• Title/Summary/Keyword: AIC(Akaike Information Criterion)

검색결과 70건 처리시간 0.025초

Line Transect에서 발견율함수 추정에 사용되는 모델에 따른 상괭이, Neophocaena phocaenoides의 자원개체수 추정 (Abundance Estimation of the Finless Porpoise, Neophocaena phocaenoides, Using Models of the Detection Function in a Line Transect)

  • 박겸준;김장근;장창익
    • 한국수산과학회지
    • /
    • 제40권4호
    • /
    • pp.201-209
    • /
    • 2007
  • Line transect sampling in a sighting survey is one of most widely used methods for assessing animal abundance. This study applied distance data, collected from three sighting surveys using line transects for finless porpoise that were conducted in 2004 and 2005 off the west coast of Korea, to four models (hazard-rate, uniform, half-normal and exponential) that can use a variety of detection functions, g (x). The hazard-rate model, a derived model for the detection function, should have a shoulder condition chosen using the AIC (Akaike Information Criterion), as the most suitable model. However, it did not describe a shoulder shape for the value of g(x) near the track tine and underestimated g (x), just as the exponential model did. The hazard-rate model showed a bias toward overestimating the densities of finless porpoises with a higher coefficient of variation (CV) than the other models did. The uniform model underestimated the densities of finless porpoise but had the lowest CV. The half-normal model described a detection function with a shape similar to that of the uniform model. The half-normal model was robust for finless porpoise data and should be able to avoid density underestimation. The estimated abundance of finless porpoise was 3,602 individuals (95% CI=1,251-10,371) inshore in 2005 and 33,045 individuals (95% CI=24,274-44,985) offshore in 2004.

평점에 따른 OTT 서비스 콘텐츠의 성공과 실패 요인 분석: 넷플릭스를 중심으로 (Analysis of Success and Failure Factors of OTT Service Contents According to the Rating: Focus on Netflix)

  • 홍지수;박진수;강성우
    • 산업경영시스템학회지
    • /
    • 제44권4호
    • /
    • pp.65-75
    • /
    • 2021
  • This study explores multiple variables of an OTT service for discovering hidden relationship between rating and the other variables of each successful and failed content, respectively. In order to extract key variables that are strongly correlated to the rating across the contents, this work analyzes 170 Netflix original dramas and 419 movies. These contents are classified as success and failure by using the rating site IMDb, respectively. The correlation between the contents, which are classified via rating, and variables such as violence, lewdness and running time are analyzed to determine whether a certain variable appears or not in each successful and failure content. This study employs a regression analysis to discover correlations across the variables as a main analysis method. Since the correlation between independent variables should be low, check multicollinearity and select the variable. Cook's distance is used to detect and remove outliers. To improve the accuracy of the model, a variable selection based on AIC(Akaike Information Criterion) is performed. Finally, the basic assumptions of regression analysis are identified by residual diagnosis and Dubin Watson test. According to the whole analysis process, it is concluded that the more director awards exist and the less immatatable tend to be successful in movies. On the contrary, lower fear tend to be failure in movies. In case of dramas, there are close correlations between failure dramas and lower violence, higher fear, higher drugs.

RCP4.5 기후변화 시나리오와 인공신경망을 이용한 우리나라 확률강우량의 변화 (The change of rainfall quantiles calculated with artificial neural network model from RCP4.5 climate change scenario)

  • 이주형;허준행;김기주;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.130-130
    • /
    • 2022
  • 기후변화로 인한 기상이변 현상으로 폭우와 홍수 등 수문학적 극치 사상의 출현 빈도가 잦아지고 있다. 따라서 이러한 기상이변 현상에 적응하기 위하여 보다 정확한 확률강우량 측정의 필요성이 증가하고 있다. 대장 지점의 미래 확률강우량 계산을 위해선 기후변화 시나리오의 비정상성을 고려해야 한다. 본 연구는 비정상적인 미래 기후에서 확률강우량이 어떻게 변화하는지 측정하는 것을 목표로 한다. Representative Concentration Pathway (RCP4.5)에 따른 우리나라의 확률강우량 계산에 인공신경망을 포함한 정상성, 비정상성 확률강우량 산정 모델들이 사용되었다. 지점빈도해석(AFA), 홍수지수법(IFM), 모분포홍수지수법(PIF), 인공신경망을 이용한 Quantile & Parameter regression technique(QRT & PRT)이 정상성 자료에 대해 확률강우량을 계산하는 모델로 사용되었으며, 비정상성 자료에 대해서는 비정상성 지점빈도해석(NS-AFA), 비정상성 홍수지수법(NS-IFM), 비정상성 모분포홍수지수법(NS-PIF), 인공신경망을 사용한 비정상성 Quantile & Parameter regression technique(NS-QRT & NS-PRT)이 사용되었다. Rescaled Akaike information criterion(rAIC)를 사용한 불확실성 분석과 적합도 검정을 통해서 generalized extreme value(GEV) 분포형 모델이 정상성 및 비정상성 확률강우량 산정에 가장 적합한 모델로 선정되었다. 이후, 관측자료가 GEV(0,0,0)을 따르고 시나리오 자료가 GEV(1,0,0)을 따르는 지점들을 선택하여 미래의 확률강우량 변화를 추정하였다. 각 빈도해석 모델들은 몬테카를로 시뮬레이션을 통해 bias, relative bias(Rbias), root mean square error(RMSE), relative root mean square error(RRMSE)를 바탕으로 측정하여 정확도를 계산하였으며 그 결과 QRT와 NS-QRT가 각각 정상성과 비정상성 자료로부터 가장 정확하게 확률강우량을 계산하였다. 본 연구를 통해 향후 기후변화의 영향으로 확률강우량이 증가할 것으로 예상되며, 비정상성을 고려한 빈도분석 또한 필요함을 제안하였다.

  • PDF

지리 공간 자료의 다중회귀분석을 이용한 제주도 남측사면 용천수의 시기별 질산성 질소 농도 예측 (Prediction of Seasonal Nitrate Concentration in Springs on the Southern Slope of Jeju Island using Multiple Linear Regression of Geographic Spatial Data)

  • 정윤영;고동찬;강봉래;고경석;유용재
    • 자원환경지질
    • /
    • 제44권2호
    • /
    • pp.135-152
    • /
    • 2011
  • 제주도 남측사면에서 산악지역부터 해안지역에 걸쳐 분포하는 용천수에 대해 풍수기와 갈수기의 2회에 걸쳐 측정된 $NO_3$ 농도를 수해지질학적 인자 및 토지 이용 특성 인자를 포함하는 공간 변수들의 다중선형 회귀모형으로 예측하였다. 용천수의 $NO_3$ 농도는 평균 20 mg/L이며, <0.02~86 mg/L의 범위를 보여 인위적 오염의 정도가 매우 다양하다. 공간 변수는 용천수를 중심으로 원형 버퍼를 설정하여 추출하였으며, 수정결정계수 증가율과 원형 버퍼의 제한점을 고려하여 반경 400 m를 최적 범위로 설정하였다. 선택된 회귀 모형들은 p-값과 더빈-왓슨 통계치에 근거하여 모두 통계적으로 유의하였다. 설명변수는 수정결정계수, Cp (total squared error), AIC (Akaike's Information Criterion)등을 기준으로 선택하였으며 변수들의 유의성과 다중공선성을 확인하여 최적 회귀 모형을 제시하였다. 일부 용천수들은 이상치로 확인되었으나 전체 시료의 10%이내였으며, 이들은 원형 버퍼를 사용하는 다중회귀분석의 한계를 지시한다고 할 수 있다. 변수의 유의성 기준으로 선정된 최적 회귀 모형의 결정계수는 이상치 제거 전이 0.74-0.79, 제거 후가 0.86-0.87의 범위로 높은 설명력을 보여주었으며, 자연지역 면적 비율이 용천수의 $NO_3$ 농도에 가장 큰 영향력을 가지는 것으로 나타났다. 용천수 $NO_3$ 농도에 대한 인위적 토지이용의 영향력은 최적 버퍼 반경에서 두 조사 시기 모두 과수원 > 주거지역 > 밭의 순으로 나타났다. 이러한 결과는 제주도 남측사면 용천수의 수질이 수리지질학적 인자보다는 토지 이용 특성에 크게 좌우됨을 지시하며, 용천수의 오염 취약성이 주변의 지표 오염원, 특히 과수원 분포에 민감함을 보여준다.

제주마 주파기록에 대한 연도별 추세 및 환경효과 분석 (Estimation of Annual Trends and Environmental Effects on the Racing Records of Jeju Horses)

  • 이종안;이수현;이재구;김남영;최재영;신상민;최정우;조인철;양병철
    • 생명과학회지
    • /
    • 제31권9호
    • /
    • pp.840-848
    • /
    • 2021
  • 본 연구는 제주마의 연도별 주파기록 특성을 파악하고 경주기록에 대한 환경효과 분석을 위해 수행되었다. 한국마사회가 2002년부터 2019년까지 수집한 제주마 2,167두의 48,645개 관측치 정보가 분석에 사용되었다. 환경효과 분석을 위하여 관측치 빈도가 가장 높은 800 m 기준으로 주파기록은 보정되었다. 거리별 경주기록은 동일거리 기준으로 변환되었으며 연도별 비교가 가능했다. 그 결과 표현형에서 매년 주파기록이 0.242초(R2=0.66) 단축됨을 알 수 있었다. 보정된 주파기록에 대한 환경효과의 유의성 검증 위해 일원분산분석을 수행하였고 모형에서 설정한 모든 변수에서 고도의 유의성을 나타내었다(p<0.001). 이들 변수에 대해 단계적 변수 선발법을 적용, AIC 값 산출을 통해 모형 적합도를 평가하였으며 연도, 부담구분, 기수 순위, 조교사 순위, 주로상태, 날씨, 마령, 성별 순으로 변수 선택 시 가장 낮은 AIC 값을 갖는 모형이 수립되었다. 최종적으로 주파기록에 영향하는 환경효과 분석을 위하여 기수, 조교사 순위 및 마령 3가지 변수를 임의효과로 가정하였다. 그 결과 기수와 마령을 임의효과로 설정하였을 때 주파기록에 영향하는 환경효과 분석에 가장 적합한 모형인 것으로 나타났다. 본 연구에서 도출된 결과는 제주마 유전능력 평가를 위한 모형설정 시 기초자료로 활용 가능할 것으로 사료된다.

Survival Analysis for White Non-Hispanic Female Breast Cancer Patients

  • Khan, Hafiz Mohammad Rafiqullah;Saxena, Anshul;Gabbidon, Kemesha;Stewart, Tiffanie Shauna-Jeanne;Bhatt, Chintan
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권9호
    • /
    • pp.4049-4054
    • /
    • 2014
  • Background: Race and ethnicity are significant factors in predicting survival time of breast cancer patients. In this study, we applied advanced statistical methods to predict the survival of White non-Hispanic female breast cancer patients, who were diagnosed between the years 1973 and 2009 in the United States (U.S.). Materials and Methods: Demographic data from the Surveillance Epidemiology and End Results (SEER) database were used for the purpose of this study. Nine states were randomly selected from 12 U.S. cancer registries. A stratified random sampling method was used to select 2,000 female breast cancer patients from these nine states. We compared four types of advanced statistical probability models to identify the best-fit model for the White non-Hispanic female breast cancer survival data. Three model building criterion were used to measure and compare goodness of fit of the models. These include Akaike Information Criteria (AIC), Bayesian Information Criteria (BIC), and Deviance Information Criteria (DIC). In addition, we used a novel Bayesian method and the Markov Chain Monte Carlo technique to determine the posterior density function of the parameters. After evaluating the model parameters, we selected the model having the lowest DIC value. Using this Bayesian method, we derived the predictive survival density for future survival time and its related inferences. Results: The analytical sample of White non-Hispanic women included 2,000 breast cancer cases from the SEER database (1973-2009). The majority of cases were married (55.2%), the mean age of diagnosis was 63.61 years (SD = 14.24) and the mean survival time was 84 months (SD = 35.01). After comparing the four statistical models, results suggested that the exponentiated Weibull model (DIC= 19818.220) was a better fit for White non-Hispanic females' breast cancer survival data. This model predicted the survival times (in months) for White non-Hispanic women after implementation of precise estimates of the model parameters. Conclusions: By using modern model building criteria, we determined that the data best fit the exponentiated Weibull model. We incorporated precise estimates of the parameter into the predictive model and evaluated the survival inference for the White non-Hispanic female population. This method of analysis will assist researchers in making scientific and clinical conclusions when assessing survival time of breast cancer patients.

항온과 변온조건에서 복숭아혹진딧물의 발육비교 및 온도 발육모형 (Comparison of Development times of Myzus persicae (Hemiptera:Aphididae) between the Constant and Variable Temperatures and its Temperature-dependent Development Models)

  • 김도익;최덕수;고숙주;강범용;박창규;김선곤;박종대;김상수
    • 한국응용곤충학회지
    • /
    • 제51권4호
    • /
    • pp.431-438
    • /
    • 2012
  • 복숭아혹진딧물(Myzus persicae)의 온도에 따른 발육시험을 실내 15, 18, 21, 24, 27, $30^{\circ}C$의 6개 항온, 광주기 14L:10D, 상대습도 50~60% 조건과 고추 비닐하우스에서 3월 23일부터 8월 20일까지 6회 접종하여 수행하였다. 실내사망률은 저온에서는 1~2령충의 사망률이 높았고 온도가 증가할수록 3~4령충의 사망률이 높았으며 고온에서는 66.7%까지 높아졌다. 실내와 포장조건 모두 온도가 증가할수록 발육기간이 짧아지는 경향을 보였으며 포장조건 8월 접종에서 6.03일로 가장 짧았다. 온도와 발육률과의 관계를 보기 위해 선형 및 3개의 비선형 모형(Briere 1, Lactin 2, Logan 6)을 이용하여 분석한 결과, 선형모형을 이용하여 전체약충의 발육영점온도는 $3.0^{\circ}C$였으며 발육유효적산온도는 111.1DD 였다. 3가지 비선형 모형중 Logan-6 모형이 전약충, 후약충 전체약충 단계에서 AIC와 BIC 값이 가장 적어 온도와 발육율과의 관계를 잘 설명하였으며, 발육단계별 발육완료분포는 3-parameter Weibull 함수를 사용하였으며 전약충, 후약충, 전체약충에서 $r^2$ 값이 0.95~0.97로 높은 값을 보여 양호한 모형 적합성을 보였으며 정식시기별 성충 발생 예측치와 포장 조사치가 일치하여 방제적기 추정에 유용하게 사용할 수 있을 것이다.

실내 항온과 온실 변온조건에서 목화진딧물의 온도 발육비교 (Comparison of Temperature-dependent Development Model of Aphis gossypii (Hemiptera: Aphididae) under Constant Temperature and Fluctuating Temperature)

  • 김도익;고숙주;최덕수;강범용;박창규;김선곤;박종대;김상수
    • 한국응용곤충학회지
    • /
    • 제51권4호
    • /
    • pp.421-429
    • /
    • 2012
  • 목화진딧물 (Aphis gossypii)의 온도에 따른 발육시험을 실내 15, 18, 21, 24, 27, $30^{\circ}C$의 6개 항온, 광주기 14L:10D, 상대습도 50~60% 조건과 오이 비닐하우스에서 3월 23일부터 8월 20일까지 6회 접종하여 수행하였다. 실내사망률은 저온에서는 2~3령충의 사망률이 높았고 온도가 증가할수록 3~4령충의 사망률이 높았으며 고온에서 전체 사망률이 높았다. 전체 약충의 발육기간은 실내에서 $15^{\circ}C$에서 12.2일로 가장 짧았으며 변온의 $28.5^{\circ}C$에서 4.09일로 가장 짧았다. 온도와 발육율과의 관계를 보기위해 선형 및 3개의 비선형 모형(Briere 1, Lactin 2, Logan 6)을 이용하여 분석한 결과, 선형모형을 이용하여 전체약충의 발육영점온도는 $6.8^{\circ}C$였으며 발육유효적산온도는 각각 111.1DD였다. 3가지 비선형 모형중 Logan-6 모형이 전약충, 후약충 전체약충 단계에서 AIC와 BIC 값이 가장 적어 온도와 발육율과의 관계를 잘 설명하였으며, 발육단계별 발육완료분포는 3-parameter Weibull 함수를 사용하였으며 전약충, 후약충, 전체약충에서 $r^2$값이 0.88~0.91로 높은 값을 보여 양호한 모형 적합성을 보였으며 정식시기별 성충 발생 예측치와 포장 조사치가 일치하여 방제적기 추정에 유용하게 사용할 수 있을 것이다.

Estimation of Weaning Age Effects on Growth Performance in Berkshire Pigs

  • Do, C.H.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제25권2호
    • /
    • pp.151-162
    • /
    • 2012
  • Analysis for back fat thickness (BFAT) and daily body weight gains from birth to the end of a performance test were conducted to find an optimal method for estimation of weaning age effects and to ascertain impacts of weaning age on the growth performance of purebred Berkshire pigs from a closed population in Korea. Individual body weights were measured at birth (B), at weaning (W: mean, 22.9 d), at the beginning of the performance test (P: mean, 72.7 d), and at the end of the performance test (T: mean, 152.4 d). Further, the average daily gains in body weight (ADG) of 3,713 pigs were analyzed for the following periods: B to W (DGBW), W to P (DGWP), P to T (DGPT), B to P (DGBP), B to T (DGBT), and W to T (DGWT). Weaning ages ranged from 17 to 34 d, and were treated as fixed (WF), random with (WC) and random without (WU) consideration of an empirical relationship between weaning ages in the models. WF and WC produced the lowest AIC (Akaike Information Criterion) and least fractions of error variance components in multi-traits analysis, respectively. The fractions of variances due to diverse weaning age and the weaning age correlations among ADGs of different stages (when no overlapping allowed) by WC ranged from 0.09 to 0.35 and from -0.03 to 0.44, respectively. The maximum weaning age effects and optimal back fat thicknesses were attained at weaning ages of 27 to 32 d. With the exception of DGBW, the effects of weaning age on the ADGs increased (ranging from 1.50 g/d to 7.14 g/d) with increased weaning age. In addition, BFAT was reduced by 0.106 mm per increased day in weaning age. In conclusion, WC produced reasonable weaning age correlations, and improved the fitness of the model. Weaning age was one of crucial factors (comparable with heritability) influencing growth performance in Berkshire pigs. Further, these studies suggest that increasing weaning age up to 32 d can be an effective management strategy to improve growth performance. However, additional investigations of the costs and losses related to extension of the suckling period and on the extended range of weaning age are necessary to determine the productivity and safety of this practice in a commercial herd and production system.

심박변이도를 통한 폐경 전 한국인 비만 여성의 비만 관련 대사체 농도 예측을 위한 회귀분석 (Predicting the Concentration of Obesity-related Metabolites via Heart Rate Variability for Korean Premenopausal Obese Women: Multiple Regression Analysis)

  • 김종연;양요찬;이운섭;김제인;맹태호;유덕주;심재우;조우영;송미연;이종수
    • 한방재활의학과학회지
    • /
    • 제24권4호
    • /
    • pp.155-162
    • /
    • 2014
  • Objectives Advanced researches on the relationship between obesity and heart rate variability (HRV), heretofore, focused on characteristics of HRV depending on the state of obesity. However, the previous researches have not quantified predictive power of HRV toward the obesity-related variables, which is rather more meaningful for clinicians who regularly treat obese patients. Hence, we designed a research to investigate whether HRV could predict serum levels of obesity-related metabolites. Methods Ninety obese premenopausal women meeting the inclusion criteria were recruited. The HRV test, blood sampling, and measurement of physical traits were conducted. Multiple regression analysis of the measurement data was carried out, putting obesity-related metabolites (insulin, glucose, triglyceride, hs-CRP, HDL, LDL, total cholesterol) as outcome variables and the others as predictors. To select appropriate predictive variables, the Akaike's Information Criterion (AIC) was applied. Normality and homoskedasticity of residuals for each model were tested to identify if there were any violations of the regression analysis's basic assumption. Logarithm transformation was used for the values of the concentration of metabolites and the HRV. Results The regression model including Total Power (TP) value and BMI had significant predictive power for serum insulin concentration (F(2, 88)=835.7, p<0.001, $R^2=0.95$). The regression coefficient of ln (TP) was -0.1002. However, it was not sure if the HRV could predict concentrations of other metabolites. Conclusions The results suggest that the Total Power (TP) value of the HRV can predict the level of serum insulin. If the BMI could be assumed as being constant, when the TP value is multiplied by n, the predicted change of insulin could be drawn by multiplying $n^{-0.1002}$. The uncertainty of this model can be assumed as approximately 5%.