• 제목/요약/키워드: bayesian regression

검색결과 258건 처리시간 0.021초

사과생산량에 영향을 미치는 기상요인 분석 (Examining Impact of Weather Factors on Apple Yield)

  • 김미리;김승규
    • 한국농림기상학회지
    • /
    • 제16권4호
    • /
    • pp.274-284
    • /
    • 2014
  • 농업은 기후 및 환경의 영향을 많이 받는 산업으로 기온, 강수량, 일조시간 등에 따라 재배 가능한 작물 과 품종이 결정된다. 본 연구의 목적은 사과의 생육과정에서 일별로 측정되는 기상변수를 활용하여 기상변수가 사과단수에 미치는 영향을 파악하는 것에 있다. 기상변수는 1) 생육단계를 고려한 자연과학적 접근방법과 2) 통계적 접근방법을 이용한다. 패널분석을 통해 추정된 각각의 결과를 모형적합도와 예측력 비교를 통해 평가한다. 사과단수와 기상변수의 자료는 2006년부터 2013년까지 우리나라 사과주산지 15개지역을 대상으로 수집되었다. 분석 결과, 통계적 접근방법 중요인분석을 이용한 변수 선정 방법이 가장 높은 예측력과 적합도를 보였다. 이는 기상변수와 같이 서로 유사하지만 다양한 설명변수의 사용으로 발생할 수 있는 다중공선성과 낮은 자유도의 문제를 효과적으로 통제하게 될 경우, 보다 많은 기상요인을 회귀분석에 포함하는 것이 적합도와 예측력을 높이는데 기여한 것으로 추정된다. 또한 사과재배에 있어 발아, 개화, 착과, 비대, 성숙, 그리고 착색 및 수확에 이르기까지의 전 생육과정의 기상요인이 단수에 영향력이 있음을 의미한다.

한우에 있어서 유전체 육종가 추정 (Prediction of genomic breeding values of carcass traits using whole genome SNP data in Hanwoo (Korean cattle))

  • 이승환;김형철;임다정;당창권;조용민;김시동;이학교;이준헌;양보석;오성종;홍성구;장원경
    • 농업과학연구
    • /
    • 제39권3호
    • /
    • pp.357-364
    • /
    • 2012
  • Genomic breeding value (GEBV) has recently become available in the beef cattle industry. Genomic selection methods are exceptionally valuable for selecting traits, such as marbling, that are difficult to measure until later in life. One method to utilize information from sparse marker panels is the Bayesian model selection method with RJMCMC. The accuracy of prediction varies between a multiple SNP model with RJMCMC (0.47 to 0.73) and a least squares method (0.11 to 0.41) when using SNP information, while the accuracy of prediction increases in the multiple SNP (0.56 to 0.90) and least square methods (0.21 to 0.63) when including a polygenic effect. In the multiple SNP model with RJMCMC model selection method, the accuracy ($r^2$) of GEBV for marbling predicted based only on SNP effects was 0.47, while the $r^2$ of GEBV predicted by SNP plus polygenic effect was 0.56. The accuracies of GEBV predicted using only SNP information were 0.62, 0.68 and 0.73 for CWT, EMA and BF, respectively. However, when polygenic effects were included, the accuracies of GEBV were increased to 0.89, 0.90 and 0.89 for CWT, EMA and BF, respectively. Our data demonstrate that SNP information alone is missing genetic variation information that contributes to phenotypes for carcass traits, and that polygenic effects compensate genetic variation that whole genome SNP data do not explain. Overall, the multiple SNP model with the RJMCMC model selection method provides a better prediction of GEBV than does the least squares method (single marker regression).

Support Vector Machine 기법을 이용한 고객의 구매의도 예측 (Forecasting of Customer's Purchasing Intention Using Support Vector Machine)

  • 김진화;남기찬;이상종
    • 경영정보학연구
    • /
    • 제10권2호
    • /
    • pp.137-158
    • /
    • 2008
  • 기업 경쟁력 강화의 중요한 이슈인 대량 개별화(mass-customization)의 실행을 위하여 통합 고객관계 관리 프로세스로서의 CRM(customer relationship management)에 대한 관심과 활용에 대한 필요성은 점점 더 높아지고 있다. 특히, 기존 고객들의 구매 정보를 기반으로 고객의 구매 패턴을 파악하고 의도를 예측하는 것은 오늘날 실질적인 판매 전략을 수립하는 마케팅 분야에서 상당히 큰 비중을 차지하고 있다. 고객의 구매의도 예측에는 대량의 데이터로부터 과거에 인지하지 못했던 의미 있고, 근거 있는 정보를 추출하는 데이터마이닝(datamining)이 주로 사용되고 있다. 기존의 구매의도 예측에 사용된 데이터마이닝 기법들은 주로 신경망(neural networks)과 로지스틱 회귀분석(logistic regression analysis)이었는데, 예측 정확성 및 모형 구축의 어려움으로 인한 다양한 문제점들이 제기되고 있는 실정이다. 따라서, 본 논문에서는 기존의 기법들이 가지고 있는 단점들을 개선하기 위하여 신경망과 로지스틱 회귀분석 외에 연관규칙(association rule), 연관성 매트릭스(association matrix), 의사결정 나무(decision tree), 베이지안 망(bayesian network), SVM(support vector machine) 기법들을 추가로 제안하였다. 본 연구의 목적은 고객의 특정 상품에 대한 구매의도 예측을 위하여 새로운 알고리즘을 제시하기보다는 기존의 다양한 데이터마이닝 기법들을 적용시켜 봄으로써, 가장 우수한 예측성과를 나타내는 기법을 발견하는 것이다. 연구에 사용된 자료는 기존의 연구에서는 적용되지 않았던 편의점의 영수증 데이터이다. 예측 목표상품은 카테고리화 된 '우유'와 '냉동식품'이며, 제안된 기법들의 신뢰성을 위하여 전체 데이터를 10개의 training과 test 셋으로 중복되지 않게 구분함과 동시에 10번의 교차 검증(cross validation)을 실시하였다. 실험 결과 SVM이 영수증 데이터를 이용한 고객의 특정 상품에 대한 구매의도 예측에서 가장 우수한 성과를 나타내는 것을 확인하였다.

Genomic partitioning of growth traits using a high-density single nucleotide polymorphism array in Hanwoo (Korean cattle)

  • Park, Mi Na;Seo, Dongwon;Chung, Ki-Yong;Lee, Soo-Hyun;Chung, Yoon-Ji;Lee, Hyo-Jun;Lee, Jun-Heon;Park, Byoungho;Choi, Tae-Jeong;Lee, Seung-Hwan
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제33권10호
    • /
    • pp.1558-1565
    • /
    • 2020
  • Objective: The objective of this study was to characterize the number of loci affecting growth traits and the distribution of single nucleotide polymorphism (SNP) effects on growth traits, and to understand the genetic architecture for growth traits in Hanwoo (Korean cattle) using genome-wide association study (GWAS), genomic partitioning, and hierarchical Bayesian mixture models. Methods: GWAS: A single-marker regression-based mixed model was used to test the association between SNPs and causal variants. A genotype relationship matrix was fitted as a random effect in this linear mixed model to correct the genetic structure of a sire family. Genomic restricted maximum likelihood and BayesR: A priori information included setting the fixed additive genetic variance to a pre-specified value; the first mixture component was set to zero, the second to 0.0001×σ2g, the third 0.001×σ2g, and the fourth to 0.01×σ2g. BayesR fixed a priori information was not more than 1% of the genetic variance for each of the SNPs affecting the mixed distribution. Results: The GWAS revealed common genomic regions of 2 Mb on bovine chromosome 14 (BTA14) and 3 had a moderate effect that may contain causal variants for body weight at 6, 12, 18, and 24 months. This genomic region explained approximately 10% of the variance against total additive genetic variance and body weight heritability at 12, 18, and 24 months. BayesR identified the exact genomic region containing causal SNPs on BTA14, 3, and 22. However, the genetic variance explained by each chromosome or SNP was estimated to be very small compared to the total additive genetic variance. Causal SNPs for growth trait on BTA14 explained only 0.04% to 0.5% of the genetic variance Conclusion: Segregating mutations have a moderate effect on BTA14, 3, and 19; many other loci with small effects on growth traits at different ages were also identified.

Potential influence of κ-casein and β-lactoglobulin genes in genetic association studies of milk quality traits

  • Zepeda-Batista, Jose Luis;Saavedra-Jimenez, Luis Antonio;Ruiz-Flores, Agustin;Nunez-Dominguez, Rafael;Ramirez-Valverde, Rodolfo
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제30권12호
    • /
    • pp.1684-1688
    • /
    • 2017
  • Objective: From a review of published information on genetic association studies, a meta-analysis was conducted to determine the influence of the genes ${\kappa}-casein$ (CSN3) and ${\beta}-lactoglobulin$ (LGB) on milk yield traits in Holstein, Jersey, Brown Swiss, and Fleckvieh. Methods: The GLIMMIX procedure was used to analyze milk production and percentage of protein and fat in milk. Models included the main effects and all their possible two-way interactions; not estimable effects and non-significant (p>0.05) two-way interactions were dropped from the models. The three traits analyzed used Poisson distribution and a log link function and were determined with the Interactive Data Analysis of SAS software. Least square means and multiple mean comparisons were obtained and performed for significant main effects and their interactions (p<0.0255). Results: Interaction of breed by gene showed that Holstein and Fleckvieh were the breeds on which CSN3 ($6.01%{\pm}0.19%$ and $5.98%{\pm}0.22%$), and LGB ($6.02%{\pm}0.19%$ and $5.70%{\pm}0.22%$) have the greatest influence. Interaction of breed by genotype nested in the analyzed gene indicated that Holstein and Jersey showed greater influence of the CSN3 AA genotype, $6.04%{\pm}0.22%$ and $5.59%{\pm}0.31%$ than the other genotypes, while LGB AA genotype had the largest influence on the traits analyzed, $6.05%{\pm}0.20%$ and $5.60%{\pm}0.19%$, respectively. Furthermore, interaction of type of statistical model by genotype nested in the analyzed gene indicated that CSN3 and LGB genes had similar behavior, maintaining a difference of more than 7% across analyzed genotypes. These results could indicate that both Holstein and Jersey have had lower substitution allele effect in selection programs that include CSN3 and LGB genes than Brown Swiss and Fleckvieh. Conclusion: Breed determined which genotypes had the greatest association with analyzed traits. The mixed model based in Bayesian or Ridge Regression was the best alternative to analyze CSN3 and LGB gene effects on milk yield and protein and fat percentages.

교차로 신호위반 단속카메라 설치가 차량사고에 미치는 영향 (Safety Impacts of Red Light Enforcement on Signalized Intersections)

  • 이상혁;이용두;도명식
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.93-102
    • /
    • 2012
  • 도시지역의 교통사고 중 교차로와 관련한 교통사고가 교통사고 건수와 교통사고 심각도에서 가로구간이나 횡단보도 관련 교통사고에 비해 높게 나타나고 있다. 특히 교차로에서 신호위반으로 인한 교통사고는 다른 교통사고유형과는 달리 중상과 경상에 관련된 교통사고비율이 높은 것으로 나타나고 있다. 이에 우리나라는 물론이고 많은 외국에서 신호위반으로 인한 교차로 교통사고를 줄이기 위하여 교차로 신호위반 단속카메라를 설치하고 있다. 이와 더불어 교차로 신호위반 단속카메라의 교통사고 감소에 미치는 효용에 대한 연구가 계속 이루어지고 있으나 신호위반 단속카메라만의 효과를 분석하기란 쉽지가 않다. 따라서 본 연구에서는 미국 Illinois주 Chicago시의 다운타운의 교차로 관련 데이터를 이용하여 SPF모형을 개발하고 개발된 모형을 활용하여 EB방법으로 교차로 신호위반 단속카메라의 효용에 대하여 분석하였다. 분석 결과, 목표로 지정한 교통사고 유형(측면직각추돌, 후방추돌, 같은 방향 측면추돌, 반대 방향 측면추돌, 회전시 추돌, 그리고 정면충돌)과 전체 교통사고유형 모두가 교차로 신호위반 단속카메라의 영향을 받는 것으로 나타났다. 전반적으로 신호위반 단속카메라 사망사고가 약 26% 감소한 것으로 나타났으며, 전체 사고는 5.49% 증가하는 것으로 나타났다. 또한 대물교통사고의 경우 3.23% 증가하는 것으로 나타났다. 또한 목표로 한 사고유형에 대한 교통사고효과 분석에서는 사망사고는 약 38% 감소한 것으로 나타났으며 전체 사고의 경우 1.46% 증가하는 것으로 나타났다. 또한 대물교통사고의 경우 1.16% 증가하는 것으로 나타났다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

기상조건에 따른 도시고속도로 교통류변화 분석 (The Effect of Rain on Traffic Flows in Urban Freeway Basic Segments)

  • 최정순;손봉수;최재성
    • 대한교통학회지
    • /
    • 제17권1호
    • /
    • pp.29-39
    • /
    • 1999
  • 본 연구는 우리나라의 고속도로 기본구간에서 기상조건에 따른 도시고속도로 교통류의 특성을 분석한 것이다. 본 연구의 주요 결과를 요약하면 다음과 같다. 첫째, 비가 올 경우 속도-교통류율간의 관계는 길어깨쪽 차로를 제외하고 차로별로 큰 차이가 없이 유사한 패턴을 보이는 것으로 나타났다. 둘째 교통류율-점유율간의 관계식은 비가 올 경우 그 관계성은 더 분명해지지만, 서비스교통류율이 약 200대/시/차로 정도 감소하는 것으로 나타났다. 셋째, 비가 올 경우 도로의 관측된 서비스교통류율은 맑은 날에 비해 약 10-20% 정도 감소하는 것으로 나타났으며, 이러한 결과는 1998 HCM에서 제시한 결과 및 교통류율-점유율 관계식의 기울기 감소 패턴과 일치한다. 넷째, 비가 올 경우 전체 차로의 소통능력은 맑은 날에 비해 감소하고 전반적으로 중앙분리대쪽 차로의 소통 능력이 길어깨쪽 차로에 비해 높은 것으로 나타났으나, 기상변화에 따른 차로별 임계속도와 임계점유율은 큰 변화가 없는 것으로 나타났다. 본 연구는 도시고속도로 기본구간의 1개 지점에서 나타난 특성으로서 공간적 분포 특성을 고려하기 위해서는 향후 연구에서 다양한 조건을 갖는 도로지점에 대해 분석해야 할 것이다. 또한 비 뿐만 아니라 안개나 눈에 의 한 영향을 고려한 상세한 분석이 필요하다. 본 연구의 결과는 그간 일반적으로 알려졌던 내용과 큰 차이는 없지만 실제로 고속도로를 설계하거나 운영하는데 근거자료로 활용할 수 있는 자료를 제공하는 측면에서 의미가 있다고 판단되며, 도로용량편람을 개정 및 수정하는 과정에서 명확히 명시해야할 기초자료를 제공하고 있다.Bayesian pooling technique for estimating the dynamic link travel time of networks. The proposed algorithm has been validated using the field experiment data out of GPS probes and detectors over the roadways and the estimated link travel time from the algorithm is proved to be more useful than the mere arithmetic mean from each traffic source. the whole sentence(preceeding sentence and the accompanying sentence). The conjunctive endings are '-고₂, -으며₂, -다가₂, -어서, -고서, 을수록, -은데₂, -으면₂, -어야₂, -어도₂, -으니까₂, -거든₁,'etc. Type C can be interpreted as the neutralized tense of the preceeding sentence and the absolute tense of the accompanying sentence. The conjunctive endings are '-으러, -으려고, -고자, -도록, -게,'etc. Type D can be described as the relative tense of the part of the preceeding sentence and the

  • PDF