• 제목/요약/키워드: Cross - Validation

검색결과 994건 처리시간 0.031초

기계학습을 활용한 특허수명 예측 및 영향요인 분석 (Prediction of patent lifespan and analysis of influencing factors using machine learning)

  • 김용우;김민구;김영민
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.147-170
    • /
    • 2022
  • 특허의 사적 가치(private value)를 나타내는 특허수명 추정은 오래전부터 연구되었으나 추정과정에서 선형모델에 의존하는 경우가 대부분이었고, 기계학습 방법을 사용하더라도 변수 간 관계에 대한 해석이나 설명이 부족하였다. 본 연구에서는 특허의 생존 기간이 특허의 가치를 대리한다는 기존 연구결과를 바탕으로 특허 등록 이후의 생존 기간(연장횟수) 예측을 통해 특허의 가치를 추정한다. 이를 위해 1996~2017년까지 미국 특허청(USPTO)에 출원하여 등록된 특허 4,033,414개를 수집하였다. 특허수명을 예측하기 위해 기존 연구에서 특허수명에 영향을 미친다고 밝혀진 특허의 특성, 특허의 소유자 특성, 특허의 발명가 특성을 반영할 수 있는 다양한 변수가 사용되었다. 서로 다른 4개의 모델(Ridge Regression, Random Forest, Feed-forward Neural Network, Gradient Boosting Models)을 생성하고, 모델 학습 과정에서는 5-fold Cross Validation으로 초매개변수 조정이 이루어졌다. 이후 생성된 모델의 성능을 평가하고 특허수명을 추정할 수 있는 예측변수의 상대적 중요도를 제시하였다. 또한, 성능이 우수했던 Gradient Boosting Model을 기반으로 Accumulated Local Effects Plot을 제시하여 예측변수와 특허수명 간 관계를 시각적으로 나타내었다. 마지막으로 모델에 의해서 평가된 개별 특허의 평가 근거를 제시하기 위하여 Kernal SHAP(SHapley Additive exPlanations)을 적용하고 특허평가 시스템에의 적용 가능성을 제시한다. 본 연구는 기존에 특허수명을 추정하는 연구에 누적적으로 기여한다는 점 그리고 선형성을 바탕으로 진행된 기존 특허수명 추정 연구들의 한계를 보완하고 복잡한 비선형 관계를 설명가능한 방식으로 제시하였다는 점에서 학문적 의의가 있다. 또한, 개별 특허의 평가 근거를 도출하는 방법을 소개하고 특허평가 시스템에의 적용 가능성을 제시하였다는 점에서 실무적 의의가 있다.

18~34 남성의 최대산소 섭취량 추정 (Prediction of Maximal Oxygen Uptake Ages 18~34 Years)

  • 전유정;임재형;이병근;김창환;김병완
    • 한국체육학회지인문사회과학편
    • /
    • 제51권3호
    • /
    • pp.373-382
    • /
    • 2012
  • 본 연구의 목적은 신체변인과 최대하 대사반응을 이용하여 최대산소섭취량(VO2max)을 간편하고 정확하게 추정하는 데 있다. 18~34세 남성 250명을 대상으로 추정집단(n=179)과 타당도 검증집단(n=71)으로 나누어 최대 운동부하검사를 실시하였으며 3분인 1단계와 6분인 2단계 종료 시점의 대사반응을 측정하였다. 추정 집단을 대상으로 단계선택법(stepwise method)으로 다중회귀분석 (multiple regression analysis)을 실시하였다. 단계별분석법으로 분석한 모형 1의 추정변인은 체중, 6분HR, 6분VO2이고 R은 0.64(p<.01)이었으며 SEE와 CV는 각각 4.74, 11.7%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 72.256-0.340(Weight)-0.220(6분HR)+0.013(6분VO2)이며 다중공선성이 나타나지 않았다. 모형 2의 추정변인은 체중, 6분HR, 6분VO2, 6분VCO2이고 R은 0.66(p<.01)이었으며 SEE와 CV는 각각 4.59, 11.3%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 68.699-0.277(Weight) -0.206(6분HR)+0.020(6분VO2)-0.009(6분VCO2)이며, 역시 다중공선성이 나타나지 않았다. 모형 1과 비교했을 때 모형 2는 상관이 더 높지만 다중공선성 측면에서는 다소 불리하게 나타났다. 모형 1과 모형 2를 교차타당도 검증집단에 적용했을 때, 측정된 VO2max와 추정된 VO2Max 간에 유의한 상관관계가 나타났다(R=0.53, 0.56, P<.001). 타당도 검증을 통해 유용성과 간편성을 고려하면, 본 연구에서 얻은 신체변인 및 최대하 대사반응을 이용한 추정모형들이 모두 사용가능하나 모형 2가 정확도 측면에서 다소 유리하다.

딥러닝을 활용한 위성영상 기반의 강원도 지역의 배추와 무 수확량 예측 (Satellite-Based Cabbage and Radish Yield Prediction Using Deep Learning in Kangwon-do)

  • 박혜빈;이예진;박선영
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.1031-1042
    • /
    • 2023
  • 인공위성은 시공간적으로 연속적인 지구환경 데이터를 제공하므로 위성영상을 이용하여 효율인 작물 수확량 예측이 가능하며, 딥러닝(deep learning)을 활용함으로써 더 높은 수준의 특징과 추상적인 개념 파악을 기대할 수 있다. 본 연구에서는 Landsat 8 위성 영상을 활용하여 다시기 영상 데이터를 이용하여 5대 수급 관리 채소인 배추와 무의 수확량을 예측하기 위한 딥러닝 모델을 개발하였다. 2015년부터 2020년까지 배추와 무의 생장시기인 6~9월 위성영상을 이용하여 강원도를 대상으로 배추와 무의 수확량 예측을 수행하였다. 본 연구에서는 수확량 모델의 입력자료로 Landsat 8 지표면 반사도 자료와 normalized difference vegetation index, enhanced vegetation index, lead area index, land surface temperature를 입력자료로 사용하였다. 본 연구에서는 기존 연구에서 개발된 모델을 기반으로 우리나라 작물과 입력데이터에 맞게 튜닝한 모델을 제안하였다. 위성영상 시계열 데이터를 이용하여 딥러닝 모델인 convolutional neural network (CNN)을 학습하여 수확량 예측을 진행하였다. Landsat 8은 16일 주기로 영상이 제공되지만 구름 등 기상의 영향으로 인해 특히 여름철에는 영상 취득에 어려움이 많다. 따라서 본 연구에서는 6~7월을 1구간, 8~9월을 2구간으로 나누어 수확량 예측을 수행하였다. 기존 머신러닝 모델과 참조 모델을 이용하여 수확량 예측을 수행하였으며, 모델링 성능을 비교했다. 제안한 모델의 경우 다른 모델과 비교했을 때, 높은 수확량 예측 성능을 나타내었다. Random forest (RF)의 경우 배추에서는 제안한 모델보다 좋은 예측 성능을 나타내었다. 이는 기존 연구 결과처럼 RF가 입력데이터의 물리적인 특성을 잘 반영하여 모델링 되었기 때문인 것으로 사료된다. 연도별 교차 검증 및 조기 예측을 통해 모델의 성능과 조기 예측 가능성을 평가하였다. Leave-one-out cross validation을 통해 분석한 결과 참고 모델을 제외하고는 두 모델에서는 유사한 예측 성능을 보여주었다. 2018년 데이터의 경우 모든 모델에서 가장 낮은 성능이 나타났는데, 2018년의 경우 폭염으로 인해 이는 다른 년도 데이터에서 학습되지 못해 수확량 예측에 영향을 준 것으로 생각되었다. 또한, 조기 예측 가능성을 확인한 결과, 무 수확량은 어느 정도 경향성을 나타냈지만 배추의 경우 조기 예측 가능성을 확인하지 못했다. 향후 연구에서는 데이터 형태에 따라 CNN의 구조를 조정해서 조기 예측 모델을 개발한다면 더 개선된 성능을 보일 것으로 생각된다. 본 연구 결과는 우리나라 밭 작물 수확량 예측을 위한 기초 연구로 활용될 수 있을 것으로 기대된다.

인공위성 원격 탐사 정보가 자료 기반 모형의 미계측 유역 하천유출 예측성능에 미치는 영향 분석 (Analysis of the Impact of Satellite Remote Sensing Information on the Prediction Performance of Ungauged Basin Stream Flow Using Data-driven Models)

  • 서지유;정하은;원정은;최시중;김상단
    • 한국습지학회지
    • /
    • 제26권2호
    • /
    • pp.147-159
    • /
    • 2024
  • 부족한 하천유출 관측 데이터는 모델 보정 작업을 어렵게 만들어 모델의 성능 향상을 제한한다. 위성 기반 원격탐사 자료는 수문 관련 데이터의 확보에 적극적으로 활용될 수 있으므로 새로운 대안이 될 수 있다. 최근에는 여러 연구를 통하여 기존의 개념적/물리적 모델보다는 인공지능을 이용한 해법이 더 적절하다는 평가를 받고 있다. 본 연구에서는 다양한 순환 신경망들과 의사결정나무 기반 알고리즘들을 결합한 자료 기반 접근 방식을 제안하였다. 또한 인공지능 학습을 위하여 인공위성 원격탐사 정보의 활용성을 조사하였다. 본 연구에서 위성영상은 MODIS와 SMAP의 자료가 사용된다. 공적으로 공개된 25개 유역의 자료를 사용하여 제안된 접근 방식을 검증하였다. 전통적인 지역화 접근법에서 착안하여 모든 유역의 자료를 통합하여 하나의 자료 기반 모델을 학습하는 전략을 채택하였으며, Leave-one-out cross-validation 지역화 설정을 이용하여 하나의 모델이 다양한 유역의 하천유출을 예측함으로써 제안된 접근 방식의 잠재력을 평가하였다. GRU + Light GBM 모델이 대상 유역에 적합한 모델 조합으로 판명되었으며(25개 미계측 유역 일 하천유량 예측 모형효율계수 평균 0.7187) 하천유출이 매우 작은 시기를 제외하면 우수한 미계측 유역의 하천유출 예측 성능을 보여주었다. 인공위성 원격탐사 정보의 영향력은 최대 10% 정도로 파악되었으며, 위성 정보의 추가 적용이 풍수기 또는 평수기보다는 저수기 또는 갈수기의 하천유출 예측에 더 큰 영향을 미쳤다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

퍼지 관계를 활용한 사례기반추론 예측 정확성 향상에 관한 연구 (A Study on Forecasting Accuracy Improvement of Case Based Reasoning Approach Using Fuzzy Relation)

  • 이인호;신경식
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.67-84
    • /
    • 2010
  • 미래에 대한 정확한 예측은 경영자, 또는 기업이 수행하는 경영의사결정에 매우 중요한 역할을 한다. 예측만 정확하다면 경영의사결정의 질은 매우 높아질 수 있을 것이다. 하지만 점점 가속화되고 있는 경영 환경의 변화로 말미암아 미래 예측을 정확하게 하는 일은 점점 더 어려워지고 있다. 이에 기업에서는 정확한 예측을 위하여 전문가의 휴리스틱뿐만 아니라 과학적 예측모형을 함께 활용하여 예측의 성과를 높이는 노력을 해 오고 있다. 본 연구는 사례기반추론모형을 예측을 위한 기본 모형으로 설정하고, 데이터 간의 유사도 측정에 퍼지 관계의 개념을 적용함으로써 개선된 예측성과를 얻고자 하였다. 특히, 독립변수 중 기호 데이터 형식의 속성을 가지는 변수들간의 유사도를 측정하기 위해 이진논리의 개념(일치여부의 판단)과 퍼지 관계 및 합성의 개념을 이용하여 도출된 유사도 매트릭스를 사용하였다. 연구 결과, 기호 데이터 형식의 속성을 가지는 변수들 간의 유사도 측정에서 퍼지 관계 및 합성의 개념을 적용하는 방법이 이진논리의 개념을 적용하는 방법과 비교하여 더 우수한 예측정확성을 나타내었다. 그러나 유사도 측정을 위해 다양한 퍼지합성방법(Max-min 합성, Max-product 합성, Max-average 합성)을 적용하여 예측하는 경우에는 예측정확성 측면에서 퍼지 합성방법 간의 통계적인 차이는 유의하지 않았다. 본 연구는 사례기반추론 모형의 구축에서 가장 중요한 유사도 측정에 있어서 퍼지 관계 및 퍼지 합성의 개념을 적용함으로써 유사도 측정 및 적용 방법론을 제시하였다는데 의의가 있다.

반정량식품섭취빈도조사지의 타당성 검증 및 보정 - 지역사회 유전체 코호트 참여자를 대상으로 - (Validation and Calibration of Semi-Quantitative Food Frequency Questionnaire - With Participants of the Korean Health and Genome Study -)

  • 안윤진;이지은;조남한;신철;박찬;오범석;김규찬
    • 대한지역사회영양학회지
    • /
    • 제9권2호
    • /
    • pp.173-182
    • /
    • 2004
  • We carried out a validation-calibration study of the food frequency questionnaire (FFQ) that we had previously developed for a community-based cohort of the Korean Genome and Health Study of the Korea National Genome Research Institute. We have collected a total of 254 3-day diet records (DRs) from 400 subjects, 200 each randomly selected from the two study cohorts of Ansung and Ansan. FFQ was administered at the time of cohort recruitment in 2001, and DRs were collected during a two month period from January through February of 2002. The mean age was 52.2 years. Farming for men and housewife for women were the most common occupations. The majority of the subjects had undergone 6∼12 years of education. The general characteristics including demographic and other data were not different from the total cohort subjects. Absolute levels of consumed nutrients including total energy (energy), protein, fat, carbohydrate, calcium, phosphorus, sodium, potassium, iron, retinol, carotene, vitamin A, thiamin, riboflavin, niacin and vitamin C were compared. The average of energy intake was not significantly different between the data collected by the 2 methods. However, consumptions of protein and fat were higher in data of DRs, whereas that of carbohydrate was higher in FFQ data. Significant correlation of each nutrient consumption between the data sets was observed (p < 0.05) except in the case of iron, while the average correlation coefficient between them was 0.22 ranging from 0.33 for energy to 0.11 for iron. The results of cross classification by quantile for exact classification ranged from 25.2% (carotene) to 35.0% (phosphorus), and from 64.6% (vitamin A) to 76.4% (retinol) for adjacent classification. The proportion of completely opposite classification was 8.1% in average. Calibration slope was estimated by regression and calibration parameters ranged from 0.025 for carotene to 0.423 for niacin. We conclude that the FFQ we have developed is an appropriate tool for assessing the nutrient intakes as ranking exposures in epidemiology studies in view that amounts of consumed nutrients obtained by FFQ were similar to those collected by DRs, that correlations between consumed nutrients collected by these methods were significant, and that classification results were relatively fair. The correlation coefficients, however, were lower than expected, which may be mainly due to the survey season. In fact, any short-term dietary survey cannot accurately reflect the overall dietary intakes that change heavily depending on seasons. Further studies including the analysis of chemical indices would be helpful for the studies of causal relationship between the diet and disease.

국내 유통 식육 및 식육가공품에서 축종감별을 위한 PCR 및 ELISA 검사법 검증 (Validation of PCR and ELISA Test Kits for Identification of Domestic Animal Species in Raw Meat and Meat Products in Korea)

  • 허은정;고은경;서건호;김영조;박현정;위성환;문진산
    • 한국식품위생안전성학회지
    • /
    • 제29권2호
    • /
    • pp.158-163
    • /
    • 2014
  • 본 연구에서는 상용화 되고 있는 PCR 및 ELISA kit를 사용하여 국내에서 유통되고 있는 소, 돼지, 닭, 오리, 칠면조, 염소, 양, 말 등 8종의 식육, 혼합육, 그리고 식육가공품에 대하여 축종 감별능력을 평가하였다. 신선육에 대한 RAW meat ELISA kit$^{(R)}$의 검출한계는 축종별 함유율 0.20%~0.05% 이었고, 열처리 혼합육에서는 열처리 온도 및 시간, 그리고 축종별로 검출한계는 함유율 1.0%~0.05% 이하까지 다양한 차이를 나타내었다. 8종의 식육에 대한 축종별 감별력은 소 94.5%, 돼지 93.3%, 양 90.0%, 오리, 염소, 말, 칠면조 모두에서 100%를 나타내었다. Powercheck Animal Species ID PCR kit$^{TM}$의 경우에는 함유율 0.05%의 검출한계를 나타내었고 8종의 모든 축종에서 100%의 특이도를 나타내어 축종별 감별력이 우수한 것으로 나타났다. 또한, 햄, 소시지, 분쇄가공품, 식육추출가공품 등 총 60개 식육가공품에 대한 Cooked meat ELISA kit$^{(R)}$의 감별력은 햄(35.3%), 소시지(13.6%), 분쇄가공육(12.5%)의 순으로 나타났으며, 2종 이상의 혼합육에서는 상대적으로 낮은 감별력을 보여 제조과정에서 식육간 교차오염에 의한 혼입가능성이 있는 것으로 확인되었다. 쇠고기 육포 54개 제품에 대하여 다른 고기 혼입여부를 PCR Kit로 검사한 결과 13개 제품에서 돼지고기 유전자가 검출되었지만 ELISA Kit에서는 모두 음성으로 나타났다. PCR 양성 시료의 제조공정 중 교차오염 여부를 조사한 결과, 텀블러, 채반, 절단기, 건조기가 쇠고기 및 돼지고기 육포 생산라인에 동일하게 사용되어 교차오염에 의한 혼입으로 추정되었다. 종교적 이유 및 일부 특정 육류에 대한 알러지 반응 등 식품안전 확보차원에서 제품의 원재료의 올바른 표시와 식육간 교차오염이 발생되지 않도록 철저한 품질관리가 되어야 할 것으로 판단된다.

이미지 감성분류를 위한 CNN과 K-means RGB Cluster 이-단계 학습 방안 (A Two-Stage Learning Method of CNN and K-means RGB Cluster for Sentiment Classification of Images)

  • 김정태;박은비;한기웅;이정현;이홍주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.139-156
    • /
    • 2021
  • 이미지 분류에서 딥러닝 모형을 사용하는 가장 큰 이유는 이미지의 전체적인 정보에서 각 지역 특징을 추출하여 서로의 관계를 고려할 수 있기 때문이다. 하지만 이미지의 지역 특징이 없는 감정 이미지 데이터는 CNN 모델이 적합하지 않을 수 있다. 이러한 감정 이미지 분류의 어려움을 해결하기 위하여 매년 많은 연구자들이 감정 이미지에 적합한 CNN기반 아키텍처를 제시하고 있다. 색깔과 사람 감정간의 관계에 대한 연구들도 수행되었으며, 색깔에 따라 다른 감정이 유도된다는 결과들이 도출되었다. 딥러닝을 활용한 연구에서도 색깔정보를 활용하여 이미지 감성분류에 적용하는 연구들이 있어왔으며, 이미지만을 가지고 분류 모형을 학습한 경우보다 이미지의 색깔 정보를 추가로 활용한 경우가 이미지 감성 분류 정확도를 더 높일 수 있었다. 본 연구는 사람이 이미지의 감정을 분류하는 기준 중 많은 부분을 차지하는 색감을 이용하여 이미지 감성 분류 정확도를 향상시키는 방안을 제안한다. 이미지의 RGB 값에 K 평균 군집화 방안을 적용하여 이미지를 대표하는 색을 추출하여, 각 감성 클래스 별 해당 색깔이 나올 확률을 가중치 식으로 변형 후 CNN 모델의 최종 Layer에 적용하는 이-단계 학습방안을 구현하였다. 이미지 데이터는 6가지 감정으로 분류되는 Emotion6와 8가지 감정으로 분류되는 Artphoto를 사용하였다. 학습에 사용한 CNN 모델은 Densenet169, Mnasnet, Resnet101, Resnet152, Vgg19를 사용하였으며, 성능 평가는 5겹 교차검증으로 CNN 모델에 이-단계 학습 방안을 적용하여 전후 성과를 비교하였다. CNN 아키텍처만을 활용한 경우보다 색 속성에서 추출한 정보를 함께 사용하였을 때 더 좋은 분류 정확도를 보였다.

초장립종 벼를 이용한 입형 관련 QTL 분석 및 국내 벼 품종 입형 개선 연구 (QTL Analysis to Improve and Diversify the Grain Shape of Rice Cultivars in Korea, Using the Long Grain japonica Cultivar, Langi)

  • 김석만;박현수;이창민;백만기;조영찬;서정필;정오영
    • 한국작물학회지
    • /
    • 제65권4호
    • /
    • pp.303-313
    • /
    • 2020
  • 본 연구는 단조로운 국내 벼 품종의 입형을 다양화하기 위하여 초장립종 자포니카 품종을 활용해 그 특성을 국내 벼 품종에 도입함으로써 입형이 다양한 새 품종을 개발하려는 기초 육종연구의 일환으로 수행되었다. 입형 다양화를 위하여 세장형 자포니카 벼 품종인 Langi와 입형이 극단적으로 원형에 가까운 자포니카형 조생자도를 교배하여 유전분석 및 QTL 탐색을 위한 mapping 집단을 육성하였고, 이를 이용하여 입형 관련 형질의 상관분석, QTL 분석, validation test 및 탐색된 QTL 효과를 검정한 결과는 다음과 같다. 1. 조생자도와 Langi 조합의 교배립을 생산하여 F2 집단을 육성하였고 출수 일수를 고려하여 최종 265 개체를 선발·수확하여 주요 형질에 대한 조사와 QTL 분석에 이용하였다. 2. 육성된 mapping집단의 입형 관련 형질들은 종자 길이에 대해 종자 장폭비(0.89)와 천립중(0.69)이 상대적으로 높은 상관계수를 나타냈고, 종자폭에 대해서는 종자 길이(-0.47)와 장폭비(-0.82)가 음의 상관을 나타냈으며 종자두께(0.43)는 정상관을 보였다. 3. QTL 분석 결과 종자 길이와 관련하여 벼 5번 염색체에서 PVE 값이 20.31%인 qGL5와 7번 염색체에서 PVE 값이 각각 36.07%와 26.11%인 qGW5와 qGW7을 탐색하였다. qGL5는 세장형인 Langi로부터 유래하였으며, 두 QTL(qGW5, qGW7)은 원형인 조생자도로부터 유래하였다. 4. Validation test결과 Langi는 자포니카형 벼(qsw5_N)에서는 매우 드문 qSW5형 대립유전자를 가지고 있으며 이것은 qGL5와 함께 작용하여 집단내에서 종자 길이신장에 관여했을 것으로 추정된다. 5. 탐색 QTL의 효과는 qGL5 (+)와 qGW5:qGW7 조합에서 중원형, 장원형, 세장형 등 입형의 변이가 다양하게 나타났는데 Langi가 자포니카 생태형이란 점과 QTL의 효과가 증명되어 MAS활용이 가능하다는 점 등 입형 다양화를 위한 육종사업에서의 효과 및 활용도가 다양할 것으로 생각된다.