• 제목/요약/키워드: over fitting

검색결과 348건 처리시간 0.027초

자연 프루닝과 베이시안 선택에 의한 신경회로망 일반화 성능 향상 (Improving Generalization Performance of Neural Networks using Natural Pruning and Bayesian Selection)

  • 이현진;박혜영;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.326-338
    • /
    • 2003
  • 신경회로망 설계 및 모델선택의 목표는 최적의 구조를 가지는 일반화 성능이 우수한 네트워크를 구성하는 것이다. 하지만 학습데이타에는 노이즈(noise)가 존재하고, 그 수도 충분하지 않기 때문에 최종적으로 표현하고자 하는 진확률 분포와 학습 데이타에 의해 표현되는 경험확률분포(empirical probability density) 사이에는 차이가 발생한다. 이러한 차이 때문에 신경회로망을 학습데이타에 대하여 과다하게 적합(fitting)시키면, 학습데이타만의 확률분포를 잘 추정하도록 매개변수들이 조정되어 버리고, 진확률 분포로부터 멀어지게 된다. 이러한 현상을 과다학습이라고 하며, 과다학습된 신경회로망은 학습데이타에 대한 근사는 우수하지만, 새로운 데이타에 대한 예측은 떨어지게 된다. 또한 신경회로망의 복잡도가 증가 할수록 더 많은 매개변수들이 노이즈에 쉽게 적합되어 과다학습 현상은 더욱 심화된다. 본 논문에서는 통계적인 관점을 바탕으로 신경회로망의 일반화 성능을 향상시키는 신경회로 망의 설계 및 모델 선택의 통합적인 프로세스를 제안하고자 한다. 먼저 학습의 과정에서 적응적 정규화가 있는 자연기울기 학습을 통해 수렴속도의 향상과 동시에 과다학습을 방지하여 진확률 분포에 가까운 신경회로망을 얻는다. 이렇게 얻어진 신경회로망에 자연 프루닝(natural pruning) 방법을 적용하여 서로 다른 크기의 후보 신경회로망 모델을 얻는다. 이러한 학습과 복잡도 최적화의 통합 프로세스를 통하여 얻은 후보 모델들 중에서 최적의 모델을 베이시안 정보기준에 의해 선택함으로써 일반화 성능이 우수한 최적의 모델을 구성하는 방법을 제안한다. 또한 벤치마크 문제를 이용한 컴퓨터 시뮬레이션을 통하여, 제안하는 학습 및 모델 선택의 통합프로세스의 일반화 성능과 구조 최적화 성능의 우수성을 검증한다.

LSTM을 이용한 주가예측 모델의 학습방법에 따른 성능분석 (A Performance Analysis by Adjusting Learning Methods in Stock Price Prediction Model Using LSTM)

  • 정종진;김지연
    • 디지털융복합연구
    • /
    • 제18권11호
    • /
    • pp.259-266
    • /
    • 2020
  • 과거 인공지능 분야에서는 지식 기반의 전문가 시스템 및 머신러닝 알고리즘들을 금융 분야에 적용하는 연구가 꾸준하게 수행되어 왔다. 특히 주식에 대한 지식 기반의 시스템 트레이딩은 이제 보편화되었고, 최근에는 대용량 데이터에 기반한 딥러닝 기술을 주가 예측에 적용하기 시작했다. 이중 LSTM은 시계열 데이터에 대한 검증된 모델로서 주가 예측에도 적용되고 있다. 본 논문에서는 주가 예측 모델로서 LSTM을 적용할 때 성능향상을 위해 고려해야 할 복잡한 매개변수 설정과 적용 함수들에 대해 적합한 조합 방법을 제안하도록 한다. 크게 가중치와 바이어스에 대한 초기화 대상과 설정 방법, 과적합을 피하기 위한 정규화 적용 대상과 설정 방법, 활성화 함수 적용 방법, 최적화 알고리즘 선택 등을 제시한다. 이 때 나스닥 상장사들에 대한 대용량 데이터를 바탕으로 각각의 방법들을 적용하여 정확도를 비교하면서 평가한다. 이를 통해 주가 예측을 위한 LSTM 적용 시 최적의 모델링 방법을 실증적인 형태로 제안하여 현실적인 시사점을 갖도록 한다. 향후에는 입력 데이터의 포맷과 길이, 하이퍼파라미터들에 대한 성능평가를 추가 수행하여 주요 설정 항목들의 조합에 대한 일반화 연구를 수행하고자 한다.

마우스와 사람 림프구에서 방사선에 의한 미소핵의 형성 및 고려인삼의 효과 (Induction of Micronuclei in Human and Mouse Lymphocytes Irradiated with Gamma Radiation and Effect of Panax ginseng C.A. Meyer)

  • 김성호;오헌;이송은;이윤실;김태환;정규식;류시윤
    • Journal of Radiation Protection and Research
    • /
    • 제22권3호
    • /
    • pp.153-160
    • /
    • 1997
  • 사람의 말초혈액림프구와 C57BL/6마우스의 비장림프구를 사용하여 시험관내에서 감마선을 조사하고 배양하여 세포질분열 차단 림프구내에 형성되는 미소핵의 빈도를 측정하였다. 미소핵 발생빈도는 방사선조사 선량에 비례하여 증가하였으며 linen-quadratic 곡선식에 적용하여, 세포 당 0.2개의 미소핵이 유도되는 방사선량을 산출하면 사람의 말초혈액 림프구에 비하여 마우스 비장림프구에서 1.67배 민감하였다. 미소핵시험방법을 이용하여, 사람의 말초혈액 림프구에 대한 인삼의 방사선 방호효과를 시험관내 시험으로, 마우스의 미장림프구에 대한 효과를 생체내 시험으로 검정하였다. 사람림프구에 있어서 방사선(3Gy)에 의해 유도되는 미소핵의 수는 방사선조사 전 및 후 투여군에서 공히 감소하였으며(p<0.01), 마우스를 사용한 생체시험에서도 림프구의 미소핵 발생빈도는 낮게 관찰되었다(p<0.025). 이상의 결과에서 인삼은 인체에서도 방사선에 의한 세포장해를 감소시킬 가능성을 나타냈다.

  • PDF

토양조성에 따른 옥상녹화용 섬기린초 생장모형 연구 (A Study on the Growth Models of Sedum takevimense as Affected by Difference of Soil Mixture Ratio in the Green Roof System)

  • 강태호;이홍;조홍하
    • 한국조경학회지
    • /
    • 제39권6호
    • /
    • pp.110-117
    • /
    • 2011
  • 본 연구는 2010년 4월 3일부터 3가지 토양 조성에 따른 섬기린초의 월동 후 생육상태를 측정하였고, 초고-생장시간 생장모형을 개발하고자 하였다. 이를 위해 함수식(Logistic식과 Gompertz식)을 사용하였고, SPSS를 이용하여 비선형 회귀분석을 진행하였다. 섬기린초의 초고-생장시간 생장모형을 통하여 섬기린초 월동 후의 생장과정과 관리방법을 명확하게 파악할 수 있다. 섬기린초의 생육상태 측정치에 의하면, 펄라이트($P_1$)보다는 혼합한 토양($P_2P_1V_1$, $P_1P_2V_1$)의 생육상태가 더 양호하고, 평균초고는 최대 약 2배 정도의 차이가 나타났다. 그리고 섬기린초의 Logistic생장모형과 Gompertz생장모형의 평균결정계수($R^2$)는 0.995, 0.978 순으로 나타났으며, Logistic생장모형의 적합성은 Gompertz생장모형보다 높은 것으로 확인되었다. 또한 섬기린초의 생장모형을 통하여 월동 후의 생장 기간은 3기간으로 나눌 수 있으며, 생장형태는 "비교적 빠른 생장기간---아주 빠른 생장기간---느린 생장기간"으로 구분할 수 있다. 옥상녹화용 섬기린초를 관리할 때 빠른 생장기간에서만 관리하면 섬기린초의 생육상태는 많이 좋아질 것으로 판단된다.

확장 Coda 규격화 방법에 의한 한국남동부 지각의 Q$_P^{-1}$, Q$_S^{-1}$연구 (A Study of Q$_P^{-1}$ and Q$_S^{-1}$ Based on Data of 9 Stations in the Crust of the Southeastern Korea Using Extended Coda Normalization Method)

  • 정태웅;;이기화
    • 한국지구과학회지
    • /
    • 제22권6호
    • /
    • pp.500-511
    • /
    • 2001
  • 양산단층이 지나는 한국 남동지방 지각의 Q$_P^{-1}$ 및 Q$_S^{-1}$를 한국자원연구소가 설치한 9점의 지진관측소 자료를 바탕으로 확장 Coda 규격화법을 이용하여 구하였다 1994년 12월부터 2000년 2월에 일어난 근지지진에서 707개 지진기록에 대하여 1${\sim}$2, 2${\sim}$4, 4${\sim}$8, 8${\sim}$16및 16${\sim}$32Hz의 대역필터를 적용하여 분석한 결과, 각 관측점의 Q$_P^{-1}$는 (7${\pm}$2)${\times}$10$^{-3}$에서 (5${\pm}$4)${\times}$10$^{-4}$으로, Q$_S^{-1}$는 5${\pm}$4)${\times}$10$^{-4}$에서 (5${\pm}$2)${\times}$10$^{-4}$로 주파수가 1.5Hz에서 24Hz로 늘어남에 따라 줄어드는 주파수 의존성이 보인다. 이들 값의 지수 회귀선은 Q$_P^{-1}$가 0.009(${\pm}$0.003)f$^{-1.05({\pm}0.14)$, Q$_S^{-1}$가 0.004(${\pm}$0.001)f$^{-0.75({\pm}0.14)$)이다.

  • PDF

출혈성 쇼크를 일으킨 흰쥐에서 인공신경망과 지원벡터기계를 이용한 생존율 비교 (Comparison of Survival Prediction of Rats with Hemorrhagic Shocks Using Artificial Neural Network and Support Vector Machine)

  • 장경환;유태근;남기창;최재림;권민경;김덕원
    • 전자공학회논문지SC
    • /
    • 제48권2호
    • /
    • pp.47-55
    • /
    • 2011
  • 전 세계적으로 상해로 인한 사망자 중 1/3의 직접적인 사망 원인은 출혈성 쇼크이다. 그러나 초기 쇼크에서 이를 정확히 예측할 수 있다면 신속한 치료가 가능하여 그 피해를 줄일 수 있다. 본 논문의 목적은 흰쥐의 대퇴부정맥을 통해 일정량의 출혈을 시키면서 변화하는 생리적 변수인 심박수, 수축기 혈압, 평균 동맥압, 호흡수, 체온 데이터로 최적의 생존 예측 모델을 제시하여 출혈성 쇼크를 조기 진단하는 것이다. 예측 모델로는 최근 많이 연구되는 인공신경망과 지원벡터기계 방법을 사용하였다. 과대적합을 피하고 최적의 모델을 선정하기 위해 10-fold cross validation을 수행하였을 때, 인공신경망의 경우 은닉노드 수가 3개인 모델이 가장 우수한 성능을 보였고, 지원벡터기계에서는 가우시안 커널함수를 이용한 모델이 가장 우수한 성능을 보였다. 평가 데이터 세트를 이용하여 각각의 생존 예측 모델을 평가한 결과 인공신경망의 경우 민감도 88.9 %, 특이도 96.7 %와 정확도 92.0 %를 보였고, 지원벡터기계의 경우 민감도 97.8 %, 특이도 95.0 %와 정확도 96.7 %를 보였다. 따라서 출혈에 따른 흰쥐의 생존 예측에서 지원벡터기계가 인공신경망보다 더 우수한 성능을 보이는 것을 확인하였다.

적합직교분해(POD)기법을 사용한 난류 응집구조 거동에 관한 연구 (A Study on the Effect of Large Coherent Structures to the Skin Friction by POD Analysis)

  • 신성윤;정광효;강용덕;서성부;김진;안남현
    • 대한조선학회논문집
    • /
    • 제54권5호
    • /
    • pp.406-414
    • /
    • 2017
  • An experimental study in a recirculating water channel was carried out to investigate the effect of large coherent structures to the skin friction on a flat plate. Particle Image Velocimetry (PIV) technique was used to quantify characteristic features of coherent structures growing to the boundary layer. In the PIV measurement, it is difficult to calculate the friction velocity near the wall region due to laser deflection and uncertainty so that Clauser fitting method at the logarithmic region was adopted to compute the friction velocity and compared with the one directly measured by the dynamometer. With changing the free-stream velocity from 0.5 m/s to 1.0 m/s, the activity of coherent structures in the logarithmic region was increased over three times in terms of Reynolds stress. The flow field was separated by Variable Interval Time Averaging (VITA) technique into the weak and the strong structure case depending on the existence large coherent structures in order to validate its effectiveness. The stream-wise velocity fluctuation was scanned through at the boundary thickness whether it had a large deviation from background flow. With coherent structures connected from near-wall to the boundary layer, mean wall shear stress was higher than that of weak structure case. Proper Orthogonal Decomposition (POD) analysis was also applied to compare the energy budget between them at each free-stream velocity.

Evaluation of the nutritional value of locally produced forage in Korea using chemical analysis and in vitro ruminal fermentation

  • Ki, Kwang Seok;Park, Su Bum;Lim, Dong Hyun;Seo, Seongwon
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제30권3호
    • /
    • pp.355-362
    • /
    • 2017
  • Objective: The use of locally produced forage (LPF) in cattle production has economic and environmental advantages over imported forage. The objective of this study was to characterize the nutritional value of LPF commonly used in Korea. Differences in ruminal fermentation characteristics were also examined for the LPF species commonly produced from two major production regions: Chungcheong and Jeolla. Methods: Ten LPF (five from each of the two regions) and six of the most widely used imported forages originating from North America were obtained at least three times throughout a year. Each forage species was pooled and analyzed for nutrient content using detailed chemical analysis. Ruminal fermentation characteristics were also determined by in vitro anaerobic incubations using strained rumen fluid for 0, 3, 6, 12, 24, and 48 h. At each incubation time, total gas, pH, ammonia, volatile fatty acid (VFA) concentrations, and neutral detergent fiber digestibility were measured. By fitting an exponential model, gas production kinetics were obtained. Results: Significant differences were found in the non-fiber carbohydrate (NFC) content among the forage species and the regions (p<0.01). No nutrient, other than NFC, showed significant differences among the regions. Crude protein, NFC, and acid detergent lignin significantly differed by forage species. The amount of acid detergent insoluble protein tended to differ among the forages. The forages produced in Chungcheong had a higher amount of NFC than that in Jeolla (p<0.05). There were differences in ruminal fermentation of LPF between the two regions and interactions between regions and forage species were also significant (p<0.05). The pH following a 48-h ruminal fermentation was lower in the forages from Chungcheong than from Jeolla (p<0.01), and total VFA concentration was higher in Chungcheong than in Jeolla (p = 0.05). This implies that fermentation was more active with the forages from Chungcheong than from Jeolla. Analysis of gas production profiles showed the rate of fermentation differed among forage species (p<0.05). Conclusion: The results of the present study showed that the nutritional values of some LPF (i.e., corn silage and Italian ryegrass) are comparable to those of imported forages widely used in Korea. This study also indicated that the nutritional value of LPF differs by origin, as well as by forage species. Detailed analyses of nutrient composition and digestion kinetics of LPF should be routinely employed to evaluate the correct nutritional value of LPF and to increase their use in the field.

DGNSS 위치정확도 향상을 위한 PRC 보정정보 모델링에 관한 연구 (A Study on Pseudo-Range Correction Modeling in order to Improve DGNSS Accuracy)

  • 손동효;박관동
    • 대한공간정보학회지
    • /
    • 제23권4호
    • /
    • pp.43-48
    • /
    • 2015
  • 본 논문은 DGNSS(Differential GNSS) 위치정확도 향상을 위한 PRC(Pseudo-Range Correction) 보정정보 모델링에 관한 연구내용이다. PRC는 DGNSS 기법을 이용하여 측위정확도를 향상시키기 위해 사용되는 보정정보로써 사용자가 통신망을 통해 수신한 뒤 사용된다. 그러나 일시적인 통신두절이나 신호간섭 등으로 인해 위치정확도가 급격히 저하되는 일이 발생한다. 그래서 본 논문에서는 이러한 현상을 방지하기 위해 PRC 보정정보를 다항식 곡선접합 방정식을 이용하여 모델링하고 그 정확도를 평가하였다. 모델링 매개변수를 이용하여 계산한 PRC 추정값과 실제 기준국 수신기에서 생산되는 관측값간의 차이를 계산한 결과 GPS의 경우에는 평균 0.1m, RMSE는 1.3m로 나타났고 대부분의 위성들이 ${\pm}1.0m$ 이내의 편향오차와 3.0m 이내의 RMSE를 보였다. GLONASS의 경우에는 평균 0.2m이고 대부분 ${\pm}2.0m$ 이내에 분포하였다. RMSE는 2.6m로 나타났고 다수의 위성들이 3.0m 이내에 분포하였다. 이런 결과는 모델링을 통해 산출한 추정값이 사용자의 위치정확도를 유지하는데 유효하게 사용될 수 있음을 보였다. 그러나 고도각이 낮은 영역에서 두 값의 차이가 크게 나타나 이에 대한 연구를 추가적으로 수행할 필요성이 있다.

Adphos 여재의 인 흡착특성과 식생 매트와 결합한 여과실험에 의한 효율 (Phosphate Adsorption Characteristics of a Filter Medium, Adphos, and Its Efficiency by the Filtration Experiment Combined with the Vegetation Mat)

  • 김지아;주광진;최이송;장광현;오종민
    • Ecology and Resilient Infrastructure
    • /
    • 제3권4호
    • /
    • pp.231-237
    • /
    • 2016
  • 본 연구에서는 여재와 식생을 결합한 수질정화기술에 적용된 여재의 흡착특성을 파악하고, 장기 여과실험에 따른 제거효율의 추이를 관찰하였다. 연구대상 여재는 Adphos이며 인산염 인 ($PO_4{^{3-}-P}$) 흡착특성 분석결과 Adphos는 Langmuir 흡착모델에 적합한 것으로 분석되었고 이 모델에 적용 시 인산염 최대흡착량 ($q_m$)은 1.162 mg/g 으로 산출되었다. 정화기술의 효율을 검증하기 위하여 Adphos의 두께를 400 mm로 충진한 실험실 규모 반응기를 제작하였다. 식생부는 노랑꽃창포 (Iris pseudacours L.)를 식재하였고 식물의 활착을 위한 기반재는 야자섬유 롤 (coir roll)을 사용하였다. 일일 8시간씩 71일간 여과실험을 지속한 결과 융복합형 반응기의 평균 제거효율은 SS, T-N, T-P 각각 94%, 41%, 64%로 나타났다. 실험 결과에 따라 정화기술의 성능이 우수한 것으로 사료되며, 부도기술의 장기 적용을 위한 유지관리방안 마련이 요구된다.