• 제목/요약/키워드: Optimal parameters

검색결과 4,312건 처리시간 0.033초

첨단 전자산업 폐수처리시설의 Water Digital Twin(II): e-ASM 모델 보정, 수질 예측, 공정 선택과 설계 (Water Digital Twin for High-tech Electronics Industrial Wastewater Treatment System (II): e-ASM Calibration, Effluent Prediction, Process selection, and Design)

  • 허성구;정찬혁;이나희;심예림;우태용;김정인;유창규
    • 청정기술
    • /
    • 제28권1호
    • /
    • pp.79-93
    • /
    • 2022
  • 본 연구에서는 Part I에서 제안한 첨단 전자산업 폐수처리시설 특화 Water Digital Twin모델인 e-ASM을 이용하여 랩-파일럿 처리장 데이터를 바탕으로 모델 보정(Calibration), 유입 성상에 따른 제거 효율, 유출수 예측 및 최적 공법 선정을 수행하였다. 첨단 전자산업 폐수처리시설의 특화 모델링을 위하여, 민감도 분석을 통해 e-ASM 모델의 정합성과 상관성이 높은 동역학적 파라미터를 선정하였고, 다중반응표면분석법 (Multiple response surface methodology, MRS)을 이용하여 동역학적 파라미터를 보정하였다. e-ASM 모델의 보정 결과, Lab-scale, Pilot-scale 단위의 실험데이터와 90% 이상의 높은 정합성을 보였다. 그리고 4가지 유기폐수 처리처리공법인 MLE, A2/O, 4-stage MLE-MBR, Bardenpho-MBR을 제안한 Water Digital Twin으로 구현하여 유입 폐수의 성상별 운전조건에 따라 제거효율을 분석하였으며, Bardenpho-MBR이 C/N ratio 변화에서도 안정적으로 COD (Chemical oxygen demand)를 90% 이상 제거하며 높은 총 질소 제거 효율을 보였다. 그리고 유입 폐수의 조건별 Bardenpho-MBR공정의 수리학적 체류시간(Hydraulic retention time, HRT)이 3일 이상일 때 1,800 mg L-1의 고농도 TMAH 폐수를 98% 이상 제거할 수 있음을 확인할 수 있었다. 이와 같이, 본 연구에서 개발한 e-ASM은 전자산업 제조시설별, 유입 폐수의 성상별 특화 모델링을 통해 높은 정합성을 가진 전자산업 폐수처리공정의 Water Digital Twin를 구현할 수 있고, 최적운전, Water AI, 최적가용기법 선정 등의 응용 가능성을 바탕으로 지속 가능한 첨단전자 산업을 위해 활용될 수 있을 것으로 사료된다.

제주 신양섭지해수욕장 주변 방두만 거머리말 군락 복원을 위한 실험적 이식 (Experimental Transplantation for the Restoration of Seagrass, Zostera marina L. Bed Around Sinyangseopji Beach in Bangdu Bay, Jeju Island)

  • 이형우;강정찬;박정임;김명숙
    • 한국해양학회지:바다
    • /
    • 제26권4호
    • /
    • pp.343-355
    • /
    • 2021
  • 제주도 동쪽에 위치한 신양섭지해수욕장 주변 방두만에는 과거 거머리말이 넓게 서식하였으나, 1990년대 방파제 공사 이후 모두 소실되었다. 본 연구는 방두만의 거머리말 서식지 복원을 위한 이식 적지 선정을 위해 2019년 1월과 2020년 1월에 방두만의 6개소에 거머리말을 이식한 후 생육 환경과 이식된 거머리말을 10개월간 월별 조사하였다. 거머리말 이식은 철사고정법을 이용하여 각 장소 당 500개체를 이식하였다. 이식된 거머리말은 모든 장소에서 대부분 생존하여 영양 번식으로 인한 밀도증가가 나타났다. 각 장소의 환경 즉, 수중광량, 수온과 염분농도는 유의한 차이가 나타났지만 모두 거머리말 생육에 적합하였다. 모든 장소에서 봄부터 파래가 출현하여 여름 동안 누적되었으나, 거머리말의 생존과 생장에는 유의한 영향을 미치지 않았다. 이식된 거머리말은 이식 3개월 후 112.5~300%의 밀도증가율이 나타났으며, 모든 장소에서 봄과 초여름 동안 높은 밀도 증가율을 보였다. 거머리말의 형태는 이식 충격으로 인하여 모든 장소에서 1~2 개월간 감소하였다가 이후 다시 증가하여 새로운 환경에 잘 적응한 것으로 확인되었다. 그러나 이식 후 8~9개월이 경과하는 늦여름부터 초가을 동안 2019년 2회, 2020년 3회의 강력한 태풍이 조사 지역을 관통하였다. 이로 인해 이식 10개월 후 방두만의 중심부에 위치한 2개소의 거머리말은 모두 소실되었으나, 방두만의 서쪽에 위치한 3개소 거머리말의 밀도증가율은 192~312%로 높게 유지되었다. 이로써 방두만의 잘피서식지 조성이 가능함을 알 수 있었고, 이식 거머리말의 밀도 증가율이 높고 태풍에도 안전한 방두만의 서쪽 연안이 생육 적지임을 확인할 수 있었다.

지방산 칼륨 Cream Soaps 의 상거동 연구 (Phase Behavior Study of Fatty Acid Potassium Cream Soaps)

  • 노민주;여혜림;이지현;박명삼;이준배;윤명석
    • 대한화장품학회지
    • /
    • 제48권1호
    • /
    • pp.55-64
    • /
    • 2022
  • Cleansing foam이라 불리는 지방산 칼륨 cream soap은 crystal gel 구조로 이루어져 있어 유화계와는 달리 전단응력에 약하며 고온의 보관조건에서 쉽게 분리되는 특성을 보여준다. Crystal gel 구조는 지방산의 종류 및 비율, 중화도, polyol의 종류와 사용량에 따라 크게 영향을 받는다. Crystal gel 구조에 미치는 이들의 영향을 조사하기 위해 water/potassium hydroxide (KOH)/fatty acid ternary system에서 실험을 실시하였다. Differential scanning calorimeter (DSC) 측정 결과 myristic acid (MA) : stearic acid (SA) = 3 : 1 비율에서 공융점(eutectic point)를 갖고 이 혼합비가 가장 안전한 삼성분계(ternary system)를 만든다는 것을 발견했다. 점도 측정과 편광현미경 (POM) 관찰 결과 중화도는 75% 부근이 최적이라고 판단된다. 삼성분계의 melting point (Tm)이 보관온도보다 높을 때, 그리고 crystal phase가 lamellar gel phase로 상 전이가 일어날 때 안정하나 지방산 함량의 증가는 안정성에 거의 영향을 미치지 않는다. 삼성분계에 polyol의 첨가는 Tm을 변화시키고 상전이를 일으키는데 중요한 역할을 한다. 클렌징폼의 구조는 저온 주사전자현미경 (Cryo-SEM), 소각 및 광각 X-선 산란 (SAXS, WAXS) 분석으로 규명하였다. Butylene glycol (BG), propylene glycol (PG), dipropylene glycol (DPG)은 Tm을 낮추어주며 lamellar gel phase 형성을 어렵게 하는 반면 glycerin, PEG-400, sorbitol은 Tm을 상승시키고 lamellar gel phase 형성을 용이하게 하며 안정한 삼성분계를 만든다.

계절내-계절 기후예측의 딥러닝 기반 후보정을 위한 입력자료 전처리 기법 평가 (Investigating Data Preprocessing Algorithms of a Deep Learning Postprocessing Model for the Improvement of Sub-Seasonal to Seasonal Climate Predictions)

  • 정유란;이진영;김미애;손수진
    • 한국농림기상학회지
    • /
    • 제25권2호
    • /
    • pp.80-98
    • /
    • 2023
  • 본 연구에서는 계절내-계절(Subseasonal to seasonal, S2S) 기후예측의 주별 예측 성능을 개선하기 위해서 딥러닝 기반의 후보정(post processing) 기술을 개발하였다. 그 첫 단계로, 일 최고, 최저기온과 일 강수를 목표 변수로, 자료의 특성과 분포에 적합한 자료 변환 및 특성 공학 기법을 규명하고자 하였다. 먼저, 6개 개별 기후모델의 S2S 예측 자료를 딥러닝 모델에 입력하기 위한 훈련자료로 변환하고, 이로부터 다중모델앙상블(Multi-Model Ensemble, MME) 기반 훈련자료를 구축하였다. 참값(label)으로는 ECMWF의 ERA5 재분석 자료를 사용하였다. 자료 변환 알고리즘은 최고 및 최저 차이를 계산하여 입력자료의 범위를 변형시키는 MinMax 및 MaxAbs 변환, 표준편차를 이용하는 Standard 변환 및 분위수를 지정하여 변형하는 Robust와 Quantile 변환으로 구성된 전처리 파이프라인을 구축하였으며, 변환된 훈련자료와 예측 변수와의 상관관계를 계산하여 순위에 따라 훈련자료의 특성을 선택하는 특성 선택 기법을 추가하였다. 본 연구는 U-Net 모델에 TimeDistributed wrapper를 모든 합성곱 층(convolutional layer)에 적용하여 활용하였다. 5개 알고리즘으로부터 변환된 6개 개별 기후모델 및 MME S2S 훈련자료(일 최고 및 최저기온, 강수)에 훈련 모델을 적용한 결과와 훈련 모델을 적용하지 않은 결과를 ERA5와의 공간상관계수(spatial Pattern Correlation Coefficient)를 계산하고 그 개선율인 기술 점수(skill score)를 평가한 결과, 일 강수의 PCC 기술 점수는 Standard 및 Robust 변환으로 처리된 것에서 전체 예측선행(1~4주)에 대해 모두 높았고, 일 최고 및 최저기온에서는 예측 선행시간 3~4주에서만 높게 나타났다. 또한, 일 강수에서 특성 선택에 따른 훈련자료의 차원 감소가 예측 성능 변화에 영향을 미치지 않는 것으로 나타났다. 일 최고 및 최저기온의 경우에는 특성 선택에 의한 훈련자료의 특성 정보 감소가 오히려 예측 성능을 저하시킬 수 있는 것으로 확인되었으며, 원시자료에서 예측성이 높은 1~2주 기온 예측 개선을 위한 적합한 전처리 변환 알고리즘이나 특성 선택을 찾을 수 없었다. 후속 연구에서는 원시 예측 성능이 강수에 비해 높으나 딥러닝 훈련 모델에 의한 후보정 효과가 미미한 예측 선행 1~2주 기온 예측의 저조 원인에 대해 탐색하고, 다양한 딥러닝 훈련 모델로의 적용 및 초매개변수 조정 등 학습 과정의 최적화를 통해 S2S 기후 예측 성능을 개선하고자 한다.

LDA, Top2Vec, BERTopic 모형의 토픽모델링 비교 연구 - 국외 문헌정보학 분야를 중심으로 - (A Comparative Study on Topic Modeling of LDA, Top2Vec, and BERTopic Models Using LIS Journals in WoS)

  • 이용구;김선욱
    • 한국문헌정보학회지
    • /
    • 제58권1호
    • /
    • pp.5-30
    • /
    • 2024
  • 이 연구는 토픽모델링 모형인 LDA, Top2Vec, BERTopic을 대상으로 실험데이터에서 토픽을 추출하고, 그 결과를 비교 분석함으로써 각각의 모형 간의 특성과 차이를 파악하는데 목적이 있다. 실험데이터는 Web of Science(WoS)에 등재된 문헌정보학 분야 학술지 85종에 게재된 논문 55,442편을 대상으로 하였다. 실험 과정으로 우선 각 모형의 파라미터를 기본값 그대로 이용하여 1차 토픽모델링 결과를 얻었고, 최적의 토픽 수를 설정하여 각 모형의 2차 토픽모델링 결과를 얻었으며, 이들을 각 모형과 단계별로 비교분석하였다. 1차 토픽모델링 단계에서는 LDA, Top2Vec, BERTopic 모형이 각각 100개, 350개, 550개의 토픽을 생성하여 세 모형은 각각 매우 다른 크기의 토픽 개수를 가져왔으며, LDA 모형에 비해 Top2Vec이나 BERTopic 모형이 토픽을 3배, 5배 더 세분화하였다. 또한 세 모형은 토픽 당 문서 수의 평균이나 표준편차에서도 많은 차이가 났다. 구체적으로 LDA 모형은 비교적 적은 수의 토픽에 많은 문서를 부여하는 반면, BERTopic 모형은 반대의 경향을 보였다. 25개의 토픽 수를 생성하는 2차 토픽모델링 단계에서는 다른 모형에 비해 Top2Vec 모형이 평균적으로 토픽 당 많은 문서를 부여하고 토픽간에 고르게 문서를 할당하여 상대적으로 편차가 작았다. 또한 모형간의 유사 토픽의 생성여부를 비교하면, LDA와 Top2Vec 모형이 전체 25개 중에 18개(72%)의 공통된 토픽을 생성하여 BERTopic 모형에 비해 두 모형이 더 유사한 결과를 보였다. 향후 토픽모델링 결과에서 각 토픽과 부여된 문서들이 주제적으로 올바르게 형성되었는지에 대한 전문가의 평가를 통해 보다 완전한 분석이 필요하다.

희귀 식물 박달목서 유묘의 생장 및 생리적 특성에 대한 차광 효과 (Shading Effects on the Growth and Physiological Characteristics of Osmanthus insularis Seedlings, a Rare Species)

  • 구다은;한심희;임은영;김진;구자정
    • 한국산림과학회지
    • /
    • 제113권1호
    • /
    • pp.88-96
    • /
    • 2024
  • 본 연구는 우리나라의 희귀식물인 박달목서의 현지내·외 보존 및 복원을 위한 생육 환경 조성 시 적정 광 조건을 구명하기 위해 수행되었다. 이를 위해 차광 처리구를 설치하여 전광 기준 100%, 55%, 20%, 10% 상대 광량 조건에서 4월부터 11월까지 생육 관리한 박달목서 유묘의 생장 특성, 잎 형태, 광합성 특성 및 광합성 색소 함량을 조사하였다. 그 결과, 수고와 근원경의 상대 생장률은 광량에 따른 차이가 없었으나, 잎, 줄기 및 뿌리의 건중량 및 잎 수는 55% 상대 광량 조건에서 가장 높았다. 잎의 형태는 광량이 높아질수록 엽면적이 작아지고 두께가 두꺼워지는 경향을 보였다. 광포화점에서의 광합성 속도와 기공전도도를 비롯하여 순양자수율, 암호흡, 잎의 엽록소 a, b와 카로테노이드 함량 역시 55% 상대 광량에서 가장 높았다. 전광 조건에서 박달목서 유묘의 잎은 작고 두꺼워지는 형태적 적응이 나타났으나, 엽록소 함량은 가장 낮아 광합성 속도가 55% 상대 광량보다 떨어졌다. 10%, 20% 상대 광량에서는 광량이 적을수록 엽록소 a, b, 카로테노이드 함량이 감소하였고, 광합성 속도와 암호흡 속도가 낮아졌다. 결론적으로, 박달목서 유묘는 광량에 따라 형태적인 적응 반응을 보였으나, 그늘에서 광합성 효율을 높이는 생리적인 반응은 뚜렷하지 않았다. 또한 생육에 가장 적절한 광조건은 전광의 55% 수준으로, 이 조건에서 광합성이 가장 활발하고 최종 산물인 건중량 생산이 최대로 나타났다. 따라서 박달목서는 현지외 보존을 위한 생육 환경 조성 시 광량이 전광의 55% 정도가 될 수 있도록 조절 관리하는 것이 필요할 것으로 판단된다.

처방선량 및 치료기법별 치료성적 분석 결과에 기반한 자궁경부암 환자의 최적 방사선치료 스케줄 (Optimum Radiotherapy Schedule for Uterine Cervical Cancer based-on the Detailed Information of Dose Fractionation and Radiotherapy Technique)

  • 조재호;김현창;서창옥;이창걸;금기창;조남훈;이익재;심수정;서양권;성진실;김귀언
    • Radiation Oncology Journal
    • /
    • 제23권3호
    • /
    • pp.143-156
    • /
    • 2005
  • 목적: 고선량률 강내근접치료와 외부방사선의 병합치료는 자궁경부암의 표준치료법이지만, 최적의 병합 방식 및 선량 분할 스케줄은 아직 정해지지 않고 있다. 부분적으로는 이에 영향을 미치는 인자들의 다양성 및 기존의 문헌들의 방사선 선량에 관한 자세한 정보 부족을 그 이유로 들 수 있다. 이에 본 연구는 고선량률 강내근접치료에 대한 풍부한 경험을 바탕으로 단일기관에서 비교적 균일한 치료를 받은 많은 수의 환자 모집단을 대상으로 이들 다양한 인자들 및 방사선치료에 대한 자세한 분석을 통해서 최적의 방사선치료를 위한 지침을 얻고자 하였다. 대상 및 방법: 1990년부터 1996년까지 연세암센터에서 고선량률 강내근접치료 및 외부방사선치료로 자궁경부암에 대한 근치적 치료를 받은 743명의 환자들을 대상으로 하였으며, 중앙추적관찰 기간은 52개월이었다. FIGO 병기 분포는 IB 198명, IIA 77명, IIB 364명, IIIA 7명, IIIB 89명, IVA 8명이었다. 전골반방사선 선량은 $23.4\~59.4$ Gy (중앙값 45 Gy)의 분포를 보였으며, 진단 시 종양의 크기 및 외부방사선치료에 대한 종양의 반응에 따라서 그 시기를 조절하는 중앙차폐는 495예에서 시행되었으며, 그 시기는 $14.4\~43.2$ Gy (중앙값 36.0 Gy)로 비교적 광범위하고 다양한 분포를 보였다. 강내근접치료와 외부방사선치료의 분할 선량 차이를 극복하기 위해 생물학적 유효선량(Biologically Effective Dose, BED) 개념을 적용하였으며, 종양 및 정상 조직에 대한 $\alpha/\beta$비는 각각 10 및 3으로 하였다. 모든 개별 환자의 직장 전벽 및 방광 흡수선량을 분석하였고, 합병증 및 골반제어율과의 상관 관계를 규명하고자 하였다. 이외에도 방사선치료 스케줄에 영향을 미칠 수 있는 인자들인 총 치료기간, 강내근접치료의 분할 선량 크기, 주치의의 선호도에 따른 치료 스케줄 차이 등도 함께 고려하여 분석하였다. 결과: 전체 환자에서 RTOG Grade 1-4독성 발생률은 $33.1\%$였다. 전체 환자의 5년 골반제어율은 $83\%$로 분석되었다. 중앙차폐이전 외부방사선선량과 강내근접치료의 합산 BED값(=MD-BED $Gy_{\alpha/\beta}$$\alpha/\beta$=10인 경우 $62.0\~121.9\;Gy_{10}$ (중앙값: $93.0\;Gy_{10}$)의 분포를, ${\alpha/\beta}=3$인 경우 $93.6\~187.3\;Gy_3$ (중앙값=$137.6\;Gy_3$ )의 분포를 보였다. MD-BED $Gy_3$는 직장합병증 발생과의 관계는 통계적으로 유의하였고, 방광합병증과는 유의하지 않았다. 직장합병증과의 연관성은 MD-BED $Gy_3$보다 개별 환자의 직장전벽 총 선량 BED값인 R-BED $Gy_3$가 훨씬 더 높았다. 요도카테터 풍선의 후방지점이 대변하는 방광의 총 선량 BED값인 V-BED $Gy_3$도 방광합병증과 경향성 테스트에서 통계적 유의성을 보였다. 하지만, 어떠한 방사선선량도 골반제어율과 의미 있는 상관관계를 보이지 않았다. 본 기관에서 주치의의 선호도에 따라 강내근접치료가 외부방사선치료의 중간에 시행되는 형태인 샌드위치기법과 외부방사선치료 후반부에 시행되는 순차적 기법으로 구분하였을 때, 두 방식간 치료성적 및 합병증의 차이는 없었다. 총 치료기간에 대한 분석에서는 치료기간이 길어질수록 재발 위험이 커지는 경향을 보였으나, 나이 및 병기, 종양의 크기, MD-BED $Gy_{10}$ 등의 예후 인자를 보정한 다변량분석에서는 치료기간이 100일 이상인 경우에만 통계적으로 유의하게 증가하였다. 강내근접치료 분할선량 크기인 3 Gy와 5 Gy 사이에 골반제어율 및 합병증의 차이는 없었다. 결론: 자궁경부암의 최적방사선치료 스케줄에 대한 지침을 세우기 어렵게 만드는 가장 중요한 이유는 강내근접치료가 갖는 선량분포 특성에서 기인하는 방사선선량-골반제어율 상관 관계의 부재 및 개별 종양의 방사선에 대한 반응 속도가 환자마다 크게 다를 수 있다는 점이다. 따라서 전체적인 원칙과 함께 개인화된 맞춤치료가 필요하다. 치료 지침에 영향을 미칠 수 있는 요소들의 복합적인 고려도 중요하다고 할 수 있겠다. 합병증 발생이 우려되는 경우 생물학적 유효선량을 낮추기 위해 적절한 조기 중앙차폐 및 강내근접치료의 분할선량 크기 감소를 고려해볼 수 있다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.