• 제목/요약/키워드: A*Algorithm

검색결과 54,221건 처리시간 0.091초

WPS와 장갑 장치 기반의 동적 제스처 인식기의 구현 (An Implementation of Dynamic Gesture Recognizer Based on WPS and Data Glove)

  • 김정현;노용완;홍광석
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.561-568
    • /
    • 2006
  • 차세대 PC를 위한 WPS(Wearable Personal Station)는 정보 처리 및 네트워크 기능을 포함하며 새로운 정보의 획득에 있어 공간적 한계성을 극복할 수 있는 '유비쿼터스 컴퓨팅'의 핵심 단말기로 정의할 수 있다. 기존의 유선 통신 모듈을 이용한 데스크톱 PC 기반의 제스처 인식기는 영상 또는 장갑 장치로부터 사용자의 의미 있는 동적 제스처 데이터를 획득함에 있어 공간상의 제약성 및 이동상의 한계성, 배경 및 음영조건의 변화에 따른 인식 성능의 변화 등 몇 가지 제약사항을 가지고 있다. 따라서 본 논문에서는 이러한 문제점들을 극복하고 해결하고자 제스처 입력모듈을 차세대 PC 플랫폼 기반의 유비쿼터스 환경으로 확대, 적용시켜 제스처 데이터 입력 모듈로부터 새로운 정보의 획득에 있어 한계성을 극복하고 효율적인 데이터 획득 방안을 제시한다 또한 퍼지 알고리즘과 신경망 이론을 이용하여 독립적인 제스처 인식 시스템을 구현하고 개별 시스템의 성능을 비교, 분석함으로써 차세대 PC를 위한 보다 효율적이며 합리적인 제스처 인식 시스템을 제안한다. 제안된 제스처 인식시스템은 동적인 손의 움직임을 입력데이터로 처리하는 제스처 입력모듈과 입력된 데이터로부터 의미 있는 제스처를 분리하기 위한 관계형 DBMS모듈, 그리고 인식의 확장성과 연속된 동적 제스처 중에서 의미 있는 제스처를 인식하기 위한 퍼지 인식 모듈 및 신경망 인식 모듈로 구성되어 있다. 30인의 피실험자에 대하여 15회의 반복 실험을 수행하였으며 사용자의 동적 제스처 인식 실험결과 퍼지 제스처 인식 시스템에서는 98.8%, 신경망 제스처 인식시스템에서는 96.7%의 평균 인식률을 도출하였다.형성에도 유의한 영향을 미치는 것을 알 수 있었다. 셋째, 신뢰와는 다르게 서비스품질이 몰입에는 유의한 영향을 미치지 못하는 것으로 나타났다. 그러나 이러한 직접적인 영향이외에 서비스품질은 고객만족을 통하여 간접적으로 몰입에 강한 영향을 미치는 것으로 나타났다. 넷째, 고객만족은 신뢰에 강하게 정(+)의 영향을 미치는 것으로 나타났다. 즉 고객들이 호텔서비스에 만족할수록 직접적으로 호텔에 대한 신뢰와 애착심이 증가하는 것을 알 수 있었고 간접적으로 서비스품질은 고객만족을 통하여 신뢰에 강한 영향을 미치는 것으로 나타났다. 다섯째, 또한 고객만족은 몰입에 강하게 정(+)의 영향을 미치는 것으로 나타났다. 간접적으로 서비스품질은 고객만족을 통하여 몰입에 강한 영향을 미치는 것으로 나타났다.미숙밭, 중점밭, 고원밭, 화산회밭으로 6개 유형으로 분류할 경우 각각의 분포면적은 41.9%, 23.3%, 17.5%, 13.9%, 1.1. 2.2% 이었다. 도시화 및 도로확대 등 다양한 토지이용 및 지형개변으로 과거의 토양정보가 많이 변경되었다. 그래서, 앞으로는 인공위성자료 및 항공사진을 이용하여 빠르고 쉽게 활용할 수 있는 토양조사 방법개발과 기 구축된 토양도의 수정, 보완 작업이 필요한 절실히 요구되고 있는 현실이다.브로 출시에 따른 마케팅 및 고객관리와 관련된 시사점을 논의한다.는 교합면에서 2, 3, 4군이 1군에 비해 변연적합도가 높았으며 (p < 0.05), 인접면과 치은면에서는 군간 유의차를 보이지 않았다 이번 연구를 통하여 복합레진을 간헐적 광중합시킴으로써 변연적합도가 향상될 수 있음을 알 수 있었다.시장에 비해 주가가 비교적 안정적인 수준을 유지해 왔다고 볼

정지궤도 해색탑재체(GOCI) 자료 검정을 위한 사전연구 (Prelaunch Study of Validation for the Geostationary Ocean Color Imager (GOCI))

  • 유주형;문정언;손영백;조성익;민지은;양찬수;안유환;심재설
    • 대한원격탐사학회지
    • /
    • 제26권2호
    • /
    • pp.251-262
    • /
    • 2010
  • GOCI(Geostationary Ocean Color Imager) 표준자료의 지속적인 품질관리를 위해서는 위성 운용기간 중 궤도상 복사보정, 대기보정 단계를 거쳐야 되며 해수환경 분석 알고리즘에 대한 검보정도 지속적으로 이루어져야 한다. GOCI의 복사, 대기, 해양환경 자료에 대한 검보정은 부이나 고정 플랫폼을 이용한 수온, 염분, 해수 광특성, 형광, 및 탁도 관측과, 주기적으로 해양환경 자료 수집을 통하여 실시한다. 이를 위하여 동중국해에 위치하고 있는 이어도 종합해양과학기지에 설치된 광학 관측 장비와 현장 관측의 복사자료를 상호 비교해 보았으며, GOCI 표준자료의 검정에 앞서 SeaWiFS 복사량과 비교하여 검정하였다. 해수출 광량은 현장관측에서 얻어진 광과 광량과는 약간의 차이를 보였지만, 흡광영역이 매우 잘 일치하고 있으며 스펙트럴 이동은 없는 것으로 판단된다. 이어도 종합해양과학기지의 분광측정기와 SeaWiFS의 전 밴드에서 얻어진 해수출 광량을 비교한 결과 평균 25% 정도의 에러가 발생했지만, 대기보정 밴드를 제외하면 절대오차가 11% 정도로 상당히 낮아진다. 이것은 SeaWiFS 표준 대기보정 방법의 문제점으로 GOCI 검보정 연구에서 고려되어 보완 되어야 할 것으로 판단된다. 이와 더불어 독도 지역의 표준 관측치(Reference Target Site) 구축을 통한 검보정 연구를 위하여, 독도 주변 해수의 광 특성과 해양환경 자료는 2009년 8월과 2009년 10월 2차례에 걸쳐서 현장관측을 실시하였다. 독도 주변 해역의 해양 광 특성은 원격반사도의 스펙트럼형태를 기준으로 Case-1 Water 성향이 강한 해수에서 나타나는 특성과 매우 유사하였다. 식물플랑크톤, 부유물질, 용존유기물의 흡광계수 스펙트럼의 형태들은 대체적으로 각 성분별 흡광 스펙트럼 특성을 잘 보여주었다. 또한 MODIS Aqua로부터 산출된 엽록소 농도와 현장관측을 통한 검증에서 위성자료 값들은 잘 일치한다. 위와 같이 현재 진행되고 있는 GOCI 검보정 연구를 통해서 복사, 대기, 해양환경 알고리즘에 대한 문제점이 도출되었고, 차후 검보정 계획에 반영하여 이 부분들에 대한 개선 및 보완이 이루어질 것으로 판단된다.

인공위성 광학 스펙트럼 기반 이어도 해양과학기지 주변 해수의 수형 분류 (Sea Water Type Classification Around the Ieodo Ocean Research Station Based On Satellite Optical Spectrum)

  • 이지현;박경애;박재진;이기택;변도성;정광영;오현주
    • 한국지구과학회지
    • /
    • 제43권5호
    • /
    • pp.591-603
    • /
    • 2022
  • 해수 속의 용존 유기·무기물과 플랑크톤 등의 상호 작용은 해수의 색과 광학적 특성을 결정한다. 동중국해에 위치한 이어도 해양과학기지(I-ORS) 주변의 해역은 서쪽으로 양자강 저염수, 남쪽으로 대마 난류에 영향을 받아 한반도 주변의 해수 순환과 광특성 변동 연구에 적합하다. 본 연구에서는 MODIS/Aqua로 관측한 위성 원격 반사도와 NOMAD 실측 원격 반사도를 이용하여 2016년 1월부터 2020년 12월까지 I-ORS 주변의 해수의 원격반사도를 스펙트럼 특성에 따라 23가지의 유형으로 분류하였으며, 이어도 해양 과학기지 주변 해역(d ≤ 10 km)의 위성 일치점 자료 59,532개를 이용하여 연구 해역 수형의 계절 변동 특성을 제시하였다. 각 관측 지점에서의 원격 반사도 스펙트럼은 분광 각도법을 이용하여 기준 스펙트럼과의 유사도를 비교함으로써 가장 근접한 기준 수형으로 분류 하였으며 분광 유사도가 10° 이내일 때만 유의미하다고 판단하였다. 연구 기간내 I-ORS 주변 해역에서는 상대적으로 맑은 해역에서 잘 나타나는 수형이 50% 이상으로 가장 빈번하게 관측되었다. 계절별 수형의 도수분포에서 여름과 겨울의 분포 양상이 다르게 나타났고, 특히 여름에는 맑은 해수에서 주로 나타나는 7 이하의 수형이 주로 출현한 반면에 겨울에는 전체 4% 미만으로 존재하였다. I-ORS 주변을 비롯한 동중국해의 수형의 공간 분포 특성을 고려할 때 I-ORS는 해수 수형의 전이 대에 위치한 것으로 판단된다. 본 연구는 한반도 연안에서의 수형 변동을 분석함으로써 해수의 광학 특성 이해을 이해하고 인공위성 해색 변수의 정확도 향상을 위한 토대 마련에 기여할 것으로 기대된다.

장기 수경재배에서 급액량의 차이가 토마토 생육과 수량 특성에 미치는 영향 (Effect of Difference in Irrigation Amount on Growth and Yield of Tomato Plant in Long-term Cultivation of Hydroponics)

  • 최경이;임미영;김소희;노미영
    • 생물환경조절학회지
    • /
    • 제31권4호
    • /
    • pp.444-451
    • /
    • 2022
  • 최근 토마토 수경재배가 증가하며 장기 재배가 일반화 되고 있다. 수경재배에서는 작물의 양분과 수분 요구도를 고려하여 적정 양액을 공급하는 것이 생산성, 자원의 이용, 환경보전 측면에서도 매우 중요한데 장기재배에서는 계절적인 환경변화가 심하므로 이것을 고려한 급액 관리가 매우 중요하다. 따라서 코이어 배지를 이용한 토마토 장기재배에서 급액량이 생육과 수량에 미치는 영향을 구명하고자 하였다. 온실 외부에 설치된 일사 센서로 적산일사를 기준으로 급액 횟수를 조절하였으며, 생육시기별로 급액 기준을 변경하며 4수준(High, Medium high, Meidum low, Low)으로 급액량을 달리 처리하였다. 급액량이 많을수록 배액률이 높았으며 배액의 EC가 지나치게 높아지는 것을 방지 할 수 있었다. 재배기간이 경과하면서 배액 EC가 높아졌는데 급액량이 적은 처리일수록 상승 폭이 컸다. 초장은 급액량이 가장 적은 처리구가 다른 처리구에 비하여 작았고 마디수와 화방의 발생 수는 급액량에 영향을 받지 않았다. 착과수는 전체적으로는 급액량의 영향을 크게 받지 않았으나 저온기에 발생한, 12-15화방에서는 급액량이 가장 많았던 처리구가 착과수가 적었다. 배꼽썩음과는 급액량이 가장 적은 처리구가 많았고 발생 시기도 빨랐다. 과실의 크기는 High 처리구가 컸으나 전체 수량은 Medium high 처리가 가장 많았다. 시험의 결과로 코이어를 이용한 토마토 수경재배에서 급액량이 근권의 양·수분 안정화와 생산성에 미치는 영향과 적정한 급액 관리의 중요성을 확인할 수 있었다. 따라서 최근에 보급되고 있는 복합환경제어시스템에 근권의 정보를 기준으로 정밀급액제어 알고리즘을 적용한다면 수경재배 제어기술 발전과 더불어 작물의 생산성 향상에도 기여할 수 있을 것으로 판단되므로 이에 대한 지속적인 연구가 필요할 것이다.

항공 LiDAR 원자료 필터링 조건에 따른 산림지역 수치표고모형 정확도 평가 (The Accuracy Evaluation of Digital Elevation Models for Forest Areas Produced Under Different Filtering Conditions of Airborne LiDAR Raw Data)

  • 조승완;최형태;박주원
    • 농업생명과학연구
    • /
    • 제50권3호
    • /
    • pp.1-11
    • /
    • 2016
  • 3차원 지형정보를 얻기 위하여 항공 LiDAR(Light Detection and Ranging)자료 기반 수치표고모델(Digital Elevation Model, DEM) 생성에 대한 연구들에 대한 관심이 지속적으로 높아져 왔다. 항공 LiDAR 원자료로부터 정확도가 높은 DEM을 생성하기 위해서는 3차원 점군에서 비지면점을 제외시키고 지면점만을 포함시키는 필터링(filtering)과정이 중요하다. 특히, 필터링을 구성하는 알고리즘의 패러미터 값 변화에 따라 산출되는 결과물들에 차이가 발생하고 정확도에 영향을 준다. 따라서 본 연구는 화천, 양주, 경산 및 장흥 유역 대상지의 항공 LiDAR 자료로부터 Fusion 소프트웨어를 이용하여 LiDAR DEM을 생성하는 GroundFilter알고리즘의 Mean패러미터(GFmn) 수준 변화가 LiDAR DEM 결과물의 정확도에 어떤 영향을 주는지 분석하였다. GFmn 수준 변화에 따른 정확도에 대한 영향 여부를 분석하기 위해 일원배치분산분석을 실시하였고, 그 결과 GFmn의 수준 변화에 따라 정확도에 대한 영향이 유의미하게 나타났다(F-value: 4.915, p<0.01). 이 후 각각의 GFmn 수준들을 다른 수준들과 차이가 있는지 여부로 묶기 위하여 사후검정을 실시하였다. 사후분석을 통해 잔차의 평균 차이에 따라 '7, 5, 9, 3'과 '1' 두 집단으로 나뉘었다. 아울러 보다 정확한 해발고도를 표현하는 LiDAR DEM 생성하는데 적정 GFmn은 '7' 조건일 때로 나타났다. 이 연구를 통해 보다 정확한 해발고도를 표현하는 LiDAR DEM을 생성할 수 있는 패러미터 값을 제안하였다.

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

CT 기반 딥러닝을 이용한 만성 폐쇄성 폐질환의 체성분 정량화와 질병 중증도 (CT-Derived Deep Learning-Based Quantification of Body Composition Associated with Disease Severity in Chronic Obstructive Pulmonary Disease)

  • 송재은;박소현;임명남;이은주;차윤기;윤현정;김우진
    • 대한영상의학회지
    • /
    • 제84권5호
    • /
    • pp.1123-1133
    • /
    • 2023
  • 목적 만성폐쇄성폐질환의 CT에서 자동 정량 측정된 체성분과 폐기능 또는 정량적 변수들 사이의 연관성을 알아보고자 하였다. 대상과 방법 총 290명의 만성폐쇄성폐질환 환자를 대상으로 연구하였다. 흉부 CT에서 근육 및 피하지방 부피, T12 레벨에서 근육 및 피하지방 면적 및 골 감쇠를 딥러닝 기반 분할 알고리즘을 사용하여 획득하였다. Parametric response mapping-derived emphysema (이하 PRMemph), PRM-derived functional small airway disease (이하 PRMfSAD) 및 기도 벽 두께(airway wall thickness; 이하 AWT)-Pi10을 정량적으로 평가하였다. Pearson 상관 분석을 사용하여 체성분과 결과 간의 연관성을 평가하였다. 결과 근육과 피하지방의 부피와 면적은 PRMemph와 PRMfSAD와 음의 상관관계를 보였다(p < 0.05). T12에서의 골밀도는 PRMemph와 음의 상관관계를 보였다(r = -0.1828, p = 0.002). 피하지방의 부피와 면적과 T12에서의 골밀도는 AWT-Pi10과 양의 상관관계를 보였다(r = 0.1287, p = 0.030; r = 0.1668, p = 0.005; r = 0.1279, p = 0.031). 반면에 근육 부피는 AWT-Pi10과 음의 상관관계를 보였다(r = -0.1966, p = 0.001). 근육 부피는 폐기능과 의미 있는 연과성을 보였다(p < 0.001). 결론 흉부 CT에서 정량적으로 평가된 체성분은 만성폐쇄성폐질환의 표현형 또는 중증도와 연관성을 보인다.

PET/CT 검사에서 냉소 인공물 발생 시 산란 제한 보정 알고리즘 적용에 따른 영상 평가 (A study on evaluation of the image with washed-out artifact after applying scatter limitation correction algorithm in PET/CT exam)

  • 고현수;류재광
    • 핵의학기술
    • /
    • 제22권1호
    • /
    • pp.55-66
    • /
    • 2018
  • PET/CT 검사에서 환자의 움직임이나 높은 비방사능에 의해 냉소 인공물(washed-out artifact)이 발생하여 육안적 판독 및 정량평가의 정확성을 감소시킬 가능성이 있다. GE PET/CT 장비의 산란 제한 보정 알고리즘은 영상에 발생한 냉소 인공물을 제거하여 영상을 회복시켜주는 알고리즘이다. 본 연구의 목적은 팬텀 실험을 통해 높은 비방사능에 의해 냉소 인공물이 발생한 영상에 산란 제한 보정 알고리즘을 적용하였을 때 기존의 정량 값으로 회복 가능한 비방사능의 역치 값을 측정하고, 냉소 인공물이 발생한 임상 환자 영상에 산란 제한 보정 알고리즘을 적용하여 보정 전과 후의 영상을 비교 분석하고자 한다. $^{68}Ge$ 실린더 팬텀 영상에 냉소 인공물을 발생시키기 위해 임의의 $^{18}F$ 선원의 비방사능이 20 ~ 20,000 kBq/ml 가 되도록 20 단계로 분주하고 $^{18}F$ 선원의 CT 영상과 PET 영상간에 불일치(mis-registration) 정도가 없을 때, 불일치가 각각 1, 2, 3, 4 cm 일 때의 영상을 획득하였다. 또한 본원에서 $^{18}F-FDG$ Fusion Whole Body PET/CT 검사를 시행한 환자 중 유치 도뇨관 내에 높은 비방사능에 의해 냉소 인공물이 발생한 34명의 환자를 대상으로, CT 영상과 PET 영상간의 불일치 정도(cm), 인공물을 발생시키는 원인이 되는 비방사능의 수치(kBq/ml), 인공물이 발생한 단면 내 근육에서의 $SUV_{mean}$, 인공물이 발생한 단면 내 병변에서의 $SUV_{max}$, 인공물이 발생하지 않은 단면 내 병변에서의 $SUV_{max}$를 측정하였다. 통계는 보정 전과 후의 차이를 비교하기 위해 대응 표본 t 검정을 시행하였다. 팬텀 실험에서는 $^{18}F$ 선원의 비방사능이 커질수록 $^{68}Ge$ 실린더 팬텀의 $SUV_{mean}$가 감소하였다. 불일치 거리가 커질수록 $SUV_{mean}$가 급격히 저하 되었지만 반대로 보정 효과는 더 크게 나타났다. 비방사능 50 kBq/ml 이하에서는 모든 조건에서 육안적으로도 냉소 인공물이 발생하지 않았으며 $SUV_{mean}$에도 차이가 없었다. 불일치가 없을 때와 1 cm 차이가 있을 때는 120 kBq/ml 이하부터 산란 제한 보정 알고리즘을 적용 할 때 기존 $SUV_{mean}$(0.95)와 동일하게 회복 되었고, 2 cm와 3 cm 차이에서는 100 kBq/ml 이하부터, 4 cm 차이에서는 80 kBq/ml 이하부터 기존 $SUV_{mean}$와 동일하게 회복 되었다. 임상 환자 34명의 영상을 분석한 결과, 불일치 평균 거리는 2.02 cm 이었고, 냉소 인공물을 발생시키는 평균 비방사능은 490.15 kBq/ml 이었다. 인공물이 발생한 단면 내 근육의 $SUV_{mean}$와 병변의 $SUV_{max}$는 보정 전 후 각각 통계적으로 유의한 차이가 있었지만(t=-13.805, p=0.000) (t=-2.851, p=0.012), 인공물이 발생하지 않은 단면 내 병변의 $SUV_{max}$는 통계적으로 유의한 차이가 없었다(t=-1.173, p=0.250). GE PET/CT 장비의 산란 제한 보정 알고리즘은 임상 검사에서 환자의 심한 움직임뿐만 아니라 높은 비방사능의 미세한 움직임에 의해 발생한 냉소 인공물을 제거하여 영상을 회복해 주는 알고리즘이다. 냉소 인공물이 발생 하였을 때 산란제한 보정 알고리즘 적용 후 그 원인이 되는 비방사능의 수치, CT 영상과 PET 영상의 불일치 거리 등을 감안하여 영상을 분석한다면 냉소 인공물 부위의 재촬영 없이, 육안적 판독 및 정량 값을 더 정확하게 평가 하는데 도움이 될 것으로 사료 된다.

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.