• 제목/요약/키워드: Classification Performance

검색결과 3,735건 처리시간 0.028초

해조류 5종의 아미노산 조성 및 계통 다양성 비교 분석 (Comparative Analysis of the Amino Acid Composition and Phylogenetic Diversity of Five Seaweed Species)

  • 손승원;이혜영
    • 생명과학회지
    • /
    • 제34권3호
    • /
    • pp.145-152
    • /
    • 2024
  • 해조류는 풍부한 필수 영양소 공급으로 인해 귀중한 해양 자원으로 여겨지며 특히 단백질과 아미노산이 풍부하게 함유되어 있다. 한국에서는 500종 이상의 해조류가 서식하며 그 중 50종 이상이 식품용으로 이용되어 일상 식단의 중심 역할을 한다. 본 연구는 한국에서 가장 흔히 섭취되는 해조류 5종(매생이, 톳, 김, 다시마, 미역; Capsosiphon fulvescens, Hizikia fusiforme, Porphyra yezoensis, Saccharina japonica, Undaria pinnatifida)의 단백질 구성 아미노산을 분석하였다. 고성능 액체 크로마토그래피 분석 결과, 아스파르트산, 글루탐산, 알라닌, 류신이 가장 풍부한 아미노산 성분임을 알 수 있었다. 주성분 분석에서는 이 다섯 종류의 해조류가 아미노산 구성에 따라 세 개의 군집으로 분류될 수 있었고, 이는 부분적으로 계통 분류 결과와 일치하였다. 다양한 아미노산 중에서도 글루탐산, 아스파르트산, 알라닌이 구분을 주도하는 주요 아미노산이였다. 특히, 가까운 계통적 근접성을 보이는 Undaria pinnatifida와 Capsosiphon fulvescens는 뚜렷하게 유사한 아미노산 프로필을 나타내었다. 그에 비해 Porphyra yezoensis와 Saccharina japonica는 계통적 관계를 공유하더라도 다른 아미노산 구성을 보였다. Hizikia fusiforme는 두 분석 모두에서 독특한 군집으로 나타났다.

한국 지방자치단체의 주민참여예산제도 운영에 관한 연구 - Support Vector Machine 기법을 이용한 유형 구분 (A Study on Korean Local Governments' Operation of Participatory Budgeting System : Classification by Support Vector Machine Technique)

  • 한준현;유재민;배재연;임충혁
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.461-466
    • /
    • 2024
  • 한국의 주민참여예산제도는 자치단체별로 자율적으로 운영되도록 하고 있어서, 본 연구는 이들을 몇 개의 유사한 유형들로 구분하여서 각각의 특징들을 살펴보고자 한다. 본 연구는 다양한 머신 러닝 기법들을 활용하여 2022년도 기초 시(市)를 중심으로 운영유형을 분류하였다. 그 결과, 여러 머신 러닝 기법(Neural Network, Rule Induction(CN2), KNN, Decision Tree, Random Forest, Gradient Boosting, SVM, Naïve Bayes) 중에서 SVM 기법이 성능이 가장 좋은 것으로 확인되었다. SVM 기법이 밝혀낸 운영유형은 모두 3개인데, 하나는 위원회 활동은 적게 하지만, 참여예산은 많이 확보하는 클러스터(C1)이고, 다른 하나는 주민참여예산제에 매우 소극적인 도시들의 클러스터(C3)이다. 마지막 클러스터(C2)는 참여예산에 전반적으로 적극적인데, 대다수 지역이 여기에 해당한다. 결론적으로 한국의 대다수 자치단체는 주민참여예산제를 긍정적으로 운영하고 있으며, 오직 소수의 자치단체만 소극적이다. 후속 연구로 지난 10여 년간의 시계열 자료를 분석한다면, 우리는 주민참여예산에 관한 지방자치단체 유형 분류의 신뢰도를 더욱 높일 수 있을 것으로 기대한다.

중고령 노인의 개인적 가치에 따른 라이프스타일 분류: 머신러닝을 활용한 상대적 중요도 분석 (Identifying Personal Values Influencing the Lifestyle of Older Adults: Insights From Relative Importance Analysis Using Machine Learning)

  • 임승주;박지혁
    • 재활치료과학
    • /
    • 제13권2호
    • /
    • pp.69-84
    • /
    • 2024
  • 목적 : 노인의 건강한 삶의 방식으로서 라이프스타일에 대한 연구가 증가하고 있다. 라이프스타일이 개개인의 가치와 삶의 태도를 반영하는 개념임에도 불구하고, 아직까지 개인의 어떠한 가치가 라이프스타일을 건강하게 유도하는지 파악한 연구는 부족한 실정이다. 이에 본 연구는 노인의 라이프스타일 유형을 두 가지로 분류하고, 머신러닝을 활용하여 어떠한 개인적 가치가 건강한 라이프스타일에 우선적으로 작용하는지 파악하고자 한다. 연구방법 : 본 연구는 지역사회에 거주하는 55세 이상 중고령 노인 300명을 대상으로 횡단 연구를 수행하였다. 라이프스타일은 Yonsei Lifestyle Profile-Active, Balanced, Connected, Diverse (YLP-ABCD) 응답을 사용하여 잠재프로파일 분석을 통해 유형화하였다. 라이프스타일 유형을 예측하는 개인적 가치는 YLP-V (Values) 응답을 수집하여, 예측성능이 가장 높은 머신러닝 알고리즘을 선정한 후 상대적 중요도를 파악하였다. 결과 : 잠재프로파일 분석 결과, 라이프스타일은 건강한 라이프스타일 실천형(48.87%), 비실천형(51.13%)으로 분류되었다. 실천형에 속한 중고령 노인은 비실천형에 비해 사회관계가 활발한 특성을 나타내었다. 본 연구에 포함된 머신러닝 알고리즘 중 가장 우수한 성능을 보인 모델은 서포트 벡터 머신으로, 정확도 96%, Receiver Operating Characteristic (ROC) 영역 95%로 나타났다. 본 알고리즘을 바탕으로 개인적 가치의 상대적 중요도를 분석한 결과, 건강한 식단, 건강 매체, 여가활동, 건강 제품 및 머신러닝에 주의를 기울일수록, 해당 가치에 따라 중고령 노인은 건강한 라이프스타일을 실천하는 그룹에 속할 가능성이 큰 것으로 나타났다. 결론 : 본 연구는 중고령 노인의 사회적 관계망을 포함한 건강한 라이프스타일을 유도하기 위해, 건강 식단, 매체, 여가, 제품 및 습관에 대한 가치 향상을 중점적으로 다루는 종합적인 프로그램 및 서비스의 필요성을 시사한다.

실시간 측정데이터 기반의 디스크커터 마모상태 판별 딥러닝 알고리즘 개발 (Development of deep learning algorithm for classification of disc cutter wear condition based on real-time measurement data)

  • 이지윤;여병철;정호영;김정주
    • 한국터널지하공간학회 논문집
    • /
    • 제26권3호
    • /
    • pp.281-301
    • /
    • 2024
  • 송전선로 지중화 사업의 일환인 전력구 터널은 쉴드TBM 공법에 의해 건설된다. 쉴드TBM 구성요소 중 디스크커터는 암반을 파쇄하는 중요한 역할을 수행한다. 마모한계에 도달하거나 편마모와 같은 파손이 발생함에 따라 적절한 교체가 이루어져야 효율적인 터널 공사가 가능하다. 본 연구에서는 실시간으로 측정된 디스크커터의 마모량과 회전수를 기반으로 디스크커터의 마모상태를 판별하기 위한 딥러닝 알고리즘 개발을 수행하였다. 실대형 굴진시험 결과를 통해 디스크 커터의 마모상태에 따라 측정데이터가 상이하게 획득되는 것을 확인하였다. 합성곱신경망 모델을 기반으로 실시간 측정데이터를 활용하여 디스크커터의 마모특성을 판별할 수 있는 알고리즘을 개발하였다. 합성곱신경망의 필터를 통해 데이터의 분포 특성을 학습할 수 있고, 이러한 패턴 특징을 통해 균등마모와 편마모를 분류할 수 있는 모델의 성능을 확인하였다.

재상업복무교역중적매매관계중상호신임대관계적효적영향(在商业服务交易中的买卖关系中相互信任对关系绩效的影响) (The Effect of Mutual Trust on Relational Performance in Supplier-Buyer Relationships for Business Services Transactions)

  • Noh, Jeon-Pyo
    • 마케팅과학연구
    • /
    • 제19권4호
    • /
    • pp.32-43
    • /
    • 2009
  • 信任在心理学, 经济学, 社会学中已被广泛研究, 其重要性不仅在市场营销中被强调, 在一般商业原则中也被强调. 供应商和买家之间的关系与过去不同, 过去的关系需要相当大的私人网络优势, 并可能涉及不道德的商业行为. 而在以工业营销成功的为核心的二十一世纪激烈的全球竞争中, 供应商和买家之间的关系是伙伴关系. 在相互合作的高级别信任的基础上, 通过交换的关系, 这会给买家和供应商带来长期的利益, 竞争力增强和交易成本的降低以及其他福利. 尽管现有的研究有信任的重要性, 但是在购买与供应关系中却忽视了信任的作用, 也没有系统地分析信任对关系的影响. 因此, 深入研究, 确定买家和商业服务供应商之间信任和关系绩效之间的联系是绝对需要的. 本研究中的商业服务, 包括那些支持制造业, 正作为下一代经济增长的引擎而吸引着人们的注意. 韩国政府已选择其作为制造业发展的战略领域. 由于商业服务开放市场的需求日趋激烈, 商业服务业的竞争力应该比以往得到更多的提倡. 本研究的目的是探索相互信任对买家和供应商之间的关系绩效的影响. 具体来说, 本研究在商业服务交易中提出了一个关于信任-关系绩效的理论模型, 并实证检验根据模型而提出的假设. 这项研究表明, 研究结果有战略意义. 本研究通过多种方法收集经验数据. 这些方法包括通过电话, 邮件和面试. 作为样本的公司是在韩国供应和购买商业服务的以知识为本的公司. 本研究收集的是二进的基础数据. 每个样本公司对包括购买公司及其相应的供应公司. 并跟踪调查每个公司对的相互信任. 本研究为商业服务的买卖双方提出了信任-关系绩效的模型. 该模型由信任和它的前因和后果. 买家的信任分为对供应公司的信任和对销售人员的信任. 根据Doney 和Cannon (1997)的研究我们在个人水平和组织水平上观察信任. 通常情况下, 买方是信任的受体, 但这项研究我们建议以供应商为观察受体. 因此, 它独特的关注了双边角度的知觉风险. 换言之, 供应商和买家一样, 是信任的主体, 因为交易通常是双边的. 从这个角度来看, 供应商对买家信任和买方对供货商的信赖一样重要. 供应商的信任从某种程度上受它信任的买方公司和买家的影响. 这种使用个人水平和组织水平的信任分类是根据Doney 和Cannon (1997)的研究. 信任影响供应商的选择, 这是一项双向放的工作. 供应商们积极参与供应商选择过程中, 和买家密切的一起工作. 此外, 该过程从某种程度上受每一方信任的合作伙伴的影响. 挑选过程包括一些步骤: 识别, 信息检索, 供应商选择和绩效评价. 作为这一进程的结果, 买家和供应商都进行绩效评估, 并就这些结果为基础, 采取有形或无形的纠正行动. 本研究中使用的关于信任的测量问项是根据Mayer, Davis 和 Schoorman (1995) 以及Mayer和Davis (1999)的研究发展起来的. 根据他们的建议, 有关信任的三个方面的研究包括有能力, 善和完整. 根据商业服务这个背景我们调整了原来的问题. 例如, 如 "他/她的专业能力" 已被改为 "当我们讨论我们的产品时销售人员表现出专业能力. "这项研究使用的测量问项不同于在以往的研究中使用的问项(Rotter 1967; Sullivan和Peterson 1982; Dwyer和Oh 1987. 本研究中有关信任的前因后果的测量问项是根据Doney和Cannon (1997)的研究为基础制定的. 根据商业服务这个背景我们调整了原来的问题. 特别是, 问题被设计为对买家和供应商以解决下列因素: 信誉 (诚信, 客户服务, 良好意愿), 市场地位 (公司规模, 市场份额, 在行业中的地位), 愿意定制(产品, 过程, 交付), 信息共享(专有信息, 个人信息), 愿意保持良好关系, 认为专业, 权威授权, 买方与卖方的相似性, 以及接触频率. 作为信任相应的变量, 我们对关系绩效进行了测试. 关系绩效分为有形的影响, 无形影响, 和副作用. 有形的影响包括财务业绩;无形的影响, 包括关系的改善, 网络开发, 以及内部员工的满意度;副作用包括既不是有形影响也不是无形影响的影响. 我们联系了350对公司, 105对公司答复了我们. 由于不完整我们删除了5对公司, 105对公司被用于数据分析. 用于数据分析的回应率为30%(三百五十零分之一百零五), 高于工业营销的平均回复比率. 至于回复的公司的特点, 大多数的公司运作的商业服务既为买方(85.4%)也为供应商(81.8%). 大部分买家是做消费品贸易(76%), 而供应商的大部分(70%)是做工业品贸易. 这可能意味着买家的过程是购入材料, 部件和组件从而生产消费品成品. 正如他们对他们与合作伙伴关系的长度的报告表示, 供应商比买家有更长的商业关系. 假设1测试买方-供应方特点对信任的影响. 销售人员的专业度(t=2.070, p<0.05)和权威授权(t=2.328, p<0.05)积极影响买方对供应方的信任. 另一方面, 权威授权(t=2.192, p<0.05)积极影响供应方对买方的信任. 对买方和供应方来说, 权威授权的程度对保持对彼此的信任有关键作用. 假设2测试买卖双方关系特点对信任的影响. 买家倾向于信任供应方, 因为供应方总是尽全力联系买方(t=2.212, p<0.05)这种倾向性在供应方方面也表现得很强(t=2.591, p<0.01). 另一方面, 供应商对买方的信任是由于供应商感知买家与自己的相似性(t=2.702, p<0.01). 这一发现证实了Crosby, Evans, 和Cowles(1990)的研究结果. 他们的结果表明供应方和买方通过商务或私务的定期会议来建立彼此的联系. 假设3测试信任对感知风险的影响. 结果表明无论对买方还是供应方, 信任越低, 感知风险就越大(买方: t =-6.621, p<0.01; 供应方: t=-2.437, p<0.05). 有趣的是, 这一趋势已被证明对买方更强. 这种较高水平的感知风险的一个可能的解释是在商业服务交易中买方通常比供应方感知到更大的风险. 为此, 有必要对供应商对买方实施减少风险的战略. 假设4测试信任对信息搜集. 根据结果, 对供应方和买方, 与预期相反, 信任取决于他们合作伙伴的名誉(买方t=2.929, p<0.01; 供应方t=2.711, p<0.05). 这一发现表明, 具有良好信誉的供应商往往是可信的. 以往的经验并没有显示出任何与买家或供应商信任的重要关系. 假设5测试信任对供应方/买方选择的影响. 与买方不同, 当供应方认为以往与买方的交易重要时, 供应方倾向信任买方(t=2.913 p<0.01). 但是, 本研究并没有现实资源忠诚和买方对供应方的信任之间有显著关系. 假设6测试的是信任对关系绩效的影响. 对买方和供应方, 当财务表现被报告提高时, 他们比较信任他们的合作伙伴(买方: t=2.301, p<0.05;供应方: t=3.692, p<0.01). 有趣的是, 这种趋势在供应方比较明显. 类似的, 当竞争力被报告提高时, 买卖双方比较信任他们的合作伙伴(买方t=3.563, p<0.01 ; 供应方t=3.042, p<0.01). 对供应方来说, 当对买方信任时效率和生产力会提高(t=2.673, p<0.01). 其他绩效指标与信任没有显著关系. 这项研究结果有一定的战略意义. 首先和最重要的是, 以信任为基础的交易对供应商和买家而言都是有益的. 根据研究证实, 通过努力建立和保持相互信任可以使财务表现提高. 同样, 可以通过同样的努力提高竞争力. 第二, 以信任为基础的交易能够减少购买情况中的感知风险. 这对供应商和买家都有启示. 人们普遍认为, 在一个高度参与的采购情况中买家感知到更高的风险. 为了减少风险, 以往的研究已建议供应商制定降低风险的策略. 而本研究的特点是从双边角度关注知觉风险. 换言之, 供应商也容易存在风险, 特别是当他们提供的服务, 需要非常先进的技术, 操作和维护. 因此, 购买者和供应商必须一起密切合作解决问题. 因此, 相互信任在问题解决过程中起着关键作用. 第三, 在这项研究中发现, 销售人员有更多的授权, 他或她越被信任. 这一发现从战术角度看是非常重要的. 建立信任是一个长期的任务, 然而, 当互信尚未开发, 供应商能够通过授权销售人员做出某些决定来克服遇到的问题, 这一结论也适用于供应商.

  • PDF

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

벌채작업(伐採作業)에서의 작업강도(作業强度) 측정연구(測定硏究) -침엽수(針葉樹) 간벌림에(間伐林)서- (Studies on Working Intensity in Felling Operation of the Thinning Forest -In Thinning of Some Conifer Species-)

  • 박수규;강건우
    • 한국산림과학회지
    • /
    • 제85권3호
    • /
    • pp.396-408
    • /
    • 1996
  • 본 연구는 우리나라 간벌림 벌채작업에서 작업강도를 구명하여 산림작업을 성력화하며, 아울러 작업방법의 개선과 생산성 향상을 도모하는데 그 목적이 있다. 이를 구명하기 위하여 침엽수 간벌림에서 벌채작업을 요소작업으로 구분하여 순수작업시간과 맥박수를 측정 분석하였으며, 그 결과는 다음과 같다. 1. 맥박수 측정 분석에서 전체 순수작업시간에서의 1분당 평균맥박수는 작업원 A의 경우 108로 나타났으며, 작업원 B의 경우 130, 작업원 C는 119, 그리고 작업원 D는 125로 나타났다. 2. 요소작업 구분별로 맥박수를 분석한 결과에서는 1분당 맥박수가 가장 높을 때는 작업원 A의 경우 주위정리에서 115였고, 작업원 B는 이동에서 131, 작업원 C는 지타작업에서 122, 작업원 D는 현목처리에서 128로 나타났다. 3. 작업원별로 기준맥박을 100%로 보았을 때 작업강도는 작업원 A(기본맥박 61=100%)가 전체 작업강도 160%, 요소작업 구분중에서는 주위정리가 188%로 가장 높게 나타났다. 작업원 B(기본맥박 57=100%)의 전체 작업강도는 220%, 요소작업중에서는 이동이 229%로 가장 높았으며, 작업원 C(기본맥박 73=100%)의 경우에는 전체 강도는 159%, 요소작업중에서는 지타작업이 168%로 가장 높았고, 작업원 D(기본맥박 70=100%)는 전체 작업강도 156%, 요소작업중에서는 현목처리가 182%로 가장 높게 나타났다. 4. 전체 작업강도를 나다내는 작업원에 따른 노동이행능력 한계점에서의 1분당 초과맥박수는 작업원 A의 경우 30, 작업원 B의 경우 207, 작업원 C는 14이며, 작업원 D는 67로 작업원 B가 가장 작업강도가 높아 신체적인 부담을 크게 받는 것으로 나타났다.

  • PDF

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.