• Title/Summary/Keyword: Language Models

검색결과 872건 처리시간 0.03초

요트 발전을 위한 한국형 마리나 운영방안에 관한 연구 (The research for the yachting development of Korean Marina operation plans)

  • 정종석;허일
    • 한국항해항만학회지
    • /
    • 제28권10호
    • /
    • pp.899-908
    • /
    • 2004
  • 소득수준의 향상과 주 5일 근무제에 따른 여가활용 시간의 증대에 수반하여 해양 선진국처럼 많은 사람들이 요트 활동을 원하고 있는 동시에 수많은 장비들의 보급이 확산되고 있다. 이러한 장비의 보급발전에 수반하여 활동영역도 넓어지고 있지만 요트를 즐길 수 있는 마리나의 환경조성은 경제 후진국보다 더욱 낙후되어 있는 실정이다. 이렇게 낙후된 한국의 요트 발전을 위하여 선진 마리나 운영의 모형을 한국의 실정에 맞게 적용할 필요성이 있어 마리나를 성공적으로 운영하고 있는 호주, 뉴질랜드, 싱가포르, 일본, 말레이시아의 마리나 운영적 국면을 상호 비교 분석하여 다음과 같은 결론을 얻었다. 첫째, 마리나 운영에 있어서 개인의 재산권 보호 및 환경보존 측면에서 회원제, 비회원제, 영리, 비영리로 분리 운영하되 클럽하우스 출입시 복장은 통제하지 않아야 한다. 둘째, 부가가치를 높이기 위하여 매년 새로운 경기이벤트를 유치하고 경기운영에 있어서 자원봉사자를 적극 활용하여야 하며, 요트를 통하여 관광을 활성화하고, 외국요트 입출항시 CIQ 절차를 간소화함은 물론 언어서비스도 병용하여야 한다. 셋째, 연중 상설요트학교를 개설하고 지도자 자격을 갖춘 강사가 지도하되, 초급반, 중급반, 고급반으로 분리 운영하고 어린이용 딩기요트 프로그램을 중요하게 운영하여야 한다. 넷째, 계류장 입${\cdot}$출항 통제는 자율에 의해서 통제하고 계류장 사용료 납부 후 보안감시 및 장비의 분실, 파손에 대하여 마리나 측에서 일정한 보상을 할 수 있도록 제도적으로 보완하여야 한다. 다섯째, 한국의 실정에 맞게 해상안전요원을 민간단체로 구성하여 벤치마크, 인명구조, 해난사고시 해상수색 등에 적극 활용하여야 한다.사에 대한 평균 수평응력비의 적용이 고려되어져야 할 것으로 판단된다.로 구매를 하기도 하였으며, 신용카드를 소비에만 사용하는 경향이 있는 사람은 패션지향적이거나 순수한 충동에 의한 구매행동을 하는 것으로 나타났다. 본 연구는 한국과 미국의 국가간 비교연구로 대학생들의 충동구매행동과 신용카드사용에서 국가간 유사성과 차이가 있음을 밝혀줌으로써 국내외 마케터들에게 유용한 정보를 제공해 준다.적 비교에 대한 통계적 타당성의 기초를 마련하였다는데 의의가 있다.가지고 있는 지 확인하기 위해 사람 방광 유래의 T-24세포와 장내 표피 유래의 Caco-2세포에 대한 부착능을 시험하였을 때, 16균주$(42.1\%)$가 T-24방광 세포에, 그리고 17균주$(44.7\%)$가 Caco-2장세포에 대해 강한 부착능을 나타내었다. 특히 11균주$(28.9\%)$는 두 세포 모두에 강한 부착능을 가지고 있었다. Filter mating method를 수행하여 이들 균주들의 독소 생산 유전자와 항생제 내성 유전자가 사람에서 분리된 균주로 전달되는 것을 확인할 수 있었다. 본 실험의 결과는 설사 중상을 나타내는 돼지로부터 분리된 용혈성 E. coli의 독성과 세포 부착능력, 그리고 항생제 내성간의 상호 연관성을 보여주지 않았으나 동물 분리 세균의 항생제 내성과 독소 생산 능력이 유전자 전달을 통해서 뿐만 아니라 세균의 직접 접촉에 의해서도 인체로 전달될 수 있는 것을 보여주는 것이다.다. 본 연구를 토대로 장시간의 체외순환에서는 신장기능을 대표하는 수치들에도 영향을 미칠 수 있으리라 예상되며, 신장 이외에 다른 주요 장기에 미치는 영향에 대한 연구를 더 진행할 필요가

복잡지형 고해상도 격자망에서의 PRISM 기반 강수추정법 (The PRISM-based Rainfall Mapping at an Enhanced Grid Cell Resolution in Complex Terrain)

  • 정유란;윤경담;조경숙;이재현;윤진일
    • 한국농림기상학회지
    • /
    • 제11권2호
    • /
    • pp.72-78
    • /
    • 2009
  • 관측밀도가 동일한 조건에서 단위격자점의 크기를 줄일 경우 PRISM 방식에 의해 추정된 강수량 분포 가 단위격자점의 크기를 줄이기 전에 비해 개선되는지 확인하기 위해 PRISM 코드를 수정하여 $270m{\times}270m$ 격자점 단위로 구동할 수 있도록 하였다. 남한 전역의 지형자료를 270m DEM으로부터 준비하고 432개 기상청 자동기상관측소의 2007년 월별 적산강수량 자료를 입력자료로 하여 각 격자점의 PRISM 회귀식을 도출하였다. 회귀모형과 DEM 고도에 의해 각 격자점의 월별 적산강수량을 추정한 다음, 추정된 강수량분포도로부터 한국수자원공사 우량관측소 166개소에 해당하는 격자점의 자료를 추출하여 해당관측소의 실측값과 비교하였다. 동일한 강수자료를 이용하되 이번에는 5km 격자점의 PRISM 회귀모형을 유도하여 강수량 분포도를 작성하고 166개 지점 추정강수량을 추출하여 실측자료와의 차이를 RMSE로 표현하였다. 5km 대신 270m 분해능의 DEM을 사용할 경우 월 강수량이 100mm 이상인 경우 평균 10%의 오차 감소효과가 확인되었다.

분산 객체 컴퓨팅 환경에서 실시간 협약 및 적응 스트림 서비스를 위한 QoS 통합 플랫폼의 구축 (The Construction of QoS Integration Platform for Real-time Negotiation and Adaptation Stream Service in Distributed Object Computing Environments)

  • 전병택;김명희;주수종
    • 한국정보처리학회논문지
    • /
    • 제7권11S호
    • /
    • pp.3651-3667
    • /
    • 2000
  • 최근 인터넷 기반의 분산 멀티미디어 환경에서 가장 성장하는 기술로는 스트림 서비스 기술과 분산 객체 기술을 꼽을 수 있다. 특히, 분산 객체 기술에 스트림 서비스 기술을 통합하려는 연구들이 진행되고 있다. 이 기술들은 다양한 스트림 서비스 관리 모델과 프로토콜의 연구에서 적용되고 있다. 그러나, 기존에 제시된 관리 모델들은 스트림 전송의 서비스 질(QoS)에 대한 지원이 미흡하다. 또한, 서비스 질에 관련된 기능들이 특정 응용 서비스의 부속 모듈로 개발됨에 따라, 확장이나 재사용을 지원할 수 없는 문제점을 나타내고 있다. 이를 해결하기 위해 본 논문에서는 분산 객체 기술을 적용하여 확장 및 재사용이 용이하고 스티림의 서비스의 질을 보장하는 QoS 통합 플랫폼을 제안했다. 제안된 플랫폼의 구조는 사용자 제어 모듈, QoS 관리 모듈 및 스트림 객체의 세가지 컴포넌트로 구성된다. 스트림 객체는 TCP/IP 상에서 RTP 패킷을 송·수신 기능을 한다. 사용자 제어 모듈은 CORBA 객체를 이용하여 스트림 객체들을 제어한다. QoS 관리 모듈은 사용자 제어 모듈간에 서비스 질을 유지하는 관리 기능을 한다. QoS xd합 플랫폼의 구축을 위해 관련 모듈들을 독립적으로 구현하고, 이들이 CORBA 환경에서 플랫폼 독립성, 상호운용성, 이식성을 갖도록 그들간에 인터페이스들을 IDL로 정의하였다. 제안된 플랫폼의 구현을 위해 Solaris 2.5/2.7에 호환되는 OrbixWeb 3.1c, 자바언어와 Java Media Framework API 2.0, Mini-SQL1.0.16 및 관련 이미지 캡쳐보드 및 영상카메라를 사용하였다. 본 플랫폼의 기능검증을 위한 결과로서, 플랫폼 상에서 스트림 서비스가 진행되는 동안, 클라이언트와 서버의 GUI를 통해 위에서 기술한 모듈들의 수행결과와 QoS 제어 과정으로부터 얻어지는 수치적 데이터를 보였다.

  • PDF

이탈리안 라이그라스 사일리지의 품질평가를 위한 근적외선분광 (NIRS) 검량식의 이설 및 검증 (Transfer and Validation of NIRS Calibration Models for Evaluating Forage Quality in Italian Ryegrass Silages)

  • 조규채;박형수;이상훈;최진혁;서성;최기준
    • 한국축산시설환경학회지
    • /
    • 제18권sup호
    • /
    • pp.81-90
    • /
    • 2012
  • 본 연구는 종래의 실험실 및 연구용 근적외선 분광분석기를 보급형 현장용 다수의 장비를 이용하여 신속하게 현장에서 조사료의 품질 평가의 예측 정확성을 평가하기 위하여 3년간 전국에서 수집된 이탈리안 라이그라스 사일리지 241점을 이용하여 연구용 장비 Unity Model 2500X에 구축된 Database를 활용하여 현장용 보급형 장비 Unity Model 1400에 맞춰 Database를 업데이트 하고 검량선을 작성 한 후 검량선 이설 알고리즘을 사용하여 검량선 이설결과 연연구용 장비와 거의 동일한 수준의 결과로 0.000%~0.343%로의 차이로서 현장에서 신속하게 NDF, ADF 및 조단백, 조회분등의 화학적 성분 및 수분, pH 젖산의 발효품질, 그리고 TDN, RFV의 조사료 품질 평가치를 실험실 수준과 같이 5분내에 동시에 분석 할수 있는 결과를 얻었다. 하지만 3년 동안 얻어진 검량선 작성용 시료는 유기적인 시료이므로 지역적 년도별 차이를 가져올 수 있다. 이는 향후 모집단에 의한 지속적인 검량식의 업데이트 및 Database 관리기법이 실험실 분석 및 이를 이용 검량식을 유지 관리 할수 있는 중앙 Control Center 의해서 관리되어져야 지속적인 현장분석이 가능하다는 것을 강력히 시사한다. 현장분석기라 하더라도 조사료 같은 농산물은 계속 변화하는 성질을 가지고 있으므로 현장분석시 변위를 쉽게 파악하여 이를 신속히 보강 하지 않으면 장기적인 분석이 되지 않는다. 그동안 여러 근적외선 분광법의 연구들이 이루어져 왔지만 현장에서 직접 사용할 수 없었을 뿐 아니라 지속성의 결여로 장비들이 잘 활용되지 않고 있었다. 조사료 같은 농산물 등은 단기적으로 맞지만 불과 1년 정도가 지나면 분석결과가 상당히 신뢰성이 결여되어 활용도가 떨어지는 현실이다. 결론적으로 조사료의 향후 계속적인 시료의 보강과 모집단 분석을 이용한 체계적인 관리 및 시료의 확충방식을 직관적으로 할 수 있는 GD(Global Distance) 및 ND(Neighbour Distance) 기법의 신호등 방식으로 손쉬운 한글화된 운영체재를 사용하게 된다면 향후 효과적인 분석을 수행할 수 있어 이에 대한 여러 기대효과가 예상되어진다. 마지막으로는 동일 목적으로 다수의 장비를 운영할 경우 장비마다 동일한 시료가 동일한 결과가 나올 수 있도록 하는 기법 및 손쉽게 검량식을 작성 할 수 있는 프로그램과 작성된 검량식을 장비에 직접 기존의 컴퓨터 Network에 연결 전송하고 관리하는 Network 기능이 필수적이라 할 수 있겠다.

인도네시아 현대미술에 있어서의 설치미술 - 미디엄과 사회적 공간을 위한 탐색 (Installation Art In Indonesian Contemporary Art; A Quest For Medium and Social Spaces)

  • A. 릭릭 쿠스마라
    • 미술이론과 현장
    • /
    • 제5호
    • /
    • pp.217-229
    • /
    • 2007
  • Many historical research and facet about modern art in Indonesia which formulating background of contemporary Indonesian Art. Indonesian art critic Sanento Yuliman states that Modern art has been rapidly developing in Indonesia since the Indonesian Independence in 1945. Modern Art is a part of the super culture of the Indonesian metropolitan and is closely related to the contact between the Indonesian and Western Cultures. Its birth was part of the nationalism project, when the Indonesian people consists of various ethnics were determined to become a new nation, the Indonesian nation, and they wished for a new culture, and therefore, a new art. The period 1960s, which was the beginning of the creation and development of the painters and the painters associations, was the first stage of the development of modern art in Indonesia. The second stage showed the important role of the higher education institutes for art. These institutes have developed since the 1950s and in the 1970s they were the main education institutes for painters and other artists. The artists awareness of the medium, forms or the organization of shapes were encouraged more intensely and these encouraged the exploring and experimental attitudes. Meanwhile, the information about the world's modern art, particularly Western Art; was widely and rapidly spread. The 1960s and 1970s were marked by the development of various abstractions and abstract art and the great number of explorations in various new media, like the experiment with collage, assemblage, mixed media. The works of the Neo Art Movement-group in the second half of the 1970s and in the 1980s shows environmental art and installations, influenced by the elements of popular art, from the commercial world and mass media, as well as the involvement of art in the social and environmental affairs. The issues about the environment, frequently launched by the intellectuals in the period of economic development starting in the 1970s, echoed among the artists, and they were widened in the social, art and cultural circles. The Indonesian economic development following the important change in the 1970s has caused a change in the life of the middle and upper class society, as has the change in various aspects of a big city, particularly Jakarta. The new genre emerged in 1975 which indicates contemporary art in Indonesia, when a group of young artists organized a movement, which was widely known as the Indonesian New Art Movement. This movement criticized international style, universalism and the long standing debate on an east-west-dichotomy. As far as the actual practice of the arts was concerned the movement criticized the domination of the art of painting and saw this as a sign of stagnation in Indonesian art development. Based on this criticism 'the movement' introduced ready-mades and installations (Jim Supangkat). Takes almost two decades that the New Art Movement activists were establishing Indonesian Installation art genre as contemporary paradigm and influenced the 1980's gene ration like, FX Harsono, Dadang Christanto, Arahmaiani, Tisna Sanjaya, Diyanto, Andarmanik, entering the 1990's decade as "rebellion period" ; reject towards established aesthetic mainstream i.e. painting, sculpture, graphic art which are insufficient to express "new language" and artistic needs especially to mediate social politic and cultural situation. Installation Art which contains open possibilities of creation become a vehicle for aesthetic establishment rejection and social politics stagnant expression in 1990s. Installation art accommodates two major field; first, the rejection of aesthetic establishment has a consequences an artists quest for medium; deconstruction models and cross disciplines into multi and intermedia i.e. performance, music, video etc. Second aspect is artists' social politic intention for changes, both conclude as characteristics of Indonesian Installation Art and establishing the freedom of expression in contemporary Indonesian Art until today.

  • PDF

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

투자자별 거래정보와 머신러닝을 활용한 투자전략의 성과 (Performance of Investment Strategy using Investor-specific Transaction Information and Machine Learning)

  • 김경목;김선웅;최흥식
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.65-82
    • /
    • 2021
  • 주식시장에 참여하는 투자자들은 크게 외국인투자자, 기관투자자, 그리고 개인투자자로 구분된다. 외국인투자자 같은 전문투자자 집단은 개인투자자 집단과 비교하여 정보력과 자금력에서 우위를 보이고 있으며, 그 결과 시장 참여자들 사이에는 외국인투자자들이 좋은 투자 성과를 보이는 것으로 알려져 있다. 외국인 투자자들은 근래에는 인공지능을 이용한 투자를 많이 하고 있다. 본 연구의 목적은 투자자별 거래량 정보와 머신러닝을 결합하는 투자전략을 제안하고, 실제 주가와 투자자별 거래량 데이터를 이용하여 제안 모형의 포트폴리오 투자 성과를 분석하는 것이다. 일별 투자자별 매수 수량과 매도 수량 정보는 한국거래소에서 공개하고 있는 자료를 활용하였으며, 여기에 인공신경망을 결합하여 최적의 포트폴리오 전략을 도출하고자 하였다. 본 연구에서는 자기 조직화 지도 모형 인공신경망을 이용하여 투자자별 거래량 데이터를 그룹화하고 그룹화한 데이터를 변환하여 오류역전파 모형을 학습하였다. 학습 후 검증 데이터 예측결과로 매월 포트폴리오 구성을 하도록 개발하였다. 성과 분석을 위해 포트폴리오의 벤치마크를 지정하였고 시장 수익률 비교를 위해 KOSPI200, KOSPI 지수 수익률도 구하였다. 포트폴리오의 동일배분 수익률, 복리 수익률, 연평균 수익률, MDD, 표준편차, 샤프지수, 벤치마크로 지정한 시가총액 상위 10종목의 Buy and Hold 수익률 등을 사용하여 성과 분석을 진행하였다. 분석 결과 포트폴리오가 벤치마크 대비 2배 수익률을 올렸으며 시장 수익률보다 좋은 성과를 보였다. MDD와 표준편차는 포트폴리오와 벤치마크가 비슷한 결과로 성과 대비 비교한다면 포트폴리오가 좋은 성과라고 할 수 있다. 샤프지수도 포트폴리오가 벤치마크와 시장 결과보다 좋은 성과를 내었다. 이를 통해 머신러닝과 투자자별 거래정보 분석을 활용한 포트폴리오 구성 프로그램 개발의 방향을 제시하였고 실제 주식 투자를 위한 프로그램 개발에 활용할 수 있음을 보였다.

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.