• 제목/요약/키워드: semantic dimension

검색결과 59건 처리시간 0.028초

분열과 반목의 시대에 신경과학적 관점에서 고찰해보는 공감과 정의 (The Empathy and Justice Contemplated From the Neuroscientific Perspective in the Age of Social Divisions and Conflicts)

  • 김지웅
    • 정신신체의학
    • /
    • 제30권2호
    • /
    • pp.55-65
    • /
    • 2022
  • 공감적 존재인 Homo Empathicus로서의 인간들이 살아가는 세상임에도 불구하고, 실제로 우리 사회는 집단간의 분열과 갈등이 끊이지 않고 있다. 인간의 공감 반응은 타자의 정의로움에 민감하여, 타인의 정의로움 여부에 따라 타인의 고통에 공감 반응을 보이기도 하고 쾌감을 느끼기도 한다. 그러나, 타자에 대한 우리의 공감 반응은 항상 정의로운 것은 아니며, 내집단 편향성이라는 내재적 한계를 가지고 있다. 즉, 자신과 같은 집단이나 범주에 속하는 사람인지 아닌지에 따라, 우리는 스스로 의식하지도 못한 채 타인의 고통에 편향적으로 공감하기도 하고, 편향적으로 쾌감을 느끼기도 한다. 최근의 정보통신기술 발전은, 내집단 관련 SNS혹은 내집단 매체에 대한 편향적 접근을 용이하게 하며, 이를 통해 집단과 관련한 보다 편향된 의미론적 정보 네트워크의 구축을 심화시킨다. 이러한 현상들은 공감의 내재적 한계 속성들과 상호작용하여 더욱 편향된 내집단 공감 및 내집단 활동을 하게 하는 악순환의 고리를 형성함으로써 분열과 대립을 가속화할 수 있다. 저자는 공감의 신경 기전에 대한 이해를 통해 공감의 속성과 한계를 고찰해보고, 신경과학적 관점에서 공감과 정의의 관련성을 탐색해봄으로써, 분열과 갈등의 현대 사회를 기존의 사회과학적 시각과는 다른 차원에서 조명해보고자 하였다.

Multi-channel CNN 기반 온라인 리뷰 유용성 예측 모델 개발에 관한 연구 (A multi-channel CNN based online review helpfulness prediction model)

  • 이흠철;윤효림;이청용;김재경
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.171-189
    • /
    • 2022
  • 온라인 리뷰는 소비자의 구매 의사결정 과정에서 중요한 역할을 담당하고 있으므로 소비자에게 유용하고 신뢰성이 있는 리뷰를 제공하는 것이 중요하다. 기존의 온라인 리뷰 유용성 예측 관련 연구는 주로 온라인 리뷰의 텍스트와 평점 정보 간의 일관성을 바탕으로 리뷰 유용성을 예측하였다. 그러나 기존 연구는 평점 정보를 스칼라로 표현했기 때문에 표현 수용력이 제한적이거나 평점 정보와 리뷰 텍스트 정보와의 상호작용을 제한적으로 학습하는 한계가 존재한다. 본 연구에서는 기존 연구의 한계점을 보완하기 위해 리뷰 텍스트와 평점 정보 간의 상호작용을 효과적으로 학습할 수 있는 CNN-RHP(CNN based Review Helpfulness Prediction) 모델을 제안하였다. 먼저, 리뷰 텍스트의 의미론적 특성을 추출하기 위해 multi-channel CNN을 적용하였다. 다음으로, 평점 정보는 텍스트 특성과 동일한 차원을 나타내는 독립된 고차원 임베딩 특성 벡터로 변환하였다. 최종적으로 요소별(Element-wise) 연산을 통해 리뷰 텍스트와 평점 정보 간의 일관성을 학습하였다. 본 연구에서는 제안된 CNN-RHP 모델의 성능을 평가하기 위해 Amazom.com에서 수집된 온라인 소비자 리뷰를 사용하였다. 실험 결과, 본 연구에서 제안한 CNN-RHP 모델이 기존 연구에서 제안된 여러 모델과 비교했을 때 우수한 예측 성능을 나타내는 것을 확인하였다. 본 연구의 결과는 온라인 전자상거래 플랫폼에서 소비자들에게 리뷰 유용성 예측 서비스를 제공할 때 유의미한 시사점을 제공할 수 있다.

조경학 연구에서 자연성 개념의 다의적 체계 연구 (Poly Synonyms Study on Naturalness in Landscape Architecture)

  • 이성진;김도은;손용훈
    • 한국조경학회지
    • /
    • 제51권1호
    • /
    • pp.29-41
    • /
    • 2023
  • 국내 조경학 연구에서 자연성 개념은 물리적 공간에서부터 인식적 체계까지 그 범주가 방대하여 용어를 정의하기에 어려움이 있다. 본 연구는 체계적 문헌 고찰(systematic review, SR)을 통하여 문헌에서 활용된 '자연성(naturalness)'의 개념과 평가 속성을 정리하고 자연성의 의미를 구성하는 개별 속성의 범위를 파악하였다. 또한, 선행연구에서 구분한 개별 속성을 인지언어학 연구 방식의 하나인 의미 연쇄(meaning chain) 원리로 파악하여 국내 조경학 논문 중 자연성을 대상으로 한 논문들에 적용하여 다의적 체계를 정리하였다. 의미 연쇄(meaning chain)는 원형의미를 중심으로 가족 유사성에 기인하여 연쇄적으로 의미가 확장되어 가는 단어를 파악하기에 적합한 방식으로서, 자연성 평가 항목 분류에 따라 그 차원을 구분하고 국내 학계에서 논의되는 자연성 개념의 다의적 의미 연쇄 체계를 고찰하였다. 연구의 결과는 다음과 같다. 첫째, 국외 조경학 문헌을 통해 추출한 자연성의 속성은 원생상태로 인지되는 자연, 인위적 개입이 없는 상태로서의 자연, 시각적 경관으로서의 자연, 경험으로서의 자연 4개 영역으로 분류되며 세부 13개 속성으로 정리되었다. 둘째, 이러한 세부속성은 국내 조경학 연구에도 전반적으로 부합하나 그 구체적 사례가 달랐고, 시간의 축적 인지에 있어 한국적 맥락이 제시되었으며, 자연성 속성 간 상호충돌이 있을 수 있음을 시사하였다.

LDA토픽 모델링을 활용한 생성형 AI 챗봇의 탐색적 연구 : 기존 AI 챗봇 서비스 품질 요인과의 비교 (An Exploratory Study of Generative AI Service Quality using LDA Topic Modeling and Comparison with Existing Dimensions)

  • 안예은;오정석
    • 서비스연구
    • /
    • 제13권4호
    • /
    • pp.191-205
    • /
    • 2023
  • 인공 지능 (AI), 특히 텍스트 생성 서비스 분야에서의 발전은 두드러지게 나타나고 있으며, AI-as-a-Service (AIaaS) 시장은 2028년까지 550억 달러에 달할 것으로 예상된다. 본 연구는 합성 텍스트 미디어 소프트웨어의 품질 요소를 탐구하였으며, 이를 위해 ChatGPT, Writesonic, Jasper, 그리고 Anyword와 같은 산업의 주요 서비스에 주목하였다. 소프트웨어 평가 플랫폼에서 수집된 4,000개 이상의 리뷰를 바탕으로, Gensim 라이브러리를 활용한 잠재 디리클레 할당 (LDA) 주제 모델링 기법을 적용하였다. 이 분석을 통해 11개의 주제가 도출되었다. 이후 이 주제들을 AICSQ 및 AISAQUAL과 같은 기존 논문에서 다루었던 AI 서비스 품질 차원과 비교 분석하였다. 리뷰에서는 가용성 및 효율성과 같은 차원이 주로 강조되었으며, 이전 연구에서 중요하게 여겨졌던 사람다움과 같은 요소는 본 연구에서 강조되지 않았다. 이러한 결과는 AI 서비스의 본질적 특성, 즉 사용자와의 직접적인 상호작용보다 의미론적 이해에 더 중점을 둔다는 특성 때문으로 해석된다. 본 연구는 단일 리뷰 원천 및 평가자들의 인구 통계의 특정성과 같은 잠재적 편향을 인정하며, 향후 연구 방향으로는 이러한 품질 차원이 사용자 만족도에 어떻게 영향을 미치는지, 그리고 개별 차원이 전체 평점에 어떻게 영향을 미치는지에 대한 깊은 분석을 제안한다.

간찰(簡札)의 안부인사(安否人事)에 대한 유형(類型) 연구(硏究) (A study on the Greeting's Types of Ganchal in Joseon Dynasty)

  • 전병용
    • 동양고전연구
    • /
    • 제57호
    • /
    • pp.467-505
    • /
    • 2014
  • 필자(筆者)는 여러 해째 간찰(簡札)를 대상으로 일련(一連)의 국어학적(國語學的) 연구(硏究)를 진행하고 있으며 이 연구(硏究)는 그 일환(一環)으로서 [안부인사(안부인사(安否人事))]의 유형화(類型化)를 위한 것이다. 이를 위하여 근대국어(近代國語) 시기(時期)(16세기(世紀)-19세기(世紀))의 한문간찰(漢文簡札)와 한글간찰(簡札)를 대상으로 [안부인사(安否人事)]를 형식적(形式的) 유형(유형(類型))와 의미적(意味的) 유형(類型)로 나누어 분석(分析)하였다. [안부인사(安否人事)]의 형식적(形式的) 유형(類型)는 정치여부(定置與否), 생략여부(省略與否), 기상여부(寄狀與否), 존비여부(尊卑與否)를 기준으로 나눌 수 있다. 정치여부(定置與否)를 제1기준으로, 생략여부(省略與否)를 제2기준으로 삼아 다섯 가지로 유형화하였다. [안부인사(安否人事)]의 전형성(典型性)이 가장 잘 드러난 정치형(定置型)이면서 완성형(完成型)을 제(第)1유형(類型)로 삼았다. 정치형(定置型)이면서 자기안부생략형(自己安否省略型)을 제(第)2유형(類型)으로, 정치형(定置型)이면서 상대안부생략형(相對安否省略型)을 제(第)3유형(類型)으로, 정치형(定置型)이면서 안부인사생략형(安否人事省略型)을 제(第)4유형(類型)로 삼았다. [안부인사(安否人事)]에서 破格이 가장 심한 도치형(倒置型)을 제(第)5유형(類型)로 삼았다. 第1유형(類型)은 [상대안부(相對安否)]가 [자기안부(自己安否)]에 선행(先行)하는 정치형(定置型)이면서 의미요소(意味要素)가 온전한 완성형(完成型)을 가리킨다. 이 유형은 [안부인사(安否人事)]의 모든 구성요소(構成要素)를 갖췄다는 점에서 가장 전형적(典型的)이며 규범적(規範的)이라 할 수 있다. 제(第)2유형(類型)은 [안부인사(安否人事)]가 [상대안부(相對安否)]로만 이루어진 것이다. 정형성(定型性)에서는 제(第)1유형(類型)보다 덜하지만 출현빈도(出現頻度)에서는 큰 차이가 없는 유형이다. [상대안부(相對安否)]를 충실히 묻되, [자기안부(自己安否)]는 생략하는 것이 예의에 크게 어긋나지 않으면서 간찰을 쉽게 쓸 수 있기 때문에 활용된다. 제(第)3유형(類型)은 [상대안부(相對安否)+자기안부(自己安否)]의 구성을 보이는 정치형(定置型)이지만 [상대안부(相對安否)]가 생략된 유형을 가리킨다. 제(第)4유형(類型)은 [상대안부(相對安否)+자기안부(自己安否)]의 구성을 보이는 정치형(定置型)이지만 [안부인사(安否人事)] 전체가 생략된 유형이다. 이 유형은 [안부인사(安否人事)]자체를 완전히 생략한 경우와 '제번(除煩)'과 같은 상투적인 표현이 [안부인사(安否人事)]를 대신하는 경우로 나뉜다. 제(第)5유형(類型)은 정치형(定置型)과 달리 [자기안부(自己安否)+상대안부(相對安否)]의 구성을 보이는 도치형(倒置型)이다. 이 유형은 정형성(定型性)에서 파격(破格)이 가장 심한 유형으로 실예(實例)도 아주 드물다. [자기안부(自己安否)]를 앞세우고 나중에 체면치레로 [상대안부(相對安否)]를 묻는 것은 예의에 어긋나기 때문이다. 이 외에 [안부인사(安否人事)] 유형을 [상대안부(相對安否)]와 [자기안부(自己安否)]가 직접 연결된 직접형(直接型)과 [事緣]으로 분리된 간접형(間接型)으로 대별(大別)하여 세분할 수도 있다. [안부인사(安否人事)]의 의미적(意味的) 유형(類型)은 기상여부(寄狀與否), 완급여부(緩急與否), 친밀여부(親密與否), 격조여부(隔阻與否)를 기준으로 나눌 수 있다. 기상(寄狀)의 경우 [안부인사(安否人事)]는 [상대안부(相對安否)(시후(時候)+문안(問安)+심경(心境))+자기안부(自己安否)(상황(狀況)+안부(安否)+심경(心境))]의 구성을 보인다. [상대안부(相對安否)]에서 [시후(時候)]는 [계절(季節)] 정보와 [기상(氣象)(날씨)] 정보로 세분(細分)할 수 있고, [심경(心境)] 또한 수신자(受信者)의 [가족안부([家族安否) 심경(心境)]과 [개인안부(個人安否) 심경(心境)]으로 나뉜다. [자기안부(自己安否)]에서 [상황(狀況)]은 수신자(受信者)의 종래 상황인 [근황(近況)]과 수신자(受信者)의 현재 상황인 [현황(現況)]으로 나뉘며 [문안(問安)] 또한 수신자(受信者)의 [가족문안(家族問安)]와 [개인문안(個人問安)]으로, [안부(安否)]는 [가족안부(家族安否)]와 [개인안부(個人安否)]로 세분(細分)할 수 있다. 이처럼 [문안(問安)]이나 [안부(安否)]가 [가족(家族)]과 [개인(個人)] 차원에서 짝을 이루어 쓰일때가 많은데 부모(父母)나 조부모(祖父母)를 모시고 사는 층층시하(層層侍下)의 대가족제도(大家族制度)에서 비롯한 현상이라 할 수 있다. 답상(答狀)의 경우 [안부인사(安否人事)]는 [상대안부(相對安否)(수신(受信)+안부(安否)+심경(心境))+자기안부(自己安否)(상황(狀況)+안부(安否)+심경(心境))]의 구성을 보며 [상대안부(相對安否)]에서만 의미구성이 기상(寄狀)과 차이가 있다. [상대안부(相對安否)]에서 [수신(受信)]은 직접 간찰을 받는 [서신(書信)]과 사람들 통해 소식을 전해 듣는 [전언(傳言)]으로 나뉘며 [안부(安否)]는 [가족안부(家族安否)]와 [개인안부(個人安否)]로, [심경(心境)] 역시 [가족안부(家族安否) 심경(心境)]과 [개인안부(個人安否) 심경(心境)]으로 나뉜다.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

시각 디스플레이에서의 감성 모형 개발 -움직임과 색을 중심으로- (A Study on Developing Sensibility Model for Visual Display)

  • 임은영;조경자;한광희
    • 인지과학
    • /
    • 제15권2호
    • /
    • pp.1-15
    • /
    • 2004
  • 본 연구는 동적 시각 디스플레이에서 움직임 속성과 감성간의 관계를 이해하고자 하였다. 움직임에서의 감성 모형을 구축하기 위해 기존 연구에서 수집된 감성어휘를 움직임과 관련된 감성을 설명하기에 적절한지 평가하도록 하고 직접 움직임 자극을 제시하면서 자유롭게 움직임에서 감성을 보고하도록 하여 70개의 감성 어휘로 정리하였다. 정리된 어휘들 중 핵심적인 어휘들을 선별하기 위해 다양한 움직임에 대한 감성을 평가한 결과로 요인분석을 실시하여 각 요인을 대표하는 19개의 기본 감성 어휘를 추출하였다. 19개 어휘를 통해 움직임의 감성을 평정한 값을 다차원 척도법을 통해 분석하고 어휘들이 분포된 형태를 분석한 결과 움직임에 대한 감성 차원은 ‘적극적이다-소극적이다’ 차원과 ‘밝다-어둡다’ 두 차원으로 대부분 설명될 수 있었다. 구축된 감성 공간을 기초로 움직이는 속도와 진행 경로의 여러 속성들을 다양하게 변화시키면서 두 가지 감성 차원에 따라 움직임에서의 감성을 평가하도록 하였다. 움직임을 결정하는 물리적 속성 중 속도, 곡선 경로의 주기와 진폭이 감성 차원을 결정하는 요인으로 작용하는 경향을 보였다. 단색에서의 감성이 움직임 감성 공간에서 두 차원을 기준으로 설명된 수 있음에도 불구하고, 움직임 요인에 색이 추가될 경우 색이나 움직임 중 한 가지 요인이 특정 감성 차원에 보다 주도적인 효과를 나타내는 경향이 있었다. 색과 움직임 요인이 동시에 제시될 때 색은 ‘밝다 어둡다’ 의 차원에서의 효과를, 움직임은 ‘적극적이다-소극적이다’ 감성차원에서의 반응을 예측할 수 있는 요소로 작용하였다.uency), 다양하게(flexibility), 그리고 독특하게(originality) 제시할 수 있는 능력이 중요한 것이 아니라, 주어진 문제 상황과 관련하여 해결 개연성이 높은 적절한 아이디어를 찾아나갈 수 있는 능력이 중요한 것임을 지적한다. 필자는 발산적 사고가 작동을 하지 않고서도 어떻게 역사적인 창의적 행위가 가능할 수 있는지를 보여주는 예로 Kekule의 벤젠링 발견의 경우 둥을 살펴본다. 창의적 문제 해결에서는 발산적 사고가 중요한 것이 아니라 해결해야할 문제 영역에 대한 통찰력과 아울러 어떤 아이디어가 주어진 문제 해결에 유용한지에 대한 통찰력이 핵심 요체이며, 이러한 통찰력은 바로 논리적ㆍ비판적 사고 훈련을 통해서 길러질 수 있는 능력인 것이다. 이와 같은 비판적 사고 교육의 강조는 정보화 사회 혹은 지식기반 사회 등으로 특징지워지는 현대사회의 특성과도 밀접한 연관을 맺고 있다. 현대 과학기술의 급격한 발전과 정치ㆍ사회ㆍ문화의 패러다임의 급속한 변화는 요구되는 지식기반의 내용과 중요성을 유동적으로 변화시키게 되었다. 따라서 새로운 변화에 신속히 적응하고 새로운 상황에서 발생하는 여러 문제들을 적절히 해결할 수 있는 상황적응적인 인지적 능력의 배양이 필요하게 되었다 우리는 이제 누구나 인터넷 서핑을 통해 방대한 정보와 지식에 접근할 수 있게 되었다. 이에 따라 암기 등을 통한 정보와 지식의 습득과 축적의 그 본래적 가치는 과거에 비해 현저히 낮아졌다. 가치를 만들어 내는 중심은 지식을 가지고 있다는 데에 있지 않고, 습득한 정보와 지식들을 조합하고 재구성하여 합리적인 문제

  • PDF

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.