• 제목/요약/키워드: 기초 어휘

검색결과 105건 처리시간 0.022초

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

색채조화의 정량적 감성평가에 기초한 이미지 검색법 (An Image Retrieval Method based on Quantitative Emotion Evaluation on Color Harmony)

  • 김돈한;정재욱
    • 감성과학
    • /
    • 제15권1호
    • /
    • pp.87-96
    • /
    • 2012
  • 본 논문에서는 사용자의 감성적 요구에 적합한 이미지를 탐색한 후 문-스펜서(P. Moon&D. E. Spencer)의 색채 조화론에 기초하여 조화의 정도가 가장 높은 이미지들을 순위별로 제시하는 이미지 검색법을 제안하였다. 이미지 검색은 키워드로 주어진 감성어휘와 관련된 색채성분이 가장 많이 포함된 이미지 화상을 검색하여 미도(Aesthetic Measure)를 계산한 후 순위별로 제시하는 방법으로 이루어진다. 문-스펜서의 색채 조화론을 적용한 이미지 검색법의 타당성을 검증하기 위하여 200개의 샘플 이미지를 대상으로 시스템이 제시한 미도순위와 사용자 만족도 평가에 의한 순위를 비교하였다. 분석결과 15개의 감성어휘별로 시스템이 출력한 이미지들의 미도 순위에 대한 실험 참가자들의 평균 만족도는 7점 척도 중 5.0으로 나타났다. 또한 시스템이 산출한 이미지들의 미도 순위와 설문 참가자가 평가한 만족도 순위 사이와의 일치 여부를 알아보기 위해 상관분석을 실시한 결과 감성어휘 'Clear'를 제외한 14개의 어휘 모두에서 상관계수 0.5 이상의 양호한 정적상관을 보였다. 이와 같은 연구결과로부터 문-스펜서의 색채 조화론을 바탕으로 제안한 감성검색법이 이미지 데이터베이스와 같은 시각자극의 검색에 있어서도 사용자의 감성을 적절히 반영할 수 있는 가능성을 확인하였다.

  • PDF

분류사와 명사 의미 부류

  • 최민우;강범모
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.395-401
    • /
    • 2000
  • 국어에서는 어떠한 대상의 수량을 표현할 때 수사와 함께 분류사(classifier)를 사용한다. 따라서 분류사는 그 특성상 수량 표현 구문을 형성하는 대상 명사와 의미적으로 밀접한 관련을 지니게되는데, 단순히 명사를 셈하는 것 뿐 아니라 명사의 의미적 특성을 명세(specify)해 준다고 할 수 있다. 본 연구에서는 이러한 명사와 분류사의 연관성에 초점을 맞추어 분류사의 사용에 따른 명사의 범주화 및 계층 구조를 보이고, 컴퓨터 말뭉치 자료를 이용하여 그 관계를 좀더 명확히 밝히는 것을 목적으로 한다. 이러한 연구는 언어를 전산적으로 처리하는데 필수적인 전산어휘부(computational lexicon)의 구축에 필요한 기초 작업이 될 수 있다.

  • PDF

시소러스를 활용한 온톨로지 구축방안 연구 - 시소러스의 SKOS 변환을 중심으로 - (A Study of Ontology Construction Using Thesaurus: Transformation of Thesaurus into SKOS)

  • 한성국;이현실
    • 한국비블리아학회지
    • /
    • 제17권1호
    • /
    • pp.285-303
    • /
    • 2006
  • 본 연구에서는 시소러스를 SKOS 기반 온톨로지로 구축하는 단계적 변환 방법을 제시하였다. 변환과정을 3단계로 형식화하였고, 각 단계별 수행작업, 산출물 및 가이드 라인을 개발하였다. 각 단계는(1) 시소러스의 어휘 용어 체계와 의미 관계를 이해하기 위해 시소러스의 기초자료를 수집하고 분석한다. (2) 대상온톨로지의 분석결과를 활용하여 변환방식을 정의하고 SKOS 온톨로지를 생성한다. (3) 대상시소러스와 생성된 SKOS 온톨로지 사이의 형태와 의미 구조 보존 여부를 검사하여 보정하고 문서화한다. 본 연구에서는 제시하고 있는 시소러스 기반형 온톨로지 구축 방법은 복잡한 어휘 관계를 갖는 시소러스에도 적용이 가능하다. 향후, 본 연구에서 제시한 단계별 변환 알고리즘을 프로그램으로 구현하여 시소러스의 자동 SKOS 온톨로지 변환기를 구현하여야 할 것이다.

해외 도서관 링크드 데이터 구축의 최근 동향 연구 - 발행 데이터세트, 재사용 어휘집, 인터링킹 외부 데이터세트를 중심으로 - (A Study on Recent Trends in Building Linked Data for Overseas Libraries: Focusing on Published Datasets, Reused Vocabulary, and Interlinked External Datasets)

  • 이성숙
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.5-28
    • /
    • 2022
  • 이 연구에서는 해외 도서관의 LD 구축 사례를 발행 데이터세트, 재사용 어휘집, 인터링킹 외부 데이터세트를 중심으로 분석하고, 분석 결과를 토대로 국내도서관의 LD 구축 방안에 대한 기초적인 데이터를 확보하였다. 21개 해외 도서관 사례 분석 결과, 해외 도서관은 충실한 전거 LD를 구축하였고, 발행 LD를 활용한 새로운 서비스를 진행하였다. 이를 위해 해외 도서관은 도서관의 주도하에 다른 도서관과 문화기관들과 지역 내에서, 국가 내에서, 국가적으로 협력하였고, 이러한 협력을 바탕으로 특성화된 데이터세트를 발행하였다. 해외 도서관은 발행 LD의 가시성을 높이기 위해 Schema.org를 사용하였고, 기술의 세분화를 위해 BIBFRAME 등을 사용하여 다양한 개체를 정의하고, 정의된 개체에 기반하여 LD를 구축하였다. 해외 도서관은 다양한 개체를 관련 정보 연계와 검색 결과 디스플레이, 브라우징, 대량 다운로드에 활용하였다. 해외 도서관은 인터링킹 외부 데이터세트를 지속해서 현행화하였고, 외부 데이터를 직접적으로 활용하여 목록정보를 보강하였다. 이 연구에서는 도출된 시사점을 토대로 국내도서관의 LD 구축 시 고려할 점을 제안하였다. 연구 결과는 향후 국내도서관이 LD 서비스를 계획하거나 기존 서비스를 고도화할 때 기초자료로 활용될 수 있을 것이다.

이동동사의 인지 도식에 관한 비교 연구 (Comparative Study on Cognitive Scheme of Movement Verbs)

  • 오현금;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.59-64
    • /
    • 2002
  • 인지심리학 및 인지언어학 분야에서 시도한 어휘 표상, 특히 움직임과 관련된 동사의 인지도식에 관한 연구들을 비교해보고자 한다. 인간의 언어학적인 지식을 도식적으로 표상 하고자 하는 노력은 언어의 통사적인 외형에만 치중하는 연구에서는 언어의 의미구조를 파악하기 힘들다고 판단하고 의미적인 범주화를 중요시하게 되었다. 본 연구에서는 시각적 이미지 도식을 중점적으로 살펴보기로 한다. 이미지 도식은 공간적 위치 관계, 이동, 형상 등에 관한 지각과 결부되어 있다. 이미지로 나타낸 표상은 근본적으로 세상의 인식과 세상에 대한 행동방법을 사용하게 하는 유추적이고 은유적인 원칙에 기초하고 있다. 이러한 점에 있어서, 언술을 발화한 화자는 어느 정도 주관적인 행동의 능력과 그가 인식한 개념화에서부터 문자화시킨 표상을 구성한다. 인지 원칙에 입각한 의미 표상에 중점을 둔 도식으로는, Langacker, Lakoff, Talmy의 도식이 있다. 프랑스에서 톰 R. Thom과 같은 수학자들은 질적인 현상에 관심을 가져 형역학(morphodynamique)이론을 확립하였는데, 이 이론은 요즘의 인지 연구에 수학적 기초를 제공하였다. R. Thom, J. Petitot-Cocorda의 도식 및 구조 의미론의 창시자라고 불리는 B.Pottier의 도식이 여기에 속한다 J.-P. Descles가 제시한 인지연산문법(Grammaire Applicative et Cognitive)은 다른 인지문법과는 달리 정보 자동처리과정에서 사용할 수 있는 연산자와 피연산자의 관계에 기초한 수학적 연산작용을 발전시켰다. 동사의 의미는 의미-인지 도식으로 설명되는데, 이것은 서로 다른 연산자와 피연산자로 구성된 형식화된 표현이다. 인간의 인지 기능은 언어로 표현되며, 언어는 인간의 의사소통, 사고 행위 및 인지학습의 핵심적 기능을 담당한다. 인간의 언어정보처리 메카니즘은 매우 복잡한 과정이기 때문에 언어정보처리와 관련된 언어심리학, 인지언어학, 형식언어학, 신경해부학 및 인공지능학 등의 관련된 분야의 학제적 연구가 필요하다.

  • PDF

비유창성 실어증 환자의 단어빈도 및 길이, 생물성에 따른 이름대기 수행의 차이 (The Differences of Naming by Word Frequency, Length, and Animacy in Nonfluent Aphasic Patients)

  • 권정희;최현주
    • 재활복지
    • /
    • 제20권1호
    • /
    • pp.171-188
    • /
    • 2016
  • 이 연구는 비유창성 실어증 환자 집단과 정상 성인 집단을 대상으로 단어빈도, 단어길이, 생물성의 세 가지 어휘조건에 따른 이름대기 수행에 차이가 있는지 알아보는 것을 목적으로 하였다. 연구 대상은 비유창성 실어증 환자 15명과 정상 성인 15명이었다. 이름대기 과제의 목표 단어는 그림으로 표현 가능한 구체명사만 사용하였으며, 이름대기 평가는 그림을 이용한 대면이름대기방법을 사용하였다. 목표 단어는 단어빈도(저빈도어/고빈도어), 단어길이(1음절/3음절), 생물성(생물/무생물)의 어휘조건을 적용하여 총 40개의 문항으로 구성하였다. 연구 결과를 살펴보면 다음과 같다. 첫째, 두 집단 모두 고빈도 단어의 이름대기 수행이 저빈도 단어보다 높게 나타났다. 둘째, 두 집단 모두 1음절 단어의 이름대기 수행이 3음절 단어보다 높게 나타났다. 셋째, 두 집단 모두 생물성에 따른 이름대기 수행에는 유의한 차이가 없었다. 넷째, 집단과 어휘조건의 상호작용 효과는 단어빈도에서만 나타났다. 이러한 결과는 비유창성 실어증 환자들의 어휘조건에 따른 이름대기 능력의 저하는 단어길이나 생물성에 비해 단어빈도의 효과가 크다는 것을 시사한다. 이러한 연구결과는 비유창성 실어증 환자의 이름대기 평가와 중재의 기초 자료로 활용될 수 있다.

시각 디스플레이에서의 감성 모형 개발 -움직임과 색을 중심으로- (A Study on Developing Sensibility Model for Visual Display)

  • 임은영;조경자;한광희
    • 인지과학
    • /
    • 제15권2호
    • /
    • pp.1-15
    • /
    • 2004
  • 본 연구는 동적 시각 디스플레이에서 움직임 속성과 감성간의 관계를 이해하고자 하였다. 움직임에서의 감성 모형을 구축하기 위해 기존 연구에서 수집된 감성어휘를 움직임과 관련된 감성을 설명하기에 적절한지 평가하도록 하고 직접 움직임 자극을 제시하면서 자유롭게 움직임에서 감성을 보고하도록 하여 70개의 감성 어휘로 정리하였다. 정리된 어휘들 중 핵심적인 어휘들을 선별하기 위해 다양한 움직임에 대한 감성을 평가한 결과로 요인분석을 실시하여 각 요인을 대표하는 19개의 기본 감성 어휘를 추출하였다. 19개 어휘를 통해 움직임의 감성을 평정한 값을 다차원 척도법을 통해 분석하고 어휘들이 분포된 형태를 분석한 결과 움직임에 대한 감성 차원은 ‘적극적이다-소극적이다’ 차원과 ‘밝다-어둡다’ 두 차원으로 대부분 설명될 수 있었다. 구축된 감성 공간을 기초로 움직이는 속도와 진행 경로의 여러 속성들을 다양하게 변화시키면서 두 가지 감성 차원에 따라 움직임에서의 감성을 평가하도록 하였다. 움직임을 결정하는 물리적 속성 중 속도, 곡선 경로의 주기와 진폭이 감성 차원을 결정하는 요인으로 작용하는 경향을 보였다. 단색에서의 감성이 움직임 감성 공간에서 두 차원을 기준으로 설명된 수 있음에도 불구하고, 움직임 요인에 색이 추가될 경우 색이나 움직임 중 한 가지 요인이 특정 감성 차원에 보다 주도적인 효과를 나타내는 경향이 있었다. 색과 움직임 요인이 동시에 제시될 때 색은 ‘밝다 어둡다’ 의 차원에서의 효과를, 움직임은 ‘적극적이다-소극적이다’ 감성차원에서의 반응을 예측할 수 있는 요소로 작용하였다.uency), 다양하게(flexibility), 그리고 독특하게(originality) 제시할 수 있는 능력이 중요한 것이 아니라, 주어진 문제 상황과 관련하여 해결 개연성이 높은 적절한 아이디어를 찾아나갈 수 있는 능력이 중요한 것임을 지적한다. 필자는 발산적 사고가 작동을 하지 않고서도 어떻게 역사적인 창의적 행위가 가능할 수 있는지를 보여주는 예로 Kekule의 벤젠링 발견의 경우 둥을 살펴본다. 창의적 문제 해결에서는 발산적 사고가 중요한 것이 아니라 해결해야할 문제 영역에 대한 통찰력과 아울러 어떤 아이디어가 주어진 문제 해결에 유용한지에 대한 통찰력이 핵심 요체이며, 이러한 통찰력은 바로 논리적ㆍ비판적 사고 훈련을 통해서 길러질 수 있는 능력인 것이다. 이와 같은 비판적 사고 교육의 강조는 정보화 사회 혹은 지식기반 사회 등으로 특징지워지는 현대사회의 특성과도 밀접한 연관을 맺고 있다. 현대 과학기술의 급격한 발전과 정치ㆍ사회ㆍ문화의 패러다임의 급속한 변화는 요구되는 지식기반의 내용과 중요성을 유동적으로 변화시키게 되었다. 따라서 새로운 변화에 신속히 적응하고 새로운 상황에서 발생하는 여러 문제들을 적절히 해결할 수 있는 상황적응적인 인지적 능력의 배양이 필요하게 되었다 우리는 이제 누구나 인터넷 서핑을 통해 방대한 정보와 지식에 접근할 수 있게 되었다. 이에 따라 암기 등을 통한 정보와 지식의 습득과 축적의 그 본래적 가치는 과거에 비해 현저히 낮아졌다. 가치를 만들어 내는 중심은 지식을 가지고 있다는 데에 있지 않고, 습득한 정보와 지식들을 조합하고 재구성하여 합리적인 문제

  • PDF

영한 기계번역의 자연어 생성 연구 (A Study on the Natural Language Generation by Machine Translation)

  • 홍성룡
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권1호
    • /
    • pp.89-94
    • /
    • 2005
  • 기계번역에서 자연어 생성의 목적은 입력언어의 어구 분석을 이용하여 그 문장의 의미를 변환해주는 목적 언어를 생성하는 것이다. 그것은 언어적 구조 낱말 전사. 대화체 언어, 어휘적 정보 등을 포함해야 한다. 본 연구에서는 대화체 자동 기계번역 시스템 구현계획의 일부인 음성, 음운 분야에서 담당하게 될 음성인식과 음성합성 알고리듬을 확립하기 위한 한국어 특질에 대한 기초조사를 하고자 한다. 또한 기계번역의 단계를 분석하여 형태소 분석 단계와 구문 분석 단계, 의미 분석 단계로 구분한다. 형태소 분석은 입력 문장을 받아 분리된 형태소를 사전 내에서 검색하여·품사 정보를 얻고 이웃하는 단어와의 접속 관계가 문법적으로 올바르게 되었는지를 점검한다. 본 연구의 결과가 대화체 기계번역 시스템 구현계획의 종합적 입장에서는 단순한 기초조사일 수 있지만, 한국어의 교육 및 기계번역 이해의 측면에서는 그 자체로 가치를 지닌다고 할 수 있겠다. 따라서 교육적 측면에서의 직접적 활용을 여러 측면에서 고려할 수 있을 것이다.

  • PDF

웹게임 기반 온라인 설문조사 방법론 -공간배색과 감성언어를 중심으로- (Methodology of Online Survey Questionnaire based on Webgame towards Spacial Color Combination and Affective Word)

  • 강승묵;김해윤;박경수;박영성
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.133-141
    • /
    • 2010
  • 본 연구의 목적은 웹 게임을 이용한 새로운 온라인 설문조사방법을 제시하는 것이다. 이는 웹 게임에서 실제로 사용되는 배경을 중심으로 공간 디자인 요소와 감성언어 간의 상관관계를 규명하고 데이터베이스 시스템을 구축하여 기존 온라인 설문조사방법의 한계인 불성실한 응답의 문제를 극복하는 새로운 조사방법론 제시 하는 것이다. 이를 위해서 관련 문헌을 고찰하고 기존 텍스트 기반의 설문 조사 방법과 온라인 설문조사의 장단점을 비교하여 그 단점에 해당하는 오류를 개선할 수 있는 웹 게임 기반의 온라인 설문조사 방법을 도출하였다. 이는 주거 전통 상업 환타지 등 4가지 공간과 감성어휘들 간의 상관관계를 가우스분포의 위치 결정값을 기초로 감성어휘 데이터베이스가 구현되었다. 본 연구는 소비자 선호도 조사와 같은 모집단 예측 시스템에 활용할 수 있을 것을 시사한다.