• 제목/요약/키워드: 자연언어이해

검색결과 133건 처리시간 0.022초

태깅 지원 시스템 : Hi-Tagger (A Tagging Support System : Hi-Tagger)

  • 이인근;정재은;황도삼;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.91-94
    • /
    • 2012
  • 컴퓨터가 인간의 자연언어를 처리하고 이해하도록 하기 위한 많은 연구가 진행되어 왔다. 그러나 컴퓨터에 의해 자동으로 구축한 정보의 신뢰성 문제로 인해 그 효용성이 낮다. 따라서 최근에는 웹 2.0 환경에서의 집단지성을 통한 오픈지식의 구축과 지식 간의 링크 정보의 활용이 주목을 받고 있다. 그러나 양질의 지식을 구축하기 위해서는 인간의 개입이 불가피하며 대부분의 오픈지식도 사용자들의 노력에 의존하여 구축되고 있다. 따라서 본 논문에서는 자연언어로 작성된 문장의 용어에 대한 태깅 작업을 지원하는 태깅지원 시스템을 개발한다. 개발한 시스템에서는 사용자가 문장을 작성하는 과정에서 자동으로 태깅 가능한 용어를 추천하고, 시스템이 추천한 용어에 대해 사용자는 태그셋(tagset) 에 등록된 태그 및 링크로 태깅을 수행한다. 이 시스템을 이용하여 경제, 과학, 문학, 철학의 4개 분야에 대해 5인의 실험자가 한글문서의 태깅 실험을 수행함으로써 개발한 시스템의 효용성을 확인한다.

  • PDF

화행 정보를 활용한 문장에서의 감정 인식 (Emotion Recognition of Sentence by using Speech Act)

  • 김기태;류법모;최용석;이상태
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2009년도 춘계학술대회
    • /
    • pp.199-200
    • /
    • 2009
  • 자연스러운 대화가 가능한 인공지능 대화시스템을 구축하기 위해서는 사용자의 문장에 내재된 감정을 이해할 수 있는 시스템이어야만 한다. 또한 상호간의 대화를 통해서 풍겨지는 분위기를 파악할 수 있다면 사용자에게 마치 인간과 대화하는 듯한 자연스러움을 느끼도록 할 수 있을 것이다. 실제 대화에서 감정은 언어적인 표현뿐 아니라 비언어적인 표현으로도 표출되지만, 본 논문은 텍스트 상에서 언어적으로 표현되는 감정 정보를 인식하는데 초점을 둔다. 언어적인 표현으로 한정하여 감정을 인식하는 경우에는 감정을 직접 표현하고 있는 형용사나 동사가 중심이 된다. 본 논문에서는 형용사를 중심으로 하여 화행 정보와 결합하여 감정을 인식하는 시스템에 대해서 제시하고자 한다. 이 논문은 문장에 내재되어 있는 숨겨진 감정이나 분위기 등을 파악하기 위한 연구에 대한 선행 연구로서 텍스트 상에서 직접 드러나는 감정을 인식하기 위한 방법을 제안한다.

  • PDF

FA의 새로운 전개(중)

  • 이봉진
    • 한국정밀공학회지
    • /
    • 제4권4호
    • /
    • pp.6-12
    • /
    • 1987
  • 지능화(Intelligence) 전반적인 경향 : 생산분야에 있어서의 지능화는 인공지능(AI)기법이 활용되면서 부터 관심을 모으게 되었다. AI기법이라고 하여도 그에 관련된 기술은 Software기술, 지식표현과 같은 기초기술 에서 부터, 지식공학, 화상인식 이해, 자연언어 이해, 음성이해 등의 응용기술에 이르기까지 다양한 분야를 포함하고 있다. 여기서는, 최근 실용화 면에서 주목을 받고 있는 지식공학의 실용 또는 그 응용시스템인 expert system(전문가시스템)에 주목하면서, 설계와 공정설계 중에 최근의 AI활용과 동향을 요약해 보기로 한다.

  • PDF

시맨틱 웹을 위한 객체지향의 마크업 언어 (Object Oriented Markup Language for the Semantic Web)

  • 유명환;정희준;이강찬;김성한;민재홍;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2321-2324
    • /
    • 2002
  • 현재의 웹은 시각적인 표현을 위한 것으로써 정보를 사람에게 어떻게 보여줄 것인가에 대해서 초점을 두고 개발되었다. 따라서 폭발적으로 증가하는 웹 데이터에서 사용자가 원하는 정보를 신속 정확하게 찾는 것은 점점 어렵게 되었다. 이를 개선하기 위해 자연언어처리, 에이전트, 검색엔진 등과 같은 기술을 개발하였으나 정보와 표현을 위한 태그의 혼합으로 컴퓨터가 정보를 효과적인 추출 및 이해하는데 한계가 있다. 이는 지금까지의 웹 기술로써는 다양한 표현과 사용하기 쉽지만 정보의 의미표현이 부족하기 때문이다. 이러한 문제점을 해결하기 위해 정보를 온톨로지로써 개념화하고 이를 컴퓨터가 이해하며 이기종 컴퓨터간의 자유로운 정보접근을 위해 1990년 대 말에 시맨틱 웹이 제안되었다. 현재 시맨틱 웹은 RDF(S), OIL. DAML, SHOE 등과 같은 마크업 언어가 연구 개발 중에 있으나 이 역시 지식표현 분야 위주의 연구로 그 한계가 있다. 이에 본 논문에서는 시맨틱 웹을 위한 지금까지의 마크업 언어에 대한 분석을 하고, 효과적인 시맨틱 웹의 구현을 위한 객체지향의 마크업 언어를 제안한다. 본 논문에서 제안하는 마크업 언어는 이기종의 분산환경에 적합하고 재사용성 및 확정성에 용이하는 등의 장점들을 갖고 있다.

  • PDF

문장 표현 언어 VAR(Verb Activate to Relation) 설계 (Design of Sentence Representation Language VAR (Verb Activate to Relation))

  • 김경서;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.119-128
    • /
    • 1992
  • 컴퓨터가 자연 언어를 이해하기 위해 가장 필요로 하는 것은 단어에 대한 정보다. 단어는 문장 안에서 나름대로의 정보를 지니고 사용된다. 사람들이 실제 생활에서 사용하는 문장을 대량으로 모아 둔 것을 말뭉치(Corpus)라 한다. 그러므로, 단어가 인간 언어 생활에서 사용되면서 지니는 정보를 찾기 위해서는 말뭉치를 들여다보는 것이 필요하다. 본 논문에서는 문장이 갖고 있는 정보 중 많은 것을 표현할 수 있는 언어, VAR를 설계한다. 그리고 말뭉치를 VAR로 표현해서 관리하면서 언어학자 및 전산학자가 좋은 지식 기반(Knowledge Base)를 만들 수 있는 기초를 제공한다.

  • PDF

한국어 워드넷의 구축 (Construction of Korean WordNet)

  • 임성신;이은령;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF

영어 조응표현의 개념구조 (Conceptual Structures of Anaphoric Expressions in English)

  • 정미애
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.300-309
    • /
    • 1995
  • 언어표현에 대한 해석은 그 구성요소들의 통사적-어휘적 구조에 덧붙여 대명사의 동일지시를 살펴야 할 필요가 있다. 조응의 분석과 조응적 선행사를 찾기 위한 효과적인 방법을 발견하는 것이 컴퓨터 언어학(computational linguistics), 특히 자연언어 이해체계(Natural Language understanding system)에 관한 연구의 중심적인 문제라고 할 수 있다. 이 논문의 목적은 영어 조응표현을 개념구조 이론(Conceptual Structure Theory)의 개념도식(conceptual graph)에 의하여 기술함으로써 단문에서뿐만 아니라 복문, 양화구문, 그리고 담화에 이르기까지 언어 전반에 걸쳐 나타나는 동일지시성(coreferenciality)을 간단하고 일관성 있게 설명하는 것이다. 이러한 조응현상을 설명하기 위하여 필자는 개념도식상의 개념을 중심개념, 직접개념, 간접개념으로 구분하고 이들이 문맥깊이 등과 더불어 동일지시성을 설명하는데 중심적 역할을 함을 보이고자 한다.

  • PDF

집단 구성 방법과 인지 양식에 따른 수학과 소집단 협동 학습의 효과: 초등학교 6학년을 중심으로

  • 김남균;이기석
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제1권2호
    • /
    • pp.137-148
    • /
    • 1997
  • 21세기를 눈앞에 두고 있는 오늘날의 사회에서는 변화에 적응할 수 있는 능력과 정보를 이해할 수 있는 능력이 더욱 필요하다. 따라서, 수학에서도 산술과 같은 기초적인 수학뿐 아니라 새로운 정보, 복잡한 정보를 이해하고 의사 소통하는 능력이 요구된다. 수학은 패턴의 과학이며 우리가 살고 있는 세상을 묘사하는 도구로서 자연 언어를 보충하는 의사소통의 한 형태이기도 하다. 그러므로 수학 수업에서는 기본 개념과 공식은 물론 의사소통 능력을 강조해야 한다(Mathematical Sciences Education Broad, 1990).(중략)

  • PDF

Machine에 의한 자연 언어 이해의 효과성 및 탄력성 중대를 위한 자연언어 이해 기법과 분류 기법과 연결적 통합 사용에 대한 연구 (A Study of Improving the Flexibility and Effectiveness of Natural Anguage Understanding Considering Natural Language Classification Methodologies)

  • 이현부
    • 한국지능시스템학회논문지
    • /
    • 제1권3호
    • /
    • pp.20-32
    • /
    • 1991
  • This study seeks a way a way of dealing with unformatted natural language considering fuzzy set theory. The goal of the study is to establish a framework of an effective language understanding system that is linked to language classification system This study has found that languate understanding is strongly influenced by the language classification. The understanding of language. This study shows that the precision of language classification depends upon the way of how the language is classified in advance. In this study, a fuzzy logic was used to improve the precision of language classification. It was considered that the fuzzy logic might be albe to distinctively classify nuatural language texts into pretinent homogenious groups where contents of the language were identical. Accordingly, in the study, it was expected that classification of language were precisely classified by the fuzzy logic. An experimentalsystems was designed to evaluate the performane of a natural language understanding system that was connected to a fuzzy language classification system. Finally, the experiment suggests that a successful language understanding should require an real time interaction between mem andmachine fuzzy provious language classification.

  • PDF

숫자의 대소관계 파악을 위한 Explicit Feature Extraction(EFE) Reasoner 모델 (Explicit Feature Extraction(EFE) Reasoner: A model for Understanding the Relationship between Numbers by Size)

  • 안지수;민태원;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.23-26
    • /
    • 2023
  • 본 논문에서는 서술형 수학 문제 풀이 모델의 숫자 대소관계 파악을 위한 명시적 자질추출방식 Explicit Feature Extraction(EFE) Reasoner 모델을 제안한다. 서술형 수학 문제는 자연현상이나 일상에서 벌어지는 사건을 수학적으로 기술한 문제이다. 서술형 수학 문제 풀이를 위해서는 인공지능 모델이 문장에 함축된 논리를 파악하여 수식 또는 답을 도출해야 한다. 때문에 서술형 수학 문제 데이터셋은 인공지능 모델의 언어 이해 및 추론 능력을 평가하는 지표로 활용되고 있다. 기존 연구에서는 문제를 이해할 때 숫자의 대소관계를 파악하지 않고 문제에 등장하는 변수의 논리적인 관계만을 사용하여 수식을 도출한다는 한계점이 존재했다. 본 논문에서는 자연어 이해계열 모델 중 SVAMP 데이터셋에서 가장 높은 성능을 내고 있는 Deductive-Reasoner 모델에 숫자의 대소관계를 파악할 수 있는 방법론인 EFE 를 적용했을 때 RoBERTa-base 에서 1.1%, RoBERTa-large 에서 2.8%의 성능 향상을 얻었다. 이 결과를 통해 자연어 이해 모델이 숫자의 대소관계를 이해하는 것이 정답률 향상에 기여할 수 있음을 확인한다.