• 제목/요약/키워드: Roget's Thesaurus

검색결과 8건 처리시간 0.018초

천자문과 로제 시소러스 범주체계 비교 (Category Comparison between Thousand-Character Text and Roget's Thesaurus)

  • 김상락;양재군;배재학
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-89
    • /
    • 2008
  • 본 논문에서는 천자문과 로제 시소러스의 어휘 분류체계를 분석하였다. 전처리 작업으로서 천자문과 로제 시소러스를 데이터베이스화 하였다. 그리고 분석 작업의 용이성과 연구의 효율성을 높이기 위해서 천자문 대응 로제 시소러스 검색 시스템을 개발하였다. 연구결과 로제 시소러스 총 39개 과(Section) 가운데에서 'Creative Thought' 과를 제외하고 대부분의 과가 천자문 한자와 관련성을 가지는 것으로 나타났다. 'Space in General', 'Dimensions', 'Matter in General' 3개의 과가 가장 높은 대응률을 보였다. 상관계수값도 약 0.94로 나타나 천자문 한자와 로제 시소러스의 범주 관련성이 아주 높다는 사실을 발견하였다.

  • PDF

감정요소를 이용한 SNS 메시지 분류기 구현에 대한 연구 (A Study on the Implementation of SNS Message Classification by Emotion Factors)

  • 김재영;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.217-222
    • /
    • 2011
  • 최근 SNS가 급격하게 성장하고 있고 많은 사용자들이 이 SNS를 하나의 다른 커뮤니케이션 매체로 사용하고 있다. SNS를 이용하는 개인 사용자들은 자신의 소식과 감정의 변화를 표현하는 수단으로 SNS를 이용하고 있다. 이에 본 연구에서는 감정을 나타내는 감정 요소를 이용하여 메시지를 분류하는 프로그램을 구현하였다. 감정 성분 추출은 OMLS(Ocean-Monmouth Legal Services)에 있는 감정 어휘를 이용하여 로젯(Roget)의 시소러스와 워드넷(WordNet)을 이용하여 이루어졌다.

온톨러지 재사용을 위한 범주 재분류 (Category Reorganization for Ontology Reuse)

  • 양재군;이종혁;배재학;배재학
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.69-80
    • /
    • 2005
  • 본 논문에서는 기존 온톨러지를 가공하여 용도에 맞게 변환하는 방안을 모색하였다. 변환방법으로서는 범주정보 단순화와 구체화를 고안하였다. 이 각각은 다시 범주표제와 기저범주를 이용한 방법으로 나누어 생각하였다. 또한 상이한 범주집합들 사이의 관계를 밝히는 방법도 도출하였다. 정립한 변환 방법론을 활용하여, (1) Roget 시소러스로부터 7개의 범주로 구성된 '이야기 분석용 온톨러지'[32]의 원형을 구축하였고, (2) 이미 알려진 22가지 멀티미디어 게임 흡인요소를 바탕으로 세분화된 흡인요소 207가지를 발견할 수 있었으며[35], 그리고 (3) 10개의 심소와 22가지 멀티미디어 게임 흡인요소 사이의 관계를 밝혀낼 수 있었다[36].

한국어 워드넷의 구축 (Construction of Korean WordNet)

  • 임성신;이은령;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF

WordNet을 이용한 한국어 시소러스 자동 구축 (Using WordNet for the Automatic Construction of Korean Thesaurus)

  • 이창기;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.156-163
    • /
    • 1999
  • 최근의 자연어 처리 분야의 연구들에서 광범위하고 완전한 어휘 지식 베이스의 필요성이 입증되었다. 영어권의 경우, 이에 대한 연구가 오래 전부터 있어 왔고, 그 결과로 현재 주로 사용되고 있는 개념체계에는 Roget's Thesaurus와 WordNet 등이 있다. 이러한 개념체계들은 자연어 처리의 여러 응용 분야에서 중요한 역할을 담담하고 있지만, 다른 언어의 경우 널리 사용되고 있는 개념체계가 없는 실정이다. 본 논문에서는 Princeton 대학의 WordNet을 기반으로 한영 사전과 국어 사전을 이용하여 한국어 명사의 개념체계를 자동으로 구축함으로써, 이미 구축되어진 다른 언어의 개념체계를 이용하여 새로운 언어의 개념체계를 자동으로 구축할 수 있음을 보인다. 먼저 한영 사전과 국어 사전으로부터 뽑아낸 한국어 단어 일부의 의미를 다양한 WSD(Word Sense Disambiguation) 방법을 적용시켜 WordNet의 synset에 자동으로 연결시킬 수 있음을 보인다. 그리고 각각의 자동변환으로 나온 결과들에 대해서 적용율과 정확도를 비교하도록 한다.

  • PDF

온톨러지를 활용한 멀티미디어 게임 몰입력 분해 (Immersion Power Decomposition of Multimedia Games with Ontology)

  • 양재군;배재학;이종혁
    • 인지과학
    • /
    • 제15권3호
    • /
    • pp.45-55
    • /
    • 2004
  • 몰입이란 이끌린 무엇인가에 전념한 상태를 의미한다. 컴퓨터 게임에 빠져 있을 때에도 이러한 몰입을 경험할 수 있다. 본 논문에서는 멀티미디어 게임의 흡인요소를 분석하였다. 몰입이론을 기초로 분석한 결과, 인지 및 감성을 고려한 흡인요소에는 22가지가 있었다. 이와 함께 몰입차원, 구현방식, 자극방법의 각도에서 흡인요소들의 상관관계를 분석하였다. 그 결과 새로운 게임을 설계할 때 우선적으로 고려해야 할 흡인요소가 일체감, 자극성, 도박, 현장감, 환상감, 만족감, 성취감 등의 7가지로 밝혀졌다. 한편, 22가지 흡인요소를 기저범주로 두고 참조정보를 이용하여 Roget 시소러스 내에서 가까운 반경 안의 새로운 범주를 탐색하였다. 그 결과, 22가지 게임의 흡인요소를 229가지로 세분화시킬 수 있었다. 이러한 본 논문의 결과를 활용한다면, 몰입력이 한층 강화된 멀티미디어 게임의 제작이 가능할 것이다.

  • PDF

ISAAC :문장분석용 통합시스템 및 사용자 인터페이스 (ISAAC : An Integrated System with User Interface for Sentence Analysis)

  • 김곤;김민찬;배재학;이종혁
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.107-116
    • /
    • 2004
  • 본 논문에서 소개할 ISAAC(An Interface for Sentence Analysis & Abstraction with Cogitation)은 문장분석용 통합 사용자 인터페이스를 제공한다. 이 시스템에는 문장 분석 시 필요한 다양한 언어학적 도구와 자원이 통합되어 있다. 문장분석에 가용한 도구와 자원은 대부분 독립적으로 개발 축적된 것들이다. 이들을 활용한 문장분석의 경우, 단계적으로 얻어지는 문장분석 정보들을 문장분석가가 관리, 처리하기에는 어려움이 있다. 이에 본 논문에서는 가용 도구와 자원들을 통합하고, 각 기능들에 대해 사용자 중심의 일관된 인터페이스를 ISAAC이 제공하도록 하였다. 문장분석 처리과정은 총 14단계로 나눌 수 있었다. ISAAC에서는 이 단계들을 독립적인 기능을 가지는 4개의 모듈 - $\cicled1$문장의 통사구조 분석, $\cicled2$원형어휘 판별, $\cicled3$Roget 시소러스 범주정보 검색, $\cicled4$OfN(Ontology for Narratives) 범주정보 검색 - 로 처리하게 되어 있다. 따라서, ISAAC을 활용한 문장분석의 경우, 전체 14단계의 처리과정이 4개의 단계로 줄어든다. 이것은 문장분석가의 작업효율을 3.5배 이상 향상시킨 수 있음을 의미한다. 뿐만 아니라, 각 단계별 처리에 필요한 지루한 정보기록 이전작업을 ISAAC이 담당하게 함으로써 문장분석정보의 정확성도 높일 것으로 예상할 수 있다.

문법성과 어휘 응집성 기반의 영어 작문 평가 시스템 (An English Essay Scoring System Based on Grammaticality and Lexical Cohesion)

  • 김동성;김상철;채희락
    • 인지과학
    • /
    • 제19권3호
    • /
    • pp.223-255
    • /
    • 2008
  • 본 논문에서 우리는 문장의 문법성과 텍스트의 어휘 응집성 측정을 위주로 하는 영어 작문 자동평가시스템을 소개하려고 한다. 문법 검사를 위해서는 링크 파서를 사용하고 어휘 연쇄를 측정하기 위해서는 로제 시소러스를 사용한다. 자동 평가 시스템의 채점 신뢰도를 측정하기 위해서 자동 채점과 수동 채점의 결과를 통계적으로 비교한다. 카파 통계와 다국면 Rasch 모형에 따른 분석 결과 자동 채점은 수동 채점과 유사성이 크며 수동 채점과 비교해서 신뢰성에 특별한 문제가 없다는 결론을 내리게 된다. 본 연구의 가장 큰 의의는 다양한 종류의 기술과 도구를 바탕으로 신뢰할 만한 수준의 영작문 자동 평가 시스템을 개발했다는 것이다. 평가 대상이 문장 단위를 넘어 선 텍스트 단위이며, 단어나 문법 등의 형식적 측면만 검사하는 것이 아니라 내용적 측면도 평가한다.

  • PDF