• Title/Summary/Keyword: Roget's Thesaurus

Search Result 8, Processing Time 0.023 seconds

Category Comparison between Thousand-Character Text and Roget's Thesaurus (천자문과 로제 시소러스 범주체계 비교)

  • Kim, Sang-Rak;Yang, Jae-Gyun;Bae, Jae-Hak J.
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.85-89
    • /
    • 2008
  • 본 논문에서는 천자문과 로제 시소러스의 어휘 분류체계를 분석하였다. 전처리 작업으로서 천자문과 로제 시소러스를 데이터베이스화 하였다. 그리고 분석 작업의 용이성과 연구의 효율성을 높이기 위해서 천자문 대응 로제 시소러스 검색 시스템을 개발하였다. 연구결과 로제 시소러스 총 39개 과(Section) 가운데에서 'Creative Thought' 과를 제외하고 대부분의 과가 천자문 한자와 관련성을 가지는 것으로 나타났다. 'Space in General', 'Dimensions', 'Matter in General' 3개의 과가 가장 높은 대응률을 보였다. 상관계수값도 약 0.94로 나타나 천자문 한자와 로제 시소러스의 범주 관련성이 아주 높다는 사실을 발견하였다.

  • PDF

A Study on the Implementation of SNS Message Classification by Emotion Factors (감정요소를 이용한 SNS 메시지 분류기 구현에 대한 연구)

  • Kim, Jae-Young;Kim, Myung-Gwan
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.11 no.4
    • /
    • pp.217-222
    • /
    • 2011
  • SNS is growing by leaps and bounds, and many users of SNS are using by a medium of communication. Using SNS users are using means of their own news and the change of emotional expression. In this study using emotional elements to the program was implemented to classify the message. Extraction of emotional elements were used for emotional vocabulary in OMLS (Ocean-Monmouth Legal Services). Emotional elements were extended by The Roget of the thesaurus and WordNet.

Category Reorganization for Ontology Reuse (온톨러지 재사용을 위한 범주 재분류)

  • Yang Jae-Gun;Lee Jong-Hyeok;Bae Jae-Hak J.;Bae Jae-Hak J.
    • The KIPS Transactions:PartB
    • /
    • v.12B no.1 s.97
    • /
    • pp.69-80
    • /
    • 2005
  • This paper introduces a methodology of transforming an existing ontology into the one that satisfies its application. The transformation consists of simplification and realization of word category information. They are based on category headings and base categories. Furthermore, this paper describes a method by which we can identify relationships between category sets. Through the transformation, (1) Roget's thesaurus is reorganized into 7 categories and the base of 'Ontology for Narrative'[32], (2) 22 immersion factors of multimedia games can be subdivided into 207 factors in [35], and (3) the relationships between 10 mental factors and 22 immersion factors of multimedia games are identified in [36].

Construction of Korean WordNet (한국어 워드넷의 구축)

  • Lim, Sung-Shin;Lee, Eun-Ryoung;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF

Using WordNet for the Automatic Construction of Korean Thesaurus (WordNet을 이용한 한국어 시소러스 자동 구축)

  • Lee, Chang-Ki;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.156-163
    • /
    • 1999
  • 최근의 자연어 처리 분야의 연구들에서 광범위하고 완전한 어휘 지식 베이스의 필요성이 입증되었다. 영어권의 경우, 이에 대한 연구가 오래 전부터 있어 왔고, 그 결과로 현재 주로 사용되고 있는 개념체계에는 Roget's Thesaurus와 WordNet 등이 있다. 이러한 개념체계들은 자연어 처리의 여러 응용 분야에서 중요한 역할을 담담하고 있지만, 다른 언어의 경우 널리 사용되고 있는 개념체계가 없는 실정이다. 본 논문에서는 Princeton 대학의 WordNet을 기반으로 한영 사전과 국어 사전을 이용하여 한국어 명사의 개념체계를 자동으로 구축함으로써, 이미 구축되어진 다른 언어의 개념체계를 이용하여 새로운 언어의 개념체계를 자동으로 구축할 수 있음을 보인다. 먼저 한영 사전과 국어 사전으로부터 뽑아낸 한국어 단어 일부의 의미를 다양한 WSD(Word Sense Disambiguation) 방법을 적용시켜 WordNet의 synset에 자동으로 연결시킬 수 있음을 보인다. 그리고 각각의 자동변환으로 나온 결과들에 대해서 적용율과 정확도를 비교하도록 한다.

  • PDF

Immersion Power Decomposition of Multimedia Games with Ontology (온톨러지를 활용한 멀티미디어 게임 몰입력 분해)

  • Yang Jae-Gun;Bae Jae-Hak;Lee Jong-Hyeok
    • Korean Journal of Cognitive Science
    • /
    • v.15 no.3
    • /
    • pp.45-55
    • /
    • 2004
  • Immersion means the state of total devotion to what one is involved in. The typical form of this immersion experience happens when one is engaging in computer games. We analyze how the users became immersed in computer games. There are 22 elements of immersion involved in cognitive and emotional fun based cm the flow theory. After analyzing these elements with respect to flow dimension and game mechanics, we find that there are differences in the degree of their immersion in games. There are 7 elements that may be considered preferentially in designing computer games: unity, stimulation, gambling, virtual reality, fantasy, satisfaction accomplishment. We match these elements to Roget's categories and search for new categories with heading information and reference information. As a result 22 immersion elements are subdivided into 229 factors in the concrete. With these factors, we can design a multimedia game which has mon powerful immersion.

  • PDF

ISAAC : An Integrated System with User Interface for Sentence Analysis (ISAAC :문장분석용 통합시스템 및 사용자 인터페이스)

  • Kim, Gon;Kim, Min-Chan;Bae, Jae-Hak;Lee, Jong-Hyuk
    • The KIPS Transactions:PartB
    • /
    • v.11B no.1
    • /
    • pp.107-116
    • /
    • 2004
  • This paper introduces ISAAC (An Interface for Sentence Analysis & Abstraction with Cogitation) which provides an integrated user interface for sentence analysis. Into ISAAC, the various linguistic tools and resources are integrated. They are necessary for sentence analysis. Most of the tools and resources for sentence analysis are developed and accumulated independently. In the sentence analyzing with these tools and resources, it is difficult for sentence analyst to manage and control information which is taken on each step. In this respect, we have integrated the usable tools and resources, and made ISAAC to provide the consistent user oriented interface to each function. We have been able to divide sentence analysis process Into 14 steps. In ISAAC, these steps are processed by four individual modules $\cicled1$syntactic analysis of sentence,$\cicled2$retrieval of a root word,$\cicled3$searching category information in Roget s Thesaurus, and $\cicled4$searching category information in OfN(Ontology for Narratives). Therefore, in case of sentence analysis with ISAAC, the process of total 14 steps falls into 4 steps. This means that it is able to improve the performance of sentence analyst to the extent 3.5 times or more. Furthermore, ISAAC undertaking tedious transcription needed to process each step, we expect that ISAAC can help the analyst to maintain the accuracy of sentence analysis.

An English Essay Scoring System Based on Grammaticality and Lexical Cohesion (문법성과 어휘 응집성 기반의 영어 작문 평가 시스템)

  • Kim, Dong-Sung;Kim, Sang-Chul;Chae, Hee-Rahk
    • Korean Journal of Cognitive Science
    • /
    • v.19 no.3
    • /
    • pp.223-255
    • /
    • 2008
  • In this paper, we introduce an automatic system of scoring English essays. The system is comprised of three main components: a spelling checker, a grammar checker and a lexical cohesion checker. We have used such resources as WordNet, Link Grammar/parser and Roget's thesaurus for these components. The usefulness of an automatic scoring system depends on its reliability. To measure reliability, we compared the results of automatic scoring with those of manual scoring, on the basis of the Kappa statistics and the Multi-facet Rasch Model. The statistical data obtained from the comparison showed that the scoring system is as reliable as professional human graders. This system deals with textual units rather than sentential units and checks not only formal properties of a text but also its contents.

  • PDF