• Title/Summary/Keyword: 분야 연상어

Search Result 21, Processing Time 0.027 seconds

Thesaurus Construction Using Word Association (단어의 의미연상을 이용한 시소러스 설계)

  • Han Seung-Hee
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2006.08a
    • /
    • pp.233-238
    • /
    • 2006
  • 본 연구에서는 단어의 의미연상을 이용하여 시소러스를 작성해봄으로써 탐색 시소러스 구축에 있어 단어연상검사법의 적용가능성을 살펴보았다. 문헌정보학 분야를 대상으로 단어연상검사를 실시한 후 자극어와 반응어간의 의미관계를 파악하고 반응어와 통제어휘를 비교 분석하였다. 실험 및 분석결과, 단어연상검사를 이용하면 다양한 연관관계 용어들을 시소러스에 포함시킬 수 있으며, 통제어휘집에 나타난 하위관계와 동등관계 용어들을 어느 정도 반영할 수 있다는 것을 확인하였다. 단어의 의미연상을 이용하여 구축된 탐색 시소러스는 정보검색환경에서 질의확장에 응용될 수 있다.

  • PDF

Passage Retrieval Using Field Reminding Words (분야 연상어를 이용한 패시지검색 방법)

  • Jang, Ki-Cheol;Jung, Kyu-Cheol;Lee, Yoon-Jung;Park, Ki-Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1175-1178
    • /
    • 2002
  • 인터넷의 보급에 의해, 전자화된 문서가 대량으로 유통되게 되었다. 이에 따라, 대량의 전자화 문서로부터 검색 요구에 해당하는 문서를 검색한 기술이 요구되고 있다. 문서 검색 시 복수의 화제나 분야가 혼재한 문서로는, 검색 요구에 해당하는 내용이 문서의 일부분에 존재하는 경우가 대부분이다. 이처럼 문서전체를 검색 대상으로 하는 것이 아니라 검색 요구에 일치한 일부만을 검색한 패시지 기술이 주목되고 있다. 본 논문에서는 패시지가 있는 분야의 화제에 관하여 쓰여진 정리로서 파악하고 부야 연상어를 이용하고, 패시지를 결정한 방법을 제안하였다. 결정된 패시지와 미리 사람에 의하고 결정한 패시지가 어느 정도 일치하고 있는지를 비교하여 제안 방법의 유효성을 평가한 결과 적합율이 약 80%, 평균 재현율이 약 67%되어, 유효성을 확인할 수 있었다.

  • PDF

Passage Retrieval and Calculation Method of Topic Field by Using Field-Associated Terms (분야연상어를 이용한 화제분야의 계산방법과 단락검색)

  • Lee Samuel-Sangkon
    • The KIPS Transactions:PartB
    • /
    • v.12B no.1 s.97
    • /
    • pp.57-68
    • /
    • 2005
  • It is important to segment a text, which is independent upon any text-embedded auxiliary information. This paper presents a technique for dividing the text into field-coherent passages. The presented method is based upon extracting field-associated terms from the text measuring how the topics grow, shrink and shift from sentence to sentence. We propose measures of topic continuity and of topic transition and suggest how those could be used to find the boundaries among passages. After collecting 12,500 documents, we obtain $88{\%}$ for average precision and $78{\%}$ for recall in Korean training set.

Design and Implementation of Field Classification and Information Retrieval Engine;JULSE (검색과 분류가 동시에 가능한 JULSE 시스템의 설계 및 구현)

  • Jang, Jeong-Hyo;Son, Ju-Sung;Kim, Do-Yun;Lee, Sang-Kon;Lee, Won-Hee;Ahn, Dong-Un
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.673-676
    • /
    • 2005
  • 기존의 정보검색 엔진은 문서의 분야에 상관없이 본문 전체의 내용을 보여주므로 사용자가 적합한 내용인지를 파악하기 위해서는 본문 전체를 읽어 보아야 그 적절성 여부를 알 수 있다. 본 논문에서 제안하는 방법은 질의어가 지시하는 분야를 분야연상어를 이용하여 자동으로 파악하고, 사용자가 원하는 분야에서의 검색이 이루어지도록 하는 검색과 분류가 동시에 가능한 엔진을 설계하여 검색결과의 성능을 향상하고자 한다. 이와 함께 적당한 분야연상어가 다수 출현한 단락을 사용자에게 제공하여 본문 전체를 보지 않아도 질의어에 적당한 문서인지를 빠르게 파악하도록 설계하여 구현하였다.

  • PDF

Searching Thesaurus Construction with Word Association Test: A Pilot Study (단어연상검사법을 이용한 탐색 시소러스 구축에 관한 실험적 연구)

  • Han Seung-Hee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.40 no.3
    • /
    • pp.289-304
    • /
    • 2006
  • The purpose of this pilot study is to construct a searching thesaurus with word association test in the library and information science field and to confirm it's functionality as searching aids through query expansion experiments. The test results were analyzed to four types of relationship between stimulus words and response words, and the terms of association thesaurus were compared with descriptors of an existing thesaurus. The test results show that the word association test is a fruitful method to identify many related terms and narrower and equivalent terms in some degree to the stimulus terms. Furthermore. in the query expansion experiment. the Performance of association thesaurus was better than that of an existing thesaurus, This result demonstrates that word association thesaurus can apply to query expansion.

Test Environment Factors Influencing Word Association about Science Terminology in Students (과학용어에 대한 학생들의 단어 연상에 영향을 미치는 검사 환경 요인)

  • Yun, Eunjeong;Park, Yunebae
    • Journal of The Korean Association For Science Education
    • /
    • v.35 no.6
    • /
    • pp.1031-1038
    • /
    • 2015
  • The list of words and the semantic structure that connects them have been important to the areas of psychology, psychoanalysis, linguistics, and education. Some researchers in constructivist perspectives of science education also have interests in the structure of science concepts expressed by science terminologies. The purpose of this paper was to investigate the test environment factors influencing the word association test as a method to identify students' semantic structures for science terminologies. We set up four variables that are possibly considered in recognizing a word as having scientific meaning. The four variables include: noticing whether stimulus words are science terminologies or not, presenting science terminologies and everyday words alternately, whether presider is science teacher or not, and whether students have learned the concepts or not. In comparing the test results of the experimental group and the control group, we have checked whether each variable influences the test result or not. Stimulus words included nine science terminologies containing both ordinary and scientific meanings, and subjects included 282 middle school students. The degree of recognizing science terminology as having scientific meaning was found to increase only when stimulus words were noticed as science terminologies. In the case of the remaining variables, there was no difference between the control group and the experimental group.

Implementation of Document Classification Engine by Using Associative Knowledge (연상 지식을 이용한 문서 분류 엔진의 구현)

  • Jang Jung-Hyo;Son Ju-Sung;Lee Sang-Kon;Ahn Dong-Un
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.625-628
    • /
    • 2006
  • 인간은 문서 내용의 적절성을 파악하기 위해서는 문서 전체를 읽어 보아야 그 적절성 여부를 알 수 있다. 그러나 문서의 양이 많은 경우나 문서 내에 여러 화제가 산재되어 있으면 문서의 분야를 파악하기 위해 많은 시간과 노력이 필요하게 된다. 따라서 본 논문에서 제안하는 방법은 이러한 비용을 절감하기 위해 카테고리의 트리 정보와 문서의 내용에서 추출한 분야연상어를 지식사전으로 구축하고 이를 이용하는 분류기를 설계하여 수집과 분류에 소요되는 비용을 절감하는 자동 분류기를 구현하였다.

  • PDF

Design of Passage Calculation Method based on Topic Recognition (화제인식에 의한 단락별 계산방법의 설계)

  • Kim Hye-Kyung;Lee Sangkon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.499-501
    • /
    • 2005
  • 화제가 혼합되어 있는 문서에서 각 화제의 단락을 추출하면 사용자의 질의어에 일치하는 정보만을 추출할 수 있다. 정확하고 빠르게 사용자의 검색요구에 일치하는 관련 정보를 추출할 수 있다. 본 논문에서는 문서에서 사용자의 요구에 적합한 단락을 추출하는 기술을 설명한다. 문서에서 분야연상어를 추출하고, 각 문장마다 화제분야의 출현${\cdot}$계속${\cdot}$전환이 어떻게 변화하여 가는지를 추적하여 계산한다. 긴 문서에서 어떤 화제가 출현하는가를 파악하고, 화제가 계속되거나 혹은 전환되는 지점을 인식하여, 분야별 단락을 추출하는 방법을 제안한다.

  • PDF

Category-based dimensional model of affective words (우리말 감성 어휘의 범주-차원 모형 - 직물 디자인의 시각적 요소와 관련하여 -)

  • 박수진;정찬섭
    • Science of Emotion and Sensibility
    • /
    • v.2 no.1
    • /
    • pp.77-94
    • /
    • 1999
  • 직물 및 직물 관련 제품에서 주로 사용되는 감성 어휘들의 관계 및 구조를 분석하기 위해 잡지 및 설문 조사 과정을 통해 어휘를 수집하였다. 수집된 어휘의 빈도를 조사하고, 어휘 적절성을 평가하여 감성어라고 생각될 수 있는 어휘들만을 정리하였다. 여기서 추출된 372개의 어휘는 직물 및 직물 관련 상황에서의 감성어로 사용될 수 있을 분만 아니라 유사 분야의 감성어 모형에 대한 기본 자료로 활용될 수 있을 것이다. 어휘들 간 관계구조에 대한 분석은 몇 가지 면에서 이뤄졌다. 자유연상 과제를 실시하여 어휘들 간 관계의 연결망(network)을 확인할 수 있었다. 어휘들이 내포하고 있는 의미의 여러 측면에서 어휘들 간 관계를 파악할 수 있도록 어휘들에 대해 다차원 분석을 실시한 결과 어휘 간 관계는 3차원이면 충분히 설명될 수 있는 것으로 나타났다. 두 개의 주차원을 중심으로 어휘들의 공간 분포를 그리고 이들 어휘를 범주로 분류한 결과 대략 11개의 범주로 어휘들을 나눠볼 수 있었다.

  • PDF

A Study on Image Generation from Sentence Embedding Applying Self-Attention (Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구)

  • Yu, Kyungho;No, Juhyeon;Hong, Taekeun;Kim, Hyeong-Ju;Kim, Pankoo
    • Smart Media Journal
    • /
    • v.10 no.1
    • /
    • pp.63-69
    • /
    • 2021
  • When a person sees a sentence and understands the sentence, the person understands the sentence by reminiscent of the main word in the sentence as an image. Text-to-image is what allows computers to do this associative process. The previous deep learning-based text-to-image model extracts text features using Convolutional Neural Network (CNN)-Long Short Term Memory (LSTM) and bi-directional LSTM, and generates an image by inputting it to the GAN. The previous text-to-image model uses basic embedding in text feature extraction, and it takes a long time to train because images are generated using several modules. Therefore, in this research, we propose a method of extracting features by using the attention mechanism, which has improved performance in the natural language processing field, for sentence embedding, and generating an image by inputting the extracted features into the GAN. As a result of the experiment, the inception score was higher than that of the model used in the previous study, and when judged with the naked eye, an image that expresses the features well in the input sentence was created. In addition, even when a long sentence is input, an image that expresses the sentence well was created.