• 제목/요약/키워드: 단어개념

검색결과 299건 처리시간 0.025초

개념 기반 문서 분류를 위한 단어 애매성 해소 (Word Ambiguity Resolution for Concept-based Text Classification)

  • 강원석;황도삼
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.167-169
    • /
    • 2000
  • 문서 분류 시스템은 문서에 나타난 용어나 개념의 출현 정보를 이용한다. 개념 기반문서분류는 용어를 사용하지 않고 문서의 단어에 나타난 의미를 이용한다. 단어가 중의성을 가지는 경우 그 뜻을 정확히 가리지 않으면 문서에 출현하지 않은 의미를 이용하게 되므로 문서 분류 시스템의 성능이 저하된다. 본 논문은 개념 기반 문서분류를 위하여 단어 애매성 해소를 시도하였다. 문서에 출현된 의미 정보를 이용하여 의미들간의 공기정보를 구하고 이를 이용하여 단어의 애매성을 해소하였다. 단어의 의미정보는 시소러스 도구를 통해 획득하고 의미들간의 공기정보는 의미들간의 동시 출현 정보를 획득하여 구축하였다. 본 시스템은 문서 분류 등 자연어처리 분야에 이용할 수 있어 효용가치가 높다.

  • PDF

개념지식의 유형에 따른 표상차이: 범주와 각본의 위계성과 전형성 비교1) (Knowledge Representation Characteristics of Categories and Scripts: An Investigation on Hierarchy and Typicality Effects)

  • 이재호;이정모
    • 인지과학
    • /
    • 제11권3_4호
    • /
    • pp.73-81
    • /
    • 2000
  • 이 연구는 지식유형에 따른 표상 차이를 확인하기 위해서 범주지식과 각본지식의 위계성과 전형성에 대한 점화효과를 측정하였다. 실험 1에서는 상위개념을 점화단어로 제시하고 하위개념을 목표단어로 제시한 다움 목표단어의 어휘판단시간을 측정하였다. 그 결과, 범주지식은 전형단어가 비전형단어보다 반응시간이 빨랐지만, 각본지식은 두 조건간의 차이가 없었다. 실험 2에서는 하위개념을 점화단어로 제시하고 상위개념을 목표단어로 제시한 다음 목표단어의 어위판단시간을 측정하였다. 범주지식이 각본지식보다 반응시간이 빨랐으며, 두 지식 모두 전형성 효과는 관찰되지 않았다. 이러한 결과는 범주지식은 전형성에 따른 위계구조를 구성하지만 각본지식은 범주지식에 비해서 위계성과 전형성이 약회된 구조로 표상될 가능성을 시사하는 것이다.

  • PDF

어휘인출과 구어동반 제스처의 관계 (The Relationship between Lexical Retrieval and Coverbal Gestures)

  • 하지완;심현섭
    • 인지과학
    • /
    • 제22권2호
    • /
    • pp.123-143
    • /
    • 2011
  • 본 연구의 목적은 구어동반 제스처가 어휘인출과정의 개념화와 어휘화 가운데 어떠한 단계와 관계가 있는지를 알아보고자 하는 것이다. 제스처와 발화 분석을 위하여, 모 방송국의 TV 버라이어티 프로그램 중 제시된 목표단어의 의미를 설명하여 전화상대방이 그 단어의 이름을 맞추게 하는 게임의 동영상 자료를 이용하였다. 분석자료로 이와 같은 TV 자료를 선택한 이유는 프로그램의 게임과제가 어휘인출의 개념화 과정과 어휘화 과정을 동시에 유도할 수 있는 과제로 판단되었기 때문이다. 20회의 동영상 자료를 재생하여 목표단어와 목표단어 설명과정에서 출연자들이 산출한 발화를 전사하고, 출연자들이 사용한 제스처를 어휘 제스처(lexical gesture)와 운동 제스처(motor gesture)로 구분하여 기록하였다. 구어동반 제스처가 어휘인출과정의 개념화와 관계가 있는지 알아보기 위하여, 구체적 단어와 추상적 단어 설명 시 동반된 제스처의 사용양상이 다른지, 그리고 단어 개념의 난이도와 제스처 양 사이에 상관관계가 있는지 분석하였다. 제스처가 어휘인출과정의 어휘화와 관계가 있는지 알아보기 위하여, 출연자가 목표단어 설명 시 산출한 발화의 단어 양과 제스처 양, 그리고 저빈도어 비율과 제스처 양 사이의 상관관계를 각각 살펴보았다. 연구결과 단어 개념의 심상성(imageability)에 따라 유의하게 많이 동반되는 제스처가 다르다는 것을 알 수 있었다. 즉 구체적 단어 설명 시에는 추상적 단어 설명 시보다 어휘 제스처가 유의하게 많이 동반되었고, 추상적 단어 설명 시에는 구체적 단어 설명 시보다 운동 제스처가 유의하게 많이 동반되었다. 또한 구체적 단어의 경우 개념의 난이도와 제스처 양 사이에 유의한 상관관계가 있었다. 그러나 목표단어 설명 시 산출된 발화의 단어 양과 제스처 양, 저빈도어 비율과 제스처 양 사이에는 상관관계가 나타나지 않았다. 본 연구의 결과는 구어동반 제스처가 어휘인출과정의 개념화부를 반영한다는 것을 시사한다. 뿐만 아니라 이제까지 많은 연구들에서 간과되어 왔던 운동 제스처의 기능에 대한 새로운 접근을 시도하였다는 점에서 본 연구는 의의가 있을 것이다.

  • PDF

개념지식의 유형에 따른 표상 차이: 대상범주와 행위각본의 전형성 비교 (The Difference of Knowledge Representation: Comparison of Typicality Effects between Categories and Scripts)

  • 이재호;이정모;이건효;김성일
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.252-257
    • /
    • 2000
  • 개념지식인 범주지식과 각본지식의 표상 차이를 검증하기 위해서 두 개의 실험을 실시하였다. 실험 1 에서는 상위 개념을 점화단어로 제시하고 하위 개념을 목표단어로한 명명과제를 실시하였다. 전형조건이 비형성조건에 비해서 명명시간이 빨랐다. 범주지식에서는 전형성의 효과가 관찰되었지만 각본지식에서는 전형성 효과가 관찰되지 않았다. 실험 2에서는 하위 개념을 점화단어로 제시하고 상위 개념을 목표단어로한 명명과제를 실시하였다. 범주지식이 각본지식에 비해서 명명시간이 빨랐으며, 범주지식에서는 전형성의 효과가 관찰되었지만 각본지식에서는 그 효과가 관찰되지 않았다. 이는 개념지식의 유형에 따라서 상위-하위 개념의 표상체계가 다르게 구성됨을 시사한다.

  • PDF

WordNet 기반 개념적 이미지 주석 시스템 설계 (Design of Conceptual Image Annotation System Using WordNet)

  • 조미영;최준호;김판구
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1081-1086
    • /
    • 2002
  • 이미지검색을 위해서 객체의 시각적인 특징에 대한 저차원의 특징 정보를 추출하고 이미지에 의미를 부여하기 위하여 주석을 다는 것이 일반적이다. 하지만 주석 기반 검색에서는 주석으로 달아 놓은 단어와 정확한 매칭이 없다면 찾을 수가 없다. 이러한 문제를 해결하기 위해 재질의 질의어 확장과 같은 기법을 써서 문제를 해결해 왔으나 여전히 개념적 매칭이 아닌 스트링 매칭의 문제를 안고 있다고 볼 수 있다. 이에 본 논문에서는 이미지 관련 Text에서 단어를 추출한 후 추출된 단어들간의 개념 관계를 WordNet을 이용하여 표현한 주석 시스템을 제안한다. 이 시스템은 단순 스트링 매칭이 아닌 개념적 매칭에 의한 개념 기반 검색을 지원할 수 있다.

  • PDF

단어개념에 기반 한 한국어 복합키워드의 추출 (A Study on Word Concept-based Compound Keyword Extraction)

  • 김양선;이상곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.477-480
    • /
    • 2003
  • 문서를 읽고 그 내용을 개념상으로 정리해 보면, 그 문서를 대표할 수 있는 적은 수의 복합단어로 이루어진 키워드를 찾을 수 있다. 그러나, 문서 내에 키워드가 존재할 경우는 별 문제가 없지만, 존재하지 않을 때는 적당한 키워드 추출이 불가능해진다. 따라서, 본 논문에서는 문서 본문의 출현단어의 개념정보를 기초로 복합어 생성 규칙을 구축하고, 나아가 문서의미와 관련 있는 요소만을 정제하는 중요도 결정법을 사용하여 이에 대한 유용성을 확인하였다.

  • PDF

시소러스 작성을 위한 개념 획득 도구 (A Concept Acquisition Tool for Thesaurus Construction)

  • 김명철;이운재;최기선;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.39-49
    • /
    • 1992
  • 시소러스를 작성하기 위해 시소러스 작성자가 고려래야 하는 문제는 단어간의 개념 관계이다. 단어간의 관개는 계층구조에 정의된 개념을 기반으로 분석하여 하향식으로 시소러스를 작성하는 것이 일반적이다. 이러한 방식은 작성자에 의존적이므로 시소러스의 정확도를 보장할 수 없고 주관적인 성향을 가진다. 그래서 Corpus에서 자동으로 개념 및 개념 관계를 추출하는 상향식 방법들이 다양하게 시도되고 있다. 본 논문에서는 시소러스 작성을 위한 자동 개념 획득 도구를 설계, 구현하였다. Mutual Information이라는 방법을 이용하여 공기 정보(Collocation)를 정량화하고 이를 통하여 단어간의 개념관계의 크기를 측정한 후 개념 관계의 크기(MI 값)가 큰 값을 선택하여 개념 화일을 작성한다. 실험 결과로 얻은 개념 화일은 두 개념간의 밀접도를 나타내므로 시소러스 작성에 매우 유용하다.

  • PDF

효과적인 정보검색을 위한 개념망의 구축 (Construction of Concept Network Useful for Effective Information Retrieval)

  • 주성은;구상회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.295-297
    • /
    • 2002
  • 본 연구에서는 정보 검색의 효과를 향상시키기 위한 방안으로 개념망을 제안한다. 개념망은 주어진 문서의 집합에서 제시된 주요 개념을 추출하고, 추출된 개념들 사이의 관련성을 분석하여, 관련성이 높은 개념 사이에는 링크를 설정함으로써 개념을 노드로 하는 네트워크를 구성한 것이다. 개념 추출과 링크 설정은 문서에 출현하는 명사의 출현 빈도를 근거로 하였다. 사용자가 정보검색을 위하여 키워드를 입력하면 본 시스템은 입력된 키워드를 중심으로 구축된 개념망을 제시한다. 사용자는 제시된 개념망을 조사함으로써, 자신이 입력한 단어가 검색하고자 하는 목표개념을 적절히 반영한 단어인지 확인할 수 있고, 새로운 검색어를 추가하거나 기존의 것을 수정함으로써 검색의 효과를 향상시킬 수 있다.

  • PDF

개념그래프 기반 문서인식 후처리기법 (A Conceptual Graph based Postprocessing Technique for Text Recognition)

  • 양기철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.211-214
    • /
    • 1994
  • 지금까지의 후처리기법은 문장의 의미 정보를 사용하지 않고 대부분 단어만을 생각하기 때문에 잘못 쓰여지거나 인식된 단어라도 사전에 있으면 그대로 받아들이게 된다. 따라서 본 논문에서는 단어로서 구성이 되지 않는 문자열 뿐만 아니라 의미적으로 잘못 사용된 단어까지도 교정해 줄 수 있는 후처리기법을 제시한다. 제시되는 후처리기법은 문장의 의미론 개념그래프로 표현하여 문장에 쓰여진 각 단어가 문장 내에서 의미적으로 유용한지를 밝혀 낼 수 있도록 한다.

  • PDF

인지어휘 유형개념 (Cognitive Dictionaries Inferred from Word Associations)

  • 지혜련
    • 아동학회지
    • /
    • 제5권
    • /
    • pp.47-52
    • /
    • 1984
  • 인지 어휘 유형(cognitive dictionary)이란 단어 연상의 반응 어휘를 인지 유형에 따라 분류, 분석하는 것을 가리킨다. 인지 어휘 유형 개념을 McNeill의 언어 발달 연구에 준하여 논의하였다. 즉 아동의 어의(語義) 발달은 자작문(自作文) 형식(形式) 표현에서 시작되어 어휘 사용에 이른다는 것이다. 한편 Moran은 범세계적으로 유아들의 인지 어휘 유형은 단어의 동작적(動作的) 특성에 주로 의거한다는 것을 발견했는데 이는 언어의 효시에 관한 Piaget 나 Bruner의 이론과 일치하는 것이다. Moran의 인지 어휘 유형의 추가 개념은 Bruner의 심상(心象)(ikonic representation)에 의한 관계, 기능적 관계 (functional representation), 논리적(logical)관계를 포함한 단어의 연합 관계에 반영시켰다.

  • PDF