• 제목/요약/키워드: 기본어휘

검색결과 136건 처리시간 0.021초

확률적 언어 모델을 위한 자료 기반 어휘 구축 (A data-driven approach for lexicon selection for probabilistic language model)

  • 류성호;김진형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2002
  • 한국어를 대상으로 하는 확률적 언어 모델에서는 대부분의 경우 형태소를 기본 어휘로서 사용하고 있다. 그러나, 이러한 모델들은 학습 및 검증을 위하여 사람에 의하여 형태소 분석이 이루어진 말뭉치를 필요로 한다. 또한, 형태소의 자동 분석은 현재 표준말을 중심으로 이루어져 있어 그 적용 분야에도 한계가 있다. 본 논문에서는 한국어의 특징을 고려하여 확률적 언어 모델의 구축에 적합한 어휘의 선택 기준에 대하여 고찰하고, 통계적인 기준을 통하여 확률적 언어 모델의 어휘를 구축하는 방법을 제안한다.

  • PDF

JADE를 이용한 에이전트 통신에 의한 온톨로지 어휘의 생성과 보기 (Creation and View of Ontology Vocabulary by Agent Communication using JADE)

  • 백성진;이명진;이태경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.19-22
    • /
    • 2009
  • 온톨로지는 특정 영역에서 정보 공유를 필요로 하는 개발자를 위한 공통의 어휘를 정의하고, 그 영역에서의 기본 개념의 정의와 개념들 사이의 관계를 포함한다. 따라서 이런 온톨로지를 사용함으로써 소프트웨어 에이전트들 사이의 정보 구조의 이해를 공유할 수 있고 영역 지식의 재사용이 가능하다. 본 연구에서는 $Prot{\acute{e}}g{\acute{e}}$를 사용하여 유사한 에이전트 온톨로지들을 생성하고 이들을 이용하는 JADE 에이전트들을 구현한 다음에, 특정 어휘가 주어지면 다른 온톨로지들을 가진 에이전트들과 통신하여 어떤 온톨로지에 포함된 어휘를 결정하는가를 보이고, 온톨로지 저장소에 관한 연구를 서술하였다.

제품별 색채감성 평가구조모델 추출 (Extraction of the Evaluation Construct Models from each article)

  • 이진숙;신은영;임오연
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.454-459
    • /
    • 1999
  • 본 연구는 메이크업, 자동차, 패션, 건축내장, 건축외장의 색채에 대한 소비자들의 감성 평가구조를 제시하는데 그 목적이 있다. 본 연구에서는 5개 제품별 색채감성 평가구조모델을 레퍼토리 그리드 발전수법을 사용하여 추출한 다음, 제품별 평가구조를 비교ㆍ분석하였다. 이렇게 추출된 5개의 구조모델은 다음과 같은 특성을 가지고 있다. 1) 소비자들의 전반적인 제품별 평가어휘를 추출하였으며, 이러한 평가어휘와색채특성간의 상관관계를 정성적으로 분석할 수 있다. 2) 제품별 고유 평가구조 및 제품들이 공통적으로 가지고 있는 기본적인 구조 특성을 파악할 수 있다.

  • PDF

소셜미디어를 통해 본 재난안전 분야 어휘 사용 양상 분석 (A Study on the Analysis of Disaster Safety Lexicon Patterns in Social Media)

  • 김태영;이정은;오효정
    • 한국콘텐츠학회논문지
    • /
    • 제17권10호
    • /
    • pp.85-93
    • /
    • 2017
  • 재난안전 분야 어휘의 표준화는 성공적인 재난안전사고 예방 및 대응을 위해 가장 기본적인 과정으로서 중요하다. 재난안전 분야의 어휘에 대한 이해 부족은 커뮤니케이션 및 정보공유의 부재로 이어지며, 이는 재난사고 발생 시 적절한 대응을 위한 의사소통에 문제가 될 수 있다. 현재 재난안전 유관기관별로 다양한 재난안전정보가 생산 및 관리되고 있으며, 정보공유를 위해 각 기관에서는 개별적으로 용어사전을 개발하여 활용하고 있다. 따라서 이용자에 따른 재난안전 분야의 어휘 사용 양상의 차이를 실제적으로 파악하는 것은 표준화를 위해 필수적이다. 이에 본 연구는 재난안전 분야의 어휘 사용 양상을 소셜미디어를 중심으로 분석하여 그 차이를 규명하였다. 구체적으로는 재난안전 분야에서 일반 이용자가 사용하는 어휘와 기존 재난안전 유관기관에서 활용하고 있는 어휘자원의 차이점을 비교 분석하였다. 이후 분석 결과를 기반으로 재난안전 분야 표준화 방안을 제안함으로써 용어사전 구축 방향성을 수립하였다.

이중언어의 어휘접근과 범주 특수적 의미체계 (Lexical Access in the Bilinguals and the Category-specific Semantic System)

  • 이승복;정효선;조성우
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.505-534
    • /
    • 2010
  • 한국어-영어 후기 이중언어자에서 두 언어에 따른 의미체계에 대한 어휘접근 방식을 비교해보고자, 단어-그림 일치판단과제를 실시하였다. 자연물과 인공물에 속하는 두 가지 범주에 속하는 기본수준 범주의 단어 제시 후, 해당 그림을 제시하여 일치하는지 판단하도록 하였다. 단어-그림의 제시간격(SOA)을 실험 1에서는 650ms로 하였고, 실험 2에서는 200ms로 설정하여 과제수행에서의 번역효과를 통제하였다. 실험 1, 2 모두에서 한국어가 제시되었을 때가 영어로 제시되었을 때 보다 반응시간이 빨랐다. 또한 두 언어에 따라 반응시간 양상에 차이가 났는데, L1(한국어)에서는 자연물에서, L2(영어)에서는 인공물에서 하위범주 간 차이를 보였다. 이러한 차이를 공유된 의미체계에 대한 어휘접근 방식의 차이로 논의하였다.

  • PDF

어휘 및 형태 정보를 이용한 한국어 Two-level 어휘사전 자동 구축 (Automatic Construction of Korean Two-level Lexicon using Lexical and Morphological Information)

  • 김보겸;이재성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.865-872
    • /
    • 2013
  • Two-level 형태소 분석 방법은 규칙 기반 방법 중 하나로 형태소의 변화 현상을 규칙으로 처리하고, 기본 어휘 사전을 기반으로 형태소 결합관계를 분석한다. 이는 언어에 독립적인 방법으로 한국어에 대해서도 일부 구축되어 적용됨이 증명되었다. 그러나 기존 한국어에 대한 Two-level 형태소 분석기는 사전을 수동으로 구축하여 규모가 매우 작고 실제 사용에 제한적이었으며, 과분석이 많아 효율성이 매우 떨어졌다. 본 논문은 세종 품사부착 말뭉치에서 대규모의 Two-level 어휘 사전을 자동으로 구축하여 형태소 분석기의 적용 범위를 넓히고, 형태소간의 결합관계를 어휘 정보와 어휘 형태에 따른 하위품사 정보를 이용하여 분석함으로써 형태소 분석기의 성능을 향상시킬 수 있는 방법을 제시한다. 실험 결과, 기존의 방법보다 형태소 분석기의 과분석을 68% 이상 줄여 f-measure를 25.5% point 이상 향상시킬 수 있었다.

초등 영어 어휘 습득을 위한 인지전략 기반의 Speaking Training System 설계 및 구현 (Cognitive strategies-based Speaking Training system for elementary English vocabulary)

  • 서병태;양해술
    • 디지털융복합연구
    • /
    • 제13권4호
    • /
    • pp.191-203
    • /
    • 2015
  • 언어학습에서 어휘는 가장 필수적이고 기본이 되는 단위임에도 불구하고 교육현장에서는 학생들에게 어휘를 지도하고 별도의 학습시간을 제공하는 경우는 매우 드물다. 어휘를 습득한다는 것은 소리 내어 말하고 듣는 과정을 통해 이루어진다. 눈으로 내용을 이해하고 암기하는 전통적인 언어 습득 방식은 분명 한계가 있을 수밖에 없다. 본 논문에서는 학습자 특성을 고려한 인지전략과 음성인식을 기반으로 한 Speaking 중심의 학습 방법을 연구하여 초등 영어 어휘 습득을 위한 인지전략 기반의 Speaking Training system을 설계하고 구현하였으며, 초등학교 5학년 두 개 학급을 선정하여 수준 테스트 후 실험 그룹과 비교 그룹으로 각각 편성하여 분석한 결과 학습자의 동기부여와 성취감을 높임으로써 학습자의 소리 영어 중심의 어휘 습득을 강화할 수 있었고, 학력향상 뿐만 아니라 학습참여도, 과제수행 정도, 흥미도 등의 자기주도적 능력까지도 향상시킬 수 있다는 놀라울만한 성과가 있었다. 본 연구를 통해 학생들의 실용적인 영어 말하기 능력을 향상시킬 것으로 기대한다.

사진 이미지와 관련된 감성 어휘 분석 및 색 유무에 따른 감성 반응 비교 (Analysis of affective words on photographic images and the effects of color on the images)

  • 박수진;정우현;한재현;신수진
    • 감성과학
    • /
    • 제7권1호
    • /
    • pp.41-49
    • /
    • 2004
  • 본 연구에서는 사진 이미지에 대해 어떠한 감성들이 나타날 수 있는지를 확인하여 이를 구조화할 수 있는 기본 감성 모형을 개발하였다. 그런 다음, 이 모형을 바탕으로 주요한 시각 속성 중 하나인 색의 유무가 감성에 어떠한 영향을 줄 수 있는지에 대해 알아보았다. 연구 1에서는 다양한 기법과 소재가 반영된 사진가들의 사진을 제시하고 각 사진에 대해 감성 반응을 받은 다음 이를 분석하였다. 얻어진 자료를 주축 기법을 이용하여 요인분석한 결과 감성 어휘 변량 중 약 42%를 세 요인만으로 설명할 수 있었다. 세 요인은 각각 긍정적-부정적 인상, 동적-정적 인상, 가벼운-무거운 인상으로 명명되었다. 연구 2에서는 세 요인을 감성 공간의 기본 차원 축으로 삼아 색의 유무가 사진 감성에 미치는 영향을 살펴보았다. 대표적인 컬러 사진 90장을 흑백으로 전환하여 컬러와 흑백 각각 90장의 사진 이미지를 자극으로 사용하였으며, 각각의 사진 이미지들이 세 감성 차원들에 대해 평정되었다. 감성 차원별로 색의 유무에 대해 t검증을 실시한 결과, 모든 감성 차원에서 색의 유무에 따라 통계적으로 유의한 차이가 나타났다. 흑백으로 전환된 이미지가 더 부정적이고 정적이며 무거운 이미지로 느껴지는 것으로 나타났다. 이러한 결과는 사진 이미지에서 동일한 소재와 동일한 구도라 할지라도 기본적인 시지각 속성의 변화만으로 감성반응에 중요한 차이를 유발할 수 있음을 시사한다.

  • PDF

한국어 어휘의 중의성 해결과 관련된 대뇌활동: MEG 연구 (The cerebral activation related to Korean word ambiguity: MEG study)

  • 유기순;김충명;김준식;정천기;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2006년도 춘계학술대회
    • /
    • pp.61-65
    • /
    • 2006
  • 본 연구는 한국어 어휘중의성 해결과정에 관련된 대뇌활동을 살펴보기 위하여 MEG(magnetoencephalography)를 이용한 실험을 실시하였다. 일차적으로 기존의 중의성 관련 fMRI 실험 결과들이 MEG를 이용한 신호원 국소화 결과와 유사한 패턴을 보이는지 확인하였고, 본 실험의 주요 목적인 중의성 관련 처리과정에 기저하는 하위 처리과정이 어떠한 기능적 처리 요소들로 분해될 수 있는 지에 대해서도 시간 해상도가 높은 MEG의 특성을 이용하여 관찰하였다. 분석 결과, 한국어 중의어 해소과정의 하위처리 과정은 어휘의미 접속이라는 기본적인 과정 비에, 이들의 의미분지를 유발하는 단서의 유무가 그 활성화 영역의 시간적인 패턴과 중의성 해결을 위한 지속시간에 영향을 미치는 것으로 확인되었다.

  • PDF

연세대 형태소 분석기 morany: 말뭉치로부터 추출한 대량의 어휘 데이터베이스에 기반한 형태소 분석 (Morphological Analyzer of Yonsei Univ., morany: Morphological Analysis based on Large Lexical Database Extracted from Corpus)

  • 윤준태;이충희;김선호;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.92-98
    • /
    • 1999
  • 본 논문에서는 연세대학교 컴퓨터과학과에서 연구되어 온 형태소 분석 시스템에 대해 설명한다. 연세대학교 자연 언어 처리 시스템의 기본적인 바탕은 무엇보다도 대량의 말뭉치를 기반으로 하고 있다는 점이다. 예컨대, 형태소 분석 사전은 말뭉치 처리에 의해 재구성 되었으며, 3000만 어절로부터 추출되어 수작업에 의해 다듬어진 어휘 데이터베이스는 형태소 분석 결과의 상당 부분을 제한하여 일차적인 중의성 해결의 역할을 담당한다. 또한 복합어 분석 역시 말뭉치에서 얻어진 사전을 바탕으로 이루어진다. 품사 태깅은 bigram hmm에 기반하고 있으며 어휘 규칙 등에 의한 후처리가 보강되어 있다. 이렇게 구성된 형태소 분석기 및 품사 태거는 구문 분석기와 함께 연결되어 이용되고 있다.

  • PDF