• 제목/요약/키워드: 어휘추출

검색결과 438건 처리시간 0.028초

개념 공간을 이용한 의미 인덱싱 (Semantic Indexing Using Concept Space)

  • 강보영;김혜정;황선옥;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.380-382
    • /
    • 2003
  • 본 논문은 문서내의 의미적인 관계에 기반하여, 문서의 내용을 보다 잘 추측할 수 있는 의미 인덱스 추출 및 가중치 부여 시스템을 제안하고자 한다. 문서 내의 개념 추출에 있어서는 기존의 어휘 체인(lexical chains)에 관한 연구를 확장하여 적용였다. 또한, 추출된 개념에서 중요 어휘에 가중치를 부여하기 위해서, 개념 벡터 공간을 이용한 정보성(information quantity)과 정보비(information ratio)를 정의하고, 인덱스의 가중치를 측정할 수 있는 정량화 할 수 있는 척도로 제시하였다.

  • PDF

사용자 감성 측정을 위한 자기-보고 질문지형 척도 개발 (Development a self-report questionnaire-type scale for measuring user's emotions)

  • 정상훈
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2007년도 춘계학술대회 및 국제감성 심포지엄
    • /
    • pp.114-117
    • /
    • 2007
  • 사용자의 감성을 측정하기 위한 심리적 측정방법 중에서 사용자가 느끼는 감성을 형용사와 같은 어휘를 통해 간접적으로 측정하는 방법, 즉 감성어휘를 추출하여 사용자의 감성을 측정하는 방법이 가장 보편화되어 있는 방법이다. 본 연구의 선행연구에서는 사용자가 제품을 사용하는 도중에 유발되는 인간의 감성 변화를 나타낼 수 있는 감성어휘들과 대표감성들을 추출하여 제품을 사용하는 도중에 표출되는 사용자의 감성을 측정하기에 적합한 주관적 평가스케일을 도출하였다. 사용자의 감성을 측정하기 위한 심리적 측정방법에는 감성어휘를 이용한 체크리스트 외에도 자기-보고 질문지형 스케일도 널리 사용되고 있다. 따라서 본 연구에서는 선행연구를 통해 도출한 주관적 평가스케일을 보다 더 효과적으로 활용하기 위하여 자기-보고 질문지형 스케일을 제안하였다. 향후 제안한 평가스케일에 대한 신뢰도(reliability) 및 타당도(validity) 검증을 통해 수정 보완함으로써 제품을 사용하면서 자연스럽게 표출되는 사용자의 감성을 효과적으로 측정하기 위한 척도로 활용할 수 있을 것이다.

  • PDF

움직임에서의 감성 효과 (The Effect of Sensibility on Motion)

  • 임은영;한광희
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.236-240
    • /
    • 2002
  • 기존의 감성 연구들은 주회 배색이나 형태등과 관련된 정적인 장면 위주로 수행되었다. 기술의 발달로 역동적인 디스플레이가 가능해지면서 동적인 장면을 대상으로 한 감성연구의 필요성이 요구된다. 본 연구에서는 움직임과 관련된 감성어휘를 추출하여 감성 차원을 밝히고 움직임과 관련된 속성을 살펴보았다. 다양한 방법을 통해 수집된 감성어휘를 적절성 평가를 통해 70개로 정리한 뒤 요인분석을 통해 각 요인을 대표하는 19개의 기본 감성 어휘를 추출하였다. 움직임 패턴을 제시하면서 19개의 감성어휘를 기초로 움직임에서 의 감성을 평정하도록 하였다. 다차원 척도법을 이용하여 분석한 결과 움직임에 대한 감성 차원은 '적극적이다-소극적이다'의 차원과 ‘밝다-어둡다’의 두 차원으로 대부분 설명 될 수 있음을 확인하였다. 움직이는 속도와 진행 경로를 변화시키면서 두 가지 감성 차원에 따라 움직임에서의 감성을 평가하도록 하였다. 움직이는 속도와 곡선 경로의 진폭이 움직임에서의 감성 차원을 결정하는 중요한 요소로 작용하는 경향을 보였다.

  • PDF

어휘 의미 패턴(Lexico-Semantic Pattern)과 온톨로지를 이용한 정보검색기의 설계 및 구현 (The Design and Implementation of an Information Retrieval System Using Lexico-Semantic Pattern and Ontology)

  • 김병우;고영중
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.957-962
    • /
    • 2007
  • 본 논문에서 제안하는 정보 검색기는 일반적인 불리언(Boolean) 질의를 통해서 정보를 검색하는 것이 아니라, 문장으로 입력된 질의형태의 패턴을 분석하여 그에 맞는 정보를 직접 제공하는 것에 목적을 둔다. 이를 위해 어휘 의미 패턴(Lexical Semantic Pattern)과 온톨로지(Ontology) 기술이 정보검색기 개발에 적용되었다. 제안된 시스템에서는 다양한 형태로 표현된 문장 질의를 어휘 의미 패턴을 사용해서 문장의 질의 패턴을 추출하고 사용자 질의를 하나의 온톨로지(Ontology) 추론 질의와 매칭함으로써 질의에 대한 정확한 해답을 추출할 수 있다. 또한, 자연어 문장 입력에 대한 검색 질의 생성기를 구축하고 온톨로지로 표현된 지식을 사용하여 정보검색기 질의를 자동으로 확장함으로써 더욱 정확한 정보 검색 결과를 만들어 낼 수 있다.

  • PDF

어휘 인식 시스템의 인식률 향상을 위한 어휘 유사율 처리 지원 (Vocabulary Likelihood rate Process support for Recognition rate Improvement of Vocabulary Recognition System)

  • 김규호;오상엽
    • 디지털융복합연구
    • /
    • 제10권11호
    • /
    • pp.359-363
    • /
    • 2012
  • 어휘 인식 모델에서는 정확하지 않은 어휘로 부터 특징을 추출하기 때문에 어휘가 실제 어휘와 유사한 어휘로 인식되거나 인식이 되지 않는 현상이 나타난다. 이를 위해 본 논문에서는 효율적인 형상 형성을 지원하는 시스템을 모델링하고 구현하였으며, 형상 형성 정보를 효율적으로 처리하고 어휘 유사율 관리를 최적화하기 위해 데이터베이스 검색에서 facet 방법을 응용하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 95.31%, 어휘 독립 인식률은 97.38%의 인식률을 나타내었다.

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

자연어 질의유형 판별과 응답 추출을 위한 어휘 의미 체계에 관한 연구 (A Study on Work Semantic Categories for Natural Language Question Type Classification and Answer Extraction)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권6호
    • /
    • pp.539-545
    • /
    • 2004
  • 자연어 질의를 입력하고 문서로부터 질의에 대한 정답을 추출하여 제공하는 질의응답 시스템에서는 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 과정이 매우 중요하다. 본 논문에서는 질의 유형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의의 의도를 나타내는 어휘들을 추출하고 인접 명사들의 의미 정보를 이용하여 질의 및 정답 유형을 결정할 수 있는 방법을 제안한다. 또 동의어 정보와 접미사 정보를 이용하고, 의문사가 생략된 경우 어휘 의미 정보를 이용하여 질의 유형 분류기의 성능을 향상시킬 수 있음을 보인다.

  • PDF

자동차 인테리어의 촉감 평가를 위한 대표감성 추출 (Extraction of Representative Emotions for Evaluations of Tactile Impressions in a Car Interior)

  • 박남춘;정성원
    • 감성과학
    • /
    • 제16권2호
    • /
    • pp.157-166
    • /
    • 2013
  • 자동차 인테리어에 사용된 여러 가지 재질에 대하여 현재까지 촉감을 측정하고 평가하여 소재의 적용과 표면질감의 기준을 결정하고자 했던 연구는 자동차의 조작 장치에 대한 인간공학적 평가, 시각적 디자인요소에 대한 연구에 비해서는 많지 않다. 본 연구에서는 자동차 인테리어의 여러 소재에 대한 촉감 관련 감성을 측정하고 평가하는데 사용될 수 있는 촉감 관련 대표감성을 추출하고자 하였다. 기존의 감성어휘 연구에서 추출되어 있는 대표감성어휘를 이용하여, 자동차에 탑승하여 여러 재질을 보고 만지면서 촉각으로 느껴지는 촉감에 대해 느껴지는 감성어휘와 자동차 사용기의 분석 및 자동차 전문가에 대한 인터뷰 등을 종합하여 최종적으로 52개의 촉감 관련 감성어휘를 추출하였다. 이를 요인분석한 결과 거칠기, 단단함, 마찰감, 안락감, 뻣뻣함, 부드러움, 온도감, 매끈함, 친숙함, 유연함 등 10개의 대표감성으로 분류되었다. 이러한 대표감성 어휘는 자동차 인테리어의 촉감에 대한 소비자의 감성을 측정하고 평가하는데 활용될 수 있을 것이며 금속, 플라스틱, 가죽 등 다양한 소재들의 고급감을 향상시킬 수 있는 질감을 결정할 수 있는 감성평가의 기본 자료로 활용될 수 있을 것이다.

  • PDF

U-WIN을 이용한 WSD 기반의 문서 유사도 측정 (Measurement of WSD based Document Similarity using U-WIN)

  • 심강섭;배영준;옥철영;최호섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.90-95
    • /
    • 2008
  • 이미 국외에서는 WordNet과 같은 의미적 언어자원을 활용한 문서 유사도 측정에 관한 많은 연구가 진행되고 있다. 그러나 국내에서는 아직 WordNet과 같은 언어자원이 부족하여, 이를 바탕으로 한 문서 유사도 측정 방법이나 그 결과를 활용하는 방법에 관한 연구가 미흡하다. 기존에 국내에서 사용된 문서 유사도 측정법들은 대부분 문서 내에 출현하는 어휘들의 의미에 기반하기 보다는, 그 어휘들의 단순 매칭이나 빈도수를 이용한 가중치 측정법, 또는 가중치를 이용한 중요 어휘 추출방법들 이었다. 이 때문에, 기존의 유사도 측정법들은 문서의 문맥정보를 포함하지 못하고, 어휘의 빈도를 구하기 위하여 대용량의 문서집합에 의존적이며, 또한 특정 개념(의미)을 다른 어휘로 표현하거나, 유사/관련 어휘가 사용된 유사 문서에 대한 처리가 미흡하였다. 본 논문에서는 이에 착안하여 한국어 어휘 의미망인 U-WIN과 문맥에 사용된 어휘들의 overlap 정보를 사용하여, 단순히 어휘에 기반하지 않고, 기본적인 문맥정보를 활용하며, 어휘의 의미에 기반을 둔 문서유사도 측정법을 제안한다.

  • PDF

한국어 어휘의미망을 이용한 비감독 어의 중의성 해소 방법의 성능 향상 (An Enhanced Method for Unsupervised Word Sense Disambiguation using Korean WordNet)

  • 권순호;김민호;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.693-696
    • /
    • 2010
  • 자연언어처리에서 어의 중의성 해소(word sense disambiguation)는 어휘의 의미를 정확하게 파악하는 기술로 기계번역, 정보검색과 같은 여러 응용 분야에서 중요한 역할을 한다. 본 논문에서는 한국어 어휘의미망(Korlex)을 이용한 비감독 어의 중의성 해소 방법을 제안한다. 의미미부착 말뭉치에서 추출한 통계 정보와 한국어 어휘의미망의 관계어 정보를 이용함으로써 자료 부족문제를 완화하였다. 또한, 중의성 어휘와 공기어휘 간의 거리 가중치, 의미별 사용 정보 가중치를 사용하여 언어적인 특징을 고려하여 본 논문의 기반이 되는 PNUWSD 시스템보다 성능을 향상하였다. 본 논문에서 제안하는 어의 중의성 해소 방법의 평가를 위해 SENSEVAL-2 한국어 데이터를 이용하였다. 중의성 어휘의 의미별 관계어와 지역 문맥 내 공기어휘 간의 카이제곱을 이용하였을 때 68.1%의 정확도를 보였고, 중의성 어휘와 공기어휘 간의 거리 가중치와 의미별 사용 정보 가중치를 사용하였을 때 76.9% 정확도를 보여 기존의 방법보다 정확도를 향상하였다.