• 제목/요약/키워드: 어휘적 특성

검색결과 229건 처리시간 0.033초

단어클러스터링 시스템을 이용한 어휘의미망의 활용평가 방안 (The Method of the Evaluation of Verbal Lexical-Semantic Network Using the Automatic Word Clustering System)

  • 김혜경;송미영
    • 한국한의학연구원논문집
    • /
    • 제12권3호통권18호
    • /
    • pp.1-15
    • /
    • 2006
  • 최근 수년간 한국어를 위한 어휘의미망에 대한 관심은 꾸준히 높아지고 있지만, 그 결과물을 어떻게 평가하고 활용할 것인가에 대한 방안은 이루어지지 않고 있다. 본 논문에서는 단어클러스터링 시스템 개발을 통하여, 어휘의미망에 의해 확장되기 전후의 클러스터링을 수행하여 데이터를 서로 비교하였다. 단어클러스터링 시스템 개발을 위해 사용된 학습 데이터는 신문 말뭉치 기사로 총 68,455,856 어절 규모이며, 특성벡터와 벡터공간모델을 이용하여 시스템A를 완성하였다. 시스템B는 구축된 '[-하]동사류' 3,656개의 어휘의미를 포함하는 동사 어휘의미망을 활용하여 확장된 것으로 확장대상정보를 선택하여 특성벡터를 재구성한다. 대상이 되는 실험 데이터는 '다국어 어휘의미망-코어넷'으로 클러스터링 결과 나타난 어휘의 세 번째 층위까지의 노드 동일성 여부로 정확률을 검수하였다. 같은 환경에서 시스템A와 시스템B를 비교한 결과 단어클러스터링의 정확률이 45.3%에서 46.6%로의 향상을 보였다. 향후 연구는 어휘의미망을 활용하여 좀 더 다양한 시스템에 체계적이고 폭넓은 평가를 통해 전산시스템의 향상은 물론, 연구되고 있는 많은 어휘의미망에 의미 있는 평가 방안을 확대시켜 나가야 할 것이다.

  • PDF

교육용 모바일 증강현실 게임을 위한 지능형 어휘 추천 에이전트 (Intelligent Vocabulary Recommendation Agent for Educational Mobile Augmented Reality Games)

  • 김진일
    • 융합정보논문지
    • /
    • 제9권2호
    • /
    • pp.108-114
    • /
    • 2019
  • 본 논문에서는 모바일 교육 증강현실 게임 환경에서 게임 학습 참여자의 학습 필요와 요구에 부응하는 어휘를 자동으로 제공해주는 지능형 어휘 추천 에이전트를 제안한다. 제안된 에이전트는 모바일 기술의 특성과 증강 현실 기술의 특성을 최대한 반영하여 설계하도록 하고 상황 어휘 추론 모듈, 싱글 게임 어휘 추천 모듈, 배틀 게임 어휘 추천 모듈, 학습 어휘 목록 모듈, 유의어 모듈로 구성한다. 연구 결과, 게임 학습 참여자들은 대체적으로 만족함을 알 수 있다. 상황 어휘 추론과 유의어의 정확도는 각각 4.01점, 4.11점으로 게임 학습 참여자가 처한 상황과 관련이 깊은 어휘가 추출되는 것을 보여준다. 하지만 만족도의 경우에는 배틀 게임 어휘(3.86)는 개인별 학습자의 추천 어휘 중에서 공동으로 사용할 수 있는 어휘를 추천하기 때문에 싱글 게임 어휘(3.94)보다는 상대적으로 낮은 결과가 나타났다.

제품별 색채감성 평가구조모델 추출 (Extraction of the Evaluation Construct Models from each article)

  • 이진숙;신은영;임오연
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.454-459
    • /
    • 1999
  • 본 연구는 메이크업, 자동차, 패션, 건축내장, 건축외장의 색채에 대한 소비자들의 감성 평가구조를 제시하는데 그 목적이 있다. 본 연구에서는 5개 제품별 색채감성 평가구조모델을 레퍼토리 그리드 발전수법을 사용하여 추출한 다음, 제품별 평가구조를 비교ㆍ분석하였다. 이렇게 추출된 5개의 구조모델은 다음과 같은 특성을 가지고 있다. 1) 소비자들의 전반적인 제품별 평가어휘를 추출하였으며, 이러한 평가어휘와색채특성간의 상관관계를 정성적으로 분석할 수 있다. 2) 제품별 고유 평가구조 및 제품들이 공통적으로 가지고 있는 기본적인 구조 특성을 파악할 수 있다.

  • PDF

GMM 지원을 위해 k-means 알고리즘을 이용한 어휘 인식 성능 개선 (Vocabulary Recognition Performance Improvement using k-means Algorithm for GMM Support)

  • 이종섭
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.135-140
    • /
    • 2015
  • 일반적인 CHMM 어휘 인식 시스템은 어휘 인식에 대한 모델들의 관측 확률 인식률이 낮고, 일부 단위 음소 모델에만 적용되어 제한적으로 사용되는 문제점이 있다. 또한, 어휘 탐색에서 어휘의 의미가 다양하여 탐색된 어휘가 사용자의 요구에 부합되지 않는 문제점을 가진다. 이러한 문제를 개선하기 위해 GMM(Gaussian Mixture Model)을 이용한 음소인식을 수행하고, 개선된 k-means 알고리즘을 이용하여 어휘 특성에 따른 제한적인 탐색 문제점을 해결하였다. 성능 실험은 기존의 시스템과 비교하여 정확도와 재현율로 대변되는 효과성을 측정하였으며, 성능 실험 결과 정확도는 83%, 재현율은 67%로 나타났다.

의학 전문용어의 정의문 자동 추출 (Automatic Extraction of Medical Term Definition from Texts)

  • 김재호;배선미;신효식;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.922-924
    • /
    • 2004
  • 지식 정보의 확산에 따라 기존 전문분야 용어집에 수록되지 않은 용어의 수가 폭발적으로 증가하고 있다 이에 따라 용어집을 자동으로 구축하는 작업이 필요하게 되었다. 본 논문에서는 의학분야 코퍼스에서 주어진 전문용어에 대한 정의문을 자동으로 추출하는 방법을 제안한다. 우선, 정의문의 구문적 패턴과 용어의 어휘구성 패턴을 이용하여 용어의 상위개념을 추정한다. 상위개념별로 구축된 특성 어휘 목록을 이용하여 구문적 패턴으로 뽑힌 문장에 등장하는 어휘의 적합성 여부를 판단하여 정의문을 추출한다. 실험 결과 코퍼스에 정의 정보가 있는 48개의 용어에 대하여 71.43%의 정확률을 보인다.

  • PDF

판별분석을 통해 살펴본 영어 능력 수준을 구별하는 어휘의 정교화 특성 (Lexical Sophistication Features to Distinguish the English Proficiency Level Using a Discriminant Function Analysis)

  • 이영주
    • 문화기술의 융합
    • /
    • 제8권5호
    • /
    • pp.691-696
    • /
    • 2022
  • 본 연구는 영어 능력 수준을 구별할 수 있는 어휘적 정교화 특징이 무엇인지를 자동화된 어휘 분석 프로그램인 TAALES를 활용하여 탐색하였다. 300명의 한국 대학생이 쓴 총 600개의 에세이가 ICNALE 코퍼스에서 추출되었고 SPSS 프로그램의 판별 분석이 수행되었다. 판별 분석 결과 한국 대학생을 상. 중. 하의 세 개의 영어 능력 수준으로 유의미하게 구분하는 어휘 특성은 SUBTLEXUS 코퍼스의 내용어 빈도, 내용어의 어휘 습득 연령, 기능어의 어휘 결정 반응 평균 시간, 상위어 동사로 나타났다. 영어 능력 수준이 높은 상 수준 학생은 SUBTLEXUS 코퍼스에 빈번하게 나오는 어휘는 많이 사용하지 않았고, 어휘 습득 연령이 높고 어휘 결정 과업에서 평균 반응시간이 길게 나타난 정교화된 어휘와 구체적인 동사를 많이 사용한 특징이 있다.

준지도학습을 통한 세부감성 어휘 구축 (Fine-grained Sentiment Lexicon Construction via Semi-supervised Learning)

  • 조요한;오효정;이충희;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-38
    • /
    • 2013
  • 소셜미디어를 통한 여론분석과 브랜드 모니터링에 대한 요구가 증가하면서, 빅데이터로부터 감성을 분석하는 기술에 대한 필요가 늘고 있다. 이를 위해, 본 논문에서는 단순 긍/부정 감성이 아닌 20종류의 세분화된 감성을 분석하기 위한 감성어휘 구축 알고리즘을 제시한다. 감성어휘 구축을 위해서는 준지도학습을 사용하였으며, 도메인에 특화되지 않은 일반 감성어휘를 구축하도록 학습되었다. 학습된 감성어휘를 인물, 스마트기기, 정책 등 다양한 도메인의 트위터 데이터에 적용하여 세부감성을 분석한 결과, 알고리즘의 특성상 재현율이 낮다는 한계를 가지고 있었으나, 대부분의 감성에 대해 높은 정확도를 지닌 감성어휘를 구축할 수 있었고, 감성을 직간접적으로 나타내는 표현들을 학습할 수 있었다.

  • PDF

구문분석 말뭉치를 이용한 문법 관계의 선호 체언 어휘와 의미 유형 연구 (A Treebank-Based Approach to Preferred Nominal Words in Grammatical Relations and their Semantic Types)

  • 홍정하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-41
    • /
    • 2008
  • 이 논문은 각 문법 관계(grammatical relation)에서 선호되는 체언 어휘를 파악하고, 이 어휘들의 의미적 유형 및 그 위계를 파악하는 것이 목적이다. 이를 위해 80만 어절의 21세기 세종계획 구문분석 말뭉치에서 그 분포를 추출하고, 통계적 검증을 통해 각 문법 관계에서 선호되는 체언 어휘를 선별한다. 이 연구에서 관찰하는 문법 관계는 주어, 목적어, 용언수식어로 하며, 이들 문법 관계에서 선호되는 어휘 추출 대상 품사는 대명사, 고유명사, 일반명사로 한다. 한정성의 강도에 따라 주어 분포 경향이 나타나며, 이에 따라 대명사 > 고유명사 > 일반명사 순으로 주어 분포 경향이 나타난다. 그러나 일반적 예측과 다르게 한정성의 강도가 더 강한 것으로 알려진 대명사가 고유명사보다 목적어와 용언수식어에서 분포 경향이 더 강하여, 일반명사 > 대명사 > 고유명사의 순으로 분포 경향이 나타난다. 대명사, 고유명사, 일반명사는 공통적으로 주어에서는 사람 지시어, 목적어에서는 사물과 장소 지시어, 그리고 용언수식어에서는 시공간 표현이 선호되어 분포한다. 특히 대명사는 각 문법기능에서 인칭대명사의 경우 인칭에 따라, 그리고 지시대명사의 경우 원근칭에 따라 선호도의 차이를 보인다. 이러한 체언 어휘의 의미적 분포 특성은 문법 관계에 통사적 기능 외에도 의미적 경향이 반영된 것으로 고려될 수 있다.

  • PDF

의미적 연결 관계에 기반한 전자 카탈로그 검색용 유사도 척도 (A New Similarity Measure for e-Catalog Retrieval Based on Semantic Relationship)

  • 서광훈;이상구
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.554-563
    • /
    • 2007
  • 전자 상거래의 발달과 함께 B2B Market Place의 등장과 통합으로 전자 상거래의 중심 단위인 전자 카탈로그의 양도 급증하고 있다. 이러한 전자 카탈로그의 정보의 질적, 양적 증가는 상품 정보 검색의 난이도를 높이고 있다. 특히, 대량 거래를 하는 상품 전문가의 의사 결정을 위해 단일 분류 체계가 아닌 다양한 분류체계 내에서의 상품 정보 검색을 지원하는 시스템의 필요성이 증가하고 있다. 하지만 기존의 검색 시스템은 일반 문서 검색 시스템이 대다수이며, 이러한 전자 카탈로그의 특성을 반영하지 못하고 있어 이를 지원하기에는 한계가 있다. 따라서 본 논문에서는 전자 카탈로그가 지니고 있는 속성적, 어휘적인 특성을 반영하고 의미적 연결관계에 기반한 검색을 통하여 해당 요구 사항을 충족시킬 수 있는 시스템의 토대를 마련하고자 하였다. 이를 위해, 전자 카탈로그의 특징을 반영한 전자 카탈로그 기본 모델을 제시하고, 검색을 결과 제시를 위한 유사도 평가 요소를 도출하였으며, 정확성 향상을 위해 이를 어휘적 특성을 고려한 데이타 확장 모델 및 어휘 기반 유사도 평가 요소로 확장하였다. 그리고 제시한 모델을 통해 의미적 연결 관계에 기반한 전자 카탈로그 유사도 평가 함수를 제시하고 이를 전자 카탈로그 정보 검색시스템으로 구현하고 검증하였다.

형태 정보에 기반한 전자사전에서의 3음절 명사 처리 (Management of Three-Syllable Nouns in Electronic Dictionary based on Morphological Information)

  • 이은전;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.156-162
    • /
    • 2000
  • 언어학적 성과를 효과적으로 반영하고 운용할 수 있는 체계적인 전자 사전 구축을 위해선, 어휘들에 대한 총체적이고 체계적인 언어 정보 제공과 함께 효율적인 처리 방식이 무엇보다도 필요하다. 따라서 이번 전자 사전 구축 작업은 내용 면에서는 형태 정보를 중심으로 다양하고 상세한 어휘 특성들을 체계적으로 제시하였고, 기술 방식에 있어서는 모든 입력 정보를 코드화 시킴으로써 효율성을 추구했다. 또한 연구 과정에서 나타난 문제 유형에 대한 인식과 검토는 앞으로 사전 개발의 원칙 및 방향을 설정하는데 도움을 줄 수 있을 것으로 기대한다. 특히 단어 형성 정보에 있어서 접사 정보가 부착된 파생어 사전은 어휘 확장과 중의성 해결을 하는데 활용될 수 있을 것이다. 본고에서는 3음절 명사 사전 작업의 전반적인 파전, 분류 유형, 어휘 정보, 기술 방법 및 앞으로 논의될 문제 유형들을 담고 있다.

  • PDF