• 제목/요약/키워드: 의미 자질

검색결과 213건 처리시간 0.029초

가변길이 윈도우를 이용한 통계 기반 동형이의어의 중의성 해소 (Statistical Word Sense Disambiguation based on using Variant Window Size)

  • 박기태;이태훈;황소현;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-44
    • /
    • 2012
  • 어휘가 갖는 의미적 중의성은 자연어의 특성 중 하나로 자연어 처리의 정확도를 떨어트리는 요인으로, 이러한 중의성을 해소하기 위해 언어적 규칙과 다양한 기계 학습 모델을 이용한 연구가 지속되고 있다. 의미적 중의성을 가지고 있는 동형이의어의 의미분별을 위해서는 주변 문맥이 가장 중요한 자질이 되며, 자질 정보를 추출하기 위해 사용하는 문맥 창의 크기는 중의성 해소의 성능과 밀접한 연관이 있어 신중히 결정되어야 한다. 본 논문에서는 의미분별과정에 필요한 문맥을 가변적인 크기로 사용하는 가변길이 윈도우 방식을 제안한다. 세종코퍼스의 형태의미분석 말뭉치로 학습하여 12단어 32,735문장에 대해 실험한 결과 용언의 경우 평균 정확도 92.2%로 윈도우를 고정적으로 사용한 경우에 비해 향상된 결과를 보였다.

  • PDF

목적어 생략에 대한 동사의 의미표상 및 추론의 역할 (The Role of Semantic Representation of Verbs and Inference in the Interpretation of Missing Objects in Korean Discourse)

  • 조숙환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.457-461
    • /
    • 2001
  • 본 논문은 동사의 의미표상과 명사의 한정성의 강호관계를 중심으로 목적어의 생략현상을 검토하였다. 한국어는 영어 같은 언어와 달리 주어, 목적어 등이 자주 생략된다. 이 연구는 한국어의 목적어 생략이 단순히 인간성 (humanness), 주체성 (agency), 한정성(definiteness) 등 명사의 의미자질에 의해서만 결정되는 것이 아니라, 다음 두 가지 제약이 결정적으로 작용함을 제안하고자 한다. 첫째, 목적어 생략은 행동양상 (mold of agent act)과 원인 (cause)을 심층적으로 포함하는 소위 '핵심 타동사 (core transitive)'와 선행사의 한정성 정도에 의해 결정되는데, 구체적으로 목적어 생략은 한정성 자질을 가진 선행사가 없는 담화에서는 허용되지 않는다는 제약이다. 둘째, 타동사와 명사의 한정성과는 독립적으로, 한국어의 목적어 생략은 또한, 추론에 의거하여 보다 더 적절히 해석될 수 있는 경우를 실증적으로 보이고자 한다.

  • PDF

Maximum Entropy 모델을 이용한 나열 및 병렬형 인식 (Syntax Analysis of Enumeration type and Parallel Type Using Maximum Entropy Model)

  • 임수종;이창기;허정;장명길
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1240-1245
    • /
    • 2006
  • 한국어 문장을 구조 분석할 때에 모호성을 발생시키는 유형 중의 하나가 나열 및 병렬형이다. 문장 구조 복잡도를 증가시키는 나열 및 병렬형을 구조 분석 전에 미리 하나의 단위로 묶어서 처리하는 것이 문장 구조 분석의 정확도를 높이는데 중요하다. 본 연구에서는 형태소 태그를 이용한 기본 규칙으로 문장을 청크 단위로 분할하고 분할된 청크 중에서 나열형을 인식하여 해당되는 청크들을 하나의 나열 청크로 통합하여 청크의 개수를 줄인다. 병렬형에 대해서는 반복되는 병렬 청크의 범위와 생략된 용언을 복원한다. 이러한 인식은 첫 단계로 기호(symbol)를 중심으로 구축된 간단한 규칙으로 인식을 하고 이러한 규칙에 해당되지 않는 형태의 나열 및 병렬형은 Maximum Entropy 모델을 이용하여 적용한다. ME모델은 어휘자질, 형태소 품사 자질, 거리 자질, 의미자질, 구 단위 태그 자질(NP:명사구, VP:동사구, AP:형용사구), BIO 태그(Begin, Inside, Outside) 자질에 대한 ME(Maximum Entropy) 모델을 이용하여 구축되었다.

  • PDF

SVM을 사용한 한국어 종속절의 의존관계 분석 (Analyzing Dependency of Korean Subordinate Clauses Using Support Vector Machine)

  • 김상수;박성배;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.148-155
    • /
    • 2006
  • 한국어 구문 분석에서 가장 어려운 작업들 중에 하나는 종속절의 의존관계 파악이다. 본 논문에서는 이를 해결하기 위해서 종속절의 의존관계를 걸을 구성하는 서술어부(동사와 어미)의 관련 정보의 유무에 따라 의존관계가 성립한다고 가정했다. 즉 각각의 절들의 서술부의 관련 정보의 유무로 보고, 이진 분류 문제로 이 문제를 해결하였다. 사용한 자질은 정적 자질(static feature)와 동적 자질(dynamic feature)를 구성되어 있다. 정적 자질은 동사와 어미에서 표면적인 어휘 정보이고 이는 단어, POS 테그 및 위치 정보들이다. 동적 자질은 문장에서 절이 가지는 문법적인 형태를 의미하고, 이를 추출하기 위해 간단한 규칙을 만들고 이를 바탕으로 CKY 차트 파서를 통하여 추출하였다. 기계학습 방법으로는 이진 분류 문제에서 널리 사용되는 SVM을 사용하였다. 실험 결과 어휘 정보들 중에서 어미의 정보만 사용하였을 경우는 64.4%의 정확도를 보였고 문법적인 정보인 동적 자질을 사용한 경우는 73.5%로 어휘 정보만을 사용한 경우 보다 9.1%의 성능 향상됨을 보였다

  • PDF

한국어 음소열 기반 워드 임베딩 기술 (Korean Phoneme Sequence based Word Embedding)

  • 정의석;송화전;이성주;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

한국어 음소열 기반 워드 임베딩 기술 (Korean Phoneme Sequence based Word Embedding)

  • 정의석;송화전;이성주;박전규
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

세대간 장단 차이에 따른 운율 변화 연구

  • 김선주
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2000년도 3월 학술대회지
    • /
    • pp.198-204
    • /
    • 2000
  • 본 연구는 한국어에서 의미를 분화시키는 기능을 담당해오던 장/단의 상실로 인해 운율자질들에 어떠한 변화가 일어났는지 알아보는 것을 목적으로 한다. 먼저 길이의 대립적 기능의 소실로 인해 젊은 세대에서 액센트를 구성하는 길이의 기능이 상실되고 있지는 않는지 알아보았다. 이와 더블어 길이, 세기, 고저의 운율행동 양상이 세대간에 차이를 보이는지 살펴보았다. 실험은 장/단의 변별력을 지니는 60대 화자와 변별력을 상실한 20대 화자를 비교하여, 운율자질들의 수치를 측정하고 높은 수치의 음절 위치를 기술하였다. 실험결과 두 세대 모두에서 길이는 상대적 돋들림을 보여 액센트를 결정하는 자질의 역할을 하는 것으로 나타났다. 그러나 운율자질들의 성격에 있어서는 세대간에 차이를 보였는데, 길이에 있어서는 60대에 비해서 20대의 돋들리는 정도가 줄어든 것을 볼 수 있었다. 또 세기와 고저는 60대 화자들에게서는 이렇다할 경향성을 발견할 수 없었지만 20대화자들에서는 2번째 음절의 수치가 고정적으로 높아지는 일정할 경향을 발견할 수 있었다.

  • PDF

용어 클러스터링의 성능 평가 (Performance Evaluation for Word Clustering)

  • 박은진;김재훈;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.43-49
    • /
    • 2005
  • 이 논문에서는 전자 사전의 뜻 풀이말을 이용하여 용어를 자동 분류하는 용어 클러스터링 시스템을 설계하였다. 클러스터링 성능에 영향을 미치는 요소로 자질 선택 자질 표현 그리고 유사도 측정 등이 있다. 이 논문에서는 이러한 요소들이 용어 클러스터링에 미치는 영향을 평가해보았다. 클러스터링 결과를 객관적으로 비교하기 위해서 용어 클러스터링 결과와 한국어 의미 계층망에서 추출한 정답 클러스터를 비교하였다 실험 결과, 용어의 뜻 풀이말만 자질로 사용한 방법보다는 뜻 풀이말 자질을 확장하는 방법이 훨씬 더 좋은 결과를 보였다.

  • PDF

초, 중, 고등학생들의 과학 교사 자질에 대한 이미지 (Images of Competencies of Science Teachers in Elementary and Secondary School Students)

  • 김영신;조윤정;임수민
    • 과학교육연구지
    • /
    • 제44권1호
    • /
    • pp.61-73
    • /
    • 2020
  • 교육의 질을 결정하는 주요 요소 중에서 가장 핵심적인 역할을 하는 것은 교사이다. 그러므로 교육의 질을 높이기 위해서는 교사의 질을 향상시켜야 한다. 교사의 자질은 교직에서 요구되는 기능 즉, 교수 활동 뿐 아니라 생활지도, 학급경영을 수행할 수 있는 능력을 의미한다. 본 연구의 목적은 초, 중, 고등학생들이 원하는 과학 교사의 자질을 분석하고자 하는 것이다. 이를 위하여 초, 중, 고 학생 332명을 대상으로 선호하는 과학 교사의 자질과 기피하는 과학 교사의 자질을 개방형으로 기술하도록 하였다. 그 결과 얻어진 개념들을 언어 네트워크 분석법으로 분석하였다. 이 연구의 결론은 1) 학생들은 선호하는 과학 교사의 자질은 다양한 것으로 나타났다. 이는 학생들이 과학 교사를 긍정적으로 생각하는 면이 많은 것을 의미한다. 또한 학생들에게 다양한 면에서 긍정적인 또는 선호하는 교사의 자질을 보여 줄 수 있다는 것이다. 2) 학생들은 실험을 통해서 과학 현상과 이론, 개념을 이해하고 설명해주길 바라는 것으로 나타났다. 과학 수업에서 학생들은 직접적인 활동이나 체험을 선호하였다. 3) 학생들은 과학 교사의 자질에서 수업과 관련된 내용을 중요시하고 있다. 과학 교수 학습 방법의 개선과 학생들을 긍정적으로 대함으로써 학생들의 과학 교사 나아가 과학에 대한 이미지를 높여야 할 것이다. 이 연구 결과를 기반으로 하여 과학 교사의 구체적인 교수 학습 방법에 따른 이미지 연구가 추가적으로 이루어지길 기대한다.