• 제목/요약/키워드: 한국어 의미 분석

검색결과 480건 처리시간 0.025초

Universal conceptual cognitive annotation(UCCA) 주석 체계의 한국어 적용 연구 (A Study on UCCA for Korean Semantic Analysis)

  • 오태환;한지윤;최현수;박석원;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-356
    • /
    • 2019
  • 본 논문은 Universal conceptual cognitive annotation(보편 개념 인지 주석, 이하 UCCA)를 한국어에 적용하는 방안에 대해 제시하였다. 우선 기존의 한국어 의미 분석 체계들의 장단점을 살펴본 뒤, UCCA가 가지고 있는 상대적인 장점들을 소개하였다. UCCA는 모든 언어에 대하여 일관적인 기술을 하려는 Meaning representation framework의 하나로, 보편언어적인 의미 분석 체계를 가지고 있다. 본고는 주석 단위와 문법적 요소의 관점에서 한국어의 특성을 반영하여 UCCA를 한국어에 적용하는 방안을 검토하였다.

  • PDF

한국어 의미 표지 부착 말뭉치 구축을 위한 자동 술어-논항 분석기 개발 (A Development of the Automatic Predicate-Argument Analyzer for Construction of Semantically Tagged Korean Corpus)

  • 조정현;정현기;김유섭
    • 정보처리학회논문지B
    • /
    • 제19B권1호
    • /
    • pp.43-52
    • /
    • 2012
  • 의미 역 결정 (Semantic Role Labeling)은 문장의 각 요소들의 의미 관계를 파악하는 연구 분야로써 어휘 중의성 해소와 더불어 자연언어처리에서의 의미 분석에서 매우 중요한 위치를 차지하고 있다. 그러나 한국어의 경우에는 의미 역 결정에 필요한 언어 자원이 구축되지 못하여 연구의 진행이 매우 미진한 상황이다. 본 논문에서는 의미 역 결정에 필요한 언어 자원 중에서 가장 널리 사용되고 있는 PropBank의 한국어 버전의 구축을 위한 시작 단계로써 자동 술어-논항 분석기를 개발하였다. 자동 술어-논항 분석기는 크게 의미 어휘 사전과 자동 술어-논항 추출기로 구성된다. 의미 어휘 사전은 한국어 동사의 격틀 정보를 구축한 사전이며 자동 술어-논항 추출기는 구문 표지 부착된 말뭉치로부터 특정 술어와 관련있는 논항의 의미 부류를 결정하는 모듈이다. 본 논문에서 개발된 자동 술어-논항 분석기는 향후 한국어 PropBank의 구축을 용이하게 할 것이며, 궁극적으로는 한국어 의미 역 결정에 큰 역할을 할 것이다.

ARGUMENT STRUCTURE ALTERNATIONS IN ENGLISH AND KOREAN

  • 김미숙
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.59-73
    • /
    • 2001
  • 이 논문은 영어와 한국어에서 논 항구조의 교체를 허용하는 처소격 동사들의 통사구조와 의미를 비교 분석해 보려고 한다. 지금까지 연구가 논항구조의 교체를 허용하는 이런 동사들이 통사적 유사성에만 국한되어 연구가 되었을 뿐 여러 다른 통사적 형식에서 보여지는 차이점이나 논항 교체 동사들의 의미적 차이점과 같은 중요한 현상들에 대한 많은 연구가 되어지지 않았다. 따라서 첫 번째로 이 논문에서는 Pinker (1989)에 제시한 논항 교체 동사들의 의미적 분석을 구체적으로 소개하고, 이런 교체 동사들의 의미적 유사성과 차이점으로 구분한 Pinker의 의미분류들을 자세히 알아본다. 또한 Pinker가 교체동사들의 의미적 분류를 위해 사용한 통사적 기준인 논항 생략 (PP-omission test)을 소개한다. 두 번째로 영어의 논항 교체 동사들에 해당하는 한국어 동사들의 통사적 형태를 알아봄으로써 영어와 한국어에서의 통사적 유사성과 차이점을 알아본다. 세 번째로 영어와 한국어에서 나타나는 통사적 차이점의 설명을 위해 Pinker가제시한 의미 분류들을 수정한 새로운 분류를 제시한다 마지막으로 Jackendoff (1996)에서 제시된 의미적 설명이 영어의 논항 교체 동사에 해당하는 한국어 동사들의 통사적 형태들의 다양성을 설명할 수 있음을 보여준다

  • PDF

문장 의미의 그래프 구조 표상을 위한 한국어 Abstract Meaning Representation 가이드라인 (Korean Abstract Meaning Representation (AMR) Guidelines for Graph-structured Representations of Sentence Meaning)

  • 최현수;한지윤;박혜진;오태환;박석원;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.252-257
    • /
    • 2019
  • 이 논문은 한국어 Abstract Meaning Representation (AMR; 추상 의미 표상) 가이드라인 1.0*을 소개한다. AMR은 통합적인 의미 표상 체계로, 의미 분석(semantic parsing)의 주요 Task 중 하나로 자리매김하고 있다. 한국어 AMR 가이드라인은 현행 AMR 1.2.6을 심도 있게 분석하고 이를 한국어 상황에 맞게 로컬라이징한 것이다. 해당 가이드라인은 추후 한국어 AMR 말뭉치 구축(sembanking)에 대비하여 일관된 주석 세부 지침을 제공하기 위해 작성되었다.

  • PDF

한국어 어휘지도(UWordMap)와 API 소개 (Introduction to the Korean Word Map(UWordMap) and API)

  • 배영준;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.27-31
    • /
    • 2014
  • 한국어 문장의 의미 분석을 위해서는 어휘 의미들의 상의어, 하의어, 반의어, 유의어 등의 의미관계뿐만 아니라 서술어의 논항이 가지는 의미제약 정보 및 의미역, 서술어와 부사 명사와 부사, 부사와 부사와의 유의미한 결합 정보 등의 다양한 의미 정보가 필요하다. 한국어 어휘지도는 울산대 한국어처리연구실에서 2002년부터 현재까지 구축해 왔으며, 이제 구축된 결과물을 API와 함께 제공한다. 본 논문은 한국어 어휘지도의 대략적인 구조 및 API 등을 소개한다.

  • PDF

통계/의미 정보를 이용한 한국어 의존 파싱 (Korean Dependency Parsing Using Statistical/Semantic Information)

  • 장명길;류법모;박재득;박동인;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.313-319
    • /
    • 1997
  • 한국어 의존 파싱에서는 불필요한 의존관계의 과다한 생성과 이에 따른 다수의 구문분석 결과 생성에 대처하는 연구가 필요하다. 본 논문에서는 한국어 의존 파싱 과정에서 생기는 불 필요한 의존관계에 따른 다수의 후보 의존 트리들에 대하여 통계/의미 정보를 활용하여 최적 트리를 결정하는 구문 분석 방법을 제안한다. 본 논문의 구문 분석에서 사용하는 통계/의미 정보는 구문구조부착 말뭉치(Tree Tagged Corpus)를 이용하여 구축한 술어 하위범주화 정보 사전에서 얻었으며, 이러한 정보를 활용한 구문 분석은 한국어 구문 분석의 모호성 해소에 적용되어 한국어 구문 분석의 정확도를 높인다.

  • PDF

중첩 분할된 양방향 LSTM 기반의 한국어 프레임넷의 프레임 분류 및 논항의 의미역 분류 (Frame-semantics and Argument Disambiguation of Korean FrameNet using Bi-directional LSTM)

  • 함영균;신기연;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.352-357
    • /
    • 2018
  • 본 논문에서는 한국어 프레임넷 분석기를 구축하기 위하여 한국어 프레임넷 데이터를 가공하여 공개하고, 한국어 프레임 분류 및 논항의 의미역 분류 문제를 해결하기 위한 방법을 제안한다. 프레임넷은 단어 단위가 아닌 단어들의 범위로 구성된 범위에 대해 어노테이션된 코퍼스라는 점에 착안하여, 어휘 및 논항의 내부 의미 정보와 외부 의미 정보, 그리고 프레임과 각 의미역들의 임베딩을 학습한 중첩 분할된 양방향 LSTM 모델을 사용하였다. 이를 통해 한국어 프레임 분류에서 72.48%, 논항의 의미역 분류에서 84.08%의 성능을 보였다. 또한 본 연구를 통해 한국어 프레임넷 데이터의 개선 방안을 논의한다.

  • PDF

양화사 유동의 분석 (An Analysis of Quantifer Floating)

  • 강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.85-90
    • /
    • 1989
  • 본고는 한국어의 양화사 유동 현상을 일반범주문법의 관점에서 통사론적, 의미론적으로 분석한다. '학생들이 넷이 술을 마셨다' 와 같은 문장에서 나타나는 유동 양화사는 통사론적으로 동사구수식어 (VP/VP)로 파악하고, 의미론적으로는 명사화된 속성이 관여하는 것으로 분석한다. 이 밖에도, 관련된 형태인 '넷' (NP/NP), '넷을' (TV/TV)등도 엄밀한 통사론적, 의미론적 분석을 시도한다. 성공적인 분석의 결과는 한국어 처리에 인접성 조건을 준수하는 범주문법의 사용가능성을 시사해 준다.

  • PDF

술어와 조사 정보를 이용한 논항의 의미역 변환 (Semantic Role Transformation of Arguments using Predicate and Josa Information)

  • 서민정;석미란;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.51-55
    • /
    • 2014
  • 의미역 결정 (Semantic Role Labeling) 은 문장 내의 술어와 이들의 논항들의 의미 관계를 결정하는 과정을 뜻한다. 의미역 결정을 하기 위해서는 대량의 말뭉치와 다양한 언어 자원이 필요한데, 많은 경우에 PropBank 말뭉치가 사용된다. 한국어 PropBank는 다른 언어에 비해 자료가 적어 그것만을 가지고 의미역 결정을 하기에 적절하지 않다. 또한 한국어 의미 분석을 위해서 지금까지는 세종 말뭉치나 의미역이 활용되어 오기도 하였다. 따라서 한국어 의미역 결정에서는 한국어 PropBank 뿐만 아닌 세종 의미역 표지 부착 말뭉치의 구축 역시 요구되는데 말뭉치 구축 작업이 수동 부착 작업이기 때문에 많은 시간과 비용이 소모된다. 본 논문에서는 이러한 문제점을 해결하기 위해 이미 구축되어 있는 한국어 PropBank 의미역을 세종 의미역으로 자동 변환하는 방법을 제시한다. 자동 변환을 위해서는 먼저 PropBank 의미역의 변환 후보 의미역을 구하여 이들 중에서 가장 적절한 의미역으로 변환한다. 자동 변환을 위해서는 크게 3 가지 특징을 활용하는데, 첫째는 변환 대상 논항의 의미 유사성이고, 둘째는 논항과 의미 관계를 가지고 있는 술어, 그리고 셋째는 논항과 결합되어 있는 조사이다. 이 세 가지 특징을 사용하여 정확한 의미역 변환을 위해 술어, 조사의 의미역 결합 확률 테이블을 구축한다.

  • PDF

한국어 텍스트 결속성 측정 도구: KorCAT (KorCAT: Cohesion Analysis Tool for Korean Text)

  • 김동현;김현정;김철희;서영덕
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.582-587
    • /
    • 2022
  • 결속성은 텍스트의 의미 관계 분석에서 주요하게 고려되는 요인 중 하나이다. 결속성이 높을 수록 텍스트 내 언어적 의미 관계가 긴밀한 것으로 볼 수 있기 때문이다. 사람에 의한 텍스트 결속성 분석은 주관이 개입되는 문제를 배제할 수 없는데, 영어에는 TAACO라고 불리는 결속성 자동 측정 도구가 있어 다양한 지표들로 텍스트의 결속성을 측정하고 있다. 그러나 한국어에는 이와 같은 텍스트 결속성 자동 측정 도구가 거의 없으며, 관련 연구도 상당히 부족한 실정이다. 따라서 본 논문에서는 한국어 텍스트의 의미 관계 분석을 위한 결속성 지표를 정의하고, 한국어의 특성에 맞는 결속성 측정 도구인 KorCAT을 제안한다.

  • PDF