• 제목/요약/키워드: 구절 구문 분석

검색결과 9건 처리시간 0.021초

한국어 구절 구문 코퍼스의 의존 구문 구조 트리로의 변환에서 중심어 전파 규칙 (Head-Percolation Rules of Constituent-to-Dependency Conversion in Korean)

  • 최용석;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.514-519
    • /
    • 2018
  • 본 연구에서는 세종 구문 코퍼스를 의존 구문 코퍼스로 변환할 때 사용되는 중심어 전파(Head-Percolation) 규칙에 대하여 논의한다. 한국어는 중심어-후위 언어이기 때문에 의존 구문 트리를 구축할 때 지배소를 의존소 뒤에 배치시키는 것을 원칙으로 하였다. 그러나 의존 관계에 있는 단어 사이에 지배소를 앞쪽으로 설정하는 것이 더 자연스러운 경우가 있다. 본 연구에서는 지배소를 앞쪽으로 배치시키는 것을 허용하는 중심어 전파 규칙을 채택하여 의존 구문 코퍼스를 구축해 보고 중심어 전파 규칙이 구문 분석기의 성능에 어떤 영향을 미치는지 살펴본다. 실험 결과 지배소를 앞쪽으로 설정하는 것을 허용한 경우, 0.43%의 성능 저하가 있었으나 학습 코퍼스의 일관성을 유지한다면 성능 저하의 차이를 좀 더 줄일 수 있을 것이다.

  • PDF

술어-논항 구조의 패턴 유사도를 결합한 혼합 커널 기반관계 추출 (Relation Extraction based on Composite Kernel combining Pattern Similarity of Predicate-Argument Structure)

  • 정창후;최성필;최윤수;송사광;전홍우
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.73-85
    • /
    • 2011
  • 문헌에 존재하는 핵심개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서 는 기존에 개발되어 비교적 높은 성능을 보여준 합성곱 구문 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴의 유사성 정보를 동시에 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 합성곱 구문 트리 커널에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 다양한 테스트컬렉션 기반의 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험결과 구절 구조 정보를 이용하는 합성곱 구문 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 또한 기존의 시스템보다 우수한 성능을 보이는 것도 함께 확인할 수 있었다.

의견 어구의 구문 관계를 고려한 트위터 의견 검색 (Opinion Retrieval in Twitter Considering Syntactic Relations of Sentiment Phrase)

  • 김윤성;양민철;이승욱;임해창
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권9호
    • /
    • pp.492-497
    • /
    • 2014
  • 본 연구에서는 대중적인 소셜 네트워크 서비스 중 하나이며 많은 사람들이 다양한 의견을 공유하는 트위터를 대상으로 질의어(또는 주제어)에 적합한 의견을 지닌 트윗을 검색하는 방법론을 제안한다. 기존의 의견 검색 시스템은 의견을 지닌 구절이 주어진 질의어나 화자와 관련이 없음에도 불구하고 그런 구절의 유무를 중요한 요소로 여겼다. 이와 같은 문제를 해결하기 위하여 본 연구에서는 1) 의견 어구-질의어 관계, 2) 의견 어구-화자 관계, 그리고 3) 의견 어구의 의존 구문 역할 등의 구문 요소를 반영하는 방법을 고안하였다. 또한, 의견을 가진 트윗을 검색하기 위하여 질의어와의 적절성, 텍스트 정보, 사용자 정보, 트위터 특화 자질에 기반한 랭킹 학습 방법을 이용하였다. 실제 데이터를 이용한 실험 결과, 본 시스템은 기존 연구들보다 더 좋은 성능을 보이고 있다.

술어-논항 구조의 패턴 유사도를 활용한 혼합 커널 기반 관계 추출 (Relation Extraction based on Composite Kernel using Pattern Similarity of Predicate-Argument Structure)

  • 정창후;전홍우;최윤수;송사광;최성필
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.276-279
    • /
    • 2011
  • 문서 내에 존재하는 개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서는 기존에 개발되어 비교적 높은 성능을 보여준 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현하는 술어-논항 구조 패턴의 유사성 정보를 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 트리 커널 기법에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험 결과 구절 구조 정보를 이용하는 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 이는 관계 인스턴스에 대한 구절 구조 정보뿐만 아니라 개체 간의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴 또한 관계 추출 작업에 매우 유용한 정보임을 입증하고 있다.

한국어 합성 동사성 명사의 어휘구조와 다중 동사성명사 구문

  • 류병래
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.141-144
    • /
    • 2001
  • 본 논문의 목적은 ‘다중 동사성 명사 구문’(Multiple Verbal Noun Construe-tions)의 논항실현 양상을 이론 중립적으로 고찰해 보고, 이 분석을 제약기반 문법 이론인 최근의 핵 심어주도 구구조문법 (Head-driven Phrase Structure Grammar)틀 안에서, 특히 다중계승위 계를 가정하는 제약기반 어휘부를 기반으로 형식화해 논항의 실현과정을 기술하고 설명하는 것이다. 우선 일본어의 유사한 현상을 분석한 Grimshaw & Mester (1988)의 격실현 양상에 관한 일반화를 기반으로 한국어 동사성명사구문의 논항실현 양상을 ‘논항전이’ (argument transfer)라는 이론적 장치를 이용해 형식화할 수 있음을 보이고, 동사성 합성명사의 논항구조를 만들기 위해 ‘논항합성’(argument composition)이라는 이론적 장치를 제안한다. 나아가서 다중 동사성 명사구문의 논항실현 과정에서 보이는 겹격표지 현상을 ‘격 복사’(case copying)를 제안해 동사성 명사의 격표지가 합성 명사에서 분리되어 문장단위에서 실현될 때 동일한 격을 복사해 실현한다는 점을 주장하고자 한다. 이 주장을 뒷받침하기 위해 수동과 능동 등 문법기능의 변화현상에서 하위범주화된 요소들의 격변화가 자의적이 아님을 실례를 들어 보여 주고자 한다. 일본어의 경동사 (light verbs)에 관한 분석 인 Grimshaw Meste, (1988) 이래 한국어에서도 이와 유사한 구문에 대한 재조명이 활발하게 이루어져 왔다 (Ryu (1993b), 채희락 (1996), Chae (1997) 등 참조). 한국어에서 ‘하다’와 동사성명사(verbal nouns)가 결합하여 이루어진 ‘동사성명사구문’ (Verbal Noun Constructions)에 대한 기존의 논의는 대부분 하나의 동사성 명사가 ‘하다’나 ‘되다등 소위 문법기능을 바꾸는 ‘경동사’들과 결합하여 복합술어가 되는 문법적 현상에 초점이 맞춰져 있었다. 그와 비교해서 동사성 명사의 어근이 두 개 이상 결합하여 동사성명사들끼리 합성명사(compound nouns)를 이루고 그 동사성 합성명사가 문법기능의 변화를 바꾸는 ‘경동사’와 결합하여 이루어진 복합술어에 대해서는 논의가 거의 없는 형편이다. 특히 이 지적은 핵심어주도 구절구조문법틀 내에서는 논란의 여지가 없다. 본 논문의 대상은 바로 이러한 합성 동사성명사의 논항구조와 동사성명사에 의해 하위범주화된 논항들의 문법적 실현양상이다.

  • PDF

정확한 해답 추출을 위한 개념 기반의 질의 분석 (Concept-based Question Analysis for Accurate Answer Extraction)

  • 신승은;강유환;안영민;박희근;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권1호
    • /
    • pp.10-20
    • /
    • 2007
  • 본 논문에서는 정확한 해답 추출을 위해 키워드보다 중요한 역할을 하는 개념을 분석하는 개념 기반 질의 분석에 대해 기술한다 해답 유형이 같은 질의들에서 나타나는 개념은 유사하기 때문에 이러한 개념들을 잘 정의하여 이용할 경우, 해답을 포함하는 다양한 형태의 구문으로부터 보다 정확한 해답을 추출할 수 있다는 것이 본 논문의 주요 아이디어이다. 즉, 해답을 포함하는 문서와 그 문서 내에 있는 해답을 좀더 정확하게 추출하기 위해 질문에 있는 각 단어나 구절들의 구문 및 의미 역할을 파악하고자 하는 것이다. 이를 위해, 정답 유형별로 그 유형의 질문에서 공통으로 나타나는 주요 개념들로 구성된 개념 프레임을 정의하고, 사용자 질의를 분석하여 개념 프레임을 채우는 과정으로 질의 분석을 수행한다. 실험 결과 본 논문에서 제안한 개념 기반 방식이 기존의 질의분석 기법에 비해 높은 정답 추출 성능을 보여주었다. 본 논문에서 제안한 개념 기반 접근 방법은 언어에 관계없이 적용 가능한 모델이며, 또한 기존 방식과 함께 사용할 수 있는 장점도 있다.

복합 웹 서비스를 위한 자연어 인터페이스 (Natural Language Interface for Composite Web Services)

  • 임종현;이경호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권2호
    • /
    • pp.144-156
    • /
    • 2010
  • 복합 웹 서비스를 이용하고자 하는 사용자의 요구가 늘어나고 있지만 유비쿼터스 환경에서 일반 사용자들이 쉽게 복합 웹 서비스를 사용할 수 있는 환경은 마련되지 않고 있다. 본 논문에서는 웹 서비스에 대한 기술적인 지식이 없는 일반인들도 쉽게 자신의 요구사항을 표현 가능한 자연어 기반의 사용자 친화적인 인터페이스를 제안한다. 특히 사용자의 표현을 효율적으로 분석하기 위해 사용자의 문장으로부터 정교한 수준의 복합적인 워크플로우를 추출하고, 문장 분석을 통해 적합한 서비스를 찾는 방법을 제안한다. 특히 많은 제어 구문과 구절로 이루어진 복잡한 문장으로부터 정교한 수준의 추상 워크플로우를 추출한다.

지적재산분쟁의 중재에 대한 미국 케이스에 관한 연구 (Research Cases of the United States Concerning Arbitration of Intellectual Property Disputes)

  • 장병윤
    • 한국중재학회지:중재연구
    • /
    • 제22권3호
    • /
    • pp.93-118
    • /
    • 2012
  • 본 연구는 지적재산분쟁의 중재에 대한 미국 케이스에 관한 연구입니다. 본 연구의 목적은 한국의 지적재산분쟁의 중재에 대한 추후 연구와 가까운 장래에 비교연구를 위해서 지적재산에 관련된 케이스들에 관하여 미국의 연구들을 논하는데 있습니다. 본 연구에서 지적재산 관련 사건들의 중재에 관한 미국케이스들을 채택하였습니다. 그리고 본 연구의 목적 달성과 효과적인 연구를 성취하기 위해 그 케이스들을 인용하였습니다. 그러므로, 본 연구의 구성은 특히, 라이센싱분쟁의 중재, 특허분쟁의 중재, 저작권분쟁의 중재를 위하여 지적재산분야와 중재 분야에 있는 케이스로 이루어져 있습니다. 중재조항은 분쟁에 관해 누가 결정할 것인가 그리고 분쟁이 중재 가능한가 아닌가에 관하여 법원에서 중재적격 문제들을 분석할때에 계약 원칙을 적용하게 됩니다. 일반적으로, 중재적격의 의문은 사법적 분야의 질문에 관한 것 입니다. 그러나, 중재조항이 분명하고, 명백하고, 오해없는 문구들인 곳에서 법원은 연방 중재법이 중재조항과 중재범위를 포함하고 있기 때문에 중재를 존중합니다. 그러므로, 저런 경우에 중재인은 중재적격을 판단 할 수 있습니다. 그러나, 미국에서 법원은 어떤 케이스들은 ICC 룰로 구속되어지고 그리고 다른 케이스들은 AAA 룰로 구속 되어지는 것을 발견했습니다. 어떤 룰이던지 간에 중재조항은 주의깊게 만들어야만 하고 그리고 분명하고 명백한 구문을 제공하여야만 한다는 것을 법원에 의해 요구되어지고 있습니다. 본 연구에서 발견한 점들은, 라이센싱분쟁의 중재에 있어서, 중재합의의 범위가 광범위 또는 제한적일지라도 양 당사자의 중재조항을 위해 계약에서 분명하고 명확한 문구를 만드는 것이 중요합니다. 이것은 우리에게 계약의 원칙이 분쟁에서 적용 되어지고 있다는 것을 보여 주고 있습니다. 그래서, 중재조항의 조문은 법원이나 중재인에게 논쟁 또는 오역이 없게 확실하고 분명하게 명시하여야 합니다. 특허분쟁의 중재에 있어서, 대부분 법원들은 케이스들을 분석할때에 광범위한 중재조항에 따라오고 있습니다. 중재적격 결정의 테스트로서 계약에서 "arising under" or "relating to" 구절은 ADR을 위해 그리고 분쟁의 예방을 위해 중재가 광범위한 문구를 포함하고 있는가 아닌가를 보는데 중요합니다. 더구나, 특허 또는 특허관련 권리들 하에서, 중재는 연방중재법에 의해 지배되기 때문에 계약은 특허 유효성 또는 침해 문제들이 중재를 통한 분쟁을 해결하도록 하나의 문구를 포함해도 됩니다. 그러므로, 이 분석은 미국의 케이스들을 비교한 결과로서, 한국중재법도 또한 모든 필요한 조문들이 그것들이 광범위하건 제한된 범위이건 간에 모호한 이슈들을 피하기 위해 분명하고 오해없는 문구들이여야 한다는 것을 제시합니다. 지적재산분쟁의 중재에 있어서, 케이스에 근거하여 발견한 점들은 저작권법을 포함한 광범위한 중재조항이 있는 경우 저작권의 유효성은 법원이 독점할 수 없다고 법원은 판단했습니다. 그리고 연방중재법은 법원이 청구취지가 중재가능한 클레임들에(arbitrable claims) 관하여 중재를 강요하도록 지원하고 있습니다. 이것은 저작권 케이스일지라도 계약에 있어서 중재조항이 법원이 중재를 강요하도록 중재가능한가 아닌가 결정하는데 분쟁에 있어 중요한 역학을 한다는 것을 제시합니다. 그러므로, 본 연구는 계약에서 광범위한 중재조항은 중재인이 지적재산 클레임에 대해 판정 또는 룰을 결정하게 허용한다는 것을 발견했습니다. 본 연구의 결과들은 계약에 있어 중재의 범위는 계약의 원칙을 적용한다는 것입니다. 그리고 중재조항에 있어서 침해와 유효성 문제들의 결정은 계약 해석에 관련되어 있다는 것을 제시합니다. 그러므로, 양 당사자가 분명하고 명확하게 달리 결정하지 않았다면, 양 당사자가 중재에 대해 동의했는가 아닌가의 의문점은 법원에 의해 결정되어지는 것입니다. 이것은 분명하고 명확한 문구가 중재조항에 존재하지 않는다면 중재인에 의해 결정되지 않는다는 것을 뜻합니다. 중재조항은 명백하게 중재인에게 결정의 권한을 주어야만 한다는 것입니다.

  • PDF

맹사성 <강호사시가>의 짜임새 (A Study on the )

  • 양희찬
    • 한국시조학회지:시조학논총
    • /
    • 제21집
    • /
    • pp.143-164
    • /
    • 2004
  • 이 논문은 <강호사시가>가 한 주제를 형상화하는 데 네 계절의 특징을 담고 있는 서로 다른 글감들을 사용하였지만, 내용의 일관된 통일성을 유지한 연시조이며, 이 통일성 유지는 하나의 일정한 틀을 사용한 데 근거하였음을 해명하려고 한 것이다. 그 일정한 틀은 겉틀과 속틀로 나누었다. 겉틀은 네 작품에 공통된 표현 부분이다. 그 내용은 '화자의 거처(강호)'-'화자(이 몸)'$\cdot$'화자와 임금의 관계(군은)' 및 '강호의 상태(강호에 (가)이 드니)', '화자의 상태(이 몸이 (라)히옴)'를 제시한 것이다. 그리고 초장의 '강호에 (가)이 드니'를 구문의 생성 조건의 측면에서 분석하여 표현의 압축과 간결함을 지적하고, 종장의 '역군은이샷다'를 구문의 생성 의도의 측면에서 분석하여 화자 개인 차원의 삶에 대한 만족을 표출한 것임을 설명하고, 이 삶의 만족을 사회적 차원의 태평성대로 확장할 수 있는지에 대하여 문제제기를 하였다. 속틀은 작품 내용의 세부 짜임이다. 이에 대해서는 네 작품을 초$\cdot$$\cdot$종장 각각으로 묶어 분석한 다음, 네 작품의 공유된 짜임을 설명하고, 각각의 내용 분석을 통하여 곁틀에서 다룬 <강호사시가>의 내용이 갖는 특성을 해명하였다. 네 작품의 초$\cdot$$\cdot$종장을 각각 하나로 묶어 종합 분석하기 위하여 지표기능과 제시기능을 설정하여 그 내용의 짜임을 설명하였다. 초장은 공통으로 네 계절의 흥취를 표현한 것이며, 중장은 지표기능 어휘인 '화자'가 생략되어 제시기능 구절만으로 이루어졌으며, 초장의 흥취를 행위나 상태로 구체적으로 제시하였다. 종장은 중장과 연결하여 함축적 표현이며,사적인 삶과 공적인 가치관(군신유의)의 관계에서 공적인 가치관으로 사적인 삶을 보장받으려는 의도를 내포한 것이다. 이를 종합하면, <강호사시가>의 속틀의 짜임은 '계절의 제시'$\to$'계절에 대한 발흥'$\to$'계절의 즐김 행위'$\to$'(심적$\cdot$신체적) 평안'으로 전개된다. 문맥의 흐름에서 초장은 중장의 단서가 되며, 중장은 초장에 대한 반응이며, 종장은 중장의 응축으로서 평가라는 성격을 가지고 있다. 그리고 속틀의 짜임에 '감군은'이 포함되면 곁틀의 짜임을 확인할 수 있다. 끝으로, 작자가 작품의 본지를 개인의 평안에 둔 것처럼 꾸몄으나, 본래의 발상은 임금의 치적(태평성대)을 송축하려는 것이라고 결론하였다.

  • PDF