• 제목/요약/키워드: Compound Noun Phrase

검색결과 9건 처리시간 0.021초

명사 의미 부류를 이용한 연속된 명사열의 구묶음 (Chunking of Contiguous Nouns using Noun Semantic Classes)

  • 안광모;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제10권3호
    • /
    • pp.10-20
    • /
    • 2010
  • 본 논문에서는 조사가 없는 연속된 명사열 중 하나의 명사처럼 쓰일 수 있는 명사열을 복합명사구라 정의하고, 의미 정보를 이용한 복합명사구의 구묶음 방법을 제시한다. 복합명사구의 구묶음에는 구문분석 말뭉치에서 추출한 명사쌍과 이들의 의미부류정보를 이용한다. 이러한 명사쌍과 의미부류정보는 신뢰도를 위해 세종말뭉치의 구문분석 말뭉치와 상세사전을 기반으로 구축하였다. 이들 정보를 이용한 복합명사구 구묶음 모듈은 길이(명사의 수)가 2 이상인 복합명사구에 대해서도 구묶음을 수행할 수 있다. 복합명사구 구묶음을 위해 '왼쪽명사-오른쪽명사' 쌍 38,940개, '왼쪽명사-오른쪽명사의미부류' 쌍 65,629개, '왼쪽명사의미부류-오른쪽명사' 쌍 46,094개, '왼쪽명사의미부류-오른쪽명사의미부류' 쌍 45,243개의 정보를 구축하여 이용하였다. 실험을 위하여 신문기사의 내용으로 이루어진 세종형태소분석 말뭉치로부터 길이가 3 이상인 조사와 결합하지 않은 연속된 명사열을 포함하는 1,000 문장을 임의로 선별하였으며, 실험결과는 86.89%의 정밀도와 80.48%의 재현율, 그리고 83.56%의 f-measure를 보였다.

Effective Thematic Words Extraction from a Book using Compound Noun Phrase Synthesis Method

  • Ahn, Hee-Jeong;Kim, Kee-Won;Kim, Seung-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.107-113
    • /
    • 2017
  • Most of online bookstores are providing a user with the bibliographic book information rather than the concrete information such as thematic words and atmosphere. Especially, thematic words help a user to understand books and cast a wide net. In this paper, we propose an efficient extraction method of thematic words from book text by applying the compound noun and noun phrase synthetic method. The compound nouns represent the characteristics of a book in more detail than single nouns. The proposed method extracts the thematic word from book text by recognizing two types of noun phrases, such as a single noun and a compound noun combined with single nouns. The recognized single nouns, compound nouns, and noun phrases are calculated through TF-IDF weights and extracted as main words. In addition, this paper suggests a method to calculate the frequency of subject, object, and other roles separately, not just the sum of the frequencies of all nouns in the TF-IDF calculation method. Experiments is carried out in the field of economic management, and thematic word extraction verification is conducted through survey and book search. Thus, 9 out of the 10 experimental results used in this study indicate that the thematic word extracted by the proposed method is more effective in understanding the content. Also, it is confirmed that the thematic word extracted by the proposed method has a better book search result.

복합명사 분할과 명사구 합성을 이용한 통합 색인 기법 (Integrated Indexing Method using Compound Noun Segmentation and Noun Phrase Synthesis)

  • 원형석;박미화;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.84-95
    • /
    • 2000
  • 본 논문에서는 명사구 색인과 복합명사 분할을 포함한 복합명사 처리를 위해 통계 정보와 자연언어 처리를 제한적으로 이용 가능하게 하는 통합적 색인 기법을 제안한다. 먼저 색인과 검색에서 복합명사 분할 및 합성 모두를 고려한 통합 기법을 제시하고, 이를 위해 통계 정보와 제한적인 자연언어 처리를 모두 이용하는 통합 색인 기법을 제안한다. 먼저 형태소 분석 및 태깅 과정에서 단일어를 색인어로 추출하고 구문분석의 결과에서 명사구를 합성해 낸다. 구문 분석 실패 시에는 형태소 분석 및 태깅의 결과만을 사용하게 된다. 또한 태깅의 결과에서 복합명사를 골라 통계 정보를 이용하여 단일 명사로 분할하고 재합성한다. 분할된 단일 명사와 합성된 명사구는 기존의 단일어로만 이루어진 색인어를 보완하기 위해 색인어로 사용된다. 실험은 한국어 정보검색의 실험 집합인 KTSET 2.0과 KRIST SET을 사용하여 통합색인 기법이 복합명사 처리에 효율적임을 보였다.

  • PDF

영어 명사구와 복합명사의 억양 실현 양상과 지각 (Intonational Realization and Perception of English Noun Phrases and Compound Nouns)

  • 강선미;김미혜;전윤실;김기호
    • 음성과학
    • /
    • 제12권4호
    • /
    • pp.153-166
    • /
    • 2005
  • This paper attempts to examine the accent implementation and perception of noun phrases and compound nouns in English sentences, arguing that primary stress of noun phrase and compound noun is realized in relative prominence in intonation. The production test examines how the stress patterns of the noun phrases and compound nouns are realized in intonation of the English native speakers' utterances. The perception test investigates English and Korean listeners' comprehension of the intonation of the noun phrases and compound nouns. And the results of this experimental study show that speakers and listeners produce and perceive the primary stress as a relatively prominent accent even if in contrast of English listeners, Korean learners have difficulty in using the cue of pitch accent location and figuring out compound nouns and noun phrases.

  • PDF

구문 다양성 해소를 위한 복합명사구 색인 방법 (A Method Of Compound Noun Phrase Indexing for Resolving Syntactic Diversity)

  • 조민희;정도헌
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.467-476
    • /
    • 2011
  • 복합명사구는 단일어보다 명확한 의미를 갖기 때문에 의미적 정보처리에서 중요한 요소로 사용된다. 하지만 명사구의 표현형태의 다양성 때문에 같은 의미를 갖고 있다 할지라도 그 동일성을 판단하기 어렵다. 이에 본 연구에서는 이러한 구문 다양성 해소를 위해 복합명사구 색인 방법을 제안한다. 본 연구의 최종목적은 다양한 형태로 표현된 동일한 의미의 명사구를 동일한 형태의 색인어로 표현하는 것이며, 이를 위해 다음과 같은 과정을 따른다. 먼저 복합명사구 인식을 위한 규칙 템플릿을 생성하고, 국내학술논문 집합에 적용하여 복합명사구들을 추출한다. 일반적으로 복합명사구는 특정성이 크다. 이에 이를 고려한 색인어 합성규칙을 제안하고, 추출된 명사구에 적용한다. 본 연구의 성능을 객관적으로 평가하기 위해 HANTEC 2.0 테스트셋을 이용하였으며, 그 결과를 기준모델과 비교하였다. 실험과 비교를 통해 본 논문에서 제안하는 색인방법이 검색 정확률 향상에 긍정적으로 영향을 미치며, 정보검색의 성능을 향상시킬 수 있음을 확인하였다.

The Incredible Shrinking Noun Phrase: Ongoing Change in Japanese Word Formation

  • Kevin Heffernan;Yusuke Imanishi
    • 아시아태평양코퍼스연구
    • /
    • 제4권1호
    • /
    • pp.1-23
    • /
    • 2023
  • The Japanese language, as a typical agglutinating language, permits large noun phrases (NP) containing ten or more morphemes. In this paper, we argue that the nature of the NP in Japanese is changing. Our data are drawn from the Balanced Corpus of Contemporary Written Japanese. We conduct a series of apparent-time studies of ongoing changes in complex NPs. We first examine the length of compound nouns, followed by the usage of bound suffixes. We then examine ongoing changes in complex NPs that contain genitive case markers. Finally, we examine noun incorporation. All of our studies show a trend towards shorter, less complex NPs. Furthermore, our results suggest that the usage rate of phrases that modify the noun inside the NP (compound nouns, bound nouns, NPs containing genitive case, noun incorporation) appears to be decreasing over time. On the other hand, the usage rate of modifying material outside of the NP (positional phrases, relative clauses) appears to be increasing over time. We conclude by suggesting that our results reflect a diachronic change of decreasing synthetic morphology and increasing analytic morphology. We end by pointing out the implications of this work on our understanding syntheticity and analyticity.

한국어의 형태소해석 (Morphological Analysis of the Korean Language)

  • 이수현;;이주근
    • 대한전자공학회논문지
    • /
    • 제26권4호
    • /
    • pp.53-61
    • /
    • 1989
  • 한국어의 구문 및 의미해석등에 필요한 정보를 도출하기 위한 입력분의 형태해석에 대하여 기술한다. 명사구에서 명사와 조사를 분리하고, 복합명사의 분리점을 선택하는 조건을 규정하며, 변형된 복합명사를 처리하는 규칙을 표시한다. 그리고 규칙동사에서 어간과 어미를 분리하고, 변칙용언과 음운축약 등을 효과적으로 처리하기 위한 논리표현 형식을 제안한다. 이 논리표현은 해석규칙과 속성값으로 구성한다. 명사사전의 중복을 배제하기 위하여 "명사형 하다" 동사의 분리 처리와 Q parameter 도입에 의한 "이다"의 처리방법을 보이고, 또한 부정문의 처리형식도 유도하여 복합술부의 형태소와 기본형식을 제시한다.

  • PDF

거리 제한을 이용한 색인 시스템 (An Index System using Restrictive Distance)

  • 박찬이;김상복
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.273-282
    • /
    • 2006
  • 한본 논문에서는 단어 가중기법에 거리 개념을 도입한 색인 기법을 제안한다. 본 색인 기법은 질의어와 문서를 대표하는 색인의 대부분은 복합명사 혹은 인접한 두개 이상의 명사 또는 명사구가 많으며 이들 명사간의 거리가 멀면 멀수록 색인으로 선택되는 비율이 줄어드는 점을 착안하여, 이를 기존의 가중치 부여 기법으로 색인어 후보를 선정하고, 후보들 간의 거리가 3어절 이내의 후보를 최종 색인으로 선정하였다. 이 방법을 이용하여 신문기사, 학술논문, 웹문서 등 100여종의 문서를 대상으로 실험한 결과 신문기사 92.03%, 학술논문 95%, 웹문서는 73..33%의 정확율을 보였다.

  • PDF

한국어 합성 동사성 명사의 어휘구조와 다중 동사성명사 구문

  • 류병래
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.141-144
    • /
    • 2001
  • 본 논문의 목적은 ‘다중 동사성 명사 구문’(Multiple Verbal Noun Construe-tions)의 논항실현 양상을 이론 중립적으로 고찰해 보고, 이 분석을 제약기반 문법 이론인 최근의 핵 심어주도 구구조문법 (Head-driven Phrase Structure Grammar)틀 안에서, 특히 다중계승위 계를 가정하는 제약기반 어휘부를 기반으로 형식화해 논항의 실현과정을 기술하고 설명하는 것이다. 우선 일본어의 유사한 현상을 분석한 Grimshaw & Mester (1988)의 격실현 양상에 관한 일반화를 기반으로 한국어 동사성명사구문의 논항실현 양상을 ‘논항전이’ (argument transfer)라는 이론적 장치를 이용해 형식화할 수 있음을 보이고, 동사성 합성명사의 논항구조를 만들기 위해 ‘논항합성’(argument composition)이라는 이론적 장치를 제안한다. 나아가서 다중 동사성 명사구문의 논항실현 과정에서 보이는 겹격표지 현상을 ‘격 복사’(case copying)를 제안해 동사성 명사의 격표지가 합성 명사에서 분리되어 문장단위에서 실현될 때 동일한 격을 복사해 실현한다는 점을 주장하고자 한다. 이 주장을 뒷받침하기 위해 수동과 능동 등 문법기능의 변화현상에서 하위범주화된 요소들의 격변화가 자의적이 아님을 실례를 들어 보여 주고자 한다. 일본어의 경동사 (light verbs)에 관한 분석 인 Grimshaw Meste, (1988) 이래 한국어에서도 이와 유사한 구문에 대한 재조명이 활발하게 이루어져 왔다 (Ryu (1993b), 채희락 (1996), Chae (1997) 등 참조). 한국어에서 ‘하다’와 동사성명사(verbal nouns)가 결합하여 이루어진 ‘동사성명사구문’ (Verbal Noun Constructions)에 대한 기존의 논의는 대부분 하나의 동사성 명사가 ‘하다’나 ‘되다등 소위 문법기능을 바꾸는 ‘경동사’들과 결합하여 복합술어가 되는 문법적 현상에 초점이 맞춰져 있었다. 그와 비교해서 동사성 명사의 어근이 두 개 이상 결합하여 동사성명사들끼리 합성명사(compound nouns)를 이루고 그 동사성 합성명사가 문법기능의 변화를 바꾸는 ‘경동사’와 결합하여 이루어진 복합술어에 대해서는 논의가 거의 없는 형편이다. 특히 이 지적은 핵심어주도 구절구조문법틀 내에서는 논란의 여지가 없다. 본 논문의 대상은 바로 이러한 합성 동사성명사의 논항구조와 동사성명사에 의해 하위범주화된 논항들의 문법적 실현양상이다.

  • PDF