• 제목/요약/키워드: the patterns of predicate

검색결과 20건 처리시간 0.024초

초등 영재학생과 일반학생들의 지구과학 영역에서 과학 글쓰기에 대한 분석 (An analysis of Scientific Writing about Earth Science Area by Gifted and Average Elementary School Students)

  • 박병태;고민석
    • 대한지구과학교육학회지
    • /
    • 제5권2호
    • /
    • pp.158-165
    • /
    • 2012
  • With five gifted and nine average elementary school students, this study attempted to make a comparative analysis on the characteristics of their scientific writings for earth science-related topics. The analysis found that all of the gifted students showed higher scores than the average in the writing sections of scientific nature, logical nature and creativity. Compared to the average scores, their creativity scores were far higher. By comparing and analyzing the predicates in the writings two groups wrote, I found that the gifted students used more sentences per topic than the average students. Both groups wrote the most numbers of sentences for Volcano-related topics. In the meantime, the gifted children used the least numbers of sentences for the related topics to atmospheric pollution and the average students did so for the related topics to fossils. By the analysis on the patterns of predicate, it was observed that both groups used material predicates most and verbal predicates least. As far as the second most used predicates are concerned, the gifted children used relational predicates and the average students used mental predicates.

BiLSTM 모델과 형태소 자질을 이용한 서술어 인식 방법 (Predicate Recognition Method using BiLSTM Model and Morpheme Features)

  • 남충현;장경식
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.24-29
    • /
    • 2022
  • 정보 추출 및 질의응답 시스템 등 다양한 자연어 처리 분야에서 사용되는 의미역 결정은 주어진 문장과 서술어에 대해 서술어와 연관성 있는 논항들의 관계를 파악하는 작업이다. 입력으로 사용되는 서술어는 형태소 분석과 같은 어휘적 분석 결과를 이용하여 추출하지만, 한국어 특성상 문장의 의미에 따라 다양한 패턴을 가질 수 있기 때문에 모든 언어학적 패턴을 만들 수 없다는 문제점이 있다. 본 논문에서는 사전에 언어학적 패턴을 정의하지 않고 신경망 모델과 사전 학습된 임베딩 모델 및 형태소 자질을 추가한 한국어 서술어를 인식하는 방법을 제안한다. 실험은 모델의 변경 가능한 파라미터에 대한 성능 비교, 임베딩 모델과 형태소 자질의 사용 유무에 따른 성능 비교를 하였으며, 그 결과 제안한 신경망 모델이 92.63%의 성능을 보였음을 확인하였다.

술어-논항 튜플 기반 근사 정렬을 이용한 문장 단위 바꿔쓰기표현 유형 및 오류 분석 (Analysis of Sentential Paraphrase Patterns and Errors through Predicate-Argument Tuple-based Approximate Alignment)

  • 최성필;송사광;맹성현
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.135-148
    • /
    • 2012
  • 본 논문에서는 Predicate-Argument Tuple (PAT)를 기반으로 텍스트 간 심층적 근사 정렬(Approximate Alignment)을 통한 문장 단위 바꿔쓰기표현(sentential paraphrase) 식별 모델을 제안한다. 두 문장 간의 PAT 기반 근사 정렬 결과를 바탕으로, 두 문장의 의미적 연관성을 효과적으로 표현하는 다양한 정렬 자질(alignment feature)들을 정의함으로써, 바꿔쓰기표현 식별 문제를 지도 학습(supervised learning) 기반의 자동 분류 모델로 접근하였다. 실험을 통해서 제안 모델의 가능성을 확인할 수 있었으며, 시스템의 오류 분석을 통해 제안 방법이 아직 해결하지 못하는 다양한 바꿔쓰기표현 유형들을 식별함으로써 향후 시스템의 성능 개선 방향을 도출하였다.

Predicate-Argument Structure 기반의 어휘적 패턴을 이용한 관계 추출 (Relation Extraction using Lexical Patterns based on Predicate-Argument Structure)

  • 정창후;전홍우;최윤수;최성필
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.748-750
    • /
    • 2010
  • 문서 내에 존재하는 개체들 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있는데, 본 논문에서는 문장 내에 존재하는 각 단어의 predicate-argument 관계를 분석하여 자질로 활용하는 PAS 패턴 기반 관계 추출 시스템을 제안한다. 관계 종류별로 구축된 PAS 패턴 집합을 활용하여 관계 식별기를 개발하였고, 실험을 통하여 개발된 관계 식별기의 성능을 측정하였다. 실험 결과 개체 간의 유의미한 관계를 표현해주는 PAS 패턴이 관계 추출 작업에 유용한 정보임을 알 수 있었다.

동형이의어 분별에 의한 한국어 의존관계 분석 (An Analysis of Korean Dependency Relation by Homograph Disambiguation)

  • 김홍순;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권6호
    • /
    • pp.219-230
    • /
    • 2014
  • 의존관계 분석은 문장의 어절 간에 의존소-지배소를 결정하는 작업이다. 용언은 문형 및 하위범주화 정보의 선택제약에 의해 다른 어절과의 의존관계를 형성한다. 본 논문은 형태소 분석 단계에서 동형이의어 분별된 용언의 문형을 이용하여 용언의 의존관계를 분석하는 방법을 제안한다. 특히, 형태소분석 단계에서 품사 및 동형이의어 태깅을 위해 사용하는 단계별 전이모델의 학습사전을 재활용하여 {명사+격조사, 용언} 간의 의존관계를 확정하는 방안을 제안하고 그의 정확률 및 영향을 분석한다. 동형이의어가 부착되고 의존관계로 변경된 21개의 세종구문분석말뭉치를 이용하여 실험한 결과, 동형이의어 분별된 의존관계 분석 정확률이 80.38%로, 동형이의어가 분별되지 않은 의존관계분석에 비해 0.42%의 정확률 향상이 있었으며, 유의수준 1%의 검정통계량 Z는 ${\mid}Z{\mid}=4.63{\geq}z_{0.01}=2.33$으로 동형이의어 분별이 의존관계 분석에 영향이 있음을 보였다. 또한, 단계별 전이모델이 의존관계 분석 정확률에 약 7.14% 영향을 미치는 것을 알 수 있었다.

시소러스와 술어 패턴을 이용한 의미역 부착 한국어 하위범주화 사전의 구축 (Constructing a Korean Subcategorization Dictionary with Semantic Roles using Thesaurus and Predicate Patterns)

  • 양승현;김영섬;우요섭;윤덕호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권3호
    • /
    • pp.364-372
    • /
    • 2000
  • 하위범주화는 보어의 어휘 개념이 명시된 술어와 보어간 의존 관계를 정의하는 언어 정보로서 구문 및 의미 분석 등에 폭넓게 활용될 수 있는 기반 언어 자원이라는 데에 그 중요성이 있다. 본 논문에서는 표층문에서 통상 격표지로 표현되는 구문적 의존 관계뿐만 아니라, 보어가 갖는 의미역 정보가 부착되어 있으며 시소러스 개념 분류 체계와 연동 가능한 한국어 술어의 하위범주화 사전의 구축에 대해 설명하고 있다. 본 논문에서는 하위범주화 사전의 의미역 표현을 위해 총 25개의 의미역을 설정하고 있다. 이 의미역은 표층 격표지와 직접 연관되어 있기 때문에 통사적인 분석으로부터 직접 의미역 정보를 추출해서 의미 구조의 해석에 이용하는 것이 가능하다. 또한 명사 보어가 갖는 개념의 표현을 위해 상ㆍ하위어 관계를 갖는 12만 어휘 규모의 시소러스를 이용하고 있으며, 술어의 의존 관계 표현을 위해 동사, 형용사에 대해 각각 47, 17 개의 하위범주화 패턴을 이용하고 있다. 실용적 규모의 시소러스를 이용함으로써 문장에 나타난 명사의 시소러스 개념을 그대로 하위범주화 사전에 적용시켜 의미 정합 여부를 판단할 수 있는 실질적인 선택제약 체계를 구성할 수 있었고, 표층 격표지에 기초한 표준화된 술어 패턴을 이용함으로써 의미역의 결정 등에서 야기될 수 있는 비일관성을 방지하고 구축에 드는 비용을 절감할 수 있었다. 이상과 같은 방법으로 말뭉치에서 추출한 고빈도 술어 13,000 여개에 대해 하위범주화 사전을 구축하였으며, 적용 범위 평가 실험에 의하면 이 하위범주화 사전은 말뭉치에서 발견된 술어의 72.7%에 대해 하위범주화 정보를 제공할 수 있음을 확인하였다.

  • PDF

술어-논항 구조의 패턴 유사도를 결합한 혼합 커널 기반관계 추출 (Relation Extraction based on Composite Kernel combining Pattern Similarity of Predicate-Argument Structure)

  • 정창후;최성필;최윤수;송사광;전홍우
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.73-85
    • /
    • 2011
  • 문헌에 존재하는 핵심개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서 는 기존에 개발되어 비교적 높은 성능을 보여준 합성곱 구문 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴의 유사성 정보를 동시에 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 합성곱 구문 트리 커널에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 다양한 테스트컬렉션 기반의 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험결과 구절 구조 정보를 이용하는 합성곱 구문 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 또한 기존의 시스템보다 우수한 성능을 보이는 것도 함께 확인할 수 있었다.

자동요약의 주제어 추출을 위한 의미사전의 동적 확장 (Dynamic Expansion of Semantic Dictionary for Topic Extraction in Automatic Summarization)

  • 추교남;우요섭
    • 전기전자학회논문지
    • /
    • 제13권2호
    • /
    • pp.241-247
    • /
    • 2009
  • 본 논문에서는 자동문서요약 시스템에서 정확하고 실용적인 주제어 추출을 위하여 한국어의 의미론적 특성을 고려한 의미사전의 확장 방법론에 대하여 논하고자 한다. 첫째로 동의어 사전을 통하여 의미표지 분석의 정확도를 높이고자 한다. 둘째로 하위범주화사전에 가중치를 부여하여 구문과 의미 분석에서 가장 올바른 분석 결과를 결정하는 참조 정보로 활용하고자 한다. 셋째로 미등록 용언의 하위범주화패턴 예측을 통하여 한국어에서 접사 파생되는 용언에 대하여 원활한 의미 분석을 수행할 수 있도록 한다.

  • PDF

Interpretations of Negative Degree Sentences and Questions

  • Kwak, Eun-Joo
    • 영어영문학
    • /
    • 제56권6호
    • /
    • pp.1135-1161
    • /
    • 2010
  • The interpretations of degree expressions require the postulation of new entities to represent degrees. Diverse entities such as degrees, intervals, and vectors are adopted for degree expressions. Positive degree sentences and questions are properly construed with the introduction of these entities, but their negative counterparts need more consideration. Negative degree sentences show dual patterns of entailments depending on contexts, and negative degree questions are unacceptable, making weak islands. To explicate the distinct nature of negative degree sentences and questions, Fox & Hackl (2006) provide an analysis based on degrees while Abrusan & Spector (2010) suggest a proposal in interval readings of degree expressions. I have pointed out the theoretical problems of these analyses and proposed an alternative in the framework of the vector space semantics, following Winter (2005). Bi-directional scales in vector space fit well with the dual patterns of negative degree sentences, and the notion of a reference vector is useful to accommodate the contextual influence in negative degree sentences and to deal with the unacceptability of negative degree questions.

자발화에 나타난 구문구조 발달 양상 (A Study on Syntactic Development in Spontaneous Speech)

  • 장진아;김수진;신지영;이봉원
    • 대한음성학회지:말소리
    • /
    • 제68권
    • /
    • pp.17-32
    • /
    • 2008
  • The purpose of the present study is to investigate syntactic development of Korean by analysing the spontaneous speech data. Thirty children(3, 5, and 7-year-old and 10 per each age group) and 10 adults are employed as subjects for this study. Speech data were recorded and transcribed in orthography. Transcribed data are analysed syntactically: sentence(simple vs complex) patterns and clause patterns(4 basic types according to the predicate) etc. The results are as follows: 1) simple sentences show higher frequency for the upper age groups, 2) complex sentences with conjunctive and embedded clauses show higher frequency for the upper age groups.

  • PDF