• 제목/요약/키워드: 기본문형

검색결과 23건 처리시간 0.023초

술어기반 문형정보를 이용한 자동요약시스템에 관한 연구 (A Study on an Automatic Summarization System Using Verb-Based Sentence Patterns)

  • 최인숙;정영미
    • 정보관리학회지
    • /
    • 제18권4호
    • /
    • pp.37-55
    • /
    • 2001
  • 본 연구에서는 특정 주제분야의 텍스트를 대표할 수 있는 단어술어를 추출하고 기본문형을 형성 한 후 각 단서술어의 기본문형을 실례화하여 연결함으로써 요약문을 작성하는 자동요약시스템의 모형을 설계하고 구현하였다. 시스템은 학습과정과 요약과정을 구분되며, 학습과정에서는 술어와 격조사를 출현빈도를 이용하여 주제분야 텍스트집단을 대표하는 단어술어와 필수격 조사를 추출한 뒤 단어술어가 이루는 문장의 기본문형을 형성한다. 요약과정에서 실례화 규직을 요약 대상 문장의 구문 분석 결과에 적용하여 기본문형의 격조사와 결합될 논항을 찾아 단문을 생성하고 연결하여 요약문을 완성한다. ‘화재’및‘강도’와 관련된 신문기사를 대상으로 실험을 수행하였으며, 작성된 요약문은 단어술어가 포함된 주요 문장에서 추출한 필수 정보항목과 술어를 중심으로 생성된 문장들로서 문장간의 연결이 자연스러울 뿐 아니라 텍스트의 전체적인 의미를 표현할 수 있었다. 또한, 통계적 기법을 이용한 학습을 통해 주제영역의 확장이 가능하였다.

  • PDF

빅데이터 분석을 위한 한국어 SentiWordNet 개발 방안 연구 : 분노 감정을 중심으로 (The Study of Developing Korean SentiWordNet for Big Data Analytics : Focusing on Anger Emotion)

  • 최석재;권오병
    • 한국전자거래학회지
    • /
    • 제19권4호
    • /
    • pp.1-19
    • /
    • 2014
  • 빅데이터 내에 존재하는 감정 정보를 추출하여 사용자들이 특정 대상에 대하여 갖고 있는 인식이 어떠한지를 파악하고자 하는 노력이 활발히 이루어지고 있다. 상품, 영화, 그리고 사회적 이슈 등에 대한 문장을 분석하여 사람들이 해당 주제에 어떠한 견해를 가지고 있는지를 분석하고 측정하여 구체적인 선호도를 알아내는 것이다. 문장에서 드러나는 감정 정도를 얻기 위해서는 감정어휘의 목록과 정도값을 제시할 수 있는 감정어휘사전이 필요하므로 본 연구에서는 감정어휘를 발견하는 방법과 이들의 정도값을 결정하는 문제를 다룬다. 기본적인 방법은 기초 감정어휘의 목록 수집과 이들의 정도값은 선행연구 결과와 직접 설문 방식을 이용하고, 확장된 목록의 수집과 정도값은 사전의 표제어 설명부(glosses)를 이용해 추론하는 것이다. 그 결과 발견된 감정어휘는 전형성을 띠고 있는 기본형 감정어휘, 기본형 감정어휘의 gloss에 사용된 확장형 1단계 1층위 감정어휘, 비 감정어휘 중 gloss에 기본형 또는 확장형 감정어휘를 가지고 있는 확장형 2단계 1층위 감정어휘, gloss의 gloss에 기본형 또는 확장형 감정어휘가 사용된 확장형 2단계 2층위 감정어휘의 네 종류로 나뉜다. 그리고 확장형 감정어휘의 정도값은 기본형 감정어휘의 정도값을 기초로 문형의 가중치와 강조승수를 적용하여 얻었다. 실험 결과 AND, OR 문형은 내포된 어휘의 감정 정도값을 평균내는 가중치를, Multiply 문형은 정도 부사어의 종류에 따라 1.2~1.5의 가중치를 갖는 것으로 파악되었다. 또한 NOT 문형은 사용된 어휘의 감정 정도를 일정 정도로 낮추어 역전시키는 것으로 추정된다. 또한 확장형 어휘에 적용되는 강조승수는 1층위에서 2, 2층위에서 3을 갖는 것으로 예상된다.

문형 정보를 이용한 한국어 구문 분석 (Korean Syntax Analysis Using Sentence Pattern Information)

  • 한용기;황이규;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.23-29
    • /
    • 1995
  • 대부분의 한국어 구문 분석은 용언과 명사구 사이의 하위범주화 정보를 이용하여 용언에 대한 명사구의 문법적 역할을 밝히는 방향으로 구문 분석을 시도하였다. 여기에 이용된 용언의 하위 범주화 정보가 단지 자릿수 서술어나 형용사, 자동사, 타동사 등으로 분류하는 수준이었기 때문에 구문 모호성이 많이 발생하고 틀린 문장이 구문적으로 옳기 때문에 옳은 문장으로 인식되는 경우가 발생하였다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어의 용언에 따른 문장 형태(문형)를 세분류하고 문장에 필수적으로 나타나는 명사구(NP[case])와 수의적으로 나타나는 명사구(NP[case])를 분류하여 분석을 시도하였다. 확장된 PATR II로 문법을 기술하여 동적인 파싱을 쉽게 제어할 수 있도록 하였다. 문형 정보는 한국어의 기본 구조를 자연스럽게 표현할 수 있기 때문에 그 자체를 기계번역을 위한 한국어 문법으로 설정하는 것이 타당하다고 생각된다.

  • PDF

한국어(韓國語) 초록문(抄錄文)의 문장(文章)과 내용(內容)에 대한 연구(硏究) (A Study on the Contents and Sentences of Korean Abstract)

  • 이태영
    • 정보관리연구
    • /
    • 제21권1호
    • /
    • pp.1-33
    • /
    • 1990
  • 품사(品詞), 격(格), 기본동작(基本動作), 기본상태(基本狀態)를 이용(利用)하여 영어(英語)와 한국어(韓國語) 지시초록(指示抄錄)의 문장(文章)을 고찰(考察)하였다. 문(文)과 문장(文章)의 길이(문장(文章)의 결합정도)를 측정(測定)하고, 문장구조(文章構造)와 전개과정(展開過程)을 분석(分析)하였으며 당위적인 초록문형(抄錄文型)을 예시(例示)하였다. 그리고 기본동작(基本動作)과 상태(狀態)를 중심(中心)으로 격관계(格關係)를 밝힌 초록문(抄錄文)의 문장틀을 제시(提示)하였다.

  • PDF

의료 영상 검색 시스템의 설계 및 구현 (Design of Medical Image Retrieval System)

  • 문형석;엄기현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.315-318
    • /
    • 2002
  • 대부분의 의료 영상 관리 시스템이 의료 영상의 저장, 전송 등의 기본적인 기능만 지원될 뿐 상위 응용 계층에서 내용기반 검색이 지원되지 않고 있다. 본 논문에서는 이를 위해 내용 기반 검색 기능을 지원하는 의료 영상 검색 시스템을 설계 및 구현한다. 의료 영상 검색 시스템은 질의 이미지의 내용기반 검색을 위해 색-공간, 질감, 모양 특징에 의한 유사 비교 기법을 사용하고 각각의 유사 비교 검색에 의해 생성된 결과 집합들을 통할하고 최종 결과 제시를 위해 복합 질의문 계획 생성 알고리즘을 제시한다.

  • PDF

결합가 이론에 의한 독일어 감정동사 연구 (Valenztheoretische Untersuchung der deutschen Emotionsverben)

  • 김수남
    • 한국독어학회지:독어학
    • /
    • 제6집
    • /
    • pp.23-55
    • /
    • 2002
  • 이 논문의 목적은 수없이 많은 독일어 동사들 가운데 사람의 심리-감정을 표현하는 동사, 소위 감정동사(Emotionsverben: Verben der Gefuhlsbewegung)를 하나의 어휘-의미장(lexikalisch-semantisches Feld)으로 보고 이들의 통사구조 및 의미구조를 파악하여 결합가 모형화 하는 것이다. 우리는 감정동사의 통사 구조 및 의미구조를 기술하기 위해 동사 중심의 결합가 이론과 격이론을 이론적$\cdot$방법론적 토대로 삼았다. 또한 우리는 감정동사를 보충어의 수와 형태에 따라 크게 세 가지 그룹, 즉 2개의 보충어를 갖는 그룹 I(이 그룹에 속하는 동사들은 무생물(사물)을 주어로 갖는다)과 그룹 II(이 그룹에 속하는 동사들은 유생물(사람)을 주어로 갖는다) 그리고 3개의 보충어를 갖는 그룹 III(사람과 사람간의 관계를 나타낸다)으로 구분하였다. 예증을 위해 개별 동사에 대해 용례를 제시했다. 2개의 보충어를 갖는 그룹 II를 보충어의 수의성 여부에 따라 하위 분류했다. 보충어의 형태는 명사구(Sn, Sd, Sa, Sa)와 전치사구(pS)에 한정했으며 - 지면관계상 개별 동사의 예문으로 제시하진 않았지만 - 문장형태의 보충어, 예를 들어 dass-문장(Nsdass)과 부정사문(Inf)도 고려하여 통사적 문형(syntaktisches Satzmodell)과 의미적문형(semantisches Satzmodell)에서 제시하였다. 결국 이 논문은 독일어를 배우는 이들에게 독일어 동사의 통사구조 및 의미구조를 보다 쉽게 설명할 수 있는 하나의 방법론을 제시함은 물론, 나아가서는 결합가 사전에서 동사 내항 기술을 위한 기본적인 토대를 제공할 것이다

  • PDF

AC/DC 선로 커플링에 따른 정상상태 영향 분석 (The Study of Steady-State Interaction Between AC/DC Line Coupling)

  • 천이경;박성진;이욱화;정용호;윤종수;문형배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.230-231
    • /
    • 2011
  • 본 논문은 2011년 제주계통 한림변전소와 금악변환소 사이에 설치 예정인 ${\pm}80kV$ 60MW HVDC 시스템의 DC 가공선로를 기존의 AC 송전 철탑의 AC 선로와 병렬로 추가하여 운영할 때 선로 Coupling에 따른 정상상태 영향을 분석한 내용이다. 한림변전소와 금악변환소 사이 철탑 17개의 데이터를 기반으로 송전선로를 모델링함으로써 실제 데이터에 최대한 근접할 수 있도록 정확성을 도모하였으며, 모델링과 분석에 있어서 전자계과도현상 해석프로그램인 PSCAD를 이용하였다. 특히 AC 병렬 연계 유무에 따른 DC 전류 주파수를 비교함으로써 AC/DC Coupling의 영향을 분석하였으며 최종적으로 이에 따른 기본파 성분 제거에 필요한 DC 필터 설치 유무에 관한 결론을 도출하였다.

  • PDF

국내외 지능형교통시스템(ITS) 시장 동향 (A Study on Worldwide & Korea Market Trends of Intelligent Transportation System)

  • 문형돈;이윤철;이동일
    • 전자통신동향분석
    • /
    • 제17권6호통권78호
    • /
    • pp.48-58
    • /
    • 2002
  • 최근 세계 ITS 시장은 활발한 정부의 투자와 민간의 시장참여로 인해 빠르게 시장이 성장해 나가고 있다. 또한, 국내 ITS 시장의 경우에도 ‘ITS 기본계획21’과 같이 범정부차원에서 ITS 육성을 위한 투자계획이 추진되고 민간의 활발한 참여가 이루어지고 있다. 이는 최근 세계적으로 초고속 인터넷의 급속한 보급과 무선통신 인프라의 구축 등과 같이 ITS를 구성하는 통신인프라의 급속한 확충에 따르는 것으로 빠르게 관련 산업 및 시장의 규모가 성장하고 있다. 따라서, 본 고에서는 세계 ITS 시장 동향과 향후 전망을 살펴보고, 국내 ITS 시장동향에 대한 분석을 통해 국내 ITS 시장에의 시사점을 제시하였다.

한국인과 원어민 영어 발화의 F0 고저 범위 차이와 발음 평가에 있어서 그 역할 (Korean & Native Speakers' High -low Range Differences in F0 and its Role in Pronunciation Assessment)

  • 이석재;조철현;문선영
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.93-103
    • /
    • 2003
  • This study examines the high-low pitch range differences between Korean and native English speakers' utterances of 36 English sentences, and explores the role of the pitch fluctuation range in the pronunciation assessment. Findings are: i) Korean speakers implement half as much pitch fluctuation as the native speakers with the achievement rate of, on an average, 47%. Especially, pitch fluctuation range is below the average in the sentence types of exclamation, yes-no & wh-questions, ii) the reason why Korean speakers' pitch fluctuation range is only half the range of the native speakers is that Korean speakers do not raise the pitch at certain sentence positions so much as the native speakers, and iii) the range of pitch fluctuation plays an important role in distinguishing the utterances of the native speakers from those of Korean speakers, but does not in rating the English utterances among Korean speakers.

  • PDF

의미역 태깅의 제문제 (Consideration of Semantic Role Tagging)

  • 김윤정;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.75-80
    • /
    • 2015
  • 본고는 기존 연구에서 상정한 의미역에 기반하여 의미역 태깅 작업 중 실제 문장에 의미역을 태깅하는 데 나타난 문제점들에 대해 재고해보았다. 의미역을 태깅하는 데에 격틀 사전을 이용한 반자동의미역태깅프로그램의 정상적인 구동을 위한 사전의 재정비와 실제 문장에서는 드러나지만 사전에서는 나타나지 않는 문형 정보를 상세히 검토해야 함을 알게 되었다. 이를 해결하기 위해 격틀사전의 기본 사전이 표준국어대사전의 통사정보 제시를 문제삼아 이를 해결하기 위한 방안을 모색하고, 실제 문장에서 격교체에 의해 나타나고 있는 논항정보교체에 대처하기 위한 방안을 마련하고자 한다.

  • PDF