• 제목/요약/키워드: Syntactic

검색결과 720건 처리시간 0.024초

안구이동추적을 통해 살펴본 관계절의 통사처리 과정 (Processing of syntactic dependency in Korean relative clauses: Evidence from an eye-tracking study)

  • 이미선;용남석
    • 인지과학
    • /
    • 제20권4호
    • /
    • pp.507-533
    • /
    • 2009
  • 관계절의 공백과 채움어의 의존관계(gap-filler dependencies)가 어떻게 해결되는지에 대한 가설은 '채움어촉발 처리전략(filler-driven parsing strategy)'과 '공백촉발 처리전략(gap-driven parsing strategy)'으로 요약할 수 있다. 두 가설의 언어보편적 타당성을 알아보기 위해, 본 연구는 안구이동추적법(eyetracking)을 이용하여, 한국어 화자들이 후핵언어(head-final language)인 한국어의 주격관계절과 여격관계절을 실시간으로 처리하는 과정을 살펴보았다. 그 결과, 피험자들이 관계절 내 공백의 위치에서 채움어에 상응하는 그림을 거의 응시하지 않았으나, 관계사와 결합한 관계절동사를 들은 시점부터는 채움어 그림을 응시하는 비율이 큰 폭으로 증가하기 시작하여 머리어를 들은 시점에서 가장 많이, 가장 오래 채움어 그림을 응시하였다. 이 결과는 공백이 관계절의 처리를 촉발하는 것이 아니라, 관계사와 결합한 관계절 동사에서 관계절의 통사처리가 시작되어 채움어가 인지된 시점에서 완성됨을 보여주는 것이다. 또한 주격관계절과 여격관계절 간의 상이한 안구이동 양상은 관계절 내의 논항과 결합한 격조사의 통사정보에 기인하는 것으로 보여서, 한국어의 관계절은 채움어촉발 처리전략을 따르기는 하지만 영어와 같은 선핵언어와는 다른 처리전략이 사용됨을 알 수 있다.

  • PDF

후방향 추론기법을 이용한 시멘틱 추론 시스템 (Semantic Inference System Using Backward Chaining)

  • 함영경;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.97-99
    • /
    • 2003
  • 대부분의 웹 문서들은 HTML이나 XML로 표현된 웹의 정보들은 Syntactic 구조를 기반으로 표현되기 때문에, 소프트웨어가 정보를 처리하는데 한계가 있다. HTML은 문서의 display안을 위한 tag기반의 문서 표현 방식이고, XML은 문서의 구조를 사람이 이해하기 쉽도록 제안된 표현 방식이기 때문이다. 따라서, HTML 및 XML로 표현된 정보들을 가지고 서비스를 제공하는 웹 에이전트들은 사용자들에게 의미있는 서비스를 제공하기 위해 오프라인 상에서 많은 수작업을 수행해야만 했다. 이와 같은 문제점을 극복하기 위해서 미국과 유럽에서는 시멘틱 웹에 대한 연구를 활발히 진행하고 있다. 시멘틱 웹은 기존의 웹과는 달리 소프트웨어가 이해하고 처리 할 수 있는 형태(machine processable)로 정보를 표현하기 때문에 오프라인 상에서 수행되던 많은 작업들을 에이전트가 이해하고 처리할 수 있게 되었다. 그러나. 온톨로지를 구축하는 과정에서도 필연적으로 정보의 31(Incorrect, incomplete, Inconsistence)가 나타나고, 서비스의 결과 또한 온톨로지에 의해 좌우된다는 단점이 있다. 본 논문에서 제안하는 후방향 추론기법을 이용한 추론엔진은 다음과 같은 시스템을 제안한다. 첫째. 시멘틱 웹을 이용함으로써 소프트웨어 에이전트의 자동화 시스템을 제안한다. 둘째 은톨로지 정보의 한계성을 극복하기 위해 규칙기반의 후방향 추론 기법을 사용하는 시멘틱 추론엔진을 제안한다. 본 논문에서 제안하는 후방향 추론기법을 이용한 시멘틱 추론시스템은 사용자의 질의를 입력받아. 온톨로지와 시멘틱 웹 문서의 정보를 이용하여 후방향 추론을 수행함으로써 웹 정보의 불완전성을 완화하고, 온톨로지의 영향력를 감소시킴으로써 웹 서비스의 질을 향상시키는데 목적이 있다.RED에 비해 향상된 성능을 보여주었다.웍스 네트워크상의 다양한 디바이스들간의 네트워크 다양화와 분산화 기능을 얻을 수 있었고, 기존의 고가의 해외 솔루션인 Echelon사의 LonMaker 소프트웨어를 사용하지 않고도 국내의 순수 솔루션인 리눅스 기반의 LonWare 3.0 다중 바인딩 기능을 통해 저 비용으로 홈 네트워크 구성 관리 서버 시스템 개발에 대한 비용을 줄일 수 있다. 기대된다.e 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해 볼때 사산(死産)은 모성(母性)의 임신력(姙娠歷)과 매우 밀접한 관련이 있는 것으

  • PDF

VOQL* : 귀납적으로 정의된 형식 시맨틱을 지닌 시각 객체 질의어 (VOQL* : A Visual Object Query Language with Inductively-Defined Formal Semantics)

  • 이석균
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.151-164
    • /
    • 2000
  • 객체 데이타베이스를 위해 최근에 제안된 VOQL(Visual Object Query Language)은 경로식과 집합 관련 조건을 시각화하고 형식 시맨틱을 제공하는데 성공적이었다. 그러나 기존의 VOQL은 몇가지 문제들이 있다. VOQL에서는 집합 관련 조건만이 허용되고, 변수 개념을 위한 명시적인 언어 구문이 없어서 질의문들은 종종 어색하고 직관적이지 못하다. 본 논문에서는 이러한 문제들을 극복하도록 VOQL을 확장한 VOQL*를 제안한다. 시각변수 개념을 도입하고 이에 기초하여 VOQL의 문법과 시맨틱을 수정하였다. VOQL*의 언어 구문들은 OOPC의 문법을 반영하도록 조심스럽게 정의되어서, 시각변수, 시각요소, VOQL* 단순 텀(term), VOQL* 구조 텀, VOQL* 기본 포뮬라(formula), VOQL* 포뮬라, VOQL* 질의문 등의 VOQL* 구문들이 OOPC 구문들처럼 계층적이고 귀납적으로 구성되어 있다. 가장 중요한 것은 VOQL*의 각 구문의 시맨틱이 OOPC를 사용하여 재귀적 방법을 통한 형식 정의가 이루어진다는 점이다. 잘 정의된 문법과 시맨틱으로 말미암아, VOQL*의 질의문들은 명확하고 간결하고 직관적이다. 또한 VOQL* 질의문을 OOPC 질의문으로 번역하는 효과적인 절차를 제공한다. VOQL*는 로직의 문법적 구조를 반영하는 잘 정의된 문법과 귀납적 방법으로 형식 시맨틱을 제공하는 첫번째 시각 질의어이다.

  • PDF

대화행위의 연쇄관계와 대화흐름에 대하여 -[일정협의 대화] 중심으로 (On the Sequences of Dialogue Acts and the Dialogue Flows-w.r.t. the appointment scheduling dialogues)

  • 박혜은;이민행
    • 인지과학
    • /
    • 제10권2호
    • /
    • pp.27-34
    • /
    • 1999
  • 이 연구의 목적은 대화행위 개념을 이용하여 독일어 일정협의 대화에서 나타나는 대화의 일반적인 흐름을 밝히는 데에 있다. 이 연구의 기본가정은 대화행위 개념의 도입이 자동번역시스템의 성능향상에 기여한다는 것이다. 그 이유는 통사적인 분석이나 의미적인 분석이 해결하지 못하는 문제들을, 문맥지식을 활용하여 해결하는 데에 있어 대화행위개념이 매우 유용하기 때문이다. 이 대화행위 개념의 하위분류작업은 독일에서 수행되고 있는 VERBMOBIL 프로젝트에서 이루어진 것이다. 본 연구에서는 전문가들에 의해 전사된 실제 대화 자료들을 대화행위의 개념을 활용하여 분석하고, 하나의 대화차례 안에서 발생하는 대화행위들의 연쇄와 각각의 대화차례 사이에서 발생하는 대화행위 연쇄를 조사했다. 여기서 분석대상으로 삼은 전사자료가 다른 연구에서 제시된 전사 자료와는 다소 차이를 보였기 때문에, 본 연구에서는 연쇄 개념을 대화차례사이에 뿐만 아니라 하나의 대화차례 내부까지 적용시켰다. 그리고 대화행위들간의 연쇄관계를 조사함으로써‘일정협의 대화’의 대화 흐름 도를 도출하였다. 이 대화 흐름 도는 통계분석 절차를 통해 가장 빈도수가 높게나온 대화행위 연쇄들을 토대로 만들어진 모형이기 때문에, 일상적인‘일정협의 대화’에 대한 대표성을 갖는다고 볼 수 있다.

  • PDF

단음절 단어의 사건 관련 전위 (Event-Related Potentials of a Monosyllabic Word)

  • 민병경;김명선;윤탁;김재진;권준수
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.211-215
    • /
    • 2002
  • 본 실험은 종합적 인지과정을 추론할 수 있는 결합 문제(binding problem)를 언어적인지 과정을 통해 알아 본 실험으로, 총 10 명(남:61여:4, 평균나이:24.40 $\pm$ 1.35)의 정상군을 대상으로, 4개의 음소로 이루어진 단음절 명사를 목표 자극(target stimulus)으로 하고, 4개 음소의 임의적인 조합으로서 글자를 이루지 못하는 비목표 자극(non-target stimulus)을, 각각 200 회와 800 회씩 시각적으로 0.5초씩 무작위로 제시하여 128 채널 고밀도 사건관련전위(ERP)를 측정하였다. 이번 실험 결과의 주요 특징은 글자가 아닌 비목표 자극보다 글자인 목표 자극에서 두드러지게 나타난 두정엽 부근의 P500 과 N900 이라고 할 수 있다. 자극 제시 비율의 차이에서 오는 oddball 효과로 인한 기존 P300 의 인지적 의미를 이번 결과의 P500 이 함축한다고 볼 수 있으며, 단음절 단어를 인지할 때, 글자임을 인식하는 순간은 의미적인지 과정이 진행되었다기보다 그 글자의 형태만으로 낯익은 글자인지를 분간하는 것으로 보인다 따라서, 이 경우 기존 언어 실험에 자주 등장하던 의미론적 peak 인 N400 은 보이지 않고, 곧바로 형태적이고, 통사적(syntactic)인 인지 처리 과정인 P500이 나타났다고 해석할 수 있다. 하지만, 이번 실험에서는 N400 대신에 N900 이 나타났다. 이 결과는 이번 ERP 실험과 병행된 프로토콜 분석을 통해, 피험자가 자극 제시 후, 약 900ms 정도에, 이미 제시되고 사라진 글자 자극을 다시 한번 떠올리는 인지 과정이 일어난다는 점과 관련 지어 해석하면, 기존에 의미적(semantic) 인지 과정으로만 해석했던 negative-peak 를 생각(thinking)과 같은 내재적인지 과정(internal cognitive process)으로 확장하여 일반화하는 추론도 생각해 볼 수 있다. 요컨대, 언어인지를 통한 이번 실험을 통해, 뇌파에서 검출되는 negative-peak 은 internal cognitive process로 추측되고, positive-peak 는 external cognitive process 라고 생각된다. 덧붙여, 유의해서 볼 점은 각 peak-topology 에서 Cz 의 진폭이 Fz 보다 크게 나온 점과, 일반적으로 언어 기능을 담당한다는 좌측 측두엽(T7)이 우측(T8)보다 통계적으로 더 유의미한 차이를 보였다는 점등이다.

  • PDF

감정 온톨로지의 구축을 위한 구성요소 분석 (Component Analysis for Constructing an Emotion Ontology)

  • 윤애선;권혁철
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.157-175
    • /
    • 2010
  • 의사소통에서 대화자 간 감정의 이해는 메시지의 내용만큼이나 중요하다. 비언어적 요소에 의해 감정에 관한 더 많은 정보가 전달되고 있기는 하지만, 텍스트에도 화자의 감정을 나타내는 언어적 표지가 다양하고 풍부하게 녹아들어 있다. 본 연구의 목적은 인간언어공학에 활용할 수 있는 감정 온톨로지를 구축할 수 있도록 그 구성요소를 분석하는 데 있다. 텍스트 기반 감정 처리 분야의 선행 연구가 감정을 분류하고, 각 감정의 서술적 어휘 목록을 작성하고, 이를 텍스트에서 검색함으로써, 추출된 감정의 정확도가 높지 않았다. 이에 비해, 본 연구에서 제안하는 감정 온톨로지는 다음과 같은 장점이 있다. 첫째, 감정 표현의 범주를 기술 대상과 방식에 따라 6개 범주로 분류하고, 이들 간 상호 대응관계를 설정함으로써, 멀티모달 환경에 적용할 수 있다. 둘째, 세분화된 감정을 분류할 수 있되, 감정 간 차별성을 가질 수 있도록 24개의 감정 명세를 선별하고, 더 섬세하게 감정을 분류할 수 있는 속성으로 강도와 극성을 설정하였다. 셋째, 텍스트에 나타난 감정 표현을 명시적으로 구분할 수 있도록, 경험자 기술 대상과 방식 언어적 자질에 관한 속성을 도입하였다. 넷째, 본 연구의 감정분류는 Plutchik의 분류와 호환성을 갖고 있으며, 언어적 요소의 기술에서 국제표준의 태그세트를 수용함으로써, 다국어 처리에 활용을 극대화할 수 있도록 고려했다.

  • PDF

규칙 정보를 이용한 은행 전표 상의 필기 한글 금액 인식 (Handwritten Korean Amounts Recognition in Bank Slips using Rule Information)

  • 지태창;이현진;김은진;이일병
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2400-2410
    • /
    • 2000
  • 한글 인식에 관한 기존의 연구는 한글 낱자 인식에 치우쳐 왔고, 실제 문서 인식 시스템 개발을 위한 연구는 거의 이루어지지 않았다. 그래서, 본 논문에서는 인식된 문자열의 오류 교정에 관한 연구로서 한글 금액열 인식기를 개발하였다. 한글 낱자 인식에서 문제가 되는 부분은 데이터의 방대함 때문에 발생한다. 컴퓨터상에서 표현될 수 있는 한글 낱자의 개수는 2000여 자 이상이다. 따라서, 기존의 연구들은 이러한 문제점을 해결하기 위해서 실생활에서 많이 쓰이는 낱자에 대해서만 실험을 했다. 하지만, 실험 대상 낱자의 개수를 1000여 자 정도로 줄였어도, 여전히 80%대 이하의 저조한 인식률을 보이고 있다. 이렇게 인식률이 저조한 범용 한글 낱자 인식기를 한글 금액 인식이라는 제한된 상황에서 사용하는 것은 적합하지 않다. 따라서, 본 연구에서는 한글 금액에 사용되는 16자의 한글 낱자만 인식할 수 있는 인식기를 제안하였다. 제안한 한글 낱자 인식기는 통계적 인식기를 사용한 다중 인식기 형태로 만들었고, 이를 통해 개별적인 특징으로 인한 인식률의 저하를 방지할 수 있다. 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액에 대한 구조적인 규칙 정보를 이용하였다. 이 규칙을 이용하여 한글 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액애 대한 구조적인 규칙 정보를 이용하였다. 이규칙을 이용하여 한글 금액의 인식 단위에 대한 인식 결과의 오류 보정을 할 수 있다. 실험 결과 제안한 한글 낱자 인식기의 1후보까지 인식률은 95.49%였고, 4후보까지 인식률은 99.72%였다. 그리고, 후처리기의 처리를 거친 금액열에 대해서는 신뢰도가 96.42%였다. 본 논문에서는 사용된 낱자의 개수가 적고, 구조안에 규칙 정보가 존재하는 한글 문자열의 경우에 제한된 글자를 인식하는 낱자 인식기와 오류를 교정할 수 있는 후처리기로 문자열 인식의 신뢰도를 향상시킬수 있는 방법을 제안하였다.

  • PDF

PPEditor: 한국어 의존구조 부착을 위한 반자동 말뭉치 구축 도구 (PPEditor: Semi-Automatic Annotation Tool for Korean Dependency Structure)

  • 김재훈;박은진
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.63-70
    • /
    • 2006
  • 말뭉치(corpus)는 많은 언어 정보를 포함하고 있으며, 언어처리 및 계산언어학 분야에서 다양한 용도로 사용되고 있다. 그러나 말뭉치에 언어 정보를 부착하는 데는 많은 시간과 인력이 소요된다. 이 문제를 완화시키기 위해서 말뭉치 구축 도구가 반드시 요구된다. 본 논문에서는 한국어 의존구조 부착을 위한 말뭉치 구축 도구의 설계 및 구현에 관해서 기술한다. 가장 이상적인 방법은 주석자가 전혀 개입하지 않고, 말뭉치를 구축하는 것이나 이것은 사실상 불가능하다. 따라서 대부분의 말뭉치 구축 도구는 반자동으로 구성되어 있으며, 본 논문에서 제안된 도구도 반자동이다. 제안된 도구는 언어 분석기의 분석 결과에 내포된 오류를 효과적으로 수정할 수 있고, 또한 가능한 한 반복적인 작업을 피할 수 있으며 쉽게 사용할 수 있도록 인터페이스를 설계하였다. 제안된 시스템을 이용해서 20어절 이상의 1만 문장에 의존구조를 부착해 보았다. 잘 훈련된 8명의 주석자들이 매일 4시간씩 2개월 동안 구축하였으며, 그 결과는 정확하고 일관성 있는 말뭉치를 구축할 수 있었으며, 작업 시간과 인력도 크게 줄일 수 있었다.

VHDL 컴파일러 후반부의 VHDL-to-C 사상에 관한 설계 및 구현 (A design and implementation of VHDL-to-C mapping in the VHDL compiler back-end)

  • 공진흥;고형일
    • 전자공학회논문지C
    • /
    • 제35C권12호
    • /
    • pp.1-12
    • /
    • 1998
  • 본 논문은 VHDL 컴파일러 시스템에서 후반부의 VHDL-to-C 사상 과정을 설계 및 구현한 연구에 관하여 기술한다. 컴파일러 전반부가 VHDL 설계 프로그램으로부터 발생시킨 중간 형식의 분석 데이터는 컴파일러 후반부의 VHDL-to-C 사상을 통해서 VHDL 어의가 구현된 C 코드 모델로 변환된다. 기본적으로 VHDL 어의를 표현하기 위한 C 코드 모델은 선언부, 구축부, 초기화부 및 실행부의 4개 기능적 템플릿으로 구성된다. 사상 과정에서는 사상 단위와 기능분류에 따른 129개 C 사상 템플릿과 반복적 알고리듬을 통하여 터미널 정보를 이용해서 C 코드를 생성하게 된다. C 프로그램의 구성은 코드를 직접 템플릿으로 출력하거나, 생성된 코드를 데이터큐에 중간 저장시키고 상위사상 결과에 결합시켜서 이루어진다. 설계 및 구현된 VHDL-to-C 사상기는 Validation Suite의 96% VHDL 구문 구조에 대해서 100% C 코드 모델을 완벽하게 사상할 수 있음을 보였다. 또한 VHDL-to-C 사상의 성능에서 생성된 코드의 메모리 오버헤드가 해석기 방식보다는 작고 직접코드 방식보다는 크지만 VHDL 프로그램 크기에 대해서 완만한 증가 경향을 보이고 있으며, 사상처리 시간에서는 사상 메카니즘의 구현에서 최적화 및 개선이 요구됨을 나타내었다.

  • PDF

지역 및 전역 의미집합을 이용한 온톨로지 병합 및 정렬 알고리즘 (An Algorithm for Ontology Merging and Alignment using Local and Global Semantic Set)

  • 김재홍;이상조
    • 전자공학회논문지CI
    • /
    • 제41권4호
    • /
    • pp.23-30
    • /
    • 2004
  • 기존 웹의 단점을 보완하기 위해 시맨틱 웹 개념이 제안되었고, 시맨틱 웹에서 중요한 역할을 하는 온톨로지는 분산 독립된 형태로 개발되는 특성으로 인해 동일한 도메인에 대해 중복 저작될 수 있는 문제점을 가지고 있다. 따라서 온톨로지의 공유와 재사용이 중요한 문제로 부각되고 있으며, 온톨로지 병합 덴 정렬이 한 해결책이 될 수 있다. 현재까지 제안된 반자동 방식의 온톨로지 병합 및 정렬 알고리즘은 온톨로지 전체에서 가지는 의미정보가 아닌 지역적 구문정보만을 이용하고, 반자동 작업 특징으로 인해 온톨로지 엔지니어에게는 지루한 작업이 되어 결과의 품질이 낮아질 수 있다는 단점이 있다. 본 논문에서는 지역 및 전역 의미집합 개념을 이용하여 이러한 단점을 개선한 온톨로지 병합 및 정렬 알고리즘을 제안하였다. 제안된 알고리즘을 구현하여 OWL 언어로 작성된 온톨로지에 대해 실험한 결과 91%의 정확도를 보였다. 본 논문에서 제안하는 알고리즘을 이용하여 온톨로지 병합 및 정렬 작업을 수행하면 온톨로지 공유 및 재활용률을 높이고, 기존 온톨로지를 활용한 새로운 온톨로지의 저작시간도 단축시킬 수 있을 것으로 기대된다. 또한, 온톨로지 매핑등 온톨로지들 간의 의미 정보 교환이 필요한 다른 어떤 분야에도 쉽게 적용이 가능할 것으로 기대된다.