• 제목/요약/키워드: Syntactic

검색결과 719건 처리시간 0.023초

문법화와 코퍼스의 관점에서 본 영어 분리부정사 통사구조 (Syntactic Structure of English Split Infinitives from the Perspectives of Grammaticalization and Corpus)

  • 김양순
    • 문화기술의 융합
    • /
    • 제6권3호
    • /
    • pp.245-251
    • /
    • 2020
  • 영어의 분리부정사구문을 통시적 연구인 문법화의 관점에서 중세영어이후 출현 동기를 살펴보고 COHA, COCA와 같은 코퍼스에 기반하여 주로 미국영어에 나타나는 현재영어(PDE)의 분리부정사의 정당성을 논의하는 것이 연구의 목표이다. 중세영어 이전에는 비문법적이었던 부정사 첨사인 to와 원형동사 사이에 부사 등이 위치하는 [to + 부사 + 동사] 형태의 분리부정사가 어떻게 현재영어에서는 문법적 구문이 되었는지에 대한 출현 동기와 정당성을 살펴본다. 문법화와 코퍼스의 실증적 자료에 기초하여 분리부정사구문의 문법성을 입증하고 영어 분리부정사구문의 출현에 관한 통시적 분석인 문법화 과정을 그 증거로 제시한다. 분리부정사가 왜 만들어지는가의 질문에 대한 답으로 동사이동의 소멸이라는 통시적 문법화를 들 수 있다. 코퍼스 자료에 기초한 통사·화용적인 이유는 표현의 명확성 즉, 탈중의성을 위한 것이거나 분리자인 부사를 통해 인상적인 강조를 하기 위한 것이다. 결론적으로 부사가 to와 원형동사를 분리할 것인가 말 것인가의 문제는 더 이상 문법적 논의의 대상이 아니며 앞으로도 분리부정사의 형태는 자연스러운 문법적 구문으로 문맥상 필요한 경우 더욱 증가하는 추세를 보일 것이다.

문서내 단어간 비교를 통한 철자오류 검출 (Detecting Spelling Errors by Comparison of Words within a Document)

  • 김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권12호
    • /
    • pp.83-92
    • /
    • 2011
  • 일반 출판물과는 달리 문서 편집기를 사용하여 작성중에 있는 문서에는 사용자의 실수에 의한 오타 오류가 자주 발생한다. 이와 같은 온라인 문서에서 맞춤법 오류의 다수를 차지하는 사용자의 오타 오류는 대부분 자판을 입력할 때 주위 문자를 잘못 입력하는 경우이다. 통상적인 철자 검사기는 이러한 오류들을 형태소 분석기를 이용하여 검출하고 교정하게 된다. 즉, 입력된 어절에 대해 형태소 분석을 시도하고 분석되지 않은 어절을 철자 오류로 간주하게 된다. 그러나 오타 입력된 어절임에도 불구하고 형태소 분석에 성공한 경우에는 이와 같은 방법으로는 검출이 불가능하다. 본 논문에서는 기존 방법들이 검출하지 못했던 철자 오류들을 검출해 낼 수 있는 방법을 제시한다. 이 방법은 문서 작성자의 오타 입력은 반복하여 입력되지 않는 경향이 있으므로 저빈도로 발생한다는 특성에 기반하여 제안되었다. 저빈도의 어절의 자소 대치를 통해 문서의 특정 구간 내의 다른 단어와 비교하여 오타일 확률이 적은 단어인 자주 나오는 단어와 매칭이 된다면 일단 오류 후보로 가정하는 것이다. 여기에는 몇 가지 경험적인 제약이 추가되어야 한다. 이러한 단어간 비교에 의한 추정은 기존에 발견하지 못했던 구문오류뿐만 아니라 일부 의미오류까지 검출할 수 있으며, 교정 후보 선정시 가중치 적용에도 사용될 수 있다.

대명사의 성별단서와 선행어 격이 참조해결의 즉각성에 미치는 효과 (The Effects of Gender Cue and Antecedent Case on the Immediacy of Pronominal Resolution)

  • 이재호
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.51-86
    • /
    • 1993
  • 대명사의 성별단서와 선행어의 격이 참조해결에 즉각적으로 작용하는지를 살펴보기 위해서 선행어의 점화효과를 시간경과에 따라 측정한 세개의 실험이 실시되었다. 실험1은 성별단서와 선행어 격에 따라서 선행어의 활성화 수준이 변화하는지를 알아보기 위해서 자율조절읽기과제를 실시하면서 대명사 직후와 문장 마지막 위치에서 선행어에 대한 탐사재인과제를 실시하였다. 선행어의 활성화 수준은 성별단서나 선행어 격의 영향을 받지않았으며, 그것의 수준은 대명사 직후에서 문자의 마지막까지 일정한 수준을 유지하였다. 실험2에서는 RSVP(rapid stimulus visual presentation) 방법을 사용하여 300msec에서 단위로 맥락글을 제시한후에 대명사 제시후 시간경과 0와 250msec에서 선행어와 비선행어에 대한 탐사재인과제를 실시하였다. 대명사의 성별단서가 명료한 경우에는 선행어가 비선행어에 비해서 탐사재인이 빨랐다. 시간경과 0mesc에서는 성별단서의 효과가 두드러졌으며, 시간경과 250msec에서는 선행어의 격효과가 두드러졌다. 조건에서 선행어의 격효과를 시간경과 250과 750msec에서 탐사재인과제를 실시하였다. 선행어가 주격인 조건이 선행어가 목적격인 조건에 비해서 점화효과가 많았다. 세개의 실험에서 나타난 결과는 대명사의 선행어 할당이 즉각적으로 일어난다는 사실을 분명히 하였다. 그렇지만 선행어 할당이 즉각적으로 일어나기 위해서는 먼저 대명사의 성별단서가 일차적으로 선행어 할당에 작용하며, 그다음에 선행어의 격효과가 순차적으로 작용한다는 사실을 입증하였다.

잘못 형성된 입력문장에 대한 CHART PARSER (CHART PARSER FOR ILL-FORMED INPUT SENTENCES)

  • 민경호
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.177-212
    • /
    • 1993
  • 본 연구는 잘못 형성된 입력에 대한 멜리쉬의 연구(1989)에 기반하고 있다. 이 글은 chart-based parser를 이용하여 구문론적 차원에서 잘못 형성된 입력 문자의 복구에 촛점을 둔다. 멜리쉬의 체계는 두가지 분석기, 즉 잘형성된 입력 분석기와 잘못 형성된 입력 분석기로 구성되는데, 필자의 연구는 그에 생각을 따르고 있다. 이글에서는 주로 chartparsing의 개념, 잘못형성된 입력에 대한 분석전략이 논의된다. 또한 필자가 제시하는 체계의 디자인과 구현, 필자의 체계를 멜리쉬의 체계와의 비교와 같은 사항들이 다루어질 것이다.

시소러스를 기반으로 하는 자동색인 시스템에 관한 연구 (The Development of an Automatic Indexing System based on a Thesaurus)

  • 임형묵;정상철
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.213-242
    • /
    • 1993
  • 그동안 자동색인 기법에 대해서는 단일어 색인,구색인,시소러스 기반 색인 등의 연구가 이루어져 왔는데,단일어 색인 기법이 단일어에 기초한 단순한 색인 방법 임에도 불구하고 다른 두가지 기법보다 일반적으로 우수하다고 알려져왔다. 시소러스 기반 색인은 이중에서도 검색효율이 낮은 것으로 알려져 왔는데,이는 일반적으로 시소러스가 포함하고 있는 색인용어들이 한정되어 있어 색인하려는 자료들이 이색인 용어에 부합(match)되지 않을 경우 색인 자체가 이루어 지지 않기 때문이다. 본 연구에서는 시소러스 기반 색인이 지금까지 기법으로는 검색효율이 좋지 않지만 실제 전문 색인들이 하는 색인과 매우 유사하다는 장범에 기초하여,입력 자료를 구문분석하고,분석된 자료들과 색인용어들을 정확부합(exact match)이 아닌 부분부합(partial match)을 통하여 색인 함으로써 검색효율이 우수한 시소러스기반 자동 색인 시스템을 개발하고자 한다. 본 연구에서 개발된 색인 시스템이 THINS는 우선 시소러스를 트리형태로 구성하고 입력자료들을 KAIST에서 개발한 언어번역기 MATES/EK를 통하여 구문분석한 후 명사구들만 뽑아낸다.그다음 명사구에 있는 용어들중 불용어를 제거하고 스테밍작업을 진행한후 생기는 형태를 색인 용어들과 부분부합 과정을 반복하여,유사한 색인 용어들과 가능하면 색인이 되도록 한다. 본 연구에서는 CACM 데이타 집합을 가지고 본 시소러스 기반 색인 시스템과 단일어 색인방식을 혼성지식기반 시스템인 HYKIS에서 성능을 평가하였다.이 성능평가에서 시소러스를 기반으로 하는 색인 시스템이 단일어 색인방식보다 회상도에서는 8-9%떨어지지만 정확도에서는 10%정도 높은 결과를 나타내었다.그러나 이는 기존의 시소러스 기반시스템이 단일어 색인 방식보다 정확도가 25%-30%정도 떨어진다는 것을 비추어 볼때 기존의 방식보다 우수한 것이라 평가된다.또한 CACM 에서 제공하는 시소러스인 CRCS 가 1000여개의 색인어밖에 포함하고 있어 매우 불완전한 것이라는 것을 고려하면,THINS가 최근에 개발되고 있는 시소러스와 접속된다면 매우 우수한 검색효율을 내리라 사료된다.

도메인 적응 기술을 이용한 한국어 의미역 인식 (Korean Semantic Role Labeling Using Domain Adaptation Technique)

  • 임수종;배용진;김현기;나동렬
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.475-482
    • /
    • 2015
  • 높은 성능의 의미역 인식 시스템의 개발을 위해서는 대상 도메인에 대한 대량의 수동 태깅 학습 데이터가 필요하다. 그러나 충분한 크기의 의미역 인식용 학습 데이터는 오직 소수의 도메인에서만 존재한다. 소스 도메인의 시스템을 상대적으로 매우 작은 학습 데이터를 가진 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 15% 정도 성능 하락이 발생한다. 이러한 도메인 변경에서의 성능 하락 현상을 최소화하기 위해 본 논문에서는 2 가지 기법을 제시한다. 첫째, 도메인 적응 방법론의 하나인 Prior 모델에 기반하여 개발된 한국어 의미역 인식 시스템을 위한 도메인 적응 알고리즘을 제안한다. 둘째, 크기가 작은 타겟 도메인 데이터를 이용할 때 데이터 희귀 문제의 감소를 위해 소스 도메인 데이터 이용시 보다 단순화된 형태소 태그와 구문 태그 자질을 사용할 것을 제안한다. 뉴스 도메인에서 개발된 시스템의 위키피디아 도메인에의 적용과 관련하여 다른 연구의 도메인 적응 기술과 우리가 제안한 방법을 비교 실험하였다. 우리의 두 가지 방법을 같이 사용할 때 더 높은 성능을 달성하는 것을 관찰하였다. 우리 시스템은 F1-score 64.3% 성능으로서 기존의 다른 도메인 적응 기술들과 비교하여 2.4~3.1% 더 높은 성능을 가지는 것으로 관찰되었다.

한국어 내포 머리어 관계절의 통사적 특성과 습득 연구 (A Study of Syntactic Properties and Acquisition of Head-Internal Relative Clauses in Korean)

  • 조수근
    • 인지과학
    • /
    • 제14권2호
    • /
    • pp.49-56
    • /
    • 2003
  • 이 논문은 한국어 내포 머리어 관계절의 통사적인 특징을 살펴보고 이 구문이 한국어를 모국어로 사용하는 아동들에 의해 어떻게 습득되는가를 조사하는데 그 목적이 있다. 먼저, 한국어 내포 머리어 관계절 구문의 통사적인 특징을 살펴보기 위하여 내포 머리어 관계절을 생성문법에 비추어 분석을 하였다. 이 분석을 통해, 한국어의 내포 머리어 관계절은 일반적인 외포 머리어 관계절에 비해 통사적으로 사용이 더 제한되어 있다는 것을 알 수 있었다. 다시 말해, 내포 머리어 관계절은 여러 개의 절을 넘어 관계화가 일어날 수 있는 외포 머리어 관계절과 달리 하나 이상의 절을 넘어 관계화가 일어날 수 없다. 또한 내포 머리어 관계절은 주어, 직접목적어, 간접목적어, 전치사의 목적어 등이 관계화될 수 있는 외포 머리어 관계절과 달리 단지 주어와 직접목적어만이 관계화가 가능하다. 그리고, 내포 머리어 관계절의 습득 연구를 위해 관찰 방법을 이용한 내포 머리어 관계절의 자료뿐만 아니라 이해도 측정 실험과 산출 실험을 이용한 자료도 같이 분석하였다. 이들 자료의 분석을 통해, 내포 머리어 관계절은 외포 머리어 관계절에 비하여 아동들이 이해하고 말하기가 더 쉽고 따라서 외포 머리어 관계절에 비해 아동들에 의해 더 일찍 습득됨을 알 수 있었다. 보통 내포 머리어 관계절은 성인들에게는 잘 사용되지 않는다고 알려져 있는데 아동들에게 특히 언어 발달 과정의 이른 시기에 있는 아동들에게 외포 머리어 관계절의 습득에 앞서 많이 사용되어진다는 습득 연구에서의 결과는 언어발달의 이른 시기에 있는 아동들이 내포 머리어 관계절을 어떻게 이용하는지를 말해준다. 다시 말해, 아동들은 언어 발달의 이른 시기에는 이해하고 말하기 어려운외포 머리어 관계절 대신 쉬운 내포 머리어 관계절을 임시적으로 사용하는 것으로 볼 수 있겠다. 실제, 외포 머리어 관계절은 언어 발달 과정에서 늦게 습득이 되는 것으로 보고되고 있다.

  • PDF

볼프강 바인가르트의 구문론적 특성에 의한 타이포그래피 고찰 (Considerations on Wolfgang Weingart's Typography based on Syntactic Characteristics)

  • 허진
    • 한국콘텐츠학회논문지
    • /
    • 제12권7호
    • /
    • pp.86-93
    • /
    • 2012
  • 현대 타이포그래피 발전의 토대는 정확한 의미전달을 위한 형태적 기능성과 합리성에 가치를 두었던 모더니즘과 스위스국제타이포그래피 시대에 걸쳐 이루어 졌다. 그러나 포스트모더니즘으로 넘어가면서 타이포그래피의 합리적인 기능성 보다 미학적 혹은 관념적인 부분까지 확대 해석되어야 한다는 의견이 유행하였다. 실제로 포스트모더니즘의 대표적인 그래픽디자이너로 꼽히는 댄 프리드먼이나 에이프릴 그레이먼의 작품들은 모더니즘 시대의 작품들과 달리 그래픽디자인도 때로는 자율적인 예술표현의 매체가 될 수 있음을 보여 주었다. 그 변화의 처음에 볼프강 바인가르트가 있었다. 그가 보여준 타이포그래피의 개념 확장을 위한 다채로운 시도는 훗날 '뉴웨이브' 발달에 커다란 영향을 끼쳤으며 그의 실험주의 정신은 오늘날 타이포그래피의 기능성과 조형성 표현에 획기적인 가치변화를 주었다. 그러나 본 논문에서는 그의 선구자적 역할에 대한 가치평가가 아닌 그의 작품에 표현된 타이포그래피의 이론적 배경과 그에 따른 실험적 방법에 대하여 고찰하고자 한다. 이는 바인가르트의 작품배경이 포스트모더니즘의 작가주의적 견해에서 비롯된 것이 아닌 구문론적 이론에 근거한 타이포그래피의 개념 확장을 위한 것임을 재조명하고자 한다.

문장추상화 : 개념추상화를 도입한 문장교열 (Sentence ion : Sentence Revision with Concept ion)

  • 김곤;양재곤;배재학;이종혁
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.563-572
    • /
    • 2004
  • 문장추상화(Sentence Abstraction)는 문장의 의사전달 기능이 보존된 단순화이다. 이는 문장교열(Sentence Revision)과 개념추상화(Concept Abstraction)를 동시에 가능하게 한다. 문장교열은 사람이 생각한 바와 문장으로 표현된 의미의 차이를 해결하는 방법이다. 개념추상화는 개념들의 공통된 요소로부터 얻은 보편적인 관념을 표현하는 것이다. 문장추상화는 문장의 주요구성성분들을 선별해 내고, 이들의 의미적인 정보를 파악하여 상위개념을 표현함으로써 문장교열과 개념추상화를 가능하게 한다. 본 논문에서는 문장추상화를 위한 구문분석기 LGPI+와, 온톨러지 OfN을 구체화하였다. 문장추상기 SABOT는 LGPI+와 OfN을 활용하며, 구문분석 결과를 처리하여 문장에서 추상화 할 후보난어를 선택한다. 문장추상화를 활용한 원문이해 시스템으로 23개 이야기의 58개 문단에 대해 중요 문장에 대한 문장재현율과 선별된 문장들의 주제관련성을 확인해 보았다. 실험결과, 문장재현율은 54~72%의 범위이었고, 주제관련성은 76~86% 정도의 비율로 나타났다. 이를 유사 시스템과 비교해 보았을 때, 약 10~20% 정도의 성능향상을 보인다. 본 논문에서는 문장추상화를 활용하여 글의 화제문을 효율적으로 선택할 수 있는 문장교열과 원문의 이해심도를 보다 더 깊게 할 수 있는 개념추상화가 가능함을 확인하였다.

통사화용의 접합면에서 본 영어 헤지표현의 유형과 기능 (Types and Functions of English Hedges at a syntax-pragmatics Interface)

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.381-388
    • /
    • 2020
  • 본 논문의 목적은 주로 사회언어학과 화용론 분야에서 연구되어 온 영어 '헤지(Hedges)' 혹은 헤지표현을 형태통사적 관점과 화용적 관점을 연관지어 논의하는 것이다. 일반적으로, '헤지표현이 없는 자연언어는 없다'는 추론이 가능한데, 그것은 어떤 자연언어에나 공손성, 혹은 화자가 청자보다 낮은 자세로 말하고자 하는 문법기제가 있음이 널리 인정되고 있기 때문이다. 헤지에 대한 기존의 이론적 연구는 주로 화용적 관점에서 헤지의 유형 분류와 화용적 기능, 그리고 출현빈도 비교 등의 수준에 그치고 있다. 즉, 헤지표현을 형태통사적 개념인 자질로 나타내려는 시도는 거의 발견되지 않는다. 언어현상으로서의 헤지는 유무에 따라, 화용부와 통사부의 접합면에서 [+hedged]와 [-hedged]로 이분지화 가능하며, 이 화용자질은 형태통사부와 상호작용 하므로 협의의 통사부에서 분리될 수 없다. 본 논문에서, 헤지는 공손성이 표현되는 화용자질로서, 그 자질이 표시되는 접합면 영역이 구조적으로 있음을 지적하였다. 즉, CP+층위가 화용자질인 헤지자질이 인코딩되는 영역임을 제안하였다. 최근에는 범언어적 관점에서 혹은 영어교육의 학술적 EFL/ESL 글쓰기, 또는 담화분석 등에 헤지 표현의 식별 여부나 용례를 연구하는 경향이 있다. 본 논문은 그동안 간과되어온 동등접속문, 병렬종속문, 부분사 구문 등을 헤지에 포함시키고, 보다 구조적이고 이분지적(±)인 방식을 제안함으로서, 제2언어습득의 이해, 글로벌 커뮤니케이션 혹은 인공지능 자연언어 알고리즘에 화용 자질을 도입할 수 있는 구조적이고 이론적인 기반을 제공하는데 그 목적이 있다.