• 제목/요약/키워드: Lexical Complexity

검색결과 19건 처리시간 0.019초

Case Frames of the Old English Impersnal Cnstruction: Conceptual Semantic Analysis

  • Jun, Jong-Sup
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권2호
    • /
    • pp.107-126
    • /
    • 2005
  • The impersonal or psyc-predicate construction in Old English (=OE) poses a special challenge for most case theories in generative linguistics. In the OE impersonal construction, the experiencer argument is marked by dative, accusative, or nominative, whereas the theme is marked by nominative, genitive, or accusative, or by a PP. The combinations of possible cases for experiencer and theme are not random, bringing about daunting complexity for possible and impossible case frames. In this paper, I develop a conceptual semantic case theory (a la Jackendoff 1990, 1997, 2002; Yip, Maling, and Jackendoff 1987) to provide a unified account for the complicated case frames of the OE impersonal construction. In the conceptual semantic case theory, syntax and semantics have their own independent case assignment principles. For impersonal verbs in OE, I propose that UG leave an option of determining either syntactic or semantic case to lexical items. This proposal opens a new window for the OE impersonal construction, in that it naturally explains both possible and impossible case frames of the construction.

  • PDF

생성문법에서 도출적 접근과 표시적 접근 (Derivational approach and representational approach in generative grammar)

  • 최숙희
    • 영어어문교육
    • /
    • 제10권1호
    • /
    • pp.179-200
    • /
    • 2004
  • The purpose of this study is to investigate the adequacy of derivational approach and representational approach to syntactic theories in generative grammar. As the generative grammar is based on the derivational process of syntactic theories, it is suggested that derivational approach is more valid than representational approach. Move, Economy Principle, Local Economy and Label-free Phrase Structure in Minimalist framework support the preference of derivational approach to representational approach with the elimination of computational complexity, minimality, and label-free phrase structure. Syntactic structure is considered as the result of the interaction of the properties of lexical items containing probe and economy conditions constrained by bare output conditions. On the other hand, Pseudogapping in Lasnik(1999) is analyzed in terms of Object Shift, that is, overt raising to Spec of $Agr_o$ and the PF deletion of VP in representational approach. Hence, it is suggested that the combination of derivational and representational approaches to syntactic theories can be admitted in generative grammar.

  • PDF

통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 (Determination of an Optimal Sentence Segmentation Position using Statistical Information and Genetic Learning)

  • 김성동;김영택
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.38-47
    • /
    • 1998
  • 실용적인 기계번역 시스템을 위한 구문 분석은 긴 문장의 분석을 허용하여야 하는데 긴 문장의 분석은 높은 분석의 복잡도 때문에 매우 어려운 문제이다. 본 논문에서는 긴 문장의 효율적인 분석을 위해 문장을 분할하는 방법을 제안하며 통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 방법을 소개한다. 문장 분할 위치의 결정은 분할 위치가 태그된 훈련 데이타에서 얻어진 어휘 문맥 제한 조건을 이용하여 입력문장의 분할 가능 위치를 결정하는 부분과 여러 개의 분할 가능 위치 중에서 안전한 분할을 보장하고 보다 많은 분석의 효율 향상을 얻을 수 있는 최적의 분할 위치를 학습을 통해 선택하는 부분으로 구성된다. 실험을 통해 제안된 문장 분할 위치 결정 방법이 안전한 분할을 수행하며 문장 분석의 효율을 향상시킴을 보인다.

  • PDF

코퍼스 지표를 활용한 모의 토익시험의 유용성 검증 : 난이도와 변별도 분석을 중심으로 (Verification of the Usefulness of the Mock TOEIC Test using Corpus Indices : Focusing on the Analysis of Difficulty and Discrimination)

  • 이예나
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.576-593
    • /
    • 2021
  • 본 연구에서는 토익 시험의 정답률과 변별도에 영향을 미치는 구조적인 요인이 무엇인지 분석하기 위하여 문항 분석에서 도출된 각 파트별 코퍼스 지표들을 분석하였다. 이를 위하여 모의 토익 시험의 정답률과 변별도에 대한 코퍼스 요인들의 회귀 분석을 실시하였고, 분석 결과는 다음과 같다. 정답률에 대해서는 기초산출치중에서 word_length, no_word_sentence1, sentence_length, 정합성 지표들 중에서는 LSA_overlap_adjacent_sentences, 어휘 다양성 지표들 중에서는 MTLD_VOCD, 접속사 지표들 중에서는 All_logical_causal_connectives_incidence, 상황모형 지표들 중에서는 casual_particles_causal_verbs_Ratio, 통사적복잡성 지표들 중에서는 Minimal_Edit_Distance1, Left_embeddedness, 통사적 패턴밀도 지표들 중에서는 Infinitive_density, Preposition_phrase_density 등이 음의 영향을 미치는 것으로 나타났다. 이러한 코퍼스 요인들은 토익의 정답률을 낮추는 효과가 있기 때문에 하위 레벨의 학습자들이 단기적인 학습효과를 향상시킬 수 있는 중요한 정보들을 제공해 줄 수 있을 것이다. 변별도에 대해서는 어휘 다양성 지표들 중에서 MTLD_VOCD, 접속사 지표들 중에서는 All_logical_causal_connectives_incidence, Additive_connectives_incidence, 통사적 패턴밀도 지표들 중에서는 Infinitive_density, 어휘정보 지표들 중에서는 person1_2_pronoun_incidence 등이 정의 영향을 미치는 것으로 나타났다. 이러한 코퍼스 요인들은 변별도 증가에 영향을 주기 때문에 영어 능력 하위 그룹에 필요한 학습 프로그램을 개발하는 데 있어서 활용될 수 있을 것이다.

영한 기계번역에서의 영어 품사결정 모델 (A Model of English Part-Of-Speech Determination for English-Korean Machine Translation)

  • 김성동;박성훈
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.53-65
    • /
    • 2009
  • 영한 기계번역에서 영어 단어의 품사결정은 번역할 문장에 사용된 어휘의 품사 모호성을 해소하기 위해 필요하다. 어휘의 품사 모호성은 구문 분석을 복잡하게 하고 정확한 번역을 생성하는 것을 어렵게 한다. 본 논문에서는 이러한 문제점을 해결하기 위해 어휘 분석 이후 구문 분석 이전에 품사 모호성을 해소하려 하였으며 품사 모호성을 해소하기 위한 CatAmRes 모델을 제안하고 다른 품사태깅 방법과 성능 비교를 하였다. CatAmRes는 Penn Treebank 말뭉치를 이용하여 Bayesian Network를 학습하여 얻은 확률 분포와 말뭉치에서 나타나는 통계 정보를 이용하여 영어 단어의 품사를 결정을 한다. 본 논문에서 제안한 영어 품사결정 모델 CatAmRes는 결정할 품사의 적정도 값을 계산하는 Calculator와 계산된 적정도 값에 근거하여 품사를 결정하는 POSDeterminer로 구성된다. 실험에서는 CatAmRes의 동작과 성능을 테스트 하기 위해 WSJ, Brown, IBM 영역의 말뭉치에서 추출한 테스트 데이터를 이용하여 품사결정의 정확도를 평가하였다.

  • PDF

표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서 (Generalized LR Parser with Conditional Action Model(CAM) using Surface Phrasal Types)

  • 곽용재;박소영;황영숙;정후중;이상주;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.81-92
    • /
    • 2003
  • 일반화 LR(Generalized LR, 이하 GLR) 파싱은 선형 스택을 사용하는 전통적인 LR 파싱 방식의 한계를 극복하도록 만들어진 LR 파싱 기법의 하나로서, LR 기법에 여러 가지 매커니즘을 통합하여 자연어 파싱에 응용하는 작업의 토대가 되어 왔다. 본 논문에서는 기존의 확률적 LR 파싱 기법이 가지고 있는 문제를 개선한 조건부 연산 모델(Conditional Action Model)을 제안한다. 기존의 확률적 LR 파싱 기법은 그래프 구조 스택의 복잡성으로 인해 상대적으로 제한된 문맥 정보만을 사용하여 왔다. 제안된 모델은 부분 생성 파스의 표현을 위하여 표층 구문 타입(Surface Phrasal Type)을 사용하여 그래프 구조 스택에 들어 있는 구문 구조를 기술함으로써 좀 더 세분된 구조적 선호도를 파서에 반영시킬 수 있다. 실험 결과, 어휘를 고려하지 않고 학습한 조건부 연산 모델로 구현된 본 GLR 파서는 기존의 방식보다 약 6-7%의 정확도 향상을 보였으며, 본 모델을 통해 풍부한 스택 정보를 확률적 LR 파서의 구조적 중의성 해결에 효과적으로 사용할 수 있음을 보였다.

한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법 (Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean)

  • 조형준;박종철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.448-462
    • /
    • 2000
  • 자연언어처리에 있어서 병렬구문은 분석의 복잡성, 단어의 애매성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 본 논문에서는 한국어에서 발생하는 병렬문의 통사적 특징을 능력문법 (competence grammar)의 입장에서 접근하고 분석된 결과를 기반으로 하여 한국어 병렬문 해석을 위한 결합범주문법 (Combinatory Categorial Grammar)을 제안한다. 제안된 결합범주문법을 사용해서 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 통사적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다. 유도된 정보들을 통해 일반적으로 한국어 병렬문의 주된 기능이라고 생각되는 두 문장이 가지는 정보를 대조, 비교하는 기능이 표현될 수 있음을 보인다. 말뭉치를 분석하여 병렬문이 한국어 처리에서 차지하는 비중과 제시한 문법으로 처리할 수 없는 문형들에 대한 논의를 제공한다.

  • PDF

창의적 이야기 작문용 세 그림의 동형 조사: 'Dog Owners,' 'Lost Dog,' 'Overslept' (An Investigation into the Equivalence of Three Pictures for Creative Story Writing: 'Dog Owners', 'Lost Dog', and 'Overslept')

  • 서희정;배정옥
    • 영재교육연구
    • /
    • 제26권4호
    • /
    • pp.699-719
    • /
    • 2016
  • 창의적 사고와 언어기술을 평가하는데 동형검사로 판명된 대체 그림들이 절실히 요구되고 있다. 본 연구는 창의적 쓰기 과제용으로 최근 개발된 세 그림(이름: 'Dog Owners,' 'Lost Dog,' 'Overslept')이 동형 검사지가 되는지 조사하였다. 183명의 중학생들이 무작위로 배분된 세 그림 중 하나에 의거하여 영어로 이야기를 작성하였다. 작문은 네 가지 쓰기요소(유창성, 어휘 다양성, 구조 복잡성, 그리고 시간성)에 대해 Coh-Metrix와 MANCOVA로 분석되었다. 이 세 그림은 변별력에 있어 대체로 위 모든 요소에 대해 비슷하였다. 그러나 이들의 난이도는 요소별로 볼 때 반드시 같지는 않았다. Dog Owners와 Lost Dog 그림은 변별력과 난이도에 있어 동형으로 판명되었다. 그러므로 이 두 그림은 반복 측정에서 타당한 동형 검사지로 추천된다. Overslept 그림은 다양한 어휘와 시간 연결사들을 유발시키는 데에 다른 두 그림 보다 용이하였다. 그림의 난이도가 다를 수 있다는 결과는 반복시험에서 대체 그림을 사용할 시 이들 그림이 동형 검정을 거치지 않고서는 그 타당성이 의심스러울 수 있음을 환기시켜 준다.

자기보고식 음성장애 설문지 문항의 가독성 평가 (Evaluation of the readability of self-reported voice disorder questionnaires)

  • 곽혜림;이석재;이승진;김향희
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.41-48
    • /
    • 2024
  • 음성장애 평가 시, 음성문제로 인해 개인이 느끼는 불편감, 삶의 질 등의 주관적인 자기보고식 평가의 중요성이 대두되고 있다. 자기보고식 설문은 대상자가 직접 읽고 실시하는 것이므로, 대상자가 문항을 충분히 이해하지 못하면 평가 결과에 영향을 미칠 수 있다. 이에, 본 연구에서는 현재 임상에서 사용되고 있는 한국어판 음성장애 자기보고식 설문지 11가지(KVHI, KAVI, KVQOL, K-SVHI, K-VAPP, K-VPPC, TVSQ, K-VDCQ, K-VFI, K-VTDS, K-VoiSS)를 선정하여 텍스트 등급 및 복잡도, 어휘 빈도 및 등급, 어휘 다양도의 가독성 분석을 실시하였다. 추가적으로 한국어판과 대응하는 원판 설문지와 아동용 설문지에 대한 가독성 평가를 실시하여 한국어판 성인용 설문지와의 결과 차이를 알아보았다. 연구 결과, 한국어판 성인용 음성장애 설문지는 문해력이 낮은 집단에게 사용하는 것에 어려움이 없을 것으로 밝혀졌다. 평가자는 대상자의 읽기 수준에 따라 평가를 진행해야 하며, 추후 개발 및 수정에도 읽기 난이도를 고려할 필요가 있다.