• 제목/요약/키워드: verb

검색결과 345건 처리시간 0.032초

Self-Organizing Map을 이용한 한국어 동사 클러스터링 (Korean Verb Clustering Using Self-Organizing Maps)

  • 박성배;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.183-184
    • /
    • 1998
  • 본 논문에서는 목적어-동사 관계의 분포에 따라 한국어 동사를 자동적으로 클러스터링하는 방법을 제시한다. SOM(Self-Organizing Map)이 입력 패턴을 분석하고 가시화하는데 뛰어난 성능을 보이므로, 본 논문에서는 클러스터링하는 방법으로 SOM을 채택하였다. 일단 맵(map)이 만들어지고 나면 학습하는 동안 경험하지 못한 동사도 쉽게 적당한 클러스터로 분류될 수 있고 클러스터들 간의 의미 거리도 맵을 이용하여 쉽게 계산할 수 있다. 본 논문에서 제안한 방법을 명사 확률 분포의 상대 엔트로피(relative entropy)에 기반한 클러스터링 방법과 비교해 본 결과, SOM에 의해 만들어진 동사 클러스터가 상대 엔트로피를 이용해서 만들어진 클러스터를 잘 반영한다는 것을 알 수 있었다.

  • PDF

Quantifiers in Questions

  • Krifka, Manfred
    • 한국영어학회지:영어학
    • /
    • 제3권4호
    • /
    • pp.499-526
    • /
    • 2003
  • This paper, based on Krifka (2001), is about the interpretation of quantifiers in questions. I have argued that quantification into question acts is possible for universal quantifiers, as these quantifiers are based on conjunction, an operation that is defined for speech acts. This explains the restriction to universal quantifiers, which are generalized conjunctions. I have developed a type system in which quantification into question acts can be described. I have argued that expressions that scope out of speech acts must be topic, which explains a number of additional observations. I have also discussed embedded questions, which, depending on the embedding verb, may allow for quantification into questions.

  • PDF

한국어의 기계번역을 위한 용언 구조의 해석 (An Analysis of Korean inflected Word for Machine Translation)

  • 한광록;이주근
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.612-615
    • /
    • 1988
  • This paper proposes a method for analyzing the Korean inflected word in machine translation system. We define the processing rules which are useful of analyzing an irregular conjugation, pesent an parsing algorithm of noun and specifed verb and reduce the space of dictionary by the algorithm.

  • PDF

자연언어 처리를 위한 한국어 동사.명사의 개념 분류 (The Classification of Korean Noun and Verb for Natural Language Processing)

  • 박영자;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.141-149
    • /
    • 1992
  • 본 논문에서는 자연언어 처리 시스템에서 사용할 수 있는 단어의 개념 정보에 대해 연구한다. 그러기 위해 언어의 실생활에서의 쓰임 - 연세대학교 사전 편찬실의 연세 말뭉치 -을 바탕으로 한국어의 동사와 명사에 대해 개념을 조사, 분류하였으며 그 개념들이 한국어 문장 분석기에 어떻게 이용되는가를 보인다.

  • PDF

A Study on Case Realization within DP

  • Hong, Sung-Shim
    • 한국언어정보학회지:언어와정보
    • /
    • 제3권1호
    • /
    • pp.97-111
    • /
    • 1999
  • This paper examines Case alternation within DP. Four previous accounts dealing with Case alternation within DP will be critically examined. We conclude that a phenomenon looking like Case alternation within Korean DPs is not an instance of Case alternation. We argue that the genitive subject within such DPs is actually in the Spec position of a Small Clause, which involves a verb movement into what is now called vP. From a cross-linguistic point of view, this analysis supports Harley & Noyer's(1997) argument that Gerunds are instances of Small Clauses.

  • PDF

"-고 자시고"류 어미 반복 구성에 관한 연구 (The Study on Ending Repetition Construction)

  • 조미희
    • 한국어학
    • /
    • 제76권
    • /
    • pp.213-241
    • /
    • 2017
  • Korean verb 'Casi-', which is treated as negative element in dictionaries, is actually a placeholder shows indefinite use, and '-ko casiko' construction is understood as a member of a class of 'Ending repetition construction'. However, unlike among others, '-ko casiko' construction is now undergoing developement of its negative polarity. Because of its indefiniteness, '-ko casiko' construction change its meaning into a universal negative when it is used in negative sentences.

웹문서를 이용한 단계별 한국어 미등록어 인식 모델 (Phase-based Model Using Web Documents for Korean Unknown Word Recognition)

  • 박소영
    • 한국정보통신학회논문지
    • /
    • 제13권9호
    • /
    • pp.1898-1904
    • /
    • 2009
  • 신문이나 블로그와 같은 실제 문서에서는 위키백과(Wikipedia)와 같은 기존에 없던 새로운 단어를 포함하고 있다. 그러나, 대부분의 정보 처리 기술은 시스템 개발 당시 확보한 자료를 바탕으로 사전을 구축하므로, 이러한 새로운 단어에 대해 신속하게 대처할 수 없다는 한계가 있다. 따라서 본 논문에서는 사전에 등록되어 있지 않은 한국어 미등록어를 자동으로 인식하는 모델을 제안한다. 제안하는 모델은 전문분석 기반 미등록명사 인식 단계, 웹 출현빈도 기반 미등록용언 인식 단계, 웹 출현빈도 기반 미등록명사 인식 단계로 구성된다. 제안하는 모델은 문서에서 여러 번 나타난 미등록어에 대해 전문분석을 통해 정확하게 인식할 수 있다. 그리고, 제안하는 모델은 문서에 한번 나타난 미등록어에 대해서도 웹문서를 바탕으로 광범위하게 인식할 수 있다. 또한, 제안하는 모델은 기본형이 어절에 그대로 나타나는 미등록명사뿐만 아니라 기본형이 변형하여 나타날 수 있는 미등록용언도 인식할 수 있다. 실험 결과 기존 미등록어 인식방법에 비해 제안하는 접근방법은 정확률 1.01%와 재현을 8.50%를 개선하였다.

수의적 보족어의 실현 메커니즘- 보족어의 수의성은 예측 불가능한 개별 어휘적 특성인가? (Der Realisierungsmechanismus der fakultativen $Erg\"{a}nzung$ - Ist die $Fakultativit\"{a}t\;der\;Erg\"{a}nzung$ ein idiosynkratisches $Ph\"{a}nomen$?)

  • 최균호
    • 한국독어학회지:독어학
    • /
    • 제2집
    • /
    • pp.101-128
    • /
    • 2000
  • In der vorliegenden Arbeit wurde der Realisierungsmechanismus der fakultativen $Erg\"{a}nzung$ aufgrund des zweidimensionalen Valenzmodells und des zweistufigen Semantikmodlells behandelt. Dabei wurde die $Fakultativit\"{a}t\;der\;Erg\"{a}nzung$ nicht als ein $Ph\"{a}nomen$ im Lexikon angesehen, sondern als ein $Ph\"{a}nomen$ auf der Ebene der Valenzrealisierung, das als Resultat des Zusammenspiels von valenzunabhangigen Faktoren zu betrachten ist. In der bisherigen Valenzforschung wurde die $Fakultativit\"{a}t\;als\;eine\;ausschlie{\ss}lich$ idiosynkratische Eigenschaft des einzelnen Verbs interpretiert, die man bei jedem Verb erlernen $mu{\ss}$. Gegen diese Auffassung wandte die vorliegende Arbeit ein, dass die $Fakultativit\"{a}t$ keine unvoraussagbare idiosynkratische Eigenschaft des einzelnen Verbs ist: Die $Fakultativit\"{a}t\;der\;Erg\;"{a}nzung$ kann durch $Regularit\"{a}ten$ allgemein vorausgesagt werden. Anhand der statischen Lokalisierungsverben im Deutschen wurde gezeigt, dass die $Fakultativit\"{a}t\;der\;lokalen\;Erg\;"{a}nzung$ von den konzeptuellen Prozessen $abh\"{a}ngt:$ Bei dem $Lokalisierungsproze{\ss}$ ist die Realisierung der lokalen $Erg\"{a}nzung$ notwendig. Dagegen ist die Realisierung der lokalen $Erg\"{a}nzung$ bei dem $Delokalisierungsproze{\ss}$ optional. Wenn man die $Fakultativit\"{a}t$ durch allgemeine $Regularit\"{a}ten\;erkl\"{a}ren$ kann, dann ist es nicht $n\"{o}tig,\;die\;Fakultativit\"{a}t$ bei jedem Verb im Lexikon zu markieren. Dadurch kann das mentale Lexikon enorm entlastet werden. Dies bedeutet $f\"{u}r$ deutschlernende $Ausl\"{a}nder$ eine $gro{\ss}e$ Erleichterung.

  • PDF

정상성인의 뇌기능적 자기공명영상에서 명사, 동사, 형용사 그리고 부사 만들기 과제들에 대한 언어영역편재화의 재현성에 관한 연구 (Reproducibility of Hemispheric Language Dominance by Noun, Verb, Adjective and Adverb Generation Paradigms in Functional Magnetic Resonance Imaging of Normal Volunteers)

  • In Chan Song;Kee Hyun Chang;Chun Kee Chung;Sang Hyun Lee;Moon Hee Han
    • Investigative Magnetic Resonance Imaging
    • /
    • 제5권1호
    • /
    • pp.24-32
    • /
    • 2001
  • Purpose : We investigated the reproducibility of language lateralization by 4 different word generation paradigms or the rest contents in each paradigm using functional magnetic resonance imaging in normal volunteers Materials and Methods Nine normal volunteers with left-handedness (mean age: 25 yrs) were examined on a 1.57 MR unit using a single-shot gradient echo epibold sequence. Four different word generation paradigms of noun, verb, adjective and adverb were used in each normal volunteer for investigating language system. In each paradigm, two different rest contents consisted of only seeing the " +" symbol or reading the meaningless letters. Each task consisted of 96 phases including 3 activations and 6 rests of 2 different contents. Two activation maps in one task were obtained under two different rest contents using the correlation method. We evaluated the detection rates of Broca and Wernicke areas and the differences of language lateralization among four different word generation paradigms, or between the rest contents. Results : The detection rates of Broca and Wernicke areas were over 67 % in 4 different language paradigms and there was no significant difference of them among language paradigms, or between two different rest contents. Language dominances, in all 4 different language paradigms, were shown to be consistent in 66 %, but were contrary with language paradigms in some subjects. The rest contents made no significant effect on dominant language dominance determination, but the success rates of the dominant language dominances determined from 4 language paradigms were higher in reading the meaningless letter (100%, n=9) than in only seeing "+" on screen at the rest task (78%, n=7).

  • PDF

어휘망(U-WIN)의 구문관계 자동구축 (Automatic Construction of Syntactic Relation in Lexical Network(U-WIN))

  • 임지희;최호섭;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.627-635
    • /
    • 2008
  • 본 연구에서는 사용자 어휘지능망(U-WIN)의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 구문관계를 형성할 수 있는 후보명사를 용언의 용례에서 문형 정보를 기준으로 추출함으로써, 용언의 세분화된 의미별로 정확하고 다양한 후보명사를 추출할 수 있다. 그러나 추출된 후보명사는 다양한 의미를 지니고 있으므로, 어휘간의 명확한 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 정확한 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문 패턴, 의미 유사도, 빈도 정보 등을 이용하여 후보명사의 의미를 분별한다. 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.