• 제목/요약/키워드: Lexical Semantic Information

검색결과 105건 처리시간 0.025초

동철이음어 처리 과정에서 형태와 의미 정보의 영향 (Effect of orthographic, phonological and semantic information on the processes of Korean heteronym)

  • 김태훈;조증열;이윤형
    • 한국산학기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.3819-3828
    • /
    • 2015
  • 본 연구에서는 중의어 중 한 가지 유형인 한국어 동철이음어의 처리 과정의 탐색을 통해 단어를 이해하는 과정에서 논쟁이 되고 있는 형태(표기 및 음운) 정보와 의미 정보의 영향을 알아보았다. 이를 위해 선행 자극이 먼저 제시되고 목표 자극이 이후에 제시되는 점화 과제를 사용하여 형태와 의미 정보의 촉진 효과를 확인해 보았다. 실험 1에서는 동철이음어의 표기 및 음운 정보와 관련된 자극을 점화 자극으로 제시하였고 실험 2에서는 의미와 관련된 자극을 점화 자극으로 제시하여 단어/비단어 여부를 판단하는 어휘판단과제를 실시하였다. 그 결과 형태 관련 정보는 유의미한 영향을 주지 않았으나 의미 관련 정보는 단어 여부 판단을 빠르게 하는 촉진 효과를 보여 주었다. 이러한 결과는 동철이음어 처리 과정에서 형태 관련 정보에 비해 의미 관련 정보의 영향이 중요하게 작용하고 있음을 시사한다.

Ontology-based models of legal knowledge

  • Sagri, Maria-Teresa;Tiscornia, Daniela
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2004년도 International Conference on Digital Policy & Management
    • /
    • pp.111-127
    • /
    • 2004
  • In this paper we describe an application of the lexical resource JurWordNet and of the Core Legal Ontology as a descriptive vocabulary for modeling legal domains. It can be viewed as the semantic component of a global standardisation framework for digital governments. A content description model provides a repository of structured knowledge aimed at supporting the semantic interoperability between sectors of Public Administration and the communication processes towards citizen. Specific conceptual models built from this base will act as a cognitive interface able to cope with specific digital government issues and to improve the interaction between citizen and Public Bodies. As a Case study, the representation of the click-on licences for re-using Public Sector Information is presented.

  • PDF

On the Syntax and Semantics of the Bound Noun Constructions: With a Computational Implementation

  • Kim, Jong-Bok;Yang, Jae-Hyung
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.223-233
    • /
    • 2007
  • The so-called Korean BNC (bound noun construction) displays complex syntactic, semantic, and constructional properties. This paper, couched upon a constraint-based approach, two different syntactic structures for the construction with articulated lexical properties for the BNs and relevant predicates. The paper reports an implementation of this analysis in the LKB (Linguistic Knowledge Building) system and shows us that this direction is robust enough to pare relevant sentences.

  • PDF

평면적 어휘 자질들을 활용한 확장 혼합 커널 기반 관계 추출 (Relation Extraction based on Extended Composite Kernel using Flat Lexical Features)

  • 최성필;정창후;최윤수;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.642-652
    • /
    • 2009
  • 본 논문에서는 기존의 관계 추출 성능을 향상시키기 위해서 기존의 자질 기반 방법에서 추구하였던 개체 주변 문맥 다양성 정보의 추출 및 적용과 커널 기반 방법의 강점인 관계 인스턴스에 대한 구문 구조적 자질 정보의 통합 활용을 통한 확장된 혼합 커널을 제안한다. ACE RDC 코퍼스를 활용한 실험에서, 기존의 합성곱 구문 트리 커널 기반 혼합 커널을 기반으로 총 9 종류의 평면적 어휘 자질 집합을 정의하고 이를 적용함으로써 성능 향상에 기여하는 어휘 자질 유형을 파악할 수 있었으며, 적은 규모의 학습 집합으로도 현재 최고 수준의 성능에 필적하는 결과를 얻을 수 있었다. 결론적으로 관계 추출을 위한 세 가지 핵심 정보, 즉 개체 자질, 구문 구조적 자질, 주변 문맥 어휘 자질을 통합 적용하면 관계 추출의 성능을 향상시킬 수 있음을 알 수 있었다.

Grammaticalization and Semantic Typology: Time-relationship Adverbs in Japanese, Korean, English and German

  • Moriya, Tetsuharu;Horie, Kaoru
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.348-357
    • /
    • 2002
  • This paper discusses constraints on grammaticalization, a primarily diachronic process through which lexical elements take on grammatical functions. In particular, it will argue that two constraints on this process, namely Persistence and Lwering, explain the different distributional patterns of time-relationship adverbs in Japanese, Korean, English and German. Furthermore, it will suggest that the distributional difference between Japanese and Korean time-relationship adverbs is not an isolated phenomenon but is a reflection of the overall semantic typological differences between the two languages in the sense of Hawkins (1986).

  • PDF

한국어 동사의 어휘의미망 구축을 위한 중립동사의 의미분할 (Word Sense Distinction of Middle Verbs for Korean Verb Wordnet)

  • 이은령;윤애선
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권2호
    • /
    • pp.23-48
    • /
    • 2005
  • This study aims to discuss the word sense distinction of Korean middle verbs for restructuring KorLexVerb 1.0. Despite the duality of its meaning and syntactic structure, the word senses of middle verb are not clearly distinguished in current dictionaries. The underspecification causes very often mismatches that a same Korean word sense is used for two different English verb senses. A close examination on the syntactic and semantic properties of middle verb shows us that the word sense distinction and the reconstruction of hierarchical structure are indispensable. Finally, by doing this fine grained word sense distinction, we propose an alternative way of classification and description of the verb polysemy for KorLexVerb 1.0 as well as for dictionary-like language resources.

  • PDF

Unaccusativity in Korean

  • Lee, Sang-Ki
    • 한국언어정보학회지:언어와정보
    • /
    • 제11권2호
    • /
    • pp.49-65
    • /
    • 2007
  • Since Perlmutter (1978) proposed the Unaccusativity Hypothesis, the past two decades have seen a flourish of studies investigating the potential validity of unaccusativity in Korean. The central contentious issues have been whether unaccusativity can also be assumed in Korean, and, if so, what criteria could be proposed to discern the unaccusativity among various predicates. In this paper, several suggestions made theoretically and experimentally to address the semantic and/or syntactic distinction of the two types of Korean intransitive predicates are critically reviewed and evaluated from the standpoint that there is a close correlation between syntax and lexical semantics of intransitives. It is proposed, then, that the Korean unaccusativity can be reliably differentiated through the combined semantic criteria of [${\pm}$agentive] and [${\pm}$active]. In addition, case alternations in long form negation constructions are shown to be the most reliable and valid syntactic criteria for testing Korean unaccusatives.

  • PDF

한국어 및 영어의 제외구문의 의미분석: 자유제외구문을 중심으로 (A Semantics of Exceptive Constructions in Korean and English.)

  • 윤재학
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권1호
    • /
    • pp.1-20
    • /
    • 2002
  • This paper examines existing approaches to exceptive constructions, which typically serve to maintain the use of universal quantifiers by diminishing the domain quantified over. It places a particular focus on constructions involving Korean oyey, Dutch behalve, and English apart from, other than, and aside from. These lexical items all share an interesting semantic property that they mean either 'except' or 'besides' depending upon their linguistic contexts, but they have largely been ignored in the literature of exceptive constructions. An observation is made that the two meanings of the ambiguous exceptive words are in complementary distribution with respect to types of quantifiers and that they are not an isolated fact. Based on this, a unifying formal semantic analysis is attempted for the constructions.

  • PDF

워드넷을 이용한 문서내에서 단어 사이의 의미적 유사도 측정 (Semantic Similarity Measures Between Words within a Document using WordNet)

  • 강석훈;박종민
    • 한국산학기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.7718-7728
    • /
    • 2015
  • 단어 사이의 의미적 유사성은 많은 분야에 적용 될 수 있다. 예를 들면 컴퓨터 언어학, 인공지능, 정보처리 분야이다. 본 논문에서 우리는 단어 사이의 의미적 유사성을 측정하는 문서 내의 단어 가중치 적용 방법을 제시한다. 이 방법은 워드넷의 간선의 거리와 깊이를 고려한다. 그리고 문서 내의 정보를 기반으로 단어 사이의 의미적 유사성을 구한다. 문서 내의 정보는 단어의 빈도수와 단어의 의미 빈도수를 사용한다. 문서 내에서 단어 마다 단어 빈도수와 의미 빈도수를 통해 각 단어의 가중치를 구한다. 본 방법은 단어 사이의 거리, 깊이, 그리고 문서 내의 단어 가중치 3가지를 혼합한 유사도 측정 방법이다. 실험을 통하여 기존의 다른 방법과 성능을 비교하였다. 그 결과 기존 방법에 대비하여 성능의 향상을 가져왔다. 이를 통해 문서 내에서 단어의 가중치를 문서 마다 구할 수 있다. 단순한 최단거리 기반의 방법들과 깊이를 고려한 기존의 방법들은, 정보에 대한 특성을 제대로 표현하지 못했거나 다른 정보를 제대로 융합하지 못했다. 본 논문에서는 최단거리와 깊이 그리고 문서 내에서 단어의 정보량까지 고려하였고, 성능의 개선을 보였다.

격틀 사전과 하위 범주 정보를 이용한 한국어 의미역 결정 (Korean Semantic Role Labeling Using Case Frame Dictionary and Subcategorization)

  • 김완수;옥철영
    • 정보과학회 논문지
    • /
    • 제43권12호
    • /
    • pp.1376-1384
    • /
    • 2016
  • 기계가 사람과 같이 문장을 처리하게 하려면 사람이 쓴 문장을 토대로 사람이 문장을 통해 발현하는 모든 문장의 표현 양상을 학습해 사람처럼 분석하고 처리할 수 있어야 한다. 이를 위해 기본적으로 처리되어야 할 부분은 언어학적인 정보처리이다. 언어학에서 통사론적으로 문장을 분석할 때 필요한 것이 문장을 성분별로 나눌 수 있고, 문장의 핵심인 용언을 중심으로 필수 논항을 찾아 해당 논항이 용언과 어떤 의미역 관계를 맺고 있는지를 파악할 수 있어야 한다. 본 연구에서는 국립국어원 표준국어대사전을 기반으로 구축한 격틀사전과 한국어 어휘 의미망에서 용언의 하위 범주를 자질로 구축한 CRF 모델을 적용하여 의미역을 결정하는 방법을 사용하였다. 문장의 어절, 용언, 격틀사전, 단어의 상위어 정보를 자질로 구축한 CRF 모델을 기반으로 하여 의미역을 자동으로 태깅하는 실험을 한 결과 정확률이 83.13%로 기존의 규칙 기반 방법을 사용한 의미역 태깅 결과의 정확률 81.2%보다 높은 성능을 보였다.