• 제목/요약/키워드: Semantic feature

검색결과 259건 처리시간 0.025초

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

시(詩)적 사유: 존재의 진리로 향한 세 개의 문(門) (Poetic Thinking: Three Gates Leading toward Truth of Being)

  • 정진배
    • 인문언어
    • /
    • 제7집
    • /
    • pp.123-155
    • /
    • 2005
  • This paper concerns different forms of poetic thinking, each of which attempts to investigating truth of being on the ground of its idiosyncratic feature. The horizon evoked via these practices, however, is the Absolute where any plausibility of communication be fundamentally blocked off. Poetry, for instance, relinquishes its semantic auto-referentiality in order to be expressive of something unsayable. Poetic diction, coming-into-being, and sound with no meaning are those three expressive modes that I will examine in terms of the so-called "poetic thinking."

  • PDF

Mixed Agreement with a Hybrid Pronoun in Latvian

  • Hahm, Hyun-Jong
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.85-101
    • /
    • 2010
  • This paper discusses mixed agreement triggered by hybrid pronouns. Hybrid pronouns considered in this paper show number discrepancy in that they are plural in form but singular in meaning. When predicates agree with these hybrid pronouns, the puzzle of number agreement arises: finite verbs show syntactic agreement, while predicate adjectives show semantic agreement. This is explained by three factors in grammar of agreement, the feature specification of agreement controllers, the types of agreement targets, and the Agreement Marking Principle that mediates the relation of two poles of agreement, controllers and targets.

  • PDF

퍼지 논리를 이용한 컴퓨터 언어해석 구현 규칙의 이용법 (The Theory of Linguistic Semantic Interpretation Rule using Fuzzy Definition)

  • 진현수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.227-230
    • /
    • 2003
  • We can not distinguish semantism of the feature of the current language “big”, “small”, “beautiful”. But we study artificial linguistic interface work and convert natural language to digital binary linguistic theory, we should define the basical conversion process. When we utilize the sum of product fuzzy theory and the visible numerical value, we can establish reasoning rule of input language. Fuzzy theory should be converted to general resulting rule.

  • PDF

Parsing Korean Comparative Constructions in a Typed-Feature Structure Grammar

  • Kim, Jong-Bok;Yang, Jae-Hyung;Song, Sang-Houn
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권1호
    • /
    • pp.1-24
    • /
    • 2010
  • The complexity of comparative constructions in each language has given challenges to both theoretical and computational analyses. This paper first identifies types of comparative constructions in Korean and discusses their main grammatical properties. It then builds a syntactic parser couched upon the typed feature structure grammar, HPSG and proposes a context-dependent interpretation for the comparison. To check the feasibility of the proposed analysis, we have implemented the grammar into the existing Korean Resource Grammar. The results show us that the grammar we have developed here is feasible enough to parse Korean comparative sentences and yield proper semantic representations though further development is needed for a finer model for contextual information.

  • PDF

Content-Based Image Retrieval Based on Relevance Feedback and Reinforcement Learning for Medical Images

  • Lakdashti, Abolfazl;Ajorloo, Hossein
    • ETRI Journal
    • /
    • 제33권2호
    • /
    • pp.240-250
    • /
    • 2011
  • To enable a relevance feedback paradigm to evolve itself by users' feedback, a reinforcement learning method is proposed. The feature space of the medical images is partitioned into positive and negative hypercubes by the system. Each hypercube constitutes an individual in a genetic algorithm infrastructure. The rules take recombination and mutation operators to make new rules for better exploring the feature space. The effectiveness of the rules is checked by a scoring method by which the ineffective rules will be omitted gradually and the effective ones survive. Our experiments on a set of 10,004 images from the IRMA database show that the proposed approach can better describe the semantic content of images for image retrieval with respect to other existing approaches in the literature.

한국어 의미역 결정을 위한 자질 정보 확장 (Expansion of Feature Information for Korean Semantic Role Labeling)

  • 조병철;석미란;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-186
    • /
    • 2015
  • 의미역 결정은 주어진 술어와 의존 관계에 있는 여러 논항들과 그 술어간의 의미 관계를 결정하는 것이다. 의미역 결정은 보통 대량의 말뭉치를 이용하여 분류의 관점에서 문제를 해결하고자 한다. 본 논문에서는 한국어 구문 표지 부착된 말뭉치에 구축한 의미역 표지 부착 말뭉치 10,000 문장을 이용한 자동 의미역 결정 방법을 제안한다. 특히, 한국어는 그 특성상 조사와 어미가 문법 관계뿐만 아니라 의미 관계 설정에도 매우 중요한 역할을 하기 때문에 기존의 의미역 결정 연구에서 미비했던 부분인 조사와 어미 정보를 개선하여 새로운 자질 (features) 로 설계하여 의미역 결정을 시도하였다. 기존의 다른 언어에서의 의미역 결정 연구에서 사용된 자질에 본 논문에서 제시된 접사 정보에 기반한 자질을 추가하게 되면 약 77.9%의 F1 점수를 얻을 수 있었는데, 이는 기존 연구에 비하여 약 10% 포인트 향상된 결과이다.

  • PDF

결합범주문법을 이용한 한국어 부정극어와 부정어의 통사 및 의미적 관계 분석 (An Analysis of Syntactic and Semantic Relations between Negative Polarity Items and Negatives in Korean.)

  • 김정재;박정철
    • 한국언어정보학회지:언어와정보
    • /
    • 제8권1호
    • /
    • pp.53-76
    • /
    • 2004
  • Negative polarity items(NPIs), which function as quantifiers are licensed in a syntactically strict way by negatives, which function as qualifiers, resulting in universal negating interpretations as pairs. We present a proposal to explain the related phenomena, in which the syntax and the semantics are closely related to each other, with Combinatory Categorial Grammar. For this purpose, we first adopt the usual approach to scrambling, but control its overgeneration with the use of markers, taking into account the complex syntactic phenomena involving NPIs and scrambling in Korean. We also propose to utilize polarity intensity as a novel feature, in order to account for the universal negating interpretations when NPIs are combined with negatives. Our proposal also explains the difference in readings when other quantifiers or qualifiers intervene the NPI and the related negatives.

  • PDF

Towards Improving Causality Mining using BERT with Multi-level Feature Networks

  • Ali, Wajid;Zuo, Wanli;Ali, Rahman;Rahman, Gohar;Zuo, Xianglin;Ullah, Inam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권10호
    • /
    • pp.3230-3255
    • /
    • 2022
  • Causality mining in NLP is a significant area of interest, which benefits in many daily life applications, including decision making, business risk management, question answering, future event prediction, scenario generation, and information retrieval. Mining those causalities was a challenging and open problem for the prior non-statistical and statistical techniques using web sources that required hand-crafted linguistics patterns for feature engineering, which were subject to domain knowledge and required much human effort. Those studies overlooked implicit, ambiguous, and heterogeneous causality and focused on explicit causality mining. In contrast to statistical and non-statistical approaches, we present Bidirectional Encoder Representations from Transformers (BERT) integrated with Multi-level Feature Networks (MFN) for causality recognition, called BERT+MFN for causality recognition in noisy and informal web datasets without human-designed features. In our model, MFN consists of a three-column knowledge-oriented network (TC-KN), bi-LSTM, and Relation Network (RN) that mine causality information at the segment level. BERT captures semantic features at the word level. We perform experiments on Alternative Lexicalization (AltLexes) datasets. The experimental outcomes show that our model outperforms baseline causality and text mining techniques.

온톨로지 기반 Feature 모델에서 Class 모델로의 변환 기법 (An Ontology - based Transformation Method from Feature Model to Class Model)

  • 김동리;송치양;강동수;백두권
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.53-67
    • /
    • 2008
  • 현재 유사 도메인에 대한 feature 모델과 class 모델간의 재사용을 위해, 모델 차원에서 상호변환 연구와 두 모델간 온톨로지를 이용한 변환 연구가 있으나, 메타모델을 통한 일관성 있는 변환이 되지 못하며, 각 모델이 가진 변환 대상 모델링 요소가 충분치 않고, 특히, 자동 변환 알고리즘 및 지원 툴을 제공하지 않음으로써 모델간 재사용의 저하를 초래하고 있다. 본 논문에서는 메타모델 상에서 온톨로지를 사용한 feature 모델을 class 모델로의 변환 방법을 제시한다. 이를 위해, feature 모델, class 모델 및 온톨로지에 대한 메타모델을 재정의하고, 각 메타모델별 모델링 요소에 대한 속성을 정의한다. 이 속성들에 기반하여 feature 모델과 온톨로지 간 그리고 온톨로지와 class 모델간의 변환 규칙 프로파일을 집합 이론과 명제논리로 정의한다. 이러한 변환의 자동화 구축을 위해 변환 알고리즘을 생성하고, 지원 툴을 구현한다. 제시한 변환규칙 및 툴을 사용해 전자 결재시스템을 통해 실제 적용한다. 기대효과로써, 기 구축된 feature 모델을 class모델로 변환하여 상이한 개발방법간에 생성된 모델을 재사용을 할 수 있다. 특히, 온톨로지를 사용해서 의미적 변환의 모호성을 해소시킬 수 있으며, 변환의 자동화 및 모델간 일관성을 유지시켜줄 수 있다.

  • PDF