• Title/Summary/Keyword: 언어 사용역

Search Result 122, Processing Time 0.027 seconds

Korean Semantic Role Labeling Using Case Frame Dictionary and Subcategorization (격틀 사전과 하위 범주 정보를 이용한 한국어 의미역 결정)

  • Kim, Wan-Su;Ock, Cheol-Young
    • Journal of KIISE
    • /
    • v.43 no.12
    • /
    • pp.1376-1384
    • /
    • 2016
  • Computers require analytic and processing capability for all possibilities of human expression in order to process sentences like human beings. Linguistic information processing thus forms the initial basis. When analyzing a sentence syntactically, it is necessary to divide the sentence into components, find obligatory arguments focusing on predicates, identify the sentence core, and understand semantic relations between the arguments and predicates. In this study, the method applied a case frame dictionary based on The Korean Standard Dictionary of The National Institute of the Korean Language; in addition, we used a CRF Model that constructed subcategorization of predicates as featured in Korean Lexical Semantic Network (UWordMap) for semantic role labeling. Automatically tagged semantic roles based on the CRF model, which established the information of words, predicates, the case-frame dictionary and hypernyms of words as features, were used. This method demonstrated higher performance in comparison with the existing method, with accuracy rate of 83.13% as compared to 81.2%, respectively.

Development of Flood Runoff Characteristics Nomograph for Small Catchment Using R-Programming (R-프로그래밍을 이용한 소유역 홍수유출특성 노모그래프 개발)

  • Jang, Cheol Hee;Kim, Hyeon Jun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.590-590
    • /
    • 2015
  • 본 연구는 집중호우에 의한 홍수예측 및 소유역의 유출거동에 대한 수문학적 민감성(susceptibility) 규명을 목적으로 강우강도, 지속기간 및 토양포화도 변화에 따른 홍수유출특성을 분석하여 유역의 유출거동 민감성을 표출할 수 있는 노모그래프를 개발하였다. 개별 홍수사상에 대한 유출거동 특성 분석을 위하여 한국건설기술연구원의 대표 시험유역인 설마천 유역의 과거 17년간(1996 ~ 2012)의 10분 간격의 강우량 및 유출량 자료를 수집하여 홍수유출해석을 수행하였다. 설마천 시험유역의 일누가강우량 100mm 이상, 50개 홍수사상에 대한 홍수유출해석은 유역 물순환 해석모형인 CAT(Catchment hydrological cycle Assessment Tool)을 이용하였으며 모의결과를 바탕으로 홍수사상별 지체시간, 강우강도, 지속기간 및 토양포화도 변화에 따른 홍수유출특성을 상세히 분석하였다. 이 중에서도 지체시간은 유역반응을 나타내는 시간변수로서 수문모델링 및 홍수량예측에 매우 중요한 요소이다. 특히, 강우량에 대한 홍수량의 반응이 빠른 소유역의 경우에 홍수량예측에 큰 영향을 미친다. 따라서 강우강도, 지속기간, 토양포화도의 변화량에 대한 지체시간의 거동을 R 프로그래밍 언어 및 3D Surfer를 이용하여 분석한 후 최종적으로 소유역의 홍수유출 특성을 나타내는 3차원 홍수 유출특성 노모그래프를 개발하였다. 분석에 사용된 R 프로그래밍 언어는 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경으로 데이터의 조작 및 수치연산, 시각화를 수행할 수 있는 기능을 여러 패키지를 통해 구현할 수 있다. 따라서 본 연구에서는 R을 이용하여 10분 단위의 강우 및 유출량 자료를 1시간 및 1일 자료로 구축하고 17년간의 과거 홍수사상을 분리하여 추출하는 R 홍수유출해석 시스템을 개발하였으며 추출된 홍수사상을 관측 유출량 및 관측 토양수분을 포함하여 시각화함으로써 강우 및 토양수분 변화에 따른 소유역의 유출거동 민감성을 확인할 수 있었다. 분석 결과, 지체시간은 강우지속기간 및 토양포화도에 민감한 거동특성을 나타냈으며 토양포화도는 첨두홍수량의 변화에 민감한 영향을 주는 것으로 확인되었다. 개발된 3차원 홍수유출특성 노모그래프는 유역의 규모 및 지형물리학적 특성에 따라 다양하게 나타날 것으로 판단되며 여러 계측유역에 적용함으로써 유역별 홍수유출 반응특성을 정량화할 필요가 있다. 즉, 강우강도, 지속기간, 지체시간, 포화도 등의 변화에 따른 유역의 홍수유출 반응특성을 규명함으로써 미계측 유역의 홍수량예측 실무에 활용할 수 있을 것으로 판단된다.

  • PDF

Predicate Recognition Method using BiLSTM Model and Morpheme Features (BiLSTM 모델과 형태소 자질을 이용한 서술어 인식 방법)

  • Nam, Chung-Hyeon;Jang, Kyung-Sik
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.26 no.1
    • /
    • pp.24-29
    • /
    • 2022
  • Semantic role labeling task used in various natural language processing fields, such as information extraction and question answering systems, is the task of identifying the arugments for a given sentence and predicate. Predicate used as semantic role labeling input are extracted using lexical analysis results such as POS-tagging, but the problem is that predicate can't extract all linguistic patterns because predicate in korean language has various patterns, depending on the meaning of sentence. In this paper, we propose a korean predicate recognition method using neural network model with pre-trained embedding models and lexical features. The experiments compare the performance on the hyper parameters of models and with or without the use of embedding models and lexical features. As a result, we confirm that the performance of the proposed neural network model was 92.63%.

A Processing of Progressive Aspect in Japanese-Korean Machine Translation (일한번역시스템에서 진행형의 번역처리)

  • 김정인;문경희;이종혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.185-187
    • /
    • 2000
  • 일본어에서 "てぃる"형태는 동작진행과 상태진행을 모두 나타내지만 한국어에서는 "고 있다"와 "어 있다"로 나누어 표기한다. 양 언어간의 상적인 의미 대응은 간단하지 않지만, 술부의 의미정보, 부사와 부사어의 의미정보 등을 이용하여 "てぃる"형태의 상적인 의미를 결정하는 것이 가능하다. "てぃる"형태의 적절한 대역어 선정을 위하여, 사전 속의 모든 일본어 술어에 다섯 종류의 의미코드를 입력한다. 즉, "1:동작진행만으로 사용되는 술어", "2:일반적으로는 동작진행으로 사용되지만, 수동인 경우에는 상태진행의 형태로도 사용되는 술어", "3:상태진행으로만 사용되는 술어", "4:동작진행, 상태진행의 구별이 애매한 술어", "5:기타"등의 상적인 의미분류코드를 술어별로 입력한다. 그리고 "2", "4" 형태의 술어로부터 진행형을 구별하기 위하여 부사와 부사어를 사용하는 방법을 제안한다.uot;5:기타"등의 상적인 의미분류코드를 술어별로 입력한다. 그리고 "2", "4" 형태의 술어로부터 진행형을 구별하기 위하여 부사와 부사어를 사용하는 방법을 제안한다.여 부사와 부사어를 사용하는 방법을 제안한다.

  • PDF

Weighting Methods and their Evaluations for Compound Nouns in Korean Text Retrieval (한국어 정보검색에서의 복합명사 가중치 부여 방법 및 평가)

  • Kim, Ji-Young;Sung, Hyon-Myaeng
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.157-162
    • /
    • 2001
  • 한국어의 경우 띄어쓰기의 자유로움과 명사들이 비교적 자유롭게 결합하여 새로운 복합명사(compound noun)를 형성한다. 따라서, 정보검색에서 복합명사를 적절하게 처리하게 되면 검색 효율을 향상시킬 수 있다. 본 논문에서는 질의에 포함된 단일명사, 복합명사, 그리고 복합명사를 이루는 구성명사의 적절한 가중치 부여 방법에 대하여 기술한다. 일반적인 tf*idf가중치 방법은 문서 내 빈도수(tf)만을 강조하여 문서 내 발생빈도가 낮은 복합명사의 경우 낮은 가중치를 갖는다. 반대로, 역문헌 빈도수(idf)로 인해 복합명사가 단일명사보다 높은 가중치를 갖게 되면 단일명사의 가중치를 지나치게 떨어뜨려 검색 성능을 저하시킨다. 이런 문제를 해결하기 위해서 복합명사의 통계적인 특성을 고려하고, 복합명사를 이루는 구성명사의 적절한 가중치 사용과 tf*idf 변화 범위에 따른 파라메터를 이용하였다. 결과적으로 본 논문에서는 질의 색인어의 종류에 따라 가중치를 달리 부여함으로써 검색 성능을 향상시킬 수 있는 가중치 부여 방법을 제시하고 검증 실험을 통해 유효성을 제시했다는 점에서 그 의의가 있다고 하겠다.

  • PDF

Implementation of the System Dividing Simple Sentences from Embedded Sentence in Korean (한국어 내포문을 단문으로 분리하는 시스템의 구현)

  • Kim, Kwang-Jun;Song, Young-Hoon;Lee, Jung-Hyun
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.25-34
    • /
    • 1993
  • 한국어의 내포문은 컴퓨터에 의한 자연어 이해 및 처리에 많은 어려운 문제점의 원인이 되고 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어 내포문을 단문으로 분리하는 시스템을 설계 및 구현한다. 내포문에서 생략성분을 효율적으로 복원하기 위해 안긴문장의 생략된 부분을 통제할 수 있도록 용언을 유형별로 분류한다. 내포문을 단문으로 분리할 때 내포문에 비해 분리된 단문의 의미가 결여 될 수 있다. 이러한 문제점을 해결하기 위해 대용어를 첨가시키는 방법을 사용한다. 그리고 명사 의미표지로부터 용언의 하위범주의미역으로의 변환 테이블을 구성하여 문맥적으로 틀린 문장을 검색, 처리할 수 있는 방법을 제안한다.

  • PDF

Synthesis of Korean Predicates in Japanese-Korean MT System Using Semantic Features for Modality (일-한 기계 번역 시스템의 한국어 생성에서 양상류 의미자질을 이용한 술부 처리)

  • Kim, Eun-Ja;Heo, Nam-Won;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.547-557
    • /
    • 1993
  • 본 논문에서는 일-한 기계 번역 시스템에서 한국어 생성에 대한 효율적인 방법을 제안한다. 일본어와 한국어는 대부분의 문법 체계가 비슷하지만 어절 내, 특히 술부 내에서는 문법 형태소의 어순이 일치하지 않고 형태소간에도 일대일 대응이 불가능한 경우가 많다. 또한 일본어 용언에 부정의 조동사가 사용된 문장을 한국어로 번역할 때에도 부정의 뜻을 내포하는 한국어 용언이 존재하면 부정적 역어로 생성하여야 한다. 이러한 점으로 인하여 형태소 대 형태소를 일대일로 대응시켜 생성하면 자연스럽고 올바른 한국어 문장을 얻기 어렵다. 따라서 기본적으로 직접 번역 방시을 이용하면서 술부의 생성을 위하여 양상류 의미자질을 이용하는 방법을 제안한다. 본 논문에서 제안한 한국어 생성 방법은 기존의 방법보다 적은 사전 작업으로 간단하게 자연스러운 한국어 표현을 얻을 수 있었다.

  • PDF

Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data (시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현)

  • Kim, Jum-Suk;An, Dong-Un;Jong, Sung-Chung
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이의 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여 할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

Conditional Random Fields based Named Entity Recognition Using Korean Lexical Semantic Network (한국어 어휘의미망을 활용한 Conditional Random Fields 기반 한국어 개체명 인식)

  • Park, Seo-Yeon;Ock, Cheol-Young;Shin, Joon-Choul
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.343-346
    • /
    • 2020
  • 개체명 인식은 주어진 문장 내에서 OOV(Out of Vocaburary)로 자주 등장하는 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 개체명이 문장 내에서 OOV로 등장하는 문제를 해결하기 위해 외부 리소스를 활용하는 연구들이 많이 진행되었다. 본 논문은 의미역, 의존관계 분석에 한국어 어휘지도를 이용한 자질을 추가하여 성능 향상을 보인 연구들을 바탕으로 이를 한국어 개체명 인식에 적용하고 평가하였다. 실험 결과, 한국어 어휘지도를 활용한 자질을 추가로 학습한 모델이 기존 모델에 비해 평균 1.83% 포인트 향상하였다. 또한, CRF 단일 모델만을 사용했음에도 87.25% 포인트라는 높은 성능을 보였다.

  • PDF

The Processing of Thematic Role Information in Korean Verbs (한국어 동사의 의미역정보 처리과정)

  • Kim, Young-Jin;Woo, Jeung-Hee
    • Korean Journal of Cognitive Science
    • /
    • v.18 no.2
    • /
    • pp.91-112
    • /
    • 2007
  • Two experiments were conducted to examine psychological reality and incremental nature of thematic processing in Korean sentence comprehension. By using two different types of verbs (i.e., transitive and causative verbs), we manipulated necessity of the thematic reanalysis (i.e., consistent vs. inconsistent condition) in the coordinated sentence structures. In Experiment 1, there was no significant difference in the reading times of the verbs between the consistent and the inconsistent condition. However, there was significant differences in question answering times between the two conditions. In Experiment 2 in which we changed a noun phrase of the test sentences into inanimate one, we found significant thematic reanalysis effects in the reading times of the final verbs. Based on these results we discussed the theoretical importance and universality of the thematic processes.

  • PDF