• Title/Summary/Keyword: 도메인 적응 기술

Search Result 24, Processing Time 0.021 seconds

A Study of Semantic Role Labeling using Domain Adaptation Technique for Question (도메인 적응 기술 기반 질문 문장에 대한 의미역 인식 연구)

  • Lim, Soojong;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.246-249
    • /
    • 2015
  • 기계학습 방법에 기반한 자연어 분석은 학습 데이터가 필요하다. 학습 데이터가 구축된 소스 도메인이 아닌 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 10% 정도 성능 하락이 발생한다. 본 논문은 기존 도메인 적응 기술을 이용하여 도메인이 다르고, 문장의 형태도 다를 경우에 도메인 적응 알고리즘을 적용하여, 질의응답 시스템에서 필요한 질문 문장 의미역 인식을 위해, 소규모의 질문 문장에 대한 학습 데이터 구축만으로도 한국어 질문 문장에 대해 성능을 향상시키기 위한 방법을 제안한다. 한국어 의미역 인식 기술에 prior 모델을 제안한다. 제안하는 방법은 실험결과 소스 도메인 데이터만 사용한 실험보다 9.42, 소스와 타겟 도메인 데이터를 단순 합하여 학습한 경우보다 2.64의 성능향상을 보였다.

  • PDF

Korean Semantic Role Labeling Using Domain Adaptation Technique (도메인 적응 기술을 이용한 한국어 의미역 인식)

  • Lim, Soojong;Bae, Yongjin;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.56-60
    • /
    • 2014
  • 기계학습 방법에 기반한 자연어 분석은 학습 데이터가 필요하다. 학습 데이터가 구축된 소스 도메인이 아닌 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 15% 정도 성능 하락이 발생한다. 본 논문은 이러한 다른 도메인에 적용시 발생하는 성능 하락 현상을 극복하기 위해서 기존의 소스 도메인 학습 데이터를 활용하여, 소규모의 타겟 도메인 학습 데이터 구축만으로도 성능 하락을 최소화하기 위해 한국어 의미역 인식 기술에 prior 모델을 제안하며 기존의 도메인 적응 알고리즘과 비교 실험하였다. 추가적으로 학습 데이터에 사용되는 자질 중에서, 형태소 태그와 구문 태그의 자질 값을 기존보다 단순하게 적용하여 성능의 변화를 실험하였다.

  • PDF

Deep Learning based Domain Adaptation: A Survey (딥러닝 기반의 도메인 적응 기술: 서베이)

  • Na, Jaemin;Hwang, Wonjun
    • Journal of Broadcast Engineering
    • /
    • v.27 no.4
    • /
    • pp.511-518
    • /
    • 2022
  • Supervised learning based on deep learning has made a leap forward in various application fields. However, many supervised learning methods work under the common assumption that training and test data are extracted from the same distribution. If it deviates from this constraint, the deep learning network trained in the training domain is highly likely to deteriorate rapidly in the test domain due to the distribution difference between domains. Domain adaptation is a methodology of transfer learning that trains a deep learning network to make successful inferences in a label-poor test domain (i.e., target domain) based on learned knowledge of a labeled-rich training domain (i.e., source domain). In particular, the unsupervised domain adaptation technique deals with the domain adaptation problem by assuming that only image data without labels in the target domain can be accessed. In this paper, we explore the unsupervised domain adaptation techniques.

Korean Semantic Role Labeling Using Domain Adaptation Technique (도메인 적응 기술을 이용한 한국어 의미역 인식)

  • Lim, Soojong;Bae, Yongjin;Kim, Hyunki;Ra, Dongyul
    • Journal of KIISE
    • /
    • v.42 no.4
    • /
    • pp.475-482
    • /
    • 2015
  • Developing a high-performance Semantic Role Labeling (SRL) system for a domain requires manually annotated training data of large size in the same domain. However, such SRL training data of sufficient size is available only for a few domains. Performances of Korean SRL are degraded by almost 15% or more, when it is directly applied to another domain with relatively small training data. This paper proposes two techniques to minimize performance degradation in the domain transfer. First, a domain adaptation algorithm for Korean SRL is proposed which is based on the prior model that is one of domain adaptation paradigms. Secondly, we proposed to use simplified features related to morphological and syntactic tags, when using small-sized target domain data to suppress the problem of data sparseness. Other domain adaptation techniques were experimentally compared to our techniques in this paper, where news and Wikipedia were used as the sources and target domains, respectively. It was observed that the highest performance is achieved when our two techniques were applied together. In our system's performance, F1 score of 64.3% was considered to be 2.4~3.1% higher than the methods from other research.

Extending Korean PropBank for Korean Semantic Role Labeling and Applying Domain Adaptation Technique (한국어 의미역 결정을 위한 Korean PropBank 확장 및 도메인 적응 기술 적용)

  • Bae, JangSeong;Oh, JunHo;Hwang, HyunSun;Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.44-47
    • /
    • 2014
  • 한국어 의미역 결정(Semantic Role Labeling)은 주로 기계 학습에 의해 이루어지며 많은 말뭉치 자원을 필요로 한다. 그러나 한국어 의미역 결정 시스템에서 사용되는 Korean PropBank는 의미역 부착 말뭉치와 동사 격틀이 영어 PropBank의 1/8 수준에 불과하다. 따라서 본 논문에서는 한국어 의미역 결정 시스템을 위해 의미역 부착 말뭉치와 동사 격틀을 확장하여 Korean PropBank를 확장 시키고자 한다. 의미역 부착 말뭉치를 만드는 일은 많은 자원과 시간이 소비되는 작업이다. 본 논문에서는 도메인 적응 기술을 적용해보고 기존의 학습 데이터를 활용하여, 적은 양의 새로운 학습 말뭉치만을 가지고 성능 하락을 최소화 할 수 있는지 실험을 통해 알아보고자 한다.

  • PDF

Extending Korean PropBank for Korean Semantic Role Labeling and Applying Domain Adaptation Technique (한국어 의미역 결정을 위한 Korean PropBank 확장 및 도메인 적응 기술 적용)

  • Bae, Jangseong;Lee, Changki
    • Korean Journal of Cognitive Science
    • /
    • v.26 no.4
    • /
    • pp.377-392
    • /
    • 2015
  • Korean semantic role labeling (SRL) is usually performed by a machine learning and requires a lot of corpus. However, the Korean PropBank used in Korean SRL system is less than PropBank. It leads to a low performance. Therefore, we expand the annotated corpus and verb frames for Korean SRL system to expand the Korean PropBank corpus. Most of the SRL system have a domain-dependent performance so, the performance may decrease if domain was changed. In this paper, we use the domain adaptation technique to reduce decreasing performance with the existing corpus and the small size of new domain corpus. We apply the domain adaptation technique to Structural SVM and Deep Neural Network. The experimental result show the effectiveness of the domain adaptation technique.

Design of An Adaptive Agent-Based Electronic Commerce Framework (적응적 에이전트 기반 전자상거래 프레임워크 설계)

  • 김만수;정목동
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.121-123
    • /
    • 2001
  • 오늘날의 1세대 구매 에이전트는 상품의 전체 특징 변수(attribute)에 대해서보다는 주로 판매자들이 제시한 가격만 비교해서 구매 행위를 대행해 주고 있으며, 간혹 가격 이외의 변수에 대해 비교를 해주는 에이전트의 경우에도 협상(negotiation) 과정에서 전체 변수를 적절히 고려해주는 협상 모델은 찾아보기 힘들다. 따라서, 전자 상거래의 협상 모델(negotiation model)을 가격 변수뿐만 아니라 상품의 전체 변수로 확장시켜 주는 것이 절실히 요구되고 있다. 또한 수많은 전자상거래 업체가 나타남에 여러 도메인간 에이전트 이동 기술과 도메인의 상품 특성에 따른 협상을 진행하는 적응적 에이전트의 필요성이 요구된다. 본 논문에서는 유틸리티(utility)이론과 간결한 휴리스틱스(simple heuristics)에 바탕을 두어서 가격, 상품의 특성, 보장 기간, 서비스 정책 등에 대해서 협상을 벌이는 다중변수 에이전트 협상 프레임워크인 Pmart를 제시하고 이를 확장하여 다중 도메인에서 에이전트의 이동성을 보장하고, 각 도메인의 협상 특수 지식을 XML로 제공받아 적응성을 가지는 적응적 구매 에이전트를 제안한다.

  • PDF

Construction of a Adaptive Domain Profile Parser in the SCA (SCA에서 적응형 도메인 프로파일 파서의 구축 방법)

  • Bae, Myung-Nam;Lee, Byung-Bog;Park, Ae-Soon;Lee, In-Hwan;Kim, Nae-Soo
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.46 no.1
    • /
    • pp.103-111
    • /
    • 2009
  • In SCA, the core framework must include the domain parser to parse the domain profile and thus reconstructs the platform on the time including the starting of the platform, the initialization of the new radio, and etc. The domain profile is described in XML and it includes the characteristics about the software component or the hardware device in a platform. Elementarily, the core framework has to have within the domain profile parser in order to parse the domain profile. In this paper, in order to apply to the limited environment like the mobile terminal, we propose the method for reducing the size of the domain profile parser and for strengthening the independency of the XML parser vendor to have with the domain profile parser. Therefore, domain profile parser can be solve the problem like the overhead about the DOM tree creation due to the repetitive parsing of the domain profile, the compatibility degradation by the specific XML parser vender, the dependency about the domain profile technique, and etc.

License Management for Device-adaptable Proctection and Management of Broadcasting Contents (단말적응형 방송콘텐츠 보호관리를 위한 라이센스 관리 방법)

  • Choo, Hyon-Gon;Ko, Byong-Su;Nam, Je-Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2005.11a
    • /
    • pp.267-270
    • /
    • 2005
  • 디지털 방송기술의 발달과 더불어 컴퓨터 및 단말 기술의 발전은 방송콘텐츠에 대한 활용 범위를 증대시키고 있다. 본 논문 에서는 다양한 단말기기에서의 안전한 방송콘텐츠의 이용 및 보호관리를 위한 라이센스 정책 및 관리방법을 제시한다. 제안하는 방법은 수신단말과 단말에 접근이 가능한 사용자 및 디바이스를 하나의 도메인으로 묶고, 각각의 도메인에서의 사용자 및 디바이스 정보를 이용한 다양한 비즈니스 모델에 활용 가능한 라이센스 발급 정책 및 접근 방법을 제시하며, 도메인과 사용정보에 대한 라이센스를 위한 키 관리 방법을 정의한다.

  • PDF

Web System Development Process based on Domain Features : Content centric Domain and Data centric Domain (도메인 특성에 근거한 웹 시스템 개발 프로세스 : 컨텐트 중심 도메인 및 데이터 중심 도메인)

  • Park, Su-Yong;Im, Seong-Jae
    • The KIPS Transactions:PartD
    • /
    • v.9D no.1
    • /
    • pp.111-126
    • /
    • 2002
  • As the technical aspect of the web system development is, unlike the existing main frame or client/server environment, greatly influenced by the dynamic and variable factors and carried out in a comparatively short period, practical and efficient process to which the developer may adapt with ease is very much required for the web system development. However, while the technological substitute, language and architecture composition have been much discussed, in connection with web system development growing rapidly, standardized development process and its deliverables have been rarely discussed. This thesis analyzes problems of the existing web system development processes and as the substitutes for them, proposes web system development process based on the domain features derived from the concepts of iteration and increment. For the classification of domains, five domains in total are set by interlocking web system factors and web site types and the workflows for two domains applied to projects are incorporated focused on work content and deliverables. The proposed process applies to the development of intranet system and is compared with the existing web development processes by the measure classified into components and elements.