• Title/Summary/Keyword: 도메인분석

Search Result 849, Processing Time 0.047 seconds

Verification of the Domain Specialized Automatic Post Editing Model (도메인 특화 기계번역 사후교정 모델 검증 연구)

  • Moon, Hyeonseok;Park, Chanjun;Seo, Jaehyeong;Eo, Sugyeong;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.3-8
    • /
    • 2021
  • 인공지능 기술이 발달함에 따라 기계번역 기술도 많은 진보를 이루었지만 여전히 기계번역을 통한 번역문 내에는 사람이 교정해야 하는 오류가 다수 포함되어있다. 이렇게 번역 모델에서 생성되는 오류를 교정하는 전문인력의 요구를 경감시키기 위하여 기계번역 사후교정 연구가 등장하였고, 해당 연구는 현재 WMT를 주축으로 활발하게 연구되고 있다. 이러한 사후교정 연구는 최근 도메인 특화 관점에서 주로 연구가 이루어지고 있으며 현재 많은 도메인에서 유의미한 성과를 내고 있다. 하지만 이런 연구들은 기존 번역문의 품질을 얼만큼 향상시켰는가에 초점을 맞출 뿐, 다른 도메인 특화 번역모델의 성능과 비교했을 때 얼마나 뛰어난지는 밝히지 않기 때문에 사후교정 연구가 도메인 특화에서 효과적으로 작용하는지 명확하게 알 수 없다. 이에 본 연구에서는 도메인 특화 번역 모델과 도메인 특화 사후교정 모델간의 성능을 비교함으로써, 도메인 특화에서 사후교정을 통해 얻을 수 있는 실제적인 성능을 검증한다. 이를 통해 사후교정이 도메인 특화 번역모델과 비교했을 때 미미한 수준의 성능을 보임을 실험적으로 확인하였고, 해당 실험 결과를 분석함으로써 향후 도메인특화 사후교정 연구의 방향을 제안하였다.

  • PDF

A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries (오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구)

  • Ahn, AeLim;Lee, SeoJin;Choi, DongHyun;Kim, EungGyun;Nam, JeeSun
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

Identification of Conserved Protein Domain Combination based on Association Rule (연관성 규칙에 기반한 보존된 단백질 도베인 조합의 식별)

  • Jung, Suk-Hoon;Jang, Woo-Hyuk;Han, Dong-Soo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.5
    • /
    • pp.375-379
    • /
    • 2009
  • Protein domain is the conserved unit of compact tree-dimensional structure and evolution, which carries specific function. Domains may appear in patterns in proteins, since they have been conserved through the evolution for functional formation of proteins. In this paper, we propose a formulated method for conservation analysis of domain combination based on association rule. Proposed method measures mutual dependency of domains in a combination, as well as co-occurrence frequency of them, which is conventionally used. Based on the method, we extracted conserve domain combinations in S.cerevisiae proteins and analyzed their functions based on Gene Ontology. From the results, we drew conclusions that domains in S.cerevisiae proteins form patterns whose members are highly affiliated to one another, and that extracted patterns tend to be associated with molecular function. Moreover, the results testified to proposed method superior to conventional ones for identifying domain combinations conserved for functional cooperation.

Bioinformatic Analysis of Envelope Protein Domains of Zika Virus and Dengue Virus (지카 바이러스 및 뎅기 바이러스의 외피 단백질을 구성하는 도메인의 생물정보학적 분석)

  • Choi, Jae-Won;Kim, Hak Yong
    • The Journal of the Korea Contents Association
    • /
    • v.19 no.11
    • /
    • pp.632-643
    • /
    • 2019
  • In recent years, large scale damages from arbovirus infections by mosquitoes have been reported worldwide due to factors such as change in global climate, increased overseas travel, and increased logistics movement between countries. Among them, Zika virus and dengue virus belonging to genus Flavivirus are representative. In this study, we performed in-depth analyses of the envelope (E) protein that perform essential functions for host infection of Zika virus and dengue virus based on bioinformatics databases. The domain analysis of E protein was performed to determine the type, location, and function, and homology analysis for each domain. From these results, EDIII showing low homology was identified. The homology and immunogenicity of each peptide constituting EDIII were analyzed and three-dimensional structures were modeled. Furthermore, we discussed their biological meaning and how they could be used.

A Method to Manage Requirements Analyzing the Commonality and Variability in Product Line (프로덕트 라인에서 공통성과 가변성 분석을 통한 요구사항 관리방법)

  • Park, Dong-Su;Kim, Dong-Kyu;Chong, Ki-Won
    • The KIPS Transactions:PartD
    • /
    • v.13D no.7 s.110
    • /
    • pp.909-922
    • /
    • 2006
  • The core assets include all properties which consist of an application in Product Line Engineering. The requirement, one of the core assets, is a basis of other core assets and commonality and variability of other core assets are classified by the requirement. accordingly, commonality and variability of the domain requirement should be managed objectively and it is necessary to make a process to reuse the domain requirements. However the requirement is analyzed by domain experts or developers without proper process. In this paper, we proposed the 4 activities: (1)the domain scoping, (2)the extraction and generalization of the domain requirement, (3)the domain requirement analyzing and modeling, (4)the change management, and sub activities. For all reasons given previously, it is possible to reduce the development time and cost by reusing the architectures and components related to the domain requirement. In addition, it is possible to increase the quality of the artifacts produced based on the requirements by managing them systematically.

자율운항선박 원격제어에서 제어지연의 본선 도메인 침공 연구

  • 임정빈;예병덕
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2021.11a
    • /
    • pp.172-173
    • /
    • 2021
  • 자율운항선박의 원격제어에서 제어지연이 발생하면 선박은 충돌위험에 처하게 됨으로 이에 대한 해결방안 필요하다. 연구 목적은 자율운항선박의 원격제어에서 제어지연이 선박충돌에 미치는 영향을 조사하기 위함이다. 연구 방법은, 선박의 터닝서클을 시뮬레이션을 통해서 관측하고, 이 데이터를 이용하여 제어지연에 의한 영향을 분석하였다. 이를 위하여 제어지연(시간)에 따른 선박조종 시뮬레이션의 선회권 측정 데이터를 이용하였다. 연구 결과, 제어지연에 의해서 본선 도메인 침공당하는 방위와 최소거리 분석 가능함을 알았다.

  • PDF

A Domain Analysis Method for Saftware Product Lines Based an Goals, Scenarios, and Features (소프트웨어 프로덕트 라인을 위한 목표, 시나리오, 휘처 기반의 도메인 분석 방안)

  • Kim Min-Seong;Park Soo-Yong
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.7
    • /
    • pp.589-604
    • /
    • 2006
  • Software product lines (SPL) are recently an emerging software reuse paradigm, which helps organizations develop their products from reusable core assets rather than from scratch. For developing these assets, understanding commonality and variability (C&V) is essential. A feature-oriented approach has been used extensively for C&V analysis in the SPL. However, this contains no proposal to systematically identify features and provide the rationale for the features. Further, the approach does not directly show how the results of C&V analysis will satisfy an organization's high-level business goals and provide the rationale for the C&V. Therefore, this paper presents a domain analysis method for the SPL based on goals, scenarios, and features in order to overcome some of the deficiencies and limitations of the feature-oriented approach. In particular, the paper proposes a domain requirements model (DRM) and a domain requirements modeling method based on the DRM. This method has been applied to the home integration system (HIS) domain to demonstrate its feasibility with a supporting tool, namely IDEAS. Our approach makes it possible to systematically identify the features and provide the rationale for both the features and the C&V.

A Composite Cluster Analysis Approach for Component Classification (컴포넌트 분류를 위한 복합 클러스터 분석 방법)

  • Lee, Sung-Koo
    • The KIPS Transactions:PartD
    • /
    • v.14D no.1 s.111
    • /
    • pp.89-96
    • /
    • 2007
  • Various classification methods have been developed to reuse components. These classification methods enable the user to access the needed components quickly and easily. Conventional classification approaches include the following problems: a labor-intensive domain analysis effort to build a classification structure, the representation of the inter-component relationships, difficult to maintain as the domain evolves, and applied to a limited domain. In order to solve these problems, this paper describes a composite cluster analysis approach for component classification. The cluster analysis approach is a combination of a hierarchical cluster analysis method, which generates a stable clustering structure automatically, and a non-hierarchical cluster analysis concept, which classifies new components automatically. The clustering information generated from the proposed approach can support the domain analysis process.

Development of Domain Model and Reuse Using Model Template (모델 템플리트를 이용한 도메인 모델 개발과 재사용)

  • 김지홍
    • Journal of Internet Computing and Services
    • /
    • v.3 no.3
    • /
    • pp.39-53
    • /
    • 2002
  • Since domain model affects largely on the development of object model and design decisions, this model is widely used in the object-oriented and component-based system development. Current $\infty$ methods and UML notation, however, do not support both engineering with reuse and engineering for reuse, This problem causes delay in project development time and inadequate domain model. The integration of extended UML notation and reuse process method can provide a solution to the reusability problem. In this paper, we designed UML based domain model template for the reuse of domain model and proposed domain model development method for the reuse of analysis information, In addition, it was possible to represent reusable domain model template in UML and to develope domain model in the internet sales domain.

  • PDF

Small Intestine-Centric Knowledge Modeling Method for Supporting Diagnosis using Capsule Endoscopy Image (캡슐내시경 영상의 진단 보조를 위한 소장 기관 중심 지식 모델링 기법)

  • Hwang, Gyubon;Park, Ye-Seul;Lee, Jung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.900-903
    • /
    • 2017
  • 캡슐내시경은 일반적인 내시경의 접근이 어려운 소장을 관찰하는 데 특화되어 있다. 보통 캡슐내시경 영상을 판독하기 위해 의사는 해부학적 지식과 병리학적 지식과 같은 도메인 지식을 활용하여 영상에 내재된 정보를 획득한다. 이와 같은 내재된 정보는 도메인 지식을 활용하여 분석될 수 있는 의미적 정보라고 할 수 있다. 본 논문에서는 의미적 정보를 추출하는 과정을 의미 기반 분석이라 정의하고, 의미 기반 분석 과정에서 요구되는 도메인 지식 모델링 기법을 제안하고자 한다. 캡슐내시경의 의미 기반 분석 과정은 크게 이미지 특징 추출, 해부학적 분석, 병리학적 분석으로 구성되며, 이와 같은 분석 과정에 활용될 수 있는 해부학 모델과 병리학 모델을 제안한다. 제안하는 모델은 캡슐내시경 영상의 주요 대상 기관인 소장에 특화된 모델로 효과적인 영상 판독을 보조할 수 있음을 보인다.