• Title/Summary/Keyword: 조정모델

Search Result 1,246, Processing Time 0.027 seconds

Word-level Korean-English Quality Estimation (단어 수준 한국어-영어 기계번역 품질 예측)

  • Eo, Sugyeong;Park, Chanjun;Seo, Jaehyung;Moon, Hyeonseok;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.9-15
    • /
    • 2021
  • 기계번역 품질 예측 (Quality Estimation, QE)은 정답 문장에 대한 참조없이 소스 문장과 기계번역 결과를 통해 기계번역 결과에 대한 품질을 수준별 주석으로 나타내주는 태스크이며, 다양한 활용도가 있다는 점에서 꾸준히 연구가 수행되고 있다. 그러나 QE 모델 학습을 위한 데이터 구성 시 기계번역 결과에 대해 번역 전문가가 교정한 문장이 필요한데, 이를 제작하는 과정에서 상당한 인건비와 시간 비용이 발생하는 한계가 있다. 본 논문에서는 번역 전문가 없이 병렬 또는 단일 말뭉치와 기계번역기만을 활용하여 자동화된 방식으로 한국어-영어 합성 QE 데이터를 구축하며, 최초로 단어 수준의 한국어-영어 기계번역 결과 품질 예측 모델을 제작하였다. QE 모델 제작 시에는 Cross-lingual language model (XLM), XLM-RoBERTa (XLM-R), multilingual BART (mBART)와 같은 다언어모델들을 활용하여 비교 실험을 수행했다. 또한 기계번역 결과에 대한 품질 예측의 객관성을 검증하고자 구글, 아마존, 마이크로소프트, 시스트란의 번역기를 활용하여 모델 평가를 진행했다. 실험 결과 XLM-R을 활용하여 미세조정학습한 QE 모델이 가장 좋은 성능을 보였으며, 품질 예측의 객관성을 확보함으로써 QE의 다양한 장점들을 한국어-영어 기계번역에서도 활용할 수 있도록 했다.

  • PDF

Speaker classification and prediction with language model (언어모델을 활용한 문서 내 발화자 예측 분류 모델)

  • Kim, Gyeongmin;Han, Seunggyu;Seo, Jaehyung;Lee, Chanhee;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.317-320
    • /
    • 2020
  • 연설문은 구어체와 문어체 두 가지 특성을 모두 갖고 있는 복합적인 데이터 형태이다. 발화자의 문장 표현, 배열, 그리고 결합에 따라 그 구조가 다르기 때문에, 화자 별 갖는 문체적 특성 또한 모두 다르다. 국정을 다루는 정치인들의 연설문은 국정 현황을 포함한 다양한 주요 문제점을 다룬다. 그러면 발화자의 문서 내 문체적 특성을 고려할 경우, 해당 문서가 어느 정치인의 연설문인지 파악 할 수 있는가? 본 연구에서는 대한민국 정책 브리핑 사이트로부터 한국어 기반 사전 학습된 언어 모델을 활용하여 연설문에 대한 미세조정을 진행함으로써 발화자 예측 분류 모델을 생성하고, 그 가능성을 입증하고자 한다. 본 연구는 5-cross validation으로 모델 성능을 평가하였고 KoBERT, KoGPT2 모델에서 각각 90.22%, 84.41% 정확도를 보였다.

  • PDF

Design and Implementation of Convergence Point Adjustment Method for Zoom-In (줌인을 위한 컨버전스포인트 조정 기법의 설계 및 구현)

  • Ha, Jong-Soo;Kim, Dae-Woong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.17 no.6
    • /
    • pp.1383-1388
    • /
    • 2013
  • Even though a dual lens stereoscopic camera allows for convenient stereoscopic photography, the necessity for the research comes up, since the dual lens stereoscopic camera can cause visual discomfort during zoom-in due to the fixed convergence point. We propose a method based on which a convergence point can be adjusted to prevent visual discomfort during zoom-in for a dual lens stereoscopic camera. First, the relational model is classified into nine kinds and defined, depending on locations of focus, object, and convergence point. And then, the method to minimize visual discomfort is suggested by adjusting convergence point on the given model. We also implement the suggested methods with anaglyph computer graphic and demonstrate the superiority of them.

A Study On Relationships between Election Problems of Coordinator Under Distributed Systems (분산시스템 환경에서 조정자 선출 문제들 간의 상관관계 연구)

  • Kim, Yoon
    • Journal of the Korea Society of Computer and Information
    • /
    • v.8 no.4
    • /
    • pp.35-40
    • /
    • 2003
  • In this paper, I raise an issue regarding the relationships between the Election problem and the Consensus problem in asynchronous systems with unreliable failure detectors. First, I describe our system model, and then define Leader Election. After then, I show that the Election problem is harder to resolve than the Consensus problem. Each correct process eventually gets into the state in which it considers only one process to be a leader. Therefore a Perfect Failure Detector is the weakest failure detector which is sufficient to solve the Election. In order to show that the Election problem is harder to resolve than the Consensus problem, I utilize the Reduction protocol in this paper.

  • PDF

Design and Implementation of Convergence Point Adjustment Method for Zoom-In (줌인을 위한 컨버전스포인트 조정 기법의 설계 및 구현)

  • Ha, Jong-soo;Kim, Dae-woong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2013.05a
    • /
    • pp.456-459
    • /
    • 2013
  • Even though a dual lens stereoscopic camera allows for convenient stereoscopic photography, the necessity for the research comes up, since the dual lens stereoscopic camera can cause visual discomfort during zoom-in due to the fixed convergence point. We propose a method based on which a convergence point can be adjusted to prevent visual discomfort during zoom-in for a dual lens stereoscopic camera. First, the relational model is classified into nine kinds and defined, depending on locations of focus, object, and convergence point. And then, the method to minimize visual discomfort is suggested by adjusting convergence point on the given model. We also implement the suggested methods with anaglyph computer graphic and demonstrate the superiority of them.

  • PDF

사용자 의도 정보를 사용한 웹문서 분류

  • Jang, Yeong-Cheol
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2008.10b
    • /
    • pp.292-297
    • /
    • 2008
  • 복잡한 시맨틱을 포함한 웹 문서를 정확히 범주화하고 이 과정을 자동화하기 위해서는 인간의 지식체계를 수용할 수 있는 표준화, 지능화, 자동화된 문서표현 및 분류기술이 필요하다. 이를 위해 키워드 빈도수, 문서내 키워드들의 관련성, 시소러스의 활용, 확률기법 적용 등에 사용자의도(intention) 정보를 활용한 범주화와 조정 프로세스를 도입하였다. 웹 문서 분류과정에서 시소러스 등을 사용하는 지식베이스 문서분류와 비 감독 학습을 하는 사전 지식체계(a priori)가 없는 유사성 문서분류 방법에 의도정보를 사용할 수 있도록 기반체계를 설계하였고 다시 이 두 방법의 차이는 Hybrid조정프로세스에서 조정하였다. 본 연구에서 설계된 HDCI(Hybrid Document Classification with Intention) 모델은 위의 웹 문서 분류과정과 이를 제어 및 보조하는 사용자 의도 분석과정으로 구성되어 있다. 의도분석과정에 키워드와 함께 제공된 사용자 의도는 도메인 지식(domain Knowledge)을 이용하여 의도간 계층트리(intention hierarchy tree)를 구성하고 이는 문서 분류시 제약(constraint) 또는 가이드의 역할로 사용자 의도 프로파일(profile) 또는 문서 특성 대표 키워드를 추출하게 된다. HDCI는 문서간 유사성에 근거한 상향식(bottom-up)의 확률적인 접근에서 통제 및 안내의 역할을 수행하고 지식베이스(시소러스) 접근 방식에서 다양성에 한계가 있는 키워들 간 관계설정의 정확도를 높인다.

  • PDF

DCGAN-based Emoji Generation exploiting Adjustment of Latent vector Representation (Latent vector 분포 조정을 활용한 DCGAN 기반 이모지 생성 기법)

  • Yun-Gyeong Song;Yu-Jin Ha;A-Yeong Seong;Gun-Woo Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.603-605
    • /
    • 2023
  • 최근 SNS 의 발달로 인해 자신의 감정을 빠르고 효과적으로 전달할 수 있는 이모지의 중요성이 커지고 있다. 하지만 이모지를 수동으로 생성하기 위해서 시간과 비용이 많이 들고 자신의 감정에 맞는 이모지를 찾아야 하며 해당 이모지가 없을 수 있다. 기존 DCGAN 을 활용한 이모지 자동 생성연구에서는 부족한 데이터셋으로 인해 G(Generator)와 D(Discriminator)가 동등하게 학습하지 못해서 두 모델 간 성능 차이가 발생한다. D 가 G 보다 최적해에 빠르게 수렴하여 G 가 학습이 되지 않아 낮은 품질의 이모지를 생성하는 불안정 문제가 발생한다. 이 문제를 해결하기 위해 본 논문에서는 Latent vector 분포를 데이터셋에 맞게 조정하여 적은 데이터로 G 에서 안정적으로 학습할 수 있게 하는 G 구조와 다양한 이모지 생성을 위한 Latent vector 평균 조정 기법을 제안한다. 비교 실험 결과 불안정 문제를 개선하였고 FID 와 IS 수치를 통해 성능 개선 효과를 검증했다.

Design by improvement of main parts of garlic planter (7조식 직립마늘파종기 배종율 개선 설계 및 제작)

  • Lee, Choong Ho;Ha, Jong Woo;Jang, Ji Un;Lee, In Beom;Kim, Hyun Gyung
    • Proceedings of the Korean Society for Agricultural Machinery Conference
    • /
    • 2017.04a
    • /
    • pp.86-86
    • /
    • 2017
  • 마늘파종기는 파종기구동부와 파종후 파종홀의 복토역할을 하는 파종기롤러, 지면과의 마찰을 통해 바퀴의 회전토크가 발생하며 발생된 토크는 파종기 내부 동력으로 전달되어 전체 파종시스템(배종, 호퍼캠, 파종부)을 동작 시키는 기능을 수행하는 파종바퀴, 마늘종구를 한알씩 집어올려 중간이송컵으로 이송하는 자세교정컵이 포함된 배종부와 자세교정컵에서 낙하된 마늘종구를 땅속으로 파종하는 파종장치로 구성된다. 배종율 95%, 2립 배종률 5% 성능을 확보할 수 있는 기술이 개발될 경우 세계적으로도 독보적인 기술 우위를 확보할 수 있다. 이와 같은 기본적인 기능을 구현할 수 있는 컨셉모델에 대한 설계를 수행하여 시제품개발 전 기구해석과 구조해석 등을 위한 기본설계를 수행하였다. 배종율 95% 이상을 확보하기 위해서는 기존의 현장경험의 의한 설계 방식으로는 한계가 있기 때문에 시뮬레이션 및 분석 개발이 필요한데, 프레임은 고정밀 마늘종구 배종부 장착을 위한 기본 구조물로써 작동시 동력을 얻기 위한 바퀴와 연계가 되도록 설계되었으며, 호퍼는 배종 수행을 위해 마늘을 저장해 두는 통으로써 배종부와 연결된다. 배종부의 배종판이 회전함에 따라서 배종판의 홈이 호퍼 내로 들어갔다 나오면서 마늘을 집게되며, 동력 전달부는 배종판을 회전시켜주고, 회전 속도 조절을 가능하게 한다. 파종부는 배종부에서 중간컵을 통해 하나씩 공급해준 마늘을 땅에 심는 부분으로서. 프레임의 바퀴 회전과 연동되어 회전하고 설계하였다. 배종판에서 중간컵으로 이송된 마늘을 파종부의 파종컵에 받아 회전하면서 땅속에 파종컵이 묻히면 파종컵이 열리면서 땅속에 마늘을 심는 원리이다. 조간조정은 7조식의 경우 초기설치시 고정되도록 설계되었으며 농촌진흥청 기계화 표준재배안에 따라 의성마늘 기준 $14{\times}14cm$(조간${\times}$주간)를 기준으로 개발하였다. 조간조정은 기계가 설치되면 조정하기 어려우므로 14cm로 설계하였으며, 주간조정은 원형배종장치의 구동기어부의 속도비로 간격을 조정할 수 있도록 기어장치를 설계하였다. 주간조정은 13에서 18cm의 범위에서 작동하도록 설계되었으며, 필요에 따라 간격조절이 가능함. 마늘은 그 크기가 다르고, 형상도 다르기 때문에 종자에 따른 개별적인 파종기술들이 개발되어야하기 때문에 개발 기간이 오래 걸리고, 수익에 비하여 개발비가 과다하게 요구되는 실정인데 축적된 시뮬레이션 툴을 이용한 파종기 분석 기술을 확보할 경우 다른 파종기의 연구 개발에도 크게 도움이 될 것으로 기대되며, 생육측정 실험과 동역학 해석 툴 RecurDyn을 통해 파종기의 기구학적 분석을 통한 설계반영 인자를 도출할 계획이다.

  • PDF

A Study on the Land Suitability Analysis Based on Site Selection Variables using Macro Language (매크로 언어를 이용한 입지인자 변수조정에 따른 토지적합성 분석에 관한 연구)

  • Yi, Gi-Chul
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.6 no.1
    • /
    • pp.59-77
    • /
    • 2003
  • This study is to validate the use of macro language for the land suitability analysis aiming to help to resolve land use conflicts. The silver-town suitability analysis is conducted on the Geejang Gun, Busan Metropolitan city. Such digital maps as terrain, road, facility, and water body were created for various cartographic models. A cartographic model identified the best suitable areas for silver-town development based on the such site selection variables as a distance to facility and road, slope and aspect of terrain, land use etc. Then, the other cartographic model identified the most favorable site among the candidate sites based on the comparison of the aspect of proximity, usage and environmental quality. Macro language was used for these modeling process and was used for the manipulation of all these spatial variables used in the models to resolve land use conflicts relating to the decision making process of the final site selection. This study will improve the effectiveness and rationality of the traditional site suitability analysis.

  • PDF

Seasonal Prediction of Tropical Cyclone Activity in Summer and Autumn over the Western North Pacific and Its Application to Influencing Tropical Cyclones to the Korean Peninsula (북서태평양 태풍의 여름과 가을철 예측시스템 개발과 한반도 영향 태풍 예측에 활용)

  • Choi, Woosuk;Ho, Chang-Hoi;Kang, KiRyong;Yun, Won-Tae
    • Atmosphere
    • /
    • v.24 no.4
    • /
    • pp.565-571
    • /
    • 2014
  • A long-range prediction system of tropical cyclone (TC) activity over the western North Pacific (WNP) has been operated in the National Typhoon Center of the Korea Meteorological Administration since 2012. The model forecasts the spatial distribution of TC tracks averaged over the period June~October. In this study, we separately developed TC prediction models for summer (June~August) and autumn (September~November) period based on the current operating system. To perform the three-month WNP TC activity prediction procedure readily, we modified the shell script calling in environmental variables automatically. The user can apply the model by changing these environmental variables of namelist parameter in consideration of their objective. The validations for the two seasons demonstrate the great performance of predictions showing high pattern correlations between hindcast and observed TC activity. In addition, we developed a post-processing script for deducing TC activity in the Korea emergency zone from final forecasting map and its skill is discussed.