• 제목/요약/키워드: language transfer

검색결과 285건 처리시간 0.027초

A Constraint on Lexical Transfer: Implications for Computer-Assisted Translation(CAT)

  • Park, Kabyong
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권11호
    • /
    • pp.9-16
    • /
    • 2016
  • The central goal of the current paper is to investigate lexical transfer between Korean and English and to identify rule-governed behavior and to provide implications for development of computer-assisted translation(CAT) software for the two languages. It will be shown that Sankoff and Poplack's Free Morpheme Constraint can not account for all the range of data. A constraint is proposed that a set of case-assigners such as verbs, INFL, prepositions, and the possessive marker may not undergo lexical transfer. The translation software is also expected to be equipped with the proposed claim that English verbs are actually borrowed as nouns or as defective verbs to escape from the direct attachment of inflectional morphemes.

Calculation of Active Power Transfer Capability using Repeated Power Flow Program

  • Ham, Jung-Pil;Kim, Jung-Hoon;Lee, Byung-Ha;Won, Jong-Ryul
    • KIEE International Transactions on Power Engineering
    • /
    • 제12A권1호
    • /
    • pp.15-19
    • /
    • 2002
  • The power transfer capability is determined by the thermal, dynamic stability and voltage limits of the generation and transmission systems. The voltage stability depends on the reactive power limit and it affects the power transfer capability to a great extent. Then, in most load flow analysis, the reactive power limit is assumed as fixed, relatively different from the actual case. This paper proposes a method for determining the power transfer capability from a static voltage stability point of view using the IPLAN which is a high level language used with PSS/E program. The f-V curve for determining the power transfer capability is determined using Repeated Power Flow method. It Is assumed that the loads are constant and the generation powers change according to the merit order. The maximum reactive power limits are considered as varying similarly with the actual case and the effects of the varied maximum reactive power limits to the maximum power transfer capability are analyzed using a 5-bus power system and a 19-bus practical power system.

MLM 기반 언어 간 전이학습을 이용한 개체명 인식 방법론 분석 (An Analysis of Named Entity Recognition System using MLM-based Language Transfer Learning)

  • 손준영;김경민;김진성;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.284-288
    • /
    • 2022
  • 최근 다양한 언어모델의 구축 및 발전으로 개체명 인식 시스템의 성능은 최고 수준에 도달했다. 하지만 이와 관련된 대부분의 연구는 데이터가 충분한 언어에 대해서만 다루기 때문에, 양질의 지도학습 데이터의 존재를 가정한다. 대부분의 언어에서는 개체 유형에 대한 언어의 잠재적 특성을 충분히 학습할 수 있는 지도학습 데이터가 부족하기 때문에, 종종 자원 부족의 어려움에 직면한다. 본 논문에서는 Masked language modeling 기반 언어 간 전이학습을 이용한 개체명 인식 방법론에 대한 분석을 수행한다. 이를 위해 전이를 수행하는 소스 언어는 고자원 언어로 가정하며, 전이를 받는 타겟 언어는 저자원 언어로 가정한다. 본 논문에서는 언어모델의 토큰 사전에 언어 독립적인 가상의 자질인 개체 유형에 대한 프롬프트 토큰을 추가하고 이를 소스 언어로 학습한 뒤, 타겟 언어로 전이하는 상황에서 제안하는 방법론에 대한 평가를 수행한다. 실험 결과, 제안하는 방법론은 일반적인 미세조정 방법론보다 높은 성능을 보였으며, 한국어에서 가장 큰 영향을 받은 타겟 언어는 네덜란드어, 한국어로 전이할 때 가장 큰 영향을 준 소스 언어는 중국어인 결과를 보였다.

  • PDF

메시지 통합성을 제공하는 멀티미디어 메일 저작 시스템 (Mutimedia Mail Authoring System Providing Message Integration)

  • 이택균;김태윤
    • 한국정보처리학회논문지
    • /
    • 제4권12호
    • /
    • pp.3139-3149
    • /
    • 1997
  • 전자 메일시스템은 정보 전송을 위해서 널리 사용되어 왔다. 멀티미디어의 기술이 발전하면서 많은 인터넷 서비스가 멀티미디어를 지원한다. 전자 메일 시스템은 RFC 821에 의한 SMTP(simple Mail Transfer Protocol)에 의해서 7bit ASCH 정보의 전송만을 담당한다. 따라서 전자 메일시스템은 멀티미디어 데이타의 저작 및 전송을 지원할 수 없다. 본 연구에서는 메시지 통합성을 제공할 수 있는 멀티미디어 메일 저작 시스템을 개발하였다. 본 시스템을 통해서 멀티미디어 메시지는 저작되고 텍스트의 형태로 변환된다. 변환된 메시지는 전송 측의 MTA (Mall Transfer Agent)에서 수신 측의 MTA로 SMTP를 통해서 전송된다. 메시지는 HTML(Hypertext Markup Language) 구문에 따라 텍스트 뿐만 아니라 이미지, 오디오 그리고 동영상등을 포함하여 저작된다. 따라서 본 시스템은 다양한 미디어들로 구성된 통합된 메시지를 제공해준다. 멀티미디어 메시지를 SMTP로 전송할 있는 형태의 데이타로 변환하기 위해서 BASE64 인코딩 방법을 사용하였다. 전달받은 멀티미디어 메시지는 본 연구에서 제안된 MUA(Multimedia User Agent)에 의해서 관리된다. 본 시스템은 사용자의 편의성을 향상시켰다.

  • PDF

Parameter Resetting in Reflexive Binding of Second Language Acquisition

  • Kim, Hak-Soo
    • 영어어문교육
    • /
    • 제4호
    • /
    • pp.207-228
    • /
    • 1998
  • This study investigated how Korean learners of English acquired the English reflexives. There is emphasis on the effects of the GCP and PAP(Wexler and Manzini, 1987). The purpose is to examine the major hypothesis that L2 learners are still constrained by Universal Grammar (UG), despite the influence of the parameter setting of their native language as well as the non-operation of the Subset Principle. The experimental group consisted of 30 middle school students (age 14-15), 30 high school students (age 16-17), and 30 university students (age 18-19) as well as 20 ESL students (age 16) studying English in the USA. Twenty native speakers of English served as a control group. The subjects responded to a test on reflexives that used a multiple-choice grammaticality judgement task. Findings show that L2 learners transfer their L1 parameter setting and, as a result, make errors in the choice of antecedents for reflexives. Therefore, I argue that the L2 learner is still constrained by UG.

  • PDF

Error Analysis: What Problems do Learners Face in the Production of the English Passive Voice?

  • Jung, Woo-Hyun
    • 영어어문교육
    • /
    • 제12권2호
    • /
    • pp.19-40
    • /
    • 2006
  • This paper deals with a part-specific analysis of grammatical errors in the production of the English passive in writing. The purpose of the study is dual: to explore common error types in forming the passive; and to provide plausible sources of the errors, with special attention to the role of the native language. To this end, this study obtained a large amount of data from Korean EFL university students using an essay writing task. The results show that in forming the passive sentence, errors were made in various ways and that the most common problem was the formation of the be-auxiliary, in particular, the proper use of tense and S-V agreement. Another important finding was that the global errors found in this study were not necessarily those with the greatest frequency. Also corroborated was the general claim that many factors work together to account for errors. In many cases, interlingual and intralingual factors were shown to interact with each other to explain the passive errors made by Korean students. On the basis of the results, suggestions are made for effective and well-formed use of the passive sentence.

  • PDF

적절한 동사 대역어 선택을 위한 한영 변환 사전 구성 (The Composition of Korean-English Transfer Dictionary for Proper Selection of Verb Translation)

  • 송정근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.294-301
    • /
    • 2001
  • 기계번역이 인간의 언어 능력을 기계로 구현한다는 점에서 전산학적 성격이 강하다면, 변환 사전은 인간의 어휘부(lexicon) 정보를 그대로 기계에 표상한다는 점에서 언어학적 성격이 강하다. 여기서는 다양한 어휘부 정보 중에서 한영 기계번역에서 필요한 언어학적 정보를 추출하고 이러한 정보를 바탕으로 적절한 동사 대역어 선택을 위한 변환 사전의 모형을 만들어 보고자 하였다. 한영 기계번역에서 적절한 동사 대역어 선택의 어려움은 한국어 동형어 처리 문제와 한국어에서는 포착되지 않지만 영어로 번역하는 과정에서 발생하는 영어 표현의 특수성 때문에 기인한 것으로 볼 수 있다. 이 논문에서는 이러한 문제를 논항과 문법 형태소, 선택제약, 개별 어휘 등의 기초적인 언어학적 개념을 이용한 변환사전을 통해 해결한다. 또한 동사 대역어 선택에 영향을 미치는 이러한 개별적인 요인들은 실제 변환사전의 기술에 있어서는 복합적으로 적용됨을 동사 '먹다'의 기술을 통해 확인할 수 있다.

  • PDF

어휘 풍부성 평가에 대한 계량언어학적 연구 (프랑스어 텍스트를 중심으로) (A Quantitative Linguistic Study for the Appreciation of the Lexical Richness)

  • 배희숙
    • 음성과학
    • /
    • 제7권3호
    • /
    • pp.139-149
    • /
    • 2000
  • Studying language by the quantitative linguistic method is not a recent development. Lately however, the interest in the quantitative linguistics has increased according to the demand on communication between human and human or between human and machine. We are required to transfer the system of the natural language onto machine. This requires the study of quantitative linguistics because we are unable to seize the characters of the tiny linguistic units and their structure in an intuitive way. In fact, the quantitative linguistics treats the internal structure of the language by the relation between the linguitic units and their quantitative characters. It is natural then that there is this growing interest in quantitative linguistics. In addition, Korean linguists take interest in the quantitative linguistics, although quantitative linguistics in Korea is not advanced by the level of the statistical analysis. Therefore, this present study shows how statistics can be applied in the field of linguistics through the two texts written in French: Lovers of the Subway and Our life's A. B. C.

  • PDF

MASS와 복사 메커니즘을 이용한 한국어 문서 요약 (Korean Text Summarization using MASS with Copying Mechanism)

  • 정영준;이창기;고우영;윤한준
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.157-161
    • /
    • 2020
  • 문서 요약(text summarization)은 주어진 문서로부터 중요하고 핵심적인 정보를 포함하는 요약문을 만들어 내는 작업으로, 기계 번역 작업에서 주로 사용되는 Sequence-to-Sequence 모델을 사용한 end-to-end 방식의 생성(abstractive) 요약 모델 연구가 활발히 진행되고 있다. 최근에는 BERT와 MASS 같은 대용량 단일 언어 데이터 기반 사전학습(pre-training) 모델을 이용하여 미세조정(fine-tuning)하는 전이 학습(transfer learning) 방법이 자연어 처리 분야에서 주로 연구되고 있다. 본 논문에서는 MASS 모델에 복사 메커니즘(copying mechanism) 방법을 적용하고, 한국어 언어 생성(language generation)을 위한 사전학습을 수행한 후, 이를 한국어 문서 요약에 적용하였다. 실험 결과, MASS 모델에 복사 메커니즘 방법을 적용한 한국어 문서 요약 모델이 기존 모델들보다 높은 성능을 보였다.

  • PDF

한국어 낱말 묶기와 그 응용 (Chunking Korean and an Application)

  • 은광희;홍정하;유석훈;이기용;최재웅
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권2호
    • /
    • pp.49-68
    • /
    • 2005
  • Application of chunking to English and some other European languages has shown that it is a viable parsing mechanism for natural languages. Although a small number of attempts have been made to apply chunking to the analysis of the Korean language, it still is not clear enough what criteria there are to identify appropriate units of chunking, and how efficient and valid the chunking algorithms would be when applied to some authentic Korean texts. The purpose of this research is to provide an alternative set of algorithms for chunking Korean, and to implement them, and to test them against some English-Korean parallel corpora, which is English and Korean bibles matched sentence by sentence. It is shown in the paper that aligning related texts and identifying matched phrases between the two languages can be achieved through appropriate chunking and matching algorithms defined on the morphologically-tagged parallel corpus. Chunking and matching processes are based on the content words rather than the function words, and the matching itself is done in terms of the transfer dictionary. The implementation is done in C and XML, and can be accessed through the Internet.

  • PDF