• 제목/요약/키워드: language transfer

검색결과 284건 처리시간 0.026초

대화체 문장 번역을 위한 토큰기반 변환중심 한일 기계번역 (A Token Based Transfer Driven Koran -Japanese Machine Translation for Translating the Spoken Sentences)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.40-46
    • /
    • 1999
  • 본 논문에서는 음성언어 자동 통역시스템의 일부 모듈로 구현한 한일 기계번역 시스템을 소개하였다. 이 번역시스템은 예제중심 기계번역(EBMT)에 기초를 둔 변환중심 기계번역(TDMT) 방법을 기반으로 구현하였다. 본 시스템에서는 토큰(TOKEN)이라는 새로운 번역단위를 정의하여 사용하였다. 토큰단위의 번역방법을 사용함으로써 한국어 문장의 매우 비 정형적인 점을 해결하고 번역의 질을 높일 수 있다. 본 시스템의 구문분석 단계에서는 대역어를 선정하기에 적합한 정도까지의 의존트리를 생성하는 간이파싱만을 함으로써 필요없는 노력을 경감시켰다. 대역어 사전은 한국전자통신 연구원이 수집한 음성 데이터베이스로부터 추출한 말뭉치를 사용해 구성하였다. 구현한 시스템은 여행 계획영역에서 수집된 600 발화 안의 문장을 대상으로 시험하였는데 제한된 환경에서 87%, 아무런 제약이 없는 환경에서는 71%의 성공률을 보였다.

  • PDF

그리드 환경에서 워크플로우 서비스를 제공하기 위한 메타 스케줄링 프레임워크 (A Meta Scheduling Framework for Workflow Service on the Grid)

  • 황석찬;최재영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권5호
    • /
    • pp.375-384
    • /
    • 2004
  • 그리드는 대규모의 독립된 자원을 공유하여 과학 연구와 같은 문제를 해결하기 위한 컴퓨팅 환경을 제공한다. Globus는 그리드를 구축할 수 있는 표준적인 미들웨어로서 자원 관리, 보안, 데이타, 정보 서비스 등의 핵심적인 서비스를 제공하지만 어플리케이션에서 필요한 다양한 요구를 충족시키기에는 아직 많은 연구가 필요하다. 그 중에서도 워크플로우 서비스는 복잡한 어플리케이션을 위한 중요한 서비스로 부각되고 있다. 본 논문에서는 워크플로우 서비스를 지원하는 메타 스케줄링 프레임워크 (MSF)를 제안한다. 메타 스케줄링 프레임워크는 그리드 작업에서 요구하는 내용과 작업 절차를 표현할 수 있는 XML 기반의 작업 제어 언어 (JCML)를 제공하며, 이를 바탕으로 복잡한 작업 처리를 효과적으로 관리할 수 있는 워크플로우 관리 서비스를 제공한다.

공작기계 절삭유 냉각용 오일쿨러 설계 자동화 (Oil Cooler Design Automation on the Cooling of Machine Tool Cutting Oil)

  • 권혁홍
    • 한국생산제조학회지
    • /
    • 제8권1호
    • /
    • pp.89-99
    • /
    • 1999
  • The automatic design of shell & tube type oil cooler can be used in real industrial environments. Since the automatic design system is intended to be used in small companies, it is designed to be operated well under environments of CAD package in the personal computer. It has adopted GUI in design system, and has employed DCl language. Design parameters to be considered in the design stage of shell and tube type oil cooler are type of oil cooler, outer diameter, thickness, length of tube, tube arrangement, tube pitch, flow rate, inlet and outlet temperature, physical properties, premissive pressure loss on both sides, type of baffle plate, baffle plate cutting ratio, clearance between baffle plate outer diameter and shell inner diameter and clearance between baffle plate holes. As a result, the automatic design system of shell & tube type oil cooler is constructed by the environment of CAD software using LISP. We have built database of design data for various kinds of shell & tube type oil coolers. The automatic design system have been assessed and compared with existing specification of design. Good agreement with Handbook of heat exchanger and design dta of real industrial environments has been found.

  • PDF

Resolving Multi-Translatable Verbs Japanese-TO-Korean Machine Translation

  • Kim Jung-In;Lee Kang-Hyuk
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.790-797
    • /
    • 2005
  • It is well-known that there are many similarities between Japanese and Korean language. For example, the order of words and the nature of the grammatical conjugation of both languages are almost the same. Another similarity is the frequent omission of the subject from a sentence. Moreover, both languages have honorific expressions and the identical concept for expressing nouns in terms of Chinese characters. Using these similarities, we have developed a word-to-word translation system which does away with any deep level analysis of syntactic and semantic structures of the two languages. If we use these similarities, the direct translation method is superior to the internal language translation method or transfer-based translation method. Although the MT system based on the direct translation method is more easily developed than the ones based on other methods, it may have a lot of difficulties when it tries to select the appropriate target word from ambiguous source verbs. In this paper, we propose a new algorithm to extract the meaning of substantives and to make use of the order of the extracted meaning. We could select $86.5\%$ appropriate verbs in the sample sentences from IPAL-verb-dictionary. $13.5\%$ indicates the cases in which we could not distinguish the meaning of substantives. We are convinced, however, that the succeeding rate can be increased by getting rid of the meaning of verbs thatare not used so often.

  • PDF

지구물리 자료에 대한 XML 기술의 적용

  • 오석훈;이덕기;남재철;양준모
    • 지구물리
    • /
    • 제4권2호
    • /
    • pp.133-142
    • /
    • 2001
  • 인터넷 인프라의 급속한 확충은 각종 자료 및 정보를 신속하고 편리하게 교환하거나 처리할 수 있는 기반을 제공하고 있다. 현재 인터넷 기반 기술로는 HTML 이 널리 이용되고 있으나, 다양한 형식의 자료 및 정보를 효율적으로 교환되는 데에는 문제점을 가지고 있다. 최근 이를 극복하기위해 등장한 기반 기술이 XML(eXtensible Markup Language)이다. XML은 HTML 과 비슷한 형식이지만, 내용의 표현양시에 중점을 두는 HTML 과 달리, 전달하고자 하는 내용의 분류 및 기술에 있어 훨씬 다양한 방식을 제공하는 사용자 정의형의 인터넷 언어이다. 이미 외국에서는 GIS자료의 교환체제에 XML 을 이용하고 있다. 본 연구에서는 지구물리자료의 교환 및 처리에 있어 XML 의 장점을 설명하고 이를 이용하여 기상청에 기록된 원거리 지진 자료(teleseismic data)를 XML 형식으로 기록하는 과정을 논의하고자 한다.

  • PDF

FSM 설계를 위한 하드웨어 흐름도와 하드웨어 기술 언어에 관한 연구 (A Study on a Hardware Folw-Chart and Hardware Description Language for FSM)

  • 이병호;조중휘;정정화
    • 대한전자공학회논문지
    • /
    • 제26권4호
    • /
    • pp.127-137
    • /
    • 1989
  • 본 논문에서는 논리 설계 자동화를 위한 레지스터 전송 레벨의 하드웨어 흐름도와 하드웨어 기술언어 SDL-II (symbolic description language)를 각각 제안한다. SDL-II는 일반화된 FSM(finite state machine)의 동작 및 구조적 특성을 제안하는 하드웨어 흐름도로 표현하고 이의 각 기호에 1대 1 대응하며 제어부와 데이타 전송부를 함께 기술하도록 구문을 설정한다. 또한 여러가지 설계 요구조건을 하드웨어 흐름도로 표현하고 이를 SDL-II로 기술하여 본 논문의 유효성을 보인다.

  • PDF

SDL을 이용한 MPOA 설계 및 구현 (Design and Implementation of MPOA using SDL)

  • 임지영;김희정;임수정;채기준;이미정;최길영;강훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권6호
    • /
    • pp.643-656
    • /
    • 2000
  • ATM 포럼에서 제안하여 표준화 한 MPOA(MultiProtocol Over ATM)는 다야한 네트워크 환경에서 ATM 네트워크에게 효과적인 브릿징과 라우팅을 제공하는 프로토콜로써, 서브넷 간에 효율적인 유니캐스트 데이타 전송을 주된 목적으로 하고 있다. 본 논문에서는 ITU에서 표준화한 통신 시스템 개발용 명세 기술 언어인 SDL(Specification and Description Language)을 사용하여 MPOA 구성요소를 구현하였으며, 상위 계층에서 받은 패킷에 대한 주소 해석, Ingress/Egress 캐쉬 관리, 지름길 설정 등에 따른 MPOA 자동 절차를 SDT(SDL Design Tool)에서 제공하고 있는 시뮬레이터를 통하여 검증하였다.

  • PDF

사람의 신체에 대한 러시아어 슬랭의 의미론적 분석 (A Semantic Analysis of Human Body Russian Slang)

  • 김성완
    • 비교문화연구
    • /
    • 제31권
    • /
    • pp.241-262
    • /
    • 2013
  • In this study, we select and analyze the slang that is represented in Elistratov's "Dictionary of Russian slang". Through the above analysis, some conclusions were drawn as follows: First, as a social and psychological phenomenon appears universal in all languages, the study of slang generates strict criteria for the analysis. Unlike literary language, listed in the dictionary slang expressions can become obsolete for their short period of usage by native speakers. Therefore, in the following research of the actual data, we have to validate words targeted for analysis. Second, as the result of the analysis it is metaphor for the most part studied rather than metonymy. The semantic derivations as a result of metonymy are used very frequently in real life. But in this study we mainly analyze words, therefore the number of words was less in metonymy than was expected. Third, the basic types of metaphor are appeared as similarity by form, function, and location, and there are varieties of intervening of subjectivity in similarity of emotional impression. Fourth, the metonymy is divided into three cases: the part meaning the whole, the whole meaning the part, and some thing meaning the reality of where it exists. Fifth, not only literary language, but also slang as the 'transitional process' is the most active way of development of new meanings, and there are two methods to transfer main meaning to second meaning.

Transition of the Kazakh Writing System from Cyrillic to Latin

  • Kim, Bora
    • International Journal of Advanced Culture Technology
    • /
    • 제6권4호
    • /
    • pp.12-19
    • /
    • 2018
  • This article aims to discuss the transition of the Kazakh writing system from Cyrillic to Latin. First, the study investigates the relationship between the Kazakh Cyrillic alphabet and phonology, in order to linguistically evaluate the efficiency of the writing system. Second, the process of determining the Kazakh Latin alphabet is discussed in terms of the Kazakh phonological system. Third, the factors that determined the Latin alphabet of Kazakh language are analyzed. In Kazakh, the phonemic system is subject to controversy among linguists, but it can be said that the phonological system basically follows the one-to-one correspondence to the Russian and Kazakh phonemes. As for the depth of orthographies, Kazakh Cyrillic writing system is not based on the shallow orthographies, so it incorporates morphophonemic information to make skilled readers understand easier. The political and social aspects are considered as a cause of the alphabet change. Although there are studies suggesting the conversion of the writing system is caused by the extrinsic factors rather than the intrinsic factors, the five criteria of Smalley (1964), which compromise the intrinsic and extrinsic factors, are also persuasive. The five factors are 1) Maximum motivation for the learner, 2) Maximum representation of speech, 3) Maximum ease of learning, 4) Maximum transfer, 5) Maximum ease of reproduction.

Sentiment analysis of Korean movie reviews using XLM-R

  • Shin, Noo Ri;Kim, TaeHyeon;Yun, Dai Yeol;Moon, Seok-Jae;Hwang, Chi-gon
    • International Journal of Advanced Culture Technology
    • /
    • 제9권2호
    • /
    • pp.86-90
    • /
    • 2021
  • Sentiment refers to a person's thoughts, opinions, and feelings toward an object. Sentiment analysis is a process of collecting opinions on a specific target and classifying them according to their emotions, and applies to opinion mining that analyzes product reviews and reviews on the web. Companies and users can grasp the opinions of public opinion and come up with a way to do so. Recently, natural language processing models using the Transformer structure have appeared, and Google's BERT is a representative example. Afterwards, various models came out by remodeling the BERT. Among them, the Facebook AI team unveiled the XLM-R (XLM-RoBERTa), an upgraded XLM model. XLM-R solved the data limitation and the curse of multilinguality by training XLM with 2TB or more refined CC (CommonCrawl), not Wikipedia data. This model showed that the multilingual model has similar performance to the single language model when it is trained by adjusting the size of the model and the data required for training. Therefore, in this paper, we study the improvement of Korean sentiment analysis performed using a pre-trained XLM-R model that solved curse of multilinguality and improved performance.