• Title/Summary/Keyword: 말은 기법

Search Result 760, Processing Time 0.024 seconds

A Hybrid Method of Verb disambiguation in Machine Translation (기계번역에서 동사 모호성 해결에 관한 하이브리드 기법)

  • Moon, Yoo-Jin;Martha Palmer
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.3
    • /
    • pp.681-687
    • /
    • 1998
  • The paper presents a hybrid mcthod for disambiguation of the verb meaning in the machine translation. The presented verb translation algorithm is to perform the concept-based method and the statistics-based method simultaneously. It uses a collocation dictionary, WordNct and the statistical information extracted from corpus. In the transfer phase of the machine translation, it tries to find the target word of the source verb. If it fails, it refers to Word Net to try to find it by calculating word similarities between the logical constraints of the source sentence and those in the collocation dictionary. At the same time, it refers to the statistical information extracted from corpus to try to find it by calculating co-occurrence similarity knowledge. The experimental result shows that the algorithm performs more accurate verb translation than the other algorithms and improves accuracy of the verb translation by 24.8% compared to the collocation-based method.

  • PDF

A Recommender System using Case-based Reasoning with Implicit Rating Information (묵시적 평가정보를 이용한 사례기반추론 추천시스템)

  • 김병찬;옥수호;우용태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.139-141
    • /
    • 2002
  • 본 논문에서는 인터넷 컨텐츠 사이트에서 개인별로 컨텐츠를 효과적으로 추천하기 위한 개인화 시스템모델을 제안하였다. 제안한 모델은 묵시적인 평가정보를 이용한 사례기반추론 기법으로서 협동적필터링 기법과 달리 유사집단의 평가정보를 이용하지 않고 개인별 속성에 대한 가중치와 속성 값을 이용하여 추천하는 기법이다. 이 기법은 각 사용자의 상품 추매 속성을 추천에 반영할 수 있는 장점이 있으며 사용자 프로파일을 이용하여 개인화된 추천이 가능하다. 제안한 기법이 Recall, Precision, F-measure의 평가 방법을 통해 실험한 결과 협동적필터링 기법 보다 모든 부분에서 더 좋은 결과가 나왔음을 볼 수 있다. 그러므로 제안 시스템이 유사 사용자의 평가정보를 이용한 협동적필터링 기법보다 효율적인 개인화 전략이 가능하다고 말 수 있다. 본 제안 모델을 이용하여 일대일 마케팅을 위한 eCRM 시스템 개발이 가능하리라 예상된다.

  • PDF

The Postprocessing of a Korean OCR using the Output of the Word Recognition and the Statistical Information from a Corpus (문자 인식기의 특성과 말뭉치의 통계 정보를 이용한 문자 인식 결과의 후처리)

  • Son, Hoon-Seok;Choi, Sung-Pil;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.188-193
    • /
    • 1997
  • 한국어 문자 인식 후처리는 인식기가 제공하는 후보 음절을 바탕으로 후처리를 하였다. 이 논문은 문자 인식기가 제공하는 후보 음절 대신에 인식기의 인식 결과를 분석하여 인식기의 오인식 통계 정보에 따라 인식 결과 음절의 후보 음절을 생성한다. 여기서 생성된 후보 어절을 각 음절의 확률 값을 이용하여 확률이 가장 놓은 어절을 선택한다. 이때 한국어 대용량 말뭉치에서 추출한 어절의 통계정보를 이용하여 그 어절의 확률 값을 구한다. 이 기법의 장점은 후보 음절의 조합으로 생성된 어절의 확률 값과 그 어절의 말뭉치상의 확률 값을 이용한 결과 말뭉치에 포함된 미등록어 정보에 따라 형태소 분석이 되지 않는 미등록어 처리가 가능하다. 또한 후보 어절 중 형태소 분석이 성공하는 어절이 두개 이상 있을 경우 실제 거의 쓰이지는 않지만 단지 음절의 확률 값이 높아 우선으로 선택되는 경우를 방지하였다. 실험은 약 1,000page 분량의 실험을 통해 오인식 결과를 수집하고, 4000만 원시 말뭉치에서 구한 어절의 통계정보를 이용하였다. 그 결과 문자 인식기의 98.05%의 어절 인식률을 후처리 결과 99.52%로 향상시켰다.

  • PDF

Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool (구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계)

  • Lee, Hyun-A;Park, Jae-Deuk;Jang, Myung-Gil;Park, Soo-Jun;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.489-496
    • /
    • 1996
  • 자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.

  • PDF

Postprocessing of A Speech Recognition using the Morphological Anlaysis Technique (형태소 분석 기법을 이용한 음성 인식 후처리)

  • 박미성;김미진;김계성;김성규;이문희;최재혁;이상조
    • Journal of the Korean Institute of Telematics and Electronics C
    • /
    • v.36C no.4
    • /
    • pp.65-77
    • /
    • 1999
  • There are two problems which will be processed to graft a continuous speech recognition results into natural language processing technique. First, the speaking's unit isn't consistent with text's spacing unit. Second, when it is to be pronounced the phonological alternation phenomena occur inside morphemes or among morphemes. In this paper, we implement the postprocessing system of a continuous speech recognition that above all, solve two problems using the eo-jeol generator and syllable recoveror and morphologically analyze the generated results and then correct the failed results through the corrector. Our system experiments with two kinds of speech corpus, i.e., a primary school text book and editorial corpus. The successful percentage of the former is 93.72%, that of the latter is 92.26%. As results of experiment, we verified that our system is stable regardless the sorts of corpus.

  • PDF

Study on Analysis Technique Comparison and Evaluation of High Thermal Conductivity Concrete with Magnetite Aggregates and Steel Powder (자철광 및 철분말을 혼입한 고열전도 콘크리트의 열전도 평가 및 해석기법 비교에 대한 연구)

  • Lee, Hack-Soo;Kim, Min-Kyu;Kwon, Seung-Jun
    • Journal of the Korea Concrete Institute
    • /
    • v.26 no.3
    • /
    • pp.315-321
    • /
    • 2014
  • Concrete as a construction material is widely used in nuclear vessel and plant for excellent radiation shielding. However the isolation characteristics in concrete may affect adversely in the case of fire and melt-down in nuclear vessel since temperature cooling down is very difficult from outside. This study is for development of high thermal conductive concrete, and its mechanical and thermal properties are evaluated. Magnetite aggregates with volume ratio of 42.3% (maximum) and steel powder of 1.5% are replaced with normal aggregates and thermal properties are evaluated. Thermal conductivity little increases by 30% addition of magnetite but rapidly increases afterwards. Finally thermal conductivity is magnified to 2.5 times in the case of 42.3% addition of magnetite. Steel powder has a positive effect on high thermal conduction to 106~113%. Several models for thermal conduction like ACI, DEMM, and MEM are compared with test results and they are verified to reasonably predict the thermal conductivity with increasing addition of magnetite aggregates and steel powder.

A Study on Fashion Design Applied by Butterfly Image -Focused on the Application Method of the Nubi by Watersoluble Paper- (나비의 이미지를 응용한 의상 디자인 연구 -수용성부직포에 의한 누비 응용기법을 중심으로-)

  • Heo, Jin-Young;Kim, Hye-Yeon
    • Archives of design research
    • /
    • v.19 no.6 s.68
    • /
    • pp.9-14
    • /
    • 2006
  • There are many paintings describing butterfly in a folk story or old story but the word of Nabby is showed up because korea culture is subject to a Chinese character culture area. the word of Nabby is originated from flying features of nabby. It was expressed to an Hoju(胡蝶:swallowtail) or Hwangjub(黃蝶:yellow butterfly) in old book, Nabby or Naboi in Dusiunhae(杜詩諺解) issued in 1481, Naboi in Hunmonjahoe(訓夢字會) issued in 1527 and Nami in Simongunhaemungmyung(時夢諺解物名) issued in Sookjong dynasty(1675$\sim$1720). After that it was called Nabeui or Nabby and Nabby became the standard language but it is still called Nabbo or Nabbe in some provinces. The butterfly have been called as jewelry spread out through the world and people have been attracted by its meaning (love, pleasure, luck, long life and eternity) and its beautiful figure so that they have collected poems and paintings about it to appreciate its beauty or have made craft works and personal ornaments of it. This research is to analyze the shape and color of the using the application method of the nubi, which is used as expression method in this research, is suitable to express the beauty of butterfly's shape and the nerve of its wings and the basic material, which is light and have good drape, was used to easily express the rhythmical movement of butterfly's flapping. And thus, this research is to present that the above expression method is suitable to express the beautiful expression of butterfly's image and have unlimited potential energy for developing designs. Results showed that the soft outline of butterfly's wings can coincide with the linear shape of human body. It was also found that the characteristics of nubi method could be diversified as material expression method and the Haute Couture luxurious work could be developed by applying the mixed nubi method to costumes.

  • PDF

A Concurrency Control Mechanism Ensuring Latest-Bound Currency in Mobile Broadcasting Environments (이동 방송환경에서 최신 현행성을 보장하는 병행선 제어기법)

  • Han, Boo-Hyung;Chung, Sung-Kwon;Cho, Yoo-Kun
    • Journal of KIISE:Information Networking
    • /
    • v.28 no.2
    • /
    • pp.207-216
    • /
    • 2001
  • 이동 방송 환경은 정보를 가지고 있는 서버가 다수의 이동 클라이언트에게 모든 데이터를 주기적으로 방송하면 클라이언트가 자신이 원하는 데이터가 방송 채널에 나타날 때 이를 검색하는 환경을 말한다. 이때 클라이언트가 수행하는 읽기 전용 트랜잭션은 일관적이면서도 가장 최근에 갱신된 데이터를 필요로한다. 이동 방송환경에 적합하도록 연구된 기존의 병행성 제어 기법들을 클라이언트가 일관적인 데이터를 읽는 것은 보장하지만 가장 최근에 갱신된 데이터를 읽을수 있게 하는 최신 현행성은 보장하지 못한다. 본 논문에서는 기존 기법들과 동일한 수준의 일관성뿐만 아니라 최신 현행성을 보장하는 효율적인 병행성 제어 기법을 제안하고 이를 검증한다. 아울러 제안된 기법의 성능을 평가하기 위하여 최신이 아닌 데이터를 읽은 경우(stale read)의 수와 트랜잭션 중단의 수를 각각 측정하였다. 시뮬레이션을 통한 실험결과 본 논문에서 제안하는 기법은 기존의 방법과 비교할 때 항상 최신의 데이터를 읽으면서 트랜잭션중단의 수를 감소시킨다는 것을 알수 있었다.

  • PDF

A Method for Detecting Event-location based on Example in Tweet (트위터에서의 사례 기반 이벤트 지명 검출 기법)

  • Ha, HyunSoo;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1119-1121
    • /
    • 2015
  • 본 논문에서는 트위터 내용을 통해 이벤트를 탐지하는 시스템에서 지명 검출 정확도를 개선하는 방법을 제안한다. SNS를 이용한 개인 정보 유출 사례들이 늘어감에 따라 자신의 위치 정보를 공개하기 꺼려하기 때문에 이벤트가 발생한 지역을 검출하기 위해서는 텍스트 내용을 직접 분석해야한다. 그러나 오타나 줄임말, 동형이의어의 사용으로 정확한 지명 검출에 어려움이 발생하였다. 따라서 정확도를 향상시키기 위해 본 논문에서는 두 가지 지명 검출 기법을 제안한다. 지명 단어에서 발생되는 노이즈를 제거하는 지명 노이즈 제거 기법과 랜드 마크를 이용하여 지명 단어를 확정하는 지명 확정 기법이다. 실험 결과 기존 시스템의 정확도 49%에서 지명 노이즈 제거기법은 56%, 지명 확정 기법은 73%로 각각 향상되었다.

Optimization of Data Augmentation Techniques in Neural Machine Translation (신경망 기계번역에서 최적화된 데이터 증강기법 고찰)

  • Park, Chanjun;Kim, Kuekyeng;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.258-261
    • /
    • 2019
  • 딥러닝을 이용한 Sequence to Sequence 모델의 등장과 Multi head Attention을 이용한 Transformer의 등장으로 기계번역에 많은 발전이 있었다. Transformer와 같은 성능이 좋은 모델들은 대량의 병렬 코퍼스를 가지고 학습을 진행하였는데 대량의 병렬 코퍼스를 구축하는 것은 시간과 비용이 많이 드는 작업이다. 이러한 단점을 극복하기 위하여 합성 코퍼스를 만드는 기법들이 연구되고 있으며 대표적으로 Back Translation 기법이 존재한다. Back Translation을 이용할 시 단일 언어 데이터를 가상 병렬 데이터로 변환하여 학습데이터의 양을 증가 시킨다. 즉 말뭉치 확장기법의 일종이다. 본 논문은 Back Translation 뿐만 아니라 Copied Translation 방식을 통한 다양한 실험을 통하여 데이터 증강기법이 기계번역 성능에 미치는 영향에 대해서 살펴본다. 실험결과 Back Translation과 Copied Translation과 같은 데이터 증강기법이 기계번역 성능향상에 도움을 줌을 확인 할 수 있었으며 Batch를 구성할 때 상대적 가중치를 두는 것이 성능향상에 도움이 됨을 알 수 있었다.

  • PDF