• Title/Summary/Keyword: 한글 처리

Search Result 2,651, Processing Time 0.026 seconds

An Optimal Hangul Code System For The Korean Language Processing (한국어 정보처리를 위한 최적화 한글 코드에 관한 연구)

  • Byun, Jeong-Yong
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.39-43
    • /
    • 1989
  • 컴퓨터에 의한 한글정보처리의 주체는 한글이며, 객체는 그 처리도구인 컴퓨터라는 전제하에서 한글문자의 개별성에 의한 주체적 파악을 통하여, 한국어 정보처리에 최적한 코드로의 개선안을 제안한다. 개선안의 구체적 대상 범주로서 최근의 한국어 정보처리의 응용분야인 자연언어처리, 문자인식, 음성 인식 및 합성, 전자출판등이 점차 확대되어 가고 있다는 관점에서 보아서 기존의 코드가 가지고 있는 문제점을 분석하고 이들에 최적한 코드는 무엇이며 어떠한 성격을 가져야 하며, 그들이 기존의 코드가 중요시하던 처리효율이나 저장 효율의 문제에 어떠한 영향을 미치는지에 대하여 해당 알고리즘을 개발하고 이들에 대한 평가를 해보인다.

  • PDF

Correction for Hangul Normalization (올바른 한글 정규화를 위한 수정 방안)

  • Ahn, Dae-Hyuk;Park, Young-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.73-80
    • /
    • 2006
  • 현재 유니코드에서 한글텍스트의 정규화 기법은 완성형 현대한글 음절과 옛 한글을 표현하는 조합형 한글 그리고 호환 자모등과 같이 사용할 경우 원래의 글자와는 전혀 다른 글자의 조합을 만들어내는 문제점이 있다. 이러한 문제점은 호환 한글 자모 및 기호들의 잘못된 정규화 변환과 유니코드의 한글자모 조합 규칙에서 자모와 완성형 현대한글 음절을 다시 조합하여 한글음절로 사용 할 수 있게 허용한 때문이다. 이는 정규화 형식을 처음 작성할 당시 옛 한글의 사용을 고려하지 않았거나, 한글에 대한 올바른 이해가 부족한 상태에서 작성 된데 따른 결과라 하겠다. 따라서 본 연구에서는 유니코드 환경에서의 한글코드와 특히 최근 들어 Web을 비롯하여 XML과 IDN에서 필연적으로 사용하는 정규화에 따른 문제점을 파악하고 이들을 올바르게 처리하기 위한 정규화의 수정 방안과 조합형 한글의 조합규칙에 대한 수정 방안을 제안한다.

  • PDF

Handwritten Korean Amounts Recognition in Bank Slips using Rule Information (규칙 정보를 이용한 은행 전표 상의 필기 한글 금액 인식)

  • Jee, Tae-Chang;Lee, Hyun-Jin;Kim, Eun-Jin;Lee, Yill-Byung
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.8
    • /
    • pp.2400-2410
    • /
    • 2000
  • Many researches on recognition of Korean characters have been undertaken. But while the majority are done on Korean character recognition, tasks for developing document recognition system have seldom been challenged. In this paper, I designed a recognizer of Korean courtesy amounts to improve error correction in recognized character string. From the very first step of Korean character recognition, we face the enormous scale of data. We have 2350 characters in Korean. Almost the previous researches tried to recognize about 1000 frequently-used characters, but the recognition rates show under 80%. Therefore using these kinds of recognizers is not efficient, so we designed a statistical multiple recognizer which recognize 16 Korean characters used in courtesy amounts. By using multiple recognizer, we can prevent an increase of errors. For the Postprocessor of Korean courtesy amounts, we use the properties of Korean character strings. There are syntactic rules in character strings of Korean courtesy amounts. By using this property, we can correct errors in Korean courtesy amounts. This kind of error correction is restricted only to the Korean characters representing the unit of the amounts. The first candidate of Korean character recognizer show !!i.49% of recognition rate and up to the fourth candidate show 99.72%. For Korean character string which is postprocessed, recognizer of Korean courtesy amounts show 96.42% of reliability. In this paper, we suggest a method to improve the reliability of Korean courtesy amounts recognition by using the Korean character recognizer which recognize limited numbers of characters and the postprocessor which correct the errors in Korean character strings.

  • PDF

An Evaluation of KS X 1026-1:2007 Based on Huminjeongeum Principle (훈민정음 해례 기반 KS X 1026-1:2007의 평가)

  • Kwon, Ki-Hong;Byun, JeongYong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1716-1717
    • /
    • 2013
  • 1987년 완성음절형 한글 부호계(KS C 5601-1987)가 처음 제정된 이래 1992년 ISO 10646-BMP 또는 Unicode에 정보교환용 한글부호계를 반영하기 시작하여 2005년에 KS X 1005로 국제문자부호계를 제정하고 2007년 최종적으로 KS X 1026-1 제정을 통하여 정보교환용 한글 처리지침을 마련하는 것으로 옛한글처리를 완성하였다고 한다. 본 논문에서 훈민정음창제원리에 입각하여 옛한글처리 완성도에 대하여 정보교환용 한글처리의 한계와 문제점을 평가함으로써 한글처리의 효율성을 기하고자 한다.

A Study on the Hangul Query Processor based on IFM(Information Modeling) (IFM에 기반한 한글 질의 처리기의 설계와 구현)

  • Lee, Seo-Jeong;Park, Jai-Nyun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.10
    • /
    • pp.2445-2452
    • /
    • 1997
  • To assist the system development methodologies, there have been a lot of researches for treatment of natural language specification, which represents system behavior and user behavior. In this paper, we suggest Hangul Query Processor based on IFM(InFormation Modeling) which is one of the Object-Oriented software development methods. This Hangul query processor translates the Korean language specification to SQL and response query result. And it is designed to improve system usability by providing convenience to Korean language users. The advantages are The Hangul Query Processor affect higher system usability of and users in that it solves user's Korean language specification without help of the expert. And the software development contained query processor has result to be more participation of users and to reduce the system development time.

  • PDF

Post-processing of Hangul Recognition for Discriminating Pairs of Characters (유사 문자쌍을 구분하기 위한 한글 인식의 후처리)

  • Jang, Seung-Ick;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.388-393
    • /
    • 2001
  • 유사한 형태의 필기 한글 문자쌍은 한글 인식 시 발생하는 오류의 많은 부분을 차지한다. 이는 유사한 문자들의 작은 차이를 인식기가 충분히 반영하기 어렵기 때문이다. 본 논문에서는 최근 주목 받고 있는 Support Vector Machine을 이용해 유사한 문자쌍을 검증하는 한글 인식 후처리 방법을 제안한다. 제안하는 방법은, 대부분의 문자 유사쌍이 한 두개의 자모만이 상이한 점에 착안하여 자모 단위로 문자 유사쌍을 구분한다. 기존 랜덤그래프를 이용한 한글 인식기를 이용하여 자모 분할을 수행하고, Support Vector Machine을 이용하여 분할된 결과를 검증한다. 제안한 방법은 유사쌍 구분에 중요한 자모만을 선택적으로 고려하여, 기존 한글 인식기의 부족한 점을 보완한다. 실험 결과, 자주 혼동되는 문자쌍들의 인식 오류가 정정되는 것을 볼 수 있었으며 그에 따라 한글 인식의 전체 성능이 향상되었다.

  • PDF

Recognition of Hangul alphabets as assessed by the Stroop and hemispheric lateralization (Stroop 및 반구 비대칭성 효과를 통해 본 한글자모 인식과정의 특성 분석)

  • Han, Kwang-Hee;Yoo, Hyung-Hyun;Chung, Chan-Sup
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.278-281
    • /
    • 1989
  • 한글 자모 인식과정의 특성을 알아보기 위하여 Stroop 및 반구 비대칭성 효과를 검증하였다. 피보험자들에게 두가지 색으로된 10개의 한글자모를 좌시야와 우시야에 제시하고, 그중 어떤 것이 가운데에 제시된 검사지극의 색 또는 자모형태와 같은 목표자극인가를 신속하게 판단하도록 하였다. 반구 비대칭성 및 Stroop 효과를 선택 반응시간을 측정하여 비교하였다. 자모 처리와 색깔 처리에서는 반구간 차이가 나타나지 않았다. 자모 처리에서 반구간 차이가 나타나지 않은 것은 한글 자모의 시각적 특성과 실험 절차의 특수성애 결부되어 해석되었다. Stroop 효과는 좌반구 보다는 우반구에서 의미있게 큰 것으로 나타났다. 따라서 대뇌 반구간의 비대칭성이 확인되었고 대뇌의 좌반구는 분석적 처리에, 우반구는 전체적인 처리에 전문화 되어 있다는 것을 확인하였다.

  • PDF

Korean Language Input System Using Direction Keys (방향키를 이용한 한글입력 시스템)

  • Min Kyung-In;Rhee Dae-Woong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.719-722
    • /
    • 2006
  • 본 연구는 방향키를 이용한 한글 입력 시스템 및 방법에 관한 것으로, 한글의 획순에 대응되는 방향키와 보충키를 이용하여 한글을 입력하는 방법으로 별도의 학습이 필요하지 않을 뿐 아니라 소수의 입력키만을 이용할 수 있어 문자입력 장치의 크기를 최소화하여 한글의 자음과 모음을 입력하는 한글 입력 시스템 및 방법에 관한 것이다.

  • PDF

A basic study on the output code system of the Hangeul (한글 출력코드 체계에 관한 기초 연구)

  • Lee, Kang-Sup;Lee, Ki-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.285-291
    • /
    • 1992
  • 알파뉴메릭 사용 언어권과는 달리 한글에서는 처리코드와 출력코드를 구별할 필요가 있다. 한글의 처리코드로는 완벽한 한글 처리가 가능한 조합형이 옳다는 데에 재론의 여지가 없다. 그러나 전자출판의 경우 출력코드는 조합형과 완성형을 모두 사용하는 절충형이어야 한다. 절충형 코드를 구현하기 위한 기초 연구로서 국민학교 국어교과서를 분석하여 완성형꼴(음절)의 범위를 예측하였다. 1400자는 완성형으로, 나머지 9700자 가량은 조합형을 사용하는 방식이 한글 출력코드 체계로서 적합할 것이다.

  • PDF

Suggestions for Efficient Translation of English Computer Terms into Korean Ones: An approach of Inner-Outer Compatibility Priciple Model (컴퓨터 용어의 효율적인 한글화를 위한 방안: 안-밖 합치도원리 모형의 접근)

  • Kim, Jung-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.219-227
    • /
    • 1991
  • 본 논문에서는 정보처리에 관한 일반 모형으로 제기된 안-밖 합치도원리 모형(김정호, 1986; Kim, 1986b, 1991)을 통해서 컴퓨터 용어의 효율적인 한글화를 위한 하나의 접근방법을 제시하였다. 안-밖 합치도는 인간의 정보처리 전반에 걸쳐서 인간이 주어진 환경에서 특정 정보를 구성함에 있어서 갖는 정보처리의 좋음 혹은 쉬움을 나타내는 개념이다. 여기서 중요한 것은 안-밖 합치도가 구성할 특정 정보에 상대적이라는 점이며 안-밖 합치도를 측정할 때에는 어떤 정보에 관심이 있는가의 목적을 명백히 해야 한다. 컴퓨터 용어의 효율적 한글화는 안-밖 합치도원리 모형의 관점에서 볼 때, 특정 목적을 위하여, 만들어진 한글 컴퓨터 용어와 그 용어의 사용자 간의 안-밖 합치도를 높이고자 하는 작업이라고 할 수 있다. 본 논문에서는 컴퓨터 용어의 한글화에 있어서 고려될 수 있는 목적들을 크게 경제적 목적, 문화적 목적, 및 심미적 목적 등으로 나누어 고찰하였다. 끝으로 각 목적에 따른 실제적인 연구방법을 소개하였다.

  • PDF