• 제목/요약/키워드: 한자사전

검색결과 28건 처리시간 0.02초

DaHae: 일한 기계번역을 위한 일본어 형태소 분석기 (DaHae: Japanese Morphological Analyzer for Japanese to Korean Machine Translation)

  • 여상화;정한민;장원;김태완;황도삼;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.195-207
    • /
    • 1995
  • 일본어는 한자, 히라가나, 가다가나 등 다양한 종류의 문자를 사용하며 이들의 혼용 비율이 매우 높아 띄어쓰기를 하지 않아도 문서의 가독성을 유지한다. ICOT 사전, EDR 사전, ATLAS I/JK사전 등 기존의 전자 사전에서 복합 자종의 표제어가 차지하는 비율(한자+히라가나의 표제어 제외)은 평균 8.8%로 그 수가 매우 작다. 따라서, 문장 내에서 자종의 변화는 단어를 구분하는 하나의 delimiter로 이용될 수 있다. 본 시스템에서는 형태소 분석의 전단계로 전처리기를 두어 자종정보(character type information)에 의한 fragment 분리 및 예외 단어, 정형표현 처리를 수행하며 각 fragment 의 형태소 분석 방법을 제시한다. 형태소 분석기는 전처리기의 처리 결과를 입력받아 각각의 fragment를 전처리기가 제시한 분석 방법에 따라 분석하여 입력 문장의 가능한 모든 분석을 추출한다. 이 방법은 불필요한 사전 탐색과 접속 체크 회수를 줄여 분석 성능을 향상시킨다.

  • PDF

한자음으로 일본어 사전을 검색하는 방법(독음입력법) (Japanese Dictionary Input System in Korean Traditional Reading Rule of Chinese Character)

  • 정철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-144
    • /
    • 2005
  • When a Japanese learner in Korea tries to find Japanese dictionary, he must know the pronunciation of the target word. But it's not easy to know the pronunciation of target word from Japanese sentence. Because most of general Japanese sentence shows only HanJa(Chinese character) instead of Kana(Japanese alphabet). If the Japanese learner knows the Korean traditional pronunciation of the target word, he can input the word to electronic Japanese dictionary with the Korean pronunciation. For this solution, the dictionary service provider must convert the Japanese word to Korean pronunciation, in advance. After setting of the conversions as a additional searching process, we can find the target word through Korean pronunciation of the Japanese HanJa, This process is possible for the three reasons below, 1. Korean, Japanese and Chinese are using the nearly same HanJa. The difference is small. 2. Most Japanese learner in Korea, knows the Korean pronunciation of the HanJa. 3. The Korean pronunciation of the HanJa is nearly unique, a HanJa has a Korean pronunciation, generally.

  • PDF

MMORPG 기반 초등한자 학습이 자기주도 학습능력에 미치는 효과 (Effects of MMORPG-Based Hanja Learning for Elementary School Students on Self-Directed Learning Ability)

  • 박희진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제45차 동계학술발표논문집 20권1호
    • /
    • pp.135-138
    • /
    • 2012
  • 본 연구는 다중참여역할수행게임(Massive Multiplayer Online Role Playing Game, 이하 MMORPG)이 자기주도 학습능력에 미치는 효과를 살펴보는데 목적이 있으며, 초등학교에 재학중인 4, 5, 6학년 3개 학급을 실험 대상으로 4주간 실험하였다. 실험집단은 방과 후 수업시간을 이용하여 일주일에 2시간 이상 MMORPG를 활용한 한자수업을 학습하도록 지도하였고, 통제집단은 교사의 수업 진행으로 학습하였다. 실험 전 두 집단 간의 자기주도 학습능력에 대한 동질성을 검증하기 위하여 자기주도 학습준비도 검사(Self-Directed Learning Readiness Scale, 이하 SDLRS)를 이용하여 자기주도 학습능력 사전검사를 실시하였고, 4주간 실험이 끝난 후 자기주도 학습능력 검사의 차이를 알아보았다. 더 나아가 하위요소인 효율적인 학습자라는 개념, 학습에 대한 솔선수범 및 독립성, 창의성, 자신의 학습에 대한 책임감, 기본학습 기능과 문제해결 기술, 미래 지향적인 자기이해 학습기회에 대한 개방성, 학습에 대한 애정과 열성을 다변량분산분석(MANOVA)를 실시하여 통계분석 하였다. 이러한 연구결과들을 바탕으로 다음과 같은 결론을 내릴 수 있다. 첫째, MMORPG를 활용한 한자학습과 일반교실 한자학습은 독립표본 t검정 결과 자기주도 학습능력에서 유의미한 차이가 나타났다. 즉, MMORPG를 활용한 한자학습이 일반교실수업에 의한 학습보다 높은 자기주도 학습능력 정도를 보여 주었다. 둘째, MMORPG를 활용한 한자학습이 하위요소 간에 어떠한 여향을 미치는가를 알아보기 위해 실시한 MANOVA 결과 효율적인 학습자라는 개념, 학습에 대한 솔선수범 및 독립성, 창의성, 자신의 학습에 대한 책임감, 기본학습 기능과 문제해결 기술, 미래 지향적인 자기이해에서는 유의미한 것으로 나왔지만 학습기회에 대한 개방성, 학습에 대한 애정과 열성에서는 유의미한 결과를 얻지 못하였다.

  • PDF

미등록어 처리가 강화된 복합명사 분해 (Compound Noun Analysis Strengthened Unknown Noun Processing)

  • 김응균;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-46
    • /
    • 2003
  • 본 논문에서는 분해 패턴을 이용한 재사용 분해 알고리즘과 외래어 인식, 이름 명사 인식, 지명 인식에 의한 미등록어 추정을 이용한 복합명사 분해 방법을 제안한다. 재사용 분해 알고리즘은 현재 분해되는 음절보다 짧은 길이의 음절에서 사용된 분해 방법을 재사용하여 분해가 이루어짐을 의미한다. 외래어 인식에서는 한국어 음절에서 비교적 사용 빈도가 낮은 음절들로 외래어가 구성이 됨을 이용한다. 이름 명사는 한국인의 이름 특성에서 한자 독음을 차용하여 작명이 이루어지기 때문에 일정한 수의 음절이 반복적으로 사용되는 점을 이용하여 인식한다. 지명 인식 방법은 지명이 출현하는 패턴을 분석하여 지명 사전의 검색으로 인식한다. 이와 같이 지명 사전에 의한 지명 인식과 알고리즘에 의한 외래어 및 이름 명사 인식 방법을 사용함으로써 미등록어 추정에 정확성을 높이고 분해 정확율 향상에 기여한다. 실험 결과 미등록어가 포함된 약 1,500어절에 대해 약 98%의 정확율이 나타났고, 미등록어가 사전에 모두 등재된 후의 실험에서는 약 99%의 정확율을 보였다.

  • PDF

미등록 이름 명사 인식 밑 성별 구분 (Unregistered Human Names Recognition and Sex Distinction)

  • 강유환;고병일;서영훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.919-921
    • /
    • 2004
  • 본 논문은 사람 이름의 특성을 이용한 이름 인식과 이름의 성별 구분 방법에 대해 제안한다 사랑 이름을 묻는 질의문은 질의-응답 시스템에서 자주 나타난다. 모든 사람 이름을 사전에 등록하는 것은 어렵다. 경우에 따라서는 남녀 이름을 구분할 필요가 있다. 한국 사람 이름의 특성은 주로 3음절로 이루어져 있고. 성씨로 사용되는 음절의 수가 제한적이라는 것이다. 또한 이름에는 한자 독음이 많이 쓰이고, 남자 이름으로 자주 쓰이는 음절과 절자 이름으로 자주 쓰이는 음절이 있다. 이러한 특성을 이용하여 사람 이름 인식과 성별 구분을 수행한다. 일반 웹 문서에서의 실험 결과, 이름 인식의 정확률은 94%를 보였고, 남녀 이름 구분의 정확률은 98%를 보였다.

  • PDF

동형이의어의 구별을 위한 한글한정어 사용에 관한 연구 (A Study on Hangul Qualifier for Homographic Descriptors)

  • 김태수;최석두
    • 정보관리학회지
    • /
    • 제14권1호
    • /
    • pp.107-124
    • /
    • 1997
  • 다의성이 있는 용어를 색인어로 사용하게 되면 탐색자의 요구와 관계없는 주제가 검색되므로 잡음률이 높아지게 된다. 이를 방지하기 위하여 거의 모든 통제어휘시스템에서 색인어로 사용될 기입어가 다의성을 가질 때 한글, 한자, 외국어 등을 이용하여 동형이의어와 세부분야을 한정하고 있다. 그러나 여러 학문분야에 걸친 대단위 어휘사전을 구축하려고 할 때 이들을 이용하여 다의성을 해소하는 데는 미흡한 점이 많으며, 흔히 사용하고 있는 한자한정어도 많은 문제점을 안고 있다. 본 고에서는 색인어로 사용될 기입어가 다의성이 있을 때 한글 한정어를 부기하여 이들을 구별할 것을 제안한다. 한글한정어의 타당성, 사용범위, 사용원칙등에 대하여 시소러스를 중심으로 논하고 이 개념의 확대적용방안에 대하여 언급한다.

  • PDF

유닛 재구성 방법을 이용한 PDA용 온라인 필기체 한자 인식 (On-line Handwriting Chinese Character Recognition for PDA Using a Unit Reconstruction Method)

  • 진원;김기두
    • 대한전자공학회논문지SP
    • /
    • 제39권1호
    • /
    • pp.97-107
    • /
    • 2002
  • 본 논문에서는 PDA용 온라인 필기체 한자 인식기를 구현하였다. PDA는 PC보다 느린 CPU와 적은 메모리를 사용하기 때문에, 본 논문에서는 적은 연산량과 적은 메모리를 사용하면서 높은 인식률을 갖는 인식기를 개발하는데 초점을 맞추었다. 따라서, 빠른 인식을 위하여 적은 연산 과정을 갖는 인덱스 매칭 방법을 사용하였고, 필기 한자의 획순 변동과 획수 변형을 수용함과 동시에, 문자 모델의 저장을 위한 메모리를 최소화하기 위하여 유닛 재구성 방법을 제안하였다. 사전에 정의된 유닛을 사용하여 1800개의.표준 문자 모델을 설정하였다. 입력된 데이터는 전처리 및 특징 추출 과정을 거친 후 표준 문자 모델과의 획수 및 형태적 특징을 기준으로 선정된 후보 문자들과의 유사도를 측정한다. 실험 대상 문자는 중·고등학교 표준 기초 한자 1800자를 대상으로 하였으며, 획수와 획순에 구애받지 않고 정서체로 필기한 5인의 문자 셀을 사용하였다. 실험은 문자 당 평균 인식 속도와 인식률을 측정하였으며, 이 결과 문자 셀에 대한 평균 인식률 94.3%를 얻었다. 문자 당 평균 인식 속도는 MIPS R4000 CPU를 사용한 PDA에서 0.16 초의 결과를 내었다.

Analysis of Modern Astronomical Terminology in the Early 1900s

  • BAHK, UHN MEE;MIHN, BYEONG-HEE
    • 천문학회보
    • /
    • 제41권1호
    • /
    • pp.63.2-63.2
    • /
    • 2016
  • 1900년대 초에 발행된 천문학 서적 2권을 중심으로 사용된 천문학 용어를 현재와 비교분석하는 연구를 진행하였다. 우리는 두 서적에 사용된 용어에서 천문학용어, 화학원소 용어, 인물 및 지명 용어로 나누어서 현재의 과학용어사전과 비교하였다. 지금까지 사용되는 용어와 지금은 사용하지 않는 용어, 그리고 의미는 동일하지만 변화를 보인 용어로 나누어 분석하였다. 한 권의 천문학 서적에는 영어 색인이 포함되어 있어, 그 기준으로 현재와 비교하고, 나머지 천문학 서적은 본문에 나온 용어를 추려서 비교하였다. 용어를 통해서 두 권의 서적이 다른 경로로 수입 번역되었음을 알 수 있었고, 현재와 같이 용어의 통일이 없었다는 점에서 당시 천문학 교육의 한계점이 드러났다. 이 연구는 당시의 천문학 서적이나 관련 서적을 연구할 때, 한자 표기 없이 영어 어휘를 음차하여 표기된 용어를 동정하는데 도움을 줄 것으로 보인다.

  • PDF

학술논문의 참고문헌 자동매핑 방법에 관한 연구 (Study on Automatic Mapping Method for Reference of Scholarly Papers)

  • 한정민;장현철;김진현;예상준;김상균;김철;송미영
    • 정보관리연구
    • /
    • 제41권3호
    • /
    • pp.155-173
    • /
    • 2010
  • 학문의 발전과 주제의 다양화로 인하여 각계의 연구자들은 자신에게 필요한 정보를 정확하게 찾을 필요성이 커지고 있다. 그리하여 본 논문에서는 효율적인 참고문헌 추출 방법으로 중복된 참고문헌을 비교 분석하여 자동으로 매핑해주는 시스템을 구축하고, 한의학 사전을 통한 한자의 오타를 교정할 수 있는 방법을 연구하였다. 이러한 방법을 적용함으로써 참고문헌의 중복입력과 한자오류를 개선할 수 있었다.

"한국문헌목록정보"에 있어서의 문제점 (A Problems in Korean MARC on Disc)

  • 정옥경
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.81-96
    • /
    • 1998
  • 본 논문은 국립중앙도서관에서 발행한 $\ulcorner$한국문헌목록정보$\lrcorner$에 있어서 기술부와 표목부의 문제점과 개선 방안을 연구하였다. $\ulcorner$한국문헌목록정보$\lrcorner$에 의하면, 간략정보와 상세정보에서 두권 이상의 다권본인 경우 서명저자사항 다음에 권차를 표시하는 한편, 이들 자료를 모두 낱권별로 별도로 입력하고, 이들에 대한 복본 까지도 각각 별도로 입력한 것은 크나큰 오류이다. 또한 한글로 표기된 한사람의 저자명 하에서 한자로 쓰인 10가지 이상의 동음이명의 저자들의 간략목록정보가 하나의 리스트에 혼합되어 열거되고 있는 경우가 상당히 많다. 그러므로 우리나라의 저자명표목은 첫째 한글로 표기하고 둘째 한자인명을 기입하고, 셋째 저작자의 전공주제명을 표시하고, 넷째 생몰년을 표시하는 것이 효과적이고 합리적인 방법이다. 그러기 위해서는 주제명의 통일성을 유지하기 위해서 사전에 정형화된 합리적인 주제명일람표를 작성하고, 이에 따라 한국의 저자명에 대한 정확한 전자데이터베이스를 구축해야만 한다.

  • PDF