• 제목/요약/키워드: 한국어자료

검색결과 410건 처리시간 0.021초

한국어-한국수화 병렬 코퍼스의 효율적 제작 (An Effective Construction of a Korean-to-KSL Parallel Corpus)

  • 김정호;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.13-17
    • /
    • 2014
  • 본 연구에서는 한국어와 한국수화 간의 병렬 코퍼스 제작과 함께 이에 따른 문제를 다룬다. 본 연구에서는 병렬 코퍼스를 효율적으로 제작하기 위해 키넥트와 립모션을 이용하였고, 이의 성능을 검증하기 위해 기존 연구에서 제시하고 있는 장갑을 통한 동작 인식 및 수집 방법과 본 연구에서 제시하고 있는 수집 방법을 비교하였으며, 비교 결과 장갑을 통해 수집한 결과와 유의미하게 차이가 나지 않음을 확인하였다. 이는 본 연구의 동작 수집 방식이 상대적으로 고비용인 장갑 수집 방식과 비교하여 경쟁력이 있음을 시사하고 있으며, 특히 보편적인 자료 수집 방식을 사용하는 특징까지 가지고 있어서 동시적으로 자료를 수집할 수 있어 규모가 있는 병렬 코퍼스 구축을 더욱 효율적으로 진행할 수 있을 것으로 기대된다.

  • PDF

m차 Markov 한글 정보원의 효율적인 구현에 관한 연구 (A Study of An Efficiant Implementation for the m-th order Markov Hangul Information Source)

  • 남기동;홍종준;김인대;이균하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.267-278
    • /
    • 1991
  • 본 논문은 한글 정보원을 Markov source로 구현하였을 때 요구되는 terra byte 이상의 방대한 기억 공간의 점유를 해결하기 위해, 이에 대한 통계자료를 조사하고 이를 기초로 기억 공간을 줄일 수 있는 방안을 제안하였다. 제안된 방식에 의해 한글 정보원을 천이확률에 따라서 구현시 paged list 구조로 7차 이상의 Markov 한국어 정보원을 수백 Kbyte의 기억 공간으로 구현 할 수 있었다. 그리고, Markov 한국어 정보원의 활용도를 넓히기 위하여 backward Markov 정보원을 제안하였다. 본 연구에서 제안한 방법은 한글 문장에서 손실된 단어의 수정뿐만이 아니라 기타 Markov source를 한글에 적용하는 모든 분야에 기초적인 자료로 활용될 것으로 기대된다.

  • PDF

한국어 화자를 위한 외국어 학습 코스웨어의 모델링 (Modelling Foreign Language Learning Courseware for Korean Speakers)

  • 윤애선;김경희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.418-425
    • /
    • 1999
  • 한국어 화자를 위한 외국어 학습 코스웨어를 학습 목표언어 독립적으로 모델링하는 방안을 모색하기 위한 외국어 학습 이론과 웹상의 자료 제시 유형에 관해 논하고 기개발된 플랫폼 LangEdu를 살펴봄으로써 그 실현 가능성을 증명하고 있다. 체계적인 학습 자료 제시와 사용자간의 긴밀한 상호 작용 및 손쉬운 관리가 가능하도록 설계되어진 이 플랫폼을 이용하면 전산 전문 지식이 없는 교과 전문가가 큰 어려움이 없이 개별 외국어 학습 코스웨어를 제작할 수 있다. 따라서, 이 방법론은 비용효과적일 뿐만 아니라 교과전문가의 적극적인 참여를 유도하여 양질의 코스웨어 제작에 기여한다.

  • PDF

많이 사용되는 한국어 문형 패턴용 조사기의 설계 및 구현 (Design and Implementation of Sentence Frame Analyzer for Korean)

  • 이상곤;소강춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.123-126
    • /
    • 2010
  • 21C 세종계획 결과물의 태그된 말뭉치를 살펴보면 국어 정보화 측면에서 귀중한 자료가 많이 구축되어는 있으나 말뭉치를 효율적으로 이용할 수 있는 저작 도구가 대단히 부족하다. 본 논문에서는 태그 정보의 조사자가 입력하는 태그의 여러 조합을 다양하게 검색하고 잘못 부착된 태그열 오류가 발견되면 즉시 수정하여 자료의 무결성을 보장하고, 한국어에서 많이 출현하는 문형 패턴을 검색할 수 있는 저작 도구를 설계하고 구현하였다.

  • PDF

확률통계적 구문태깅의 자동화 (Toward Automatic Probabilistic Syntactic Tagging)

  • 김형근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.253-257
    • /
    • 1994
  • 언어처리에 통계 확률적인 방법이 도입되면서 현실적으로 상당한 진전이 있었지만 한국어의 경우에는 대부분 형태소 해석과 품사 태깅에 그치고 있다. 본 논문에서는 구문분석 수준에서의 통계적인 한국어 분석에 쓰일 자료 구축으로서의 구문 태깅의 방법론과 그 자동화에 대해 보고한다.

  • PDF

한국어 신조어 교육의 가치와 자료 구축을 위한시론 (Research on the Value of Korean Neologism Education and the Method of Building Data)

  • 김덕신
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.371-377
    • /
    • 2022
  • 이 연구는 그간 학습 결과, 교육적 결과물, 객체를 우선시하느라 한국어 어휘 교육에서 다루지 못한 '과정'으로서 주목해야 할 대상과 학습자는 없는지 검토한 후, 신조어의 교육적 가치를 점검하고 이에 대한 자료구축 방안을 제안하는 데 목적을 두었다. '과정' 중에 빠진 사각지대 어휘로는 신조어를, 사각지대 단계의 학습자로는 외국인 학문목적 학습자를 들고, 학문 목적 학습자에게 신조어를 가르치기 위한 학습 자료로 사전을 만들기 위한 전초 작업으로 신조어 '단층적 목록' 만들기를 제안하였다. '단층적 목록'은 신조어를 시기별로 조어, 의미, 문화 등으로 나누어 자료로 구축하는 것이다. 이러한 연구는 그간 한국어 어휘교육에서 구축한 결과물에 '과정'으로 학습으로 할 어휘를 추가하여 한국어 어휘교육을 체계적으로 하는 데 도움을 줄 것이다.

이주배경 학생 밀집초등학교 다문화교육 담당교사의 경험과 정책시사점 (Teachers' experiences of multicultural education in primary schools with ethnic diversity and policy implications)

  • 박희진;최수진
    • 한국교육논총
    • /
    • 제43권1호
    • /
    • pp.89-123
    • /
    • 2022
  • 본 연구는 이주배경 학생 밀집초등학교에서 다문화교육 업무를 담당하는 교사의 경험을 탐색하여 이를 토대로 교육정책 시사점을 도출하기 위하여 수행되었다. 연구를 위하여 농촌지역 2개 군에 위치한 9개 학교의 교원 15명을 심층면담하였다. 연구결과 이주배경 학생 밀집초등학교에서 다문화교육 업무를 담당하는 교사조차 체계적인 다문화교육을 받은 경우는 찾아보기 어려웠고, 가용한 자료의 부족으로 어려움을 겪고 있으며, 한국어를 모국어로 하지 않는 학생 및 학부모와의 소통에 긴박한 지원 필요를 느끼고 있는 것으로 나타났다. 이주배경 학생에 대한 정확한 자료확보의 어려움도 확인되었다. 이상의 연구결과를 토대로 예비 및 현직 교사를 대상으로 하는 체계적인 다문화교육, 학교 한국어교육 자료 개선 및 통합교육 자료 보급, 일반교과 내용의 수정과 개선 등을 제안하였다. 또한, 학교 한국어교육 전담인력의 육성과 배치를 통해 한국어를 모국어로 하지 않는 학생 및 학부모와의 체계적인 소통지원 방안 마련, 이주배경 학생에 대한 정확한 실태파악 대책 등의 다문화교육정책 개선방안을 제안하였다.

분포 정보를 이용한 의미 중의성을 지닌 한국어 동사의 의미 분별 (Korean Verb Senses Disambiguation Using Distributional Information from Corpora)

  • 조정미;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.56-61
    • /
    • 1995
  • 본 논문에서는 말뭉치로부터의 분포 정보를 이용하여, 의미 중의성을 지닌 한국어 동사의 의미를 분별하고자 한다. 분포 정보란 말뭉치내에서 목적어-서술어 관계에 있는 명사와 동사의 분포를 의미한다. 이 분포 정보는 명사 분포와 동사 분포로 나누어 생각할 수 있는데, 본 논문에서는 이 두가지 분포 정보를 사용함으로써 명사 분포만을 이용하였을 때 나타나는 자료 부족 현상을 등사 분포 정보를 이용하여 보완하였다. 분포 정보간의 유사도 계산은 정보 이론에서 사용하는 상대 엔트로피를 이용한다. 품사가 태깅된 50만 단어의 한국어 말뭉치로부터 분포 정보들을 추출하여 한국어 동사 10개에 대해 실험하였다.

  • PDF

어절 띄어쓰기를 고려한 형태소 단위 품사 태깅 모델 (Morpheme-Unit POS Tagging Model Considering Eojeol-Spacing)

  • 김진동;이상주;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 1998
  • 한국어 품사 태깅 모델은 어절 단위 모델과 형태소 단위 모델로 나눌 수 있다. 이들 중 형태소 단위 모델은 자료 부족 문제가 별로 심각하지 않고 비교적 풍부한 태깅 결과를 내어 준다는 점에서 선호되나 어절 단위로 띄어쓰기를 하는 한국어의 특성을 제대로 반영하지 못한다는 단점이 있다. 이에 본 논문에서는 한국어의 어절 띄어쓰기 정보를 활용하는 형태소 단위 품사 태깅 모델을 제안한다. 어절 띄어쓰기 정보는 복잡도가 매우 작기 때문에 모델 구축에 드는 추가 비용이 그리 크지 않다. 그림에도 불구하고 실험 결과는 어절 띄어쓰기 정보가 한국어 품사 태깅에 유용한 정보임을 보여준다.

  • PDF