• Title/Summary/Keyword: 한국어자료

Search Result 414, Processing Time 0.026 seconds

The $21^{st}$ Century Sejong Project Special Corpus Construction (1998~2007) (21세기 세종 계획 특수자료 구축 분과의 성과 (1998~2007))

  • Seo, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.317-322
    • /
    • 2007
  • 이 발표는, <21세기 세종 계획>(문화관광부/국립국어원의 지원, 1998~2007)의 일환으로 이루어진, 특수자료 구축 분과의 지난 10년간의 성과를 소개하고자 하는 데에 목적이 있다. 특수자료 구축 분과에서는 구어, 병렬, 역사 자료, 북한 및 해외 말뭉치와 같은 특수 말뭉치의 구축을 담당하고 있다. 여기서는 특수자료 구축 소분과의 개요와 과제의 구성, 각 세부 과제별 말뭉치 구축 성과 및 각 말뭉치의 가치와 특성을 밝히고자 한다.

  • PDF

정보표시를 이용한 화일처리와 정보 검색 시스템

  • Park, Jae-Wan;Choe, Yun-Cheol;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.24-31
    • /
    • 1990
  • 표본자료에 있는 정보표시는 그 표본에 있는 모든 자료의 내용을 상실하지 않도록 하기 위해서 필요하다. 그러한 정보표시는 또한 자료들의 구분을 명확히 하여 자료의 저장과 정보검색 목적으로 사용된다. 본 연구에서는 이러한 텍스트 정보표시의 잘못 쓰여진 오류의 검출과 수정 그리고 이러한 분류표시를 이용하여 방대한 표본자료를 정보표시별로의 화일처리와 필요한 정보에 관한 검색 시스템에 관하여 기술한다.

  • PDF

Korean Semantic Tagged Corpus Construction working (한국어 의미 표지 부착 말뭉치 구축 작업)

  • Lee, Min-Ji;Lee, Yoon-Jeong;Lee, Jung-Kuk;Kim, Jong-Dae;Park, Chan-Young;Song, Hae-Jung;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.99-103
    • /
    • 2012
  • 의미 역 결정 (Semantic Role Labeling)은 문장 내의 술어-논항 요소들의 의미 관계를 결정하는 과정이다. 이를 위해서는 의미 표지 부착 말뭉치가 필요하지만 한국어의 경우 이 데이터가 매우 부족한 상황이다. 본 논문에서는 한국어 Proposition Bank(이하 PropBank) 말뭉치와 세종 용언 격틀 말뭉치 구축을 위한 의미 표지 부착 작업에 대해 설명한다. 표지 부착 작업은 말뭉치의 의존 관계를 사람이 파악하여 적절한 의미 역 태그를 다는 과정이고, 이 과정으로부터 얻은 말뭉치는 의미 역 결정을 위한 기계 학습 방법론의 훈련 자료로 이용된다. 이 과정에서 필요한 구문 표지 부착 밀뭉치로는 한국전자통신연구원의 구문표지 부착 말뭉치를, 그리고 언어자원으로는 한국어 PropBank의 frame file과 세종 용언 격틀 사전을 사용한다.

  • PDF

Interaction of native language interference and universal language interference on L2 intonation acquisition: Focusing on the pitch range variation (L2 억양에서 나타나는 모국어 간섭과 언어 보편적 간섭현상의 상호작용: 피치대역을 중심으로)

  • Yune, Youngsook
    • Phonetics and Speech Sciences
    • /
    • v.13 no.4
    • /
    • pp.35-46
    • /
    • 2021
  • In this study, we examined the interactive aspects between pitch reduction phenomena considered a universal language phenomenon and native language interference in the production of L2 intonation performed by Chinese learners of Korean. To investigate their interaction, we conducted an acoustic analysis using acoustic measures such as pitch span, pitch level, pitch dynamic quotient, skewness, and kurtosis. In addition, the correlation between text comprehension and pitch was examined. The analyzed material consisted of four Korean discourses containing five and seven sentences of varying difficulty. Seven Korean native speakers and thirty Chinese learners who differed in their Korean proficiency participated in the production test. The results, for differences by language, showed that Chinese had a more expanded pitch span, and a higher pitch level than Korean. The analysis between groups showed that at the beginner and intermediate levels, pitch reduction was prominent, i.e., their Korean was characterized by a compressed pitch span, low pitch level, and less sentence internal pitch variation. Contrariwise, the pitch use of advanced speakers was most similar to Korean native speakers. There was no significant correlation between text difficulty and pitch use. Through this study, we observed that pitch reduction was more pronounced than native language interference in the phonetic layer.

An Analysis on the Work Types of Korean Books Based Bibliographical Relationship (서지적 관계를 기반으로 한 한국어 도서의 저작유형 분석)

  • Kim, Jeong-Hyen
    • Journal of Korean Library and Information Science Society
    • /
    • v.38 no.3
    • /
    • pp.183-200
    • /
    • 2007
  • Today, if a work is created and published, new items concerned with it gets expended extremely. There are bibliographic relationships between the original work and new items as it is translations, revisions, reproductions, critiques etc. Bibliographic relationships refer to the connections and associations between two or more than two bibliographic items. Tillett's study with taxonomy, as well as other studies of the bibliographic relationships is used as the foundation for analysis of the work types. The current study examines the work types based upon the bibliographic relationships of Korean publications. KORMARC records of the Korean collection of the Chonnam National University Library is used to draw a sample for analysis. The research results of the study are provided for future studies on the KORMARC format and organization of Korean collections.

  • PDF

Development of Language-Learning Courseware in Korean Environments (한글 환경에서의 언어 교육 시스템 개발)

  • Kim, Hae-Gyung;Yoon, Ae-Sun;Lee, Mi-Hwa
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.335-340
    • /
    • 1998
  • 최근 컴퓨터 통신 기술의 발달로 인하여 교육분야에서의 컴퓨터 통신망을 이용한 학습의 효율성 증대에 대한 연구가 활발하다. 지금까지의 학습 방식은 교과목 특성의 개별성을 인식하지 못하거나 혹은 기술적인 문제점 등으로 인하여 학습자들에게 일관된 단답형이나 선다형의 학습 방식을 요구하여 왔다. 웹을 기반으로 한 원격 교육으로의 활용 측면에서 프랑스어와 같은 제2외국어의 경우, 한국어 환경에서의 프랑스어 악상 문자 입력이나 개별화된 저작 언어 개발 등의 문제점이 제기된다. $\lceil$Voila-web$\rfloor$ 은 한국어를 모국어로 하는 프랑스어 학습자들을 위한 교육 시스템으로 개별 교과목의 특성을 반영하고 능동적인 학습 방식을 통한 학습의 효율성 증대를 위한 시스템이다. 학습자들에게는 학습 자료의 전체적인 내용 흐름만을 제시하고 영역별 구체적인 자료의 전개는 다양한 교과 내용을 자유 항해할 수 있도록 설계되어 있다. 이는 학습자들로 하여금 통신망을 통한 컴퓨터 이용 학습의 장점을 기존의 학습 방식에 보완하여 보다 능동적인 학습 방식을 유도하여 학습의 효율성을 증대시킬 수 있다.

  • PDF

Bayesian Parameter Estimation Considering User-input for Korean Word Spacing Model (한국어 띄어쓰기 모델에서 사용자 입력을 고려한 베이지언 파라미터 추정)

  • Lee, Jeong-Hoon;Hong, Gum-Won;Lee, Do-Gil;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.5-11
    • /
    • 2008
  • 한국어 띄어쓰기에서 통계적 모델을 사용한 기존의 연구들은 최대우도추정(Maximum Likelihood Estimation)에 기반하고 있다. 그러나 최대우도추정은 자료부족 시 부정확한 결과를 주는 단점이 있다. 본 연구는 이에 대한 대안으로 사용자 입력을 고려하는 베이지언 파라미터 추정(Bayesian parameter estimation)을 제안한다. 기존 연구가 사용자 입력을 교정 대상으로만 간주한 것에 비해, 제안 방법은 사용자 입력을 교정 대상이면서 동시에 학습의 대상으로 해석한다. 제안하는 방법에서 사용자 입력은 학습 말뭉치의 자료부족에서 유발되는 부정확한 파라미터 추정(parameter estimation)을 방지하는 역할을 수행하고, 학습 말뭉치는 사용자 입력의 불확실성을 보완하는 역할을 수행한다. 실험을 통해 문어체 말뭉치, 통신환경 구어체 말뭉치, 웹 게시판 등 다양한 종류의 말뭉치와 다양한 통계적 모델에 대해 제안 방법이 효과적임을 알 수 있다.

  • PDF

A study on the duration of Korean fricatives /s, s'/ and factors that Influence their duration (한국어 마찰음 /ㅅ,ㅆ/의 지속시간에 영향을 미치는 요인에 관한 연구)

  • Song YoonGyoung
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.333-336
    • /
    • 1999
  • 본 연구의 목적은 한국어 마찰음 /ㅅ, ㅆ/가 지속시간에 있어서 유의미한 차이를 가지고 있는가를 관찰하고, 나아가 지속시간에 영향을 미치는 요인에 어떠한 것이 있는가를 기술하는 데에 있다. 이러한 결과는 음성합성을 위한 기초자료로 이용될 수 있을 것이다. 분석 결과, /ㅅ/보다 /ㅆ/가 더 긴 지속시간을 가졌으며 마찰음을 선행하는 음소의 성질, 단어에서 마찰음이 가지는 음절 위치, 그리고 마찰음 앞에서 끊어읽기가 이루어졌는가의 여부가 지속시간에 영향을 미치는 요인으로 작용하였다.

  • PDF

A study on the analysis of Korean vowels by the Line Spectrum Pair method (한국어의 LSP 분석에 관한 연구)

  • 이응정;김희래
    • The Journal of the Acoustical Society of Korea
    • /
    • v.5 no.3
    • /
    • pp.21-27
    • /
    • 1986
  • LSP 방식은 음성의 주파수 특성을 포함하는 공진 주파수를 낮은 부분과 SHB은 부분의 주파수 로 표시되는 선스펙트럼쌍 계수를 구하는 방법이다. 본 논문은 LSP 방식을 사용하여 한국어의 기본 모 음 7개를 대상으로 하여 분석하고 LSP 계수를 구하는 Algorithm을 개발하였으며 PARCOR 방식과 비 교하였다. 실험 결과 LSP 방식의 연산량이 PARCO 방식의 연산량보다 약 1/2정도로 적음을 알 수 있었 고 Hardware 구성 시에 있어서도 경제적임을 알 수 있었다. 그리고 LSP는 계수 모음의 종류에 따라 각 기 다른 공진 주파수, 대역폭을 나타내기 때문에 음성 합성이나 음성 인식 분야에 있어 기초 자료로 이 용할 수 있을 것으로 사료된다.

  • PDF

"NFPA 5000 건축물 구조 및 안전코드" 소개

  • Kim, Eun
    • 방재와보험
    • /
    • s.118
    • /
    • pp.36-41
    • /
    • 2007
  • 한국화재보험협회는 지난 2월 건축공학의 이론적 기반기술 및 실무 관련 자료가 수록된 "NFPA 5000, 건축물 구조 및 안전 코드" 한국어판(총 680페이지)을 발간하였다. 이번 한국어판 발간은 최근 건축물의 초고층화, 심층화, 자연재해 및 실내 환경의 중요성 증대 등에 따라 이루어진 것으로, 100년이 넘게 건축 환경과 관련 코드 및 기준을 개발해온 NFPA의 결정판인 NFPA 5000코드를 국내에 소개하여 관련 업계 종사자들에게 도움을 주고자 하였다. 본 고에서는 이 코드의 내용을 간략히 소개하고자 한다.

  • PDF