• Title/Summary/Keyword: 단어길이

Search Result 147, Processing Time 0.025 seconds

The Effects of Korean Lexical Characteristics on Memory Span (한국어 어휘특성들이 기억폭에 미치는 효과)

  • Park Tae-Jin;Park Sun-Hee;Kim Tae-Ho
    • Korean Journal of Cognitive Science
    • /
    • v.17 no.1
    • /
    • pp.15-27
    • /
    • 2006
  • The effects of the number of Hangul syllable, the nunber/location of batchim in a Hangul word, and compound/noncompound Hangul word on memory span were examined. The results were that (1) the more syllables a word had, the lower us memory span was, (2) the more batchims a two-syllable word had, the lower its memory span was (Korean batchim effect on memory span), (3) noncompound word had higher memory span than compound word. The reading speed of above mentioned words was measured and the results were that (1) the more syllables a word had, the slower its reading speed was, (2) but the reading speed of a two-syllable word was forest when it had a batchim on second syllable than when it had no batchim or had a batchim on first syllable or batchims on both syllables (Korean ending batchim effect on reading speed), (3) noncompound word was read faster thu compound word. Korean ending batchim effect on reading speed was not compatible with the explanation by articulatory loop bur compatible with the explanation by visual cache where the orthographic information was represented. The results suggest that memory span was influenced nor only by phonological information but also by orthographic information.

  • PDF

A Study on the Postprocessing In Keyword Spotting (Keyword spotting에서의 후처리 과정에 관한 연구)

  • 송화전
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.249-252
    • /
    • 1994
  • Keyword spotting 이란 음성인식의 한 분야로서 컴퓨터가 사람의 음성을 입력받아 이 음성에 미리 정해진 특정단어 또는복수개의 단어들 중 어느 것이 포함되어 있는지의 여부를 찾아내고 이 단어를 식별해 내는 작업을 의미한다. 이러한 keyword spotting 시스템의 인식 오류들을 감소시키는 방법의 하나로 keyword spotting 시스템에 후처리 과정을 둠으로써 잘못 검출된 keyword 들을 제거시키는 방법이 사용될 수 있다. 본 논문에서는 keyword로 검출된 영역에 대한 keyword 모델의 likeihood와 그 여역에 대한 filler 모델의 likelihood의 ratio 와 second best keyword 의 likelihood 그리고, 끝점존재 영역의 구간 길이등 여러 가지 정보를 이용한 후처리과정을 검토하고 인식실험을 통해 이들의 성능을 비교하였다. 6개의 부서명을 keyword로 하는 불특정 화자 keyword spotting 실험을 수행한 결과 baseline 시스템의 경우 고립단어 및 문장 형태의 음성에 대해 95.0%의 keyword 인식률을 얻었으며, 본 논문에서 검토된 네 가지 후처리 방법에 의해 keyword rejection ratio를 0%에서 5%까지 변화시켜 나갈 경우 최저 95.3%에서 최고 97.1%까지 keyword 인식률이 향상된 결과를 얻었다. 특히 성능과 계산량을 종합적으로 고려할 때 끝점 존재 영역의 구간 길이 정보를 이용한 방법이 가장 우수하였다.

  • PDF

Korean-English Sentence Alignment Based on Sentence Length and Word Alignment (문장 길이와 단어 정렬에 기반한 한-영 문장 정렬)

  • Lim, Jae-Soo;Seo, Hee-Cheol;Lee, Sang-Zoo;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.302-309
    • /
    • 2001
  • 말뭉치를 통한 통계적인 자연 언어 처리에 관한 연구가 다국어 처리 분야에서도 활발히 진행되고 있는 가운데, 본 논문에서는 병렬 말뭉치 구축 및 활용의 기본이 되는 문장 정렬을 위한 효과적인 방법을 제안한다. 먼저, 기존의 문장 길이를 이용한 방법을 한-영 문장 정렬에 적용해 보고, 길이 정보만을 이용했을 때의 한계점을 지적한다. 그리고, 사전과 품사 대응 확률을 이용한 단어 정렬을 통하여, 길이 기반의 정렬 방식이 갖는 문제점을 보완할 수 있는 방법을 제시한다. 실험을 통하여 제안한 방법이 길이에 기반한 방법에 비하여 높은 성능을 나타냄을 알 수 있었다. 또한 한-영 문장 정렬에의 어휘 정보 활용에 있어서 문제가 될 수 있는 요소가 어떤 것들이 있는지 알아본다.

  • PDF

The characteristics of eye-movement in Korean sentence reading: cluster length, word frequency, and landing position effects (우리 문장 읽기에서 안구 운동의 특성: 어절 길이, 단어 빈도 및 착지점 관련 효과)

  • Koh, Sung-Ryongng;Yoon, Nak-Yeong
    • Korean Journal of Cognitive Science
    • /
    • v.18 no.4
    • /
    • pp.325-350
    • /
    • 2007
  • This study investigated global and local characteristics of eye movement while 16 college students read 48 easy Korean sentences. It was found that readers lusted for about 225ms at the word cluster(eojeol), made a forward saccade of about 3.6 characters to the next word, skipped short and high-frequent words about 25% during the first-pass reading, and regressed backward at 19%. There were also individual differences in readers' pattern of fixation and saccade. In addition, the effects of word cluster length and word frequency and the effects related to landing position were examined. The eyes landed on the center of a word cluster more frequently than on the boundaries. When the eyes landed at the boundaries, the eyes fixated the word cluster again more frequently. The word clusters with high-frequency words were read faster than those with low-frequency words.

  • PDF

A Study on the English Pronunciation for English-related Industry (교육산업 활성화를 위한 영어발음 연구)

  • Park, Hee-Suk
    • Journal of Convergence for Information Technology
    • /
    • v.8 no.1
    • /
    • pp.37-42
    • /
    • 2018
  • This study focuses on investigating and comparing the lengths of the five words, vowels, and the ratio of the length of vowels to that of words among the Korean college students with the English native speaker. English sentences were read and recorded by Korean subjects to do this experiment. The vowel lengths were measured from a sound spectrogram, the Praat software program, and these data were analyzed through statistical analysis. I could easily tell that there were differences between the groups and they were significant. In the English front low vowel /${\ae}$/, I was able to find out that native subjects pronounced differently from Korean subjects, and the differences were significant. However, the pronunciation of the English diphthong /ai/, native subjects pronounced significantly shorter than Korean subjects.

Australian English sequences of semivowel /w/ + Back Vowel /3:/, / :/ or / / production by Korean and Japanese learners of English (한국인과 일본인의 호주 영어 모음 연쇄 /w+V/ 조음 비교)

  • 박시균
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.188-191
    • /
    • 1998
  • 호주 영어의 단어 중 한국인과 일본인이 구별하기 어려운 'work', 'walk', 'wok' 세 단어에 대해 다룬다. 우선 한국인과 일본인이 이들 세 단어를 어떻게 조음할 것인가를 예측하고, 실제로 한국인과 일본인 화자들이 조음한 자료를 가지고 모듬의 음질과 길이 두가지 측면으로 나누어 예측한 사항과 비교하고 또 이들 단어를 조음할 때 한국인과 일본인 사이에 어떤 음성 음운적 특징이 나타나는지도 비교 분석한다. 결과는 모국어의 음성, 음운적 영향이 목표어의 음소를 습득하고 발음하는데에 영향을 미친다는 사실을 보여주고 있다. 하지만 wok/wo k/의 예는 언어 보편적인 요소가 L2의 음소를 습득하는데 있어 또 하나의 요소로 작용하고 있음도 알려주고 있다.

  • PDF

Korean-English Sentence Alignment using Length and Similarity Information (길이 정보와 유사도 정보를 이용한 한영 문장 정렬)

  • Hong, Jeen-Pyo;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.130-135
    • /
    • 2010
  • 문장 정렬은 두 개의 문서 간의 대응이 되는 문장을 찾는 작업이다. 이 방법은 통계적 기계 번역의 학습 문서인 병렬 말뭉치를 자동으로 구축하는데 필수적인 방법이다. 본 연구에서는 길이 정보에 추가적으로 유사도 정보를 반영하는 한영 문장 정렬 방법을 제안한다. 먼저 한국어로 된 문서를 기계번역 시스템에 적용하여 영어 문서로 변환한다. 그리고 번역된 영어로 된 문서 결과와 영어로 된 대상 문서 간의 정렬 작업을 수행한다. 정렬 완료된 결과와 원시 문서, 대상 문서로부터 최종적인 결과를 생성해낸다. 본 논문에서는 기계 번역을 이용하는 방법과 더불어 기존의 길이 기반 문장 정렬 프로그램에 문장 유사도 정보를 추가하여 단어 정렬의 성능 향상을 꾀하였다. 그 결과 "21세기 세종기획"의 최종 배포본 내에 포함된 한영 병렬 말뭉치에 대해 한영 문장 정렬 F-1 자질의 결과가 89.39%를 보였다. 이 수치는 기존의 길이 기반의 단어 정렬의 성능 평가 결과와 비교했을 때 약 8.5% 가량 성능이 향상되었다.

  • PDF

Sentiment words extraction method using pattern (패턴을 이용한 상품평 감정 단어 추출 방법)

  • Chun, Eun-Hye;Shim, Su-Jeong;Park, Hyuk-Ro
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.112-113
    • /
    • 2010
  • 최근 오피니언 마이닝 관련 연구 중 감정 분류에 대한 관심이 높아지면서 많은 연구가 진행되고 있다. 기존 영어권 연구에서 제시되어온 방법은 한국어 상품평에 적용하는 것이 쉽지 않다. 영어 시소러스 기반 한국어 감정단어 추출 기술은 한국어와 영어 단어가 일대일로 일치하기가 어렵다는 문제가 있다. 기존 관련 연구 중 k-Structure 기법은 패턴의 길이가 3인 단순한 문장에 속성단어와 감정단어가 포함되었을 경우를 기준으로 한 것이므로 한정적이다. 본 논문에서 제안하는 방법은 상품평에서 의미적인 패턴을 추출하여 감정 단어의 위치를 파악하는 방법이다.

  • PDF

HMM-based Korean Named Entity Recognition (HMM에 기반한 한국어 개체명 인식)

  • Hwang, Yi-Gyu;Yun, Bo-Hyun
    • The KIPS Transactions:PartB
    • /
    • v.10B no.2
    • /
    • pp.229-236
    • /
    • 2003
  • Named entity recognition is the process indispensable to question answering and information extraction systems. This paper presents an HMM based named entity (m) recognition method using the construction principles of compound words. In Korean, many named entities can be decomposed into more than one word. Moreover, there are contextual relationships among nouns in an NE, and among an NE and its surrounding words. In this paper, we classify words into a word as an NE in itself, a word in an NE, and/or a word adjacent to an n, and train an HMM based on NE-related word types and parts of speech. Proposed named entity recognition (NER) system uses trigram model of HMM for considering variable length of NEs. However, the trigram model of HMM has a serious data sparseness problem. In order to solve the problem, we use multi-level back-offs. Experimental results show that our NER system can achieve an F-measure of 87.6% in the economic articles.

Ontofitting: Specialization of Word Vectors for Semantic Representation (Ontofitting: 의미 표현을 위한 벡터 조정)

  • Oh, Jinyoung;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.537-540
    • /
    • 2018
  • 우리는 단어 임베딩에 외부지식을 내재할 수 있는 Ontofitting 방법을 제안한다. 이 방법은 retrofitting의한 방법으로 유의어, 반의어, 상위어, 하위어 정보를 단어 임베딩에 내재할 수 있다. 유의어와 반의어 정보를 내재하기 위해서 벡터의 각 유사도를 사용하였고 상하위어 정보를 내재하기 위해서 벡터의 길이 정보를 사용하였다. 유의어 사이에는 작은 각도를 가지고 반의어 사이에는 큰 각도를 가지게 된다. 하위어는 상위어보다 상대적으로 작은 길이를 가지게 된다. SimLex와 HyperLex로 실험하여 효과와 안정성을 검증하였다. 의미정보를 내재한 임베딩을 사용할 수 있다면 QA, 대화 등 응용에서 보다 좋은 성능을 보일 수 있을 것이다.

  • PDF