An Experimental Phonetic Study of the Word Duration in Standard Korean - with reference to its contextual effects - (한국어의 낱말 지속시간에 관한 실험음성학적 연구 - contextual effect와 관련하여 -)

  • 성철재
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.191-194
    • /
    • 1995
  • 환경적 요인으로 인하여 측정간격이 지속시간이 변할 수 있는 지의 l여부를 알아보기 위해 실험을 행하였다. 실험에서의 측정간격은 어절단위이며 이러한 실험을 통해서 소위 구-길이 효과의 한 츠면도 파악해 볼 수 있다. 측정간격 양쪽의 어절에서 체계적인 음절증가를 유도한 뒤 나타날 수 있는 측정간격의 지속시간에서의 변화율을 측정하였다. 결과는 엄격한 의미에서 체계적으로 기술될 수 있을 만한 단음화효과는 나타나지 않았다. 어느 정도의 융통성을 둔다면 순행단음화 효과의 부분적인 출현은 인정할 만하다. 문장의 중간에 위치한 어절과 양쪽 환경 각각을 짝을 지워 상관관계를 따져본 결과 양의 상관이 더 많이 나타났다. 결과적으로 실험에서의 측정간격은 지속시간에 관한 한 문장 내에서 독립적인 활동을 하는 단위로 생각할 수 있다.

A Study on Context Environment and Model State for Robustness Acoustic Models (강건한 음향모델을 위한 모델의 상태와 문맥환경에 관한 연구)

  • 최재영;오세진;황도삼
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.366-369
    • /
    • 2003
  • 본 연구에서는 강건한 문맥의존 음향모델을 작성하기 위한 기초적인 연구로서 문맥환경과 상태수의 변화에 따른 음향모델의 성능을 고찰하고자 한다. 음성은 시간함수로 표현되며 음절, 단어, 연속음성을 발성할때 자음과 모음에 따라 발성시간에 차이가 있으며 음성인식의 최소 인식단위로 널리 사용되는 음소의 앞과 뒤에 오는 문맥환경에 따라 인식성능에 많은 차이를 보이고 있다. 따라서 본 연구에서는 시간의 변화(상태수의 변화)와 상태분할 과정에서 문맥환경의 변화를 고려하여 다양한 형태의 문맥의존 음향모델을 작성하였다. 모델학습은 음소결정트리 기반 SSS 알고리즘(Phonetic Decision Tree-based Successive State Splitting: PDT-555)을 이용하였다 PDT-SSS 알고리즘은 미지의 문맥정보를 해결하기 위해 문맥방향과 시간방향으로 목표 상태수에 도달할 때까지 상태분할을 수행하여 모델을 작성하는 방법이다. 본 연구에서 강건한 문맥의존 음향모델을 학습하기 위한 방법의 유효성을 확인하기 위해 국어공학센터의 452 단어를 대상으로 음소와 단어인식 실험을 수행하였다. 실험결과, 음성의 시간변이에 따른 모델의 상태수와 각 음소의 문맥환경에 따라 인식성능의 변화를 고찰할 수 있었다. 따라서 본 연구는 향후 음성인식 시스템의 강건한 문맥의존 음향모델을 작성하는데 유효할 것으로 기대된다.

Legibility Evaluation of Two and Three Syllable Words Used in Pesticides According to Font, Thickness, Gender, and Visual Acuity (시력, 폰트, 굵기, 성별에 따른 2음절 및 3음절 농약 제품 표시글자의 가독성 평가)

  • Hwang, Hae-Young;Song, Young-Woong
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.13 no.8
    • /
    • pp.3444-3451
    • /
    • 2012
  • Safety and health related information for the proper use and handing of pesticides is usually printed on the surface of the pesticide products in the form of texts. But, the guidelines or standards for the appropriate presentation of the texts for the pesticide products are most vague or not practical. Thus, this study aimed to provide the preliminary guidelines for the text sizes based on the legibility experiments. To achieve the objective legibility evaluation experiments were conducted to test the effects of different near vision (0.6, ${\geq}0.8$), gender, font type(thick gothic-type and fine gothic-type), thickness of font(plain and bold), and number of syllables(2 and 3 syllables) in the same age group of 20s. The results showed that legibility was different according to the visual acuity (p<0.05), and no other main effects showed statistically significant effects. The 'maximum illegible size' to read at least one word correctly in all the text conditions was 2 pt when the near vision was ${\geq}0.8$, and 2 pt or 3 pt when the near vision was 0.6. The 'minimum legible size' for 100% correct answer was 9 pt for the near vision of 0.6, and 5.3 pt for ${\geq}0.8$, respectively. Mean character size does not read any discomfort in 0.6 was 15.5 pt in both male and female but male was mean 8.5 pt, female was 10 pt in ${\geq}0.8$. Considering these experimental results, it was recommended that the 16 pt or larger characters should be used the important information such as 'Pesticides' or toxicity, and the minimum character size was 9 pt for the less important information.

Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation (문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리)

  • 이용주;손종목;강경옥;배건성
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.11b
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

Real Time Recognition of Unknown Words based on the Analysis of Similar Words with an Extended Definition (확장 정의된 유사어절의 분석에 근거한 실시간 미등록어 인식)

  • Park, Bong-Rae;Hwang, Young-Sook;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.222-228
    • /
    • 1996
  • 기존의 미등록어 추정 방법은 대부분 단일 어절 접근 방법으로 단일 어절에서 추출할 수 있는 추정 정보가 부족하여 과분석과 오분석의 가능성이 높았다. 그래서 동일 미등록어를 가진 어절들을 동시에 분석하는 유사 어절 접근 방법이 제시되었다. 그러나 이 방법도 유사 어절의 범위를 조사나 어미만 다른 어절로 정의함으로써 수집될 수 있는 유사 어절의 수가 제한되어 대략의 텍스트에서만 적용이 가능하였다. 이에 본 논문은 유사어절을 동일 음절열을 공유하는 어절들로 확장 정의하여 작은 크기 N의 텍스트 윈도우에서 유사 어절의 발견 가능성을 높임으로써 실시간으로 미등록어를 추정할 수 있게 하는 방법을 제시한다. N을 100으로 한 실험결과는 미등록어 추정 정확도가 99.3%였고 재현율은 약 32%였다.

A Study on Comparision of Clearness Between the Conventional Singer and Techno Singer (기존가수와 테크노 가수의 명료성 비교에 관한 연구)

  • Jung YoungHoon;Shin DongSung;BAE MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.171-174
    • /
    • 2001
  • 랩을 주로 하는 신세대 테크노 가수들의 음악을 들어보면 자막을 보지 않고서는 무슨 말인지 알아들을 수가 없다. 그들이 노래할 때 입 크기의 변화 없이 입술모양만 변화시키면서 발성하기 때문이다. 음성은 기본적으로 여기성분과 성도성분으로 구분할 수 있다. 성도는 인두강과 구강을 합쳐서 일컫는다 따라서 입 모양을 어떻게 하느냐에 파라서 같은 말이라도 명료성이 달라지게 된다. 본 논문에서는 이 명료성을 비교 평가하기 위해서 기존가수와 테크노 가수의 한 음절에 대한 지속시간을 비교하여 보았고 8Khz까지의 스펙트로그램을 비교하였다. 비교결과 기존가수가 신세대 테크노 가수에 비하여 말의 의사 전달에 있어서 명료하게 전달 할 수 있다는 것을 알 수 있었다.

Syllable Reconition by HMM Using Segmental Statistics (세그멘트 통계량을 이용한 HMM 의 한국어 음절 인식)

  • 박창호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.175-178
    • /
    • 1995
  • 기존이 연속 출력 분포형 HMM은 시계열의 과도적 변화에 대하여 표현 능력이 부족하다는 단점이 있다. 이것을 보완하기 위해 본 논문에서는 음성의 동적 변화를 반영하기 위한 특징 파라메타로서 여러 개의 프레임을 결합하여 세그멘트를 구성하여 각각에 대해 한 개의 벡터를 만들었다. 이것을 그대로 이용하면 세그멘트의 프레임수에 대응하는 파라메타의 차원수가 증가하기 때문에 학습 데이터가 불충분한 경우 모델의 파라메타를 잘 추정할 수 없으므로 K-L 전개로서 파라메타의 차원을 압축하여 파라메타수를 감소시켰다. 인식실험은 한국어 단음절에 대하여 멜켑스트럼ㅇ르 K-L 전개로 압축한 벡터를 이용한 결과와 멜켑스트럼, 멜켑스트럼 선형회귀계수를 파라메타로 이용한 경우를 비교하였다. 실험결과 K-L 전개로 압축한 벡터만을 이용한 경우는 멜켑스트럼 + 선형회귀계수를 파라메타로 이용한 경우보다 인식율이 낮앗으나 멜켑스트럼 + K-L 전개로 압축한 경우와 거의 동등한 결과를 얻을 수 있었다.

An Effective Indexing Method for Hangul Texts (한글 문서를 위한 효과적인 색인 방법)

  • 이준호;박혁로;박현주;안정수;김명호
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1995.08a
    • /
    • pp.11-14
    • /
    • 1995
  • 기존의 한글 자동 색인 방법들은 어절 단위 색인법과 형태소 단위 색인법으로 분류될 수 있다. 전자는 문서내의 어절에서 색인어의 부분으로서 가치가 없는 음절들을 제거함으로써 색인어를 추출하는 방법으로, 문서에 복합 명사들이 많이 포함되어 있을 경우 검색효과가 저하되는 문제점을 지니고 있다. 후자는 형태소 해석이나 구문 해석을 이용하여 중요한 의미를 갖는 명사나 명사구를 추출하는 방법으로, 단일 명사를 추출함으로써 복합 명사의 띄어 쓰기 문제를 극복할 수 있다. 그러나, 색인 과정에서 요구되는 많은 언어 정보를 개발하고 유지 보수해야 하는 부담을 지니고 있다. 본 논문에서는 기존의 색인 방법들의 문제점들을 완화할 수 있는 새로운 색인 방법을 제안한다. 그리고 실험을 통하여 제안하는 방법의 성능을 평가한다.

Hangul Porting and Display Performance Comparison of an Embedded System (임베디드 시스템을 위한 한글 포팅 및 출력 성능 비교)

  • Oh, Sam-Kweon;Park, Geun-Duk;Kim, Byoung-Kuk
    • Journal of Digital Contents Society
    • /
    • v.10 no.4
    • /
    • pp.493-499
    • /
    • 2009
  • Three methods frequently used for Hangul display in computer systems are Standard Johab Code in which each of Hangul consonants and vowels is given a 5-bit code and each syllable created by combining them forms a 2-byte code, Standard Wansung Code in which each of all the syllables generally used for Hangul presentation forms a 2-byte code, and Unicode in which each syllable in most of the world's language systems is given a unique code so that it allows computers to consistently represent and manipulate them in a unified manner. An embedded system in general has a lower processing power and a limited amount of storage space, compared to a personal compute(PC) system. According to its usage, however, the former may have a processing power equal to that of the latter. Hence, when Hangul display needs to be adopted, an embedded system must choose a display method suitable for its own resource environment. This paper introduces a TFT LCD initialization method and pixel display functions of an LN2440SBC embedded board on which an LP35, a 3.5" TFT LCD kit, is attached. Using the initialization and pixel display functions, in addition, we compare three aforementioned Hangul display methods, in terms of their processing speeds and amounts of memory space required. According to experiments, Standard Johab Code requires less amount of memory space but more processing time than Standard Wansung Code, and Unicode requires the largest amount of memory space but the least processing time.

A Study of Acceptance of Sijo, traditional Gagok by Modern Gagok (근대 가곡의 시조, 전통 가곡 수용 고(考) - 홍난파 가곡을 중심으로 -)

  • Shin, Woong-Soon
    • Sijohaknonchong
    • /
    • v.30
    • /
    • pp.91-107
    • /
    • 2009
  • This study is to examine how Sijo is being accommodated to modern Gagok by comparing them. In details, the work is about comparison between three verses in Sijo and twofold grouping in modern Gogok, JoongYuUm in traditional Gagok, YuBak in Sijo, the interlude, ADanSungJang, and changing verses in modern Gagok. First point is about three verses in Sijo and a rhythm of twofold grouping in modern Gagok. In particular, modern Gagok is treated as a group of twofold leaving three verses of Sijo. The way is chosen that whether it sets on an interlude into a song or the third part of three verses in Sijo is extended to avoid its logic of music and poem. Second, the discussion moves points on between an interlude in traditional Gagok and in Sijo. In the process of grouping twofold in modern Gagok, the parts which are interludes of both in traditional Gagok and in Sijo, combined with the interlude of the modern Gagok. It shows that the modern Gagok is affected on both the traditional Gagok and the Sijo. In addition, it explains elements of ADanSungJang - - tones and sounds in the modern Gagok. Originally, the traditional Gagok and sijo are composed of tones and sounds. At this point, tones are short, whereas sounds should be longer. This kind of way in the song has appeared on the modern Gagok of Hong, Nan-Pa. Lastly, the factors is about changing verses of modern Gagok. The one of differences between the modern Sijo and traditional Sijo is verses. For example, when it comes to sijo by Lee, Eun-Sang, he used to create his sijo with three verses. Hence, he did not change verses on his works. Whereas, the modern song "The Spring Lady" by Hong, Nan-Pa has shown the phenomenon that is separating three verses into six verses. It is noticeable that this phenomenon in "The Spring Lady" has the same bases with the modern Sijo.

