• Title/Summary/Keyword: 경계강도

Search Result 537, Processing Time 0.024 seconds

Prosody Boundary Index Prediction Model for Continuous Speech Recognition and Speech Synthesis (연속음성 인식 및 합성을 위한 운율 경계강도 예측 모델)

  • 강평수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.99-102
    • /
    • 1998
  • 본 연구에서는 연속음 인식과 합성을 위한 경계강도 예측 모델을 제안한다. 운율 경계 강도는 음성 합성에서는 운율구 사이의 휴지기의 길이 조절로 합성음의 자연도에 기여를 하고 연속음 인식에서는 인식과정에서 나타나는 후보문장의 선별 과정에 특징변수가 되어 인식률 향상에 큰 역할을 한다. 음성학적으로 발화된 문장은 큰 경계 단위로 볼 때 운율구 형태로 이루어졌다고 볼 수 있으며 구의 경계는 문장의 문법적인 특징과 관련을 지을 수 있게 된다. 본 논문에서는 운율 경계 강도 수준을 4로 하고 문법적인 특징으로는 트리구조 방법으로 결정된 오른쪽 가지의 수식의 깊이(rd)와 link grammar방법으로 결정된 음절수(syl), 연결거리(torig)를 bigram 모형과 결합하여 운율적 경계 강도를 예측한다. 예측 모형으로는 다중 회귀 모형과 Marcov 모형을 제안한다. 이들 모형으로 낭독체 200 문장에 대해 실험한 결과 76%로 경계 강도를 예측할 수 있었다.

  • PDF

Analysis and Prediction of Prosodic Phrage Boundary (운율구 경계현상 분석 및 텍스트에서의 운율구 추출)

  • Kim, Sang-Hun;Seong, Cheol-Jae;Lee, Jung-Chul
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.1
    • /
    • pp.24-32
    • /
    • 1997
  • This study aims to describe, at one aspect, the relativity between syntactic structure and prosodic phrasing, and at the other, to establish a suitable phrasing pattern to produce more natural synthetic speech. To get meaningful results, all the word boundaries in the prosodic database were statistically analyzed, and assigned by the proper boundary type. The resulting 10 types of prosodic boundaries were classified into 3 types according to the strength of the breaks, which are zero, minor, and major break respectively. We have found out that the durational information was a main cue to determine the major prosodic boundary. Using the bigram and trigram of syntactic information, we predicted major and minor classification of boundary types. With brigram model, we obtained the correct major break prediction rates of 4.60%, 38.2%, the insertion error rates of 22.8%, 8.4% on each Test-I and Test-II text database respectively. With trigram mode, we also obtained the correct major break prediction rates of 58.3%, 42.8%, the insertion error rates of 30.8%, 42.8%, the insertion error rates of 30.8%, 11.8% on Test-I and Test-II text database respectively.

  • PDF

A Study on Generation Method of Intonation using Peak Parameter and Pitch Lookup-Table (Peak 파라미터와 피치 검색테이블을 이용한 억양 생성방식 연구)

  • Jang, Seok-Bok;Kim, Hyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.184-190
    • /
    • 1999
  • 본 논문에서는 Text-to-Speech 시스템에서 사용할 억양 모델을 위해 음성 DB에서 모델 파라미터와 피치 검색테이블(lookup-table)을 추출하여 미리 구성하고, 합성시에는 이를 추정하여 최종 F0 값을 생성하는 자료기반 접근방식(data-driven approach)을 사용한다. 어절 경계강도(break-index)는 경계강도의 특성에 따라 고정적 경계강도와 가변적 경계강도로 세분화하여 사용하였고, 예측된 경계강도를 기준으로 억양구(Intonation Phrase)와 액센트구(Accentual Phrase)를 설정하였다. 특히, 액센트구 모델은 인지적, 음향적으로 중요한 정점(peak)을 정확하게 모델링하는 것에 주안점을 두어 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞뒤 기울기를 추정하여 4개의 파라미터로 설정하였고, 이 파라미터들은 CART(Classification and Regression Tree)를 이용하여 예측규칙을 만들었다. 경계음조가 나타나는 조사, 어미는 정규화된(normalized) 피치값과 key-index로 구성되는 검색테이블을 만들어 보다 정교하게 피치값을 예측하였다. 본 논문에서 제안한 억양 모델을 본 연구실에서 제작한 음성합성기를 통해 합성하여 청취실험을 거친 결과, 기존의 상용 Text-to-Speech 시스템에 비해 자연스러운 합성음을 얻을 수 있었다.

  • PDF

A Study on the Interface Shear Strength of HDPE Textured Geomembrane (HDPE 표면처리 지오멤브레인의 경계면 전단강도에 관한 연구)

  • Kim, Sejin;Youn, Heejung
    • Journal of the Korean GEO-environmental Society
    • /
    • v.17 no.2
    • /
    • pp.41-49
    • /
    • 2016
  • This paper evaluates the interface shear strength of HDPE textured geomembrane. The interface shear strength between textured geomembrane and marl, and textured geomembrane and woven geotextile were measured; and the smooth geomembrane was used to evaluate the effect of "texture" on the interface shear strength. The interface shear strength was measured using a large direct shear testing device under several conditions including the presence of water, and the normal stresses that were 12, 24, 45, 100, 500, and 1,000 kPa. From testing results, it was found that there was meaningful reduction in the interface shear strength in the presence of water, but the effect of normal stress was not clear. The interface shear strength was measured to be significantly different for smooth geomembrane, whose strength was measured to be as small as half that of the textured geomembrane.

Comparison of Three POS Sets in Prosody Break Index Estimation (운율경계강도 예측을 위한 품사셋 비교 연구)

  • 엄기완
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.81-84
    • /
    • 1998
  • 본 논문에서는 문장의 문법 구조로부터 운율 경계 강도를 효율적으로 예측하기 위해서, 문법 정보의 세밀함에 따라 품사셋을 3단계로 설정하였다. 그리고 운율 경계 강도를 예측하는데 있어서 어떠한 품사셋이 최적인가를 알아보기 위해 150문장의 코퍼스를 구축하였으며, 세 종류의 품사셋에 대해 코퍼스를 수작업으로 품사분석을 하였다. 청취실험으로 결정한 운율 경계 강도를 바탕으로 확률론적인 모델링 방법을 사용하여 예측하는 실험을 하였다. 이러한 예측결과를 평가 비교하여 최적의 품사셋을 정하였다.

  • PDF

A Block-based Segmentation Method for Color-Textured Images (칼라 텍스쳐 영상에 대한 블록 기반의 영역분할 방법)

  • 김성영;이석찬;김민환;박창민
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.165-169
    • /
    • 2001
  • 본 논문에서는 텍스쳐가 포함된 칼라 영상으로부터 텍스쳐에 무관하게 영역을 분할할 수 있는 방법을 개발하였다. 빠른 처리를 위해 영상을 블록 단위로 쪼개고 블록의 경계 성분값(H)을 계산하여 영역 분할에 이용할 수 있도록 하였다. M값은 객체의 경계에서는 높은 경계 강도를 갖지만 영역 내부나 텍스쳐 경계에서는 상대적으로 낮은 경계 강도를 갖도록 정의되었다 영상 분할을 위해 M값으로 표현된 M영상으로부터 Watershed를 이용해 경계 위치를 결정하고 닫혀진 형태로 경계가 표현될 수 있도록 하였다. 그런데 Watershed 방법은 과잉 분할 결과를 초래하므로 인접 영역 사이의 공유 경계에 대한 강도와 영역 내부의 칼라 분포 특성을 이용하여 영역을 병합함으로써 객체 경계처럼 중요한 변화가 발생되는 영역 단위의 최종 영상 분할된 결과를 얻을 수 있도록 하였다. 본 논문에서 제안한 방법은 MPEG4나 내용기반검색을 위한 영역분할에 유용하게 적용될 수 있을 것이다.

  • PDF

The Comparison of OC1 and CART for Prosodic Boundary Index Prediction (운율 경계강도 예측을 위한 OC1의 적용 및 CART와의 비교)

  • 임동식;김진영;김선미
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.4
    • /
    • pp.60-64
    • /
    • 1999
  • In this paper, we apply CART(Classification And Regression tree) and OC1(Oblique Classifier1) which methods are widely used for continuous speech recognition and synthesis. We prediet prosodic boundary index by applying CART and OC1, which combine right depth of tree-structured method and To_Right of link grammar method with tri_gram model. We assigned four prosodic boundary index level from 0 to 3. Experimental results show that OC1 method is superior to CART method. In other words, in spite of OC1's having fewer nodes than CART, it can make more improved prediction than CART.

  • PDF

A Study on the Smart Workers' Perception of the Boundary Strength Between Work and Nonwork (스마트워크 이용자의 업무와 비업무간 경계 강도 인식에 관한 연구)

  • Kim, Yong-Young;Oh, Sangjo;Lee, Heejin
    • Information Systems Review
    • /
    • v.15 no.3
    • /
    • pp.71-87
    • /
    • 2013
  • Companies as well as the Korean government show growing attention to the Smart Work which is enabled by the ongoing development of information and communication technologies (ICTs). Smart Work can be regarded as an extended version of telecommuting or distance work and defined as "working efficiently and conveniently regardless of time and place utilizing ICTs." Smart Work currently puts its emphasis on the work and life balance by changing the ways of working. Despite its emphasis on work and life balance, it is expected the boundaries between work and nonwork would blur, work and nonwork boundaries may become more permeable, and role conflicts would occur more times than before. To find ways to enhance work and life balance while escaping from expected conflicts in the context of Smart Work, we investigate the work and nonwork boundary strengths and the factors affecting them. In the course, we consider asymmetries between the work and nonwork boundary strengths and bidirectional nature of work and nonwork permeability. We develop two research models having work and nonwork boundary strengths as respective dependent variables. We empirically found that work role identification and nonwork-to-work permeability had influences on the boundary strength at work and that work-to-nonwork permeability affected the boundary strength at nonwork. However, nonwork role identification did not show any significant influence on the boundary strength at nonwork.

  • PDF

Deblocking Filter Algorithm in Intra Prediction Coding for Low Complexity Video Codec (저복잡도 비디오 코덱을 위한 화면 내 예측 부호화에서의 디블록킹 필터 알고리듬)

  • Yun, Janghyeok;Jeon, Gwanggil;Jeong, Jechang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.330-332
    • /
    • 2012
  • H.264/AVC를 비롯한 대부분의 동영상 압축 표준에 의해 부호화 및 복호화된 영상은 블록화 현상(blocking artifacts)이 생긴다. 이러한 화질 열화 현상은 블록 기반의 정수형 이산코사인 변환(Integer DCT)을 수행한 후 계수를 양자화 하기 때문에 발생한다. 이러한 블록화 현상을 줄이기 위해 H.264/AVC에서는 디블록킹 필터를 이용한다. 본 논문에서는 H.264/AVC의 디블록킹 필터의 복잡도를 감소시키면서 화질을 유지하는 알고리듬을 제안하고 실험을 통한 평가를 제시한다. 복잡도를 줄이기 위해 제안하는 알고리듬에서는 블록 경계강도(Bs) 결정 과정에서 한 화소 줄의 경계강도를 이용하여 네 화소 줄 모두에 적용한다. 실험결과 경계강도 결정의 계산량을 줄이면서 주관적, 객관적 화질 또한 향상되는 결과를 보였다.

  • PDF

Prosodic Break Index Estimation using LDA and Tri-tone Model (LDA와 tri-tone 모델을 이용한 운율경계강도 예측)

  • 강평수;엄기완;김진영
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.7
    • /
    • pp.17-22
    • /
    • 1999
  • In this paper we propose a new mixed method of LDA and tri-tone model to predict Korean prosodic break indices(PBI) for a given utterance. PBI can be used as an important cue of syntactic discontinuity in continuous speech recognition(CSR). The model consists of three steps. At the first step, PBI was predicted with the information of syllable and pause duration through the linear discriminant analysis (LDA) method. At the second step, syllable tone information was used to estimate PBI. In this step we used vector quantization (VQ) for coding the syllable tones and PBI is estimated by tri-tone model. In the last step, two PBI predictors were integrated by a weight factor. The proposed method was tested on 200 literal style spoken sentences. The experimental results showed 72% accuracy.

  • PDF