• 제목/요약/키워드: 합성 단위도

검색결과 623건 처리시간 0.035초

접합 왜곡의 최소화 과정이 포함된 음성합성기 (Text-to-Speech Synthesizer with the Process of Minimizing Concatenation Distortion)

  • 박훈재;김상훈;정재호
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.38-44
    • /
    • 1998
  • 대용량의 음성합성용 데이터베이스를 용이하게 구축하기 위해 음성인식 시스템을 이용한 음소 경계 분할이 이루어지고 있다. 그러나 자동 분할 결과를 직접 이용하여 합성음 을 생성할 경우 음소 경계 에러로 인하여 접합 왜곡이 많이 발생하게 된다. 이러한 문제를 해결하기 위해서, 본 연구에서는 단위 접합시 경계 에러를 고려하여 적합한 접합 위치를 찾 고자 하였다. 여기서 적합한 접합 위치는 스펙트럼의 불연속이 최소화된 접합점을 의미한다. 합성음에 대한 MOS(Mean Opinion Score) 테스트와 스펙트로그램(spectrogram)의 모양을 비교하므로써 제안된 방법의 성능을 평가하였다. 제안된 방법은 두 단계로 이루어져 있다. 첫째, 레퍼런스 패턴(reference pattern)과 두 개의 테스트 패턴(test pattern)을 선택하는 단 계와, 둘째, 앞과 뒤 테스트 패턴 사이의 적합한 접합위치를 찾는 단계이다. 본 연구에서는 패턴 사이의 스펙트로그램 비교를 위해 켑스트럼(cepstrum) 피라미터와 패턴 분류기 (pattern classifier)인 DTW(Dynamic Time Warping) 알고리즘을 사용하였다. 제안된 알고 리즘을 평가한 청취 테스트의 결과에서 제안된 알고리즘을 적용하여 합성된 합성음의 음질 이 자동 분절로 생성된 단위를 그대로 이용한 경우의 음질보다 우수함을 보였다.

  • PDF

희박 어레이 기반의 효율적인 양방향 화소단위 집속 기법의 구현 (Efficient Implementation of Synthetic Aperture Imaging with Virtual Source Element in B-mode Ultrasound System Based on Sparse Array)

  • 김강식;송태경
    • 대한의용생체공학회:의공학회지
    • /
    • 제23권6호
    • /
    • pp.419-430
    • /
    • 2002
  • 본 논문에서는 양방향 화소단위 집속 기법을 희박 어레이 기법을 사용하여 효율적으로 구현하는 방법에 대해 제안한다. 제안한 방법은 각 주사선을 구성할 때 합성에 이용되는 부구경 사이의 간격을 멀리함으로써 적은 수의 부구경으로 큰 크기의 합성구경을 형성하여 시스템의 복잡도를 감소시키면서 초음파 영상의 해상도와 프레임율을 향상시키게 된다. 하지만 이때 합성에 사용되는 부구경 사이의 간격 증가로 인해 그레이팅 로브 값은 상승하게 된다. 이러한 그레이팅 로브는 일반적인 합성구경 기법에서는 제거할 수 있다. 하지만 본 논문에서는 일반적인 합성구경 기법과는 달리 양방향 화소단위 집속 기법에서는 부구경 사이의 간격이 클 경우 발생하는 그레이팅 로브를 제거할 수 없음을 이론적으로 해석하였다. 또한 이러한 그레이팅 로브 값을 송신 집속점을 근거리에 위치시키고 합성에 사용되는 부구경간의 간격을 수신부구경의 크기에 비례하여 적절히 선택함으로써 의료용 초음파 영상에 적합한 -40dB 이하로 억제하는 방법과 조건을 제시하였다. 모의 생체와 실제 인체 실험 결과 제안한 방법을 통해 보다 적은 수의 부구경을 이용하여 더욱 빠른 프레임율의 양방향 화소단위 집속 기법의 구현이 가능함을 확인하였다

포만트합성법을 이용한 한국어 규칙합성시스템의 구현에 관한 연구 (A Study on the Implementation of Korean Synthesis-By-Rule System Using Formant Synthesis Method)

  • 조철우;이태원
    • 한국음향학회지
    • /
    • 제9권6호
    • /
    • pp.38-44
    • /
    • 1990
  • 포만트 합성법을 이용하여 규칙합성시스템을 구현한 일례를 제시한다. 먼저 음소의 입력을 위한 영문 알파벳과 음소의 대응관계를 설정한 뒤 수집된 자연음성으로부터 포만트 합성을 위한 특징 파라미 터를 추출하여 데이터베이스를 작성하다. 그 다음 이러한 데이터베이스를 이용하여 제시된 음소간을 연 결하는 규칙을 제안하고 음소단위의 합성을 행한다. 합성에는 신호처리 프로세서를 사용한 실시간 포만 트 음성합성기를 구현하여 사용하였다. 합성결과 단독음소와 연결음소에 대하여 합성음성을 얻고 이를 평가하였다.

  • PDF

포만트 합성방식에 의한 한국어 문자/음성 변환에 관한 연구 (I) (A Study on the Korean Text-to-Speech Conversion Using the Formant Synthesizer(I))

  • 김민년
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.119-122
    • /
    • 1995
  • 음소단위의 포만트 합성방식을 이용하여 한국어의 규칙합성에 대해 시험하였다. 포만트 합성방식으로는 Klatt가 제안한 직/병렬 합성기를 수정하여 사용하였으며, 운율 정보를 나타내는 피치값의 제어는 Fujisaki 모델을 이용하였다. 합성에 사용되는 각 파라미터들이 합성음의 음질 및 파형에 미치는 영향을 분석할 수 있도록 합성 파라미터와 음성파형 및 스펙트로그램을 화면에 나타내고 마우스를 이용하여 파라미터 값을 사용자가 적절히 변경한 후 합성할 수 있는 포만트 방식의 합성 Tool을 개발하였으며, 이를 이용하여 한국어 문자/음성변환 시스템을 지속적으로 연구하고자 한다.

  • PDF

산림의 지역적 특성을 고려한 시군구 임목축적량 통계 산출 기법 개발 (Estimations of Forest Growing Stocks in Small-area Level Considering Local Forest Characteristics)

  • 김은숙;김철민
    • 한국산림과학회지
    • /
    • 제104권1호
    • /
    • pp.117-126
    • /
    • 2015
  • 시군구 단위 산림통계의 사회적 필요성에도 불구하고 자료의 부족으로 인하여 현실을 반영한 산림통계 산출이 어려운 상황에 있다. 따라서, 시군구 산림 통계 산출을 위하여 해당 시군구의 국가산림자원조사 자료와 주변 지역의 자료를 함께 활용하여 통계량의 오차 수준을 감소시키고 소면적 통계량이 해당 지역 산림의 지역적 특수성을 반영할 수 있는 새로운 소면적 통계산출 방법의 개발이 필요하다. 본 연구에서는 소면적 지역과 특성 구조가 유사하다는 가정을 만족하면서 통계산출을 위한 최소한의 표본점 개수를 확보하기에 적정한 공간 단위에 대한 연구를 수행하였다. 그리고 산림의 지역적 특성을 결정하는 주요 요인인 기후, 토양, 수종 구성 등의 동질성을 기준으로 구획된 확장시군구 기반의 합성추정법, 시 도 단위 자료를 이용하는 기본계획구 합성추정법, 인접 시군구 자료를 이용하는 이웃시군 합성추정법을 비교하고, 이 방법들을 통해 산출된 임목축적 통계의 지역적 특성 설명력과 상위 통계와의 관계에 대한 평가를 수행했다. 그 결과, 확장시군구 합성추정법이 기본계획구 합성추정과 이웃시군 합성추정보다 지역적 특성을 보다 잘 반영하는 통계를 산출하는 것으로 평가되었다. 또한 확장시군구 합성추정법을 통해 산출된 통계량은 시도 단위로 산출된 통계량의 95% 신뢰구간 내에 포함되었으며, 이웃시군 합성추정법에 의해 산출된 결과보다 시도단위 통계량과의 차이가 적게 발생하였다.

수문응답의 지형학적 합성방법에 관한 연구 (A Study on the Geomorphologic Synthesis of Hydrologic Response)

  • 조홍제;이상배
    • 대한토목학회논문집
    • /
    • 제10권1호
    • /
    • pp.99-108
    • /
    • 1990
  • 지형화적 순간단위도 이론을 이용하여 강우-유출 수문곡선을 재현할 수 있는 합성단위도법을 연구하였다. 지형학적 순간단위도는 Gupta등이 제한한 이론을 이용하였고, 응답함수는 2변수 감마분포를 사용하였다. 응답함수의 매개변수결정은 Rosso가 유도한 Horton의 지형법칙에 대한 회귀방정식과 유역지체시간의 저유계수에 대한 상관식을 이용하였다. 유도된 합성단위도의 적용성을 검토하기 위해 한강수계의 평창강과 낙동강수계의 위천유역에 대한 실측치와 비교하였다. 그리고 모멘트법과 불안전 감마함수를 사용한 최소자승법을 이용하여 수문응답의 재현정도를 비교 검토함으로서 본 연구에서 확립된 방법의 적용 타당성을 입증하였다. 분석결과 유도된 합성단위도는 첨두유량, 도달시간 그리고 수분곡선의 실측치에 대한 재현성이 비교적 높았으며, 미계측 유역의 유출해석에 중요한 수단을 제공할 것으로 판단되었다.

  • PDF

음성인식.합성을 위한 한국어 운율단위 음운론의 계산적 연구:음운단위에 따른 경계의 발견 (A Computation Study of Prosodic Structures of Korean for Speech Recognition and Synthesis:Predicting Phonological Boundaries)

  • 이찬도
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.280-287
    • /
    • 1997
  • 성공적인 음성인식·합성 시스템을 구축하기 위해서는 음운론적 지식, 특히 운율 정보의 도입이 매우 중요하다. 본 연구에서는 우선 음성인식·합성을 위한 운율음운 론의 연구동향을 개관하고, 국어의 음운단위와 경계의 설정에 관한 이론적·실험적 고찰을 정리하였으며, 음운단위에 따른 경계의 자동적 발견을 위하여, 데이터를 수집 하고 시스템을 구현하여 실험을 행하였다. 단순회귀 신경망을 이용하여, 2,200여 개 의 문장에 있는 12,000여개의 음운단어를 외부정보의 도움이 전혀 없이 훈련시킨 결 과, 70%정도의 예측률을 보였다. 본 연구에서 사용한 방법을 다른 정보와 결합하여 사용한다면, 음운경계의 발전과 그에 따른 분절화를 정확하게 행할 수 있으리라 기대 된다.

  • PDF

음성합성을 위한 텍스트 음역 시스템과 숫자 음역 모호성 처리 (Text Transliteration System and Number Transliteration Disambiguation for TTS)

  • 박정연;신형진;육대범;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.449-452
    • /
    • 2018
  • TTS(Text-to-Speech)는 문자열을 입력받아 그 문자열을 음성으로 변환하는 음성합성 기술이다. 그러나 실제 입력되는 문장에는 한글뿐만 아니라 영단어 및 숫자 등이 혼합되어 있다. 영단어는 대소문자에 따라 다르게 읽을 수 있으며, 단위로 사용될 때는 약어로 사용되는 것이므로, 알파벳 단위로 읽어서는 안 된다. 숫자 또한 함께 사용되는 단어에 따라 읽는 방식이 달라진다. 본 논문에서는 한글과 숫자 및 단위, 영단어가 혼합된 문장을 분류하고 이를 음역하는 시스템을 구성하며 word vector를 이용한 숫자 및 단위의 모호성 해소방법을 소개한다.

  • PDF

단위벡터를 이용한 한글 인식에 관한 연구 (A study on Korean character recognition using the sun of unit vector)

  • 천수연;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1104-1106
    • /
    • 1987
  • 본 논문은 한글 자모 인식에 관한 새로운 방법을 제시한다. 본 연구는 한글패턴을 독립된 자소의 부분패턴으로 나누어서 특정점들(끝점, 7굴곡점, T굴곡점)을 추출하여 각 굴곡점에서 연결되는 점과의 벡터를 글자의 크기에 관계없도록 하기 위해 크기가 1인 단위벡터를 구한 후 이들의 합성벡터를 생성한다. 생성된 합성벡터들의 수, 벡터들이 지준축과 이루는 각, 그리고 특정점들의 수로부터 한글의 기본 자모를 분류하는 과정을 연구하였다. 입력된 한글패턴은 이미 세선화가 된 자모패턴으로 하였다.

  • PDF

Sequence-to-sequence 기반 한국어 형태소 분석 및 품사 태깅 (Sequence-to-sequence based Morphological Analysis and Part-Of-Speech Tagging for Korean Language with Convolutional Features)

  • 이건일;이의현;이종혁
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.57-62
    • /
    • 2017
  • 기존의 전통적인 한국어 형태소 분석 및 품사 태깅 방법론은 먼저 형태소 후보들을 생성한 뒤 수많은 조합에서 최적의 확률을 가지는 품사 태깅 결과를 구하는 두 단계를 거치며 추가적으로 형태소의 접속 사전, 기분석 사전 및 원형복원 사전 등을 필요로 한다. 본 연구는 기존의 두 단계 방법론에서 벗어나 심층학습 모델의 일종인 sequence-to-sequence 모델을 이용하여 한국어 형태소 분석 및 품사 태깅을 추가 언어자원에 의존하지 않는 end-to-end 방식으로 접근하였다. 또한 형태소 분석 및 품사 태깅 과정은 어순변화가 일어나지 않는 특수한 시퀀스 변환과정이라는 점을 반영하여 음성인식분야에서 주로 사용되는 합성곱 자질을 이용하였다. 세종말뭉치에 대한 실험결과 합성곱 자질을 사용하지 않을 경우 97.15%의 형태소 단위 f1-score, 95.33%의 어절단위 정확도, 60.62%의 문장단위 정확도를 보여주었고, 합성곱 자질을 사용할 경우 96.91%의 형태소 단위 f1-score, 95.40%의 어절단위 정확도, 60.62%의 문장단위 정확도를 보여주었다.