• 제목/요약/키워드: pitch contour

검색결과 68건 처리시간 0.023초

인공 신경망의 한국어 운율 발생에 관한 연구 (The Study on Korean Prosody Generation using Artificial Neural Networks)

  • 민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.337-340
    • /
    • 2004
  • 한국어 문-음성 합성 시스템(TTS: Text-To-Speech)은 합성음의 자연스러움을 증가시키기 위해 운율 발생 알고리듬을 만들어 시스템에 적용하고 있다. 운율 법칙은 각국의 언어에 대한 언어학적 정보나 자연음에서 구한 운율에 대한 지식을 기반으로 음성 합성 시스템에 적용하고 있다. 그러나 이렇게 구한 운율 법칙이 자연음에 존재하는 모든 운율 법칙을 포함할 수도 없고, 또 추출한 운율 법칙이 틀린 법칙이라면, 합성음의 자연감이나 이해도는 떨어질 것이므로, TTS의 실용화에 장애가 될 수 있다. 이러한 점을 감안하여 본 논문에서는 자연음에 내재하는 운율을 학습할 수 있는 인공 신경망을 이용한 운율발생 신경망을 제안하였다. 훈련단계에서 인공 신경망의 입력 단에 한국어 문장의 음소 열을 차례로 이동시켜 인가하면 입력 단의 중앙에 해당하는 음소의 운율 정보가 출력되도록 훈련시킬 때, 목표 패턴을 이용한 감독학습을 통해, 자연음에 내재하는 운율을 학습하도록 하였다. 평가 단계에서 문장의 음소 열을 입력하고, 추정율을 측정하여 인공 신경망이 한국어 문장에 내재하는 운율을 학습하여 발생시킬 수 있음을 살펴보았다.

  • PDF

내용기반 음악검색 시스템의 비교 분석 (A Comparative Analysis of Content-based Music Retrieval Systems)

  • 노정순
    • 정보관리학회지
    • /
    • 제30권3호
    • /
    • pp.23-48
    • /
    • 2013
  • 본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

이중 전송률(2.4/4.0 kbps)을 갖는 개선된 하모닉-CELP 음성부호화기 (Improved Harmonic-CELP Speech Coder with Dual Bit-Rates(2.4/4.0 kbps))

  • 김경민;윤성완;최용수;박영철;윤대희;강태익
    • 한국통신학회논문지
    • /
    • 제28권3C호
    • /
    • pp.239-247
    • /
    • 2003
  • 본 논문에서는 기존에 제안한 바 있는 EHC(Efficient Harmonic-CELP) 부호화기에 기반한 이중 전송률(2.4/4.0 kbps)의 개선된 하모닉-CELP(Improved Harmonic-CELP: IHC) 음성 부호화기를 제안한다. 제안된 IHC는 유/무성음 판별에 따라 유성음에서는 하모닉 추정, 하모닉 양자화, 하모닉 합성 및 잡음 혼합을 통한 자연성 제어 등의 과정을 통해, 무성음에서는 고속 CELP 방식을 통해 음성신호를 부호화/복호화한다. 또한 제안된 IHC는 EHC의 유/무성음 판별과 하모닉 추정 성능을 개선한다. 피치 이득과 에너지 등을 이용한 유/무성음 판별은 프레임 내의 에너지 변화 등에 의해 재판별된다. 하모닉 부호화에서는 첨점 추출과 델타 조정 방법을 이용하여 정확한 하모닉 추정을 하고, 혼합하는 잡음의 대역과 양을 적절하게 조절하여 자연성을 제어한다. 제안된 IHC 부호화기에 성능평가 결과, 비교 부호화기인 HVXC 연산량의 약 40%이내의 연산량으로 우수한 음질을 보임을 확인하였다.

수중 선박엔진 음향 변환을 위한 향상된 CycleGAN 알고리즘 (Improved CycleGAN for underwater ship engine audio translation)

  • 아쉬라프 히나;정윤상;이종현
    • 한국음향학회지
    • /
    • 제39권4호
    • /
    • pp.292-302
    • /
    • 2020
  • 기계학습 알고리즘은 소나 및 레이더를 포함한 다양한 분야에서 사용되고 있다. 최근 개발된 GAN(Generative Adversarial Networks)의 변형인 Cycle-Consistency Generative Adversarial Network(CycleGAN)은 쌍을 이루지 않은 이미지-이미지 변환에 대해 검증된 네트워크이다. 본 논문에서는 높은 품질로 수중 선박 엔진음을 변환시킬 수 있는 변형된 CycleGAN을 제안한다. 제안된 네트워크는 수중 음향을 기존영역에서 목표영역으로 변환시키는 생성자 모델과 데이터를 참과 거짓으로 구분하는 개선된 식별자 그리고 변환된 수환 일관성(Cycle Consistency) 손실함수로 구성된다. 제안된 CycleGAN의 정량 및 정성분석은 공개적으로 사용 가능한 수중 데이터 ShipsEar을 사용하여 기존 알고리즘들과 Mel-cepstral분포, 구조적 유사 지수, 최소 거리 비교, 평균 의견 점수를 평가 및 비교함으로써 수행되었고, 분석결과는 제안된 네트워크의 유효성을 입증하였다.

플래퍼론이 전개된 플라잉윙 형상의 공력 특성에 대한 전산유동해석 (Computational Fluid Dynamics of the aerodynamic characteristics for Flying Wing configuration with Flaperon)

  • 고아림;장경식;박창환;신동진
    • 항공우주시스템공학회지
    • /
    • 제13권5호
    • /
    • pp.32-38
    • /
    • 2019
  • 높은 후퇴각을 갖는 둥근 앞전 날개 형상은 앞전 와류에 의해 복잡한 유동 현상이 나타난다. 불안정한 방향 안정성을 갖는 무미익 플라잉윙의 제어를 위해서 플래퍼론이 사용된다. 본 연구에서는 플래퍼론이 전개된 비세장형, 둥근 앞전의 플라잉윙 형상의 전산해석을 수행하였으며 옆미끄럼각 및 플래퍼론에 대한 영향을 분석하였다. 공력계수 분석을 통해 양력과 항력계수에 대한 옆미끄럼각의 영향은 적으며 측력 및 모멘트 계수는 옆미끄럼각의 영향을 크게 받음을 알 수 있었다. 정적 안정성 분석을 통해 플래퍼론이 전개된 플라잉윙의 가로안정성과 방향안정성이 좋아졌음을 확인하였다. 또한 압력계수분포, 표면 마찰선의 관찰을 통해 앞전 와류 구조 및 거동을 분석하였다.

나사 가공 관리를 위한 스마트팩토리 시스템 설계에 관한 연구 (A Study on Smart Factory System Design for Screw Machining Management)

  • 이은규;김동완;이상완;김재중
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.329-331
    • /
    • 2018
  • 본 논문은 나사 가공을 위한 원재료 공급부터 시작해서 선반 머신으로 가공되어 제품의 불량 여부에 대한 검수를 스마트팩토리 기술이 도입된 로봇이 자동으로 조립 및 분해 작업을 통해 검수를 해주는 모니터링 시스템에 대해 제안하였다. 생산 지시 수량과 생산 지시에 따른 완료 체크는 변위센서로 원재료 입고 여부에 따른 생산 현황을 체크하였고 가공된 Female, male 의 피치, 외형 검사를 진행하여 OK, NG 판별을 한다. 로봇시스템에서는 원자재 적재, 반출, 파레트 이송 및 전반적인 공정에 개입하며, 유기적으로 구동될 수 있도록 중계역할을 하였고 나사 가공품에 대한 위치 정보는 비접촉 무선 태그를 활용하여 위치 정보를 수집하였고 Energy Saving System으로 장비 생산 효율성 및 가동율에 대해 체크하였다. 환경센서는 공조환경 데이터(온도, 습도)를 수집하여 정확한 온도 및 습도 측정 하여, 제품 가공 품질 영향 체크 제품의 구동 위험 수준 환경(과열, 다습)에 대해 관리 감시하였고 CNC 및 로봇모듈에 대한 제어는 PLC로 하여 이기종 시스템 통합 운영하였다.

  • PDF

Prosodic Phrasing and Focus in Korea

  • Baek, Judy Yoo-Kyung
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.246-246
    • /
    • 1996
  • Purpose: Some of the properties of the prosodic phrasing and some acoustic and phonological effects of contrastive focus on the tonal pattern of Seoul Korean is explored based on a brief experiment of analyzing the fundamental frequency(=FO) contour of the speech of the author. Data Base and Analysis Procedures: The examples were chosen to contain mostly nasal and liquid consonants, since it is difficult to track down the formants in stops and fricatives during their corresponding consonantal intervals and stops may yield an effect of unwanted increase in the FO value due to their burst into the following vowel. All examples were recorded three times and the spectrum of the most stable repetition was generated, from which the FO contour of each sentence was obtained, the peaks with a value higher than 250Hz being interpreted as a high tone (=H). The result is then discussed within the prosodic hierarchy framework of Selkirk (1986) and compared with the tonal pattern of the Northern Kyungsang dialect of Korean reported in Kenstowicz & Sohn (1996). Prosodic Phrasing: In N.K. Korean, H never appears both on the object and on the verb in a neutral sentence, which indicates the object and the verb form a single Phonological Phrase ($={\phi}$), given that there is only one pitch peak for each $={\phi}$. However, Seoul Korean shows that both the object and the verb have H of their own, indicating that they are not contained in one $={\phi}$. This violates the Optimality constraint of Wrap-XP (=Enclose a lexical head and its arguments in one $={\phi}$), while N.K. Korean obeys the constraint by grouping a VP in a single $={\phi}$. This asymmetry can be resolved through a constraint that favors the separate grouping of each lexical category and is ranked higher than Wrap-XP in Seoul Korean but vice versa in N.K. Korean; $Align-x^{lex}$ (=Align the left edge of a lexical category with that of a $={\phi}$). (1) nuna-ka manll-ll mEk-nIn-ta ('sister-NOM garlic-ACC eat-PRES-DECL') a. (LLH) (LLH) (HLL) ----Seoul Korean b. (LLH) (LLL LHL) ----N.K. Korean Focus and Phrasing: Two major effects of contrastive focus on phonological phrasing are found in Seoul Korean: (a) the peak of an Intonatioanl Phrase (=IP) falls on the focused element; and (b) focus has the effect of deleting all the following prosodic structures. A focused element always attracts the peak of IP, showing an increase of approximately 30Hz compared with the peak of a non-focused IP. When a subject is focused, no H appears either on the object or on the verb and a focused object is never followed by a verb with H. The post-focus deletion of prosodic boundaries is forced through the interaction of StressFocus (=If F is a focus and DF is its semantic domain, the highest prominence in DF will be within F) and Rightmost-IP (=The peak of an IP projects from the rightmost $={\phi}$). First Stress-F requires the peak of IP to fall on the focused element. Then to avoid violating Rightmost-IP, all the boundaries after the focused element should delete, minimizing the number of $={\phi}$'s intervening from the right edge of IP. (2) (omitted) Conclusion: In general, there seems to be no direct alignment constraints between the syntactically focused element and the edge of $={\phi}$ determined in phonology; all the alignment effects come from a single requirement that the peak of IP projects from the rightmost $={\phi}$ as proposed in Truckenbrodt (1995).

  • PDF

토모 테라피 치료 시 선량 체적 히스토그램 표지자를 이용한 치료계획 비교에 관한 연구 (A Study on Prospective Plan Comparison using DVH-index in Tomotherapy Planning)

  • 김주호;조정희;이상규;전병철;윤종원;김동욱
    • 대한방사선치료학회지
    • /
    • 제19권2호
    • /
    • pp.113-122
    • /
    • 2007
  • 목 적: 토모테라피 치료 계획 시 여러 가지 다양한 빔 조절 인자들의 수정으로 얻어진 각각의 치료 계획 결과를 특정한 선량체적 히스토그램 표지자(DVH-Index)를 이용하여 치료 전에 비교 함으로써 최적의 치료 계획을 효율적으로 도출할 수 있는 방안을 제시하고자 하는데 목적이 있다. 대상 및 방법: 토모테라피 적응증례를 가진 3명의 환자(두경부, 복부, 골반부)를 대상으로 치료 전 PQ 5000 (CT simulator, Philips)을 이용하여 전산화 단층 촬영영상을 얻었고, pinnacle ver 7.6c (3D RTP, ADAC)에서 종양 조직과 정상조직의 윤곽선을 묘사하여 토모 치료계획 장비(hi-art system ver 2.0)로 전송한 후 빔 조사야, 피치 혹은 중요도를 각기 다르게 설정하고 치료 계획을 실시하였다. 각각의 치료 계획은 종양 부위와 정상 부위의 선량 통계량(최대선량, 최소선량, 평균선량, 선량체적)을 구하여 치료 적절성을 비교하였고 또한 선량 체적 히스토그램을 이용하여 종양 표적 내의 균일성 지수(homogeneity index, HI), 종양 표적에 대한 선량 조형 지수(conformity index, CI), 정상 조직에서의 선량 감소 지수(dose gradient index, DGI)를 이용하여 치료 계획을 비교한 후 두 가지 비교 결과의 유사성을 확인 하였다. 결 과: 3명의 환자를 대상으로 각각 시행한 3가지 치료 계획을 등 선량 분포와 선량 통계량을 통해 비교한 결과와 선량 체적 히스토그램 표지자를 이용한 치료 계획의 비교 결과 두부, 복부와 골반부에 치료 부위를 가진 환자에 있어서 모두 동일한 치료계획을 우월하게 판정하였다. 결 론: 토모테라피의 치료 계획 비교 시 선량 체적 히스토그램의 표지자를 이용한 방법은 특정한 치료 목표에 따라 다소간의 차이를 나타낼 순 있으나 종양 조직에 대한 선량분포의 적절성과 전체적인 정상조직의 고 선량 위험도를 반영함으로써 다수의 치료계획을 단시간에 상호 비교 검증 할 수 있는 적절한 방법으로 사료 된다.

  • PDF