• Title/Summary/Keyword: 음향적 연결

Search Result 130, Processing Time 0.019 seconds

A Study on Korean 4-connected Digit Recognition Using Demi-syllable Context-dependent Models (반음절 문맥종속 모델을 이용한 한국어 4 연숫자음 인식에 관한 연구)

  • 이기영;최성호;이호영;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.3
    • /
    • pp.175-181
    • /
    • 2003
  • Because a word of Korean digits is a syllable and deeply coarticulatied in connected digits, some recognition models based on demisyllables have been proposed by researchers. However, they could not show an excellent recognition results yet. This paper proposes a recognition model based on extended and context-dependent demisyllables, such as a tri-demisyllable like a tri-phone, for the Korean 4-connected digits recognition. For experiments, we use a toolkit of HTK 3.0 for building this model of continuous HMMs using training Korean connected digits from SiTEC database and for recognizing unknown ones. The results show that the recognition rate is 92% and this model has an ability to improve the recognition performance of Korean connected digits.

Self-Adaptation Algorithm Based on Maximum A Posteriori Eigenvoice for Korean Connected Digit Recognition (한국어 연결 숫자음 인식을 일한 최대 사후 Eigenvoice에 근거한 자기적응 기법)

  • Kim Dong Kook;Jeon Hyung Bae
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.8
    • /
    • pp.590-596
    • /
    • 2004
  • This paper Presents a new self-adaptation algorithm based on maximum a posteriori (MAP) eigenvoice for Korean connected digit recognition. The proposed MAP eigenvoice is developed by introducing a probability density model for the eigenvoice coefficients. The Proposed approach provides a unified framework that incorporates the Prior model into the conventional eigenvoice estimation. In self-adaptation system we use only one adaptation utterance that will be recognized, we use MAP eigenvoice that is most robust adaptation. In series of self-adaptation experiments on the Korean connected digit recognition task. we demonstrate that the performance of the proposed approach is better than that of the conventional eigenvoice algorithm for a small amount of adaptation data.

SoC Design of Self-Diagnosing Speaker Connection System (자동 고장진단이 가능한 스피커 연결 시스템의 SoC 설계)

  • Song, Moon-Vin;Kwon, Oh-Kyun;Song, The-Hoon;Chung, Yun-Mo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.26 no.6
    • /
    • pp.269-275
    • /
    • 2007
  • Pervasive Multi-channel audio systems are being realized due to advances in digital technology. This paper proposes an efficient system that serially connects individual speakers with bidirectional digital communication capability by means of SoC design. In particular, each speaker can identify the bit stream assigned to the speaker and convert it into analog audio. Furthermore, the speaker can self-diagnose the speaker functionality by utilizing the designed capability to measure frequencies of various square wave test signals. The proposed system running on 200MHz clock yielded restoration of analog output signal with latency of only $500{\mu}s$ compared to directly driving the speakers in a traditional way.

Acoustic Characterization of Three Seamounts Located in the Northwest of Marshall Islands, Western Pacific (서태평양 마샬제도 북서쪽에 위치한 세 해저산에 대한 음향상 연구)

  • Lee, Tae-Gook;Lee, Kie-Hwa;Moon, Jai-Woon;Jung, Mee-Sook;Kim, Hyun-Sub;Lee, Sang-Mook
    • Journal of the Korean Geophysical Society
    • /
    • v.7 no.3
    • /
    • pp.193-206
    • /
    • 2004
  • Geophysical data including chirp (3 7 kHz) subbottom profile and detailed bathymetry were obtained over three seamounts in the Ogasawara Fracture Zone (OFZ) of the western Pacific, as a part of manganese crust survey onboard R/V Onnuri in 2003. The OFZ is a 150-km-wide, 600-km-long rift zone, which separates the East Mariana and Pigafetta Basin. The OFZ is unique in that it includes many seamounts (e.g., Magellan Seamounts andseamounts on the Dutton Ridge). The sub-seafloor acoustic echoes obtained near the OFZ were classified into following types on the basis of their characteristics: types I-1(pelagic sediment with parallel or subparallel reflectors), I-2 (pelagic sediment with no internal reflectors), and III-1 (reef build-up complex) on summit; types II-1 and III-2 (basement outcrop) on flank rift zone and upper slope, respectively; type III-3 (slump) on the lower slope and embayment between the flank rift zones; types II-2 (debrite) on the base of slope and basin floor; and types II-3 (turbidite or pelagic sediment) and II-4 (turbidite) on the basin floor. The mass-wasting that produced the complex of type II-2 debrite and III-3 slump on the lower slope and basin may have been caused by (1) strong tensional stress in the OFZ which may cause the numerous fissures or basement faults and (2) complex of the faults on the summit and steep upper slope. The variations in the echo type of pelagic sediment in the summit of seamounts may be related with the changes in the depositional and/or erosional environments. Type I-2 pelagic sediment, which is characterized by a thin and intermittent coverage, was probably deposited at a sheltered area when the current was strong, whereas type I-1 pelagic deposit occurred during a stage of progressive sedimentation.

  • PDF

UNDERWATER SIGNAL SIMULATION DUE TO WARM EDDY IN THE EAST SEA OF KOREA (동해에서 EDDY에 의한 수중신호 변형 모의)

  • 나정열
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1993.06a
    • /
    • pp.195-198
    • /
    • 1993
  • 해수의 물리적 성질 변화에 의한 수중음속 변화는 수중음파 전파에 커다란 영향을 미친다. 매질변동에 의한 음파 전파경로 변동특성, 즉 음파 도달시간 변동에 의한 매질변위량 추정으로 해양을 탐사하는“해양음향 토모그라피”를 운용하기 위하여 비균질 매질에서의 음파 전파경로 파악이 우선이다. 수심이 일정한 비균질한 매질에서의 음파 전파경로를 파악하기 위해 파동방정식의 해를 Ray theory에 의거 ray path를 구하고 송,수신기 사이를 연결하는 eigenray 정보를 얻었다. 음원의 주파수가 400Hz($\pm$25Hz), pulse length가 20ms인 LFM pulse를 사용하였다. 이 음원을 동해의 최소음속층에서 송,수신하였을 경우 음원에서 150Km 떨어진 수신기에 도달한 신호는 평균음속분포 일 때 보다 약 66ms 정도 빨리 도착한다. 또한 Eigenray 정보에 의거 모의된 수신신호는 토모그라피 운용을 위한 필수 조건인 ray path의 식별, 안정성, 그리고 분해능을 만족한다. 또한 모의 수신신호 음파 도달시간 변동 분석으로 송,수신기 사이의 매질 변동을 파악 할 수 있다.

  • PDF

Pro-Logic Audio의 소개

  • 이상근;조재문
    • Broadcasting and Media Magazine
    • /
    • v.3 no.1
    • /
    • pp.20-27
    • /
    • 1998
  • 종래에는 2개의 오디오 채널을 이용한 음향의 재생방법이 널리 퍼져 있었으나 다채널 음향의 재생에 대한 관심이 많아지면서 다중 채널의 오디오를 전송하고 재생하는 방법이 연구되었다. 이 중에서 2개 채널의 전송으로 4개 채널의 출력을 얻을 수 있는 돌비랩(Dolby Laboratories)의 프로로직(Prologic) 오디오가 많은 대중적인 관심을 끌었다. 이 기술은 전송측에서 2 개채널에 해당하는 신호만을 전송하지만 수신측에 있는 디코더에서는 4 개 채널의 데이터를 재생할 수 있는 압축 기법으로서 대중적으로 많은 시장을 가지고 있다. 따라서 Prologic 오디오 기술을 이해하고 이를 제품에 연결하는 방법을 찾는 것은 앞으로 성장하게 될 다중채널 재생 방법에 성공적으로 대처하기 위해서 필요한 일이다. 본 논고에서는 다중 채널 재생 기법의 하나인 Prologic 에 관한 기술과 이와는 별도의 압축기법인 AC-3 와의 비교를 통해서 Prologic 오디오 기술의 특징을 기술하기로 한다. 그리고 프로로직의 구현을 위한 하드웨어적인 관점에서 필요한 로직과 그 로직을 구현하기 위한 칩의 설계에 대해서도 간략히 기술하기로 한다.

  • PDF

Identification and Visualization of Sound Sources with Non-regular Shapes (불규칙한 형상을 가진 소음원의 파악 및 가시화)

  • 이정권
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 2004.05a
    • /
    • pp.63-63
    • /
    • 2004
  • 기계류는 대개 부정형의 형상을 지니고 있으며, 또 표면이 모두 연결되어 있으므로, 진동하는 물체 표면상에서의 소음원 특성을 세밀히 파악하는 일은 매우 어려운 일이다. 음향 인텐시티나 공간 푸리에 변환을 이용하는 홀로그래피 기법 등의 어레이 마이크에 의한 기법들이 제안되었고 또 활용되고 있으나, 이는 어디까지나 음원에서 가까운 음장을 가상적인 음원면이라 보고 재구성하는 것이어서 실제 음원의 특성을 파악하는데 어려움이 있다. 이러한 문제점을 해결하기 위해 음원표면을 경계요소화 모델링을 하고, 어레이 마이크로 측정될 음장의 지점과 표면간의 관계를 수학적으로 정리한 후, 마이크에서 측정된 신호를 이용해 역으로 경계요소해석 계산을 수행하여 음원 특성을 파악하는 기법이 제안되었다. 본 발표에 있어서는 이와 같은 취지에서 ‘개발된 Inverse BEM을 이용한 NAH 기법’에 관한 개괄적인 내용을 설명하고, 그 적용 가능성 및 이 기법의 미래에 대해 설명하며, 다음과 같은 내용의 순서대로 설명된다: $\textbullet$ 각종 음원 파악 기법들의 특성과 이 방법이 필요한 이유 $\textbullet$일반 음향 holography 기법 (STSF)과의 차이점 $\textbullet$ 이론적 배경 개괄 $\textbullet$ 실제 적용 순서에 따른 방법의 설명 $\textbullet$ 후처리 결과물 $\textbullet$ 본 기법의 향후 과제 및 적용 방법의 개선

  • PDF

A Historical Inquiry about Rayleigh's Research on the Perception of the Direction of Sound (Rayleigh의 소리의 방향 지각 연구에 대한 과학사적 고찰)

  • 구자현
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.8
    • /
    • pp.695-702
    • /
    • 2002
  • The question how man can perceive the direction of a sound is one of the traditional psychoacoustical problems. Rayleigh already began to investigate this subject in 1870s and kept on interesting himself intermittently throughout his research career. Rayleigh was only concerned with this subject among those of perception of sound and focused more interest on it than any other acoustical problems. At first he insisted on the perception of the direction of a sound by the difference of intensity of a sound in two ears. but was phased in accepting that by the difference of phase of a sound there. Thus he arrived at the modern view that the perception of the sound direction is caused by the difference of intensity in high frequencies and the difference of phase in low frequencies. Rayleigh presented his ability as an excellent experimenter by employing very cautious and ingenious experimental settings and acquired persuasive results by linking the consequences of his mathematical theorization with his experiments.

The Implementation of Windows 95 Control System with Speech Recognition (음성인식을 이용한 Windows 95 제어 시스템의 구현)

  • 남동선
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.43-46
    • /
    • 1998
  • 본 논문은 컴퓨터 사용에 미숙한 초보자나 키보드나 마우스를 사용할 수 없는 신체적인 조건을 가진 장애인 또는 PC사용에 미숙한 사용자들을 위해 기존의 인터페이스에 추가적으로 음성을 사용하여 더 효율적인 작업 환경을 만들기 위한 음성을 이용한 Window95 환경에서의 음성 인식 시스템 구현에 관한 것이다. 인터페이스 구현을 위해 사용되는 인식 알고리즘으로는 연결어 인식에 사용되는 OSDP[1] 알고리즘을 단독어 인식에 적용하여 사용하였다. 특징 벡터는 화자 독립적인 특성을 지닌 Perceptual Linear Predictive(PLP)[2] 13차 계수를 사용하였다. 인식 대상 어휘는 윈도우 사용자에게 자주 사용되는 60개의 명령어로 설정하였다. 인식된 후 그 결과는 구현된 시스템의 명령 실행 모듈로 전달되어 윈도우 상에서 실제 수행된다. 구현된 시스템에서는 노트북 내장 마이크를 사용하여 음성을 검출하였고 이를 위한 음성 구간 검출 알고리즘을 사용하였다. 기준 패턴은 20대 남성화자 9인이 2회 발성한 데이터를 이용하였고, 화자 독립으로 온라인 인식률은 91.71%이고, 오프라인 인식률은 96.4%의 인식률을 얻었다.

  • PDF

음성과 인상의 관계: 예비 연구

  • 문승재
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.387-389
    • /
    • 1998
  • 사람의 음성을 들으면, 사람은 물론이지만 처음 듣는 목소리에 대해서도 그 목소리의 주인공에 대한 막연한 이상이 그려지게 된다. 본 논문은 이러한 현상이 얼마나 신빙성이 있는지, 즉, 음성만을 듣고 짐작한 그 음성의 주인공의 모습과 실제의 모습이 과연 얼마나 관계가 있는지를 알아보고자 하는 연구의 초기 단계에 대한 보고이다. 본 연구에서는 이처럼 음성이 전달하는 시각적 정보의 신빙성을 확인하기 위하여 남녀 각 8명의 사진을 찍고, 같은 내용의 짧은 문장을 녹취한 후, 100명 이상의 피실험자들에게 개별적으로 녹음을 듣고 가장 잘 어울릴 듯한 사진을 고르도록 할 것이다. 우선적으로 여성 8명의 녹음을 약간명(48명)의 피실험자에게 들려주어 실험한 결과, 목소리의 주인공을 바로 찾는 경우는 드물었지만, 흥미로운 것은 비록 틀린 경우라도 어떤 특정한 목소리는 어느 특정한 사진과 집중적으로 연결되었다는 것이다. 이 결과를 source-filter theory와 연관시켜 생각해보고, 이를 바탕으로 좀 더 구체적인 앞으로의 연구방향을 제시한다.

  • PDF