Because a word of Korean digits is a syllable and deeply coarticulatied in connected digits, some recognition models based on demisyllables have been proposed by researchers. However, they could not show an excellent recognition results yet. This paper proposes a recognition model based on extended and context-dependent demisyllables, such as a tri-demisyllable like a tri-phone, for the Korean 4-connected digits recognition. For experiments, we use a toolkit of HTK 3.0 for building this model of continuous HMMs using training Korean connected digits from SiTEC database and for recognizing unknown ones. The results show that the recognition rate is 92% and this model has an ability to improve the recognition performance of Korean connected digits.
This paper Presents a new self-adaptation algorithm based on maximum a posteriori (MAP) eigenvoice for Korean connected digit recognition. The proposed MAP eigenvoice is developed by introducing a probability density model for the eigenvoice coefficients. The Proposed approach provides a unified framework that incorporates the Prior model into the conventional eigenvoice estimation. In self-adaptation system we use only one adaptation utterance that will be recognized, we use MAP eigenvoice that is most robust adaptation. In series of self-adaptation experiments on the Korean connected digit recognition task. we demonstrate that the performance of the proposed approach is better than that of the conventional eigenvoice algorithm for a small amount of adaptation data.
Pervasive Multi-channel audio systems are being realized due to advances in digital technology. This paper proposes an efficient system that serially connects individual speakers with bidirectional digital communication capability by means of SoC design. In particular, each speaker can identify the bit stream assigned to the speaker and convert it into analog audio. Furthermore, the speaker can self-diagnose the speaker functionality by utilizing the designed capability to measure frequencies of various square wave test signals. The proposed system running on 200MHz clock yielded restoration of analog output signal with latency of only $500{\mu}s$ compared to directly driving the speakers in a traditional way.
Geophysical data including chirp (3 7 kHz) subbottom profile and detailed bathymetry were obtained over three seamounts in the Ogasawara Fracture Zone (OFZ) of the western Pacific, as a part of manganese crust survey onboard R/V Onnuri in 2003. The OFZ is a 150-km-wide, 600-km-long rift zone, which separates the East Mariana and Pigafetta Basin. The OFZ is unique in that it includes many seamounts (e.g., Magellan Seamounts andseamounts on the Dutton Ridge). The sub-seafloor acoustic echoes obtained near the OFZ were classified into following types on the basis of their characteristics: types I-1(pelagic sediment with parallel or subparallel reflectors), I-2 (pelagic sediment with no internal reflectors), and III-1 (reef build-up complex) on summit; types II-1 and III-2 (basement outcrop) on flank rift zone and upper slope, respectively; type III-3 (slump) on the lower slope and embayment between the flank rift zones; types II-2 (debrite) on the base of slope and basin floor; and types II-3 (turbidite
or pelagic sediment) and II-4 (turbidite) on the basin floor. The mass-wasting that produced the complex of type II-2 debrite and III-3 slump on the lower slope and basin may have been caused by (1) strong tensional stress in the OFZ which may cause the numerous fissures or basement faults and (2) complex of the faults on the summit and steep upper slope. The variations in the echo type of pelagic sediment in the summit of seamounts may be related with the changes in the depositional and/or erosional environments. Type I-2 pelagic sediment, which is characterized by a thin and intermittent coverage, was probably deposited at a sheltered area when the current was strong, whereas type I-1 pelagic deposit occurred during a stage of progressive sedimentation.
Proceedings of the Acoustical Society of Korea Conference
/
1993.06a
/
pp.195-198
/
1993
해수의 물리적 성질 변화에 의한 수중음속 변화는 수중음파 전파에 커다란 영향을 미친다. 매질변동에 의한 음파 전파경로 변동특성, 즉 음파 도달시간 변동에 의한 매질변위량 추정으로 해양을 탐사하는“해양음향 토모그라피”를 운용하기 위하여 비균질 매질에서의 음파 전파경로 파악이 우선이다. 수심이 일정한 비균질한 매질에서의 음파 전파경로를 파악하기 위해 파동방정식의 해를 Ray theory에 의거 ray path를 구하고 송,수신기 사이를 연결하는 eigenray 정보를 얻었다. 음원의 주파수가 400Hz($\pm$25Hz), pulse length가 20ms인 LFM pulse를 사용하였다. 이 음원을 동해의 최소음속층에서 송,수신하였을 경우 음원에서 150Km 떨어진 수신기에 도달한 신호는 평균음속분포 일 때 보다 약 66ms 정도 빨리 도착한다. 또한 Eigenray 정보에 의거 모의된 수신신호는 토모그라피 운용을 위한 필수 조건인 ray path의 식별, 안정성, 그리고 분해능을 만족한다. 또한 모의 수신신호 음파 도달시간 변동 분석으로 송,수신기 사이의 매질 변동을 파악 할 수 있다.
종래에는 2개의 오디오 채널을 이용한 음향의 재생방법이 널리 퍼져 있었으나 다채널 음향의 재생에 대한 관심이 많아지면서 다중 채널의 오디오를 전송하고 재생하는 방법이 연구되었다. 이 중에서 2개 채널의 전송으로 4개 채널의 출력을 얻을 수 있는 돌비랩(Dolby Laboratories)의 프로로직(Prologic) 오디오가 많은 대중적인 관심을 끌었다. 이 기술은 전송측에서 2 개채널에 해당하는 신호만을 전송하지만 수신측에 있는 디코더에서는 4 개 채널의 데이터를 재생할 수 있는 압축 기법으로서 대중적으로 많은 시장을 가지고 있다. 따라서 Prologic 오디오 기술을 이해하고 이를 제품에 연결하는 방법을 찾는 것은 앞으로 성장하게 될 다중채널 재생 방법에 성공적으로 대처하기 위해서 필요한 일이다. 본 논고에서는 다중 채널 재생 기법의 하나인 Prologic 에 관한 기술과 이와는 별도의 압축기법인 AC-3 와의 비교를 통해서 Prologic 오디오 기술의 특징을 기술하기로 한다. 그리고 프로로직의 구현을 위한 하드웨어적인 관점에서 필요한 로직과 그 로직을 구현하기 위한 칩의 설계에 대해서도 간략히 기술하기로 한다.
Proceedings of the Korean Society for Noise and Vibration Engineering Conference
/
2004.05a
/
pp.63-63
/
2004
기계류는 대개 부정형의 형상을 지니고 있으며, 또 표면이 모두 연결되어 있으므로, 진동하는 물체 표면상에서의 소음원 특성을 세밀히 파악하는 일은 매우 어려운 일이다. 음향 인텐시티나 공간 푸리에 변환을 이용하는 홀로그래피 기법 등의 어레이 마이크에 의한 기법들이 제안되었고 또 활용되고 있으나, 이는 어디까지나 음원에서 가까운 음장을 가상적인 음원면이라 보고 재구성하는 것이어서 실제 음원의 특성을 파악하는데 어려움이 있다. 이러한 문제점을 해결하기 위해 음원표면을 경계요소화 모델링을 하고, 어레이 마이크로 측정될 음장의 지점과 표면간의 관계를 수학적으로 정리한 후, 마이크에서 측정된 신호를 이용해 역으로 경계요소해석 계산을 수행하여 음원 특성을 파악하는 기법이 제안되었다. 본 발표에 있어서는 이와 같은 취지에서 ‘개발된 Inverse BEM을 이용한 NAH 기법’에 관한 개괄적인 내용을 설명하고, 그 적용 가능성 및 이 기법의 미래에 대해 설명하며, 다음과 같은 내용의 순서대로 설명된다: $\textbullet$ 각종 음원 파악 기법들의 특성과 이 방법이 필요한 이유 $\textbullet$일반 음향 holography 기법 (STSF)과의 차이점 $\textbullet$ 이론적 배경 개괄 $\textbullet$ 실제 적용 순서에 따른 방법의 설명 $\textbullet$ 후처리 결과물 $\textbullet$ 본 기법의 향후 과제 및 적용 방법의 개선
The question how man can perceive the direction of a sound is one of the traditional psychoacoustical problems. Rayleigh already began to investigate this subject in 1870s and kept on interesting himself intermittently throughout his research career. Rayleigh was only concerned with this subject among those of perception of sound and focused more interest on it than any other acoustical problems. At first he insisted on the perception of the direction of a sound by the difference of intensity of a sound in two ears. but was phased in accepting that by the difference of phase of a sound there. Thus he arrived at the modern view that the perception of the sound direction is caused by the difference of intensity in high frequencies and the difference of phase in low frequencies. Rayleigh presented his ability as an excellent experimenter by employing very cautious and ingenious experimental settings and acquired persuasive results by linking the consequences of his mathematical theorization with his experiments.
Proceedings of the Acoustical Society of Korea Conference
/
1998.06c
/
pp.43-46
/
1998
본 논문은 컴퓨터 사용에 미숙한 초보자나 키보드나 마우스를 사용할 수 없는 신체적인 조건을 가진 장애인 또는 PC사용에 미숙한 사용자들을 위해 기존의 인터페이스에 추가적으로 음성을 사용하여 더 효율적인 작업 환경을 만들기 위한 음성을 이용한 Window95 환경에서의 음성 인식 시스템 구현에 관한 것이다. 인터페이스 구현을 위해 사용되는 인식 알고리즘으로는 연결어 인식에 사용되는 OSDP[1] 알고리즘을 단독어 인식에 적용하여 사용하였다. 특징 벡터는 화자 독립적인 특성을 지닌 Perceptual Linear Predictive(PLP)[2] 13차 계수를 사용하였다. 인식 대상 어휘는 윈도우 사용자에게 자주 사용되는 60개의 명령어로 설정하였다. 인식된 후 그 결과는 구현된 시스템의 명령 실행 모듈로 전달되어 윈도우 상에서 실제 수행된다. 구현된 시스템에서는 노트북 내장 마이크를 사용하여 음성을 검출하였고 이를 위한 음성 구간 검출 알고리즘을 사용하였다. 기준 패턴은 20대 남성화자 9인이 2회 발성한 데이터를 이용하였고, 화자 독립으로 온라인 인식률은 91.71%이고, 오프라인 인식률은 96.4%의 인식률을 얻었다.
Proceedings of the Acoustical Society of Korea Conference
/
1998.06c
/
pp.387-389
/
1998
사람의 음성을 들으면, 사람은 물론이지만 처음 듣는 목소리에 대해서도 그 목소리의 주인공에 대한 막연한 이상이 그려지게 된다. 본 논문은 이러한 현상이 얼마나 신빙성이 있는지, 즉, 음성만을 듣고 짐작한 그 음성의 주인공의 모습과 실제의 모습이 과연 얼마나 관계가 있는지를 알아보고자 하는 연구의 초기 단계에 대한 보고이다. 본 연구에서는 이처럼 음성이 전달하는 시각적 정보의 신빙성을 확인하기 위하여 남녀 각 8명의 사진을 찍고, 같은 내용의 짧은 문장을 녹취한 후, 100명 이상의 피실험자들에게 개별적으로 녹음을 듣고 가장 잘 어울릴 듯한 사진을 고르도록 할 것이다. 우선적으로 여성 8명의 녹음을 약간명(48명)의 피실험자에게 들려주어 실험한 결과, 목소리의 주인공을 바로 찾는 경우는 드물었지만, 흥미로운 것은 비록 틀린 경우라도 어떤 특정한 목소리는 어느 특정한 사진과 집중적으로 연결되었다는 것이다. 이 결과를 source-filter theory와 연관시켜 생각해보고, 이를 바탕으로 좀 더 구체적인 앞으로의 연구방향을 제시한다.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.