Search | Korea Science

Performance Evaluation of Speech Coder for Digital Mobile Communication System in Radio Channel Environment (무선 채널 환경에서 디지털 이동통신용 음성 부호화기의 성능 평가)

김형중;윤병식;최송인
- Journal of the Korea Institute of Information and Communication Engineering
- /
- v.1 no.1
- /
- pp.77-83
- /
- 1997
In this paper, we present a comparison between QCELP(Qualcomm Code Excited Linear Predictor) speech coder that is operating in digital mobile communication system and CS-ACELP(Conjugate Structure Algebraic Code Excited Linear Prediction) speech coder that is scheduled to use for IMT-2000 (International Mobile Telecommunications 2000) system. The performance comparison might give help to design of the speech coding algorithms so that the robustness of the algorithms to channel errors engaged by mobile communication system be optimized.
PDF

Implementation of a Secure and Flexible Peer-to-Peer VoIP Service (보안성과 유연성을 갖는 피어-투-피어 인터넷 음성 통신 서비스의 구현)

Lee, Ju-Ho;Jeong, Choong-Kyo
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.10d
- /
- pp.466-471
- /
- 2006
중앙 집중형 음성 통신 시스템이 확장성, 신뢰성, 그리고 초기 비용의 문제를 가짐에 따라, 분산 아키텍쳐 기반의 피어 투 피어 음성 통신 서비스를 실현하기 위한 연구가 최근 활발히 이루어지고 있다. 그러나 대부분의 연구들은 완전 분산 시스템을 구현하지 못하고 사용자의 인증 및 보안 기능을 위해 중앙의 서버에 일부 의존하는 형태를 취하고 있다. 이러한 형태로 구현된 서비스는 완화되기는 했지만 확장성, 신뢰성, 초기 비용 등의 문제를 그대로 가지고 있으며 또 다양한 서비스로 유연하게 확장하기가 쉽지 않다. 이 연구에서는 사용자 인증 및 보안 기능까지도 완전한 분산 형태로 구현할 수 있는 피어 투 피어 음성 통신 서비스의 구조를 제안하고 구현 사례를 보였다. 또 제안된 서비스 구조가 유연한 확장성과 발전성을 갖는다는 것을 보이기 위해 웹 서비스와의 연동을 통한 확장된 서비스 사례를 보였다. 추가적으로 우리의 제안 구조가 기존의 중앙 집중형 음성 통신 시스템과 호환성을 갖출 수 있도록 하는 방안도 제시한다.
PDF

The Design and Implementation of Personal Audio Recorder Service (개인 오디오 레코더 서비스 설계 및 구현)

Kim, Do-Hyung;Yun, Min-Hong;Kim, Sun-ja;Lee, Kyung-Hee
- Proceedings of the Korea Information Processing Society Conference
- /
- 2007.11a
- /
- pp.727-728
- /
- 2007
본 논문에서는 음성통화를 위해 CDMA 네트워크와 데이터 통신을 위해 와이브로 네트워크를 동시에 사용하는 임베디드 리눅스 기반 듀얼모드 응용 서비스인 개인 오디오 레코더의 구현에 대해서 기술한다. 개인 오디오 레코더는 듀얼모드 지원 단말에 탑재된 클라이언트에서 음성 녹음을 시작하면, 송신자와 수신자의 CDMA 음성 데이터가 와이브로 네트워크를 통해 인터넷 상의 개인 오디오 레코더 서버로 전달된다. 개인 오디오 레코더 서버는 통화 번호 및 통화 시간에 따라 음성 데이터를 저장하게 된다. 구현된 개인 오디오 레코더는 단말의 저장공간이 부족한 환경에서도 음성통화 내용을 저장할 수 있도록 한다.
https://doi.org/10.3745/PKIPS.y2007m11a.727 인용 PDF

신경망을 이용한 음성인식 시스템

석용호;김기철;한일송;이황수
- Information and Communications Magazine
- /
- v.11 no.9
- /
- pp.93-107
- /
- 1994
본 글에서는 음성인식에 적용된 신경망 구조를 알아본다. 또한 신경망 VLSI와 국내에서 개발된 신경망 VLSI인 URAN에 대해서 살펴보고 URAN을 이용한 음성인식 시스템의 설계에 관해 기술한다. 시뮬레이션을 통해 낮은 정밀도의 입출력 및 연결강도, 선형 출력함수를 가지는 뉴런을 사용하는 신경망 음성인식 시스템의 성능을 분석하고 잡음 환경에서 낮은 정밀도를 사용한 신경망의 성능저하 정도를 검토한다.
PDF

Performance Analysis of Speech Recognition in Communication Systems using Speech Coder (음성 압축기를 사용한 통신 시스템에서의 음성 인식 성능 분석)

Han Sang-Wook;Jung Heui Suck;Park Hochong
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.179-182
- /
- 2002
본 논문에서는 음성 압축기를 사용하는 디지털 이동통신 환경에서 한글 음성 인식기의 성능을 분석하기 위하여 다양한 표준 음성 압축기를 이용하여 음성 압축기의 구조, 전송률, 전송 채널의 에러율에 대한 성능을 측정하여 비교하였다. 동일한 구조의 음성 압축기에 대하여 전송률의 증가에 따라 음성 인식률이 증가하지만, 음성 압축기의 구조에 따라 동일 전송률에서도 많은 성능 차이가 발생하는 것을 확인하였다. 특히 IS-127 EVRC의 인식 성능이 매우 떨어지는 것을 알 수 있고, EVRC의 잡음 제거기와 가변 전송률에 의하여 음성 인식 성능이 저하되는 것을 확인하였다. 이를 통하여 청취 음질과 음성 인식 성능 사이의 상관 관계가 높지 않는 것을 알 수 있다. 모든 음성 압축기에 대하여 채널 에러율과 음성 인식기의 성능은 매우 밀접한 관계가 있음을 확인하였고, 평균적으로 채널 에러율 $1.0\%$에서 인식률이 $0.6\%$ 감소하고, 에러 $5.0\%$에서 인식률이 $1.8\%$ 감소한다.
PDF

On the Implementation of Model System for Speech Transmission Quality Evaluation of Digital Communication Network (디지틀 음성통신망의 통화품질 측정을 위한 통화모델 시스템의 구현)

홍진우;김순협
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.18 no.2
- /
- pp.192-201
- /
- 1993
According to technical advances of telecommunication, communication network has changed to digital transmission from analog transmission network. In the long run, current network will be altered into ISDN which makes end-to-end digital communication. This transition of communication network brings about an important questions for networking plan, administration, and speech quality in order to achieve the effective and advanced telecommunication. Speech quality criterions and degradation factors of digital communication system differ from those of existing analog system because of other characteristics like single echo. It is, therefore, necessary to design new criterions and specifications for digital communication network. This Paper describes the relation between speech communication and speech transmission quality and describes the implementation of model system for quality evaluation of digital speech communication network. In addition, some applications of model system implemented are proposed.
PDF

Reduction of Background Noise using FFT cepstrum (FFT 켑스트럼을 사용한 배경잡음의 제거)

Choi, Jae-Seung
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2010.10a
- /
- pp.264-267
- /
- 2010
본 논문에서는 오차역전파 학습 알고리즘을 사용하여 신경회로망을 학습시켜, 각 프레임에서의 음성 및 잡음 구간의 검출에 의한 음성인식 알고리즘을 제안한다. 그리고 신경회로망에 의하여 음성 및 잡음 구간의 검출에 따라서 각 프레임에서 잡음을 제거하는 스펙트럼 차감법을 제안한다. 본 실험에서는 원음성에 백색잡음 및 자동차잡음을 부가하여 음성인식의 인식율을 평가한다. 또한 인식시스템에 의하여 검출된 음성 및 잡음 구간을 이용하여 각 프레임에서의 스펙트럼 차감법에 의한 잡음제거의 실험결과를 나타낸다.
PDF

On the Present Construction Status of Speech Databases at KAIST Communications Research Laboratory (KAIST 통신연구실의 음성 데이터베이스 구축 현황)

최인정
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1995.06a
- /
- pp.272-275
- /
- 1995
한국과학기술원 통신연구실에서 진행중인 한국어 음성 데이터베이스의 개발 현황에 관하여 기술한다. 음성데이타베이스의 구축을 위하여 사용된 절차와 환경, 및 데이터베이스의 음성학적, 언어학적 성질들이 상세히 기술된다. 데이터베이스는 damtjddlstlr 알고리듬의 개발 및 평가를 위하여 사용되도록 고안되었다. 데이터베이스는 5종류의 음성 데이터, 즉 3천단어 규모의 무역관련 연속음성, 가변길이 연결 숫자음, phonembalanced 75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다.
PDF

SPHINX : Hidden Markov Model 기반 음성인식 시스템

Kim, Myeong-Won;Lee, Yeong-Jik;Jeon, In-Heng
- Electronics and Telecommunications Trends
- /
- v.5 no.2
- /
- pp.63-77
- /
- 1990
HMM(Hidden Markov Model)은 음성을 기술하는데 적합한 model이다. 본 고는 최근 CMU에서 개발한 HMM에 기반을 둔 화자독립, 연속음성 system인 SPIHNX에 대하여 기술한다. SPHINX는 단순한 음소의 HMM model을 적용한 baseline SPHINX로부터 시작하여 새로운 지식의 추가 및 음성단위의 조정 등을 통하여 지속적으로 그 성능이 개선되어 왔다. SPHINX의 최종 version은 어휘 약 1000단어 정도의 재원 관리에 관한 질문 형태의 문장을 인식하는데 96%의 높은 인식율을 보인다. SPHINX는 가장 발전된 음성인식 시스템의 하나이며 이는 화자독립, 대용량어휘의 연속음성 인식 시스템의 실현 가능성을 제시한다.
https://doi.org/10.22648/ETRI.1990.J.050205 인용 PDF

정보통신윤리위원회소식

Korean Associaton of Information & Telecommunication
- 정보화사회
- /
- s.94
- /
- pp.74-75
- /
- 1995
정보통신윤리위원회는 지난 4월 13일 정식 법정기구로 발족된 이후 음성 및 비음성 정보에 대한 사전, 사후 심의를 실시하였다. 심의한 실적과 모니터링 실적, 불건전정보 신고에 대한 처리결과는 다음과 같다.
PDF

Search Result 2,216, Processing Time 0.032 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)