• Title/Summary/Keyword: 음성다중

Search Result 350, Processing Time 0.028 seconds

A data server system in compliance with ATSC (데이터방송용 서버 개발)

  • 김정덕;이상주
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2001.11b
    • /
    • pp.21-25
    • /
    • 2001
  • 지상파 디지털방송에서는 기존 아날로그 방송에 비해 뛰어난 품질의 영상/음성 서비스가 제공될 뿐만 아니라 신문이나 잡지에서 볼 수 있었던 프로그램 정보를 TV 화면상에서 바로 받아 볼 수 있는 EPG(Electronic Program Guide) 서비스와 각종 데이터 서비스도 함께 제공된다. 이러한 EPG 정보와 함께 수신기에 필요한 각종 시스템 정보를 수신측에 전달하려면 ATSC(Advanced Television Systems Committee)의 PSIP(Program and System Information Protocol)에 따라 정보를 가공하는 장비가 필요하며 데이터 서비스를 위해서는 ATSC A/90의 송출 규격에 따라 데이터를 가공하는 장비가 필요하게 된다. 데이터서버 시스템은 PSIP의 생성과 데이터의 스케줄링을 담당하는 Data/PSIP 제어기와 데이터를 ATSC 송출 규격에 맞추어 가공하는 데이터 인젝터로 구성된다. 데이터서버 시스템은 방송 편성 정보를 담고 있는 KBS 편성 DB, 각종 콘텐츠를 관리하는 콘텐츠 DB, 그리고 실시간 독립정보 서비스를 제공하기 위한 실시간 어플리케이션 에이전트와의 인터페이스를 갖추고 있다. Data/PSIP 제어기와 데이터 인젝터에서는 편성된 PSIP 정보와 콘텐츠 데이터를 ASI(Asynchronous Serial Interface) 인터페이스를 통해서 다중화기로 전송한다. 다중화기는 PSIP 정보와 인코딩된 데이터 정보를 A/V TS(Transport Stream)와 함께 다중화하여 최종적으로 디지털 데이터 방송용 TS를 출력시킨다.

  • PDF

An Efficient Coding of LSP Parameters Using Multiple Type Frame Segmentation (다중 형태 프레임 분할 방법을 이용한 효율적인 LSP 계수 부호화에 관한 연구)

  • 이윤근
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.159-163
    • /
    • 1995
  • 음성 코딩에 있어서 스펙트럼 정보의 효율적인 방법으로써 다중 형태 프레임 분할 방법을 제안하였다. 일반적인 보코더의 경우 엔코더에서 전송된 스펙트럼 정보를 인접 프레임 계수간의 선형보간에 의해 하부프레임 단위의 스펙트럼 계수간의 선형보간에 의해 하부프레임 단위의 스펙트럼 정보를 재생해 낸다. 이 때 비선형적 스펙트럼 변화가 존재하는 경우에는 스펙트럼 왜곡이 발생하며 본 논문에서는 이를 intra frame spectral distortion 이라 정의한다. 제안된 다중 형태 프레임 분할 방법은 한 프레임내에서 스펙트럼 계수의 변화를 잘 나타낼 수 있도록 차수마다 다른 분할 형태를 적용하여 IFSD을 최소화시키는 방법이다. 스펙트럼 정보로써 line spectrum pair 계수를 이용하였으며, 분할 개수 및 분할 형태의 개수에 따른 IFSD을 분석하여 이를 기존의 방법과 비교하였다. 그 결과 기존의 방법보다 적은 정보량으로 왜곡이 적은 스펙트럼을 재생할 수 있었다.

  • PDF

Enhancement of Mobile Authentication System Performance based on Multimodal Biometrics (다중 생체인식 기반의 모바일 인증 시스템 성능 개선)

  • Jeong, Kanghun;Kim, Sanghoon;Moon, Hyeonjoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.342-345
    • /
    • 2013
  • 본 논문은 모바일 환경에서의 다중생체인식을 통한 개인인증 시스템을 제안한다. 다중생체인식을 위하여 얼굴인식과 화자인식을 선택하였으며, 시스템의 인식 시나리오는 다음을 따른다. 얼굴인식을 위하여 Modified census transform (MCT) 기반의 얼굴검출과 k-means 클러스터 분석 (cluster analysis) 알고리즘 기반의 눈 검출을 통해 얼굴영역 전처리를 수행하고, principal component analysis (PCA) 기반의 얼굴인증 시스템을 구현한다. 화자인식을 위하여 음성의 끝점 추출과 Mel frequency cepstral coefficient(MFCC) 특징을 추출하고, dynamic time warping (DTW) 기반의 화자 인증 시스템을 구현한다. 그리고 각각의 생체인식을 본 논문에서 제안된 방법을 기반으로 융합하여 인식률을 향상시킨다.

A Multi-band Loss Function for Improving Time-Domain Autoencoder (시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수)

  • Lim, Yujin;Yu, Jeongchan;Seo, Eunmi;Park, Hochong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.78-79
    • /
    • 2021
  • 본 논문에서는 시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수를 제안한다. 기존의 시간 영역 오토인코더를 사용하는 압축 및 복원 모델은 저 대역 손실에 치중되어 고 대역 신호를 생성하지 못하고 다운 샘플링된 신호를 결과로 출력하는 문제점을 가진다. 이를 해결하기 위해 대역별로 손실을 분리하여 가중치를 조절할 수 있는 다중 대역 손실 함수를 제안한다. 제안하는 손실 함수가 적용된 오토인코더에 음성 신호를 입력하여 학습을 진행한 결과, 다운 샘플링이 발생하지 않으며 고 대역 신호가 복원되는 것을 스펙트로그램을 통해 확인하였다.

  • PDF

The Effects of $SKMVTT^{(R)}$ on Voice Improvement in Vocal Polyp Patients (웃음을 이용한 다중음성치료기법$(SKMVTT^{(R)})$이 성대용종 환자의 음성개선에 미치는 효과)

  • Kim, Seong-Tae;Jeong, Ok-Ran;Ahn, Cheol-Min
    • Speech Sciences
    • /
    • v.15 no.2
    • /
    • pp.157-168
    • /
    • 2008
  • Vocal polyp is one of the representative chronic diseases of vocal folds, and it can be cured by voice therapy and/or laryngeal microsurgery. However, the existing therapeutic methods about vocal polyp are in great demand. The purpose of this study was to evaluate the effect of vocal improvement between laryngeal microsurgery and $SKMVTT^{(R)}$ (Seong-Tae Kim's Multiple Voice Therapy Technique), which was designed by the author. We identified 37 patients, who were diagnosed with unilateral vocal polyp, aged from 21 to 62 years(mean age: 46 years). 21 patients were treated by the $SKMVTT^{(R)}$ and the other 16 patients were only treated by the laryngeal microsurgery. All patients who were treated by the $SKMVTT^{(R)}$, received 12 sessions of treatment, and were evaluated before therapy and after finishing the 12th session. The patients who were treated by laryngeal microsurgery, were evaluated prior to and at least 8 weeks after surgery. The results showed that the $SKMVTT^{(R)}$ produced better results compared to the laryngeal microsurgery alone. The $SKMVTT^{(R)}$ produced better results, especially, at the initial stage of voice therapy compared with those of laryngeal microsurgery. In this study, we can suggest that $SKMVTT^{(R)}$ may be useful in improving the voice qualities of vocal polyp patients. However, more data should be collected and evaluated to be widely used in other clinics.

  • PDF

The Effects of SK-MVTT on Voice Improvement in Vocal Nodules Patients; Comparison with Accent Method (다중음성치료기법(SK-MVTT)이 성대결절 환자의 음성개선에 미치는 효과: 액센트 기법과의 비교 연구)

  • Kim, Seong-Tae;Jeong, Ok-Ran
    • Speech Sciences
    • /
    • v.11 no.4
    • /
    • pp.101-120
    • /
    • 2004
  • Vocal nodule is one of the representative chronic diseases of vocal folds, and it can be cured by voice therapy. However, the existing therapeutic methods about vocal nodule are in great demand. The purpose of this study was to evaluate the effect of therapeutic methods between Accent method and SK-MVTT (Seong-Tae Kim's multiple voice therapy technique), which was designed by the author. We identified 40 females, who diagnosed having vocal nodules, aged from 21 to 52 years (mean age: 40 years). Twenty females were treated by the SK-MVTT and the other 20 females the Accent method. All subjects received 12 sessions of treatment, and were evaluated after finishing the 6th and the 12th session. The results showed that the SK-MVTT produced a better results compared to the Accent method. The SK-MVTT was better especially at the initial stage of voice therapy compared to the Accent method. In this study, we can suggest that SK-MVTT may be useful in improving the voice qualities of vocal nodule patients. However, more data should be collected and evaluated before it can widely be used in other clinics.

  • PDF

Speech Enhancement Based on Mixture Hidden Filter Model (HFM) Under Nonstationary Noise (혼합 은닉필터모델 (HFM)을 이용한 비정상 잡음에 오염된 음성신호의 향상)

  • 강상기;백성준;이기용;성굉모
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.4
    • /
    • pp.387-393
    • /
    • 2002
  • The enhancement technique of noise signal using mixture HFM (Midden Filter Model) are proposed. Given the parameters of the clean signal and noise, noisy signal is modeled by a linear state-space model with Markov switching parameters. Estimation of state vector is required for estimating original signal. The estimation procedure is based on mixture interacting multiple model (MIMM) and the estimator of speech is given by the weighted sum of parallel Kalman filters operating interactively. Simulation results showed that the proposed method offers performance gains relative to the previous results with slightly increased complexity.

PCA-based Variational Model Composition Method for Roust Speech Recognition with Time-Varying Background Noise (시변 잡음에 강인한 음성 인식을 위한 PCA 기반의 Variational 모델 생성 기법)

  • Kim, Wooil
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.17 no.12
    • /
    • pp.2793-2799
    • /
    • 2013
  • This paper proposes an effective feature compensation method to improve speech recognition performance in time-varying background noise condition. The proposed method employs principal component analysis to improve the variational model composition method. The proposed method is employed to generate multiple environmental models for the PCGMM-based feature compensation scheme. Experimental results prove that the proposed scheme is more effective at improving speech recognition accuracy in various SNR conditions of background music, compared to the conventional front-end methods. It shows 12.14% of average relative improvement in WER compared to the previous variational model composition method.

Stimuli-responsive Smart Surface with Reversibly Switchable Wettability (자극 응답성 초발수-초친수 표면 특성 제어 기술)

  • Lim, Ka Hyun;Rho, Yoo Jin;Lim, Ho Sun
    • Prospectives of Industrial Chemistry
    • /
    • v.24 no.6
    • /
    • pp.3-18
    • /
    • 2021
  • 가역적인 표면 젖음성의 제어가 가능한 스마트 표면은 첨단 센서, 기능성 멤브레인 등 여러 산업분야에 적용될 수 있는 계면제어 기술로써 많은 관심을 받을 것으로 기대된다. 표면의 젖음성은 표면의 화학적 구조와 기하학적 입체 구조에 의해 영향을 받는 데, 특히 외부자극에 의해 소재 물성을 가변시킬 수 있는 스마트 고분자 소재를 나노구조가 제어된 표면에 도입함으로써 표면의 젖음성을 초발수에서 초친수로 가역적으로 전환시킬 수 있는 스마트 표면을 효과적으로 구현할 수 있다. 자극 응답성 스마트 소재는 인가하는 외부자극에 따라 물리적 자극(빛, 온도, 전기, 자기)과 화학적 자극(pH, 용매, 이온)으로 구분할 수 있으며, 이를 복합적으로 적용한 이중/다중 유발 자극에 반응하는 소재가 있다. 본 기고문에서는 외부자극에 응답하는 자극응답성 고분자를 나노 구조 표면에 도입하여 초발수에서 초친수로의 가역적인 젖음성 변화가 가능한 고기능성 스마트 표면의 최근 연구 동향과 미래 전망에 대해 소개하고자 한다. 이런 다양한 외부자극을 이용한 표면 특성의 가역적 제어 기술을 통해 물-오일의 분리, 바이오센서, 약물 전달, 소프트로보틱스와 같은 스마트 소재의 잠재적 발전 가능성 또한 엿볼 수 있을 것으로 기대된다.

HMM-based Speech Recognition using DMS Model and Fuzzy Concept (DMS 모델과 퍼지 개념을 이용한 HMM에 기초를 둔 음성 인식)

  • Ann, Tae-Ock
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.9 no.4
    • /
    • pp.964-969
    • /
    • 2008
  • This paper proposes a HMM-based recognition method using DMSVQ(Dynamic Multi-Section Vector Quantization) codebook by DMS(Dynamic Multi-Section) model and fuzzy concept, as a study for speaker- independent speech recognition. In this proposed recognition method, training data are divided into several dynamic section and multi-observation sequences which are given proper probabilities by fuzzy rule according to order of short distance from DMSVQ codebook per each section are obtained. Thereafter, the HMM using this multi-observation sequences is generated, and in case of recognition, a word that has the most highest probability is selected as a recognized word. Other experiments to compare with the results of recognition experiments using proposed method are implemented as a data by the various conventional recognition methods under the equivalent environment. Through the experiment results, it is proved that the proposed method in this study is superior to the conventional recognition methods.