• 제목/요약/키워드: speaker detection

검색결과 108건 처리시간 0.027초

GMM-Based Maghreb Dialect Identification System

  • Nour-Eddine, Lachachi;Abdelkader, Adla
    • Journal of Information Processing Systems
    • /
    • 제11권1호
    • /
    • pp.22-38
    • /
    • 2015
  • While Modern Standard Arabic is the formal spoken and written language of the Arab world; dialects are the major communication mode for everyday life. Therefore, identifying a speaker's dialect is critical in the Arabic-speaking world for speech processing tasks, such as automatic speech recognition or identification. In this paper, we examine two approaches that reduce the Universal Background Model (UBM) in the automatic dialect identification system across the five following Arabic Maghreb dialects: Moroccan, Tunisian, and 3 dialects of the western (Oranian), central (Algiersian), and eastern (Constantinian) regions of Algeria. We applied our approaches to the Maghreb dialect detection domain that contains a collection of 10-second utterances and we compared the performance precision gained against the dialect samples from a baseline GMM-UBM system and the ones from our own improved GMM-UBM system that uses a Reduced UBM algorithm. Our experiments show that our approaches significantly improve identification performance over purely acoustic features with an identification rate of 80.49%.

광대역 무선 스피커 시스템을 위한 효율적인 패킷 검출 알고리즘 (Efficient Packet Detection Algorithm for Wireless Speaker System)

  • 김도훈;위정욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.195-198
    • /
    • 2012
  • MB-OFDM UWB시스템은 TFC(Time-Frequency Code)를 이용하여 시간/주파수 호핑을 수행한다. 이를 통해 주파수 영역에서 다이버시티 효과를 갖는 동시에 사용되는 다른 piconet간의 간섭을 최소할 수 있다. 송신단에서는 프리앰블을 전송할 때부터 해당 TFC에 맞게 호핑을 하면서 전송을 하기 때문에 수신단에서는 신호의 시작을 추정하는 패킷 검출은 매우 중요한 과제이다. 따라서 본 논문에서는 MB-OFDM UWB시스템을 위한 간단하고 효율적인 패킷 검출 방법을 제안하였다. 시뮬레이션 수행 결과 제안된 방법은 기존 방법보다 약 0.5 dB의 SNR 개선 결과가 있는 것으로 밝혀졌다.

  • PDF

컴퓨터 비젼 시스템에 의한 인쇄악보의 인식과 연주 (The recognition of Printed Music Score and Performance Using Computer Vision system)

  • 이명우;최종수
    • 대한전자공학회논문지
    • /
    • 제22권5호
    • /
    • pp.10-16
    • /
    • 1985
  • 본 논문에서는 인쇄 양보 서상을 CCTV 카메라로써 마이크로 컴퓨터에 입력시켜, 이 화상을 인식, 스피커로 노래를 내어주는 컴퓨터 비젼 시스템에 관해 논하고 있다. 이때 내보서조의 특징추출 및 인식에는 가산투영법이 적용되구 그 대상 인식 범위는 내보의 여러 요소 중에서 오연 마디, 음표로 하고 있다. 아울러 분제 내보화징을 취급할 때 반드시 고려되어야 할 전처리 및 잡음 제거 과정을 보였고, 인식된 음표로 화음을 내민주는 간단한 하드웨어 시스템을 구성했다. 그 결과 보호한 인식률로 연주 가능함을 보였다.

  • PDF

머리전달함수를 이용한 로봇의 화자 위치 추정 (Detection of Speaker Position for Robot Using HRTF)

  • 황성목;박윤식;박영진
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2005년도 추계학술대회논문집
    • /
    • pp.637-640
    • /
    • 2005
  • We propose a sound source localization method using the Head-Related-Transfer-Function (HRTF) to be implemented in a given platform. HRTFs contain not only the information regarding proper time delays but also phase and magnitude distortions due to diffraction and scattering by the shading object. Therefore, a set of HRTFs for any given platform provides a substantial amount of information as to the whereabouts of the source. In this study, we introduce new phase criterion in order to find the sound source location in accordance with the HRTF database empirically obtained in an anechoic chamber with the given platform. Using this criterion, we analyze the estimation performance of the proposed method in a household environment.

  • PDF

AI 스피커를 활용한 어텐션 메커니즘 기반 멀티모달 우울증 감지 시스템 (Multimodal depression detection system based on attention mechanism using AI speaker)

  • 박준희;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.28-31
    • /
    • 2021
  • 전세계적으로 우울증은 정신 건강 질환으로써 문제가 되고 있으며, 이를 해결하기 위해 일상생활에서의 우울증 탐지에 대한 연구가 진행되고 있다. 따라서 본 논문에서는 일상생활에 밀접하게 연관되어 있는 AI 스피커를 사용한 어텐션 메커니즘(Attention Mechanism) 기반 멀티모달 우울증 감지 시스템을 제안한다. 제안된 방법은 AI 스피커로부터 수집할 수 있는 음성 및 텍스트 데이터를 수집하고 CNN(Convolutional Neural Network)과 BiLSTM(Bidirectional Long Short-Term Memory Network)를 통해 각 데이터에서의 학습을 진행한다. 학습과정에서 Self-Attention 을 적용하여 특징 벡터에 추가적인 가중치를 부여하는 어텐션 메커니즘을 사용한다. 최종적으로 음성 및 텍스트 데이터에서 어텐션 가중치가 추가된 특징들을 합하여 SoftMax 를 통해 우울증 점수를 예측한다.

  • PDF

홍채 인식에서의 눈꺼풀 및 눈썹 추출 연구 (A Study on Eyelid and Eyelash Localization for Iris Recognition)

  • 강병준;박강령
    • 한국멀티미디어학회논문지
    • /
    • 제8권7호
    • /
    • pp.898-905
    • /
    • 2005
  • 홍채 인식은 동공의 확대, 축소 역할을 하는 홍채 근육의 무의 패턴을 이용하여 동일인 여부를 판별하는 연구 분야이다. 이러한 홍채 인식은 기존의 생체 인식(얼굴, 지문, 정맥 및 음석 인식 등)방법들에 비해 정확도가 상대적으로 높은 것으로 알려져 있으므로, 최근 고 수준의 정보 보안이 요구되는 분야에서 널리 사용되고 있다. 그런데 홍채 영역 내에 눈꺼풀,눈썹과 같은 다른 불필요한 정보가 포함되어 홍채 영역을 가리게 된다면 홍채 인식에서 오류가 발생할 확률도 증가하게 된다. 즉, 홍채 영역을 덮고 있는 눈꺼풀 및 눈썹을 홍채 패턴으로 취급하여 인식에 그대로 사용할 경우, 눈꺼풀과 눈썹의 위치가 변경되게 되면 그에 따라 홍채 코드 역시 바뀌게 되어 인식 오류도 증가하게 될 것이다. 이러한 문제점을 해결하기 위하여 이 논문에서는 피라미드 탐색 기반 포물선 가변 템플릿을 이용하여 눈꺼풀을 추출하였으며, 또한 눈썹 마스크를 이용하여 고속으로 눈썹 영역을 추출하였다. 실험 결과 본 논문에서 제안하는 눈꺼풀 및 눈썹 추출 알고리즘을 사용하지 않았을 때의 인식성능(EER)보다 제안하는 알고리즘을 사용했을 때의 인식 성능이 $0.3\%$ 향상되는 결과를 얻었다.

  • PDF

차량 부품의 노면 가진 특성을 고려한 래틀과 스퀵 현상 검출 방법의 개발 (Development of Rattle and Squeak Detection Methodology Considering Characteristics of Road Vibration Input)

  • 류수정;전인기;최재민;이원구;우재철
    • 대한기계학회논문집A
    • /
    • 제37권5호
    • /
    • pp.679-683
    • /
    • 2013
  • BSR 소음은 특히 자동차에서 도로 표면과 엔진 및 차량내부 스피커등의 진동에 의해 발생한다. 이러한 현상은 진동하는 시스템의 약화된 체결부나 접촉부에서 공진모드와 가진력의 중첩으로 인해서 발생하는 불규칙한 타격이나 스틱슬립(stick-slip)으로 발생한다. 이와 같인 국부적인 현상을 관찰하기 위해서 모든 BSR 발생 부위를 상세 유한요소 모델로 만드는 과정은 현실적으로 불가능 하므로 부분구조 모델 (Sub-structure) 해석 기술이 필요하다. 이번 연구에서는 부분구조 모델 (sub-structure) 해석 기술을 적용하여 실제 가진력이 구조물을 통해 전달되어 발생하는 래틀(rattle)과 스퀵(Squeak)을 검출하고 분석하는 해석적인 방법을 정리하였다.

잡음환경및 채널왜곡에 강인한 ARS용 전화음성인식 방식 연구 (The Development of a Speech Recognition Method Robust to Channel Distortions and Noisy Environments for an Audio Response System(ARS))

  • 안정모;임계종;계영철;구명완
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.41-48
    • /
    • 1997
  • 본고는 음성인식 기능이 추가된 음성응답장치(ARS)의 음성 인식률을 향상시키는 방법을 제안한다. ARS에 입력되는 전화음성은 안내방송, 전화잡음, 그리고 채널왜곡에 의하여 영향을 받기 때문에, 양질의 음성을 대상으로 하여 개발된 인식 알고리듬을 그대로 적용하면 상당한 인식률의 저하를 가져오게 된다. 이러한 문제점을 극복하기 위하여 본고에서는 세 가지 방법을 제안한다: 1)음성이 시작되는 순간 안내 방송을 즉시 끊기 위한 음성 입력순간의 정확한 검출, 2)Teager 에너지를 이용한 잡음 섞인 전화음성의 효과적인 끝점검출, 3)SDCN 알고리듬을 이용한 채널왜곡의 보상. 위의 세 가지 방법을 모두 결합하여 화자독립인 전화음성을 대상으로 실험한 결과, 기존의 방법이 약 23%의 인식률을 보인 반면, 제안된 방식은 약 77%의 인식률로서 상당한 성능향상을 보여주었다.

  • PDF

변곡점 검출에 기반한 음성의 기본 주파수 추정 (Fundamental Frequency Estimation of Voiced Speech Signals Based on the Inflection Point Detection)

  • 임병관
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.472-476
    • /
    • 2023
  • 피치 혹은 기본 주파수는 음성 신호의 주요 특성 인자이며 음성 부호화, 음성인식, 화자인식 등의 다양한 음성 관련 응용에 활용된다. 본 논문에서는 기본 주파수의 역수인 음성의 피치 주기를 추정하기 위해서 음성 신호의 변곡점을 이용한다. 변곡점은 국소적인 최대값, 최소값 혹은 신호의 기울기가 변하는 지점으로 정의된다. 음성 신호는 저역통과 필터로 먼저 전처리되어 고주파 성분이 제거된다. 이를 통해 불필요한 변곡점들이 제거되며, 피치 주기 추정에 유용한 국소적인 최대값만을 변곡점 검출법을 이용하여 추출한다. 얻어진 변곡점 간의 시간 간격을 측정하여 피치 주기를 추정하며, 그 역수로 기본 주파수 추정치를 얻는다. 기존의 피치 추정 방법은 음성이 국소적으로 시불변이라는 가정하에 음성을 블록 단위로 처리하여 블록당 피치 주기를 구하지만, 제안된 방법은 음성을 샘플 단위로 처리하여 변곡점을 검출하며, 그 결과 피치 주기를 시간 경과에 따라 얻게 되어 음성의 시변성이 반영된 기본 주파수 추정치를 얻는다. 컴퓨터 모의실험으로 기본 주파수 추정기로서 제안된 방법의 유용성을 볼 수 있다.

구조물 음향진동 모니터링을 위한 광섬유 센서 설계 (Fiber Optic Sensor Design for the Monitoring of Structural Sound and Vibration)

  • 이종길
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2007년도 춘계학술대회논문집
    • /
    • pp.81-84
    • /
    • 2007
  • In this paper, fiber optic sound and vibration monitoring sensor which is latticed shape structure based on Sagnac interferometer is fabricated and tested in laboratory conditions. To detect external vibrations surface mounted fibers on the latticed steel wire fence with a dimension of 170cm by 180cm is used. To detect external sound frequency the tightened fiber optic itself wire netting fence with a dimension of 50cm by 50cm is used. Experiments for the detection of the excited vibration and sound signals were performed. A small vibrator induced external vibration signal and it is applied to the latticed structure in the range of 100Hz to several kHz. External sound signal applied to the fiber optic sensor net using non-directional sound speaker. The detected optical signals were compared and analyzed to the detected both accelerometer and microphone signals in the time and frequency domain. Based on the experimental results, distributed fiber optic sensor using Sagnac interferometer detected effectively external vibration and sound signal and had a good performance. This system can be expanded to the monitoring of a significant system and to the structural health monitoring system.

  • PDF