• 제목/요약/키워드: 음성검출

검색결과 726건 처리시간 0.032초

주파수 영역에서의 Gaussian Mixture Model 기반의 동시통화 검출 연구 (Frequency Domain Double-Talk Detector Based on Gaussian Mixture Model)

  • 이규호;장준혁
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.401-407
    • /
    • 2009
  • 본 논문에서는 주파수 영역에서의 가우시안 혼합 모델 (Gaussian Mixture Model, GMM) 기반의 새로운 동시통화 검출 (Double-talk Detection, DTD) 알고리즘을 제안한다. 구체적으로 주파수 영역에서의 음향학적 반향억제 (Acoustic Echo Suppression, AES)를 위한 동시 통화 검출 알고리즘을 구성하기 위해 기존의 시간 영역에서의 동시통화 검출에 사용되는 상호 상관계수를 이산 푸리에 변환을 통해 16개 채널의 주파수 영역으로 변환하였다. 이러한 주파수 영역에서의 상호 상관계수를 GMM의 보다 효과적인 구성을 위해 통계적 분류 특성에 근거하여 우수한 7개를 선별하였다. 본 논문은 이러한 특징 벡터로 패턴인식에서 우수한 성능을 보이는 GMM을 구성하였으며 원단화자만 있는 구간, 동시통화 구간, 근단 화자만 있는 구간을 우도 (Likelihood) 비교에 따라 분류함으로써 별도의 원단 화자 신호에 대한 음성 검출기 (Voice Activity Detector, VAD)의 사용 없이 잡음환경과 반향 경로 변화에서 강인한 동시통화 검출 알고리즘을 제안한다. 다양한 실험 결과 제안된 방법은 기존의 상호 상관계수를 고정된 문턱 값과 가부 비교하여 동시 통화 구간을 검출하는 hard decision 방법에 비해 검출 오류 확률 (Detection Error Probability)을 비교한 결과 우수한 성능을 보였다.

스마트폰 음성녹음 파일 구조 및 메타데이터의 위변조 기법에 관한 연구 (A Study on Forgery Techniques of Smartphone Voice Recording File Structure and Metadata)

  • 박재완;곽원준;이상현
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.807-812
    • /
    • 2022
  • 최근 음성녹음 파일도 법정 증거로 제출되는 수가 늘어남에 따라 위변조를 주장하는 사례도 증가하고 있다. 객관적 근거인 음성녹음 파일 구조 및 메타데이터를 완벽하게 위변조 할 경우에는 정교한 음성녹음 파일의 위변조 검출은 사실상 불가능하다. 위변조된 음성녹음 파일을 가지고 수행된 파일 구조 및 메타데이터 분석이 법정에서 거부되는 것은 쉽지 않다. 본 연구는 음성녹음 파일 구조 및 메타데이터의 위변조가 손쉽게 가능하다는 것을 증명하는 것을 목적으로 한다. 이를 위해 본 연구에서는 음성녹음 파일의 편집 방법의 유형화를 기반으로 정교한 편집이 가능한 '혼합붙여넣기' 기능을 적용할 경우 위변조 검출의 불가능함을 소개했다. 더욱이 실험을 통해 파일 구조 및 메타데이터의 위변조가 가능하다는 것을 증명했다. 따라서 음성녹음 파일이 디지털 증거로 채택됨에 있어서 더 엄격한 증거능력 판단 기준이 필요하다. 본 연구는 법관이 디지털 증거를 채택함에 무결성의 기준에 공헌할 뿐만 아니라 향후 개발될 것으로 예상되는 녹음파일 위변조 검출 인공지능을 위한 데이터셋 구축 방법에 공헌할 것이다.

충북지역 주산지 수박, 멜론에서의 바이러스 발생현황 (Incidence of Virus Diseases in Major Cultivated Areas of Watermelon and Melon in Chungbuk Province)

  • 한종우;박영욱;윤철구;이석호;정택구;최홍수;김미경
    • 식물병연구
    • /
    • 제29권1호
    • /
    • pp.88-93
    • /
    • 2023
  • 충북지역 수박과 멜론재배지에서 2020년부터 2021년까지 시료를 채집하여 reverse transcription polymerase chain reaction으로 유전자 진단을 실시해 바이러스 발생현황을 조사하였다. 2020년 수박에서는 정식 전 접목묘에 대해 바이러스를 검정했을 때 음성군과 진천군 두 곳에서 cucumber green mottle mosaic virus (CGMMV)만이 각각 8%의 감염률을 보였다. 6월에는 진천군과 음성군 모두에서 watermelon mosaic virus (WMV), CGMMV, cucurbit aphid-borne yellows virus (CABYV)가 공통적으로 검출되었으며, 감염률은 진천군이 WMV 3.7%, CGMMV 11.1%, CABYV 3.7%이었고 음성군은 WMV 15.8%, CGMMV 33.3%, CABYV 3.5%로 음성군이 진천군에 비해 WMV와 CGMMV 감염률이 높았다. 2021년 3월부터 5월까지 월별로 수박재배지에서 바이러스를 검정했을 때 3월에는 음성군과 진천군 모두에서 바이러스가 검출되지 않았으며, 4월에는 진천군에서 CGMMV 1.6%, 음성군에서는 WMV 0.4%, CGMMV 38.5% 발생하였다. 5월에는 진천군에서 cucumber mosaic virus (CMV) 35%, CGMMV 10%, 음성군에서는 CMV 20.9%, CGMMV 29% 발생하였다. 충북지역에서 수박 바이러스 조사기간 동안 zucchini yellow mosaic virus (ZYMV)와 cucurbit chlorotic yellows virus (CCYV)는 검출되지 않았으며, 2020년에는 발생되지 않았던 CMV가 2021년도에 발생하였다. 2020년부터 2021년까지 멜론재배지에서 최근 문제가 되고 있는 CABYV와 CCYV 발생을 조사했을 때 CABYV는 조사기간 동안 음성군과 진천군 모두에서 발생되었고 감염률은 53.9-92.2%였다. CCYV는 2020년에 음성군에서만 20.8% 2021년에는 진천군에서만 2.7% 발생하였다.

음성인식을 이용한 생활환경 제어장치 (The Environmental Control System using Speech Recognition)

  • 정혁준;임재용;이행세;오문식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.141-144
    • /
    • 2000
  • 일반인들은 음성인식을 이용한 생활보조기구들의 필요성이 적지만 장애인이나 노인들은 가족이나 주변인의 도움을 받지 않고서는 가전제품의 작동이나 전화통화 등과 같은 일을 스스로 하기에는 쉽지 않다. 이러한 사람들에게 각 가정에 널리 보급되어 있는 PC를 이용하여서 타인의 도움을 받지 않고서도 간편하게 사용할 수 있게 음성을 이용한 생활보조기구들 제어에 응용하였다본 음성인식기는 음성의 끝점 검출, 음성의 특징계수 추출, 백터 양자화 학습 및 인식, HMM학습 그리고 HMM인식으로 나누어져 있다. 그리고 그 인식 결과에 따라 생활보조기구등을 제어하였다. 이러한 음성인식기를 만드는 것은 노인이나 장애인들에게 자신이 혼자할수 없는 생활의 편리함을가져다 주기 위함이고 일반정상인에게도 많은 편리함을 가져다 주기 위함이다. 그러나 언어 학습과정에서 노인이나 환자는 학습에 어려움이 있어 적은 학습으로도 인식되어야하는 과제가 남아있다.

  • PDF

시간특성을 고려한 음성신호의 발성율 검출에 관한 연구

  • 김익성;서지호;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.109-111
    • /
    • 2004
  • 발성율은 일정한 시간동안 발성되는 음성신호 내에 몇 개의 음절이 포함되어 있는 지를 나타낸다. 발성율은 화자마다 다르고 각 음소들의 특징에 따라 변화할 수 있다. 발성율의 사전 측정이 이루어 진다면 음성부호화 측면에서도 중용한 정보로 사용될 수 있다. 기존의 음성부호화기는 발성율에 관계없이 고정적인 분석 구간을 정하여 전송률을 결정하고 있다. 따라서, 발성율을 미리 측정한다면, 발성율이 느린 부분과 빠른 부분에 각기 다른 부호화 방법을 적용하여 음질을 향상할 수도 있고 전송률을 가변적으로 적용할 수 도 있게 된다. 정확한 발성율을 측정하기 위해서는 음절의 변화를 추정하여야 한다. 음절의 변화를 추정하기 위한 방법으로 음성신호의 에너지 포락선 측정법과 LSP를 이용한 측정법이 각각 제안된 바 있으나, 본 논문에서는 위 두 가지 방법을 혼합한 방법을 사용하였다. 에너지 변동은 음성신호의 시간영역 처리방법으로 LSP 파라미터는 음성신호의 선형예측 분석에 의해 구해질 수 있다.

  • PDF

피치 검색에 의한 Phrase 단위의 Template 추출에 관한 연구 (On a Template Extraction of phrase unit by Pitch Searching)

  • 김종국;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.77-80
    • /
    • 2004
  • 원화자로부터 목표 화자의 음성으로 변환을 위해서는 음운 및 피치변환이 이루어져야 한다. 원 음성과 목표 음성 신호 사이에 따른 발성길이, 크기 및 피치 등의 운율 특성은 화자의 개인성 및 발성문장의 의도를 나타내는 주요 역할을 한다. 본 논문에서는 음성 변환을 수행하기 위하여 발성된 음성의 강세구(phrase)단위의 피치 검출을 통하여 템플릿을 추출하는 방법을 제안한다. 우선 한국어의 운율구에 대한 정보가 필요한 것인지, 한국어는 어떤 운율 구조를 갖는지에 대하여 알아본다. 마지막으로 어떻게 연속음성으로부터 한국어에 적당한 운율구 단위를 나눌 것인지, 즉 자동 세그멘테이션 및 레이블링에 대하여 분석한다. 또한 논문에서는 한국어 문장음성의 운율구를 강세구와 억양구로 나누고 육안으로 표시한 운율구 단위를 기준으로 이 운율구 단위에 적합한 특징을 추출하여 패턴을 작성한다.

  • PDF

Windows환경에서 음성인식을 이용한 멀티미디어 게임의 구현 (An Implementation of Multimedia Game using Speech Recognition for Windows)

  • 윤재선
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.335-338
    • /
    • 1998
  • 본 논문에서는 음성인식 알고리즘인 HMM을 사용하여 Windows 환경에서 온라인으로 사용할 수 있는 음성인식 게임“Voice Illust Magic”개발에 관하여 소개한다. 사용자와 컴퓨터가 상호작용(Interaction)할 수 있는 매체를 마우스와 키보드뿐만 아니라 게임에 필요한 명령어를 음성인식으로 실행함으로써 정보전달이 매우 효과적으로 이루어져 사용자가 접근하기 쉽고 편리하게 되었으며 의사전달 효율을 높일 수 있었다. 음성인식 과정을 온라인으로 마이크를 통해 들어온 음성을 자동으로 끝점을 검출한 후, Mel-Cepstrum을 추출하여 Word 단위의 reference HMM과 비교하여 최적의 model이 선택되면, 윈도우즈에게 메시지를 보내어 마우스나 키보드가 동작하는 것과 마찬가지로 실행되도록 하였다. 또한, 입력 음성을 모든 reference pattern과 비교하는 것이 아니라 그 상황에 적용될 수 있는 표준 패턴을 한정함으로써 탐색시간을 줄일 수 있었으며 높은 인식률을 나타내었다.

  • PDF

음성제어 PC를 위한 음향 반향 제거기의 구현 (Implementation of the Acoustic Echo Canceller for a Voice-controlled PC)

  • 한철희;이혁재;윤대희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 학술대회
    • /
    • pp.103-106
    • /
    • 1998
  • 본 논문에서는 전이중(full duplex)으로 동작하는 멀티미디어 PC의 음성 명령어 인식기의 성능 향상을 위한 적응 음향 반향 제거기를 구현하였다. 최근 들어 일고 있는 인간과 컴퓨터의 인터페이스를 쉽고 친밀하게 하려는 노력은 음성으로 제어하는 컴퓨터의 탄생을 예고하고 있다. 이러한 시스템을 전이중 모드에서 사용할 경우 음향 반향은 피할 수 없는 현상이다. 본 논문에서는 이러한 음향 반향을 제거하기 위해서 서브밴드 적응 필터 구조를 이용하여 실시간 처리가 가능한 음향 반향 제거기를 설계하였다. 또한, 동시통화시 음성의 왜곡을 줄이는 스위칭 구조를 사용하였다. 동시통화의 검출은 상호상관도를 이용하여 구현하였다. 이렇게 구현된 반향제거기를 음향 입출력 루틴과 음성 인식기와 결합하여 Windows 95상에서 실시간으로 동작하는 음성 명령어 인식 소프트웨어를 완성하였다. 모의 실험 및 실시간 실험을 통하여 반향 제거기의 성능을 검증하였고, 음성인식 실험을 수행하여 반향 제거기가 인식율 향상에 기여함을 확인하였다.

  • PDF

사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션에 관한 연구 (A Study on VoiceXML Application of User-Controlled Form Dialog System)

  • 권형준;노용완;이현구;홍광석
    • 정보처리학회논문지B
    • /
    • 제14B권3호
    • /
    • pp.183-190
    • /
    • 2007
  • VoiceXML은 음성을 통해 웹 자원 탐색을 제공하기 위한 목적으로 설계된 XML 기반의 새로운 마크업 언어이다. VoiceXML로 만들어진 어플리케이션은 기계 주도 폼 다이얼로그 구조와 상호 주도 폼 다이얼로그 구조로 분류된다. 이와 같은 다이얼로그 구조들은 어플리케이션 개발자에 의해 서비스 시나리오가 결정되기 때문에 사용자가 자유롭게 웹 자원을 탐색하는 서비스를 구축할 수 없다. 본 논문에서는 사용자의 의도에 따라 서비스 시나리오가 결정되는 음성 웹 서비스의 구축을 위해 사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션 구조를 제안한다. 제안하는 어플리케이션은 사용자에 의해 요청된 정보로부터 인식 후보들을 자동적으로 검출하여 음성 앵커로 사용하고 각각의 음성 앵커론 새로운 음성 노드로 연결한다. 제안하는 시스템의 예로 IT 용어사전을 내장한 뉴스 서비스를 구현하여 음성 앵커의 검출 및 등록 여부를 확인하였고, 음성 인식률 및 사용자가 의도한 정보를 성공적으로 제공했는지 판단하는 척도가 되는 적중률과 응답 속도를 측정하였다. 실험 결과, 제안한 시스템이 기존의 VoiceXML 폼 다이얼로그 구조의 시스템보다 더 자유로운 웹 자원의 탐색이 가능함을 확인하였다.