• 제목/요약/키워드: 화자식별

검색결과 105건 처리시간 0.02초

AMDF의 회전변환을 이용한 피치 주기 검출 알고리즘 (Pitch Period Detection Algorithm Using Rotation Transform of AMDF)

  • 서현수;배상범;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.1019-1022
    • /
    • 2005
  • 최근 정보 통신 기술의 급속한 발전에 의해 음성 신호 처리에 관련된 많은 연구가 진행됨에 따라 피치 주기는 음성 인식, 화자 식별, 음성 분석 및 합성 등과 같은 많은 응용분야에서 중요한 요소로써 적용되고 있다. 이러한 피치 주기 검출에 관련된 시간 영역과 주파수 영역에서의 많은 알고리즘이 제안되었으며, 시간 영역의 피치 검출 알고리즘의 하나인 AMDF(average magnitude difference function)는 각 valley점의 거리를 피치 주기로 계산한다. 그러나 피치 주기 검출을 위한 valley점 선정에 있어서 알고리즘이 복잡해지는 문제점이 발생한다. 따라서 본 논문에서는 AMDF의 회전변환을 이용하여 전체 최소 valley점을 음성 신호의 피치 주기로 인식하는 간단한 알고리즘을 제안하였으며, 음성의 시작구간에 대해 경계값을 설정하여 피치 주기 선정에 대한 판단기준으로 사용하였다. 그리고 제안한 알고리즘을 시뮬레이션을 통해 기존의 방법들과 비교하였다.

  • PDF

소음환경에 강인한 피치주기 검출 알고리즘에 관한 연구 (A Study on the Robust Pitch Period Detection Algorithm in Noisy Environments)

  • 서현수;배상범;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.481-484
    • /
    • 2006
  • 음성 신호의 피치주기 검출 알고리즘은 음성 인식, 화자 식별 등의 다양한 음성 신호 처리 분야에 적용되고 있으며, 시간영역과 주파수영역에서 많은 연구가 진행되고 있다. 피치주기 검출 알고리즘의 하나인 AMDF(average magnitude difference function)는 연산속도가 빠른 장점이 있지만, 피치주기 검출을 위한 valley점 선정에 있어서 알고리즘이 복잡해지는 문제점이 발생한다. 또한 이러한 피치주기 검출 알고리즘이 실생활에 응용되기 위해서는 다양한 환경에서 발생하는 소음으로부터 강인한 특성을 가져야 한다. 따라서, 본 논문에서는 변형된 AMDF 알고리즘을 이용하여 피치주기 검출을 위한 전체 최소 valley점 선정을 보다 용이하게 하였으며, 테스트 신호로써 지하철 등과 같은 소음환경에서의 음성신호를 사용하였다.

  • PDF

인공지능 기반 화자 식별 기술의 불공정성 분석 (Analysis of unfairness of artificial intelligence-based speaker identification technology)

  • 신나연;이진민;노현;이일구
    • 융합보안논문지
    • /
    • 제23권1호
    • /
    • pp.27-33
    • /
    • 2023
  • Covid-19으로 인한 디지털화는 인공지능 기반의 음성인식 기술을 급속하게 발전시켰다. 그러나 이 기술은 데이터셋이 일부 집단에 편향될 경우 인종 및 성차별과 같은 불공정한 사회적 문제를 초래하고 인공지능 서비스의 신뢰성과 보안성을 열화시키는 요인이 된다. 본 연구에서는 대표적인 인공지능의 CNN(Convolutional Neural Network) 모델인 VGGNet(Visual Geometry Group Network), ResNet(Residual neural Network), MobileNet을 활용한 편향된 데이터 환경에서 정확도에 기반한 불공정성을 비교 및 분석한다. 실험 결과에 따르면 Top1-accuracy에서 ResNet34가 여성과 남성이 91%, 89.9%로 가장 높은 정확도를 보였고, 성별 간 정확도 차는 ResNet18이 1.8%로 가장 작았다. 모델별 성별 간의 정확도 차이는 서비스 이용 시 남녀 간의 서비스 품질에 대한 차이와 불공정한 결과를 야기한다.

통사화용의 접합면에서 본 영어 헤지표현의 유형과 기능 (Types and Functions of English Hedges at a syntax-pragmatics Interface)

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.381-388
    • /
    • 2020
  • 본 논문의 목적은 주로 사회언어학과 화용론 분야에서 연구되어 온 영어 '헤지(Hedges)' 혹은 헤지표현을 형태통사적 관점과 화용적 관점을 연관지어 논의하는 것이다. 일반적으로, '헤지표현이 없는 자연언어는 없다'는 추론이 가능한데, 그것은 어떤 자연언어에나 공손성, 혹은 화자가 청자보다 낮은 자세로 말하고자 하는 문법기제가 있음이 널리 인정되고 있기 때문이다. 헤지에 대한 기존의 이론적 연구는 주로 화용적 관점에서 헤지의 유형 분류와 화용적 기능, 그리고 출현빈도 비교 등의 수준에 그치고 있다. 즉, 헤지표현을 형태통사적 개념인 자질로 나타내려는 시도는 거의 발견되지 않는다. 언어현상으로서의 헤지는 유무에 따라, 화용부와 통사부의 접합면에서 [+hedged]와 [-hedged]로 이분지화 가능하며, 이 화용자질은 형태통사부와 상호작용 하므로 협의의 통사부에서 분리될 수 없다. 본 논문에서, 헤지는 공손성이 표현되는 화용자질로서, 그 자질이 표시되는 접합면 영역이 구조적으로 있음을 지적하였다. 즉, CP+층위가 화용자질인 헤지자질이 인코딩되는 영역임을 제안하였다. 최근에는 범언어적 관점에서 혹은 영어교육의 학술적 EFL/ESL 글쓰기, 또는 담화분석 등에 헤지 표현의 식별 여부나 용례를 연구하는 경향이 있다. 본 논문은 그동안 간과되어온 동등접속문, 병렬종속문, 부분사 구문 등을 헤지에 포함시키고, 보다 구조적이고 이분지적(±)인 방식을 제안함으로서, 제2언어습득의 이해, 글로벌 커뮤니케이션 혹은 인공지능 자연언어 알고리즘에 화용 자질을 도입할 수 있는 구조적이고 이론적인 기반을 제공하는데 그 목적이 있다.

입술움직임 영상신호를 고려한 음성존재 검출 (Speech Activity Decision with Lip Movement Image Signals)

  • 박준;이영직;김응규;이수종
    • 한국음향학회지
    • /
    • 제26권1호
    • /
    • pp.25-31
    • /
    • 2007
  • 본 논문은 음성인식을 위한 음성구간 검출과정에서, 음향에너지 이외에도 화자의 입술움직임 영상신호까지 확인하도록 함으로써, 외부의 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위하여 시도한 것이다. 먼저, PC용 화상카메라를 통하여 영상을 획득하고, 입술움직임 여부가 식별된다. 그리고 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세스와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서는 공유메모리에 저장되어 있는 데이터를 확인함으로써 사람의 발성에 의한 음향에너지인지의 여부를 확인하게 된다. 음성인식기와 영상처리기를 연동시켜 실험한 결과, 화상카메라에 대면해서 발성하면 음성인식 결과의 출력까지 정상적으로 진행됨을 확인하였고, 화상카메라에 대면하지 않고 발성하면 음성인식 결과를 출력하지 않는 것을 확인하였다. 이는 음향에너지가 입력되더라도 입술움직임 영상이 확인되지 않으면 음향잡음으로 간주하도록 한 것에 따른 것이다.