• Title/Summary/Keyword: 음성자료분석

Search Result 263, Processing Time 0.022 seconds

음성·영상 신호 처리 알고리즘 사례를 통해 본 젠더혁신의 필요성 (Gendered innovation for algorithm through case studies)

  • 이지연;이혜숙
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.459-466
    • /
    • 2018
  • 젠더혁신은 연구개발의 전 과정에서 남녀의 생물학적, 인지적, 사회적 특성 및 행동방식의 차이에 의한 성 젠더 요소를 고려하여 남녀 모두를 위한 보다 나은 연구개발과 지식을 창출하는 과정을 의미한다. 본 논문의 연구목적은 ICT산업, 자동차 산업, 빅데이터, 로봇 산업 등에 활용할 수 있는 영상 음성신호처리에서 문헌연구 및 기존 자료를 분석하고 사례 조사를 통하여 젠더혁신의 중요성을 고찰하는 것이다. 본 연구에서는 젠더 연구를 기반으로 영상 음성신호처리의 관련된 최신 국내외 문헌을 검색하고 총 8편의 논문을 선정한다. 그리고 젠더분석 측면에서, 연구대상, 연구 환경, 연구 설계로 구분하여 살펴본다. 연구결과로써, 노인음성 신호처리, 기계학습과 젠더, 기계번역 기술, 안면 젠더인식 기술의 음성 영상신호 처리 알고리즘 논문 사례 분석을 통하여 기존의 알고리즘에 젠더편향성이 있음을 밝히고 이들 알고리즘 개발에서 상황에 맞는 성 젠더 분석이 필요함을 보인다. 또한 알고리즘 개발에 다양한 성 젠더 요소를 반영하는 젠더혁신 방법과 정책을 제안한다. 추후 ICT에서의 젠더혁신은 남녀 모두의 요구를 반영한 제품과 서비스를 개발로 새로운 시장 창출에 기여할 수 있다.

치조 마찰음 왜곡 오류 유무에 따른 아동 발화 적률분석 비교 (Spectral moment analysis of distortion errors in alveolar fricatives in Korean children)

  • 한윤주;김도형;황자은;장대현;김재원
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.33-40
    • /
    • 2024
  • 본 연구는 치조 마찰음의 왜곡 오류인 치간음화, 구개음화, 설측음화가 적률분석의 변인인 무게중심, 분산, 왜도, 첨도에서 정조음과 보이는 음향학적 차이를 확인하고자 하였다. 이를 위해 61명 아동(평균연령: 5.6±1.5세, 여아 19명, 남아 42명)을 대상으로 얻어진 조음음운평가(Assessment of Phonology & Articulation for Children, APAC; Urimal-test of Articulation and Phonology I, U-TAP I) 결과, 음성 중 치조 마찰음을 포함하고 있는 목표 단어에서 치조마찰음 왜곡 오류를 보인 음성과 정조음 음성을 추출하여 후향적 연구를 진행하였다. 총 169개의 음성이 적률분석에 사용되었다. 그 결과, 무게중심에서 정조음이 구개음화보다 값이 높았으며, 구개음화는 치간음화보다 값이 낮았다. 치간음화의 분산이 정조음과 구개음화보다 높았다. 치간음화가 정조음보다 높은 왜도를 보였으며 구개음화의 왜도가 정조음보다 높았다. 마지막으로 구개음화의 첨도가 정조음과 치간음화보다 높았다. 각 왜곡 오류 유형에서 적률분석의 모든 변인들에 대해 조음위치(어두초성, 어중초성), 발성유형(평음, 경음)에 따른 유의한 차이는 관찰되지 않았다. 본 연구는 치조 마찰음의 유형에 따라 무게중심, 분산, 왜도, 첨도에서 다른 패턴이 나타남을 확인하였으며, 본 연구에서 제시한 객관적 수치는 추후 임상에서 청지각 평가를 도와 치조 마찰음 왜곡 오류의 진단과정에 기초 자료로 사용될 수 있을 것이다.

스펙트로그램을 이용한 근위축성측삭경화증 여성 화자의 모음 포먼트, 음성강도, 기본주파수의 변화 (Characteristics of Vowel Formants, Voice Intensity, and Fundamental Frequency of Female with Amyotrophic Lateral Sclerosis using Spectrograms)

  • 변해원
    • 한국융합학회논문지
    • /
    • 제10권9호
    • /
    • pp.193-198
    • /
    • 2019
  • 본 연구는 근위축성측삭경화증(amyotrophic lateral sclerosis, ALS)으로 진단된 여성을 대상으로 음향음성학적 스펙트로그램 분석을 이용하여 11개월 동안 모음과 이중모음의 포먼트 변화(vowel formant variation)를 분석하였다. 검사어는 단모음 /a, i, u/와 이중모음 /h + ja + da/, /h + wi + da/, /h +ɰi+ da/를 이용하였다. 발화자료는 'Alvin' 프로그램을 이용하여 모니터에 제시된 단어읽기과제를 통해 수집되었고, 녹음환경은 nyquist frequency는 5,500Hz, sampling rate는 11,000Hz으로 설정하였다. 녹음자료는 스펙트로그램을 이용하여 강도, 음도와 이중모음의 포먼트를 분석하였다. 분석결과, ALS의 진행과정에서 기본주파수와 강도가 저하되었고, 단모음에서의 포먼트 변화보다는 이중모음의 포먼트 기울기의 감소가 특징으로 확인되었다. 이 결과는 병의 진행에 따른 ALS의 모음왜곡이 혀와 턱의 협응력 감소에 기인함을 시사한다.

인공지능 음성 스피커의 의인화 특성 지각 정도가 지속적 이용 의향에 미치는 영향: 통합 수용 모델을 기반으로 (The Effect of Perceived Anthropomorphic Characteristics on Continuous Usage Intention of Artificial Intelligence Voice Speaker : Based on the Integrated Adoption Model)

  • 이성준
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.41-55
    • /
    • 2021
  • AI(Artificial Intelligence) 음성 스피커는 많은 이들의 관심을 받으며 AI 기술 기반 제품 관련 초기 시장 형성과 발전에 중요한 역할을 하고 있다. 이런 가운데 본 연구는 확장된 기술 수용 모델과 인지된 즐거움 및 혁신 저항 요인을 통합한 통합 수용 모델을 기반으로 AI 음성 스피커 지속적 이용 의향 영향 요인들을 살펴보았다. 또한, AI 음성 스피커만의 차별화된 요소로서 3가지 인지된 의인화된 특성들(인지된 이성적지지, 인지된 친밀성, 인지된 인지적 개방성) 요인들이 어떻게 AI 음성 스피커 지속적 이용 의향에 영향을 미치는 지를 살펴 보았다. 자료는 20-30대 AI 음성 스피커 이용 경험자를 중심으로 온라인 설문을 통해 수집되었으며, 수집된 자료는 구조방정식모델(Structural Equation Modeling)을 통하여 분석되었다. 연구결과, 인지된 용이성, 인지된 유용성, 인지된 즐거움 및 혁신 저항 모두 지속적 이용 의향에 유의미한 영향을 미치는 것으로 나타났다. 또한, 인지된 이성적지지, 인지된 친밀성, 인지된 인지적 개방성 3가지 인지된 의인화된 특성들 인지된 용이성, 인지된 유용성 및 인지된 즐거움에 영향을 미치는 것으로 나타났다. 본 연구가 지니는 다양한 함의들도 같이 논의된다.

국가기록원 음성 기록물의 복원과 분석 (Restoration for Speech Records Managed by the National Archives of Korea)

  • 오세진;강홍구
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.269-278
    • /
    • 2013
  • 국가기록원의 음성 기록물은 우리나라의 근현대사를 담은 중요한 기록물이다. 하지만 아날로그로 녹음된 방식은 시간이 지남에 따라 손실을 피할 수 없어 디지털로 변환하여 관리 및 서비스할 필요성이 있다. 그에 따라 왜곡이 발생한 부분에 대해 본래의 정보를 복원하는 작업은 매우 중요하며, 본 논문은 음성 기록물의 훼손 종류에 따라 4가지의 카테고리로 분류하고 음량, 정상 잡음, 돌발 잡음에 맞는 복원 알고리즘을 적용하였다. 그 결과 음량은 음성 존재구간에 대해서 -26 dBov로 조정했고 SNR은 10 dB이상 상승하였다. 특히 기존에는 음성이 훼손된 부분을 순차적으로 청취하여 개별적으로 문제를 해결해야 했기 때문에 방대한 자료를 복원하기는 불가능 했지만 자동 복원 알고리즘을 도입하여 보다 효율적인 방식으로 복원할 수 있게 되었다.

In-vehicle 교통안전 경고정보 제공에 따른 운전자 반응특성 분석 (Effects of In-vehicle Warning Information on Drivers' Responsive Behavior)

  • 송태진;오철;오주택;이청원
    • 대한교통학회지
    • /
    • 제27권5호
    • /
    • pp.63-74
    • /
    • 2009
  • 본 연구에서는 실시간 주행환경에서 전방의 위험상황에 대해 운전자가 효과적으로 반응 할 수 있는 교통안전 경고정보 컨텐츠 도출을 위한 연구를 수행하였다. 차내 단말기를 통해 제공되는 경고정보 유형에 따른 운전자 반응특성을 분석하였다. 운전자 반응특성자료를 수집하기 위하여 DGPS를 장착한 실험차량을 이용하여 개별차량 주행궤적을 수집하여 속도 및 가감속도를 산출하였다. 차내 경고정보 유형은 사고위험성과 직접적인 연관이 있는 긴급영향권과 긴급영향권에 진입하는 차량에게 위험발생의 사전정보를 제공하기 위한 일반영향권으로 분류하였다. 컨텐츠는 시각적 정보인 Text, 이미지와 청각적 정보인 경고음, 그리고 음성 메시지를 고려하여 다양한 시나리오를 제작하여 현장실험에 활용하였다. 분석 결과 긴급영향권에서는 음성+이미지+text와 경고음+text로 구성된 경고정보를 제공하는 것이 가장 효과적인 것으로 분석되었으며, 일반영향권에서는 경고음+음성+이미지+text로 구성된 경고정보를 제공하는 것이 가장 효과적인 것으로 나타났다. 본 연구 결과는 향후 운전자의 반응특성을 고려한 보다 효과적인 실시간 경고정보를 설계하기 위한 유용한 정보로 활용 될 것으로 기대된다.

체세포점수와 홀스타인 유방형질간의 관계 (Relationship of Somatic Cell Score and Udder Type Traits of Holstein Cattle)

  • 최태정;서강석;김시동;박병호;최재관;윤호백;나승환;손삼규;권오섭;조광현
    • Journal of Animal Science and Technology
    • /
    • 제50권3호
    • /
    • pp.285-292
    • /
    • 2008
  • 본 연구는 국제적인 경쟁력을 갖기 위한 젖소개량방법으로 체세포를 활용하는 방법을 모색하고자 선형심사 자료에서 유방염에 관련된 형질을 이용하여 새로운 선발지수를 개발하기 위한 단계로 국내 젖소집단의 체세포점수 분포와 변화추이를 분석해보고 연령, 분만계절, 비유단계의 환경효과를 구명하고 유방관련 형질과의 유전상관과 유전력을 구하여 기초자료로 활용하고자 본 연구를 진행하였다. 분석은 유우군 능력검정을 통하여 2000년부터 수집된 자료를 이용하였고 자료는 1산차 기록을 갖는 10,929개체의 290,144 검정일 기록과 37,723개의 유방형질 기록을 이용하였다. 분석에 이용된 유방형질은 전유방붙음성, 뒷유방높이, 뒷유방너비, 유방깊이, 앞유두길이의 형질이며 체세포 점수간의 표현형상관과 유전상관을 구하고 분산성분을 추정하였으며 개체모형을 이용하여 표현형상관과 유전상관을 분석하였다. 분석에 이용된 모형은 개체모형으로 DF-REML방식을 이용하여 추정하였고 유방깊이와 앞유두길이의 유전력은 0.23, 0.22로 체세포점수의 유전력은 0.08로 분석되었다. 유방형질과 체세포점수간의 표현형상관은 -0.03~-0.06으로 낮게 나타났으며 높은 유방붙음성을 갖을수록 낮은 체세포점수를 보였다. 체세포점수와 유방깊이, 체세포점수와 앞유두길이의 유전상관은 부의 상관을 보였다.

AIS 데이터를 활용한 정량적인 선박정보제공 실적 산정에 관한 연구

  • 김광일;이승희;정중식
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2016년도 춘계학술대회
    • /
    • pp.252-254
    • /
    • 2016
  • VTS에서 정보제공실적은 대내 외적으로 많이 활용되며, VTS 성과평가 자료로 중요하게 활용되고 있다. 지금까지 VTS에서 산정되는 정보제공 실적은 대부분 관제사가 관제업무 중 정보제공 발생시 관제일지에 수기로 기록하고 있으나, 선박관제 및 선박모니터링, PORT-MIS 등 여러 업무를 수행하고 있는 관제사가 정보제공 실적을 일일이 기록하는데 한계가 있다. 본 연구에서는 객관적인 정보제공 실적 산출을 위해 VHF 음성 자료 및 선박간 조우데이터를 분석하여 선박교통데이터 기반의 선박 안전정보 제공 회귀모형식을 도출하고자 한다.

  • PDF

WiBro 네트워크에서 메신저, VoIP 도청 및 포렌식 연구 (A Study of Forensic on Eavesdropping from VoIP and Messenger through WiBro Network)

  • 천우성;박대우
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.149-156
    • /
    • 2009
  • 우리나라 WiBro가 IEEE 802.16e로 국제표준화 되어 수도권부터 WiBro 네트워크 사업을 수행하고 있다. 본 논문에서는 WiBro 네트워크에서 빈번하게 일어나는 메신저 프로그램과 VoIP를 통한 음성 및 화상통화에 대해 도청을 실시하였다. 패킷 수집과 분석기인 와이어샤크를 통해서 패킷의 도청을 실시하고 SIP, H.263, TCP, UDP 프로토콜을 바탕으로 도청자료를 재생한다. 패킷이 위변조 되지 않았다는 무결성을 시간을 기준으로 검증하여 도청된 VoIP 음성 패킷의 복사본의 시간과 패킷의 시간 그리고 X-Lite 통화 기록의 시간이 일치함을 증명하여 무결성을 검증한다. 무결성이 검증된 자료는 밀봉 봉투에 넣어서 수사 자료로서 활용하기 위해 밀봉 후에 수사관의 간인을 실시하여 법정에서의 증거자료로 사용 할 수 있도록 준비한다.

숫자음 분석과 인식에 관한 연구 (A Study on Spoken Digits Analysis and Recognition)

  • 김득수;황철준
    • 한국산업정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.107-114
    • /
    • 2001
  • 본 논문에서는 한국어의 음성학적 규칙을 적용한 연속 숫자음 인식에 관하여 연구한다. 연속 숫자음의 인식률은 일반적으로 음성인식 시스템 중에서 낮은 인식률을 나타낸다. 따라서 숫자음에 대하여 강건한 모델을 작성하기 위하여 음성 특징 파라미터와 음성학적 규칙을 적용하고 실험을 통하여 그 유효성을 확인하고자 한다. 이를 위하여 음성자료로는 국어공학센터(KLE)에서 채록한 4연속 숫자음을 사용하며 인식의 기본단위로서는 음성학적 규칙을 적용한 19개의 연속분포 HMM을 유사음소 단위(PLUs)로 사용한다. 또한, 인식실험에 있어서는 일반적인 멜 켑스트럽과 회귀계수를 이용한 경우와 음성학적 규칙과 특징을 확장하여 모델을 작성한 경우에 대해서 유한상태 오토마타(Finite State Automata ; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming) 법으로 인식실험을 수행하여 그 결과를 비교 검토하였다. 그 결과, 멜 켑스트럼만을 사용한 경우 55.4%, 멜 켑스트럼과 회귀계수를 사용한 경우에는 64.6%, 특징 파라미터를 확장한 경우 74.3%, 음성학적 특징까지 고려한 경우 75.4%로 기존의 경우보다 높은 인식률을 보였다. 따라서, 음성 특징 파라미터를 확장하고 음성학적 규칙까지 함께 적용한 경우 비교적 높은 인식률을 보여 제안된 방법이 연속 숫자음 인식에 유효함을 확인하였다.

  • PDF