• 제목/요약/키워드: 음악지능

검색결과 122건 처리시간 0.026초

잡음 환경에서의 음성인식을 위한 온라인 빔포밍과 스펙트럼 감산의 결합 (Combining deep learning-based online beamforming with spectral subtraction for speech recognition in noisy environments)

  • 윤성욱;권오욱
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.439-451
    • /
    • 2021
  • 본 논문에서는 실제 환경에서의 연속 음성 강화를 위한 딥러닝 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합한 빔포머를 제안한다. 기존 빔포밍 시스템은 컴퓨터에서 음성과 잡음을 완전히 겹친 방식으로 혼합하여 생성된 사전 분할 오디오 신호를 사용하여 대부분 평가되었다. 하지만 실제 환경에서는 시간 축으로 음성 발화가 띄엄띄엄 발성되기 때문에, 음성이 없는 잡음 신호가 시스템에 입력되면 기존 빔포밍 알고리듬의 성능이 저하된다. 이러한 효과를 경감하기 위하여, 심층 학습 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합하였다. 잡음 환경에서 온라인 빔포밍 알고리듬을 평가하기 위해 연속 음성 강화 세트를 구성하였다. 평가 세트는 CHiME3 평가 세트에서 추출한 음성 발화와 CHiME3 배경 잡음 및 MUSDB에서 추출한 연속 재생되는 배경음악을 혼합하여 구성되었다. 음성인식기로는 Kaldi 기반 툴킷 및 구글 웹 음성인식기를 사용하였다. 제안한 온라인 빔포밍 알고리듬 과 스펙트럼 감산이 베이스라인 빔포밍 알고리듬에 비해 성능 향상을 보임을 확인하였다.

국내 TV 드라마 디지털 불법복제, TV 시청률, 온라인 입소문 간의 동태적 분석 (A Dynamic Analysis of Digital Piracy, Ratings, and Online Buzz for Korean TV Dramas)

  • 김동연;박규홍;방영석
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.1-22
    • /
    • 2022
  • 본 연구는 패널 벡터자기회귀 모형을 활용하여 국내 TV 드라마에 대한 디지털 불법복제, 시청률, 온라인 입소문 간의 동태적 관계를 종합적으로 분석하였다. 주요 분석결과는 다음과 같다. 첫째, 시청률은 디지털 불법복제에 부정적 영향을 받지만 구글 버즈에는 긍정적 영향을 받는다. 둘째, 디지털 불법복제는 시청률과 소셜 버즈에 부정적인 영향을 받는다. 셋째, 소셜 버즈와 구글 버즈는 서로 긍정적 영향을 받는다. 영화나 음악에 대한 불법복제 효과 연구는 많이 이루어졌으나 TV 드라마에 대한 연구는 상대적으로 제한적이다. 본 연구는 TV 드라마의 디지털 불법복제 영향을 실증 분석하였으며, 특히 디지털 불법복제가 시청률에 미치는 직접효과 뿐만 아니라 온라인 입소문을 통한 간접효과가 존재함을 실증적으로 밝혔다는 점에서 의의가 있다. 또한 온라인 입소문을 소셜 버즈와 구글 트렌드 지표로 다양화하여 그 효과를 검증함으로써 중요한 실무적 시사점을 제공한다.

실어증 환자 대상 디지털 기술 기반 언어재활에 관한 최근 문헌 고찰: VR, AR, 모바일 애플리케이션을 중심으로 (A Review of Recent Digital Technology-Based Language Rehabilitation For Aphasia: Focusing on VR, AR, and Mobile Application)

  • 정채윤;홍유정;공성현;최유진;이교구
    • 한국콘텐츠학회논문지
    • /
    • 제22권9호
    • /
    • pp.46-63
    • /
    • 2022
  • 디지털 기술이 비약적으로 발전하며 이를 의료 분야에 융합하려는 흐름이 심화되고 있는 가운데, 최근 연구들은 실어증 환자 대상 언어재활에 가상현실(VR)과 증강현실(AR) 및 어플리케이션을 활용한 중재를 제안해왔다. 본 연구는 이러한 실어증 환자 대상 디지털 기술 기반 언어재활을 시행한 최근 4년 (2018~2021년) 연구의 특징을 종합하고 향후 연구에 대한 시사점을 도출하고자 주제범위 문헌 고찰(scoping review)을 시행하였다. Web of Science, CINAHL, RISS에서 검색된 국내외 문헌 중 선정 기준을 만족한 총 20개의 논문을 검토한 결과, 디지털 기술을 이용하여 재활 훈련 콘텐츠에 게이미피케이션(gamification), 환자 맞춤형 개인화 등을 적용하거나 가상 의사소통 환경을 구현하여 재활 훈련을 돕는 등 새로운 형식의 재활 콘텐츠가 다양한 방식으로 시도되고 있음을 확인하였다. 이러한 디지털 기술 기반 언어재활은 기존 언어재활의 한계점을 보완할 수 있는 새로운 방식의 재활 훈련 콘텐츠를 제시할 수 있을 것으로 기대된다.

LSTM 모델을 이용한 조각투자 상품의 가격 예측: 뮤직카우를 중심으로 (Price Prediction of Fractional Investment Products Using LSTM Algorithm: Focusing on Musicow)

  • 정현조;이재환;서지혜
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.81-94
    • /
    • 2022
  • 최근 고액의 실물자산이나 채권을 분할하여 여러 투자자가 공동으로 투자하는 이른바 조각투자가 인기를 얻고 있다. 2016년 설립된 뮤직카우는 음원 유통에 따른 저작권료 참여 청구권을 조각투자할 수 있는 서비스를 세계 최초로 시작하였다. 본 연구에서는 딥러닝 알고리즘 중 하나인 LSTM 모델을 사용하여 뮤직카우에서 거래되는 저작권료 참여 청구권의 가격을 예측하는 연구를 진행하였다. 청구권의 이전 가격과 거래량, 저작권료와 같은 청구권과 관련된 변수 외에도, 음악저작권료 참여 청구권 시장 상황을 나타내는 종합 지표와 경제 상황을 반영하는 환율, 국고채 금리, 한국종합주가지수도 변수로 사용하였다. 연구 결과 상대적으로 거래량이 낮은 조각투자의 사례에서도 LSTM 모델이 거래가격을 잘 예측하는 것을 확인할 수 있었다.

동요를 활용한 통합적 인성교육활동이 유아의 정서지능과 공감능력에 미치는 영향 (The Impact of Integrated Character Education Activities Involving Children's Songs on Children's Emotional Intelligence and Empathic Ability)

  • 김성미;김현주
    • 한국보육지원학회지
    • /
    • 제11권2호
    • /
    • pp.239-260
    • /
    • 2015
  • 본 연구는 동요를 활용한 통합적 인성교육활동이 유아의 정서지능과 공감능력에 미치는 영향을 알아 보고자 하였다. 연구대상은 H지역에 소재한 J유치원 만 4세 유아 46명을 실험집단과 비교집단으로 나누어 연구하였다. 12주 동안 매주 2회씩 총 24회 활동을 진행하였다. 한 회기 마다 동요를 배우고, 부르는 활동을 시작으로 이야기 나누기, 음악활동, 과학활동, 조형활동, 동작활동, 문학활동, 요리활동 등의 통합적으로 구성된 인성교육 활동을 실시하였다. 본 연구의 결과는 다음과 같다. 첫째, 동요를 활용한 통합적 인성교육 활동에 참여한 실험집단의 유아들과 인성교육활동에 참여하지 않은 비교집단의 유아들 간 정서지능이 유의미하게 차이가 있었다. 둘째, 동요를 활용한 통합적 인성교육 활동에 참여한 실험집단의 유아들과 인성교육활동에 참여하지 않은 비교집단의 유아들 간 공감능력이 유의미한 차이가 있었다. 본 연구의 결론은 앞으로 인성 교육활동을 위해 유아들이 생활 속에서 자연스럽게 부를 수 있는 동요에 대한 창작과 통합적 인성교육활동의 다양한 프로그램 개발이 지속되어야 할 것이다.

Touch-Face 기반 에듀테인먼트 콘텐츠 (Edutainment contents using Touch-Face)

  • 송대현;박재완;이칠우
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.363-366
    • /
    • 2008
  • 본 논문에서는 유아를 대상으로 한 에듀테인먼트 콘텐츠에 대하여 기술한다. 우리나라 전통 음악인 국악을 사용자가 실제 악기가 아닌 가상 악기를 이용하여 체험해 볼 수 있고, 국악에 하나인 판소리를 따라 부를 수 있게 한다. 또한 전통문양과 기본도형을 이용한 놀이를 직감적 도구인 손을 이용하여 디스플레이를 직접 터치할 수 있는 지능형 인터페이스 플랫폼인 Touch-Face를 기반으로 조작이 익숙하지 않는 유아 및 아동들이 쉽고 편리하게 조작할 수 있게 하였다. 이러한 기반 위에 교육적 콘텐츠는 보다 더 유아 교육에 있어서 효율적으로 학습하는데 도움이 될 수 있다.

  • PDF

스마트 모바일 기기에서의 객체 기반 실감 음원 서비스 구현 (A Desigin of real sound service based-on object in Smart mobile devices)

  • 정종진;임태범;이석필
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.685-688
    • /
    • 2011
  • 앞으로의 멀티미디어 기기시장은 기존의 단순 복합 디지털 기기들이 아닌 사용자 감성 및 취향 제어가 가능한 인간 친화적 지능형 멀티미디어 기기가 주류를 이룰 것이다. 이미 IT 기능이 기존의 '정보의 소통'에서 '감성의 소통'으로 진화 중에 있으며, 미래시대에는 느낌까지 디지털 신호로 전달 가능한 기술이 발달 될 것이다. 이에 맞추어 사람의 감성, 주변 분위기, 섬세한 공간 정보를 전달하는 사실적인 오디오 개발 및 인프라가 구축되어 모든 멀티미디어 제품에 적용된다면, 사용자는 보다 현장감 있게 멀티미디어를 즐길 수 있을 것이다. 최근 스마트폰의 확산과 더불어 각종 다양한 음악서비스를 제고하는 웹/앱 형태의 어플리케이션이 증대되고 있는 바, 본 논문에서는 안드로이드 기반 스마트 모바일 기기에서 다양한 오디오 정보를 청취자에게 제공하고 이를 활용하여 청취자가 다양하게 오디오 재생 / 제어하여, 일방적으로 청취자가 오디오를 듣는 수준이 아니라 청취자 취향에 따라 다양하게 오디오를 감상 할 수 있는 서비스를 구현하였다.

Integrated Arts Education Program with AI Literacy

  • Jihye Kim;SunKwan Han
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.281-288
    • /
    • 2023
  • 본 연구는 초등학생들의 AI 리터러시 함양을 위한 통합예술교육프로그램을 개발하고자 하였다. 먼저 AI 리터러시 영역별 목표와 2022 개정 초등학교 교육과정의 미술, 음악, 체육과의 목표 연구, 통합예술교육의 목표와 요소 매트릭스를 이용하여 2개의 주제 프로그램을 개발하였다. 개발된 프로그램은 1차 전문가 타당도 검사를 통해 수정 및 보완 후 학생에게 수업 적용하였고, 학생들의 AI 리터러시 사전/사후 검사, 프로그램에 대한 만족도 조사 결과를 토대로 2차 수정을 거쳤다. 마지막으로 3차 전문가 타당도 검사를 통해 최종 프로그램을 개발하였다. 개발된 프로그램은 초등학생들의 AI리터러시 함양을 위한 융합교육프로그램을 활용되기를 기대한다.

AI 영화영상콘텐츠를 위한 AI 예술창작 사례연구 (AI Art Creation Case Study for AI Film & Video Content)

  • 전병원
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.85-95
    • /
    • 2021
  • 현재 우리는 창작도구로서 컴퓨터와 창작자로서 컴퓨터 사이에 서 있다. 또한 포스트 시네마적 상황이라 할 수 있는 새로운 장르의 영화들이 등장하고 있다. 본 논문은 AI 시네마의 출현 가능성을 진단하고자 한다. AI 시네마의 가능성을 확인하고자 영화 창작의 필요조건이라 할 수 있는 스토리, 서사의 창작, 이미지의 창작, 사운드의 창작이 인공지능에 의해 가능한지 사례조사를 통해 살펴보았다. 먼저 AI 페인팅 알고리즘인 Obvious, GAN 및 CAN의 시각이미지 생성을 확인했다. 둘째, AI 사운드, 음악은 이미 인간과 협력하여 유통 단계에 들어섰다. 셋째, AI는 이미 드라마 대본을 완성 할 수 있고, 빅 데이터를 활용한 자동 시나리오 제작 프로그램도 인기를 얻고 있다. 즉, 우리는 필수적인 영화 제작 요구 사항이 AI 알고리즘으로 충족될 수 있음을 확인할 수 있다. 마노 비치의 'AI 장르 컨벤션' 관점에서 웹 다큐멘터리와 데스크톱 다큐멘터리는 포스트 시네마로서 AI 시네마의 대표적인 장르라고 할 수 있다. AI, 웹 다큐멘터리, 데스크톱 다큐멘터리가 존재하고 있는 환경이 동일하기 때문이다. 본 논문은 포스트시네마의 창작자로서 AI에 대한 연구를 통해 4차 산업혁명시대 영화라는 매체가 개척해야 할 새로운 길을 제시하고 있다.

스마트 강의 시스템을 위한 시간차 검출 방식의 실시간 음원 추적 기법 구현 (Implementation of Real-time Sound-location Tracking Method using TDoA for Smart Lecture System)

  • 강민수;오우진
    • 한국정보통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.708-717
    • /
    • 2017
  • 음원 추적은 지능형 CCTV, 화상회의시스템, 음성 명령 인식 등에서 널리 활용되고 있다. 본 논문에서는 스마트강의시스템에 적합한 천정 부착형 직교배열 마이크로 음성 신호의 도착 시간차인 TDoA(Time Difference of Arrival)를 이용하는 실시간 음원추적 기법을 제안한다. TDoA를 위한 점 음원과 평행음원 모델을 분석하고, 3개의 선형배열마이크를 이용하여 상호 상관 방안을 제안하였다. 또한 직교축에 십자 배열된 5개의 마이크를 사용하여 전방위(omni-direction)에서 음원 추적이 가능함을 보였다. 무음구간을 제거하기 위하여 수신 에너지를 이용하였으며 상호상관을 부호로 연산하여 계산량을 줄이고 추정 결과에 미디언 필터(Median Filter)를 적용하여 안정도를 높였다. 제안된 시스템은 고속 MCU인 TMS320F379D와 MEMs마이크 모듈로 구현하여, 방향 검출 성능이 백색잡음이나 음악 등에 대해서는 0.5도, 음성에 대해서는 6.5도의 정밀도를 보였다.