• 제목/요약/키워드: 사운드 분류

검색결과 60건 처리시간 0.021초

음성 정보를 이용한 성인 컨텐츠 필터링 (Adult Contents Filtering using Speech Information)

  • 조정익;조진수;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.145-147
    • /
    • 2008
  • 현재까지 유해한 컨텐츠(Contents)를 차단하기 위한 활발한 연구가 있었으나, 사람의 음성(speech)정보를 이용한 필터링(filtering) 기법에 대한 연구는 활발히 이루어지지 않은 측면이 있다. 본 논문은 동영상 데이터를 가지고 있는 여러 데이터 중에서 음성 정보의 분석을 통하여 일반 컨텐츠와 성인 컨텐츠를 분류하기 위함이다. 본 논문은 음성 정보 중에서 음성 정보의 특징을 가장 잘 다루는 피치 검출을 통한 정보의 분석을 통한 성인 컨텐츠의 필터링에 그 목적이 있다. 현재까지 진행되고 있는 필터링(filtering)방법에 대한 수행 결과보다 개선된 성능을 보이고자 한다. 즉, 음성 정보의 특징 정보를 이용한 성인 컨텐츠(Adult Contents)분류 기법을 활용하는 것으로 성인 컨텐츠(Adult Contents)에서 두드러지는 특징을 보이는 사운드 패턴을 분석하는 것이다.

다양한 합성곱 신경망 방식을 이용한 폐음 분류 방식의 성능 비교 (Performance comparison of lung sound classification using various convolutional neural networks)

  • 김지연;김형국
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.568-573
    • /
    • 2019
  • 폐질환 진단에서 청진은 다른 진단 방식에 비해 단순하고, 폐음을 이용하여 폐질환 환자식별뿐 아니라 폐음과 관련된 질병을 예측할 수 있다. 따라서 본 논문에서는 다양한 합성곱 신경방 방식을 기반으로 폐음을 이용하여 폐질환 환자를 식별하고, 소리특성에 따른 폐음을 분류하여 각 신경망 방식의 분류 성능을 비교한다. 먼저 폐질환 소견을 갖는 흉부 영역에서 단채널 폐음 녹음기기를 이용하여 폐음 데이터를 수집하고, 수집된 시간축 신호를 스펙트럼 형태의 특징값으로 추출하여 각 분류 신경망 방식에 적용한다. 폐 사운드 분류 방식으로는 일반적인 합성곱 신경망, 병렬 구조, 잔류학습이 적용된 구조의 합성곱 신경망을 사용하고 실험을 통해 각 신경망 모델의 폐음 분류 성능을 비교한다.

음악 구성요소의 감정 구조 분석에 기반 한 시각화 연구 (Sound Visualization based on Emotional Analysis of Musical Parameters)

  • 김혜란;송은성
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.104-112
    • /
    • 2021
  • 본 연구에서는 음악의 속성인 구성 요소 데이터들과 심리학의 감정 차원 모델을 기반으로 감정분석을 하였고 그 결과를 조형예술에서의 시각화 규칙에 적용하였다. 음악 속성 데이터를 활용한 기존의 연구들에서는 사람들이 원하는 음악을 분류, 검색, 추천할 수 있도록 하는 보다 실용적인 목적을 가진 사례들이 많았다. 본 연구에서는 특히 음원 분석에 따른 음악의 감정분석을 기반으로 사운드 데이터가 예술작품 창작의 재료가 되어 심미적 표현에 활용될 수 있도록 하는 것에 집중하였다. 음악의 시각화 연구를 위해서는 예술이 가지는 중요한 속성인 감정표현을 가능하게 하는 방법이 필요하였고 이를 위해 잘 구조화된 음악의 기본 속성 분류 및 감정 정보의 분류 체계를 마련하였다. 그리고 조형요소의 형태, 색상, 애니메이션을 통해 음악 요소들에 대해 감정을 기반으로 세분화 된 입력 매개 변수들을 반영하여 시각화하는 작업을 수행하였다. 본 연구는 음악 시각화를 활용하는 작가들에게 기초 자료로 활용될 수 있을 것이다. 또한 감정분석에 기반 한 음악 구성요소와 시각화 매칭을 위한 분석 방법 및 작품 결과는 향후 인공지능 기반의 자동화 된 시각화 연구의 기반이 될 수 있을 것이다.

HMM에 의한 원형 마이크로폰 어레이 적용 드론 위치 추적 (Drone Location Tracking with Circular Microphone Array by HMM)

  • 정형찬;임원호;곽준봉;이시티아크 아메드;장경희
    • 한국항행학회논문지
    • /
    • 제24권5호
    • /
    • pp.393-407
    • /
    • 2020
  • 불법 무인기에 의한 위협을 줄이기 위해, 음향 기반 기법에 의한 추적시스템을 구현하였다. 드론 음향 추적 방식에는 3가지 주요 사항이 있다. 첫째, 가변 빔 형성을 통해 공간을 스캔하여 음원을 찾아 마이크 어레이를 사용하여 소리를 녹음한다. 둘째, 음원의 존재 유·무 여부를 알기 위해 은닉 마르코프 모델(HMM)로 분류한다. 마지막으로 음원이 드론인 경우, 적응형 빔 패턴을 기반의 추적기준 신호로 기록 및 저장된 음원을 사용한다. 시뮬레이션은 배경 노이즈 및 간섭 사운드가 없는 이상적인 상태와 배경 노이즈 및 간섭 사운드가 있는 비이상적인 조건 모두에서 수행되며 불법적인 드론의 추적 성능을 평가하였다. 드론 추적 시스템은 마이크 어레이 성능에 따른 탐색 거리 성능향상 및 음향 패턴 일치 정도에 따른 드론 유무 판정 기준을 설계하여 음성판독 회로설계에 반영하였다.

코엔 형제의 연출 스타일 분석 :범죄 영화를 중심으로 (Analysis of Coen Brothers's Directing Style: Centering around Crime Movies)

  • 이정국
    • 한국콘텐츠학회논문지
    • /
    • 제10권6호
    • /
    • pp.236-248
    • /
    • 2010
  • 이 글을 통해 코엔 형제의 범죄 영화에 속하는 <블러드 심플>, <바톤 핑크>, <파고>, <그 남자는 거기 없었다>, <노인을 위한 나라는 없다>를 중심으로 감독의 연출 스타일을 분석하다. 코엔 형제 영화 구성의 특징은 서사적 구성, 내레이션의 활용, 해피엔딩의 거부다. 주제에 있어서는 인간본성을 탐구하고, 탐욕이 가져온 허무와 비극을 주로 다룬다. 극적인 요소로는 오해, 엇갈림, 추격의 모티프를 주로 활용하고 있다. 그의 작품의 캐릭터들은 어긋난 욕망으로 파괴되는 보통사람의 단순함이 대부분이고, 전형적인 캐릭터를 거부한다. 형식을 분석해 보면, 촬영은 스테디 캠을 자주 사용하고, 고정 숏에 광각렌즈를 애용한다. 초기 범죄영화는 표현주의적인 조명을 많이 사용했으나 나중엔 사실적인 자연조명을 주로 썼다. 고전적인 편집, 사운드는 음악보다 음향효과를 주로 사용했고, 실제 현장 사운드, 사실적인 연기와 개성을 중요 시 하였다. 분명 그의 영화는 크게 범죄 영화와 코미디로 분류할 수 있지만, 범죄가 우월한 느와르 스타일의 영화야말로 코엔의 독특한 연출 스타일을 느낄 수 있다.

'알라딘' 애니메이션에서 비주얼 스토리텔링과 오리지널 사운드 트랙 융합 분석 (Integrated Analysis of Visual Story Telling and Original Sound Track of 'Alladin' Animation)

  • 장소은;루오량;김재호
    • 한국과학예술포럼
    • /
    • 제24권
    • /
    • pp.375-388
    • /
    • 2016
  • 본 연구는 애니메이션 '알라딘' 'A Whole New World'의 OST와 VST의 융합분석을 수행한 것이다. OST는 도입단계, 경과단계, 클라이막스단계, 엔딩단계의 4단계로 분류되고 각 단계마다 OST와 VST의 특징이 발견되었다. 특히, 클라이막스단계에서는 OST요소(사운드, 조성, 템포, 주요 음역, 셈여림, 악기편성)와 VST요소(영상구도, 카메라 샷, 카메라 움직임)의 높은 다이나믹 특성이 발견되었다. FS는 47.9% 사용되었는데, 이는 사랑의 완성단계에 두 캐릭터가 하나가 되는 것을 보여 주는데 도움을 준다. 이것은 이전 연구인 '미녀와 야수' OST의 공통점이기도 하다. '미녀와 야수'에서는 악기가 캐릭터와 매칭되고 '알라딘'에서는 화면 내 물체의 고저위치와 상승하강에 악기를 매칭하는 특징을 가진다.

협력적 태그를 이용한 추천 시스템

  • 연철;김흥남;지애띠;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.179-188
    • /
    • 2007
  • 디지털 기기 가 보편 화 되 면서 많 은 디지털 컨텐츠가 생성되고 있다. 또한, 인터넷 서비스의 발전으로 이들 컨텐츠를 과거에 비해 손쉽게 웹 상에 개제할 수 있게 되 었다. 따라서, 많은 컨텐츠를 추 천해 주기 위해 추천 시스템에 관한 연구가 활발히 진행되고 있다. 이들 컨텐츠가 기존의 텍스트 기반에서 사진이나 동영상, 사운드 등 컴퓨터가 자동으로 내용을 파악하기 힘든 컨텐츠로 변화하면서, 내용의 파악이 필요 없 는 협력적 여 과(Collaborative Filtering)가 추천 시스템에서 유 용하게 이 용될 수 있다. 또한 web 2.0의 영향으로 컨텐츠를 분류하고 재검색을 용이하게 하기 위해 태깅(tagging)을 제공하는 서비스가 많아지고 있다. 본 논문에서는 내용 파 악이 힘든 컨텐츠의 효과적인 추천을 위해 협력적 여과(Collaborative Filtering)와 협력적 태깅(Collaborative Tagging)을 접목시킨 방법을 제안하고, 전통적인 협력적 여과 방법과 제안한 방법의 비교 실험을 통하여 협력적 여과 방법에서의 태 깅의 효과에 대 해 논한다.

  • PDF

지능형 PVR을 위한 축구 동영상 하이라이트 요약 (Soccer Video Highlight Summarization for Intelligent PVR)

  • 김형국;신동
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.209-212
    • /
    • 2009
  • 본 논문에서는 MDCT기반의 오디오 특징과 영상 특징을 이용하여 축구 동영상의 하이라이트를 효과적으로 요약하는 방식을 제안한다. 제안하는 방식에서는 입력되는 축구 동영상을 비디오 신호와 오디오 신호로 분리한 후에, 분리된 연속적인 오디오 신호를 압축영역의 MDCT계수를 통해 이벤트 사운드별로 분류하여 오디오 이벤트 후보구간을 추출한다. 입력된 비디오 신호에서는 장면 전환점을 추출하고 추출된 장면 전환점으로부터 페널티 영역을 검출한다. 검출된 오디오 이벤트 후보구간과 검출된 페널티 영역장면을 함께 결합하여 축구 동영상의 이벤트 장면을 검출한다. 검출된 페널티 영역 장면을 통해 검출된 이벤트 구간을 다른 이벤트 구간보다 더 높은 우선순위를 갖는 하이라이트로 선정하여 요약본이 생성된다. 생성된 하이라이트 요약본의 평가는 precision과 recall을 통해 정확도를 평가하였다.

  • PDF

소프트웨어 로봇의 감성 표현을 위한 기반연구 - 감성어 추론을 위한 한글 처리 기술 개발 - (A Preliminary Study for Emotional Expression of Software Robot -Development of Hangul Processing Technique for Inference of Emotional Words-)

  • 송복희;윤한경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.3-4
    • /
    • 2012
  • 사용자 중심의 man machine interface 기술의 발전은 사용자 인터페이스 기술과 인간공학의 접목으로 인하여 많은 진전이 있으며 계속 진행되고 있다. 근래의 정보전달은 사운드와 텍스트 또는 영상을 통하여 이루어지고 있으나, 감성적인 측면에서의 정보전달에 관한 연구는 활발하지 못한 실정이다. 특히, Human Computer Interaction분야에서 음성이나 표정의 전달에 관한 감성연구는 초기단계로 이모티콘이나 플래쉬콘 등이 감정전달을 위하여 사용되고 있으나 부자연스럽고 기계적인 실정이다. 본 연구는 사용자와 상호작용에서 컴퓨터 또는 응용소프트웨어 등이 자신의 가상객체(Software Robot, Sobot)를 활용하여 인간친화적인 상호작용을 제공하기위한 기반연구로써 한글에서 감성어를 추출하여 분류하고 처리하는 기술을 개발하여 컴퓨터가 전달하고자하는 정보에 인공감정을 이입시켜 사용자들의 감성만족도를 향상시키는데 적용하고자한다.

  • PDF

음원인식 및 지연시간을 이용한 카메라의 방향제어 시스템 설계 (Design of direction control system for camera, Using sound source recognition and delay time.)

  • 이희태;김영섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.1076-1078
    • /
    • 2017
  • 본 연구는 이상음원(비명, 유리창 파손음, 경적소리 등) 발생 시, 2개의 마이크로폰에 입력되는 사운드에 대하여 음원 방향추적 장치와 연결된 카메라에 음원의 방향 정보를 전송함으로써, 카메라의 View Point를 음원 발생방향으로 이동시켜 사고현장을 더욱 신속하게 대처할 수 있는 시스템에 대한 연구이다. 일반적인 음성을 이용한 감시카메라는 단순히 소리 발생 여부만 감지하지만, 본 시스템은 이상음원 발생 지점으로 카메라의 방향 제어를 가능하게 한다. 이상음원의 검출은 기존에 수집한 DB를 기반으로 비교, 분석 과정을 통하여 이상음원을 분류한다. 음원 발생 방향은 음원 발생 시, 마이크로폰에 도달하는 음원의 시간차에 따른 음파의 위상차를 계산하여 음원 발생 방향을 판단하게 된다.