• 제목/요약/키워드: 사운드 분석

검색결과 175건 처리시간 0.024초

인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템 (Soundtrack Search System for Interactive-Smart-Television)

  • 류상현;조재만;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.202-203
    • /
    • 2011
  • 본 논문에서는 인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템을 제안한다. 제안하는 시스템은 동영상을 오디오와 비디오특징을 구분한 후, 각 오디오와 비디오 신호를 분석한다. 비디오 신호의 분석은 MPEG-2 비디오 인코더로부터 영상의 장면전환과 시작과 끝 위치를 검출하고, 오디오 신호의 분석은 AC-3 오디오 인코더로부터 오디오 특징을 추출한 후, 오디오 정보의 비트 벡터를 추출하여 데이터베이스를 생성한다. 생성된 데이터베이스와 사용자가 북마크를 하여 요청한 쿼리와 비교를 통하여 오디오 특징정보가 유사한 부분의 장면을 검색하고, 검색된 장면을 사용자에게 제공한다. 제안된 시스템의 성능 측정을 위해서 뉴스, 패널토론, 음악방송, 광고, 드라마 등 50개 TV 방송 프로그램의 데이터베이스를 이용해서 정확성을 측정하였다.

  • PDF

웹툰 연출의 애니메이션 기법활용과 문제점 분석 (Analyzing animation techniques used in webtoons and their potential issues)

  • 김유미
    • 만화애니메이션 연구
    • /
    • 통권46호
    • /
    • pp.85-106
    • /
    • 2017
  • 2000년을 전후 디지털 미디어 시대의 전환과 함께 출판만화는 인터넷 망을 활용한 유통구조를 확립하는 등 새로운 매체로의 전환을 시도하였다. 그러나 인터넷 만화는 여전히 전통적인 병렬적 페이지 읽기구조를 벗어나진 못하였다. 반면 웹툰의 경우 인터넷브라우저의 세로 스크롤 읽기방식에 따라 칸을 분리 배분하여 연출하고, 애니메이션의 움직임과 음향효과나 배경음악과 같은 사운드를 도입하는 등 다른 매체들을 재매개하며 변화를 보여주고 있다. 이러한 변화는 현대 독자의 수용방식에도 부합한다. 현대 사회는 영상 미디어의 발달과 함께 복잡한 사회구조를 갖고 있다. 따라서 대중은 일상적으로 다양한 자극에 노출되어 분산된 지각의 특성을 보여준다. 즉, 전통적인 만화는 여타의 인쇄매체가 그러하듯 침잠과 몰입의 감상을 필요로 한다. 그러나 웹툰은 특정 컷에서 캐릭터가 움직이거나 타이틀 텍스트가 불투명도를 높이며 서서히 등장하는 것과 같은 애니메이션과 음향효과를 적용하고 있다. 이러한 애니메이션 움직임의 시간성과 사운드의 청각적 자극이 웹툰의 특성으로 출판만화와 구분된다. 먼저 웹툰의 움직임은 극적 긴장감이나 액션의 효과적인 연출을 위해 부분적으로 적용되고 있다. 기술적으로 동작 이미지를 여러 레어어로 분리하여 움직임을 주는 핸드 드로운 애니메이션의 기법을 차용하고 있다. 그리고 사운드의 사용이 있다. 각 에피소드와 관련된 가사나 멜로디의 배경음악이나 엠비언스 사운드, 또는 어떠한 움직임과 관련된 음향효과 등이다. 뿐만 아니라 스마트폰의 진동을 이용한 촉각적 자극 등으로 독자에게 새로운 유희를 제공하고 있다. 그러나 한편으로는 새로운 기법을 도입한 웹툰의 연출이 아직은 완숙기에 도달하지 못했음을 볼 수 있다. 웹툰 효과연출 소프트웨어의 조작적 정교함을 차치하고 볼 때, 애니메이션과 사운드 적용에 대한 매체적 이해가 부족한 과도기적 현상으로 볼 수 있다. 만약 사운드가 적용된 특정 프레임이 위로 스크롤되어 브라우저에 노출되는 지점부터 재생되는 경우를 보면, 독자에게 기대되는 속도보다 빠르거나 느리게 스크롤 되는 경우 전체 이미지를 보기도 전에 사운드가 끝이 나거나 또는 다음컷으로 이동하였음에도 사운드는 계속적으로 유지되는 경우다. 움직임 또한 각 컷의 움직임은 스크롤의 위치에 대비하여 시작되도록 한다. 따라서 독자의 스크롤 속도는 움직임의 속도가 되기도 한다. 따라서 타이밍이 어긋나고 부자연스러운 움직임이나 갑작스럽게 플레이되고 끊기는 등 사운드의 연출은 독자들의 몰입을 방해하는 요인이 되기도 한다. 결론적으로 이러한 문제점들에 관하여 본 연구는 연속성의 부재로, 자연스럽게 전환되는 연속적 사운드나, 예를 들어 캐릭터가 움직일 때 관절의 간단한 회전 등 개연성이 필요하고 본다.

대전 원도심 소리풍경에 관한 의미론적 연구 - 대흥동 성당과 은행동 성심당 종소리를 중심으로 - (A Semantic Study on the Soundscape of the Historic Downtown of Daejeon - Focusing on the Bells of Daeheung-dong Cathedral and Enhang-dong Sungsimdang -)

  • 김명신
    • 한국조경학회지
    • /
    • 제50권2호
    • /
    • pp.64-75
    • /
    • 2022
  • 본 연구의 목적은 대전 원도심의 랜드마크이자 명소인 중구 대흥동 성당과 은행동 성심당 두 장소의 종소리가 지닌 사운드스케이프의 성격과 의미를 조명하는 것이다. 연구는 현장 답사 및 녹취, 관련 자료와 사운드스케이프 이론 등의 문헌연구에 의해 이루어졌다. 대전시는 20세기 초 일제강점기에 철도 대전역과 함께 생성된 도시로, 충남도청이 대전으로 이전하면서 대전역 인근에 위치한 중구 대흥동과 은행동 일대는 크게 발달하며 원도심을 형성하였다. 90년대에 서구로 주요 행정기관이 대거 이전하면서 대전 원도심은 쇠락의 길을 걷게 되었고 세종시 개발로 쇠락은 가속화되었다. 그런 가운데, 대흥동 성당과 한국전쟁 당시 한 피난민에 의해 설립된 성심당은 원주민들이 떠나간 대전 원도심을 굳건히 지키고 있다. 대흥동 성당은 일제 강점기에 설립되어 2019년 들어 100년의 역사를 지니게 된 지역 랜드마크로, 일제 강점기에 탄생한 대전시와 역사를 같이 하는 역사문화자산이다. 한국전쟁을 배경으로 탄생한 성심당 또한 설립 60년의 역사를 지닌 역사문화자산이자 대전 명소 1위로 선정된 지역 랜드마크이다. 인근 주택가에까지 들려오는 대흥동 성당의 종소리에서 출발한 이 탐구는, 대로 건너에 위치한 은행동 성심당의 종소리를 발견하기에 이르렀다. 본 고는 대흥동 성당과 은행동 성심당의 종소리가 시그널 사운드(signal sound)를 넘어 사운드마크(soundmark)의 성격을 지님을 머레이의 사운드스케이프 소리 범주를 통해 파악하였다. 나아가 비교적 최근의 EU 사운드스케이프 정의에 따라 두 종소리의 의미 분석을 시도했다. 두 종소리는 표층적 차원에서는 시그널사운드이지만 심층적 차원에서는 대전 원도심의 사운드마크이다. 외형적으로는 규모나 스케일, 빈도, 유명도에서 차이가 있으나, 두 종소리는 특별한 인연의 역사성과 장소성, 로컬리티와 선한 영향력 등에서 의미를 공유한다. 본 연구의 시사점은 대전 중구 원도심 도시 재생 혹은 도시 개발에서 두 장소가 시각적 랜드마크 뿐만 아니라 사운드마크로서도 지역 역사문화자산임을 밝힌 데 있다.

디지털 오디오 주관적 음향레벨 계측기 구현을 위한 ITU-R BS. 1387-1의 알고리즘 특성 분석 (Performance analysis of subjective Loudness meter with ITU-R BS. 1387-1 algorithm for digital audio)

  • 뉴엔 보 바오 느안;박성균;노승환;한찬규
    • 전기전자학회논문지
    • /
    • 제16권4호
    • /
    • pp.395-404
    • /
    • 2012
  • 본 논문에서는 객관적 오디오 품질 분석에 대한 권고안인 ITU-R BS.1387-1의 귀의 모델을 토대로 라우드니스를 객관적으로 측정할 수 있는 알고리즘을 구현하며, 그 성능을 23개의 순음과 9개의 샘플 디지털 사운드에 적용하여 평가하였다. 순음의 경우 ISO226:2003에서 제공하는 실험 데이터와 비교한 결과 5%이하의 오차를 보이며, 디지털 사운드 실험 결과도 Moore 모델의 측정결과와 비교할 때 4.7%이하의 편차와 0.96이상의 코릴레이션을 나타내어 좋은 성능을 보였다. 한편 구현 알고리즘에 적용한 청각필터 수에 따른 성능 변화를 분석하기 위해 21개의 별도의 샘플 디지털 사운드에 적용하였다. 그 결과를 분석하여 보면, 37개의 청각필터를 갖는 구현 알고리즘에 바이어스 보상값을 적용함으로써 109개 필터를 사용하는 경우에 대해 2%미만의 오차를 갖는 양호한 성능을 갖도록 할 수 있었다.

촉각기반 비디오 및 오디오 스트리밍 기술 개발 (Development of a Haptic Based Video and Audio Streaming Method)

  • 유용희;조동현;이환문;김기권;전경구;성미영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.538-541
    • /
    • 2009
  • 본 논문에서는 촉각기반 비디오 및 오디오 스트리밍 기술 개발을 설명한다. 제안하는 스트리밍 기술은 촉각정보를 포함한 비디오 프레임과 함께 진동정보를 가진 오디오를 실시간으로 전송해주는 방법에 대한 구현을 설명한다. 촉각정보 전송을 위하여 비디오 화면을 일정한 크기의 셀로 나누어 각 셀에 비디오 화면의 콘텐츠에 대응하는 촉각정보를 적용시켜 주었다. 이 정보들은 특정 형식으로 파일로 저장되게 되고 촉각정보 전송에 사용되게 된다. 촉각정보 전송은 비디오 프레임과 교차하며 전송된다. 이렇게 전송된 비디오와 촉각정보는 클라이언트 컴퓨터에서 병렬적으로 처리되어 화면에 출력시켜준다. 진동정보를 가진 오디오를 전송하기 위해서는 사운드를 분석하여 특정 사운드에 적합한 진동을 적용시켜 주었다. 이런 방법으로 저장된 진동정보는 사운드 스트리밍과 동기화되어 사용자에게 전송되며 이를 통해 사용자는 관람하고 있는 비디오 화면을 만짐으로써 화면 콘텐츠의 재질을 느낄 수 있고 음향에 따라 다양한 패턴의 진동을 느낄 수 있다.

  • PDF

전기자동차 실내 주행 사운드의 사용자 경험 디자인 : 맥락정보성과 정숙성을 중심으로 (User Experience Design of Interior Driving Sound for Electric Vehicle : Focusing on the Contextual Information and Quietness)

  • 이다혜;심혜린;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제16권2호
    • /
    • pp.14-24
    • /
    • 2016
  • 최근 전기자동차와 관련된 콘텐츠 연구에서 사운드 디자인이 새로운 연구 주제로 부각되고 있다. 이 연구는 전기자동차 실내 주행음 디자인의 주요 가치들을 사용자 경험(User Experience) 측면에서 탐색하고 검증하는 것을 목적으로 진행되었다. 근거이론에 의한 탐색적 연구를 통해 맥락정보성과 정숙성을 독립변수로 도출하여 $2{\times}2$ 요인 설계로 유용성, 감성, 만족도에 대한 주효과 및 두 변인 간 상호작용 효과를 분석하였다. 실험연구를 통해 맥락정보성과 정숙성의 조합에 따라 전기 자동차의 사용자 경험에 미치는 영향이 달라진다는 점을 밝혔다. 연구 결과에 기반하여 실내 주행 사운드 가치의 개인별 선호를 고려한 사용자 니즈 최적화를 위한 후속 연구 방향을 제시하였다.

영상음향의 사운드디자인설계가 커뮤니케이션 효과에 미치는 영향 - TV광고음향을 뇌 지수 분석기법으로 - (Influences of a Sound Design of Media Contents on Communication Effects - TV-CF Sound Using a BQ-TEST)

  • 유회종;서현주;문남미
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.602-611
    • /
    • 2008
  • 지금까지 TV, 영화, 광고 등 미디어콘텐츠 제작에서 사운드디자인은 스토리를 전달하는 청각효과측면에서 전문가의 경험적 느낌에 의하여 주로 진행되었으며, 수용자가 느끼는 시청각적 효과를 적용키 위한 정량적 연구와 검증은 아직 취약한 실정이다. 본 연구에서는 미디어콘텐츠 제작에서 사운드디자인설계의 차이가 수용자에게 미치는 커뮤니케이션 효과의 차이를 알아보고자 시도한 비 동등성 대조군 전후 유사실험 연구이다. 연구방법은 60초의 TV광고영상을 음악으로만 디자인한 실험영상(A트랙)과, 음향효과와 음악으로 디자인한 실험영상(B트랙)을 시청하는 동안 뇌파측정을 통하여 얻어진 뇌 지수(Brain Quotient)를 비교 분석하여, 어떠한 사운드 디자인 설계가 수용자의 커뮤니케이션 효과에 차이가 있는가를 알아보았다. 그 결과, 첫째, 인지효과의 해당 뇌지수인 주의지수(ATQ)를 A트랙과 B트랙을 비교한 결과 A트랙이 B트랙보다 높은 활성화 차이를 보였다. 이는 음악위주의 사운드 디자인이 음향효과디자인보다 수용자에게 더 높은 관심과 집중도를 보였다고 해석할 수 있다. 둘째, 감성효과에 해당하는 정서지수(EQ)를 A트랙과 B트랙 비교결과 A트랙이 B트랙보다 높은 활성화를 보였다. 이 역시 음악위주의 사운드디자인이 음향효과위주의 디자인보다 정서적으로 감성효과가 높게 관여한다는 것을 의미한다. 셋째, 기억활성효과에 해당하는 뇌 활성지수(ACQ)는 A트랙과 B트랙 비교결과 B트랙 군보다 A트랙 군이 약간의 차이가 있었으나 유의하지는 않았다. 이번 실험을 통하여 지금까지 강한 집중을 위해서는 음향효과디자인이, 정서적인 감정은 음악디자인이 관여도가 높다는 기존의 연구에서, TV광고음향의 한정이 있기는 하나 집중도에서 음악디자인이 오히려 효과가 높을 수 있으며, 정서적인 관여는 역시 음악디자인이 효과가 높다는 결론을 얻을 수 있었다. 다만 기억활성도에서 유의한 차이가 없었던 점은 피험자숫자를 늘리는 등 계속적 연구가 필요하다. 본 연구는 미디어콘텐츠에서 사운드디자인설계가 수용자에게 미치는 커뮤니케이션효과의 영향을 뇌파측정을 통하여 정량적으로 알아 본 것에 의의가 있으며, 사운드디자인제작현장의 기초 자료로 활용될 수 있음을 기대한다.

광역 스펙트로그램과 심층신경망에 기반한 중첩된 소리의 인식과 영향 분석 (Recognition of Overlapped Sound and Influence Analysis Based on Wideband Spectrogram and Deep Neural Networks)

  • 김영언;박구만
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.421-430
    • /
    • 2018
  • 많은 음성인식 시스템들은 MFCC와 HMM등의 분류 기법을 사용하여 사람의 음성을 인식한다. 그러나 이러한 음성인식 시스템은 단일 음성신호를 인식하는 것을 목적으로 설계되어, 인간과 기계사이의 일대일 음성 인식에는 적합하나, 애완동물 소리와 실내 소리같은 음성보다 다양하고 넓은 주파수의 소리 군으로 중첩된 음향 속에서 설정된 소리를 인식하기에는 제한이 있다. 중첩된 소리들의 주파수는 사람의 목소리보다 높은 최대 20 kHz까지 넓은 주파수 범위로 구성된다. 본 논문에서는 광역 사운드 스펙트로그램과 DNN에 기반한 케라스 시?셜 모델 기법을 활용하여 인지 주파수 범위를 넓게 확대하는 새로운 인식방법을 제안한다. 광역 사운드 스펙트로그램이 본 논문에서 설계된 특징 추출 및 분류 시스템과 같이 넓은 주파수 범위의 다양한 소리를 분석하고 실험하도록 채택되었다. 소리 인식률을 개선하기 위하여, 케라스 시?셜 모델이 사운드 스펙트로그램에 의하여 생성되어 추출된 특징을 사용하여 패턴인식을 수행하기 위한 방법으로 채용되었다. 제안된 특징 추출 및 분류 시스템이 광역 사운드 스펙트로그램과 케라스 시?셜 모델을 채용하여 애완동물 소리와 실내 소리같은 다양한 주파수들로 구성되어 중첩된 음향 속에서 설정된 소리를 우수하게 분류하는 것을 확인하였다. 그리고 중첩된 소리의 크기에 비례하여 인식에 미치는 특성과 영향을 단계별로 비교 분석하였다.

차세대 디지털 TV 방송을 위한 오디오 규격 비교 분석 및 제언 (Audio Format Comparative Study and Suggestion for Next Generation DTV)

  • 이재홍
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.337-343
    • /
    • 2011
  • 3D 디지털 시험 방송 개시와 함께, 다가오는 UHDTV 시대에 대비 한 차세대 디지털 방송 방식에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 현행 사용 중이거나 연구되고 있는 주요 서라운드 오디오 규격을 비교 분석하고 차세대 디지털 방송용 오디오 규격을 제시한다. 현재 주목받고 있는 손실 및 비손실 압축 방식을 채용한 디지털 서라운드 오디오 규격인 Dolby True HD와 DTS HD MA (Master Audio) 규격과 함께 일본 NHK 연구소가 제안한 UHDTV용 22.2 채널 서라운드 규격에 대해 비교 검토한다. 이를 기초로 하여 우리나라의 주택 사정을 감안한 3D 서라운드 7.1 손실 압축 오디오 규격과 하이파이 오디오와의 호환성을 중시하는 2.0, 4.0 비손실 압축규격을 차세대 디지털 방송용 규격으로 제시한다. 이와 함께 개인별 HRTF (Head Related Transfer Function) 생성을 통하여 홀로그래픽 사운드에 근접하는 3차원 입체 음장 제공을 해줄 수 있는 바이노럴 (binaural) 헤드폰용 2 채널 오디오 데이터를 부음성 규격으로 별도로 전송 방안도 함께 제시한다. 각 전송 규격 별 소요 비트 레이트 율도 함께 산출하여 제시하였다.