• 제목/요약/키워드: Audio Analysis

검색결과 537건 처리시간 0.03초

국내 포털 이용자들의 멀티미디어 검색 행태 분석 (The Multimedia Searching Behavior of Korean Portal Users)

  • 박소연
    • 한국문헌정보학회지
    • /
    • 제44권1호
    • /
    • pp.101-115
    • /
    • 2010
  • 멀티미디어 검색은 전통적인 검색과 웹 검색을 차별화시키는 중요한 요소 중 하나이다. 본 연구에서는 국내 주요 검색 포털인 네이버 이용자들의 멀티미디어 검색 행태를 분석, 평가하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구 결과, 이용자가 입력하는 멀티미디어 질의 중 음악 질의가 차지하는 비중이 가장 높았으며, 이미지 질의와 동영상 질의의 비중은 비슷한 것으로 나타났다. 한편 멀티미디어 관련 컬렉션들 중 이용자가 가장 많이 조회하는 컬렉션은 동영상 컬렉션이었고, 이어서 이미지 컬렉션, 음악 컬렉션 순으로 나타났다. 이용자가 입력하는 멀티미디어 질의나 멀티미디어 컬렉션에서 클릭하는 문서 모두 엔터테인먼트와 관련된 주제가 가장 많았다. 본 연구의 결과는 향후 포털의 멀티미디어 컨텐츠 구축 및 검색 알고리즘 개발에 활용될 수 있을 것으로 기대된다.

전방 스피커 어레이 재생 방식 기반 음향 재현 성능 평가 (Subjective Listening Test based on Frontal Loudspeaker Array Reproduction System)

  • 유재현;장대영;이태진
    • 방송공학회논문지
    • /
    • 제20권5호
    • /
    • pp.667-675
    • /
    • 2015
  • 고화질, 고품질 방송에 대한 관심이 크게 증가하면서 영상 신호 뿐만 아니라 음향 신호의 고품질화를 요구하는 목소리도 높아지고 있다. 음향 신호의 고품질화에 기여하는 요소 중 하나는 가령, 10.2채널, 22.2채널 등과 같은 재생 채널 수의 확장이지만 이는 많은 수의 스피커를 설치해야만 하는 문제점이 발생한다. 이와 같은 문제를 해결하기 위한 한 가지 방법으로 전방 스피커 어레이를 통한 입체 음향 재생 방식을 들 수 있는데 본 논문에서는 스피커 어레이 기반 음장 재생 방식인 음장합성 기술 (Wave Field Synthesis, WFS)에 대한 소개 및 이론적인 분석을 하고 이 기술로 구현한 전방 스피커 어레이 시스템의 입체 음향 재현 성능을 확인하기 위한 주관 청취 평가 결과를 제시한다. 결론적으로, WFS에 기반한 전방 스피커 어레이 재생 방식이 디스크리트 5.1채널 재생 방식과 비교하여 만족스러운 음장감을 제공한다는 것을 알 수 있었다.

MP3Player의 변화에서 나타나는 재매개적 특성 I : 계보적 변화와 재매개성 (Remediation Characteristics that Appear in the Change of MP3Player I : Re-mediation and Genealogical Change)

  • 이진혁;이영천;구윤희
    • 한국콘텐츠학회논문지
    • /
    • 제13권11호
    • /
    • pp.59-68
    • /
    • 2013
  • iPod Touch는 초기의 음악 재생기능을 무색하게 할 만큼 다양한 응용소프트웨어가 제공되고, UI를 UX의 차원으로 한층 높임으로써 혁신적이라는 평을 받기도 하였다. 또한 인터넷을 통한 다양한 영상의 제공이 이루어 졌음에도 불구하고 일부에서는 여전히 MP3Player의 상품분류가 음향기기로 인식되고 있다. 어떻게 음향기기가 하루아침에 영상 장치가 되었는지, 그러기까지 어떠한 요인들이 작용했는지는 매체의 본질적 변화 외에도 사회적, 문화적, 그리고 기술적 변화의 요일들이 존재할 것이다. 이 연구는 MP3Player의 매체적 특성에 관한 연구이다. 즉 MP3Player의 계보적 변화를 4개의 지점으로 분류할 수 있었다. 그리고 분류에 따른 각 지점별 특성을 분석하였다. 그 결과 MP3Player의 계보적 변화에는 기술적 변화와 사회적 맥락성이 함께 관계하고 있음을 알 수 있었다. 하나의 장치가 변화하는 데에는 다양한 요소들이 존재하지만, MP3Player의 계보적 변화의 요인에는 사회적 요구와 맥락, 그리고 기술적 변화의 총체성을 보이고 있다고 하겠다.

멀티미디어 스트리밍 서비스에 대한 QPLUS의 연성 실시간 및 통신 성능 평가 (Soft Real-time Capabilities and Communication Performance Evaluation in Qplus for Multimedia Streaming Service)

  • 이광로;배병민;이인한;김민중
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.301-304
    • /
    • 2013
  • 본 논문에서는 Qplus의 빠른 부팅과 연성 실시간 기술의 응답성 개선 효과를 입증하기 위해 절대적인 평가보다 상대적인 평가를 통해 실제 사용되는 서비스가 원활히 수행되는 지를 평가한다. 연성 실시간, 빠른 부팅, 파일 시스템 기술이 적용된 Qplus와 이러한 기술이 적용되지 않은 임베디드 리눅스를 개발보드에 탑재한 후, 멀티미디어 스트리밍 서비스에 대한 연성 실시간 기능 및 통신 성능 평가를 위해 AV(Audio/Video) 그룹통신을 개발 보드에 포팅하여 부팅시간 측정 실험, 연성실시간 측정 실험을 위해 자체 성능 측정실험, 통신 성능 평가를 위해 네트워크경유 성능 측정실험 등으로 나누어 크게 3가지를 수행하여 Qplus의 실제적인 성능평가와 분석을 수행한다.

  • PDF

걸음걸이 인식을 통한 연령 및 성별 분류 방법 (Method for Classification of Age and Gender Using Gait Recognition)

  • 유현우;권기연
    • 대한기계학회논문집A
    • /
    • 제41권11호
    • /
    • pp.1035-1045
    • /
    • 2017
  • 얼굴 모양 및 목소리를 이용하는 방법을 포함하여 연령 및 성별을 분류하는 다양한 방법이 연구되고 있다. 그러나 얼굴 기반 방법은 원거리에서 인식률이 급격히 감소하고, 오디오 기반 방법은 잡음이 많은 환경에서는 적용하기 어렵다. 대조적으로 보행 기반 방법은 대상자가 카메라에 촬영만 되면 인식이 가능하다. 기존 연구에서 카메라의 시점은 측면에서만 볼 수 있어서 실제 환경에서 일반 보행과는 현실적으로 차이가 발생했다. 본 연구에서는 일반 보행 데이터를 이용하여 연령과 성별을 분류할 수 있도록 RGB-D 센서로부터 획득된 골격 모델을 이용한 특징 추출 방법을 제안한다. 실험 결과는 제안된 방법이 실제 환경에서 효율적임을 보여준다.

프로세서 구조에 따른 DCT 알고리즘의 구현 성능 비교 (Performance Comparison of DCT Algorithm Implementations Based on Hardware Architecture)

  • 이재성;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제31권6C호
    • /
    • pp.637-644
    • /
    • 2006
  • 본 논문에서는 MPEG 오디오 부호화 과정 중 서브밴드 필터뱅크를 구현하기 위해 사용되는 DCT(Discrete Cosine Transform) 과정에 대해 구현 시스템의 구조에 따른 DCT 알고리즘의 구현 결과와 성능 차이를 분석한다. 고속 DCT 알고리즘은 코사인 계수의 내적을 통해 구하는 직접 구현 방법보다 연산량이 현저하게 적은 것으로 알려져 있지만, 피연산자의 어드레스가 불규칙적이고 출력 데이터를 재정렬하는 과정이 필요하기 때문에 규칙성이 결여되며, 재정렬만을 위한 추가적인 연산이 필요한 경우도 있다. 따라서 DSP와 같이 반복적인 연산을 고속으로 수행하기 위해 최적화된 구조의 하드웨어에서는 알고리즘의 규칙성이 높은 직접 구현 방법에 비해 고속 알고리즘이 불리한 측면이 있으며, 더욱이 유효 자리수를 제한하는 경우, 직접 구현 방법에 비해 더 많은 프로세싱 단계를 거쳐야 하므로 누적 오차가 커진다. 본 논문에서는 알고리즘의 규칙성과 각 프로세서의 연산 방법간의 관계와 유효 자리수에 따른 누적 오차를 분석하고 프로세서의 구조에 따른 고속 알고리즘의 선택 기준을 제시하였다.

VR 영상의 회전각도에 따른 오디오 데이터 변화에 관한 연구 (A Study for Change of Audio Data according to Rotation Degree of VR Video)

  • 고은지;양지희;김영애;박구만;김성권
    • 한국전자통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1135-1142
    • /
    • 2017
  • 본 논문에서는 개인방송서비스에서 실감 음향을 구현할 수 있도록, 화면 변화에 따른 음향 데이터의 변화를 추적하여, 자동적으로 화면과 음향을 믹싱하도록 도와주는 알고리즘을 제안하고자 한다. 실험을 통하여 화면의 회전각도 변화에 따른 음원에서의 고주파 대역에서의 음압 변화를 확인하였고, 소리의 명료도와 관련되는 주파수 대역인 2kHz, 4kHz, 8kHz에서의 음압 변화를 회귀분석을 통하여 각각 -1.17 dB/degree, -2.0 dB/degree, -2.44 dB/degree로 음압의 감쇄 변화 추세를 파악하였다. 이 실험결과는 음압열화를 보완하여 실감음향을 향상시키는 믹싱 알고리즘에 사용되어, 실감 개인방송 서비스 보급에 유용할 것으로 기대된다.

디지털 오디오 주관적 음향레벨 계측기 구현을 위한 ITU-R BS. 1387-1의 알고리즘 특성 분석 (Performance analysis of subjective Loudness meter with ITU-R BS. 1387-1 algorithm for digital audio)

  • 뉴엔 보 바오 느안;박성균;노승환;한찬규
    • 전기전자학회논문지
    • /
    • 제16권4호
    • /
    • pp.395-404
    • /
    • 2012
  • 본 논문에서는 객관적 오디오 품질 분석에 대한 권고안인 ITU-R BS.1387-1의 귀의 모델을 토대로 라우드니스를 객관적으로 측정할 수 있는 알고리즘을 구현하며, 그 성능을 23개의 순음과 9개의 샘플 디지털 사운드에 적용하여 평가하였다. 순음의 경우 ISO226:2003에서 제공하는 실험 데이터와 비교한 결과 5%이하의 오차를 보이며, 디지털 사운드 실험 결과도 Moore 모델의 측정결과와 비교할 때 4.7%이하의 편차와 0.96이상의 코릴레이션을 나타내어 좋은 성능을 보였다. 한편 구현 알고리즘에 적용한 청각필터 수에 따른 성능 변화를 분석하기 위해 21개의 별도의 샘플 디지털 사운드에 적용하였다. 그 결과를 분석하여 보면, 37개의 청각필터를 갖는 구현 알고리즘에 바이어스 보상값을 적용함으로써 109개 필터를 사용하는 경우에 대해 2%미만의 오차를 갖는 양호한 성능을 갖도록 할 수 있었다.

디지털 방송 서비스에서 트랜스포트 스트림 분석 및 파싱 능력 향상에 관한 연구 (A Study on Transport Stream Analysis and Parsing Ability Enhancement in Digital Broadcasting and Service)

  • 김장원
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.552-557
    • /
    • 2017
  • 유 무선 디지털 방송이 고화질 TV의 탄생과 함께 2010년 이후로 급격하게 확산되었으며, 단방향 콘텐츠 이용뿐만 아니라 양방향 콘텐츠 이용이 급격하게 증가되고 있다. 현재 우리나라 위성 통신망에서는 유럽 디지털 방송 표준화기구의 DVB를 국내 데이터 방송의 표준으로 채택하고 있으며, IPTV의 발전에 의해 선택적 콘텐츠의 이용방법도 또한 다양하게 연구되었다. 디지털 방송에서는 MPEG-2 system의 비디오, 오디오, 그리고 데이터 등의 멀티미디어 정보를 전송하기 위해 정보를 다중화 하는 방식으로 Transport Stream Packet(TSP)을 이용한 방식을 사용하는데, 이 Stream에는 비디오, 오디오 정보는 물론, TV 편성표와 프로그램에 대한 상세한 정보까지도 포함되어 있다. 본 연구에서는 이러한 데이터 방송 시스템을 이해하기 위하여 Linux 환경에서 Transport Stream(TS)을 Packet별로 구분하고 각각의 기능별로 분석, 출력해주는 TS Analyzer를 구현하였으며, TS의 이해를 돕고 Stream Parsing 능력향상을 이룰 수 있었다.

Comparison of McGurk Effect across Three Consonant-Vowel Combinations in Kannada

  • Devaraju, Dhatri S;U, Ajith Kumar;Maruthy, Santosh
    • Journal of Audiology & Otology
    • /
    • 제23권1호
    • /
    • pp.39-48
    • /
    • 2019
  • Background and Objectives: The influence of visual stimulus on the auditory component in the perception of auditory-visual (AV) consonant-vowel syllables has been demonstrated in different languages. Inherent properties of unimodal stimuli are known to modulate AV integration. The present study investigated how the amount of McGurk effect (an outcome of AV integration) varies across three different consonant combinations in Kannada language. The importance of unimodal syllable identification on the amount of McGurk effect was also seen. Subjects and Methods: Twenty-eight individuals performed an AV identification task with ba/ga, pa/ka and ma/ṇa consonant combinations in AV congruent, AV incongruent (McGurk combination), audio alone and visual alone condition. Cluster analysis was performed using the identification scores for the incongruent stimuli, to classify the individuals into two groups; one with high and the other with low McGurk scores. The differences in the audio alone and visual alone scores between these groups were compared. Results: The results showed significantly higher McGurk scores for ma/ṇa compared to ba/ga and pa/ka combinations in both high and low McGurk score groups. No significant difference was noted between ba/ga and pa/ka combinations in either group. Identification of /ṇa/ presented in the visual alone condition correlated negatively with the higher McGurk scores. Conclusions: The results suggest that the final percept following the AV integration is not exclusively explained by the unimodal identification of the syllables. But there are other factors which may also contribute to making inferences about the final percept.