• Title/Summary/Keyword: sound based information

Search Result 637, Processing Time 0.028 seconds

영상의 효과음을 통한 분위기 메타데이터 추출 (Extractiong mood metadata through sound effects of video)

  • 유연휘;박효경;용성중;이서영;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.453-455
    • /
    • 2022
  • 메타데이터는 데이터에 대한 속성이나 특징을 설명하는 구조화된 데이터를 말한다. 그중에서 비디오 메타데이터는 정확한 콘텐츠 기반 검색을 위해 비디오를 구성하는 정보에서 추출한 데이터를 의미한다. 최근 영상 콘텐츠를 이용하는 사용자들이 늘어나면서 자연스럽게 OTT 제공 업체들 역시 늘어나고 있으며, OTT 제공 업체에서 많은 양의 영상 콘텐츠를 개인 사용자에게 추천 또는 알맞은 검색을 위해 메타데이터의 역할이 중요해지고 있다. 본 논문에서는 영상의 효과음을 통해 분위기 속성에 대한 메타데이터를 자동으로 추출하는 방법에 관해 연구를 진행하였다. 영상의 효과음에 대한 분류와 분위기 속성에 대한 메타데이터 생성을 위해 분위기에 대한 용어사전을 구축하고 지도학습을 통해 정보를 추출하는 방법을 제안하고자 한다.

  • PDF

가야금의 실시간 음 합성을 위한 멀티코어 프로세서 구현 (Multi-Core Processor for Real-Time Sound Synthesis of Gayageum)

  • 최지원;조상진;김철홍;김종면;정의필
    • 정보처리학회논문지A
    • /
    • 제18A권1호
    • /
    • pp.1-10
    • /
    • 2011
  • 물리적 모델링은 실제 악기음과 유사한 고음질의 음을 합성하는 방법으로 많은 연구가 진행되어 왔다. 그러나 물리적 모델링은 악기의 소리를 합성할 때 필요한 수많은 파라미터들을 동시에 계산해야 하기 때문에 동시 발음수가 높은 악기의 경우 실시간 처리에 문제가 발생할 수 있다. 이러한 문제를 해결하기 위해 본 논문에서는 전통 현악기인 가야금의 음 합성 알고리즘을 실시간으로 처리 가능한 단일 명령어 다중 데이터(Single Instruction Multiple Data, SIMD) 방식의 멀티코어 프로세서를 제안한다. 제안하는 SIMD기반 멀티코어 프로세서는 가야금의 12개현을 제어하기 위해 12개의 프로세싱 엘리먼트(Processing Element, PE)로 구성되어 있다. 각각의 프로세싱 엘리먼트는 해당되는 가야금 현을 모델링하며, 각 현의 여기신호와 파라미터를 음 합성 병렬 알고리즘의 입력으로 받아 동시에 12개 현의 합성된 음을 실시간으로 생성할 수 있다. 표본화 비율을 44.1kHz로 설정하고 16비트 양자화 데이터의 음을 합성한 모의실험 결과, 제안한 SIMD기반 멀티코어 프로세서를 이용한 합성음은 원음과 매우 유사하였으며, 상용 프로세서(TI TMS320C6416, ARM926EJ-S, ARM1020E)보다 실행 시간에서 5.6~11.4배, 에너지 효율에서 553~1,424배의 향상을 보였다.

지자기 센서를 이용한 양이 보청기의 방향성 이득 조절 연구 (Automatic Directional-gain Control for Binaural Hearing Aids using Geomagnetic Sensors)

  • 양혜진;안선영;정재현;최인용;우지환
    • 대한의용생체공학회:의공학회지
    • /
    • 제37권6호
    • /
    • pp.209-214
    • /
    • 2016
  • Binaural hearing aids with a voice transmitter have been widely used to enhance sound quality in noisy environment. However, this system has a limitation on sound-source localization. In this study, we investigated automatic directional-gain control method using geomagnetic sensors to provide directional information to binaural hearing aid user. The loudness gains of two hearing aids were differently controlled based on the directional information between a speaker position and a viewing direction of hearing aids user. This relative directional information was measured by two geomagnetic sensors on hearing aids user and a speaker. The results showed that the loudness gains were accurately controlled and could provide directional information based on the cue of interaural level differences.

로지스틱 회귀 모형을 이용한 무선인터넷 콘텐츠 서비스의 life cycle 분석 및 예측 (A Study on Life Cycle analysis and prediction of Contents Service in the Wireless Internet)

  • 박지홍;전준현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.1161-1164
    • /
    • 2005
  • In this paper, we proposed the technique to estimate the life cycle of Internet content services based on the logistic regression model. In this paper, to define parameters of Internet contents estimating life cycle by logistic regression model, we used market size, traffic amount, page view and session-visit number as the parameters of Internet contents estimating life cycle by logistic regression model. In this paper, to compare the performance of our proposed scheme, we estimated life cycle for the download services of bell sound & character contents in mobile network. As a result, using our proposed logistic regression, we were able to estimate exactly the life cycle of the download services of bell sound & character contents.

  • PDF

음성정보 내용분석을 통한 골프 동영상에서의 선수별 이벤트 구간 검색 (Retrieval of Player Event in Golf Videos Using Spoken Content Analysis)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.674-679
    • /
    • 2009
  • 본 논문은 골프 동영상에 포함된 오디오 정보로부터 검출된 이벤트 사운드 구간과 골프 선수이름이 포함된 음성구간을 결합하여 선수별 이벤트 구간을 검색하는 방식을 제안한다. 전체적인 시스템은 동영상으로부터 분할된 오디오 스트림으로부터 잡음제거, 오디오 구간분할, 음성 인식 등의 과정을 통한 자동색인 모듈과 사용자가 텍스트로 입력한 선수 이름을 발음열로 변환하고, 색인된 데이터베이스에서 질의된 선수 이름과 상응하는 음성구간과 연결되는 이벤트 구간을 찾아주는 검색 모듈로 구성된다. 선수이름 검색을 위해서 본 논문에서는 음소 기반, 단어 기반, 단어와 음소를 결합한 하이브리드 방식을 적용한 선수별 이벤트 구간 검색결과를 비교하였다.

A TDOA Sign-Based Algorithm for Fast Sound Source Localization using an L-Shaped Microphone Array

  • Yiwere, Mariam;Rhee, Eun Joo
    • Journal of Information Technology Applications and Management
    • /
    • 제23권3호
    • /
    • pp.87-97
    • /
    • 2016
  • This paper proposes a fast sound source localization method using a TDOA sign-based algorithm. We present an L-shaped microphone set-up which creates four major regions in the range of $0^{\circ}{\sim}360^{\circ}$ by the intersection of the positive and negative regions of the individual microphone pairs. Then, we make an initial source region prediction based on the signs of two TDOA estimates before computing the azimuth value. Also, we apply a threshold and angle comparison to tackle the existing front-back confusion problem. Our experimental results show that the proposed method is comparable in accuracy to previous three microphone array methods; however, it takes a shorter computation time because we compute only two TDOA values.

Polymer based adherent differentil output sensor를 이용한 전자 청진 시스템 설계 (An electronic auscultation system design using a polymer based adherent differential output sensor)

  • 한철규;고성택;최민주
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.185-188
    • /
    • 2000
  • Heart sound contains rich information regarding the dynamics of the heart and the auscultation has been a first choice of routine procedures for diagnosis of the heart. However, heart sounds captured using a conventional stethoscope are not often loud or clear enough for doctors to precisely classify their characteristics, especially, under the noisy environments of the hospital. A simple auscultation device that removed shortcomings of the conventional stethoscope was constructed in the study. The device employed a polymer based adherent differential output sensor which was on contact with skin through a coupling medium and appropriated electronic circuits for signal amplification and conditioning. An ordinary headphone is taken to hear the captured heart sounds and the volume can be adjusted to hear well. It is also possible that the device sends the captured heart sound signals to a PC where the signals are further processed and viualized.

  • PDF

5음기준 음파자극에 따른 5장관련 경락의 반응분석 (Response analysis of 5 vitals relation to meridian by Stimulus of sound wave based on 5 tones.)

  • 김용진;정동명;이봉구;손인철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(5)
    • /
    • pp.99-102
    • /
    • 2000
  • This study analyze of reflection wave to Acoustic stimulation on acupoints and contrast parts for objectification of the meridian substance. In order to verify meridian pathway and channel theory of bio-energy in body. It was analyzed response characteristic of reflection waves after acoustic stimulation by sound wave of 5 specific tones. The response characteristics of reflection are measured by the average current magnitude of meridian. The current variation ratio are Live Meridian(gung) 33.2%, Heart Meridian(sang) 30.7%, Kidney Meridian (gak) 33.1%, Spleen Meridian(chi) 33.9%, Lung Meridian (wo) 30.7% compare with contrast parts (non-acupoint and meridian). Therefore meridian is distinguished to non-meridian and 5 vital meridians have relationship with sound wave of 5 specific tones.

  • PDF

AR 모델을 이용한 심음의 진단적 특성에 관한 연구 (Research on diagnostic property of heart sound using AR model)

  • 김형석;백승화
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1998년도 하계학술대회 논문집 G
    • /
    • pp.2486-2488
    • /
    • 1998
  • In this paper, Prameters esimated t using AR model in order to approach linearly the heart sound which include the nonlinear characteristic from the characteristics based on a statistical theory. The parameters which is figured out using AR model is a very important information which show the characteristic heart sound In this paper parameters estimated using autocorrelation method and order selected by proposed Akaike[6] method. Compared the similirities of the spectrums between estimated by using AR model and estimated by using FFT method.

  • PDF

PDA기반 멀티미디어 학습시스템 설계 및 구현 (Design and Implementation of Multimedia Learning System based PDA)

  • 이순기;김창수;심규박
    • 수산해양교육연구
    • /
    • 제16권2호
    • /
    • pp.163-170
    • /
    • 2004
  • The rapid exchanges of mobile computing environment and development of wireless communication are providing many effects for learning activity of students. Recently, PDA system developers which are studying memory capacity, communication speed and size of screen support techniques to be capable of learning from students in the wireless or moving environment. In this viewpoints, this paper has a purpose to design multimedia learning system to be able to do with sound lecture contents. The implemented system largely consists of two parts which have the teacher module and students module. The one manages learning progress of students, class management, bulletin board and etc. The other is capable of using studying and bulletin functions. The main idea of this research is focus to upgrade the effect of learning without almost treating the existing studies, which can be listening sound lecture and also seeing text and image at the same time.