• 제목/요약/키워드: 오디오 효과

검색결과 177건 처리시간 0.027초

음향학적 자질을 활용한 비디오 스피치 요약의 자동 추출과 표현에 관한 연구 (Investigating an Automatic Method for Summarizing and Presenting a Video Speech Using Acoustic Features)

  • 김현희
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.191-208
    • /
    • 2012
  • 스피치 요약을 생성하는데 있어서 두 가지 중요한 측면은 스피치에서 핵심 내용을 추출하는 것과 추출한 내용을 효과적으로 표현하는 것이다. 본 연구는 강의 자료의 스피치 요약의 자동 생성을 위해서 스피치 자막이 없는 경우에도 적용할 수 있는 스피치의 음향학적 자질 즉, 스피치의 속도, 피치(소리의 높낮이) 및 강도(소리의 세기)의 세 가지 요인을 이용하여 스피치 요약을 생성할 수 있는지 분석하고, 이 중 가장 효율적으로 이용할 수 있는 요인이 무엇인지 조사하였다. 조사 결과, 강도(최대값 dB과 최소값 dB간의 차이)가 가장 효율적인 요인으로 확인되었다. 이러한 강도를 이용한 방식의 효율성과 특성을 조사하기 위해서 이 방식과 본문 키워드 방식간의 차이를 요약문의 품질 측면에서 분석하고, 이 두 방식에 의해서 각 세그먼트(문장)에 할당된 가중치간의 관계를 분석해 보았다. 그런 다음 추출된 스피치의 핵심 세그먼트를 오디오 또는 텍스트 형태로 표현했을 때 어떤 특성이 있는지 이용자 관점에서 분석해 봄으로써 음향학적 특성을 이용한 스피치 요약을 효율적으로 추출하여 표현하는 방안을 제안하였다.

청각 장애인용 홈 모니터링 시스템을 위한 다채널 다중 스케일 신경망 기반의 사운드 이벤트 검출 (Sound event detection based on multi-channel multi-scale neural networks for home monitoring system used by the hard-of-hearing)

  • 이기용;김형국
    • 한국음향학회지
    • /
    • 제39권6호
    • /
    • pp.600-605
    • /
    • 2020
  • 본 논문에서는 청각 장애인을 위한 소리 감지 홈 모니터링을 위해 다채널 다중 스케일 신경망을 사용한 사운드 이벤트 검출 방식을 제안한다. 제안하는 시스템에서는 홈 내의 여러 무선 마이크 센서들로부터 높은 신호 품질을 갖는 두 개의 채널을 선택하고, 그 신호들로부터 도착신호 지연시간, 피치 범위, 그리고 다중 스케일 합성 곱 신경망을 로그멜 스펙트로그램에 적용하여 추출한 특징들을 양방향 게이트 순환 신경망 기반의 분류기에 적용함으로써 사운드 이벤트 검출의 성능을 더욱 향상시킨다. 검출된 사운드 이벤트 결과는 선택된 채널의 센서 위치와 함께 텍스트로 변환되어 청각 장애인에게 제공된다. 실험결과는 제안한 시스템의 사운드 이벤트 검출 방식이 기존 방식보다 우수하며 청각 장애인에게 효과적으로 사운드 정보를 전달할 수 있음을 보인다.

선율의 음높이와 리듬 정보를 이용한 음악의 유사도 계산 알고리즘 (A Similarity Computation Algorithm Based on the Pitch and Rhythm of Music Melody)

  • 모종식;김소영;구경이;한창호;김유성
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3762-3774
    • /
    • 2000
  • 컴퓨터 하드웨어 및 멀티미디어 정보 처리 기술의 발달로 인하여 멀티미디어 정보 검색 시스템에 대한 요구가 증대되고 있다. 멀티미디어 정보 검색 시스템은 텍스트와 이미지 위주로 발전하였으나 비디오와 오디오 정보, 특히 음악 정보를 위한 멀티미디어 정보 검색 시스템에 대한 요구가 점차 증대되고 있다. 최근의 음악 정보 검색 시스템에서는 해당 음악 정보의 작곡가, 곡명 등과 같은 메타 정보만을 이용한 메타 정보 기반의 검색뿐만 아니라 음악의 내용을 기반으로 하는 내용 기반 검색까지도 가능하다. 음악의 내용 기반 검색에서는 메타 정보 기반 검색에서 흔히 볼 수 있는 문자열에 대한 패턴 매칭보다는 멀티미디어 데이타간의 유사도를 기반으로 검색한다. 본 논문에서는 음악을 일정한 선율에 따른 음들의 배합으로 정의하고, 선율을 구성하는 음의 높이와 음의 길이 정보를 복합적으로 이용하여 두 음악 정보간의 유사도를 계산하는 알고리즘을 제안한다. 또한, 본 논문에서는 제안된 유사도 계산 알고리즘의 검증을 위해 동요를 대상으로 실험을 하였다. 실험 결과에 따르면 제안된 유사도 계산 알고리즘이 기존에 제안된 내용기반 음악 정보 검색 시스템과 비교하여 음악의 선율 정보를 기준으로 음악들간의 유사도를 보다 정확하게 효과적으로 계산하였다.

  • PDF

컨텐츠 저작 응용을 위한 디지털 자산 관리자의 설계 및 구현 (Design and Implementation of a Digital Asset Manager for Contents Authoring Applications)

  • 김종수;방수호;정연돈;이재형;김민정;김명호;장덕호;박종승;오황석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권3호
    • /
    • pp.288-298
    • /
    • 2000
  • 디지털 자산이란 이미지, 오디오, 비디오 등과 같이 디지털화된 형태로 존재하는 멀티미디어 정보를 의미한다. 디지털 자산은 저장에 요구되는 방대한 저장 공간 및 자산의 내용 표현에 요구되는 다차원적 정보 특성과 같은 특징들로 인하여, 효율적인 관리를 위한 많은 노력이 필요하다. 본 논문에서는 디지털 자산을 효과적으로 관리하기 위한 디지털 자산 관리자를 구현하였다. 개발된 디지털 자산 관리자는 디지털 자산 중 가장 복잡도가 높은 비디오 자산을 주요 관리 대상으로 하며, 다양한 디지털 자산 관련 응용 환경 중 디지털 컨텐츠 저작을 주요 응용으로 가정한다. 디지털 자산 관리자는 비디오 자산에 대한 효과적인 접근을 위해 계층 구조 모델에 기반을 둔 자산 관리 기능을 제공하고, 저장 시스템과의 독립성을 최대한 보장하며, 빠른 내용 기반 유사성 검색 기능을 지원한다.

  • PDF

스위치형 커패시터를 이용한 새로운 형태의 3차 직렬 접속형 시그마-델타 변조기 (A Novel Third-Order Cascaded Sigma-Delta Modulator using Switched-Capacitor)

  • 류지열;노석호
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.197-204
    • /
    • 2010
  • 본 논문은 저 전압 및 저 왜곡 스위치형 커패시터 (switched-capacitor, SC)를 적용한 새로운 형태의 몸체효과 보상형 스위치 구조를 제안한다. 제안된 회로는 저 전압 SC회로를 위해서 rail-to-rail 스위칭을 허용하며, 기존의 부트스트랩 된 회로 (19dB)보다 더 우수한 총 고조파 왜곡을 가진다. 설계된 2-1 캐스케이드 시그마 델타 변조기는 통신 송수신 시스템내의 오디오 코덱을 위한 고해상도 아날로그-디지털변환을 수행한다. 1단 폴드형 캐스코드 연산증폭기 및 2-1 캐스케이드 시그마 델타 변조기는 0.25 마이크론 이중 폴리 3-금속 표준 CMOS 공정으로 제작되었으며, 2.7V에서 동작한다. 연산증폭기의 1% 정착시간은 16 pF의 부하 용량에 대해 560ns를 보였다. 제작된 시그마 델타 변조기에 대한 검사는 비트 스트림 검사 및 아날로그 분석기를 이용하여 수행 되었다. 다이크기는 $1.9{\times}1.5\;mm^2$였다.

3차원 비디오 전송을 위한 스테레오비디오 동기화 방법 (Stereo-video Synchronization for 3D Video Transmission)

  • 이동진;이선오;심동규;이혁준
    • 한국통신학회논문지
    • /
    • 제34권4B호
    • /
    • pp.349-359
    • /
    • 2009
  • 본 논문에서는 3차원 효과의 최대화를 위한 스테레오 비디오 전송 방법을 제안한다. 기존의 다중스트림 동기화 기술은 단일 비디오와 오디오간의 지연을 최소화 하는 것으로, 둘 이상의 비디오가 동시에 필요한 3차원 비디오스트림 동기화에는 적합하지 않다. 본 논문에서는 인간에게 자연스럽고, 입체적으로 느껴지는 3차원 영상을 만들어 낼 수 있는 시간 차이의 허용 범위를 고려하여 다중 영상을 합성하는 기준을 제시하였고, 이를 위한 비디오 스트림 간의 동기화 방법을 제안하였다. 본 연구에서는 주관적 화질 평가를 통하여 스테레오 비디오를 3차원으로 느낄 수 있는 시간 차이의 허용범위를 측정하였다. 스테레오 비디오의 동기화를 위해, 전송된 각 비디오 스트림들의 취득 시간을 구하고, 시간 차이 허용 범위 안에 포함된 비디오 스트립을 이용하여 3차원 영상으로 합성한 뒤, 디스플레이 장치를 통해 재생한다. 제안한 기술의 성능을 평가하기 위해 실시간 다중 비디오 통신 시스템을 구현하였고, 주관적 화질 평가를 통해 제안한 동기화 제어 기술의 성능을 평가하였다. MOS (Mean Opinion Score) 측정 결과, 제안하는 기술을 통하여 3차원 디스플레이 장치에 재생한 영상은 DMOS (Differential Mean Opinion Score) 실험 스케일 중 매우 좋음과 좋음 범위에 속하는 것을 확인하였다.

전자상거래에서 시간압박감이 소비자 행동에 미치는 영향연구 (CONSUMER BEHAVIOR UNDER TIME-PRESSURE AT ELECTRONIC COMMERCE)

  • 박치관
    • 정보기술응용연구
    • /
    • 제3권4호
    • /
    • pp.43-62
    • /
    • 2001
  • 본 연구는 시간압박감을 느끼는 소비자들이 인터넷을 통한 전자상거래에 대한 인식의 정도와 실제 구매행동에 어떤 영향을 미치는지를 조사하였는데 분석의 결과는 다음과 같은 시사점을 우리에게 준다. 첫째, 인터넷 전자상거래에서는 적절한 제품의 선택이 중요하고, 제품의 기술에 있어서는 가능한 단순하면서도 소비자들이 전체적인 품질의 특성을 파악하기 용이하도록 표준화된 방법으로 기술되어야한다. 둘째, 소비자들의 탐색시간을 고려하여 웹사이트를 지나치게 복잡하게 하여 소비자들로 하여금 검색에 시간이 많이 소요된다고 느끼게 하는 것은 곤란하며, 시간이 부족한 소비자들을 고려하여 보다 탐색이 용이한 수단들을 동원하여야 할 것이다. 셋째, 제품은 단순한 특성기술에서 벗어나 간단한 조작방법과 같은 것들을 오디오 기술이나 동영상 등의 기술을 동원하여 소비자들이 쉽게 사용할 수 있도록 노력하여야 할 것이다. 넷째, 확실한 반환정책을 수립하여 운영하는 것이 필요하다. 반환정책에 대한 소비자들의 인식도는 구매시에 품질에 대한 긍정적인 관점을 가지게 할 뿐만 아니라 구매 후의 사후관리에 대한 시간압박감도 상당히 해소하는 효과가 있다. 다섯째, 전자상거래의 주문-배달시스템의 정립이 매우 중요하다. 효율적인 주문-배달시스템은 주문에서부터 배달까지의 과정에서 소요되는 시간을 상당히 절약해줄 수 있기 때문이다.

  • PDF

디지털 케이블 방송 환경에서 개인 미디어를 위한 스트리밍 프로토콜 연구 (A Research on streaming protocol for User-Created Contents in Digital Cable Broadcasting environment)

  • 김성원;김정환;시장현;정문열
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.239-244
    • /
    • 2006
  • 최근 인터넷에서 많은 관심을 보이고 있는 개인 미디어(UCC;User Created, Contents, VC2;Viewer Created Contents, 이하 UCC-사용자가 직접 제작한 미디어 콘텐츠를 불특정 다수에게 제공하는 서비스) 중에 비디오/오디오 콘텐츠를 영상 콘텐츠의 기본적인 매체라 할 수 있는 TV상에서 직접 즐길 수 있다면 미디어의 대상과 그 미디어의 Entertainment적인 효과는 배가될 것이다. 디지털 케이블 방송에서 UCC와 같은 다양하고 많은 미디어 콘텐츠를 디지털 TV상에서 서비스를 하고자 한다면 현재의 OCAP(OpenCable Application Plat form)기반에서는 RVOD(Real Video on Demand)와 동일한 서비스 모델을 가져야 하는 부담과 UCC 제공을 위한 방송 플랫폼별 인터페이스가 필요할 것이다. 이러한 문제점을 Return Path를 통한 RTP(Real-time Transport Protocol;RFC1889)을 이용해서 기존의 VoD(Video on Demand)스트림의 대역에서 분리하고 별도의 VOD프로토콜을 구현함으로써 라이브 방송환경과 동일한 인프라의 지속적인 확장보다는 일반적인 네트워크 프로토콜을 이용하여 VoD서비스를 위한 인프라에 많은 영향을 받지 않는 서비스가 가능할 수 있을 것이다. 따라서 본 논문에서는 RTP를 위한 Set-Top-Box상의 다운로드 가능한 구조의 클래스 분석과 클라이언트 대응의 UCC Transcoding 및 전송을 위한 스트리밍 서버의 설계에 중점을 두고 경량화 된 VOD서비스 및 시스템을 설계함으로써 방송환경 하에 On-Demand서비스의 효율적인 확장성과 보다 많은 콘텐츠 등록 및 활용의 기회를 가져올 수 있을 것으로 기대한다.

  • PDF

사상체질(四象體質)과 비만(肥滿)의 상관성에 관한 임상적 연구

  • 김달래;백태현
    • 사상체질의학회지
    • /
    • 제8권1호
    • /
    • pp.319-335
    • /
    • 1996
  • 연구 목적 : 복지부 발표 '1993년도 대한민국 국민들의 영양상태'보고서를 보면 1인당 섭취열량은 1969보다 257Kcal가 줄어든 것으로 나타났다. 그런데도 불구하고 일부의 사람들은 과도한 열량을 섭취하고 있기 때문에 비만인 사람이 점점 늘어나고 있다. 그렇다보니 신문이나 잡지에서는 거의 매일 살빼는 약이나 신종 다이어트방법에 대한 광고와 기사를 앞다투어 내보내고 있는 실정이다. 비만증은 근래에 발병률이 현저히 증가하면서 중풍, 당뇨병, 고혈압, 암, 간경화증, 당석증 등의 만성질환의 이환율을 증가시키고, 관절에 큰 부담을 주어 골관절염을 보다 빠르게 진전시키며, 사람들의 수명을 단축시키는 등 심각한 건강상의 문제를 일으키고 있다. 또한 비만증은 용모의 손상을 일으켜 정신적인 스트레스의 주요 인자로 등장하고 있기도 하다. 비만인이 증가하는 원인으로는 서구화된 음식습관으로 동물성 지방질과 단백질의 섭취증가, TV 자동차 세탁기 오디오 리모콘 등 생활이기의 사용으로 인한 운동부족, 체질과 질병 등이 재기되고 있다. 이제까지 비만을 치료하기 위한 많은 시도가 있었으나 주된 이론은 섭취음식의 절재와 운동량을 증가시키는 것이었으며, 체질적인 요소를 중심으로 비만증을 해결하려는 시도는 없었다. 이에 저자는 1992년 8월 20일부터 1995년 8월 19일까지 만 3년동안 상지대학교 부속한방병원 체질의학과에서 치료받는 461명의 환자를 대상으로 사상체질과 비만과의 상관성을 임상적으로 연구하고 그 효과를 보고하는 바이다. 연구 결론 : 상지대학교 부속한방병원에 내원치료를 받고 있는 비만증환자들을 대상으로하여 체질과 비만과의 관계를 연구한 결과는 다음과 같다. 1. 비만증 환자의 70.2%가 태음인이었다. 2. 치료결과 4주동안에는 $1.48{\pm}1.64kg$, 5주부터 8주동안에는 $2.05{\pm}2.10kg$, 9주부터 12주동안에는 $2.18{\pm}2.27kg$, 13주부터 16주동안에는 $2.08{\pm}2.88kg$이 감량되었다. 3. 체중감량에 있어 태음인이 가장 많은 감소를 보였다. 연령별로는 10대에서 가장 많은 감소를 보였다. 4. 비만환자의 혈액 가운데 총 콜레스테롤, 저밀도 지방단백이 높온 사람보다 유리지방산과 중성지방이 높은 경우가 대부분을 차지했다. 5. 비만인의 혈청지질에서는 FFA, TG가 높았다. 그 이유는 육식보다는 당질과 지방질의 섭취로 나타난 것이었다.

  • PDF

다중 피어 결합을 이용한 P2P 멀티미디어 스트리밍 프로토콜 (A P2P Multimedia Streaming Protocol Using Multiple-Peer Binding)

  • 정의현
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.253-261
    • /
    • 2006
  • P2P 기술의 각광에도 불구하고 P2P상에서 멀티미디어 스트리밍에 대한 연구는 상대적으로 주목을 받지 못하고 있다. 이것은 피어간의 낮은 대역폭과 신뢰도가 낮은 접속 등의 몇 가지 이유 때문에 P2P 멀티미디어 스트리밍이 어렵기 때문이다. 본 논문에서는 이 문제를 해결하기 위하여 여러 피어와의 연결을 한 개의 가상적인 채널로 제공하는 프로토콜인 다중피어 바인딩 프로토콜(WPBP: Multi-Peer Binding Protocol)을 제안한다. 이 프로토콜은 응용들이 여러 피어로부터 동시에 데이터를 다운로드 받아서 성능 개선과 안정된 스트리밍을 할 수 있게 해준다. 이를 위해서 MPBP는 미디어 파일을 작은 청크로 분리하고, 각 청크를 구분하고 전송할 수 있는 기법을 제공한다. 구현된 MPBP 엔진은 데이터 송신 서버로부터의 갑작스런 접속 단절을 효과적으로 다루는 것에 중점을 두어 개발되었으며, 실험 결과는 MPBP 프로토콜이 이를 효율적으로 다루는 것을 보여주었다. 또한 MPBP는 여러 미디어 타입에 대해서 지원이 가능하도록 설계되었으며, 이를 검증하기 위하여 본 논문에서는 비디오와 오디오 응용을 MPBP 엔진을 이용하여 개발하였다.

  • PDF