• 제목/요약/키워드: audio content

검색결과 240건 처리시간 0.02초

A public key audio watermarking using patchwork algorithm

  • Hong, Doo-Gun;Park, Se-Hyoung;Jaeho Shin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.160-163
    • /
    • 2002
  • This paper presents a statistical technique for audio watermarking. We describe the application of the promising public key watermarking method to the patchwork algorithm. Its detection process does not need the original content nor the secret key used in the embedding process. Special attention is given to statistical method working in the frequency domain. We will present a solution of robust watermarking of audio data. In this scheme, an extension of patchwork audio watermarking is presented which enables public detection of the watermark. Experimental results show good robustness of the approach against MP3 compression and other common signal processing manipulations.

  • PDF

영상 콘텐츠의 오디오 분석을 통한 메타데이터 자동 생성 방법 (Method of Automatically Generating Metadata through Audio Analysis of Video Content)

  • 용성중;박효경;유연휘;문일영
    • 한국항행학회논문지
    • /
    • 제25권6호
    • /
    • pp.557-561
    • /
    • 2021
  • 영상 콘텐츠를 사용자에게 추천하기 위해서는 메타데이터가 필수적인 요소로 자리 잡고 있다. 하지만 이러한 메타데이터는 영상 콘텐츠 제공자에 의해 수동적으로 생성되고 있다. 본 논문에서는 기존 수동으로 직접 메타데이터를 입력하는 방식에서 자동으로 메타데이터를 생성하는 방법을 연구하였다. 기존 연구에서 감정 태그를 추출하는 방법에 추가로 영화 오디오를 통한 장르와 제작국가에 대한 메타데이터 자동 생성 방법에 대해 연구를 진행하였다. 전이학습 모델인 ResNet34 인공 신경망 모델을 이용하여 오디오의 스펙트로그램으로부터 장르를 추출하고, 영화 속 화자의 음성을 음성인식을 통해 언어를 감지하였다. 이를 통해 메타데이터를 생성 인공지능을 통해 자동 생성 가능성을 확인할 수 있었다.

심리음향 모델 II와 MDCT를 이용한 오디오 포렌식 마킹 (Audio Forensic Marking using Psychoacoustic Model II and MDCT)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.16-22
    • /
    • 2012
  • 본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.

SWAT의 시청각 매뉴얼을 통한 학습 효과 분석 (Analysis of learning effects using audio-visual manual of SWAT)

  • 이주영;김태호;류지철;강현우;금동혁;우원희;장춘화;최중대;임경재
    • 농업과학연구
    • /
    • 제38권4호
    • /
    • pp.731-737
    • /
    • 2011
  • In the modern society, GIS-based decision support system has been used in evaluating environmental issues and changes due to spatial and temporal analysis capabilities of the GIS. However without proper manual of these systems, its desired goals could not be achieved. In this study, audio-visual SWAT tutorial system was developed to evaluate its effectives in learning the SWAT model. Learning effects was analyzed after in-class demonstration and survey. The survey was conducted for $3^{rd}$ grade students with/without audio-visual materials using 30 questionnaires, composed of 3 items for trend of respondent, 5 items for effects of audio-visual materials, and 12 items for effects of with/without manual in learning the model. For group without audio-visual manual, 2.98 out of 5 was obtained and 4.05 out of 5 was obtained for group with audio-visual manual, indicating higher content delivery with audio-visual learning effects. As shown in this study, the audio-visual learning material should be developed and used in various computer-based modeling system.

만성 목-어깨 통증이 있는 여성 성인에게 시청각 매체를 활용한 탄력밴드 저항운동이 통증, 고유수용성 감각과 운동기능에 미치는 영향 (Effects of Elastic Band-Resistive Exercise using Audio-visual Medium on Pain, Proprioceptive Sense, and Motor Function in Adult Females with Chronic Neck and Shoulder Pain)

  • 이남기;이정우
    • 대한물리치료과학회지
    • /
    • 제31권1호
    • /
    • pp.33-45
    • /
    • 2024
  • Background: This study aimed to investigate the effect of elastic band-resistive exercise using audio-visual medium on pain, proprioception, and motor function in adults with chronic neck and shoulder pain. Design: One group pretest-posttest follow-up experimental design. Method: Twenty adult women with neck and shoulder pain voluntarily participated in this study. Elastic band-resistive exercise using audio-visual medium including cervical flexion and extension, shoulder external rotation, and scapular retraction-protraction motions was conducted 5 times a week for 3 weeks. The Numerical Rating Scale, pressure threshold tool, CROM goniometer, and Image J software were used to assess subjective pain level, tenderness threshold (pain), joint position sense error (proprioception), joint range of motion, and postural alignment (motor function), respectively. Result:: The pain intensity and threshold and joint position sense error showed significant decreases after the intervention, whereas the joint range of motion angle revealed significant increases. The postural alignment including forward head posture and rounded shoulder revealed significant improvements after the intervention. Conclusions: Therefore, we suggest that elastic band-resistive exercise through audio-visual medium would be helpful in preventing and managing pain and physical dysfunction in individuals with chronic neck and shoulder pain, and then it would support the development of health management-related online education content.

2차원 바코드를 이용한 오디오 워터마킹 알고리즘 (A digital Audio Watermarking Algorithm using 2D Barcode)

  • 배경율
    • 지능정보연구
    • /
    • 제17권2호
    • /
    • pp.97-107
    • /
    • 2011
  • 본 논문에서는 2차원 바코드를 이용한 오디오 워터마킹 알고리즘을 제안하였다. 삽입되는 워터마크 정보로는 2차원 바코드인 QR 코드를 변형하여 이용하였다. 2차원 바코드가 1차원 바코드에 비하여 많은 정보를 표현할 수 있고, 코드자체가 에러 보정능력을 내재하고 있는 장점을 이용하여 워터마킹 알고리즘의 견고성을 높였다. 또한 부분적인 워터마크 정보의 손실에 대응하기 위하여 직교코드를 이용하여 삽입대역을 확산했으며, 삽입강도 0.7에서 50dB 이상의 우수한 품질을 확보할 수 있었다.

오디오 특징계수를 이용한 시계열 패턴 인덱스 화일의 뮤지션 검색 기법 (Musician Search in Time-Series Pattern Index Files using Features of Audio)

  • 김영인
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.69-74
    • /
    • 2006
  • 최근 멀티미디어 내용기반 검색 기술의 발달로 음악 정보 검색 기술 중 하나인 오디오 특징을 이용한 뮤지션 검색에 대한 관심이 증대되고 있다. 그러나 이와 관련한 음악 데이타베이스의 인덱싱 기법에 대한 연구는 부족한 실정이다. 본 논문에서는 시계열 패턴 인덱스 화일의 공간 분할 방법을 이용하여 오디오 특징 데이터를 사용한 뮤지션 검색 기법을 제시한다. 뮤지션 탐색을 위하여 오디오의 특징을 사용하며, 유사한 후보 뮤지션의 곡을 탐색하기 위한 인덱싱 기법으로 시계열 패턴 인덱스 화일을 사용한다. 실험 결과, 윤번 공간 분할 방법을 사용한 시계열 패턴 인덱스 화일이 뮤지션 검색에 있어서 효율적임을 보였다.

  • PDF

음성정보 내용분석을 통한 골프 동영상에서의 선수별 이벤트 구간 검색 (Retrieval of Player Event in Golf Videos Using Spoken Content Analysis)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.674-679
    • /
    • 2009
  • 본 논문은 골프 동영상에 포함된 오디오 정보로부터 검출된 이벤트 사운드 구간과 골프 선수이름이 포함된 음성구간을 결합하여 선수별 이벤트 구간을 검색하는 방식을 제안한다. 전체적인 시스템은 동영상으로부터 분할된 오디오 스트림으로부터 잡음제거, 오디오 구간분할, 음성 인식 등의 과정을 통한 자동색인 모듈과 사용자가 텍스트로 입력한 선수 이름을 발음열로 변환하고, 색인된 데이터베이스에서 질의된 선수 이름과 상응하는 음성구간과 연결되는 이벤트 구간을 찾아주는 검색 모듈로 구성된다. 선수이름 검색을 위해서 본 논문에서는 음소 기반, 단어 기반, 단어와 음소를 결합한 하이브리드 방식을 적용한 선수별 이벤트 구간 검색결과를 비교하였다.

Unleashing the Power of Digitization: National Mission for Manuscript's Analysis and Special Efforts in Enhancing Manuscript Usability and Preserving Cultural Heritage in Uttar Pradesh

  • Priyanka Jaiswal;Abhay Chaurasia;Ajay Pratap Singh
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제14권3호
    • /
    • pp. 7-18
    • /
    • 2024
  • The present study focuses on the activities and efforts of the National Mission for Manuscripts (NMM) in the Uttar Pradesh region, which is known for its vast area, population, and rich cultural heritage. The aim is to examine the digitization work carried out by the NMM in this area, as digitization plays a crucial role in preserving our country's rich ancient heritage. The importance of safeguarding cultural heritage is universally acknowledged, and digitization serves as a vital tool in this endeavour. Through digitization, we can protect and preserve our heritage for future generations. The government has implemented several commendable initiatives for manuscript digitization, and the NMM stands as a prominent organization dedicated to the conservation of cultural heritage. The NMM possesses a diverse range of cultural heritage resources, including photographic slides, photographs, digital images, photo-negatives, motion pictures, audio spools, microfiche, LP records, endangered manuscripts, audio and videotapes, digital images, microfilms, digital audio and video files, and more. The mission has undertaken extensive digitization efforts to conserve and provide access to a significant portion of its collection. This study is unique as it explores the digital conservation and digitization practices of a premier institute working in the field of art and cultural heritage in Uttar Pradesh. With its extensive network of institutions, the mission aims to cover all manuscripts, digitize them, and consolidate them on a common platform for easy access and utilization.

Automatic Generation of Video Metadata for the Super-personalized Recommendation of Media

  • Yong, Sung Jung;Park, Hyo Gyeong;You, Yeon Hwi;Moon, Il-Young
    • Journal of information and communication convergence engineering
    • /
    • 제20권4호
    • /
    • pp.288-294
    • /
    • 2022
  • The media content market has been growing, as various types of content are being mass-produced owing to the recent proliferation of the Internet and digital media. In addition, platforms that provide personalized services for content consumption are emerging and competing with each other to recommend personalized content. Existing platforms use a method in which a user directly inputs video metadata. Consequently, significant amounts of time and cost are consumed in processing large amounts of data. In this study, keyframes and audio spectra based on the YCbCr color model of a movie trailer were extracted for the automatic generation of metadata. The extracted audio spectra and image keyframes were used as learning data for genre recognition in deep learning. Deep learning was implemented to determine genres among the video metadata, and suggestions for utilization were proposed. A system that can automatically generate metadata established through the results of this study will be helpful for studying recommendation systems for media super-personalization.