• 제목/요약/키워드: sound based information

검색결과 637건 처리시간 0.025초

공감각인지기반 컬러이미지-음악요소 변환에 관한 기초연구 (A Basic Study on the Conversion of Color Image into Musical Elements based on a Synesthetic Perception)

  • 김성일
    • 감성과학
    • /
    • 제16권2호
    • /
    • pp.187-194
    • /
    • 2013
  • 본 연구는 컬러영상에서 특정소리를 연상시킬 수 있는 공감각 인지현상에 기반하여 컬러이미지에서 음악요소로 변환하는 시스템의 구현을 최종 목표로 한다. 이는 빛과 소리의 물리적 주파수정보사이의 유사도를 기반으로 이루어진다. 입력 컬러영상은 우선 컬러모델변환이론에 기초하여 색상(Hue), 채도(Saturation) 및 명도(Intensity)영역으로 변환된다. 음계, 옥타브, 크기 및 시간길이 등의 음악적 성분들이 HSI 컬러모델의 각 영역으로부터 추출된다. 기본주파수(F0, Fundamental Frequency)는 색상 및 명도 히스토그램에서 추출되고, 크기 및 시간길이성분은 명도와 채도 히스토그램에서 추출된다. 실험에서, 제안된 시스템은 표준 C 및 VC++ 기반에서 실현되었고, 최종적으로 WAV 포맷의 사운드파일이 생성되었다. 시뮬레이션 결과를 통해서 입력 컬러영상에서 추출된 음악적 요소들이 출력 사운드신호에 반영됨을 알 수 있었다.

  • PDF

Rule-Based Fuzzy-Neural Networks Using the Identification Algorithm of the GA Hybrid Scheme

  • Park, Ho-Sung;Oh, Sung-Kwun
    • International Journal of Control, Automation, and Systems
    • /
    • 제1권1호
    • /
    • pp.101-110
    • /
    • 2003
  • This paper introduces an identification method for nonlinear models in the form of rule-based Fuzzy-Neural Networks (FNN). In this study, the development of the rule-based fuzzy neural networks focuses on the technologies of Computational Intelligence (CI), namely fuzzy sets, neural networks, and genetic algorithms. The FNN modeling and identification environment realizes parameter identification through synergistic usage of clustering techniques, genetic optimization and a complex search method. We use a HCM (Hard C-Means) clustering algorithm to determine initial apexes of the membership functions of the information granules used in this fuzzy model. The parameters such as apexes of membership functions, learning rates, and momentum coefficients are then adjusted using the identification algorithm of a GA hybrid scheme. The proposed GA hybrid scheme effectively combines the GA with the improved com-plex method to guarantee both global optimization and local convergence. An aggregate objective function (performance index) with a weighting factor is introduced to achieve a sound balance between approximation and generalization of the model. According to the selection and adjustment of the weighting factor of this objective function, we reveal how to design a model having sound approximation and generalization abilities. The proposed model is experimented with using several time series data (gas furnace, sewage treatment process, and NOx emission process data from gas turbine power plants).

입체음향시스템을 위한 상호간접제거 기법의 유효청취범위 분석 (A Study on Sweet Spot of Crosstalk Cancellation Schemes for Sound Rendering Systems)

  • 이정혁;정상효;유승수;송익호;김선용
    • 한국통신학회논문지
    • /
    • 제36권5C호
    • /
    • pp.309-316
    • /
    • 2011
  • 본 논문에서는 입체음향시스템을 위한 대표적인 상호간섭제거 기법인 머리전달함수만 (head related transfer function, HRTF) 이용한 기법과 두 귀에 도달하는 소리의 시간차와 세기차를 (interaural time/intensity difference, ITD와 IID) HRTF와 함께 이용한 기법의 상태지수와 ITD/IID 수준을 보이고, 이로부터 두 기법의 유효청취범위를 보인다. 입체음향시스템의 유효청취범위는 청취자가 의도된 음향의 입체감을 왜곡 없이 느낄 수 있는 공간으로 등역 (equalization zone) 또는 sweet spot으로도 부른다.

Attack and Correction: How to Design a Secure and Efficient Mix Network

  • Peng, Kun
    • Journal of Information Processing Systems
    • /
    • 제8권1호
    • /
    • pp.175-190
    • /
    • 2012
  • Shuffling is an effective method to build a publicly verifiable mix network to implement verifiable anonymous channels that can be used for important cryptographic applications like electronic voting and electronic cash. One shuffling scheme by Groth is claimed to be secure and efficient. However, its soundness has not been formally proven. An attack against the soundness of this shuffling scheme is presented in this paper. Such an attack compromises the soundness of the mix network based on it. Two new shuffling protocols are designed on the basis of Groth's shuffling and batch verification techniques. The first new protocol is not completely sound, but is formally analyzed in regards to soundness, so it can be applied to build a mix network with formally proven soundness. The second new protocol is completely sound, so is more convenient to apply. Formal analysis in this paper guarantees that both new shuffling protocols can be employed to build mix networks with formally provable soundness. Both protocols prevent the attack against soundness in Groth's scheme. Both new shuffling protocols are very efficient as batch-verification-based efficiency-improving mechanisms have been adopted. The second protocol is even simpler and more elegant than the first one as it is based on a novel batch cryptographic technique.

눈동자 추적 기반 입력 및 딥러닝 기반 음성 합성을 적용한 루게릭 환자 의사소통 지원 시스템 (Communication Support System for ALS Patient Based on Text Input Interface Using Eye Tracking and Deep Learning Based Sound Synthesi)

  • 박현주;정승도
    • 디지털산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.27-36
    • /
    • 2024
  • Accidents or disease can lead to acquired voice dysphonia. In this case, we propose a new input interface based on eye movements to facilitate communication for patients. Unlike the existing method that presents the English alphabet as it is, we reorganized the layout of the alphabet to support the Korean alphabet and designed it so that patients can enter words by themselves using only eye movements, gaze, and blinking. The proposed interface not only reduces fatigue by minimizing eye movements, but also allows for easy and quick input through an intuitive arrangement. For natural communication, we also implemented a system that allows patients who are unable to speak to communicate with their own voice. The system works by tracking eye movements to record what the patient is trying to say, then using Glow-TTS and Multi-band MelGAN to reconstruct their own voice using the learned voice to output sound.

소리 주파수대역 기반 멀티미디어 콘텐츠의 감성 추출 (Emotion Extraction of Multimedia Contents based on Specific Sound Frequency Bands)

  • 권영훈;장재건
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.381-387
    • /
    • 2013
  • 최근 인간의 감성에 반응하고, 감성을 유도하는 감성콘텐츠가 문화산업 분야에서 크게 주목을 받으면서 멀티미디어 콘텐츠가 유발하는 감성 추출에 초점이 모아지고 있다. 게다가 최근 멀티미디어 콘텐츠가 빠르고 방대하게 생산, 유통되는 흐름으로 볼 때 콘텐츠에서 유발하는 감성을 자동으로 추출하는 기법의 연구들이 주목받고 있다. 본 논문은 멀티미디어 콘텐츠의 소리 정보 중 특정 주파수대역의 볼륨 값을 활용하여 멀티미디어 콘텐츠 내의 감성지수를 추출하는 방법에 대해 연구하고자 한다. 이러한 연구는 동영상 콘텐츠의 감성지수를 자동으로 추출할 수 있도록 하며 추출된 정보를 활용하여 사용자의 현재 감성, 혹은 날씨 등과 같은 기타 요소에 맞추어 사용자에게 맞춤형 콘텐츠를 제공하는데 사용되어질 것이다.

가상 음원 위치 정보를 이용한 능동 메트릭스 디코더 (A Perception Based Active Matrix Decoder with Virtual Source Location Information)

  • 문한길
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.18-24
    • /
    • 2010
  • 본 논문에서는 돌비 프로로직 II/IIx를 대체하기 위한 가상 음원 위치 정보 기반의 새로운 메트릭스 디코더 시스템을 제안하고자 한다. 제안하는 신규 메트릭스 디코더는 역행렬 계산을 통해 얻어지는 수동 메트릭스 디코딩부와 수동 메트릭스 디코딩을 통해서 얻은 신호들을 멀티채널 신호의 채널간 이미지 특성에 따라서 적응적으로 가변시키는 능동 메트릭스 디코딩부로 구성된다. 멀티채널 환경에서 채널 간에 형성되는 다수의 이미지는 실제 청각 시스템에 의해서 인지되어 만들어지는 가상의 사운드 이벤트와 연결이 되어 있다. 따라서 이 이미지의 위치와 크기에 기반하여 멀티채널 신호를 적응적으로 가변시키면, 인지적인 관점에서 우수한 성능의 메트릭스 디코더를 설계할 수 있다. 더불어 채널간 분리도를 향상시키기 위해서 비선형 삼각함수의 조합을 사용하였다.

뮤직프로덕션에서의 음향시스템 학습을 위한 웹 기반 문제중심학습 시스템 설계 (Design of Web Based PBL(Problem Based Learning)System for Sound System Learning in Music Production)

  • 이에스더
    • 정보교육학회논문지
    • /
    • 제7권3호
    • /
    • pp.373-387
    • /
    • 2003
  • 최근 뮤직프로덕션이라는 새로운 학문이 우리나라에 도입되어 대학현장에서 학생들에게 교육되기 시작했지만 교수 학습에서의 효율적인 방법들의 부족으로 교육이 제대로 이루어지기 힘든 실정이다. 뮤직프로덕션에서의 음향시스템에 관한 학습은 단순한 지식전달위주의 교육방법으로는 효과적인 교수 학습을 하기 어려운 점이 많다. 음향 기기의 발전이 급속히 일어남에 따라 학교에서 배우고 익힌 지식과 기술을 졸업 후 현장에 그대로 적용하는 것에는 한계가 있다. 따라서 학교에서의 교육은 지식이나 기술 전달 학습뿐만 아니라 학습자들이 현장에서 활동 할 때 실제로 주어지는 상황에 대한 문제를 해결할 수 있는 능력을 키우는 것이 더욱 중요하다. 따라서 본 연구는 대학의 뮤직프로덕션에서 효과적인 음향시스템 학습이 이루어지기 위해 문제중심학습을 도입한 웹기반 음향 학습 시스템을 설계하였다.

  • PDF

PC 기반의 Békésy 청력검사 시스템 개발 (Development of a Békésy Audiometry System based on PC)

  • 강덕훈;송복득;신범주;김진동;왕수건
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.77-84
    • /
    • 2011
  • B$\'{e}$k$\'{e}$sy 청력검사는 피검자의 청력 역치를 결정할 수있을 뿐만 아니라 누가현상을 추정 할 수 있고 난청의 병변위치를 규명하는데도 도움을 주는 청력검사 방법이다. 본 논문은 가격 경쟁력을 제공하기 위한 방법으로 PC 사운드카드를 사용하여 ANSI 표준을 준수하는 B$\'{e}$k$\'{e}$sy 청력검사 시스템의 개발에 대해 기술한다. 본 시스템은 동적으로 검사 신호를 생성하며, 실시간으로 검사 결과를 확인할 수 있는 인터페이스를 제공한다. 또한 표준에서 요구하는 최대 청력 레벨을 지원하기 위해 증폭기를 구현한다. 그리고 구현된 시스템이 ANSI 표준을 준수하는지 검증한다.

Directional Filter와 Harmonic Filter 기반 화자 분리 (Speaker Separation Based on Directional Filter and Harmonic Filter)

  • 백승은;김진영;나승유;최승호
    • 음성과학
    • /
    • 제12권3호
    • /
    • pp.125-136
    • /
    • 2005
  • Automatic speech recognition is much more difficult in real world. Speech recognition according to SIR (Signal to Interface Ratio) is difficult in situations in which noise of surrounding environment and multi-speaker exists. Therefore, study on main speaker's voice extractions a very important field in speech signal processing in binaural sound. In this paper, we used directional filter and harmonic filter among other existing methods to extract the main speaker's information in binaural sound. The main speaker's voice was extracted using directional filter, and other remaining speaker's information was removed using harmonic filter through main speaker's pitch detection. As a result, voice of the main speaker was enhanced.

  • PDF