• 제목/요약/키워드: Acoustical Similarity

검색결과 53건 처리시간 0.017초

다중레벨 벡터양자화 기반의 유사도를 이용한 자동 음악요약 (Automatic Music Summarization Using Similarity Measure Based on Multi-Level Vector Quantization)

  • 김성탁;김상호;김회린
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권2E호
    • /
    • pp.39-43
    • /
    • 2007
  • Music summarization refers to a technique which automatically extracts the most important and representative segments in music content. In this paper, we propose and evaluate a technique which provides the repeated part in music content as music summary. For extracting a repeated segment in music content, the proposed algorithm uses the weighted sum of similarity measures based on multi-level vector quantization for fixed-length summary or optimal-length summary. For similarity measures, count-based similarity measure and distance-based similarity measure are proposed. The number of the same codeword and the Mahalanobis distance of features which have same codeword at the same position in segments are used for count-based and distance-based similarity measure, respectively. Fixed-length music summary is evaluated by measuring the overlapping ratio between hand-made repeated parts and automatically generated ones. Optimal-length music summary is evaluated by calculating how much automatically generated music summary includes repeated parts of the music content. From experiments we observed that optimal-length summary could capture the repeated parts in music content more effectively in terms of summary length than fixed-length summary.

Style-Specific Language Model Adaptation using TF*IDF Similarity for Korean Conversational Speech Recognition

  • Park, Young-Hee;Chung, Min-Hwa
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권2E호
    • /
    • pp.51-55
    • /
    • 2004
  • In this paper, we propose a style-specific language model adaptation scheme using n-gram based tf*idf similarity for Korean spontaneous speech recognition. Korean spontaneous speech shows especially different style-specific characteristics such as filled pauses, word omission, and contraction, which are related to function words and depend on preceding or following words. To reflect these style-specific characteristics and overcome insufficient data for training language model, we estimate in-domain dependent n-gram model by relevance weighting of out-of-domain text data according to their n-. gram based tf*idf similarity, in which in-domain language model include disfluency model. Recognition results show that n-gram based tf*idf similarity weighting effectively reflects style difference.

인자분석과 다효원척를 이용한 스피이커의 음질평가 (The assessment of sound quality of loudspeaker system by using factor analysis and muliti-dimensional scaling)

  • 황영수;김영일;차일환
    • 한국음향학회지
    • /
    • 제3권1호
    • /
    • pp.16-24
    • /
    • 1984
  • The objective data and subjective data correlated in order to rate sound quality of loudspeaker system and these data were analyzed by the Factor Analysis and Multi-Dimensioinal Scaling. The dimensions yielded Factor Analysis were interpreted as "Contrast", "Metallic", "Rich", "Present" and their relation to physical variables were explored by studying the positions of loudspeaker systems in the respective dimension. When the subjective similarity degree of loudspeaker systems was compared with the objective similarity degree of loudspeaker systems by Multi-Dimensional Scaling, the similarity degree of sound pressure response in the listening room closely coincided with the subjective similarity degree regardless of sound source. This result implies the necessity of measurements taken not only in an anechoic room but also in a listening room in order to rate sound quality of loudspeaker systems.

  • PDF

커버곡 검색을 위한 코드 기반 크로마그램 유사도 (A code-based chromagram similarity for cover song identification)

  • 서진수
    • 한국음향학회지
    • /
    • 제38권3호
    • /
    • pp.314-319
    • /
    • 2019
  • 음악 커버곡 검색 시스템 구현에 있어서 크로마그램 간 유사도 계산은 필수적인 구성 요소이다. 본 논문은 크로마그램 비교에 소요되는 저장공간 및 계산량을 줄이기 위한 크로마그램 코딩 방법을 제안한다. 음악별로 코드북을 학습하여 크로마그램 수열을 코드 수열로 변환하여 저장 공간을 줄이게 된다. 얻어진 코드 간 거리를 룩업 테이블에 저장하여 크로마그램 비교의 속도를 개선하였다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여, 제안된 코드 기반 방법과 기존 방법 간의 커버곡 검색 정확도, 저장 공간, 계산량을 비교하였다.

커버곡 검색 정확도 향상을 위한 적합도 기반 크로마그램 쌍별 유사도 (A relevance-based pairwise chromagram similarity for improving cover song retrieval accuracy)

  • 서진수
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.200-206
    • /
    • 2024
  • 음악 유사도 계산은 음악 검색 서비스 구현에서 중요한 구성 요소 중 하나이다. 본 논문은 커버곡 검색 성능을 제고하기 위해서, 크로마그램 벡터 별로 커버곡 검색 적합도를 구하여 음악 유사도 계산 시 가중치로 활용한다. 커버곡 검색 적합도는 확률 적합도 모델을 이용하여 구한다. 커버곡 검색에 도움이 될 수 있는 분별도가 높은 벡터에 높은 가중치를 부여하고, 흔하게 존재하여 분별도가 떨어지는 벡터에 낮은 가중치를 부여하는 방식으로 음악 유사도 함수를 유도한다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여 제안한 음악 유사도 함수가 커버곡 검색 성능을 개선시킬 수 있음을 보였다.

청각 기억 게임을 위한 리듬 유사도 측정 기술 (Measurement of Rhythmic Similarity for Auditory Memory Game)

  • 김주완;이세원;박호종
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.136-141
    • /
    • 2011
  • 본 논문에서는 청각 기억 게임을 위하여 두 개의 소리 파형을 비교하여 파형의 리듬 유사도를 정량적으로 측정하는 기술을 제안한다. 제안한 방법은 두 입력 파형에 대하여 에너지 변화, 에너지 피크의 지속 시간, 음색 등을 분석하여 각 파형에 포함된 비트 위치를 검출하고, 두 파형의 템포 차이와 비트 수의 차이를 보상하는 과정을 통하여 두 파형의 리듬 벡터를 각각 정의한다. 다음, 두 리듬 벡터 사이의 차이와 비트 수의 차이를 적용하여 두 입력 파형의 리듬 유사도를 정량적으로 표현하는 식을 정의한다. 제안한 방법으로 측정한 리듬 유사도와 주관적 청취 평가로 측정한 리듬 유사도를 비교하였으며, 두 방법에 의한 리듬 유사도가 상관도 0.86을 가지는 것을 확인하였다.

Automatic Music Summarization Using Vector Quantization and Segment Similarity

  • Kim, Sang-Ho;Kim, Sung-Tak;Kim, Hoi-Rin
    • The Journal of the Acoustical Society of Korea
    • /
    • 제27권2E호
    • /
    • pp.51-56
    • /
    • 2008
  • In this paper, we propose an effective method for music summarization which automatically extracts a representative part of the music by using signal processing technology. Proposed method uses a vector quantization technique to extract several segments which can be regarded as the most important contents in the music. In general, there is a repetitive pattern in music, and human usually recognizes the most important or catchy tune from the repetitive pattern. Thus the repetition which is extracted using segment similarity is considered to express a music summary. The segments extracted are again combined to generate a complete music summary. Experiments show the proposed method captures the main theme of the music more effectively than conventional methods. The experimental results also show that the proposed method could be used for real-time application since the processing time in generating music summary is much faster than other methods.

기하상사법을 이용한 대형 소음기의 성능평가에 관한 해석적 연구 (Analytical Study on Performance Evaluation of Large-Sized Silencer using Geometric Similarity Law)

  • 양준혁;이부윤;김원진
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제34권2호
    • /
    • pp.275-281
    • /
    • 2010
  • 선박용 엔진 또는 플랜트 시스템에 사용되는 대형 소음기의 개발단계에서 비용절감 및 개발기간의 단축을 위하여 축소모형으로 대체 실험이 가능하도록 기하상사법을 제안하고자 한다. 대형 소음기를 구성하고 있는 공명형과 단순 확장관형 소음기의 원형과 축소 모형에 대한 이론식으로부터 기하상사 변수를 규명하였다. 그리고 음향해석을 통하여 조합형과 배플형의 축소 모형에 기하상사법을 적용하여 원형모형의 성능을 예측하고, 이를 원형모형의 실제 성능과 비교하는 방법으로 기하상사 변수를 검증하였다.

소형 송풍기 소음의 음향학적 상사성에 관한 연구 (Acoustical Similarity for Small Cooling Fans Revisited)

  • 김용철;진성훈;이승배
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 1995년도 춘계학술대회논문집; 전남대학교, 19 May 1995
    • /
    • pp.196-201
    • /
    • 1995
  • The broadband and discrete sources of sound in small cooling fans of propeller type and centrifugal type were investigated to understand the turbulent vortex structures from many bladed fans using ANSI test plenum for small air-moving devices (AMDs). The noise measurement method uses the plenum as a test apparatus to determine the acoustic source spectral density function at each operating conditions similar to real engineering applications based on acoustic similarity laws. The characteristics of fans including the head rise vs. volumetric flow rate performance were measured using a performance test facility. The sound power spectrum is decomposed into two non-dimensional functions: an acoustic source spectral distribution function F(St,.phi.) and an acoustic system response function G(He,.phi.) where St, He, and .phi. are the Strouhal number, the Helmholtz number, and the volumetric flow rate coefficient, respectively. The autospectra of radiated noise measurements for the fan operating at several volumetric flow rates,.phi., are analyzed using acoustical similarity. The rotating stall in the small propeller fan with a bell-mouth guided is mainly due to a leading edge separation. It creates a blockage in the passage and the reduction in the flow rate. The sound power levels with respect to the rotational speeds were measured to reveal the mechanisms of stall and/or surge for different loading conditions and geometries, for example, fans installed with a impinging plate. Lee and Meecham (1993) studied the effect of the large-scale motions like impinging normally on a flat plate using Large-Eddy Simulation(LES) and Lighthill's analogy.[ASME Winter Annual Meeting 1993, 93-WA/NCA-22]. The dipole and quadrupole sources in the fans tested are shown closely related to the vortex structures involved using cross-correlations of the hot-wire and microphone signals.

  • PDF

커버곡 검색을 위한 확률적 선형 판별 분석 기반 음악 유사도 (A music similarity function based on probabilistic linear discriminant analysis for cover song identification)

  • 서진수;김정현;김혜미
    • 한국음향학회지
    • /
    • 제41권6호
    • /
    • pp.662-667
    • /
    • 2022
  • 음악 유사도 계산은 음악 검색 서비스 구현에서 가장 중요한 요소 중 하나이다. 본 논문은 커버곡 검색의 성능을 제고하기 위한 음악 유사도 학습에 대해서 다룬다. 음악 유사도 함수를 유도하는 데 확률적 선형 판별 분석을 이용하여 잠재 음악 공간을 구한다. 잠재 음악 공간은 같은 커버곡 간의 거리는 줄이고 다른 곡 간의 거리는 크게 되도록 학습한다. 추출된 음악 특징이 잠재 음악 변수에서 생성되었다는 가정 하에 확률 모델을 구하고, 음악의 동질성 여부를 가설검증하여 음악 유사도 함수를 유도한다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여 제안한 음악 유사도 함수가 커버곡 검색 성능을 개선시킬 수 있음을 보였다.