• 제목/요약/키워드: 위상 마스킹

검색결과 3건 처리시간 0.019초

화소 간 분석을 이용하여 자화율 가중 영상(SWI)에 나타난 위상 마스킹의 효과 분석 (Voxel-based Investigations of Phase Mask Effects on Susceptibility Weighted Images)

  • 황어진;김민지;김혁기;류창우;장건호
    • 한국의학물리학회지:의학물리
    • /
    • 제24권1호
    • /
    • pp.25-34
    • /
    • 2013
  • 이 연구의 목적은 영상의 화소 간 분석(voxel-based analysis)을 이용하여 자화율 가중 영상(SWI)에 나타난 위상 마스킹의 효과를 알아보는 것이었다. 20명의 정상 노인에서 SWI 영상의 정보를 획득하기 위하여 3차원 경사자장 에코 시퀀스를 이용하여 영상을 얻었다. SWI 영상에서의 위상 마스킹의 효과를 관찰하기 위해 원래의 경사자장 크기(magnitude) 영상에 위상 영상을 2번 곱한 SWI2 영상, 4번 곱한 SWI4 영상, 영상 내 정맥 혈관을 강조한 양의 위상 마스크 SWI 영상 (PSWI), 그리고 조직 부분을 강조한 음의 위상 마스크 SWI 영상(NSWI)을 만들었다. paired t-test를 이용한 PSWI와 NSWI간 신호강도의 차이, SWI2와 SWI4간의 신호강도의 차이, 그리고 경사자장 크기영상 영상과 위상 마스킹에서 얻은 SWI 영상의 신호강도의 차이를 voxel-based 분석으로 수행하였다. 신호 강도 차이는 magnitude과 SWI4 영상 간의 차이가 magnitude과 SWI2 영상 간의 차이보다 더 크게 나왔다. 또한, 신호강도 차이는 magnitude과 PSWI 영상 간의 차이가 magnitude과 NSWI보다 더 많았다. 그리고 NSWI2와 NSWI4간의 신호강도 차이가 PSWI2와 PSWI4간의 신호강도 차이 보다 더 크게 나타났으며, 그리고 NSWI4와 PSWI4간의 신호강도 차이가 NSWI2와 PSWI2간의 신호강도 차이보다 더 크게 나타났다. 위 실험은 화소 간 분석을 통한 SWI 영상 연구가 뇌 전체의 자화율 효과를 볼 때 매우 유용할 것이라는 사실뿐만 아니라, 각기 다른 위상 마스킹 방법을 응용함으로써 선택적으로 정맥 혈관 대비, 혹은 뇌 조직 대비를 강조할 수 있다는 사실을 입증하였다. 그러므로, 자화율 가중 영상의 화소 간 분석은 많은 임상 예에 적용될 수 있을 것이다.

이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델 (Complex nested U-Net-based speech enhancement model using a dual-branch decoder)

  • 황서림;박성욱;박영철
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.253-259
    • /
    • 2024
  • 본 논문에서는 이중 분기 디코더를 갖는 복소 중첩 U-Net 기반의 새로운 음성 향상 모델을 제안하였다. 제안된 모델은 음성 신호의 크기와 위상 성분을 동시에 추정할 수 있도록 복소 중첩 U-Net으로 구성되며, 디코더는 스펙트럼 사상과 시간 주파수 마스킹을 각각의 분기에서 수행하는 이중 분기 디코더 구조를 갖는다. 이때, 이중 분기 디코더 구조는 단일 디코더 구조에 비하여, 음성 정보의 손실을 최소화하면서 잡음을 효과적으로 제거할 수 있도록 한다. 실험은 음성 향상 모델 학습을 위해 보편적으로 사용되는 VoiceBank + DEMAND 데이터베이스 상에서 이루어졌으며, 다양한 객관적 평가 지표를 통해 평가되었다. 실험 결과, 이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델은 기존의 베이스라인과 비교하여 Perceptual Evaluation of Speech Quality(PESQ) 점수가 0.13가량 증가하였으며, 최근 제안된 음성 향상 모델들보다도 높은 객관적 평가 점수를 보였다.

지각 특성 및 라우드니스를 이용한 입체음향의 성능 개선 (Enhancement of the 3D Sound's Performance using Perceptual Characteristics and Loudness)

  • 구교식;차형태
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.846-860
    • /
    • 2011
  • 인간의 청각기관은 소리의 방향과 거리인지에 있어서 양 귀에 들어오는 소리세기의 차이, 위상의 차이, 그리고 주파수 스펙트럼의 차이 등의 정보들을 복합적으로 이용한다. 이런 정보를 종합적으로 포함하고 있는 것을 머리전달함수라 하며, 이를 이용하여 실질적으로 존재하지 않는 음원을 근사적으로 생성할 수 있는 입체음향 시스템을 구현할 수 있다. 그러나 비개인화 된 머리전달함수는 음상정위 성능을 떨어뜨리는 주된 원인이 된다. 이에 본 논문에서는 이 머리전달함수를 이용한 3차원 음상정위를 위해 사람의 청각 특성을 이용한 알고리즘을 제안한다. 청자가 정확한 방향을 인지하기 위해 1차로 측정된 머리전달함수의 청각 자극 에너지를, 2차로 전역 마스킹 임계치와 라우드니스를 이용하여 방향감을 강조하였다. 제안된 알고리즘의 성능 평가를 위해 청감 테스트를 수행하였으며 실험결과 기존의 알고리즘에 비해 입체음향의 전체적인 인지도가 50% 이상 증가하였음을 확인할 수 있었다.