• 제목/요약/키워드: 지각 최적화

검색결과 22건 처리시간 0.028초

잡음 형상화에 의한 오디오 워터마크 설계 (Design of Audio Watermarks by Noise Shaping)

  • 이진걸
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1432-1438
    • /
    • 2005
  • 심리음향모델을 기반으로 주파수영역에서 잡음을 형상화하여 오디오 신호에 부가하였을 때 부가된 잡음이 지각되지 않는 방법을 제안하였다. 신호의 마스킹 문턱값으로부터 지각되지 않는 잡음의 준위를 구하는 것은 심리음향모델에서 확산함수와 관련된 디컨버루션을 수반하는데 난제(ill-conditioned Problem)로 알려져 있다. 본 논문에서는 최적화 기법을 적용하여 잡음의 여기준위를 신호의 마스킹 준위에 일치시킴으로써 신호에 부가된 잡음이 청각적으로 지각되지 않는 한도 내에서 최대한의 잡음준위가 되도록 형상화하는 방법을 제시하고 실험적으로 그 타당성을 증명하였다.

  • PDF

청취실험에 의한 에코확산 오디오 워터마킹방법의 최적화에 관한 검토 (A Study of Optimum Time-Spread Echo Audio Watermarking via Listening Test)

  • 고병섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.545-546
    • /
    • 2004
  • 서브밴드 분리에 의한 에코확산 오디오 워터마킹법은 호스트 신호를 특정 주파수 대역으로 분리하고, MPEG 심리음향 모델을 이용하여 각 대역별로 삽입되는 워터마크의 파워를 파라미터 설정 함수에 의하여 설정한다. 여기서, 본 방법의 강인성과 비지각성을 좌우하는 것은 파라미터 설정 함수가 된다. 따라서, 본 연구에서는 최대의 강인성과 최소의 음질 열화를 구현하기 위하여 청취실험을 실시하여 최적의 파라미터 설정 함수 설정방법에 대한 검토를 수행하였다.

  • PDF

다양한 손실 함수를 이용한 음성 향상 성능 비교 평가 (Performance comparison evaluation of speech enhancement using various loss functions)

  • 황서림;변준;박영철
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.176-182
    • /
    • 2021
  • 본 논문은 다양한 손실 함수에 따른 Deep Nerual Network(DNN) 기반 음성 향상 모델의 성능을 비교 평가한다. 베이스라인 모델로는 음성의 위상 정보를 고려할 수 있는 복소 네트워크를 사용하였다. 손실 함수는 두 가지 유형의 기본 손실 함수, Mean Squared Error(MSE)와 Scale-Invariant Source-to-Noise Ratio(SI-SNR)를 사용하였으며 두 가지 유형의 지각 기반 손실 함수 Perceptual Metric for Speech Quality Evaluation(PMSQE)과 Log Mel Spectra(LMS)를 사용한다. 성능은 각 손실 함수의 다양한 조합을 사용하여 얻은 출력을 객관적인 평가와 청취 테스트를 통해 측정하였다. 실험 결과, 지각기반 손실 함수를 MSE 또는 SI-SNR과 결합하였을 때 전반적으로 성능이 향상되며, 지각기반 손실함수를 사용하면 객관적 지표에서 약세를 보이는 경우라도 청취 테스트에서 우수한 성능을 보임을 확인하였다.

얼굴 특징점의 지각적 위계구조에 기초한 표정인식 신경망 모형 (A neural network model for recognizing facial expressions based on perceptual hierarchy of facial feature points)

  • 반세범;정찬섭
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.77-89
    • /
    • 2001
  • 얼굴 특징점의 지각적 위계구조를 반영한 표정인식 신경망 모형을 설계하였다. 입력자료는 MPEG-4 SNHC(Synthetic/Natural Hybrid Coding)의 얼굴 정의 파라미터(FDP) 중 39개 특징점 각각에 대해 150장의 표정연기 사진을 5개의 크기와 8개의 바위를 갖는 Gabor 필터로분석한 값이었다. 표정영상에 대한 감정상태 평정 값과 39개 특징점의 필터 반응 값을 중가 회귀분석한 결과, 감정상태의 쾌-불쾌 차원은 주로 입과 눈썹 주변의 특징점과 밀접한 과련이 있었고, 각성-수면차원은 주로 눈 주변의 특징점과 밀접한 관련이 있었다. 필터의 크기는 주로 저역 공간 주파수 필터와 감정상태가 관련이 있었고, 필터의 방위는 주로 비스듬한 사선방위와 감정상태가 관련이 있었다. 이를 기초로 표정인식 신경망을 최적화한 결과 원래 1560개(39x5x8) 입력요소를 400개(25x2x8)입력요소로 줄일 수 있었다. 표정인식 신경망의 최적화 결과를 사람의 감정상태 평정과 비교하여 볼 때, 쾌-불쾌 차원에서는 0.886의 상관관계가 있었고, 각성-수면 차원에서는 0.631의 상관관계가 있었다. 표정인식 신경망의 최적화 모형을 기쁨, 슬픔, 놀람, 공포, 분노, 혐오 등의 6가지 기본 정서 범주에 대응한 결과 74%의 인식률을 얻었다. 이러한 결과는 사람의 표정인식 원리를 이용하면 작은 양의 정보로도 최적화된 표정인식 시스템을 구현할수 있다는 점을 시시한다.

  • PDF

디지털 워터마크의 삽입용량 최적화를 위한 임계값 선택방법 (Threshold Selection Method for Capacity Optimization of the Digital Watermark Insertion)

  • 이강승;박기범
    • 융합신호처리학회논문지
    • /
    • 제10권1호
    • /
    • pp.49-59
    • /
    • 2009
  • 본 논문은 웨이블릿 영역에서 인간지각시스템 특성, 적응 스케일(Scale) 개수와 가중치 함수를 이용하고 실험적 임계값을 적용하여 디지털 워터마크의 삽입용량 최적화를 위한 디지털 워터마킹 알고리즘을 제안하였다. 실험적 임계값을 기초로 하여 웨이블릿 영역에서 중요 계수를 찾아 디지털 워터마크의 삽입용량 최적화를 위한 워터마크를 삽입하였다. 원본영상을 3-레벨(Level)로 웨이블릿 변환하여, 저주파에 해당하는 기저대역을 제외한 나머지 모든 부대역을 워터마크 정보를 삽입하였다. 디지털 워터마크의 삽입용량 최적화를 위하여 인간시각시스템 특성을 근거로 한 적응 스케일 계수와 가중치 함수는 고려되었으며, 이 적응 스케일 계수와 가중치 함수는 강인성과 비가시성의 향상을 도모하였다. 워터마크는 가우시안 랜덤 시퀀스로 구성되어 있고 워터마크의 검출은 상관도를 이용하여 워터마크의 삽입 여부를 판단한다. 본 논문에서 제안한 방법으로 모의 실험한 결과 비교적 우수한 화질에서 JPEG 손실 압축, 잡음 첨가, 잘라내기, 흐림, 예리화, 그리고 선형 및 비선형 필터링 등의 공격에 강인함을 알 수 있었다.

  • PDF

IoT제품의 내재적 속성이 브랜드 이미지와 고객 충성도에 미치는 영향 (The Effect of Intrinsic Attributes of IoT Product on Brand Image and Customer Loyalty)

  • 펑텐;진성
    • 디지털융복합연구
    • /
    • 제20권5호
    • /
    • pp.61-68
    • /
    • 2022
  • 본 연구는 소비자의 주관적 지각이 IoT제품의 품질에 대한 충성도에 미치는 영향을 검증하여 학문적 혁신 방안을 모색하여 산업현장에 최적화된 경영전략을 제시한다. 연구방법은 샤오미 IoT제품을 사용하거나 구매했던 중국 소비자들을 대상으로 온라인 설문 조사를 방법을 사용하였고, 실증분석을 위한 통계처리방법은 소프트웨어 SPSS 26.0을 사용하였다. 연구결과는 IoT제품의 내재적 속성(초연결성, 편리성)은 브랜드 이미지에 정(+) 영향을 보이고 있고, 브랜드 이미지는 고객 충성도에 정(+) 영향을 미친다. 브랜드 이미지는 IoT제품의 내재적 속성인 초연결성과 고객 충성도 관계에서 완전 매개효과를, IoT제품의 내재적 속성인 편리성과 고객 충성도 관계에서 부분 매개 효과를 보였다. IoT제품을 개발한 기업에게 지각된 브랜드 이미지 확보는 충성고객층을 확장하는 측면에서 매우 중요한 전략적 의미가 있다.

심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 최적화 (Optimization of Multi-time Scale Loss Function Suitable for DNN-based Audio Coder)

  • 신승민;변준;박영철;백승권;성종모
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1315-1317
    • /
    • 2022
  • 최근, 심층신경망 기반 오디오 부호화기가 활발히 연구되고 있다. 심층신경망 기반 오디오 부호화기는 기존의 전통적인 오디오 부호화기보다 구조적으로 간단하지만, 네트워크의 복잡도를 증가시키지 않고 인지적 성능향상을 기대하는 것은 어렵다. 이 문제를 해결하기 위하여 인간의 청각적 특성을 활용한 심리음향모델 기반 손실함수를 사용한 기법들이 소개되었다. 심리음향 모델 기반 손실함수를 사용한 오디오 부호화기는 양자화 잡음을 잘 제어하였지만, 여전히 지각적인 향상이 필요하다. 본 논문에서는 심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 지역 손실함수 윈도우 크기의 최적화 제안한다. Multi-time Scale 손실함수의 지역 손실함수 계산을 위한 윈도우 크기를 조절하며, 이를 통하여 오디오 부호화에 적합한 윈도우 사이즈를 결정한다. 실험을 통해 얻은 최적의 Multi-time Scale 손실함수를 사용하여 네트워크를 훈련하였고, 주관적 평가를 통해 기존의 심리음향모델 기반 손실함수보다 좋은 음성 품질을 보여주는 것을 확인하였다.

  • PDF

구면 스레피안 함수로 표현된 지각 자기이상값과 구배 성분 (Spherical Slepian Harmonic Expression of the Crustal Magnetic Vector and Its Gradient Components)

  • 김형래
    • 자원환경지질
    • /
    • 제49권4호
    • /
    • pp.269-280
    • /
    • 2016
  • 지역에 최적화된 스레피안 구면함수(spherical Slepian function)를 활용하여 남극을 중심으로 반경 $20^{\circ}$ 범위의 지역에 지각 자기이상의 3개의 방향 성분과 6개의 구배성분들을 표현하였다. 2013년 11월 유럽 항공 우주국이 발사한 3개의 자력 위성인 Swarm은 궤도 전개를 통해 동서 방향의 구배값은 물론 남북 및 수직방향의 구배값을 얻을 수 있도록 계획하였다. 이미 발사된 여러 중력위성들(i.e., GRACE and GOCE) 역시 이러한 구배값을 활용하여 보다 정확한 중력 이상값 및 지표에서의 시간에 따른 중력변화 연구등을 수행해 왔으나 자력 위성자료를 통해서는 많은 연구들이 이루어지고 있지 않는 상태이다. 한편 지역화 모델링은 관심 지역 또는 자료 분포의 제한인 지역인 경우에 활용될 수 있다. 또한 전지구 모델보다 효율적인 연산이 가능하여 위성자료로부터 고해상도의 지각 자기이상값을 표현할 수 있다는 장점을 지니고 있다. 또한 기존의 전지구 구면조화함수의 선형 결합으로 이루어진 기저함수들은 서로 직교성(orthogonality)이 유지되므로 스레피안 구면함수의 계수를 전지구 구면조화함수의 계수로 변환이 가능하여 스펙트럼 분석에 활용할 수 있다. 따라서 Swarm 위성자료의 구배 성분을 이용한 지역화 모델링 방법은 앞으로 많은 활용이 기대되며 여기서는 Swarm 위성자료로부터 얻어진 지각 자기이상값의 전지구 조화함수 계수 모델을 사용하여 자기이상의 방향성분과 구배성분을 유도하고 이를 스레피안 구면 조화함수에 적용하여 관심지역인 남극지역의 방향 성분과 구배 성분을 표현하고 이에 대한 결과를 토의 하고자 한다.

표색계를 이용한 액정 프로젝션 시스템의 색재현 (Color reproduction using color appearance model in LCD projection systems)

  • 김지홍
    • 한국광학회지
    • /
    • 제9권6호
    • /
    • pp.373-379
    • /
    • 1998
  • 3판식 액정 프로젝션 시스템의 색재현 개선을 위한 색분리/합성 광학계의 설계 방법으로서, 다양한 시청 조건하에서 인간의 색지각 특성을 고려하여 색순응과 표시색을 이용한 최적의 색재현 구현에 대해 기술한다. 이를 위해 3차원 균등 색공간에서 재현 색영역의 체적을 성능 지수로 선정하고 이를 최대화시키는 설계 방법을 제안한다. 또한, 3판식 액정 프로젝션 시스템의 색재현 원리와 표색계 모델에 대해 기술하고 최적화 문제를 색채학적으로 제시한 후, 적용 예로서 2종류의 시청 조건에 대해 Dichroic Mirror의 경계 파장의 최적 설계치를 구하였다.

  • PDF

스마트기기를 통한 동영상 시청 환경에서 기기 이용 태도에 영향을 미치는 요인 (Factors Affecting Attitude to Use Devices in Watching Video through Smart Devices)

  • 송재민;김동연
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.46-57
    • /
    • 2020
  • 스마트기기의 대중적인 보급은 사람들의 사회활동 전반에 많은 변화를 가져왔다. 특히, 사람들은 동영상 시청 등 여가 생활에 다양한 종류의 스마트기기를 활용하고 있지만, 이러한 기기 이용 태도에 영향을 미치는 외부 요인에 관한 연구는 부족한 상황이다. 따라서 본 연구에서는 기술수용모델에 기반하여 동영상 시청 환경 요인(예. 화면 크기 및 동영상 길이)과 개인적 성향 요인(예. 성별 및 엔터테인먼트 욕구)이 지각된 사용 용이성, 지각된 유용성, 이용 태도에 미치는 영향을 살펴보았다. 다른 스마트기기를 사용하는 660명의 이용자를 대상으로 분석한 결과, 스마트기기 화면이 커질수록 이용 태도가 긍정적으로 형성되었지만, 성별에 따라서는 그 차이점이 나타나지 않았다. 동영상의 길이 또한 이용 태도에 영향을 미치지 않았지만, 엔터테인먼트 욕구는 이용 태도에 긍정적으로 유의미한 영향을 미쳤다. 본 연구의 결과를 바탕으로 동영상 시청 환경 요인과 개인적 성향 요인을 고려하여 제품 개발과 영상 콘텐츠 제작을 통합한 최적화된 고객 마케팅 및 경영 전략에 활용할 수 있을 것으로 기대한다.