• 제목/요약/키워드: convolution transform

검색결과 149건 처리시간 0.022초

사용자의 음장선호도에 따른 오디오 콘텐츠 적응 기술 (Audio Contents Adaptation Technology According to User′s Preference on Sound Fields)

  • 강경옥;홍재근;서정일
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.437-445
    • /
    • 2004
  • 본 논문에서는 사용자의 음장 선호도를 이용하여 오디오 콘텐츠를 사용자가 원하는 음장으로 변환하는 기술에 대하여 설명한다. 오디오 신호가 재생되는 공간의 음장을 사용자가 원하는 음장으로 변환시켜주는 음장효과 기술은 실감있고 현장감있는 음악재생에 필수적인 요소이다. 그러나, 음장효과를 실시간으로 처리하기 위해서는 막대한 연산량이 필요하므로 MP3 플레이어와 같은 휴대용 오디오 단말에서는 구현하기 힘들다. 본 논문에서는 사용자로부터 전달된 음장 선호도를 이용하여 서버에서 음장효과를 처리하도록 하여, 단말의 성능에 구애받지 않고 음장효과를 제공할 수 있는 기술을 제안한다. 사용자가 선호하는 음장을 표현하기 위하여 선호하는 음장을 실내응답신호의 URI 주소를 이용하여 표현하는 방법 뿐만 아니라 음향공간에 대한 심리적 파라미터를 이용할 수 있게 하였다. 또한, 실내응답신호와 복적분 연산을 통한 음장효과 처리 방법을 실시간 응용에 적용하기 위하여 고속 복적분 알고리즘을 제안하였으며, 실험을 통하여 실시간 응용에도 적용이 가능함을 확인하였다. 본 논문에서 제안한 음장 선호도 서술구조의 효용성을 검증하기 위하여, 일반인을 대상으로 음장을 구분하는 능력과 음장효과가 처리된 음악에 대한 선호도에 대한 주관듣기평가를 실시하여 제안된 음장 선호도가 일반인들에게 적용이 가능함을 확인하였다.

APPLICATION OF CONVOLUTION THEORY ON NON-LINEAR INTEGRAL OPERATORS

  • Devi, Satwanti;Swaminathan, A.
    • Korean Journal of Mathematics
    • /
    • 제24권3호
    • /
    • pp.409-445
    • /
    • 2016
  • The class $\mathcal{W}^{\delta}_{\beta}({\alpha},{\gamma})$ defined in the domain ${\mid}z{\mid}$ < 1 satisfying $Re\;e^{i{\phi}}\((1-{\alpha}+2{\gamma})(f/z)^{\delta}+\({\alpha}-3{\gamma}+{\gamma}\[1-1/{\delta})(zf^{\prime}/f)+1/{\delta}\(1+zf^{\prime\prime}/f^{\prime}\)\]\)(f/z)^{\delta}(zf^{\prime}/f)-{\beta}\)$ > 0, with the conditions ${\alpha}{\geq}0$, ${\beta}$ < 1, ${\gamma}{\geq}0$, ${\delta}$ > 0 and ${\phi}{\in}{\mathbb{R}}$ generalizes a particular case of the largest subclass of univalent functions, namely the class of $Bazilevi{\check{c}}$ functions. Moreover, for 0 < ${\delta}{\leq}{\frac{1}{(1-{\zeta})}}$, $0{\leq}{\zeta}$ < 1, the class $C_{\delta}({\zeta})$ be the subclass of normalized analytic functions such that $Re(1/{\delta}(1+zf^{\prime\prime}/f^{\prime})+1-1/{\delta})(zf^{\prime}/f))$ > ${\zeta}$, ${\mid}z{\mid}$<1. In the present work, the sucient conditions on ${\lambda}(t)$ are investigated, so that the non-linear integral transform $V^{\delta}_{\lambda}(f)(z)=\({\large{\int}_{0}^{1}}{\lambda}(t)(f(tz)/t)^{\delta}dt\)^{1/{\delta}}$, ${\mid}z{\mid}$ < 1, carries the fuctions from $\mathcal{W}^{\delta}_{\beta}({\alpha},{\gamma})$ into $C_{\delta}({\zeta})$. Several interesting applications are provided for special choices of ${\lambda}(t)$. These results are useful in the attempt to generalize the two most important extremal problems in this direction using duality techniques and provide scope for further research.

Distributed Arithmetic을 사용한 OFDM용 저전력 Radix-4 FFT 구조 (Low-power Radix-4 FFT Structure for OFDM using Distributed Arithmetic)

  • 장영범;이원상;김도한;김비철;허은성
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.101-108
    • /
    • 2006
  • 이 논문에서는 64-Point FFT Radix-4 알고리즘을 DA(Distributed Arithmetic)연산을 이용하여 효율적으로 나비연산 구조를 설계할 수 있음을 보였다. 기존의 convolution 연산에 사용되어 왔던 DA연산이 FFT 나비연산의 트위들 계산에도 효과적으로 사용될 수 있음을 보였다. 제안된 DA 나비연산 구조를 Verilog HDL 코딩으로 구현한 결과, 기존의 승산기를 사용한 나비연산 구조와 비교하여 $61.02\%$의 cell area 감소 효과를 보였다. 또한 제안된 나비연산 구조를 파이프라인 구조에 적용하여 지연변환기와 함께 사용한 전체 64-point Radix-4 FFT 구조의 Verilog-HDL 코딩을 기존의 승산기를 사용한 구조의 코딩과 비교한 결과, $46.1\%$의 cell area 감소효과를 볼 수 있었다. 따라서 제안된 FFT 구조는 DMB용 OFDM 모뎀과 같은 큰 크기의 FFT에 효율적으로 사용될 수 있는 구조가 될 것이다.

이미지 라벨링을 이용한 적층제조 단면의 결함 분류 (Defect Classification of Cross-section of Additive Manufacturing Using Image-Labeling)

  • 이정성;최병주;이문구;김정섭;이상원;전용호
    • 한국기계가공학회지
    • /
    • 제19권7호
    • /
    • pp.7-15
    • /
    • 2020
  • Recently, the fourth industrial revolution has been presented as a new paradigm and additive manufacturing (AM) has become one of the most important topics. For this reason, process monitoring for each cross-sectional layer of additive metal manufacturing is important. Particularly, deep learning can train a machine to analyze, optimize, and repair defects. In this paper, image classification is proposed by learning images of defects in the metal cross sections using the convolution neural network (CNN) image labeling algorithm. Defects were classified into three categories: crack, porosity, and hole. To overcome a lack-of-data problem, the amount of learning data was augmented using a data augmentation algorithm. This augmentation algorithm can transform an image to 180 images, increasing the learning accuracy. The number of training and validation images was 25,920 (80 %) and 6,480 (20 %), respectively. An optimized case with a combination of fully connected layers, an optimizer, and a loss function, showed that the model accuracy was 99.7 % and had a success rate of 97.8 % for 180 test images. In conclusion, image labeling was successfully performed and it is expected to be applied to automated AM process inspection and repair systems in the future.

영상변형:얼굴 스케치와 사진간의 증명가능한 영상변형 네트워크 (Image Translation: Verifiable Image Transformation Networks for Face Sketch-Photo and Photo-Sketch)

  • 숭타이리엥;이효종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.451-454
    • /
    • 2019
  • In this paper, we propose a verifiable image transformation networks to transform face sketch to photo and vice versa. Face sketch-photo is very popular in computer vision applications. It has been used in some specific official departments such as law enforcement and digital entertainment. There are several existing face sketch-photo synthesizing methods that use feed-forward convolution neural networks; however, it is hard to assure whether the results of the methods are well mapped by depending only on loss values or accuracy results alone. In our approach, we use two Resnet encoder-decoder networks as image transformation networks. One is for sketch-photo and another is for photo-sketch. They depend on each other to verify their output results during training. For example, using photo-sketch transformation networks to verify the photo result of sketch-photo by inputting the result to the photo-sketch transformation networks and find loss between the reversed transformed result with ground-truth sketch. Likely, we can verify the sketch result as well in a reverse way. Our networks contain two loss functions such as sketch-photo loss and photo-sketch loss for the basic transformation stages and the other two-loss functions such as sketch-photo verification loss and photo-sketch verification loss for the verification stages. Our experiment results on CUFS dataset achieve reasonable results compared with the state-of-the-art approaches.

딥러닝 기반의 대퇴골 영역 분할을 위한 훈련 데이터 증강 연구 (Data Augmentation Method for Deep Learning based Medical Image Segmentation Model)

  • 최규진;신주연;경주현;경민호;이윤진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권3호
    • /
    • pp.123-131
    • /
    • 2019
  • 본 연구에서는 CT 영상의 대퇴골 부위를 해부학적으로 의미 있게 변형하여 CT 영상의 대퇴골 영역을 분할하기 위한 컨벌루션 신경망(CNN)의 훈련 데이터를 증강하는 방법을 제안한다. 먼저 CT 영상으로부터 삼차원 삼각형 대퇴골 메쉬를 얻는다. 그 후 메쉬의 국소부위에 대한 기하학적 특성을 계산하고, 군집화하여 메쉬를 의미 있는 부분들로 분할한다. 마지막으로, 분할한 부분들을 적절한 알고리즘으로 변형한 뒤, 이를 바탕으로 CT 영상을 와핑하여 새로운 CT영상을 생성하였다. 본 연구의 데이터 증강 방법을 이용하여 학습시킨 딥러닝 모델은 기하학적 변환이나 색상 변환 같이 일반적으로 사용되는 데이터 증강법과 비교하여 더 나은 영상분할 성능을 보인다.

콘볼루션 신경회로망을 이용한 능동펄스 식별 알고리즘 (Active pulse classification algorithm using convolutional neural networks)

  • 김근환;최승률;윤경식;이균경;이동화
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.106-113
    • /
    • 2019
  • 본 논문은 능동소나 시스템이 비협동으로 운용될 경우 수신된 직접파로 부터 이를 탐지하여 식별하는 일련의 알고리즘을 제안하였다. 제안하는 알고리즘은 최근 다양한 분야에서 우수한 성능을 보여주고 있는 콘볼루션 신경회로망을 사용하였으며, 입력 데이터로 수신신호를 단시간 퓨리에 변환을 수행한 시간 주파수 분석 데이터를 사용하였다. 본 논문에서 사용한 콘볼루션 신경회로망의 구조는 두 개의 콘볼루션 계층과 풀링 계층을 사용하였으며, 출력층에 따라 데이터베이스 기반의 신경회로망과 펄스 특징인자 기반의 신경회로망을 설계하였다. 알고리즘의 성능을 검증하기 위해 실제 해상에서 수신한 3110개의 CW(Continuous Wave)펄스와 LFM(Linear Frequency Modulated) 펄스의 데이터를 가공하여 학습 데이터와 테스트 데이터를 구성하였다. 시뮬레이션을 수행한 결과 데이터베이스 기반의 신경회로망은 99.9 %의 정확도를 보였으며, 특징인자 기반의 신경회로망은 두 픽셀의 오차를 허용할 경우 약 96 %의 정확도를 보였다.

스펙트로그램 이미지를 이용한 CNN 기반 자동화 기계 고장 진단 기법 (CNN-based Automatic Machine Fault Diagnosis Method Using Spectrogram Images)

  • 강경원;이경민
    • 융합신호처리학회논문지
    • /
    • 제21권3호
    • /
    • pp.121-126
    • /
    • 2020
  • 소리 기반 기계 고장 진단은 기계의 음향 방출 신호에서 비정상적인 소리를 자동으로 감지하는 것이다. 수학적 모델을 사용하는 기존의 방법은 기계 시스템의 복잡성과 잡음과 같은 비선형 요인이 존재하기 때문에 기계 고장 진단이 어려웠다. 따라서 기계 고장 진단의 문제를 딥러닝 기반 이미지 분류 문제로 해결하고자 한다. 본 논문에서 스펙트로그램 이미지를 이용한 CNN 기반 자동화 기계 고장 진단 기법을 제안한다. 제안한 방법은 기계의 결함 시 발생하는 주파수상의 특징 벡터를 효과적으로 추출하기 위해 STFT를 사용하였으며, STFT에 의해 검출된 특징 벡터들은 스펙트로그램 이미지로 변환하여 CNN을 이용해 기계의 상태별로 분류한다. 그 결과는 제안한 방법은 효과적으로 결함을 탐지할 뿐만 아니라 소리 기반의 다양한 자동 진단 시스템에도 효과적으로 활용될 수 있다.

임펄스 라디오 시스템에서 RF 대역 통과 필터의 군지연 영향 분석 (Impact of Group Delay in RF BPF on Impulse Radio Systems)

  • 명성식;권봉수;김영환;육종관
    • 한국전자파학회논문지
    • /
    • 제16권4호
    • /
    • pp.380-388
    • /
    • 2005
  • 본 논문은 초광대역 통신 방식(Ultra Wide Band, UWB)의 하나인 임펄스 라디오 시스템에서 RF(Radio Frequency)필터의 군지연 차에 의한 펄스 신호의 왜곡과 펄스 신호 왜곡으로 인한 시스템 성능의 열화에 대해 분석하였다. 임펄스 라디오는 시간 영역에서 매우 짧은 지속 시간을 갖는 펄스 신호를 변조하여 송신한 후 수신단에서 송신 펄스와 동일한 펄스를 발생하여 상호 상관(cross correlation)을 구해 신호를 판별하게 된다. 이로 인해 군지연 차이로 인한 펄스 파형의 왜곡은 심각한 시스템 성능 열화를 야기할 수 있다. 특히 RF 필터는 공진을 이용한 특성으로 인해, 필터의 차단 특성이 우수할수록 더 큰 군지연 차이를 야기하며, 본 논문에서는 이러한 RF필터의 군지연 차이가 시간 영역에서 펄스 파형의 왜곡에 미치는 영향 및 시스템 성능 열화에 미치는 영향을 분석하였다. 본 논문은 2 단자 회로의 입출력 단이 이상적으로 매칭되어 있을 경우 소신호 산란계수 $S_{21}$이 필터의 전달 함수 $H(\omega)$ 임을 이용하여 임의의 필터를 설계 후 그 $S_{21}$을 구하고, 역 푸리에 변환을 구하여 입력 펄스 파형과 컨벌루션 적분을 통해 출력 파형을 구하였다. 또한 BPM(Bi-Phase Modulation) 및 PPM(Pulse Position Modulation) 변조 임펄스 라디오 시스템의 BER(Bit Error Rate)을 분석하여 RF 필터의 군지연 차이로 인한 시스템 성능의 열화를 분석하였다.