통합 검색 | Korea Science

딥러닝 기반 이산웨이블릿변환 네트워크 (Discrete Wavelet Transform Network based on Deep Learning)

이주원;박찬승;윤영재;김동욱
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.347-350
- /
- 2020
본 논문에서는 영상 변환 기술인 이산웨이블릿변환(Discrete Wavelet Transform, DWT)를 딥러닝 기반의 네트워크로 구현한다. 딥러닝 기술 중에도 CNN 기반으로 네트워크를 설계하였으며, 본 DWT 네트워크는 해상도에 의존적이지 않은 계층들로만 구성된다. 데이터세트를 구성할 때 파이썬의 라이브러리를 사용하여 레이블 데이터세트를 구성한다. 128×128크기의 gray-scale 영상을 입력으로 사용하고 이에 대응하는 레이블 데이터세트를 구성하여 1-level DWT를 수행하는 네트워크의 학습을 진행한다. 역방향 변환도 네트워크 설계 후 데이터세트를 구성하여 학습을 진행한다. 학습이 완료된 1-level DWT 네트워크를 반복적으로 사용하여 Multi-level DWT 네트워크를 구성한다. 또한 양자화에 의한 간단한 영상압축 실험을 진행하여 DWT 네트워크의 성능과 압축 등의 응용분야에 활용할 수 있음을 보인다. 설계한 DWT 네트워크의 1-level 순방향 변환 성능은 42.18dB의 PSNR을 보였고, 1-level 역방향 변환 성능은 50.13dB의 PSNR을 보였다.
PDF

DCT 맵과 이진 트리 구조 벡터 양자화기를 이용한 영상 부호화 (Image Coding Using DCT Map and Binary Tree-structured Vector Quantizer)

조성환;김응성
- 한국정보처리학회논문지
- /
- 제1권1호
- /
- pp.81-91
- /
- 1994
벡터 양자화기를 이용하여 영상의 부호화기를 설계하는데 있어서 2차원 이산여현 변환(2D-Discrete Cosine Transform)에 근거한 DCT 맵(map)과 새로운 부호책(codebook) 설계로서 알고리듬을 제안한다. 영상을 작은 부블럭으로 나누고 2차원 이산여현변환 으로 대부분의 정보를 포함하는 부분, 즉 부호화하기 어려운 부분과 부호화하기 쉬운 적은 정보를 포함하는 영역으로 나누어 맵을 만들고 이 맵에 따라 영상의 중요한 특징 들을 2차원 이산여현변환으로 추출한다. 부호책은 트리 구조에 근거한 2진 트리로 두 영역을 따로 학습세트로 나눔으로서 만들어 진다. 2진 트리의 중간 노드에서 각 학 습 벡터는 그 노드에서의 문턱 값과 비교하여 두개의 아래 노드중 하나에 속하게 된다. 국제 표준화상인 Lenna와 Boat 영상에 대하여 본 알고리듬으로 영상을 부호화했을 때 PNN과 CVQ 알고리듬에 비하여 수행 시간을 줄이고, PNN 알고리듬보다는 각각 약0.45 dB과 0.33 dB만큼, CVQ 알고리듬보다 각각 약 0.05 dB과 0.1 dB만큼 더 좋은 영상의 화질을 얻을 수 있었다.
PDF

구매빈도별 피자전문점 선택에 미치는 속성의 영향 평가 (Estimating Effects of Attributes on Choice of Pizza Restaurants by Purchase Frequency)

강종헌;정인숙
- 한국생활과학회지
- /
- 제15권3호
- /
- pp.491-499
- /
- 2006
The purpose of this study is to measure the pizza purchasing behavioral characteristics of respondents and importances of factors affecting pizza purchase, to estimate the effects of attributes on choice of pizza restaurant, and to predict probability of selecting a particular pizza restaurant. The questionnaire consisted of two parts: The paired experimental profiles, purchasing behavior and importances of factors affecting pizza purchase. This study generated profiles of 16 hypothetical pizza restaurants based on seven attributes. The profiles comprised 16 discrete sets of variables, each of which had two levels. For this study, researcher randomly selected 150 university students as respondents. Twenty one students did not complete the survey instrument, resulting in a final sample size of 129. All estimations were carried out using frequencies, $X^2$, independent samples t-test, phreg procedure of SAS package. The results were as followed: Some purchasing behavioral characteristics and importances of factors affecting pizza purchase were significantly different by purchase frequency. Based on the estimated models developed for the two purchase frequency groups, the Chi-square statistics were significant at p<0.001. The parameter estimate for late delivery time with frequently purchase frequency group was highest, and the parameter estimate for price with frequently purchase frequency group was highest. The pizza restaurants that charged 20,000 won, offered 100% discount on eleventh pizza, promised to deliver pizza in 20 min, usually delivered the pizza as promised, offered 2 or more types of pizza crust, delivered steaming hot pizza, and did not offer a money-back guarantee which was favored by each of the two purchase frequency groups. The results from this study suggested that there was an opportunity to increase market share and profit by improving operations so that customers can receive discount and money-back guarantee simultaneously, and by reducing price, delivery time.
PDF

디지털 홀로그램의 압축을 위한 특성 분석 (Characteristic Analysis for Compression of Digital Hologram)

김진겸;김경진;김우석;이윤혁;오관정;김진웅;김동욱;서영호
- 방송공학회논문지
- /
- 제24권1호
- /
- pp.164-181
- /
- 2019
본 논문에서는 홀로그램 데이터를 효과적으로 압축하기 위한 디지털 홀로그래픽 데이터 코덱 기술 분석 및 개발을 소개한다. 먼저, JPEG Pleno에서 제공하는 홀로그램 표준 데이터세트의 생성방법과 데이터의 특성을 소개한다. 이산 웨이블릿 변환과 이산 코사인 변환을 이용하여 홀로그램 생성방법에 따른 에너지 집중도를 분석한다. 균일 양자화와 비균일 양자화를 적용시켜 홀로그램 생성방법에 따른 양자화 효율을 분석한다. 변환과 양자화 실험을 통해 홀로그램 생성방법에 맞는 변환기법 양자화방법을 제시한다. 마지막으로, 표준 압축 코덱인 JPEG, JPEG2000, AVC/H.264, HEVC/H.265를 이용해 홀로그램을 압축하고 그 결과를 분석한다.
https://doi.org/10.5909/JBE.2019.24.1.164 인용 PDF KSCI KPUBS HTML

초소형 IoT 장치에 구현 가능한 딥러닝 양자화 기술 분석 (Analysis of Deep learning Quantization Technology for Micro-sized IoT devices)

김영민;한경현;황성운
- 사물인터넷융복합논문지
- /
- 제9권1호
- /
- pp.9-17
- /
- 2023
많은 연산량을 가진 딥러닝은 초소형 IoT 장치나 모바일 장치에 구현하기가 어렵다. 최근에는 이러한 장치에서도 딥러닝을 구현할 수 있도록 모델의 연산량을 줄이는 딥러닝 경량화 기술이 소개되었다. 양자화는 연속적인 분포를 가지는 파라미터 값들을 고정된 비트의 이산 값으로 표현하여 모델의 메모리 및 크기 등을 줄여 효율적으로 사용할 수 있는 경량화 기법이다. 그러나 양자화로 인한 이산 값 표현으로 인해 모델의 정확도가 낮아지게 된다. 본 논문에서는 정확도를 개선할 수 있는 다양한 양자화 기술을 소개한다. 먼저 기존 양자화 기술 중 APoT와 EWGS를 선택하여 동일한 환경에서 실험을 통해 결과를 비교 분석하였다. 선택된 기술은 ResNet모델에서 CIFAR-10 또는 CIFAR-100 데이터 세트로 훈련되고 테스트 되었다. 실험 결과 분석을 통해 기존 양자화 기술의 문제점을 파악하고 향후 연구에 대한 방향성을 제시하였다.
https://doi.org/10.20465/KIOTS.2023.9.1.009 인용 PDF

기체크로마토그래피에서 황화합물의 구조를 통한 용리시간 예측 (Retention Time Prediction form Molecular Structure of Sulfur Compounds by Gas Chromatography)

김영구;김원호;박형석
- 대한화학회지
- /
- 제42권6호
- /
- pp.646-651
- /
- 1998
기체크로마토그래피에서 황화합물의 분자구조와 용리시간과의 관계를 연구하였다. 분석대상인 황화합물은 황화수소, 이산화항, 이황화탄소, 에틸메르캅탄, 황화이메틸, 이소프로필메르캅탄, 노말프로필메르캅탄, 황화에틸메틸, 황화이에틸, t-부틸메르캅탄, 테트라히이드로티오핀, 티오핀, 2-클로르티오핀이었다. 다중선형회귀분석방법으로 용리시간과 분자의 설명인자 사이의 상관관계를 설명할 수 있었다. 기체크로마토그래피에서 오븐 온도 프로그램을 30$^{\circ}C$에서 10.5분간 유지 후 15$^{\circ}C$/min 비율로 150$^{\circ}C$까지 증가하는 것으로 설정하였다. SAS를 사용하여 사대적 용리시간에 대한 예측식을 다음과 같이 얻을 수 있었다. $RRT=0.121bp+14.39dp-8.94dp^2+0.0741sqmw-35.78\;(N=8,\;R^2=0.989, \;Variance=0.175,\;F=66.21)$. 상대적 용리시간은 끓는점, 분자량의 제곱근 및 분자쌍극자모멘트의 함수이며 끓는점에 의한 영향이 가장 컸다. 무극성 컬럼 사용시 분자쌍극자모멘트가 0.805D에서 용리시간이 가장 길었다. 분자구조가 평면성을 띠면서 대칭성이 높은 물질은 용리속도가 작았다. 훈련세트(training set)에서 SAS 프로그램을 통해 얻은 예측식의 상관계수의 제곱$(R^2)$은 0.989이며 분산은 0.175이다. 시험세트(testing set)에서 3개의 황화합물에 대하여 예측식을 통해 얻은 상대적 용리시간과 관측된 값 사이의 분산은 0.432 이었다.
PDF

뇌파신호를 이용한 감정분류 연구 (Research on Classification of Human Emotions Using EEG Signal)

무하마드 주바이르;김진술;윤장우
- 디지털콘텐츠학회 논문지
- /
- 제19권4호
- /
- pp.821-827
- /
- 2018
Affective Computing은 HCI (Human Computer Interaction) 및 건강 관리 분야에서 다양한 애플리케이션이 개발됨에 따라 최근 몇 년 동안 관심이 높아지고 있다. 이에 필수적으로 필요한 인간의 감정 인식에 대한 중요한 연구가 있었지만, 언어 및 표정과 비교하여 심전도 (ECG) 또는 뇌파계 (EEG) 신호와 같은 생리적 신호 분석에 따른 감정 분석에 대한 관심은 적었다. 본 논문에서는 이산 웨이블릿 변환을 이용한 EEG 기반 감정 인식 시스템을 제안하고 감정 관련 정보를 얻기 위해 다른 뇌파와 뇌 영역을 연구 하였으며, 웨이블릿 계수에 기초한 특징 세트가 웨이블릿 에너지 특징과 함께 추출되었다. 중복성을 최소화하고 피처 간의 관련성을 극대화하기 위해 mRMR 알고리즘이 피쳐 선택에 적용된다. 다중클래스 Support Vector Machine을 사용하여 4 가지 종류의 인간 감정을 크게 분류하였으며 공개적으로 이용 가능한 "DEAP"데이터베이스의 뇌파 기록이 실험에서 사용되었다. 제안 된 접근법은 기존의 알고리즘에 비해 향상된 성능을 보여준다.
https://doi.org/10.9728/dcs.2018.19.4.821 인용 PDF KSCI

GAN으로 합성한 음성의 충실도 향상 (Improving Fidelity of Synthesized Voices Generated by Using GANs)

백문기;윤승원;이상백;이규철
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제10권1호
- /
- pp.9-18
- /
- 2021
생성적 적대 신경망(Generative Adversarial Networks, GANs)은 컴퓨터 비전 분야와 관련 분야에서 큰 인기를 얻었으나, 아직까지는 오디오 신호를 직접적으로 생성하는 GAN이 제시되지 못했다. 오디오 신호는 이미지와 다르게 이산 값으로 구성된 생플링된 신호이므로, 이미지 생성에 널리 사용되는 CNN 구조로 학습하기 어렵다. 이러한 제약을 해결하고자, 최근 GAN 연구자들은 오디오 신호의 시간-주파수 표현을 기존 이미지 생성 GAN에 적용하는 전략을 제안했다. 본 논문은 이 전략을 따르면서 GAN을 사용해 생성된 오디오 신호의 충실도를 높이기 위한 개선된 방법을 제안한다. 본 방법은 공개된 스피치 데이터세트를 사용해 검증했으며, 프레쳇 인셉션 거리(Fréchet Inception Distance, FID)를 사용해 평가했다. 기존의 최신(state-of-the-art) 방법은 11.973의 FID를, 본 연구에서 제안하는 방법은 10.504의 FID를 보였다(FID가 낮을수록 충실도는 높다).
https://doi.org/10.3745/KTSDE.2021.10.1.9 인용 PDF KSCI

검색결과 8건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)