• 제목/요약/키워드: CNN Algorithm

검색결과 474건 처리시간 0.022초

CNN 잡음 감쇠기에서 커널 사이즈의 최적화 (Optimization of the Kernel Size in CNN Noise Attenuator)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.987-994
    • /
    • 2020
  • 본 논문은 음향잡음감쇠기에서 CNN(: Convolutional Neural Network) 계층의 커널 사이즈가 성능에 미치는 영향을 위한 연구하였다 이 시스템은 기존의 적응필터를 이용하는 대신 신경망 적응예측필터를 이용한 심층학습 알고리즘으로 잡음감쇠 성능을 개선한다. 100-neuron, 16-filter CNN 필터와 오차 역전파(back propagation) 알고리즘을 이용하여 잡음이 포함된 단일입력 음성신호로부터 음성을 추정한다. 이는 음성신호가 갖는 유성음 구간에서의 준주기적 성질을 이용하는 것이다. 본 연구에서 커널 사이즈에 대한 잡음감쇠기의 성능을 검증하기 위하여 Tensorflow와 Keras 라이브러리를 사용한 시뮬레이션 프로그램을 작성하고 모의실험을 수행하였다. 모의실험 결과, 커널 사이즈가 16 정도일 때 평균자승오차(MSE: Mean Square Error) 및 평균절대값오차(MAE: Mean Absolute Error) 값이 가장 작은 것으로 나타났으며 사이즈가 이보다 더 작거나 커지면 MSE 및 MAE 값이 증가하는 것을 볼 수 있다. 이는 음성신호의 경우 커널 사이즈가 16 정도일 때 특성을 가장 잘 포집할 수 있음을 알 수 있다.

X-ray 이물검출기의 이물 검출 향상을 위한 딥러닝 방법 (Deep Learning Method for Improving Contamination Dectection of Xoray Inspection System)

  • 임병휘;정승수;유윤섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.460-462
    • /
    • 2021
  • 식품은 기본적으로 영양성과 안전성을 반드시 갖추어야 한다. 최근에 식품의 안정성이 의심이 되는 안산의 한 유치원에서 식중독성 유증상자가 다수 발생하였다. 그래서 식품의 안전성은 더욱 요구되는 사항이다. 본 논문에서는 식품의 안전성을 확보하기 위한 이물검출기의 딥러닝모델을 통해 검출율을 향상시키는 방법을 제안한다. 제안방법으로는 CNN(convolution neural network), Faster R-CNN(region convolution neural network)의 네트워크를 통해 학습하고 정상과 이물제품의 영상을 테스트 한다. 딥러닝 모델을 통해 테스트한 결과 기존 이물검출기의 알고리즘에 Faster R-CNN을 병행한 방법이 다른 방법보다 검출율이 좋은 성능을 보였다.

  • PDF

A New Bank-card Number Identification Algorithm Based on Convolutional Deep Learning Neural Network

  • Shi, Rui-Xia;Jeong, Dong-Gyu
    • International journal of advanced smart convergence
    • /
    • 제11권4호
    • /
    • pp.47-56
    • /
    • 2022
  • Recently bank card number recognition plays an important role in improving payment efficiency. In this paper we propose a new bank-card number identification algorithm. The proposed algorithm consists of three modules which include edge detection, candidate region generation, and recognition. The module of 'edge detection' is used to obtain the possible digital region. The module of 'candidate region generation' has the role to expand the length of the digital region to obtain the candidate card number regions, i.e. to obtain the final bank card number location. And the module of 'recognition' has Convolutional deep learning Neural Network (CNN) to identify the final bank card numbers. Experimental results show that the identification rate of the proposed algorithm is 95% for the card numbers, which shows 20% better than that of conventional algorithm or method.

Visual Object Tracking Fusing CNN and Color Histogram based Tracker and Depth Estimation for Automatic Immersive Audio Mixing

  • Park, Sung-Jun;Islam, Md. Mahbubul;Baek, Joong-Hwan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권3호
    • /
    • pp.1121-1141
    • /
    • 2020
  • We propose a robust visual object tracking algorithm fusing a convolutional neural network tracker trained offline from a large number of video repositories and a color histogram based tracker to track objects for mixing immersive audio. Our algorithm addresses the problem of occlusion and large movements of the CNN based GOTURN generic object tracker. The key idea is the offline training of a binary classifier with the color histogram similarity values estimated via both trackers used in this method to opt appropriate tracker for target tracking and update both trackers with the predicted bounding box position of the target to continue tracking. Furthermore, a histogram similarity constraint is applied before updating the trackers to maximize the tracking accuracy. Finally, we compute the depth(z) of the target object by one of the prominent unsupervised monocular depth estimation algorithms to ensure the necessary 3D position of the tracked object to mix the immersive audio into that object. Our proposed algorithm demonstrates about 2% improved accuracy over the outperforming GOTURN algorithm in the existing VOT2014 tracking benchmark. Additionally, our tracker also works well to track multiple objects utilizing the concept of single object tracker but no demonstrations on any MOT benchmark.

3차원 특징볼륨을 이용한 깊이영상 생성 모델 (Depth Map Estimation Model Using 3D Feature Volume)

  • 신수연;김동명;서재원
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.447-454
    • /
    • 2018
  • 본 논문은 컨볼루션 신경망으로 이루어진 학습 모델을 통해 스테레오 영상의 깊이영상 생성 알고리즘을 제안한다. 제안하는 알고리즘은 좌, 우 시차 영상을 입력으로 받아 각 시차영상의 주요 특징을 추출하는 특징 추출부와 추출된 특징을 이용하여 시차 정보를 학습하는 깊이 학습부로 구성된다. 우선 특징 추출부는 2D CNN 계층들로 이루어진 익셉션 모듈(xception module) 및 ASPP 모듈(atrous spatial pyramid pooling) module을 통해 각각의 시차영상에 대한 특징맵을 추출한다. 그 후 각 시차에 대한 특징 맵을 시차에 따라 3차원 형태로 쌓아 3D CNN을 통해 깊이 추정 가중치를 학습하는 깊이 학습부를 거친 후 깊이 영상을 추정한다. 제안하는 알고리즘은 객체 영역에 대해 기존의 다른 학습 알고리즘들 보다 정확한 깊이를 추정하였다.

R-CNN 기법을 이용한 지중매설물 제원 정보 자동 추출 연구 (A Study on Automatically Information Collection of Underground Facility Using R-CNN Techniques)

  • 박현석;홍기만;조용성
    • 한국재난정보학회 논문집
    • /
    • 제19권3호
    • /
    • pp.689-697
    • /
    • 2023
  • 연구목적: 본 연구는 미니트렌칭 공법 적용 과정에서 범용 스마트폰을 이용하여 지중매설물의 정보를 자동 추출하는데 목적이 있다. 연구방법:이미지 학습을 위한 데이터 셋은 주야간, 높이, 각도 등의 다양한 조건에서 수집하였으며, 객체 검지알고리즘은 R-CNN 알고리즘을 이용하였다. 연구결과: 성능평가지표는 정확한 예측과 재현율의 평균을 동시에 고려할 수 있는 F1-Score를 적용하였으며, 학습결과 F1-Score는 0.76으로 나타났다. 결론: 본 연구의 결과는 스마트폰 기반의 지중매설물 정보 추출이 가능한 것으로 나타났으나, 학습데이터의 추가적인 확보와 현장 실증 등을 통해 알고리즘의 정밀성 및 정확성을 향상시킬 필요가 있을 것으로 판단된다.

어텐션임베딩과 다채널 CNN 기반 반시민성 검출 알고리즘 (Detection of Incivility based on Attention-embedding and multi-channel CNN)

  • 박윤정;이세영;금희조
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1880-1889
    • /
    • 2022
  • 온라인 포털 플랫폼은 뉴스 기사와 온라인 댓글을 제공하고 있으나, 온라인 댓글의 익명성은 반시민적 표현을 증가시켜 사회적 문제점으로 간주되고 있다. 댓글의 반시민성 검출 연구가 많이 이루어진 국외와 달리, 국내에서는 비시민성을 세분화한 한국어 데이터셋이 구현되지 않아 심도있는 연구가 이루어지지 못하였다. 본 연구에서는 댓글의 반시민성에 대한 라벨링을 총 13가지 항목으로 시행하였으며 반시민적 표현으로 요약하였다. 또한 어텐션 알고리즘을 이중으로 적용하여 임베딩 벡터를 추출하였고 이후 2-d CNN으로 반시민성 항목을 분류하였다. 그 결과, 제안한 알고리즘이 무례한 호칭 및 공격적 어조 등의 반시민성 검출에 유용하다는 것을 보여주었다. 본 연구는 민주적 담론을 저해하는 반시민적 댓글들을 탐지함으로써 건전한 온라인 댓글 문화 형성에 기여할 것으로 기대된다.

구조적인 차이를 가지는 CNN 기반의 스테그아날리시스 방법의 실험적 비교 (Experimental Comparison of CNN-based Steganalysis Methods with Structural Differences)

  • 김재영;박한훈;박종일
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.315-328
    • /
    • 2019
  • 영상 스테그아날리시스는 입력 영상을 스테가노그래피 알고리즘이 적용된 스테고 영상과 스테가노그래피 알고리즘이 적용되지 않은 커버 영상으로 분류하는 알고리즘이다. 기존에는 주로 수제 특징 기반의 스테그아날리시스를 연구하였다. 하지만 CNN 기반의 물체 인식이 큰 성과를 이루면서 최근 CNN 기반의 스테그아날리시스가 활발히 연구되고 있다. CNN 기반의 스테그아날리시스는 물체 인식과는 달리 커버 영상과 스테고 영상의 미세한 차이를 식별하기 위해서 전처리 필터를 필요로 한다. 그러므로, CNN 기반의 스테그아날리시스 연구들은 효과적인 전처리 필터와 네트워크 구조를 개발하는 데 초점을 두고 있다. 본 논문에서는 동일한 실험 조건에서 기존 연구들을 비교하고, 그 결과를 기반으로 전처리 필터와 네트워크 구조적인 차이에 의한 성능 변화를 분석한다.

얼굴 검출을 위한 캐스케이드 CNN 정확도에 관한 연구 (A Study on Cascaded CNN Accuracy for Face Detection)

  • 우위네마 조세린;이해연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.232-235
    • /
    • 2018
  • Convolutional Neural Network is arguably the most popular deep learning architecture that is one of the most attractive area of research since it has various applications including face detection and recognition. The cascaded CNN operates at multiple resolution and rejects the background regions in the fast low resolution stages. By considering that advantage, we carry out the study on accuracy of cascaded CNN for face detection applications. The key point for our study is to analysing and improving the accuracy of cascaded CNN by applying simulations of algorithm where by we used Google's Tensorflow GPU as deep learning framework.

물체 탐지 알고리즘을 활용한 블랙박스 영상 내 사고 위험 감지 시스템 (The Accident Risk Detection System in Dashcam Video using Object Detection Algorithm)

  • 홍진석;한명우;김정선;김경섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.364-368
    • /
    • 2018
  • 본 논문에서는 물체 탐지 알고리즘 중 하나인 Faster R-CNN과 컴퓨터 비전을 목적으로 한 프로그래밍 라이브러리인 OpenCV를 사용하여 차선 변경이 가능한 고속도로나 국도, 일반 도로 등의 블랙박스 영상에서 다른 차량이 자신의 차선으로 차선 변경을 시도할 때 위험을 감지 할 수 있는 시스템을 구현하였다. 또한, 구현한 시스템의 성능을 평가하여 성능이 나쁘지 않음을 증명하였다.

  • PDF