• 제목/요약/키워드: single-image detection

검색결과 357건 처리시간 0.027초

A Method for Improving Resolution and Critical Dimension Measurement of an Organic Layer Using Deep Learning Superresolution

  • Kim, Sangyun;Pahk, Heui Jae
    • Current Optics and Photonics
    • /
    • 제2권2호
    • /
    • pp.153-164
    • /
    • 2018
  • In semiconductor manufacturing, critical dimensions indicate the features of patterns formed by the semiconductor process. The purpose of measuring critical dimensions is to confirm whether patterns are made as intended. The deposition process for an organic light emitting diode (OLED) forms a luminous organic layer on the thin-film transistor electrode. The position of this organic layer greatly affects the luminescent performance of an OLED. Thus, a system for measuring the position of the organic layer from outside of the vacuum chamber in real-time is desired for monitoring the deposition process. Typically, imaging from large stand-off distances results in low spatial resolution because of diffraction blur, and it is difficult to attain an adequate industrial-level measurement. The proposed method offers a new superresolution single-image using a conversion formula between two different optical systems obtained by a deep learning technique. This formula converts an image measured at long distance and with low-resolution optics into one image as if it were measured with high-resolution optics. The performance of this method is evaluated with various samples in terms of spatial resolution and measurement performance.

SVM on Top of Deep Networks for Covid-19 Detection from Chest X-ray Images

  • Do, Thanh-Nghi;Le, Van-Thanh;Doan, Thi-Huong
    • Journal of information and communication convergence engineering
    • /
    • 제20권3호
    • /
    • pp.219-225
    • /
    • 2022
  • In this study, we propose training a support vector machine (SVM) model on top of deep networks for detecting Covid-19 from chest X-ray images. We started by gathering a real chest X-ray image dataset, including positive Covid-19, normal cases, and other lung diseases not caused by Covid-19. Instead of training deep networks from scratch, we fine-tuned recent pre-trained deep network models, such as DenseNet121, MobileNet v2, Inception v3, Xception, ResNet50, VGG16, and VGG19, to classify chest X-ray images into one of three classes (Covid-19, normal, and other lung). We propose training an SVM model on top of deep networks to perform a nonlinear combination of deep network outputs, improving classification over any single deep network. The empirical test results on the real chest X-ray image dataset show that deep network models, with an exception of ResNet50 with 82.44%, provide an accuracy of at least 92% on the test set. The proposed SVM on top of the deep network achieved the highest accuracy of 96.16%.

에지 및 국부적 최소/최대 변환을 이용한 자연 이미지로부터 텍스트 영역 검출 (Text Region Detection using Edge and Regional Minima/Maxima Transformation from Natural Scene Images)

  • 박종천;이근왕
    • 한국산학기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.358-363
    • /
    • 2009
  • 자연이미지로부터 텍스트 영역 검출은 다양한 응용분야에 활용됨으로 이 분야의 많은 연구가 필요하다. 최근의 연구 방법은 에지 및 연결요소 기반 방법을 결합하는 다양한 알고리즘을 이용하여 텍스트 영역을 검출하고 있다. 그러므로 본 논문은 이러한 결합방법으로 에지 및 국부적 최소/최대 변환 방법을 이용하여 텍스트 영역을 검출하는 알고리즘을 제안한다. 명도 이미지로부터 에지 및 국부적 최소/최대 연결성분을 검출하고, 에지 및 국부적 최소/최대 연결성분을 레이블화한다. 레이블된 영역을 분석하여 텍스트 후보 영역을 검출하고, 검출된 각각의 텍스트 후보 영역을 결합하여 단일 텍스트 후보 이미지를 생성한다. 텍스트 후보 개별문자의 인접성 및 유사도를 비교하여 검증함으로서 최종적인 텍스트 영역을 검출한다. 실험결과 제안한 알고리즘은 에지 요소 및 국부적 최소/최대 연결요소 검출 방법을 결합하여 자연 이미지로부터 텍스트 영역 검출의 정확도 및 재현률을 향상할 수 있었다.

천리안 위성 자료를 이용한 대류권계면 접힘 난류 탐지 가능성 연구 (Feasibility Study for Detecting the Tropopause Folding Turbulence Using COMS Geostationary Satellite)

  • 김미정;김재환
    • 대기
    • /
    • 제27권2호
    • /
    • pp.119-131
    • /
    • 2017
  • We present and discuss the Tropopause Folding Turbulence Detection (TFTD) algorithm for the Korean Communication, Ocean, Meteorological Satellite (COMS) which is originally developed for the Tropopause Folding Turbulence Product (TFTP) from the Geostationary Operational Environmental Satellite (GOES)-R. The TFTD algorithm assumes that the tropopause folding is linked to the Clear Air Turbulence (CAT), and thereby the tropopause folding areas are detected from the rapid spatial gradients of the upper tropospheric specific humidity. The Layer Averaged Specific Humidity (LASH) is used to represent the upper tropospheric specific humidity calculated using COMS $6.7{\mu}m$ water vapor channel and ERA-interim reanalysis temperature at 300, 400, and 500 hPa. The comparison of LASH with the numerical model specific humidity shows a strong negative correlation of 80% or more. We apply the single threshold, which is determined from sensitivity analysis, for cloud-clearing to overcome strong gradient of LASH at the edge of clouds. The tropopause break lines are detected from the location of strong LASH-gradient using the Canny edge detection based on the image processing technique. The tropopause folding area is defined by expanding the break lines by 2-degree positive gradient direction. The validations of COMS TFTD is performed with Pilot Reports (PIREPs) filtered out Convective Induced Turbulence (CIT) from Dec 2013 to Nov 2014 over the South Korea. The score test shows 0.49 PODy (Probability of Detection 'Yes') and 0.64 PODn (Probability of Detection 'No'). Low POD results from various kinds of CAT reported from PIREPs and the characteristics of high sensitivity in edge detection algorithm.

컴퓨터 시각을 이용한 고속 터널 유고감지 시스템 (Vision-Based Fast Detection System for Tunnel Incidents)

  • 이희신;정성환;이준환
    • 한국ITS학회 논문지
    • /
    • 제9권1호
    • /
    • pp.9-18
    • /
    • 2010
  • 산악지형이 많은 우리나라는 자연환경 여건상 터널 수요가 많고 안전한 운영을 보장 할 수 있는 터널 유고감지 시스템에 대한 필요성도 커지고 있다. 본 논문에서는 터널 내 유고 상황을 실시간으로 감지하여 터널 사무소에 전달 터널의 안전한 운영을 도울 수 있는 터널 유고감지 시스템을 제안 하였다. 제안한 시스템은 차 영상 기법과 같은 단순한 영상 분석 알고리즘을 사용하여 시스템의 신속성을 높였으며 유고의 종류 보다는 유고상황의 발생여부를 정확히 판단하데 중점을 두어 시스템의 정확성도 확보하였다. 또한 영상 분석 장치 한 대당 네 대의 카메라를 수용할 수 있게 함으로써 시스템의 비용적인 측면도 고려하였다. 그리고 카메라의 대수에 따라 영상분석 장치를 추가함으로써 카메라 대수에 관계없이 시스템의 확장성을 용이하게 하였으며 터널 유고상황 정보를 웹에서도 접근 가능하게 하여 원격지의 다른 터널 시스템과의 연동 등의 추가 확장성도 고려하였다. 구현된 시스템을 실제 터널에서 실험한 결과 터널 내에서 발생한 장애물, 정지 사고차량, 차량 정체 지체, 사람 이륜차, 연기 화재, 조명 이상, 역 주행 등의 유고상황을 모두 실시간으로 정확히 감지하였다.

A Study on Traffic Vulnerable Detection Using Object Detection-Based Ensemble and YOLOv5

  • Hyun-Do Lee;Sun-Gu Kim;Seung-Chae Na;Ji-Yul Ham;Chanhee Kwak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.61-68
    • /
    • 2024
  • 횡단보도에서 발생하는 교통사고를 해결하기 위한 시도가 계속되고 있지만, 교통사고는 끊임 없이 일어나는 상황이다. 특히 노인, 장애인 등의 교통약자들은 교통사고에 노출될 위험이 더 크다. 이에 대한 문제점을 주의 깊게 볼 필요가 있다. 본 논문은 교통 약자 중 휠체어, 목발과 같은 보조 기구를 이용하는 보행자를 위해 YOLO v5 모델을 활용한 객체 탐지 기술을 제안한다. 휠체어, 목발 사용자 그리고 보행자의 이미지 크롤링, Roboflow와 Mobibity Aids 데이터를 수집하였다. 일반화 성능을 높이기 위해 데이터 증강 기법을 활용하였다. 더하여 Type 2 error를 줄이기 위해 앙상블 기법을 이용하여 Recall이 96%인 높은 성능 수치를 얻었다. 이를 통해 교통약자를 목표로 YOLO 내 단일 모델을 앙상블 할 시, 객체를 놓치지 않고 정확한 탐지 성능을 보여준다는 것을 입증하였다.

임베디드 프로세서를 이용한 고정익 무인항공기 영상기반 목표물 탐지 및 추적 (Fixed-Wing UAV's Image-Based Target Detection and Tracking using Embedded Processor)

  • 김정호;정재원;한동인;허진우;조겸래;이대우
    • 한국항행학회논문지
    • /
    • 제16권6호
    • /
    • pp.910-919
    • /
    • 2012
  • 본 논문에서는 고정익 무인항공기의 온보드 영상처리 시스템 개발에 대하여 개발과정에 대해 기술하고, 비행실험을 통한 실험결과를 토대로 하여 성능을 검증하고자 하였다. 시스템 개발보드는 ARM 프로세서가 탑재된 영상처리용 보드에 임베디드 리눅스를 포팅하였다. 목표물 추적을 위한 영상처리 알고리즘으로는 비교적 간단한 알고리즘인 색상 기반 알고리즘을 적용하여, 지상에 있는 특정 색상의 물체를 추적하도록 하였다. 개발된 시스템의 성능검증을 위해 실험실에서 제작한 무인항공기에 탑재하여 비행실험을 수행하였으며, 실시간 성능 향상을 위해 영상처리 알고리즘 및 임베디드 리눅스의 커널에 대한 최적화 작업을 수행하였다. 비행실험 결과, 4픽셀 이내의 오차범위에서 지속적으로 목표물을 추적하는 것을 확인하였다.

가중치 맵을 이용한 수중 음향 신호 영상에서의 표적 강화 알고리즘 (Target Emphasis Algorithm in Image for Underwater Acoustic Signal Using Weighted Map)

  • 주재흠
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.203-208
    • /
    • 2010
  • 본 논문에서는 소나 시스템을 통해 획득된 수중 음향 신호를 디지털 영상의 형태로 변환한다. 그리고 이러한 형태의 영상에 대해 영상 처리 기법을 도입하여 표적 후보를 탐지하고, 이들 영역에 대해 정보를 강화하는 알고리즘을 제안한다. 수중 표적의 탐지 과정은 우선 수중음향신호 영상에서 불규칙한 형태로 분포하고 있는 배경 잡음을 추정하여 재구성한 뒤, 원 영상에서 배경 영상을 제거하여 초기 표적 후보군을 획득한다. 또한 도플러 신호 정보를 가공하여 가중치 맵을 생성하고, 배경잡음이 제거된 영상에 대해 가중치 맵을 이용한 필터링 과정을 수행함으로써 표적 후보에 대한 정보를 보다 정확히 확보하고, 단일프레임에서의 표적 후보 정보를 강화한다. 본 논문에서는 시뮬레이션으로 획득된 수중음향신호에 대해 제안된 알고리즘을 적용하여, 불규칙적으로 발생하게 되는 잡음이 대부분 제거됨을 확인하였고, 필터링 및 표적 탐지 과정을 통해 수중음향신호 영상에서 표적이 더욱 명확히 표시됨을 확인하였다.

컨볼루션 오토인코더를 이용한 마스크 착용 얼굴 이미지 생성 (Generation of Masked Face Image Using Deep Convolutional Autoencoder)

  • 이승호
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1136-1141
    • /
    • 2022
  • 코로나19 팬데믹으로 인해 마스크 착용이 일상화되면서 마스크 착용 얼굴을 식별하는 얼굴인식 연구에 대한 중요도가 높아지고 있다. 안정된 얼굴인식 성능을 위해서는 인식 대상에 대한 풍부한 학습용 이미지 확보가 필요하지만 인물 별로 마스크 착용 얼굴 이미지를 다량 확보하는 것은 쉽지 않다. 본 논문에서는 마스크 미착용 얼굴 이미지에 가상의 마스크 패턴을 합성하는 새로운 방법을 제안한다. 제안 방법은 동일 인물에 대해 마스크 미착용 얼굴 이미지와 마스크 착용 얼굴 이미지를 쌍으로 컨볼루션 오토인코더에 입력하여 얼굴과 마스크의 기하학적 관계를 학습한다. 학습이 완료된 컨볼루션 오토인코더는 학습에 사용되지 않은 새로운 마스크 미착용 얼굴 이미지에 가상의 마스크 패턴을 자연스러운 형태로 합성해준다. 제안 방법은 고속으로 대량의 마스크 착용 얼굴 이미지를 생성할 수 있으며, 얼굴 특징점 추출에 기반하는 마스크 합성 방법에 비해 실용적이다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.