• 제목/요약/키워드: Image Labeling

검색결과 373건 처리시간 0.023초

블록기반 라벨과 화소기반 스캔마스크를 이용한 이진 연결요소 라벨링 (Binary Connected-component Labeling with Block-based Labels and a Pixel-based Scan Mask)

  • 김교일
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.287-294
    • /
    • 2013
  • 이진 연결요소 라벨링은 영상처리와 컴퓨터비전 등의 영역에 널리 사용되는 기법 중의 하나이다. 지금까지 여러 가지 방법의 라벨링기법이 연구되어 왔는데 그 중에서 이중스캔 방법이 가장 효과가 있는 것으로 나타나고 있다. 이중스캔 방법에서는 전통적으로 화소단위로 스캐닝을 하면서 순차적으로 라벨링하는 방법을 사용했는데 최근에는 C. Grana et. al. 및 L. He et. al. 등이 제안한 복수의 인접화소를 묶은 블록을 기반으로 라벨링하는 방법이 가장 효율적인 것으로 인정받고 있다. 본 논문에서는 화소기반의 스캔마스크를 사용하면서 라벨링은 Grana의 블록을 기반으로 하는 새로운 라벨링 방법을 제안하고 있다. 실제 사용하는 영상들에 대해 실험한 결과 영상의 종류에 따라 제안된 방법이 현재 가장 효율이 좋은 He의 방법에 비해 평균 3.9%에서 22.4%까지 성능의 향상이 있는 것으로 나타났다.

항만 영상정보시스템 구축을 위한 컨테이너 식별자 인식 (A Recognition Method of Container ISO-code for Vision & Information System in Harbors)

  • 구경모;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.721-723
    • /
    • 2007
  • 현재 항만의 컨테이너 양하 및 적하 과정에서 획득되는 컨테이너 영상은 크기 및 위치가 정형화되어 있지 않고, Yard Tractor의 정차 차선과 컨테이너의 크기 등의 외부 환경 변화로 인해 인식에 적합한 영상을 획득하기 어렵다. 본 논문에서는 Top-Hat Transform을 이용하여 실시간 영상으로부터 문자의 영역을 추정하고, 카메라의 PAN/TILT/ZOOM 기능을 이용한 시선이동을 통해 문자인식에 적합한 영상을 획득한다. 획득된 컨테이너 영상으로부터 Top-Hat Transform 및 Histogram Projection을 이용하여 식별자 영역을 추출하고 이진화한 뒤, Labeling 된 결과를 토대로 배경과 문자영역을 구분하고 개별 문자들을 추출한다. 이후 오류역전파 알고리즘을 이용하여 추출된 개별 문자들을 인식한다. 실제 부두에 설치하여 제안된 컨테이너 식별자 영상 획득 및 인식 방법이 우수함을 확인하였다.

  • PDF

Reconstruction and Elimination of Optical Microscopic Background Using Surface Fitting Method

  • Kim Hak-Kyeong;Kim Dong-Kyu;Jeong Nam-Soo;Lee Myung-Suk;Kim Sang-Bong
    • Fisheries and Aquatic Sciences
    • /
    • 제4권1호
    • /
    • pp.10-17
    • /
    • 2001
  • One serious problem among the troubles to identify objects in an optical microscopic image is contour background due to non-uniform light source and various transparency of samples. To solve this problem, this paper proposed an elimination method of the contour background and compensation technique as follows. First, Otsu's optimal thresholding method extracts pixels representing background. Second, bilinear interpolation finds non-deterministic background pixels among the sampled pixels. Third, the 2D cubic fitting method composes surface function from pivoted background pixels. Fourth, reconstruction procedure makes a contour image from the surface function. Finally, elimination procedure subtracts the approximated background from the original image. To prove the effectiveness of the proposed algorithm, this algorithm is applied to the yeast Zygosaccharomyces rouxii and ammonia-oxidizing bacteria Acinetobacter sp. Labeling by this proposed method can remove some noise and is more exact than labeling by only Otsu's method. Futhermore, we show that it is more effective for the reduction of noise.

  • PDF

전방 모노카메라 기반 장애물 검출 기술 (Obstacle Detection Algorithm Using Forward-Viewing Mono Camera)

  • 이태재;이훈;조동일
    • 제어로봇시스템학회논문지
    • /
    • 제21권9호
    • /
    • pp.858-862
    • /
    • 2015
  • This paper presents a new forward-viewing mono-camera based obstacle detection algorithm for mobile robots. The proposed method extracts the coarse location of an obstacle in an image using inverse perspective mapping technique from sequential images. In the next step, graph-cut based image labeling is conducted for estimating the exact obstacle boundary. The graph-cut based labeling algorithm labels the image pixels as either obstacle or floor as the final outcome. Experiments are performed to verify the obstacle detection performance of the developed algorithm in several examples, including a book, box, towel, and flower pot. The low illumination condition, low color contrast between floor and obstacle, and floor pattern cases are also tested.

합성곱 신경망 및 영상처리 기법을 활용한 피부 모공 등급 예측 시스템 (A Prediction System of Skin Pore Labeling Using CNN and Image Processing)

  • 이태희;황우성;최명렬
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.647-652
    • /
    • 2022
  • 본 논문은 사용자들에 의해 촬영된 피부이미지를 가공하여 데이터 세트를 구축하고, 제안한 영상처리 기법에 의해 모공 특징이미지를 생성하여, CNN(Convolution Neural Network) 모델 기반의 모공 상태 등급 예측 시스템을 구현한다. 본 논문에서 활용하는 피부이미지 데이터 세트는, 피부미용 전문가의 육안 분류 기준에 근거하여, 모공 특징에 대한 등급을 라벨링 하였다. 제안한 영상처리 기법을 적용하여 피부이미지로 부터 모공 특징 이미지를 생성하고, 모공 특징 등급을 예측하는 CNN 모델의 학습을 진행하였다. 제안한 CNN 모델에 의한 모공 특징은 전문가의 육안 분류 결과와 유사한 예측 결과를 얻었으며, 비교 모델(Resnet-50)에 의한 결과보다 적은 학습시간과 높은 예측결과를 얻었다. 본 논문의 본론에서는 제안한 영상처리 기법과 CNN 적용의 결과에 대해 서술하며, 결론에서는 제안한 방법에 대한 결과와 향후 연구방안에 대해 서술한다.

어텐션 모듈과 기하학적 데이터 증강을 통한 X-ray 영상 내 해부학적 랜드마크 검출 성능 향상 (Improved Anatomical Landmark Detection Using Attention Modules and Geometric Data Augmentation in X-ray Images)

  • 이효정;마세리;최장환
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권3호
    • /
    • pp.55-65
    • /
    • 2022
  • X-ray 두개골 영상에서 주요 해부학적 부위들 간의 거리를 계측하는 것은 진단과 치료 등 임상적 의미에서 매우 중요하다. 최근에는 딥러닝 기술의 발전을 바탕으로 랜드마크를 식별 및 검출하는 자동화 시스템들이 제시되고 있다. 이러한 딥러닝 기반 모델을 과적합 없이 학습 시키기 위해서는 대량의 영상과 라벨링 데이터가 필요하다. 기존에는 숙련된 판독의가 환자의 영상에서 랜드마크를 수동으로 식별하여 라벨링하는 방식으로 계측이 이루어져 왔다. 그러나 이러한 계측 방식은 많은 비용이 소요될 뿐만 아니라, 재현성이 떨어지기 때문에 자동화된 라벨링 방법에 대한 필요성이 제기되고 있다. 또한, X-ray 영상에는 광자가 통과하는 경로 상의 여러 인체조직들이 표시되기 때문에 랜드마크 식별이 일반 자연 이미지 또는 삼차원 모달리티 영상에 비해 어렵다. 본 연구에서는 X-ray 영상 내에 대량의 라벨링 데이터 생성을 가능하게 하는 기하학적 데이터 증강 기법을 제안하고 있다. 또한, 두개골 내 주요한 16개 랜드마크들의 검출 성능을 향상시키기 위해 다양한 어텐션 기법들의 구현 및 적용을 통해 랜드마크 검출을 위한 최적의 어텐션 메커니즘을 제시하였다. 마지막으로 주요 두개골 랜드마크들 중 안정적인 검출이 보장되는 마커들을 도출하였으며, 이러한 마커들은 임상적인 활용 가능성이 높을 것으로 기대된다.

Convolutional Neural Networks기반 항공영상 영역분할 및 분류 (Aerial Scene Labeling Based on Convolutional Neural Networks)

  • 나종필;황승준;박승제;백중환
    • 한국항행학회논문지
    • /
    • 제19권6호
    • /
    • pp.484-491
    • /
    • 2015
  • 항공영상은 디지털 광학 영상 기술의 성장과 무인기(UAV)의 발달로 인하여 영상의 도입 및 공급이 크게 증가하였고, 이러한 항공영상 데이터를 기반으로 지상의 속성 추출, 분류, 변화탐지, 영상 융합, 지도 제작 형태로 활용되고 있다. 특히, 영상분석 및 활용에 있어 딥 러닝 알고리즘은 패턴인식 분야의 한계를 극복하는 새로운 패러다임을 보여주고 있다. 본 논문은 딥 러닝 알고리즘인 ConvNet기반으로 항공영상의 영역분할 및 분류 결과를 통한 더욱더 넓은 범위와 다양한 분야에 적용할 수 있는 가능성을 제시한다. 학습데이터는 도로, 건물, 평지, 숲 총 3000개 4-클래스로 구축하였고 클래스 별로 일정한 패턴을 가지고 있어 특징 벡터맵을 통한 결과가 서로 다르게 나옴을 확인할 수 있다. 본 연구의 알고리즘은 크게 두 가지로 구성 되어 있는데 특징추출은 ConvNet기반으로 2개의 층을 쌓았고, 분류 및 학습과정으로 다층 퍼셉트론과 로지스틱회귀 알고리즘을 활용하여 특징들을 분류 및 학습시켰다.

깊이 정보를 이용한 영역분할 기반의 다시점 영상 조명보상 기법 (Illumination Compensation Algorithm based on Segmentation with Depth Information for Multi-view Image)

  • 강근호;고민수;유지상
    • 한국정보통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.935-944
    • /
    • 2013
  • 본 논문에서는 영상 분할을 이용한 다시점 영상의 조명보상 기법을 제안한다. 제안하는 기법에서는 깊이 정보를 이용하여 일정 거리에 따라 참조 영상의 깊이 영상을 레이어로 분리한다. 분리된 레이어에서 서로 다른 객체를 분리하기 위하여 각 레이어에 레이블링 과정을 수행한다. 레이블링 된 참조 영상의 깊이 영상은 3D 워핑 기법을 통하여 왜곡 영상의 시점으로 변환되고 레이블링 된 영역을 찾아 히스토그램을 이용한 조명 보상을 각 영역에서 독립적으로 수행한다. 3D 워핑으로 발생하는 가려짐 영역은 전역적인 방법을 이용하여 보상하게 된다. 다양한 실험을 통해 제안하는 기법으로 조명보상 전처리를 수행한 다시점 영상의 부호화 효율이 향상되는 것을 확인할 수 있었다.

흉부 CT 영상에서 폐 혈관 분할 및 정제 (Pulmonary Vessels Segmentation and Refinement On the Chest CT Images)

  • 김정철;조준호;황형수
    • 전자공학회논문지
    • /
    • 제50권11호
    • /
    • pp.188-194
    • /
    • 2013
  • 본 논문에서는 폐 영상에서 폐 혈관을 분할하고 정제하는 방법을 제안하였다. 제안된 방법은 다음과 같이 다섯 단계로 구성된다. 첫 번째, 폐 영상에서 히스토그램 변화율의 다항식 회귀 분석을 사용하여 임계값을 계산한다. 두 번째, 계산된 임계값으로 밝기값 기반 분할 방법을 사용하여 폐 혈관을 분할한다. 세 번째, 분할한 폐 혈관 영상에 2차원 연결 요소 레이블링 방법을 사용하고, 레이블링 요소의 크기와 이심률을 계산하여 좌측 및 우측 횡격막의 씨앗점을 결정한다. 네 번째, 결정된 씨앗점에서 3차원 영역 성장법을 사용하여 횡격막을 추출한다. 다섯 번째, 이진 영상의 3차원 연결 요소 레이블링 방법을 사용하여 폐 혈관 영상의 노이즈를 제거한다.

터널 내 돌발상황 오탐지 영상의 반복 학습을 통한 딥러닝 추론 성능의 자가 성장 효과 (Effect on self-enhancement of deep-learning inference by repeated training of false detection cases in tunnel accident image detection)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제21권3호
    • /
    • pp.419-432
    • /
    • 2019
  • 대부분 딥러닝 모델의 학습은 입력값과 입력값에 따른 출력값이 포함된 레이블링 데이터(labeling data)를 학습하는 지도 학습(supervised learning)으로 진행된다. 레이블링 데이터는 인간이 직접 제작하므로 데이터의 정확도가 높다는 장점이 있지만 비용과 시간의 문제로 인해 데이터의 확보에 많은 노력이 소요된다. 그리고 지도 학습의 목표는 정탐지 데이터(true positive data)의 인식 성능 향상에 초점이 맞추어져 있으며, 오탐지 데이터(false positive data)의 발생에 대한 대처는 미흡한 실정이다. 본 논문은 터널 관제센터에 투입된 딥러닝 모델 기반 영상유고 시스템의 모니터링을 통해 정탐지와 레이블링 데이터의 학습으로 예측하기 힘든 오탐지의 발생을 확인하였다. 오탐지의 유형은 작업차량의 경광등, 터널 입구부에서 반사되는 햇빛, 차선과 차량의 일부에서 발생하는 길쭉한 검은 음영 등이 화재와 보행자로 오탐지되고 있었다. 이러한 문제를 해결하기 위해 현장에서 발생한 오탐지 데이터와 레이블링 데이터를 동시에 학습하여 딥러닝 모델을 개발하였으며, 그 결과 기존 레이블링 데이터만 학습한 모델과 비교하면 레이블링 데이터에 대한 재추론 성능이 향상됨을 알 수 있었다. 그리고 오탐지 데이터에 대한 재추론을 한 결과 오탐지 데이터를 많이 포함하여 학습한 모델일 경우 보행자의 오탐지 개수가 훨씬 줄었으며, 오탐지 데이터의 학습을 통해 딥러닝 모델의 현장 적용성을 향상시킬 수 있었다.