• 제목/요약/키워드: Image Labeling

검색결과 373건 처리시간 0.024초

연속영상에서 motion 기반의 새로운 분할 알고리즘 (A new motion-based segmentation algorithm in image sequences)

  • 정철곤;김중규
    • 한국통신학회논문지
    • /
    • 제27권3A호
    • /
    • pp.240-248
    • /
    • 2002
  • 본 논문에서는 연속영상에서 움직이는 객체의 motion에 기반하여 영상을 분할하는 새로운 알고리즘을 제안하였다. 전체적인 분할 과정은 2단계로 구성되어진다. 첫 단계는 '픽셀 레이블링' 단계이며, 두 번째 단계는 'motion 분할' 단계이다. '픽셀 레이블링' 단계에서는 optical flow에 의해 발생하는 속도 벡터들의 크기에 따라 영상의 각 픽셀에 레이블을 부여한다. 'Motion 분할' 단계에서는 첫 단계에서 생겨난 불필요한 잡음을 제거하기 위해 motion 필드를 마코프 랜덤 필드로 모델링하여 에너지 최소화를 통해 motion을 분할한다. 실험결과, 제안된 알고리즘이 연속영상에서 움직이는 객체의 motion을 효율적으로 분할함을 확인할 수 있었다.

YCbCr정보와 아다부스트 알고리즘을 이용한 실시간 얼굴검출 시스템 (Real-time Face Detection System using YCbCr Information and AdaBoost Algorithm)

  • 김형균;정기봉
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.19-26
    • /
    • 2008
  • 본 논문에서는 실시간 얼굴검출을 위하여 감시카메라에서 입력된 RGB영상을 YCbCr 영상으로 변환한 후 연속된 두 영상의 차를 구하고 Glassfire 라벨링을 실시했다. 라벨링 결과 가장 넓은 구역의 면적과 Area 임계치 값을 비교하여 임계값 이상의 면적이면 동작변환으로 인식하고 영상을 추출하였다. 이렇게 추출된 동작변환 영상을 대상으로 얼굴 검출을 실시하였다. 얼굴 검출에 필요한 특징을 추출하기 위해 AdaBoost알고리즘을 사용하였다.

  • PDF

Manchu Script Letters Dataset Creation and Labeling

  • Aaron Daniel Snowberger;Choong Ho Lee
    • Journal of information and communication convergence engineering
    • /
    • 제22권1호
    • /
    • pp.80-87
    • /
    • 2024
  • The Manchu language holds historical significance, but a complete dataset of Manchu script letters for training optical character recognition machine-learning models is currently unavailable. Therefore, this paper describes the process of creating a robust dataset of extracted Manchu script letters. Rather than performing automatic letter segmentation based on whitespace or the thickness of the central word stem, an image of the Manchu script was manually inspected, and one copy of the desired letter was selected as a region of interest. This selected region of interest was used as a template to match all other occurrences of the same letter within the Manchu script image. Although the dataset in this study contained only 4,000 images of five Manchu script letters, these letters were collected from twenty-eight writing styles. A full dataset of Manchu letters is expected to be obtained through this process. The collected dataset was normalized and trained using a simple convolutional neural network to verify its effectiveness.

이미지 생성을 위해 노이즈를 이용한 GAN 시스템 (GAN System Using Noise for Image Generation)

  • 배상중;김민규;정회경
    • 한국정보통신학회논문지
    • /
    • 제24권6호
    • /
    • pp.700-705
    • /
    • 2020
  • 생성적 적대 신경망(GAN, Generative Adversarial Network)은 두 개의 신경망을 대립하여 이미지를 생성하는 방법이다. 이미지를 생성할 때 랜덤으로 생성한 노이즈를 재배열하여 이미지를 생성하는데 이러한 방법으로 생성된 이미지는 노이즈에 따라 생성이 잘 이루어지지 않고, 이미지의 픽셀이 적은 경우 제대로 된 이미지를 생성하기 어렵다는 문제점이 발생할 수 있다. 또한 데이터 분류에서 데이터가 쌓이는 속도와 크기가 증가되는데 이들을 라벨링하는 데는 많은 어려움이 있다. 본 논문에서는 이를 해결하기 위해 랜덤으로 생성하던 노이즈에 실제 데이터를 사용하여 노이즈를 생성하고 이를 기반으로 이미지를 생성하는 기법을 제안한다. 제안하는 시스템은 기존에 있는 이미지를 기반으로 하는 이미지를 생성하는 것이므로 좀 더 자연스러운 이미지의 생성이 가능하다는 것을 확인하였고 이를 학습에 이용할 경우 기존의 생성적 적대 신경망을 사용한 방법보다 더 높은 적중률을 보임을 확인하였다.

Fish Injured Rate Measurement Using Color Image Segmentation Method Based on K-Means Clustering Algorithm and Otsu's Threshold Algorithm

  • Sheng, Dong-Bo;Kim, Sang-Bong;Nguyen, Trong-Hai;Kim, Dae-Hwan;Gao, Tian-Shui;Kim, Hak-Kyeong
    • 동력기계공학회지
    • /
    • 제20권4호
    • /
    • pp.32-37
    • /
    • 2016
  • This paper proposes two measurement methods for injured rate of fish surface using color image segmentation method based on K-means clustering algorithm and Otsu's threshold algorithm. To do this task, the following steps are done. Firstly, an RGB color image of the fish is obtained by the CCD color camera and then converted from RGB to HSI. Secondly, the S channel is extracted from HSI color space. Thirdly, by applying the K-means clustering algorithm to the HSI color space and applying the Otsu's threshold algorithm to the S channel of HSI color space, the binary images are obtained. Fourthly, morphological processes such as dilation and erosion, etc. are applied to the binary image. Fifthly, to count the number of pixels, the connected-component labeling is adopted and the defined injured rate is gotten by calculating the pixels on the labeled images. Finally, to compare the performances of the proposed two measurement methods based on the K-means clustering algorithm and the Otsu's threshold algorithm, the edge detection of the final binary image after morphological processing is done and matched with the gray image of the original RGB image obtained by CCD camera. The results show that the detected edge of injured part by the K-means clustering algorithm is more close to real injured edge than that by the Otsu' threshold algorithm.

디지털영상의 특정영역 인식과 처리 방안 (Methods on Recognition and Recovery Process of Censored Areas in Digital Image)

  • 김감래;김욱남;김훈정
    • 한국측량학회지
    • /
    • 제20권1호
    • /
    • pp.1-11
    • /
    • 2002
  • 본 연구에서는 보안목표물의 효율적인 활용에 목적을 두고 있으며 이를 위하여 항공사진 영상에 표현된 보안 삭제구역에 대한 문제점을 분석하고 영상의 특정영역 인식을 위하여 클러스터링과 레이블링을 실시하였으며, 후처리 알고리즘을 통하여 디지털 영상 데이터의 다양한 활용성을 극대화시키려 하였다. 이러한 연구성과를 토대로 영상의 밝기 값은 지형ㆍ지물의 수량에 따라 증가하는 것으로 나타났으며, 이는 영상 전체에 포함되어 있는 지형·지물의 정보량 판단에 유용한 평가자료로 활용할 수 있는 것으로 평가되었다. 또한 영상인식 및 후 처리에 있어서 도심지나 교외지의 경우 기존 보안목표물의 삭제를 위한 처리절차와 유사하게 인식되는 지형ㆍ지물의 다수 포함으로 인해 산악지에 비해 좋은 결과 값이 도출되지 않았으며. 이는 지형·지물의 수량이 인식 및 처리에 절대적인 영향을 미치는 것으로 나타났다.

신뢰성 있는 이미지 전송 기법을 적용한 전자 가격표시 시스템의 설계 및 구현 (Design and Implementation of Electronic Shelf Label System using Technique of Reliable Image Transmission)

  • 양은주;정승완;유길상;김정준;서대화
    • 한국멀티미디어학회논문지
    • /
    • 제18권1호
    • /
    • pp.25-34
    • /
    • 2015
  • Recently, in distribution market, demand for electronic shelf label system is increasing gradually to provide the accurate price immediately and detailed product information to consumers and reduce operation costs. Most of electronic shelf label system companies develop the full-graphic display device to display a wide variety of product information as well as the exact price. Our system had introduced Go-Back-N retransmission method in the early. However, we encountered performance problems that it delayed updating of the electronic shelf label system and exhausted the battery life time. Proposed adaptive image retransmission technique based on the selective scheme is that tags of electronic shelf label system recognize idle time of transmission cycle and require partial image retransmission to sever by itself. As a result, it can acquire much more opportunities of partial image retransmission within the same period and increase reception rate of full image for each tags. The experimental result shows that adaptive image retransmission technique's reception rate of full image for each tags is approximately 4% higher than existing previous works. And total battery life time increases 30 hours because tag reduce wake-up time as it receive only lost data instead of whole data.

영상보안을 위한 머리와 얼굴의 간단한 영역 분리 및 얼굴 특징 추출 (Simply Separation of Head and Face Region and Extraction of Facial Features for Image Security)

  • 전영철;이건익;김강
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.125-133
    • /
    • 2008
  • 사회가 발전할수록 공공장소에서 개인 및 시설물의 안전에 대한 중요성이 높아진다 기존의 주차장, 은행, 공장 등 보안이나 범죄 예방이 요구되는 지역은 넘어서 일반 기관, 개인의 주택까지 감시 및 보안에 대한 투자가 증가하는 경향을 보이고 있다. 이 논문은 얼굴인식에 있어서 중요한 얼굴 영역과 머리 영역을 칼라변환을 이용하여 간단하게 분리하는 방법과 얼굴특징 추출을 제안한다. 먼저 입력영상에 대한 CMYK영상 중 K영상을 가지고 머리 영역을 분리한 후에 YIQ영상의 Y영상과 머리 영상과의 칼라변환을 이용하여 얼굴영역을 분리한다 머리영상에 Log 연산을 한 후에 라벨링을 이용하여 얼굴의 특징들을 추출한다. 뚜렷하게 분리된 머리와 얼굴영역은 머리와 얼굴의 형태를 쉽게 분류할 수 있으며, 쉽게 특징점을 찾을 수 있게 한다. 제안한 방법의 알고리즘을 이용하면 중요성이 요구되는 보안 관련 시설에서 사람을 감시하거나 인식하는데 효과적으로 이용될 수 있을 것으로 예상된다.

  • PDF

동영상 데이터에서 조명 보정을 사용한 관심 영역의 획득 (Acquisition of Region of Interest through Illumination Correction in Dynamic Image Data)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.439-445
    • /
    • 2021
  • 영상 센서 및 소형 디스플레이의 발달로 가능해진 저가의 고속 카메라는 영상처리 및 패턴인식 분야에서 유용하게 활용될 수 있다. 본 논문에서는 약간의 시차를 두고 연속적으로 입력되는 고속의 영상으로부터 불규칙적인 조명을 보정한 다음, 조명이 보정된 영상으로부터 사람의 관심 영역인 노출된 피부 색상 영역을 획득하는 알고리즘을 소개한다. 본 연구에서는 먼저 받아들인 고속의 영상으로부터 비 균일하게 발생된 조명적인 효과를 프레임 블렌딩 기법을 사용하여 보정한다. 그런 다음, 사전에 반복적인 학습으로 생성된 타원형의 피부 색상 분포 모델을 적용하여 입력된 고속의 컬러 영상으로부터 관심 영역을 강인하게 획득한다. 실험 결과에서는 본 논문에서 제시된 접근 방법이 입력되는 컬러 영상으로부터 조명을 보정한 다음 관심 영역을 정확하게 획득한다는 것을 보여준다. 본 연구에서 제안된 알고리즘은 얼굴 인식 및 추적, 조명 보정 및 제거, 동영상 색인 및 검색 등과 같은 영상 인식과 연관된 다양한 종류의 실제적인 응용 프로그램에서 매우 유용하게 이용될 것으로 추측된다.

미소 픽셀을 갖는 비행 객체 인식을 위한 데이터베이스 구축 및 관리시스템 연구 (Database Generation and Management System for Small-pixelized Airborne Target Recognition)

  • 이호섭;신희민;심현철;조성욱
    • 항공우주시스템공학회지
    • /
    • 제16권5호
    • /
    • pp.70-77
    • /
    • 2022
  • 본 논문에서, 데이터베이스 생성 및 관리 시스템은 미소 픽셀 공중 표적 인식을 위해 제안된다. 제안된 시스템은 1)비행 테스트 비디오 프레임에 의한 직접 이미지 추출, 2) 자동 이미지 보관, 3) 이미지 데이터 레이블링 및 메타 데이터 주석, 4) 컬러 채널 변환, 5) HOG/LBP 기반 소화소 대상 증강 이미지 데이터 생성의 다섯가지 주요 기능으로 구성된다. 제안하는 프로그램은 파이썬 기반의 PyQt5와 OpenCV를 이용하여 구성하였고 공중 표적 인식을 위한 이미지 데이터셋은 제안한 시스템을 이용해 생성했으며 비행 실험으로 부터 수집된 영상을 입력영상으로 사용하였다.