• Title/Summary/Keyword: 영상 분류 및 검색

Search Result 98, Processing Time 0.025 seconds

Classification of Brain MR Images using 2 Level Decision Tree Learning (2 단계 결정 트리 학습을 이용한 뇌 MR 영상 분류)

  • Kim, Yong-Uk;Kim, Jun-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.341-344
    • /
    • 2001
  • 본 논문에서는 학습을 수행하여 뇌 MR 이미지를 자동으로 분류하고 검색하는 시스템을 설계하였다. 이미지로부터 얻을 수 있는 정보는 크게 두 가지 부류로 나눌 수 있다. 이미지 자체로부터 얻을수 있는 크기, 색상, 질감, 윤곽선 등의 하위레벨(low-level) 정보가 있고, 이미지 의미 해석에서 오는 전이, 포함, 방향, 등의 상위레벨(high-level) 정보가 있다. 이 논문은 의료 이미지에 대하여 상위 및 하위 레벨 정보의 각 특징을 살리고 효과적으로 검색하기 위해, 두 부류의 이미지 정보에 대한 결정 트리(Decision Tree) 학습을 2 단계로 적용하여 이미지를 분류하도록 시스템을 설계하였다.

  • PDF

Image Super Resolution Using Neural Architecture Search (심층 신경망 검색 기법을 통한 이미지 고해상도화)

  • Ahn, Joon Young;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.102-105
    • /
    • 2019
  • 본 논문에서는 심층 신경망 검색 방법을 사용하여 이미지 고해상도화를 위한 심층 신경망을 설계하는 방법을 구현하였다. 일반적으로 이미지 고해상도화, 잡음 제거 및 번짐 제거를 위한 심층신경망 구조는 사람이 설계하였다. 최근에는 이미지 분류 등 다른 영상처리 기법에서 사용하는 심층 신경망 구조를 검색하기 위한 방법이 연구되었다. 본 논문에서는 강화학습을 사용하여 이미지 고해상도화를 위한 심층 신경망 구조를 검색하는 방법을 제안하였다. 제안된 방법은 policy gradient 방법의 일종인 REINFORCE 알고리즘을 사용하여 심층 신경망 구조를 출력하여 주는 제어용 RNN(recurrent neural network)을 학습하고, 최종적으로 이미지 고해상도화를 잘 실현할 수 있는 심층 신경망 구조를 검색하여 설계하였다. 제안된 심층 신경망 구조를 사용하여 이미지 고해상도화를 구현하였고, 약 36.54dB 의 피크 신호 대비 잡음 비율(PSNR)을 가지는 것을 확인할 수 있었다.

  • PDF

Segmentation and Classification Using Audio and Image Information (오디오와 영상 정보를 이용한 비디오 세그먼테이션 및 크래시피케이션)

  • Jung, Hae-Jun;Jung, Sung-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.891-894
    • /
    • 2000
  • 본 논문에서는 효과적인 내용기반 비디오 검색을 위한 샷 경계 검출, 장면 경계 검출, 그리고 비디오 크래시피케이션 방법을 연구하였다. 먼저, 샷 경계 검출을 위해 칼라 히스토그램과 DCT 변환 계수를 통합하여 사용했다. 그리고 장면 경계 검출을 위해서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용하여 장면 경계를 검출하였다. 또한 비디오 크래시피케이션에서는 장면 경계검출시 추출한 오디오 정보를 이용해 비디오를 내용별로 분류하는 연구를 제안하였다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 8,500개 영상 프레임과 약 50,000개의 오디오 프레임을 가진 실험 비디오 데이터베이스를 구성하여 제안된 시스템을 실험하였다. 실험한 결과, 약 88%의 정확도(Precision)를 가지는 장면 경계 검출과 약 85%의 평균 분류율을 보였다.

  • PDF

Parallel Processing System with combined Architecture of SIMD with MIMD (SIMD와 MIMD가 결합된 구조를 갖는 병렬처리시스템)

  • Lee, Hyung;Choi, Sung-Hyuk;Kim, Jung-Bae;Park, Jong-Won
    • The KIPS Transactions:PartA
    • /
    • v.8A no.1
    • /
    • pp.9-15
    • /
    • 2001
  • 영상에 관련된 다양한 응용 시스템들을 구현하는 많은 연구들이 진행되어 왔지만, 그러한 영상 관련 응용 시스템을 구현함에 있어서 처리속도의 저하로 인하여 많은 어려움을 겪고 있다. 이를 해결하기 위해 대두된 여러 방법들 중에서 최근 하드웨어 접근 방법에 고려한 많은 관심과 연구가 진행되고 있다. 본 논문은 영상을 실시간으로 처리하기 위하여 하드웨어 구조를 갖는 병렬처리시스템을 기술하며, 또한 병렬처리시스템을 얼굴 검색 시스템에 적용한 후 처리속도 및 실험 결과를 기술한다. 병렬처리시스템은 SIMD와 MIMD가 결합된 구조를 갖고 있기 때문에 다양한 영상 응용시스템에 대해서 융통성과 효율성을 제공하며, 144개의 처리기와 12개의 다중접근기억장치, 외부 메모리 모듈을 위한 인터페이스와 외부 프로세서 장치(i960Kx)와의 통신을 위한 인터페이스로 구성되어있다. 다중접근기억장치는 메모리 모듈선택회로, 데이터 라이팅회로, 그리고, 주소계산 및 라우팅회로로 구성되어 있다. 또한 얼굴 검색 시스템을 병렬처리 시스템에 적합한 병렬화를 제공하기 위해 메쉬방법을 이용하여 전처리, 정규화, 4개 특징값 추출, 그리고 분류화로 구성하였다. 병렬처리시스템은 하드웨어 모의실험 패키지인 CADENCE사의 Verilog-XL로 모의실험을 수행하여 기능과 성능을 검증하였다.

  • PDF

Classification and Recommendation of Scene Templates for PR Video Making Service based on Strategic Meta Information (홍보동영상 제작 서비스를 위한 전략메타정보 기반 장면템플릿 분류 및 추천)

  • Park, Jongbin;Lee, Han-Duck;Kim, Kyung-Won;Jung, Jong-Jin;Lim, Tae-Beom
    • Journal of Broadcast Engineering
    • /
    • v.20 no.6
    • /
    • pp.848-861
    • /
    • 2015
  • In this paper, we introduce a new web-based PR video making service system. Many video editing tools have required tough editing skill or scenario planning stage for a just simple PR video making. Some users may prefer a simple and fast way than sophisticated and complex functionality. To solve this problem, it is important to provide easy user interface and intelligent classification and recommendation scheme. Therefore, we propose a new template classification and recommendation scheme using a topic modeling method. The proposed scheme has the big advantage of being able to handle the unstructured meta data as well as structured one.

A Study on Extraction of Central Objects in Color Images (칼라 영상에서의 중심 객체 추출에 관한 연구)

  • 김성영;박창민;권규복;김민환
    • Journal of Korea Multimedia Society
    • /
    • v.5 no.6
    • /
    • pp.616-624
    • /
    • 2002
  • An extraction method of central objects in the color images is proposed, in this paper. A central object is defined as a comparatively consist of the central object in the image. First of all. an input image and its decreased resolution images are segmented. Segmented regions are classified as the outer or the inner region. The outer region is adjacent regions are included by a same region in the decreased resolution image. Then core object regions and core background regions are selected from the inner region and the outer region respectively. Core object regions are the representative regions for the object and are selected by using the information about the information about the region size and location. Each inner regions is classified into foreground or background regions by comparing values of a color histogram intersection of the inner region against the core object region and the core background regions. The core object region and foreground regions consist of the central object in the image.

  • PDF

CNN-based Human Parsing Technique Using Pyramid Pooling (Pyramid pooling을 이용한 CNN 기반의 Human Parsing 기법)

  • Choi, Inkyu;Ko, min-soo;Song, hyok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.97-98
    • /
    • 2018
  • 최근 딥러닝 기술의 발전으로 영상 분류 및 영상 내 객체 검출뿐만 아니라 CNN 기반의 segmentation 기술도 개발되어 다른 요소까지 포함한 직사각형 영역의 검출 영역이 아닌 경계까지 고려한 분리가 가능하게 되었다. 더불어 사람 영역을 신체부위나 의류 부분과 같은 세부 영역으로 나누어 분리하는 human parsing 기술까지 연구되고 있다. Human parsing은 의류스타일 분석 및 검색, 사람의 행동 인식 및 추적과 같은 분야에도 응용될 수 있다. 본 논문에서는 Spatial pyramid pooling layer를 이용하여 영상 전체에 대한 공간적 분포 및 특성 정보를 고려한 human parsing 기법을 제안한다. Look into person(LIP) dataset을 이용하여 기존의 다른 segmentation 및 human parsing 기법과 제안하는 기법을 비교하여 제안하는 기법의 human parsing 결과가 보다 정교한 분리가 가능한 것을 확인하였다.

  • PDF

Subimage Detection of Window Image Using AdaBoost (AdaBoost를 이용한 윈도우 영상의 하위 영상 검출)

  • Gil, Jong In;Kim, Manbae
    • Journal of Broadcast Engineering
    • /
    • v.19 no.5
    • /
    • pp.578-589
    • /
    • 2014
  • Window image is displayed through a monitor screen when we execute the application programs on the computer. This includes webpage, video player and a number of applications. The webpage delivers a variety of information by various types in comparison with other application. Unlike a natural image captured from a camera, the window image like a webpage includes diverse components such as text, logo, icon, subimage and so on. Each component delivers various types of information to users. However, the components with different characteristic need to be divided locally, because text and image are served by various type. In this paper, we divide window images into many sub blocks, and classify each divided region into background, text and subimage. The detected subimages can be applied into 2D-to-3D conversion, image retrieval, image browsing and so forth. There are many subimage classification methods. In this paper, we utilize AdaBoost for verifying that the machine learning-based algorithm can be efficient for subimage detection. In the experiment, we showed that the subimage detection ratio is 93.4 % and false alarm is 13 %.

Efficient Face Detection using Adaboost and Facial Color (얼굴 색상과 에이다부스트를 이용한 효율적인 얼굴 검출)

  • Chae, Yeong-Nam;Chung, Ji-Nyun;Yang, Hyun-S.
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.7
    • /
    • pp.548-559
    • /
    • 2009
  • The cascade face detector learned by Adaboost algorithm, which was proposed by Viola and Jones, is state of the art face detector due to its great speed and accuracy. In spite of its great performance, it still suffers from false alarms, and more computation is required to reduce them. In this paper, we want to reduce false alarms with less computation using facial color. Using facial color information, proposed face detection model scans sub-window efficiently and adapts a fast face/non-face classifier at the first stage of cascade face detector. This makes face detection faster and reduces false alarms. For facial color filtering, we define a facial color membership function, and facial color filtering image is obtained using that. An integral image is calculated from facial color filtering image. Using this integral image, its density of subwindow could be obtained very fast. The proposed scanning method skips over sub-windows that do not contain possible faces based on this density. And the face/non-face classifier at the first stage of cascade detector rejects a non-face quickly. By experiment, we show that the proposed face detection model reduces false alarms and is faster than the original cascade face detector.

Detection method of objects with a special pattern in satellite images using Histogram Of Gradients (HOG) feature and Support Vector Machine (SVM) classifier (Histogram Of Gradients (HOG) 피쳐와 Support Vector Machine (SVM) 분류기를 이용한 위성영상에서 관심물체 탐색 방법)

  • Lim, Ingeun;Kim, Suhwan;Choi, Jonggook
    • Korean Journal of Remote Sensing
    • /
    • v.30 no.4
    • /
    • pp.537-546
    • /
    • 2014
  • In this paper, we propose a method to detect interesting objects in inaccessible areas using high resolution satellite images. We define the interesting objects as a set of objects which have conceptually similar image patterns, not having exact sizes or shapes. In this paper, we developed a learning and classifier of Support Vector Machine (SVM) that extracts characteristic data for inputted images using Histogram of Gradients (HOG) feature and detects similar objects in other images using the characteristic data. As automatic search of interesting objects in our proposed method, we identify that our method provides reduced time and efforts for manual searching similar objects.