• 제목/요약/키워드: Segment based classification

검색결과 122건 처리시간 0.026초

고해상도 영상 및 라이다 자료를 이용한 객체 기반 건물 탐지 (Object-based classification for building detection using VHR image and Lidar data)

  • 윤여상
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.307-310
    • /
    • 2006
  • 고해상도(VHR, Very High Resolution) 영상은 활용에 따라 도심의 다양한 정보를 얻을 수 있는 잠재적 가치가 매우 큰 자료이다. 그러나 이러한 고해상도 영상자료는 매우 높은 공간해상력으로 인해 같은 용도의 객체 혹은 같은 객체(예, 건물)라 할지라도 다양한 분광 특성 및 형태로 표현된다. 그러므로 이러한 고해상도영상을 이용하여 효과적으로 주제도를 생성하기 위해서는 현재까지 영상분류 분야에서 주로 활용되고 있는 화소(pixel)단위 기반의 분석방법으로는 한계가 존재한다. 본 연구에서는 이러한 문제점을 보완하기 위한 방법으로 활발한 연구가 진행되고 있는 세그멘트(segment) 혹은 객체(object) 기반 분류기법을 고해상도 영상 및 라이다 자료에 적용하여 도심지역의 건물들을 추출해 보았으며, 그 활용 가능성에 대하여 판단해 보았다. 이러한 세그멘트 기법은 분류하고자 하는 객체들을 하나의 동일한 특성을 가지는 집단으로 모으는 방법을 말하는데, 이를 위해 본 연구에서는 multi-resolution image segmentation기법을 제공해주는 eCognition이라는 소프트웨어를 이용하였다.

  • PDF

Classification of Lower Body Types of Female Adults aged 18 to 69 based on 3D Body Scan Data - Focusing on the Front Type, Lateral-Front Type, and Lateral-Back Type -

  • Kim, Min Kyoung;Nam, Yun Ja
    • 한국의류산업학회지
    • /
    • 제18권1호
    • /
    • pp.91-102
    • /
    • 2016
  • This study classified the lower body types of female adults aged 18 to 69. The lower body was divided into front, lateral front, and lateral back. In order to understand the shape and somatotype of each segment, 592 people were analyzed based on girth, height, length, depth, width, angle and cross section distance for each segment. For data analysis, SPSS 18.0 was performed for descriptive statics, principal component analysis, K-means cluster analysis, ANOVA, and Duncan's test (as verification). Factor analysis was performed based on index values, calculation values, angles, and cross section distances. The measured items resulted in a.) 16 items were extracted to 5 factors in the case of the front factor (FF) of the lower body, and b.) 24 items were extracted to 6 factors in the case of lateral front factor (LFF) and lateral back factor (LBF). Each factor was put through K-means cluster analysis, classifying the lower bodies into one of four types of based on the front type (FT), the lateral front type (LFT), and the lateral back type (LBT) respectively. This study proposed an understanding of various lower body shapes by segmenting and classifying the lower body shapes for each type.

오디오 정보를 이용한 골프 동영상 자동 색인 알고리즘 (Automatic Indexing Algorithm of Golf Video Using Audio Information)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.441-446
    • /
    • 2009
  • 본 논문에서는 오디오 정보 분석을 이용하여 골프 통영상을 자동 색인하는 알고리즘을 제안한다. 제안하는 알고리즘에서는 입력되는 골프 동영상을 비디오 신호와 오디오 신호로 분리한 후에, 연속적인 오디오 스트림을 Adaboost Cascade 분류방식을 통하여 스튜디오 환경에서의 아나운서의 음성구간, 선수이름이 TV 화면에 소개 될 때 수반되는 음악구간, 선수들의 플레이에 따라 반응하는 관중들의 박수 및 환호성 소리구간, 필드에서의 레포터의 음성구간, 바다나 바람 등의 필드환경 잡음 사운드구간 등의 5가지 구간으로 분류한다. 그리고 드라이브 샷, 아이런 샷과 퍼팅 샷 시에 발생하는 스윙 사운드는 onset 검출과 변조스펙트럼 검증 방법을 통해 검출되며, 관객의 박수 소리 구간과 결합하여 액션 및 하이라이트를 효율적으로 색인할 수 있게 한다. 제안된 알고리즘은 오디오 신호의 간단한 연산을 통해 의미를 지니고 있는 기본구조들을 검출하기 때문에 골프 동영상에서 사용자가 원하는 부분을 빠르게 브라우징하는 임베이디드 시스템에 적용가능하다.

상황인지 음악추천을 위한 음악 분위기 검출 (Detection of Music Mood for Context-aware Music Recommendation)

  • 이종인;여동규;김병만
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.263-274
    • /
    • 2010
  • 상황인지 음악추천 서비스를 제공하기 위해서는 무엇보다 상황 또는 문맥에 따라 사용자가 선호하는 음악의 분위기를 파악할 필요가 있다. 음악 분위기 검출에 대한 기존 연구의 대부분은 수작업으로 대표구간을 선정하고, 그 구간의 특징을 이용하여 분위기를 판별한다. 이러한 접근 방법은 분류 성능이 좋은 반면 전문가의 간섭을 요구하기 때문에 새로운 음악에 대해서는 적용하기 어렵다. 더욱이, 곡의 진행에 따라 음악 분위기가 달라지기 때문에 음악의 대표 분위기를 검출하는 것이 더욱 어려워진다. 본 논문에서는 이러한 문제점들을 보완하기 위해 음악 분위기를 자동으로 판별하는 새로운 방법을 제안하였다. 먼저 곡 전체를 구조적 분석 방법을 통하여 비슷한 특성을 갖는 세그먼트들로 분리한 후 각각에 대해 분위기를 판별한다. 그리고 세그먼트별 분위기 파악 시 Thayer 의 2차원 분위기 모델에 기초한 회귀분석 방법으로 개인별 주관적 분위기 성향을 모델링하였다. 실험결과, 제안된 방법이 80% 이상의 정확도를 보였다.

텍스쳐 특징과 구조적인 정보를 이용한 문서 영상의 분할 및 분류 (Document Image Segmentation and Classification using Texture Features and Structural Information)

  • 박근혜;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.215-220
    • /
    • 2010
  • 본 논문은 문서 영상을 대상으로 표, 그림, 글자 등의 각 구성요소들을 자동으로 분류하기 위한 새로운 텍스쳐 기반의 영상 분할 및 분류 방법을 제안한다. 제안한 방법은 문서 영상 분할 단계와 문서 영상 내 구성요소 분류 단계로 이루어진다. 먼저 영상 분할을 수행한 후, 분할된 영역을 대상으로 문서 영상의 구성 요소들을 분류하는데, 이때 각 구성 요소는 서로 다른 텍스쳐를 가지고 있는 영역이라는 특징을 이용한다. 분할된 영역들을 분류하기 위한 텍스쳐 특징을 추출하기 위해 다양한 텍스쳐 분석에 광범위하게 사용되는 2차원 가보필터를 이용한다. 제안한 방법은 구성 요소와 사용 언어에 대한 사전 지식을 이용하지 않으면서 문서 영상의 분할 및 구성요소 분류에서 좋은 성능을 보인다. 제안한 방법은 멀티미디어 데이터 검색, 실시간 영상 처리 등과 같은 다양한 분야에 적용 될 수 있다.

Image-based Soft Drink Type Classification and Dietary Assessment System Using Deep Convolutional Neural Network with Transfer Learning

  • Rubaiya Hafiz;Mohammad Reduanul Haque;Aniruddha Rakshit;Amina khatun;Mohammad Shorif Uddin
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.158-168
    • /
    • 2024
  • There is hardly any person in modern times who has not taken soft drinks instead of drinking water. The rate of people taking soft drinks being surprisingly high, researchers around the world have cautioned from time to time that these drinks lead to weight gain, raise the risk of non-communicable diseases and so on. Therefore, in this work an image-based tool is developed to monitor the nutritional information of soft drinks by using deep convolutional neural network with transfer learning. At first, visual saliency, mean shift segmentation, thresholding and noise reduction technique, collectively known as 'pre-processing' are adopted to extract the location of drinks region. After removing backgrounds and segment out only the desired area from image, we impose Discrete Wavelength Transform (DWT) based resolution enhancement technique is applied to improve the quality of image. After that, transfer learning model is employed for the classification of drinks. Finally, nutrition value of each drink is estimated using Bag-of-Feature (BoF) based classification and Euclidean distance-based ratio calculation technique. To achieve this, a dataset is built with ten most consumed soft drinks in Bangladesh. These images were collected from imageNet dataset as well as internet and proposed method confirms that it has the ability to detect and recognize different types of drinks with an accuracy of 98.51%.

선박 이동 경로 예측을 위한 해상 영역 분할 및 영역 단위 목적지 예측 방법 (Maritime region segmentation and segment-based destination prediction methods for vessel path prediction)

  • 김종희;정찬호;강도근;이창진
    • 전기전자학회논문지
    • /
    • 제24권2호
    • /
    • pp.661-664
    • /
    • 2020
  • 본 논문에서 우리는 선박의 이동 경로를 예측하기 위하여, 해상 영역을 분할하고, 분할된 영역을 기반으로 선박의 목적지를 예측하는 방법을 제안한다. 해상 영역을 분할하기 위하여 과거 이동 경로를 토대로 생성된 목적지 후보들을 군집화한다. 그리고, 선박이 이동할 목적지 영역을 예측하기 위해서 현재 위치에서 주어진 경로의 선형 여부와 향후 예측 시간에 따른 불확실성에 따라 다른 예측 방법을 적용한다. 예측에 사용하는 방법에는 선형 영역에서는 등속 운동을 가정한 선형 예측 방법, 불확실성이 높은 비선형 영역에서는 과거 경로 중 유사한 경로와 비슷한 움직임을 보일 것이라고 가정한 유사 경로 이용 예측 방법을 사용한다. 실험 결과에서 해당 방법이 선형 예측, 유사 경로 이용 예측 방법을 단독으로 적용하는 것에 비해 더 우수함을 보인다.

A study on the classifying vehicles for traffic flow analysis using LiDAR DATA

  • Heo J.Y.;Choi J.W.;Kim Y.I.;Yu K.Y.
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.633-636
    • /
    • 2004
  • Airborne laser scanning thechnology has been studied in many applications, DSM(Digital Surface Model) development, building extraction, 3D virtual city modeling. In this paper, we will evaluate the possibility of airborne laser scanning technology for transportation application, especially for recognizing moving vehicles on road. First, we initially segment the region of roads from all LiDAR DATA using the GIS map and intensity image. Secondly, the segmented region is divided into the roads and vehicles using the height threshold value of local based window. Finally, the vehicles will be classified into the several types of vehicles by MDC(Minimum Distance Classification) method using the vehicle's geometry information, height, length, width, etc

  • PDF

뇌파기반 휴먼-컴퓨터 인터페이스를 위한 인지적 정신상태의 분별 (Classification of Cognitive Mental States for Brain Wave based Human-Computer Interface)

  • 신승철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(5)
    • /
    • pp.61-64
    • /
    • 2001
  • This paper describes a basic study for the classification of cognitive mental states as a basic research of a human-computer interface technique. To recognize the mental states, we obtained 22 subjects’brain waves in course of two types of experiments. One of the experiments is to choose an answer among yes, no or reject buttons, to underlying questions and the other is to select an icon displayed in a monitor screen. After acquiring the brain wave signals, we construct a feature set with the percent power increase for a given segment with respect to that of the reference period. The linear discriminative algorithm is used to classify the cognitive yes/no mental states.

  • PDF

MobileNetV3 전이학습 기반 스포츠 비디오 클립 추출 구현 (Implementation of Sports Video Clip Extraction Based on MobileNetV3 Transfer Learning)

  • 위리
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.897-904
    • /
    • 2022
  • 스포츠 영상은 중요한 정보 자원에 속하여 있고 정확다가 높게 스포츠 영상 속에 유효 클립을 추출할 수 있어서 코치를 잘 보조하여 영상에서 선수들의 동작을 분석하며 사용자가 더 직관적으로 선수들의 타격 자세를 감상할 수 있다. 현재 스포츠 영상 클립 추출된 결과가 주관이 뚜렷하고 업무량이 많고 저효율 등 결함에 대해 MobileNetV3을 기반으로 스포츠 비디오 클립 분류 방법을 제시하였고 사용자의 시간이 절약하게 한다. 실험이 추출된 유효 클립에 대한 유효성 평가를 진행했으며 추출된 클립에서 유효적인 비율은 97.0%로 자지해서 유효 클립이 추출된 결과는 양호를 밝히는 동시 후속 배드민턴 동작의 원본 영상 데이터 집합의 구성을 위한 기초를 다진다.