• 제목/요약/키워드: segment based classification

검색결과 124건 처리시간 0.027초

클래스 초월구를 이용한 프로토타입 기반 분류 (Prototype-Based Classification Using Class Hyperspheres)

  • 이현종;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권10호
    • /
    • pp.483-488
    • /
    • 2016
  • 본 논문은 최근접 이웃 규칙을 이용한 프로토타입을 이용하는 분류 학습을 제안한다. 훈련 데이터가 대표하는 클래스 영역을 초월구로 분할하는데 최근접 이웃규칙을 적용시키며, 초월구는 동일 클래스 데이터들만 포함시킨다. 초월구의 반지름은 가장 인접한 다른 클래스 데이터와 가장 먼 동일 클래스 데이터의 중간 거리 값으로 결정한다. 그리고 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합을 선택하기 위해 집합 덮개 최적화를 이용한다. 제안하는 선택 방법은 클래스 별 프로토타입을 선택하는 그리디 알고리즘으로 설계되며, 대규모 훈련 데이터에 대한 병렬처리가 가능하다. 분류 예측은 최근접 이웃 규칙을 이용하며, 새로운 훈련 데이터는 프로토타입 집합이다. 실험에서 제안하는 방법은 기 연구된 학습 방법에 비해 일반화 성능이 우수하다.

자소 클래스 인식에 의한 off-line 필기체 한글 문자 분할 (Consonant-Vowel Classification Based Segmentation Technique for Handwritten Off-Line Hangul)

  • 황순자;김문현
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.1002-1013
    • /
    • 1996
  • 문자 분할은 필기체 문서 서식의 자동 인식 과정에서 중요한 부분이다. 본 연구는 off-line 필기체 한글로부터 문자를 분할하기 위한 방법을 제안한다. 제안한 방법은 한글의 구조적 특성에 기반을 두고 있다. 먼저 투영에 의하여 입력 단어로 부터 분할 을 위한 특징과 연결 화소, 획을 추출한다. 두 번째 단계에서 획의 모양과 위치, 획과 획과의 관계를 이용하여 한글의 기본 자소 클래스 영역을 찾는다. 세 번째 단계는 분할 과정으로 WRC(While Run Column)다음에 초성이나 수평 모음이 오는 경우 이 WRC에서 수직으로 분할하며, 분할된 세그먼트의 길이가 임계값 이상아면 자소 클래 스와 문자의 칼럼에 대한 특징을 이용하여 예상 분할 영역을 찾고, 이 영역에 있는 획을 따라 요철 형태로 분할한다.

  • PDF

CNN-based Visual/Auditory Feature Fusion Method with Frame Selection for Classifying Video Events

  • Choe, Giseok;Lee, Seungbin;Nang, Jongho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1689-1701
    • /
    • 2019
  • In recent years, personal videos have been shared online due to the popular uses of portable devices, such as smartphones and action cameras. A recent report predicted that 80% of the Internet traffic will be video content by the year 2021. Several studies have been conducted on the detection of main video events to manage a large scale of videos. These studies show fairly good performance in certain genres. However, the methods used in previous studies have difficulty in detecting events of personal video. This is because the characteristics and genres of personal videos vary widely. In a research, we found that adding a dataset with the right perspective in the study improved performance. It has also been shown that performance improves depending on how you extract keyframes from the video. we selected frame segments that can represent video considering the characteristics of this personal video. In each frame segment, object, location, food and audio features were extracted, and representative vectors were generated through a CNN-based recurrent model and a fusion module. The proposed method showed mAP 78.4% performance through experiments using LSVC data.

수체 추출을 위한 Geo-SAM 기법의 응용: 국토위성영상 적용 실험 (Application of Geo-Segment Anything Model (SAM) Scheme to Water Body Segmentation: An Experiment Study Using CAS500-1 Images)

  • 이하영;김광섭;이기원
    • 대한원격탐사학회지
    • /
    • 제40권4호
    • /
    • pp.343-350
    • /
    • 2024
  • Meta에서 신속한 영상 분할 기능을 제공하는 대규모 컴퓨터 비전 생성 모델을 발표한 이후, 여러 활용 분야에서 이를 적용하려는 연구가 이루어지고 있다. 이 연구에서는 위성 영상 자료에 Segment Anything Model (SAM)을 사용할 수 있는 QGIS 플러그인 Geo-SAM을 사용하여 수체 객체 탐지와 추출에 대한 SAM의 적용성을 조사해 보고자 하였다. 실험 대상 자료는 국토위성(Compact Advanced Satellite 500, CAS500-1) 영상을 사용하였다. 이 자료를 가지고 SAM을 적용하여 얻은 결과는 같은 입력 영상으로부터 수작업으로 제작한 수체 객체 자료, Open Street Map (OSM)의 수체 자료, 국토지리정보원의 수계 수치지도와 비교하였다. SAM 처리 결과와 비교 대상 자료를 이용하여 추출된 모든 객체를 대상으로 계산한 경계사각형의 교집합/합집합의 평균값을 나타내는 mean Intersection over Union (mIoU)은 각각 0.7490, 0.5905, 0.4921로 나타났고, 각 자료에서 공통으로 나타나거나 추출된 객체에 대해 계산한 결과는 차례대로 0.9189, 0.8779, 0.7715로 나타났다. SAM을 적용한 결과와 다른 비교 자료와의 공간적 일치도를 분석한 결과, SAM에서는 한 개의 수체 객체를 여러 개의 분할 요소로 나타내므로 수체 객체 분류를 지원하는 의미 있는 결과를 보이고 있음을 알 수 있다.

선형분석 기반의 심방세동 분류를 위한 불규칙 RR 간격의 최적값 검출 (Optimal Value Detection of Irregular RR Interval for Atrial Fibrillation Classification based on Linear Analysis)

  • 조익성;정종혁;조영창;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2551-2561
    • /
    • 2014
  • 심방세동 검출을 위한 기존 연구방법으로는 비선형 분석법과 주파수 분석법 등을 들 수 있지만 시간 영역 알고리즘에 비해 연산이 복잡하고 불규칙한 리듬 검출에 필요한 일반적 규칙을 제공하지 못한다. 이를 위해 본 연구에서는 선형 분석 기반의 심방세동 분류를 위한 불규칙 RR 간격의 최적값 검출 방법을 제안하였다. 이를 위해 먼저 전처리과정과 차감 기법을 통해 R파를 검출하였다. 이후 불규칙 RR 간격의 세그먼트 길이에 대한 범위를 설정하고 정규화 절대 편차와 절대치와 같은 선형 분석상의 심방세동 분류를 위한 최적값을 검출하였다. 제안된 알고리즘의 타당성 평가를 위해 MIT-BIH 부정맥과 심방세동 데이터베이스를 이용하여 RR 간격의 세그먼트 길이와 최적값에 대한 심방세동 분류율을 각각 비교 실험하였다. 성능 평가 결과, RR 간격과 연속하는 RR 간격 차에 대한 최적값은 ${\alpha}=0.75$, ${\beta}=1.4$, ${\gamma}=300ms$ 일 때 제일 높은 성능을 나타나는 것을 확인할 수 있었다.

머신러닝 기반의 뷰티 커머스 고객 세그먼트 분류 및 활용 방안: 언택트 서비스 중심으로 (A Study of the Beauty Commerce Customer Segment Classification and Application based on Machine Learning: Focusing on Untact Service)

  • 윤상혁;최윤진;이소현;김희웅
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.75-92
    • /
    • 2020
  • 인구 및 세대 구조가 변화면서 점차 대면 관계를 꺼리는 고객의 태도 변화가 정보기술의 발달과 스마트폰의 확산으로 더욱 커지고 있다. 이는 정보기술에 익숙해진 현대 고객들의 소비패턴인 효율성 및 신속성과도 부합되는 것으로, 오프라인 망 중심의 유통회사들이 판매 및 서비스 방식을 언택트로 전환하려는 움직임이 활발해지고 있다. 최근 다양한 분야에서 언택트 서비스가 활성화되고 있지만, 뷰티 제품의 경우 고객의 피부타입 및 상태에 따라 제품 선택이 쉽지 않으므로 비대면을 통해 제품을 추천하기가 쉽지 않다. 이와 관련하여 온라인 뷰티 분야에서 제품 추천을 위한 추천시스템 개발 및 추천 관련 연구들이 수행되었지만, 대부분이 설문조사 방법이나 소셜 데이터를 이용하여 추천 알고리즘을 개발한 연구들이었다. 즉, 고객의 피부타입이나 제품 선호도 등의 실제 사용자 정보를 기반으로 세그먼트를 분류한 연구는 부족하였다. 그리하여, 본 연구에서는 뷰티 분야에서의 언택트 서비스 중의 하나인 모바일 애플리케이션의 고객 정보와 검색 로그 데이터를 기반으로 머신러닝 기법의 K-prototypes 알고리즘을 이용하여 고객 세그먼트를 새롭게 분류하고, 이를 기반으로 언택트 마케팅 전략 방안을 제안한다. 본 연구는 머신러닝 기법을 이용하여 새롭게 고객 세그먼트를 분류함으로써 관련 기존 문헌의 범위를 확장하였다. 더불어, 언택트 서비스라는 새로운 소비 트렌드를 반영하여 고객 세그먼트를 분류하고, 이를 기반으로 뷰티 분야의 언택트 서비스에 활용할 수 있는 구체적인 방안을 제시했다는 실무적 의의가 있다.

주변정보 분할을 이용한 주제 중심 웹 문서 수집기 (A Focused Crawler by Segmentation of Context Information)

  • 조창희;이남용;강진범;양재영;최중민
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.697-702
    • /
    • 2005
  • 주제 중심 웹 문서 수집기는 검색엔진에서 최신의 웹 문서 색인을 유지하는 대안방안으로 부상하고 있다. 그러나 주제 중심 웹 문서 수집기는 비 관심문서에서 연결된 관심문서들을 수집할 수 없는 문제점을 가지고 있다. 이러한 문제점은 문서의 구조적 특징을 고려하지 않아서 발생한다. 특히 문서분석 방법인 문서의 발생 횟수 및 역문헌 발생빈도는 이러한 문제를 야기하는 주요 원인이 된다 주제 중심 웹 문서 수집기의 성능을 향상하기 위해서 본 논문에서는 국소 정보기반의 문서 분할법을 제안한다. 본 논문에서는 문서를 하이퍼링크 주변의 문맥을 고려한 특징 정보들을 사용하여 여러 소각의 문서로 나눈다. 본 논문에서 제안하는 주제 중심 웹 문서 수집기는 나누어진 문서들을 이용하여 하이퍼링크가 관심문서를 가리키는 것인지를 판단하여 문서를 수집할 것인지를 판단한다.

해부병리조직에 대한 칼라 영상분석 (Color Image Analysis of Histological tissue Sections)

  • 최흥국
    • 한국정보처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.253-260
    • /
    • 1999
  • 본 논문에서는 조합된 텍스쳐와 칼라 정보로부터 다변수의 선형 구별 알고리즘을 사용하여 영상분할에 대한 새로운 방법론의 개발을 제시한다. 그 칼라 텍스쳐는 칼라 영상의 공간과 색깔의 밴드로부터 한 화소가 갖는 3X3의 마스크에서 Haralick 과 Pressman의 텍스쳐 특성들을 계산했다. 모두 9X28개의 텍스쳐 특성들 중에서 학습을 기반으로 크게 식별자(classifier)에 영향을 주는 특성들을 도출하였으며 결과적으로 뽑혀진 10개의 특성이 한 영상을 4부분으로 분할하는데 사용되어졌다. 이 방법론의 결과로 얻어진 영상은 고전적인 칼라와 텍스쳐 분할 방법론의 상자식별자(Box Classifier)와 Maximum Likelihood 식별기들과 비교했다. 이것은 Fastred-Lightgreen으로 염색된 전립선암이 조직에서 얻은 영상을 통해 비교를 했을 경우에 잘 나타난다. 학습 데이터를 통해 나타난 이 새로운 방법론은 97.5%의 정확한 식별성으로 또한 검증된 최상의 방법론중의 하나이다. 이 결과들이 더 많은 영상에 사용된다면, 이 방법론은 칼라와 텍스쳐가 분할에 관련됨으로써 보다 정확한 영상을 분할하기 위한 효율적인 도구가 될 것이다.

  • PDF

숫자 영역 탐색에 기반한 자동차 번호판 추출 (Car License Plate Extraction Based on Detection of Numeral Regions)

  • 이득용;오일석
    • 한국ITS학회 논문지
    • /
    • 제7권1호
    • /
    • pp.59-67
    • /
    • 2008
  • 이 논문은 우리나라 차량 영상에서 번호판 영역을 추출하는 알고리즘을 제안한다. 이 논문의 아이디어는 차량 영상에서 네 개의 숫자를 찾고 그 정보를 이용하여 번호판 영역을 분할하는 것이다. 이 방법으로 번호판 영역을 찾으면 네 개 숫자 영역도 더불어 얻게 되는 장점을 가진다. 첫 단계는 입력된 영상에서 적절한 크기의 연결 요소를 검출하고 이들을 군집화 한다. 둘째 군집화 된 연결요소들을 바탕으로 숫자 네 개 (4-digits)후보를 생성한다. 세 번째 단계는 4-digits후보들을 인식하여 숫자일 신뢰도를 측정한다. 마지막으로 후보 영역 중 신뢰도가 가장 높은 영역을 번호판 영역으로 추출한다 신뢰도를 얻기 위해 Perfect Metrics 분류 알고리즘을 사용하였다. 제안하는 방법을 주간 영상 4600장과 야간 영상 264장으로 테스트 한 결과 각각 97.23%와 95.45%의 검출률과 0.09%와 0.11%의 오검출률을 얻었다.

  • PDF

인쇄체 문서의 문자영역에서 한글과 한자의 구별에 관한 연구 (A Study on Classification into Hangeul and Hanja in Text Area of Printed Document)

  • 심상원;이성범;남궁재찬
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.802-814
    • /
    • 1993
  • 본 논문에서는 문서인식시스템의 문자인식부에서 각 문자를 인식하기 위한 전처리 단계인 한글과 한자를 구별하는 알고리즘을 제안한다. 본 연구에서는 문자의 구별에 큰 영향을 미치고, 쓰기형태와 글자체에 따라서 변동을 흡수할 수 있는 9가지의 한자 특성을 제안하고, 문자의 크기에 영향을 받지 않고 문자를 구별할 수 있도록 문자 크기에 따른 비율을 제안된 각 특성에 반영하여 문자의 구별을 행하였다. 입력된 문서 제안한 9가지의 한자 구조적 특성을 조사하여, 한글과 한자로 구별한다. KS-C5601의 한글 2350자와 한자 4888자의 고딕, 명조체에 대하여, 실험결과는 인쇄 표본, 신문, 학회지, 잡지 교재에서 각각 98.8%, 92%, 96%, 98%, 98%을 얻었다.

  • PDF