• Title/Summary/Keyword: k-Means 알고리즘

Search Result 773, Processing Time 0.034 seconds

Recognition of Digit Strings from Celluar Phone image by Sequential Color Clustering (순차적 칼라 클러스터링에 기반 한 휴대폰 카메라 영상에서의 숫자열 인식)

  • 박현일;김수형
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.766-768
    • /
    • 2004
  • 자연영상에서 획득된 문자를 인식하는 연구는 대부분 디지털 카메라나 캠코더를 이용하여 획득된 고해상도 영상을 입력영상으로 사용하고 있다. 본 논문에서는 휴대폰 카메라로 획득된 저해상도 영상을 입력영상으로 사용하였다. 저해상도의 영상은 적은 수의 픽셀로 정보를 표현하고 있기 때문에 기존에 제시되었던 다양한 이진화 방법으로는 문자와 배경을 깨끗하게 분리해 낼 수 없다. 본 논문은 입력영상의 이진화를 위친 K-Means 알고리즘을 이용하여 칼라 클러스터링을 하였으며, 이진화 성능을 향상시키기 위해 지능형 주파수 필터를 사용하였다. 이진화된 영상을 파이프라인 구조의 인식 시스템에 인식시킴으로써 기존의 제안 방법들에 비하여 인식 성능을 향상시킬 수 있었다.

  • PDF

Multi-Dimension Visualization Proposition and Clustering of Remote Sensing Data Using Star Coordinates Technique (Star Coordinates 기법을 이용한 원격탐사 데이터의 다차원 시각화 제안 및 클러스터링)

  • Kim, Dae-Sung;Kim, Yong-Il;Yu, Ki-Yun
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2005.05a
    • /
    • pp.313-318
    • /
    • 2005
  • 단 밴드 영상과는 달리 다차원 데이터는 분광적인 특성을 이용한 자동화된 영상 분석을 수행하는 장점이 있는 반면, 3차원 이상의 데이터를 분광차익 상에 시각화 하는데 어려움이 따른다. 클러스터링 기법을 이용한 영상 정보 추출은 자동화된 영상 분석적인 측면에서 중요한 분야 중 하나로서, 분광차원에서 구 형태의 조밀한 클러스터를 분리하는데 효과적인 방법으로 알려져 있지만 부정형(不定形)의 클러스터를 추출하는 방법에는 한계를 가진다. 따라서 본 연구는 모든 차원의 데이터를 2차원 상에 시각화하여 화소간 인접성을 개략적으로 확인할 수 있는 Star Coordinates 기법을 제안한다. 데이터의 다차원 시각화를 통해, 부정형 클러스터를 제거하여 다음 단계의 영상 분석 시 발생할 수 있는 오류를 방지할 수 있고, 명확한 클러스터를 확인 지정하여 클러스터링 정확도를 골일 수 있을 것으로 기대된다. 부가적인 연구고서, Star Coordinates 기법을 적용하여 Plot된 영상 데이터를 K-Means 알고리즘을 이용한 무감독 분류를 수행하여 그 결과를 확인하였다.

  • PDF

Outlier Data Clustering using Factor Score (인자 점수를 이용한 이상치 데이터의 군집화)

  • 전성해;임민택;오경환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.77-80
    • /
    • 2002
  • 이상치를 포함한 학습 데이터의 군집화 전략은 일반적으로 이상치를 포함하여 학습하거나, 이상치를 제거하는 두 가지 선택이 가능하다. 이상치를 제거하지 않고 학습에 반영시켜야 할 경우 한 개 또는 소수의 이상치가 독자적인 군집을 형성하거나 객관적인 군집화를 방해하는 문제가 발생할 수 있다. 이 때 주어진 학습 데이터의 군집 결과가 이상치의 영향으로부터 벗어나기 위해 원래의 학습 데이터에 대한 변환 작업을 거친 후 군집화를 수행할 수 있다. 이러한 변환 방법으로서 본 논문에서는 차원 축소의 기법으로 알려진 인자 분석의 점수를 사용하였다. 인자 점수로 변환된 학습 데이터에 대해 계층적 군집화, K-means 그리고 자기조직화 지도 등과 같은 군집화 알고리즘을 적용하면 이상치가 자신만의 군집을 별도로 형성하지 않고 다른 학습 데이터의 군집에 소속되면서 이상회의 영향으로부터 벗어남을 실험을 통하여 확인하였다.

  • PDF

Optimize Data Glove-based System for Korean Finger Spelling Recognition (한글 지화 인식에 최적화된 데이터 글러브 시스템)

  • Min, Seung-Ki;Oh, Sang-Hyeok;Kim, Gyo-Ryeong;Yoon, Tae-Hyun;Lim, Chun-Gyu;Lee, Yun-Ii;Jung, Kee-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.237-241
    • /
    • 2007
  • 본 논문에서는 지화 인식에 최적화된 데이터 글러브 기반의 시스템을 제안한다. 제안된 데이터 글러브는 적은 수의 센서로 인식 속도의 향상을 기대할 수 있으며 한글의 지화 인식만을 위한 특수한 목적을 가지고 저렴하게 설계되었다. 그에 따라 한글의 지화를 사용한 많은 어플리케이션에 쉽게 적용할 수 있을 것이 기대된다. 2개의 틸트 센서는 손의 방향을 인식하고 5개의 플렉스 센서는 각 손가락의 구부러진 정도를 측정한다. 제안된 시스템에서는 k-means 알고리즘과 간단한 인덱싱 방식을 사용하여 한글의 기본적인 음소 24개를 인식하는 실험을 하였으며 인식율은 80.27% 에 이르렀다.

  • PDF

A Comparative Study on Parameter for Korean Phoneme-based HMM Model Decision (한국어 음소 HMM 모델 결정을 위한 파라미터 비교 연구)

  • 권혁제
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.302-305
    • /
    • 1998
  • 음소의 확률적 분포를 이용하는 음소 HMM 모델을 결정하기 위한 여러 가지 거리 측정방법에 대한 연구이다. 음소 HMM 모델 결정을 위해서 LPC 계수를 이용하고, 거리 측정자를 LPC 계수, LPC 스첵트럼, LPC 켑스트럼 등의 파라미터를 이용하고, 또한 양자화 과정은 k-means 와 LBG 알고리즘을 혼합한 하이브리드 알고리듬을 사용하였다. LPC 코드북을 구성하기 위해 세 가지 파라미터를 유클리디안 거리로 거리측정에 이용하였다. 이렇게 양자화한 파라미터의 평균과 분산을 구하고, 양자화한 파라미터 코드북의 확률갑승ㄹ 비교해 한국어 음소 HMM 모델 결정을 위한 거리 측정 파라미터를 비교하였으며, 그 결과 LPC 계수를 주파수 영역으로 변환하여 유클리디안 거리를 이용한 코드북의 분산이 작으므로 상대적으로 높은 확률을 가짐을 보았다.

  • PDF

Unsupervised Classification of KOMPSAT EOC Imagery Based on Independent Component Analysis (독립 요소 분석 기반의 KOMPSAT EOC영상 무감독 분류)

  • 변승건;이호영;이쾌희
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.04a
    • /
    • pp.581-587
    • /
    • 2003
  • 독립 요소 분석 (Independent Component Analysis: ICA)는 텍스처를 의미 있는 특징으로 변환하는 강인한 영상 필터를 생성하기 위한 확률적 방법이다. ICA는 고차통계적 특성을 사용하여 ICA 필터와 독립 요소를 동시에 학습한다. 제안한 분류 방법은 fast ICA 알고리즘을 사용하여 KOMPSAT 영상으로부터 ICA 필터를 생성한 다음, 필터에 의해 투영된 텍스처들의 특징들을 독립 평면상에서 무감독 방법으로 분류한다. KOMPSAT 영상은 텍스처 성분이 뚜렷하지 않는 영역이 존재하기 때문에 본 논문에서는 투영된 특징 값들과 윈도우 내의 정규화된 평균 화소값으로 특징 벡터를 재구성하였다. 분류 방법으로는 K-means 클러스터링을 적용하였다. 6.6m 해상도를 가진 KOMPSAT 흑백 영상에 대해 제안한 방법은 우수한 분류 성능을 보인다.

  • PDF

OMR Sheet Recognition Algorithm Using QR code Recognition and Perspective Transform (QR 코드 인식 및 투영 변환을 이용한 OMR 인식 알고리즘)

  • Heo, Sang Hyung;Kwon, Seong-Geun
    • Journal of Korea Multimedia Society
    • /
    • v.21 no.4
    • /
    • pp.464-470
    • /
    • 2018
  • With the introduction of the e-learning since 2000, the place of the education has not been limited to off-line, but the range of it has become broader in online. The e-learning market has evolved steadily over time. With the advent of the term "Edu-tech", which means a combination of education and technology, various IT technologies have incorporated education. Particularly, the Korean education market collects patterns by computerizing the learning history in classes taught according to curriculums. Because of that environment, various personalized learning services have been developed which maximize the effect of the learning. These services have qualitative differences depending on how many data is accumulated and algorithms are developed for the precise analysis. The purpose of this study is to recognize and data-ize OMR marking by the most suitable method to convert analog data into digital data without harming the Korean education system.

Diagnosis Design Using Embedded Transmission Simulator (임베디드 변속기 시뮬레이터를 이용한 진단알고리즘 설계)

  • Jung, G.H.;Kim, K.D.
    • 유공압시스템학회:학술대회논문집
    • /
    • 2010.06a
    • /
    • pp.56-61
    • /
    • 2010
  • Simulator is a development equipment which enables the ECU to operate in normal mode by simulating the interface signal between ECU and mechanical system electrically. Embedded simulator means simulation function is embedded in ECU firmware, hence the electrical signal interface is replaced by the substitution of information at system program level. This paper explains the development of embedded transmission simulator for the verification of TCU firmware function which covers shifting control and on-board diagnosis. The embedded simulation program is executed in TCU processor along with the TCU firmware and it provides TCU firmware with not only the speed information those are appropriate both in driving and shifting conditions, but also the fault detection signals. Experimental results show that the validity of embedded simulator and its usefulness to the TCU firmware development and verification.

  • PDF

Recruiting Ranking Techniques Based on Hybrid Using Clustering (군집화를 이용한 하이브리드 기반 채용검색 랭킹 기법)

  • Cho, Bo-Yun
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.1587-1590
    • /
    • 2012
  • 인터넷의 활용이 보편화 됨에 따라 정보의 양은 급격히 늘어나고 있다. 이에 취업을 희망하는 구직자의 경우 IR 로부터 원하는 정보를 검색하기 위해 과거보다 더 많은 시간과 노력이 필요하게 되었다. 이에 본 논문에서는 TF(Term Frequency)기법을 통해 문서를 추출하고 추출된 문서의 Doc_ID 빈도수를 기준으로 한 내용기반과 군집기법을 혼합한 하이브리드 검색 시스템을 제안한다. 구직자들이 클릭한 취업정보들의 링크번호들을 K-means 알고리즘을 이용하여 군집화를 한다. 생성된 군집들은 각기 하나의 문서로 가정하고, 기존 문서과 더불어 검색 주제와 연관성을 갖고 있는 문서들을 동적비율로 검색 랭킹 하는 방식이다. 기존의 IR 기술과의 비교 실험을 통해 성능을 평가하였다. 실험결과 본 논문에서 제안한 방법이 기존의 방법보다 우수함을 확인할 수 있었다

Enhancement of Mobile Authentication System Performance based on Multimodal Biometrics (다중 생체인식 기반의 모바일 인증 시스템 성능 개선)

  • Jeong, Kanghun;Kim, Sanghoon;Moon, Hyeonjoon
    • Annual Conference of KIPS
    • /
    • 2013.05a
    • /
    • pp.342-345
    • /
    • 2013
  • 본 논문은 모바일 환경에서의 다중생체인식을 통한 개인인증 시스템을 제안한다. 다중생체인식을 위하여 얼굴인식과 화자인식을 선택하였으며, 시스템의 인식 시나리오는 다음을 따른다. 얼굴인식을 위하여 Modified census transform (MCT) 기반의 얼굴검출과 k-means 클러스터 분석 (cluster analysis) 알고리즘 기반의 눈 검출을 통해 얼굴영역 전처리를 수행하고, principal component analysis (PCA) 기반의 얼굴인증 시스템을 구현한다. 화자인식을 위하여 음성의 끝점 추출과 Mel frequency cepstral coefficient(MFCC) 특징을 추출하고, dynamic time warping (DTW) 기반의 화자 인증 시스템을 구현한다. 그리고 각각의 생체인식을 본 논문에서 제안된 방법을 기반으로 융합하여 인식률을 향상시킨다.