• Title/Summary/Keyword: k-mean clustering algorithm

Search Result 119, Processing Time 0.023 seconds

데이터 형태에 적응하는 클러스터링 알고리즘 (Data Clustering Algorithm Adaptive to Data Forms)

  • 이기호;이기철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1433-1436
    • /
    • 2000
  • 클러스터링에 있어서 k-means[7], DBSCAN[2], CURE[4], ROCK[5], PAM[8], 같은 기존의 알고리즘은 원형이나 타원형 등의 어느 고정된 모양에 의해 클러스터를 결정한다. 만약 클러스터 하려는 데이터의 분포가 우연히 알고리즘의 결정된 모양과 일치하면 정확한 해를 얻을 수 있다. 하지만 자연적인 데이터의 분포에서는 발생하기 어렵다. 데이터의 형태를 추적하여 이러한 문제점을 해결한 CHAMELEON[1] 알고리즘이 최근에 발표되었다. 하지만 모양에는 독립적이나 데이터의 양이 증가함에 따라 소요되는 시간이 폭발적으로 증가한다. 이것은 기존의 마이닝 데이터들이 대용량이라는 것을 고려하면 현실에 적용하기 힘든 문제점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 K-means[7]]를 이용한 대표를 선출하는 방법으로 CHAMELEON[1]의 문제점 개선(EF-CHAMELEON)을 시도하였으며 여러 자연적인 형태의 도형들은 아주 작은 원형들의 집합으로 구성 될 수 있다는 생각을 기본으로 잡음에 영향을 받지 않을 정도로 아주 작은 초기 다수의 소형 클러스터를 K-mean을 이용하여 구성하고 이를 다시 크러스터간의 상대적인 거리를 이용하여 다시 머지 하는 방법으로 모양에 의존적인 문제를 해결하며 비교사 학습(unsupervised learning)에 충실하기 위해 임계값을 적용 적정 단계에서 알고리즘을 멈추게 한 ADF 알고리즘을 소개한다. 실험 데이터는 기존의 여러 클러스터링 알고리즘이 판별 할 수 없었던 다양한 모양을 가지고있는 2차원 배열을 사용하여 ADF. CHAMELEON[1], EF-CHAMELEON,의 성능을 비교하였다.

  • PDF

칼라 문서에서 문자 영역 추출믹 문자분리 (The Character Area Extraction and the Character Segmentation on the Color Document)

  • 김의정
    • 한국지능시스템학회논문지
    • /
    • 제9권4호
    • /
    • pp.444-450
    • /
    • 1999
  • 본 논문에서는 칼라로 입력된 문서 영상에서 문자 영역추출을 위하여 k-means을 이용한 클러스트링 알고리즘을 제안하였다. 칼라 영상의 클러스트링을 위해서 HIS 좌표계에 적합한 거리함수를 제안하였다. 이를 인식하기 위한 전처리 단계인 문자분리(segmentation)방법은 연결 화소를 이용한 개별문자 추출 알고리즘을 제안하였다. 본 알고리즘 에서는 문자분리방벙에서 접촉문자 (touching character)또는 겹친 문자(overlapped character)등과 같이 분리가 곤란한 문자를 개별문자로 분리하는 방법이다. 기존의 문자 분리방법에서는 투영(projection)dop 의한 방법과 외곽선(edge)추적에 의한 방법등을 사용하여 왔으나 제안된 방법은 문자열 추출후 한번의 투영으로 연결화소를 이용하여 개별문자를 추출한다. 문자 영역과 비 문자 영역을 구분하여 개발문자 추출을 한 결과 단순한 이진 영상이 아닌 칼라 영상에서의 문서 처리가 큰 의의가 있고 기존의 문서 처리기 보다 향상된 알고리즘인 것을 확인하였다.

  • PDF

3차원 형상복원 정보 기반의 검색 자동화를 위한 스테레오 X-선 검색장치에 관한 연구 (The study of the stereo X-ray system for automated X-ray inspection system using 3D-reconstruction shape information)

  • 황영관;이남호
    • 한국정보통신학회논문지
    • /
    • 제18권8호
    • /
    • pp.2043-2050
    • /
    • 2014
  • X-선 탐지장치는 검색 대상물에 대한 단면 정보만을 제공하기 때문에 내용물에 대한 판정의 한계가 있다. 스테레오 X-선 탐지 장치는 검색 대상체에 대한 단면 정보와 논문에서 제안된 볼륨기반의 3차원 형상복원 알고리즘을 통해 3차원 정보를 제공하여 검색효율을 높일 수 있다. 또한, 고속 검색을 위해 자동화 검색에 대한 식별자로 형상복원 결과를 적용하고자 유사한 모형의 15개 샘플에 대한 형상 복원 및 검출율을 분석하였다. 검색대상 모델에 대한 복원 결과는 실측 모델과 비교할 때 각각 폭 (2.56%), 높이 (6.15 %)와 깊이 (7.12 %)의 오차를 보이며 높은 정확도를 나타내었다. 또한 K-Mean 클러스터링 알고리즘을 적용하여 실험한 결과 97 %의 검출 효율이 보였다. 본 논문의 결과는 자동화 시스템을 위한 새로운 검색식별자를 제시하며 추가연구를 통해 검색 시스템의 효율성 향상을 위한 연구를 진행할 것이다.

Preliminary Test of Adaptive Neuro-Fuzzy Inference System Controller for Spacecraft Attitude Control

  • Kim, Sung-Woo;Park, Sang-Young;Park, Chan-Deok
    • Journal of Astronomy and Space Sciences
    • /
    • 제29권4호
    • /
    • pp.389-395
    • /
    • 2012
  • The problem of spacecraft attitude control is solved using an adaptive neuro-fuzzy inference system (ANFIS). An ANFIS produces a control signal for one of the three axes of a spacecraft's body frame, so in total three ANFISs are constructed for 3-axis attitude control. The fuzzy inference system of the ANFIS is initialized using a subtractive clustering method. The ANFIS is trained by a hybrid learning algorithm using the data obtained from attitude control simulations using state-dependent Riccati equation controller. The training data set for each axis is composed of state errors for 3 axes (roll, pitch, and yaw) and a control signal for one of the 3 axes. The stability region of the ANFIS controller is estimated numerically based on Lyapunov stability theory using a numerical method to calculate Jacobian matrix. To measure the performance of the ANFIS controller, root mean square error and correlation factor are used as performance indicators. The performance is tested on two ANFIS controllers trained in different conditions. The test results show that the performance indicators are proper in the sense that the ANFIS controller with the larger stability region provides better performance according to the performance indicators.

퍼지기반의 두뇌영상 영역분할 알고리듬 (Fuzzy-based Segmentation Algorithm for Brain Images)

  • 이효종
    • 대한전자공학회논문지TC
    • /
    • 제46권12호
    • /
    • pp.102-107
    • /
    • 2009
  • 기술의 발달로 의료장비의 현대화가 이루어지고 PACS와 같은 시스템이 보편화되면서 디지털 의료영상처리 기술에 대한 관심이 높아지고 있다. 영역분할 기술은 디지털의료영상처리에서 첫 번째 단계로 필요한 전처리기술이다. 영역분할을 통하여 특정 부위가 종양, 부종, 파손 및 괴사세포와 같은 이상 현상을 나타내는 것을 조기에 발견할 수 있도록 해주고, 의사들이 적절한 처방을 내려줄 수 있도록 도와줄 수 있다. 특히 두뇌영상에서 백질, 회백질 및 CSF(cerebral spinal fluid)의 영역분할은 두뇌연구의 핵심기술이다. 이들 의료영상에서 기존의 윤곽선이나 영역 확장법은 애매한 경계선과 장기내의 물리적 특성이 비균질하여 영역분할의 실패율을 높게 한다. 퍼지기반의 영역분할 알고리듬은 불분명한 경계를 이루는 장기의 영역분할에 강하다고 알려져 있다. 본 연구에서는 자기공명영상이 강하게 나타내는 잡음에도 안정적인 퍼지기반의 영역분할 알고리듬을 제안하였다. 제안된 알고리듬은 이웃화소들을 군집시킬 때에 평균과 분산의 정보를 이용하여 최소한의 계산을 추가함으로써, 기존의 퍼지기반 영역분할 방법에 비하여 실패율이 대략 30% 이하로 낮은 것을 확인하였다.

비교사적 군집화 알고리즘을 이용한 전산화 단층영상의 병소부위 결정에 관한 연구 (Determination of Tumor Boundaries on CT Images Using Unsupervised Clustering Algorithm)

  • 이경후;지영훈;이동한;류성렬;조철구;김미숙;유형준;권수일;전준철
    • Journal of Radiation Protection and Research
    • /
    • 제26권2호
    • /
    • pp.59-66
    • /
    • 2001
  • 정위적분할방사선치료(FSRT)는 병소경계에 대한 공간상위치와 형태를 정확히 결정하는 것이 큰 쟁점이다. 본 연구는 나선형 CT를 이용하여 4명의 뇌종양 환자와 팬톰(파라핀)으로부터 연속적인 횡축 단면상을 얻었다. K-mean 분류 알고리즘을 적용하여 CT영상의 초기정보값을 평균화소값으로 변화시켰다. 영상의 구성은 병소영역, 정상영역, 혼합영역, 바탕영역, 가음영영역의 5영역으로 분류하였다. 주된 관심은 혼합영역 내에서 정상영역과 혼합영역을 어떻게 분리하는 가였다. 5영역 평균화소값 중에서 정상영역과 병소영역에 상대적인 평균편차 분석법을 적용하여 2영역 평균편차 화소값 사이의 최대점을 구하였다. IDL 프로그램을 이용한 반자동윤곽법으로 혼합영역내의 최대점을 연결함으로서 GTV의 경계선을 그렸다. 균일한 팬톰의 관심영역 경계선은 ${\pm}1%$ 이내의 오차로 평가되었다. 환자 4명의 경우는 방사선 전문의들이 그린 병소영역과 K-mean 알고리즘과 상대적인 평균편차 분석법에 의해 자동적으로 묘사된 병소영역과 거의 일치하였다. 이러한 방법들을 사용하여 불분명한 정상영역과 병소영역의 경계선을 명확하게 나타낼 수 있었다. 그러므로 CT 영상이 MRI 영상과 비교하여 간헐적으로 병소윤곽을 보여주지 못할 경우 이 방법은 치료계획을 결정할 때 유용한 CT영상 자료로 활용될 수 있음을 확인하였다.

  • PDF

블록 정합 재작업 시수 예측 시스템에 관한 연구 (A Study on the Prediction System of Block Matching Rework Time)

  • 장문석;유원선;박창규;김덕은
    • 대한조선학회논문집
    • /
    • 제55권1호
    • /
    • pp.66-74
    • /
    • 2018
  • In order to evaluate the precision degree of the blocks on the dock, the shipyards recently started to use the point cloud approaches using the 3D scanners. However, they hesitate to use it due to the limited time, cost, and elaborative effects for the post-works. Although it is somewhat traditional instead, they have still used the electro-optical wave devices which have a characteristic of having less dense point set (usually 1 point per meter) around the contact section of two blocks. This paper tried to expand the usage of point sets. Our approach can estimate the rework time to weld between the Pre-Erected(PE) Block and Erected(ER) block as well as the precision of block construction. In detail, two algorithms were applied to increase the efficiency of estimation process. The first one is K-mean clustering algorithm which is used to separate only the related contact point set from others not related with welding sections. The second one is the Concave hull algorithm which also separates the inner point of the contact section used for the delayed outfitting and stiffeners section, and constructs the concave outline of contact section as the primary objects to estimate the rework time of welding. The main purpose of this paper is that the rework cost for welding is able to be obtained easily and precisely with the defective point set. The point set on the blocks' outline are challenging to get the approximated mathematical curves, owing to the lots of orthogonal parts and lack of number of point. To solve this problems we compared the Radial based function-Multi-Layer(RBF-ML) and Akima interpolation method. Collecting the proposed methods, the paper suggested the noble point matching method for minimizing the rework time of block-welding on the dock, differently the previous approach which had paid the attention of only the degree of accuracy.

Binary Harmony Search 알고리즘을 이용한 Unsupervised Nonlinear Classifier 구현 (Implementation of Unsupervised Nonlinear Classifier with Binary Harmony Search Algorithm)

  • 이태주;박승민;고광은;성원기;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.354-359
    • /
    • 2013
  • 본 논문을 통해서 우리는 최적화 알고리즘인 binary harmony search (BHS) 알고리즘을 이용하여 unsupervised nonlinear classifier를 구현하는 방안을 제시하였다. 패턴인식을 위한 기계학습이나 뇌파 신호의 분석 과정과 같이 벡터로 표현되는 특징들을 분류하는데 있어 다양한 알고리즘들이 제시되었다. 교사 학습기반의 분류 방식으로는 support vector machine과 같은 기법이 사용되어왔고, 비교사 학습 방법을 통한 분류 기법으로는 fuzzy c-mean (FCM)과 같은 알고리즘들이 사용되어 왔다. 그러나 기존에 사용해 왔던 분류 방법들은 비선형 데이터 분류에 적용하기 힘들거나 교사 학습을 적용하기 위해서 사전정보를 필요로 하는 문제점이 있다. 본 논문에서는 경험적 접근을 통해 공간상에 분포된 벡터 사이의 기하학적 거리를 최소로 만드는 벡터 집합을 선택하고 이를 하나의 클래스로 간주하는 방법을 적용한 분류법을 제시하였다. 비교 대상으로 FCM과 artificial neural network (ANN) 기반의 self-organizing map (SOM)을 제시하였다. 시뮬레이션에는 KEEL machine learing dataset을 사용하였고 그 결과, 제안된 방식이 기존 알고리즘에 비해 더 나은 우수성을 지니고 있음을 확인하였다.

HEVC 부호화기 고효율 압축을 위한 인지시각 특징기반 양자화 방법 (Human Visual Perception-Based Quantization For Efficiency HEVC Encoder)

  • 김영웅;안용조;심동규
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.28-41
    • /
    • 2017
  • 본 논문에서는 사람의 인지특성을 기반으로 대조 민감도에 의해 나타나는 특성을 모델링 한 JND (Just Noticeable Difference) 모델을 비디오 코딩에 적용하여 압축률을 높이는 방법을 제안한다. 제안하는 방법은 JND 모델에 따른 임계치를 기준으로 양자화 단계에서 비가시 신호를 제한하여 주관적 화질을 유지하면서 비트율을 낮추는 방법으로, 변환을 통해 주파수 도메인으로 변환된 잔차 신호들을 양자화 단계에서 입력으로 받아 신호제한 및 양자화를 수행한다. 양자화 단계에서 주파수 도메인의 신호가 JND 관점에서 유사하게 인지되는 기준 임계치를 구해 잔차 신호에서 비가시 신호를 제한하고 양자화를 수행한 후, 최적의 율-인지왜곡 비용을 갖는 양자화 계수를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증은 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 적용했으며, CTC (Common Test Condition)의 Random Access 모드에서 HM 16.0을 통해 압축된 영상 대비 평균 4.11%, BQTerrace 영상의 양자화 파라미터 22에서 최대 17.22%의 비트율 절감을 보였으며, Low Delay 모드에서 평균 7.16%, 최대 22.55%, All intra 모드에서 평균 13.41%, 최대 21.64%의 비트율 절감을 보였다. 5명의 평가자들의 주관적 화질 측정으로 평균 DMOS (Difference Mean Opinion Score) 값은 최대 약 0.36 최소 0 정도의 분포를 보였다.

펴지 군집화 알고리즘 기반의 웨이블릿 변환을 이용한 3차원 얼굴 인식 (3D Face Recognition using Wavelet Transform Based on Fuzzy Clustering Algorithm)

  • 이영학
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1501-1514
    • /
    • 2008
  • 깊이 값에 따른 얼굴의 형상은 사람의 특징을 나타내는 중요한 요소 중의 하나로서 각 사람마다 다른 모양을 가지고 있다. 다른 형상을 가진 얼굴 영상으로부터 분리한 주파수 성분은 동일 얼굴에 대한 또 다른 중요 특징 성분의 하나가 될 수 있다. 본 논문은 3차원 얼굴 영상에서 등고선 값을 따라 추출된 영역에 대하여 각 영역별로 주파수 분리를 이용하여 특징을 추출한다. 그리고 이 주파수에 대한 수정된 퍼지 군집화를 적용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾는다. 이를 이용하여 회전된 얼굴에 대해 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 이는 사람마다 서로 다른 형상 특징을 가진다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 이산 웨이블릿 변환을 이용하여 4가지의 주파수 성분을 추출하여 특징정보로 사용한다. 각각의 웨이블릿 주파수 성분을 추출한 등고선 영역에 대해 차원의 감소를 위하여 고유얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형 판별 분석 알고리즘을 이용하여 유사도를 비교하였다. 본 논문에서는 클래스간의 분별 정보를 향상시키고자 각각의 등고선 영역과 각 영역의 주파수별로 수정된 퍼지 군집화 알고리즘을 적용하여 인식률을 향상 시켰으며, 코끝으로부터 깊이 값이 60인 영역의 경우 98.3%의 인식률을 나타내었다.

  • PDF