• 제목/요약/키워드: K-Mean++ 클러스터링

검색결과 83건 처리시간 0.032초

Support Vector Machine을 이용한 선에코 특성 분석 및 탐지 방법 (Analysis and Detection Method for Line-shaped Echoes using Support Vector Machine)

  • 이한수;김은경;김성신
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.665-670
    • /
    • 2014
  • SVM은 학습 데이터를 두 개의 집단으로 분리시키는 최적의 초평면을 찾는 이진 분류기로서 우수한 성능 때문에 다양한 분야에서 귀납 추론, 이진 분류, 예측 등을 목적으로 사용되는 알고리즘이다. 또한 대표적인 블랙박스 모델 중 하나이기 때문에 학습 후 생성되는 SVM의 해석에 대한 연구도 활발히 진행되고 있다. 본 논문에서는 SVM 알고리즘을 이용하여 기상 레이더의 데이터 내에 비교적 높은 빈도로 발생하여 기상 예보의 정확도를 감소시키는 비강수에코 중 하나인 선에코를 자동으로 탐지하는 방법에 대한 연구를 수행하였다. 학습 데이터로는 평균 반사도, 크기, 발생 형태, 중심 고도 등과 같은 특성을 활용하였는데, 이는 기상 레이더 데이터에 저장된 다양한 데이터 중 반사도 값을 선택한 후 클러스터링 기법을 통해 추출한 것이다. 이와 같이 학습된 SVM 분류기를 실제 사례를 바탕으로 하여 검증하였으며, Decision Tree 알고리즘을 적용하여 생성한 분류기의 해석을 수행하였다.

산업용 CT 볼륨데이터에서 템플릿 매칭을 통한 이물질 자동 검출 (Automatic Detection of Foreign Body through Template Matching in Industrial CT Volume Data)

  • 지혜림;홍헬렌
    • 한국멀티미디어학회논문지
    • /
    • 제16권12호
    • /
    • pp.1376-1384
    • /
    • 2013
  • 본 논문에서는 산업용 CT 볼륨데이터에서 템플릿 매칭을 통하여 제품의 이물질을 자동 검출하는 기법을 제안한다. 제안방법은 다음과 같은 세 단계로 이루어진다. 첫째, 다운 샘플링 데이터에서 잡음제거 후 제품을 배경과 분리하고, 영상의 평균값 및 표준편차를 이용하여 초기 이물질 후보를 추출한 후, K-평균 클러스터링을 이용하여 이물질 후보를 추출한다. 둘째, 템플릿 매칭을 이용하여 제품과 유사도가 다른 이물질을 검출한다. 이 때, 검출하고자 하는 이물질의 크기에 따라 밝기값평균차이(SSD)와 조인트 엔트로피를 이용한 유사도 평가를 통하여 이물질을 검출한다. 셋째, 원 볼륨데이터에서 이물질 검출률을 개선하기 위하여 여과기법으로 제품의 이물질을 최종 검출한다. 본 제안 방법의 결과를 평가하기 위해 산업용 CT 볼륨데이터와 시뮬레이션 데이터를 사용하여 육안평가, 정확성 평가와 수행시간 측정을 수행하였다. 정확성 평가를 위하여 기존 밝기값 기반 검출 기법을 비교방법으로 사용하고, 다이스 계수 유사도를 측정하였다.

가중치 기반 Bag-of-Feature와 앙상블 결정 트리를 이용한 정지 영상에서의 인간 행동 인식 (Human Action Recognition in Still Image Using Weighted Bag-of-Features and Ensemble Decision Trees)

  • 홍준혁;고병철;남재열
    • 한국통신학회논문지
    • /
    • 제38A권1호
    • /
    • pp.1-9
    • /
    • 2013
  • 본 논문에서는 CS-LBP (Center-Symmetric Local Binary Pattern) 특징과 공간 피라미드를 이용한 BoF (Bag of Features)를 생성하고 이를 랜덤 포레스트(Random Forest) 분류기에 적용하여 인간의 행동을 인식하는 알고리즘을 제안한다. BoF를 생성하기 위해 영상을 균일한 패치로 나누고, 각 패치 마다 CS-LBP 특징을 추출한다. 행동 분류 성능을 향상시키기 위해 패치들마다 추출한 특징벡터들에 대해 K-mean 클러스터링을 적용하여 코드 북을 생성한다. 본 논문에서는 영상의 지역적인 특성을 고려하기 위해 공간 피라미드 방법을 적용하고 각 공간 레벨에서 추출된 BoF에 대해 가중치를 적용하여 최종적으로 하나의 특징 벡터로 결합한다. 행동 분류를 위해 결정트리의 앙상블로 이루어진 랜덤 포레스트는 학습 단계에서 각 행동 클래스를 위한 분류 모델을 만든다. 가중 BoF가 적용된 랜덤 포레스트는 다양한 인간 행동 영상을 포함하고 있는 Standford Actions 40 데이터를 성공적으로 분류하였다. 또한 기존 방법에 비해 분류 성능이 유사하거나 우수하며, 한 장의 영상에 대해 빠른 인식속도를 보였다.

메탄 가스 기반 가스 누출 위험 예측을 위한 다변량 특이치 제거 (Multivariate Outlier Removing for the Risk Prediction of Gas Leakage based Methane Gas)

  • 홍고르출;김미혜
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.23-30
    • /
    • 2020
  • 본 연구에서는, 천연가스(NG) 데이터와 가스 관련 환경 요소 간의 관계를 기계학습 알고리즘을 사용하여 가스 누출 데이터를 직접 측정하지 않고 가스 누출 위험 수준을 예측하였다. 이번 연구는 서버가 제공하는 오픈 데이터인 IoT 기반 원격 제어 피카로(Picarro) 가스 센서 사양을 기반으로 사용했다. 천연 가스는 공기 중으로 누출이 되며, 대기 오염, 환경, 그리고 건강에 큰 문제가 된다. 본 연구에서 제안하는 방법은 천연 가스의 누출 위험 예측을 위한 랜덤 포레스트(Random Forest) 분류 기반 다변량 특이치 제거 방법이다. 비지도 k-평균 클러스터링 후에 실험 데이터 집합은 불균형 데이터이다. 따라서 우리는 제안된 모델이 중간과 높은 위험 수준을 가장 잘 예측할 수 있다는 점에 초점을 맞춘다. 이 경우 각 분류 모델에 대한 수신자 조작 특성(ROC) 곡선, 정확도, 평균 표준 오차(MSE)를 비교했다. 실험 결과로 정확도, 수신자 조작 특성의 곡선 아래 영역(AUC, Area Under the ROC Curve), MSE가 각각 MOL_RF의 경우 99.71%, 99.57%, 및 0.0016의 결과 값을 얻었다.

Binary Harmony Search 알고리즘을 이용한 Unsupervised Nonlinear Classifier 구현 (Implementation of Unsupervised Nonlinear Classifier with Binary Harmony Search Algorithm)

  • 이태주;박승민;고광은;성원기;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.354-359
    • /
    • 2013
  • 본 논문을 통해서 우리는 최적화 알고리즘인 binary harmony search (BHS) 알고리즘을 이용하여 unsupervised nonlinear classifier를 구현하는 방안을 제시하였다. 패턴인식을 위한 기계학습이나 뇌파 신호의 분석 과정과 같이 벡터로 표현되는 특징들을 분류하는데 있어 다양한 알고리즘들이 제시되었다. 교사 학습기반의 분류 방식으로는 support vector machine과 같은 기법이 사용되어왔고, 비교사 학습 방법을 통한 분류 기법으로는 fuzzy c-mean (FCM)과 같은 알고리즘들이 사용되어 왔다. 그러나 기존에 사용해 왔던 분류 방법들은 비선형 데이터 분류에 적용하기 힘들거나 교사 학습을 적용하기 위해서 사전정보를 필요로 하는 문제점이 있다. 본 논문에서는 경험적 접근을 통해 공간상에 분포된 벡터 사이의 기하학적 거리를 최소로 만드는 벡터 집합을 선택하고 이를 하나의 클래스로 간주하는 방법을 적용한 분류법을 제시하였다. 비교 대상으로 FCM과 artificial neural network (ANN) 기반의 self-organizing map (SOM)을 제시하였다. 시뮬레이션에는 KEEL machine learing dataset을 사용하였고 그 결과, 제안된 방식이 기존 알고리즘에 비해 더 나은 우수성을 지니고 있음을 확인하였다.

3차원 형상복원 정보 기반의 검색 자동화를 위한 스테레오 X-선 검색장치에 관한 연구 (The study of the stereo X-ray system for automated X-ray inspection system using 3D-reconstruction shape information)

  • 황영관;이남호
    • 한국정보통신학회논문지
    • /
    • 제18권8호
    • /
    • pp.2043-2050
    • /
    • 2014
  • X-선 탐지장치는 검색 대상물에 대한 단면 정보만을 제공하기 때문에 내용물에 대한 판정의 한계가 있다. 스테레오 X-선 탐지 장치는 검색 대상체에 대한 단면 정보와 논문에서 제안된 볼륨기반의 3차원 형상복원 알고리즘을 통해 3차원 정보를 제공하여 검색효율을 높일 수 있다. 또한, 고속 검색을 위해 자동화 검색에 대한 식별자로 형상복원 결과를 적용하고자 유사한 모형의 15개 샘플에 대한 형상 복원 및 검출율을 분석하였다. 검색대상 모델에 대한 복원 결과는 실측 모델과 비교할 때 각각 폭 (2.56%), 높이 (6.15 %)와 깊이 (7.12 %)의 오차를 보이며 높은 정확도를 나타내었다. 또한 K-Mean 클러스터링 알고리즘을 적용하여 실험한 결과 97 %의 검출 효율이 보였다. 본 논문의 결과는 자동화 시스템을 위한 새로운 검색식별자를 제시하며 추가연구를 통해 검색 시스템의 효율성 향상을 위한 연구를 진행할 것이다.

Prompt engineering to improve the performance of teaching and learning materials Recommendation of Generative Artificial Intelligence

  • Soo-Hwan Lee;Ki-Sang Song
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.195-204
    • /
    • 2023
  • 본 연구에서는 GPT, Stable Diffusion과 같은 생성형 인공지능을 이용한 교수·학습 자료 추천 성능 향상을 위해 프롬프트를 개선하는 프롬프트 엔지니어링에 대해 탐색하였다. 분석할 교수·학습 자료의 종류는 그림 자료이다. 프롬프트 구성에 따른 영향을 탐색하기 위해 명령만 담긴 Zero-Shot 프롬프트, 학습 대상 학년 정보가 담긴 프롬프트, 학습 목표가 담긴 프롬프트, 학습 대상 학년과 학습 목표가 모두 담긴 프롬프트를 설계하여 각각을 GPT-3.5모델에 입력하고 응답을 수집하였다. 수집한 응답을 Sentence Transformers로 임베딩 하고 t-SNE를 활용하여 차원 축소하여 시각화 한 다음 프롬프트와 응답 간의 관계를 탐색하였다. 그리고 각 응답을 k-means clustering algorithm을 활용하여 군집화 한 다음 가장 넓은 클러스터의 첫 번째 값을 대표로 선택하여 Stable Diffusion을 이용하여 이미지화 한 다음 교수·학습자료 평가 기준에 따라 초등학교 교사 30명에게 평가 받았다. 초등학교 교사 30인은 추천한 4종의 그림 자료 중 3종은 교육적 가치가 있다고 판단하였으며, 그 중 2종은 실제 수업에 사용할 수 있다고 하였다. 가장 가치 있는 그림 자료를 추천한 프롬프트는 대상 학년과 학습 목표가 모두 담긴 프롬프트로 나타났다.

이중 마이크로폰을 이용한 비음수 행렬분해 기반 다중음원 도래각 예측 (Nonnegative Matrix Factorization Based Direction-of-Arrival Estimation of Multiple Sound Sources Using Dual Microphone Array)

  • 전광명;김홍국;유승우
    • 전자공학회논문지
    • /
    • 제54권2호
    • /
    • pp.123-129
    • /
    • 2017
  • 본 논문에서는 이중 마이크로폰 배열을 이용하여 비음수 행렬분해(nonnegative matrix factorization, NMF) 기반으로 다중음원의 도래각을 추정하는 새로운 방법을 제안한다. 우선 이중 마이크로폰 배열에 들어온 음향 신호들을 연속된 분석프레임으로 분할한 후, 각 프레임에 대해 조향응답파워 위상변환(steered-response power phase transform, SRP-PHAT) 빔형성기를 적용하여 스테레오 신호들을 시간-방향 영역으로 표현한다. 이러한 SRP-PHAT의 시간-방향 출력값들은 사전에 정의된 프레임 수만큼 누적하여 시간-방향 블록으로 정의한다. 다음으로, 잡음에 강건한 도래각 추정을 위하여, 각 시간-방향 블록을 블록차감 기법을 사용하여 매 프레임에 대해 정규화한다. 이후, 다중음원 환경에서 각 음원의 방향을 클러스터링하기 위해 정규화된 시간-방향 블록에 비지도(unsupervised) NMF를 적용한다. 구체적으로, 음원의 개수와 이들의 도래각을 추정하는데 각각 활성 및 기저 행렬들을 사용한다. 제안된 방법의 도래각 추정 성능을 평가하기 위해 이중 마이크로폰 배열로부터 입력된 [$-35{\circ}$, 5m], [$12{\circ}$, 4m], 그리고 [$38{\circ}$, 4.m]에 각각 위치한 세 가지 음원들에 대한 추정 오차의 절대 평균(mean absolute error, MAE) 및 오차의 표준편차를 측정하였다. 실험 결과. 제안된 방법은 기존의 SRP-PHAT 기반 도래각 추정방법에 비해 상대적으로 MAE를 56.83% 줄일 수 있었다.

클러스터링 기법을 이용한 하이브리드 영화 추천 시스템 (Hybrid Movie Recommendation System Using Clustering Technique)

  • 싯소포호트;펭소니;양예선;일홈존;김대영;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.357-359
    • /
    • 2023
  • This paper proposes a hybrid recommendation system (RS) model that overcomes the limitations of traditional approaches such as data sparsity, cold start, and scalability by combining collaborative filtering and context-aware techniques. The objective of this model is to enhance the accuracy of recommendations and provide personalized suggestions by leveraging the strengths of collaborative filtering and incorporating user context features to capture their preferences and behavior more effectively. The approach utilizes a novel method that combines contextual attributes with the original user-item rating matrix of CF-based algorithms. Furthermore, we integrate k-mean++ clustering to group users with similar preferences and finally recommend items that have highly rated by other users in the same cluster. The process of partitioning is the use of the rating matrix into clusters based on contextual information offers several advantages. First, it bypasses of the computations over the entire data, reducing runtime and improving scalability. Second, the partitioned clusters hold similar ratings, which can produce greater impacts on each other, leading to more accurate recommendations and providing flexibility in the clustering process. keywords: Context-aware Recommendation, Collaborative Filtering, Kmean++ Clustering.

국내 주요 강 생태계 내 동물플랑크톤의 탄소, 질소, 인 비율 해석 (Carbon, Nitrogen and Phosphorous Ratios of Zooplankton in the Major River Ecosystems)

  • 김현우;라긍환;정광석;김동균;황순진;이재용;김범철
    • 생태와환경
    • /
    • 제46권4호
    • /
    • pp.581-587
    • /
    • 2013
  • 국내 주요 강 생태계 (한강, 금강, 영산강, 섬진강)에서 지난 2004년부터 2008년까지 총 동물플랑크톤의 탄소(C), 질소(N) 및 인(P) 함량에 대해 평가하였다. 동물플랑크톤의 건중량 당 C, N P-함량은 강 시스템별로 변화가 뚜렷하였다. 조사지점별 평균 C, N, 그리고 P-함량의 범위는 $70{\sim}620mgC\;mg^{-1}$ D.W., $7.1{\sim}85.5{\mu}gN\;mg^{-1}$ D.W. 그리고 $2.5{\sim}7.4{\mu}gP\;mg^{-1}$ D.W.인 것으로 파악되었다. 평균 탄소: 질소: 인 비율은 지점별 상이한 차이를 보였으며 전 지점의 평균은 200 : 29 : 1인 것으로 파악되었다. 전 조사지점에서의 동물플랑크톤 군집의 탄소: 인 그리고 질소: 인 비율의 범위는 각 각 38에서 392 : 1과 4에서 65 : 1이었다. 자가조직화지도(SOM)을 활용한 평면상 지점들의 배치 양상과 화학양론 자료들 간의 주요그룹 분석 결과 크게 세 클러스터로 구분되었다. 클러스터링 결과 동물플랑크톤의 C, N, P-함량은 공간적 이질성에 의해 영향을 받았으며, 화학량론 자료는 강 생태계의 환경 특성 해석에 활용성이 높은 것으로 사료되었다.