• 제목/요약/키워드: 클러스터링 문제

검색결과 429건 처리시간 0.021초

멀티채널 비음수 행렬분해와 정규화된 공간 공분산 행렬을 이용한 미결정 블라인드 소스 분리 (Underdetermined blind source separation using normalized spatial covariance matrix and multichannel nonnegative matrix factorization)

  • 오순묵;김정한
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.120-130
    • /
    • 2020
  • 본 논문은 블라인드 소스 분리 분야에서 널리 사용되는 멀티채널 비음수 행렬 분해 기법의 단점을 개선하여 미결정 복잡한 혼합 환경에서 문제를 해결한다. 공간 공분산 행렬에 기반을 둔 기존의 연구들에서, 단일 채널의 파워게인 및 상관관계와 같은 값으로 구성된 행렬의 각 요소는 높은 분산으로 인해 분리된 소스의 품질을 저하시키는 경향이 있다. 이 논문에서는 추정된 소스들을 효과적으로 클러스터링하기 위해 레벨 및 주파수 정규화를 수행한다. 따라서 새로운 공간 공분산 행렬 및 효과적인 클러스터 쌍별 거리함수를 제안한다. 본 논문에서는 제안된 행렬을 공간 모델의 초기화에 활용하여 공간 모델의 향상된 추정과 이를 바탕으로 상향식 접근법에서의 계층적 응집 클러스터링에 활용함으로써 분리된 음원의 품질을 향상시켰다. 제안된 알고리즘은 'Signal Separation Evaluation Campaign 2008 development dataset'을 활용하여 실험을 하였다. 그 결과 객관적인 소스 분리 품질 검증 도구인 'Blind Source Separation Eval toolbox'를 활용하여 대부분의 성능향상지표에서의 향상을 확인하였으며, 특히 대표적인 수치인 SDR의 1 dB ~ 3.5 dB 정도의 성능우위를 검증하였다.

유사한 인기도 추세를 갖는 웹 객체들의 클러스터링 (Clustering of Web Objects with Similar Popularity Trends)

  • 노웅기
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.485-494
    • /
    • 2008
  • 인터넷이 광범위하게 활용됨에 따라 검색 키워드, 멀티미디어 객체, 웹 페이지, 블로그 등의 다양한 웹 객체들이 크게 증가하고 있다. 이러한 웹 객체들의 인기도는 시간에 따라 변화하며, 그러한 웹 객체 인기도의 시간적 패턴에 대한 마이닝이 여러 가지 웹 응용에 필요한 중요한 연구 과제가 되고 있다. 예를 들어, 검색 키워드에 대한 인기도 패턴의 분석은 앞으로 인기가 높아질 키워드를 미리 예측할 수 있게 하여 광고주들에게 키워드를 판매하기 위한 가격을 결정하는 데에 중요한 자료가 될 수 있다. 하지만, 웹 객체 인기도가 시간에 따라 변화하고 웹 객체의 개수가 매우 방대하다는 특성으로 인하여 웹 객체 인기도에 대한 분석은 매우 어려운 문제이다. 본 논문에서는 웹 객체 인기도의 시간적 패턴을 마이닝하기 위한 효율적인 알고리즘을 제안한다. 본 논문은 웹 객체 인기도를 시계열로 표현하고, 두 웹 객체 인기도 간의 유사성을 측정하기 위하여 gap 척도를 제안한다. gap 척도의 효율적인 계산을 위하여 FFT를 활용한 알고리즘을 제안하고, 밀도기반 클러스터링 알고리즘을 이용하여 유사한 인기도 추세를 갖는 웹 객체들의 클러스터를 생성한다. 본 논문에서는 웹 객체 인기도가 특정 분포를 따르거나 주기적이라고 가정하지 않는다. Google Trends 웹 사이트로부터 구한 검색 키워드 인기도를 이용한 실험을 통하여, 제안된 알고리즘이 실세계 응용에서 유용함을 보인다.

클러스터링 기반의 최적 차량 운행 계획 수립을 위한 비교연구 (Comparative Analysis for Clustering Based Optimal Vehicle Routes Planning)

  • 김재원;신광섭
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.155-180
    • /
    • 2020
  • 화물의 수배송을 위한 차량의 배차 및 최적 경로 설계는 물류 서비스의 효율성 향상을 위한 가장 핵심적인 역할을 담당한다. 이 문제는 차량의 대수, 차량별 적재 용량, 차량의 총 이동거리와 같이 다양한 비용 요소를 동시에 고려해야 하기 때문이다. 최근 비용 최소화 및 운영 효율성 향상을 위해 TMS를 도입하는 사례가 증가하고 있으나, 현장에서 필요한 모든 요소를 고려하지 못한다는 한계가 존재한다. 이를 해결하기 위해 현장 전문가가 TMS의 결과를 경험과 직관에 기반하여 수정하는 과정이 필요하다. 본 연구에서는 지금까지 총 비용의 최소화에 집중하고 있는 기존 연구들과 달리 서비스에 투입되는 자원 활용의 효율성과 형평성을 동시에 높일 수 있는 방법을 제안한다. 이를 위해 Cluster-First Route-Second (CFRS)기법을 활용한다. 고객의 위치를 기준으로 네 가지 클러스터링 알고리즘(K-Means, K-Medoids, DBSCAN, Model-based)과 Fisher & Jaikumar 알고리즘을 적용하여 고객들을 군집화하였다. 이 후, 군집별 최적의 차량 경로 계획을 수립하였다. 수치 실험을 통해 본 연구에서 제안하는 CFRS 기법을 적용한 방안이 상대적으로 차량의 전체 이동거리와 평균 이동거리 및 이동시간이 더 절감될 수 있다는 사실을 확인하였다. 또한, 차량별 방문하는 고객의 수에 대한 편차가 더 낮다는 사실로부터 기본적인 차량 경로 배정 유형에 비해 본 연구에서 제안하는 방안이 상대적으로 형평성 있게 업무가 할당되었음을 확인할 수 있었다.

유비쿼터스 센서 네트워크에서 메타 데이터 구조를 이용한 하이브리드 클러스터링 (An Hybrid Clustering Using Meta-Data Scheme in Ubiquitous Sensor Network)

  • 남도현;민홍기
    • 융합신호처리학회논문지
    • /
    • 제9권4호
    • /
    • pp.313-320
    • /
    • 2008
  • 센서 네트워크에서 사용되는 동적 클러스터 방식의 라우팅은 일정 주기마다 클러스터 헤드 노드의 재 선출과 그에 따른 클러스터 재구성을 통해 센서 노드들의 에너지 소모를 분산한다. 그러나 동적 클러스터링 방식의 경우는 주기적으로 클러스터 구조가 바뀌게 되어 이로 인한 에너지 소모가 크다. 또한 클러스터 헤드노드가 동일 데이터를 수신할 경우 에너지 낭비가 있다. 본 논문은 위에서 언급한 반복적인 클러스터 구성에 대한 에너지 소모 문제는 최초에 구성된 클러스터는 고정하고 순환적으로 클러스터 헤드노드를 선출하는 순환적 클러스터 헤드선정(RRCH: Round-Robin Cluster Header)방식을 제안하였다. 또한 클러스터 헤드노드에 중복 데이터가 발생하는 문제는 클러스터 헤드노드가 처음에 수신한 데이터의 메타데이터를 브로드캐스트 함으로서 동일 데이터를 센싱한 클러스터 멤버노드가 송신하지 못하게 하는 방법을 사용하였다. 본 논문에서 제안한 방식의 타당성을 확인하기 위해 모의실험을 실시하였다. 라운드 구간을 100번 반복하여 클러스터 구성과 데이터 전송을 포함한 전체 에너지 소모량을 측정하였다. 결과는 제안한 방식이 기존의 LEACH방식보다 평균 29.3%, HEED방식보다 평균 21.2% 적게 소모되는 것을 확인하였다.

  • PDF

새로운 초기치 선정 방법을 이용한 향상된 EM 알고리즘 (Improved Expectation and Maximization via a New Method for Initial Values)

  • 김성수;강지혜
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.416-426
    • /
    • 2003
  • 본 논문은 시스템 공학의 인식에 관련된 여러 분야에서 널리 쓰이는 클러스터링 기법인 Expectation-Maximization의 초기값 설정문제에 관하여 새로운 방법을 제안한다. 기존의 임의로 지정하는 랜덤한 초기치 선정 문제점을 지적하고, 새로이 제안하는 균등 영역 분할과 분할 된 데이터의 통계적 특성을 이용한 초기치 설정 방법을 사용한 새로운 EM 알고리즘을 제안한다. 일반적으로 EM에서 초기값 설정 방법으로 랜덤한 설정 방식의 약점을 보완하기 위하여 K-means 방법을 많이 사용하고 있다. 하지만, K-means 초기치 설정 방법도 근본적인 문제는 해결하지 못하고 있다. 이러한 문제의 하나의 해결 방안으로 논문이 제안한 균등 분할 및 통계적 특성을 이용한 초기치 선정의 방법을 EM 알고리즘에 적용하였다. 제안된 방법은 기존보다 EM 알고리즘의 특성을 극대화하는 방향으로 더 좋은 결과를 가져온다. 본 논문에서 제안된 알고리즘의 우수성을 제안한 초기치 선정 방법을 적용한 EM과 기존 EM의 시뮬레이션 결과를 비교 분석하여 그 우수성을 제시하였다.

프로그래밍 언어 학습지원 추천시스템 (The Recommendation System for Programming Language Learning Support)

  • 김경아;문남미
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.11-17
    • /
    • 2010
  • 본 논문에서는 프로그래밍 언어 교육을 위한 자기주도 학습지원 추천시스템을 제안한다. 이 시스템은 학습자의 수준별 단계별 프로그래밍 학습을 지원하기 위해 협업필터링을 이용한 추천시스템이다. 본 연구에서는 이러닝 환경에서 학습자가 자신의 학습단계에 필요한 학습과정을 계획하고 학습하는 과정에서 자기주도적 학습효과를 높일 수 있도록 학습주제별 학습수준 기반 학습자 프로파일과 학습주제사이의 연관성 프로파일을 이용한 협업 필터링을 사용하여 프로그래밍 언어 학습지원 추천시스템을 설계하였다. 이 시스템은 이러닝 환경에서 제공되는 프로그래밍 언어 학습 시스템이 자기주도적 학습을 지원하는데 발생하는 가장 큰 어려움인 문제 해결 능력 향상에 기반한 프로그래밍 문제 제공의 어려움을 해결할 수 있는 방법을 제시하여 기존 시스템들이 가지고 있는 문제점을 해결하고자 하였다. 그 결과 프로그래밍 언어 교육 과정에서 발생하는 수준별 단계별 학습에 맞는 프로그래밍 문제 제공의 어려움을 해결하고, 학습자의 자기주도적 학습을 유도하는 학습자 중심의 교수 학습 방법에 기반을 둔 이러닝 학습 환경을 제공함으로써 학습의 질을 높일 수 있는 방안을 제시할 수 있다는 데에 본 연구의 의의가 있다고 할 수 있다.

주기적 모니터링 센서 네트워크에서 핫 스팟 문제 해결을 위한 호핑 라우팅 기법 (Hopping Routing Scheme to Resolve the Hot Spot Problem of Periodic Monitoring Services in Wireless Sensor Networks)

  • 허석렬;이완직;장성식;변태영;이원열
    • 한국산학기술학회논문지
    • /
    • 제10권9호
    • /
    • pp.2340-2349
    • /
    • 2009
  • 본 논문에서는 주기적 모니터링 센서 네트워크의 핫 스팟 문제를 해결하기 위한 호핑 라우팅 기법을 제안한다. 제안한 호핑 라우팅 기법은 네트워크의 모든 노드들의 에너지 소비 형태가 예측 가능한 부하 균등 경로를 구성한다. 부하 균등 라우팅 경로는 동일한 영역내 노드들의 부하 균형을 이루는 수평 호핑 전송 기법과 서로 다른 영역에 있는 노드 사이에 부하 균형을 이루는 수직 호핑 전송 기법으로 구할 수 있다. 수직 호핑 전송에 필요한 직접 전송횟수는 센서 노드의 에너지 소비 모델을 통해서 부하 균형을 이룰 수 있는 값을 도출하였다. 시뮬레이션을 통해서 제안한 호핑 라우팅 기법이 핫 스팟 문제를 효과적으로 해결함을 보였으며 기존 라우팅 기법 중에서 멀티 홉 전송 방식과 직접 전송 방식 그리고 클러스터링 기법과 비교 평가를 통해서 호핑 라우팅 기법의 효율성을 제시하였다.

다중 클래스 이상치 탐지를 위한 계층 CNN의 효과적인 클래스 분할 방법 (Effective Classification Method of Hierarchical CNN for Multi-Class Outlier Detection)

  • 김지현;이세영;김예림;안서영;박새롬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.81-84
    • /
    • 2022
  • 제조 산업에서의 이상치 검출은 생산품의 품질과 운영비용을 절감하기 위한 중요한 요소로 최근 딥러닝을 사용하여 자동화되고 있다. 이상치 검출을 위한 딥러닝 기법에는 CNN이 있으며, CNN을 계층적으로 구성할 경우 단일 CNN 모델에 비해 상대적으로 성능의 향상을 보일 수 있다는 것이 많은 선행 연구에서 나타났다. 이에 MVTec-AD 데이터셋을 이용하여 계층 CNN이 다중 클래스 이상치 판별 문제에 대해 효과적인지를 탐구하고자 하였다. 실험 결과 단일 CNN의 정확도는 0.7715, 계층 CNN의 정확도는 0.7838로 다중 클래스 이상치 판별 문제에 있어 계층 CNN 방식 접근이 다중 클래스 이상치 탐지 문제에서 알고리즘의 성능을 향상할 수 있음을 확인할 수 있었다. 계층 CNN은 모델과 파라미터의 개수와 리소스의 사용이 단일 CNN에 비하여 기하급수적으로 증가한다는 단점이 존재한다. 이에 계층 CNN의 장점을 유지하며 사용 리소스를 절약하고자 하였고 K-means, GMM, 계층적 클러스터링 알고리즘을 통해 제작한 새로운 클래스를 이용해 계층 CNN을 구성하여 각각 정확도 0.7930, 0.7891, 0.7936의 결과를 얻을 수 있었다. 이를 통해 Clustering 알고리즘을 사용하여 적절히 물체를 분류할 경우 물체에 따른 개별 상태 판단 모델을 제작하는 것과 비슷하거나 더 좋은 성능을 내며 리소스 사용을 줄일 수 있음을 확인할 수 있었다.

  • PDF

불법주정차 단속을 위한 지역(장소) 분류 및 활용 방안: 경기도를 중심으로 (Location Classification and Its Utilization for Illegal Parking Enforcement: Focusing on the Case of Gyeonggi)

  • 한현;최소연;이소현
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.113-130
    • /
    • 2023
  • 경제발전과 국민소득 증가로 자동차 수는 계속 증가하고 있으며 이는 한정된 도로 여건과 주차 시설 부족으로 불법주정차 문제가 심각한 상황이다. 불법주정차는 사람들에게 많은 불편과 불쾌감을 주며, 또한 사고로 인한 인명 피해로까지 이어지게 한다. 수도권을 중심으로 늘어나는 차량과 불법주정차로 인해 관련 사고 및 그 피해의 심각성은 날로 커지고 있다. 이는 사회문제 발생의 원인이 되면서 불법주정차를 줄이기 위한 대책 마련에 힘쓰고 있다. 특히, 국내에서는 수도권에 거주하는 사람들의 민원 절반이 불법주정차 문제이고, 이로 인한 물리적 피해와 인명 피해가 가장 많은 곳은 경기도이다. 그리하여, 본 연구에서는 경기도 수원시의 불법주정차 관련 데이터를 기반으로 머신러닝 기법을 이용하여 지역 특성을 새롭게 분류하고, 이를 기반으로 효과적인 불법주정차 단속 방안을 제안한다. 더불어, 수도권 지역의 불법주정차 문제를 감소하기 위한 실무적·사회적·정책 및 법률적 방안을 제시한다. 본 연구는 사회문제 중 하나로 언급되고 있는 도시의 교통체증을 증가시키는 불법주정차 문제에 머신러닝 알고리즘인 K-prototype을 이용하여 지역 특성을 새롭게 분류한 것에 학술적 의의가 있다. 또한, 본 연구의 결과는 수도권 지역의 불법주정차 문제를 감소하기 위한 방안을 제시함으로써 실무적 및 사회적 측면에 기여한다.

클러스터 수가 주어지지 않는 클러스터링 문제를 위한 공생 진화알고리즘 (A symbiotic evolutionary algorithm for the clustering problems with an unknown number of clusters)

  • 신경석;김재윤
    • 품질경영학회지
    • /
    • 제39권1호
    • /
    • pp.98-108
    • /
    • 2011
  • Clustering is an useful method to classify objects into subsets that have some meaning in the context of a particular problem and has been applied in variety of fields, customer relationship management, data mining, pattern recognition, and biotechnology etc. This paper addresses the unknown K clustering problems and presents a new approach based on a coevolutionary algorithm to solve it. Coevolutionary algorithms are known as very efficient tools to solve the integrated optimization problems with high degree of complexity compared to classical ones. The problem considered in this paper can be divided into two sub-problems; finding the number of clusters and classifying the data into these clusters. To apply to coevolutionary algorithm, the framework of algorithm and genetic elements suitable for the sub-problems are proposed. Also, a neighborhood-based evolutionary strategy is employed to maintain the population diversity. To analyze the proposed algorithm, the experiments are performed with various test-bed problems which are grouped into several classes. The experimental results confirm the effectiveness of the proposed algorithm.