• 제목/요약/키워드: clustering problem

검색결과 709건 처리시간 0.029초

데이터 웨어하우스에서 클러스터링 기법을 이용한 실체화 뷰 선택 알고리즘 (Materialized View Selection Algorithm using Clustering Technique in Data Warehouse)

  • 양진혁;정인정
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2273-2286
    • /
    • 2000
  • 데이터 웨어하우스에서 실체화 할 뷰들을 알맞게 선택하는 것은 분석적인 질의에 대한 정확하고 신속한 응답을 얻기 위해서 대단히 중요한 문제이다. 기존의 뷰 선택 알고리즘들에서는 릴레이션 전체가 실체화 뷰들로서 고려되었다. 그러나, 릴레이션의 부분 대신 전체를 실체화한다는 것은 시간과 공간 비용측면에서 좋지 못한 성능을 초래한다. 따라서, 우리는 기존 뷰 선택 알고리즘들에서의 문제점을 극복하기 위해서 개선된 실체화 뷰 선택 알고리즘을 제안한다. 제안된 알고리즘 ASVMRT(Algorithm for Selection on Views to Materialize using Reduced Table)에서는 먼저 속성-값들의 농도에 기반을 둔 자동 클러스터링을 사용하여 축약 테이블들을 데이터 웨어하우스에서 생성한 다음, 원래의 베이스 릴레이션들의 조합 대신에 축약 테이블들의 조합을 실체화 뷰들로 고려한다. 제안한 알고리즘의 타당성 검증을 위하여 우리는 실험결과에서 시간 및 공간 모두에서 기존 알고리즘들보다 약 1.8배의 성능향상이 있음을 보인다.

  • PDF

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.12-17
    • /
    • 2003
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다

커널 밀도 추정을 이용한 Fuzzy C-Means의 초기화 (Initialization of Fuzzy C-Means Using Kernel Density Estimation)

  • 허경용;김광백
    • 한국정보통신학회논문지
    • /
    • 제15권8호
    • /
    • pp.1659-1664
    • /
    • 2011
  • Fuzzy C-Means (FCM)는 군집화를 위해 널리 사용되는 알고리듬 중 하나로 다양한 응용 분야에서 성공적으로 사용되어 왔다. 하지만 FCM은 여러 가지 단점을 가지고 있으며 초기 원형 설정이 그 중 하나이다. FCM은 국부 최적해에 수렴하므로 초기 원형 설정에 따라 군집화의 결과가 달라진다. 따라서 초기 원형의 설정은 군집화 결과 향상을 위해 중요하다. 이 논문에서는 이러한 FCM의 초기 원형 설정 문제를 해결하는 방안으로 커널 밀도 추정을 활용하는 방법을 제안한다. 커널 밀도 추정은 비모수적 분포들에도 사용할 수 있어 국부적인 데이터 밀도 추정에 유용하다. 제안한 방법에서는 커널 밀도 추정을 수행한 후 밀도가 높은 지역에 클러스터의 초기 원형을 설정하고 원형이 설정된 영역의 밀도를 감소시키는 과정을 반복함으로써 효율적으로 초기 원형을 선택할 수 있다. 제안된 방법이 일반적으로 사용되는 무작위 초기화 방법에 비해 효율적이라는 사실은 실험 결과를 통해 확인할 수 있다.

퍼지 클러스터링을 이용한 강화학습의 함수근사 (Function Approximation for Reinforcement Learning using Fuzzy Clustering)

  • 이영아;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.587-592
    • /
    • 2003
  • 강화학습을 적용하기에 적합한 많은 실세계의 제어 문제들은 연속적인 상태 또는 행동(continuous states or actions)을 갖는다. 연속 값을 갖는 문제인 경우, 상태공간의 크기가 거대해져서 모든 상태-행동 쌍을 학습하는데 메모리와 시간상의 문제가 있다. 이를 해결하기 위하여 학습된 유사한 상태로부터 새로운 상태에 대한 추측을 하는 함수 근사 방법이 필요하다. 본 논문에서는 1-step Q-learning의 함수 근사를 위하여 퍼지 클러스터링을 기초로 한 Fuzzy Q-Map을 제안한다. Fuzzy Q-Map은 데이터에 대한 각 클러스터의 소속도(membership degree)를 이용하여 유사한 상태들을 군집하고 행동을 선택하고 Q값을 참조했다. 또한 승자(winner)가 되는 퍼지 클러스터의 중심과 Q값은 소속도와 TD(Temporal Difference) 에러를 이용하여 갱신하였다. 본 논문에서 제안한 방법은 마운틴 카 문제에 적용한 결과, 빠른 수렴 결과를 보였다.

최대 중첩구간을 이용한 새로운 GPS 궤적 클러스터링 (A new Clustering Algorithm for GPS Trajectories with Maximum Overlap Interval)

  • 김태용;박보국;박진관;조환규
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권9호
    • /
    • pp.419-425
    • /
    • 2016
  • 내비게이션 시스템에서 지도 데이터를 최신 정보로 유지하는 것은 중요한 일이다. 그러나 수작업을 통한 갱신은 비용이 많이 소요될 뿐만 아니라 갱신되는 정보를 즉각적으로 반영하기 힘들다. 본 논문에서는 GPS 데이터를 이용하여 자동으로 도로를 생성해주는 시스템에서 가장 중요한 문제 중 하나인 중심 도로를 추출하는 기법에 관하여 살펴보고자 한다. 중심도로를 추출하기 위해서는 클러스터링 시킨 궤적이 필요하지만, 실제 궤적은 클러스터링 되어있지 않다. 이 문제를 해결하기 위하여 본 논문에서는 최대 중첩구간 탐색과 궤적 클러스터링 과정을 통하여 효과적으로 궤적에 대해 클러스터링 하는 기법을 제안한다. 마지막으로 클러스터링 시킨 궤적에 대하여 가상달리기 기법을 적용하여 중심도로를 추출하였다. 실험 데이터로는 실제 대용량의 강남구, 성남시, 서울시 전체를 지나다니는 택시 GPS 데이터를 수집하여 실험을 하였고, 실험 결과 제안기법이 실제 중심 도로를 추출하는데 안정적이고 효율적인 것을 보였다.

태양 에너지 수집형 센서 네트워크에서 모바일 싱크를 지원하기 위한 클러스터 기반 에너지 인지 데이터 공유 기법 (Cluster-based Energy-aware Data Sharing Scheme to Support a Mobile Sink in Solar-Powered Wireless Sensor Networks)

  • 이홍섭;이준민;김재웅;노동건
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1430-1440
    • /
    • 2015
  • 배터리 기반 무선 센서 네트워크(Wireless Sensor Networks, WSN)는 고정된 자원으로 인해 제한된 수명을 갖지만, 태양 에너지 기반 WSN은 에너지가 주기적으로 계속 공급되어, 하드웨어적인 문제가 없는 한 영원히 동작할 수 있다. 한편, 모바일 싱크를 활용한 기법은 데이터 전송 경로를 단축하여 센서의 에너지 소모량을 감소시킬 수 있지만, 비효율적인 싱크의 이동은 에너지 낭비를 초래할 수 있다. 이에 따라 모바일 싱크와 클러스터링을 혼합한 기법들이 제안되고 있지만, 클러스터링은 에너지 불균형 문제로 인한 네트워크 수명 단축을 야기한다. 따라서 본 연구에서는 태양 에너지 기반 WSN에서 모바일 싱크를 효과적으로 지원하기 위한 CE-DSS를 제안한다. CE-DSS는 에너지를 효율적으로 활용해 각 노드의 정전시간을 최소화하면서, 각 클러스터의 데이터를 공유한다. 이로 인해 네트워크 신뢰도가 향상되고, 모바일 싱크의 이동 거리가 단축되어 싱크의 에너지 사용량이 감소된다.

Device-to-Device assisted user clustering for Multiple Access in MIMO WLAN

  • Hongyi, Zhao;Weimin, Wu;li, Lu;Yingzhuang, Liu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권7호
    • /
    • pp.2972-2991
    • /
    • 2016
  • WLAN is the best choice in the place where complex network is hard to set up. Intelligent terminals are more and more assembled in some areas now. However, according to IEEE 802.11n/802.11ac, the access-point (AP) can only serve one user at a single frequency channel. The spectrum efficiency urgently needs to be improved. In theory, AP with multi-antenna can serve multiple users if these users do not interfere with each other. In this paper, we propose a user clustering scheme that could achieve multi-user selection through the mutual cooperation among users. We focus on two points, one is to achieve multi-user communication with multiple antennas technique at a single frequency channel, and the other one is to use a way of distributed users' collaboration to determine the multi-user selection for user clustering. Firstly, we use the CSMA/CA protocol to select the first user, and then we set this user as a source node using users' cooperation to search other proper users. With the help of the users' broadcast cooperation, we can search and select other appropriate user (while the number of access users is limited by the number of antennas in AP) to access AP with the first user simultaneously. In the network node searching, we propose a maximum degree energy routing searching algorithm, which uses the shortest time and traverses as many users as possible. We carried out the necessary analysis and simulation to prove the feasibility of the scheme. We hope this work may provide a new idea for the solution of the multiple access problem.

GMM 음소 단위 파라미터와 어휘 클러스터링을 융합한 음성 인식 성능 향상 (Speech Recognition Performance Improvement using a convergence of GMM Phoneme Unit Parameter and Vocabulary Clustering)

  • 오상엽
    • 융합정보논문지
    • /
    • 제10권8호
    • /
    • pp.35-39
    • /
    • 2020
  • DNN은 기존의 음성 인식 시스템에 비해 에러가 적으나 병렬 훈련이 어렵고, 계산의 양이 많으며, 많은 양의 데이터 확보를 필요로 한다. 본 논문에서는 이러한 문제를 효율적으로 해결하기 위해 GMM에서 모델 파라메터를 가지고 음소별 GMM 파라메터를 추정하여 음소 단위를 생성한다. 그리고 이를 효율적으로 적용하기 위해 특정 어휘에 대한 클러스터링을 통해 성능을 향상시키기 위한 방법을 제안한다. 이를 위해 3가지 종류의 단어 음성 데이터베이스를 이용하여 DB를 가지고 어휘 모델을 구축하였고, 잡음 처리는 워너필터를 사용한 특징을 추출하여 음성 인식실험에 사용하였다. 본 논문에서 제안한 방법을 사용한 결과 음성 인식률에서 97.9%의 인식률을 나타내었다. 본 연구에서 개선된 오버피팅의 문제점을 향상시킬 수 있는 추가적인 연구를 필요로 한다.

유사 음소 모델 스키마 지원을 위한 결정 트리 (Decision Tree for Likely phoneme model schema support)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.367-372
    • /
    • 2013
  • 어휘 인식 시스템에서는 훈련 중에 적용되지 않는 음소에 대한 문제점으로 인해 시스템에 저장된 모델을 재생성해야 하고 그에 따른 시간과 추가 비용이 초래된다. 본 논문에서는 결정 트리 군집화 방법을 사용하여 유사 음소 모델을 관리하는 방법을 제안하였다. 제안한 방법은 생성된 모델들로부터 결정트리 군집화 방법을 적용하여 군집화된 모델에서 음소 단위로 확률 모델을 탐색할 수 있는 시스템을 모델링하여 모델의 재생성 과정을 줄이고 강인하고 정확한 음향 모델을 제공한다. 또한, 제안된 시스템의 사용으로 시스템에서 기존에 생성되어진 음향 모델에 추가적으로 유사 음소 모델을 생성하여 제공하므로 음성 인식에 강인한 음향 모델을 구성한다. 본 연구에서 제안된 방법으로 실내 환경에 대하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 실내 환경의 어휘 종속 실험에서는 98.3%의 인식 성능을 보였고, 어휘 독립 실험에서 98.4%의 인식 성능을 보였다.

컨테이너 환경에서 토플로지 재구성 시간을 개선한 변형 LEACH 프로토콜 (Modified LEACH Protocol improving the Time of Topology Reconfiguration in Container Environment)

  • 이양민;이기원;곽광훈;이재기
    • 정보처리학회논문지C
    • /
    • 제15C권4호
    • /
    • pp.311-320
    • /
    • 2008
  • 일반적으로 애드-혹 네트워크에 적용되는 라우팅 알고리즘은 수천 개 이상의 많은 노드를 포함하는 환경에는 적합하지 않다. 이 문제를 해결하기 위해서 노드에 대한 계층적 관리와 토플로지의 안정적 유지를 위해 클러스터링 기반의 프로토콜을 이용한다. 본 논문에서는 통신 노드들을 장착한 금속 컨테이너들이 이동하는 환경에서도 적용 가능한 클러스터링 기반의 변형 LEACH 프로토콜을 제안한다. 제안한 프로토콜은 클러스터 기반의 프로토콜인 LEACH에 노드 이동을 감지하는 모듈을 구현하였고, 노드가 이동하는 환경에서 LEACH가 가지는 단점을 개선하였다. 그리고 멀티 홉의 구성 방법을 조절하여 효율적인 통신이 가능하도록 하였다. 또한 제안한 프로토콜과 기존의 LEACH 프로토콜을 점진적 네트워크 구성 시간, 토플로지 재구성 시간, 컨테이너 환경에서의 통신 성공률, 그리고 라우팅 오버헤드라는 네 가지 관점에서 비교하였다. 비교 결과, 본 논문에서 제안한 프로토콜이 금속 컨테이너에 포함된 이동 가능한 노드의 통신에서 기존의 LEACH 프로토콜보다 우수함을 확인하였다.