• 제목/요약/키워드: clustering problem

검색결과 709건 처리시간 0.033초

시간 가중치와 가변형 K-means 기법을 이용한 개인화된 음악 추천 시스템 (A Personalized Music Recommendation System with a Time-weighted Clustering)

  • 김재광;윤태복;김동문;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.504-510
    • /
    • 2009
  • 근래 들어 개인 적응형 서비스에 대한 관심이 높아지고 있으나 아직 음악에 관련된 서비스는 보편화되어 있지 않다. 그 이유는 음악의 관련 정보를 분석하는 것이 텍스트 기반의 자료에 비해 어렵기 때문이다. 이에 본 논문은 사용자가 선택했던 음악을 분석해서 사용자의 성향을 파악하고 그와 유사한 음악을 추천해주는 시스템을 제안한다. 음악의 속성을 추출하는 방법으로 음파 분석 기법을 사용한다. 음파에서 세 가지의 수치화된 속성을 추출하여 이를 특성 공간에 나타낸다. 이 때 사용자가 선택한 음악이 많이 모여 있는 군집을 분석한다면, 사용자의 취향을 파악할 수 있다. 하지만 몇 개의 군집이 형성될 것인지를 예측하기란 쉽지 않다. 이를 해결하기 위하여 군집의 수를 상황에 따라 유동적으로 변경할 수 있는 가변형 K-means 기법을 제시한다. 이 기법은 군집의 직경 크기를 제한하여, 일정치 이상일 때 군집의 수를 늘리는 방법으로 데이터의 범위를 알고 있을 때 매우 효율적으로 적용할 수 있다. 이 방법을 이용하여 군집의 중심을 찾고 이와 가까운 음악을 추천한다. 또한 사용자의 성향은 꾸준하게 변화하므로 본 논문은 사용자가 근래에 선택한 음악의 반영 비율을 높이고자 무게의 개념을 이용한 시간 가중치 기법을 적용하였다. 그리고 음악의 발매 시기도 고려하여 음악을 추천하는 시스템을 제안한다. 제안 방법의 검증을 위하여 100개의 음악 조각을 통한 실험적 검증을 하였으며 그 결과 제안 방법이 효과적인 것을 보인다.

한국어 음성인식 성능향상을 위한 문맥의존 음향모델에 관한 연구 (A Study-on Context-Dependent Acoustic Models to Improve the Performance of the Korea Speech Recognition)

  • 황철준;오세진;김범국;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.9-15
    • /
    • 2001
  • 본 연구에서는 한국어 음성인식 성능향상을 위한 문맥의존 음향 모델을 개선하기 위하여 한국어 음성학적 지식과 결정트리를 접목한 음소결정트리 기반 상태분할 알고리즘으로 한국어에 적합한 문맥의존 음향 모델에 관해 고찰한다. HMM (Hidden Markov Model)의 각 상태를 네트워크로 연결하여 문맥의존 음향모델로 표현하는 HM-Net(Hidden Markov Network)이 있는데 이는 SSS(Successive State Splitting) 알고리즘으로 작성한다. 이 방법은 음향 모델의 상태공유관계와 모델의구조를 결정하는데 효율적이지만 모델을 학습할때 문맥환경에 따라 출현하지 않는 문맥이 존재하는 문제점이 있다 본 연구에서는 이러한 문제점을 해결하기 위해 2진 결정트리와 SSS 알고리즘의 장점을 결합하여 문맥방향 상태분할을 수행할 때 각 노드에서 한국어 음성학적 지식으로 구성된 음소 질의어에 따라 상태분할 하는 방법으로서 PDT-SSS(Phonetic Decision Tree-based SSS) 알고리즘을 적용한다. 적용한 방법으로 작성한 문맥의존 음향 모델의 유효성을 확인하기 위해 국어공학센터 (KLE)m이 452 단어와 항공편 예약관련 200문장(YNU 200)에 대해 화자독립 음소, 단어 및 연속음성인식 실험을 수행하였다. 인식실험결과, 문맥 의존 음향모델에 대한 화자독립 음소, 단어 및 연속음성 인식실험에서 기존의 단일 HMM 모델보다 향상된 인식률을 보여, 한국어에 적합한 문맥의존 음향 모델을 작성하는데 한국어 음성학적 지식과 음소결정트리 기반 상태분할 알고리즘이 유효함을 확인하였다.

  • PDF

추천시스템에서 구매 패턴 예측을 위한 SOM기반 고객 특성에 의한 군집 분석 (Clustering Analysis by Customer Feature based on SOM for Predicting Purchase Pattern in Recommendation System)

  • 조영성;문송철;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.193-200
    • /
    • 2014
  • 유비쿼터스 컴퓨팅이 생활의 일부가 되어가면서 정보의 양도 급속도로 늘어나고 있으며, 이로 인해 많은 데이터 속에서 정보를 찾아내는 기술이 부각되고 있다. 고객 기반의 협력적 필터링을 이용한 고객 선호도 예측 방법에서는 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법을 사용하므로 아이템에 대한 속성을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하고 있다. 그리고 비슷한 선호도를 가진 일부 아이템의 정보를 바탕으로 하기 때문에 아이템의 속성은 무시하는 경향이 있다. 본 논문에서는 전자상거래 추천에서 구매 패턴 예측을 위한 고객 특성기반 SOM 학습을 이용한 군집 방법을 제안한다. 제안 방법은 고객의 속성 정보 기반의 유사한 속성의 데이터끼리의 클러스터링을 통해 보다 빠른 시간 내에 고객 성향에 맞는 추천이 가능한 구매 패턴의 추출이 가능하다. 성능평가를 위해 현업에서 사용하는 인터넷 화장품 아이템 쇼핑몰의 데이터를 기반으로 데이터 셋을 구성하여 기존 시스템과 비교 실험을 통해 성능을 평가하여 효용성과 타당성을 입증하였다.

LSTM-AutoEncoder를 활용한 선박 메인엔진의 이상 탐지 및 라벨링 (Outlier Detection and Labeling of Ship Main Engine using LSTM-AutoEncoder)

  • 김도희;한영재;김혜미;강성필;김기훈;배혜림
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.125-137
    • /
    • 2022
  • 운송 산업은 우리나라의 3면이 바다로 둘러싸여 있는 지리적 요건과 자원 소비량의 대부분을 수입에 의존하는 자원 빈곤 문제로 인해 중요한 산업 중 하나이다. 그 중에서도 해운업의 비중은 운송 산업의 대부분을 차지할 정도로 크며, 해운업에서의 유지보수는 선박의 운영 효율성 개선 및 비용 감소에 있어서도 중요하다. 그러나 현재 선박이 유지보수를 위해 일정기간 주기로 검사가 시행되고, 이에 따라 시간과 비용이 발생하며 원인규명도 제대로 되지 않고 있다. 따라서 본 연구에서는 제안 방법론인 LSTM-AutoEncoder를 활용해 실제 선박 운항 데이터에 대해 시점을 고려하여 선박 고장의 원인이 될 수 있는 이상 탐지를 수행한다. 또한 클러스터링을 통해 군집화를 수행하고 이상치에 대해 요인별로 그룹화를 통해 선박 메인엔진 고장의 잠재 원인을 규명한다. 이는 선박의 다양한 정보에 대해 보다 빠르게 모니터링이 가능하고, 이상 정도를 식별할 수 있다. 또한 현재 선박의 고장 감시시스템에 있어서도 구체화된 경보 점 설정과 고장 진단 체계를 갖추고, 유지보수시점을 찾는 데 도움을 줄 수 있을 것이다.

베이지안 추정치가 부여된 유사도 가중치와 연관 사용자 군집을 이용한 선호도 예측 시스템 (Preference Prediction System using Similarity Weight granted Bayesian estimated value and Associative User Clustering)

  • 정경용;최성용;임기욱;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.316-325
    • /
    • 2003
  • 기존의 협력적 필터링 기술을 이용한 사용자 선호도 예측 방법에서는 피어슨 상관 계수에 의해 사용자의 유사도를 구하고, 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법을 사용하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하였다. 본 논문에서는 기존의 사용자 선호도 예측 방법의 문제점을 보완하기 위하여 베이지안 추정치가 부여된 유사도 가중치와 연관 사용자 군집을 이용한 선호도 예측 시스템을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서의 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집하며 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 기존의 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게 하여 예측의 정확도를 높일 수 있다. 제안된 방법의 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다. 그 결과 기존의 협력적 필터링 기술의 문제점을 해결하여 예측의 정확도를 높이는데 효과적임을 확인하였다.

이동 객체 경로 탐색을 위한 시공간 클러스터링 기법 (A Spatio-Temporal Clustering Technique for the Moving Object Path Search)

  • 이기영;강홍구;윤재관;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제7권3호
    • /
    • pp.67-81
    • /
    • 2005
  • 최근 들어 지리 정보 시스템이 발전함에 따라 경로 검색, 주변 정보 검색, 응급 서비스 등을 제공하는 위치 기반 서비스, 텔레매틱스 등의 새로운 응용 서비스 개발에 대한 관심과 연구가 증대되고 있다. 위치 기반 서비스 및 텔레매틱스에서 사용되는 시공간 데이타베이스에서의 사용자의 검색은 시간 축을 현재의 시간으로 고정하고 공간 및 비공간 속성을 검색하기 때문에 시간 축에 대한 검색 범위가 넓을 경우에는 이를 효율적으로 처리하기 어렵다. 이를 해결하기 위하여 이동 객체의 위치 데이타를 요약하는 기법인 스냅샷이 소개되었다. 그러나, 이러한 스냅샷 기법은 저장해야 되는 총간 영역이 넓을 경우 저장 공간이 많이 필요하며 검색에 자주 사용되지 않는 불필요한 영역까지 스냅샷을 생성하므로 저장 공간 및 메모리를 많이 사용하게 된다. 이에 본 논문에서는 기존의 스냅샷 기법의 단점을 극복하기 위하여 이전에 공간 클러스터링을 위해 사용되던 2차원의 공간 해시 알고리즘을 시공간으로 확장한 해시-기반 시공간 클러스터링 알고리즘(H-STCA)과 과거 위치 데이타로부터 이동 객체 경로 탐색을 위한 지식을 추출하기 위해 H-STCA 알고리즘에 근거한 지식 추출 알고리즘을 제안한다. 그리고, 대용량의 이동 객체 데이터에 대한 검색 시간, 저장 구조 생성 시간, 최적 경로 탐색 시간 등에서 H-STCA를 사용한 스냅샷 클러스터링 방법, 기존의 시공간 인덱스 방법, 스냅샷 방법과의 성능평가에 대하여 설명한다. 성능평가 결과로 H-STCA를 사용한 스냅샷 클러스터링 방법은 기존의 시공간 인덱스 방법이나 스냅샷 방법 보다 이동 객체의 개수가 증가하면 할수록 성능 향상이 더욱 큰 것으로 나타났다.

  • PDF

적응형 군집화 기반 확장 용이한 협업 필터링 기법 (Scalable Collaborative Filtering Technique based on Adaptive Clustering)

  • 이오준;홍민성;이원진;이재동
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.73-92
    • /
    • 2014
  • 기존 협업 필터링 기법은 사용자들의 아이템에 대한 선호도를 기반으로 유사 아이템 집합 또는 유사 사용자 집합을 구성하고, 이를 이용해 예측된 사용자의 특정 아이템에 대한 선호도를 기반으로 추천을 수행한다. 이로 인해, 사용자 선호도 정보가 부족하게 되면, 유사 아이템 사용자 집합의 신뢰도가 낮아지고, 추천 서비스의 신뢰도 또한 따라서 낮아진다. 또한, 서비스의 규모가 커질수록, 유사 아이템, 사용자 집합의 생성에 걸리는 시간은 기하급수적으로 증가하고 추천서비스의 응답시간 또한 그에 따라 증가하게 된다. 위와 같은 문제점을 해결하기 위해 본 논문에서는 적응형 군집화 기법을 제안하고 이를 적용한 협업 필터링 기법을 제안하고 있다. 이 기법은 크게 네 가지 방법으로 이루어진다. 첫째, 사용자와 아이템의 특성 벡터를 기반으로 사용자와 아이템 각각을 군집화 하여, 기존 협업 필터링 기법에서 유사 아이템, 사용자 집합을 생성하는데 소요되는 시간을 절약하며, 사용자 선호도 정보만을 이용한 부분 집합 생성보다 추천의 신뢰도를 높이고, 초기 평가 문제와 초기 이용자 문제를 일부 해소한다. 둘째, 미리 구성된 사용자와 아이템의 군집을 기반으로 군집간의 선호도를 이용해 추천을 수행한다. 사용자가 속한 군집의 선호도가 높은 순서대로 아이템 군집을 조회하여 사용자에게 제공할 아이템 목록을 구성하여, 추천 시스템의 부하 대부분을 모델 생성 단계에서 부담하고 실제 수행 시 부하를 최소화한다. 셋째, 누락된 사용자 선호도 정보를 사용자와 아이템 군집을 이용하여 예측함으로써 협업 필터링 추천 기법의 사용자 선호도 정보 희박성으로 인한 문제를 해소한다. 넷째, 사용자와 아이템의 특성 벡터를 사용자의 피드백에 따라 학습시켜 아이템과 사용자의 정성적 특성 정량화의 어려움을 해결한다. 본 연구의 검증은 기존에 제안되었던 하이브리드 필터링 기법들과의 성능 비교를 통해 이루어졌으며, 평가 방법으로는 평균 절대 오차와 응답 시간을 이용하였다.

컨볼루션 인공신경망을 이용한 2차원 게임 이미지 색상 합성 시스템 (2D Game Image Color Synthesis System Using Convolutional Neural Network)

  • 홍승진;강신진;조성현
    • 한국게임학회 논문지
    • /
    • 제18권2호
    • /
    • pp.89-98
    • /
    • 2018
  • 최근의 인공 신경망(Neural Network) 기법은 전통적인 분류 문제와 군집화 문제 해결에서 벗어나 이미지 생성 같은 컨텐츠 생성에서도 좋은 성능을 보이고 있다. 본 연구에서는 차세대 컨텐츠 생성 기법으로 인공신경망을 이용한 이미지 생성기법을 제안한다. 제안하는 인공신경망 모델은 두개의 이미지를 입력받아서 하나의 이미지에서는 색상을, 다른 이미지에서는 모양을 가져와 새로운 이미지로 조합해낸다. 이 모델은 컨볼루션 인공신경망(Convolutional Neural Network)으로 제작되었으며 각각 이미지에서 색상과 모양을 추출해내는 두 개의 인코더와 각 인코더의 값을 모두 넘겨받아 하나의 조합이 되는 이미지를 생성해내는 하나의 디코더로 구성이 되어있다. 본 연구의 성과는 저비용으로 게임 개발 프로세스 상 다양한 2차원 이미지 생성 및 보정 작업에 활용될 수 있다.

프로그래밍 언어 학습지원 추천시스템 (The Recommendation System for Programming Language Learning Support)

  • 김경아;문남미
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.11-17
    • /
    • 2010
  • 본 논문에서는 프로그래밍 언어 교육을 위한 자기주도 학습지원 추천시스템을 제안한다. 이 시스템은 학습자의 수준별 단계별 프로그래밍 학습을 지원하기 위해 협업필터링을 이용한 추천시스템이다. 본 연구에서는 이러닝 환경에서 학습자가 자신의 학습단계에 필요한 학습과정을 계획하고 학습하는 과정에서 자기주도적 학습효과를 높일 수 있도록 학습주제별 학습수준 기반 학습자 프로파일과 학습주제사이의 연관성 프로파일을 이용한 협업 필터링을 사용하여 프로그래밍 언어 학습지원 추천시스템을 설계하였다. 이 시스템은 이러닝 환경에서 제공되는 프로그래밍 언어 학습 시스템이 자기주도적 학습을 지원하는데 발생하는 가장 큰 어려움인 문제 해결 능력 향상에 기반한 프로그래밍 문제 제공의 어려움을 해결할 수 있는 방법을 제시하여 기존 시스템들이 가지고 있는 문제점을 해결하고자 하였다. 그 결과 프로그래밍 언어 교육 과정에서 발생하는 수준별 단계별 학습에 맞는 프로그래밍 문제 제공의 어려움을 해결하고, 학습자의 자기주도적 학습을 유도하는 학습자 중심의 교수 학습 방법에 기반을 둔 이러닝 학습 환경을 제공함으로써 학습의 질을 높일 수 있는 방안을 제시할 수 있다는 데에 본 연구의 의의가 있다고 할 수 있다.

항만 경쟁력 평가를 위한 유사도 기반의 이산형 평균 알고리즘 (A Dispersion Mean Algorithm based on Similarity Measure for Evaluation of Port Competitiveness)

  • 추봉성;이철영
    • 한국항해항만학회지
    • /
    • 제28권3호
    • /
    • pp.185-191
    • /
    • 2004
  • 평균법과 클러스터링은 다속성 평가문제에서 널리 쓰이고 있는 중요한 데이터 마이닝 기법들이다. 그러나, 다양한 다속성 평가 문제에서 데이터 마이닝을 할 때, 데이터들의 특징은 그 중요성이 달라질 수 있기 때문에 이러한 데이터의 중요도 차이를 고려해야 할 필요가 있다. 따라서, 이러한 기법들은 데이터의 선택 및 중요도 등과 같이 그 특징을 얼마나 잘 반영하는 지가 중요하다. 게다가, 산술평균법의 경우에는 우선순위 및 가중치로 정의되는 평가구조에서 적합한 결과를 산출하기에는 한계가 있을뿐 만 아니라, 평가자 그룹별 특징을 반영하기 곤란하다. 따라서, 본 연구에서는 기하학적 도형을 바탕으로 유사도를 평가하여, 평가자 그룹별로 특징지어지는 이산적인 환경에서의 평균을 산출하는 알고리즘을 제안하였다. 본 알고리즘의 핵심사항 중 하나는, 항목별 우선순위의 혼돈없이 유사도를 평가할 수 있다는 점이다.