• 제목/요약/키워드: 콜드스타트

검색결과 28건 처리시간 0.023초

유전자 알고리즘을 이용한 클러스터링 기반 협력필터링 (Clustering-based Collaborative Filtering Using Genetic Algorithms)

  • 이수정
    • 창의정보문화연구
    • /
    • 제4권3호
    • /
    • pp.221-230
    • /
    • 2018
  • 추천 시스템의 주요 방법인 협력 필터링 기술은 실제 상업용 온라인 시스템에서 성공적으로 구현되어 서비스가 제공되고 있다. 그러나, 이 기술은 본질적으로 여러 가지 단점을 내포하는데, 데이터 희소성, 콜드 스타트, 확장성 문제 등이 그 예이다. 확장성 문제를 해결하기 위하여 클러스터링 기법을 활용한 협력 필터링 방법이 연구되어 왔다. 본 연구에서 제안하는 협력 필터링 시스템에서는 가장 널리 활용되는 클러스터링 기법들 중 하나인 K-means 알고리즘의 단점을 개선하고자 유전자 알고리즘을 이용한다. 또한, 기존 연구에서 최적화된 클러스터링 결과를 추구하였던 것과는 달리, 제안 방법은 클러스터링 결과를 활용한 협력 필터링 시스템 성능의 최적화를 목표로 하므로, 실질적으로 시스템의 성능을 향상시킬 수 있다.

5+2광역경제권의 지역경제력 비교연구 (Comparative study of the Regional Economic Power of the Korean 5+2 Mega-regional Economic Zones)

  • 박숙진;김태헌
    • 한국콘텐츠학회논문지
    • /
    • 제10권11호
    • /
    • pp.318-328
    • /
    • 2010
  • 본 광역권별 경제력 비교분석은 정부의 지역경제정책에 대한 기초연구로서 콜드스타트(cold start)된 5+2광역경제권의 상이한 경제여건과 펀더멘털을 고찰하고 설정된 비교지표를 중심으로 전국 7대 광역권의 지역경제력을 비교 분석해 봄으로써 글로벌 경쟁력 확보 차원에서 자립적 광역경제권을 육성한다는 정부의 지역경제정책의 타당성과 향후 광역경제권의 정책방향을 고찰하는데 목적을 두고 있다. 경제력지수 비교결과, 수도권의 경제력지수가 절대 우위에 있는 반면 강원권, 호남권, 제주권은 상대적 열위상태인 것으로 조사되었다. 지역의 특성과 경제적 펀더멘털이 다르기 때문에 향후 지역발전 및 광역경제권 정책을 추진함에 있어서는 이를 고려한 세심한 배려와 발전계획 수립이 필요할 것으로 보인다. 그리고 정부는 지역경제여건을 감안한 광역경제권사업의 지역안배와 조정을 통하여 지역사업의 중복성 문제를 원천 차단함으로써 재정의 효율성을 제고시켜야 할 것이다. 또한 수요분석에 기초한 demand-based policy와 demand-pull policy, 지역낙후성을 감안하여 예산균등할(豫算均等割)정책보다는 비균등할 지원책을 탄력적으로 사용함으로써 지역균형발전을 도모하여야 할 것으로 사료된다.

신규 사용자 추천 성능 향상을 위한 가중치 기반 기법 (Weight Based Technique For Improvement Of New User Recommendation Performance)

  • 조성훈;이무훈;김정석;김봉회;최의인
    • 정보처리학회논문지D
    • /
    • 제16D권2호
    • /
    • pp.273-280
    • /
    • 2009
  • 오늘날 컴퓨팅 환경의 진보와 웹의 이용이 활발해짐에 따라 오프라인에서 이루어졌던 있었던 많은 서비스들과 상품의 제공이 웹에서 이루어지고 있다. 이러한 웹 기반 서비스 및 상품은 개인에 적합하게 취사선택되어 제공되는 추세이다. 이렇듯 개인에 적합한 서비스 및 상품의 선택과 제공을 위한 패러다임을 개인화(personalization)라 한다. 개인화된 서비스 및 상품의 제공을 위한 분야로서 연구된 것이 추천(recommendation)이다. 그러나 이러한 추천 기법들은 신규 사용자에게 적합한 추천을 제공하지 못하는 문제와 사용자의 상품에 대한 평점에만 의존하여 추천을 생성한다는 계산 공간에서의 제약 사항을 가지고 있다. 두 문제 모두 추천 분야에서 지속적인 관심을 보이는 분야로서 신규사용자 추천 문제의 경우는 신규 사용자의 평점이 없기 때문에 유사 사용자들을 분류할 수 없음에 기인한다. 그리고 추천 공간 제약에 따른 문제는 추천 차원의 추가에 따른 처리 비용이 급격히 증가한다는 문제를 가지고 있기 때문에 쉽게 접근하기 어렵다. 따라서 본 논문에서는 신규사용자 추천 향상을 위한 기법과 평점 예측 시 예측에 대한 가중치를 적용하는 기법을 제안한다.

전자상거래에서 고객 행동 정보와 구매 기록을 활용한 딥러닝 기반 개인화 추천 시스템 (Deep Learning-Based Personalized Recommendation Using Customer Behavior and Purchase History in E-Commerce)

  • 홍다영;김가영;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권6호
    • /
    • pp.237-244
    • /
    • 2022
  • 본 논문은 고객의 온라인 행동 정보와 구매 기록을 활용하여 기존의 추천 시스템이 갖는 데이터 희소성의 문제와 콜드 스타트 문제를 해결하고자 VAE 기반 추천 시스템을 제시하였다. 고객의 구매 기록을 임베딩하고 차원 축소하여 단일 변수로 생성하였으며, 온라인 행동 정보를 활용하여 학습을 통해 고객의 잠재 요인을 추출하는데 Variational Autoencoders를 적용하였다. VAE 기반 추천 시스템은 총 12개의 고객의 특성 변수에 VAE를 적용하여 저차원의 벡터를 생성한 뒤 이를 통해 유사 사용자를 찾은 다음, 유사 사용자들이 구매했던 상품들을 고객에게 추천한다. 이렇게 추천한 상품들의 점수를 매겨 nDCG로 성능을 평가하였다. 실험 결과 구매 기록 변수 그리고 온라인 행동 로그 변수를 활용한 VAE 기반의 추천시스템이 SVD 기반의 추천 시스템보다 성능이 좋다는 것을 알 수 있었다. 따라서 고객의 온라인 행동 로그 및 구매 기록을 사용하여 상품을 추천하면 정보 수집에 발생하는 비용과 시간을 줄일 수 있을 뿐만이 아니라 기존 추천 시스템보다 더욱 효율적으로 상품을 추천할 수 있다는 것을 보여주었다.

사용자 선호도와 군집 알고리즘을 이용한 퍼지-계층적 분석 기법 기반 영화 추천 시스템 (A Movie Recommendation System based on Fuzzy-AHP with User Preference and Partition Algorithm)

  • 오재택;이상용
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.425-432
    • /
    • 2017
  • 현재 추천 시스템은 실제 사용자가 선호하는 항목을 추천하는지, 아니면 단순히 관심 정도의 항목을 추천하는지 알 수 없다는 문제와 사용자들이 매우 적어 적합한 항목을 추천할 수 없는 데이터 희소성 문제, 새로운 사용자들이 유입됨에 따라 사용자들이 만족하는 항목을 추천하기 위해 시스템의 성능이 저하되는 Cold-Start 문제 등이 발생한다. 본 연구에서는 이러한 문제점을 해결하기 위해 불확실한 상황이나 문제들을 반영할 수 있는 퍼지-계층적 분석(Fuzzy-Analytic Hierarchy Process)과 주어진 항목들을 비슷한 항목들끼리 모으는 데이터 군집화 알고리즘을 활용하여 사용자들에게 만족할 수 있는 영화를 추천하기 위한 시스템을 구현하였다. 61명을 대상으로 영화 선호도에 대한 설문 조사를 실시한 데이터를 본 시스템에 적용한 결과 Fuzzy-AHP 기법을 통해서 데이터 희소성 문제를 해소할 수 있었으며, 또한 데이터 군집화 알고리즘을 통해 새로운 사용자들이 유입되어도 사용자에게 적합한 항목이 추천되었음을 확인할 수 있었다. 향후 노이즈 데이터나 아웃라이어(Outlier) 데이터를 걸러낼 수 있는 밀도 기반 클러스터링에 대한 연구가 필요할 것으로 생각된다.

Improvement of a Product Recommendation Model using Customers' Search Patterns and Product Details

  • Lee, Yunju;Lee, Jaejun;Ahn, Hyunchul
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.265-274
    • /
    • 2021
  • 본 논문에서는 검색 키워드와 상품 상세정보를 활용한 Doc2vec 기반의 새로운 추천 모형을 제안한다. 지금까지 추천 시스템에 관한 많은 기존 연구에서는 고객의 구매 이력이나 평점 같은 정형 데이터만을 사용하는 협업 필터링(CF) 알고리즘에 기반한 추천 모델이 제안되었다. 그러나 CF에서 온라인 고객 리뷰와 같은 비정형 데이터를 사용하면, 보다 나은 추천결과를 도출할 수 있다. 이에 본 연구에서는 기존 연구에서 거의 활용되지 않았던 검색 키워드 정보와 상품 상세정보를 제품 추천에 활용할 것을 제안한다. 본 연구의 제안 모형은 고객이 구매한 상품에 대한 평점, 검색어, 상품 상세정보를 종합적으로 고려한 CF 알고리즘을 이용해 추천결과를 생성한다. 이 때 비정형 데이터로부터 정량적인 패턴을 추출하기 위한 방법으로는 Doc2vec이 적용된다. 실험 결과 제안 모형이 기존 추천 모형보다 더 나은 성능을 보이는 것을 알 수 있었고, 검색어 및 상품 상세정보가 추천에 유의한 영향을 미치는 것을 확인하였다. 본 연구는 고객의 온라인 행동 정보를 추천시스템에 적용하였다는 점과 전통적인 CF의 한계 중 하나인 콜드 스타트 문제를 완화하였다는 점에서 학술적 의의가 있다.

고객의 투자상품 선호도를 활용한 금융상품 추천시스템 개발 (Financial Products Recommendation System Using Customer Behavior Information)

  • 김효중;김성범;김희웅
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.111-128
    • /
    • 2023
  • 인공지능(AI) 기술이 발전함에 따라 빅데이터 기반의 상품 선호도 추정 개인화 추천시스템에 관심이 증가하고 있는 추세이다. 하지만 개인화 추천이 적합하지 않은 경우 고객의 구매 의사를 감소시키고 심지어 금융상품의 특성상 막대한 재무적 손실로 확대될 수 있는 위험을 가지고 있다. 따라서 고객의 특성과 상품 선호도를 포괄적으로 반영한 추천시스템을 개발하는 것이 비즈니스 성과 창출과 컴플라이언스 이슈 대응에 매우 중요하다. 특히 금융상품의 경우 개인의 투자성향과 리스크 회피도에 따라 고객의 상품 선호도가 구분되므로 축적된 고객 행동 데이터를 활용하여 맞춤형 추천서비스를 제안하는 것이 필요하다. 이러한 고객의 행동 특성과 거래 내역 데이터를 사용하는 것뿐만 아니라, 고객의 인구통계정보, 자산정보, 종목 보유 정보를 포함하여 추천 시스템의 콜드 스타트 문제를 해결하고자 한다. 따라서, 본 연구는 고객의 거래 로그 기록을 바탕으로 고객의 투자성향과 같은 특성 정보와 거래 내역 및 금융상품 정보를 통해 고객별 금융상품 잠재 선호도를 도출하여 딥러닝 기반의 협업 필터링을 제안한 모형이 가장 성능 우수한 것을 확인하였다. 본 연구는 고객의 금융 투자 메커니즘을 기반으로 금융상품 거래 데이터를 통해 미거래 금융상품에 대한 예상 선호를 도출하는 추천 모델을 구축하여, 선호가 높을 것으로 예상되는 상위 상품군을 추천하는 서비스를 개발하는 것에 의의가 있다.

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.