• 제목/요약/키워드: 평균 아이템 유사도

검색결과 9건 처리시간 0.025초

추천 선행평가에 의한 마케팅 도메인 및 고객군 선정 (Selecting Marketing Domains and Customer Groups by Pre-evaluation on Recommendation)

  • 윤찬식;이수원
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.220-229
    • /
    • 2002
  • 협력적 추천 기법은 유사한 이웃의 선호도를 이용하여 고객에게 개인화된 아이템을 추천해 주는 방법으로 비교적 높은 정확도를 보이며 추천 시스템의 중심으로 연구되어져 왔다. 그러나, 지금까지의 추천 시스템은 도메인의 특성을 제대로 고려하지 못한채 추천을 시행함으로써 특정 도메인에서 추천의 정확도가 떨어지는 문제점이 발생하였다. 이러한 문제점들을 보완하기 위하여 본 논문에서는 평균 고객 유사도, 평균 아이템 유사도, 밀집도 등의 추천 선행 평가 척도를 제안하고, 추천 선행평가 척도와 추천의 정확도와의 상관관계를 보이며, 이를 이용하여 짧은 수행시간 안에 추천 적용이 가능한 마케팅 도메인 및 고객군을 선정하는 방법을 제시한다.

  • PDF

사용자 기반과 아이템 기반 협업여과 추천기법에 관한 실증적 연구 (A Empirical Study on Recommendation Schemes Based on User-based and Item-based Collaborative Filtering)

  • 김예나;최인복;박태근;이재동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.714-717
    • /
    • 2008
  • 협업여과 추천기법에는 사용자 기반 협업여과와 아이템 기반 협업여과가 있으며, 절차는 유사도 측정, 이웃 선정, 예측값 생성 단계로 이루어진다. 유사도 측정 단계에는 유클리드 거리(Euclidean Distance), 코사인 유사도(Cosine Similarity), 피어슨 상관계수(Pearson Correlation Coefficient) 방법 등이 있고, 이웃 선정 단계에는 상관 한계치(Correlation-Threshold), 근접 N 이웃(Best-N-Neighbors) 방법 등이 있다. 마지막으로 예측값 생성 단계에는 단순평균(Simple Average), 가중합(Weighted Sum), 조정 가중합(Adjusted Weighted Sum) 등이 있다. 이처럼 협업여과 추천기법에는 다양한 기법들이 사용되고 있다. 따라서 본 논문에서는 사용자 기반 협업여과와 아이템 기반 협업여과 추천기법에 사용되는 유사도 측정 기법과 예측값 생성 기법의 최적화된 조합을 알아보기 위해 성능 실험 및 비교 분석을 하였다. 실험은 GroupLens의 MovieLens 데이터 셋을 활용하였고 MAE(Mean Absolute Error)값을 이용하여 추천기법을 비교 하였다. 실험을 통해 유사도 측정 기법과 예측값 생성 기법의 최적화된 조합을 찾을 수 있었고, 사용자 기반 협업여과와 아이템 기반 협업여과의 성능비교를 통해 아이템 기반 협업여과의 성능이 보다 우수했음을 확인 하였다.

협업 필터링 추천 시스템을 위한 데이터 신뢰도 기반 가중치를 이용한 하이브리드 선호도 예측 기법 (Hybrid Preference Prediction Technique Using Weighting based Data Reliability for Collaborative Filtering Recommendation System)

  • 이오준;백영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.61-69
    • /
    • 2014
  • 협업 필터링 추천은 사용자의 아이템에 대한 선호도를 기반으로 유사 아이템 집합 또는 유사 사용자 집합을 생성하고 이를 이용해 사용자의 특정 아이템에 대한 선호도를 예측한다. 따라서 선호도 행렬이 희박할 경우, 추천의 신뢰도는 급격히 낮아진다. 본 논문에서는 위 문제를 해결하기 위해 데이터 신뢰도 기반 가중치를 이용한 하이브리드 선호도 예측 기법을 제안한다. 선호도 예측은 유사 아이템 집합과 유사 사용자 집합을 모두 생성하고 각 집합을 통해 사용자의 선호도를 예측하며, 모델의 상황을 반영한 가중치를 이용해 각 예측치를 병합하여 수행된다. 이 기법은 사용자 선호도 예측 정확도를 높이며 선호도 행렬 희박도가 높은 상황에도 추천 서비스의 신뢰도를 유지할 수 있도록 한다. 이 기법을 바탕으로 추천 시스템을 구현하고 절대평균오차를 기준으로 서비스 신뢰도 향상을 측정하였다. 실험에서 본 기법은 Hao Ji가 제안한 기존의 기법에 비해 선호도 행렬 희박도가 84% 이상인 상황에서 평균 21.7%의 성능 향상을 보여 효과적으로 행렬 희박도 문제를 해소할 수 있음을 검증하였다.

사용자 정보를 이용한 모바일 추천 기법 (The User Information-based Mobile Recommendation Technique)

  • 윤소영;윤성대
    • 한국정보통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.379-386
    • /
    • 2014
  • 모바일 기기의 사용이 급증하면서 앱 스토어를 이용하는 사용자들 또한 증가하고 있다. 그러나 앱 스토어들은 대부분 단순한 랭킹 방식의 추천을 사용하므로 추천의 정확성이 떨어진다. 본 논문에서는 사용자에게 더 적합한 아이템을 추천하기 위해 사용자 정보 가중치와 아이템의 최근 선호 정도를 반영한 기법을 제안한다. 제안하는 기법은 데이터 셋을 카테고리별로 구분한 후 협업필터링 기법에 사용자 정보 가중치를 적용하여 예측값을 추출한다. 카테고리별로 아이템에 대한 최근 선호 정도를 반영하기 위해 특정 기간을 지정한 아이템 평가값 평균을 구한다. 최종적으로 두 결과 값을 결합하여 아이템을 추천한다. 실험을 통해 제안한 기법이 기존의 아이템 기반, 사용자 기반 기법보다 추천의 정확성과 적합성이 향상되는 것을 확인하였다.

적응형 군집화 기반 확장 용이한 협업 필터링 기법 (Scalable Collaborative Filtering Technique based on Adaptive Clustering)

  • 이오준;홍민성;이원진;이재동
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.73-92
    • /
    • 2014
  • 기존 협업 필터링 기법은 사용자들의 아이템에 대한 선호도를 기반으로 유사 아이템 집합 또는 유사 사용자 집합을 구성하고, 이를 이용해 예측된 사용자의 특정 아이템에 대한 선호도를 기반으로 추천을 수행한다. 이로 인해, 사용자 선호도 정보가 부족하게 되면, 유사 아이템 사용자 집합의 신뢰도가 낮아지고, 추천 서비스의 신뢰도 또한 따라서 낮아진다. 또한, 서비스의 규모가 커질수록, 유사 아이템, 사용자 집합의 생성에 걸리는 시간은 기하급수적으로 증가하고 추천서비스의 응답시간 또한 그에 따라 증가하게 된다. 위와 같은 문제점을 해결하기 위해 본 논문에서는 적응형 군집화 기법을 제안하고 이를 적용한 협업 필터링 기법을 제안하고 있다. 이 기법은 크게 네 가지 방법으로 이루어진다. 첫째, 사용자와 아이템의 특성 벡터를 기반으로 사용자와 아이템 각각을 군집화 하여, 기존 협업 필터링 기법에서 유사 아이템, 사용자 집합을 생성하는데 소요되는 시간을 절약하며, 사용자 선호도 정보만을 이용한 부분 집합 생성보다 추천의 신뢰도를 높이고, 초기 평가 문제와 초기 이용자 문제를 일부 해소한다. 둘째, 미리 구성된 사용자와 아이템의 군집을 기반으로 군집간의 선호도를 이용해 추천을 수행한다. 사용자가 속한 군집의 선호도가 높은 순서대로 아이템 군집을 조회하여 사용자에게 제공할 아이템 목록을 구성하여, 추천 시스템의 부하 대부분을 모델 생성 단계에서 부담하고 실제 수행 시 부하를 최소화한다. 셋째, 누락된 사용자 선호도 정보를 사용자와 아이템 군집을 이용하여 예측함으로써 협업 필터링 추천 기법의 사용자 선호도 정보 희박성으로 인한 문제를 해소한다. 넷째, 사용자와 아이템의 특성 벡터를 사용자의 피드백에 따라 학습시켜 아이템과 사용자의 정성적 특성 정량화의 어려움을 해결한다. 본 연구의 검증은 기존에 제안되었던 하이브리드 필터링 기법들과의 성능 비교를 통해 이루어졌으며, 평가 방법으로는 평균 절대 오차와 응답 시간을 이용하였다.

협업적 여과 추천 시스템을 위한 에러반영 모델 구축 (Building Error-Reflected Models for Collaborative Filtering Recommender System)

  • 김흥남;조근식
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.451-462
    • /
    • 2009
  • 협업적 여과는 추천 시스템을 구축하는데 가장 널리 보급된 정보 여과 기법으로 사용자 각 개인의 관심에 적합한 정보 및 아이템을 추천함으로써 사용자들의 의사 결정에 도움을 준다. 그러나, 협업적 여과 기법은 우수한 추천 성능에도 불구하고 초기 진입 문제와 같은 대표적인 한계를 가지고 있다. 본 논문에서는 초기 진입 문제의 한계점을 보완하기 위해 새로운 모델 구축 방법과 구축된 모델들을 적용한 효율적인 협업적 추천 시스템을 제안한다. 제안된 협업적 여과 방법은 크게 2단계로 나뉘어질 수 있다. 첫 번째는 사전에 미리 사용자들이 선호 평가한 아이템에 대한 선호도 예측 에러 정보를 반영하여 모델을 구축하는 과정으로 대부분의 작업이 오프라인에서 수행된다. 두 번째는 미리 구축된 모델들을 적용하여 온라인에서 사용자에게 적합한 개인화된 아이템 추천 및 예측을 하는 과정이다. 사전에 측정된 에러 정보를 반영한 모델은 목적 사용자와 유사한 사용자 및 목적아이템과 유사한 아이템의 사전 평균 예측 에러를 활용하는 에러반영 모델로써 초기 진입 문제를 보완하면서 선호도 예측의 성능을 높이기 위한 모델이다. 또한 모델 기반의 협업적 여과의 단점인 재구축 비용을 감소시키고 사용자들의 새로운 선호도 피드백 정보에 대하여 계속적으로 반영 가능하게 하기 위해 점진적으로 새로운 정보를 갱신할 수 있는 구축 방법을 제안한다.

트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법의 성능분석 (Performance analysis of Frequent Itemset Mining Technique based on Transaction Weight Constraints)

  • 윤은일;편광범
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2015
  • 최근, 아이템들의 가치를 고려한 빈발 아이템셋 마이닝 방법은 데이터 마이닝 분야에서 가장 중요한 이슈 중 하나로 활발히 연구되어왔다. 아이템들의 가치를 고려한 마이닝 기법들은 적용 방법에 따라 크게 가중화 빈발 아이템셋 마이닝, 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝, 유틸리티 아이템셋 마이닝으로 구분된다. 본 논문에서는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝들에 대해 실증적인 분석을 수행한다. 일반적으로 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법들은 데이터베이스 내 아이템들의 가치를 고려함으로써 트랜잭션 가중치를 계산한다. 또한, 그 기법들은 계산된 각 트랜잭션의 가중치를 바탕으로 가중화 빈발 아이템셋들을 마이닝 한다. 트랜잭션 가중치는 트랜잭션 내에 높은 가치의 아이템이 많이 포함 될수록 높은 값으로 나타나기 때문에 우리는 각 트랜잭션의 가중치의 분석을 통해 그 가치를 파악할 수 있다. 우리는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법 중에서 가장 유명한 알고리즘인 WIS와 WIT-FWIs, IT-FWIs-MODIFY, WIT-FWIs-DIFF의 장 단점을 분석하고 각각의 성능을 비교한다. WIS는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝의 개념과 그 기법이 처음 제안된 알고리즘이며, 전통적인 빈발 아이템셋 마이닝 기법인 Apriori를 기반으로 하고 있다. 또 다른 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 방법인 WIT-FWIs와 WIT-FWIs-MODIFY, WIT-FWIs-DIFF는 가중화된 빈발 아이템셋 마이닝을 더 효율적으로 수행하기 위해 격자구조(Lattice) 형태의 특별한 저장구조인 WIT-tree를 이용한다. WIT-tree의 각 노드에는 아이템셋 정보와 아이템셋이 포함된 트랜잭션의 ID들이 저장되며, 이 구조를 사용함으로써 아이템셋 마이닝 과정에서 발생되는 다수의 데이터베이스 스캔 과정이 감소된다. 특히, 전통적인 알고리즘들이 수많은 데이터베이스 스캔을 수행하는 반면에, 이 알고리즘들은 WIT-tree를 이용해 데이터베이스를 오직 한번만 읽음으로써 마이닝과정에서 발생 가능한 오버헤드 문제를 해결한다. 또한, 공통적으로 길이 N의 두 아이템셋을 이용해 길이 N+1의 새로운 아이템셋을 생성한다. 먼저, WIT-FWIs는 각 아이템셋이 동시에 발생되는 트랜잭션들의 정보를 활용하는 것이 특징이다. WIT-FWIs-MODIFY는 조합되는 아이템셋의 정보를 이용해 빈도수 계산에 필요한 연산을 줄인 알고리즘이다. WIT-FWIs-DIFF는 두 아이템셋 중 하나만 발생한 트랜잭션의 정보를 이용한다. 우리는 다양한 실험환경에서 각 알고리즘의 성능을 비교분석하기 위해 각 트랜잭션의 형태가 유사한 dense 데이터와 각 트랜잭션의 구성이 서로 다른 sparse 데이터를 이용해 마이닝 시간과 최대 메모리 사용량을 평가한다. 또한, 각 알고리즘의 안정성을 평가하기 위한 확장성 테스트를 수행한다. 결과적으로, dense 데이터에서는 WIT-FWIs와 WIT-FWIs-MODIFY가 다른 알고리즘들보다 좋은 성능을 보이고 sparse 데이터에서는 WIT-FWI-DIFF가 가장 좋은 효율성을 갖는다. WIS는 더 많은 연산을 수행하는 알고리즘을 기반으로 했기 때문에 평균적으로 가장 낮은 성능을 보인다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

GRU 언어 모델을 이용한 Fuzzy-AHP 기반 영화 추천 시스템 (A Fuzzy-AHP-based Movie Recommendation System using the GRU Language Model)

  • 오재택;이상용
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.319-325
    • /
    • 2021
  • 무선 기술의 고도화 및 이동통신 기술의 인프라가 빠르게 성장함에 따라 AI 기반 플랫폼을 적용한 시스템이 사용자의 주목을 받고 있다. 특히 사용자의 취향이나 관심사 등을 이해하고, 선호하는 아이템을 추천해주는 시스템은 고도화된 전자상거래 맞춤형 서비스 및 스마트 홈 등에 적용되고 있다. 그러나 이러한 추천 시스템은 다양한 사용자들의 취향이나 관심사 등에 대한 선호도를 실시간으로 반영하기 어렵다는 문제가 있다. 본 연구에서는 이러한 문제를 해소하기 위해 GRU(Gated Recurrent Unit) 언어 모델을 이용한 Fuzzy-AHP 기반 영화 추천 시스템을 제안하였다. 본 시스템에서는 사용자의 취향이나 관심사를 실시간으로 반영하기 위해 Fuzzy-AHP를 적용하였다. 또한 대중들의 관심사 및 해당 영화의 내용을 분석하여 사용자가 선호하는 요인과 유사한 영화를 추천하기 위해 GRU 언어 모델 기반의 모델을 적용하였다. 본 추천 시스템의 성능을 검증하기 위해 학습 모듈에서 사용된 스크래핑 데이터를 이용하여 학습 모델의 적합성을 측정하였으며, LSTM(Long Short-Term Memory) 언어 모델과 Epoch 당 학습 시간을 비교하여 학습 수행 속도를 측정하였다. 그 결과 본 연구의 학습 모델의 평균 교차 검증 지수가 94.8%로 적합하다는 것을 알 수 있었으며, 학습 수행 속도가 LSTM 언어 모델보다 우수함을 확인할 수 있었다.