• 제목/요약/키워드: Content Similarity

검색결과 532건 처리시간 0.026초

상품구조 및 사용자 경향성에 기반한 추천 시스템 (Recommender System based on Product Taxonomy and User's Tendency)

  • 임헌상;김용수
    • 산업경영시스템학회지
    • /
    • 제36권2호
    • /
    • pp.74-80
    • /
    • 2013
  • In this study, a novel and flexible recommender system was developed, based on product taxonomy and usage patterns of users. The proposed system consists of the following four steps : (i) estimation of the product-preference matrix, (ii) construction of the product-preference matrix, (iii) estimation of the popularity and similarity levels for sought-after products, and (iv) recommendation of a products for the user. The product-preference matrix for each user is estimated through a linear combination of clicks, basket placements, and purchase statuses. Then the preference matrix of a particular genre is constructed by computing the ratios of the number of clicks, basket placements, and purchases of a product with respect to the total. The popularity and similarity levels of a user's clicked product are estimated with an entropy index. Based on this information, collaborative and content-based filtering is used to recommend a product to the user. To assess the effectiveness of the proposed approach, an empirical study was conducted by constructing an experimental e-commerce site. Our results clearly showed that the proposed hybrid method is superior to conventional methods.

VRTEC : 내용 기반 비디오 질의를 위한 다단계 검색 모델 (VRTEC : Multi-step Retrieval Model for Content-based Video Query)

  • 김창룡
    • 전자공학회논문지T
    • /
    • 제36T권1호
    • /
    • pp.93-102
    • /
    • 1999
  • 본 논문은 내용 기반 비디오 질의를 위한 데이터 모델과 검색 방법을 제안한다. 하나의 비디오를 같은 길이의 프레임(frame)들의 집합 즉 비디오-윈도우로 나눈 후에 각각의 비디오-윈도우를 다차원 공간의 한 점으로 사상시킨다. 인접한 비디오-윈도우를 연결하면 하나의 비디오는 다차원 공간에서의 하나의 궤적(trajectory)이된다. 두 비디오-윈도우의 유서성은 두 점의 유클리디안 거리로 정의되며, 비디오 단편(segment)의 유사성 비교는 궤적을 비교함으로써 검사한다. 여과(filtering), 정제(refinement)과정을 가지는 새로운 검색 방법을 개발한다. 새로운 검색 방법을 여과/정제 과정이 없는 질의 결과가 정확하고, 질의 처리 속도는 약 4.7배 향상되었다.

  • PDF

Compositional Correlations in Canine Genome Reflects Similarity with Human Genes

  • Joy, Faustin;Basak, Surajit;Gupta, Sanjib Kumar;Das, Pranab Jyoti;Ghosh, Shankar Kumar;Ghosh, Tapash Chandra
    • BMB Reports
    • /
    • 제39권3호
    • /
    • pp.240-246
    • /
    • 2006
  • The base compositional correlations that hold among various coding and noncoding regions of the canine genome have been analysed. The distribution pattern of genes, on the basis of $GC_3$ composition, shows a wide range similar to that observed in human. However the occurrence of maximum number of genes was observed in the range of 65-75% of $GC_3$ composition. The correlation between the coding DNA sequences of canine with the different noncoding regions (introns and flanking regions) is found to be significant and in many cases the degree of correlation show similarity to human genome. We found that these correlations are not limited to the GC content alone, but is holding at the level of the frequency of individual bases as well. The present study suggests that canines ideally belong to the predicted 'general mammalian pattern' of genome composition along with human beings.

엔트로피에 기반한 영상분할을 이용한 영상검색 (Image Retrieval Using Entropy-Based Image Segmentation)

  • 장동식;유헌우;강호증
    • 제어로봇시스템학회논문지
    • /
    • 제8권4호
    • /
    • pp.333-337
    • /
    • 2002
  • A content-based image retrieval method using color, texture, and shape features is proposed in this paper. A region segmentation technique using PIM(Picture Information Measure) entropy is used for similarity indexing. For segmentation, a color image is first transformed to a gray image and it is divided into n$\times$n non-overlapping blocks. Entropy using PIM is obtained from each block. Adequate variance to perform good segmentation of images in the database is obtained heuristically. As variance increases up to some bound, objects within the image can be easily segmented from the background. Therefore, variance is a good indication for adequate image segmentation. For high variance image, the image is segmented into two regions-high and low entropy regions. In high entropy region, hue-saturation-intensity and canny edge histograms are used for image similarity calculation. For image having lower variance is well represented by global texture information. Experiments show that the proposed method displayed similar images at the average of 4th rank for top-10 retrieval case.

히스토그램 인터섹션과 오토코릴로그램을 이용한 내용기반 영상검색 시스템 (Content Based Image Retrieval System using Histogram Intersection and Autocorrelogram)

  • 송석진;김효성;이희봉;남기곤
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.1-7
    • /
    • 2002
  • 본 논문에서는 사용자가 질의영상을 선택할 때 영상전체 뿐만 아니라 영상내의 다양한 물체에 대해 질의를 원하는 물체영역만을 간단히 선택, 추출하여 그와 유사한 물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상으로부터 개선된 HSV변환을 통해 히스토그램을 구한 뒤 질의영상의 대표색상을 이용한 컬러 히스토그램 인터섹션방법으로 신속하게 1차 유사도 측정을 하여 후보영상들을 검색한다. 그리고 밴디드 컬러 오토코릴로그램을 이용한 2차 유사도 측정을 수행하여 최종 검색된 영상을 구하였는데 각각의 단점을 보완할 수 있는 2개의 검색방법들을 결합함으로써 소환성(recall) 및 정확성(precision)을 개선하였다. 또한 영상데이터베이스내의 영상들을 특성 라이브러리내에 자통 색인화하여 이를 통해 빠른 영상검색이 가능하였다.

  • PDF

PMCN: Combining PDF-modified Similarity and Complex Network in Multi-document Summarization

  • Tu, Yi-Ning;Hsu, Wei-Tse
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제9권3호
    • /
    • pp.23-41
    • /
    • 2019
  • This study combines the concept of degree centrality in complex network with the Term Frequency $^*$ Proportional Document Frequency ($TF^*PDF$) algorithm; the combined method, called PMCN (PDF-Modified similarity and Complex Network), constructs relationship networks among sentences for writing news summaries. The PMCN method is a multi-document summarization extension of the ideas of Bun and Ishizuka (2002), who first published the $TF^*PDF$ algorithm for detecting hot topics. In their $TF^*PDF$ algorithm, Bun and Ishizuka defined the publisher of a news item as its channel. If the PDF weight of a term is higher than the weights of other terms, then the term is hotter than the other terms. However, this study attempts to develop summaries for news items. Because the $TF^*PDF$ algorithm summarizes daily news, PMCN replaces the concept of "channel" with "the date of the news event", and uses the resulting chronicle ordering for a multi-document summarization algorithm, of which the F-measure scores were 0.042 and 0.051 higher than LexRank for the famous d30001t and d30003t tasks, respectively.

Paper Recommendation Using SPECTER with Low-Rank and Sparse Matrix Factorization

  • Panpan Guo;Gang Zhou;Jicang Lu;Zhufeng Li;Taojie Zhu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권5호
    • /
    • pp.1163-1185
    • /
    • 2024
  • With the sharp increase in the volume of literature data, researchers must spend considerable time and energy locating desired papers. A paper recommendation is the means necessary to solve this problem. Unfortunately, the large amount of data combined with sparsity makes personalizing papers challenging. Traditional matrix decomposition models have cold-start issues. Most overlook the importance of information and fail to consider the introduction of noise when using side information, resulting in unsatisfactory recommendations. This study proposes a paper recommendation method (PR-SLSMF) using document-level representation learning with citation-informed transformers (SPECTER) and low-rank and sparse matrix factorization; it uses SPECTER to learn paper content representation. The model calculates the similarity between papers and constructs a weighted heterogeneous information network (HIN), including citation and content similarity information. This method combines the LSMF method with HIN, effectively alleviating data sparsity and cold-start issues and avoiding topic drift. We validated the effectiveness of this method on two real datasets and the necessity of adding side information.

다운로드 기반의 주문형 비디오 서비스에서 다중 지수를 고려한 동영상 프리페칭 기법 (Multi-index Prefetching Mechanism for Download-based Video on Demand Services)

  • 문양찬;임민규
    • 전기학회논문지
    • /
    • 제66권8호
    • /
    • pp.1257-1264
    • /
    • 2017
  • In video content watching service, when a user requests video content, the content server has to transmit the entire video to the client for watching. This transmission delay increases as the size of video content increases. In order to solve the transmission delay problem, a prefetching technique can be used in which a video content to be watched by a user is predicted and transmitted to a client before the user requests it. In this paper, we propose a prefetching system considering multiple indices for video content. In the proposed method, video content to be prefetched is selected by comprehensively analyzing the order relation index indicating the order of viewing the videos of the users, the similarity index between the video contents, and the popularity index reflecting the viewing frequency of the video content. Experimental results show that the maximum accuracy is achieved when prefetching uses only the order relation index for movie contents.

고온(高溫)과 재배광도(栽培光度)가 인삼(人蔘) 잎의 지방산(脂肪酸) 조성(組成)에 미치는 영향(影響) (Effect of High Temperature and Growth Light Intensity on Fatty Acid Composition of Panax ginseng leaf)

  • 박훈;박현석;홍종욱
    • Applied Biological Chemistry
    • /
    • 제29권4호
    • /
    • pp.366-371
    • /
    • 1986
  • 광도(光度)가 다른 포장조건에서 자란 6년근 인삼잎과 온도별 20시간 처리된 관행재배 6년근 절제엽중(切除葉中)의 지방산을 gas chromatography로 분석하였다. 재배광도(온도)가 높을수록 지방산 함량이 감소하였다. Linoleic, linolenic, palmitic과 palmitoleic acid가 다량(多量)지방산으로 80%였다. 지방산 조성의 유사도는 광도 20%까지는 차이가 크지 않았으나 30%에서 차이를 보여 20%가 재배 한계 광도인 것 같다. 재배광도가 높을수록 불포화 지방산비율이나 불포화대(不飽和帶)의 비율이 적어져서 고온에 대한 적응 기작으로 보였다. 30% 수광율과 수확기잎이 지방산특성이 유사하였으며 고온적응과 노화(老化)의 관계가 불분명(不分明)하였다. 단시간(短時間)의 고온처리 ($25^{\circ}$$35^{\circ}C$)는 지방산함량, 불포화산비율 및 불포화도의 비율을 증대시켰고 지방산 조성이 유사하여 장기 온도효과와는 반대의 결과였다.

  • PDF

사례기반추론 기법을 이용한 개인화된 추천시스템 설계 및 구현 (Design and Implementation of personalized recommendation system using Case-based Reasoning Technique)

  • 김영지;문현정;옥수호;우용태
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1009-1016
    • /
    • 2002
  • 본 논문에서는 인터넷 컨텐츠 사이트에서 묵시적인 평가정보를 이용한 새로운 사례기반 추천시스템을 설계하고 구현하였다. 본 시스템은 크게 사용자 프로파일 생성 모듈, 유사도 계산 및 추천 모듈, 개인화된 메일링 모듈로 구성된다. 사용자 프로파일 생성 모듈에서는 사용자가 컨텐츠를 이용하면서 남긴 로그 기록을 이용하여 컨텐츠에 대한 개인별 선호도를 추출할 수 있는 속성내, 속성간 가중치를 제시하였다. 유사도 계산 및 추천 모듈에서는 사용자 프로파일과 새로운 컨텐츠간의 유사도를 측정하기 위한 유사도 계산식을 제시하였다. 개인화된 메일링 모듈에서는 개인별 선호도에 의해 구성된 추천 컨텐츠를 플렛폼-독립적인 XML 문서 형식으로 변환하여 발송한다. 제안된 모델에 대한 추천 효율을 검증하기 위해 평균절대오차(MAE)와 반응자작용특성(ROC) 값을 이용하여 제안한 추천 모델과 협동적 필터링 기법과 비교 실험하였다. 실험결과, 본 논문에서 제안한 모델의 추천 효율이 기존의 협동적 필터링 기법보다 우수함을 보였다.