• 제목/요약/키워드: similarity based clustering

검색결과 322건 처리시간 0.024초

인터넷 게시판 질문 분류를 위한 인터랙티브 접근방법에 관한 연구 (An Interactive Approach to Categorize Questions on the Internet BBSs)

  • Jae-Kwang Lee;Seong-Ho Noh;Ok-Hyun Ryou
    • 한국전자거래학회지
    • /
    • 제8권3호
    • /
    • pp.177-195
    • /
    • 2003
  • 전통적인 고객지원방법에서는 콜 센터와 서비스 센터가 고객의 질문과 요구 사항을 접수하고 응대하는 기능을 담당해왔다. 최근 인터넷의 급속한 확산에 따라 전화, 우편, 방문 등의 전통적인 고객과의 의사소통수단이 전자우편과 인터넷 게시판과 같은 웹기반의 고객지원시스템으로 전환되고 있다. 인터넷 게시판은 기본적으로 고객의 질문에 관리자가 응답하는 시스템이므로 고객이 응답을 받는데 시간이 걸리는 제약이 있다. 이러한 시간적 제약을 해결하기 위하여 고객이 인터넷을 통하여 고객지원시스템에 접속하여 미리 구축된 지식 데이터베이스로부터 원격에서 질문에 대한 응답을 받을 수 있도록 공통적인 질문과 응답을 FAQ와 같은 형태를 제공한다. 그리고, 인터넷 게시판에 다양한 내용과 형태의 질문이 혼재되어 사용됨으로써 응답과 관리상의 어려움이 많다. 따라서 질문들을 체계적으로 분류하여 FAQ를 만들고, 인터넷 게시판의 관리작업을 지원하기 위한 도구의 필요성이 대두되고 있다. 본 연구에서는 키워드와 키워드들간의 친밀도를 이용하여 벡터형태로 표현한 질문들간의 유사 도를 계산하여 질문들을 클러스터링 하는 방법을 제안한다. 제안한 방법은 기본적으로 자동으로 질문들을 분류하지만, 내용이 애매모호한 질문의 경우 사용자가 상호작용을 통하여 사용자의 판단을 받아들일 수 있도록 개발되었다. 그리고, 제안한 방법의 성능을 평가하기 위하여 프로토타입 시스템을 개발하고 제한된 상황하에서 실험을 수행하였다.

  • PDF

균체 지방산 분석을 이용한 Bacillus anthracis의 동정 (Analysis of Cellular Fatty Acid Methyl Esters (FAMEs) for the Identification of Bacillus anthracis)

  • 김원용;송태욱;송미옥;남지연;박철민;김기정;정상인;최철순
    • 대한미생물학회지
    • /
    • 제35권1호
    • /
    • pp.31-40
    • /
    • 2000
  • Bacillus anthracis, the etiological agent of anthrax has been classified into the Bacillus subgroup I with B. cereus, B. mycoides and B. thuringiensis based on morphological and DNA similarity. DNA studies have further indicated that these species have very AT-rich genomes and high homology, indeed it has been proposed that these four sub-species be recognized as members of the one species. Several methods have been developed to obtain good differentiation between these species. However, none of these methods provides the means for an absolutely correct differntiation. The analysis of fatty acid methyl esters (FAMEs) was employed as a quick, simple and reliable method for the identification of 21 B. anthracis strains and closley related strains. The most significant differences were found between B. anthracis and B. anthracis closely related strains in FAMEs profiles. All tested strains of B. anthracis had a branched fatty acid C17:1 Anteiso A, whereas the fraction of unsaturated fatty acid Iso C17:1 w10c was found in B. anthracis closely related strains. By UPGMA clustering analysis of FAMEs profiles, all of the tested strains were classified into two clusters defined at Euclidian distance value of 24.5. The tested strains of B. anthracis were clustered together including Bacillus sp. Kyungjoo 3. However, the isolates of B. anthracis closely related spp. Rho, S10A, 11R1, CAU9910, CAU9911, CAU9912 and CAU9913 were clustered with the other group. On the basis of these results, isolates of B. anthracis Bongchon, Kyungjoo 1, 2 and Bacillus sp. Kyungjoo 3 were reclassified as a B. anthracis. It is concluded that FAMEs analysis provides a sensitive and reliable method for the identification of B. anthracis from closely related taxa.

  • PDF

AdaBoost 알고리즘과 레이더 데이터를 이용한 채프에코 식별에 관한 연구 (A Study on Chaff Echo Detection using AdaBoost Algorithm and Radar Data)

  • 이한수;김종근;유정원;정영상;김성신
    • 한국지능시스템학회논문지
    • /
    • 제23권6호
    • /
    • pp.545-550
    • /
    • 2013
  • 패턴 인식 분야에 있어서 데이터 분류는 해당 데이터에서 유용한 정보를 추출하기 위해서 반드시 수행해야 하는 과정 중 하나이다. AdaBoost 알고리즘은 Boosting 알고리즘을 실제 데이터 분석에 이용할 수 있도록 개량한 것으로, Random guessing이나 Random forest와 같이 정확한 결과를 도출할 확률이 50%보다 조금 높은 약한 분류기와 가중치 값의 조합을 통해 높은 분류 성능을 가지는 강한 분류기를 생성하는 방법을 뜻한다. 본 논문에서는 AdaBoost 알고리즘을 이용하여 비강수에코 중 강수에코와 그 특성이 유사하여 기상 예보를 수행하는 데 방해가 되는 채프에코를 식별하는 알고리즘의 구현에 대한 연구를 수행하였다. 기상 현상 관측을 위해 사용하는 레이더 데이터를 정적 클러스터링과 동적 클러스터링 과정을 통해서 유사도를 기반으로 한 클러스터를 생성한 후, 이를 예보관의 채프에코 판별 결과에 따라 채프에코와 비채프에코로 나누어 학습 데이터를 구성한 후 AdaBoost 알고리즘에 적용하여 분류기를 구현하였다. 제안한 AdaBoost 알고리즘의 성능을 검증하기 위하여 실제 채프에코가 발생한 레이더 데이터를 적용하였으며, 실험 결과를 통해서 제안한 알고리즘이 효과적으로 채프에코를 분류할 수 있음을 확인하였다.

Principal Component Analysis와 Multi-Dimensional Scaling 분석을 이용한 시화공단 시흥천의 수질지표 및 미생물 군집 분포 연구 (Assessing Water Quality of Siheung Stream in Shihwa Industrial Complex Using Both Principal Component Analysis and Multi-Dimensional Scaling Analysis of Korean Water Quality Index and Microbial Community Data)

  • 서경진;김주미;김민정;김성근;이지은;김인영;조경덕;고광표
    • 한국환경보건학회지
    • /
    • 제35권6호
    • /
    • pp.517-525
    • /
    • 2009
  • The water quality of Lake Shihwa had been rapidly deteriorating since 1994 due to wastewater input from the watersheds, limited water circulation and the lack of a wastewater treatment policy. In 2000, the government decided to open the tidal embankment and make a comprehensive management plan to improve the water quality, especially inflowing stream water around Shihwa and Banwol industrial complex. However, the water quality and microbial community have not as yet been fully evaluated. The purpose of this study is to investigate the influent water quality around the industrial area based on chemical and biological analysis, and collected surface water sample from the Siheung Stream, up-stream to down-stream through the industrial complex, Samples were collected in July 2009. The results show that the downstream site near the industrial complex had higher concentrations of heavy metals (Cu, Mn, Fe, Mg, and Zn) and organic matter than upstream sites. A combination of DGGE (Denaturing Gradient Gel Electrophoresis) gels, lists of K-WQI (Korean Water Quality Index), cluster analysis, MDS (Multi-Dimensional Scaling) and PCA (Principal Component Analysis) has demonstrated clear clustering between Siheung stream 3 and 4 and with a high similarity and detected metal reducing bacteria (Shewanella spp.) and biodegrading bacteria (Acinetobacter spp.). These results suggest that use of both chemical and microbiological marker would be useful to fully evaluate the water quality.

비메트릭 다변량 척도법과 네트워크 분석을 통한 멸종위기 국내 담수어류 20종의 먹이원 분석 (Analysis of Food Resources of 20 Endangered Fishes in Freshwater Ecosystems of South Korea using Non-metric Multidimensional Scaling and Network Analysis)

  • 지창우;이대성;이다영;박영석;곽인실
    • 생태와환경
    • /
    • 제54권2호
    • /
    • pp.130-141
    • /
    • 2021
  • 국내 멸종위기 어류 25종의 먹이원을 문헌 조사한 결과, 먹이원은 20문, 31강, 58목, 116과, 154속으로 나타났다. 먹이원 중 가장 많은 어류가 섭식한 먹이원은 분류군에 따라 절지동물문, 곤충강, 파리목, 깔따구과로 조사되었으며, 식물류 먹이원은 돌말문, 윷돌말강, 반달돌말목, 반달돌말과로 조사되었다. 계층적 군집분석과 NMDS를 이용하여 멸종위기 어류 20종의 먹이원 유형화 결과, 어류를 주로 포식하는 충식성 어류와 식물플랑크톤을 섭식하는 어류 2가지 유형으로 나타났다. 네트워크 분석의 허브 점수가 높은 먹이원은 파리목, 하루살이목, 날도래목, 강도래목, 딱정벌래목으로 나타났으며 식물류 먹이원 중 허브 점수가 높은 쪽배돌말목과 반달돌말목, 김발돌말목으로 조사되었다. 먹이원 폭이 큰 어류는 연준모치(PP)와 열목어, 좀수수치, 가는돌고기, 꼬치동자개, 퉁사리, 묵잡자루, 미호종개로 Bi 지수 값이 0.3 이상으로 조사되어 다양한 먹이를 먹는 것으로 조사되었다. 반면, 금강모치, 부안종개, 감돌고기, 흰수마자, 다묵장어, 돌상어, 얼룩새코미꾸리, 북방종개는 Bi 지수 값이 0.1 이하로 조사되어 먹이원 다양성이 낮게 조사되었다.

협업 필터링 및 하이브리드 필터링을 이용한 동종 브랜드 판매 매장간(間) 취급 SKU 추천 시스템 (SKU recommender system for retail stores that carry identical brands using collaborative filtering and hybrid filtering)

  • 조용민;남기환
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.77-110
    • /
    • 2017
  • 최근 인터넷 기반의 웹 및 모바일 기기를 통한 소비 패턴의 다양화와 개성화가 급진전됨에 따라 전통적 유통채널인 오프라인 매장의 효율적 운영이 더욱 중요해졌다. 매장의 매출과 수익 모두를 제고하기 위해 매장은 소비자에게 가장 매력적인 상품을 적시에 공급-판매 해야 하는데 많은 상품들 중에서 어떤 SKU를 취급하는 것이 판매 확률을 높이고 재고 비용을 낮출 수 있는지에 대한 연구가 부족한 실정이다. 특히, 여러 지역에 걸쳐 다수의 오프라인 매장을 통해 상품을 판매하는 기업의 경우 고객에게 매력적인 적절한 SKU를 추천 받아 취급할 수 있다면 매장의 매출 및 수익률 제고에 도움이 될 것이다. 본 연구에서는 개인화 추천에 이용되어 왔던 협업 필터링과 하이브리드 필터링 등의 추천 시스템(Recommender System)을 국가별, 지역별로 복수의 판매 매장을 통해 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하였다. 각 매장의 취급 품목별 구매 데이터를 활용하여 각 매장 별 유사성(Similarity)을 계산하고 각 매장의 SKU별 판매 이력에 따라 협업 필터링을 하여 최종적으로 매장에 개별 SKU를 추천하였다. 또한 매장 프로파일 데이터를 활용하여 주변수 분석 (PCA : Principal Component Analysis) 및 군집 분석(Clustering)을 통하여 매장을 4개의 군집으로 분류한 뒤 각 군집 내에서 협업 필터링을 적용한 하이브리드 필터링 방식으로 추천 시스템을 구현하고 실제 판매 데이터를 바탕으로 두 방식의 성능을 측정하였다. 현존하는 대부분의 추천 시스템은 사용자에게 영화, 음악 등의 아이템을 추천하는 방식으로 연구가 진행되어 왔고 실제로 산업계에서의 적용 또한 개인화 추천 시스템이 주류를 이루고 있다. 그 동안 개인화 서비스 영역에서 주로 다루어져 왔던 이러한 추천 시스템을 동종 브랜드를 취급하는 유통 기업의 매장 단위에 적용하여 각 매장의 취급 SKU를 추천하는 방식에 대한 연구는 거의 이루어지지 않고 있는 실정이다. 기존 추천 방법론의 추천 적용 대상이 '개인의 영역이었다면 본 연구에서는 국가별, 지역별로 복수의 판매 매장을 통해 개인의 영역을 넘어 매장의 영역으로 확대하여 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하고 있다. 또한 기존의 추천시스템은 온라인에 한정되었다면 이를 오프라인으로 활용 범위를 넓히고, 기존 개인을 기반으로 분석을 하는 것보다 매장영역으로 확대 적용하기에 적합한 알고리즘을 개발하기 위해 데이터마이닝 기법을 적용하여 추천 방법을 제안한다. 본 연구의 결과가 갖는 의의는 개인화 추천 알고리즘을 동일 브랜드를 취급하는 복수의 판매 매장에 적용하여 의미 있는 결과를 도출하고 실제 기업을 대상으로 시스템으로 구축하여 활용할 수 있는 구체적 방법론을 제시했다는 데에 있다. 개인화 영역을 위주로 이루어졌던 기존의 추천 시스템과 관련한 학계의 연구 영역을 동종 브랜드를 취급하는 기업의 판매 매장으로 확장시킨 첫 시도라는 데에도 의미가 있다. 2014년 03주차 ~ 05주차 전(全) 매장 판매 수량 실적 Top 100개 SKU로 추천의 대상을 한정하여 협업 필터링과 하이브리드 필터링 방식으로 52개 매장 별로 취급 SKU를 추천하고, 추천 받은 SKU에 대한 2014년 06주차 매장별 판매 실적을 집계하여 두 추천 방식의 성과를 비교하였다. 두 추천 방식을 비교한 이유는 본 연구의 추천 방법이 기존 추천 방식 보다 높은 성과를 입증하기 위해 단순히 오프라인에 협업필터링을 적용한 것을 기준 모델로 정의하였다. 이 기준 모델에 오프라인 매장 관점의 특성을 잘 반영한 본 연구 모델인 하이브리드 필터링 방법과 비교 함으로써 성과를 입증한다. 연구에서 제안한 방식은 기존 추천 방식보다 높은 성과를 나타냈으며, 이는 국내 대기업 의류업체의 실제 판매데이터를 활용하여 입증하였다. 본 연구는 개인 수준의 추천시스템을 그룹수준으로 확장하여 효율적으로 접근하는 방법을 이론적인 프레임 워크를 만들었을 뿐 아니라 실제 데이터를 기반으로 분석하여 봄으로써 실제 기업들이 적용해 볼 수 있다는 점에서 연구의 가치가 크다.

웹서비스 유사성 평가 방법들의 실험적 평가 (Evaluation of Web Service Similarity Assessment Methods)

  • 황유섭
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.1-22
    • /
    • 2009
  • 월드와이드웹(WWW)은 유용한 정보를 포함하는 자료들의 집합에서 유용한 작업을 수행할 수 있는 서비스들의 집합으로 변화하고 있다. 새롭게 등장하고 있는 웹서비스 기술은 향후 웹의 기술적 변화를 추구하며 최근의 웹의 변화에 중요한 역할을 수행할 것으로 기대된다. 웹서비스는 어플리케이션 간의 통신을 위한 호환성 표준을 제시하며 기업 내/외를 아우를 수 있는 어플리케이션 상호작용 및 통합을 촉진한다. 웹서비스를 서비스 중심 컴퓨팅환경으로서 운용하기 위해서는 웹서비스 저장소는 조직화되어 있어야 할 뿐 아니라, 사용자들의 요구에 맞는 웹서비스 컴포넌트를 찾을 수 있는 효율적인 도구들을 제공하여야 한다. 서비스 중심 컴퓨팅을 위한 웹서비스의 중요성이 증대됨에 따라 웹서비스 발견을 효율적으로 제공할 수 있는 기법의 수요 또한 증대된다. 웹서비스 발견을 위한 많은 기법들이 제안되어 왔지만, 대부분의 선행연구들은 활용하기에는 제대로 발달하지 못하였거나 특정 도메인에 너무 치중하여 일반화하기 어려웠다. 이 논문에서는 군집화기법과 XML기반의 서비스 기술표준인 WSDL의 의미적 가치를 활용하여 다수의 웹서비스를 군집화하는 프레임워크를 제안한다. 웹서비스 발견이라는 연구영역에 최초로 데이터마이닝 기법을 적용한 연구이다. 본 논문에서 제안하는 방식은 여러 흥미로운 요소들이 있다: (1) 서비스 사용자와 제공자들의 사전지식 요구를 최소화한다 (2) 특정 도메인에 과도하게 치중한 온톨로지를 피한다 (3) 웹서비스들 간의 의미론적 관계를 시각화할 수 있다. 이 논문에서 인공신경 정신망 네트워크를 기반으로 하여 프로토타입 시스템을 개발하였으며, 실제 운용되고 있는 웹서비스 저장소로부터 획득한 실제 웹서비스들을 사용하여 제안하는 웹서비스 조직화 프레임워크를 실증적으로 평가하였으며 제안하는 방식의 효용성을 보여주는 실험결과를 보고한다.

  • PDF

Metallothionein 유전자를 기초로 한 멸종위기 육상 달팽이 Satsuma myomphala (거제외줄달팽이) 의 분자계통학적 연구 (Molecular Phylogenetic Study of the Endangered Land Snail Satsuma myomphala Based on Metallothionein Gene.)

  • 상민규;강세원;황희주;정종민;송대권;민혜린;박지은;하희철;이현준;홍찬의;안영모;박소영;박영수;박홍석;한연수;이준상;이용석
    • 한국패류학회지
    • /
    • 제32권4호
    • /
    • pp.263-268
    • /
    • 2016
  • Metallothionein (MT) family of metal-binding proteins are involved in maintaining homeostasis and heavy metal poisoning. Recently, MT has been considered as a biomarker that can identify a particular species, very similar to the use of cytochrome oxidase I (COI) gene. Satsuma myomphala species of land snails have been reported from North-East Asia, including South Korea and Japan. In particular, the land snail species have been known from only a limited area of Geoje Island, Gyeongsangnam-do province of South Korea. Genetic studies of S. myomphala has been limited with only 6 nucleotide, 2 protein registered on the NCBI server. For elucidating the genetic information of S. myomphala, we conducted RNA sequencing analysis using Illumina HiSeq 2500 next-generation platform. We screened the MT gene from the RNA-Seq database to confirm the molecular phylogenetic relationship. After sequencing, the de novo analysis and clustering generated 103,774 unigenes. After annotation against PANM database using BLAST program, we obtained MT sequence of 74 amino acid residues containing the coding region of 222 bp. Based on this sequence, we found about 53 sequences using the BLAST program in NCBI nr database. Using ClustalX alignment, Maximum-Likehood Tree of MEGA program, we confirmed the molecular phylogenetic relationships that showed similarity with mollusks such as Helix pomatia and H. aspersa, Megathura crenulata.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

온톨로지 기반 영화 메타데이터간 연관성을 활용한 영화 추천 기법 (The Ontology Based, the Movie Contents Recommendation Scheme, Using Relations of Movie Metadata)

  • 김재영;이석원
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.25-44
    • /
    • 2013
  • 최근 IPTV와 스마트 TV 등의 등장과 영상 콘텐츠를 시청하고 검색할 수 있는 웹 서비스의 등장으로 영상 콘텐츠의 접근이 용이해져 사용자들은 자신이 원하는 콘텐츠를 찾고자 하는 요구가 증가하고 있다. 하지만 서비스되는 콘텐츠의 양이 방대하여 영상 콘텐츠를 검색할 때 사용하는 키워드 기반의 검색은 많은 양의 결과를 가져오며 사용자가 필요로 하지 않은 결과가 검색된다. 따라서 사용자가 원하는 콘텐츠의 검색 시간과 노력이 증가 하게 되었다. 이를 극복 하기 위해 콘텐츠 추천 및 검색에 대한 연구가 수행되어 왔다. 기존의 연구에는 사용자의 선호도 분석을 통하여 영상 콘텐츠를 추천하거나 비슷한 성향을 가지는 사용자들을 분류하여 콘텐츠를 추천하는 기법들이 연구되어 왔다. 본 논문에서는 영상 콘텐츠 중 영화의 추천을 위해 사용자 개인의 영화 메타데이터의 선호도를 분석하고, 영화의 메타데이터와 영화의 유사성을 도출하여 이를 기반으로 영화 추천 기법을 제안한다. 영화의 특징을 담고 있고, 사용자의 영화 선호도에 영향을 끼치는 장르, 줄거리, 배우, 키워드 등의 영화 메타데이터를 기반으로 온톨로지를 구축하고, 확률 기법을 통한 메타 데이터간의 유사성을 분석하여 유사 메타데이터를 연결한다. 또한 사용자의 선호도와 그룹을 정의하고, 사용자 정보를 활용하기 위한 사용자 모델을 정의한다. 제안하는 추천 기법은 1) 사용자 정보기반의 후보 영화 검색 컴포넌트, 2) 사용자 선호기반의 후보 영화 검색 컴포넌트, 3) 1)과 2)의 결과를 통합하고 가중치를 부여하는 컴포넌트, 4) 최종결과의 분석을 통한 개인화된 영화 추천 컴포넌트 등 총 4가지 컴포넌트로 구성된다. 제안하는 추천 기법의 실험을 위하여 20대 남/녀 10명씩 20명을 대상으로 실험을 진행하였으며, 실험결과 평균 Top-5에서 2.1개 Top-10에서 3.35개 Top-20에서 6.35의 영화가 보고 싶은 영화로 선택되었다. 본 논문에서는 영화 메타데이터간의 연관성 도출을 통하여 영화간의 유사성을 도출하고 이를 기반으로 사용자의 기본적인 정보를 활용한 추천뿐만 아니라 사용자가 예상하지 못한 영화의 추천이 가능하다.