• 제목/요약/키워드: web page

검색결과 675건 처리시간 0.034초

방문 웹 페이지 로그를 이용한 개인화된 문맥광고 기법 (Personalized Contextual Advertising Scheme using Logs of Web Page Visited)

  • 심규선;이명수;최재호;이상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.743-744
    • /
    • 2009
  • 사용자가 방문한 웹 사이트와 연관된 광고를 웹 페이지에 실어주는 문맥광고 관련 연구가 광고 효율성 측면에서 최근 주목을 받고 있다. 이러한 문맥광고 관련 연구의 핵심은 웹 페이지와 웹 광고간의 연관성을 높여주는데 있는데, 연관성 향상 방안으로 최근 사용자 의도 분석을 통한 연관성 향상 기법이 많이 연구되고 있다. 그러나 기존 연구에서는 사용자가 로그인을 해야 하거나, 로그 정보를 일정기간이상 수집해야만 사용자 의도 분석이 가능 하다는 문제점이 존재 한다. 본 논문에서는 로그인이나 많은 양의 로그정보 수집 없이 한 세션 내에서 방문한 웹 페이지 로그만을 이용하여 개인화된 문맥 광고를 제공하는 문맥광고 기법을 제안한다. 실험 결과에서는 제안하는 기법이 기존의 광고 기법에 비해 사용자가 판단하는 웹 페이지와 웹 광고의 연관성 (precison) 이 기존의 기법에 비해 높아짐을 증명한다.

공공기관 내부 정보유출 방지를 위한 상용메일시스템 차단 방안 (A Study on the Blocking of Commercial Mail Systems for the Prevention of Information Leakage in Public Institutions)

  • 김서혜;김도현;이대성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.195-197
    • /
    • 2022
  • 본 논문에서는 공공기관 또는 행정부 소속기관들이 공통으로 고민하는 기업 내부 인터넷망에서의 외부상용 메일시스템 사용에 대한 원천적 차단 방법론에 관해 연구해보고자 한다. 기존에 사용되는 blacklist 기반의 차단 방식에 대한 한계를 확인하고 메일발송 웹페이지의 패킷 분석을 통해 메일 전송이 사용되는 구분자를 추출하여 whitelist기술을 적용함으로 기업의 중요한 내부 정보 유출을 모니터링 및 차단에 목적이 있다.

  • PDF

Jsoup를 이용한 조선왕조실록의 빅 데이터 분석 (Big Data Analysis of the Annals of the Joseon Dynasty Using Jsoup)

  • 변영일;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.131-133
    • /
    • 2021
  • 조선왕조실록은 UNESCO에 등재된 중요한 기록물이다. 본 논문은 한글로 번역된 조선왕조 실록에서 단어의 빈도수를 조사하여 빅데이터를 분석하는 방법을 제안한다. 조선왕조 실록을 인터넷 사이트에서 액세스하여 단어의 빈도수를 조사하려 할 때, 그 페이지에 포함된 소스를 직접 액세스하면 HTML 문법에 필요한 키워드가 포함되어 있어 필요한 본문에서 단어 빈도수에 의한 빅데이터 분석을 하는 것이 어렵다. 본 논문에서는 Java의 Jsoup를 활용한 크롤링 기능을 사용하여 조선왕조 실록의 본문을 분석하는 방법을 제안한다. 실험에서는 조선왕조실록의 태조부분만을 추출하여 본 방법의 유효성을 검증하였다.

  • PDF

소셜미디어 뉴스를 이용한 관심 이슈 연구 (A Study on Interest Issues Using Social Media New)

  • 곽노영;이문봉
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권2호
    • /
    • pp.177-190
    • /
    • 2023
  • Purpose Recently, as a new business marketing tool, short form content focused on fun and interest has been shared as hashtags. By extracting positive and negative keywords from media audiences through comment analysis of social media news, various stakeholders aim to quickly and easily grasp users' opinions on major news. Design/methodology/approach YouTube videos were searched using the YouTube Data API and the results were collected. Video comments were crawled and implemented as HTML elements, and the collection results were checked on the web page. The collected data consisted of video thumbnails, titles, contents, and comments. Comments were word tokenized with the R program, comparing positive and negative dictionaries, and then quantifying polarity. In addition, social network analysis was conducted using divided positive and negative comments, and the results of centrality analysis and visualization were confirmed. Findings Social media users' opinions on issue news were confirmed by analyzing and visualizing the centrality of keywords through social network analysis by dividing comments into positive and negative. As a result of the analysis, it was found that negative objective reviews had the highest effect on information usefulness. In this way, previous studies have been reaffirmed that online negative information has a strong effect on personal decision-making. Corporate marketers will analyze user comments on social network services (SNS) to detect negative opinions about products or corporate images, which will serve as an opportunity to satisfy customers' needs.

에듀테인먼트 기반의 어린이 웹사이트 디자인에 관한 연구 (A Study on the Optimization of Edutainment Website design For Juvenile Users)

  • 손은미;임은정;이현주
    • 디자인학연구
    • /
    • 제15권1호
    • /
    • pp.143-152
    • /
    • 2002
  • 인터넷이 보편직인 일상의 도구로 자리잡으면서, 그 이용자의 수도 급격하게 증가하고 있다. 특히 초등학생의 인터넷 이용률의 급심장을 주목할 필요가 있다. 이들은 태어나면서부터 자연스럽게 인터넷을 접하게 된 세대로 앞으로 대두될 새로운 미디어 시대를 이끌어 나갈 주역이다. 또한 이들은 미래의 인터넷의 발전과 변화를 주도할 수 있다는 잠재력을 가지고 있는 세대이기도 하다. 현재 국내에서는 이러한 어린이를 위한 웹사이트에 대한 투자가 미흡하지만, 그 관심도가 높아지는 만큼 인터넷 시장을 주도할 새로운 영역으로 자리 잡아가고 있다. 이러한 관점에서 지금까지의 단순 학습 전달 목적의 사이트 개발보다는 보다는, 흥미 있는 요소를 통해 자연스럽게 학습환경에 몰두할 수 있도록 도와주는 에듀테인먼트 사이트의 개발이 요구된다. 어린이의 인지적인 특성을 고려하여 사이트를 설계함과 동시에, 디자인, 공학, 아동학 등의 다양한 학문 분야들 간의 학제적 접근이 필요하다. 뿐만 아니라 학습자가 보다 쉽게 정보를 인지하고 수용할 수 있는 인터페이스의 설계가 필요하며 이를 위해서는 일관성 있는 레이아웃과 아동의 감성을 고려한 색상과 배색, 내용의 조직화와 더불어, 멀티미디어 요소를 적극 활용하여 학습으로 연결해야 한다. 또한 어린이 스스로가 직접 제어하며 사고하도록 유도하는 상호작용을 통해 학습 효과를 높이고 학습의 참여도와 상상력, 사고력도 더욱 향상시킬 수가 있을 것이다. 어린이 웹사이트가 가진 잠재력을 최대한 발휘하기 위해서는 이러한 시도 외에도 기술적인 지원과 적극적인 투자가 필요하며, 동시에 어린이의 사용성 평가를 통한 관련 연구들의 선행이 필수적이다.

  • PDF

벤처기업 웹사이트의 속성이 웹사이트 이탈률에 미치는 영향에 관한 실증연구 (An Empirical Study on the Effects of Venture Company's Website Properties on Bounce Rate)

  • 황윤도;하태관
    • 벤처창업연구
    • /
    • 제18권2호
    • /
    • pp.67-79
    • /
    • 2023
  • 이탈률은 사용자가 방문한 후 별다른 요청 없이 바로 이탈한 비율이며 본 연구를 통해 웹사이트의 어떤 속성이 이탈률에 영향을 미치는지 알아보고자 하였다. 웹사이트 평가항목은 선행연구를 통하여 다양한 업종의 벤처기업에 공통으로 적용할 수 있도록 사용성과 정보, 서비스상호작용, 기술 등 총 4가지 항목과 27개 평가속성으로 정의하였다. 연구 결과 이탈률에 영향을 미치는 웹사이트 속성은 판별분석과 의사결정나무분석에 의해 6개가 유의한 것으로 검증되었다. 본 연구를 통한 벤처기업 웹사이트의 이탈률을 줄이기 위한 제안은 다음과 같다. 첫째, 웹사이트의 경로명을 필수로 표시하고 풀다운 메뉴 기능을 추가하여 다른 페이지로의 이동이 용이하도록 한다. 둘째, 사용자의 관심을 끌 만한 핵심 콘텐츠를 배너 형태로 노출하고 서브 페이지에서도 내부링크 배너를 적재적소에 배치하는 것이 좋다. 셋째, 외부링크는 현재 페이지를 바로 이탈하지 않도록 새 창으로 연동하여 재유입이 가능하도록 해야 한다. 마지막으로 담당자 연락처와 상담기능은 고객과의 소통을 위한 직접 정보로서 노출이 권장되지만 개별 응대가 어려울 경우에는 상담기능만이라도 필수로 추가해야 한다. 이러한 제안들은 웹사이트의 개발과 운영, 마케팅 등 여러 분야에서 실무적으로 도움이 될 것으로 기대된다. 다만 특수한 경우에는 높은 이탈률이 정상적일 수도 있으므로 상황에 맞게 고려되어야 한다.

  • PDF

고교 생물의 오버헤드 프로젝터용 필름 제작 및 전달 매체로서의 CD-ROM과 홈페이지의 설계 (Development of Overhead Projector Films, CD-ROM, and Bio-Cosmos Home Page as Teaching Resources for High School Biology)

  • 송방호;신연욱;최미숙;박창보;안나영;강재석;김정현;서혜애;권덕기;손종경;정화숙;양홍준;박성호
    • 한국과학교육학회지
    • /
    • 제19권3호
    • /
    • pp.428-440
    • /
    • 1999
  • 고등학교 생물교육의 강의 및 학습의 효율증진을 위한 영상매체로써 오버헤드 프로젝터 필름(OHP)을 제작하였으며 이의 전달매체로써 CD-ROM및 웹용 홈페이지를 설계하였다. 본 필름은 제6차 교육과정에 의해 개정된 공통과학 및 생물교과서에 수록된 내용을 총 망라하는 방향에서 천연색으로 제작하였으며 도안의 선명도, 수려성, 청정성, 색상, 명암, 인지도 등에서 내용의 질적 우월성을 시도하였고 교수 학생내용 상호간의 관련성을 감안하여 학습항진효과를 극대화하는 측면에서 설계되고 제작되었다. 제6차 교육 과정에 의해 개정된 공통과학 및 생물 교과서 7 종에 수록된 내용을 총 망라하는 방향에서 교재를 분석한 후 가장 다빈도로 출현하는 내용을 우선적으로 제작하였다. CD-ROM은 로고(logo), 초기 메인(main), 학습목록, 내용, 종료 등의 화면으로 구성되어 있고 초기 메인 화면은 공통과학, 생물I, 생물II, 교과서에 수록된 단원의 내용(장)목록을 제시한 후 내용세부 문항, 실제내용화면으로 하이퍼링크 시켰다. 내용화면은 교과서 내용의 요약, 그림 및 사진과 그 해설, 실험과정 및 결과의 요약, 표에 의한 내용의 정리 등 4가지 형식으로 제작된 필름 화면이 우선적으로 수록되어 있으나, 비디오 영상수취(video capture)에 의한 화면이나 인쇄 버턴, 자료의 설명 또는 해설, 용어 해설 등의 버턴과 연결시킨 경우도 있다. OHP 파일은 제작시 포토샵(Adobe Photoshop), 일러스터레이터(Adobe Illustrator), 클레리스 오피스(Claris Office)를, CD-ROM은 MM 디렉터(Macromedia Director)를 웹용 홈페이지는 html 에디터(editor)를 주된 소프트웨어로 사용하였다. OHP파일은 스케닝, 그림, 배경, 문자의 입력, 그림의 수식, PICT 또는 PSD 파일로의 저장, JPG 파일로의 변환 등의 순서로 진행되었다. 공통과학 14점, 생물I 80점, 생물II 142점, 총 236점이 제작되었으며 이들의 전달매체로써 CD-ROM 및 웹 홈페이지를 제작하여 이들을 이미 공개된 중학생물과 동일한 주소 즉 http://gic.kyungpook.ac.kr/biocosmos에 공개하였다.

  • PDF

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

구성주의 이론에 기반한 자기주도적 웹 기반 교육의 설계와 구현 (Design and Implementation of Web Based Instruction Based on Constructivism for Self-Directed Learning Ablity)

  • 김기남;김의정;김창석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.855-858
    • /
    • 2006
  • 정보화 시대에 이르러 정보통신기술의 급속한 발달은 교육을 포함한 모든 분야에 획기적인 패러다임의 변화를 가져왔다. 교육에 있어서의 변화는 단순한 지식의 축적이 아닌 학습자가 스스로 문제를 발견하고, 이를 위한 적절한 해결방법을 습득함을 의미한다. 즉, 교사는 조언자로서의 역할을, 학생은 학습의 주도자로서의 역할을 담당하며, 이는 교육의 주체가 교사중심에서 학생중심으로의 전환을 뜻한다. 이러한 교육적 패러다임의 변환과 더불어 주목받고 있는 교수학습이론이 "구성주의(Constructivism)"이다. 구성주의의 틀안에서 과거의 교사중심의 직접교수법 대신에 학습자 중심의 참여학습을 강조하고 있으며, 새로운 교육적 패러다임의 실천적 방안을 구체적으로 제시하고 있다. 이러한 실천적 방안을 구축 가능하게 해준 것이 바로 정보통신기술 그중에서도 인터넷(internet)의 발달이다. 인터넷에서 가장 활발하게 사용되고 있는 웹(Web)은 그 특성상 구성주의 학습원리를 실현하는데 적절한 환경을 제공하고 있으며, 교육 시스템의 변화를 가져오고 있다. 인터넷을 활용한 웹상에서의 교수학습은 교실이라는 제한된 공간에서 판서에 의존하는 방식의 수업이 아닌 풍부하고 다양한 형태의 폭넓은 자료의 습득을 가능하게 하며, 학습자에게 생동감 있는 학습 경험을 주어 학습 동기를 유발할 수 있다. 또한 기존의 수업에 비해 비교적 시간과 장소의 제약에서 자유롭게 학습할 수 있으며, 학습내용과 관련된 최신의 정보를 참조할 수 있다. 그리고 이미지, 오디오, 비디오, 텍스트와 같은 풍부한 멀티미디어 인터페이스 (Interface)가 가능하고 게시판, 이메일, 채팅을 통하여 교사와 학습자간에 활발한 상호작용이 이루어질 수 있다는 점에서 교육적 가능성이 대두되고 있다. 학교나 교육담당자들도 이런 교육기자제의 첨단화 더불어 새로운 교수 학습 모형 개발에 힘을 쓰고 있다. 이에 본 논문은 구성주의 학습원리에 토대를 둔, 월 기반 교육시스템의 설계 및 구현을 통하여 학습자 중심의 자기주도적 학습활동이 이루어질 수 있는 교육환경을 구축하는데 그 목적이 있다. 라라서 학습자는 학습자의 필요(need)에 라라 선별적으로 강의를 수강할 수 있고, 키워드 정색을 통해 학습하고자 하는 내용을 구분하여 학습할 수 있도록 구현하였다. 이를 통해 학습자들이 자기 주도적으로 주어진 문제에 대해 스스로 해결하는 방법을 찾아 학습할 수 있도록 함으로씨 학습 능력을 키우도록 하는데 그 주안점이 있다.

  • PDF

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.