• 제목/요약/키워드: 콘텐츠 추출

검색결과 1,392건 처리시간 0.025초

온톨로지 시각화를 활용한 사용자 리뷰 분석 기반 영화 추천 시스템 (Movie Recommended System base on Analysis for the User Review utilizing Ontology Visualization)

  • 문성민;김기남;최경철;이경원
    • 디자인융복합연구
    • /
    • 제15권2호
    • /
    • pp.347-368
    • /
    • 2016
  • 최근 소비자 구전정보에 대한 연구들은 소비자가 제품 구매 과정에서 다른 소비자의 구전에 의한 정보를 활용한다는 연구 결과를 시사하고 있다. 본 연구는 제품에 대한 소비자의 의견을 파악하고 활용할 수 있도록 오피니언 마이닝과 시각화를 통해 도움을 줄 수 있는 방법을 제안하고자 한다. 이를 위해 최근 들어 관람할 영화를 선택할 때 인터넷 상의 영화리뷰를 참고 하는 상황이 증가함을 고려하여 "영화" 도메인의 온톨로지를 구축하고 오피니언 마이닝을 수행하여 시각화 한 후 그 결과에 대해 논하고자 한다. 온톨로지를 구축하는 과정에서 평가요소에 대한 속성 분류뿐만 아니라 평가요소에 대한 서술어 사전을 구성하였다는 점에서 기존의 연구와 차별성이 있으며 분석 결과를 통해 이러한 방법이 오피니언 마이닝에 유효함을 증명하고자 한다. 연구를 통해 도출한 결과는 크게 세 가지로 나누어 볼 수 있다. 첫째, 본 연구에서는 기존에 구축된 온톨로지를 활용하지 않고 키워드 추출과 토픽모델링을 활용하여 영화 도메인에 대한 온톨로지를 구축하는 방법에 대해 서술하였다. 둘째, 개별 영화에 대한 시각화 분석을 시행하여 영화에 대한 관객의 종합적인 의견을 한눈에 파악할 수 있도록 하였다. 셋째, 제품에 대한 평가 결과에 따라 유사한 평가를 받은 제품끼리 군집화 되는 것을 발견하였으며 본 연구의 분석에 사용된 130개의 영화는 크게 3개의 집단으로 군집화 됨을 보였다.

음성인식과 자연어 처리 딥러닝을 통한 전자의무기록자동 생성 시스템 (Automatic Electronic Medical Record Generation System using Speech Recognition and Natural Language Processing Deep Learning)

  • 손현곤;류기환
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.731-736
    • /
    • 2023
  • 최근 의료 현장은 전자의무기록, 전자건강기록 등의 의료 기록을 전산화하여 저장하고 관리하는 시스템이 의무적으로 적용되거나 전체 의료 현장에 보급되어 환자 개개인의 과거 의료 기록을 추가적인 의료 행위에 활용하고 있다. 그러나 일반적인 의료 문진 및 상담 간 발생하는 의료진과 환자 간의 대화는 별도로 기록되거나 저장되지 않고 있어 추가적인 환자의 주요 정보는 효율적으로 활용되지 못하고 있다. 이에 따라, 의료 문진 현장에서 발생하는 의료진과 환자와의 대화를 저장하고 이를 텍스트 데이터로 변환하여 주요한 문진 내용만 자동으로 추출, 요약하여 정보화하는 음성인식과 자연어 처리 딥러닝을 통한 의료상담 요약문을 자동으로 생성하는 전자의무기록 시스템을 제안한다. 본 시스템은 의료 종사자와 환자의 의료 상담 내용의 인식과정을 거쳐서 텍스트 정보를 획득한다. 이렇게 획득된 텍스트를 복수의 문장으로 구분하고, 생성된 문장에 포함된 복수 키워드의 중요도를 산출한다. 산출된 중요도를 기반으로 복수의 문장에 순위를 매기고, 순위를 기반으로 문장들을 요약하여 최종 전자의무기록 데이터를 생성한다. 제안하는 시스템 성능은 정량적 분석을 통하여 우수함을 확인한다.

빅데이터를 활용한 뉴노멀(New normal)시대의 관광행태 변화에 관한 연구 (A Study on Tourism Behavior in the New normal Era Using Big Data)

  • 유경미;강종천;최연희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.167-181
    • /
    • 2023
  • 본 연구는 코로나 19 발생 후 여행 제재가 완화된 현재의 관광행태 변화를 분석하기 위해 소셜네트워크 분석프로그램인 TEXTOM을 활용하였다. 네이버, 구글, 다음이 제공하는 블로그, 카페, 뉴스 등을 대상으로 '국내여행', '해외여행' 키워드에 대한 데이터를 수집하였다. 사회적 거리두기가 해제된 2022년 4월~12월로 수집 기간을 정하였고, 코로나19 발생 이전인 2019년과 코로나19의 영향이 가장 심각했던 2020년은 각각 1년으로 하여 2022년과 비교 분석하였다. 텍스트 마이닝을 통하여 각각 총 80개의 핵심어를 추출하고 NetDraw를 사용하여 중심성분석을 하였다. 마지막으로 CONCOR분석을 통하여 상관관계가 있는 핵심어들을 4개로 군집화하였다. 연구결과, 2022년도의 관광행태는 코로나 발생 이전으로의 관광 회복, 각자가 선호하는 테마를 중심으로 여행의 세분화, 나라별 코로나 완화정책을 우선적으로 검색해 본 후 관광지를 선택하는 관광행태를 보인다. 코로나19 이후에 새롭게 도래하는 관광생태계에 대한 관광마케팅 전략과 관광상품 개발을 위한 기초자료를 제공할 것으로 기대한다.

한국 전통마을의 공간구성 재론(再論) (Reconsideration of the Spatial Composition of the Korean Traditional Village)

  • 김기덕
    • 역사민속학
    • /
    • 제57호
    • /
    • pp.197-228
    • /
    • 2019
  • 본 논문은 기존 연구에서 전통마을의 공간구성을 분류한 연구들을 일별해 보고, 그것들을 보완하여 새롭게 전통마을의 공간구성과 속성을 정리하였으며, 다음으로는 새롭게 정리된 공간구성 분류에 맞추어 기존연구를 활용하되 필자가 강조하고자 하는 사항을 보안하여 한국 전통마을의 공간 구성을 재론한 것이다. 먼저 전통마을의 공간구성으로 ①자연공간 ②주거공간 ③생업공간 ④이동공간 ⑤경계공간 ⑥놀이공간 ⑦제의공간의 7가지를 추출하였다. 그리고 그것을 기본성격에 맞추어, ①마을입지의 기본 공간 : 자연공간 ②자연공간 하에서 요청되는 필수 생존공간 : 주거공간 및 생업공간 ③마을 구성원 상호소통망에서 파생된 관계공간 : 이동공간 및 경계공간 ④장(場)의 개념으로 확산되는 가변공간: 놀이공간 및 제의공간의 4개 요소로 다시 제시하여 서술하였다. 사람이 만든 공간은 사람들의 삶을 담는 그릇이다. 그 그릇이 편리하고 쓰임새 있는 그릇이 되기 위해서는 삶의 틀에 맞추어진 것이어야 한다. 우리의 전통마을의 공간구성은 구성원들의 자연관·생활양식·세계관이라는 삶의 틀에 잘 구현되어 있었다. 자연관은 마을 공간구성 전체에 작용하지만 특히 자연공간에 잘 반영되어 있다. 생활양식은 주거공간·생업공간·이동공간·놀이공간에, 그리고 세계관은 경계공간·제의공간에 특색있게 반영되어 있다. 이러한 모든 것들을 유기적으로 작동시키기 위하여 공동체적 규약이 있었다.

일기를 통해 본 귀농·귀촌인 '일상 경관' 인식 - 텍스트 마이닝 적용 - (Analysis of Urban-to-Rural Migrants' Perceptions of the 'Everyday Landscape' Using Diary-Based Text Mining)

  • 오정심
    • 헤리티지:역사와 과학
    • /
    • 제57권3호
    • /
    • pp.184-199
    • /
    • 2024
  • 본 논문은 세계적인 변화 흐름 속에서 '일상 경관'의 중요성이 부각된 배경을 탐구하고, 귀농·귀촌인 관점에서 일상 경관을 분석한 결과를 제시했다. 전라남도 '곡성군' 사례를 중심으로, 귀농·귀촌인이 작성한 '일기' 460건을 수집하여 '텍스트 마이닝'의 주요 기법인 '빈도수 분석', '토픽 모델링', '감성 분석' 등으로 분석했다. 명사형 형태소의 분석 결과를 인지적 측면에서, 형용사형 형태소의 분석 결과를 감성적 측면에서 해석했다. 특히 기존 감성 분석 방법의 한계를 극복하기 위해 '시맨틱 네트워크 분석'을 활용해 단어 네트워크 목록을 추출했고, 목록에서 감정을 나타내는 '형용사'와 공기 관계로 연결된 '명사'를 검토하여 감성의 대상과 내용을 확인했다. 이러한 방법은 기존 연구에서 찾아보기 어려운 차별화된 접근법이다. 연구 결과에서 나타난 흥미로운 사실은 해당 귀농·귀촌인이 '동네 산책길 꽃', '텃밭 수확', '동네 행사', '카페 공간' 등을 중요하게 인식한다는 것이다. 이들 모두는 시각적 요소를 갖춘 일상 경관이다. 현재 많은 농촌 마을은 주거 경관을 개선하고 사람들의 관심을 끌어모으기 위해서 지붕 색상을 하나로 통일하거나 담벼락에 벽화를 그리고 있다. 그러나 시각적 임팩트는 그러한 인위적인 조치로 생겨나지 않는다. 현재의 정책 및 제도에 대한 비판적 검토와 개선이 필요하다. 본 논문은 일기와 텍스트 마이닝을 활용하여 귀농·귀촌인 관점에서 일상 경관을 연구한 첫 사례로서 의미가 있다. 본 논문을 통해 일상 경관 관련 연구가 활성화되기를 기대한다.

스포츠 센터 운동 참여에 따른 여성의 신체이미지에 관한 연구 (A Study on Body Image of Women Who Participate in Physical Exercise)

  • 강별님
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.145-148
    • /
    • 2006
  • 현대사회는 사회 문화적 가치 기준이 대중매체를 통해 널리 전달되고, 빠르게 수용되어지는 특성을 지니고 있다. 이와 같은 경향은 현대 여성들에게 자신의 신체를 대중매체 속의 아름다운 몸매와 비교하여 표방하고자 하는 경향을 불러일으키고 있으며, 최근 몸짱 등의 신종용어의 탄생은 이러한 현상을 더욱 부추기고 있는 실정이다. 따라서 본 연구는 이러한 지나친 외모지상주의 현상으로 인한 여성의 건강장애 및 스트레스를 예방하고, 올바른 신체이미지 형성으로 건강하고 건전한 삶을 영위하기 위한 스포츠 참여를 확산시키는 데 그 목적이 있다. 이와 같은 연구 목적을 달성하기 위하여 본 연구에서는 2006년 현재 서울 대전 지역에 소재하고 있는 스포츠 활동 참여자를 모집단으로 설정한 후 유층집락무선표집법을 이용, 스포츠 활동 참여 집단의 표본을 추출하였고, 스포츠 활동 비참여집단의 표본은 참여집단을 표집한 스포츠센터 등의 인근에 위치하고 있는 초 중 고 학교 학생의 학부모 및 여자형제를 조사, 각각 450명씩 총 900명의 자료가 실제분석에 사용되었다. 자료 수집을 위한 도구는 설문지이며 신뢰도 검사 결과 체중관련요인 a=.807, 건강관련요인 a=.819, 몸매관련요인 and a=.784로 나타났다. 자료분석을 위하여 본 연구에서 사용한 통계분석기법은 공변량분석(Analysis of Covariance)이었다. 이와 같은 연구방법 및 절차를 통하여 본 연구에서 도출된 결론은 다음과 같다. 스포츠 활동 참여는 신체이미지에 긍정적인 영향을 미친다. 즉, 스포츠센터 운동 참여집단이 비참여집단에 비하여 건강관련요인, 몸매관련요인의 신체이미지가 높다.)를 보였다. 3. 경토(耕土) 15cm 밑에 비닐을 깐 것은 비닐의 공극량(孔隙量)에 따라서 $75{\sim}88%$의 관개용수절약(灌漑用水節約)을 보였다. 비닐의 공극량(孔隙量) $3cm/m^2$의 경우에는 수도수량(水稻收量)이 표준구(標準區)와 비등(比等)하였으나 그 보다 공극(孔隙) 작으면 수도수량(水稻收量)은 저하(低下)하였다. 4. 처리구(處理區) 주위(周圍)에 깊이 57cm, 높이 6cm로 비닐을 삽입(揷入)하여 지수벽(止水壁)을 만들면 수분침투량(水分浸透量) $25{\sim}33%$ 정도 감소(減少)되었다. 5. 경토(耕土) 15cm 밑에 밑짚을 6cm 두께로 다저 넣은 것은 표준구(標準區)에 비(比)하여 1963, 년도(年度)에는 약(約) 30% 의 증수(增收)를 보였으나 1969년도(年度)에는 약(約) 7%의 감수(減收)를 보여 양년도(兩年度)의 성적(成績)이 극(極)히 대조적(對照的)이었다. 6. 전체적(全體的)으로 1969년도(年度)에는 전년도(前年度)보다 수량(收量)이나 주당수수(株當穗數) 및 수립수(穗粒數)가 적은데 이것은 1969도(度)의 기상(氣象)이 분얼성기(分蘖盛期)에 저온다우(低溫多雨)이고 등숙기(登熟期)에 일조(日照)가 적었기 때문일 것이다. 7. 생육상태(生育狀態)의 처리간(處理間) 변이(變異)는 다음과 같다. (1) 밑다짐과 간단관수(間斷灌水)에 의하여 초장신장(草長伸長)이 조장(助長)되었다. (2) 밑다짐 9cm 구(區)와 일간격(日間隔)의 간단관수구(間斷灌水區)는 고(高) 수량(收量)이며 간장(稈長)도 컸다. (3) 간단관수(間斷灌水)의

  • PDF

과정이수형 자격제도 운영 학과의 NCS 기반 교육과정 설계모형 연구 - 전문대학 사회복지과를 중심으로 (A Study of the Curriculum Design Modelling Focused on the Combination of National Competency Standards and the Already-Accredited Course in the Department of Social Welfare in the Junior College)

  • 박용운;김경미;유태완
    • 한국콘텐츠학회논문지
    • /
    • 제16권2호
    • /
    • pp.652-665
    • /
    • 2016
  • 국가직무능력표준(NCS)은 산업현장에서 직무 수행에 필요한 능력들을 체계화 및 표준화한 것으로서 전문직업인 양성이 교육목적인 전문대학에 NCS를 적절히 적용할 수만 있다면 현장 중심의 인력 양성에 많은 도움이 될 것으로 보인다. 그러나 인문사회계열 학문인 사회복지 분야에서는 실기보다는 이론 숙지가 주를 이루며 또한 사회복지사 2급 자격을 위한 과정이수형 교육과정을 편성하고 있기 때문에 기존의 자격제도 변화없이 NCS를 교육과정에 도입하는 것은 매우 어렵다. 이에 본 연구에서는 과정이수형 교육과정을 운영하고 있는 전문대학 사회복지과 교육과정에 NCS를 적용하기 위한 교육과정 설계모형을 다음과 같이 제시한다. 첫째, NCS 능력단위 중심의 교육과정 설계가 아닌 기존 교과목에 NCS 능력단위를 매핑하는 역공학적 접근을 시도한다. 둘째, 주 취업시장의 직무능력 함양을 위하여 노인, 아동, 장애인 등 대상에 따른 사회복지 서비스 제공에 관한 능력단위를 개발 추가한다. 셋째, NCS 능력단위를 주 취업시장의 직무와의 연관정도에 따라 유형 1,2,3 등 3 유형으로 분류하여 적용한다. 넷째, NCS 직업기초능력 중 사회복지 분야에 적합하다고 판단되는 4개 요소를 추출, 독자적인 과목으로 개설한다. 다섯째, 주 취업시장에서의 직무능력 함양을 위한 능력단위들의 조합을 하나의 가상 능력단위로 간주하고 유형 1, 유형 2, 유형 3 등의 순으로 3단계에 걸쳐 유기적으로 배치한 다음 학습 범위를 주 취업시장에서의 직무 수준으로 조정하여 3단계에 공통적으로 적용한다.

사회안전망과 지역사회주민의 안전생활만족의 관계: 사회안전망 척도개발과 적용 (The Relationship Between Social Security Network and Security Life Satisfaction in Community Residents: Scale Development and Application of Social Security Network)

  • 김찬선
    • 한국콘텐츠학회논문지
    • /
    • 제14권6호
    • /
    • pp.108-118
    • /
    • 2014
  • 본 연구의 목적은 사회안전망 측정도구를 개발하여 타당도와 신뢰도를 검증하고 이를 적용 하여 지역사회주민의 안전생활만족과의 관계를 규명하는데 있다. 이 연구는 2013년 서울시 시민들을 모집단으로 설정하여 집락무선표집법을 이용해 최종분석에 사용한 자료는 203명이다. 사회안전망 측정도구는 문헌고찰, 개념적 정의 및 설문지 초안 작성, 전문가 회의, 예비검사 및 본 조사, 설문지의 타당도 및 신뢰도 검증 등의 과정을 통하여 개발되었다. 이 연구에서는 설문지의 타당도를 검증하기 위해 전문가 회의를 하였으며, 탐색적 요인분석을 통해 범죄예방설계, 거리 CCTV시설, 지역자율방범활동, 지자체안전교육, 경찰치안서비스, 민간경비서비스 등의 6개 요인을 추출 하였다. 통계처리는 SPSSWIN 18.0 프로그램을 활용하여 빈도분석, 일원변량분석, 요인분석 및 신뢰도 분석, 상관분석, 다중회귀분석 등을 실시하였다. 결론은 다음과 같다. 첫째, 사회안전망 척도의 타당도는 매우 높다. 즉, 사회안전망 구성 요인은 범죄예방설계, 거리 CCTV시설, 지역자율방범활동, 지자체안전교육, 경찰치안서비스, 민간경비서비스 등으로 탐색되었으며, 범죄예방설계 요인의 설명력이 가장 높다. 둘째, 사회안전망 척도의 신뢰도는 매우 높다. 즉, 사회안전망은 문항과 영역간, 문항과 전반적 사회안전망간의 상관정도가 매우 높으며, 내적일관성 신뢰도 Cronbach's ${\alpha}$값이 .865 이상이다. 셋째, 사회안전망은 지역사회주민의 안전생활만족에 영향을 미친다. 즉, 범죄예방설계, 경찰치안서비스가 체계적으로 구축 된다면 시민들의 사회불안감은 감소한다.

국내 소비자들의 비트코인 사용 의도에 영향을 미치는 요인 연구 (The Factors Influencing Intention to Use Bit Coin of Domestic Consumers)

  • 신동희;김용문
    • 한국콘텐츠학회논문지
    • /
    • 제16권1호
    • /
    • pp.24-41
    • /
    • 2016
  • 최근 전 세계적으로 관심을 받고 있는 디지털 화폐인 비트코인에 대한 연구이다. 각 나라의 본원 통화와 도 교환이 가능할 뿐 아니라 소액결재에 대한 편의성 등으로 인해 국내에서도 사용이 점차 증가하고 있다. 이러한 시점에서 비트코인에 관한 국내 소비자들의 이해정도와 수용성에 대해 살펴보았다. 그리고 비트코인에 관한 국내 소비자들의 사용의도에 영향을 미치는 요인에 대해 알아보기 위해 기술수용모형을 변형하여 적용하였다. 먼저 비트코인의 특징을 분석하였고, 비트코인의 사용 의도에 관련된 국내외 선행연구가 아직은 미약해서 기존 전자화폐에 대한 연구들을 통해 변인들을 추출하였다. 연구 결과는 첫째, 비트코인의 특성 변수인 '경제성'이 매개변수인 '인지된 유용성'을 통해 종속변수인 '사용 의도'에 영향을 미친다는 결과이다. 이는 비트코인을 사용할 때 소요되는 금전적 정신적 비용이 다른 화폐를 사용할 때보다 적을 것이라고 조사되었다. 둘째, 비트코인의 특성 변수인 '지불 편의성'이 매개변수인 '인지된 유용성'을 통해 종속변수인 '사용 의도'에 영향을 미친다는 결과이다. 이는 비트코인을 사용함으로 인해 거래 처리, 현금관리 시간 단축, 그리고 거스름돈 교환에 따른 불편함이 해소될 것이라고 측정되었다. 셋째, 비트코인의 인지된 위험변수인 '신뢰성'은 종속변수인 '사용 의도'에 직접적인 영향을 미친다는 결과이다. 이는 비트코인이 여러 컴퓨터의 분산 데이터베이스에 의해 처리됨으로 시스템 고장 등에 영향을 받지 않아 지불의 목적을 달성할 수 있기 때문이다. 넷째, 비트코인의 매개변수인 '인지된 유용성'이 종속변수인 '사용 의도'에 직접적인 영향을 미친다는 결과이다. 결국, 비트코인을 사용하고자 하는 소비자들은 비트코인이 가진 다양한 유용성으로 인해 매력을 느낄 것이라는 의미이다. 또한 이러한 연구결과를 바탕으로 국내 금융 기관, 전자화폐 관련 업체, 그리고 비트코인 사용자 모두에게 시사점을 제공할 수 있기를 기대한다.

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.