• Title/Summary/Keyword: Analysis Algorithm

검색결과 12,267건 처리시간 0.042초

혈중산소포화도검사를 이용한 폐쇄성 수면무호흡증의 흡증의 진단 (Diagnosis of Obstructive Sleep Apnea Syndrome Using Overnight Oximetry Measurement)

  • 윤탁;박두흠;최광호;김용식;우종인;권준수;하규섭;정도언
    • 수면정신생리
    • /
    • 제9권1호
    • /
    • pp.34-40
    • /
    • 2002
  • 목 적 : 폐쇄성 수면무호흡증은 일반인구의 $2{\sim}5%$ 정도에서 발견될 정도로 흔한 질환이다. 합병증이 심각해서 치료의 중요성이 점차 증가되고 있다. 폐쇄성 수면무호흡증의 진단에는 야간 수면다원검사가 가장 기본적인 방법이지만, 숙련된 인력이 필요하고, 경제적인 부담이 커서 제한적으로 사용되고 있다. 이런 이유로 수면무호흡증 선별을 위한 보다 간편하고 경제적인 방법에 대한 필요성이 제기되어 왔다. 본 연구에서는 수면다원검사에 비해 간편하고 쉽게 사용할 수 있는 혈중산소포화농도측정기를 이용하여 그 측정소견을 활용하면 수면무호흡증의 선별 진단이 가능한지를 연구하였다. 방 법 : 수면다원검사실에 의뢰된 환자들 중 무작위로 선정된 59명을 연구 대상으로 하였다. 수면다원검사기기로 기록을 하면서 동시에 혈중산소포화농도측정기를 이용하여 혈중산소포화도 기록을 얻었다. 수면다원기록 판독은 국제 판독기준에 따랐다. 저하 지수(dip index), 동맥혈 혈중산소포화도 평균치(mean $SaO_2$), 그리고 CT90(혈중산소포화도가 90%이하인 수면 시간의 비율)을 이용하여 수면무호흡증의 진단 기준을 설정하였으며, 그 결과를 수면다원검사의 결과와 비교하였다. 혈중산소포화도에서 도출된 세기준에 따른 민감도, 특이도를 계산하였다. 결 과 : 전체 59명의 대상자 중에서 39명이 수면다원검사에 의해 수면무호흡증으로 진단되었다. 평균 호흡장애지수는 17.5 이었으며, 혈중산소포화도 평균치는 94.9%, 평균 CT90은 5.1%이었다. 저하 지수[$4%{\sim}4$초]가 호흡 장애지수(RDI)와 연관성이 가장 직선적으로 높았으며, 저하 지수[$4%{\sim}4$초]${\geq}2$일 때 0.95의 민감도와 0.71의 특이도를 보였다. 혈중산소포화도 평균치${\leq}97%$를 수면무호흡증의 진단 기준으로 할 경우 0.95의 민감도와 0.41의 특이도가 산출되었다. $CT90{\geq}5%$를 수면무호흡증의 진단 기준으로 하였을 때 민감도는 0.28 이었으며 특이도는 1.00이었다. 결 론 : 본 연구에서는 혈중산소포화농도측정기에서 얻어낸 저하 지수, 혈중 산소포화도 평균치, 그리고 CT90을 이용하여 수면다원검사를 대치해 수면무호흡증을 선별, 진단해낼 수 있는 가능성을 제시하였다.

  • PDF

소셜 뉴스를 위한 시간 종속적인 메타데이터 기반의 컨텍스트 공유 프레임워크 (Context Sharing Framework Based on Time Dependent Metadata for Social News Service)

  • 가명현;오경진;홍명덕;조근식
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.39-53
    • /
    • 2013
  • 인터넷의 발달과 SNS의 등장으로 정보흐름의 방식이 크게 바뀌었다. 이러한 변화에 따라 소셜 미디어가 급부상하고 있으며 소셜 미디어와 비디오 콘텐츠가 융합된 소셜 TV, 소셜 뉴스의 중요성이 강조되고 있다. 이러한 환경 속에서 사용자들은 단순히 콘텐츠를 탐색만 하는 것이 아니라 같은 콘텐츠를 이용하고 있는 친구들이나 지인들과 콘텐츠에 대한 정보나 경험들을 공유하고 더 나아가 새로운 콘텐츠를 만들어내기도 한다. 하지만 기존의 소셜 뉴스에서는 이러한 사용자들의 특성을 반영해 주지 못하고 있다. 특히 이용자들의 참여성만을 고려하고 있어서 서비스간의 차별화가 어렵고 뉴스 콘텐츠에 대한 정보나 경험 공유 시 컨텍스트 공유가 어렵다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 뉴스를 내용별로 분할하고 분할된 뉴스에서 추출된 시간 종속적인 메타데이터를 제공하는 프레임워크를 제안한다. 제안하는 프레임워크에서는 스토리 분할 방법을 이용하여 뉴스 대본을 내용별로 분할한다. 또한 뉴스 전체내용을 대표하는 태그, 분할된 뉴스를 나타내는 서브 태그, 분할된 뉴스가 비디오에서 시작하는 위치 즉, 시간 종속적인 메타데이터를 제공한다. 소셜 뉴스 이용자들에게 시간 종속적인 메타데이터를 제공한다면 이용자들은 전체의 뉴스 내용 중에 자신이 원하는 부분만을 탐색 할 수 있으며 이 부분에 대한 견해를 남길 수 있다. 그리고 뉴스의 전달이나 의견 공유 시 메타데이터를 함께 전달함으로써 전달하고자 하는 내용에 바로 접근이 가능하며 프레임워크의 성능은 추출된 서브 태그가 뉴스의 실제 내용을 얼마나 잘 나타내 주느냐에 따라 결정된다. 그리고 서브 태그는 스토리 분할의 정확성과 서브 태그를 추출하는 방법에 따라 다르게 추출된다. 이 점을 고려하여 의미적 유사도 기반의 스토리 분할 방법을 프레임워크에 적용하였고 벤치마크 알고리즘과 성능 비교 실험을 수행하였으며 분할된 뉴스에서 추출된 서브 태그들과 실제 뉴스의 내용을 비교하여 서브 태그들의 정확도를 분석하였다. 결과적으로 의미적 유사도를 고려한 스토리 분할 방법이 더 우수한 성능을 보였으며 추출된 서브 태그들도 컨텍스트와 관련된 단어들이 추출 되었다.

사례 기반 지능형 수출통제 시스템 : 설계와 평가 (Export Control System based on Case Based Reasoning: Design and Evaluation)

  • 홍원의;김의현;조신희;김산성;이문용;신동훈
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.109-131
    • /
    • 2014
  • 최근 전 세계적인 원전 설비의 수요 증가로 원자력 전략물자 취급의 중요성이 높아지는 가운데, 국외 수출을 위한 원전 관련 물품 및 기술의 신청 또한 급증하는 추세이다. 전략물자 사전판정 업무는 통상 원자력 물자 관리에 해박한 전문가의 경험 및 지식에 근거하여 수행되어 왔지만, 급증하는 수요에 상응하는 전문 인력의 공급이 부족한 실정이다. 이러한 문제를 극복하기 위하여, 본 연구진은 전략물자 수출 통제를 위한 사례 기반 지능형 수출 통제 시스템을 설계 및 개발하였다. 이 시스템은 현장 전문가의 전담 업무이던 신규 사례에 대한 전략물자 사전판정 과정 업무의 주요 맥락을 자동화 하여 전문가 및 관계 기관이 감당해야 할 업무 부담을 줄이며, 빠르고 정확한 판정을 돕는 의사결정 지원 시스템의 역할을 맡는다. 개발된 시스템은 사례 기반 추론 (Case Based Reasoning) 방식에 기반을 두어 설계되었는데, 이는 과거 사례의 특성을 활용하여 신규 사례의 해법을 유추하는 추론 방법이다. 본 연구에서는 자연어로 작성된 전자문서 처리에 널리 사용되는 텍스트 마이닝 분석 기법을 원자력 분야에 특화된 형태로 응용하여 전략물자 수출통제 시스템을 설계하였다. 시스템 설계의 근거로 선행 연구에서 제안된 반자동식 핵심어 추출 방안의 성능을 보다 엄밀히 검증하였고, 추출된 핵심어로 신규 사례와 유사한 과거 사례를 추출하는 알고리즘을 제안하였다. 제안된 방안은 텍스트 마이닝 분야의 TF-IDF 방법 및 코사인 유사도 점수를 활용한 결과(${\alpha}$)와 원자력 분야에서 통용되는 개념적 지식을 계통으로 분류하여 도출한 결과(${\beta}$)를 조합하여 최종 결과 (${\gamma}$) 를 생성하게 된다. 세부 요소 기술의 성능 검증은 임상 데이터를 활용한 실험 및 실무 전문가의 의견수렴을 통해 이루어졌다. 개발된 시스템은 사전판정 전문 인력을 다수 양성하는 데 드는 비용을 절감하는 데 일조할 것이며, 지식서비스 산업의 의미 있는 응용 사례로서 관련 산업의 성장에 기여할 수 있을 것으로 보인다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

예측 불가능한 호흡 변화에 따른 사이버나이프 종양 추적 방사선 치료의 정확도 분석 (An accuracy analysis of Cyberknife tumor tracking radiotherapy according to unpredictable change of respiration)

  • 서정민;이창열;허현도;김완선
    • 대한방사선치료학회지
    • /
    • 제27권2호
    • /
    • pp.157-166
    • /
    • 2015
  • 목 적 : 사이버나이프 종양 추적 시스템(Cyber-knife tumor tracking system)은 환자 외부에 부착한 LED marker에서 얻어진 실시간 호흡 주기 신호와 호흡에 따라 움직이는 종양의 위치와의 상관관계를 바탕으로 종양의 위치를 미리 예측하고 종양의 움직임을 치료기와 동기화 (Synchronize) 시켜 실시간으로 종양을 추적하며 치료하는 시스템이다. 본 연구의 목적은 사이버나이프 종양 추적 방사선 치료 중 기침이나 수면 등으로 인해 예측 불가능한 갑작스러운 호흡 형태 변화에 따른 종양 추적 방사선 치료 시스템의 정확도를 평가하고자 한다. 대상 및 방법 : 연구에 사용된 호흡 Log 파일은 본원에서 호흡 동조 방사선치료(Respiratory gating radiotherapy)나 사이버나이프 호흡 추적 방사선수술(Cyber-knife tracking radiosurgery)을 받았던 환자의 호흡 Log 파일을 바탕으로, 정현곡선 형태(Sinusoidal pattern)와 갑작스런 변화 형태(Sudden change pattern)의 Log 파일을 이용하여 측정이 가능하도록 재구성하였다. 재구성 된 호흡 Log 파일을 사이버나이프 동적 흉부 팬텀에 입력하여 호흡에 따른 움직임을 구현할 수 있도록 기존 동적 흉부 팬텀의 구동장치를 추가 제작하였고, 호흡의 형태를 팬텀에 적용 시킬 수 있는 프로그램을 개발하였다. 팬텀 내부 표적(Ball cube target)의 움직임은 호흡의 크기에 따라 상하(Superior-Inferior)방향으로 5 mm, 10 mm, 20 mm 3가지 크기의 변위로 구동하게 하였다. 팬텀 내부 표적에 EBT3 필름 2장을 교차 삽입하여 표적 움직임의 변화에 따라 사이버나이프 제조사에서 제공된 End-to-End(E2E) test를 호흡의 형태에 따라 각각 5회씩 실시하고 측정하였다. 종양 추적 시스템의 정확도는 삽입된 필름을 분석하여 표적 오차(Targeting error)로 나타내었고, 추가로 E2E test가 진행되는 동안 상관관계 오차(Correlation error)를 측정하여 분석하였다. 결 과 : 표적 오차는 정현곡선 호흡 형태일 경우 표적 움직임의 크기가 5 mm, 10 mm, 20 mm 에 따라 각각 평균 $1.14{\pm}0.13mm$, $1.05{\pm}0.20mm$, $2.37{\pm}0.17mm$이고, 갑작스런 호흡 변화 형태일 경우 각각 평균 $1.87{\pm}0.19mm$, $2.15{\pm}0.21mm$, $2.44{\pm}0.26mm$으로 분석되었다. 표적 추적에 있어 변위 벡터의 길이로 정의할 수 있는 상관관계 오차는 정현곡선 호흡 형태일 경우 표적 움직임의 크기가 5 mm, 10 mm, 20 mm 에 따라 각각 평균 $0.84{\pm}0.01mm$, $0.70{\pm}0.13mm$, $1.63{\pm}0.10mm$이고, 갑작스런 호흡 변화 형태일 경우 각각 평균 $0.97{\pm}0.06mm$, $1.44{\pm}0.11mm$, $1.98{\pm}0.10mm$으로 분석되었다. 두 호흡 형태에서 모두 상관관계 오차 값이 클수록 표적 오차 값이 크게 나타났다. 정현곡선 호흡 형태의 표적 움직임 크기가 20 mm 이상일 경우, 두 오차 값 모두 사이버나이프 제조사의 권고치인 1.5 mm 이상으로 측정되었다. 결 론 : 표적 움직임의 크기가 클수록 표적 오차 값과 상관관계 오차 값이 증가하는 경향이 있었으며, 정현곡선 호흡 형태보다 갑작스런 호흡 변화 형태에서 오차 값이 크게 나타났다. 호흡의 형태가 규칙적인 정현 곡선 형태더라도 표적의 움직임이 클수록 종양 추적 시스템의 정확도가 감소하는 것으로 판단할 수 있다. 사이버나이프 종양 추적 시스템의 알고리즘을 이용하여 치료 시행 시 환자의 기침 등으로 인하여 갑작스럽게 예측 불가능한 호흡 변화가 있는 경우 치료를 멈추고 내부 표적 확인 과정을 재실시 하여야 하며 호흡 형태를 재조정해야 할 필요가 있다. 치료 중 환자가 본인의 호흡 형태를 관찰 할 수 있는 고글 모니터 등을 착용하여 규칙적인 호흡 형태를 유도하는 것이 치료의 정확도는 향상될 수 있다고 판단된다.

  • PDF

시장 환경이 인터넷 경로를 포함한 다중 경로 관리에 미치는 영향에 관한 연구: 게임 이론적 접근방법 (The Impact of Market Environments on Optimal Channel Strategy Involving an Internet Channel: A Game Theoretic Approach)

  • 유원상
    • 한국유통학회지:유통연구
    • /
    • 제16권2호
    • /
    • pp.119-138
    • /
    • 2011
  • 지난 십년동안 인터넷을 통한 전자상거래는 빠른 속도로 성장해 왔다. 이러한 인터넷의 발달은 기업들의 사업방식에 많은 변화를 유도했으며, 그 중에서도 마케팅경로의 구조와 경로 구성원들 사이의 관계에 중요한 변화를 초래하고 있다. 각 기업이 처한 시장환경은 다양하며 이 다양한 시장 환경은 인터넷 경로가 각 시장에 미치는 효과를 조절하는 역할을 한다. 이러한 시장의 다양성에도 불구하고 지금까지의 선행연구들은 각기 특정한 하나의 시장상황(unique setting)을 상정하여 인터넷경로 도입이 그 시장에 미치는 영향을 분석하는데 그쳐왔다. 이러한 기존 연구의 공백을 채우기 위해 본 연구는 시장의 다양성을 소비자의 지리적 분포, 시장의 인터넷 수용도의 측면에서 살펴보고 이러한 시장 환경이 인터넷 경로 도입 효과에 미치는 영향에 관하여 조사해 보고자 한다. 이를 위해 본 연구는 다양한 소비자들의 지리적 분포, 경쟁강도, 소비자의 인터넷 상거래에 대한 수용도 등을 포함한 다양한 시장 환경을 수요모형에 반영시켜 그 영향력 분석을 가능하도록 하였다. 그러나, 다양한 시장 요소를 모형에 반영하는 과정에서 수요모형이 복잡한 구조를 가지게 되었다. 이 문제를 극복하고 게임이론의 균형해를 도출하기 위해 Newton-Raphson algorithm을 사용한 numerical search 방법을 사용하였다. 분석결과 두 종류의 경로에 대한 소비자선호의 분포에 따라 생산자의 가격차별정도, 생산자와 독립소매상 간의 경로이윤 배분율, 그리고 인터넷경로 도입이 각 경로주체의 이윤 향상에 도움이 되는지의 여부, 소비자잉여 등이 달라질 수 있음을 발견하였다. 끝으로 연구의 학술적, 실무적 시사점과 한계점 및 향후 연구방향도 논의되었다.

  • PDF

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.