• 제목/요약/키워드: intelligent ability

검색결과 476건 처리시간 0.025초

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

인공지능이 의사결정에 미치는 영향에 관한 연구 : 인간과 인공지능의 협업 및 의사결정자의 성격 특성을 중심으로 (A Study on the Impact of Artificial Intelligence on Decision Making : Focusing on Human-AI Collaboration and Decision-Maker's Personality Trait)

  • 이정선;서보밀;권영옥
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.231-252
    • /
    • 2021
  • 인공지능(Artificial Intelligence)은 미래를 가장 크게 변화시킬 핵심 동력으로 산업 전반과 개인의 일상생활에 다양한 형태로 영향을 미치고 있다. 무엇보다 활용 가능한 데이터가 증가함에 따라 더욱더 많은 기업과 개인들이 인공지능 기술을 이용하여 데이터로부터 유용한 정보를 추출하고 이를 의사결정에 활용하고 있다. 인공지능에 관한 기존 연구는 모방 가능한 업무의 자동화에 초점을 두고 있으나, 인간을 배제한 자동화는 장점 못지않게 알고리즘 편향(Algorithms bias)으로 발생되는 오류나 자율성(Autonomy)의 한계점, 그리고 일자리 대체 등 사회적 부작용을 보여주고 있다. 최근 들어, 인간지능의 강화를 위한 증강 지능 (Augmented intelligence)으로서 인간과 인공지능의 협업에 관한 연구가 주목을 받고 있으며 기업도 관심을 가지기 시작하였다. 본 연구는 의사결정을 위해 조언(Advice)을 제공하는 조언자의 유형을 인간, 인공지능, 그리고 인간과 인공지능 협업의 세 가지로 나누고, 조언자의 유형과 의사결정자의 성격 특성이 의사결정에 미치는 영향을 살펴보았다. 311명의 실험자를 대상으로 사진 속 얼굴을 보고 나이를 예측하는 업무를 진행하였으며, 연구 결과 의사결정자가 조언활용을 하려면 먼저 조언의 유용성을 높게 인지하여하는 것으로 나타났다. 또한 의사결정자의 성격 특성이 조언자 유형별로 조언의 유용성을 인지하고 조언을 활용하는 데에 미치는 영향을 살펴본 결과, 인간과 인공지능의 협업 형태인 경우 의사결정자의 성격 특성에 무관하게 조언의 유용성을 더 높게 인지하고 적극적으로 조언을 활용하는 것으로 나타났다. 인공지능 단독으로 활용될 경우에는 성격 특성 중 성실성과 외향성이 강하고 신경증이 낮은 의사결정자가 조언의 유용성을 더 높게 인지하고 조언을 활용하는 것으로 나타났다. 본 연구는 인공지능의 역할을 의사결정과 판단(Decision Making and Judgment) 연구 분야의 조언자의 역할로 보고 관련 연구를 확장하였다는데 학문적 의의가 있으며, 기업이 인공지능 활용 역량을 제고하기 위해 고려해야 할 점들을 제시하였다는데 실무적 의의가 있다.

딥러닝 오픈소스 프레임워크의 사례연구를 통한 도입 전략 도출 (Deriving adoption strategies of deep learning open source framework through case studies)

  • 최은주;이준영;한인구
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.27-65
    • /
    • 2020
  • 많은 정보통신기술 기업들은 자체적으로 개발한 인공지능 기술을 오픈소스로 공개하였다. 예를 들어, 구글의 TensorFlow, 페이스북의 PyTorch, 마이크로소프트의 CNTK 등 여러 기업들은 자신들의 인공지능 기술들을 공개하고 있다. 이처럼 대중에게 딥러닝 오픈소스 소프트웨어를 공개함으로써 개발자 커뮤니티와의 관계와 인공지능 생태계를 강화하고, 사용자들의 실험, 적용, 개선을 얻을 수 있다. 이에 따라 머신러닝 분야는 급속히 성장하고 있고, 개발자들 또한 여러가지 학습 알고리즘을 재생산하여 각 영역에 활용하고 있다. 하지만 오픈소스 소프트웨어에 대한 다양한 분석들이 이루어진 데 반해, 실제 산업현장에서 딥러닝 오픈소스 소프트웨어를 개발하거나 활용하는데 유용한 연구 결과는 미흡한 실정이다. 따라서 본 연구에서는 딥러닝 프레임워크 사례연구를 통해 해당 프레임워크의 도입 전략을 도출하고자 한다. 기술-조직-환경 프레임워크를 기반으로 기존의 오픈 소스 소프트웨어 도입과 관련된 연구들을 리뷰하고, 이를 바탕으로 두 기업의 성공 사례와 한 기업의 실패 사례를 포함한 총 3 가지 기업의 도입 사례 분석을 통해 딥러닝 프레임워크 도입을 위한 중요한 5가지 성공 요인을 도출하였다: 팀 내 개발자의 지식과 전문성, 하드웨어(GPU) 환경, 데이터 전사 협력 체계, 딥러닝 프레임워크 플랫폼, 딥러닝 프레임워크 도구 서비스. 그리고 도출한 성공 요인을 실현하기 위한 딥러닝 프레임워크의 단계적 도입 전략을 제안하였다: 프로젝트 문제 정의, 딥러닝 방법론이 적합한 기법인지 확인, 딥러닝 프레임워크가 적합한 도구인지 확인, 기업의 딥러닝 프레임워크 사용, 기업의 딥러닝 프레임워크 확산. 본 연구를 통해 각 산업과 사업의 니즈에 따라, 딥러닝 프레임워크를 개발하거나 활용하고자 하는 기업에게 전략적인 시사점을 제공할 수 있을 것이라 기대된다.

공공 정보지원 인프라 활용한 제조 중소기업의 특징과 성과에 관한 연구 (The Characteristics and Performances of Manufacturing SMEs that Utilize Public Information Support Infrastructure)

  • 김근환;권태훈;전승표
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.1-33
    • /
    • 2019
  • 제조 중소기업들은 지속적인 성장과 생존을 위해 새로운 제품 개발에 필요한 많은 정보가 필요할 뿐만 아니라 자원의 한계를 극복하기 위한 네트워킹(networking)을 추구하지만, 규모의 한계로 인해 한계점에 봉착하게 된다. 초연결성으로 인해 비즈니스 환경의 복잡성과 불확실성이 더욱 높아지는 새로운 시대에 중소기업은 신속한 정보 확보와 네트워킹 문제를 해결이 더욱 절실해지고 있다. 이러한 문제를 해결하기 위해 공공기관인 정부출연(연)구기관(이하 '출연(연)')은 중소기업의 정보 비대칭성 문제를 해결해야하는 중요한 임무와 역할을 맞이하고 있다. 본 연구에서는 비즈니스 인텔리젼스의 경쟁 지능화(competitive intelligence) 기능과 외부 네트워크 활성화를 위한 서비스 인프라(service infrastructure)의 기능을 포함한 공공 정보지원 인프라를 통한 간접지원의 성과를 확산하고자 하는 목적으로 출연(연)이 중소기업의 혁신역량 제고를 위해 제공하는 공공 정보지원 인프라를 활용하는 중소기업의 차별적 특징을 파악하고, 인프라가 기업의 성과에 어떻게 기여하는 가를 규명하고자 하였다. 이를 위해 첫째, 출연(연)이 제공한 정보지원 인프라를 활용하는 제조 중소기업은 다른 중소기업과 어떤 차별적인 특정이 있는가? 라는 연구 질의를 도출하였다. 추가적으로 단순히 선택적 편의 여부를 판단하는 것을 넘어서 출연(연) 정보지원 인프라를 활용한 제조 중소기업의 특징을 복수 집단의 특징과 비교하는 연구를 진행하였다. 둘째, 출연(연)이 제공하는 정보지원 인프라를 활용한 제조 중소기업의 외부 네트워킹 역량이 제품 경쟁력에 어떻게 기여했는가? 라는 연구 질의이다. 본 연구에서 공공 정보지원 인프라에 의해서 강화된 외부 네트워킹 역량이 어떻게 제품 경쟁력에 영향을 미쳤는지 정밀하게 분석하기 위해 복수의 변수에 대한 매개 및 조절 효과 분석을 수행하였다. 연구 모형을 도출하기하기 위해 첫째, 외부 네트워킹이 기술혁신성과에 영향력에 대한 평가를 수행하였다. 일반적으로 기업들은 외부 네트워킹(networking) 전략을 통해 혁신에 필요한 가치 있는 정보를 획득할 수 있기 때문에 기술혁신성과를 높일 수 있다. 정보 획득은 중소 제조기업 경영자의 혁신에 대한 인식을 강화할 뿐만아니라, 의사결정을 효율적으로 하여 경쟁력을 강화시킬 수 있게 된다. 대기업에 비해 인력과 자금의 규모 한계를 극복하기 위해 중소기업은 외부 조직과의 협력관계를 보다 적극적으로 추구한다. 둘째, 기술사업화 역량이 기술혁신성과에 미치는 관계에 대한 평가를 수행하였다. 기술사업화는 생산과 마케팅을 통합하여 새로운 기술을 만드는 역량을 말한다. 우수한 생산 역량을 보유한 기업은 소비자의 수요를 가격, 품질, 신기능 측면에서 신속하게 충족시킬 수 있어 시장내 경쟁우위를 창출하고, 그 결과로 높은 재무적 혁신적 성과를 가져온다고 본다. 혁신적인 기업은 생산 역량과 마케팅 역량에서 일반 기업보다 높은 성과를 나타내는데, 기술혁신성과의 대표 지표로 제품 경쟁력을 지목하고 있다. 마지막으로 기업의 규모가 작을수록 새로운 혁신 정보를 확보할 수 있는 자체 정보지원 인프라가 없는 경향이 있다. 중소기업용 정보인프라는 기업의 제품 또는 서비스 역량을 강화하기 위한 전략에 필요한 중요한 정보를 확보할 수 있어야 하며, 데이터에 대한 해석 기능이 있어야 하고, 기업의 성장과 발전을 위한 다양한 주제(대기업, 공급자, 소비자 등)와의 협력 전략을 수립을 도울 수 있는 기능이 요구된다. 종합하면, 연구모형은 외부 네트워킹 역량(독립변수)이 기술혁신성과인 제품 경쟁력(종속변수)에 영향을 주는 기본 모형에 기술사업화 역량을 매개요인으로 적용하였고, 이들의 관계에 기업의 내부역량(연구원 집중도, 매출액, 업력)이 영향을 줄 수 있기 때문에 기업의 내부역량과 관련된 변수들을 통제하였다. 또한 KISTI가 제공한 공공 정보지원 인프라 활용한 기업별 역량 차이를 분석하기 위해, 정보지원 인프라 활용(효율성)과 관련된 KISTI 외부 기술사업화 전문가(멘토링) 정보지원 횟수의 조절 변수로 고려하였다. 본 연구에서 활용한 데이터 원천은 2차 정보인 '제8차 중소기업 기술통계조사' 자료와 1차 정보인 KISTI의 직접 설문 자료다. '제8차 중소기업 기술통계조사' 는 중소기업청과 중소기업중앙회에서 공동으로 매년 실시되고 있으며, 설문 조사의 모집단은 종사자수 5인 이상 300인 미만인 제조업 및 제조업 외 기업 중에서 기술개발을 수행하고 있는 중소기업 43,204개사이다. 이 중에서 2014년 12월 31일 현재 기준으로 기술개발을 수행하고 있는 3,300개 중소기업을 표본추출하여 방문조사를 실시하여 수집한 자료이다. 본 연구에서 KISTI의 정보지원 인프라를 통해 지원받은 290개의 KISTI 패밀리 기업(ASTI)을 대상으로 2017년에 전자 메일을 통해 자료를 수집하였다. 송부된 290개의 설문지 중 222개의 기업에서 회신을 보내왔으며 그 중에서 설문 내용이 유효한 설문 조사는 149건으로 활용율은 51.3%였다. 분석 결과에 대한 살펴보면 다음과 같다. 규모면에서는 공공 정보지원 인프라 활용 제조 중소기업(ASTI 설문 집단)과 R&D 중소기업(KBIZ 설문 집단)의 성향은 통계적으로 유의미하게 차이가 있었지만, 보다 많은 변수를 종합적으로 보면 크게 다르지 않은 집단이라고 판단했다. 공공 정보지원 인프라를 활용하는 제조 중소기업은 이미 출연(연)과 협업이 가능한 집단을 대표하는 성향 보이는 것으로 나타났다. 외부 네트워킹 역량 강화가 제품 경쟁력 제고에 기여하는데 있어서 기술사업화 역량(마케팅 및 생산 역량)이 가지는 매개 효과의 가능성을 탐색하기 위해서 먼저 통제 변수는 고려하지 않고, Baron과 Kenny(1986)의 매개 효과 분석을 수행했다. 분석결과 외부 네트워크 역량 강화 효과가 제품 경쟁력을 강화시키는 것으로 보였지만, 실제는 기술사업화 역량의 제고를 통해 제품 경쟁력을 강화시키는 것으로 나타났다. 공공 정보지원 인프라 활용의 효과성을 판단하기 위한 멘토링 정보지원 횟수의 조절효과 분석을 위해 3단계의 위계적 회귀분석을 수행하였다. 분석 결과 외부 네트워킹 역량과 멘토링 정보지원 횟수의 상호작용항이 혁신성과(제품 경쟁력)에 유의한 영향을 미쳤을 뿐 아니라, 모델의 설명력도 증가하여, 멘토링 정보지원 횟수의 조절 효과가 검증되었다. 마지막으로 앞서 확인된 복수 매개효과와 조절효과가 동시에 나타날 수 있는 가능성을 판단하기 위해서 매개된 조절효과를 검토했다. 분석결과 외부 네트워킹 역량이 높아지면 제품 경쟁력 제고에 양의 영향을 주지만, 조절 변수인 멘토링 지원 횟수가 높아질수록 그 영향은 오히려 약화되었다. 그리고 외부 네트워킹 역량이 높아지면 사업화 역량(마케팅과 생산)이 높아져서 제품 경쟁력이 높아지며, 조절변수인 멘토링 지원 횟수가 높아지면 독립변수 외부 네트워킹 역량이 매개변수 생산 역량에 미치는 역량이 작아졌다. 종합하면, 외부 네트워킹 역량의 제고는 제품 경쟁력을 높이는데 기여하는데, 직접적 기여하지는 않지만 마케팅과 생산 역량을 높여 간접적으로 기여한다(완전 매개 효과). 또한 이 과정에서 멘토링의 정보적 지원 횟수는 외부 네트워킹 역량 제고가 생산 역량을 제고하는 매개효과에 영향을 준다(순수 조절 효과). 그러나 멘토링 정보 지원 횟수는 마케팅 역량 제고와 제품경쟁력에 별다른 조절 효과를 보이진 않는 것으로 나타났다. 연구를 통한 시사점은 다음과 같다. KISTI의 정보지원 인프라는 서비스 활용 마케팅이 이미 잘 진행되고 있다는 결론을 이끌 수도 있지만, 반면에 시장의 정보 불균형을 해소하는 공공적 기능보다는(열위 기업 지원) 성과가 잘 도출될 수 있는 집단을 지원해서(의도적 선택적 편의) 성과가 잘 나타나도록 관리하고 있다는 결론에 이를 수 있다. 연구 결과를 통해서 우리는 공공 정보지원 인프라가 어떻게 제품경쟁력 제고에 기여하는지 확인했는데, 여기서 우리는 다음과 같은 몇 가지 정책적 시사점을 도출할 수 있다. 첫째, 정보지원 인프라는 분석된 정보뿐만아니라 이 정보를 제공하는 기관(또는 전문가)과 지속적인 교류나 이런 기관을 찾는 역량을 높이는 기능이 있어야 한다. 둘째, 공공 정보지원 (온라인) 인프라의 활용이 효과적이라면 병행적인 오프라인 지원인 정보 멘토링이 지속적으로 제공될 필요는 없으며, 오히려 멘토링과 같은 오프라인 병행 지원은 성과 제고보다는 이상징후 감시에 적절한 장치로 활용되어야 한다. 셋째, 셋째, 공공 정보지원 인프라를 통한 네트워킹 역량 제고와 이를 통한 제품경쟁력 제고 효과는 특정 중소기업에서 나타나기 보다는 대부분 형태의 기업에서 나타나기 때문에, 중소기업이 활용 능력을 제고할 노력이 요구된다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.