• 제목/요약/키워드: ALGORITHM

검색결과 62,659건 처리시간 0.082초

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

사고가 시각을 바꾼다: 조절 초점에 따른 소비자 감성 기반 웹 스타일 평가 모형 및 추천 알고리즘 개발 (Individual Thinking Style leads its Emotional Perception: Development of Web-style Design Evaluation Model and Recommendation Algorithm Depending on Consumer Regulatory Focus)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.171-196
    • /
    • 2018
  • 본 연구는 디자인 영역 중 웹 스타일에 대해서 소비자 감성과 만족과의 관계를 연구했다. 기존 웹 스타일 연구들은 웹의 레이아웃과 구조도 등과 색상 등이 감성에 미치는 영향에서 연구했다. 본 연구는 기존 연구들과 차별되게 웹의 구성 요소를 배제하고 소비자의 감성 지표만을 갖고 소비자 만족과의 관계를 분석했다. 분석을 위해 검증을 위해 소비자 204명을 대상으로 40개 웹 스타일 테마를 선정, 각 소비자에게 4개씩 평가하도록 하였다. 소비자에게 평가하도록 한 감성 형용사는 18개의 대비되는 쌍을 갖는 감성 형용사로 구성하였고, 요인 분석을 통해 상위 감성 지표를 추출했다. 각 감성 지표들은 '부드러움', '모던함', '명확함', '꽉 참' 이었으며, 감성지표들이 소비자 만족에 미치는 영향이 다를 것으로 판단하여 가설을 수립했다. 분석 결과에 따라 가설 1과 2, 3은 채택되었으며, 가설 4의 경우는 기각되었다. 가설 4의 경우 기각되었지만 정의 방향이 아닌 부의 방향으로 유의한 것으로 나타났다. 이때, 조절 초점 성향이 감성이라는 정보처리 과정에서 소비자 만족에 미치는 영향이 다를 것으로 판단했다. 조절 초점 성향은 조직 행동 및 의사결정에 영향을 주기도 하며, 정치, 문화, 윤리적 판단 및 행동은 물론 광범위적 심리적 문제와 사고 프로세스, 감정적 반응에도 영향을 미친다. 때문에 각 감성 지표에 대한 조절 초점 간 차이를 확인할 필요성이 있고, 각 감성 지표에 대한 세부 가설을 수립했다. 세부 가설을 검증하기 위해 조절 회귀 분석을 수행했다. 분석 결과 가설 5는 부분적으로 지지됐고, 가설 5.3만 지지되었고, 5.4의 경우 기각되었지만 가설과의 반대 방향으로 지지되었다. '명확함'의 경우 향상 초점이 소비자 만족에 더 큰 영향을 보였고, 예방 초점일수록 '꽉 참'을 더 선호한 것으로 나타났다. 분석 결과를 바탕으로 조절 초점 성향을 향상, 예방, 중간 성향으로 3집단으로 구분, 소비자 감성 기반으로 웹 스타일에 대한 추천을 할 수 있는 알고리즘을 개발했다.

스마트폰 다종 데이터를 활용한 딥러닝 기반의 사용자 동행 상태 인식 (A Deep Learning Based Approach to Recognizing Accompanying Status of Smartphone Users Using Multimodal Data)

  • 김길호;최상우;채문정;박희웅;이재홍;박종헌
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.163-177
    • /
    • 2019
  • 스마트폰이 널리 보급되고 현대인들의 생활 속에 깊이 자리 잡으면서, 스마트폰에서 수집된 다종 데이터를 바탕으로 사용자 개인의 행동을 인식하고자 하는 연구가 활발히 진행되고 있다. 그러나 타인과의 상호작용 행동 인식에 대한 연구는 아직까지 상대적으로 미진하였다. 기존 상호작용 행동 인식 연구에서는 오디오, 블루투스, 와이파이 등의 데이터를 사용하였으나, 이들은 사용자 사생활 침해 가능성이 높으며 단시간 내에 충분한 양의 데이터를 수집하기 어렵다는 한계가 있다. 반면 가속도, 자기장, 자이로스코프 등의 물리 센서의 경우 사생활 침해 가능성이 낮으며 단시간 내에 충분한 양의 데이터를 수집할 수 있다. 본 연구에서는 이러한 점에 주목하여, 스마트폰 상의 다종 물리 센서 데이터만을 활용, 딥러닝 모델에 기반을 둔 사용자의 동행 상태 인식 방법론을 제안한다. 사용자의 동행 여부 및 대화 여부를 분류하는 동행 상태 분류 모델은 컨볼루션 신경망과 장단기 기억 순환 신경망이 혼합된 구조를 지닌다. 먼저 스마트폰의 다종 물리 센서에서 수집한 데이터에 존재하는 타임 스태프의 차이를 상쇄하고, 정규화를 수행하여 시간에 따른 시퀀스 데이터 형태로 변환함으로써 동행 상태분류 모델의 입력 데이터를 생성한다. 이는 컨볼루션 신경망에 입력되며, 데이터의 시간적 국부 의존성이 반영된 요인 지도를 출력한다. 장단기 기억 순환 신경망은 요인 지도를 입력받아 시간에 따른 순차적 연관 관계를 학습하며, 동행 상태 분류를 위한 요인을 추출하고 소프트맥스 분류기에서 이에 기반한 최종적인 분류를 수행한다. 자체 제작한 스마트폰 애플리케이션을 배포하여 실험 데이터를 수집하였으며, 이를 활용하여 제안한 방법론을 평가하였다. 최적의 파라미터를 설정하여 동행 상태 분류 모델을 학습하고 평가한 결과, 동행 여부와 대화 여부를 각각 98.74%, 98.83%의 높은 정확도로 분류하였다.

ERGM 기반의 모수적 및 비모수적 방법을 활용한 수출 유망국가 분석: 정보통신 및 가전 산업 사례를 중심으로 (Analysis of promising countries for export using parametric and non-parametric methods based on ERGM: Focusing on the case of information communication and home appliance industries)

  • 전승표;서진이;유재영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.175-196
    • /
    • 2022
  • 우리나라의 주력 산업 중 하나였던 정보통신 및 가전 산업은 점차 수출 비중이 낮아지는 등 수출 경쟁력이 약화되고 있다. 본 연구는 이런 정보통신 및 가전 산업의 수출 제고를 돕기 위해서 객관적으로 수출경쟁력을 분석하고 수출 유망국가를 제시하고자 했다. 본 연구는 수출경쟁력 평가를 위해서 네트워크 분석 중 구조적 특징, 중심성 그리고 구조적 공백 분석을 수행했다. 유망 수출 국가를 선정하기 위해서는 기존에 경제적 요인 외에도 이미 형성된 글로벌 무역 네트워크(ITN) 즉 글로벌 밸류체인(GVC)의 특성을 고려할 수 있는 새로운 변수를 제안했다. 국가간 무역 네트워크 분석에서 Exponential Random Graph Model(ERGM)을 통해 도출된 개별적인 링크에 대한 조건부 로짓값(log-odds)을 수출가능성을 나타낼 수 있는 대리변수로 가정했다. 이런 ERGM의 링크 연결 가능성까지 고려해 수출 유망국가를 추천하는 데는 모수적 접근 방법과 비모수적 접근 방법을 각각 활용했다. 모수적 방법에서는 ERGM에서 도출된 네트워크의 링크별 특성값을 기존의 경제적 요인에 추가 고려하여 우리나라 정보통신 및 가전 산업 수출액을 예측하는 회귀분석 모형을 개발했다. 또한 비모수적 접근 방법에서는 클러스터링 방법을 바탕으로 한 Abnormality detection 알고리즘을 활용했는데, 2개 Peer(동배)에서 벗어난 이상값을 찾는 방법으로 수출 유망국가를 제안했다. 연구 결과에 따르면, 해당 산업 수출 네트워크의 구조적 특징은 이전성이 높은 연결망이었으며, 중심성 분석결과에 따르면 우리나라는 수출에 규모에 비해서 영향력이 약한 것으로 나타났고, 구조적 공백 분석결과에서 수출 효율성이 약한 것으로 나타났다. 본 연구가 제안한 추천모델에 따르면 모수 분석에서는 이란, 아일랜드, 북마케도니아, 앙골라, 파키스탄이 유망 수출 국가로 나타났으며, 비모수 분석에서는 카타르, 룩셈부르크, 아일랜드, 북마케도니아, 파키스탄이 유망 국가로 분석되었으며, 분석방법에 따라 추천된 국가에서는 일부 차이가 나타났다. 본 연구결과는 GVC에서 우리나라 정보통신과 가전 산업의 수출경쟁력이 수출 규모에 비해서 높지 않음을 밝혔고, 따라서 수출이 더욱 감소될 수 있음을 보였다. 또한 본 연구는 이렇게 약화된 수출경쟁력을 높일 수 있는 방안으로 다른 국가들과의 GVC 네트워크까지 고려해 수출유망 국가를 찾는 방법을 제안했다는데 의의가 있다.

예측 불가능한 호흡 변화에 따른 사이버나이프 종양 추적 방사선 치료의 정확도 분석 (An accuracy analysis of Cyberknife tumor tracking radiotherapy according to unpredictable change of respiration)

  • 서정민;이창열;허현도;김완선
    • 대한방사선치료학회지
    • /
    • 제27권2호
    • /
    • pp.157-166
    • /
    • 2015
  • 목 적 : 사이버나이프 종양 추적 시스템(Cyber-knife tumor tracking system)은 환자 외부에 부착한 LED marker에서 얻어진 실시간 호흡 주기 신호와 호흡에 따라 움직이는 종양의 위치와의 상관관계를 바탕으로 종양의 위치를 미리 예측하고 종양의 움직임을 치료기와 동기화 (Synchronize) 시켜 실시간으로 종양을 추적하며 치료하는 시스템이다. 본 연구의 목적은 사이버나이프 종양 추적 방사선 치료 중 기침이나 수면 등으로 인해 예측 불가능한 갑작스러운 호흡 형태 변화에 따른 종양 추적 방사선 치료 시스템의 정확도를 평가하고자 한다. 대상 및 방법 : 연구에 사용된 호흡 Log 파일은 본원에서 호흡 동조 방사선치료(Respiratory gating radiotherapy)나 사이버나이프 호흡 추적 방사선수술(Cyber-knife tracking radiosurgery)을 받았던 환자의 호흡 Log 파일을 바탕으로, 정현곡선 형태(Sinusoidal pattern)와 갑작스런 변화 형태(Sudden change pattern)의 Log 파일을 이용하여 측정이 가능하도록 재구성하였다. 재구성 된 호흡 Log 파일을 사이버나이프 동적 흉부 팬텀에 입력하여 호흡에 따른 움직임을 구현할 수 있도록 기존 동적 흉부 팬텀의 구동장치를 추가 제작하였고, 호흡의 형태를 팬텀에 적용 시킬 수 있는 프로그램을 개발하였다. 팬텀 내부 표적(Ball cube target)의 움직임은 호흡의 크기에 따라 상하(Superior-Inferior)방향으로 5 mm, 10 mm, 20 mm 3가지 크기의 변위로 구동하게 하였다. 팬텀 내부 표적에 EBT3 필름 2장을 교차 삽입하여 표적 움직임의 변화에 따라 사이버나이프 제조사에서 제공된 End-to-End(E2E) test를 호흡의 형태에 따라 각각 5회씩 실시하고 측정하였다. 종양 추적 시스템의 정확도는 삽입된 필름을 분석하여 표적 오차(Targeting error)로 나타내었고, 추가로 E2E test가 진행되는 동안 상관관계 오차(Correlation error)를 측정하여 분석하였다. 결 과 : 표적 오차는 정현곡선 호흡 형태일 경우 표적 움직임의 크기가 5 mm, 10 mm, 20 mm 에 따라 각각 평균 $1.14{\pm}0.13mm$, $1.05{\pm}0.20mm$, $2.37{\pm}0.17mm$이고, 갑작스런 호흡 변화 형태일 경우 각각 평균 $1.87{\pm}0.19mm$, $2.15{\pm}0.21mm$, $2.44{\pm}0.26mm$으로 분석되었다. 표적 추적에 있어 변위 벡터의 길이로 정의할 수 있는 상관관계 오차는 정현곡선 호흡 형태일 경우 표적 움직임의 크기가 5 mm, 10 mm, 20 mm 에 따라 각각 평균 $0.84{\pm}0.01mm$, $0.70{\pm}0.13mm$, $1.63{\pm}0.10mm$이고, 갑작스런 호흡 변화 형태일 경우 각각 평균 $0.97{\pm}0.06mm$, $1.44{\pm}0.11mm$, $1.98{\pm}0.10mm$으로 분석되었다. 두 호흡 형태에서 모두 상관관계 오차 값이 클수록 표적 오차 값이 크게 나타났다. 정현곡선 호흡 형태의 표적 움직임 크기가 20 mm 이상일 경우, 두 오차 값 모두 사이버나이프 제조사의 권고치인 1.5 mm 이상으로 측정되었다. 결 론 : 표적 움직임의 크기가 클수록 표적 오차 값과 상관관계 오차 값이 증가하는 경향이 있었으며, 정현곡선 호흡 형태보다 갑작스런 호흡 변화 형태에서 오차 값이 크게 나타났다. 호흡의 형태가 규칙적인 정현 곡선 형태더라도 표적의 움직임이 클수록 종양 추적 시스템의 정확도가 감소하는 것으로 판단할 수 있다. 사이버나이프 종양 추적 시스템의 알고리즘을 이용하여 치료 시행 시 환자의 기침 등으로 인하여 갑작스럽게 예측 불가능한 호흡 변화가 있는 경우 치료를 멈추고 내부 표적 확인 과정을 재실시 하여야 하며 호흡 형태를 재조정해야 할 필요가 있다. 치료 중 환자가 본인의 호흡 형태를 관찰 할 수 있는 고글 모니터 등을 착용하여 규칙적인 호흡 형태를 유도하는 것이 치료의 정확도는 향상될 수 있다고 판단된다.

  • PDF

PET/CT에서 재구성 프로그램의 성능 평가 (Evaluation of Image Quality Based on Time of Flight in PET/CT)

  • 임정진;윤석환;김종필;남궁식;신성화;윤상혁;김영석;이형진;이홍재;김진의;우재룡
    • 핵의학기술
    • /
    • 제16권2호
    • /
    • pp.110-114
    • /
    • 2012
  • 암의 조기검진 및 수술 전후 추적검사에 유용하게 이용되고 있는 PET/CT는 영상의 질을 향상시키기 위하여 기계적인 성능 향상과 더불어 영상 재구성방법도 발전되어 왔다. 본 연구는 Time of Flight (TOF)를 기반으로 한 재구성 프로그램들에 대하여 영상의 질을 평가하고자 한다. Gemini TF, Biograph mCT, Discovery 690을 이용하여 phantom 영상을 동일한 조건으로 2분 동안 영상을 획득 후 Astonish TF, ultraHD PET, SharpIR을 적용한 것과 적용하지 않은 것에 대하여 영상을 재구성하였다. Flangeless Esser PET phantom 의 내부에는 $^{18}F$-FDG 1.11 kBq/ml (30 ${\mu}Ci/ml$)를 채우고 4개의 열소 원통(8, 12, 16, 25 mm)에는 8.88 kBq/ml (240 ${\mu}Ci/ml$)를 채워서 배후 방사능과 열소 원통 방사능의 비율이 1:8이 되도록 제작하였고 triple line phantom의 내부에는 $^{18}F$-FDG 37 MBq (1 mCi)를 채우고 세 개의 line에는 0.37 MBq/ml (100 uCi)를 주입하여 제작하였다. Flangeless Esser PET phantom을 사용한 재구성 영상에서 contrast ratio와 background variability를 구하였고, triple line phantom을 사용한 재구성 영상에서 resolution을 측정하였다. Phantom lid 크기가 8, 12, 16, 25 mm에서의 contrast ratio는 Astonish TF를 적용하지 않은 영상에서 8.69, 12.28, 19.31, 25.80%, 적용한 영상에서는 6.24, 13.24, 19.55, 27.60%, ultraHD PET를 적용하지 않은 영상에서 4.94, 12.68, 22.09, 30.14%, 적용한 영상에서는 4.76, 13.23, 23.72, 31.65%, SharpIR를 적용하지 않은 영상에서 13.18, 17.44, 28.76, 34.67%, 적용한 영상에서는 13.15, 18.32, 30.33, 35.73%로 나타났다. Background variability는 Astonish TF를 적용하지 않은 영상에서 5.51, 5.42, 7.13, 6.28%, 적용한 영상에서는 7.81, 7.94, 6.40, 6.28%, ultraHD PET를 적용하지 않은 영상에서 6.46, 6.63, 5.33, 5.21%, 적용한 영상에서는 6.08, 6.08, 4.45, 4.58%, SharpIR를 적용하지 않은 영상에서 5.93, 4.82, 4.45, 5.09%, 적용한 영상에서는 4.80, 3.92, 3.63, 4.50%로 나타났다. Phantom line 위치가 upper, center, right에서의 resolution은 Astonish TF를 적용하지 않은 영상에서 10.77, 11.54, 9.34 mm, 적용한 영상에서는 9.54, 8.90, 8.88 mm, ultraHD PET를 적용하지 않은 영상에서 7.84, 6.95, 8.32 mm, 적용한 영상에서는 7.51, 6.66, 8.27 mm, SharpIR를 적용하지 않은 영상에서 9.35, 8.69, 8.99 mm, 적용한 영상에서는 9.88, 9.18, 9.00 mm로 나타났다. TOF를 기반으로 하여 영상의 질을 향상시키기 위한 재구성 프로그램 사용 시 전반적으로 영상의 질적 향상이 이루어짐을 알 수 있었다. 또한 제조사별 재구성 프로그램 비교에 대해서는 어느 정도의 결과 값의 차이를 보였지만 이는 제조사별 장비의 특성과 재구성 알고리즘의 차이로 인한 결과라고 생각된다. 따라서 각 병원에서는 영상의 질을 향상시키기 위해 사용되는 재구성 프로그램을 이용함에 있어서 프로그램에 맞는 적절한 재구성 조건을 찾기 위한 추가적인 연구가 필요할 것으로 사료된다.

  • PDF

시장 환경이 인터넷 경로를 포함한 다중 경로 관리에 미치는 영향에 관한 연구: 게임 이론적 접근방법 (The Impact of Market Environments on Optimal Channel Strategy Involving an Internet Channel: A Game Theoretic Approach)

  • 유원상
    • 한국유통학회지:유통연구
    • /
    • 제16권2호
    • /
    • pp.119-138
    • /
    • 2011
  • 지난 십년동안 인터넷을 통한 전자상거래는 빠른 속도로 성장해 왔다. 이러한 인터넷의 발달은 기업들의 사업방식에 많은 변화를 유도했으며, 그 중에서도 마케팅경로의 구조와 경로 구성원들 사이의 관계에 중요한 변화를 초래하고 있다. 각 기업이 처한 시장환경은 다양하며 이 다양한 시장 환경은 인터넷 경로가 각 시장에 미치는 효과를 조절하는 역할을 한다. 이러한 시장의 다양성에도 불구하고 지금까지의 선행연구들은 각기 특정한 하나의 시장상황(unique setting)을 상정하여 인터넷경로 도입이 그 시장에 미치는 영향을 분석하는데 그쳐왔다. 이러한 기존 연구의 공백을 채우기 위해 본 연구는 시장의 다양성을 소비자의 지리적 분포, 시장의 인터넷 수용도의 측면에서 살펴보고 이러한 시장 환경이 인터넷 경로 도입 효과에 미치는 영향에 관하여 조사해 보고자 한다. 이를 위해 본 연구는 다양한 소비자들의 지리적 분포, 경쟁강도, 소비자의 인터넷 상거래에 대한 수용도 등을 포함한 다양한 시장 환경을 수요모형에 반영시켜 그 영향력 분석을 가능하도록 하였다. 그러나, 다양한 시장 요소를 모형에 반영하는 과정에서 수요모형이 복잡한 구조를 가지게 되었다. 이 문제를 극복하고 게임이론의 균형해를 도출하기 위해 Newton-Raphson algorithm을 사용한 numerical search 방법을 사용하였다. 분석결과 두 종류의 경로에 대한 소비자선호의 분포에 따라 생산자의 가격차별정도, 생산자와 독립소매상 간의 경로이윤 배분율, 그리고 인터넷경로 도입이 각 경로주체의 이윤 향상에 도움이 되는지의 여부, 소비자잉여 등이 달라질 수 있음을 발견하였다. 끝으로 연구의 학술적, 실무적 시사점과 한계점 및 향후 연구방향도 논의되었다.

  • PDF

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.