• 제목/요약/키워드: Algorithm Development

검색결과 6,969건 처리시간 0.036초

참조 수문관측소 구성 조건에 따른 LSTM 모형 홍수위예측 정확도 검토 사례 연구 (Case study on flood water level prediction accuracy of LSTM model according to condition of reference hydrological station combination)

  • 이승호;김수영;정재원;윤광석
    • 한국수자원학회논문집
    • /
    • 제56권12호
    • /
    • pp.981-992
    • /
    • 2023
  • 최근 전세계적인 기후변화의 영향으로 강우가 집중되고 강우강도가 강해짐에 따라 홍수피해의 규모를 증가시키고 있다. 과거에 관측되지 않았던 규모의 비가 내리기도 하고, 기록되지 않았던 장기간의 장마가 발생하기도 한다. 이러한 피해들은 아세안 국가에도 집중되고 있으며, 태풍 및 집중호우로 인해 침수의 빈번한 발생과 함께 많은 사람들이 영향을 받고 있다. 특히, 인도네시아 찌따룸강 상류 유역에 위치한 반둥 지역은 분지 형태의 지형학적 특성을 가지고 있어서 홍수에 매우 취약한 실정이다. 이에 공적개발원조(ODA)를 통해 2017년에 찌따룸강 상류(Upper Citarum River) 유역에 대하여 홍수예경보시스템을 구축되었고, 현재 운영중에 있다. 그럼에도 불구하고, 찌따룸강 상류 (Upper Citarum River) 지역은 홍수발생시 인명 및 재산피해의 위험에 여전히 노출되어 있어 신속하고 정확한 홍수예경보의 실시를 통해 피해를 경감시키는 노력이 지속적으로 필요한 실정이다. 따라서 본 연구에서는 찌따룸강 상류의 Dayeuh Kolot 지점을 목표관측소로 하고, 강우관측소 4개소와 수위관측소 1개소의 10분 단위 수문자료를 수집하여 인공지능 기반의 하천홍수위예측모형을 개발하였다. 6개 관측소의 2017년 1월부터 2021년 1월까지의 10분 단위 수문관측자료를 활용하여 선행예보시간 0.5, 1, 2, 3, 4, 5, 6시간에 대해서 학습, 검증, 시험을 수행하였으며 인공지능알고리즘으로는 LSTM을 적용하였다. 연구결과 모든 선행예보시간에 대해 모형적합도 및 오차에서 좋은 결과를 나타냈으며, 학습자료 구축조건에 따른 예측정확도를 검토한 결과 참조관측소가 적은 경우에도 모든 관측소를 활용하는 경우와 유사하게 예측정확도를 확보하는 것으로 나타나 효율적인 인공지능 기반 모형 구축에 활용될 수 있을 것으로 기대된다.

오픈소스 소프트웨어를 활용한 고고 유물의 디지털 실측 연구 (A Study on the Digital Drawing of Archaeological Relics Using Open-Source Software)

  • 이호선;안형기
    • 헤리티지:역사와 과학
    • /
    • 제57권1호
    • /
    • pp.82-108
    • /
    • 2024
  • 고고 자료의 기록방식이 아날로그 기록에서 디지털로 전환되면서 3D 스캐닝 기술의 도입은 본격화되었다. 현재 3D스캔과 사진측량을 이용한 고고 자료의 디지털 기록에 대한 연구와 도입은 지속적으로 이루어지고 있다. 하지만 비용, 인력 문제 등으로 인해 대부분의 매장문화재 기관에서는 적극적인 디지털 기술의 도입을 주저하고 있다. 본고는 3D 스캔 방식 중 효율성이 가장 높다고 평가되는 사진측량 기술을 이용하여 오픈소스 소프트웨어를 활용한 유물의 디지털 실측 방법을 제시하고자 한다. 유물의 디지털 실측 절차는 크게 3D 모델 획득, 3D 모델 편집 및 입단면도 제작, 전자도면 작성의 세 단계로 이루어진다. 디지털 기술 적용의 접근성을 살펴보기 위해 전 과정은 오픈소스 소프트웨어만을 이용하였다. 연구 결과 정량적 평가에서 실제 유물과 3D 모델의 수치 데이터 간 계측의 편차가 크지 않았다. 또한, 오픈소스 소프트웨어와 상용 소프트웨어 간 정량적 품질 비교분석 결과 유사도가 높았다. 다만 데이터 처리시간은 상용 소프트웨어의 성능이 우위에 있었다. 이는 지속적인 알고리즘 개선으로 인한 연산속도 향상의 결과로 판단된다. 정성적 평가에서는 메시 및 텍스처 품질의 차이가 일부 발생하였다. 오픈소스 소프트웨어로 생성된 3D 모델은 메시표면에 노이즈가 다수 발생하거나 메시의 표면이 부드럽지 않고 유물의 제작흔, 문양의 표현을 확인하기 어려웠다. 하지만 일부 프로그램에서 정량적·정성적 평가에서 상용 소프트웨어에 견줄 만한 품질을 획득할 수 있었다. 3D 모델 편집을 위한 오픈소스 소프트웨어에서는 사진실측 결과물의 후처리, 정합, 병합뿐만 아니라 유물 실측에 필요한 스케일 조정, 입단면도 제작 및 이미지 렌더링까지 가능하였다. 이후 오픈소스 캐드 프로그램에서 트레이싱하여 최종 도면을 완성하였다. 고고학 연구에서 사진실측의 적용은 발굴과정부터 보고서 작성 그리고 3D 모델 데이터의 수치정보를 이용한 연구 등 활용 가능성이 매우 높다. 컴퓨터 비전의 획기적인 발전으로 오픈소스 소프트웨어의 종류도 다양해졌고 성능도 상당부분 개선된 것으로 확인되었다. 누구나 쉽게 디지털 기술의 적용이 가능한 현재 고고 자료의 3D 모델 데이터의 획득은 문화유산의 보존과 연구 활성화를 위한 기초자료로 활용될 수 있다.

데이터마이닝을 활용한 소프트웨어 개발인력의 업무 지속수행의도 결정요인 분석 (A Study of Factors Associated with Software Developers Job Turnover)

  • 전인호;박선웅;박윤주
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.191-204
    • /
    • 2015
  • 국내 소프트웨어(SW) 개발인력의 미충원율은 매우 높으며, 특히 2년 이상의 현장경력이 있는 고급 개발자의 부족문제는 심각하다. 최근 정부도 이를 인식하고, 정책적으로 SW개발 신규인력 양성에 힘을 기울이고 있다. 그러나, 이러한 노력은 초급개발자의 수급문제를 해결하는데 효과적일 수 있지만, 업계에서 요구하는 고급 개발자의 부족현상을 해결하는 근본적인 대책으로 인식되지는 못하고 있다. SW 전문개발자를 양성하기 위해서는 초급개발자들이 지속적으로 직무를 수행하여 풍부한 업무경험을 갖춘 고급 개발자로 성장해야 하기 때문이다. 이에, 본 연구는 국내 SW업체에서 근무하고 있는 개발관련 인력들의 업무 지속수행 의도를 조사하고, 이에 영향을 주는 주요요인들을 분석하였다. 이를 위해, 2014년 9월부터 10월까지 국내 SW업체에 근무하고 있는 현직 개발자 총 130명을 대상으로 설문조사를 수행하였으며, 이를 기반으로 SW개발업무 지속수행의도 및 이에 영향을 주는 요인들을 개발자의 특성, 직무환경, 그리고 SW개발자에 대한 사회적 인식 및 산업전망 등의 측면에서 분석하였다. 분석에는 데이터마이닝 기법들 중에서, 분석과정에서의 설명능력이 있는 회귀분석과 의사결정나무가 사용되었다. 회귀분석 결과, SW개발자가 스스로 인식하는 근무 가능한 연령이 높을수록, 내성적인 성향을 가질수록, 또한 적성에 맞아서 직무를 선택한 경우, 지속적 직무 수행 의도가 높은 것으로 나타났다. 이와 더불어, 선형회귀분석에서는 유의하지 않았으나, 규칙기반의 의사결정나무 분석에서 파악된 추가적 요인으로, 새로운 기술에 대한 학습능력 및 SW산업에 대한 전망이 직무 지속수행의도에 영향을 미치는 것으로 나타났다. 이러한 연구결과는 기업의 인적자원관리 및 고급 SW인력 양성정책에 활용될 수 있을 것으로 생각되며, 궁극적으로 SW개발인력의 직무 지속성을 증진시키는 데 기여할 수 있을 것으로 기대된다.

R&D 기술 선정을 위한 시계열 특허 분석 기반 지능형 의사결정지원시스템 (An Intelligent Decision Support System for Selecting Promising Technologies for R&D based on Time-series Patent Analysis)

  • 이충석;이석주;최병구
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.79-96
    • /
    • 2012
  • 기술의 발전과 융합이 빠르게 이루어지고 있는 오늘날 유망기술을 어떻게 파악하여, 다양한 후보군들 중에서 최적의 R&D 대상을 어떻게 선정할 것인가에 대한 문제는 주요한 경영의사결정문제 중 하나로 부상하고 있다. 본 연구에서는 이러한 R&D 기술 선정 의사결정을 지원할 수 있는 새로운 지능형 의사결정지원시스템을 제안한다. 본 연구의 의사결정지원시스템은 크게 3가지 모듈로 구성되는데, 우선 첫 번째 모듈인 '기술가치 평가' 모듈에서는 기업이 관심을 갖고 있는 분야의 특허들을 분석하여 유망기술 파악에 요구되는 다양한 차원의 기술가치 평가지수 값들을 산출하는 작업이 이루어진다. 이를 통해, 현재 시점에서의 각 기술의 가치가 다양한 차원에서 평가가 이루어지고 나면, 두 번째 모듈인 '미래기술가치 예측' 모듈에서 이들의 시간 흐름에 따른 변화를 학습한 인공지능 모형을 토대로 각 후보기술들이 미래 시점에 어떤 가치지수값을 갖게 될 것인지 예측값을 산출하게 된다. 마지막 세 번째 모듈인 '최적 R&D 대상기술 선정 지원' 모듈에서는 앞서 두 번째 모듈에서 산출된 각 차원별 예상 가치지수값들을 적절히 가중합하여 기술의 종합적인 미래가치 예측값을 산출하여 의사결정자에게 제공하는 기능을 수행한다. 이를 통해 의사결정자가 자사에 적합한 최적의 R&D 대상기술을 선정할 수 있도록 하였다. 본 연구에서는 제안된 시스템의 적용 가능성을 검증하기 위해, 10년치 특허데이터에 인공신경망 기법을 적용하여 실제 기술가치 예측모형을 구축해 보고, 그 효과를 살펴본다.

소셜 뉴스를 위한 시간 종속적인 메타데이터 기반의 컨텍스트 공유 프레임워크 (Context Sharing Framework Based on Time Dependent Metadata for Social News Service)

  • 가명현;오경진;홍명덕;조근식
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.39-53
    • /
    • 2013
  • 인터넷의 발달과 SNS의 등장으로 정보흐름의 방식이 크게 바뀌었다. 이러한 변화에 따라 소셜 미디어가 급부상하고 있으며 소셜 미디어와 비디오 콘텐츠가 융합된 소셜 TV, 소셜 뉴스의 중요성이 강조되고 있다. 이러한 환경 속에서 사용자들은 단순히 콘텐츠를 탐색만 하는 것이 아니라 같은 콘텐츠를 이용하고 있는 친구들이나 지인들과 콘텐츠에 대한 정보나 경험들을 공유하고 더 나아가 새로운 콘텐츠를 만들어내기도 한다. 하지만 기존의 소셜 뉴스에서는 이러한 사용자들의 특성을 반영해 주지 못하고 있다. 특히 이용자들의 참여성만을 고려하고 있어서 서비스간의 차별화가 어렵고 뉴스 콘텐츠에 대한 정보나 경험 공유 시 컨텍스트 공유가 어렵다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 뉴스를 내용별로 분할하고 분할된 뉴스에서 추출된 시간 종속적인 메타데이터를 제공하는 프레임워크를 제안한다. 제안하는 프레임워크에서는 스토리 분할 방법을 이용하여 뉴스 대본을 내용별로 분할한다. 또한 뉴스 전체내용을 대표하는 태그, 분할된 뉴스를 나타내는 서브 태그, 분할된 뉴스가 비디오에서 시작하는 위치 즉, 시간 종속적인 메타데이터를 제공한다. 소셜 뉴스 이용자들에게 시간 종속적인 메타데이터를 제공한다면 이용자들은 전체의 뉴스 내용 중에 자신이 원하는 부분만을 탐색 할 수 있으며 이 부분에 대한 견해를 남길 수 있다. 그리고 뉴스의 전달이나 의견 공유 시 메타데이터를 함께 전달함으로써 전달하고자 하는 내용에 바로 접근이 가능하며 프레임워크의 성능은 추출된 서브 태그가 뉴스의 실제 내용을 얼마나 잘 나타내 주느냐에 따라 결정된다. 그리고 서브 태그는 스토리 분할의 정확성과 서브 태그를 추출하는 방법에 따라 다르게 추출된다. 이 점을 고려하여 의미적 유사도 기반의 스토리 분할 방법을 프레임워크에 적용하였고 벤치마크 알고리즘과 성능 비교 실험을 수행하였으며 분할된 뉴스에서 추출된 서브 태그들과 실제 뉴스의 내용을 비교하여 서브 태그들의 정확도를 분석하였다. 결과적으로 의미적 유사도를 고려한 스토리 분할 방법이 더 우수한 성능을 보였으며 추출된 서브 태그들도 컨텍스트와 관련된 단어들이 추출 되었다.

연속촬영 전자조사 문 영상을 이용한 오프라인 기반 치료 중 내부 장기 움직임 확인 시스템의 개발 (Development of an Offline Based Internal Organ Motion Verification System during Treatment Using Sequential Cine EPID Images)

  • 주상규;홍채선;허웅;김민규;한영이;신은혁;신정석;김진성;박희철;안성환;임도훈;최두호
    • 한국의학물리학회지:의학물리
    • /
    • 제23권2호
    • /
    • pp.91-98
    • /
    • 2012
  • 방사선치료 중 내부 장기의 움직임을 확인하고 이를 보정하는 것은 움직이는 종양에 정확히 방사선을 조사하는데 매우 중요한 역할을 한다. 실제 치료 중 획득한 연속촬영 전자조사 문(cine EPID) 영상을 이용해 치료 중 내부 장기 움직임을 추적하는 오프라인 기반 분석 시스템(IMVS, Internal-organ Motion Verification System using cine EPID)을 개발하였고 모형을 이용하여 개발된 시스템의 정확도와 유용성을 평가했다. IMVS는 cine EPID영상을 이용한 내부 장기 움직임 추적을 위해 내부 표지자를 이용한 유형 정합 알고리즘을 이용했다. 시스템의 성능평가를 위해 폐와 폐 종양을 묘사한 인체 모형과 이를 상하(SI, superior-inferior)방향으로 직선 운동시키는 구동 장치와 제어 프로그램을 고안했다. 모형을 4초 주기로 2 cm 직선 운동 시키면서 10 MV X선으로 3.3 fps, 6.6 fps속도로 cine EPID 영상($1,024{\times}768$ 해상도)를 획득했다. 획득된 cine EPID 영상은 IMVS를 이용하여 표적의 움직임을 추적하고 기존 외부 표지자를 이용한 비디오 영상 기반 추적시스템(RPM, Real-time Position Management, Varian, USA)으로부터 얻은 결과와 비교했다. 정량적 평가를 위해 두 시스템으로부터 움직임의 평균 주기(Peak-To-Peak), 진폭과 패턴(RMS, Root Mean Square)을 측정하여 비교했다. RPM과 IMVS로 측정한 폐 종양 모형의 움직임 주기는 각각 $3.95{\pm}0.02$ (RPM), $3.98{\pm}0.11$ (IMVS 3.3 fps), $4.005{\pm}0.001$ (IMVS 6.6 fps) 초로 실제움직임 주기인 4초와 잘 일치했다. IMVS로 획득한 모형 내부장기의 평균 움직임 진폭은 3.3 fps에서 $1.85{\pm}0.02$ cm, 6.6 fps에서 $1.94{\pm}0.02$ cm으로 실제 진폭 2 cm에 비해 각각 0.15 cm (오차 7.5%) 및 0.06 cm (오차 3%)의 차를 보였다. 움직임 신호의 일치성 평가를 위해 측정한 RMS는 0.1044 (IMVS 3.3 fps), 0.0480 (IMVS 6.6 fps)로 계획된 신호와 잘 일치 했다. cine EPID 영상을 이용하여 내부 표지자의 움직임을 추적하는 IMVS는 모형 실험에서 내부 장기의 움직임을 3% 오차 내에서 확인 가능했다. IMVS는 치료 중 내부장기 움직임을 측정하고 이를 사차원 방사선 치료계획과 비교하여 오차를 보정하는데 기여할 것으로 생각된다.

공공 서비스 수출 플랫폼을 위한 온톨로지 모형 (An Ontology Model for Public Service Export Platform)

  • 이광원;박세권;류승완;신동천
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.149-161
    • /
    • 2014
  • 공공 서비스의 수출의 경우 수출 절차와 대상 선정에 따른 다양한 문제가 발생하며, 공공 서비스 수출 플랫폼은 이러한 문제점들을 해결하기 위하여 사용자 중심의 유연하고, 개방형 구조의 디지털 생태계를 조성할 수 있도록 구현되어야 한다. 또한 공공서비스의 수출은 다수의 이해당사자가 참여하고 여러 단계의 과정을 거쳐야 하므로 사용자의 이해 종류와 탐색 컨설팅 협상 계약 등 수출 프로세스 단계별로 맞춤형 플랫폼 서비스 제공이 필수적이다. 이를 위해서 플랫폼 구조는 도메인과 정보의 정의 및 공유는 물론 지식화를 지원할 수 있어야 한다. 본 논문에서는 공공서비스 수출을 지원하는 플랫폼을 위한 온톨로지 모형을 제안한다. 서비스 플랫폼의 핵심 엔진은 시뮬레이터 모듈이며 시뮬레이터 모듈에서는 온톨로지를 사용하여 수출 비즈니스의 여러 컨텍스트들을 파악하고 정의하여 다른 모듈들과 공유하게 된다. 온톨로지는 공유 어휘를 통하여 개념들과 그들 간의 관계를 표현할 수 있으므로 특정 영역에서 구조적인 틀을 개발하기 위한 메타 정보를 구성하는 효과적인 도구로 잘 알려져 있다. 공공서비스 수출 플랫폼을 위한 온톨로지는 서비스, 요구사항, 환경, 기업, 국가 등 5가지 카테고리로 구성되며 각각의 온톨로지는 요구분석과 사례 분석을 통하여 용어를 추출하고 온톨로지의 식별과 개념적 특성을 반영하는 구조로 설계한다. 서비스 온톨로지는 목적효과, 요구조건, 활동, 서비스 분류 등으로 구성되며, 요구사항 온톨로지는 비즈니스, 기술, 제약으로 구성 된다. 환경 온톨로지는 사용자, 요구조건, 활동으로, 기업 온톨로지는 활동, 조직, 전략, 마케팅, 시간으로 구성되며, 국가 온톨로지는 경제, 사회기반시설, 법, 제도, 관습, 인프라, 인구, 위치, 국가전략 등으로 구성된다. 수출 대상 서비스와 국가의 우선순위 리스트가 생성되면 갭(gap) 분석과 매칭 알고리즘 등의 시뮬레이터를 통하여 수출기업과 수출지원 프로그램과의 시스템적 연계가 이루어진다. 제안하는 온톨로지 모형 기반의 공공서비스 수출지원 플랫폼이 구현되면 이해당사자 모두에게 도움이 되며 특히 정보 인프라와 수출경험이 부족한 중소기업에게 상대적으로 더 큰 도움이 될 것이다. 또한 개방형 디지털 생태계를 통하여 이해당사자들이 정보교환, 협업, 신사업 기획 등의 기회를 만들 수 있을 것으로 기대한다.

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.