• 제목/요약/키워드: Nearest Neighbor Index Analysis

검색결과 29건 처리시간 0.022초

COMPARATIVE ANALYSIS ON MACHINE LEARNING MODELS FOR PREDICTING KOSPI200 INDEX RETURNS

  • Gu, Bonsang;Song, Joonhyuk
    • 한국수학교육학회지시리즈B:순수및응용수학
    • /
    • 제24권4호
    • /
    • pp.211-226
    • /
    • 2017
  • In this paper, machine learning models employed in various fields are discussed and applied to KOSPI200 stock index return forecasting. The results of hyperparameter analysis of the machine learning models are also reported and practical methods for each model are presented. As a result of the analysis, Support Vector Machine and Artificial Neural Network showed a better performance than k-Nearest Neighbor and Random Forest.

순환검색거리를 이용하는 최대근접 질의처리의 성능분석 (The Performance Analysis of Nearest Neighbor Query Process using Circular Search Distance)

  • 선휘준;김원호
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.83-90
    • /
    • 2010
  • 최대근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의 수와 연산시간을 최소화할 수 있어야 한다. 이를 위해 최대근접질의 처리시 검색대상을 정확히 선택하고 객체들의 순환적 위치 속성이 고려된 검색거리 측도가 필요하다. 본 논문은 순환도메인을 갖는 검색공간에서 객체의 순환적 위치속성을 고려한 최대근접질의 처리방법을 제안하고 그 성능을 실험을 통하여 입증한다. 제안한 방법은 최대근접질의의 처리비용을 최적화하기 위한 검색거리 측도인 순환최소거리와 순환최적거리를 사용한다.

면적평균강우량 산정을 통한 강우관측망 평가 및 추정오차 (Evaluation of Raingauge Network using Area Average Rainfall Estimation and the Estimation Error)

  • 이지호;전환돈
    • 한국습지학회지
    • /
    • 제16권1호
    • /
    • pp.103-112
    • /
    • 2014
  • 면적평균강우량의 산정은 가용 수자원의 정확한 양을 파악하고 강우-유출해석에 필수적인 입력자료이기 때문에 매우 중요하다. 이와 같은 면적평균강우량의 정확한 산정을 위한 필수적인 조건은 강우관측망의 균일한 공간적 분포이다. 본 연구에서는 보다 향상된 유역 면적평균강우량 산정을 위한 강우관측망의 공간분포 평가방법론을 제시하고, 이를 한강 및 금강 유역에 적용하였다. 강우관측소의 공간적 분포 특성은 최근린 지수(nearest neighbor index)를 이용하여 정량화하였다. 유역별 강우관측소의 공간적 분포가 면적평균강우량 산정에 미치는 영향을 평가하기 위하여 2013년의 강우사상에 대해 산술평균법, 티센가중법, 추정이론을 이용하여 면적평균강우량을 산정하고 각 경우에 대해 추정오차를 평가하였다. 그 결과 공간분포가 우수한 유역은 면적평균강우량의 추정오차가 상대적으로 작으며, 반대로 공간분포가 왜곡된 유역의 경우는 상대적으로 추정오차가 큼을 확인하였다.

이동객체궤적에 대한 효율적인 최근접이웃검색 (Efficient Nearest Neighbor Search on Moving Object Trajectories)

  • 김규재;박영희;조우현
    • 한국정보통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.2919-2925
    • /
    • 2014
  • 스마트폰과 같은 이동 통신 매체의 발달과 LTE, NFC, RFID 등 무선통신의 발달로 실시간으로 이동 객체의 위치데이터를 수집하여 활용하는 위치 기반의 서비스들이 다방면의 개발에 이용되고 있다. 이에 따라 대용량의 이동객체 위치 데이터들을 효율적으로 저장하는 방법과 여러 질의를 좀 더 빠르게 처리할 수 있는 방법들에 대한 연구들이 진행 중이다. 본 논문에서는 Douglas-Peucker 알고리즘을 응용하여 대용량의 이동객체궤적 데이터를 단순화하여 색인구조를 생성하고 이 색인 구조를 이용하여 최근접이웃검색 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 제안된 방법으로 대용량의 데이터가 더 적은 양의 데이터로 단순화 되고 얼마나 더 효율적으로 질의를 처리하는지 실험을 통하여 확인하였다.

이동객체궤적에 대한 효율적인 최근접 이웃 검색 (Efficient Nearest Neighbor Search on Moving Object Trajectories)

  • 김규재;박영희;조우현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.418-421
    • /
    • 2014
  • 스마트폰과 같은 이동 통신 매체의 발달과 LTE, NFC, RFID 등 무선통신의 발달로 실시간으로 이동 객체의 위치데이터를 수집하여 활용하는 위치 기반의 서비스들이 다방면의 개발에 이용되고 있다. 이에 따라 대용량의 이동객체 위치 데이터들을 효율적으로 저장하는 방법과 여러 질의를 좀 더 빠르게 처리할 수 있는 방법들에 대한 연구들이 진행 중이다. 본 논문에서는 Douglas-Peucker 알고리즘을 응용하여 대용량의 이동객체궤적 데이터를 단순화하여 색인 구조를 생성하고 이 색인 구조를 이용하여 최근접 이웃 검색 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 제안된 방법으로 대용량의 데이터가 더 적은 양의 데이터로 단순화 되고 얼마나 더 효율적으로 질의를 처리하는지 실험을 통하여 확인하였다.

  • PDF

맵리듀스를 이용한 그리드 기반 인덱스 생성 및 k-NN 조인 질의 처리 알고리즘 (Grid-based Index Generation and k-nearest-neighbor Join Query-processing Algorithm using MapReduce)

  • 장미영;장재우
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1303-1313
    • /
    • 2015
  • 맵리듀스는 대용량 데이터 처리를 위한 시스템 안정성과 유용성을 제공한다. 맵리듀스 기반 k-최근접점 조인 질의처리 알고리즘은 두 데이터 집합 R과 S를 기반으로 R의 모든 레코드에 대해 S의 데이터 중 가장 인접한 k개의 레코드를 탐색하는 알고리즘으로써, 대용량 데이터 분석을 위한 중요한 질의 처리 알고리즘이다. 그러나 기존 k-최근접점 조인 질의처리 알고리즘은 높은 인덱스 구축비용 문제로 인해 대용량 데이터 처리에 적합하지 않은 문제점을 지닌다. 따라서, 본 논문에서는 그리드 기반 인덱스 생성 및 k-최근접점 질의 처리 알고리즘을 제안한다. 제안하는 기법은 질의 셀로부터 인접한 데이터만을 찾아 맵리듀스 테스크에 전송함으로써 데이터 전송 및 k-최근접점 연산 오버헤드를 줄인다. 성능평가를 통해, 제안하는 기법이 정확 매칭 질의를 제공하는 동시에 기존 기법에 비해 질의 처리 시간 측면에서 최대 7배의 성능을 개선함을 보인다.

우리나라 산악기상관측망의 공간분포 특성 (The spatial distribution characteristics of Automatic Weather Stations in the mountainous area over South Korea)

  • 윤석희;장근창;원명수
    • 한국농림기상학회지
    • /
    • 제20권1호
    • /
    • pp.117-126
    • /
    • 2018
  • 본 연구는 품질평가 등급이 우수한 4개 기관에서 운영하고 있는 990개의 AWS 중에서 고도가 200m 이상인 산악지역에 분포하고 있는 산악기상관측소의 공간분포 특성과 연도별 공간변화를 분석하였다. 공간분포특성 분석을 위해 2012년부터 2016년까지 203개의 산악기상관측망을 대상으로 유클리디안 거리 분석, 최근 린지수 분석, 커널밀도 분석 방법으로 공간분석을 수행하였다. 평균거리 분석 결과, 2012년(3개 기관)은 29.0km, 2012년(4개 기관) 26.6km, 2013년 21.9km, 2014년 16.9km, 2015년 14.3km, 2016년은 12.6km로 2012년부터 2016년까지 16.4km가 감소하는 효과를 보였다. 최근린지수는 0.666632~0.811237였으며, 군집화 범위인 Z-score 검정 결과는 -4.372239~-5.145115, 통계적으로는 P-value(P<0.01)로 매우 유의하면서 산악기상관측망이 군집화 형태로 분포하는 것으로 나타났다. 커널밀도 분석 결과, 2012년은 129,719ha/1개소, 2013년 90,917ha/1개소, 2014년 71,342ha/1개소, 2015년 58,875ha/1개소로, 2016년은 50,914ha/1개소로 2012년부터 2016년까지 169,399ha/1개소가 감소하면서 산악기상관측망 공간분포 밀도가 높아진 결과를 보였다. 따라서 백두대간 일부 지역과 경북 내륙, 경남북서부 지역을 대상으로 최적의 입지에 산악기상관측망을 확충하는 것이 필요하다고 사료된다.

개혁신학과 복음주의에 관한 계량서지학적 비교 연구 (A Comparative Study using Bibliometric Analysis Method on the Reformed Theology and Evangelicalism)

  • 유영준;이재윤
    • 한국비블리아학회지
    • /
    • 제29권3호
    • /
    • pp.41-63
    • /
    • 2018
  • 이 연구에서는 개혁신학과 복음주의, 중립적인 신학적 입장을 가지는 학술지와 색인어, 저자를 대상으로 계량서지학적 분석 방법을 적용하였다. 구체적인 분석방법은 평균 연결 군집화, 이웃중심성 척도, 프로파일 코사인 유사도를 활용하여 세 가지 결과를 제시하였다. 특히 저자 간 관계를 분석할 때에는 저자 사이에 핵심 공유 색인어를 파악해서 연구 주제를 해석하는 새로운 시도를 해보았다. 학술지 분석에서는 9개 학술지가 크게 개혁신학과 복음주의의 두 개 군집으로 나뉘어졌지만, 개혁신학을 지향하는 장로교단 학술지인 장신논단만 복음주의 군집에 속하였다. 두 군집의 색인어 분석에서도 개혁신학과 복음주의가 두 군집을 대표하는 주요어로 나타났다. 저자 분석에서는 9개의 군집이 산출되었다. 이중에서 4개의 군집에는 주로 개혁신학을 연구하는 장로교단 신학자들이 포함되었으며, 5개 군집에는 장로교단에 소속되지 않은 신학자들이 주로 포함되었다. 따라서 학술지와 색인어, 저자에 대한 계량서지학적 분석 모두에서 일관되게 개혁신학 군집과 복음주의 군집을 도출하였다.

GIS 기반의 상권분석 모형 연구 - Huff 확률모형을 중심으로 - (A Study on the Trade Area Analysis Model based on GIS - A Case of Huff probability model -)

  • 손영기;안상현;신영철
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.164-171
    • /
    • 2007
  • 본 연구는 GIS공간분석기법과 Huff의 확률모형을 이용하여 근린생활권중심의 상권분석을 수행하였다. 연구에 사용된 기본도는 청주시 복대동을 대상으로 하여 업종, 세대수 등을 현장 조사하여 구축하였으며, 기 구축된 LMIS에 있는 연속지적도를 활용하였다. 분석에서는 커널밀도함수(Kernel Density Function)와 최근린지수(Nearest Neighbor Index)를 활용하여 근린생활권내 점포분포 중심권역을 설정하였다. 상권분석을 수행하기 위하여 설정된 중심권역에 따라 중심지(점)와 규모를 산출한 후 상권분석의 모형인 Huff 확률모형에 적용하여 중심권역별 상권을 추출하였으며, 추출된 상권을 지도로 도식하였다. 따라서 본 연구에서는 GIS 공간분석기법 중 커널밀도함수와 최근린지수를 통해 Huff 확률모형에 적용할 수 있는 방법을 제시하였다. 이러한 방법들을 이용함으로써 보다 정확하게 상권분석을 할 수 있으며, 향후 창업하고자 하는 소상공인들에 도움이 될 수 있으리라 사료된다.

  • PDF

빅 데이터를 이용한 범죄패턴 분석 알고리즘의 구현 (Implementation of Crime Pattern Analysis Algorithm using Big Data)

  • 차경현;김경호;황유민;이동창;김상지;김진영
    • 한국위성정보통신학회논문지
    • /
    • 제9권4호
    • /
    • pp.57-62
    • /
    • 2014
  • 본 논문에서는 빅 데이터를 이용하여 범죄 발생 패턴을 분석하는 알고리즘을 제안하고 구현했다. 제안된 알고리즘은 대검찰청에서 수집하여 공개한 범죄관련 빅 데이터를 사용하며, 표준편차 타원체 및 공간밀도 분석과 같은 공간통계분석을 통해 서울시의 2011-2013년 범죄발생 패턴을 분석했다. 범죄 발생 빈도수를 이용하여 범죄발생지역, 시간, 요일, 장소의 위험지수를 구했고, 범죄 패턴 분석 알고리즘을 통해 범죄 발생 확률을 구했다. 이를 통해 공간통계분석을 했다. 제안된 알고리즘의 구현 결과, 서울시의 각 구별로 범죄발생 패턴이 다르다는 것을 파악할 수 있었고, 다양한 범죄발생 패턴을 분석하고 범죄발생확률을 위험지수를 통해 수치화하여 위험도를 정량적으로 산출할 수 있었다.