• 제목/요약/키워드: K-nearest neighbor technique

검색결과 77건 처리시간 0.025초

A Stochastic Approach for Prediction of Partially Measured Concentrations of Benzo[a]pyrene in the Ambient Air in Korea

  • Kim, Yongku;Seo, Young-Kyo;Baek, Kyung-Min;Kim, Min-Ji;Baek, Sung-Ok
    • Asian Journal of Atmospheric Environment
    • /
    • 제10권4호
    • /
    • pp.197-207
    • /
    • 2016
  • Large quantities of air pollutants are released into the atmosphere and hence, must be monitored and routinely assessed for their health implications. This paper proposes a stochastic technique to predict unobserved hazardous air pollutants (HAPs), especially Benzo[a]pyrene (BaP), which can have negative effects on human health. The proposed approach constructs a nearest-neighbor structure by incorporating the linkage between BaP and meteorology and meteorological effects. This approach is adopted in order to predict unobserved BaP concentrations based on observed (or forecasted) meteorological conditions, including temperature, precipitation, wind speed, and air quality. The effects of BaP on human health are examined by characterizing the cancer risk. The efficient prediction provides useful information relating to the optimal monitoring period and projections of future BaP concentrations for both industrial and residential areas within Korea.

유전자 알고리즘을 이용한 사례기반추론 시스템의 최적화: 주식시장에의 응용 (Optimization of Case-based Reasoning Systems using Genetic Algorithms: Application to Korean Stock Market)

  • 김경재;안현철;한인구
    • Asia pacific journal of information systems
    • /
    • 제16권1호
    • /
    • pp.71-84
    • /
    • 2006
  • Case-based reasoning (CBR) is a reasoning technique that reuses past cases to find a solution to the new problem. It often shows significant promise for improving effectiveness of complex and unstructured decision making. It has been applied to various problem-solving areas including manufacturing, finance and marketing for the reason. However, the design of appropriate case indexing and retrieval mechanisms to improve the performance of CBR is still a challenging issue. Most of the previous studies on CBR have focused on the similarity function or optimization of case features and their weights. According to some of the prior research, however, finding the optimal k parameter for the k-nearest neighbor (k-NN) is also crucial for improving the performance of the CBR system. In spite of the fact, there have been few attempts to optimize the number of neighbors, especially using artificial intelligence (AI) techniques. In this study, we introduce a genetic algorithm (GA) to optimize the number of neighbors to combine. This study applies the novel approach to Korean stock market. Experimental results show that the GA-optimized k-NN approach outperforms other AI techniques for stock market prediction.

Improvement of location positioning using KNN, Local Map Classification and Bayes Filter for indoor location recognition system

  • Oh, Seung-Hoon;Maeng, Ju-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.29-35
    • /
    • 2021
  • 본 논문에서는 위치 측위의 정확도를 높일 수 있는 방안으로 KNN(K-Nearest Neighbor)과 Local Map Classification 및 Bayes Filter를 융합한 기법을 제안한다. 먼저 이 기법은 Local Map Classification이 실제 지도를 여러 개의 Cluster로 나누고, 다음으로 KNN으로 Cluster들을 분류한다. 그리고 Bayes Filter가 획득한 각 Cluster의 확률을 통하여 Posterior Probability을 계산한다. 이 Posterior Probability으로 로봇이 위치한 Cluster를 검색한다. 성능 평가를 위하여 KNN과 Local Map Classification 및 Bayes Filter을 적용하여서 얻은 위치 측위의 결과를 분석하였다. 분석 결과로 RSSI 신호가 변하더라도 위치 정보는 한 Cluster에 고정되면서 위치 측위의 정확도가 높아진다는 사실을 확인하였다.

Improving Web Service Recommendation using Clustering with K-NN and SVD Algorithms

  • Weerasinghe, Amith M.;Rupasingha, Rupasingha A.H.M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1708-1727
    • /
    • 2021
  • In the advent of the twenty-first century, human beings began to closely interact with technology. Today, technology is developing, and as a result, the world wide web (www) has a very important place on the Internet and the significant task is fulfilled by Web services. A lot of Web services are available on the Internet and, therefore, it is difficult to find matching Web services among the available Web services. The recommendation systems can help in fixing this problem. In this paper, our observation was based on the recommended method such as the collaborative filtering (CF) technique which faces some failure from the data sparsity and the cold-start problems. To overcome these problems, we first applied an ontology-based clustering and then the k-nearest neighbor (KNN) algorithm for each separate cluster group that effectively increased the data density using the past user interests. Then, user ratings were predicted based on the model-based approach, such as singular value decomposition (SVD) and the predictions used for the recommendation. The evaluation results showed that our proposed approach has a less prediction error rate with high accuracy after analyzing the existing recommendation methods.

클라우드 무선접속 네트워크에서 상향링크 채널 상태 정보를 이용한 핑거프린팅 기반 실내 측위에 관한 연구 시스템 (Study of Localization Based on Fingerprinting Technique Using Uplink CSI in Cloud Radio Access Network)

  • 우상우;이상헌;문철
    • 한국정보기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.71-77
    • /
    • 2019
  • 최근 5G 표준화가 본격화되고 실내위치관련 서비스에 대한 수요가 증가하면서, 실내 측위 기술에 대한 연구가 다양한 산업분야에서 연구되고 있으며, WLAN(Wireless Local Area Network)을 이용한 핑거프린팅 기법 기반의 연구가 대표적이다. 본 논문은 UDN(Ultra Dense Network) 환경에서 C-RAN(Cloud Radio Access Network) 구조와 상향링크 CSI(Channel State Information)를 측위 기반정보로 사용하는 실내 측위 기술을 제안한다. 기존의 핑거프린팅 방식에 머신러닝 기술 중 하나인 KNN(K Nearest Neighbor) 기술을 결합하여 측위 정확도를 개선하였으며, 성능 분석을 위해 구축된 테스트베드에서 수행된 기존 실내 측위 기술과 제안 기술의 성능 비교 실험을 통해, 제안하는 기술이 측위 정확도를 개선함을 확인하였다.

위성영상자료 및 국가 산림자원조사 자료를 이용한 산림 바이오매스 추정 (Estimation of Forest Biomass based upon Satellite Data and National Forest Inventory Data)

  • 임종수;한원성;황주호;정상영;조현국;신만용
    • 대한원격탐사학회지
    • /
    • 제25권4호
    • /
    • pp.311-320
    • /
    • 2009
  • 본 연구는 전라북도 무주군을 대상으로 제5차 국가산림자원조사 자료와 위성영상(Landsat TM-5)자료를 이용하여 산림 바이오매스를 추정하고 이를 토대로 바이오매스 주제도를 작성하고자 하였다. 먼저 국가산림자원조사의 야외 표본점 자료를 이용하여 조사표본점의 단위면적 당 축적을 산출하고, 바이오매스 변환계수를 적용하여 산림 바이오매스를 추정하였다. 본 연구에서는 위성영상 자료를 이용한 산림 바이오매스 추정을 위해 회귀모형을 이용하는 방법과 최근린 기법(k-Nearest Neighbor)을 이용하는 두 가지 방법을 사용하였는데, 이 두 가지 방법에 의해 추정된 산림 바이오매스를 국가산림자원조사 자료에 의한 추정치와 비교하여 최적의 방법을 선정하였다. 추정된 바이오매스 통계량의 비교를 위해 교차대조법을 이용하여 RMSE(Root Mean Square Error)와 평균편의(Mean Bias)를 산출하였는데, 그 결과 두 방법 모두 유사한 추정오차(RMSE: 63.75$\sim$67.26ton/ha)와 편차($\pm$1 ton/ha)를 보여 정확성 면에서는 큰 차이가 없는 것으로 나타났다. 하지만 최근린 기법을 이용하여 산림 바이오매스를 추정하는 것이 효율성 측면에서 보다 유리할 것으로 평가되었다. 최근린 기법에 의해 추정된 무주군의 산림 바이오매스는 약 839만 톤으로 나타났으며 단위면적당 평균은 149톤/ha인 것으로 분석되었다.

거리 가중치와 층화를 이용한 최근린기반 임목축적 추정치의 정확도 비교 (Comparison of Forest Growing Stock Estimates by Distance-Weighting and Stratification in k-Nearest Neighbor Technique)

  • 임종수;유병오;신만용
    • 한국산림과학회지
    • /
    • 제101권3호
    • /
    • pp.374-380
    • /
    • 2012
  • 본 연구는 최근린 기법에서 거리가중치와 훈련자료의 층화에 의한 추정치의 정확도를 비교하여 효율적인 방법을 모색하기 위하여 수행하였다. 거리가중치의 경우, 유사성이 높은 훈련자료에 가중치를 부여하는 방법으로 일반적으로 적용되는 5가지의 계수(0, 0.5, 1, 1.5, 그리고 2)를 비교한 결과, 평균 편차에서 최대 ${\pm}0.6m^3/ha$로 정확도는 유사한 것으로 나타났다. 훈련자료의 층화에서는 임상구분을 적용하였을 때 추정치의 정확도가 가장 높은 것으로 나타났으며, 임상구분과 참조수평거리(반경=100 km)를 통합하여 적용하였을 경우에는 임상구분에 의한 추정치와 유사한 정확도를 나타내었다. 연구대상지의 2010년 기준 평균임목축적과 비교한 결과 최근린 기반 추정치가 약 $5m^3/ha$ 정도 과소 추정되었지만, 조사시점을 고려하였을 때 상당한 정확도를 나타낸 것으로 평가된다.

Native API 의 효과적인 전처리 방법을 이용한 악성 코드 탐지 방법에 관한 연구 (Malicious Code Detection using the Effective Preprocessing Method Based on Native API)

  • 배성재;조재익;손태식;문종섭
    • 정보보호학회논문지
    • /
    • 제22권4호
    • /
    • pp.785-796
    • /
    • 2012
  • 본 논문에서는 악성코드의 시스템 콜 빈도수를 특징값으로 행위 기반 탐지(behavior-based detection)를 할 때, 시스템 콜의 속성 개수보다 학습데이터 개수가 적더라도 효과적으로 악성 코드를 탐지하는 기법을 제안한다. 이 연구에서는, 프로그램 코드가 동작할 때, 발생시키는 윈도우 커널 데이터인 Native API를 수집하여 빈도수로 정규화한 것을 기본적인 속성 값으로 사용하였다. 또한 악성코드와 정상 코드를 효과적으로 분류할 수 있으면서, 악성코드를 분류하기 위한 기본적인 속성의 개수보다 학습데이터 개수가 적어도 적용 가능한 GLDA(Generalized Linear Discriminant Analysis)를 사용하여, 새로운 속성 값들로 전환하였다. 분류 기법으로는 베이지언 분류법의 일종인 kNN(k-Nearest Neighbor) 분류법을 이용하여 악성 코드를 탐지하였다. 제안된 탐지 기법의 성능을 검증하기 위하여 수집된 Native API 로 기존의 연구 방법과 비교 검증하였다. 본 논문에 제안된 기법이 탐지율(detection rate) 100%인 Threshold 값에서, 다른 탐지 기법보다 낮은 오탐율(false positive rate)을 나타내었다.

SMOTE와 분류 기법을 활용한 산사태 위험 지역 결정 방법 (Method for Assessing Landslide Susceptibility Using SMOTE and Classification Algorithms)

  • 윤형구
    • 한국지반공학회논문집
    • /
    • 제39권6호
    • /
    • pp.5-12
    • /
    • 2023
  • 산사태 위험 지역을 사전에 조사하여 설정하는 것은 다수의 피해를 줄이기 위해 필요하다. 해당 연구의 목적은 machine learning 기법 중 분류 알고리즘을 활용하여 대상 지반의 안전율 분류를 수행할 수 있는 방법론을 제시하는 것이다. 산사태 위험 지역은 high risk area(HRA) 모델을 적용하였으며, 8개의 지반공학 물성치를 통해 위험 지역을 판단하였다. 분류 알고리즘은 decision tree(DT), K-Nearest Neighbor(KNN), logistic regression(LR) 그리고 random forest(RF)의 4가지가 활용 되었으며, 안전율 1.2~2.0 범위에 8가지 지반공학 물성치의 분류 정확도를 계산하였다. 정확도는 안전율이 1.2~1.7 범위에서 신뢰성 높게 나타났지만, 그 외 범위인 1.8~2.0 사이에서는 상대적으로 낮은 정확도를 보였다. 이를 극복하기 위하여 synthetic minority over-sampling technique(SMOTE) 알고리즘을 적용하여 데이터 개수를 증폭하였으며, 증폭한 데이터를 통해 분류 알고리즘을 적용하면 안전율 1.8~2.0 범위에서 정확도가 평균적으로 약 250% 증가한 것으로 나타났다. 해당 연구 결과는 SMOTE 알고리즘이 데이터 개수를 향상시켜 분류 알고리즘의 정확도가 개선된 것을 보여주며, 타 분야에도 정확도 향상에 적용 가능하다고 판단된다.

kNN 기법을 이용한 강원도 평창군의 산림 주제도 작성과 산림통계량 추정 (Forest Thematic Maps and Forest Statistics Using the k-Nearest Neighbor Technique for Pyeongchang-Gun, Gangwon-Do)

  • 임종수;공지수;김성호;신만용
    • 한국산림과학회지
    • /
    • 제96권3호
    • /
    • pp.259-268
    • /
    • 2007
  • 본 연구는 야외조사 자료와 원격탐사 자료를 연계하여 야외조사가 이루어지지 않은 미 관측지점의 산림정보를 추정하고 산림 주제도를 작성할 수 있는 kNN 기법을 이용하여 강원도 평창군을 대상으로 산림정보별 주제도를 작성하고, 산림통계량을 산출하였다. 수평참조범위 반경을 20, 40, 60 km로 구분한 후, 각 반경별 추정치의 오차를 비교하였다. 반경 60 km일 때, 최소 오차를 갖는 것으로 분석되었지만, 반경 40 km와 비교하면 차이가 없는 것으로 파악되어, 반경이 작은 반경 40 km을 효율적인 참조범위로 선정하였다. 선정된 수평참조범위에서 최적의 참조 표본점의 개수를 선정하기 위하여 오차행렬을 분석한 결과, k=5가 최적의 참조 표본점개수로 관측되었다. 따라서 최소 수평반경 40 km와 k=5의 참조표본점수를 이용하여 평창군 산림의 ha당 재적, 흉고단면적, 그리고 본수에 대한 주제도를 작성하였다. 작성된 주제도에 의해 추정된 산림통계량은 야외조사에 의한 추정치보다 과소추정치를 나타내었다.