• 제목/요약/키워드: k nearest neighbors(KNN)

검색결과 48건 처리시간 0.022초

Assessment of wall convergence for tunnels using machine learning techniques

  • Mahmoodzadeh, Arsalan;Nejati, Hamid Reza;Mohammadi, Mokhtar;Ibrahim, Hawkar Hashim;Mohammed, Adil Hussein;Rashidi, Shima
    • Geomechanics and Engineering
    • /
    • 제31권3호
    • /
    • pp.265-279
    • /
    • 2022
  • Tunnel convergence prediction is essential for the safe construction and design of tunnels. This study proposes five machine learning models of deep neural network (DNN), K-nearest neighbors (KNN), Gaussian process regression (GPR), support vector regression (SVR), and decision trees (DT) to predict the convergence phenomenon during or shortly after the excavation of tunnels. In this respect, a database including 650 datasets (440 for training, 110 for validation, and 100 for test) was gathered from the previously constructed tunnels. In the database, 12 effective parameters on the tunnel convergence and a target of tunnel wall convergence were considered. Both 5-fold and hold-out cross validation methods were used to analyze the predicted outcomes in the ML models. Finally, the DNN method was proposed as the most robust model. Also, to assess each parameter's contribution to the prediction problem, the backward selection method was used. The results showed that the highest and lowest impact parameters for tunnel convergence are tunnel depth and tunnel width, respectively.

인체의 임펄스 응답 신호를 이용한 사용자 인식 방법 (User Recognition Method using Human Body Impulse Response Signals)

  • 박범수;강은정;강태욱;이재진;김성은
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.120-126
    • /
    • 2020
  • 본 연구에서는 인체의 임펄스 응답 신호를 이용하여 사용자를 인식하는 방법을 제안한다. 인체는 물, 근육, 지방, 뼈 등으로 구성되어 있고, 이러한 구성비는 사람마다 다르게 형성되어 있다. 기존의 인체 통신 연구에서는 인체가 커패시터와 저항으로 이루어진 회로로 모델링 되었고, 회로의 특징은 인체의 구성 특성에 따라 다르다는 것이 밝혀졌다. 따라서 인체는 개인별 고유한 채널로 인식될 수 있고, 이를 이용한 사용자 인식이 가능하다는 연구가 보고 되었다. 이 연구에서는, 임펄스 신호를 인체에 인가하여 임펄스 응답 신호를 측정하고, empirical mode decomposition 기법으로 노이즈를 제거한다. 그리고 10개의 피크 값을 추출하고 피크 간 값의 차이를 특징량으로 사용하여 사용자 인증을 수행하였다. 6명의 참가자로부터 수집한 데이터를 k-nearest neighbors(KNN) 알고리즘을 사용하여 분류 성능을 확인한 결과, 임펄스 응답 신호의 전체 시계열 데이터의 분류 정확도는 91.57%이었으나, 제안한 피크 간 값의 차이를 특징량으로 하여 분류를 하였을 때 분류 정확도가 97.71%로 크게 향상되는 것을 확인할 수 있었다.

운동학적 접근 방법을 사용한 복잡한 인간 동작 질의 시스템 (A Kinematic Approach to Answering Similarity Queries on Complex Human Motion Data)

  • 한혁;김신규;정형수;염헌영
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-11
    • /
    • 2009
  • 대규모 인간 동작 데이터베이스에서 고차원의 데이터를 처리하는 것이 큰 비용을 요구하기에, 최근 데이터베이스 및 그래픽스 학계는 인간 동작 데이터 질의 및 접근에 큰 관심을 가지게 되었다. 특히, 인간 동작 데이터를 위한 효과적인 유사도(거리) 측정 방법이나 질의 처리는 여전히 많은 연구진들이 도전하고 있는 문제이다. 이에, 본 연구진은 SMoFinder 라고 명명한 동작 질의 처리 시스템을 제안한다. SMoFinder는 새롭게 고안된 운동학적 거리 측정 그리고 적응적 프레임 세그멘테이션에 기반하는 효율적인 인덱싱을 사용하여 동작 질의를 처리한다. 이를 위해, SMoFinder에서는 인간 동작을 다연결 물리 운동으로 간주하고 새로운 가중치 Minkowski 함수를 정의했다. 또한, 효율적인 인덱싱을 위해 모든 프레임을 저장하지 않고 유사한 프레임들 중에서 대표 프레임을 뽑아서 저장하는 적응적 세그멘테이션을 고안했다. 그리고, 효율적인 검색을 위해 이들 대표 프레임들만 가지고 k-근접 이웃 질의를 수행하는 새로운 방법을 제안한다. 마지막으로, SMoFinder가 데이터베이스 용량이 크게 줄지만(1/25배), 검색 능력은 다른 시스템과 동일하거나 우월하다는 것을 실험을 통해 보여주고자 한다.

  • PDF

Classifying Indian Medicinal Leaf Species Using LCFN-BRNN Model

  • Kiruba, Raji I;Thyagharajan, K.K;Vignesh, T;Kalaiarasi, G
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3708-3728
    • /
    • 2021
  • Indian herbal plants are used in agriculture and in the food, cosmetics, and pharmaceutical industries. Laboratory-based tests are routinely used to identify and classify similar herb species by analyzing their internal cell structures. In this paper, we have applied computer vision techniques to do the same. The original leaf image was preprocessed using the Chan-Vese active contour segmentation algorithm to efface the background from the image by setting the contraction bias as (v) -1 and smoothing factor (µ) as 0.5, and bringing the initial contour close to the image boundary. Thereafter the segmented grayscale image was fed to a leaky capacitance fired neuron model (LCFN), which differentiates between similar herbs by combining different groups of pixels in the leaf image. The LFCN's decay constant (f), decay constant (g) and threshold (h) parameters were empirically assigned as 0.7, 0.6 and h=18 to generate the 1D feature vector. The LCFN time sequence identified the internal leaf structure at different iterations. Our proposed framework was tested against newly collected herbal species of natural images, geometrically variant images in terms of size, orientation and position. The 1D sequence and shape features of aloe, betel, Indian borage, bittergourd, grape, insulin herb, guava, mango, nilavembu, nithiyakalyani, sweet basil and pomegranate were fed into the 5-fold Bayesian regularization neural network (BRNN), K-nearest neighbors (KNN), support vector machine (SVM), and ensemble classifier to obtain the highest classification accuracy of 91.19%.

머신러닝 기법을 활용한 토양수분 예측 가능성 연구 (Study on Soil Moisture Predictability using Machine Learning Technique)

  • 조봉준;최완민;김영대;김기성;김종건
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.248-248
    • /
    • 2020
  • 토양수분은 증발산, 유출, 침투 등 물수지 요소들과 밀접한 연관이 있는 주요한 변수 중에 하나이다. 토양수분의 정도는 토양의 특성, 토지이용 형태, 기상 상태 등에 따라 공간적으로 상이하며, 특히 기상 상태에 따라 시간적 변동성을 보이고 있다. 기존 토양수분 측정은 토양시료 채취를 통한 실내 실험 측정과 측정 장비를 통한 현장 조사 방법이 있으나 시간적, 경제적 한계점이 있으며, 원격탐사 기법은 공간적으로 넓은 범위를 포함하지만 시간 해상도가 낮은 단점이 있다. 또한, 모델링을 통한 토양수분 예측 기술은 전문적인 지식이 요구되며, 복잡한 입력자료의 구축이 요구된다. 최근 머신러닝 기법은 수많은 자료 학습을 통해 사용자가 원하는 출력값을 도출하는데 널리 활용되고 있다. 이에 본 연구에서는 토양수분과 연관된 다양한 기상 인자들(강수량, 풍속, 습도 등)을 활용하여 머신러닝기법의 반복학습을 통한 토양수분의 예측 가능성을 분석하고자 한다. 이를 위해 시공간적으로 토양수분 실측 자료가 잘 구축되어 있는 청미천과 설마천 유역을 대상으로 머신러닝 기법을 적용하였다. 두 대상지에서 2008년~2012년 수문자료를 확보하였으며, 기상자료는 기상자료개방포털과 WAMIS를 통해 자료를 확보하였다. 토양수분 자료와 기상자료를 머신러닝 알고리즘을 통해 학습하고 2012년 기상 자료를 바탕으로 토양수분을 예측하였다. 사용되는 머신러닝 기법은 의사결정 나무(Decision Tree), 신경망(Multi Layer Perceptron, MLP), K-최근접 이웃(K-Nearest Neighbors, KNN), 서포트 벡터 머신(Support Vector Machine, SVM), 랜덤 포레스트(Random Forest), 그래디언트 부스팅 (Gradient Boosting)이다. 토양수분과 기상인자 간의 상관관계를 분석하기 위해 히트맵(Heat Map)을 이용하였다. 히트맵 분석 결과 토양수분의 시간적 변동은 다양한 기상 자료 중 강수량과 상대습도가 가장 큰 영향력을 보여주었다. 또한 다양한 기상 인자 기반 머신러닝 기법 적용 결과에서는 두 지역 모두 신경망(MLP) 기법을 제외한 모든 기법이 전반적으로 실측값과 유사한 형태를 보였으며 비교 그래프에서도 실측값과 예측 값이 유사한 추세를 나타냈다. 따라서 상관관계있는 과거 기상자료를 통해 머신러닝 기법 기반 토양수분의 시간적 변동 예측이 가능할 것으로 판단된다.

  • PDF

희소주성분분석을 이용한 텍스트데이터의 단어선택 (Feature selection for text data via sparse principal component analysis)

  • 손원
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.501-514
    • /
    • 2023
  • 텍스트데이터는 일반적으로 많은 단어로 이루어져 있다. 텍스트데이터와 같이 많은 변수로 구성된 데이터의 경우 과적합 등의 문제로 분석에 있어서의 정확성이 떨어지고, 계산과정에서의 효율성에도 문제가 발생하는 경우를 흔히 볼 수 있다. 이렇게 변수가 많은 데이터를 분석하기 위해 특징선택, 특징추출 등의 차원 축소 기법이 자주 사용되고 있다. 희소주성분분석은 벌점이 부여된 최소제곱법 중 하나로 엘라스틱넷 형태의 목적함수를 사용하여 유용하지 않은 주성분을 제거하고 각 주성분에서도 중요도가 큰 변수만 식별해내기 위해 활용되고 있다. 이 연구에서는 희소주성분분석을 이용하여 많은 변수를 가진 텍스트데이터를 소수의 변수만으로 요약하는 절차를 제안한다. 이러한 절차를 실제 데이터에 적용한 결과, 희소주성분분석을 이용하여 단어를 선택하는 과정을 통해 목표변수에 대한 정보를 이용하지 않고도 유용성이 낮은 단어를 제거하여 텍스트데이터의 분류 정확성은 유지하면서 데이터의 차원을 축소할 수 있음을 확인하였다. 특히 차원축소를 통해 고차원 데이터 분석에서 분류 정확도가 저하되는 KNN 분류기 등의 분류 성능을 개선할 수 있음을 알 수 있었다.

주파수 공간상의 특징 데이터를 활용한 손목에 부착된 가속도 센서 기반의 낙상 감지 (Fall detection based on acceleration sensor attached to wrist using feature data in frequency space)

  • 노정현;김진헌
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.31-38
    • /
    • 2021
  • 낙상사고는 언제, 어디에서 일어날지 예측하기 어렵다. 또한 신속한 후속 조치가 수행되지 않으면 생명의 위협으로 이어지므로 낙상사고를 자동으로 감지할 수 있는 연구가 필요하게 되었다. 자동적인 낙상사고 감지기법 중 손목에 부착된 IMU 센서를 활용한 기법은 움직임이 많아 낙상사고 검출이 어렵지만, 착용의 간편함과 접근성이 뛰어난 기법으로 인식되고 있다. 낙상 데이터 확보의 어려움을 극복하기 위해 본 연구는 KNN과 SVM과 같은 머신러닝으로 적은 데이터를 효율적으로 학습하는 알고리즘을 제안한다. 또한, 이들 수학적 분류기의 성능을 높이기 위해 본 연구에서는 주파수 공간에서 취득한 특징 데이터를 활용하였다. 제안된 알고리즘은 표준 데이터세트를 활용한 실험을 통해 모델의 파라미터와 주파수 특징 추출기의 파라미터를 다각화하여 그 영향을 분석하였다. 제안된 알고리즘은 학습 데이터를 확보하기 어려운 현실적인 문제에 적절히 대처할 수 있었다. 또한 본 알고리즘이 다른 분류기보다 경량화되어 있기 때문에 SIMD(Single Instruction Multiple Data) 처리장치 탑재가 어려운 소형 임베디드시스템에도 구현이 용이했다.

네트워크 중심성 척도가 추천 성능에 미치는 영향에 대한 연구 (A Study on the Effect of Network Centralities on Recommendation Performance)

  • 이동원
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.23-46
    • /
    • 2021
  • 개인화 추천에서 많이 사용되는 협업 필터링은 고객들의 구매이력을 기반으로 유사고객을 찾아 상품을 추천할 수 있는 매우 유용한 기법으로 인식되고 있다. 그러나, 전통적인 협업 필터링 기법은 사용자 간에 직접적인 연결과 공통적인 특징을 기반으로 유사도를 계산하는 방식으로 인해 신규 고객 혹은 상품에 대해 유사도를 계산하기 힘들다는 문제가 제기되어 왔다. 이를 극복하기 위하여, 다른 기법을 함께 사용하는 하이브리드 기법이 고안되기도 하였다. 이런 노력의 하나로서, 사회연결망의 구조적 특성을 적용하여 이런 문제를 해결하려는 시도가 있었다. 이는, 직접적으로 유사성을 찾기 힘든 사용자 간에도 둘 사이에 놓인 유사한 사용자 또는 사용자들을 통해 유추해내는 방식으로 상호 간의 유사성을 계산하는 방식을 적용한 것이다. 즉, 구매 데이터를 기반으로 사용자의 네트워크를 생성하고 이 네트워크 내에서 두 사용자를 간접적으로 이어주는 네트워크의 특성을 기반으로 둘 사이의 유사도를 계산하는 것이다. 이렇게 얻은 유사도는 추천대상 고객이 상품의 추천에 대한 수락여부를 결정하는 척도로 활용될 수 있다. 서로 다른 중심성 척도는 추천성과에 미치는 영향이 서로 다를 수 있다는 점에서 중요한 의미를 갖는다 할 수 있다. 이런 유사도의 계산을 위해서 네트워크의 중심성을 활용할 수 있다. 본 연구에서는 여기서 더 나아가 이런 중심성이 추천성과에 미치는 영향이 추천 알고리즘에 따라서도 다를 수 있다는 데에서 주목하여 수행되었다. 또한, 이런 네트워크 분석을 활용한 추천기법은 신규 고객 혹은 상품뿐만 아니라 전체 고객 혹은 상품으로 그 대상을 넓히더라도 추천 성능을 높이는 데 기여할 것을 기대할 수 있을 것이다. 이런 관점에서 본 연구는 네트워크 모형에서 연결선이 생성되는 것을 이진 분류의 문제로 보고, 추천 모형에 적용할 분류 기법으로 의사결정나무, K-최근접이웃법, 로지스틱 회귀분석, 인공신경망, 서포트 벡터 머신을 선택하고, 온라인 쇼핑몰에서 4년2개월간 수집된 구매 데이터로 실험을 진행하였다. 사회연결망에서 측정된 중심성 척도를 각 분류 기법에 적용하여 생성한 모형을 비교 실험한 결과, 각 모형 별로 중심성 척도의 추천성공률이 서로 다르게 나타남을 확인할 수 있었다.