• 제목/요약/키워드: Knn

검색결과 252건 처리시간 0.025초

ZrO2 첨가된 0.96(K0.5Na0.5)NbO3-0.04SrZrO3 압전세라믹스의 환원분위기 소결 (Sintering of ZrO2-modified 0.96(K0.5Na0.5)NbO3-0.04SrZrO3 Piezoelectric Ceramics in a Reduced Atmosphere)

  • 강경민;조정호;남중희;고태경;전명표
    • 한국전기전자재료학회논문지
    • /
    • 제24권7호
    • /
    • pp.563-567
    • /
    • 2011
  • The most widely used piezoelectric ceramics are lead oxide based ferroelectrics (PZT). However, the toxicity of lead oxide and its high vapor pressure during processing have led to a demand for alternative lead-free piezoelectric materials. We synthesized Lead-free piezoelectric ceramics of $0.96(K_{0.5}Na_{0.5})NbO_3-0.04SrZrO_3+x$ mol% $ZrO_2$ [KNN-SZ+$xZrO_2$; x= 0~0.10] doped with 0.1 wt% $MnO_2$ by a conventional solid state method. We investigated the piezoelectric properties and microstructures of these disk samples sintered in reduced atmosphere in order to evaluate the possibility of the multilayered piezoelectric ceramics having the base metal such as Ni as a internal electrode. All of these KNN-SZ samples sintered in 3%$H_2-97%N_2$ atmosphere at $1,140^{\circ}C$ exhibit pure perovskite structure irrespective of the content of $ZrO_2$. Meanwhile, the sintering denisty and piezoelectric properties such as $K_p$, $Q_m$ and $d_{33}$ of KNN-SZ samples as a function of $ZrO_2$ content show the maxima ($k_p$=28.07%, $Q_m$= 101.34, $d_{33}$= 156 pC/N) at x= 0.04 and it is likely that there is some morphotropic phase boundary(MPB) in this KNN-SZ+$xZrO_2$ composition system. These results indicate that the ceramic composition is a promising candidate material for applications in lead free multilayer piezoelectric ceramics.

머신 러닝을 활용한 과학 논변 구성 요소 코딩 자동화 가능성 탐색 연구 (Exploratory Research on Automating the Analysis of Scientific Argumentation Using Machine Learning)

  • 이경건;하희수;홍훈기;김희백
    • 한국과학교육학회지
    • /
    • 제38권2호
    • /
    • pp.219-234
    • /
    • 2018
  • 본 연구에서는 국내 교육학 연구에서 거의 사용되지 않던 머신 러닝 기술을 과학 교육 연구에 접목하여, 학생들의 과학 논변 활동에서 나타나는 논변의 구성 요소를 분석하는 과정을 자동화할 수 있는 가능성을 탐색해보았다. 학습 데이터로는 Toulmin이 제안하였던 틀에 따라 학생들의 과학 논변 구성 요소를 코딩한 국내 선행 문헌 18건을 수합하고 정리하여 990개의 문장을 추출하였으며, 테스트 데이터로는 실제 교실 환경에서 발화된 과학 논변 전사 데이터를 사용하여 483개의 문장을 추출하고 연구자들이 사전 코딩을 수행하였다. Python의 'KoNLPy' 패키지와 '꼬꼬마(Kkma)' 모듈을 사용한 한국어 자연어 처리(Natural Language Processing, NLP)를 통해 개별 논변을 구성하는 단어와 형태소를 분석하였으며, 연구자 2인과 국어교육 석사학위 소지자 1인의 검토 과정을 거쳤다. 총 1,473개의 문장에 대한 논변-형태소:품사 행렬을 만든 후에 다섯 가지 방법으로 머신 러닝을 수행하고 생성된 예측 모델과 연구자의 사전 코딩을 비교한 결과, 개별 문장의 형태소만을 고려하였을 때에는 k-최근접 이웃 알고리즘(KNN)이 약 54%의 일치도(${\kappa}=0.22$)를 보임으로써 가장 우수하였다. 직전 문장이 어떻게 코딩되어 있는지에 관한 정보가 주어졌을 때, k-최근접 이웃 알고리즘(KNN)이 약 55%의 일치도(${\kappa}=0.24$)를 보였으며 다른 머신 러닝 기법에서도 전반적으로 일치도가 상승하였다. 더 나아가, 본 연구의 결과는 과학 논변 활동의 분석에서 개별문장을 고려하는 단순한 방법이 어느 정도 유용함과 동시에, 담화의 맥락을 고려하는 것 또한 필요함을 데이터에 기반하여 보여주었다. 또한 머신 러닝을 통해 교실에서 한국어로 이루어진 과학 논변 활동을 분석하여 연구자와 교사들에게 유용하게 사용될 수 있는 가능성을 보여준다.

사고등급별 고속도로 교통사고 처리시간 예측모형 개발 (Development of Freeway Traffic Incident Clearance Time Prediction Model by Accident Level)

  • 이숭봉;한동희;이영인
    • 대한교통학회지
    • /
    • 제33권5호
    • /
    • pp.497-507
    • /
    • 2015
  • 고속도로의 비반복 혼잡은 주로 돌발상황에 의해 발생된다. 돌발상황의 주요 원인은 교통사고로 알려져 있다. 따라서 교통사고 시 사고처리시간을 정확하게 예측하는 것은 돌발상황 관리에서 매우 중요하다. 본 연구에서는 전국고속도로의 2008-2014년 총 7년치(60,473건)의 사고 자료를 이용하였다. 사고처리시간 예측모형은 과거의 교통사고 이력자료를 바탕으로 비모수모형인 KNN (K-Nearest Neighbor) 알고리즘을 활용하였다. 사고자료 현황 분석결과 사고등급별로 사고처리시간에 미치는 영향이 매우 큰 것으로 분석되었다. 따라서 사고처리시간은 사고등급별로 분류하여 모형을 구축하였다. 그리고 현재 발생한 사고의 교통상황과 도로 기하구조를 반영하기 위하여 교통량, 차로수, 시간대를 구분하여 데이터를 추출하였다. 추출된 데이터 중 현재 교통사고와 유사한 사고를 검색하기 위하여 사고처리시간에 영향을 미치는 요인들을 분석하였다. 마지막으로, 상태간 거리 산정을 위해서 세부항목별 가중치를 산정하였다. 가중치산정은 정규분포 표준화방법을 적용하였고, 이를 통해 사고처리시간을 예측하였다. 본 연구에서 개발된 모형의 예측결과는 기존의 연구들의 결과에 비해 낮은 예측오차(MAPE)를 보여 모형의 우수성을 입증할 수 있다고 판단된다. 본 연구를 통해 고속도로의 돌발상황 발생 시 효율적인 고속도로의 운영관리에 기여할 수 있고, 기존의 모형들이 갖고 있던 한계를 개선 및 보완할 수 있을 것으로 판단된다.

하나의 IMU를 이용한 앉은 자세 분류 연구 (Research on Classification of Sitting Posture with a IMU)

  • 김연욱;조우형;전유용;이상민
    • 재활복지공학회논문지
    • /
    • 제11권3호
    • /
    • pp.261-270
    • /
    • 2017
  • 바르지 못한 앉은 자세는 다양한 질병과 신체 변형을 유발한다. 하지만 오랜 시간동안 바른 앉은 자세를 유지하는 것은 쉬운 일이 아니다. 이러한 이유 때문에 그동안 자동으로 바른 앉은 자세를 유도하기 위한 다양한 시스템이 제안되어왔다. 이전에 제안되었던 앉은 자세 판별 및 바른 앉은 자세 유도 시스템은 영상 처리를 이용한 방법, 의자에 압력센서를 달아 측정하는 방법, IMU(Internal Measurement Unit)를 이용한 방법이 있었다. 이 중 IMU를 이용한 측정 방법은 하드웨어 구성이 간단하고, 공간, 광량 등의 환경적 제한이 적어 측정에 있어서 용이한 이점이 있었다. 본 논문에서는 하나의 IMU를 이용하여 적은 데이터로 효율적으로 앉은 자세를 분류하는 방법을 연구하였다. 특징추출 기법을 이용하여 데이터 분류에 기여도가 낮은 데이터를 제거하였으며, 머신러닝 기법을 이용하여 앉은 자세 분류에 적합한 센서 위치를 찾고, 여러 개의 머신러닝 모델 중 가장 분류 정확도가 높은 머신러닝 모델을 선정하였다. 특징추출 기법은 PCA(Principal Component Analysis)를 사용하였고, 머신러닝 모델은 SVM(Support Vector Machine), KNN(K Nearest Neighbor), K-means (K-means Algorithm) GMM (Gaussian Mixture Model), and HMM (Hidden Marcov Model)모델을 사용하였다. 연구결과 데이터 분류율이 높게나온 뒷목이 적합한 센서 위치가 되었으며, 센서 데이터 중 Yaw데이터는 분류 기여도가 가장 낮은 데이터임을 PCA 특징추출 기법을 이용하여 확인하고, 제거하여도 분류율에 영향이 매우 작음을 확인하였다. 적합 머신러닝 모델은 SVM, KNN 모델로 다른 모델에 비하여 분류율이 높게 나오는 것을 확인할 수 있었다.

인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구 (A Study on the Win-Loss Prediction Analysis of Korean Professional Baseball by Artificial Intelligence Model)

  • 김태훈;임성원;고진광;이재학
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.77-84
    • /
    • 2020
  • 본 연구에서는 인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구를 했다. 승리할 팀과 해당 팀의 최종 리그 순위를 예측했고, 사용자의 편의를 위해 웹사이트도 구축했다. 각 1·3·5이닝 별로 가장 정확도가 높으면서도 오차가 적은 모델을 최적 모델로 선정해 승·패 결과를 예측했고, 이를 토대로 순위표를 작성했다. 결과표는 2020년 개막인 5월 5일부터 8월 30일까지의 예측 결과를 바탕으로 작성했다. 기아타이거즈가 아닌 다른 구단끼리의 경기는 실제 결과를 사용했다. 머신러닝 모델은 KNN과 AdaBoost가 최적 모델로 선정되었으며, 실제 순위와 비교해 본 결과, 경기가 진행될수록, 예측 결과의 순위 오차가 점점 작아지는 것을 확인했다. 딥러닝 모델은 89%의 정확도를 기록했고, 머신러닝 모델과 마찬가지로 경기를 진행할수록 예측 결과 순위 오차가 작아지는 것을 확인했다. 실험 결과는 한국 프로야구 승·패 결과 예측뿐 아니라 다양한 분야에서 사용할 수 있을 것으로 사료된다. 방송국에서 야구 경기를 중계하는 중 이닝별로 인공지능 알고리즘이 예상한 승·패 여부를 중계화면에 띄울 수 있다. 시청자들에게 새로운 흥미를 일으킬 수 있을 것이고, 나아가 구단의 감독들이 이닝마다 데이터를 분석해 경기 중 유동적으로 승리하기 위한 전략을 세울 수 있을 것으로 기대된다.

데이터 증가를 통한 선형 모델의 일반화 성능 개량 (중심극한정리를 기반으로) (Improvement of generalization of linear model through data augmentation based on Central Limit Theorem)

  • 황두환
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.19-31
    • /
    • 2022
  • 기계학습 모델 구축 간 트레이닝 데이터를 활용하며, 훈련 간 사용되지 않은 테스트 데이터를 활용하여 모델의 정확도와 일반화 성능을 판단한다. 일반화 성능이 낮은 모델의 경우 새롭게 받아들이게 되는 데이터에 대한 예측 정확도가 현저히 감소하게 되며 이러한 현상을 두고 모델이 과적합 되었다고 한다. 본 연구는 중심극한정리를 기반으로 데이터를 생성 및 기존의 훈련용 데이터와 결합하여 새로운 훈련용 데이터를 구성하고 데이터의 정규성을 증가시킴과 동시에 이를 활용하여 모델의 일반화 성능을 증가시키는 방법에 대한 것이다. 이를 위해 중심극한정리의 성질을 활용해 데이터의 각 특성별로 표본평균 및 표준편차를 활용하여 데이터를 생성하였고, 새로운 훈련용 데이터의 정규성 증가 정도를 파악하기 위하여 Kolmogorov-Smirnov 정규성 검정을 진행한 결과, 새로운 훈련용 데이터가 기존의 데이터에 비해 정규성이 증가하였음을 확인할 수 있었다. 일반화 성능은 훈련용 데이터와 테스트용 데이터에 대한 예측 정확도의 차이를 통해 측정하였다. 새롭게 생성된 데이터를 K-Nearest Neighbors(KNN), Logistic Regression, Linear Discriminant Analysis(LDA)에 적용하여 훈련시키고 일반화 성능 증가정도를 파악한 결과, 비모수(non-parametric) 기법인 KNN과 모델 구성 간 정규성을 가정으로 갖는 LDA의 경우에 대하여 일반화 성능이 향상되었음을 확인할 수 있었다.

완전 자율주행을 위한 도로 상태 기반 제동 강도 계산 시스템 (The Road condition-based Braking Strength Calculation System for a fully autonomous driving vehicle)

  • 손수락;정이나
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.53-59
    • /
    • 2022
  • 3단계 자율주행 차량 이후, 4, 5단계의 자율주행 기술은 차량의 완벽한 주행뿐만 아니라 탑승객의 상태를 최적으로 유지하기 위해 노력하고 있다. 그러나 현재 자율주행 기술은 LiDAR, 전방 카메라 등 시각적 정보에 과하게 의존하기 때문에 지정된 도로 이외의 도로에서 완벽하게 자율주행을 실행하기 힘들다. 따라서 본 논문은 차량이 시각 정보 외의 데이터를 사용하여 도로의 상태를 분류하고, 도로 상태와 주행 상태에 따라 최적의 제동 강도를 계산하는 BSCS (Braking Strength Calculation System)를 제안한다. 본 논문에서 제안하는 BSCS는 KNN 알고리즘을 기반으로 도로의 상태를 분류하는 RCDM (Road Condition Definition Module)과 RCDM의 결과와 현재 주행 상태를 통해 주행 중 최적의 제동 강도를 계산하는 BSCM (Braking Strength Calculation Module)로 구성된다. 본 논문의 실험 결과, KNN 알고리즘에 가장 적합한 K의 수를 찾을 수 있었고, 비지도 학습인 K-means 알고리즘보다 본 논문에서 제안한 RCDM이 더 정확한 것이 증명되었다. 해당 논문의 BSCS는 시각 정보뿐만 아니라 서스펜션에 가해지는 진동 데이터를 사용함으로써, 시각 정보가 제한되는 여러 환경에서 자율주행 차량의 제동을 더 원활하게 만들 수 있다.

Plurality Rule-based Density and Correlation Coefficient-based Clustering for K-NN

  • Aung, Swe Swe;Nagayama, Itaru;Tamaki, Shiro
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권3호
    • /
    • pp.183-192
    • /
    • 2017
  • k-nearest neighbor (K-NN) is a well-known classification algorithm, being feature space-based on nearest-neighbor training examples in machine learning. However, K-NN, as we know, is a lazy learning method. Therefore, if a K-NN-based system very much depends on a huge amount of history data to achieve an accurate prediction result for a particular task, it gradually faces a processing-time performance-degradation problem. We have noticed that many researchers usually contemplate only classification accuracy. But estimation speed also plays an essential role in real-time prediction systems. To compensate for this weakness, this paper proposes correlation coefficient-based clustering (CCC) aimed at upgrading the performance of K-NN by leveraging processing-time speed and plurality rule-based density (PRD) to improve estimation accuracy. For experiments, we used real datasets (on breast cancer, breast tissue, heart, and the iris) from the University of California, Irvine (UCI) machine learning repository. Moreover, real traffic data collected from Ojana Junction, Route 58, Okinawa, Japan, was also utilized to lay bare the efficiency of this method. By using these datasets, we proved better processing-time performance with the new approach by comparing it with classical K-NN. Besides, via experiments on real-world datasets, we compared the prediction accuracy of our approach with density peaks clustering based on K-NN and principal component analysis (DPC-KNN-PCA).

An Arabic Script Recognition System

  • Alginahi, Yasser M.;Mudassar, Mohammed;Nomani Kabir, Muhammad
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권9호
    • /
    • pp.3701-3720
    • /
    • 2015
  • A system for the recognition of machine printed Arabic script is proposed. The Arabic script is shared by three languages i.e., Arabic, Urdu and Farsi. The three languages have a descent amount of vocabulary in common, thus compounding the problems for identification. Therefore, in an ideal scenario not only the script has to be differentiated from other scripts but also the language of the script has to be recognized. The recognition process involves the segregation of Arabic scripted documents from Latin, Han and other scripted documents using horizontal and vertical projection profiles, and the identification of the language. Identification mainly involves extracting connected components, which are subjected to Principle Component Analysis (PCA) transformation for extracting uncorrelated features. Later the traditional K-Nearest Neighbours (KNN) algorithm is used for recognition. Experiments were carried out by varying the number of principal components and connected components to be extracted per document to find a combination of both that would give the optimal accuracy. An accuracy of 100% is achieved for connected components >=18 and Principal components equals to 15. This proposed system would play a vital role in automatic archiving of multilingual documents and the selection of the appropriate Arabic script in multi lingual Optical Character Recognition (OCR) systems.

KNN-based Image Annotation by Collectively Mining Visual and Semantic Similarities

  • Ji, Qian;Zhang, Liyan;Li, Zechao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권9호
    • /
    • pp.4476-4490
    • /
    • 2017
  • The aim of image annotation is to determine labels that can accurately describe the semantic information of images. Many approaches have been proposed to automate the image annotation task while achieving good performance. However, in most cases, the semantic similarities of images are ignored. Towards this end, we propose a novel Visual-Semantic Nearest Neighbor (VS-KNN) method by collectively exploring visual and semantic similarities for image annotation. First, for each label, visual nearest neighbors of a given test image are constructed from training images associated with this label. Second, each neighboring subset is determined by mining the semantic similarity and the visual similarity. Finally, the relevance between the images and labels is determined based on maximum a posteriori estimation. Extensive experiments were conducted using three widely used image datasets. The experimental results show the effectiveness of the proposed method in comparison with state-of-the-arts methods.