• 제목/요약/키워드: Geometric Classifier

검색결과 17건 처리시간 0.025초

기업부실 예측 데이터의 불균형 문제 해결을 위한 앙상블 학습 (Ensemble Learning for Solving Data Imbalance in Bankruptcy Prediction)

  • 김명종
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.1-15
    • /
    • 2009
  • 데이터 불균형 문제는 분류 및 예측 문제에서 하나의 범주에 속하는 표본의 수가 다른 범주들에 속하는 표본 수에 비하여 현저하게 적을 경우 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류 경계영역이 왜곡되고 결과적으로 분류자의 학습성과가 저하되는 문제가 발생한다. 본 연구에서는 데이터 불균형 문제를 해결하기 위하여 Geometric Mean-based Boosting (GM-Boost) 알고리즘을 제안하고자 한다. GM-Boost 알고리즘은 기하평균 개념에 기초하고 있어 다수 범주와 소수 범주를 동시에 고려한 학습이 가능하고 오분류된 표본에 집중하여 학습을 강화할 수 있는 장점이 있다. 기업부실 예측문제를 활용하여 GM-Boost 알고리즘의 성과를 검증한 결과 기존의Under-Sampling, Over-Sampling 및 AdaBoost 알고리즘에 비하여 우수한 분류 정확성을 보여주었고 데이터 불균형 정도에 관계없이 견고한 학습성과를 나타냈다.

  • PDF

신경회로망을 이용한 냉연 표면흠 분류를 위한 계층적 분류기의 설계 (Design of Hierarchical Classifier for Classifying Defects of Cold Mill Strip using Neural Networks)

  • 김경민;류경;정우용;박귀태;박중조
    • 제어로봇시스템학회논문지
    • /
    • 제4권4호
    • /
    • pp.499-505
    • /
    • 1998
  • In developing an automated surface inspect algorithm, we have designed a hierarchical classifier using neural network. The defects which exist on the surface of cold mill strip have a scattering or singular distribution. We have considered three major problems, that is preprocessing, feature extraction and defect classification. In preprocessing, Top-hit transform, adaptive thresholding, thinning and noise rejection are used Especially, Top-hit transform using local minimax operation diminishes the effect of bad lighting. In feature extraction, geometric, moment, co-occurrence matrix, and histogram ratio features are calculated. The histogram ratio feature is taken from the gray-level image. For defect classification, we suggest a hierarchical structure of which nodes are multilayer neural network classifiers. The proposed algorithm reduced error rate by comparing to one-stage structure.

  • PDF

Automatic indoor progress monitoring using BIM and computer vision

  • Deng, Yichuan;Hong, Hao;Luo, Han;Deng, Hui
    • 국제학술발표논문집
    • /
    • The 7th International Conference on Construction Engineering and Project Management Summit Forum on Sustainable Construction and Management
    • /
    • pp.252-259
    • /
    • 2017
  • Nowadays, the existing manual method for recording actual progress of the construction site has some drawbacks, such as great reliance on the experience of professional engineers, work-intensive, time consuming and error prone. A method integrating computer vision and BIM(Building Information Modeling) is presented for indoor automatic progress monitoring. The developed method can accurately calculate the engineering quantity of target component in the time-lapse images. Firstly, sample images of on-site target are collected for training the classifier. After the construction images are identified by edge detection and classifier, a voting algorithm based on mathematical geometry and vector operation will divide the target contour. Then, according to the camera calibration principle, the image pixel coordinates are conversed into the real world Coordinate and the real coordinates would be corrected with the help of the geometric information in BIM model. Finally, the actual engineering quantity is calculated.

  • PDF

소형 고정익기의 신호기반 조종면 고장진단 알고리즘 (Signal-based Fault Diagnosis Algorithm of Control Surfaces of Small Fixed-wing Aircraft)

  • 김지환;구윤성;이형철
    • 한국항공우주학회지
    • /
    • 제40권12호
    • /
    • pp.1040-1047
    • /
    • 2012
  • 본 논문에서는 소형 고정익기의 고장 발생시기와 부품 교체시기를 예측하여 유지보수 비용을 절감하고 정비 효율을 높이기 위하여 ANPSD와 PCA, 그리고 GC 방법을 이용하여 조종면의 고장에 대하여 이를 검출하고 위치와 정도를 분리하는 알고리즘을 제안하였다. 이때 ANPSD는 주파수 영역에서의 진동 분석을, PCA는 ANPSD의 중요 정보 추출을, GC는 고장 검출 및 분리 시의 오류 최소화를 위하여 사용되었다. 또한 모형 항공기에 가속도 센서를 부착하여 정상인 경우와 힌지 고장이 발생한 경우에 대하여 실제로 측정한 결과에 이와 같은 알고리즘을 적용한 결과 해당 알고리즘이 고장을 검출하고 분리하는 데에 적합함을 보였으며 제안된 알고리즘을 적용할 경우에 발생 가능한 문제들에 대하여 이를 완화할 수 있는 대응책을 함께 제시하였다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

모바일 레이저 스캐닝 데이터로부터 철도 시설물 인식에 관한 연구 (Railway Object Recognition Using Mobile Laser Scanning Data)

  • ;좌윤석;손건호;원종운;이석
    • 한국산업정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.85-91
    • /
    • 2014
  • 본 연구는 MLS 데이터로부터 자동으로 철도 시설물들을 인식하여 시설물 간의 기하학적인 공간정보를 추출하는데 기여 하고자 한다. 본 연구에서 제안된 방법은 9개 주요 철도 시설물(노반, 레일, 철로, 수목, 플렛폼, 방음벽, 철주, 절연체, 고압선)들의 분류를 목적으로 하고 있다. 이를 위해 제안된 방법은 크게 두 단계로 나뉘어 진행된다. 첫 번째 단계에서는 포인트, 라인, 체적과 수직 프로파일 레벨에서 데이터의 맥락 특징(contextual feature)들이 추출된다. 두 번째 단계에서는 CRF(Conditional Random Field)가 맥락 분류자(contextual classifier)로 사용되어 각 데이터 포인트에 객체 정보가 할당되고 철도 시설물들이 분류된다. 사용된 CRF 모델은 다른 맥락 분류자 와는 달리 로컬지역에서 데이터들의 분류정보가 일관성을 유지하게 하는 장점이 있다. 제안된 방법의 성능은 commission과 omission 오류분석을 통해 입증되었다.

An Evaluation of ETM+ Data Capability to Provide 'Forest-Shrub land-Range' Map (A Case Study of Neka-Zalemroud Region-Mazandaran-Iran)

  • Latifi Hooman;Olade Djafar;Saroee Saeed;jalilvand Hamid
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.403-406
    • /
    • 2005
  • In order to evaluate the Capability of ETM+ remotely- sensed data to provide 'Forest-shrub land-Rangeland' cover type map in areas near the timberline of northern forests of Iran, the data were analyzed in a portion of nearly 790 ha located in Neka-Zalemroud region. First, ortho-rectification process was used to correct the geometric errors of the image, yielding 0/68 and 0/69 pixels of RMS. error in X and Y axis, respectively. The original and panchromatic bands were fused using PANSHARP Statistical module. The ground truth map was made using 1 ha field plots in a systematic-random sampling grid, and vegetative form of trees, shrubs and rangelands was recorded as a criteria to name the plots. A set of channels including original bands, NDVI and IR/R indices and first components of PCI from visible and infrared bands, was used for classification procedure. Pair-wise divergence through CHNSEL command was used, In order to evaluate the separability of classes and selection of optimal channels. Classification was performed using ML classifier, on both original and fused data sets. Showing the best results of $67\%$ of overall accuracy, and 0/43 of Kappa coefficient in original data set. Due to the results represented above, it's concluded that ETM+ data has an intermediate capability to fulfill the spectral variations of three form- based classes over the study area.

  • PDF

LANDAST(MSS, TM) Data를 이용(利用)한 서울시(市)의 토지이용(土地利用) 경년변화(經年變化)의 추출(抽出)에 관한 연구(硏究) (1972~1985년) (A Study on Extracting the Landuse Change Information of Seoul Using LANDSAT(MSS, TM) Data (1972~1985))

  • 안철호;안기원;김용일
    • 대한토목학회논문집
    • /
    • 제9권4호
    • /
    • pp.113-124
    • /
    • 1989
  • 인공위성 데이타 정보의 용용분야는 여러가지가 있으나, 본 연구에서는 LANDSAT MSS데이타와 TM데이타를 처리 분석하여 서울시 토지이용정보를 경년변화에 따라 추출하고자 하였다. 사용 데이터는 MSS(72, 79, 81, 83년), TM(85년)이며 입수된 데이타를 전처리를 통해 기하보정, 디지타이징(행정구역에 따라) 등을 하고, 유효 band 선정 및 filtering을 통하여 정확도를 높인 후 MLC(Maximum Likelihood Classifier)로 토지이용분류를 실시하였다. 토지이용분류시 training field 선정 자료로는 현지조사자료, 지형도, 항공사진을 참조하였고, 분류결과의 정확도는 각각 그 당시의 통계자료를 토대로 하여 비교해 보았다. 분석결과, 서울시의 도시지역은 72년 (25.3 %), 81년 (43.0 %), 85년 (51.9 %)로 증가되었고, 이에 대해 삼림은 72년(39.0 %)에서 85년(28.4 %)로 점차 감소되고 있었다. 이상과 같이 토지이용 경년변화를 추출함으로써 도시의 토지 이용상황 monitoring에는 반복 주기를 가지는 인공위성 데이터의 활용이 경제적이며 효과적임을 알 수 있었다.

  • PDF

Effects of Spray Surfactant and Particle Charge on Respirable Coal Dust Capture

  • Tessum, Mei W.;Raynor, Peter C.
    • Safety and Health at Work
    • /
    • 제8권3호
    • /
    • pp.296-305
    • /
    • 2017
  • Background: Surfactant-containing water sprays are commonly used in coal mines to collect dust. This study investigates the dust collection performance of different surfactant types for a range of coal dust particle sizes and charges. Methods: Bituminous coal dust aerosol was generated in a wind tunnel. The charge of the aerosol was either left unaltered, charge-neutralized with a neutralizer, or positively- or negatively-charged using a diffusion charger after the particles were neutralized. An anionic, cationic, or nonionic surfactant spray or a plain water spray was used to remove the particles from the air flow. Some particles were captured while passing through spray section, whereas remaining particles were charge-separated using an electrostatic classifier. Particle size and concentration of the charge-separated particles were measured using an aerodynamic particle sizer. Measurements were made with the spray on and off to calculate overall collection efficiencies (integrated across all charge levels) and efficiencies of particles with specific charge levels. Results: The diameter of the tested coal dust aerosol was $0.89{\mu}m{\pm}1.45$ [geometric $mean{\pm}geometric$ standard deviations (SD)]. Respirable particle mass was collected with $75.5{\pm}5.9%$ ($mean{\pm}SD$) efficiency overall. Collection efficiency was correlated with particle size. Surfactant type significantly impacted collection efficiency: charged particle collection by nonionic surfactant sprays was greater than or equal to collection by other sprays, especially for weakly-charged aerosols. Particle charge strength was significantly correlated with collection efficiency. Conclusion: Surfactant type affects charged particle spray collection efficiency. Nonionic surfactant sprays performed well in coal dust capture in many of the tested conditions.

Active Shape Model을 이용한 외형기반 얼굴표정인식에 관한 연구 (A Study on Appearance-Based Facial Expression Recognition Using Active Shape Model)

  • 김동주;신정훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권1호
    • /
    • pp.43-50
    • /
    • 2016
  • 본 논문에서는 ASM(Active Shape Model) 특징점(Landmark)을 이용하여 정밀한 얼굴영역을 획득하고, 외형기반 접근법으로 표정을 인식하는 방법에 대하여 제안한다. 외형기반 표정인식은 EHMM(Embedded Hidden Markov Model) 및 이진패턴 히스토그램 특징과 SVM(Support Vector Machine)을 사용하는 알고리즘으로 구성되며, 제안 방법의 성능평가는 공인 CK 데이터베이스와 JAFFE 데이터베이스를 이용하여 수행되었다. 더불어, 성능비교는 기존의 눈 거리 기반의 얼굴 정규화 방법과 비교를 통하여 수행되었고, 또한 ASM 전체 특징점 및 변형된 특징을 SVM으로 인식하는 기하학적 표정인식 방법론과 성능비교를 수행하였다. 실험 결과, 제안 방법은 거리기반 얼굴정규화 영상을 사용한 방법보다 CK 데이터베이스 및 JAFFE 데이터베이스 경우, 최대 6.39%와 7.98%의 성능향상을 보였다. 또한, 제안 방법은 기하학적 특징점을 사용한 방법보다 높은 인식 성능을 보였으며, 이로부터 제안하는 표정인식 방법의 효용성을 확인하였다.