• 제목/요약/키워드: 분류기 알고리즘

검색결과 599건 처리시간 0.028초

교차 프로젝트 결함 예측 성능 향상을 위한 효과적인 하모니 검색 기반 비용 민감 부스팅 최적화 (Effective Harmony Search-Based Optimization of Cost-Sensitive Boosting for Improving the Performance of Cross-Project Defect Prediction)

  • 류덕산;백종문
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.77-90
    • /
    • 2018
  • 소프트웨어 결함 예측(SDP)은 결함이 있는 모듈을 식별하기 위한 연구 분야이다. 충분한 로컬 데이터가 없으면 다른 회사에서 수집한 데이터를 사용하여 분류기를 구축하는 교차 프로젝트 결함 예측(CPDP)을 활용할 수 있다. SDP에 대한 대부분의 기계 학습 알고리즘은 서로 다른 값에 따라 예측 성능에 큰 영향을 미치는 하나 이상의 매개 변수를 사용한다. 본 연구의 목적은 CPDP의 예측 성능 향상을 위해 매개 변수 선택 기법을 제안하는 것이다. Harmony Search 알고리즘을 사용하여, 예측 어려움을 야기하는 클래스 불균형을 해결하는 방법인 비용에 민감한 부스팅의 매개 변수를 조정한다. 분포 특성에 따라 매개 변수 범위와 매개 변수 간의 제한 조건 규칙이 정의되어 하모니 검색 알고리즘에 적용된다. 제안된 접근법은 15개의 대상 프로젝트를 대상으로 3개의 CPDP 모델과 내부프로젝트 결함 예측(WPDP) 모델을 비교한다. 실험 결과는 제안된 방법이 클래스 불균형의 맥락에서 다른 CPDP 방법보다 성능이 우수하다는 것을 보여준다. 이전의 연구에서는 탐지 확률이 낮거나 오보 가능성이 높았으나 우리의 기법은 높은 PD와 낮은 PF를 제공하면서 높은 전체 성능을 보였다. 또한 WPDP와 비슷한 성능을 제공하였다.

퍼지 RBFNNs와 증분형 주성분 분석법으로 실현된 숫자 인식 시스템의 설계 (Design of Digit Recognition System Realized with the Aid of Fuzzy RBFNNs and Incremental-PCA)

  • 김봉연;오성권;김진율
    • 한국지능시스템학회논문지
    • /
    • 제26권1호
    • /
    • pp.56-63
    • /
    • 2016
  • 본 연구에서는 퍼지 RBFNNs과 증분형 주성분 분석법으로 실현된 숫자인식 시스템의 설계를 소개한다. 주성분 분석법은 차원축소를 위해 사용되는 알고리즘으로 학습데이터의 차원 수가 고차원이거나 데이터의 양이 많을 때 특징 추출을 위한 많은 계산 시간을 필요로 한다. 따라서 고차원 데이터의 효율적인 차원축소와 점진적인 학습을 위해 증분형 주성분분석법을 적용하는 방법을 제안한다. 방사형 기저함수 신경회로망의 구조는 조건부, 결론부, 추론부의 3가지 기능적 모듈로서 구분이 가능하다. 조건부에서는 FCM 클러스터링 알고리즘의 도움으로 실현된 퍼지 클러스터링의 사용으로 입력 공간을 분할한다. 또한 가우시안 함수 대신 FCM(Fuzzy C-Means)클러스터링 알고리즘의 멤버쉽 값을 사용함으로써 입력 데이터의 특성을 좀 더 잘 반영할 수 있도록 개선하였으며, 결론부에서 연결가중치는 상수항에서 일차식과 이차식, 그리고 변형된 이차식과 같은 다항식의 형태로 확장하여 사용한다. 실험 결과는 공인 숫자 데이터인 MNIST 필기체 숫자 데이터를 사용하여 제안된 숫자 인식 시스템의 효율성을 다른 연구와의 비교를 통해 입증한다.

N-그램 증강 나이브 베이스 알고리즘과 일반화된 k-절단 서픽스트리를 이용한 확장가능하고 정확한 침입 탐지 기법 (Scalable and Accurate Intrusion Detection using n-Gram Augmented Naive Bayes and Generalized k-Truncated Suffix Tree)

  • 강대기;황기현
    • 한국정보통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.805-812
    • /
    • 2009
  • 기계 학습을 응용한 많은 침입 탐지 시스템들에서 n-그램 접근 방법이 사용되고 있다. 그러나, n-그램 접근방법은 확장이 어렵고, 주어진 시퀀스에서 획득한 n-그램들이 서로 겹치는 문제들을 가지고 있다. 본 연구에서는 이러한 문제들을 해결하기 위해, 일반화된 k-절단 서픽스트리 (generalized k-truncated suffix tree; k-TST) 기반의 n-그램 증강 나이브 베이스 (n-gram augmented naive Bayes) 알고리즘을 침입 시퀀스의 분류에 적용하여 보았다. 제 안된 시스템의 성능을 평가하기 위해 n-그램 특징들을 사용하는 일반 나이브 베이스 (naive Bayes) 알고리즘과 서포트 벡터 머신(support vector machines) 알고리즘과 본 연구에서 제안한 n-그램 증강 나이브 베이스 알고리즘을 호스트 기반 침입 탐지 벤치마크 데이터와 비교하였다. 공개된 호스트 기반 침입 탐지 벤치마크 데이터인 뉴 멕시코 대학(University of New Mexico)의 벤치마크 데이터에 적용해 본 결과에 따르면, n-그램 증강 방법이, n-그램이 나이브 베이스에 직접 적용되는 경우(예: n-그램 특징을 사용하는 일반 나이브 베이스), 생기는 독립성 가정에 대한 위배의 문제도 해결하면서, 동시에 더 정확한 침입 탐지기를 생성해냄을 알 수 있었다.

TPI 응용에 의한 산악지형 분류기법의 적용을 위한 scale factor 선정방법 개발 (An Objective Procedure to Decide the Scale Factors for Applying Land-form Classification Methodology Using TPI)

  • 장광민;송정은;박경;정주상
    • 한국산림과학회지
    • /
    • 제98권6호
    • /
    • pp.639-645
    • /
    • 2009
  • 이 연구는 우리나라의 산악형 산림지대의 지형을 분류하기 위한 방안으로 TPI를 응용하기 위해 수행되었다. 이 방법을 적용하기 위해서는 지형특성에 적합한 기초분석단위로 scale factor들이 요구된다. 따라서 본 연구에서는 scale factor를 결정하기 위한 객관적으로 결정하기 위한 방안을 제시하였다. 즉, 산지의 기복 패턴를 반영하기 위한 scale factor를 결정하기 위해 음영기복도를 이용하여 제작된 지형성장곡선으로부터 기울기변화도 곡선을 작성하였다. 기울기변화도 곡선을 이용하여 기복의 변화량이 최대가 되는 지점을 찾고, 그 극대점에서의 grid 크기를 찾아 지형 분류를 위한 scale factor로 결정하였다. scale factor 결정 알고리즘의 적용성을 검토하기 위하여 지형특성이 다른 3곳의 산악지대에 대한 scale factor를 도출하고, 지형분류를 수행하였다. 이 방법에 따른 연구결과 scale factor는 지형기복이 심할수록 짧아지는 경향이 있음을 보여주었다. 또한 TPI를 이용하여 분류한 능선과 계곡의 수가 종단면도를 이용한 방법과 유사하게 나타났고, scale factor의 크기가 대상지역의 능선 간 평균거리와 일치하는 경향이 있음을 보여주었다.

이질적 이미지의 딥러닝 분석을 위한 적대적 학습기반 이미지 보정 방법론 (Adversarial Learning-Based Image Correction Methodology for Deep Learning Analysis of Heterogeneous Images)

  • 김준우;김남규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.457-464
    • /
    • 2021
  • 빅데이터 시대의 도래는 데이터에서 스스로 규칙을 배우는 딥러닝의 비약적인 발전을 가능하게 하였으며, 특히 CNN 알고리즘이 거둔 성과는 모델의 구조를 넘어 소스 데이터 자체를 조정하는 수준에 이르렀다. 하지만 기존의 이미지 처리 방법은 이미지 데이터 자체를 다룰 뿐, 해당 이미지가 생성된 이질적 환경을 충분히 고려하지 않았다. 이질적 환경에서 촬영된 이미지는 동일한 정보임에도 촬영 환경에 따라 각 이미지의 특징(Feature)이 상이하게 표현될 수 있다. 이는 각 이미지가 갖는 상이한 환경 정보뿐 아니라 이미지 고유의 정보조차 서로 상이한 특징으로 표현되며, 이로 인해 이들 이미지 정보는 서로 잡음(Noise)으로 작용해 모델의 분석 성능을 저해할 수 있음을 의미한다. 따라서 본 논문은 이질적 환경에서 생성된 이미지 데이터들을 동시에 사용하는 앤드-투-앤드(End-To-End) 구조의 적대적 학습(Adversarial Learning) 기반의 이미지 색 항상성 모델 성능 향상 방안을 제안한다. 구체적으로 제안 방법론은 이미지가 촬영된 환경인 도메인을 예측하는 '도메인 분류기'와 조명 값을 예측하는 '조명 예측기'의 상호 작용으로 동작하며, 도메인 분류의 성능을 떨어뜨리는 방향의 학습을 통해 도메인 특성을 제거한다. 제안 방법론의 성능을 평가하기 위해 이질적 환경에서 촬영된 이미지 데이터 셋 7,022장에 대한 색 항상성 실험을 수행한 결과, 제안 방법론이 기존 방법론에 비해 Angular Error 측면에서 우수한 성능을 나타냄을 확인하였다.

연속파 레이다를 활용한 이진 신경망 기반 사람 식별 및 동작 분류 시스템 설계 및 구현 (Design and Implementation of BNN based Human Identification and Motion Classification System Using CW Radar)

  • 김경민;김성진;남궁호정;정윤호
    • 한국항행학회논문지
    • /
    • 제26권4호
    • /
    • pp.211-218
    • /
    • 2022
  • 연속파 레이다는 카메라나 라이다와 같은 센서에 비해서 안정성과 정확성이 보장된다는 장점이 있다. 또한 이진 신경망은 다른 딥러닝 기술에 비해서 메모리 사용량과 연산 복잡도를 크게 줄일 수 있는 특징이 있다. 따라서 본 논문에서는 연속파 레이다와 이진 신경망 기반 사람 식별 및 동작 분류 시스템을 제안한다. 연속파 레이다 센서를 통해 수신된 신호를 단시간 푸리에 변환함으로써 스펙트로그램을 생성한다. 이 스펙트로그램을 기반으로 레이다를 향해 사람이 다가오는지 감지하는 알고리즘을 제안한다. 더불어, 최적화된 이진 신경망 모델을 설계하여 사람 식별 90.0%, 동작 분류 98.3%의 우수한 정확도를 지원할 수 있음을 확인하였다. 이진 신경망 연산을 가속하기 위해 FPGA (field programmable gate array)를 이용하여 이진 신경망 연산에 대한 하드웨어 가속기를 설계하였다. 해당 가속기는 1,030개의 로직, 836개의 레지스터, 334.906 Kbit의 블록 메모리를 사용하여 구현되었고, 추론에서 결과 전송까지 총 연산 시간이 6 ms로 실시간 동작이 가능함을 확인하였다.

신경회로망을 이용한 SVC 계통의 안정화에 관한 연구 (A Study on the SVC System Stabilization Using a Neural Network)

  • 정형환;허동렬;김상효
    • 조명전기설비학회논문지
    • /
    • 제14권3호
    • /
    • pp.49-58
    • /
    • 2000
  • 본 논문에서는 FACTS(Flexible AC Transnission System)로 분류되는 여라 기기중 기존의 전압제어 및 무효 전력보상기들이 가지고 있는 바속응성과 불연속성 문제를 해결해줄 수 있는 정지형 무효전력 보상가(Static Var Compensator : SVC)를 포함한 전력계통에 신경회로망 제어기를 적용하여 안정화에 관하여 연구하였다. 제안된 신경회로망 제어기는 오차와 오차변화량을 입력하는 오차역전과 학습 알고리즘을 사용하고, 학습시간올 단축하기 위해 모멘텀 방법을 사용하였다. 제안된 방법의 강인섬을 입증하기 위해 중부하시 및 정상부하시에 초기 전력을 변동시킨 경우와 초기에 회천자각을 변동시킨 경우에 대하여 시스렘의 회전자각, 각속도 편차 특성 및 단 자전압의 동특성을 고찰하여 다른 시스템보다 응답특성이 우수합을 보였다.

  • PDF

쿼드트리 기반의 다중 스케일 블록 영역 검출기를 통한 구간적 영상 잡음 제거 기법 (Piecewise Image Denoising with Multi-scale Block Region Detector based on Quadtree Structure)

  • 이지현;정제창
    • 방송공학회논문지
    • /
    • 제20권4호
    • /
    • pp.521-532
    • /
    • 2015
  • 본 논문은 효과적인 열화영상의 복원을 위해 쿼드트리 구조를 갖는 다중-스케일 블록 지역적 이진 패턴 기반의 영역검출기를 제시하고, 이를 통한 구간적 잡음 제거 기법을 제안한다. 구간적 잡음 제거 기법은 영상 내 전체 화소를 일정한 블록 단위의 영역으로 나누어 화소의 변화량에 따라 검출을 수행하는 다중-스케일 블록 영역 검출기를 쿼드트리 형태로 제시하고 검출된 영역 특성에 맞게 영상분석을 진행한다. 처리되는 영역들은 강한 변화량을 갖는 영역, 약한 변화량을 갖는 영역, 평탄한 영역의 세 가지로 분류되며 차례로 주성분분석, 양방향 필터, 구조-텍스쳐 영상 분해의 기법들이 잡음제거를 위해 적용된다. 객관적 실험결과를 통하여 기존 알고리즘들 보다 제안하는 구간적 잡음 제거 기법이 최대 신호-대-잡음비 측면에서 이득을 가지며, 주관적 화질 비교를 통해 세부정보들이 최대한 보존되어 있음과 동시에 평탄한 영역에 대해서도 왜곡이 거의 없는 향상된 복원영상이 얻어지는 것을 확인할 수 있었다.

적응적으로 특징과 채널을 선택하는 sEMG 신호기반 보행단계 인식기법 (sEMG Signal based Gait Phase Recognition Method for Selecting Features and Channels Adaptively)

  • 류재환;김덕환
    • 재활복지공학회논문지
    • /
    • 제7권2호
    • /
    • pp.19-26
    • /
    • 2013
  • 본 논문에서는 다수의 특징 값 중에서 적합한 특징 및 채널을 선택하는 sEMG 신호기반 보행단계 인식기법을 제안한다. 제안하는 방법은 sEMG 신호 기반 분류기를 이용하여 하지 절단 환자의 동력의족을 제어하며, 적응적으로 특징 및 채널들을 선택하여 임베디드 시스템의 신호처리과정에서 발생하는 오버헤드를 감소시킨다. 또한 피험자의 보행 습관에 따라 근육 발달도가 다르다는 특성을 이용하여 피험자의 보행단계에 따라 사용 빈도가 높은 근육과 특징 추출 알고리즘을 선택함으로서 정확도를 향상시킨다. 실험 결과 피험자마다 인식율이 높은 근육이 다르다는 것을 발견하였다. 또한 모든 특징들과 채널들을 이용하는 기존 방법의 경우 50%의 평균정확도를 보인 반면에 제안한 방법은 91%의 평균정확도를 보였다. 따라서 소수의 발달된 근육과 이에 맞는 특징을 사용한 sEMG기반 보행단계인식 방법이 하지절단환자의 동력의족을 제어하는 데 적용될 수 있음을 확인하였다.

  • PDF

APEX 기반 침입 탐지 시스템 개발에 관한 연구 : (주)제이드 솔류션과 공동 연구 (A Study on Developing Intrusion Detection System Using APEX : A Collaborative Research Project with Jade Solution Company)

  • 김병주
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.38-45
    • /
    • 2017
  • 정보 처리 기술의 컴퓨터 및 네트워크 의존도가 심화됨에 따라 컴퓨터 및 네트워크에 대한 침입 사례가 갈수록 증가하고 있다. 시스템 및 네트워크의 침입을 방지하기 위하여 호스트와 네트워크 기반 침입차단시스템(방화벽 등)이 개발되었지만 기존의 규칙 기반의 침입차단시스템만으로는 보안 관리에 많은 어려움이 있다. 이러한 이유로 인해 시스템 및 네트워크 자원에 대한 침입을 실시간으로 탐지하고 이에 대처하는 침입탐지시스템 개발에 대한 요구가 증가하고 있다. 본 논문에서는 비선형 자료에도 적용 가능하며 수렴성이 보장된 실시간 특징 추출 방법으로 APEX 알고리즘과 점증적 LS-SVM 분류기를 결합한 실시간 침입탐지 시스템을 개발하였다. 일반적으로 실시간 처리 방식은 메모리의 효율성이 좋고 학습 자료의 추가를 허용하는 장점이 있지만 일괄처리 방식에 비해 정확도가 떨어지는 단점이 있다. 따라서 제안한 시스템은 정확도 면에서도 일괄 처리 방식과 비슷한 성능을 나타내고 있어 상용화가 가능한 시스템이다.