• 제목/요약/키워드: 이상점 가중치 조정

검색결과 6건 처리시간 0.022초

이상점 영향력 축소를 통한 무응답 대체법 (A Multiple Imputation for Reducing Outlier Effect)

  • 김만겸;신기일
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1229-1241
    • /
    • 2014
  • 이상점과 무응답이 동시에 존재하는 경우에는 무응답만 있는 경우에 비해 무응답 대체의 성능이 떨어지게 된다. 이러한 경우에는 먼저 이상점을 탐지하고, 탐지된 이상점의 영향력을 축소한 후 무응답 대체를 실시하여야 한다. 본 논문에서는 이상점의 영향력을 축소하여 무응답 대체법의 성능을 향상시키는 방법을 연구하였다. 이를 위해 She and Owen (2011)이 제안한 이상점 탐지법을 살펴보았고, 탐지된 이상점의 영향력을 줄이기 위한 방법으로 흔히 사용되는 가중치 조정법과 이상점 대체법을 살펴보았다. 또한 이상점 처리 방법을 적용한 무응답 대체법을 살펴보았으며 모의실험과 사례분석을 통하여 이상점 영향력 축소 효과를 살펴보았다.

로지스틱회귀모형의 로버스트 추정을 위한 알고리즘 (Algorithm for the Robust Estimation in Logistic Regression)

  • 김부용;강명욱;최미애
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.551-559
    • /
    • 2007
  • 로지스틱회귀에서 일반적으로 사용되는 최대우도추정법은 이상점에 대해 로버스트 하지 않다. 따라서 본 논문에서는 로지스틱회귀모형의 로버스트 추정을 위한 알고리즘을 제안하고자 한다. 이 알고리즘은 V-마스크 형태의 경계기준에 의해 나쁜 지렛점과 수직이상점을 식별하고, 식별 결과를 바탕으로 이상점의 영향력을 감소시키기 위한 효과적인 방안을 모색한다. 이상점의 영향력 감소는 가중치와 조정치를 적절히 선정함으로 가능하며, 그 결과 붕괴점이 높은 추정치를 얻게 된다. 제안된 알고리즘을 다양한 자료에 적용하여 정분류율을 측정하여 비교하였는데, 새로운 알고리즘이 최대우도추정보다 정확한 분류를 해 주는 것으로 평가되었다.

멀티모달 딥 러닝 기반 이상 상황 탐지 방법론 (Anomaly Detection Methodology Based on Multimodal Deep Learning)

  • 이동훈;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.101-125
    • /
    • 2022
  • 최근 컴퓨팅 기술의 발전과 클라우드 환경의 개선에 따라 딥 러닝 기술이 발전하게 되었으며, 다양한 분야에 딥 러닝을 적용하려는 시도가 많아지고 있다. 대표적인 예로 정상적인 데이터에서 벗어나는 값이나 패턴을 식별하는 기법인 이상 탐지가 있으며, 이상 탐지의 대표적 유형인 점 이상, 집단적 이상, 맥락적 이중 특히 전반적인 상황을 파악해야 하는 맥락적 이상을 탐지하는 것은 매우 어려운 것으로 알려져 있다. 일반적으로 이미지 데이터의 이상 상황 탐지는 대용량 데이터로 학습된 사전학습 모델을 사용하여 이루어진다. 하지만 이러한 사전학습 모델은 이미지의 객체 클래스 분류에 초점을 두어 생성되었기 때문에, 다양한 객체들이 만들어내는 복잡한 상황을 탐지해야 하는 이상 상황 탐지에 그대로 적용되기에는 한계가 있다. 이에 본 연구에서는 객체 클래스 분류를 학습한 사전학습 모델을 기반으로 이미지 캡셔닝 학습을 추가적으로 수행하여, 객체 파악뿐만 아니라 객체들이 만들어내는 상황까지 이해해야 하는 이상 상황 탐지에 적절한 2 단계 사전학습 모델 구축 방법론을 제안한다. 구체적으로 제안 방법론은 ImageNet 데이터로 클래스 분류를 학습한 사전학습 모델을 이미지 캡셔닝 모델에 전이하고, 이미지가 나타내는 상황을 설명한 캡션을 입력 데이터로 사용하여 학습을 진행한다. 이후 이미지와 캡션을 통해 상황 특질을 학습한 가중치를 추출하고 이에 대한 미세 조정을 수행하여 이상 상황 탐지 모델을 생성한다. 제안 방법론의 성능을 평가하기 위해 직접 구축한 데이터 셋인 상황 이미지 400장에 대해 이상 탐지 실험을 수행하였으며, 실험 결과 제안 방법론이 기존의 단순 사전학습 모델에 비해 이상 상황 탐지 정확도와 F1-score 측면에서 우수한 성능을 나타냄을 확인하였다.

CRITIC 방법을 이용한 형상유사도 기반의 면 객체 자동매칭 방법 (A new method for automatic areal feature matching based on shape similarity using CRITIC method)

  • 김지영;허용;김대성;유기윤
    • 한국측량학회지
    • /
    • 제29권2호
    • /
    • pp.113-121
    • /
    • 2011
  • 본 연구에서는 기하학적 정보를 바탕으로 생성된 유사도 기반의 면 객체 자동매칭 방법을 제안하였다. 이를 위하여 서로 다른 공간자료에서 교차되는 후보 매칭 쌍을 추출하고, CRITIC방법을 이용하여 연동 기준별 가중치를 자동으로 생성하여 선형조합으로 추출된 후보매칭 쌍 간의 형상유사도를 측정하였다. 이때, 훈련자료에서 조정된 상자도표의 특이점 탐색을 적용하여 도출된 임계값 이상인 경우가 매칭 쌍으로 탐색된다. 제안된 방법을 이종의 공간자료(수지치도 2.0과 도로명주소 기본도)의 일부지역에 적용한 결과, 시각적으로 형상이 유사하고 교차되는 면적이 넓은 건물객체가 매칭 되었으며, 통계적으로 F-Measure가 0.932로 높게 나타났다.

폭풍해일 침수예상도 검증을 위한 형상유사도 분석 : 형상기준 (Shape Similarity Analysis for Verification of Hazard Map for Storm Surge : Shape Criterion)

  • 김영인;김동현;이승오
    • 한국방재안전학회논문집
    • /
    • 제12권3호
    • /
    • pp.13-24
    • /
    • 2019
  • 실시간 재난위험도 예측 모델인 SIND 모델의 정확도 확인 및 검증을 위해 다양한 형상유사도 개념을 적용하였다. 기하학적 방법론 중에서 가장 널리 이용되는 CRITIC 기법은 침수예상도와 같은 복잡한 지형 형상에 적용하기에는 분명한 한계점을 보여서 본 연구에서는 복잡한 전파특성의 형상을 평가할 수 있는 RCCI와 TF 등과 같은 형상인자를 추가하여 수정된 CRITIC 기법을 제시하였다. 본 연구에서 제안된 형상유사도 평가 방법을 폭풍해일의 침수예상도에 적용하여 검토한 결과, 면 객체 쌍들을 수동으로 정 매칭쌍과 오 매칭쌍으로 구분하였으며, 각 형상 인자들, 위치기준, 면적기준, 형상 기준의 가중치들을 변화시켜가며 각 매칭쌍의 형상유사도를 산정하였다. 본 연구에서 제안된 방법론과 산정된 가중치를 참고자료인 침수예상도의 지도 객체와 목표자료인 SIND 모델결과의 객체에 적용한 결과, 정 매칭쌍은 약 90%가 형상유사도 0.5 이상의 값을 가졌고, 오 매칭쌍은 약 70%가 0.5 미만으로 나타났다. 향후 다수의 객체가 하나의 객체와 대응되는 점을 보완 조정한다면 정 매칭쌍의 형상유사도는 전체적으로 증가하고 오 매칭쌍의 형상유사도는 감소할 것이라 판단된다.

소프트웨어 개발 프로젝트 성능의 최적화를 위한 Opportunity Tree 모델 설계 (Opportunity Tree Framework Design For Optimization of Software Development Project Performance)

  • 송기원;이경환
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.417-428
    • /
    • 2005
  • 오늘날 IT 조직들은 시장확보와 재정이득 측면에서 비전을 가지고 프로젝트를 수행한다. QCD관점에서 그 수god능력을 향상시켜 나가는 것이 비전을 실현하는 목표이다. 따라서 조직들은 이러한 목표를 달성하기 위해 프로세스 개선을 통해 QCD관점의 목표를 달성하고자 많은 노력을 하고 있는 실정이다. TBM, Ford, GE와 같은 대형 회사들도 컴퓨터에 의한 업무개선 효과보다는 IT를 이용한 비즈니스 프로세스 리엔지니어링을 통해 80퍼센트 이상의 성과를 거두고 있다. 그러나, 목표달성을 위해서는 프로젝트를 수행한 데이터를 수집하고 분석하여 관리해야 하지만 소프트웨어의 비가시성 특성으로 인한 정량적인 측정이 어려운 것이 사실이며 이로 인해 프로세스 변경으로 인한 효과와 효율을 가시적인 확인하기 힘들고 효과적인 프로세스 개선전략을 도출하기 어렵다. 본 논문에서는 조직의 외부적인 효과와 내부적인 효율(품질, 납기일, 공정, 재사용)에 초점을 맞추어 프로젝트 성능을 측정하고 분석한다. 측정된 프로젝트 성능 점수를 기반으로 프로젝트 성능의 최적화를 위한 OT(Opportunity Tree) 모델을 설계하였다. 설계 과정으로서 먼저 프로젝트에서 공통적인 요소(Meta data)를 도출하여 정량적 GQM(Goal-Question-Metric) 설문서에 의해서 분석한다. 정량적 GQM 설문서로부터 얻은 데이터를 가지고, 프로젝트 성능 모델을 설계하고 조직의 영역별 성능 점수를 계산한다. 계산된 영역별 성능 점수와 모든 스테이크 홀더들(조직의 최고 경영자(CEO), 중간 관리자, 개발자, 투자가, 고객)로부터 받아낸 비전 가중치를 통합하여 보정된 값을 구한다. 이를 통해 개선을 위한 경로(Route for Improvement)를 제시하고 최적화된 개선 방법을 제공한다. 기존 소프트웨어 프로세스 개선 방법은 '프로세스 구분'에큰 뛰어난 효과를 보였으나, 프로세스를 프로젝트에 대응시켜서 전략을 수립하고 조직적으로 관리하는 구조적 기능이 미비하였다. 이러한 문제점에 대하여 본 논문에서 제시한 OT 모델은 해결책을 제시해 주고 있다. OT 모델의 효과는 조직의 목표에 맞게 최적화된 개선 방법을 제공하는 것이고, 제공된 방법을 사용하여 수행할 경우 프로젝트를 개선할 때 생기는 리스크를 감소시킬 수 있다는 점이다. 또한, 정성적인 설문서를 통해 모든 스테이크 홀더들에게 중요도를 입력받아 계산되었으므로, 개선 방법에 대한 만족도를 높여 줄 수 있다. OT 활용에 의해서 품질, 납기, 공정, 재사용을 조정하여 시장 확장과 재무성과를 최적화시킬 수 있다.