• 제목/요약/키워드: 다변량 통계기법

검색결과 132건 처리시간 0.024초

유전자 알고리즘을 활용한 인공신경망 모형 최적입력변수의 선정: 부도예측 모형을 중심으로 (Using GA based Input Selection Method for Artificial Neural Network Modeling Application to Bankruptcy Prediction)

  • 홍승현;신경식
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.227-249
    • /
    • 2003
  • 부도예측모형의 구축은 은행 등 금융기관이 신용평가시스템 혹은 심사역 의사결정지원시스템을 구축하는데 중요한 기반이 된다. 많은 선행연구들에서는 기업의 부도예측을 위하여 전통적으로 다변량 판별분석이나 로짓분석과 같은 통계기법이 많이 사용되었으나, 최근에는 많은 연구들에 의해 그 우수성이 보고되고 있는 인공신경망, 귀납적 학습방법 등 인공지능 기법이 부도예측분야에 많이 응용되고 있다. 일반적으로 인공신경망 기법을 응용한 부도예측모형에서는 기업의 재무정보 및 비재무 정보를 입력변수로 주고 기업의 부도여부를 출력변수로 설정하여 학습을 통해 이들의 관계를 추출하고 있다. 그러므로 입력변수의 선정은 모형의 정확도에 커다란 영향을 미치며, 입력변수가 잘못 선정된 경우 예측 정확도는 현저히 낮아진다. 그러나 최적의 입력변수군을 선정하는 문제는 매우 어려운 과제 중 하나로, 선행 연구들에서는 주로 전문가의 의견을 반영하거나, 문헌을 통해 도출, 혹은 통계적 기법을 활용하여 입력변수를 선정하는 것이 일반적이었다. 본 연구에서는 많은 선행 연구에서 모형구축에의 한계점으로 명시하고 있는 입력변수 선정의 문제에 대해 유전자 알고리즘을 이용한 최적화를 통하여 입력 변수군을 도출하는 방법론을 제시하였고, 이 방법론이 다른 통계기법이나 전문가에 의한 변수 선택 방법론에 비해 우수함을 인공신경망 모형에 적용한 결과를 비교함으로 보여 주었으며, 이들간의 예측력의 차이가 유의함을 통계적 검증하였다. 모형의 실험을 위하여 총 528개사의 재무정보를 활용하였는데, 이는 1995년부터 1997년까지 3년간 부도가 발생한 일반법인 제조업체 중 외감법인 이상 264개사와 동수의 건전기업의 재무 데이터로 구성하였다. 기업이 도산에 이르기까지 많은 변인들이 다양하게 작용하게 된다. 그러나 이러한 변인들을 모두 모형에 적용하는 것은 비효율적이며, 인공신경망 모형에서 과다 입력변수를 사용하는 경우 수렴과 일반화 모두에 바람직하지 않은 결과가 나타난다. 따라서 적절한 입력변수군의 선택은 인공신경망 모형의 효율성과 성능을 향상시키게 되고, 이는 부도 예측율의 향상으로 이어질 수 있다. 이에 인공신경망 모형을 위한 최적의 입력변수군을 선정하고자 한 본 연구는 결국 기업의 부도 예측율을 높이기 위한 방법론을 제시했다는 점에 그 의의가 있다.

  • PDF

이미지 검색을 위한 색상 성분 분석 (Color Component Analysis For Image Retrieval)

  • 최영관;최철;박장춘
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.403-410
    • /
    • 2004
  • 최근 의료 영상 분석(Medical Image Analysis)이나 영상 검색(Image Retrieval)을 위한 전처리(Preprocessing) 단계로 영상 분석(Image Analysis)에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 영상 검색에서 색상 성분(Color Component)의 활용 방법을 제안하고자 한다. 이미지를 검색하기 위해 색상 성분을 기반으로 하고, 색상(Color)을 분석하기 위한 기법으로 CLCM(Color Level Co-occurrence Matrix)과 통계적 기법을 이용하고 있다. CLCM은 기하학적 회전 변환(Geometric Rotate Transform)을 통해서 색상 성분을 3차원 공간상에 투영(Projection)하여 공간 관계(Spatial Relationship)로부터 나타나는 분포를 해석하는 방법으로, 본 논문에서 제안하는 주제이다. CLCM은 색상 모델에서 만들어지는 2차원 히스토그램을 지칭하며 색상 모델의 기하학적인 회전 변환을 통해서 생성된다. 그리고 이를 분석하기 위한 방법으로 통계 기법을 활용하고 있다. CLCM과 유사하게 2차원 분포도를 사용하는 GLCM(Gray Level Co-occurrence Matrix)[1]과 불변 모멘트(Invariant Moment)[2,3] 같은 알고리즘은 2차원적인 데이터를 해석하기 위하여 기본적인 통계 기법을 활용하고 있다. 하지만 GLCM과 불변 모멘트가 각각의 도메인에 최적화되어 있다 하더라도 공간 좌표상에 존재하는 불규칙적인 데이터를 완전히 해석할 수는 없다. 즉 GLCM과 불변 모멘트는 기초 통계 기법만을 사용하고 있기 때문에 추출된 특징들의 신뢰성이 낮다는 것이다. 본 논문에서는 이러한 단점을 보완하여 공간 관계를 해석함과 동시에 데이터의 가중치를 해석하기 위해 전형적인 다변량 통계에서 사용하는 주성분 분석(Principal Component Analysis)[4,5]을 이용하고 있다. 그리고 데이터의 정확도를 높이기 위해서 3차원 공간상에 색상 성분을 투영하여 이를 회전시키면서 데이터의 특성을 다각도에서 추출하는 방법을 제시한다.

인공신경망 기반 호텔 부도예측모형 개발 (A Development of Hotel Bankruptcy Prediction Model on Artificial Neural Network)

  • 최성주;이상원
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.125-133
    • /
    • 2014
  • 본 논문에서는 호텔경영을 위한 인공신경망 기반의 부도예측 모형을 개발한다. 부도예측 모형은 호텔에서 관리하는 사업장의 사업성과 이터를 바탕으로 부도 가능성을 평가하여 호텔 전체사업의 부도를 예측하는 특징을 가진다. 부도예측을 위한 전통적인 통계기법은 다변량 판별분석이나 로짓분석 등이 있는데, 본연구는 이들보다 우수한 예측정확성을 갖는 인공신경망 기법을 이용해서 연구를 진행하였다. 이를 위해 우선 우수기업 100개와 도산기업 100개를 선정하여 전체 실험데이터를 구성하고, 뉴로쉘이라는 인공신경망 도구를 이용하여 부도예측모형을 구성하였다. 본 모형 설계와 실험은 서비스드 레지던스 호텔에서 관리하는 각 브랜치의 부도예측과 재무건전성을 판단하기에 효율성이 높아 호텔 경영의 의사결정에 많은 도움이 될 것이다.

다목적 다변량 자료분석을 위한 변수선택 (Variable Selection for Multi-Purpose Multivariate Data Analysis)

  • 허명회;임용빈;이용구
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.141-149
    • /
    • 2008
  • 다변량 자료분석에서 최근의 추세는 관측개체의 수 n이 커지는 외에 변수의 수 p가 큰사례들이 많아지고 있다는 것이다. n개 개체 각각에서 획득된 p개 변수들 $X_1$, $X_2$, $\ldots$, $X_p$ 가운데는 이름이나 개념적으로는 구분이 가능하지 만 실제로 거의 중복이 되는 변수들이 있을 수 있는데, 이들 변수들이 모두 분석에 포함되면 여러 문제가 유발될 수 있다. 예컨대 주성분 분석이나 인자분석에서는 중복 변수들이 주축(主軸, principal axis) 결정에, 관측개체 군집 화에서는 개체간 거리 산출에 왜곡된 영향을 줄 수 있다. 또한 목적변수가 지정된 지도학습(supervised learning)에서 설명변수들의 중복성은 추정모형의 안정성을 해치는 결과를 초래한다. 실제 자료 분석에서는 한 자료 세트가 여러 기법으로 탐색되고 다수의 모형이 추출되므로 변수세트를 최대한 절약적(parsimonious)으로 구성할 필요가 있다. 본 연구의 목적은 $X_1$, $X_2$, $\ldots$, $X_p$ 중에서 필요한 변수들은 선적하고 불필요한 변수들은 제거함으로써 주어진 변수세트를 보다 적은 크기의 변수세트로 대치하는 방법을 제시하는 데 있다. 제안 방법을 몇 개의 수치적 사례에 적용해 봄으로써 선적 변수와 제거변수간 관계의 시각화, 회귀모형에서의 유용성, 범주형 자료분석에서의 활용 등에 대해 논의 하고자 한다.

Data-driven modeling of the anaerobic wastewater treatment plant using robust adaptive dynamic PLS method

  • Lee Hae Woo;Lee Min Woo;Joung Jea Youl;Park Jong Moon
    • 한국생물공학회:학술대회논문집
    • /
    • 한국생물공학회 2004년도 학술대회지
    • /
    • pp.47-84
    • /
    • 2004
  • Principal Component Analysis나 Partial Least Squares와 같은 다변량 통계 기법은 변수간의 correlation structure로부터 공정의 variance를 설명할 수 있는 latent variable를 얻고 이를 이용하여 공정을 효과적으로 modeling할 수 있는 방법으로 최근 들어 많은 관심을 얻고 있다. 하지만 PLS는 공정이 stationary state에 있다고 가정하기 때문에, 생물학적 공정의 non-stationary and time-varying behavior를 설명하기에 부적절하다. 본 논문에서는 PLS 알고리즘의 혐기성 폐수처리 공정에의 적용에 있어, 이와 같은 문제를 해결하기 위해서 adaptive PLS 알고리즘을 사용함으로써 변화하는 공정의 특성에 대응하여 모델을 update하는 방법을 이용하였다. 하지만 실시간 데이터로부터 adaptive PLS 방법을 적용하는 데에는 많은 어려움이 존재하며, 특히 outlier나 abnormal disturbance에 모델이 부적절하게 adaptation하는 문제가 발생할 수 있다. 따라서 이의 해결을 위해 adaptive PLS를 적용하는데 있어 robustness를 향상시키기 위해 monitoring index를 이용하여 abnormal data에 weight를 주고 안정적인 모델의 update가 가능하게 하는 방법을 제안하였으며, 이를 적용하여 성공적으로 혐기성 폐수처리 공정의 Output을 예측하고 효과적으로 공정을 모니터링할 수 있었다. 만들어진 PLS 모델은 산업폐수를 처리하기 위한 industrial plan에서 측정된 실제 데이터에 적용하여 그 효용성을 입증하였으며, 그 결과는 mechanistic model을 적용하기 힘든 실공정에 비교적 쉽게 implementation할 수 있는 장점이 있다.

  • PDF

주성분 분석을 이용한 문서 주제어 추출 (Document Thematic words Extraction using Principal Component Analysis)

  • 이창범;김민수;이기호;이귀상;박혁로
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.747-754
    • /
    • 2002
  • 본 논문에서는 문서의 내용을 대표할 수 있는 주제어를 추출하는데 있어 다변량 통계 분석 기법 중의 하나인 주성분 분석을 이용하는 모델을 제안한다. 제안한 모델은 고유값과 고유벡터를 이용하여 문서 자체내의 단어의 흐름을 파악한 후 주제어를 추출하는 방법이다. 제안한 모델을 문서 요약에 적용하여 그 성능을 평가하였다. 신문기사를 대상으로 실험한 결과 제안한 모델이 단어의 출현 빈도를 고려하는 방법, 시소러스를 이용하는 방법 모두에 비해 더 좋은 성능을 보였다. 제안한 모델은 정보검색, 정보추출, 문서요약 등에 이용될 수 있으리라 기대된다.

Box-Cox 대비변환을 이용한 구성비율자료의 주성분분석 (Principal Component Analysis of Compositional Data using Box-Cox Contrast Transformation)

  • 최병진;김기영
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.137-148
    • /
    • 2001
  • 비율을 나타내는 요소들로 이루어진 구성비율자료는 각 행들의 합이 1이 되는 제약을 가지고 있어 통계적으로 다루기가 쉽지 않다. 더구나 자료의 구조가 선형적인 형태를 보이지 않는 특성을 가지기 때문에 주성분분석과 같은 선형적인 다변량기법들을 구성비율자료에 적용을 할 때 잘못된 해석과 추론이 이루어질 가능성이 있다. 본 논문에서는 구성비율자료의 주성분분석에서 기존의 방법들이 가지는 문제점을 해결하기 위해 Box-Cox 대비변환(Box-Cox contrast transformation)을 이용한 새로운 형태의 분석방법을 제시한다. 그리고 실제자료의 분석과 모의실험을 통해서 Aitchison(1983)이 제시한 방법과 수행능력을 비교하고자 한다.

  • PDF

표본조사에서 크론바흐알파값을 사용한 신뢰성 (Reliability using Cronbach alpha in sample survey)

  • 박현아
    • 응용통계연구
    • /
    • 제34권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 사회조사에서 추상적 개념은 타당성과 신뢰성이 보장된 측정도구를 사용하여야 한다. 그와 같은 측정도구에 의해 도출된 관측점수는 타당한 관측점수와 편향된 관측점수와 오차로 나눌 수 있으며 편향된 값의 유무가 타당성과 연관되어 있으며 오차값의 유무가 신뢰성과 연관되어 있다. 측정도구가 타당도 및 신뢰도를 만족하는 지를 보기 위한 기법들이 많이 존재한다. 예를 들면 요인분석을 통한 구성타당도, 크론바흐 알파 값에 의한 내적일치도 등을 들 수 있다. 본 연구에서 크론바흐알파값의 계산은 표본을 통해서 도출되는 데 복잡한 표본설계와 무응답이 발생했을 때 크론바흐알파값의 추정법에 대해 살펴본다. 제안된 기법에 대한 모의실험으로 다변량정규분포를 사용하여 기존의 여러 다른 크론바흐알파값의 추정기법과 비교분석한다.

습부공정에 전하 중화개념의 도입 (Charge Neutralization of Wet-end)

  • 신종호;김동호;류정용;김용환;송봉근
    • 한국펄프종이공학회:학술대회논문집
    • /
    • 한국펄프종이공학회 2001년도 추계학술발표논문집
    • /
    • pp.59-59
    • /
    • 2001
  • 전보에서 발표한 바와 같이, 대상 라이너지 제조공장의 습부 운전조건이 지극히 악화되어 있으며 초지 시스템이 지종교체 등의 충격에 전혀 완충작용을 못하는 이유로 는 용수를 포함한 지료의 전하특성을 조절해주지 못하기 때문인 것으로 판단되었다. 특 히 양이온성 고분자로서 유일하게 사용하고 있는 보류향상제가 적절히 작용하지 못하 기 때문에 보류도가 저하되고, 제품내에 보류되지 못한 다량의 미세분이 백수 중에 존 재함으로서 결과적으로 지료의 전기적 특성을 더욱 악화시키는 악순환이 되풀이 되는 것으로 판단되었다. 이와 같이 강하게 음으로 하전된 지료의 전기적 특성을 조절하기 위해서는 양이온성 고분자의 사용량을 증가시키거나 고분자의 전하밀도 또는 분자량을 변화시켜 보는 것이 일반적인 습부첨가제 사용방법이라고 할 수 있다. 따라서 대상 습부공정의 조업조건을 호전시키기 위해서는 적절한 보류향상시스 템의 적용이 가장 시급한 현안이라고 판단되어 선규 보류제의 현장적용시험을 수행한 결과, 백수의 COD와 미세분이 격감하고 탈수성이 향상되어 습부공정의 운전조건이 호 전됨을 관측할 수 있었다. 그러나 2달 이상에 걸친 보류제 현장적용시험 기간 중에 생 산된 라이너지의 제반 물성들은 별다른 변화를 관측할 수 없었다. 이는 적용된 보류제 의 상당 부분이 계내의 미세분과 작용하여 소모되기 때문으로 판단되었다. 본 연구에서는 보류제의 투입 이전에 보류제와는 상대적으로 저분자량과 고 전 하밀도를 가진 고분자 전해질 4종을 사용하여 라이너지 지료의 전하를 중화시키고자 하였으며, 이러한 공정으로 생산된 라이너지의 물성변화를 관측하였다. 물성으로는 파 열강도, 압축강도, 습윤인장강도 및 염료 고착능력 등을 살펴보았다.시아노에틸화한 PYA가 안정된 분자구조를 유지하고 있음을 확인할 수 있었다. 시아노에틸화한 PYA용액의 점탄성 평가를 위하여 storage modulus와 loss modulus 를 분석하였다. 일반적 유변특성 평가 결과 PYA용액은 shear-thinning, pseudoplastic 한 특성을 나타내어 표면사이즈 공정에서의 적용 가능성을 확인할 수 있었다. 사용하는 통계기법 중의 하나인 주성분회귀분석을 실시하였다. 주성분 분석은 여러 개의 반응변수에 대하여 얻어진 다변량 자료의 다차원적인 변 수들을 축소, 요약하는 차원의 단순화와 더불어 서로 상관되어있는 반응변수들 상호간 의 복잡한 구조를 분석하는 기법이다. 본 발표에서는 공정 자료를 활용하여 인공신경망 과 주성분분석을 통해 공정 트러블의 발생에 영향 하는 인자들을 보다 현실적으로 추 정하고, 그 대책을 모색함으로써 이를 최소화할 수 있는 방안을 소개하고자 한다.금 빛 용사 둥과 같은 표면처리를 할 경우임의 소재 표면에 도금 및 용 사에 용이한 재료를 오버레이용접시킨 후 표면처리를 함으로써 보다 고품질의 표면층을 얻기위한 시도가 이루어지고 있다. 따라서 국내, 외의 오버레이 용접기술의 적용현황 및 대표적인 적용사례, 오버레이 용접기술 및 용접재료의 개발현황 둥을 중심으로 살펴봄으로서 아직 국내에서는 널리 알려지지 않은 본 기 술의 활용을 넓이고자 한다. within minimum time from beginning of the shutdown.및 12.36%, $101{\sim}200$일의 경우 12.78% 및 12.44%, 201일 이상의 경우 13.17% 및 11.30%로 201일 이상의 유기의 경우에만 대조구와 삭

  • PDF

질적변수에 대한 계량화를 통한 사면붕괴 예측모형 (Prediction Modeling through Quantification for Qualitative Variables)

  • 나종화;유혜경;남은미;조완섭
    • 한국산업정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.281-288
    • /
    • 2009
  • 본 논문에서는 수량화 방법과 AHP(Analytic Hierarchy Process) 기법을 사용하여 산사태 발생에 대한 통계적 예측모형을 구축하는데 목적이 있다. 수량화(Quantification) 방법은 질적변수에 수량을 부여하는 통계적 방법으로, 기 조사된 자료에 기반하여 분석을 수행하는 방법이다. 본 논문에서는 서구의 다변량분석 기법인 정준상관분석의 결과를 토대로 수량화 과정을 구체적으로 제안한다. 데이터에 기반한 수량화 방법과는 팔리 AHP 기법은 일종의 다기준 의사결정을 위해 사용되는 기법으로, 설문자료에 기반한 분석법이다. 실제자료에 대한 분석으로 산사태 발생여부를 측정한 자료(한국지질자원연구원 제공)와 전문가 설문을 통해 수집된 자료를 이용하였다. 이들 자료에 대해 수량화 분석과 AHP분석을 통해 산사태 발생여부를 예측할 수 있는 두 종류의 평가표와 함께 로지스틱 회귀를 통한 통계적 예측모형을 개발하였으며, 두 모형간의 성능비교와 안정성 평가를 수행하였다.