• 제목/요약/키워드: 다중 주성분 분석

검색결과 103건 처리시간 0.032초

로버스트추정에 바탕을 둔 주성분로지스틱회귀 (Principal Components Logistic Regression based on Robust Estimation)

  • 김부용;강명욱;장혜원
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.531-539
    • /
    • 2009
  • 로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.

표준화 주성분 분석(Standardized PCA)을 이용한 LANDSAT 위성자료 분류 (Classification)의 정확도 향상 (LANDSAT remotely sensed data's Classification accuracy improvement Using Standardized Principal Components Analysis)

  • 장훈;윤완석
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.151-156
    • /
    • 2003
  • 본 연구에서는 2000년 LANDSAT ETM+ 수도권 영상을 이용하여 도시지역 10개소, 식생지역 10개소를 선정해서 각각에 대해 표준화 주성분 분석을 적용하여 두 지역간의 고유벡터 매트릭스를 비교ㆍ분석해보았다. 도시 지역과 식생 지역각각에 대해 총 6개의 주성분이 생성되었으며 PC-2와 고유벡터 부호가 변한 밴드(band2, band7)를 RGB로 조합하여 수원지역을 대상으로 분류(Classification)한 결과의 정확도를 분광서명 분별 분석(Signature Separability Analysis)통해 얻은 밴드조합(band1, band3, band5) 영상의 분류결과와 비교해 보았다. 수원지역 2000년 IKONOS 영상의 다중분광 밴드(4×4m)와 전정색 밴드(1x1m)를 융합한 영상이 분류 정확도를 판단하는 기준으로 사용되었다. 비교결과 분류 전체 정확도는 각각 87.7%, 77.29% Khat 지수는 0.83, 0.68로 나타나 PC-2, 밴드2, 밴드7을 이용했을 때 분류 정확도를 높일 수 있다는 결과를 얻었다.

  • PDF

감 재배지 간 과실 품질 차이에 관계한 기온요인 분석 (Analysis of Air Temperature Factors Related to Difference of Fruit Characteristics According to Cultivating Areas of Persimmon (Diospyros kaki Thunb.))

  • 김호철;전경수;김태춘
    • 생물환경조절학회지
    • /
    • 제17권2호
    • /
    • pp.124-131
    • /
    • 2008
  • 본 연구에서는 감 재배지 간 과실 특성 차이에 관계한 기온 요인을 분석하고자 8개 단감 '부유' 재배지의 16개 기온요인과 과실 특성을 조사하여 주성분 및 다중회귀 분석을 실시하였다. 16개 기온요인 중 제1주성분은 12개 요인으로 이중 연 평균최저기온, 10월 평균기온, 연 평균최저극온, 생육기 평균기온의 영향력이 아주 높았다. 그리고 제2주성분은 4개 요인으로 4월에서 7월까지의 월 평균기온이었고 5월과 6월 평균기온의 영향력이 높았다. 이에 제2주성분까지 누적기여율은 91.4%로 재배지 간 기온 차이에 관여하는 기온 요인을 분석하는 데에는 충분하였다. 8개 재배지 중 5 재배지은 주요 기온요인이나 그 영향력에서 뚜렷한 차이를 나타내었다. 기온요인과 과실 특성 간 다중회귀분석에서 과고는 생육기 평균기온($X_8$) 겨울철 적산온도($X_6$) 영향을 뚜렷이 받으며 회귀식 $Y=150.55-5.375X_8+0.014X_6$을 나타내었고, 이 회귀식에 대하여 생육기 평균최저기온($X_9$), 적산온도($X_5$), 8월 평균기온($X_{12}$) 등이 영향을 주었다. 과경은 생육기 평균기온($X_8$, 부의 상관), 과육갈반정도는 생육기 평균최저기온($X_9$, 정의 상관), 과피색 $a^*$값은 연 평균최저기온($X_2$, 정의 상관)의 영향을 받는 것으로 나타났다.

객체 분할 및 주성분 분석 기반의 얼굴 추적 인식 알고리즘 (Face Tracking and Recognition Algorithm Based On Object Segmentation and PCA)

  • 성민영;김대현;이응주
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.435-440
    • /
    • 2003
  • 본 논문에서는 실시간 출입통제시스템에 적용이 가긍한 복잡한 배경에서의 다중 얼굴 영역 검출과 추적을 통한 얼굴 인식 알고리즘을 제안하였다. 제안된 알고리즘에서는 배경영상과 입력된 연속적인 프레임간의 차영상을 적용함으로써 물체의 움직임을 감지한 후. IISI컬러 좌표모델을 이용하여 얼굴의 1차 후보 영역을 검출하고, 잡음제거를 위해 모폴로지 연산을 수행하였다 또한 Line Projection을 이용한 객체 분할법(Object Segmentation)으로 객체를 분할함으로써 다중 얼굴 영역을 추출하였다. 또한 추출된 얼굴영역에서 눈 영역 검출을 통해 각각의 얼굴 영역들을 검증하였으며 검증된 얼굴들의 최외각 4개의 좌표를 이용하여 얼굴 추적율을 높였다. 마지막으로 얼굴 인식은 추출된 얼굴 영역으로부터 주성분 분석(PCA : Principle Component Analysis)방법을 이용함으로써 97~98%의 높은 인식율을 보였다.

  • PDF

효과음 자막 생성을 위한 딥러닝 기반의 다중 사운드 분류 (A Multiclass Sound Classification Model based on Deep Learning for Subtitles Production of Sound Effect)

  • 정현영;김규미;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.397-400
    • /
    • 2020
  • 본 논문은 영화에 나오는 효과음을 자막으로 생성해주는 자동자막생성을 제안하며, 그의 첫 단계로써 다중 사운드 분류 모델을 제안하였다. 고양이, 강아지, 사람의 음성을 분류하기 위해 사운드 데이터의 특정벡터를 추출한 뒤, 4가지의 기계학습에 적용한 결과 최적모델로 딥러닝이 선정되었다. 전처리 과정 중 주성분 분석의 유무에 따라 정확도는 81.3%와 33.3%로 확연한 차이가 있었으며, 이는 복잡한 특징을 가지는 사운드를 분류하는데 있어 주성분 분석과 넓고 깊은 형태의 신경망이 보다 개선된 분류성과를 가져온 것으로 생각된다.

다차원 데이터의 군집분석을 위한 차원축소 방법: 주성분분석 및 요인분석 비교 (A dimensional reduction method in cluster analysis for multidimensional data: principal component analysis and factor analysis comparison)

  • 홍준호;오민지;조용빈;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.135-143
    • /
    • 2020
  • 본 논문은 농식품 소비자패널 데이터에서 소비자의 유형을 나눌 때에 변수간 연관성이 많은 장바구니 분석에서 전처리 방법과 차원축소의 방법을 제안한다. 군집분석은 다변량 자료에서 관측 개체를 몇 개의 군집으로 나눌 때 널리 사용되는 분석기법이다. 하지만 여러 개의 변수가 연관성을 가진 경우에는 차원축소를 통한 군집분석이 더 효과적일 수 있다. 본 논문은 1,987 가구를 대상으로 조사한 식품소비 데이터를 K-means 방법을 사용하여 군집화하였으며, 군집을 나누기 위해 17개의 변수를 선정하였고, 17개의 다중공선성 문제와 군집을 나누기 위한 차원축소의 방법 중 주성분 분석과 요인분석을 비교하였다. 본 연구에서는 주성분분석과 요인분석 모두 2개의 차원으로 축소하였으며 주성분분석에서는 3개의 군집으로 나뉘었지만 분석하고자 하였던 소비 패턴에 대한 군집의 특성이 잘 나타나지 않았으며 요인분석에서는 분석가가 보고자 하는 소비 패턴의 특징이 잘 나타났다.

서울시의 카셰어링 이용도에 대한 지역적 요인특성분석 (Study on the Local Factors Affecting Availability of Car-Sharing in Seoul)

  • 최현수;박준태
    • 한국철도학회논문집
    • /
    • 제17권5호
    • /
    • pp.381-389
    • /
    • 2014
  • 본 연구에서는 카셰어링 이용특성자료 및 GIS를 활용하여 입지특성과 관련된 도시 및 지역적 사회경제에 대한 DB를 구축하였으며, 주성분분석을 통해 잠재변수를 도출하였고 요인점수를 활용한 다중회귀분석을 통해 영향변수의 의미를 살펴보았다. 업무중심지역 및 역세권지역, 대학교인근지역에서의 활용도가 높았고, 특히, 전기차에 대한 관심도가 카셰어링 이용도에 영향을 미치는 것으로 파악되었다. 한편, 금융기관이 집중된 지역 및 영업용(택시)차량 배치가 많은 지역에서는 이용이 제한되는 것으로 나타났다. 본 연구의 분석결과는 향후의 카셰어링의 활성화와 공유가치에 대한 시민의 이해도 향상과 소유에서 공유로의 발상전환에 기여할 것으로 판단된다.

교통문화지수 영향요인에 의한 유형화와 영향정도에 관한 연구 (A Study on Patterning and Grading by the Impact of Traffic Culture Index)

  • 정철우;정헌영;고상선
    • 한국항해항만학회지
    • /
    • 제30권1호
    • /
    • pp.35-43
    • /
    • 2006
  • 본 연구는 교통안전공단과 사단법인 녹색교통운동이 공동으로 개발한 교통문화지수와 관련한 2002년과 2003년의 전국 81개 도시 자료를 토대로 통계적 분석을 행하여 이들 대상도시들을 유형화하고, 집단별 영향요인에 근거하여 교통사고 예방대책들을 제시하고자 하였다. 먼저 교통문화지수와 영향요인들에 대한 주성분분석 결과로는 4개의 주성분으로 구분 지울 수 있었으며, 도시 특성별 최적 집단 수는 4개가 적합한 것으로 나타났다. 또한 이들 유형화된 집단별 교통문화지수에의 영향요인을 단계별 다중 회귀분석법을 이용하여 분석한 결과, 4개 집단 모두 높은 설명력을 갖는 회귀모형을 구축할 수 있었다. 이에 따라 각 집단별 교통사고 예방대책들을 구체적으로 제시할 수 있었으며, 아울러 투자된 시설이 얼마나 교통사고 예방에 효과적이었는가를 분석할 필요성이 있음을 향후의 연구 과제로 제시하였다.

주성분 분석을 이용한 목재 건조 중 발생하는 음향방출 신호의 해석 및 분류 (Analysis and Classification of Acoustic Emission Signals During Wood Drying Using the Principal Component Analysis)

  • 강호양;김기복
    • 비파괴검사학회지
    • /
    • 제23권3호
    • /
    • pp.254-262
    • /
    • 2003
  • 본 연구는 목재(참나무 판목 판재) 건조 중 발생하는 음향방출 신호에 대하여 목재 내 수분이동에 의한 신호와 표면할열에 의한 신호를 해석하고 분류하기 위하여 수행되었다. AE 신호의 특징값들에 대한 상관분석을 실시하여 상호의존성이 높은 변수를 제거한 후 주성분 분석을 실시하였다. AE 변수들을 독립변수로 한 분류기와 주성분들을 독립변수로 한 분류기에 대하여 분류성능을 비교하였다. 목재 건조 시 발생하는 표면할열과 수분이동에 따른 AE 신호 파형을 분석한 결과 대체적으로 표면할열에 의한 신호가 최대진폭이 크며 상승시간이 팎고 상대적으로 고주파의 신호인 것으로 분석되었다. 다중 회귀분석모델을 이용하여 수분이동에 의한 신호와 표면할열에 의한 신호를 분류할 수 있는 분류기를 개발하고 평가한 결과 개별 AE 변수들을 독립변수로 하는 분류기 보다 주성분들을 독립변수로 하는 분류기의 분류성능이 양호한 것으로 나타났다.

호우 위험도 평가를 이용한 피해예측 (Damage Prediction Using Heavy Rain Risk Assessment)

  • 김종성;최창현;이종소;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.154-154
    • /
    • 2017
  • 전 세계적인 기후변동과 기후변화의 영향으로 대규모 인명 및 재산피해를 유발하는 자연재난의 빈도와 강도가 증가하고 있다. 이렇게 변화하는 상황에서 효율적인 대책을 수립하기 위해서는 재해에 노출된 특성을 지역적 특성과 함께 고려하여 지역별로 재해에 위험한 정도를 평가하는 것이 선행되어지고, 재난 피해 발생전에 피해 지역 및 범위를 예측하는 것이 필요하다고 판단된다. 따라서 본 연구에서는 국내 자연재난 피해의 65% 이상을 차지하는 호우피해를 대상으로 PSR(Pressure-State-Response) 구조를 이용하여 호우피해위험지수(Heavy rain Damage Risk Index, HDRI)를 제안하여 호우 위험도를 평가하고자하였다. 또한 도출된 지역별 위험등급에 따른 호우피해 예측함수를 개발하여 재해발생 전에 개략적인 피해의 범위를 예측하고자 하였다. 먼저 지역별 호우 위험도 평가를 위해 압력지표, 현상지표, 대책지표를 구축하고, 주성분분석을 이용하여 평가지표를 결정하였다. 결정된 평가지표를 동일한 가중치를 부여하여 호우피해위험지수를 도출하였다. 분석결과, 경기도 31개 지자체 중에서 가장 안전한 1등급인 지자체는 15개의 지자체로 나타났으며, 2등급인 지자체는 7개, 3등급인 지자체는 9개로 분류되었다. 지자체별 호우 위험도 등급에 따라서 재해기간별 총강우량, 재해일수, 선행강우량(1~5일), 지속시간별 최대강우량(1~24시간) 등의 자료를 설명변수로 구축하였고, 다중회귀모형과 주성분분석을 활용하여 예측함수를 개발하였다. 등급별 호우피해 예측함수는 N-RMSE가 12~18%로 호우피해를 적절하게 예측하는 것으로 평가되었다. 본 연구를 통해 지자체별 호우피해위험도 등급을 파악 할 수 있으며, 평가된 호우피해위험도 등급별로 호우피해 예측함수 개발을 통해 사전에 호우피해 발생 및 규모를 파악할 수 있게 되었다. 따라서 본 연구의 결과는 각 지자체 및 관련 부처에서 효과적인 방재체계를 수립하는데 있어 기초자료로 활용될 수 있을 것으로 판단된다.

  • PDF