• 제목/요약/키워드: 분류분석

검색결과 16,013건 처리시간 0.041초

정교한 데이터 분류를 위한 방법론의 고찰 (A Review of the Methodology for Sophisticated Data Classification)

  • 김승재;김성환
    • 통합자연과학논문집
    • /
    • 제14권1호
    • /
    • pp.27-34
    • /
    • 2021
  • 전 세계적으로 인공지능(AI)을 구현하려는 움직임이 많아지고 있다. AI구현에서는 많은 양의 데이터, 목적에 맞는 데이터의 분류 등 데이터의 중요성을 뺄 수 없다. 이러한 데이터를 생성하고 가공하는 기술에는 사물인터넷(IOT)과 빅데이터(Big-data) 분석이 있으며 4차 산업을 이끌어 가는 원동력이라 할 수 있다. 또한 이러한 기술은 국가와 개인 차원에서 많이 활용되고 있으며, 특히나 특정분야에 집결되는 데이터를 기준으로 빅데이터 분석에 활용함으로써 새로운 모델을 발견하고, 그 모델로 새로운 값을 추론하고 예측함으로써 미래비전을 제시하려는 시도가 많아지고 있는 추세이다. 데이터 분석을 통한 결론은 데이터가 가지고 있는 정보의 정확성에 따라 많은 변화를 가져올 수 있으며, 그 변화에 따라 잘못된 결과를 발생시킬 수도 있다. 이렇듯 데이터의 분석은 데이터가 가지는 정보 또는 분석 목적에 맞는 데이터 분류가 매우 중요하다는 것을 알 수 있다. 또한 빅데이터 분석결과 통계량의 신뢰성과 정교함을 얻기 위해서는 각 변수의 의미와 변수들 간의 상관관계, 다중공선성 등을 고려하여 분석해야 한다. 즉, 빅데이터 분석에 앞서 분석목적에 맞도록 데이터의 분류가 잘 이루어지도록 해야 한다. 이에 본 고찰에서는 AI기술을 구현하는 머신러닝(machine learning, ML) 기법에 속하는 분류분석(classification analysis, CA) 중 의사결정트리(decision tree, DT)기법, 랜덤포레스트(random forest, RF)기법, 선형분류분석(linear discriminant analysis, LDA), 이차선형분류분석(quadratic discriminant analysis, QDA)을 이용하여 데이터를 분류한 후 데이터의 분류정도를 평가함으로써 데이터의 분류 분석률 향상을 위한 방안을 모색하려 한다.

Utilizing UPCA and SPCA in Unsupervised Classification Using Landsat TM data

  • Lee, Byung-Gul;Kang, In-Joon
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2003년도 춘계학술발표회 논문집
    • /
    • pp.167-170
    • /
    • 2003
  • 본 연구는 무감독영상해석(Unsupervised Classification)에서 주성분 분석법(Principal Component Analysis)의 응용성을 연구하기 위하여, 주성분 분석법을 K-means, ISODATA 두가지 무감독분류법에 적용하였다. 적용대상지역은 제주도이다. 본 연구에서 주성분 분석 방법중에서 비정규형 주성분 분석방법 (Unstandardized PCA)과 정규형 주성분 분석방법(Standardized PCA) 두가지 경우로 나누어서 각각 연구하였다. 이를 위하여 제주도의 Landsat TM영상과 국토연구원에서 조사한 제주도 식생분류 조사자료와 현장조사 자료 그리고 1/25,000 수치지도를 이용하였다. 그리고 분석된 자료의 정확도를 평가하기 위하여 오차행렬(Error Matrix)을 도입하여 계산하였다. 우선 비정규형 주성분 분석법으로 구한 주성분 영상과 Landsat TM 원래 영상을 오차행렬을 이용하여 제주도의 식생 분류에 각각 적용하였다. 그 결과, K-means 무감독분류법에서는 Landsat TM 자료를 직접 이용한 경우에는 바다와 육상의 분류가 잘 되지 않았으며, 또한 전반적인 영상분류결과가 관측치와 많은 차이를 보였다. 그러나, 주성분 분석법으로 계산된 주성분 영상으로 K-means방법으로 분류 한 결과는 관측치와 잘 일치를 하였다. ISODATA의 경우, Landsat TM 원래영상을 계산하면, K-means으로 분류한 결과보다는 좋은 값을 나타냈으나, 주성분 분석법으로 구한 영상의 계산결과와 비교하면, 주성분 영상으로 구한 분류결과의 정확도가 약 15%정도 높게 나타났다. 정규형 주성분 분석법의 경우를 보면 K-means에서는 Landsat TM원래 자료보다 우수한 결과를 보여주었으나, 비정규형 주성분 분석법으로 계산된 결과보다는 정확도가 다소 떨어지는 단점이 있었고, ISODATA의 경우도 Landsat TM원래 자료보다 약 7%정도의 높은 정확도를 보였으나, 비정규형 영상보다는 약8%정도 낮은 정확도를 보였다. 본 연구에서 주성분 분석법으로 계산된 결과에서 주목되는 것은, 주성분 분석법으로 구한 주성분 영상은 분류방법(K-means, ISODATA, artificial neural networks)에 따라 분류된 결과값이 비슷하게 나타난 반면, Landsat TM원래 자료는 분류방법에 따라 결과값이 많은 차이를 보여 주었다. 그리고 주성분 분석 방법 중에서도 비정규형 주성분 분석법(Unstandardized PCA)이 정규형 주성분 분석법(Standardized PCA)보다 영상분석에서 더 좋은 결과를 보여주는 것으로 나타났다.

  • PDF

인식론적 주제관점에서의 지식과 문헌분류의 전개고 (A study on Developmental History of the Knowledge and Library Classification in the Epistemological Subject Viewpoint)

  • 김옥희;남태우
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.133-136
    • /
    • 1994
  • 문헌분류는 지식분류에 입각하여야 한다는 분류의 제 1원리를 규명하기 위하여 지식의 발전과정을 인식론적 관점에서 규명하였으며. 이를 바탕으로 지식분류가 문헌분류에 어떤 영향력을 미쳤는가를 규명하였다. 주제개념은 주관적 관념론, 객관적 관념론, 실용주의, 유물론으로 구분하여 분석하였다. 분석된 결과에 따라 지식분류가 어떤 인식의 관점에서 전개되어 왔는지를 인도의 베다분류법을 비롯하여 플라톤과 아리스토텔레스의 지식분류에서부터 현재의 머시럼, 브리테니카 3의 분류법에 이르기까지 분석하였다. 또한 이를 토대로 지식분류와 문헌분류의 상보성을 규명하였다.

  • PDF

IPAA의 효과를 고찰하기 위한 분류분석방법들의 비교연구

  • 이승연;이은주;최호식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.291-298
    • /
    • 2005
  • 지속성 외래 복막투석은 말기 신부전 환자들에게 널리 시행하는 신 대체 요법으로, 복막투석 환자에게서 주된 합병증으로 일어나는 단백질-열량 영양실조를 치료하기 위하여 아미노산을 복강 내로 주입하는 치료방법이다. 이현석 등(2004)의 연구에서는 아미노산 복막 투석액(IPAA)이 영양실조 환자들에게 실제로 영양상태에 미치는 영향을 평가하기 위하여 지속성 외래 복막투석 환자 43명을 12개월 동안 3개월 주기로 관측하여 얻어낸 반복측정자료를 바탕으로 IPAA의 효과 여부에 따라 반응군과 비반응군을 분류하였다. 본 논문에서는 이러한 두 그룹을 효과적으로 분류할 수 있는 분류기준변수들을 찾아내고 이 분류기준변수의 값을 바탕으로 새로운 환자에게 IPAA의 투여 여부를 진단할 수 있는 여러 분류방법들을 고찰하여 비교 연구하였다. 모수적인 방법으로 선형판별분석, 이차판별분석 및 로지스틱 판별분석을 소개하고 비모수적인 방법으로 support vector machine(SVM)을 소개하여 분류분석의 결과를 비교하여 두 그룹을 최소한의 오류로 분류하는 방법을 제안하였다.

  • PDF

인터넷 쇼핑몰에서의 동적 고객 분류에 관한 연구

  • 임승재;서의호;정태수
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2003년도 춘계공동학술대회
    • /
    • pp.586-590
    • /
    • 2003
  • 고객 분류는 고객관계관리(CRM)의 한 부분으로서 기업에게 이익을 주는 고객의 속성과 구매패턴을 분석함으로써 목표 고객을 결정하는 것을 의미한다. 현재까지 고객 분류에 관한 연구는 특정한 시점에서 고객의 속성과 구매 패턴을 분석함으로써 이루어졌다. 그러나 인터넷 쇼핑몰과 같은 동적인 환경에 있어서 기존의 정적인 분석방법은 시간에 따라 지속적으로 변하는 고객의 행동 변화를 찾아내고, 예측하는데 적합하지 않다. 본 논문에서는 Decision Tree, ANOVA 분석, ARIMA 모형을 사용하여, 특정한 시점에서의 고객 분류뿐만 아니라 미래 시점에서의 고객 분류를 예측하고 패턴을 분석하는 동적인 고객 분류 방법을 제안한다. 동적인 고객 분류를 통해 인터넷 쇼핑몰 기업은 효율적인 마케팅 전략을 작성하여 기업의 이익을 증진시킬 수 있다.

  • PDF

자동 분류 기법과 지적 구조 분석 기법을 융합한 처방적 분석 시스템 구현 방안 연구 (Prescriptive Analytics System Design Fusing Automatic Classification Method and Intellectual Structure Analysis Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.33-57
    • /
    • 2017
  • 본 연구는 새로운 분석법으로 떠오르는 처방적 분석 기법을 소개하고, 이를 분류 기반의 시스템에 효율적으로 적용하는 방안을 제시하는 것을 목적으로 한다. 처방적 분석 기법은 분석의 결과를 제시함과 동시에 최적화된 결과가 나오기까지의 과정 및 다른 선택지까지 제공한다. 새로운 개념의 분석 기법을 도입함으로써 문헌 분류를 기반으로 하는 응용 시스템을 더욱 쉽게 최적화하고 효율적으로 운영하는 방안을 제시하였다. 최적화의 과정을 시뮬레이션하기 위해, 대용량의 학술문헌을 수집하고 기준 분류 체계에 따라 자동 분류를 실시하였다. 처방적 분석 개념을 적용하는 과정에서 대용량의 문헌 분류를 위한 동적 자동 분류 기법과 학문 분야의 지적 구조 분석 기법을 동시에 활용하였다. 실험의 결과로 효과적으로 서비스 분류 체계를 수정하고 재적용할 수 있는 몇 가지 최적화 시나리오를 효율적으로 도출할 수 있음을 보여 주었다.

CPC 기반 특허 기술 분류 분석 모델 (A Study of CPC-based Technology Classification Analysis Model of Patents)

  • 채수현;김장원
    • 한국콘텐츠학회논문지
    • /
    • 제18권10호
    • /
    • pp.443-452
    • /
    • 2018
  • 최근 들어 지식재산권의 확보는 기업의 기술 경쟁력 확보를 위해 점점 더 중요하게 되었다. 특히 특허는 기업의 핵심 기술 및 요소 기술을 포함하고 있기 때문에 특허 분석을 통한 기업 가치 측정 및 경쟁 기술 분야 분석 등의 연구가 활발히 진행되고 있다. 국제특허분류(IPC)를 기반으로 다양한 특허 분석 연구가 진행되었으나, IPC는 최신의 기술 분야를 포함하고 있지 않으며 기술의 상세 분류가 충분하지 않아 기술 분류 정확도가 낮아진다. 이를 보완하기 위해 최신의 기술 분야를 포함하고 상세한 기술 분류를 위한 선진특허분류(CPC)가 개발되었으나 이러한 특징을 고려한 특허 분석 연구가 아직 미흡하다. 본 논문에서는 CPC의 상세 분류체계를 이용하여 특허에 포함된 기술 분류 분석 모델을 제안한다. CPC의 상세 분류체계간의 연관관계 중요도 및 효율성을 고려하여 출원인의 특허를 분석하여 핵심 기술 분류 추출을 통해 기존 IPC 기반의 방법보다 상세하고 정확한 분석이 가능하다. 기존의 IPC 기반의 특허 분석 방법과 비교 평가를 통해 제안 모델이 출원인의 핵심 기술 분류를 분석함에 있어 더 좋은 성능을 보임을 확인하였다.

정준상관분석을 이용한 원격탐사 수치화상 분류기법의 개발 : 무감독분류기법과 정준상관분석의 통합 알고리즘 (Development of Classification Method for the Remote Sensing Digital Image Using Canonical Correlation Analysis)

  • 김용일;김동현;박민호
    • 대한공간정보학회지
    • /
    • 제4권2호
    • /
    • pp.181-193
    • /
    • 1996
  • 본 연구는 원격탐사의 수치화상분류에 적용된 바 없는 정준상관분석(Canonical Correlation Analysis)기법을 무감독분류한 위성화상데이터에 적용하여 토지피복분류하는 새로운 방법을 개발하는 것을 목적으로 한다. 개발된 분류기법은 기존의 분류기법인 최대우도분류기법에 비해 분류기준용 표본데이터 선정이 용이함을 알 수 있었다. 즉, 정준상관분석에 의한 분류결과는 분류기준용 표본데이터의 선정위치에 거의 영향을 받지 않는다. 또한 무감독분류 후 정준상관분석에 의해 결정된 각 군집의 토지피복은 최대우도분류를 위한 사전정보로 활용정보로 활용가능하다. 동일한 분류기준용 표본데이터 사용시, 무감독분류 후 정준상관분석에 의한 분류가 최대우도분류보다 분류정확도가 우수하였다. 이상과 같은 결과로 판단해 볼 때 연구에서는 시도된 분류기법은 원격탐사의 분류기법 분야에서 실용화 될 수 있으며, 나아가서는 GIS 데이터베이스 구축에 중요한 역학을 할 수 있을 것이다.

  • PDF

다각적이고 계층적인 트래픽 분석을 위한 트래픽 분류 체계에 관한 연구 (Study on Classification Scheme for Multilateral and Hierarchical Traffic Identification)

  • 윤성호;안현민;김명섭
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권2호
    • /
    • pp.47-56
    • /
    • 2014
  • 인터넷을 기반으로 하는 다양한 서비스 및 응용의 등장과 무선 디바이스의 보급은 인터넷 트래픽을 급격하게 증가시켰다. 인터넷 트래픽의 급격한 증가로 한정적인 네트워크 자원을 효율적으로 사용하기 위해 인터넷 트래픽 분석의 중요성이 증가하고 있다. 하지만 트래픽 분석 방법론에 비해 분석 결과를 체계적으로 관리하는 분류 체계에 대한 연구는 이루어지지 않고 있다. 본 논문에서는 다각적이고 계층적인 트래픽 분석을 위한 분류 체계를 제안한다. 제안하는 분류 체계는 서비스, 응용, 프로토콜, 기준의 4가지 분류 기준을 사용하여 다각적으로 분석이 가능하며, 분류 기준 별로 계층화된 속성을 가지고 있어 결과의 통합화 및 세분화가 가능하다. 논문에서는 제안한 분류 기준을 실제 학내 망에 적용하여 분석함으로 분류 체계의 장점과 활용성을 보인다.

도로터널에서의 암반분류 및 통계분석 사례 (A Case Study for Rock Mass Classification and Statistical Analysis in Roadway Tunnel)

  • 김영근;유동욱
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 2003년도 암반역학위원회 학술세미나 논문집
    • /
    • pp.197-226
    • /
    • 2003
  • 터널에서의 암반분류/평가는 지보패턴결정 뿐만 아니라 터널주변암반에 대한 설계정 수 산정 및 물성평가에 있어 매우 중요한 요소라 할 수 있다. 암반분류는 각 국 또는 주요기관 별로 분류안이 만들어져 있으며, 현재 RMR분류와 Q-system이 가장 활발히 적용되고 있다. 본고에서는 터널설계단계에서 암반분류방법과 지보패턴결정과정을 고찰하였으며, 도로설계를 중심으로 적용현황을 분석하였다 또한 실제 터널시공시 암반분류 및 판정에 의한 지보공 변경사례를 살펴봄으로서 시공 중 암반분류/평가의 의미를 고찰하였다. 그리고 암반분류요소들에 대한 통계분석을 실시하여 암반분류요소들간의 상관관계를 분석하였다.

  • PDF