• 제목/요약/키워드: 데이터 분석론

검색결과 1,383건 처리시간 0.028초

의사결정나무를 활용한 비즈니스 프로세스 분석 (A Method for Business Process Analysis by using Decision Tree)

  • 허원창;배혜림;김승;정기성
    • 한국전자거래학회지
    • /
    • 제13권3호
    • /
    • pp.51-66
    • /
    • 2008
  • 기업이 비즈니스 프로세스의 중요성을 인식하게 되면서 비즈니스 프로세스 관리시스템에 대한 관심이 높아졌다. 그러나 전통적으로 BPMS는 업무프로세스의 모형화 및 실행에 그 초점이 맞추어져 있어, 상대적으로 프로세스 관리의 궁극적인 목적인 프로세스 효율성 제고나 더 나아가 프로세스를 혁신하는 데에는 큰 기여를 하지 못하였다. BPMS는 일반적으로 방대한 량의 이력 데이터를 남기게 되는데, 이에는 프로세스의 실행과 관련된 다양한 의미있는 정보나 규칙들이 숨어있다. 본 연구는 데이터마이닝 기법을 활용하여 프로세스 이력 데이터를 분석하는 체계적인 방법론을 제시한다. 제시된 방법론은 프로세스 분석을 위한 데이터 모형, 분석절차, 그리고 시스템 프레임워크를 포함한다. 또한 그 유용성을 검증하기 위하여, 시뮬레이션 데이터를 이용한 실험결과를 제시한다.

  • PDF

동물 행동권 분석 방법론 고찰 - 괭이갈매기 사례 분석과 시사점 - (Animal Home Range Estimators - A Review and a Case Study -)

  • 이성주;이후승
    • 한국환경생태학회지
    • /
    • 제36권2호
    • /
    • pp.202-216
    • /
    • 2022
  • 동물은 그들의 필요와 외부 자극, 그리고 주변 환경에 반응하면서 특정한 행동과 이동 패턴을 보이며, 생활하면서 대부분의 시간을 보내는 일정한 영역인 행동권(home range)을 가진다. 행동권은 종의 존속과 보전에 매우 중요한 영역이라는 점에 기반하여 해외에서는 행동권 추정 방법론 개발 및 정책 반영이 활발하게 이루어지고 있다. 원격 추적 기술의 발전으로 인해 좌표간 시간 간격이 줄어들며 정밀해진 동물 추적 데이터는 기존 행동권 방법론에 한계점을 드러냈으며, 이를 보완하기 위하여 다양한 새로운 방법론이 개발되었다. 하지만, 국내 행동권 연구는 아직 더딘 편이며 새로이 개발된 방법론 도입도 전혀 이루어지지 않고 있는 상태이다. 본 연구는 동물 행동권의 더욱 정확한 추정을 목적으로 꾸준하게 개발되어 온 해외의 방법론들을 정리 및 소개하여 국내 도입을 촉진하는 것을 목적으로 한다. 먼저 크게 기하학적 그리고 통계적 추정 방법론으로 나눈 후 좌표들이 독립일 때와 자기상관성이 존재할 때의 경우로 나누어 총 7가지의 행동권 추정 방법론을 비교 및 고찰하였다. 실제 전남 신안군 불무기도에 번식하는 괭이갈매기(Larus Crassirostris)의 6월 한 달간 GPS 위치 추적 정보를 사용해 본 연구에서 소개한 방법론을 적용하여 행동권을 도출하였다. 행동권 결과를 비교분석 함으로써 각 방법론의 특징 및 한계점을 논의하였으며, 향후 동물 행동권을 분석하고자 하는 연구자가 본인이 가지고 있는 데이터 특성과 분석 목적에 알맞는 방법론을 선택할 수 있도록 행동권 분석 방법론 선택 의사결정 가이드라인을 제시하였다.

정보이론에 기반한 Supervised, Unsupervised 피처 선택 방법론 (Information-based Supervised and Unsupervised Feature Selection Methods)

  • 이상근;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.637-639
    • /
    • 2004
  • 많은 변수(variable)라 피처(feature)를 포함하는 대규모 데이터에 기계학습 방법론을 적용하는데 있어 그 예측 성능을 향상시키기 위한 방법으로 피처 선택(feature selection)기법이 활발히 연구되고 있다. 그러나 다른 연구를 위한 사전 데이터 분석 작업에 유용하게 사용될 수 있는 단순한 순위기반 피처 선택 방법론은 피처의 중요한 특성을 간과하는 경우가 많으며, 따라서 예측 성능의 향상을 기대하기 어렵다. 본 연구에서는 정보 이론에 기반한 supervised 피처 선택 방법과 이것을 보완할 수 있는 unsupervised 피처 선택 방법을 제시했다. 서로 다른 특성을 가진 다섯 개의 데이터셋에 대해 실험한 결과. 제시된 방법이 기존 방법보다 나은 예측 성능을 보임을 확인했다. 또한 두 방법에서 얻어진 피처들을 결합해 사용할 경우 한가지 방법만으로 추출된 피처를 사용할 경우보다 나은 기계 학습 성능을 보임을 확인했다.

  • PDF

온라인 빅 데이터 분석 결과와 상수도 통계 비교를 통한 데이터 가치 추출 (Data value extraction through comparison of online big data analysis results and water supply statistics)

  • 홍성진;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.431-431
    • /
    • 2021
  • 4차 산업혁명의 도래로 사회기반시설물의 계획 및 운영관리에 있어 데이터 분석을 통한 가치추출에 대한 관심은 매우 높은 상황이다. 데이터의 가용성과 접근성, 정부 지원 등을 평가하는 공공데이터 개방지수에서 한국은 1점 만점에 0.93점을 획득하여 경제협력개발기구 회원국 중 1위(2019년 기준)를 할 정도로 매우 높은 수준(평균 0.60점)이다. 그러나 공식적으로 발표 및 배포되는 사회기반시설물 관련 정보와 심도 있는 연구 분석이 필요한 정보는 접근이 여전히 제한적이라 할 수 있다. 특히 대표적인 사회기반시설물인 상수도시스템은 대부분 국가중요시설로 지정되어 있어 다양한 정보를 획득하고 분석하는데 제약이 존재하며, 관련 국가통계인 상수도통계에서는 누수사고 등과 같은 비정상적 상황에 대한 사고지점, 원인 등과 같은 세부정보는 제공하고 있지 않다. 본 연구에서는 웹크롤링 및 빅데이터 분석기술을 활용하여 과거 일정기간 발생한 지자체의 상수도 누수사고 관련 뉴스를 전수조사하고 도출된 사고건수를 국가 공인 정보인 상수도통계자료와 비교·분석하였다. 독립적인 누수사고 기사를 추출하기 위해서 중복기사의 제거, 누수 관련 키워드 정립, 상수도분야 이외의 관련기사 제거 등의 절차가 필요하며, 이와 같은 기법은 R프로그래밍을 통해 구현되었다. 추가적으로 뉴스기사의 자연어 처리기반 정보추출기법을 통해 누수사고 건수 뿐만 아니라 사고발생일, 위치, 원인, 피해정도, 그리고 대상 관로의 크기 등을 획득하여 상수도 통계에서 제시하고 있는 정보보다 많은 가치를 추출하여 연계할 수 있는 방안을 제시하였다. 제시된 방법론을 국내 A광역시에 적용하여 누수사고 건수를 비교한 결과 상수도통계에서 제시하고 있는 누수발생건수와 유사한 규모의 사고건수를 뉴스기사분석을 통해 도출할 수 있었다. 제안된 방법론은 추가적인 정보의 추출이 가능하다는 점에서 향후 활용성이 높을 것으로 기대된다.

  • PDF

데이터정보기술을 이용한 데이터 마이닝 (A Data Mining using Data Information Technology)

  • 전성해;이승주;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.264-265
    • /
    • 2008
  • 문제의 정의부터 데이터의 조사, 측정, 수집, 전송, 분석, 지식의 창출, 그리고 최적의 의사결정 및 피드백에 이르는 전체 과정을 다루는 데이터기술은 2000년 전,후에 제안되었다. 아직 이에 대한 폭넓은 연구는 이루어지고 있지 못하지만 기업 비즈니스를 위한 CRM 등의 경영을 위한 효과적인 데이터 마이닝 방법론에 대한 개선을 위한 중요한 역할이 기대된다. 본 논문에서는 현재 연구되고 있는 데이터기술과 정보기술의 창조적인 융합을 제안하고 이를 통하여 효과적인 데이터 마이닝의 수행방안에 대하여 연구한다.

  • PDF

주성분 분석을 이용한 빅데이터 분석 (Big Data Analysis Using Principal Component Analysis)

  • 이승주
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.592-599
    • /
    • 2015
  • 빅 데이터 환경에서 빅데이터를 분석하기 위한 새로운 방법의 필요성이 대두되고 있다. 데이터의 크기, 다양성, 그리고 적재 속도 등의 빅데이터 특성으로 인해 모집단의 추론에서 전체 데이터의 분석이 가능해졌기 때문이다. 그러나 전통적인 통계분석 방법은 모집단으로부터 추출된 확률표본에 초점이 맞추어져 있다. 따라서 기존의 통계적 접근방법은 빅데이터 분석에 적합하지 않은 경우가 발생한다. 이와 같은 문제점을 해결하기 위하여 본 논문에서는 빅데이터분석을 위한 새로운 접근방법에 대하여 제안하였다. 특히 대표적인 다변량 통계분석 기법인 주성분 분석을 이용하여 효율적인 빅데이터분석을 위한 방법론을 연구하였다. 제안방법의 성능평가를 위하여 통계적 모의실험을 실시하였다.

베이지안 접근법을 이용한 입력변수 및 근사모델 불확실성 하에서의 신뢰성 분석 (Reliability Analysis under Input Variable and Metamodel Uncertainty using Bayesian Approach)

  • 안다운;원준호;최주호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2009년도 정기 학술대회
    • /
    • pp.97-100
    • /
    • 2009
  • 신뢰성 분석은 불확실성으로 인한 제품의 성능 변동을 안전확률이나 파괴확률로 정량화 하여 설계에 이용하기 위해 연구되어 왔다. 불확실성은, 데이터의 양에 따라-물질의 본질적인 특성으로서의 많은 데이터가 주어진 경우의 물리적 불확실성과 부족한 데이터에서의 인식론적 불확실성으로 구분되고, 불확실성을 갖는 대상에 따라-입력변수 및 근사모델 불확실성으로 구분된다. 물리적 불확실성에 대한 연구는 많이 진행되어 왔지만, 실제 산업현장에는 부족한 데이터로 인한 인식론적 불확실성이 지배적이며 이에 대한 연구는 최근에서야 진행되고 있다. 불확실성을 고려하는 신뢰성 기반 설계에는 효율성을 위해 실제모델을 대체하는 근사모델이 이용되는데, 근사모델법 자체에 대한 연구는 많이 진행되어 왔으나, 근사모델 이기 때문에 존재하는 불확실성을 고려한 연구는 최근에서야 연구되기 시작하였다. 본 연구에서는 베이지안 접근법에 기반하여 입력변수 및 근사모델 불확실성을 통합 고려하는 새로운 신뢰성 분석 기법을 제시하고 수치예제를 통해 타당성을 증명한 후, 이를 공학문제에 적용한다.

  • PDF

이동 단말기에서 멀티미디어 연출을 위한 버퍼 선일출기법 (Prefetch Method for Multimedia Presentation on Mobile Device)

  • 공란숙;최원희;박성근;이종호;임영환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.417-420
    • /
    • 2003
  • 요즘은 여러 멀티미디어 데이터가 기존의 PC에서 재생되는 것이 아니라 핸드폰, PDA와 같은 이동단말기에서 재생되기가 요구되고 있다 멀티미디어 데이터의 용량이 크고 시간에 종속적인 연속 미디어이기 때문에 데이터의 일부론 미리 가져와서 재생하는 Prefetch기법이 필요하다. 영역 분할 기법과 재생가능성 분석기법을 통해서 멀티미디어 프리젠테이션의 재생가능 여부를 분석하고 재생이 불가능한 프리젠테이션은 EPOB지정을 이용한 Prefetch기법을 적용한 후 재생가능 여부를 판단한다. Prefetch하는 시점과 데이터의 양을 지정함으로서 원활한 멀티미디어 프리젠테이션을 재생 할 수 있다.

  • PDF

기업 내 정보유출방지를 위한 내부자 위험도 분석 방법론 연구 (Methodology to analyze insider risk for the prevention of corporate data leakage)

  • 신혜원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.295-297
    • /
    • 2012
  • 내부자에 의한 위협이 증가됨에 따라, 기업 내 핵심기술이 유출되어 큰 피해가 발생하고 있다. 내부자들이 합법적인 권한을 통한 불법적인 정보유출을 시도하는 위험을 예측 관리하기 위하여, 본 논문에서는 내부자들의 위험도를 평가하기 적합한 위험분석 방법론 ISMS-AIR(ISMS - Against Insider Risk)을 제안하였다. 내부자 위협의 정의와 위험도 평가를 위한 기존 위험분석 방법론들을 연구하였으며, 기존 자산 중심의 위험분석 방법론인 ISMS에 사용자 중심의 행위 모니터링을 강화하여 위험도 산출하는 방법을 제안하였다. 이를 위하여 사용자 행위에 따른 프로파일링 데이터와 이상징후 시나리오를 적용하여 내부자들의 위험도를 산출하고, 주요 모니터링 대상을 선정하여 내부자들의 불법적인 정보유출 시도행위를 모니터링 할 수 있다.

시스템 R을 활용한 범죄데이터 분석 기법 연구 (A Study on Crime Data Analysis Technique Using System R)

  • 장우인;오재섭;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1498-1501
    • /
    • 2013
  • 최근 SNS나 스마트폰을 이용한 다양하고 많은 데이터들이 우리 주위에 산재하고 있다. 이러한 데이터는 사용자의 심리나 상황을 담은 것으로 이에 대한 분석을 통해 사용자의 행동과 심리를 유추할 수 있다. 그러나 이러한 데이터는 빅데이터의 형태를 가지고 있기 때문에 이를 효과적으로 분석하기 위한 방법론이 필요하다. 본 논문에서는 이러한 문제에 초점을 맞추고 이를 효과적으로 분석하기 위하여, 먼저 시스템인 R을 소개하고, R에 실제 데이터를 로딩 하여, 이를 분석하는 분석 예를 보인다.