• 제목/요약/키워드: 데이터 기반 의사결정

검색결과 778건 처리시간 0.031초

의사결정 트리 기법을 이용한 그리드 자원선택 시스템 (Grid Resource Selection System Using Decision Tree Method)

  • 노창현;조규철;마용범;이종식
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-10
    • /
    • 2008
  • 이 기종의 네트워크와 시스템 자원으로 구성된 그리드 컴퓨팅 환경에서 대용량 데이터를 빠르고 정확하게 처리하기 위해서는 효과적인 그리드 자원선택이 필수적이다. 이를 위해 본 논문은 의사결정 트리 기법을 이용한 그리드 자원선택 시스템을 제안한다. 이 시스템은 자원 정보를 기록한 데이터 셋을 바탕으로 사용자들이 선택하는 자원들을 처리 할 데이터의 특성과 사용자의 요구사항으로 분석해서 자원선택을 위한 의사결정 트리를 구축한다. 그리드 사용자의 자원 요청 시 의사결정 트리를 탐색하여 사용자 요구 및 작업 특성에 적합한 자원들을 선택하여 작업을 할당함으로써 사용자 만족도를 향상시킴은 물론 전체 그리드 시스템의 성능을 개선한다. 실험결과는 본 논문에서 제안한 의사결정 트리 기반의 그리드 자원선택 시스템이 기존 그리드 자원선택 시스템인 Condor-G 및 Nimrod-G와 비교하여 더 높은 작업 처리율 및 자원 이용률과 더 적은 작업 손실 및 처리시간을 제공함으로써 그리드 자원선택 및 데이터 분산 처리에 효과적이라는 사실을 증명한다

  • PDF

공간 데이터의 분포를 고려한 공간 엔트로피 기반의 의사결정 트리 기법 (A Spatial Entropy based Decision Tree Method Considering Distribution of Spatial Data)

  • 장윤경;유병섭;이동욱;조숙경;배해영
    • 정보처리학회논문지B
    • /
    • 제13B권7호
    • /
    • pp.643-652
    • /
    • 2006
  • 의사결정 트리는 데이터 마이닝의 분류와 예측 작업에 주로 사용되는 기법 중의 하나이다. 실생활에서 공간의사결정을 위한 분류를 수행할 때에는 인접 데이터의 위치와 분산도를 고려하는 것이 매우 중요하다. 기존의 공간 의사결정 트리는 데이터의 공간적 특성을 표현하기 위해 각 객체간의 유클리디안 거리비율을 엔트로피로 반영하여 트리 구축 시 이용하였다. 그러나 이것은 공간 객체간의 거리 비율만을 설명할 뿐 공간 차원에서의 데이터 분산 정도와 각 분류된 클래스간의 연관관계 등은 파악할 수 없다는 한계점이 있었다 본 논문에서는 분산도와 차별도 기반의 공간 엔트로피를 이용하여 공간 데이터의 분포도를 반영하는 공간 의사결정 트리를 제안한다 분산도는 분류된 클래스 내의 공간 객체 분포도를 나타내고 차별도는 다른 클래스 내 공간 객체와의 분포도 및 관계성을 나타낸다. 이러한 분산도와 차별도의 비율을 엔트로피 계산 시 이용함으로써 비공간적 속성으로 분류된 각 클래스가 공간적으로는 얼마나 뚜렷하게 분류되는지 알 수 있게 한다. 제안 기법은 정확성과 계산 비용에 있어서 기존 기법보다 각각 약 18%, 11%의 성능 향상을 보였다.

범주형 데이터의 러프집합 분석을 통한 의사결정 향상기법 (An Improvement of the Decision-Making of Categorical Data in Rough Set Analysis)

  • 박인규
    • 디지털융복합연구
    • /
    • 제13권6호
    • /
    • pp.157-164
    • /
    • 2015
  • 최적의 의사결정시스템에서 효율적인 정보검색을 위해서는 정보의 감축이 필수적이다. 다양한 종류의 데이터에 존재하는 유용한 정보를 찾는 데이터 마이닝 기법에 대한 많은 연구가 활발하게 진행되어 왔고 타 산업과의 융복합을 위한 빅데이터 활용이 높아져 가고 있다. 유용한 지식의 발견을 위한 여러 가지 기법들이 특징을 가지고 있지만 단점이 존재하기 마련이다. 따라서 그러한 특징을 수렴하는 하나의 새로운 기법이 필요하다. 본 논문에서는 베이지언 정리를 이용하여 정보의 대수학적인 확률을 측정하고 이 확률에 대하여 정보엔트로피를 계산함으로써 정보의 불확실성을 계산한다. 제안된 척도를 기반으로 불필요한 속성을 제거하여 최소의 리덕트를 생성하고 이를 기반으로 결정규칙을 유도하는 알고리즘을 제안한다. 제안된 방법의 효율성을 위하여 콘텍트 렌즈를 결정하는 실험을 통하여 기존방법과 비교 결과, 본 연구가 의사결정의 유용성면에 있어 일반성이 있음을 보인다.

국내외 데이터 통합관리 표준화 사례 연구 (A Case Study on Standardization of Data Integration Management in National and International)

  • 김동영;채효석;황의호;이정주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.631-631
    • /
    • 2015
  • 최근 데이터가 전략적 의사결정의 핵심요소로 대두됨에 따라 데이터 통합 및 데이터 품질에 대한 관심이 증대되고 있다. 특히, 데이터 품질을 확보하기 위해 데이터 표준화가 필수적으로 수반되어야 한다. 그러나 데이터 활용에 있어 (1)데이터의 중복 및 불일치 발생, (2)데이터에 대한 의미 파악 지연으로 정보 제공의 적시성 결여, (3)데이터 통합의 어려움, (4)정보시스템 변경 및 유지 보수 곤란 등과 같은 현실적인 문제점들이 정확한 정보를 적시에 사용자에게 전달하는데 장애 요인으로 발생하고 있는 실정이다. 따라서 본 연구에서는 '국토관측센서 기반 수문 및 수재해 정보포털시스템 개발'에 앞서 보다 정확한 데이터 통합관리 및 제공서비스가 가능하도록 국내외 사례연구를 통한 기반을 마련하고자 한다. 데이터 표준화는 시스템별로 산재해 있는 데이터 정보요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것을 의미하며, 이러한 데이터 표준화 작업은 데이터의 정확한 의미 파악뿐만 아니라 데이터에 대한 상반된 시각을 조정하는 역할을 수행한다. 기본적으로 데이터 모델 및 데이터베이스에서 정의할 수 있는 모든 오브젝트를 대상으로 하는 것이 이상적이나, 주로 관리해야 될 필요성이 있는 오브젝트만을 대상으로 데이터 표준화를 하는 것이 더욱 효율적으로 작용한다. 본 연구는 국내외 데이터 통합관리 표준화 동향을 제시하였으며, 현업 사용자로부터 데이터 표준과 관련된 요구사항을 수요조사를 통하여 조사함으로써 데이터 표준 대상 후보를 식별하고 개선점을 도출하는데 사용할 기반을 마련하였다. 데이터 표준화가 수행되면 현업 사용자는 정확한 데이터를 사용할 수 있고, 올바른 의사결정을 내릴 수 있을 것으로 판단된다. 앞으로 데이터 표준, 데이터 표준 준수 체크, 데이터 표준 조회 및 활용 등 데이터 표준 관리에서 수작업으로 인해 발생하는 애로사항을 배제하기 위해 자동화에 관한 연구가 지속적으로 추진되어야 할 것으로 사료된다.

  • PDF

XAI 기반의 임상의사결정시스템에 관한 연구 (A Study on XAI-based Clinical Decision Support System)

  • 안윤애;조한진
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.13-22
    • /
    • 2021
  • 임상의사결정시스템은 누적된 의료 데이터를 활용하여 머신러닝으로 학습된 AI 모델을 환자의 진단 및 진료 예측에 적용한다. 그러나 기존의 블랙박스 기반의 AI 응용은 시스템이 예측한 결과에 대해 타당한 이유를 제시하지 못하여 설명성이 부족한 한계점이 존재한다. 이와 같은 문제점을 보완하기 위해 이 논문에서는 임상의사결정시스템의 개발 단계에서 설명이 가능한 XAI를 적용하는 시스템 모델을 제안한다. 제안 모델은 기존의 AI모델에 설명성이 가능한 특정 XAI 기술을 추가로 적용시켜 블랙박스의 한계점을 보완할 수 있다. 제안 모델의 적용을 보이기 위해 LIME과 SHAP을 활용한 XAI 적용 사례를 제시한다. 테스트를 통해 데이터들이 모델의 예측 결과에 어떤 영향을 미치는지 다양한 관점에서 설명할 수 있다. 제안된 모델은 사용자에게 구체적인 이유를 제시함으로써 사용자의 신뢰를 높일 수 있는 장점을 가진다. 아울러 XAI의 적극적인 활용을 통해 기존 임상의사결정시스템의 한계를 극복하고 더 나은 진단 및 의사결정 지원을 가능하게 할 것으로 기대한다.

데이터 기반 유사연구영역 효율성 제고 방안 및 과제 우선순위 도출에 대한 탐색적 연구 -출연연 사례 및 AHP분석을 중심으로

  • 정재연;최산;강인제;정재웅;한유리;전승표
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 춘계학술대회 논문집
    • /
    • pp.537-547
    • /
    • 2017
  • 현재 우리나라의 GDP 대비 R&D 투자 규모는 세계최고의 수준에 이르렀다. 이러한 연구개발 예산의 양적인 확대 및 성장과 함께 상대적으로 연구개발 예산의 효율적 활용이 중요한 과학기술정책 이슈로 부각되고 있다. 본 연구는 정부 R&D사업 유사영역의 효율성 제고를 위한 정책, 전략의 수립 및 실행의 의사결정을 돕는 데이터 기반의 객관적인 지표들을 제시하였다. 그 후 본 연구에서 제시한 효율성 지표들을 NTIS에서 추출한 2015년 정부출연연구기관 R&D 사업 데이터와 연계하여 실질적으로 측정과 사용이 가능한 정량적 지표들만을 따로 선별하였다. 또한 정부 R&D사업 효율성 지표들의 가중치를 측정하기 위하여 계층분석기법(analytic hierarchy process)을 수행하였으며 계층분석기법의 결과로 나온 가중치를 효율성 지표들에 적용하여 과제 우선순위를 도출하였다. 이를 통해 정책의 수립, 실행 및 조정 시 고려해야 할 지표의 우선순위를 설정하여 유사연구영역 관련 정부 R&D 정책수립에서 실행까지의 연계를 강화시키고 국가적으로 한정된 자원의 효율적 사용을 위한 방안을 제시하였다.

  • PDF

시뮬레이션 기반 반도체 포토공정 스케줄링을 위한 샘플링 대안 비교 (A Simulation-based Optimization for Scheduling in a Fab: Comparative Study on Different Sampling Methods)

  • 윤현정;한광욱;강봉권;홍순도
    • 한국시뮬레이션학회논문지
    • /
    • 제32권3호
    • /
    • pp.67-74
    • /
    • 2023
  • 반도체 제조라인(FAB)은 복잡하고 불확실한 운영환경에서 작동하는 대규모의 제조시스템 중 하나로 반도체 설비 운영을 담당하는 엔지니어들은 직관적이고 신속한 공정 스케줄링을 위해 가중치 기반 스케줄링을 널리 사용하고 있다. 가중치 기반 스케줄링에서 가중치 결정은 FAB 성능에 큰 영향을 미치므로 엔지니어들은 가중치 최적화를 위하여 시뮬레이션 기반 의사결정을 활용할 수 있다. 그러나 대규모 시뮬레이션은 많은 실험 비용을 요구하기 때문에 효과적인 의사결정을 위해서 신중한 실험설계가 요구된다. 본 연구에서는 적은 시뮬레이션 실행 내에서 효율적인 스케줄링을 도출하기 위해 세 가지 샘플링 대안(i.e., Optimal latin hypercube sampling(OLHS), Genetic algorithm(GA), and Decision tree based sequential search (DSS))에 대한 비교연구를 수행하였다. 시뮬레이션 실험을 통해 세 가지 대안이 단일 규칙보다 우수한 성능을 보였고, 그중 GA와 DSS가 최적화를 위한 효과적인 대안이 될 수 있음을 확인하였다.

해외 재난 안전관리 시스템 사례기반 산불재난대응 연구 (A Study on Wildfire Disaster Response based on Cases of International Disaster Safety Management Systems)

  • 이지현;박민수;정대교;박승희
    • 대한토목학회논문집
    • /
    • 제40권3호
    • /
    • pp.345-352
    • /
    • 2020
  • 산불재난은 위험요소에 대한 경우의 수가 많고, 범위가 넓으며 파생되는 피해 다양성도 나날이 늘어나고 있다. 산불재난에 대응하기 위해 다양한 연구 및 시스템이 생겨나고 있다. 국외 산불재난 대응 시스템은 빅데이터, GIS 기반 시스템, 의사결정 시스템 등 다양한 기술을 적용하였다. 산불재난대응 체계 및 시스템에 대해, 국내외 사례를 비교 분석하였다. 또한, 이에 대한 국내 산불재난 대응 시스템 대안방안을 제시하였다. 첫째, 국내 각 기관에서 파악한 정보 및 현장 정보를 통합하는 방향을 제안한다. 둘째, 재난대응 시스템에 빅데이터를 적용하는 방안을 제안한다. 셋째, 기존에 GIS 기반 시스템에 의사결정 시스템을 적용한다. 따라서 본 논문에서는 위의 대응방안으로 기존 재난 안전 관리체계에 제안했을 때, 다양한 정보 및 데이터를 가시화하여 쉽게 파악할 수 있다. 또한, 가시화 플랫폼으로 의사결정을 도와줄 수 있으며 최적의 결과로 최소한의 피해를 기대할 수 있다.

공간 데이터 웨어하우스 구축기에서 사실테이블 사전 계산 기법 (Pre-Computation of Fact table in a Spatial Data Warehouse Builder.)

  • 최유신;유병섭;박순영;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.165-170
    • /
    • 2004
  • 공간 데이터 웨어하우스에서 구축기는 의사절정을 위한 기반 데이터의 구축을 담당한다. 일반적으로 공간 데이터 웨어하우스의 데이터 적재는 잦은 갱신으로 인한 서버의 부하를 줄이기 위하여 구축기에 적재할 데이터를 임시 저장하고 일정주기마다 적재하는 방법을 이용한다. 이때 구축기의 정보는 차원테이블에 대한 갱신정보와 사실 테이블의 일부 갱신정보만을 유지하므로 여러 차원 테이블로 구성된 사실 테이블의 갱신은 공간 데이터 웨어하우스 서버에서 수행해야 한다. 사실 테이블의 갱신연산은 연관된 차원 테이블들에 의해 처리되므로 높은 처리 비용이 필요하다. 따라서 사실테이블의 처리로 인해 적재시간이 증가하며, 이는 사용자의 의사결정 응답시간을 증가시킨다. 본 논문에서는 공간 데이터 웨어하우스의 구축기에서 사실테이블의 사전 계산 기법을 제안한다. 이 기법은 차원 테이블 및 사실 테이블에 대한 메타정보와 추가적으로 기록되어야할 데이터 정보를 구축기에 유지한다. 구축기는 이 정보를 이용하여 삽입 연산시 사실 테이블에 적재할 갱신 정보를 사전에 계산하고, 이를 적재주기에 함께 적재한다. 따라서 사실 테이블의 신을 데이터 적재 이전에 구축기에서 계산하므로 공간 데이터 웨어하우스 서버에서 발생하는 높은 처리 비용을 감소시킬 수 있다. 공간 데이터 웨어하우스 사용자의 의사결정 응답시간을 감소시킨다.

  • PDF