• 제목/요약/키워드: 데이터 기반 의사결정

검색결과 778건 처리시간 0.026초

사용자 관심 이슈 분석을 통한 추천시스템 성능 향상 방안 (Improving Performance of Recommendation Systems Using Topic Modeling)

  • 최성이;현윤진;김남규
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.101-116
    • /
    • 2015
  • 많은 기관들이 데이터에 기반을 둔 의사결정을 수행해 왔으며, 특히 수치자료를 비롯한 정형 데이터가 이러한 목적으로 널리 활용되어 왔다. 하지만 최근에는 스마트기기와 소셜미디어의 발달로 인해 다양한 형태를 가진 방대한 양의 정보가 생성, 공유, 저장되면서, 전통적인 정형 데이터 기반 의사결정으로부터 비정형 빅데이터 기반 의사결정으로 관심의 전환이 이루어지고 있다. 데이터 기반 의사결정의 대표적 분야인 추천시스템 분야에서도 성능 향상을 위해 비정형 데이터를 활용해야 한다는 필요성이 최근 꾸준히 제기되고 있다. 특히 사용자의 성향이나 선호도는 고객의 니즈와 직결되기 때문에, 비정형 데이터 분석을 통해 사용자의 성향을 파악하고 이를 통해 상품 추천 및 구매 예측의 정확도를 향상시키기 위한 노력이 매우 시급하게 이루어질 필요가 있다. 따라서 본 연구에서는 사용자의 성향을 측정하여 재구매 예측 정확도, 특히 카테고리별 재구매 예측 정확도를 높임으로써, 궁극적으로 추천시스템의 성능을 향상시킬 수 있는 방안을 제시한다. 구체적으로는 사용자의 일상적인 인터넷 사용 기록을 분석하여 고객이 조회하는 뉴스 기사의 이슈를 식별하고 다양한 이슈에 대한 고객의 관심을 계량화한 후, 이를 활용하여 고객의 카테고리별 재구매 여부를 예측하는 모델을 제안하고자 한다. 실제 웹 트랜잭션으로부터 도출된 인터넷 뉴스 조회 기록 및 쇼핑몰 구매 기록을 대상으로 실험을 수행한 결과, 고객의 과거 구매이력만을 활용한 카테고리 재구매 예측 모형에 비해 본 연구에서 제안한 모형, 즉 고객의 과거 구매이력과 관심 이슈를 모두 활용한 예측 모형의 정확도가 다소 우수한 것으로 나타났다.

BIM 데이터를 적용한 증강현실 기반의 건설관리시스템 개발에 관한 연구 (A Study on the Development of the Project Management System based on Augmented Reality)

  • 안지연;최정민;권순호;송두형;옥종호
    • 한국산학기술학회논문지
    • /
    • 제11권8호
    • /
    • pp.3083-3093
    • /
    • 2010
  • 최근 3D파라메트릭 모델링 기법의 발달에 힘입어 비정형 건축 프로젝트가 증가하고 있다. 기존의 BIM 시뮬레이션 의사결정 지원시스템은 가상현실에서 구현되기 때문에 효율적이지 못했다. 이에 본 연구에서 효율적 의사결정지원을 위한 증강현실 기반 시뮬레이션 시스템인 "AR naviX"를 개발하였다. 이 시뮬레이션 시스템은 현장사진과 동영상자료 혹은 레이져 스캐닝 데이터를 활용하여 사용자가 보다 높은 현실감과 몰입감을 느낄 수 있도록 함으로써, 의사결정에 소비되는 시간을 단축시킨다.

지식베이스를 이용한 플랜트 엔지니어링 분석 플랫폼 개발 (Development of Plant Engineering Analysis Platform using Knowledge Base)

  • 고영동;김현수
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.139-152
    • /
    • 2022
  • 플랜트를 대상으로 하는 엔지니어링의 업무영역은 플랜트의 기획, 설계, 시공, 운영 및 폐기에 이르는 생애주기에 걸친 생산성과 성능 및 품질에 직접적인 영향을 미치는 복합적인 기술분야이다. 이때 발생하는 다양한 유형의 데이터를 활용하여 의사결정을 활용하는 것은 후속 과정뿐만 아니라 생애주기 관점에서도 중요한 영향을 미치고 있다. 하지만 이러한 데이터를 통합적으로 관리하고 분석할 수 있는 시스템은 부족하다. 본 논문에서는 플랜트 생애주기에서 발생하는 데이터를 관리하고 활용할 수 있는 지식베이스 기반 플랜트 엔지니어링 분석 플랫폼을 개발하였다. 플랫폼에서는 기수집된 엔지니어링 데이터를 전처리한 지식베이스를 제공하고, 이를 레퍼런스 데이터로 AI 모델에 활용하도록 분석 기능과 시각화를 제공한다. 사용자는 플랫폼을 통한 선행기술과 축적된 지식의 활용을 통해 데이터 분석을 진행하고 시각화를 의사결정에 활용해 경험에만 의존하던 공사를 합리적이고 체계적으로 관리할 수 있다.

뇌파의 의사 결정 트리 분석과 가능성 기반 서포트 벡터 머신 분석을 통한 우울증 환자의 분류 (EEG Classification for depression patients using decision tree and possibilistic support vector machines)

  • 심우현;이기영;채정호;정재승;이도헌
    • Bioinformatics and Biosystems
    • /
    • 제1권2호
    • /
    • pp.134-138
    • /
    • 2006
  • 우울증은 가장 유병율이 높은 '기분 장애'(mood disorder)의 일종으로, 약 20%의 인구가 일생동안 우울증 증상을 한번쯤 경험한다. 이러한 우울증은 크게 '우울 장애'(major depressive disorder)와 '양극성 장애'(bipolar disorder)로 구분된다. 환자의 질병 분류에 따라 사용되는 약과 의학적 처방이 다르기 때문에, 우울증 환자의 빠르고 정확한 진단 및 분류는 매우 중요하다. 기존의 다면성 인성검사(MMPI)와 같은 통계적인 방법이 우울증 환자의 진단을 위해 사용돼 왔으나, 장시간의 집중력을 요구하기 때문에 집중력 저하의 특징을 보이는 우울증 환자들에게 적용하는데 어려움이 있다. 이 논문에서는 이러한 문제를 해결하고자, 빠른 측정이 가능하고 측정동안 집중력을 요하지 않는 EEC 데이터의 분석을 통해 우울증 환자의 분류를 시도하였다. EEG 채널 간 정보 흐름에서의 비선형성과 근사 엔트로피(approximate entropy)의 크기를 속성(attribute)으로 사용하여 데이터 마이닝 기법 중 의사 결정 트리(decision tree)와 가능성 기반 서포트 벡터머신(possibilistic support vector machines) 통해 분석을 수행하였다. 30명의 주요 우울장애환자와 24명의 양극성 장애 환자를 통해 위의 분석을 수행한 결과 의사 결정 트리의 경우 85.19% 의 정확도를 가지며 분류해냈고, 가능성 기반 서포트 벡터머신의 경우 77.78%의 정확도를 보여줬다. 본 연구는 가능성 기반 서포트 벡터 머신 분석이 우울증 환자는 진단하고 분류하는데 유용하게 적용될 수 있는 가능성을 제시하고 있다.

  • PDF

의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템 (TF-IDF Based Association Rule Analysis System for Medical Data)

  • 박호식;이민수;황성진;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.145-154
    • /
    • 2016
  • u-Health에 대한 관심과 IT 기술의 발전에 따라 의료 정보를 적극적으로 활용하고자 하는 요구가 커지고 있으며, 이에 대해 텍스트 형태의 의료 정보 데이터에 연관규칙 기법을 적용하여 질병과 증상과의 관계를 추론하는 시스템에 대한 연구들이 이루어지고 있다. 그러나 일반적인 연관규칙 기법을 의료 정보 데이터에 그대로 적용할 경우, 이전에는 새로운 연관규칙들보다 일반적이며 의미없는 연관규칙들이 많이 생성되는 문제가 발생한다. 또한 필터링으로 인해 빈번하게 함께 발생하지는 않지만 의학적으로 의미있는 항목들의 연관 규칙을 발견할 수 없다는 한계점을 가지게 된다. 본 논문에서는 의료데이터 특성을 고려하여 빈번한 항목과 빈번하지 않지만 의학적으로 의미 있는 항목들을 대상으로 연관규칙을 구성하여 의료 전문가의 의사 결정에 도움을 주기 위한 시스템을 제안한다. 제안 시스템은 의료 기록 데이터에서 용어들을 TF-IDF기반으로 가중치를 부여하고 기존 FP-Growth 알고리즘을 확장하여 TF-IDF 가중치를 고려한 빈번하게 발생하거나 빈번하지 않지만 의미 있는 연관규칙을 구성한다. 특정 질의 데이터가 입력되면 해당 데이터에 나타난 연관 규칙들의 유사도를 의학분야 온톨로지를 이용하여 평가하여 해당 데이터의 내용과 관련된 후보 질병들을 추론한다. 추론된 후보 질병명은 의료 전문가에게 의사 결정의 참고 자료로 제공된다. 실제 임상 진료 및 처방 기록 데이터에 대해 제안 시스템을 적용해 본 결과, 본 제안 시스템을 통해 도출한 연관 규칙이 기존 FP-Growth 알고리즘을 적용했을 때 보다 더 구체적인 질병과 증상과의 관계들을 포함함을 확인할 수 있었다. 또한 본 제안 시스템은 자유형식의 의료 및 병리데이터를 마이닝하고 후보 질병들을 가중치 기반으로 보여주므로, 의료 기록 정보로부터 질병 관련 새로운 정보를 획득하고 의료진의 의사 결정에 도움을 주는 시스템으로 활용될 수 있다.

통계적 추론을 이용한 전문가 Belief기반의 Web Usage 패턴 검증 (Web Usage Patterns Validation Based on Expert Belief Using Statistical Reasoning)

  • 고세진;안계순;정준;이필규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.148-150
    • /
    • 2001
  • 발견된 Web Usage 패턴들은 분석하는 전문가에게는 불필요하고 흥미롭지 못해 의사결정에 도움이 못되는 경우가 많다. 따라서 발견된 패턴에 대한 도메인 전문가의 사전 Belief에 기반한 패턴 검증 과정이 필요하다. 발견된 패턴의 유용성 여부는 패턴의 Unexpectedness를 측정함으로써 결정할 수 있다. 본 논문에서는 패턴의 Unexpectedness를 전문가의 Belief에 기반하여 검증하기 위한 새로운 방법론 제안한다. 발견된 패턴과 전문가 Belief를 매칭 알고리즘을 이용하여 패턴을 4가지(완전일치, 조건부 일치, 결과부 일치, 완전 불일치)로 분류하는 1차 검증과 1차 검증 결과의 4가지 분류데이터를 통계적 추론 방법인 Dempster-chafer에 적용한 2차 검증으로 나뉜다. 1차 검증 과정은 패턴의 분류 용이성을 부여하나 패턴의 Unexpectedness에 대한 신뢰성을 제공하지 못한다. 이 문제점을 2차 검증 과정을 통해 해결한다.

  • PDF

토지 보상비 추정 모델 개발 - 건설CALS데이터와 공공데이터 중심으로 (Development of Land Compensation Cost Estimation Model : The Use of the Construction CALS Data and Linked Open Data)

  • 이상규;김진욱;서명배
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.375-378
    • /
    • 2020
  • 본 연구는 토지 보상비의 추정 모델 개발을 위해서 건설 CALS (Continuous Acquisition & Life-cycle Support) 시스템의 내부데이터와 개별공시지가 및 표준지 공시지가 등의 외부데이터, 그리고 개발된 추정 모델의 고도화를 위한 개별공시가 데이터를 기반으로 생성된 데이터를 활용하였다. 이렇게 수집된 3가지 유형의 데이터를 분석하기 위해서 기존 선형 모델 또는 의사결정나무 (Tree) 기반의 모델상 과적합 오류를 제거할 경우 매우 유용한 알고리즘으로 Decision Tree 기반의 Xgboost 알고리즘을 데이터 분석 방법론으로 토지 보상비 추정 모델 개발에 활용하였다. Xgboost 알고리즘의 고도화를 위해 하이퍼파라미터 튜닝을 적용한 결과, 실제 보상비와 개발된 보상비 추정 모델의 MAPE(Mean Absolute Percentage Error) 범위는 19.5%로 확인하였다.

  • PDF

빅데이터를 이용한 기술 시장동향 예측 (Forecasting Market trends of technologies using Bigdata)

  • 최미선;조용확;김진화
    • 산업융합연구
    • /
    • 제21권10호
    • /
    • pp.21-28
    • /
    • 2023
  • 오늘날 빅데이터 활용의 필요성이 증가하면서 개인, 기업, 국가 등에서 SNS 데이터를 포함해 빅데이터를 이용한 다양한 분석 활동들이 이루어지고 있다. 그러나 기존 기술 시장 동향 예측연구는 전문가에 의존적이거나 특허나 문헌 연구 기반 데이터를 이용한 연구가 주로 진행되어 왔으며 빅데이터를 활용한 객관적인 기술 예측이 필요하다. 이에 본 연구는 소셜네트워크서비스(SNS)의 데이터로 의사결정나무 분석, 시각화 분석, 백분율 분석을 통해 미래 기술을 예측하는 모델을 제시하고자 한다. 연구 결과 백분율 분석은 다른 분석 결과에 비해 긍정적인 기술을 더 잘 예측할 수 있었고, 시각화 분석은 다른 분석 결과에 비해 부정적인 기술을 더 잘 예측할 수 있었다. 의사결정나무 분석도 의미 있는 예측은 가능하였다.

지리정보시스템(GIS)을 이용한 LPG 충전소 위험관리정보시스템 개발에 관한 연구 (Development of a Risk Management Information System(RMIS) for the LPG refueling station by utilizing GIS)

  • 함은구;노삼규
    • 한국가스학회:학술대회논문집
    • /
    • 한국가스학회 2007년도 춘계학술발표회 논문집
    • /
    • pp.195-200
    • /
    • 2007
  • 본 연구는 도심지에 위치한 LPG 충전소를 연구범위로 하여 공간정보의 활용이 가장 많이 요구되는 안전관리 분야의 업무를 중심으로 공간정보를 효율적으로 구축 활용하기 위하여 데이터베이스를 중심으로 위험관리정보 시스템을 개발하였다. 이를 바탕으로 정량적 위험성 평가의 자동화를 통해 나타난 위험성을 실시간에 제어하기 위한 필요조건을 표준화하여 기초 정보자료로 구축, 이를 지리정보기능과 연동하여 LPG 충전소의 안전검사의 효율화, 사전 위험성 평가, 사고대응 판단의 효과적인 의사결정을 유도 할 수 있는 기반을 제공한다. 위험관리정보시스템(RMIS, Risk Management Information System) 개발절차는 다음과 같다 첫째, 도심지에 위치한 LPG 충전소 위험성 평가를 수행함에 있어서 기본적인 데이터인 부지내(On-site) 관련 자료와 부지 외(Off-site) 관련 자료를 관계형 데이터베이스(RDB, Relational Database)로 개발하였다. 둘째, Visual Basic을 이용하여 사용자가 효과적으로 위험을 관리 제어 할 수 있는 위험관리 통합 데이터베이스 시스템 개발하였다. 셋째, 위험관리 통합 데이터베이스 시스템과 지리정보시스템에 연동을 통한 의사결정 방안 제시하였다. 위험관리정보시스템(RMIS) 프로그램을 개발을 통하여 다음과 같은 결과를 도출하였다. 첫째, 위험관리 데이터 이용하여 사용자와 검사자가 효과적으로 위험을 사전관리 할 수 있는 공유정보를 구축하였다. 둘째, 위험 관리를 부지 내와 부지 외로 나누어 관리함으로서 시설 내부 뿐 만 아니라 시설외부에 미치는 영향을 모두 고려하여 구축하므로 서, 중대사고에 대응 할 수 있는 종합적인 안전관리 기반을 조성하였다. 셋째, 사용자 인터페이스를 바탕으로 비상사태 발생시에 신속하고 정확한 의사결정을 할 수 있는 기반을 조성하였다. 제공하여 응용GIS 구축의 생산성 및 품질 향상에 기여할 뿐만 아니라 우리의 최종목표인 GIS 소프트웨어 자동 생산에도 크게 기여할 것으로 사료된다. 등)을 교통망상에 표시할 수 있음으로서 의사결정에 보다 많은 도움을 줄 수 있을 것이다. 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수 있는 거래전략은 존재하므로 이러한 전략을 개발 및 활용할 수 있으며, 특히, 한국주

  • PDF

4차 산업혁명시대 인공지능 정책의사결정에 대한 탐색적 논의 (A Preliminary Discussion on Policy Decision Making of AI in The Fourth Industrial Revolution)

  • 서형준
    • 정보화정책
    • /
    • 제26권3호
    • /
    • pp.3-35
    • /
    • 2019
  • 4차 산업혁명시대에 지능정보기술의 발전에 따라 인공지능의 다양한 역할이 주목을 받고 있다. 구글의 알파고를 계기로 인공지능은 더 이상 공상의 기술이 아닌 실존하는 기술이라는 점에서 사회전역에 파급효과를 가져올 것으로 예상되고 있다. 이에 따라 본 연구에서는 공공부문에서 인공지능을 활용한 정책결정의 가능성과 쟁점에 대한 탐색적 논의를 진행하였다. 이에 따른 연구목적은 세 가지 측면으로 구분되며, 첫째, 공공부문에서 인공지능이 정책결정까지 이어질 수 있는지에 대한 검토이다. 둘째, 인공지능의 정책결정과정이 기존 정책결정과의 어떠한 차이를 가지는가이다. 셋째, 인공지능이 정책결정에 도입될 경우에 나오게 될 쟁점을 다루었다. 이러한 인공지능에 의한 정책결정이 기존의 정채결정과 구별되는 점은 많은 정보와 대안에 기반한 합리적 의사결정, 투명성 및 신뢰성의 제고, 정책이슈에 대한 객관적인 시각, 신속한 의사결정 등이다. 하지만 인공지능의 정책의사결정시 야기되는 쟁점 역시 존재 한다. 첫째는 인공지능의 우월성, 둘째 윤리성 논란, 셋째 책임성, 넷째 기존 민주주의의 변화, 다섯째 공공부문 인력의 대체 논쟁, 여섯째 인공지능에 필요한 데이터 활용의 문제점 등이다. 공공부문 정책의사결정에서 인공지능의 도입은 향후 실현될 것이기 때문에, 사회적 충격을 최소화하기 위해 그에 따른 순기능과 역기능에 대한 융합적인 접근이 필요하다.