• 제목/요약/키워드: Model-Based Decision Support Systems

검색결과 208건 처리시간 0.023초

데이터의 불균형성을 제거한 네트워크 침입 탐지 모델 비교 분석 (Experimental Comparison of Network Intrusion Detection Models Solving Imbalanced Data Problem)

  • 이종화;방지원;김종욱;최미정
    • KNOM Review
    • /
    • 제23권2호
    • /
    • pp.18-28
    • /
    • 2020
  • 컴퓨팅 환경의 발전에 따라 IT 기술이 의료, 산업, 통신, 문화 등의 분야에서 사람들에게 제공해주는 혜택이 늘어나 삶의 질도 향상되고 있다. 그에 따라 발전된 네트워크 환경을 노리는 다양한 악의적인 공격이 존재한다. 이러한 공격들을 사전에 탐지하기 위해 방화벽, 침입 탐지 시스템 등이 존재하지만, 나날이 진화하는 악성 공격들을 탐지하는 데에는 한계가 있다. 이를 해결하기 위해 기계 학습을 이용한 침입 탐지 연구가 활발히 진행되고 있지만, 학습 데이터셋의 불균형으로 인한 오탐 및 미탐이 발생하고 있다. 본 논문에서는 네트워크 침입 탐지에 사용되는 UNSW-NB15 데이터셋의 불균형성 문제를 해결하기 위해 랜덤 오버샘플링 방법을 사용했다. 실험을 통해 모델들의 accuracy, precision, recall, F1-score, 학습 및 예측 시간, 하드웨어 자원 소모량을 비교 분석했다. 나아가 본 연구를 기반으로 랜덤 오버샘플링 방법 이외에 불균형한 데이터 문제를 해결할 수 있는 다른 방법들과 성능이 높은 모델들을 이용하여 좀 더 효율적인 네트워크 침입 탐지 모델 연구로 발전시키고자 한다.

멀티 모달리티 데이터 활용을 통한 골다공증 단계 다중 분류 시스템 개발: 합성곱 신경망 기반의 딥러닝 적용 (Multi-classification of Osteoporosis Grading Stages Using Abdominal Computed Tomography with Clinical Variables : Application of Deep Learning with a Convolutional Neural Network)

  • 하태준;김희상;강성욱;이두희;김우진;문기원;최현수;김정현;김윤;박소현;박상원
    • 한국방사선학회논문지
    • /
    • 제18권3호
    • /
    • pp.187-201
    • /
    • 2024
  • 골다공증은 전 세계적으로 주요한 건강 문제임에도 불구하고, 골절 발생 전까지 쉽게 발견되지 않는 단점을 가지고 있습니다. 본 연구에서는 골다공증 조기 발견 능력 향상을 위해, 복부 컴퓨터 단층 촬영(Computed Tomography, CT) 영상을 활용하여 정상-골감소증-골다공증으로 구분되는 골다공증 단계를 체계적으로 분류할 수 있는 딥러닝(Deep learning, DL) 시스템을 개발하였습니다. 총 3,012개의 조영제 향상 복부 CT 영상과 개별 환자의 이중 에너지 X선 흡수 계측법(Dual-Energy X-ray Absorptiometry, DXA)으로 얻은 T-점수를 활용하여 딥러닝 모델 개발을 수행하였습니다. 모든 딥러닝 모델은 비정형 이미지 데이터, 정형 인구 통계 정보 및 비정형 영상 데이터와 정형 데이터를 동시에 활용하는 다중 모달 방법에 각각 모델 구현을 실현하였으며, 모든 환자들은 T-점수를 통해 정상, 골감소증 및 골다공증 그룹으로 분류되었습니다. 가장 높은 정확도를 갖는 모델 우수성은 비정형-정형 결합 데이터 모델이 가장 우수하였으며, 수신자 조작 특성 곡선 아래 면적이 0.94와 정확도가 0.80를 제시하였습니다. 구현된 딥러닝 모델은 그라디언트 가중치 클래스 활성화 매핑(Gradient-weighted Class Activation Mapping, Grad-CAM)을 통해 해석되어 이미지 내에서 임상적으로 관련된 특징을 강조했고, 대퇴 경부가 골다공증을 통해 골절 발생이 높은 위험 부위임을 밝혔습니다. 이 연구는 DL이 임상 데이터에서 골다공증 단계를 정확하게 식별할 수 있음을 보여주며, 조기에 골다공증을 탐지하고 적절한 치료로 골절 위험을 줄일 수 있는 복부 컴퓨터 단층 촬영 영상의 잠재력을 제시할 수 있습니다.

자본시장 심리지수의 수용요인에 관한 연구 (A Study on the Acceptance Factors of the Capital Market Sentiment Index)

  • 김석환;강형구
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.1-36
    • /
    • 2020
  • 본 연구는 비정형 빅 데이터를 가공하여 추출된 투자자 감성을 반영하여 만든 자본시장 심리지수(Market Sentiment Index: MSI)의 수용요인을 밝히는 것이다. 이를 위해 합리적 행동이론에 근거한 외생변수들을 탐색하고 기술수용모형(Technology Acceptance Model: TAM)을 응용하여 연구모형을 설정하였다. 주식시장에서 투자자에게 제공되는 MSI의 수용은 본 연구에서 제시한 외생변수에 의해 영향을 받는 것으로 확인되었다. 인과관계 분석결과는 다음과 같다. 첫째, 자기효능감, 투자기회확장, 혁신적 성향, 사용비용이 인지된 용이성에 통계적으로 유의하게 영향을 미친다. 둘째, 서비스다양성과 인지된 효익은 인지된 유용성에 통계적으로 유의하게 영향을 미친다. 셋째, 인지된 용이성과 인지된 유용성은 사용태도에 통계적으로 유의하게 영향을 미친다. 넷째, 사용태도는 사용의도에 통계적으로 유의하게 영향을 미치고 독립변수인 투자기회확장이 사용의도에 영향을 미친다. 다섯째, 사용의도는 최종 종속변수인 지속적 사용의도에 통계적으로 유의하게 영향을 미친다. 연구모형의 독립변수와 종속변수 간의 매개효과는 다음과 같다. 첫째, 서비스다양성에서 지속적 사용의도의 인과경로에 간접효과가 0.1491로 유의수준 1%에서 통계적으로 유의하게 나타났다. 둘째, 인지된 효익에서 지속적 사용의도의 인과경로에 간접효과가 0.1281로 유의수준 1%에서 통계적으로 유의하게 나타났다. 다중집단분석에 대한 결과는 다음과 같다. 첫째, 주식투자경험이 있는 집단과 없는 집단의 투자자 태도, 투자자 주관적 규범, 소셜 빅 데이터 시스템의 특성요인에 대한 사전인지(지식)등에 포함된 세부 독립변수가 지속적 사용의도에 미치는 경로별 영향도의 차이와 통계적 유의성에 대한 분석은 두 집단 간 측정동일성이 확보되지 않아 불가능하였다. 둘째, 두 집단 간 측정동일성이 확보된 남, 여 집단의 세부 독립변수가 지속적 사용의도에 미치는 경로별 영향도 차이에 대한 분석결과, 사용태도에서 사용의도의 인과경로에서는 여성이 남성보다 높은 것으로 그리고 사용의도에서 지속적 사용의도의 인과경로에서는 남성이 매우 높은 것으로 유의수준 5%에서 통계적으로 유의한 차이를 보였다.

텍스트 마이닝을 활용한 지역 특성 기반 도시재생 유형 추천 시스템 제안 (Suggestion of Urban Regeneration Type Recommendation System Based on Local Characteristics Using Text Mining)

  • 김익준;이준호;김효민;강주영
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.149-169
    • /
    • 2020
  • 현 정부의 주요 국책사업 중 하나인 도시재생 뉴딜사업은 매년 100 곳씩, 5년간 500곳을대상으로 50조를 투자하여 낙후된 지역을 개발하는 것으로 언론과 지자체의 높은 이목이 집중되고 있다. 그러나, 현재 이 사업모델은 면적 규모에 따라 "우리동네 살리기, 주거정비지원형, 일반근린형, 중심시가지형, 경제기반형" 등 다섯 가지로 나뉘어 추진되어 그 지역 본래의 특성을 반영하지 못하고 있다. 국내 도시재생 성공 키워드는 "주민 참여", "지역특화" "부처협업", "민관협력"이다. 성공 키워드에 따르면 지자체에서 정부에게 도시재생 사업을 제안할 때 지역주민, 민간기업의 도움과 함께 도시의 특성을 정확히 이해하고 도시의 특성에 어울리는 방향으로 사업을 추진하는 것이 가장 중요하다는 것을 알 수 있다. 또한 도시재생 사업 후 발생하는 부작용 중 하나인 젠트리피케이션 문제를 고려하면 그 지역 특성에 맞는 도시재생 유형을 선정하여 추진하는 것이 중요하다. 이에 본 연구는 '도시재생 뉴딜 사업' 방법론의 한계점을 보완하기 위해, 기존 서울시가 지역 특성에 기반하여 추진하고 있는 "2025 서울시 도시재생 전략계획"의 도시재생 유형을 참고하여 도시재생 사업지에 맞는 도시재생 유형을 추천하는 시스템을 머신러닝 알고리즘을 활용하여 제안하고자 한다. 서울시 도시재생 유형은 "저이용저개발, 쇠퇴낙후, 노후주거, 역사문화자원 특화" 네 가지로 분류된다 (Shon and Park, 2017). 지역 특성을 파악하기 위해 총 4가지 도시재생 유형에 대해 사업이 진행된 22개의 지역에 대한 뉴스 미디어 10만여건의 텍스트 데이터를 수집하였다. 수집된 텍스트를 이용하여 도시재생 유형에 따른 지역별 주요 키워드를 도출하고 토픽모델링을 수행하여 유형별 차이가 있는 지 탐색해 보았다. 다음 단계로 주어진 텍스트를 기반으로 도시재생 유형을 추천하는 추천시스템 구축을 위해 텍스트 데이터를 벡터로 변환하여 머신러닝 분류모델을 개발하였고, 이를 검증한 결과 97% 정확도를 보였다. 따라서 본 연구에서 제안하는 추천 시스템은 도시재생 사업을 진행하는 과정에서 신규 사업지의 지역 특성에 기반한 도시재생 유형을 추천할 수 있을 것으로 기대된다.

지능형 시뮬레이션 모형을 기반으로 한 정보기술 투자 성과 요인 및 전략 도출에 관한 연구 (A study on the Success Factors and Strategy of Information Technology Investment Based on Intelligent Economic Simulation Modeling)

  • 박도형
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.35-55
    • /
    • 2013
  • 최근 기업 경영에 있어 정보기술의 도입 및 전략적인 활용은 선택이 아닌 필수로 자리잡고 있다. 기업의 전략적인 목표와 정보기술 간의 상호 의존은 기업의 생존 및 성장에 중요한 역할을 하고 있으며, 이에 따라 이미 많은 기업이 지속적으로 정보기술에 투자하고 있다. 정보기술 투자 성과 관련해서는 기업 내부의 요인들과 전략들, 기업외부의 고객까지 여러 가지 복합적인 요소들이 서로 상호작용하고 있기 때문에, 각 요인들을 독립적으로 분리하여 정보기술 투자 성과에 미치는 영향력을 분석하는 것이 쉽지 않다. 이에 본 연구는 기존의 연구들을 바탕으로 정보기술 투자성과에 영향을 줄 수 있는 변수들을 도출하여, 각 변수들의 관계를 수리적인 모델링을 통해 단순화시키고, 시뮬레이션 방법론을 이용하여 각 변수들의 변화에 정보기술 투자 성과는 어떻게 달라지는지를 밝혔다. 본 연구의 결과는 정보기술 투자는 서비스의 품질을 증가시켜 경제학적인 성과들에 간접적으로 영향을 주고, 정보기술 투자와 동시에 소비자 잉여는 증가되지만, 큰 투자비용으로 회사의 이익은 감소하게 된다. 그리고 시간이 지남에 따라 품질 증가에 관한 정보가 고객들 사이에 퍼져 나가게 되므로 최종적으로 기업의 수익을 증가시켜준다. 또한, 정보기술 투자 성과 극대화를 위해서는 회사가 제공하는 서비스와 소비자들의 네트워크 효과 등이 고려되어 정보기술 투자 여부를 결정하고, 회사에 맞는 정보기술 투자 전략을 세워야 함을 시뮬레이션 모형을 통해 확인할 수 있었다. 구체적으로, 한 번에 많은 투자를 할 경우는 단기적인 성과는 클 것으로 기대되나, 장기적으로 좋은 성과가 이뤄지지 않는다. 그러나 정보의 확산 속도가 빠르거나 정보의 장벽이 될 수 있는 정보를 받지 못하는 소비자가 적을 경우 단기에 집중 투자 하는 것이 많은 수요를 얻을 수 있다. 또, 여러 번에 걸쳐 투자하는 경우는 적당한 주기를 가지게 될 경우 장기적으로 큰 성과를 낼 수 있음을 확인할 수 있었다. 본 연구는 경제학 모델링과 시뮬레이션을 결합시켜, 각각의 한계를 모두 극복할 수 있는 방법론을 활용했다는 측면과, 정보기술 투자의 성과를 제품 품질의 매개 효과 모형에 적용하여 정보기술 투자와 기업 성과간의 관계를 보여주었다는 측면, 마지막으로 정보기술 투자 전략 및 정보의 확산 효과를 반영하여 정보기술 투자의 성과를 확인할 수 있다는 측면에서 의의가 있다.

복잡지형 고해상도 격자망에서의 PRISM 기반 강수추정법 (The PRISM-based Rainfall Mapping at an Enhanced Grid Cell Resolution in Complex Terrain)

  • 정유란;윤경담;조경숙;이재현;윤진일
    • 한국농림기상학회지
    • /
    • 제11권2호
    • /
    • pp.72-78
    • /
    • 2009
  • 관측밀도가 동일한 조건에서 단위격자점의 크기를 줄일 경우 PRISM 방식에 의해 추정된 강수량 분포 가 단위격자점의 크기를 줄이기 전에 비해 개선되는지 확인하기 위해 PRISM 코드를 수정하여 $270m{\times}270m$ 격자점 단위로 구동할 수 있도록 하였다. 남한 전역의 지형자료를 270m DEM으로부터 준비하고 432개 기상청 자동기상관측소의 2007년 월별 적산강수량 자료를 입력자료로 하여 각 격자점의 PRISM 회귀식을 도출하였다. 회귀모형과 DEM 고도에 의해 각 격자점의 월별 적산강수량을 추정한 다음, 추정된 강수량분포도로부터 한국수자원공사 우량관측소 166개소에 해당하는 격자점의 자료를 추출하여 해당관측소의 실측값과 비교하였다. 동일한 강수자료를 이용하되 이번에는 5km 격자점의 PRISM 회귀모형을 유도하여 강수량 분포도를 작성하고 166개 지점 추정강수량을 추출하여 실측자료와의 차이를 RMSE로 표현하였다. 5km 대신 270m 분해능의 DEM을 사용할 경우 월 강수량이 100mm 이상인 경우 평균 10%의 오차 감소효과가 확인되었다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

빅데이터 도입의도에 미치는 영향요인에 관한 연구: 전략적 가치인식과 TOE(Technology Organizational Environment) Framework을 중심으로 (An Empirical Study on the Influencing Factors for Big Data Intented Adoption: Focusing on the Strategic Value Recognition and TOE Framework)

  • 가회광;김진수
    • Asia pacific journal of information systems
    • /
    • 제24권4호
    • /
    • pp.443-472
    • /
    • 2014
  • To survive in the global competitive environment, enterprise should be able to solve various problems and find the optimal solution effectively. The big-data is being perceived as a tool for solving enterprise problems effectively and improve competitiveness with its' various problem solving and advanced predictive capabilities. Due to its remarkable performance, the implementation of big data systems has been increased through many enterprises around the world. Currently the big-data is called the 'crude oil' of the 21st century and is expected to provide competitive superiority. The reason why the big data is in the limelight is because while the conventional IT technology has been falling behind much in its possibility level, the big data has gone beyond the technological possibility and has the advantage of being utilized to create new values such as business optimization and new business creation through analysis of big data. Since the big data has been introduced too hastily without considering the strategic value deduction and achievement obtained through the big data, however, there are difficulties in the strategic value deduction and data utilization that can be gained through big data. According to the survey result of 1,800 IT professionals from 18 countries world wide, the percentage of the corporation where the big data is being utilized well was only 28%, and many of them responded that they are having difficulties in strategic value deduction and operation through big data. The strategic value should be deducted and environment phases like corporate internal and external related regulations and systems should be considered in order to introduce big data, but these factors were not well being reflected. The cause of the failure turned out to be that the big data was introduced by way of the IT trend and surrounding environment, but it was introduced hastily in the situation where the introduction condition was not well arranged. The strategic value which can be obtained through big data should be clearly comprehended and systematic environment analysis is very important about applicability in order to introduce successful big data, but since the corporations are considering only partial achievements and technological phases that can be obtained through big data, the successful introduction is not being made. Previous study shows that most of big data researches are focused on big data concept, cases, and practical suggestions without empirical study. The purpose of this study is provide the theoretically and practically useful implementation framework and strategies of big data systems with conducting comprehensive literature review, finding influencing factors for successful big data systems implementation, and analysing empirical models. To do this, the elements which can affect the introduction intention of big data were deducted by reviewing the information system's successful factors, strategic value perception factors, considering factors for the information system introduction environment and big data related literature in order to comprehend the effect factors when the corporations introduce big data and structured questionnaire was developed. After that, the questionnaire and the statistical analysis were performed with the people in charge of the big data inside the corporations as objects. According to the statistical analysis, it was shown that the strategic value perception factor and the inside-industry environmental factors affected positively the introduction intention of big data. The theoretical, practical and political implications deducted from the study result is as follows. The frist theoretical implication is that this study has proposed theoretically effect factors which affect the introduction intention of big data by reviewing the strategic value perception and environmental factors and big data related precedent studies and proposed the variables and measurement items which were analyzed empirically and verified. This study has meaning in that it has measured the influence of each variable on the introduction intention by verifying the relationship between the independent variables and the dependent variables through structural equation model. Second, this study has defined the independent variable(strategic value perception, environment), dependent variable(introduction intention) and regulatory variable(type of business and corporate size) about big data introduction intention and has arranged theoretical base in studying big data related field empirically afterwards by developing measurement items which has obtained credibility and validity. Third, by verifying the strategic value perception factors and the significance about environmental factors proposed in the conventional precedent studies, this study will be able to give aid to the afterwards empirical study about effect factors on big data introduction. The operational implications are as follows. First, this study has arranged the empirical study base about big data field by investigating the cause and effect relationship about the influence of the strategic value perception factor and environmental factor on the introduction intention and proposing the measurement items which has obtained the justice, credibility and validity etc. Second, this study has proposed the study result that the strategic value perception factor affects positively the big data introduction intention and it has meaning in that the importance of the strategic value perception has been presented. Third, the study has proposed that the corporation which introduces big data should consider the big data introduction through precise analysis about industry's internal environment. Fourth, this study has proposed the point that the size and type of business of the corresponding corporation should be considered in introducing the big data by presenting the difference of the effect factors of big data introduction depending on the size and type of business of the corporation. The political implications are as follows. First, variety of utilization of big data is needed. The strategic value that big data has can be accessed in various ways in the product, service field, productivity field, decision making field etc and can be utilized in all the business fields based on that, but the parts that main domestic corporations are considering are limited to some parts of the products and service fields. Accordingly, in introducing big data, reviewing the phase about utilization in detail and design the big data system in a form which can maximize the utilization rate will be necessary. Second, the study is proposing the burden of the cost of the system introduction, difficulty in utilization in the system and lack of credibility in the supply corporations etc in the big data introduction phase by corporations. Since the world IT corporations are predominating the big data market, the big data introduction of domestic corporations can not but to be dependent on the foreign corporations. When considering that fact, that our country does not have global IT corporations even though it is world powerful IT country, the big data can be thought to be the chance to rear world level corporations. Accordingly, the government shall need to rear star corporations through active political support. Third, the corporations' internal and external professional manpower for the big data introduction and operation lacks. Big data is a system where how valuable data can be deducted utilizing data is more important than the system construction itself. For this, talent who are equipped with academic knowledge and experience in various fields like IT, statistics, strategy and management etc and manpower training should be implemented through systematic education for these talents. This study has arranged theoretical base for empirical studies about big data related fields by comprehending the main variables which affect the big data introduction intention and verifying them and is expected to be able to propose useful guidelines for the corporations and policy developers who are considering big data implementationby analyzing empirically that theoretical base.