• 제목/요약/키워드: 통계 모델링

검색결과 341건 처리시간 0.025초

통계 분석과 뉴스 기사 토픽 모델링을 통한 코로나19가 자살에 미치는 영향 분석 (The Effect of Covid-19 on Suicide through Statistical Analysis and Topic Modeling of News Articles)

  • 권민지;김준철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.518-520
    • /
    • 2021
  • 전 세계적으로 확산된 코로나19의 장기화로 인해 국민들은 경제적, 심리적 어려움을 겪고 있으며, 이에 따른 자살 시도에 대한 우려가 높아지고 있다. 본 연구에서는 자살사망자 통계와 자살 관련 뉴스 기사의 토픽 모델링을 통해 코로나19가 자살에 미친 영향을 분석하였다. 그 결과 수치적으로는 재난 직후 자살률이 일시적으로 감소하는 '허니문 기간'을 보였고, 의미적으로는 자살 예방에 대한 중요성이 지속적으로 부각되었다. 또한 유명인 또는 사회적으로 이슈화된 사건에 대한 수사 및 사실관계가 언론을 통해 드러났으며, 연초를 지나도 꾸준히 유지되는 경제 관련 이슈가 도출되었다.

은닉 마르코프 모델에 기반한 정상행위의 순서적 이벤트 모델링을 통한 침입탐지 시스템 (An Intrusion Detection System with Temporal Event Modeling based on Hidden Markov Model)

  • 최종호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.306-308
    • /
    • 1999
  • 사회분야 전반이 전산화되면서 전산시스템에 대한 효과적인 침입방지와 탐지가 중요한 문제로 대두되었다. 침입행위도 정상사용행위와 마찬가지로 전산시스템 서비스를 사용하므로 호출된 서비스의 순서로 나타난다. 본 논문에서는 정상사용행위에 대한 서비스 호출순서를 모델링 한 후 사용자의 사용패턴을 정상행위와 비교해서 비정상행위(anomaly)를 탐지하는 접근방식을 사용한다. 정상 행위 모델링에는 순서정보를 통계적으로 모델링하고 펴가하는데 널리 쓰이고 있는 HMM(Hidden Markov Model)을 사용하였다. Sun사의 BSM 모듈로 얻어진 3명 사용자의 사용로그에 대하여 본 시스템을 적용한 결과, 학습되지 않은 u2r 침입에 대해 2.95%의 false-positive 오류에서 100%의 탐지율을 보여주었다.

  • PDF

페트리네트를 기반으로 한 통합 소프트웨어의 개발 (Development of a Petri-net based Integrated Software)

  • 황상철;박찬우;이효성
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2000년도 추계학술대회 논문집
    • /
    • pp.219-225
    • /
    • 2000
  • 본 연구에서는 이산사건 동적 시스템을 모델링하고 성능을 분석하기 위한 통합 소프트웨어를 개발하였다. 소프트웨어는 페트리네트를 기반으로 비쥬얼 C++와 비쥬얼 베이직을 이용하여 개발되었으며 윈도우즈 환경 하에서 동작하는 범용 그래픽도구를 내장하고 있다. 본 소프트웨어를 이용하면 사용자는 마우스의 드래그 앤 드롭만으로 페트리네트 모델을 작성할 수가 있으며 모델이 작성되면 수리적 분석과 시뮬레이션을 통하여 시스템의 성능분석을 자동으로 수행하여 준다. 또한 시스템의 논리적인 특성을 분석하기 위하여 coverbility tree와 reachability tree를 지원한다. 이외에도 deadlock을 탐지하고 이를 해소하는 기능과 정교한 세부 모델링이 가능하도록 다양한 활성화 함수와 분포를 지원하며 시스템의 성능척도와 관련된 다양한 통계치를 제공해준다.

  • PDF

저급 특징들로부터 비디오 셧의 특성 분석 (Analysis of video shots' characteristics using low-level features)

  • 박현재;강행봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.424-426
    • /
    • 2003
  • 본 논문에서는 비디오 데이터에서 비디오 셧이 가지는 저급 특징들로부터 감정에 관련된 특징을 검출하기 위하여 비디오 셧의 특성을 확률적 분포를 이용하여 모델링 하는 방식을 제안한다. 제안한 방법을 통해 감상자가 감정을 느끼게 하는 부분의 비디오 셧을 검출할 수 있는 방법에 대하여 기술한다. 특징값과 감정과의 관계, 시간의 흐름과 감정과의 관계를 통계적으로 분석하여 모델링 함으로써 감정 검출이 가능하다는 것을 확인하였다.

  • PDF

토픽모델링과 군집분석을 통한 지방 소멸 위험지역과 요인의 탐색 (Exploring Regional Decline Risk Areas and Factors Using Topic Modeling and Cluster Analysis)

  • 김지민;조희련
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.349-350
    • /
    • 2023
  • 우리나라는 지속적인 저출산과 고령화로 인해 지방 소멸 위험지역이 점차 늘어나고 있다. 본 연구는 지방 소멸과 관련된 다양한 요인을 '인구 소멸'이라는 키워드를 포함하는 신문 기사에 대한 토픽모델링을 통해 발견하고, 추출된 토픽과 관련된 공공 데이터를 수집하여 비슷한 특징을 가지는 지역을 묶는 군집분석을 수행한다. 그리고 지방소멸위험지수로 분류된 소멸 위험지역과 군집분석 결과를 비교한다.

GCAM을 이용한 국내 수송부문 모델링 (Modeling Domestic Transportation Sector Using Global Change Assessment Model)

  • 전승호;김수덕
    • 대한교통학회지
    • /
    • 제35권2호
    • /
    • pp.91-104
    • /
    • 2017
  • 본 연구에서는 통합모형인 GCAM을 활용한 국내수송부문을 모델링에 대해 논의한다. GCAM은 IPCC 5차 보고서 평가에도 활용된, 국제적으로 널리 쓰이는 모형이다. 그럼에도 불구하고 이를 국내수송부문에 그대로 적용하는 데 상당한 문제가 있다. 첫째, GCAM의 기준년도(2010년) 수송 서비스수요가 국가통계와 일치하지 않다는 점. 둘째, 수송부문 시뮬레이션 결과가 관련 부문별 서비스수요의 과거추이를 제대로 반영하고 못하고 있다는 점이다. GCAM을 활용한 국내 수송부문 모델링에서 가장 중요하게 영향을 미치는 수송서비스수요 항등식을 상세히 점검함으로써, 기준년도의 서비스수요를 국가통계와 일치시키도록 노력하였다. 또 GCAM의 시뮬레이션 결과가 과거 통계추이를 제대로 반영할 수 있도록 기존모형을 점검, 수정하였다. 점검 및 수정결과, 기존 GCAM의 시뮬레이션 결과와 어떤 부분에서 문제가 있는지, 또 수송부문별 과거 서비스 수요의 추이가 어떻게 제대로 반영되고 있는지를 상세히 보고하였다. 본 연구는 향후 수송부문의 정책, 기술평가 및 온실가스저감 대책 마련 등을 위한 시나리오 분석의 기본분석도구로 유용하게 쓰일 수 있을 것으로 보인다.

다변량 확률분포함수의 추정을 위한 MKDE-ebd 개발 (Development of MKDE-ebd for Estimation of Multivariate Probabilistic Distribution Functions)

  • 강영진;노유정;임오강
    • 한국전산구조공학회논문집
    • /
    • 제32권1호
    • /
    • pp.55-63
    • /
    • 2019
  • 공학문제에서 많은 확률 변수들은 상관성을 가지고 있고, 입력변수의 상관성은 기계시스템의 통계적 성능 분석 결과에 큰 영향을 미친다. 하지만, 상관 변수들은 결합분포함수를 모델링하기 어렵다는 이유로 종종 독립변수로 취급되거나 특정한 모수적 모델로 표현되는 경우가 많으며, 특히 데이터가 적은 경우 결합분포함수를 정확히 모델링하는데 더 큰 어려움이 있다. 본 연구에서 개발된 경계데이터를 이용한 다변량 커널밀도추정은 비선형성을 갖는 다양한 형태의 다변량 확률 분포 추정을 위해 개발되었다. 다변량 커널밀도추정은 주어진 데이터와 균등분포함수의 파라미터의 신뢰구간으로부터 생성된 경계데이터를 결합하여 데이터의 질과 수에 덜 민감하다. 따라서 제안된 방법은 보수적인 통계모델링과 신뢰성 해석 결과를 도출할 수 있으며, 통계시뮬레이션과 공학예제를 통해 그 성능을 검증하였다.

다중 자료 변환을 이용한 구성 자료의 지구통계학적 시뮬레이션 (Geostatistical Simulation of Compositional Data Using Multiple Data Transformations)

  • 박노욱
    • 한국지구과학회지
    • /
    • 제35권1호
    • /
    • pp.69-87
    • /
    • 2014
  • 이 논문에서는 구성 자료의 지구통계학적 시뮬레이션을 위해 다중 자료 변환 기반 조건부 시뮬레이션 틀을 제안하였다. 우선 일반적인 통계 기법의 적용이 가능하도록 구성 자료에 로그비 변환을 적용하였다. 다음 변환들로는 최소/최대 자기상관 인자 변환과 지시자 변환을 순차적으로 적용하였다. 독립적인 새로운 변수의 생성을 위해 최소/최대 자기상관 인자 변환을 적용하였으며, 적용 결과 개별 변수들의 독립적인 시뮬레이션이 가능해진다. 그리고 다중 가우시안 확률 모델을 따르지 않는 변수들의 비모수적 조건부 누적 확률 분포 모델링을 위해 지시자 변환을 적용하였다. 최종적으로는 적용한 변환 방법들의 역순으로 역 변환을 적용하였다. 간석지 표층 퇴적물 성분 자료를 대상으로 제안 시뮬레이션 기법의 적용 가능성을 예시하였다. 모든 시뮬레이션 결과들은 구성 자료의 제한 조건을 만족하면서 샘플 자료의 통계 특성을 잘 반영하였다. 구성 자료의 다수의 시뮬레이션 결과들을 이용한 표층 퇴적물 분류를 통해 기존 크리깅에서는 얻을 수 없는 분류 결과의 확률론적 평가가 가능하였다. 따라서 제안 시뮬레이션 틀은 다양한 구성 자료의 지구통계학적 시뮬레이션에 효과적으로 이용될 수 있을 것으로 기대된다.