• 제목/요약/키워드: 기초통계학

검색결과 81건 처리시간 0.021초

평균장 이론을 이용한 전량화분석 문제의 최적화 (Quantification Analysis Problem using Mean Field Theory in Neural Network)

  • 조광수
    • 한국정보처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.417-424
    • /
    • 1995
  • 본 논문에서는 정량화(Quantification) 문제를 MFT(Mean Field Theroy)를 통해서 해결하는 기법을 제안한다. 통계학에서 중요한 문제의 하나인 정량화 문제는 주어진 공간에서 대상들간의 유사성에 따라서 최적의 상태를 갖도록 하는 문제이다. 평균장 접근 방법에 기초한 한개의 변수로 표현되는 확률적 시뮬레이티드 아닐링을 제안하고 정량화 문제를 패널티(penalty) 파라메타 항을 첨가한 비한정된 최적화 문제로 변형하 여 MFT를 적용하였다. 또한 연속변수를 갖는 신경회로망에서 실제 값을 계산하는 것 보다 평균장 접근방법으로 계산하는것이 더 빠르게 계산될 수 있음을 확인하였다. 본 논문에서 제안한 방법이 실험결과 해석적인 방법보다 좋은 정량적 결과를 보였다.

  • PDF

유전알고리즘을 이용한 암반 물성의 최적 평가에 관한 연구 (Optimal Estimation of Rock Mass Properties Using Genetic Algorithm)

  • 홍창우;전석원
    • 터널과지하공간
    • /
    • 제15권2호
    • /
    • pp.129-136
    • /
    • 2005
  • 터널이나 지하구조물의 건설시 필요한 지보의 설계는 보통 시추에 의한 지반조사결과에 기초하고 있다. 지반조사 자료가 부족한 지역에서의 암반 물성을 보다 객관적이고 추계학적(stochastic)으로 예측하기 위해 유전알고리즘(genetic algorithm)과 조건부 모사 기법(conditional simulation)을 사용하였다. 지구통계학적 모델링의 방법으로 조건부 모사를 실시한 후에 공간상관관계의 최적화과정을 통해 암반 물성을 구하였다. 유전알고리즘을 이용할 경우 크리깅에 의한 분산의 감소 현상을 극복하고 확률적으로 값을 제시할 수 있었다. 또한 30번의 확률적 등가치(equi-probable) 모사를 통해 유전알고리즘으로 구한 값의 불확실성을 정량적인 확률분포 값으로 제시하였고, 교차검증(cross validation) 방법으로 유전알고리즘의 신뢰도를 검증하였다.

한우 발정기 발성음의 특징 벡터 생성 (Feature Vector Generation of Korean Cow Oestrus Vocalization)

  • 이종욱;정용화;김석;장홍희;박대희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1154-1157
    • /
    • 2012
  • 축산농가의 경제성과 직결되는 암소 발정기의 조기 탐지는 IT 농 축산 학계에서도 매우 중요한 문제 중 하나이며 반듯이 해결해야만 하는 문제로 알려져 있다. 이를 해결하기 위한 다양한 연구 방법들 중, 본 논문에서는 소리 센서 환경에서의 암소의 발정기 탐지 시스템에 관한 연구를 대상으로 한다. 특히, 발정기 발성음의 특징 벡터 생성에 초점을 맞춘다. 특징은 크게 분별력과 차원이라는 두 가지 기준에 대해 우수해야 한다. 즉, 좋은 특징이란 서로 다른 부류를 잘 분별해 주어야 할 뿐만 아니라, 특징 벡터의 차원이 낮을수록 계산 효율이 좋고 차원의 저주에서 멀어 진다. 본 논문에서는 통계학에 기초한 체계적인 특징 벡터 생성에 관한 알고리즘을 제안하고, 실제 축사에서 녹취한 한우 발정기 발성음을 대상으로 낮은 차원의 특징 벡터 생성 과정을 보인다. 또한 이상상황 탐지기로 잘 알려진 단일 클래스 SVM의 대표 모델인 SVDD를 탐지기로 설정하여 생성된 특징 벡터의 분별력을 실험적으로 검증한다.

PHP3를 이용한 웹상에서의 통계분석 (Statistical Analysis on the Web Using PHP3)

  • 황진수;엄대호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권2호
    • /
    • pp.501-510
    • /
    • 1999
  • 컴퓨터의 발달과 더불어 멀티미디어 산업은 급속히 발전하고 있고, 인터넷 또한 폭발적으로 확산되면서 우리의 컴퓨터 환경을 바꾸어 놓고 있다. 통계학 분야에서도 마찬가지로 인터넷을 이용한 기초통계 교육의 필요성이 대두되고 있다. 본 논문에서는 스크립트 언어인 PHP3을 이용하여 웹상에서 동적인 그래프를 통한 기초 자료 분석 및 간단한 검정을 구현하였다. 또한 데이터베이스의 자료와 연동하여 웹상에서의 설문조사 및 결과를 제시하였다. PHP3는 서버에서 수행이 되며 Apache 웹서버에서 모듈형태로 연계되어 있어 기존의 CGI에 비하여 빠른 처리속도를 얻을 수 있는 스크립트언어이며 인터넷상에서 많은 활용을 기대 할 수 있다.

  • PDF

공간 분석 기반 지진 위험도 정보를 활용한 우리나라 지진 취약 지역 평가 (Assessment of Regional Seismic Vulnerability in South Korea based on Spatial Analysis of Seismic Hazard Information)

  • 이선영;오석훈
    • 자원환경지질
    • /
    • 제52권6호
    • /
    • pp.573-586
    • /
    • 2019
  • 우리나라 전역을 대상으로 공간 분석 기반 지진 위험 지도를 작성하고 지진 취약 지역을 평가하였다. 지진 피해에 영향을 미치는 지질학적 특성을 고려하여 지표를 선정하였으며, 지진 활동 위험과 관련된 확률론적 지진 위험도 및 단층 특성, 지진 피해 위험과 연관된 기반암 심도 정보가 이용되었다. 각 지표는 정규 크리깅, 선 밀도 및 가변적 지역 평균 기반 단순 크리깅과 같은 GIS 및 지구 통계학 기법을 활용하여 공간 정보로 구축되었다. 구축된 세 가지 공간 정보는 연구 목적, 자료의 해상도 및 정확도에 따라 가중치를 할당하여 통합되었다. 지진 활동 위험 지표인 확률론적 지진 위험도와 단층 선 밀도의 경우 데이터의 불확실성이 비교적 크기 때문에 경향성 만을 반영하고자 먼저 가중 합한 후, 지진 피해 위험 지표인 기반암 심도 분포와 통합되었다. 이를 통해 세 가지 공간 자료의 분석에 기반한 지진 위험 지도가 작성되었으며, 우리나라 남동부와 북서부 지역이 지진 위험도가 높은 것으로 평가되었다. 본 연구 결과는 지진 재해를 최소화하기 위한 지진 대응 시스템을 구축하는데 기초 자료로 활용될 수 있을 것으로 기대된다.

OECD 국가별 코로나19의 기술 통계 분석 (Descriptive analysis of COVID-19 statistics across nations)

  • 안지선;박민규
    • 응용통계연구
    • /
    • 제36권5호
    • /
    • pp.447-455
    • /
    • 2023
  • 신종감염병인 코로나19는 치명률과 전파력, 치료법이 밝혀지지 않은 상태이다. 게다가 종식 시기 마져 알 수 없어 상당한 신체·정신적 피해가 발생하고 있다. 이에 세계 각국은 코로나19 치료제 및 백신 개발에 힘쓰고 있으며 현재 몇 가지 치료제와 백신이 개발됨에 따라 긴급 승인으로 사용하고 있다. 그러나 치료제는 일부 중증환자들을 위해 사용되기에 대중적이지 않다. 따라서 본 연구는 백신 접종이 사망률에 미치는 영향을 살펴보고자 한다. 코로나19 확진율과 사망률, 백신접종률을 살펴보면, 2차 백신 접종 완료 후 확진율은 감소하였다. 2022년 초 오미크론으로 확진율은 다시 증가한 반면 사망률은 감소하였으며, 누적 백신 접종 완료율이 50% 이상 되면서 사망률은 완만한 곡선 형태를 보였다. 이는 백신 접종이 사망률에 영향을 주는 결과라 하겠다. 그러나 백신 효과의 지속성이 상당히 짧아, 누적 백신 접종 완료율이 100%에 가까워질수록 초기 접종 효과가 떨어지고 월별 사망률이 높아졌다. 본 연구는 코로나19 상황 속에서 진행된 연구로 데이터가 충분하지 않았다. 그러나 국가별로 코로나19의 영향을 비교·분석하는 것은 의미가 있으며, 본 연구가 코로나19에 대한 부족한 데이터를 채우고 다른 연구의 기초가 되기를 바란다.

도시공간적 요인을 고려한 로지스틱 회귀분석 기반 체감더위 예측 모형 개발 (Development of a Prediction Model for Personal Thermal Sensation on Logistic Regression Considering Urban Spatial Factors)

  • 성욱제;박형민;임재연;서유진;손정민;민진규;엄정희
    • 한국지리정보학회지
    • /
    • 제27권1호
    • /
    • pp.81-98
    • /
    • 2024
  • 본 연구는 시민들이 직접 체감하는 더위인 체감더위를 열환경 단위로 설정하여 공간적 요인과의 상관관계를 분석하고 체감더위 예측 모형을 개발하였다. 체감더위를 수집하기 위해 리빙랩이라는 시민 참여형 연구방법론을 적용하여 시민들이 직접 체감더위를 기록하고 주변의 온도를 측정하도록 하였다. 수집한 체감더위 정보의 입력지점에 기반하여 주변 도시공간적 요소를 수집하여 통계 분석을 위한 데이터셋을 구축하였다. 구축한 데이터를 활용하여 로지스틱 회귀분석을 수행하였다. 분석 결과, 기온은 주변 공간환경에 영향을 받으며, 건물 높이, 녹지율, 도로율과 음의 상관관계를 가지고, 기온과 천공률과 양의 상관관계를 가진다고 분석되었다. 또한 도로율, 천공률, 녹지율 순으로 체감더위에 강한 영향을 미치는 것으로 나타났다. 본 연구의 결과는 기후변화 대응을 위한 국지적인 열환경 대책을 마련하기 위한 열환경 평가의 기초자료로 활용될 수 있을 것으로 기대된다.

교사교육을 위한 공공 빅데이터 수집 및 스프레드시트 활용 기초 데이터과학 교육 사례 연구 (A Case Study of Basic Data Science Education using Public Big Data Collection and Spreadsheets for Teacher Education)

  • 허경
    • 정보교육학회논문지
    • /
    • 제25권3호
    • /
    • pp.459-469
    • /
    • 2021
  • 본 논문에서는 현장 교사 및 예비교사를 위한 기초 데이터과학 실습 교육 사례를 연구하였다. 본 논문에서는 기초 데이터과학 교육을 위해, 스프레드시트 SW를 데이터 수집 및 분석 도구로 사용하였다. 이후 데이터 가공, 예측 가설 및 예측 모델 검증을 위한 통계학을 교육하였다. 또한, 수천명 단위의 공공 빅데이터를 수집 및 가공하고, 모집단 예측 가설 및 예측 모델을 검증하는 교육 사례를 제안하였다. 이와 같은 데이터과학의 기초 교육내용을 담아, 스프레드시트 도구를 활용한 34시간 17주 교육 과정을 제시하였다. 데이터 수집, 가공 및 분석을 위한 도구로서, 스프레드시트는 파이썬과 달리, 프로그래밍 언어 및 자료구조에 대한 학습 부담이 없고, 질적 데이터와 양적 데이터에 대한 가공 및 분석 이론을 시각적으로 습득할 수 있는 장점이 있다. 본 교육 사례 연구의 결과물로서, 세가지 예측 가설 검증 사례들을 제시하고 분석하였다. 첫 번째로, 양적 공공데이터를 수집하여 모집단의 그룹별 평균값 차이 예측 가설을 검증하였다. 두 번째로, 질적 공공데이터를 수집하여 모집단의 질적 데이터 내 연관성 예측 가설을 검증하였다. 세 번째로, 양적 공공데이터를 수집하여 모집단의 양적 데이터 내 상관성 예측 가설 검증에 따른 회귀 예측 모델을 검증하였다. 그리고 본 연구에서 제안한 교육 사례의 효과성을 검증하기 위해, 예비교사와 현장교사의 만족도분석을 실시하였다.

바이오디젤 혼합연료의 배기특성 실험결과에 대한 통계학적 해석 (Statistical Analysis of Experimental Results on Emission Characteristics of Biodiesel Blended Fuel)

  • 염정국;윤정환
    • 대한기계학회논문집A
    • /
    • 제39권12호
    • /
    • pp.1199-1206
    • /
    • 2015
  • 본 연구는 경유와 바이오디젤(대두유) 혼합연료의 디젤엔진 배기특성을 조사하였고, 연료 혼합비는 BD(biodiesel)3, BD5, BD20, BD50 및 BD100이며, 분사압력 조건을 400 bar, 600 bar, 800 bar, 1000 bar 및 1200 bar로 변화시켰다. 그리고 연료 혼합비 및 분사압력에 따른 엔진배출물인 NOx와 Soot의 정량적인 분석을 위해 통계학에 기초한 피어슨 상관계수와 스피어만 상관계수를 이하였다. 본 연구의 결과로서 실험변수인 혼합비와 분사압력에 대한 NOx 및 Soot 발생량의 피어슨 상관계수는 -0.811이며, 스피어만 상관계수는 -0.884로 NOx와 Soot 발생량 관계가 선형적이며, 이것은 trade-off관계를 나타낸다. 또한 각각의 분사압력 조건에서 피어슨 상관계수가 음의 상관 관계를 나타내며 이것은 NOx와 Soot 배출관계가 반비례적인 것을 나타낸다.

지구통계학적 기법을 이용한 연약 지반 분포 추정 (Estimation of Distribution of the Weak Soil Layer for Using Geostatistics)

  • 정진;장원일
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제35권8호
    • /
    • pp.1132-1140
    • /
    • 2011
  • 해상풍력발전단지 건설 시 기초지반이 해상 점성토층의 지반일 경우 플랜트 자체 하중의 영향과 풍력과 같은 외부 모멘트 영향으로 인해 침하 발생을 야기할 수 있기 때문에 연약지반 분포를 파악하는 것은 풍력플랜트 입지를 위해 매우 중요한 사항이다. 이러한 연약지반 분포를 파악하는 방법은 시추조사 방법이 가장 최적의 방법이지만, 현장의 여건이나 경제적 제약이 큰 단점을 가지고 있다. 따라서 이러한 문제점을 보완하기 위해 현재 지구통계학적 방법을 이용한 연구가 활발하게 진행되고 있다. 본 연구에서는 풍력 플랜트 설치를 가정한 해상 영역을 설정하여 지구통계학적 기법을 통하여 연약 지반층 두께 분포의 추정을 연구 수행하였다. 연약 지반층은 표준 관입시험치의 결과를 이용하여 구분하였으며, 지구통계학적 기법은 정규크리깅과 순차가우시안 시뮬레이션을 이용하여 결과를 비교하였다. 그 결과 비슷한 영역에서 최대 점성토의 두께를 가지는 영역이 나타남을 파악할 수 있었으며, 그 결과의 불확실성을 정량적으로 평가할 수 있었다.