• 제목/요약/키워드: Random indices

검색결과 135건 처리시간 0.028초

금융시계열자료를 이용한 원주율값 π의 추정 (Approximation of π by financial historical data)

  • 장대흥;엄태웅;이성백
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.831-841
    • /
    • 2017
  • 원주율 ${\pi}$는 임의의 원의 지름에 대한 둘레의 비로 정의되며 상수값을 갖는다. 이 값은 무리수이며 초월수로서 고대로부터 좀 더 정확한 값을 구하기 위한 수많은 노력이 있어왔다. 특히 확률분야에서는 18세기 Buffon의 바늘문제를 기점으로 확률실험을 통하여 ${\pi}$값을 계산하려는 많은 노력이 있어왔다. 통계분야에서 Chong (2008)은 서로 독립인 이변량표준정규확률분포와 단변량 확률보행과정의 차분이 독립인 정규분포를 따른다는 전제조건하에서 ${\pi}$값을 유도하였다. 본 연구에서는 Buffon의 바늘문제와 정사각형에 내접하는 원의 문제에서 유도된 ${\pi}$값을 확률실험을 통하여 근사값을 구해보며 이 값이 실험횟수와 어떤 관계가 있는지 알아본다. 더불어 Chong이 유도한 단변량확률보행과정의 차분에 근거한 ${\pi}$의 일치추정량을 모의실험을 통하여 검증해본다. 나아가 국내외 금융자료를 사용하여 제시된 방법에 의해 계산된 추정값의 수렴여부와 수렴할 경우 극한값과 ${\pi}$의 오차정도를 살펴보고 이를 통하여 효율적시장가설에 대한 설명을 시도한다.

켑스트럼 변수와 랜덤포레스트 알고리듬을 이용한 MTD(근긴장성 발성장애) 여성화자 음성과 정상음성 분류 (Classification of muscle tension dysphonia (MTD) female speech and normal speech using cepstrum variables and random forest algorithm)

  • 윤주원;심희정;성철재
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.91-98
    • /
    • 2020
  • 근긴장성 발성장애(cepstral peak prominence, MTD) 환자의 모음 발성과 문장읽기 과제를 켑스트럼 기반 변수를 이용하여 분석하였으며 음성장애 환자의 GRBAS청지각적 특성과 음향학적 특성의 상관관계를 살펴보고, 랜덤포레스트 머신러닝 분류 알고리듬을 이용한 MTD 감별 진단 가능성을 논의하였다. 내원 시 MTD로 진단받은 여성 36명과 정상음성을 사용하는 여성 36명이 연구에 참여했으며, 수집한 음성샘플은 ADSVTM를 사용하여 분석하였다. 연구 결과, 음향학적 측정치 중 MTD의 CSID(cepstral spectral index of dysphonia)는 대조군보다 높았으며, CPP(cepstral peak prominence), CPP_Fo 값이 대조군보다 유의하게 낮았다. 이는 모음 발성과 읽기 과제에서 모두 동일하게 나타났다. MTD 환자의 음질 특성은 전반적인 음성중증도(G)가 가장 두드러졌으며, 조조성(R), 기식성(B), 노력성(S)순으로 음성 특성을 보였다. 이 특성이 높아질수록 CPP가 감소하는 부적 상관을 보이고, CSID는 증가하는 정적 상관이 관찰되었다. 켑스트럴 변수 중 모음과 문장읽기과제 모두에서 집단간 유의한 차이를 보여준 CPP와 CPP_F0를 이용하여 MTD와 대조군의 음성분류를 시도하였다. 머신러닝 알고리듬인 랜덤포레스트로 모델링한 결과 문장읽기 과제에서 모음연장발성보다 조금 더 높은 분류 정확도(83.3%)가 나왔으며, 모음 발성과 문장 읽기 과제 모두에서 CPP변수가 더 중심적 역할을 수행하였음을 알 수 있었다.

생물화학적 산소요구량 농도예측을 위하여 데이터 전처리 접근법을 결합한 새로운 이단계 하이브리드 패러다임 (Novel two-stage hybrid paradigm combining data pre-processing approaches to predict biochemical oxygen demand concentration)

  • 김성원;서영민;자크로프 마샵;말릭 아누락
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1037-1051
    • /
    • 2021
  • 주요한 수질지표 중의 하나인 생물화학적 산소요구량(BOD) 농도는 호소와 하천에서 생태학적 측면에서 관측항목으로 취급하고 있다. 본 연구에서는 대한민국의 도산 및 황지지점에서 BOD 농도예측을 위하여 새로운 이단계 하이브리드 패러다임(웨이블릿 기반 게이트 순환 유닛, 웨이블릿 기반 일반화된 회귀신경망, 그리고 웨이블릿 기반 랜덤 포레스트) 을 활용하였다. 이러한 모형들은 각 대응하는 독립모형들(게이트 순환 유닛, 일반화된 회귀신경망, 그리고 랜덤 포레스트) 과 함께 평가되었다. 다양한 수질 및 수량지표들이 여러 개의 입력조합(분류1-5) 을 기본으로 하여 독립 및 이단계 하이브리드 모형을 개발하기 위하여 구현되었다. 언급한 모형들은 root mean squared error (RMSE), Nash-Sutcliffe efficiency (NSE), 그리고 correlation coefficient (CC) 를 포함한 세 개의 통계지표로서 평가되었으며, 통계결과치를 분석하면 이단계 하이브리드 모형들이 항상 대응하는 독립모형들의 예측 정도를 개선하지 않은 것으로 나타났다. 대한민국의 도산관측소에서는 DWT-RF5 (RMSE = 0.108 mg/L) 모형이 다른 최적모형과 비교하여 BOD 농도의 더 정확한 예측을 나타내었으며, 황지관측소에서는 DWT-GRNN4 (RMSE = 0.132 mg/L) 모형이 BOD 농도를 예측하는 최고의 모형이다.

동적·정적 자료 기반 도로위험도 산정 알고리즘 개발 (Developing Road Hazard Estimation Algorithms Based on Dynamic and Static Data)

  • 양충헌;김진국
    • 한국ITS학회 논문지
    • /
    • 제19권4호
    • /
    • pp.55-66
    • /
    • 2020
  • 본 연구에서는 사업용 차량 수집정보를 통해 도로위험을 계량화하고 검증할 수 있는 네 가지 알고리즘과 관련 지수를 개발하였다. 도로위험도 산정을 위해서 사업용 차량의 블랙박스와 디지털 운행 기록계로 부터 원시 데이터를 수집하였다. 포트홀, 도로 결빙, 안개 등 가공 처리된 데이터는 사업용 차량 수집정보 공유시스템에서 생성이 가능하다. 도로 위험도 산정 알고리즘은 기본적으로 이러한 수집정보와 도로 기하구조 자료를 활용하였다. 가공 처리된 데이터에 따라 총 4개의 서로 다른 도로 위험 알고리즘과 관련 지표를 개발하였다. 과거 이력자료를 근거로 상습결빙구간 및 안개다발구간인 국도 19호선(강원도)과 국도 1호선(세종시 인근)을 대상으로 수동형 운행기록계를 이용하여 알고리즘 검증을 수행하였다. 단기적으로 실제 도로위험정보 취득에 어려움이 있어 가상으로 위험정보를 수집하여 알고리즘을 검증한 결과 특징적인 알고리즘 오류는 발생하지 않았다. 본 연구는 지점이 아닌 구간을 기반으로 도로 위험정보를 제공하기 때문에 도로 이용자는 물론 도로 유지관리기관에도 실질적인 도움을 줄 수 있을 것으로 판단된다.

Spatio-temporal Distribution Pattern of New Biotypes of Weedy Rice (Oryza sativa L.) in Selangor North-West Project, Malaysia

  • Baki, B.B.;M.M., Shakirin
    • 한국잡초학회지
    • /
    • 제30권2호
    • /
    • pp.68-83
    • /
    • 2010
  • Weedy rice (Oryza sativa L.) occurred sympatrically with other weeds and the rice crop in Malaysian rice granaries. We conducted field surveys in 2006-2008 seasons in 7 farm blocks of Selangor's North West Project, Malaysia to enlist the new biotypes of weedy rice (NBWR) and assess their spatio-temporal pattern of distribution based on quantitative and dispersion indices. No less than 16 accessions of NBWR were identified based on their special traits, viz. panicle type, pericarp colour, presence or absence of awn, seed type and degree of grain shattering. The NBWR accessions exhibited a combination of morphological traits from open panicle, grain with awns, red pericarp, short grain type, and degrees of grain shattering. Others mimic commercial rices with close panicle, awnless grains, white pericarp, long or short grain-type. Invariably, the NBWRs mimic and stand as tall as cultivated rice namely MR219, MR220, or MR235 and these NBWR accessions stand among equals morphologically vis-a-vis the commercial rice varieties. Most accessions displayed varying degrees of grain shattering in excess of 50%, except Acc9 and Acc12. The seasonal dynamics of on the prevalence of dominant NBWR accessions were also displaying significant differences among farm blocks. While Bagan Terap farm block, for example, did not record any measurable changes in the dominant NBWR accessions over seasons, the Sungai Leman farm block recorded measurable season-mediated changes in the dominant NBWR accessions. Sungai Leman started with NBWR Acc3, Acc4, Acc5, Acc7, Acc8, and Acc12 in season 1 of 2006/2007, but no measurable records of Acc3 and Acc5 were shown in season 2 of 2007. In season 3 of 2007/2008, only Acc8 and Acc12 prevailed in the farm block. In Sawah Sempadan farm block, season 3 of 2007/2008 showed much reduced prevalence of NBWRs leaving only Acc8 and Acc12. Most accessions registered clump or under-dispersed spatial distribution pattern based on quantitative indices: variance-to-mean ratio (VMR) and Lloyd's patchiness values. The dynamics on the extent of infestation and prevalence of dominant NBWR accessions registered both season- and farm-block mediated differences. Most accessions showed VMR >1 thus indicative of having a clump or clustered spatial distribution, as exemplified by Acc3, Acc4, Acc7, Acc8 and Acc12 in all farm blocks throughout three seasons. Some accessions have either random or uniform distribution in a few farm blocks. The Acc8 has the highest population counts based on important value index, followed by Acc12, and both were the most dominant accession while Sawah Sempadan was the worst farm block infested by NBWR compared to other farm blocks. These results were discussed in relation with the current agronomic and weed management practices, water availability and extension services in the granary.

CART알고리즘과 Landsat-8 위성영상 분석을 통한 계절별 지하수함양량 변화 (Variation of Seasonal Groundwater Recharge Analyzed Using Landsat-8 OLI Data and a CART Algorithm)

  • 박승혁;정교철
    • 지질공학
    • /
    • 제31권3호
    • /
    • pp.395-432
    • /
    • 2021
  • 지하수함양은 시공간적으로 다양하여 직접적으로 측정하기 어렵기 때문에 함양추정을 위해 수치모델이 널리 사용되고 있다. 이 연구에서는 지하수함양을 추정하기 위한 방법으로 기계학습법의 하나인 분류회귀트리(CART)모형을 적용하기 위해 수정된 수직식생지수(mPVI), 정규식생지수(NDVI), 정규경작지수(NDTI), 정규나지지수(NDRI) 같은 토양-식생관련 지수와 강우, 지형인자(고도, 경사, 경사방향)를 입력하고 김천지역 SWAT-MODFLOW의 함양량 결과를 추출 및 학습하여 함양량을 예측하였다. SWAT-MODFLOW의 함양량 분포에 대한 CART모형의 예측값의 전반적인 정확도는 0.5~0.7, 카파계수는 0.3~0.6으로 나타나 위성영상자료를 통해 토양-식생에 따른 함양량 변화를 합리적으로 예측할 수 있었다.

RAPD 표지자 분석 에 의한 가시아메바속 한국분리주의 유전적 지위 (Genetic status of Acanthamoeba spp. Korean isolates on the basis of RAPD markers)

  • 홍용표;오승환
    • Parasites, Hosts and Diseases
    • /
    • 제33권4호
    • /
    • pp.341-348
    • /
    • 1995
  • 가시아메바 속(Accnthamoeba spp.)의 DNA 염기 구성 정보와 관계없이 임의의 10개의 엽기로 구성된 프라이머를 사용하여 random amplified polymorphic DNA-polymerase chain reaction(RAPD-PCR)에 의해 게놈 상의 DNA를 무작위로 증폭하여 확인된 표지자로써 한국 분리주 및 외국 분리주와 기존의 알려진 4개 가시아메바 종간의 유전적 근연관계 분석을 통해서 4개 한국 분리주의 분류상의 성상을 규명하였다. 본 연구에서 A. culbertsoni, A. hokchetti, A. triangularis, A. pokphrwc와 한국 분리주인 YM-2 YM-3, YM-4 YM-5 그리고 외국 분리주인 HOV의 게놈 DNA는 18 종류의 프라이머에 의하여 다양한 양상의 증폭산물을 보였으며 그 중 9개 프라이머는 한국 분리쿠간에도 특이성을 보이는 RAPD 표지자를 제공하였다. 총 18개의 프라이머에 대한 증폭 산물을 대상으로 각 시료의 유사도를 조사한 결과, A. culbertsoni는 A. hakhetti, A. triangularis, A. polyphuga와 유사도가 각각 0.300, 0.308, 0.313이었고, A hqkchetti와 A. triangularis간의 유사도는 0.838이었다. 한국 분리주 YM-2, -3, -4 간의 평균 유사도는 0.959이었고, YM-2, -3, -4 와 A. hotchetti, A. triangularis 간의 평균 유사도는 0.832이었다. 한국 분리주 YM-5는 YM-2, -3 -4 간의 비교에서 평균 0.237의 유사도를 보인 반면, A. culbersoni와 유사도 0.857을 보여, 다른 한국 분리주보다 A. culbertsoni와 유전적으로 유사함을 알 수 있었다. UPGMA법에 의한 유전적 근 연관계 분석 결과 phonogram 강에 두개의 분지군이 존재하는데, A. hakchetti, A. triangularis 및 3개 한국 분리주(YM-2, -3 -4)가 하나의 분지군을, A. cuzburtsoni, A. polyphaga HOV주, 및 YM-5가 따른 분지군을 형성하는 것으로 나타났다 게놈 DNA 상의 변이에 근거하여 볼 때, YM-5 주늘 유전적으로 A. culbertsoni와 거의 유사한 분리주이며 한국 분리주는 최소 2종 이상의 가시아메바로 분류할 수 있다고 사료된다.

  • PDF

머신러닝과 샘플링을 이용한 강원도 지역 산불발생예측모형 개발 (Development of a Gangwon Province Forest Fire Prediction Model using Machine Learning and Sampling)

  • 채경재;이유리;조용주;박지현
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.71-78
    • /
    • 2018
  • 본 연구는 산불 발생 예측 모형의 정확도를 높이기 위해 머신러닝 기법을 적용한 연구이다. 산불 피해면적이 가장 큰 강원도를 중심으로 2003년부터 2016년까지 총 14년의 산불 자료를 이용하였다. 기상자료의 오차를 줄이기 위해 강원도를 9개의 구역으로 나누어 각 구역 관측소의 기상자료를 이용하였다. 9개의 구역으로 나누어 각 구역의 산불 예측 모형을 만들게 되면 산불이 발생한 날(majority)과 산불이 발생하지 않은 날(minority)의 비율 차이가 큰 불균형 문제가 발생한다. 불균형 문제에서는 모델의 성능이 떨어지는 현상이 발생할 수 있다. 이를 해결하기 위해 여러 샘플링 방법을 적용하였다. 또한 모델의 정확도를 높이기 위해 캐나다 산불 기상 지수(FWI)의 5가지 지수를 파생변수로 사용하였다. 모델링 방법은 통계적 방법인 로지스틱 회귀분석 방법과 머신러닝 방법인 random forest와 xgboost 방법을 사용하였다. 각 구역의 최종모델의 선택기준을 정확도, 민감도, 특이도를 고려하여 정했으며, 9개 구역의 예측 결과는 산불이 발생한 104건 중 80건의 발생 예측에 성공하였으며 산불이 발생하지 않은 9758건 중 7426건의 발생하지 않음을 예측했다. 전체의 정확도는 76.1%였다.

도입 마(Dioscorea alata L.)의 특성 분석 (Characteristics of Dioscorea alata L. Introduced from Tropical and Subtropical Regions)

  • 장광진;유기억;박철호;박종인;홍규현;박주현
    • 현장농수산연구지
    • /
    • 제3권1호
    • /
    • pp.48-69
    • /
    • 2001
  • 1997년 부터 한국농업전문학교에서 수집하여 재배되고 있는 마 (Dioscorea alata L.) 계통 중 품질이 우수하고 이용 가치가 기대되는 33개 계통에 대한 특성을 조사하였으며, 형태적 차이를 보이는 19개 계통에 대한 RAPD분석을 실시하였다. 1. 주당 괴경의 전체 무게는 최대 2,147g (No.36), 최소 90g (No.20)으로 평균 610g이었다. 주당 평균 괴경수는 2.8개였으며 최대 4.7개, 최소 1.3개였다. 괴경중은 평균 363g이었으며 최대 1200g, 최소 70g이었다. 2. 괴경의 육질은 백색, 담황색 및 적자색 3가지 패턴을 보였으며, 잎은 녹색, 진녹색 및 담녹색으로 분류되었다. 3. RAPD 분석에 사용된 총 113개 primers 중 12개 primer 만이 모든 분류군에서 증폭되었다. 이를 통하여 93개의 밴드를 얻었으며 69개 밴드는(71.0%) polymorphic 하게 나타났다. 4. 유집분석 결과 19개 계통은 유사도 지수 값 0.66~0.90의 범위로 나타났으며, 크게 2개의 그룹, 즉 인도네시아와 가고시마에서 도입된 8개의 계통이 포함된 그룹과, 유사도지수 0.70~0.90의 범위를 갖는 Nauru, Palau Is., Okinawa와 Papua New Guinea에서 도입된 11 계통이 포함된 그룹으로 대별되었다.

미래토지이용 및 기후변화에 따른 하천유역의 유출특성 분석 (Analysis of Future Land Use and Climate Change Impact on Stream Discharge)

  • 안소라;이용준;박근애;김성준
    • 대한토목학회논문집
    • /
    • 제28권2B호
    • /
    • pp.215-224
    • /
    • 2008
  • SLURP 준 분포형 수문모형을 이용하여 예측된 토지이용 자료와 미래 기후변화 시나리오에 의한 기상자료 및 식생지수 정보를 고려한 상태에서 하천유역의 유출에 미치는 영향을 분석하였다. 경안천 경안수위관측소 상류유역($260.4km^2$)을 대상으로 4개년(1999-2002) 동안의 일별 유출량 자료를 바탕으로 모형의 보정(1999-2000)과 검증(2001-2002)을 실시하였다. 토지이용 예측은 1996년, 2000년, 2004년의 Landsat TM 및 ETM+ 위성영상을 이용하여 CA-Markov 기법으로 검증(2004)을 실시한 후, 미래의 토지이용(2030, 2060, 2090)을 예측하였다. 예측된 토지이용은 시간이 경과할수록 산림과 논은 지속적으로 감소하고 도시, 초지, 나지 등은 증가하는 경향을 보였다. 미래의 식생정보 예측을 위하여 NOAA/AVHRR 위성영상으로부터 추출된 월별 NDVI(1998-2002)와 월평균기온간의 선형 회귀식을 도출하여 미래의 식생지수 정보(2030, 2060, 2090)를 추정하였다. IPCC SRES A2, B2 기후변화 시나리오에 대한 CCCma CGCM2 모의결과 값(2030s, 2060s, 2090s)을 Stochastic Spatio-Temporal Random Cascade Model(SST-RCM) 기법을 이용하여 downscaling 한 뒤 하천유출의 변화를 분석한 결과, 기후변화에 따른 하천유출율은 1999-2002년의 59%에 비해 미래에는 13%~34%로 감소하는 것으로 모의되었고, 반면에 토지이용의 변화에 대한 유출율은 0.1%~1% 증가하였다.