• 제목/요약/키워드: Outlier Analysis

검색결과 236건 처리시간 0.026초

대표농도경로 시나리오에 의한 미래 강수량의 지역빈도해석 (Regional Frequency Analysis for Future Precipitation from RCP Scenarios)

  • 김덕환;홍승진;최창현;한대건;이종소;김형수
    • 한국습지학회지
    • /
    • 제17권1호
    • /
    • pp.80-90
    • /
    • 2015
  • 기후변화로 인해 강우 패턴과 강우강도의 변동성이 커지고 있으며, 도시화 및 산업화에 따른 불투수면적의 증가로 인해, 집중호우에 따른 도시침수와 홍수피해가 심화될 것으로 예상하고 있다. 따라서 본 연구에서는 홍수방어 대안 설정을 위한 설계 강수량(design rainfall) 또는 확률강수량에도 변화가 예상되므로 지역빈도해석을 통해 미래 확률강수량을 산정 및 분석하고자 한다. 기상청 산하 30년 이상의 관측치를 갖고 있는 58개 지점을 대상으로 과거 관측자료를 수집하고, 기후변화를 고려한 미래 확률강수량 추정을 위해 대표농도경로(RCP) 시나리오에 의한 강수량 자료를 이용하여 지역빈도해석을 실시하였다. 기후변화에 따른 강수량 자료의 편의를 제거하기 위하여 분위사상법(Quantile Mapping) 및 이상치 검정을 실시하였다. Hosking and Wallis(1997)가 제시한 L-moment방법을 이용하여 지역빈도 해석을 실시하였으며, 80년, 100년, 200년 빈도에 대한 미래 목표기간별 확률강수량을 산정하였다. 그 결과 21세기 말에 전국의 확률강수량이 현재의 관측 확률강수량에 비해 25 ~ 27% 상승하는 것으로 예측되며, 특히, 제주도 지역이 가장 크게 증가하는 것으로 분석되었다. 따라서 미래 기후변화로 인한 강수량의 증가와 도시화에 따른 유출특성 변화로 자연재해 발생 및 피해는 더욱 증가할 것으로 예상되며, 미래 홍수안전도를 위한 대비책 마련이 필요할 것으로 판단된다.

KMA와 ECMWF 자료를 이용한 연안 유의파고의 분포 및 추세분석 (Distribution and Trend Analysis of the Significant Wave Heights Using KMA and ECMWF Data Sets in the Coastal Seas, Korea)

  • 고동휘;정신택;조홍연;서경식
    • 한국해안·해양공학회논문집
    • /
    • 제29권3호
    • /
    • pp.129-138
    • /
    • 2017
  • 연안의 파랑환경은 해안지형의 변화, 해양생물의 서식조건, 해양구조물의 설계 등에 직접적인 영향을 미치는 매우 중요한 인자이다. 최근 기후변화로 인한 파랑환경의 변화도 예상되고 있는 상황에서, 가용한 자료를 이용한 파랑환경의 추세분석이 요구된다. 본 연구에서는 한국 연안 6개 지점(덕적도, 외연도, 칠발도, 마라도, 포항, 울릉도) 평상파랑의 부이관측 자료를 이용하여 장기 변화양상을 분석하였다. 먼저, 국내 기상청 해양기상부이 관측 자료의 이상치를 제거하기 위해 Rosner 방법을 사용하였으며, 이를 ECMWF 재해석 자료와 피어슨 상관분석을 수행하였다. 그 결과, 해양기상부이와 ECMWF 자료간의 상관성은 0.849~0.938로 나타났다. 한편, 맨-캔달 검정법을 이용하여 평상파랑의 장기변동 양상을 검토하였으며 그 결과, 덕적도, 외연도, 칠발도 지점은 변동이 없는 것으로 나타났지만, 마라도, 포항, 울릉도 지점은 증가하는 경향을 보였다.

Molecular Classification and Characterization of Human Gastric Adenocarcinoma through DNA Microarray

  • Xie, Hongjian;Eun, Jung-Woo;Noh, Ji-Heon;Jeong, Kwang-Wha;Kim, Jung-Kyu;Kim, Su-Young;Lee, Sug-Hyung;Park, Won-Sang;Yoo, Nam-Jin;Lee, Jung-Young;Nam, Suk-Woo
    • Molecular & Cellular Toxicology
    • /
    • 제3권3호
    • /
    • pp.190-194
    • /
    • 2007
  • Gastric adenocarcinoma (GA) is a major tumor type of gastric cancers and subdivides into several different tumors such as papillary, tubular mucinous, signet-ring cell and adenosquamous carcinoma according to histopatholigical determination. In other hand, GA is also subdivided into intestinal and diffuse type of adenocarcinoma by the Lauren?fs classification. In this study, we have examined differential gene expression pattern analysis of three histologically different GAs of 24 samples by using DNA microarray containing approximately 19000 genetic elements. The hierarchical clustering analysis of 24 gastric adenocarcinomas (12 of intestinal type, 7 of diffuse type and 5 of mixed type) resulted in two major subgroup on dendrogram, and two subgroups included most of intestinal and diffused type of GAs respectively. Supervised analysis of 19 intestinal and diffuse type GAs by using Wilcoxon rank T-test (P<0.01) resulted in 100 outlier genes which exactly separated intestinal and diffuse type of GA by differential gene expression. In conclusion, genome-wide analysis of gene expression of GAs suggested that GAs may subclassify as intestinal and diffused type of GA by their characteristic molecular expression. Our results also provide large-scale genetic elements which reflect molecular differences of intestinal and diffuse type of GAs, and this may facilitate to understand different molecular carcinogenesis of gastric cancer.

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

확률가중모멘트의 차수 변화에 따른 홍수량 변동 특성 분석 (Analysis on Characteristics of Variation in Flood Flow by Changing Order of Probability Weighted Moments)

  • 맹승진;황주하
    • 한국산학기술학회논문지
    • /
    • 제10권5호
    • /
    • pp.1009-1019
    • /
    • 2009
  • 본 연구에서는 우리나라 수위관측소들 중에서 관측 유량이 검증된 총 19개 유역을 선정하고 관측된 홍수량을 사용하여 적정 설계홍수량을 유도함으로써 우리나라의 설계홍수량 특성을 분석하였다. 대상유역별로 관측개시 년도에서부터 분석 시작년을 기준으로 1년씩 증가 시키는 점진적 구성 방식으로 연최대홍수량에 대한 빈도분석을 실시하기 위해, 변동특성을 이동평균법에 의해 분석하였다. 19개 대상유역에 대한 연최대홍수량 계열 구성기간별로 기본통치를 산정하고 독립성, 동질성 및 Outiler 검정을 실시하였다. Gumbel, Generalized Extreme Value, Generalized Logistic 및 Generalized Pareto 분포의 적합도 검정을 LH-모멘트비도와 Kolmogorov-Smirnov 검정에 의해 수행하였다. 적정 확률분포로 선정된 GEV 분포의 매개변수를 확률가중모멘트의 치수 변화에 의한 L, L1, L2, L3 및 L4-모멘트법에 의해 추정하고 대상유역 및 연최대홍수량 계열 구성 기간별 설계홍수량을 유도하였다. 본 연구에서 사용한 변동률 분석에 따라 최근 지구온난화에 따른 우리나라 기후 변화를 고려한 적절한 수리구조물의 설계 조건변경시기는 2002년 전후로 하여야 할 것이다.

인공지능과 국토정보를 활용한 노인복지 취약지구 추출방법에 관한 연구 (A Study on the Methodology of Extracting the vulnerable districts of the Aged Welfare Using Artificial Intelligence and Geospatial Information)

  • 박지만;조두영;이상선;이민섭;남한식;양혜림
    • 지적과 국토정보
    • /
    • 제48권1호
    • /
    • pp.169-186
    • /
    • 2018
  • 급속한 고령화 사회에서 노인인구가 갖는 사회적 영향력은 더욱 가속화될 것이다. 본 연구에서는 인공지능 방법론 중 머신러닝, 인공신경망, 국토정보 분석을 통해 노인복지 취약지구를 추출하는 방법론을 정립하는데 목적을 두었다. 분석방향 정립을 위해 65세 이상 노인, 공무원, 노인복지 시설물 담당자와 인터뷰 후 방향을 설정하였다. 경기도 용인시를 대상으로 500 m 공간단위 벡터 기반 격자에 15분 이내 지리적 거리 수용력, 노인복지 향유도, 공시지가, 이동통신 기반 노인활동을 지표로 설정하였다. 10단계 군집형성 후 모의학습 결과 RBF 커널 알고리즘을 활용한 머신러닝 서포트 벡터머신에서 83.2%의 예측정확도가 나타났다. 그리고 역전파 알고리즘을 활용한 인공신경망에서 높은 상관성 결과(0.63)가 나타났다. 변수간 공간적 자기상관성을 분석하기 위해 지리적 가중회귀분석을 수행했다. 분석결과 결정계수가 70.1%로 모형으로 나타나 설명력이 우수한 것으로 나타났다. 변수의 공간적 이상값 여부와 분포패턴을 검토하기 위해 국지적인 공간적 자기상관성 지수인 Moran's I 계수와 Getis-Ord Gi 계수를 분석하였다. 분석결과 용인시 신도시인 수지 기흥구에서 노인복지 취약지구가 발생하는 특성을 보였다. 본 연구의 인공지능 모의방법과 국토정보 분석의 연계는 최근 정부의 지역여건을 고려한 노인복지 불균형을 해결하는데 활용될 수 있을 것이다.

L-모멘트법을 이용한 지역홍수빈도분석을 통한 금강유역 미계측 유역의 설계홍수량 산정 (Estimating design floods for ungauged basins in the geum-river basin through regional flood frequency analysis using L-moments method)

  • 이진영;박동혁;신지예;김태웅
    • 한국수자원학회논문집
    • /
    • 제49권8호
    • /
    • pp.645-656
    • /
    • 2016
  • 본 연구에서는 금강유역에 대한 지역홍수빈도분석을 실시하고 재현기간에 따른 홍수량을 추정하는 관계식을 제안하였다. 유역 내 유량자료의 수문학적 독립성과 동질성에 대한 검증을 위하여 Lag-1 자기상관성 분석, 동질성 검정, 이상치 검정, 불일치척도 검정을 수행하였다. 검정 결과, 금강유역의 대상 관측소들은 시간에 대하여 독립적이고 동질적 모집단에 속하며 이상치는 없었다. 일반 극치 분포(GEV), 3변수 대수정규 분포(LN-III), 피어슨-III 분포(P-III), 일반 로지스틱 분포(GLO), 일반 파레토 분포(GPA) 등 5개의 3변수 확률분포함수에 대한 L-모멘트비도와 평균가중거리(AWD), 그리고 $Z^{DIST}$ 적합도 산정 결과, GLO 분포함수가 금강유역의 최적 확률분포형으로 선정되었다. GLO 분포를 바탕으로 지역홍수빈도를 추정하는 회귀모형을 제안하였고, 강경 관측소의 관측 유량을 이용하여 회귀모형의 적용성을 검증하였다.

근적외선 분광법을 이용한 산지방목지 목초시료 화학적 성분 분석에 관한 연구 (Studies on Predicting Chemical Composition of Permanent Pastures in Hilly Grazing Area Using Near-Infrared Spectroscopy)

  • 박형수;이효진;이효원;고한종;정종성
    • 한국초지조사료학회지
    • /
    • 제37권2호
    • /
    • pp.154-160
    • /
    • 2017
  • 본 연구는 산지방목초지에서 채취한 목초 및 야초 혼합시료의 화학조성분석의 근적외선분광법 이용의 가능성을 탐색하기 위하여 실시하였다. 충남 서산의 한우개량사업소의 방목초지에서 2년간 386점의 목야초 혼합시료를 수집하였다. 재료를 이용하여 파장을 수집한 후 파장이 동일한 시료를 제외한 163점에 대해 습식분석을 하였다. 최적의 검량식 유도를 위하여 파장은 가시광선 및 근적외선 전대역을 사용한 것 그리고 가시광선대역을 사용하면서 동시에 T값을 2.5 및 1.5를 적용하여 최상의 검량식을 구하였다. 전체적으로 볼 때 근적외선 대역의 파장을 사용한 것이 검량식 결정계수값이 높았고 또한 검증식 역시 같은 경향이었다. T값은 습식분석치와 NIRS 예측치의 차가 더 적은 1.5를 적응하였을 때 검량 및 검증값이 더 높은 것으로 나타났다. 검량식의 $R^2$치는 0.48~0.93 사이 그리고 검증식은 0.35~0.88 사이였다. 조단백질, 조섬유, NDF에서 보다 만족스런 예측이 가능하였다.

올리고 마이크로어래이를 이용한 활성화된 인간 제대 정맥 내피세포의 유전자 발현 조사 (DNA Microarray Analysis of the Gene Expression Profile of Activated Human Umbilical Vein En-dothelial Cells.)

  • 김선용;오호균;이수영;남석우;이정용;안현영;신종철;홍용길;조영애
    • 생명과학회지
    • /
    • 제14권5호
    • /
    • pp.874-881
    • /
    • 2004
  • 혈관 신생은 암의 성장 및 전이뿐만 아니라 염증, 관절염, 건성, 동맥경화 등의 병적인 진행에 주요한 역할을 하며, 혈관신생 억제를 통한 암의 치료를 시도하는 연구들이 활발하게 진행되고 있다. 혈관 신생 시 내피세포의 증식, 이동을 유도하는 활성화 과정이 필수적으로 일어나는 것으로 알려져 있다 본 연구에서는 in vitro에서 내피세포를 배양하여, 각종 growth factor가 풍부한 배지에서 활성화 시켰을 때, 그렇지 않는 세포들과의 유전자 발현 형태를 비교 조사하였다. HUVEC을 70∼80% cofluency로 배양시킨 후에 endothelial cell growth supplement (ECCS), 20% fetal bovine serum, heparin이 첨가된 Ml99 배지에서 13 시간 활성화시킨 세포(AHUVEC)와 대조군 세포(RHUVEC)로부터 분리한 total RNA로부터 CDNA를 제작하였고, 이것을 18,864 개의 유전자가 올려져있는 인간 올리고 칩과 hybridization 반응을 시켰다. 반응된 유전자를 이용하여 random clustering분석을 실시한 결과, 활성화 시켰던 HUVEC과 그렇지 않은 HUVEC으로 dendrogram 상에서 두개의 subgroup으로 나뉘어 지는 것을 확인할 수 있었다. 최소 2배 이상 발현 변화가 있는 유전자 122종이 활성화 시켰던 HUVEC으로부터 추출되었다. 이중에서 기능이 알려진 32 개의 유전자는 활성화시킨 HUVEC에서 발현이 증가하였고, 38 개의 유전자 발현은 감소하였다. 흥미롭게도 세포 증식과 이동, 염증, 면역반응에 관련한 유전자의 발현이 증가된 반면에 세포 흡착과 혈관 조직과 기능에 관련한 유전자의 발현이 감소된 것이 관찰되었다. 예상외로 규명이 잘된 혈관신생 인자와 관련한 유전자들의 발현에는 크기 차이를 보이지 않았으나, Eph-B4의 발현은 약 4 배 감소된 것으로 관찰되었다 또한, 2배 이상 발현에 차이를 보이고 기능이 알려져 있지 않은 유전자 52종이 발견되었다. 따라서, 이러한 연구 결과로부터 새로운 혈관 표적 물질 개발에 대한 기회가 제공될 수 있을 것이라 사료된다.

근적외선 분광분석기를 이용한 잔디 생체잎의 질소 함량 측정을 위한 검량식 개발 (Prediction from Linear Regression Equation for Nitrogen Content Measurement in Bentgrasses leaves Using Near Infrared Reflectance Spectroscopy)

  • 차정훈;김경덕;박대섭
    • 아시안잔디학회지
    • /
    • 제23권1호
    • /
    • pp.77-90
    • /
    • 2009
  • Near Infrared Reflectance Spectroscopy(NIRS)는 짧은 시간 안에 식물의 다양한 영양소를 동시에 정확하고 빠르게 측정할 수 있다. 본 연구는 creeping bentgrass 'CY2' 엽의 여러 가지 기본 요소의 값을 예측하기 위해서 NIRS(근적의선 분광분석기)를 사용하여 측정하였다. 그 결과, 질소와 수분 그리고 탄수화물의 $r^2$은 각각 0.892, 0.925, 0.971이었다. 검량식에 대한 검증에서 $r^2$이 높은 상관관계를 나타냈으므로, 잔디에서 더 많은 연구를 위한 실용화 가능성을 확인 할 수 있었다.