• 제목/요약/키워드: 결측정보

검색결과 137건 처리시간 0.024초

버스정보 결측시 검지기 자료를 통한 버스 통행시간의 산정 (Estimation of Bus Travel Time Using Detector for in case of Missed Bus Information)

  • 손영태;김원기
    • 한국ITS학회 논문지
    • /
    • 제4권3호
    • /
    • pp.51-59
    • /
    • 2005
  • 버스의 서비스 질을 향상시키기 위해서 시행중인 버스정보시스템은 버스의 도착 예정시간을 산정하기 위해서 일정주기동안 통행한 버스의 데이터를 바탕으로 신경망 모형, 칼만필터링, 이동평균법등의 알고리즘을 사용하여 예측한다. 하지만 버스의 데이터 결측으로 인하여 버스의 도착 예정 시간을 산정하기 어려울 때는 버스의 시간대별 패턴 데이터를 구축하여 이를 활용하지만, 일반적으로 오차의 범위가 크다. 따라서 본 연구에서는 도착 예정 시간을 산정하기 위해 링크에 설치된 대기행렬 검지기 자료를 이용하여 버스의 링크통행 시간을 산정한다. CORSIM Version 5.1 시뮬레이션 패키지를 이용하여 검지기 지점 속도를 보정하여 검지기 지점속도를 바탕으로 버스의 통행시간을 산정한다.

  • PDF

에센셜 그래프를 바탕으로 한 격자 조건부 독립 모델 (Lattice Conditional Independence Models Based on the Essential Graph)

  • Ju Sung, Kim;Myoong Young, Yoon
    • 한국산업정보학회논문지
    • /
    • 제9권2호
    • /
    • pp.9-16
    • /
    • 2004
  • 결측치가 존재하는 비 단조형 데이터에 대한 패턴 분석과 비 내포형 종속 회귀 모형 분석에 격자 조건부 독립 모델이 최근 도입되고 있다. 이러한 접근 방법은 데이터 패턴 분석에 성공적으로 적용되고 있지만 격자 조건부 독립 모델을 찾는 계산적 부담이 따른다. 본 논문에서는 이러한 단점을 극복하기 위하여 에센셜 그래프를 바탕으로 격자 조건부 독립 모델(LCIM)을 찾는 새로운 방법을 제안한다. 또한, LCIM 클래스가 특정한 비 순환 방향 그래프 모델과 마르코프 동등한 모든 추이적 비 순환 방향 그래프의 모델 클래스와 일치함을 밝혔다.

  • PDF

계절성 임베딩을 고려한 STL-Attention 기반 트래픽 예측 (STL-Attention based Traffic Prediction with Seasonality Embedding)

  • 염성웅;최철웅;콜레카르 시바니 산제이;김경백
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.95-98
    • /
    • 2021
  • 최근 비정상적인 네트워크 활동 감지 및 네트워크 서비스 프로비저닝과 같은 다양한 분야에서 응용되는 네트워크 트래픽 예측 기술이 네트워크 통신 문제에 의한 트래픽의 결측 및 네트워크 유저의 불규칙한 활동에 의한 비선형 특성 때문에 발생하는 성능 저하를 극복하기 위해 딥러닝 신경망에 대한 연구가 활성화되고 있다. 이 딥러닝 신경망 중 시계열 딥러닝 신경망은 단기 네트워크 트래픽 볼륨을 예측할 때 낮은 오류율을 보인다. 하지만, 시계열 딥러닝 신경망은 기울기 소멸 및 폭발과 같은 비선형성, 다중 계절성 및 장기적 의존성 문제와 같은 한계를 보여준다. 이 논문에서는 계절성 임베딩을 고려한 주의 신경망 기반 트래픽 예측 기법을 제안한다. 제안하는 기법은 STL 분해 기법을 통해 분해된 트래픽 트랜드, 계절성, 잔차를 이용하여 일별 및 주별 계절성을 임베딩하고 이를 주의 신경망을 기반으로 향후 트래픽을 예측한다.

수온 관측 자료의 효율적인 이상 자료 탐지 (Efficient Outlier Detection of the Water Temperature Monitoring Data)

  • 조홍연;정신택;고동휘;손경표
    • 한국해안·해양공학회논문집
    • /
    • 제26권5호
    • /
    • pp.285-291
    • /
    • 2014
  • 연안의 수온 모니터링 자료는 이상자료 및 결측을 포함하고 있기 때문에 통계정보를 왜곡할 수 있다. 다양한 이상자료 감지 기법이 제안되고 있으나 결측이 없고 이상자료에 대한 사전정보를 가정하고, 어떤 적용기법은 과도한 계산시간이 소요되기 때문에 적용에 제한이 따른다. 본 연구에서는 방대한 자료에서도 효과적으로 이상자료를 감지할 수 있는 실용적인 Robust 모형을 제안하였다. 이 모형은 계산시간을 크게 저감하는 부분자료 추출기법을 이용한 어림성분 추정과정 및 어림성분으로부터 계산되는 잔차성분으로부터 이상자료를 반복적으로 진단하여 제거하는 부분으로 구성되어 있다. 이 모형의 성능평가는 새만금호에서 5분 간격으로 관측한 2년 동안의 수온 자료를 이용하여 수행하였다. 모형 적용결과, 이상자료가 전체자료에서 차지하는 비율은 1.6-3.7% 정도로 파악되었으며, 전체적으로 대부분의 이상자료가 제거되는 것으로 파악되었다. 또한 어림성분 추정과정의 반복적용은 Long-span 조건을 먼저 적용하는 것이 효과적인 것으로 파악되었다.

협력적 여과 시스템에서 귀납 추리를 이용한 순위 결정 (Ranking by Inductive Inference in Collaborative Filtering Systems)

  • 고수정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권9호
    • /
    • pp.659-668
    • /
    • 2010
  • 협력적 여과 시스템은 새로운 사용자의 행위를 파악하고 사용자가 흥미로워할 아이템을 추천해주기 위해서 사용자들에 대한 새로운 정보를 필요로 한다. 이러한 정보를 획득하기 위하여 협력적 여과 시스템은 기존 데이터를 기반으로 학습을 하고, 그 결과에 따라 사용자에 대한 새로운 정보를 찾아낼 수 있다. 본 논문에서는 사용자에 대한 새로운 정보를 획득하기 위한 방법으로 귀납적 추리 방법을 제안하고, 추리된 사용자의 정보를 이용하여 아이템의 순위를 결정한다. 제안된 방법에서는 귀납적 기계 학습 방법인 NMF를 이용하여 사용자를 학습시켜서 모든 사용자들을 그룹으로 군집시키고, 각 그룹으로부터 카이제곱을 이용하여 그룹의 특징을 추출한다. 다음으로, 귀납 추리 방법의 하나인 베이지언 확률모델을 이용하여 새로운 사용자가 입력한 평가값과 각 그룹의 특징을 기반으로 사용자를 적합한 그룹으로 분류한다. 마지막으로, 사용자가 결측한 아이템을 대상으로 로치오(Rocchio) 알고리즘을 적용하여 아이템의 순위를 결정한다.

디지털 협력수업이 독서 리터러시에 미치는 효과 연구 (A Study on the Effects of Digital Co-Teaching on Reading Literacy)

  • 박주현;강봉숙
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.211-230
    • /
    • 2023
  • 본 연구의 목적은 온라인으로 진행된 교사 간 디지털 협력수업이 학생들의 독서 리터러시 향상에 어떠한 효과가 있었는지를 확인하는 데 있다. 연구의 목적을 달성하기 위하여 고등학교 1학년 학생을 대상으로 사전검사를 하였고, 2차시에 걸쳐 교사 간 디지털 협력수업을 실시한 후 사후검사를 하였다. 통계분석을 위해 사전과 사후 검사에서 결측값이 없는 101명의 데이터를 활용하였다. OECD의 PISA 독서 리터러시 평가틀과 요인분석을 통해 표현능력과 이해능력 및 정보활용능력으로 구성된 독서 리터러시 검사 도구를 개발하였으며 자기보고 식으로 독서 리터러시 역량의 변화도를 측정하였다. 분석결과, 디지털 협력수업은 고등학생의 표현능력과 이해능력 및 정보활용능력에 통계적으로 유의미하게 긍정적인 영향을 미치고 있음을 확인하였다. 본 연구는 OECD가 주관하는 PISA의 독서 리터러시를 향상시키는 방법으로 디지털 협력수업이 적용될 수 있음을 보여주고 있다는 데 의의가 있다.

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

범주형 자료에서 경험적 베이지안 오분류 분석 (Empirical Bayesian Misclassification Analysis on Categorical Data)

  • 임한승;홍종선;서문섭
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.39-57
    • /
    • 2001
  • 범주형 자료에서 오분류는 자료를 수집하는 과정에서 발생될 수 있다. 오분류되어 있는 자료를 정확한 자료로 간주하여 분석한다면 추정결과에 편의가 발생하고 검정력이 약화되는 결과를 초래하게 되며, 정확하게 분류된 자료를 오분류하고 판단한다면 오분류의 수정을 위해 불필요한 비용과 시간을 낭비해야 할 것이다. 따라서 정확하게 분류된 표본인지 오분류된 표본인지를 판정하는 것은 자료를 분석하기 전에 이루어져야할 매우 중요한 과정이다. 본 논문은 I$\times$J 분할표로 주어지는 범주형 자료에서 두 변수 중 하나의 변수에서만 오분류가 발생되는 경우에 오분류 여부를 검정하기 위해서 오분류 가능성이 없는 변수에 대한 주변합은 고정시키고, 오분류 여부를 가능성이 있는 변수의 주변합을 Sebastiani와 Ramoni(1997)가 제안한 Bound와 외부정보로 표현되는 Collapse의 개념, 그리고 베이지안 방법을 확장하여 자료에 적합한 모형과 사전정보를 고려한 사전모수를 다양하게 설정하면서 재분류하는 연구를 하였다. 오분류에 대한 정보를 얻기 위해서 Tenenbein(1970)에 의해 연구된 이중추출법을 이용하여 오분류 검정을 위한 새로운 통계량을 제안하였으며, 제안된 오분류 검정통계량에 관한 분포를 다양한 모의실험을 통하여 연구하였다.

  • PDF

교통 통계 정보를 이용한 속도 패턴 예측에 관한 연구 (A Study for Traffic Forecasting Using Traffic Statistic Information)

  • 최보승;강현철;이성건;한상태
    • 응용통계연구
    • /
    • 제22권6호
    • /
    • pp.1177-1190
    • /
    • 2009
  • 도로의 성능을 측정는데 있어서, 주행속도는 가장 중요한 정보가 된다. 또한 도로 교통의 정보를 제공하는데 있어서 현 시점의 교통정보와 더불어 향후 예측되는 교통정보를 함께 제공하는 것은 보다 정확한 예측 시간과 구간을 제공하기 위한 차별화된 기능이라 할 수 있다. 본 연구에서는 그 동안 축적된 도로 구간별 속도 자료를 이용하여 속도 패턴을 다양하게 분석하고 퓨리에 변환 및 삼각함수를 설명변수로 하는 시계열 회귀모형을 이용한 예측모형을 개발하여 구간별 및 시간대별 평균 속도를 예측하였다. 이와 더불어 보다 정확한 예측을 위하여 결측치에 대한 대체 방법 및 특이치 처리 방법을 함께 고려하였고 방대한 데이터에 대한 효율적인 분석을 위하여 유사 속도 구간에 대한 그룹핑(grouping) 방법도 제안하였다.

한국 시민단체의 성장에 대한 양적 연구 (Growth of Civic Organizations in South Korea)

  • 신동준;김광수;김재온
    • 한국조사연구학회지:조사연구
    • /
    • 제6권2호
    • /
    • pp.75-101
    • /
    • 2005
  • 본 논문은 1997년과 2000년 이차에 걸쳐서 출간된 $\ll$한국 민간단체 총람\gg$ 자료를 소개하고, 이 자료의 분석을 통해 한국 시민단체의 성장에 대한 양적 연구를 수행한다. 시민단체 성장에 대한 주요 지표가 될 수 있는 회원수 정보와 설립연도 정보의 질을 데이터에 나타난 결측율을 중심으로 검토한다. 회원수 정보를 통해서 1996년에서 1999년 사이의 회원수 변화를 활동 분야에 따라 알아보고 그 결과를 시민단체의 성장이라는 측면에서 논의한다. 분석 결과 우리나라 시민단체 성장의 주축이라고 여겨지고 있는 시민사회 분야에서, 특히 전국적 규모의 단체들을 중심으로 많은 회원 감소가 있었던 것으로 보인다. 설립되는 단체 수의 지속적인 증가 추세와 맞물려, 이 결과는 계속적으로 그 숫자가 증가하고 있는 시민단체들 사이에 제한된 자원을 둘러싼 경쟁이 있음을 반영한다고 본다. 이러한 경향을 생태학적 조직이론에 근거해서 논의하고, 1945년부터 1996년까지 시민단체의 수적 성장 패턴을 설립연도 정보를 이용하여 간접적으로 확인한다. 이 의사 성장 곡선(pseudo-growth curve)을 생태학적 조직 이론에 근거해서 로지스틱 성장 곡선 모형으로서 제시하고, 비선형적 회귀분석을 통해 활동 범위와 분야별로 단체들의 수적 증가 추이를 비교해 본다.

  • PDF