• 제목/요약/키워드: 자료분석

검색결과 46,274건 처리시간 0.071초

AVL을 이용한 구간통행시간 산출기법 개발 (A new approach to estimate the link travel time by using AVL technology)

  • 김성인;이영호;남기효
    • 대한교통학회지
    • /
    • 제17권2호
    • /
    • pp.91-103
    • /
    • 1999
  • 이 연구는 자동 차량위치 측정기법(Automatic Vehicle Location, AVL)을 이용해서 수집한 교통상황자료를 가지고 구간 통행시간을 산출하는 알고리즘을 개발한다. AVL기법을 이용하는 경우, 처리해야 할 자료량이 많아서 실시간에 정보를 산출하는 것이 힘들다. 따라서 이 연구는 처리해야 할 자료량을 가능한 한 줄이고 자료량이 적은 경우에도 효율적인 구간통행시간을 산출하는 알고리즘을 제시한다. 이 연구의 방법론은 크게 4가지인데, 첫째, 해석 기법, 둘째, 회귀분석, 셋째, 인공지능 및 전문가 시스템, 넷째, 통계분석이다. 이 방법론을 이용해서 세 단계 알고리즘을 개발하는데, 첫째는 실시간 분석통계 알고리즘, 둘째는 과거자료분석 알고리즘, 셋째는 자료응합 알고리즘이다. 이 알고리즘 가운데 자료융합 알고리즘 결과가 산출하고자 하는 구간 통행시간이다. 실시간 분석통계 알고리즘은 연속하는 세 개 구간의 통행 패턴을 이용해서 가운데 구간의 통행시간을 산출하는 방법을 제시한다. 또 실시간 분석통계 알고리즘으로 산출하지 못한 구간은 인접구간 상관도 정보를 이용해서 구간통행시간을 추정한다. 과거자료분석 알고리즘은 회귀분석을 이용해서 시간대별 통행시간 평균과 분산을 구하고, 이 결과를 바탕으로 인접구간 상관도 정보를 오프라인으로 구하는 알고리즘이다. 자료융합 알고리즘은 2가지 단계를 거치는데, 그것은 실시간 자료융합과 최종 자료융합이다. 실시간 자료융합은 실시간에 가까운 자료원의 실시간 분석통계 알고리즘 결과 패턴과 인접구간 상관도 정보를 이용한 구간통행시간 추정 결과를 이용해서 패턴에 따라 다른 방법으로 융합을 하는 알고리즘을 개발한다. 최종 자료융합은 실시간 자료융합 결과와 회귀분석 결과의 패턴을 이용해서 구간 통행시간을 산출한다. 이 연구를 기존 연구와 비교할 때, 세 가지 독차성이 있다. 첫째는 연속하는 세 구간 통행 패턴을 분석하였기 때문에 기존의 노드의존 방식을 탈피하였다는 점이다. 따라서 자료량이 적은 경우도 믿을만한 통행시간을 산출할 수 있다는 것이다. 둘째는 인접구간 상관도 정보를 구간통행시간 산출에 이용하였기 때문에 자료를 효율적으로 이용할 수 있다는 점이다. 셋째는 자료원 패턴을 분류하고 전문가 시스템을 이용하여 자료융합 하였기 때문에 수행속도가 빠르고, 신뢰성있는 정보를 제공한다는 점이다. 이 연구는 개발한 알고리즘 정확도를 검증하기 위해서 두 가지 검증방법을 이용하였다. 첫째는 시뮬레이션을 이용한 것이고, 둘째는 실제 주행조사 분석을 이용한 것이다. 두 가지 검증 결과는 알고리즘 정확도를 보여준다.

  • PDF

안양천 유역의 실시간 수문모니터링 자료관리시스템 개발 (Development of Hydrologic Data Aquisition and Management System(HDAMS) in Anyangcheon watershed)

  • 이경도;김유진;김남일;이길성
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.2029-2033
    • /
    • 2007
  • 오늘날 특정 유역에서의 수문현상 및 수문순환에 대한 분석을 위한 연구가 활발히 진행되고 있다. 이를 위해서는 수문자료의 관측은 반드시 수반되어야 하며, 관측자료의 품질관리 및 원시자료의 관리 등이 요구되고 있는 실정이다. 관측된 수문자료의 품질관리라 함은 자료의 신뢰도 분석과 자료의 보완의 두 과정을 포함한다. 여기서, 신뢰도 분석이라 함은 자료 속에 포함된 불확실성을 판별하는 작업을 의미하며, 자료의 불확실성은 위에서 언급된 자료의 불충분 및 불안정을 제외한 부정확, 불일관성에서 비롯된다. 자료의 보완이라 함은 자료의 신뢰도 분석을 통하여 자료 속에 포함된 불확실한 성분들을 찾아내고, 이를 제거한 후 완전한 자료로 대체하고, 자료가 결측된 경우 공백을 연결함으로써 자료의 완전성을 유지하거나 또는 불충분한 자료를 확장하는 일련의 보완작업이라고 정의한다. 자료의 품질을 결정하는 주요 인자는 크게 관측소 관리의 하드웨어적인 측면과 자료 분석의 소프트웨어적인 측면이 있다. 하드웨어적인 측면에서의 수문자료 품질관리를 위해서 본 과제에서는 현장에 설치된 수위계, 강우량계의 센서 등에 대한 장비를 점검하고, 현장실측을 통해 지속적으로 측정값을 보정해주는 역할을 수행하고 있으며, 소프트웨어적인 측면에서 수문자료의 품질관리를 위해서는 수문자료의 수집 단계부터 시작하여 데이터베이스 저장, 필터링, 통계분석, 웹 및 C/S(Client Server)를 통한 배포 등의 일련의 자료 처리 과정을 수행할 수 있는 수문자료관리 프로그램을 웹 시스템과 C/S로 분류하여 정의내릴 수 있다. 본 연구에서는 수문자료의 관리자 입장에서의 보다 효율적이고 체계적으로 자료를 관리하고 분석하기 위한 방안으로 수문자료관리시스템(Hydrologic Data Aquisition and Management System, HDAMS)을 개발하였다. 이 시스템은 안양천 유역에서 시범 적용하고 있으며, 범용성을 전제로 개발되었다. 또한 수문자료 관리 프로그램의 DB 구조 및 DB 자료를 활용한 다양한 분석기능은 갖도록 설계하였으며 계획된 데이터베이스 구조를 바탕으로 계측기 인터페이스와 사용자 인터페이스, 데이터베이스 간의 연동이 원활히 이루어지도록 개발하고자 한다.

  • PDF

교육 빅데이터 관련 연구 동향 (Current Status of Educational Big Data Research)

  • 이은경;박도영;최인봉
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.175-176
    • /
    • 2014
  • 본고에서는 교육 빅데이터의 개념, 가치, 처리 기술 및 분석 방법 등을 탐색하였다. '온라인과 오프라인 교수 학습 활동의 투입, 과정, 산출을 통해 생산되는 국가, 지역, 학교, 교사, 학생 수준의 자료'로 정의할 수 있는 교육 빅데이터는 Hadoop으로 대표되는 분산 컴퓨팅 기술을 통해 효율적으로 처리할 수 있다. 대규모 교육 자료에서 의미있고 유용한 결과를 도출하기 위해 주로 사용되는 분석 방법에는 교육 데이터 마이닝, 학습 분석학과 시각 자료 분석학이 있다. 교육 데이터 마이닝은 학생과 교사, 학교의 다양한 수준에서 자료를 폭넓게 분석하는 측면이 강한 반면에 학습 분석학은 학생 수준에서의 자료 분석에 더 초점을 맞추는 경향이 있으며, 시각 자료 분석학은 자료에 대한 분석 자체보다는 분석 결과를 효과적으로 표현하는 방식에 초점이 주어져 있다.

  • PDF

2010년 설마천 시험유역의 운영 (The Operation of the Seolma-Cheon Experimental Catchment of the 2010)

  • 김동필;이남훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.372-376
    • /
    • 2011
  • 본 연구는 설마천 시험유역(경기도 파주시 적성면 소재)을 운영하면서 수문현상을 관측하여 신뢰성 있는 수문자료를 지속적으로 획득하고 물순환 과정을 규명하는데 있다. 이를 위하여 2010년에도 지속적인 수문관측 및 측정을 하였으며, 수문자료의 품질 향상을 위한 관측기기의 유지관리와 수집된 자료의 처리절차를 통하여 신뢰성 있는 수문자료를 생성하고, 이들 자료를 바탕으로 유역의 수문특성을 분석하였다. 시험유역에서 생성되는 자료에는 6개 우량관측소의 우량자료, 2개 수위관측소의 하천수위 및 지하수위, 유량측정성과, 수질 자료, 1개 하천수위관측소의 부유사량 자료, 1개 기상관측소의 기상자료 등이 있으며, 이로부터 산정된 유역평균우량과 유량자료 등이 있다. 실시간 전송장비와 설마천 시험유역 홈페이지(http://seolmacheon.kict.re.kr)로 구성된 수문정보시스템을 통해 관측자료와 가공자료를 등록하였으며, 실시간 전송자료 제공은 물론 확정된 자료를 신청절차를 통해 일반에게 제공하고 있다. 확정된 강우-유출 자료를 이용하여 강우의 호우사상 분석(강우강도, 지속기간), 강우의 지속기간별 최대강우량, 각 지점간 강우량 비교, 강우의 시 공간분포 특성 분석, 월별 유출 및 주요 호우사상의 유출특성 분석 등 기본적인 강우-유출 특성을 분석하였다. 그리고, 유량측정성과의 불확실도 분석을 통하여 측정한 유량자료의 정확도 제고와 현장의 유량자료의 정확도를 개선하기 위하여 유량정보시스템(Parshall Flume, Argonaut-SW, Cableway System에 의한 유량정보 생성)을 운영 평가하였다. 또한, 수질, 부유사량의 특성 분석은 본 유역의 물질순환 해석을 위한 기초자료로 충분히 활용될 수 있다. 관측자료를 이용하여 유역의 유입량과 유출량에 대한 물수지 분석을 하였으며, 각 요소별 정량적인 값을 도출함으로써 물순환 과정을 해석 할 수 있는 기반을 구축하였다. 설마천 시험유역에서 축적된 수문자료는 자료의 공유를 통하여 자료의 검증을 확보함과 동시에 시험유역의 연구성과가 수자원 개발 분야에 활용되기 위해서는 지속적이고 안정적인 자료확보와 수문관측 기술개발을 위한 기반구축이 더욱더 필요한 상황이다.

  • PDF

시계열 자료의 웨이블릿 분석을 위한 모 웨이블릿의 선정문제 (Selection of a Mother Wavelet Using Wavelet Analysis of Time Series Data)

  • 이현욱;송성욱;주국화;이문석;유철상
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.259-259
    • /
    • 2019
  • 시계열 자료들을 분석하고자 하는 경우 자료가 정상성(stationarity)을 만족하는 경우는 드물다. 특히 계절성을 제거한 자료들에서는 정량화하기 어려운 주기성이 많이 관찰된다. 즉, 어떤 특정지역에서 나타나는 현상이 다른 기상 현상에 영향을 미칠 것은 자명한 일이나 그 관련성이 선형(linearity)일 가능성은 극히 드물다. 따라서 그들 사이의 관련성이 선형성에 근거한 지표들로 정량화되어야 한다. 이러한 문제점을 해결하기 위해서 다양한 방법이 사용되며 그중에서 웨이블릿 분석을 통해 본 연구를 진행하였다. 웨이블릿 변환(wavelet transforms)은 특수한 함수의 집합으로 구성되어 기존 웨이블릿 신호의 분석을 위해 사용되는 방법이다. 이 변환은 푸리에 변환에서 변형된 방법으로 특정한 기저 함수(base function)를 이용하여 기존의 시계열 자료를 주파수로 바꾸는 변환이다. 웨이블릿 변환에서 기저 함수를 모 웨이블릿이라고 하며 이를 천이, 확대 및 축소 과정을 통해 주파수를 구성한다. 웨이블릿 분석은 모 웨이블릿을 분해하고 재결합하여 시계열 분석을 할 수 있다. 모 웨이블릿 함수에는 Haar, Daubechies, Coiflets, Symlets, Morlet, Mexican Hat, Meyer 등의 여러 가지 종류의 모 웨이블릿 함수가 있으며 모 웨이블릿이 달라지면 결과가 다르게 나타난다. 기존에는 Morlet 웨이블릿을 주로 이용하여 주파수분석에 사용하여 결과를 도출하였다. 그리고 시계열 자료는 크게 백색잡음(White Noise), 장기기억(Long Term Memory), 단기기억(Short Term Memory)으로 나뉜다. 각 시계열 자료의 종류에 따라 임의의 시계열 자료를 산정하여 그에 따른 웨이블릿 분석을 통해 모 웨이블릿의 특성을 도출하였다. 본 연구에서는 웨이블릿 분석을 통해 시계열 자료의 최적 모 웨이블릿을 결정하고자 남방진동지수(SOI), 북극진동지수(AOI)의 자료를 이용하여 웨이블릿 분석을 시도하였다. 웨이블릿 분석은 모 웨이블릿에 따라 달라지는 결과를 토대로 분석하였으며 이를 정상성과 지속성에 따라 분류된 시계열에 적용하여 최적 모 웨이블릿을 결정하고자 하였다. 본 연구에서는 임의의 시계열 자료에서 설정한 최적의 모 웨이블릿을 AOI와 SOI와 같은 실제 시계열 자료에 대입하여 분석을 진행하였다. 본 연구에서는 시계열 자료의 종류를 구분하고 자료의 특성에 따라 가장 적합한 모 웨이블릿을 구하고자 하였다.

  • PDF

강수자료에 대한 변동성 및 경향성 해석 (Change and Trend Analyses of Rainfall Data)

  • 이상복;김경덕;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.696-700
    • /
    • 2004
  • 본 연구에서는 우리나라 주요 관측소의 연최대강수량과 연강수량을 내상으로 변동 및 경향을 분석하여 그 결과를 비교하였다. 강수 자료의 변화분석을 수행함에 있어 양질의 강수 자료를 수집하기 위하여 기상청 보유 관측소 중 30년 이상 강우 기록을 가지고 있는 관측소를 내상으로 연최대강수량과 연강수량 자료를 추출하였다. 강수 자료의 변화분석은 크게 2가지로 변동분석과 경향분석을 수행하였다. 변동분석은 강수 자료의 평균과 분산의 편차에 따른 변동점 가정을 이용하여 변동점 전${\cdot}$후 강수 자료의 평균과 분산 변화에 내하여 통계적 유의성을 검정하는 방법이다. 경향분석은 강수 자료의 증가 또는 감소의 경향을 매개변수적, 비매개변수적 방법으로 통계적 유의성을 검정하는 방법이다. 본 연구에서 수행한 변동 및 경향분석 결과 어떤 기후적 요인에 의하여 강수량이 변화했다는 길과는 통계적 유의성에서 확인되지 않았다. 그러나 강수량 도시(plot)를 통한 강수량의 변동 및 경향은 존재하는 것으로 나타났으며, 이는 빈도 해석에 의한 확률강수량 산정시 고려 대상이 된다.

  • PDF

2009년 설마천 시험유역의 운영 (A Study on the Operation of the Seolma-Cheon Experimental Catchment of 2009)

  • 김동필;이남훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1941-1945
    • /
    • 2010
  • 본 연구는 설마천 시험유역을 운영하면서 수문현상을 관측하여 신뢰성 있는 수문자료를 지속적으로 획득하고 물순환 과정을 규명하는데 있다. 이를 위하여 2009년에도 지속적인 수문(우량, 유량, 수질, 부유사량) 관측으로 자료의 품질 향상을 위한 관측기기의 유지관리와 수집된 자료의 처리절차를 통하여 수문자료를 생성하고, 이들 자료를 바탕으로 유역의 수문특성을 분석하였다. 시험유역에서 생성되는 자료에는 6개 우량관측소의 우량자료, 2개 수위관측소의 하천수위 및 지하수위, 유량측정성과, 부유사량, 수질 자료, 1개 기상관측소의 기상자료 등이 있으며, 이로부터 산정된 유역평균우량과 유량자료 등이 있다. 실시간 전송장비와 설마천 시험유역 홈페이지로 구성된 수문정보시스템을 통해 관측 자료와 가공자료를 데이터베이스화하였으며, 실시간 자료 제공은 물론 확정된 자료는 신청절차를 통해 일반에게 제공하고 있다. 관측된 강우-유출 자료를 이용하여 강우의 시 공간 분포 특성, 유출률 분석 등 기본적인 강우 및 유출 특성을 분석하였다. 유량측정성과의 불확실도 분석을 통하여 측정한 유량자료의 정확도 제고와 현장의 유량 자료의 정확도를 개선하기 위하여 유량정보시스템을 운영하였다. 또한, 수질, 부유사량의 특성 분석은 본 유역의 물질순환 해석을 위한 기초자료로 충분히 활용될 수 있다. 설마천 시험유역에서 축적된 수문자료는 자료의 공유를 통하여 자료의 검증을 확보함과 동시에 시험유역의 연구성과가 수자원 개발 분야에 활용되기 위해서는 지속적이고 안정적인 자료확보와 수문관측 기술개발을 위한 기반구축이 매우 필요한 상황이다.

  • PDF

GSIS를 활용한 교통사고 공간 분석 기법 적용에 관한 연구 (A Study on the Spatial Analysis method of Traffic Accident with GSIS)

  • 유지연;조기성;전형섭;최연웅
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2004년도 추계학술발표회 논문집
    • /
    • pp.441-444
    • /
    • 2004
  • 현재 우리나라에서는 이미 오래 전에 만들어진 도로교통사고 자료양식을 수정 없이 사용해오고 있으며, 이 교통사고 자료에 대한 정확한 분석과 세심한 통계 분석 체계가 구축되지 않고 있는 상황이다. 이를 위해 교통사고 발생과 관련된 교통사고처리 체계의 개선이 필요하다. 개성 방안으로 사고 현황 조사서인 104호 서식의 자료 항목을 공간적 관계나 자료간의 상관관계에 따라 연계하여 정보화하여 관리 및 분석 할 수 있는 방안을 제시하여 교통사고 자료를 지형공간정보체계 (GSIS, Geo-Spatial Information System)기반으로 구축하여 기존에 텍스트 형태의 자료 수집이 아닌 PDA를 이용하여 수신 받은 후 임시 저장된 자료를 사고 자료 양식에 맞게 입력 및 저장, 출력할 수 있는 시스템을 구축하였다. 또한, 교통안전정책 및 각종 사업에 필요한 자료로 이용되는 통계 자료를 교통사고 자료를 토대로 교통사고 발생원인 및 특징에 관하여 점, 선, 면의 공간 분석 기법을 적용한 분석 시스템 개발되어 그 활용성이 기대된다.

  • PDF

일반국토 상시 교통량자료를 이용한 교통량 결측자료 추정 (Missing Data Imputation Using Permanent Traffic Counts on National Highways)

  • 하정아;박재화;김성현
    • 대한교통학회지
    • /
    • 제25권1호
    • /
    • pp.121-132
    • /
    • 2007
  • 일반국도의 상시조사 자료는 교통량 조사 장비를 통해 수집되며, 수집된 자료가 누락되거나 불량일 경우 통계자료의 객관성을 유지하기 위해서 보정을 해야 한다. 교통량 결측 자료의 보정을 통계적인 방법으로 접근하여 신뢰성을 높이고자 본 연구에서는 보정 대상 시간과 동일시간의 자료를 적용할 수 있는 자기회귀분석과 보정 대상 지점과 동일 지점의 자료를 적용할 수 있는 계절 시계열 분석을 이용하여 보정하는 방안을 제시하였다. 계절 시계열 분석을 적용하여 결측 자료를 보정한 결과, 결측 기간이 길어질수록 오차가 커지는 것으로 분석되었다. 이것은 단기예측의 경우 실제자료를 이용하여 예측 값을 제시하지만, 장기예측의 경우 예측된 자료를 이용하여 예측값을 제시하기 때문에 신뢰성이 떨어지기 때문이라 판단된다. 자기회귀분석을 적용하여 결측 자료를 보정한 결과, 시계열분석에 비해서 오차가 적은 것으로 분석되었다. 이것은 교통량자료는 과거 패턴보다 현재 시점의 영향을 더 많이 받는 것이기 때문이라 판단된다 하지만 자기회귀분석은 인근에 패턴이 유사한 지점이 있어야 가능하며, 인근에 유사한 지점이 있더라도 그 지점의 자료가 불량일 경우 보정이 불가능하다는 단점이 있다. 이러한 경우에는 과거자료를 이용해서 보정할 수밖에 없으며, 단기 결측의 경우에는 시계열분석을 이용할 수 있다.

K-모드 알고리즘과 ROCK 알고리즘의 비교 및 개선방안

  • 김보화;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.163-167
    • /
    • 2001
  • 데이터 마이닝에서 분석의 대상으로 하는 대용량 자료에는 연속형 자료와 범주형 자료가 모두 포함된다. 전통적인 군집분석은 연속형 자료를 대상으로 하는 방법들이다. 본 연구에서는 범주형 자료를 대상으로 하는 군집분석방법인 K-모드 알고리즘과 락(ROCK) 알고리즘을 비교${\cdot}$분석하였다. 그리고 두 알고리즘이 갖는 방법론적인 단점을 보안하여 군집의 효과를 높일 수 있는 개선 방안을 제안하였다.

  • PDF