• 제목/요약/키워드: 타임 워핑

검색결과 30건 처리시간 0.023초

시계열 데이타베이스에서 유사한 서브시퀀스의 모양 기반 검색 (Shape-Based Retrieval of Similar Subsequences in Time-Series Databases)

  • 윤지희;김상욱;김태훈;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권5호
    • /
    • pp.381-392
    • /
    • 2002
  • 본 논문에서는 시계열 데이타베이스에서의 모양 기반 검색 문제에 관하여 논의한다. 모양 기반 검색은 실제 요소 값과 관계없이 질의 시퀀스와 유사한 모양을 갖는 (서브)시퀀스를 찾는 연산이다. 본 연구에서는 모양 기반 서브시퀀스 검색을 위한 새로운 기법을 제안한다. 먼저, 시프팅, 스케일링, 이동 평균, 타임 워핑 등 변환들의 다양한 조합을 지원하는 모양 기반 검색을 위하여 새로운 유사 모델을 제시한다. 또한, 이러한 유사 모델을 기반으로 하는 모양 기반 검색을 효과적으로 처리하기 위하여 효율적인 인덱싱 및 질의 처리 기법들을 제안한다. 제안된 기법의 유용성을 규명하기 위하여 실제 데이타인 S&P 500 주식 데이터를 이용한 다양한 실험을 수행한다. 실험 결과에 의하면, 제안된 기법은 질의 시퀀스의 모양과 유사한 모양을 갖는 서브시퀀스들을 성공적으로 검색할 뿐만 아니라 순차 검색 기법과 비교하여 66배까지의 상당한 성능 개선 효과를 갖는 것으로 나타났다.

DTW와 PCA에 기반한 효과적인 필적 검증 (Effective Handwriting Verification through DTW and PCA)

  • 장석우;허문행;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권7호
    • /
    • pp.25-32
    • /
    • 2009
  • 논문에서는 오프라인 환경에서 패턴분석을 적용하여 두필적의 유사성을 자동으로 분석하여 필적을 검증하는 방법을 제안한다. 제안된 방법에서는 먼저 필적 문서에서 문자 영역만을 분할하고, 분할된 문자 영역에 대한 특징을 추출한다. 그리고 비선형적인 형태로 추출되는 특징으로부터 동적 타임 워핑(DTW)과 다변량 통계 분석법(PCA) 알고리즘을 이용하여 기준이 되는 특징과의 유사성을 구한다. 본 논문에서 제안된 필적 검증 방법은 효과적인 특징 추출 방법 및 기존의 짧은 패턴에서 효과적으로 수행하던 방법들을 다양한 길이를 가진 특징에 대해서도 효과적으로 필적 검증이 가능하도록 하였다. 본 논문은 실험 결과는 제안된 방법인 기존의 방법보다 우수함을 다양한 실험을 통해서 보여준다. 제안된 필적 검증 방법은 기존에 감정 전문가에 의해 수동적으로 수행되던 필적 검증 작업을 자동화하고, 기존 필적 검증 작업의 객관성을 배가할 수 있을 것으로 기대된다.

시퀀스 데이터베이스를 위한 타임 워핑 기반 유사 검색 (A Method for Time Warping Based Similarity Search in Sequence Databases)

  • 김상욱;박상현
    • 산업기술연구
    • /
    • 제20권B호
    • /
    • pp.219-226
    • /
    • 2000
  • In this paper, we propose a new novel method for similarity search that supports time warping. Our primary goal is to innovate on search performance in large databases without false dismissal. To attain this goal, we devise a new distance function $D_{tw-lb}$ that consistently underestimates the time warping distance and also satisfies the triangular inequality. $D_{tw-lb}$ uses a 4-tuple feature vector extracted from each sequence and is invariant to time warping. For efficient processing, we employ a multidimensional index that uses the 4-tuple feature vector as indexing attributes and $D_{tw-lb}$ as a distance function. We prove that our method does not incur false dismissal. To verify the superiority of our method, we perform extensive experiments. The results reveal that our method achieves significant speedup up to 43 times with real-world S&P 500 stock data.

  • PDF

HummingBird: 향상된 스케일드앤워프트 매칭을 이용한 유사 음악 검색 시스템 (HummingBird: A Similar Music Retrieval System using Improved Scaled and Warped Matching)

  • 이혜환;심규석;박형민
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.409-419
    • /
    • 2007
  • 허밍을 통한 유사 검색 질의가 주어질 때 효과적으로 음악 데이타베이스를 검색하는 시스템에 대한 연구는 다양한 방향으로 진행되어 왔다. 최근에는 음악 데이타베이스와 허밍 질의를 시계열 데이터로 변환하여 시계열 데이타의 유사 검색과 관련하여 제안되어 왔던 여러 가지 거리 척도(distance measure)나 인덱싱 기법등을 적용하여 효과적으로 질의를 처리하려는 시도가 계속 되고 있다. 허밍 질의의 특성을 고려하여 균일 스케일링(Uniform Scaling)과 동적 프로그래밍을 사용한 타임 워핑(Dynamic Time Warping)을 함께 고려한 스케일드 앤 워프트 매칭(Scaled and Warped Matching) 거리를 사용하여 효과적인 유사 검색을 하는 방법은 가장 최근 제시된 방법 중 하나이다. 본 논문에서는 허밍을 통한 유사 검색 시스템인 Humming BIRD(Humming Based sImilaR miDimusic retrieval system)를 제안하고 구현하였다. 슬라이딩 윈도우를 사용하여 음악의 임의의 부분에 대한 허밍 질의를 처리할 수 있도록 하였으며 더 효율적으로 검색하기 위해 이전의 균일 스케일링을 변형하여 중심을 일치시킨(center-aligned) 균일 스케일링을 제안하고 이와 타임 워핑을 결합한 형태의 스케일드 앤워프트 매칭을 제안하였다. 이 거리의 좀 더 타이트한 하한을 계산하는 하계 함수를 사용하여 탐색 공간(search space)을 효과적으로 줄여 더 빠르고 효과적인 유사 검색을 가능하도록 하였다. 마지막으로 실험을 통해 개선된 스케일드 앤 워프트 매칭이 이전에 비해 같은 검객 결과를 얻으면서도 효과적으로 검색함을 탐색 공간을 줄이는 가지치기 성능을 비교함으로써 보였다.

국내 연안 해역 선박 항적 군집화를 위한 항적 간 거리 척도 개발 연구 (Research on the Development of Distance Metrics for the Clustering of Vessel Trajectories in Korean Coastal Waters)

  • 이승주;이원희;민지홍;조득재;박현우
    • 한국항해항만학회지
    • /
    • 제47권6호
    • /
    • pp.367-375
    • /
    • 2023
  • 본 연구에서는 국내 연안 해역 환경에서의 해상교통관제 서비스에 기여할 수 있는 항적 간 거리 척도를 개발하였다. 새로운 항적간 거리 척도는 전통적으로 위치 시계열 간의 유사도를 측정하는 데 활용되는 하우스도르프 거리(hausdorff distance)와 두 항적 간의 대지속력(Speed Over Ground, SOG)의 평균 간의 차이, 그리고 대지침로(Course Over Ground)의 분산 간의 차이를 가중합하여 설계되었다. 새로운 척도의 유효성을 검증하기 위하여 실제 AIS 항적 데이터와 병합 군집화 알고리즘을 활용한 기존 항적 간 거리 척도와의 비교 분석이 수행되었으며, 새로운 거리 척도를 활용한 항적 군집화 결과가 하우스도르프 거리(hausdorff distance), 그리고 다이내믹 타임 워핑 거리(Dynamic Time Warping distance) 등 기존 척도에 비해 항적 간 지리적 거리나 대지속도 및 대지침로 등 선박 거동 특성의 분포를 비슷하거나 그 이상의 수준으로 정교하게 반영하고 있음을 데이터 시각화로써 확인하였다. 정량적으로는 Davies-Bouldin 지표를 기준으로, 군집화 결과가 더욱 우수하거나 약간 낮은 수준을 기록한 한편, 거리 계산 효율성에서는 특히 우수함을 실증하였다.

이미지 시퀀스 데이터베이스에서 우선순위 큐와 접미어 트리를 이용한 효율적인 유사 서브시퀀스 검색의 설계 (A Design for Efficient Similar Subsequence Search with a Priority Queue and Suffix Tree in Image Sequence Databases)

  • 김인범
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.613-624
    • /
    • 2003
  • 본 논문은 우선순위 큐와 접미어 트리로 색인 구조를 생성한 후. 이미지 시퀀스 데이터베이스에서 다차원 타임 워핑 거리 함수를 이용하여 유사한 이미지 서브시퀀스를 신속하고 정확하게 검색할 수 있는 방법을 제안한다. 본 논문에서 제안된 방법은 사전에 정의된 중요도에 따라 선별된 이미지 시퀀스로 구성된 우선순위 큐 색인의 이미지 서브시퀀스에 대한 유사성 거리 계산을 첫 단계로 시행하여 유사한 서브시퀀스집합을 얻고 만족할 결과를 얻지 못했을 경우에는 두 번째 단계로 나머지 유사 서브시퀀스에 대해 디스크 기반의 접미어 트리를 색인 구조체로 하여 유사한 서브시퀀스를 검색하는 것이다. 하한 거리 함수를 활용하여 질의 이미지 시퀀스와 유사한 이미지 서브시퀀스를 검색하는 과정에서 생성 가능한 오류를 방지 하면서 동시에 비 유사 이미지 서브시퀀스를 제거하도록 한다.

  • PDF

시계열 군집분석과 로지스틱 회귀분석을 이용한 골목상권 성장요인 연구 (Analyzing Growth Factors of Alley Markets Using Time-Series Clustering and Logistic Regression)

  • 강현모;이상경
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.535-543
    • /
    • 2019
  • 최근 들어 경리단길처럼 빠른 성장세를 보이는 골목상권에 대한 사회적 관심이 높아지면서 골목상권 성장요인에 대한 분석의 필요성이 커지고 있다. 이 연구에서는 서울시의 골목상권 매출액 자료에 동적타임워핑(DTW)을 적용한 시계열 군집분석을 통해 성장 골목상권을 찾아내고 로지스틱 회귀분석을 통해 골목상권의 성장에 영향을 미치는 요인들을 분석하였다. 군집분석 결과, 성장상권은 서남권과 동북권, 동남권에 많이 분포하는 것으로 나타났지만 성장상권의 권역 내 비중은 서북권, 동북권, 서남권이 높게 나타난 반면 동남권은 낮게 나타났다. 로지스틱 회귀분석 결과, 20~30대가 매출액에 미치는 영향은 50대에 비해 낮지만 성장에 미치는 영향은 더 큰 것으로 나타났다. 또한, 소득이 높은 지역에 위치한 골목상권들은 성장 한계에 도달한 경우가 많아 정체 또는 쇠퇴하는 경향이 나타났다. 지하철에 가까운 골목상권일 경우 매출액은 더 많지만 성장성은 오히려 떨어지는 것으로 나타났다. 본 연구는 기존연구에서 다루어지지 않던 골목상권의 성장요인을 처음으로 분석했다는 점에서 의의를 둘 수 있다.

스마트그리드 환경하의 가정용 AMI 자료를 위한 시계열 군집분석 연구 (Time series clustering for AMI data in household smart grid)

  • 이진영;김삼용
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.791-804
    • /
    • 2020
  • 스마트그리드 환경하에서 ICT 기술의 발달로 AMI 기기를 통해 가정의 실시간 전력사용량을 수집할 수 있게 됨에 따라 이러한 자료들을 활용하여 보다 더 정확한 가정용 전력사용량 예측을 할 수 있게 되었다. 본 논문에서는 1시간 단위 가정용 전력사용량 자료를 바탕으로 ARIMA, TBATS, NNAR 모형을 사용하여 전력수요를 예측하는 모형을 연구하였는데, 기존과 달리 가구 전체 사용량을 한 번에 예측하는 것이 아닌 유사한 전력사용패턴을 나타내는 가구들을 군집하여 군집별로 예측 모형을 수립하고 각 모형별 예측치를 합산하여 예상 전력사용량을 산출하였다. 특히 전력사용량 자료는 전형적인 시계얼 자료로서 군집분석 방법으로 시계열에 적절한 방법을 선택하였으며 본 논문에서는 동적타임워핑(dynamic time warping)과 Periodogram 기반의 방법을 사용하였다. 연구 결과 사용량이 유사한 가구들을 군집하여 전력사용량을 예측하는 것이 한 번에 예측하는 것보다 예측 성능이 더 우수한 것으로 나타났으며 예측 모형 중에서는 여름철의 경우 NNAR 모형이, 겨울철의 경우 TBATS 모형의 성능이 가장 좋았으며 군집분석 방법은 군집 간 패턴의 차이가 명확히 나타난 동적타임워핑 방법을 사용했을 때 예측 성능의 향상이 가장 많았다.

바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템 (Phoneme Similarity Error Correction System using Bhattacharyya Distance Measurement Method)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.73-80
    • /
    • 2010
  • 어휘 인식 시스템은 부정확한 어휘 제공과 유사한 음소 인식으로 인식률이 저하되며 이는 유사한 음소인식 오인식과 효율적 특징 추출 처리를 위한 방법을 필요로 한다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템을 제안하였다. 음소 유사율은 모노폰으로 훈련시킨 훈련 데이터의 음소에 HMM 특징 추출 방법을 이용하였으며 유사한 음소는 바타챠랴 거리 측정법을 이용하여 정확한 음소로 인식할 수 있도록 유도하여 인식률 향상 효과를 얻을 수 있었다. 이를 유클리디안 거리 측정법과 동적타임 워핑 시스템에 비교한 시스템 성능 평가 결과 1.2%의 향상된 97.91% 인식률을 보였다.

정수생태계의 지형적인 요인 변화와 윤충류 출현 종 수 및 개체군 밀도 변동에 대한 연구 (Time Series Patterns and Clustering of Rotifer Community in Relation with Topographical Characteristics in Lentic Ecosystems)

  • 오혜지;허유지;장광현;김현우
    • 생태와환경
    • /
    • 제54권4호
    • /
    • pp.390-397
    • /
    • 2021
  • 본 연구에서는 호소의 환경 특성 및 시간에 따른 동물 플랑크톤 윤충류 군집 변동 특성을 분석하기 위해, 전라남도에 위치하여 유사한 기상 조건을 가지나 규모와 수질 환경이 서로 다른 29개 호소를 선정, 2008년부터 2016년까지 분기별 윤충류 출현 개체수 및 종 수의 시계열 자료를 수집하였다. 조사기간 중 각 호소의 윤충류 출현 개체수 및 종 수의 범위, 이상치 및 변동계수(CV)를 비교하였으며, 동적 시간 워핑(dtw) 분석을 통해 각 호소의 윤충류 군집 시계열 경향을 비교하여 유사 정도를 바탕으로 분류(clustering)하고, 주성분 분석을 통해 분류된 호소의 환경 특성과의 관계를 분석하였다. 윤충류 개체수에서 보다 빈번한 이상치 출현과 높은 변동성을 보인 호소에는 상대적으로 저수용량이 적은 소규모 호소가 많았던 반면, 출현종 수에서는 뚜렷한 경향이 관찰되지 않았다. 타 호소들과 윤충류 개체수의 시간적 변동 경향이 상이하게 나타난 일부 호소들에서 화학적 산소 요구량(COD)과 양의 상관관계를, 식물플랑크톤 현존량 변동 및 지각류 상대풍부도 변동과 음의 상관관계를 갖는 것으로 나타나 윤충류 출현 개체수의 시계열 경향에 영향을 미치는 잠재적인 요인으로 분석되었다.