• 제목/요약/키워드: Time-based Clustering

검색결과 721건 처리시간 0.031초

Deconstructing Agile Survey to Identify Agile Skeptics

  • Entesar Alanazi;Mohammad Mahdi Hassan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권3호
    • /
    • pp.201-210
    • /
    • 2024
  • In empirical software engineering research, there is an increased use of questionnaires and surveys to collect information from practitioners. Typically, such data is then analyzed based on overall, descriptive statistics. Overall, they consider the whole survey population as a single group with some sampling techniques to extract varieties. In some cases, the population is also partitioned into sub-groups based on some background information. However, this does not reveal opinion diversity properly as similar opinions can exist in different segments of the population, whereas people within the same group might have different opinions. Even though existing approach can capture the general trends there is a risk that the opinions of different sub-groups are lost. The problem becomes more complex in case of longitudinal studies where minority opinions might fade or resolute over time. Survey based longitudinal data may have some potential patterns which can be extracted through a clustering process. It may reveal new information and attract attention to alternative perspectives. We suggest using a data mining approach to finding the diversity among the different groups in longitudinal studies (agile skeptics). In our study, we show that diversity can be revealed and tracked over time with the use of clustering approach, and the minorities have an opportunity to be heard.

계층적 분류구조의 퍼지시스템 설계 및 시계열 예측 응용 (Design of Fuzzy System with Hierarchical Classifying Structures and its Application to Time Series Prediction)

  • 방영근;이철희
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.595-602
    • /
    • 2009
  • 시스템의 동작특성을 표현하는 퍼지 규칙들은 퍼지 클러스터링 기법에 매우 의존적이다. 만약, 클러스터링 기법의 분류 능력이 개선된다면, 그들에 의해 생성되는 퍼지 규칙과 식별되는 파라미터들이 보다 정밀해 질 수 있으므로 시스템의 성능이 개선될 수 있다. 따라서 본 논문에서는 분류능력이 강화된 새로운 계층 구조 클러스터링 알고리즘을 제안한다. 제안된 클러스터링 기법은 데이터 사이의 통계적 특성과 상관성을 고려하여 보다 정확하게 데이터들을 분류할 수 있도록 2개의 클러스터의 구조를 갖는다. 또한, 본 논문은 차분 데이터를 이용하여 원형 데이터의 패턴이나 규칙들이 명확하게 반영될 수 있도록 하며, 각각의 차분 데이터들의 다양한 특성을 고려할 수 있도록 다중 퍼지 시스템을 구현한다. 마지막으로, 제안된 기법들의 유효성을 다양한 비선형 시계열 데이터들의 예측을 통해 검증한다.

에너지 효율 증대를 위한 에너지 사용량 예측과 에너지 수요이전 모델 연구 (A Study on the Energy Usage Prediction and Energy Demand Shift Model to Increase Energy Efficiency)

  • 김재환;양세모;이강윤
    • 인터넷정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.57-66
    • /
    • 2023
  • 현재, 에너지 효율 향상으로 소비감축을 시행하는 새로운 에너지 시스템이 대두되고 있다. 이에 스마트그리드가 확산되면서 계시별 요금제가 확대되고 있다. 계시별 요금제는 계절별 / 시간별로 요금을 다르게 적용해 사용량에 따라 요금을 내는 요금제이다. 본 연구에서는 에너지 전력 사용량 데이터를 예측하기 위해, 온도/요일/시간/계절 등 외부 요인을 고려하고 시계열 예측 모델인 LSTM을 활용한다. 이러한 에너지 사용량 예측 모델을 기반으로 기기별 사용패턴을 분석하여 전력 에너지를 최대부하시간대에서 경부하시간대로 수요이전 함으로써 에너지 사용요금을 절감한다. 기기별 사용패턴을 분석하기 위해서는 시간대별로 기기의 사용량 패턴을 학습 및 분류하는 clustering 기법을 사용한다. 정리하자면, 본 연구에서는 사용자의 전력 데이터 사용량을 기반으로 사용량과 사용 요금을 예측 및 기기별 사용패턴을 분석하고 분석 기반의 맞춤형 수요이전 서비스를 제공함으로써 사용자에게 요금 절감 효과를 가져다 준다.

애드혹 네트워크에서 적응적 시간관리 기법을 이용한 클러스터링 노드 에너지 수명의 효율적인 관리 방법 (An Efficient Node Life-Time Management of Adaptive Time Interval Clustering Control in Ad-hoc Networks)

  • 오영준;이강환
    • 한국정보통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.495-502
    • /
    • 2013
  • MANET(Mobile Ad-hoc Network)에서는 에너지 효율을 높이기 위한 다양한 클러스터링 기법과 라우팅 알고리즘이 연구되고 있다. 일반적으로 무선 Ad-hoc 네트워크에서는 LEACH와 같은 클러스터 기반의 동적 라우팅 알고리즘이 많이 사용된다. 본 논문에서는 클러스터내의 각 노드가 가지는 속성을 고려하여 클러스터를 생성하고 노드를 관리하는 ATICC(Adaptive Time Interval Clustering Control) 알고리즘 기법을 제안한다. 제안한 ATICC은 노드의 속성 중의 하나인 잔여에너지 값으로 노드의 에너지 레벨을 분류한다. 그리고 분류된 에너지 레벨에 대응하는 시간차 컨트롤 기법을 이용하여 클러스터링 과정을 수행하거나 노드들을 관리한다. 특히 제안한 ATICC 알고리즘은 MANET에서 클러스터의 생성, 재생성, 진입 노드 및 이탈 노드의 검출과 관리를 통해 노드의 에너지 관리 효율을 향상시키고 클러스터의 Lifetime을 증가시키는 결과를 보여주었다.

과거이력자료를 활용한 요일별 패턴분류 알고리즘 개발 (Development of a Daily Pattern Clustering Algorithm using Historical Profiles)

  • 조준한;김보성;김성호;강원의
    • 한국ITS학회 논문지
    • /
    • 제10권4호
    • /
    • pp.11-23
    • /
    • 2011
  • 이 연구는 시계열 과거 속도자료를 활용하여 유사한 패턴 변화를 보이는 요일을 그룹핑하는 알고리즘을 개발하였다. 알고리즘에 적용할 이력자료 시간적 범위는 과거 2개월치 자료를 사용하였으며, 공간적 범위는 도시부도로를 대상으로 하였다. 이 연구에서 제안한 알고리즘은 크게 거시적인 관점과 미시적인 관점으로 나누어 요일별 패턴분류를 수행하였다. 먼저 거시적인 관점에서 요일별 첨두/비첨두 시간대와 요일별 속도변화가 크게 나타나는 중점시간대를 도출하였다. 미시적인 관점에서는 거시적인 관점에서 도출된 중점시간대를 대상으로 요일간 속도 차이를 개별(요일별) 혹은 그룹간의 유사성을 비교하여 단계적으로 분류하는 2단계 속도 군집 알고리즘(Two-step speed clustering algorithm, TSC)을 개발하였다. TSC 알고리즘은 중점시간대의 매 가공주기(또는 제공주기)마다 요일별(월~일) 속도차이를 토대로 그룹핑하는 1단계와 1단계에서 도출된 각 그룹의 평균과 요일간의 속도차이를 비교하여 재할당하는 2단계로 구성된다. TSC 알고리즘은 실제 지점검지기에서 수집된 시간대별 시계열 자료를 토대로 개발 및 성능평가가 수행되었다. 따라서, 교통정보센터에서 수집 가공 저장되는 과거이력자료를 이용하여 요일별 패턴분류 수행이 가능하고 알고리즘 구현도 실제 가공체계에 적용하기 용이하다. 이 연구에서 제안한 알고리즘은 통행패턴기반 정보가공 알고리즘 개발, 요일별 반복정체구간 운영관리, TOD에 근거한 신호운영 개선 등 교통운영 및 관리 전반에 적용이 가능하다.

클러스터링 기반의 최적 차량 운행 계획 수립을 위한 비교연구 (Comparative Analysis for Clustering Based Optimal Vehicle Routes Planning)

  • 김재원;신광섭
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.155-180
    • /
    • 2020
  • 화물의 수배송을 위한 차량의 배차 및 최적 경로 설계는 물류 서비스의 효율성 향상을 위한 가장 핵심적인 역할을 담당한다. 이 문제는 차량의 대수, 차량별 적재 용량, 차량의 총 이동거리와 같이 다양한 비용 요소를 동시에 고려해야 하기 때문이다. 최근 비용 최소화 및 운영 효율성 향상을 위해 TMS를 도입하는 사례가 증가하고 있으나, 현장에서 필요한 모든 요소를 고려하지 못한다는 한계가 존재한다. 이를 해결하기 위해 현장 전문가가 TMS의 결과를 경험과 직관에 기반하여 수정하는 과정이 필요하다. 본 연구에서는 지금까지 총 비용의 최소화에 집중하고 있는 기존 연구들과 달리 서비스에 투입되는 자원 활용의 효율성과 형평성을 동시에 높일 수 있는 방법을 제안한다. 이를 위해 Cluster-First Route-Second (CFRS)기법을 활용한다. 고객의 위치를 기준으로 네 가지 클러스터링 알고리즘(K-Means, K-Medoids, DBSCAN, Model-based)과 Fisher & Jaikumar 알고리즘을 적용하여 고객들을 군집화하였다. 이 후, 군집별 최적의 차량 경로 계획을 수립하였다. 수치 실험을 통해 본 연구에서 제안하는 CFRS 기법을 적용한 방안이 상대적으로 차량의 전체 이동거리와 평균 이동거리 및 이동시간이 더 절감될 수 있다는 사실을 확인하였다. 또한, 차량별 방문하는 고객의 수에 대한 편차가 더 낮다는 사실로부터 기본적인 차량 경로 배정 유형에 비해 본 연구에서 제안하는 방안이 상대적으로 형평성 있게 업무가 할당되었음을 확인할 수 있었다.

대용량의 고차원 데이터 공간에서 프로젝션 필터링 기반의 부분차원 클러스터링 기법 (Partial Dimensional Clustering based on Projection Filtering in High Dimensional Data Space)

  • 이혜명;정종진
    • 한국전자거래학회지
    • /
    • 제8권4호
    • /
    • pp.69-88
    • /
    • 2003
  • 현재 알려진 대부분의 클러스터링 알고리즘들은 고차원 공간에서 데이터가 갖는 고유의 희소성 및 잡음으로 인하여 성능이 급격히 저하되는 경향이 있다. 이에 따라 최근에 클러스터 형성에 연관성이 있는 차원만을 선택하고, 연관성이 적은 차원들을 제거함으로써 클러스터링의 성능을 높일 수 있는 부분차원 클러스터링 기법이 연구되고 있다. 그러나 현재 연구된 부분차원 클러스터링 기법은 그리드 기반 방법으로서 차원의 증가에 따라 그리드 셀의 수가 방대해짐으로써 공간 및 시간적 인 효율성 이 저하된다. 또한, 대부분의 알고리즘들은 데이터 집합에서 대표객체를 찾아 클러스터 형성에 관계 있는 차원만을 조사하기 때문에 대량의 고차원 공간 데이터에 대해서는 최상의 대표객체를 선택하는데 어려움이 많다는 문제점이 있다. 본 논문에서는 입력 차원의 순서와 무관하게 동일한 클러스터를 탐사할 수 있는 효율적인 부분차원 클러스터링 알고리즘인 CLIP을 제안한다. CLIP은 클러스터 형성에 밀접하게 연관된 임의의 차원에서 클러스터를 탐사한 후에, 그에 종속적인 다음 차원에 대해서 점진적인 프로젝션을 이용하여 클러스터를 탐사하는 기법이다. 점진적 프로젝션 기법은 제안된 알고리즘의 핵심 기법으로서 방대한 양의 탐색공간과 클러스터링을 식별하는 계산시간을 크게 줄인다. 이에 따라 CLIP 알고리즘을 평가하기 위해 합성 데이타를 이용한 실험을 통하여 알고리즘의 정확성 및 효율성, 알고리즘 결과의 동등성에 대한 실험 및 비교 분석 결과를 제시한다.

  • PDF

ASVMRT: Materialized View Selection Algorithm in Data Warehouse

  • Yang, Jin-Hyuk;Chung, In-Jeong
    • Journal of Information Processing Systems
    • /
    • 제2권2호
    • /
    • pp.67-75
    • /
    • 2006
  • In order to acquire a precise and quick response to an analytical query, proper selection of the views to materialize in the data warehouse is crucial. In traditional view selection algorithms, all relations are considered for selection as materialized views. However, materializing all relations rather than a part results in much worse performance in terms of time and space costs. Therefore, we present an improved algorithm for selection of views to materialize using the clustering method to overcome the problem resulting from conventional view selection algorithms. In the presented algorithm, ASVMRT (Algorithm for Selection of Views to Materialize using Reduced Table), we first generate reduced tables in the data warehouse using clustering based on attribute-values density, and then we consider the combination of reduced tables as materialized views instead of a combination of the original base relations. For the justification of the proposed algorithm, we reveal the experimental results in which both time and space costs are approximately 1.8 times better than conventional algorithms.

Modified Passive Clustering Algorithm for Wireless Sensor Network

  • AI Eimon Akhtar Rahman;HONG Choong Seon
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.427-429
    • /
    • 2005
  • Energy efficiency is the most challenging issue in wireless sensor network to prolong the life time of the network, as the sensors has to be unattended. Cluster based communication can reduce the traffic on the network and gives the opportunity to other sensors for periodic sleep and thus save energy. Passive clustering (PC) can perform a significant role to minimize the network load as it is less computational and light weight. First declaration wins method of PC without any priority generates severe collision in the network and forms the clusters very dense with large amount of overlapping region. We have proposed several modifications for the existing passive clustering algorithm to prolong the life time of the network with better cluster formation.

  • PDF

시계열 데이타 클러스터링에서 푸리에 진폭 기반의 프라이버시 보호 (Privacy-Preserving Clustering on Time-Series Data Using Fourier Magnitudes)

  • 김혜숙;문양세
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.481-494
    • /
    • 2008
  • 본 논문에서는 시계열 데이타 클러스터링에서 DFT 진폭 기반의 프라이버시 보호 기법을 제안한다. 기존의 프라이버시 보호 연구인 DFT 계수 기법은 원본과 유사한 데이타가 복원될 수 있어 프라이버시 보호 측면에서 큰 문제점이 있다. 반면에, 제안한 DFT 진폭 기법은 DFT 변환 후에 위상을 제외한 진폭만을 사용함으로써 원본 데이타를 복원하기 매우 어려운 특징을 가진다. 본 논문에서는 우선 기존의 DFT 계수 기법이 복원이 용이한 함수이고, 제안한 DFT 진폭 기법이 복원이 어려운 함수임을 체계적으로 설명한다. 다음으로, 클러스터링 정확도를 대신하고 진폭을 선택하기 위한 척도로서 거리-순서 보존정도의 개념을 제안한다. 거리-순서 보존 정도는 객체들의 상대적 순서가 클러스터링 보호 함수의 적용전후에 얼마나 보존되는지의 척도를 나타낸다. 본 논문에서는 이러한 거리-순서 보존 정도의 개념을 사용하여 DFT 진폭 기법에서 진폭을 선택하는 탐욕적 전략들을 제시한다. 즉, 제안한 탐욕적 전략은 거리-순서 보존 정도를 극대화하는 방향으로 DFT 진폭을 선택하여, 궁극적으로 클러스터링 정확도를 높이고자 하는 방법이다. 마지막으로 실험을 통해 제안한 거리-순서 보존 정도가 클러스터링 정확도를 대신할 수 있는 척도임을 보인다. 또한, 제안한 DFT 진폭 기법의 탐욕적 전략들이 기존의 DFT 계수 기법에 비해 정확도가 크게 떨어지지 않음을 확인한다. 이 같은 결과를 달 때, 제안한 DFT 진폭 기법은 DFT 계수 기법에 비해 프라이버시 보호 정도를 크게 개선했을 뿐 아니라 비교적 정확한 클러스터링 정확도를 보이는 우수한 연구 결과라 사료된다.