• Title/Summary/Keyword: 최적의 클러스터 수

Search Result 155, Processing Time 0.033 seconds

Novel Intent Discovery Utilizing Large Language Models and Active Learning Strategies (대규모 언어 모델을 활용한 새로운 의도 발견 방법과 액티브 러닝 전략)

  • Changwoo Chun;Daniel Rim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.425-431
    • /
    • 2023
  • 음성 어시스턴트 시스템에서 발화의 의도를 분류하고 새로운 의도를 탐지하는 것은 매우 중요한 작업이다. 끊임없이 인입되는 새로운 발화로 인해 기존에 학습된 모델의 의도 분류 성능은 시간이 지남에 따라 점차 낮아진다. 기존 연구들에서 새로운 의도 발견을 위해 제안되었던 클러스터링 방법은 최적의 클러스터 수 결정과 명명에 어려움이 있다. 이러한 제한 사항을 보완하기 위해, 본 연구에서는 대규모 언어 모델 기반의 효과적인 의도 발견 방법을 제안한다. 이 방법은 기존 의도 분류기로 판단하기 어려운 발화에 새로운 의도 레이블을 할당하는 방법이다. 새롭게 인입되는 OOD(Out-of-Domain) 발화 내에서 오분류를 찾아 기존에 정의된 의도를 탐지하고, 새로운 의도를 발견하는 효율적인 프롬프팅 방법도 분석한다. 이를 액티브 러닝 전략과 결합할 경우, 분류 가능한 의도의 개수를 지속 증가시면서도 모델의 성능 하락을 방지할 수 있고, 동시에 새로운 의도 발견을 자동화 할 수 있다.

  • PDF

An Optimal VM creation by considering I/O Bandwidth in Virtualized Hadoop Cluster Environments (가상화된 Hadoop 클러스터 환경에서 I/O 대역폭을 고려한 최적VM 생성)

  • Kim, Tae-Won;Kim, Hyun-Jun;Kim, Joom-Mo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.151-153
    • /
    • 2012
  • 최근 고속 네트워크와 저장 기술의 발전으로 인하여 대용량 데이터 분산 처리 시스템에 관한 연구가 활발히 진행되고 있다. 또한 서버의 통합을 통해 시스템 자원의 효율적인 활용을 제공할 수 있는 시스템 가상화가 많은 주목을 받고 있다. 그러나 가상 머신 환경에서 대용량 데이터 분산처리 시스템을 구성할 경우 많은 문제가 발생하게 된다. 본 논문에서는 가상 머신 환경에서 Hadoop 클러스터를 활용할 때 가상 데이터 노드의 개수에 따른 I/O 대역폭 최적화에 대한 실험을 하고 평가를 한다. 본 논문에서 수행한 실험 결과는 가상 머신 환경에서 I/O 대역폭 밸런싱(balancing)을 지원하는 Hadoop Scheduler의 개발 연구에 사용될 것이다.

Optimal Control of Voltage and Reactive Power Using Parallel PSO Algorithm (병렬 PSO 알고리즘을 이용한 전력계통의 전압제어)

  • Park, Jong-Kook;Kim, Jong-Yul;Park, June-Ho;Lee, Hwa-Seok
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.233-234
    • /
    • 2008
  • 전력계통이 점점 더 복잡하고 광역화됨에 따라서 전압 및 무효전력 제어는 매우 중요한 문제로서 부각되고 있다. 전압 제어를 위해서는 전력계통 내의 조상설비들을 최적으로 운용하는 것이 중요하다. 따라서 전력계통에서 효과적인 전압제어를 위해서는 가능한 모선전압 크기의 차이가 없이 전압 분포가 이루어지는 것이 효과적이다. 본 논문의 목적함수로는 각 부하모선의 전압편차의 합을 최소화 함 을 사용하였으며, 최적 해를 찾는데 소요되는 연산시간을 단축시키기 위해 PC클러스터 기반 병렬 PSO 알고리즘을 이용한 기법을 제안하였다. 제안한 기법의 유용성을 보이기 위하여 IEEE 30모선 계통의 문제에 적용하였다. 검토결과 최적해 탐색성능의 저하 없이 연산시간을 단축할 수 있음을 확인하였다.

  • PDF

Development of Stochastic Rainfall Downscaling using Bayesian Neyman-Scott Rectangular Pulse Model(NSRPM) (Bayesian NSRP 모형을 이용한 추계학적 Downscaling 기법 개발)

  • Kim, Jang-Gyeong;Ban, Woo-Sik;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.9-9
    • /
    • 2018
  • 추계학적 강우생성모형 중 포아송 클러스터(Poisson Cluster) 모형은 단일지점에 대하여 시간강우량의 관측연한 문제점을 해결하기 위한 강우모형으로 강우 단계별 계층적 구조를 이해하는데 유용한 모형이다. 특히 강우 특성을 계절, 지역 등과 같이 비교하는 기준에 따라 5~6개의 비교적 적은 매개변수들로 모의 강우시계열을 생성할 수 있다는 점에서 장기간 강우분석에 필요한 관측연한 문제를 보완할 수 있다. 그러나 매개변수 최적해가 수렴되지 않는 사례가 많고, 매개변수들이 강우의 물리적 특성을 반영하는 것에 비해 내포된 불확실성에 관한 연구는 미흡하다. 본 연구에서는 포아송 클러스터 강우생성모형 중 Neyman-Scott Rectangular Pulse(NSRP) 모형을 Bayesian 모형과 연계한 Bayesian NSRP 모형을 개발하여 매개변수간 물리적 상관성을 고려한 최적화 기법을 개발하였다. Bayesian 모형은 물리적 범위가 다른 매개변수간의 결합확률분포를 산정하여 사후분포(posterior)를 추정하므로 매개변수 최적화와 불확실성 정량화 문제를 동시에 해결할 수 있다. 최종적으로 Bayesian NSRP 모형에 기후변화 시나리오의 통계적 특성을 고려한 시간단위 강우시계열 생성 모의 기법의 활용 가능성을 평가하고자 한다.

  • PDF

A Sensing Node Selection Scheme for Energy-Efficient Cooperative Spectrum Sensing in Cognitive Radio Sensor Networks (인지 무선 센서 네트워크에서 에너지 효율적인 협력 스펙트럼 센싱을 위한 센싱 노드 선택 기법)

  • Kong, Fanhua;Jin, Zilong;Cho, Jinsung
    • Journal of KIISE
    • /
    • v.43 no.1
    • /
    • pp.119-125
    • /
    • 2016
  • Cognitive radio technology can allow secondary users (SUs) to access unused licensed spectrums in an opportunistic manner without interfering with primary users (PUs). Spectrum sensing is a key technology for cognitive radio (CR). However, few studies have examined energy-efficient spectrum sensing in cognitive radio sensor networks (CRSNs). In this paper, we propose an energy-efficient cooperative spectrum sensing nodes selection scheme for cluster-based cognitive radio sensor networks. In our proposed scheme, false alarm probability and energy consumption are considered to minimize the number of spectrum sensing nodes in a cluster. Simulation results show that by applying the proposed scheme, spectrum sensing efficiency is improved with a decreased number of spectrum sensing nodes. Furthermore, network energy efficiency is guaranteed and network lifetime is substantially prolonged.

Incremental Clustering Algorithm by Modulating Vigilance Parameter Dynamically (경계변수 값의 동적인 변경을 이용한 점층적 클러스터링 알고리즘)

  • 신광철;한상용
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.11
    • /
    • pp.1072-1079
    • /
    • 2003
  • This study is purported for suggesting a new clustering algorithm that enables incremental categorization of numerous documents. The suggested algorithm adopts the natures of the spherical k-means algorithm, which clusters a mass amount of high-dimensional documents, and the fuzzy ART(adaptive resonance theory) neural network, which performs clustering incrementally. In short, the suggested algorithm is a combination of the spherical k-means vector space model and concept vector and fuzzy ART vigilance parameter. The new algorithm not only supports incremental clustering and automatically sets the appropriate number of clusters, but also solves the current problems of overfitting caused by outlier and noise. Additionally, concerning the objective function value, which measures the cluster's coherence that is used to evaluate the quality of produced clusters, tests on the CLASSIC3 data set showed that the newly suggested algorithm works better than the spherical k-means by 8.04% in average.

Analysis and Application of Power Consumption Patterns for Changing the Power Consumption Behaviors (전력소비행위 변화를 위한 전력소비패턴 분석 및 적용)

  • Jang, MinSeok;Nam, KwangWoo;Lee, YonSik
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.25 no.4
    • /
    • pp.603-610
    • /
    • 2021
  • In this paper, we extract the user's power consumption patterns, and model the optimal consumption patterns by applying the user's environment and emotion. Based on the comparative analysis of these two patterns, we present an efficient power consumption method through changes in the user's power consumption behavior. To extract significant consumption patterns, vector standardization and binary data transformation methods are used, and learning about the ensemble's ensemble with k-means clustering is applied, and applying the support factor according to the value of k. The optimal power consumption pattern model is generated by applying forced and emotion-based control based on the learning results for ensemble aggregates with relatively low average consumption. Through experiments, we validate that it can be applied to a variety of windows through the number or size adjustment of clusters to enable forced and emotion-based control according to the user's intentions by identifying the correlation between the number of clusters and the consistency ratios.

Meta-heuristic Method for the Single Source Capacitated Facility Location Problem (물류 센터 위치 선정 및 대리점 할당 모형에 대한 휴리스틱 해법)

  • Soak, Sang-Moon;Lee, Sang-Wook
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.9
    • /
    • pp.107-116
    • /
    • 2010
  • The facility location problem is one of the traditional optimization problems. In this paper, we deal with the single source capacitated facility location problem (SSCFLP) and it is known as an NP-hard problem. Thus, it seems to be natural to use a heuristic approach such as evolutionary algorithms for solving the SSCFLP. This paper introduces a new efficient evolutionary algorithm for the SSCFLP. The proposed algorithm is devised by incorporating a general adaptive link adjustment evolutionary algorithm and three heuristic local search methods. Finally we compare the proposed algorithm with the previous algorithms and show the proposed algorithm finds optimum solutions at almost all middle size test instances and very stable solutions at larger size test instances.

Coverage Scheduling control Algorithm in MANET (모바일 에드 혹 네트워크에서 커버리지 스케쥴링 제어 알고리즘)

  • Oh, Young-jun;Lee, Kang-whan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.10a
    • /
    • pp.848-850
    • /
    • 2014
  • Mobile Ad hoc Networks(MANET) is consist of node that has mobility, MANET build cluster formation for using energy efficient. In existing LEACH algorithm elect cluster head node in coverage area by distribution function. However, when the cluster head node, that elected by distribution function, is divided coverage area unevenly, the network can't consumption energy efficiency. To solve this problem, we proposed CSWC(Coverage Scheduling Weight-value Control) algorithm. When the coverage area is divided nonchalance, proposed algorithm increased number of hops, that determines coverage area, for balance coverage area. As the result proposed algorithm is set balance coverage area, the network consumption energy efficiency.

  • PDF

An Analytic Model for the Optimal Number of Relay Stations in IEEE 802.16j Cooperative Networks (IEEE 802.16j 협력 전송 네트워크에서 최적의 중계국 수를 위한 분석 모델)

  • Jin, Zilong;Cho, Jin-Sung
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.36 no.9A
    • /
    • pp.758-766
    • /
    • 2011
  • Cooperative communications are adopted as a promising solution to achieve high data rate over large areas in the future 40 wireless system and the relay station (RS) is the key concept in cooperative communications. However, most existing works in this area focus only on optimal RS selections. In addition, there are only few works consider another crucial issue: how many relay stations we need to place. Only when the number of relay stations is defined, the relay station selection can be performed well. In this paper we derive a formula which describes the impact of varying number of RS on end-to-end link throughput assuming a clustering scheme which is based on Voronoi tessellation. In addition to mathematical analysis on the feasibility of the formula, we also examine its performance through a set of simulations under the Erceg path loss model. Simulation results verify that the link throughput gain of our proposed scheme is promising.