• 제목/요약/키워드: Cluster Models

검색결과 355건 처리시간 0.03초

HMM을 기본으로한 집단화 방법의 불특정화자 단어 인식에 응용 (The Application of an HMM-based Clustering Method to Speaker Independent Word Recognition)

  • 임현;박순영;방만원
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.5-10
    • /
    • 1995
  • 본 논문에서는 단어를 발음하는 방법 이 각각 다른 화자들의 변이성을 잘 흡수하도록 복수개의 통계적인 모델들을 구성하기 위하여 HMM을 기본으로 하는 집단화 방법을 제시한다. 또한 개발된 방법으로부터 얻어진 HMM집단화된 모델들이 불특정화자 고립단어 인식에 응용된다. HMM 집단화 방법은 학습용 데이타로부터 어떤 경계치 보다 낮은 유사도를 갖는 관측열들을 분리하여 새로운 집단을 만들고 이 집단내에 있는 관측열들을 이용하여 새로운 모델들을 학습시키는 방법이다. 집단화 과정은 반복되는데 최고의 유사도를 갖는 모델의 집단에 관측열들을 재분배하고 집단내 관측열들이 변화하면 새로운 모델을 재 추정하여 기존의 모델을 대신한다. 그러므로 이 집단화 방법은 집단화 과정과 파라미터 추정이 일체화되어 기존의 패턴에 의한 집단화 방법보다 더욱 효율적이 된다. 실험결과 HMM에 의한 집단화 방법이 기존의 패턴에 의한 집단화 방법보다. 고립 숫자음 인식에 있어서 $1.43\%$의 인식률을 향상시킬 수 있었으며 단일 모델의 사용보다는 $2.08\%$의 인식률이 향상되었다.

  • PDF

GMM-supervector를 사용한 SVM 기반 화자분류에 대한 연구 (A Study on SVM-Based Speaker Classification Using GMM-supervector)

  • 이경록
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1022-1027
    • /
    • 2020
  • 본 논문에서는 GMM-supervector를 특징 파라미터로 하는 SVM 기반 화자 분류에 대해서 실험하였다. 실험을 위한 화자 클러스터를 생성하기 위해서 기존의 SNR 기반 가중치를 반영한 KL거리 기반 화자변화검출을 실행하였다. SVM 기반 화자 분류는 2단계로 이루어져있다. 1단계는 UBM과 화자 모델들간의 SVM 기반 분류를 시행하여 각 클러스터에 화자 정보를 인덱싱한 다음 화자별로 그룹핑한다. 2단계는 화자 클러스터 그룹에 UBM과 화자모델들간의 SVM 기반 분류를 시행한다. SVM의 커널 함수로는 Linear와 RBF를 사용하였다. 실험결과, 1단계에서는 Linear 커널이 화자 클러스터 148개, MDR 0, FAR 47.3, ER 50.7로 좋은 성능으로 보였다. 2단계 실험결과도 Linear 커널이 화자 클러스터 109개, MDR 1.3, FAR 28.4, ER 32.1로 좋은 성능을 보였다.

Developing efficient model updating approaches for different structural complexity - an ensemble learning and uncertainty quantifications

  • Lin, Guangwei;Zhang, Yi;Liao, Qinzhuo
    • Smart Structures and Systems
    • /
    • 제29권2호
    • /
    • pp.321-336
    • /
    • 2022
  • Model uncertainty is a key factor that could influence the accuracy and reliability of numerical model-based analysis. It is necessary to acquire an appropriate updating approach which could search and determine the realistic model parameter values from measurements. In this paper, the Bayesian model updating theory combined with the transitional Markov chain Monte Carlo (TMCMC) method and K-means cluster analysis is utilized in the updating of the structural model parameters. Kriging and polynomial chaos expansion (PCE) are employed to generate surrogate models to reduce the computational burden in TMCMC. The selected updating approaches are applied to three structural examples with different complexity, including a two-storey frame, a ten-storey frame, and the national stadium model. These models stand for the low-dimensional linear model, the high-dimensional linear model, and the nonlinear model, respectively. The performances of updating in these three models are assessed in terms of the prediction uncertainty, numerical efforts, and prior information. This study also investigates the updating scenarios using the analytical approach and surrogate models. The uncertainty quantification in the Bayesian approach is further discussed to verify the validity and accuracy of the surrogate models. Finally, the advantages and limitations of the surrogate model-based updating approaches are discussed for different structural complexity. The possibility of utilizing the boosting algorithm as an ensemble learning method for improving the surrogate models is also presented.

네트워크 기반 클러스터 시스템을 위한 적응형 동적 부하균등 방법 (Adaptive Dynamic Load Balancing Strategies for Network-based Cluster Systems)

  • 정훈진;정진하;최상방
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권11호
    • /
    • pp.549-560
    • /
    • 2001
  • 클러스터 시스템을 계산능력과 메모리 크기에 있어서 바람직한 확장성을 제공한다. 또한 고속의 컴퓨터 네트워크 기술의 발달로 인해 클러스터 시스템은 값비싼 MPPs (Massively Parallel Processors)와 비교하여 경쟁력을 얻고 있다. 부적당한 작업 스케줄링은 시스템의 기능을 충분히 이용할수 없고, 병렬처리 프로그램에서 프로그램 실행 전에 각 태스크의 부하를 예측하기 어려우며, 태스크들은 다양한 형태로 서로 의존적이다. 동적 부하균등 알고리즘에서는 실행시간에 각 프로세서의 부하를 평가한 후, 각 태스크를 적절한 크기로 분할하고 그것들을 각 프로세서의 수행능력에 비례하여 클러스터 시스템에 할당한다. 그러나, 프로세싱 노드간의 통신비용이 높으면, 모든 노드들이 부하분산에 참여하는 것은 효율적이지 못하다. 본 논문에서는 부하분산에 참여하는 프로세서를 통신비용과 평균 부하로부터의 편차를 고려하여 제한하였다. 기존의 부하균등 방식과 제안된 동적 알고리즘을 비교하기 위하여, 통신비용, 노드 수, 그리고 부하의 범위와 같은 파라메터를 사용하여 다양한 모델의 클러스터 시스템에 관한 시뮬레이션을 수행하였다.

  • PDF

경쟁위험 생존자료에 대한 결합 프레일티모형 (A Joint Frailty Model for Competing Risks Survival Data)

  • 하일도;조건호
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1209-1216
    • /
    • 2015
  • 경쟁위험사건들은 다기관 임상시험과 같은 군집화된 임상연구에서 자주 관측되어진다. 본 논문에서는 하나의 군집으로 부터 얻어지는 경쟁위험 생존자료에 대해 공통 프레일티를 허락하는 결합 프레일티모형 접근법을 제안한다. 추론을 위해 어려운 적분 자체를 피하는 다단계 가능도를 사용하여, 대응하는 추론절차를 유도한다. 또한 실제자료 분석을 통해 제안된 방법을 예증한다.

Satellite Overquenching Problem

  • Yi, Suk-Young;Kimm, Tay-Sun
    • 한국우주과학회:학술대회논문집(한국우주과학회보)
    • /
    • 한국우주과학회 2009년도 한국우주과학회보 제18권2호
    • /
    • pp.34.3-34.3
    • /
    • 2009
  • We have investigated the recent star formation history of the nearby galaxies using the SDSS optical and Galex UV data. To everyone's surprise, we found that roughly 30 percent of elliptical galaxies had a residual star formation in the last billion years, suggesting that residual star formation has been common even in ellipticals. Galaxy evolution models based on semi-analytic prescriptions including AGN feedback reasonably reproduce the star formation properties of elliptical galaxies. However, we found that the current galaxy models miserably fail to reproduce the star formation properties of satellite disc galaxies in cluster environments. Satellite disc galaxies in models are overly star-formation quenched in comparison to observation. Detailed investigations led us to conclude that this is due to the use of inaccurate prescriptions for the gas content evolution in the model. I present a solution to the problem by adopting more realistic physical prescriptions.

  • PDF

헬스케어 특허의 IPC 코드 기반 사회 연결망 분석(SNA)을 이용한 기술 융복합 분석 (Technology Convergence Analysis by IPC Code-Based Social Network Analysis of Healthcare Patents)

  • 심재륜
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.308-314
    • /
    • 2022
  • 본 연구는 국내에 출원된 헬스케어 특허의 기술 융복합 분석에 관한 것으로 사회 연결망 분석(Social Network Analysis)을 이용하여 핵심 기술간 관계를 시각화하였다. 헬스케어 특허의 서브클래스 수준에서 복합 IPC 코드를 가지는 특허는 1,155건(49.4%)으로 조사되었고, 이를 대상으로 사회 연결망 분석을 실시한 결과 연결 중심성이 가장 큰 IPC 코드는 A61B, G16H, G06Q 순이고, 매개 중심성이 가장 큰 IPC 코드는 A61B, G16H, G06Q 순이다. 또한 헬스케어 특허는 두 개의 큰 기술 집합(Cluster)으로 구성되어 있다는 것을 확인할 수 있었다. Cluster-1은 A61B와 G16H 및 G06Q를 중심으로 헬스케어 인포매틱스 관련 기술을 이용한 진단, 수술 등 관련 비즈니스 모델에 해당하고, Cluster-2는 H04L과 H04W 및 H04B로 구성된 디지털 통신 기반의 헬스케어 사물인터넷 기술이다. 헬스케어 특허의 기술 융복합 핵심 쌍은 Cluster-1에서 [G16H-A61B]와 [G16H-G06Q] 이고, Cluster-2에서는 [H04L-H04W] 이다. 본 연구는 헬스케어 특허의 기술 개발 동향과 앞으로의 특허 출원에 기여할 수 있다.

소나무와 일본잎갈나무의 연륜생장과 기후 요소와의 상관관계 분석 및 생장예측 (Correlation Analysis between Climatic Factors and Radial Growth and Growth Prediction for Pinus densiflora and Larix kaempferi in South Korea)

  • 정준모;김현섭;김미숙;전영우
    • 한국산림과학회지
    • /
    • 제106권1호
    • /
    • pp.77-86
    • /
    • 2017
  • 본 연구는 소나무(Pinus densiflora)와 일본잎갈나무(Larix kaempferi)의 연륜생장과 기후 요소와의 관계를 분석하고, 각 수종별 연구지역을 기후군집으로 분류하여 군집별 연륜기후학적 모델을 개발하였다. 또한 기후변화에 따른 연륜생장 변화를 RCP 기후변화 시나리오와 연륜기후학적 모델을 이용하여 예측하였다. 군집분석을 통한 소나무와 일본잎갈나무의 기후군집은 각각 4개로 분류되었다. 각 군집별 연륜기후학적 모델은 단계적 회귀분석으로 표준화된 잔차연대기와 군집별 기후변수를 이용하여 작성하였다. 소나무의 연륜기후학적 모델에는 각 4개씩의 기후변수가 사용되었고 $R^2$는 0.38~0.58로 나타났다. 일본잎갈나무 연륜기후학적 모델에는 2~5개의 기후변수가 사용되었고 $R^2$는 0.31~0.43으로 분석되었다. 수종별 연륜생장변화 예측은 RCP 4.5와 RCP 8.5 두 개의 기후변화 시나리오를 이용하였다. 소나무 기후군집별 연륜생장예측은 백두대간 산악지역인 군집 4에서 연륜생장이 증가하였고 평균기온이 높은 군집 2와 군집 3에서는 연륜생장이 감소하였다. 일본잎갈나무는 월평균 최저기온이 낮은 군집 1과 평균기온이 높은 군집 2에서는 기후변화가 진행됨에 따라 연륜생장이 감소하였고, 동부해안지역인 군집 3과 해발고가 높은 지역인 군집 4에서는 연륜생장이 유지되었다. 본 연구의 결과는 소나무와 일본잎갈나무의 기후변화에 따른 연륜생장의 변화 예측에 필요한 유용한 정보로 활용될 수 있을 것으로 기대된다.

구조적 공백과 협업필터링을 이용한 추천시스템 (Recommender Systems using Structural Hole and Collaborative Filtering)

  • 김민건;김경재
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.107-120
    • /
    • 2014
  • 본 연구에서는 사회연결망분석기법 중 하나인 구조적 공백 분석 결과를 이용하여 추천과정에 사용자의 정성적이고 감성적인 정보를 반영할 수 있는 협업필터링 기반의 추천시스템을 제안한다. 협업필터링은 추천기술 중 가장 많이 활용되고 있지만 전통적으로 확장성과 희박성 등의 문제점뿐 만 아니라 사용자-상품 매트릭스의 선호도만을 이용하여 추천을 함으로써 사용자의 정성적이고 감성적인 정보를 추천과정에 반영하지 못한다는 한계점이 있다. 본 연구에서 제안하는 추천시스템은 사회연결망분석에서 중심성 분석과 함께 연결망 내의 주요개체를 탐지할 수 있는 구조적 공백 분석을 이용하여 연결망 내의 대표 사용자들을 추출한 후 이들을 중심으로 군집을 형성한 후 각 군집색인 협업필터링을 수행하는 과정을 통해 전통적인 협업필터링에서 반영하지 못했던 정성적, 감성적 정보를 반영한다. 한편, 군집색인 협업필터링을 수행함으로써 추천의 효율성을 높일 수 있는 장점도 있다. 본 연구에서는 실제 사용자들의 상품에 대한 선호도 평가점수와 사용자들의 사회연결망 정보를 수집하여 실험을 수행하고 전통적인 협업필터링과 다양한 형태의 협업필터링과의 추천성과 비교를 통하여 제안하는 시스템의 유용성을 확인한다. 비교모형으로는 전통적인 협업필터링, 임의 군집색인 기반 협업필터링, k평균 군집색인 기반 협업필터링을 이용한 추천시스템이며, 실험 결과, 제안한 모형이 다른 비교모형에 비해 추천성과의 정확도가 가장 우수하였다. 추천성과의 차이에 대한 통계적 유의성 검정 결과, 제안 모형은 전통적인 협업필터링 기반의 추천시스템과는 통계적으로 유의한 성과 차이가 없었으나, 다른 두 모형에 대해서는 통계적으로 유의한 성과의 차이가 있는 것으로 나타났다.

PROBING GALAXY FORMATION MODELS IN COSMOLOGICAL SIMULATIONS WITH OBSERVATIONS OF GALAXY GROUPS

  • HABIB. G., KHOSROSHAHI;GOZALIASL, GHASSEM;FINOGUENOV, ALEXIS;RAOUF, MOJTABA;MIRAGHEE, HALIME
    • 천문학논총
    • /
    • 제30권2호
    • /
    • pp.349-353
    • /
    • 2015
  • We use multi-wavelength observations of galaxy groups to probe the formation models for galaxy formation in cosmological simulations, statistically. The observations include Chandra and XMM-Newton X-ray observations, optical photometry and radio observations at 1.4 GHz and 610 MHz. Using a large sample of galaxy groups observed by the XMM-Newton X-ray telescope as part of the XMM-Large Scale Survey, we carried out a statistical study of the redshift evolution of the luminosity gap for a well defined mass-selected group sample and show the relative success of some of the semi-analytic models in reproducing the observed properties of galaxy groups up to redshift z ~ 1.2. The observed trend argues in favour of a stronger evolution of the feedback from active galactic nuclei at z < 1 compared to the models. The slope of the relation between the magnitude of the brightest cluster galaxy and the value of the luminosity gap does not evolve with redshift and is well reproduced by the models. We find that the radio power of giant elliptic galaxies residing in galaxy groups with a large luminosity gap are lower compared to giant ellipticals of the same stellar masses but in typical galaxy groups.