• 제목/요약/키워드: C-mean Clustering

검색결과 85건 처리시간 0.021초

Neural Network을 이용한 무선 통신시스템에서의 VAD (VAD By Neural Network Under Wireless Communication Systems)

  • 이호선;김수경;박승권
    • 한국통신학회논문지
    • /
    • 제30권12C호
    • /
    • pp.1262-1267
    • /
    • 2005
  • EBF(Elliptical basis function) 신경망은 비선형 처리를 가능하게 하며, 잡음에 강하고 빠른 수렴을 하는 장점이 있다. 또한 EBF는 설계가 간단하여 실시간 음성 구간 검출기(Voice Activity Detection, VAD)에 적용하기 용이하다. 따라서 전송 효율을 높이기 위해 사용되는 음성구간 검출기를 제안함에 있어 EBF 신경망을 이용하였다. EBF의 학습 알고리즘은 평균 클러스터링(K-means Clustering) 알고리즘과 선형 최소 제곱 방범(Least Mean Square error, LMS)을 사용하였다. G.729 Annex B 와 RBF(Radial Basis Function) 신경망을 이용한 음성구간 검출기와 성능 비교에 있에서, G.729 Annex B 음성 검출기보다 $70\%$ 이상의 높은 성능재선을 나타냈고, RBF 신경망을 이용한 음성구간 검출기 보다 비음성 구간에서 $50\%$정도의 높은 효율을 보였다.

데이터 형태에 적응하는 클러스터링 알고리즘 (Data Clustering Algorithm Adaptive to Data Forms)

  • 이기호;이기철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1433-1436
    • /
    • 2000
  • 클러스터링에 있어서 k-means[7], DBSCAN[2], CURE[4], ROCK[5], PAM[8], 같은 기존의 알고리즘은 원형이나 타원형 등의 어느 고정된 모양에 의해 클러스터를 결정한다. 만약 클러스터 하려는 데이터의 분포가 우연히 알고리즘의 결정된 모양과 일치하면 정확한 해를 얻을 수 있다. 하지만 자연적인 데이터의 분포에서는 발생하기 어렵다. 데이터의 형태를 추적하여 이러한 문제점을 해결한 CHAMELEON[1] 알고리즘이 최근에 발표되었다. 하지만 모양에는 독립적이나 데이터의 양이 증가함에 따라 소요되는 시간이 폭발적으로 증가한다. 이것은 기존의 마이닝 데이터들이 대용량이라는 것을 고려하면 현실에 적용하기 힘든 문제점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 K-means[7]]를 이용한 대표를 선출하는 방법으로 CHAMELEON[1]의 문제점 개선(EF-CHAMELEON)을 시도하였으며 여러 자연적인 형태의 도형들은 아주 작은 원형들의 집합으로 구성 될 수 있다는 생각을 기본으로 잡음에 영향을 받지 않을 정도로 아주 작은 초기 다수의 소형 클러스터를 K-mean을 이용하여 구성하고 이를 다시 크러스터간의 상대적인 거리를 이용하여 다시 머지 하는 방법으로 모양에 의존적인 문제를 해결하며 비교사 학습(unsupervised learning)에 충실하기 위해 임계값을 적용 적정 단계에서 알고리즘을 멈추게 한 ADF 알고리즘을 소개한다. 실험 데이터는 기존의 여러 클러스터링 알고리즘이 판별 할 수 없었던 다양한 모양을 가지고있는 2차원 배열을 사용하여 ADF. CHAMELEON[1], EF-CHAMELEON,의 성능을 비교하였다.

  • PDF

Radial Basis Function Networks를 이용한 이중 임계값 방식의 음성구간 검출기 (Voice Activity Detection Algorithm base on Radial Basis Function Networks with Dual Threshold)

  • 김홍익;박승권
    • 한국통신학회논문지
    • /
    • 제29권12C호
    • /
    • pp.1660-1668
    • /
    • 2004
  • 본 논문에서는 간단한 구조, 적은 계산량과 안정된 빠른 수렴속도를 가진 RBF (Radial Basis Function) 신경회로망을 이용한 이중 임계값 방식의 음성구간 검출기 알고리즘을 제안하고 시뮬레이션을 통해 유용성을 확인하였다. 음성압축기에 사용되는 CELP (Code-Excited Linear Prediction) 파라미터들을 신경회로망 입력으로 하여 잡음에 강하게 반응하게 하였고, 음성구간 검출기의 성능향상을 위해 음성구간과 침묵구간에서 다른 임계값을 사용하는 이중 임계값 방식을 적용하였다. 실험 결과 이중 임계값을 이용한 RBF 신경망 음성구간 검출기는 G.729 Annex B 음성구간 검출기 보다 우수한 성능을 보였고, 기존의 MLP (Multi Layer Perceptron) 신경회로망을 이용한 음성구간 검출기와 비교하여 음성구간에서는 비슷한 성능을 보였으나 침묵구간에서 25% 정도의 성능향상을 보였다.

Determination of Genetic Diversity Using 15 Simple Sequence Repeats Markers in Long Term Selected Japanese Quail Lines

  • Karabag, Kemal;Balcioglu, Murat Soner;Karli, Taki;Alkan, Sezai
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제29권12호
    • /
    • pp.1696-1701
    • /
    • 2016
  • Japanese quail is still used as a model for poultry research because of their usefulness as laying, meat, and laboratory animals. Microsatellite markers are the most widely used molecular markers, due to their relative ease of scoring and high levels of polymorphism. The objective of the research was to determine genetic diversity and population genetic structures of selected Japanese quail lines (high body weight 1 [HBW1], HBW2, low body weight [LBW], and layer [L]) throughout 15th generations and an unselected control (C). A total of 69 individuals from five quail lines were genotyped by fifteen microsatellite markers. When analyzed profiles of the markers the observed ($H_o$) and expected ($H_e$) heterozygosity ranged from 0.04 (GUJ0027) to 0.64 (GUJ0087) and 0.21 (GUJ0027) to 0.84 (GUJ0037), respectively. Also, $H_o$ and $H_e$ were separated from 0.30 (L and LBW) to 0.33 (C and HBW2) and from 0.52 (HBW2) to 0.58 (L and LBW), respectively. The mean polymorphic information content (PIC) ranged from 0.46 (HBW2) to 0.52 (L). Approximately half of the markers were informative ($PIC{\geq}0.50$). Genetic distances were calculated from 0.09 (HBW1 and HBW2) to 0.33 (C and L). Phylogenetic dendrogram showed that the quail lines were clearly defined by the microsatellite markers used here. Bayesian model-based clustering supported the results from the phylogenetic tree. These results reflect that the set of studied markers can be used effectively to capture the magnitude of genetic variability in selected Japanese quail lines. Also, to identify markers and alleles which are specific to the divergence lines, further generations of selection are required.

Genetic Differentiation of Chinese Indigenous Meat Goats Ascertained Using Microsatellite Information

  • Ling, Y.H.;Zhang, X.D.;Yao, N.;Ding, J.P.;Chen, H.Q.;Zhang, Z.J.;Zhang, Y.H.;Ren, C.H.;Ma, Y.H.;Zhang, X.R.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제25권2호
    • /
    • pp.177-182
    • /
    • 2012
  • To investigate the genetic diversity of seven Chinese indigenous meat goat breeds (Tibet goat, Guizhou white goat, Shannan white goat, Yichang white goat, Matou goat, Changjiangsanjiaozhou white goat and Anhui white goat), explain their genetic relationship and assess their integrity and degree of admixture, 302 individuals from these breeds and 42 Boer goats introduced from Africa as reference samples were genotyped for 11 microsatellite markers. Results indicated that the genetic diversity of Chinese indigenous meat goats was rich. The mean heterozygosity and the mean allelic richness (AR) for the 8 goat breeds varied from 0.697 to 0.738 and 6.21 to 7.35, respectively. Structure analysis showed that Tibet goat breed was genetically distinct and was the first to separate and the other Chinese goats were then divided into two sub-clusters: Shannan white goat and Yichang white goat in one cluster; and Guizhou white goat, Matou goat, Changjiangsanjiaozhou white goat and Anhui white goat in the other cluster. This grouping pattern was further supported by clustering analysis and Principal component analysis. These results may provide a scientific basis for the characteristization, conservation and utilization of Chinese meat goats.

요인 및 군집분석을 이용한 지상 라이다 자료의 분류 (Classification of Terrestrial LiDAR Data Using Factor and Cluster Analysis)

  • 최승필;조지현;김열;김준성
    • 대한공간정보학회지
    • /
    • 제19권4호
    • /
    • pp.139-144
    • /
    • 2011
  • 본 연구는 지상라이다 자료에서 얻어진 색상정보(R, G, B)와 반사강도정보(I)를 동시에 이용하여 이를 통계학적 분류기법으로 서로의 연관성을 분석하여 라이다 자료에 대한 분류방법을 제시하였다. 이를 위하여 우선 변수 R,G,B 및 I를 사용하여 분산 을 극대화하는 요인을 추출하여 주요인과 각 변수들 간의 요인행렬을 산출하였다. 그러나 요인행렬은 기초자료를 축소시켜 보여주기는 하지만, 이로부터 어떤 변수들이 어떤 요인에 의해 높게 관계되는지 명확하게 알기 어렵기 때문에 직각회전방식 중에서 Varimax방법을 이용하여 회전된 요인행렬을 구하여 요인점수를 산출하였다. 그리고 비 계층적 군집화 방법인 K-평균법을 이용하여 요인분석으로 산출된 요인점수에 대하여 군집분석을 실시한 후, 지상라이다 자료의 분류 정확도를 평가하였다.

국내 주요 강 생태계 내 동물플랑크톤의 탄소, 질소, 인 비율 해석 (Carbon, Nitrogen and Phosphorous Ratios of Zooplankton in the Major River Ecosystems)

  • 김현우;라긍환;정광석;김동균;황순진;이재용;김범철
    • 생태와환경
    • /
    • 제46권4호
    • /
    • pp.581-587
    • /
    • 2013
  • 국내 주요 강 생태계 (한강, 금강, 영산강, 섬진강)에서 지난 2004년부터 2008년까지 총 동물플랑크톤의 탄소(C), 질소(N) 및 인(P) 함량에 대해 평가하였다. 동물플랑크톤의 건중량 당 C, N P-함량은 강 시스템별로 변화가 뚜렷하였다. 조사지점별 평균 C, N, 그리고 P-함량의 범위는 $70{\sim}620mgC\;mg^{-1}$ D.W., $7.1{\sim}85.5{\mu}gN\;mg^{-1}$ D.W. 그리고 $2.5{\sim}7.4{\mu}gP\;mg^{-1}$ D.W.인 것으로 파악되었다. 평균 탄소: 질소: 인 비율은 지점별 상이한 차이를 보였으며 전 지점의 평균은 200 : 29 : 1인 것으로 파악되었다. 전 조사지점에서의 동물플랑크톤 군집의 탄소: 인 그리고 질소: 인 비율의 범위는 각 각 38에서 392 : 1과 4에서 65 : 1이었다. 자가조직화지도(SOM)을 활용한 평면상 지점들의 배치 양상과 화학양론 자료들 간의 주요그룹 분석 결과 크게 세 클러스터로 구분되었다. 클러스터링 결과 동물플랑크톤의 C, N, P-함량은 공간적 이질성에 의해 영향을 받았으며, 화학량론 자료는 강 생태계의 환경 특성 해석에 활용성이 높은 것으로 사료되었다.

Saos-2 세포에서 Doxorubicin에 의한 세포사멸 유도과정에서의 유전자 발현 변화 (Profile of Gene Expression Changes During Doxorubicin Induced Apoptosis of Saos-2)

  • 임정숙;배민재;백석환;김재룡;김정희;김성용
    • Journal of Yeungnam Medical Science
    • /
    • 제22권2호
    • /
    • pp.221-240
    • /
    • 2005
  • 사람의 악성 골종양 세포주 Saos-2 를 이용하여 doxorubicin에 의해 발현이 증가 또는 감소하는 유전자들의 변화를 cDNA microarray를 이용하여 확인하였다. 그 결과 대조군에 비하여 2배 이상 증가 또는 감소하는 유전자 264개, 3배 이상 증가 또는 감소하는 유전자 35개를 선별할 수 있었다. Doxorubicin 처리 후 시간대 별로 발현변화가 비슷한 유전자들을 k-mean clustering으로 분석하여 5가지의 군으로 분류할 수 있었다. A군은 24시간 까지 계속 발현이 증가하는 67개 유전자, B군은 6시간까지는 변화가 없다가 24시간에는 감소하는 108개 유전자, C군은 6시간에 발현의 감소하고 24시간까지 지속되는 33개 유전자, D군은 6시간에 발현의 감소하였으나 24시간에는 다시 발현이 회복되는 5개 유전자, 그리고 E군은 6시간까지는 발현의 변화가 없다가 24시간에 발현이 증가하는 경향을 보이는 51개 유전자로 구분하였다. cDNA microarry 결과 발현차이가 현저한 22개의 유전자들을 대상으로 RT-PCR을 시행하여 발현정도를 비교하였다. cDNA microarry에서 발현증가를 보이는 13개 유전자 중에서, RT-PCR 결과 11개가 그 발현이 증가하였으며, cDNA microarry의 결과에서 발현감소를 보이는 9개 유전자 중에서 RT-PCR 결과에서 2개 유전자만 감소하였다. 이상의 결과 Saos-2 세포에서 doxorubicin에 의해 세포사멸과 세포성장, 세포신호전달, 세포골격, 세포주기, 운반, 대사 등에 관여하는 많은 유전자들의 발현이 변함을 확인할 수 있었다.

  • PDF

Binary Harmony Search 알고리즘을 이용한 Unsupervised Nonlinear Classifier 구현 (Implementation of Unsupervised Nonlinear Classifier with Binary Harmony Search Algorithm)

  • 이태주;박승민;고광은;성원기;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.354-359
    • /
    • 2013
  • 본 논문을 통해서 우리는 최적화 알고리즘인 binary harmony search (BHS) 알고리즘을 이용하여 unsupervised nonlinear classifier를 구현하는 방안을 제시하였다. 패턴인식을 위한 기계학습이나 뇌파 신호의 분석 과정과 같이 벡터로 표현되는 특징들을 분류하는데 있어 다양한 알고리즘들이 제시되었다. 교사 학습기반의 분류 방식으로는 support vector machine과 같은 기법이 사용되어왔고, 비교사 학습 방법을 통한 분류 기법으로는 fuzzy c-mean (FCM)과 같은 알고리즘들이 사용되어 왔다. 그러나 기존에 사용해 왔던 분류 방법들은 비선형 데이터 분류에 적용하기 힘들거나 교사 학습을 적용하기 위해서 사전정보를 필요로 하는 문제점이 있다. 본 논문에서는 경험적 접근을 통해 공간상에 분포된 벡터 사이의 기하학적 거리를 최소로 만드는 벡터 집합을 선택하고 이를 하나의 클래스로 간주하는 방법을 적용한 분류법을 제시하였다. 비교 대상으로 FCM과 artificial neural network (ANN) 기반의 self-organizing map (SOM)을 제시하였다. 시뮬레이션에는 KEEL machine learing dataset을 사용하였고 그 결과, 제안된 방식이 기존 알고리즘에 비해 더 나은 우수성을 지니고 있음을 확인하였다.

예쁜꼬마선충의 수영 행동 영상과 기계학습 모델을 이용한 수질 오염 물질 구분 방법 (A Method for the Classification of Water Pollutants using Machine Learning Model with Swimming Activities Videos of Caenorhabditis elegans)

  • 강승호;정인선;임형석
    • 한국정보통신학회논문지
    • /
    • 제25권7호
    • /
    • pp.903-909
    • /
    • 2021
  • 예쁜꼬마선충(Caenorhabditis elegans)은 염기서열이 완전히 밝혀진 동물로 유전자 기능 분석, 동물 행동 연구 등 다양한 연구 분야에 사용되는 대표적인 생물 종이다. 그동안 선충을 이용해 물의 오염 여부를 판별하기 위한 바이오 모니터링 시스템에 대한 여러 연구들이 있었다. 본 논문은 하천의 수질 오염의 원인이 되는 화학물질을 식별하기 위해 선충의 수영 행동이 활용 가능한 지를 보여주기 위해 기계학습 기반의 바이오 모니터링 시스템을 제안한다. 선충의 수영 행동을 대표하기 위해 선충을 대상으로 가지 길이 유사성(Branch Length Similarity) 엔트로피를 계산한다. 그리고 BLS 엔트로피의 조합인 BLS 엔트로피 프로파일을 클러스터링 알고리즘을 사용해 몇 가지 패턴으로 유형화하여 데이터 집합을 만든다. 0.1ppm 농도의 포름알데히드, 벤젠, 톨루엔이 첨가된 아레나에서 선충의 수영 행동을 촬영하고 개발한 히든 마코프 모델(Hidden Markov Model: HMM)의 성능을 검증한다.