• Title/Summary/Keyword: 유클리드거리 분석

Search Result 56, Processing Time 0.024 seconds

Adaptive Euclidean Distance Measure Method for Numeric Data Distribution (수치 데이터 분포에 적응적 유클리드 거리 측정 기법)

  • Choi, You-Hwan;Joo, Bum-Joon;Jung, Sung-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.67-69
    • /
    • 2011
  • 데이터의 군집 분석에서 두 개의 서로 다른 데이터에 대한 유사도(거리)를 어떻게 정의하는가는 매우 중요한 문제이다. 수치속성에 대한 거리 측정 방법에는 다양한 기법이 존재하지만 각 속성의 크기와 범위가 서로 크게 다를 경우 이들을 동일한 인자로 여기고 거리 측정을 하게 되면 논리적인 오류를 범할 수 있다. 기존의 군집 분석 연구에서 사용된 거리 측정 기법은 데이터의 정규화 과정을 통해 이 문제를 해결하려고 노력하지만 일반적인 정규화는 이상치의 존재나 데이터의 편중된 분포 등의 이유로 속성별 거리가 왜곡될 수 있다. 본 논문은 이러한 문제점을 해결하기 위해 정규화된 데이터에서 각 속성의 비중을 고려한 적응적 유클리드 거리 측정 기법(AEDM: Adaptive Euclidean Distance Measure)을 제안한다. AEDM은 유클리드 거리를 기반으로 정규화 된 데이터의 형태에 따라 가중치를 부여하여 데이터의 분포에 관계없이 각 속성간의 거리를 충분히 반영하기 때문에 더욱 정확한 군집 분석을 가능하게 한다.

Network Distance Estimation Scheme with Virtual Topology and Local Adjustment Term (가상 토폴로지와 지역 조정 항을 이용한 네트워크 거리 추정)

  • Lee, Sang-Hwan
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2006.05a
    • /
    • pp.241-248
    • /
    • 2006
  • 네트워크 거리 (Network distance : 일반적으로 ping이나 traceroute 등으로 측정 가능한 round trip time 등 네트워크 상에서 패킷 전송 시간) 추정 기법은 인터넷상의 많은 응용프로그램들에서 유용하게 사용된다. 예를 들면 다수의 서버를 인터넷상에 설치하고자 하는 경우 사용자들 간의 네트워크 거리를 알고 있다면 서버와 사용자간의 왕복 전송 시간 (Round Trip Time)등을 최소화할 수 있도록 서버를 분산하여 설치하는 구성을 도출해 낼 수 있을 것이다. Peer to Peer 응용 프로그램들에서도 이 네트워크 거리 정보는 매우 유용하다. 기존에 존재하는 추정 기법들은 대부분 유클리드 공간 좌표 기반 기법들로서 유클리드 좌표 상의 거리가 실제 네트워크 거리와 유사하도록 유클리드 공간 좌표를 지정한다. 그러나 이런 방법들의 문제점은 인터넷 상의 네트워크 거리가 삼각 부등식을 만족하지 않는 경우가 존재하는 등 유클리드 공간의 기본적인 가정을 만족하지 못한다는데 있다. 이런 문제점 때문에 새로운 모델이 필요하고, 이 논문에서는 가상 토폴로지(Virtual Topology) 모델과 지역 조정 항 (Local Adjustment Term) 모델을 제시하고, 기본적인 성능 분석을 시도하였다.

  • PDF

Performance of a 3-Dimensional Signal Transmission System (3차원 신호 전송시스템의 성능)

  • Kwon, Hyeock Chan;Kang, Seog Geun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.11
    • /
    • pp.2021-2026
    • /
    • 2016
  • In this paper, a system model for transmission of 3-dimensional (3-D) signals is presented and its performance is analyzed. Unlike 2-D signals, no quadrature form expression for the 3-D signals is available. Exploiting a set of orthogonal basis functions, the 3-D signals are transmitted. As a result of computer simulation using very higher-level signal constellations, the 3-D transmission system has significantly improved error performance as compared with the 2-D system. It is considered that the principal reason for such performance improvement is much increased minimum Euclidean distance (MED) of the 3-D lattice constellations compared with the corresponding 2-D ones. When the MEDs of 2-D and 3-D lattice constellation are compared to confirm the analysis, the MED of 3-D 1024-ary constellation is around 2.6 times larger than that of the quadrature amplitude modulation (QAM). Expanding the constellation size to 4096, the MED of 3-D lattice constellation is increased by 3.2 times of the QAM.

Segmentation of Continuous Speech based on PCA of Feature Vectors (주요고유성분분석을 이용한 연속음성의 세그멘테이션)

  • 신옥근
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.2
    • /
    • pp.40-45
    • /
    • 2000
  • In speech corpus generation and speech recognition, it is sometimes needed to segment the input speech data without any prior knowledge. A method to accomplish this kind of segmentation, often called as blind segmentation, or acoustic segmentation, is to find boundaries which minimize the Euclidean distances among the feature vectors of each segments. However, the use of this metric alone is prone to errors because of the fluctuations or variations of the feature vectors within a segment. In this paper, we introduce the principal component analysis method to take the trend of feature vectors into consideration, so that the proposed distance measure be the distance between feature vectors and their projected points on the principal components. The proposed distance measure is applied in the LBDP(level building dynamic programming) algorithm for an experimentation of continuous speech segmentation. The result was rather promising, resulting in 3-6% reduction in deletion rate compared to the pure Euclidean measure.

  • PDF

Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance (다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법)

  • Nam, Seungchan;Choi, Yong-Seok
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.4
    • /
    • pp.567-578
    • /
    • 2017
  • Grouped multivariate data can be tested for differences between two or more groups using multivariate analysis of variance (MANOVA). However, this method cannot be used if several assumptions of MANOVA are violated. In this case, multidimensional scaling (MDS) and analysis of distance (AOD) can be applied to grouped dissimilarities based on the various distances. A permutation test is a non-parametric method that can also be used to test differences between groups. MDS is used to calculate the coordinates of observations from dissimilarities and AOD is useful for finding group structure using the coordinates. In particular, AOD is mathematically associated with MANOVA if using the Euclidean distance when computing dissimilarities. In this paper, we study the between and within group structure by applying MDS and AOD to the grouped dissimilarities. In addition, we propose a new test statistic using the group structure for the permutation test. Finally, we investigate the relationship between AOD and MANOVA from dissimilarities based on the Euclidean distance.

Similarity Calculation for Mobile Life Log Data Mining (모바일 라이프로그 데이터 마이닝을 위한 Non-Euclidean 데이터의 유사도 계산)

  • Lee, Young-Seol;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.298-301
    • /
    • 2011
  • 모바일 기기에서 수집된 많은 정보들은 시맨틱한 정보들을 포함하고 있기 때문에 수치 해석에 특화된 클러스터링 등의 데이터마이닝 방법들을 적용하기가 힘들다. 따라서 상대적인 유사도를 계산하는 방법이 많이 이용되지만, 상대적인 유사도 값조차 유클리드 거리로 환산이 불가능한 특징을 가지는 경우가 많다. 본 논문에서는 비유클리드 특징을 가지는 유사도를 TFIDF 와 pseudo-Euclidean embedding을 적용하여 유클리드 공간 상의 거리값으로 변환하는 방법을 제안한다. 제안하는 방법의 가능성을 보이기 위하여 모바일 기기에서 대학생들의 생활 패턴을 반영하는 데이터를 수집하고, 수집된 데이터에 제안하는 방법을 적용한다. 그리고 적용된 결과를 대학생들의 생활 패턴과 비교하여 분석한다. 또한 장소 간의 유사도를 이용하는 애플리케이션의 프로토타입을 개발한다.

The Transform of Multidimensional Categorical Data and its Applications (다차원 범주형 자료의 변환과 그의 응용)

  • Ahn, Ju-Sun
    • The Korean Journal of Applied Statistics
    • /
    • v.20 no.3
    • /
    • pp.585-595
    • /
    • 2007
  • The squared Euclid distance of the values which is transformed by P-matrix of Ahn et al. (2003) is in proportion to the squared Euclid distance of cell's relative frequencies in two Contingency Tables. We propose the method of using the PP-values for the analysis of modern poems and questionnaire data.

3D Automatic Skeleton Extraction of Coronary Artery for Interactive Shape Analysis (관상동맥의 인터랙티브 형상 분석을 위한 3차원 골격의 자동 생성)

  • Lee, Jae-Jin;Kim, Jeong-Sik;Choi, Soo-Mi
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.541-546
    • /
    • 2006
  • 3차원 관상동맥을 분석하기 위해서는 혈관의 분기점, 극단점, 혈관의 계층적 구조 관계를 함축적으로 표현하는 것이 매우 중요하다. 본 논문에서는3차원 CT 혈관 조영 영상으로부터 관상동맥의 3차원 골격을 자동으로 추출하는 방법을 개발하였다. 먼저, CT혈관 조영술에 의해 획득된 슬라이스 이미지로부터 3차원 조작 및 수술 시뮬레이션 등을 위하여 혈관의 3차원 표면에 대한 메쉬 모델을 생성한다. 생성된 메쉬 모델이 임의로 변형된 후에도 자동으로 골격을 쉽게 추출할 수 있도록 메쉬 모델을 복셀화하는 단계를 거친다. 이렇게 얻어진 복셀 모델로부터 표면복셀을 결정하고 표면 복셀로부터 객체 복셀까지의 유클리드 거리값를 계산하여 유클리드 거리맵(EDM)을 계산한다. 계산된 EDM 으로부터 객체 복셀이 가지게 되는 최대 내접 구를 계산하여 Discrete Medial Surface을 생성하게 되는데 이것은 골격의 후보가 된다. 골격의 후보집합 복셀에 대하여 Dijkstra 최단 경로 결정 알고리즘을 적용하여 골격을 자동으로 추출하게 된다. 이렇게 추출된 3차원 골격은 관상동맥 수술 시뮬레이션 등의 다양한 형상 분석에 유용하게 사용될 수 있다.

  • PDF

Visualizing multidimensional data in multiple groups (다그룹 다차원 데이터의 시각화)

  • Huh, Myung-Hoe
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.1
    • /
    • pp.83-93
    • /
    • 2017
  • A typical approach to visualizing k (${\geq}2$)-group multidimensional data is to use Fisher's canonical discriminant analysis (CDA). CDA finds the best low-dimensional subspace that accommodates k group centroids in the Mahalanobis space. This paper proposes an alternative visualization procedure functioning in the Euclidean space, which finds the primary dimension with maximum discrimination of k group centroids and the secondary dimension with maximum dispersion of all observational units. This hybrid procedure is especially useful when the number of groups k is two.

Fault diagnosis of wafer transfer robot based on time domain statistics (시간 영역 통계 기반 웨이퍼 이송 로봇의 고장 진단)

  • Hyejin Kim;Subin Hong;Youngdae Lee;Arum Park
    • The Journal of the Convergence on Culture Technology
    • /
    • v.10 no.4
    • /
    • pp.663-668
    • /
    • 2024
  • This paper applies statistical analysis methods in the time domain to the fault diagnosis of wafer transfer robots, and proposes a methodology to discern the critical characteristics of vibration and torque signals. Subsequently, principal component analysis (PCA) is applied to diminish the data's dimensionality, followed by the development of a fault diagnosis algorithm utilizing Euclidean distance and Hotelling's T-square statistics. The algorithm establishes decision boundaries to categorize failure states based on the observed data. Our findings indicate that data classification incorporating velocity parameters enhances diagnostic accuracy. This approach serves to enhance the precision and efficacy of fault diagnosis.