• 제목/요약/키워드: Probability Vector

검색결과 284건 처리시간 0.022초

앙상블 구성을 이용한 SVM 분류성능의 향상 (Improving SVM Classification by Constructing Ensemble)

  • 제홍모;방승양
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.251-258
    • /
    • 2003
  • Support Vector Machine(SVM)은 이론상으로 좋은 일반화 성능을 보이지만, 실제적으로 구현된 SVM은 이론적인 성능에 미치지 못한다. 주 된 이유는 시간, 공간상의 높은 복잡도로 인해 근사화된 알고리듬으로 구현하기 때문이다. 본 논문은 SVM의 분류성능을 향상시키기 위해 Bagging(Bootstrap aggregating)과 Boosting을 이용한 SVM 앙상블 구조의 구성을 제안한다. SVM 앙상블의 학습에서 Bagging은 각각의 SVM의 학습데이타는 전체 데이타 집합에서 임의적으로 일부 추출되며, Boosting은 SVM 분류기의 에러와 연관된 확률분포에 따라 학습데이타를 추출한다. 학습단계를 마치면 다수결 (Majority voting), 최소자승추정법(LSE:Least Square estimation), 2단계 계층적 SVM등의 기법에 개개의 SVM들의 출력 값들이 통합되어진다. IRIS 분류, 필기체 숫자인식, 얼굴/비얼굴 분류와 같은 여러 실험들의 결과들은 제안된 SVM 앙상블의 분류성능이 단일 SVM보다 뛰어남을 보여준다.

3차원 동영상 데이터의 통계적 모델링과 주기적 평균값에 의한 Smoothing 방법에 관한 연구 (A Study on a Statistical Modeling of 3-Dimensional MPEG Data and Smoothing Method by a Periodic Mean Value)

  • 김덕성;김태형;이병호
    • 전자공학회논문지S
    • /
    • 제36S권6호
    • /
    • pp.87-95
    • /
    • 1999
  • 본 논문에서는 ATM망에서 3차원 동영상 데이터의 시뮬레이션 모델을 제시한다. 이 모델은 슬라이스 레벨에 기초를 두며, PVAR(Projected Vector Autoregressive)모델이라고 명한다. PVAR 모델은 자기상관성(Autocorrelation)과 히스토그램(Histogram)특성을 만족하기 위해 AR(Autoregressive)모델에 기초로 모델링 되고 프로젝션 함수(Projection function)에 의해 실제 데이터를 매핑 한다. 프로젝션 함수로는 CDPF(cumulative distribution probability function)를 사용한다. 이때 과정은 슬라이스 단위로 수행된다. 제안된 모델은 자기 상관성과 히스토그램을 만족시키는데 좋은 성능을 보여주고, 네트워크 성능 분석에 중요하다. 이어서 이것을 주기적 평균값에 의한 Smoothing 방법에 적용한다. 일반적으로 QoS는 버퍼(buffer)에서의 셀 손신과 최대 지연에 관계된 CLR에 달려 있다. 따라서 제안한 Smoothing 기법은 QoS를 향상시키는데 이용할 수 있다.

  • PDF

변형된 개체기반 증가 학습을 이용한 소형 스테레오 정합 알고리즘 (A Compact Stereo Matching Algorithm Using Modified Population-Based Incremental Learning)

  • 한규필;정의윤;민각;김기석;하영호
    • 전자공학회논문지S
    • /
    • 제36S권10호
    • /
    • pp.103-112
    • /
    • 1999
  • 유전 알고리즘은 적절한 해를 찾기 위해서 자연선택과 개체군 유전학을 이용한 효율적 탐색기법이다. 그러나, 기존의 유전 알고리즘들은 수렴을 보장하기 위해서 유전자 풀의 크기를 증가시켜야 했고 그 결과 저장공간과 계산 시간이 많이 소요되었다. 또한, 염색체 교차와 유전자 돌연변이를 사용하여 새로운 염색체를 발생시켰기 때문에 알고리즘이 복잡하다는 단점이 있다. 본 논문에서는 이런 문제를 줄이기 위해서 확률벡터에 기반한 개체기반 증가 학습이라는 소형 유전 알고리즘을 정합 환경에 맞게 변형시킨 새로운 스테레오 정합 방법을 제안하였다. 제안된 알고리즘은 확률벡터의 사용으로 인해 유전 풀, 염색체 교차, 그리고 유전자 돌연변이 연산을 제거하였다. 그 결과 제안된 정합 알고리즘은 기존 방식보다 구조가 간단하고 계산량의 향상이 있었으며, 영상의 특성에 상관없이 안정된 결과를 얻을 수 있다는 장점이 있었다.

  • PDF

화자간 변별력 최대화를 위한 혼합 모델 방식과 심볼 확률 가중함수에 관한 연구 (A Study on the Mixed Model Approach and Symbol Probability Weighting Function for Maximization of Inter-Speaker Variation)

  • 진세훈;강철호
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.410-415
    • /
    • 2005
  • 최근 대부분의 화자확인 시스템은 패턴 인식 접근방식에 기인하고 있다. 패턴 분류기의 성능은 화자의 특징 파라미터를 어떻게 분류하는가 하는 데에 기인한다. 그 특징 파라미터를 잘 분류하기 위해서는, 화자간 변이를 최대화하고 특징 파라미터 간 거리를 효과적으로 측정하는 것이 매우 중요하다. 따라서, 본 논문에서는 개인 모델과 월드 모델을 동시에 배치함으로써 화자간 변이를 최대화 할 수 있는 개선된 혼합 모델 구조를 제안한다. 결정 과정 시 제안한 혼합 모델 방식을 사용함으로써 화자간 변별력을 최대화 할 수 있었다. 또한, 입력데이터에 대한 개인 모델과 월드 모델의 거리비율에 따라 심볼 확률 값을 가중하여 벡터 양자화 에러를 줄이는 가중치 함수를 제안 한다. 실험 결과, 이두 가지 방법을 취함으로써 DCF (Detection Cost Function)를 $2.37\%$에서 $1.16\%$로 낮출 수 있었다.

이상 신호왜곡과 소스 불일치에 강인한 벡터 양자화 방법 (A Robust Vector Quantization Method against Distortion Outlier and Source Mismatch)

  • 노명훈;김무영
    • 대한전자공학회논문지SP
    • /
    • 제49권3호
    • /
    • pp.74-80
    • /
    • 2012
  • 고정 비트율을 사용하는 resolution-constrained quantization 방식은 입력 데이터 분포에 따라 보로노이 셀의 크기가 달라지므로 이상 신호왜곡 (distortion outliers)을 발생시킨다. 본 논문에서는 generalized Lloyd algorithm (GLA)과 cell-size constrained vector quantization (CCVQ) 방식을 결합하여 이상 신호왜곡을 줄이는 벡터 양자화 방식을 제안한다. 즉, 왜곡에 대한 문턱 값에 따라서 데이터 분포를 내부와 외부영역으로 나누고, 각각 CCVQ와 GLA 방식을 사용하여 학습하도록 한다. 데이터 분포가 높은 내부영역에 CCVQ 방식을 사용하게 됨에 따라 GLA를 사용하는 외부영역에서 사용이 가능한 셀의 개수가 늘어나게 되며, 이로 인해 이상 신호왜곡을 줄일 수 있었다. 또한, 실제 코딩 환경에서는 일반적으로 training과 test 데이터의 분포가 다르게 나타나는 소스 불일치 (source mismatch) 문제가 발생하게 된다. 제안하는 방식은 source mismatch 문제로 인해 일어나는 신호왜곡과 이상 신호왜곡에 대해서도 성능 개선을 가능하게 하였다.

움직임벡터의 확률분포와 적응적인 탐색을 이용한 고속 움직임 예측 알고리즘 (A Fast Motion Estimation Algorithm using Probability Distribution of Motion Vector and Adaptive Search)

  • 박성모;유태경;김종남
    • 한국정보과학회논문지:정보통신
    • /
    • 제37권2호
    • /
    • pp.162-165
    • /
    • 2010
  • 본 논문에서는 전영역 탐색기반의 방법에 비하여 예측화질은 거의 같게 유지하면서 불필요한 계산량을 현저히 줄이는 알고리즘을 제안한다. 제안하는 방법은 움직임 벡터의 확률분포에 따라 탐색패턴을 달리하며, 블록매칭 기준의 비교값을 다르게 함으로써 예측화질을 유지하면서 계산량만 효율적으로 감축할 수 있다. 제안한 알고리즘은 기존의 전영역 탐색 기반인 H.264 PDE 고속 알고리즘과 비교하여 예측화질의 저하가 0~0.02dB이며, 소요된 계산량은 20%~30%정도이다. 제안한 알고리즘은 MPEG-2/4 AVC를 이용하는 실시간 비디오 압축 응용분야에 유용하게 사용될 수 있을 것이다.

접합영상 검출을 위한 효율적인 마코프 특징 추출 방법 (Efficient Markov Feature Extraction Method for Image Splicing Detection)

  • 한종구;박태희;엄일규
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.111-118
    • /
    • 2014
  • 본 논문에서는 영상접합 조작 검출을 위한 효율적인 마코프 특징을 추출하는 방법을 제안한다. 제안 방법에서 사용하는 마코프 상태는 이산 코사인 변환 영역에서 인접한 블록간 계수의 차이로 구성되며, 블록간 대칭성을 이용하여 다양한 1차 마코프 천이확률을 접합 검출을 위한 특징으로 추출한다. 아울러 마코프 확률의 분포를 분석하여 특징의 수를 줄이는 방법을 제안한다. 추출된 특징 벡터를 SVM(support vector machine) 분류기를 이용하여 학습한 후 영상의 접합 여부를 판별한다. 실험 결과를 통하여 본 논문의 방법이 기존의 방법보다 적은 수의 특징으로 높은 영상접합 조작 결과를 보임을 확인하였다.

다양한 기계학습 기법의 암상예측 적용성 비교 분석 (Comparative Application of Various Machine Learning Techniques for Lithology Predictions)

  • 정진아;박은규
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제21권3호
    • /
    • pp.21-34
    • /
    • 2016
  • In the present study, we applied various machine learning techniques comparatively for prediction of subsurface structures based on multiple secondary information (i.e., well-logging data). The machine learning techniques employed in this study are Naive Bayes classification (NB), artificial neural network (ANN), support vector machine (SVM) and logistic regression classification (LR). As an alternative model, conventional hidden Markov model (HMM) and modified hidden Markov model (mHMM) are used where additional information of transition probability between primary properties is incorporated in the predictions. In the comparisons, 16 boreholes consisted with four different materials are synthesized, which show directional non-stationarity in upward and downward directions. Futhermore, two types of the secondary information that is statistically related to each material are generated. From the comparative analysis with various case studies, the accuracies of the techniques become degenerated with inclusion of additive errors and small amount of the training data. For HMM predictions, the conventional HMM shows the similar accuracies with the models that does not relies on transition probability. However, the mHMM consistently shows the highest prediction accuracy among the test cases, which can be attributed to the consideration of geological nature in the training of the model.

User Identification Using Real Environmental Human Computer Interaction Behavior

  • Wu, Tong;Zheng, Kangfeng;Wu, Chunhua;Wang, Xiujuan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권6호
    • /
    • pp.3055-3073
    • /
    • 2019
  • In this paper, a new user identification method is presented using real environmental human-computer-interaction (HCI) behavior data to improve method usability. User behavior data in this paper are collected continuously without setting experimental scenes such as text length, action number, etc. To illustrate the characteristics of real environmental HCI data, probability density distribution and performance of keyboard and mouse data are analyzed through the random sampling method and Support Vector Machine(SVM) algorithm. Based on the analysis of HCI behavior data in a real environment, the Multiple Kernel Learning (MKL) method is first used for user HCI behavior identification due to the heterogeneity of keyboard and mouse data. All possible kernel methods are compared to determine the MKL algorithm's parameters to ensure the robustness of the algorithm. Data analysis results show that keyboard data have a narrower range of probability density distribution than mouse data. Keyboard data have better performance with a 1-min time window, while that of mouse data is achieved with a 10-min time window. Finally, experiments using the MKL algorithm with three global polynomial kernels and ten local Gaussian kernels achieve a user identification accuracy of 83.03% in a real environmental HCI dataset, which demonstrates that the proposed method achieves an encouraging performance.

클러터 환경에서의 GLRT 기반 표적 탐지성능 (Target Detection Performance in a Clutter Environment Based on the Generalized Likelihood Ratio Test)

  • 서진배;전주환;정지현;김진욱
    • 한국전자파학회논문지
    • /
    • 제30권5호
    • /
    • pp.365-372
    • /
    • 2019
  • 본 논문에서는 일반화우도비검정(generalized likelihood ratio test: GLRT)에 있는 모르는 파라미터(표적의 크기, 클러터의 파라미터)를 최대우도추정(maximum likelihood estimation: MLE) 방법 또는 Newton-Raphson method를 통해 추정하는 방법에 대해서 제안하였다. 클러터 환경에서 표적을 탐지할 경우, 실제 환경과 유사하게 클러터의 수식적인 모델을 세우는 것이 중요하다. 이러한 서로 상관된 클러터 모델은 SIRV(Spherically Invariant Random Vector)를 이용하여 생성할 수 있다. 생성된 클러터 모델에 대한 일반화우도비검정 식을 세우고, 추정된 파라미터에 대한 일반화우도비검정의 탐지확률을 모의실험을 통해 확인하였다.