• 제목/요약/키워드: 서포트 벡터 데이터 표현

검색결과 11건 처리시간 0.025초

단일부류 최소제곱 서포트 벡터 머신 (One-class Least Square Support Vector Machines)

  • 우상호;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.559-561
    • /
    • 2002
  • 서포트 벡터 머신은 얼굴인식이나 문자인식과 같은 다양한 패턴인식 문제에서 좋은 성능을 보여준다. 그러나 이러한 문제는 Quadratic Programming(QP) 문제에 관하여 몇 가지 단점을 가지고 있다. 일반적으로 대용량의 QP 문제를 해결하기 위해 많은 계산비용이 요구되며, QP 기반 시스템을 효과적으로 구현하는 것이 쉽지 않은 문제이다. 또한 대규모 데이터의 처리 시에는 입출력을 맞추기 또한 쉽지 않은 단점이 있다. 본 논문에서는 위의 단점을 극복하기 위하여 단일부류 문제를 최소제곱 서포트 벡터 머신을 기반으로 하여 해결하였다. 제안한 방법은 QP 문제를 해결하는 과정이 없이 단일부류 문제를 표현하여 최소제곱 방법을 이용하는 알고리즘이다. 제안된 방법으로 쉽고, 계산 비용을 줄이는 결과를 얻었다. 또한 서포트 벡터 영역 표식자에 확장 적용하여 선형방정식으로 구현하여, 문제를 해결하였다. 제안된 방법의 효율성을 입증하기 위하여 패턴인식 분야 중에 얼굴 인증 방법과 바이오인포매틱스 분야 중에 전립선 암 분류 문제에 적용하였다. 우리의 실험결과는 적합한 성능과 좋은 Equal Error Rate(EER)를 보여준다. 제안된 방법은 알 수 없는 물체의 분류 방법의 효율성을 증대시켰고, 실시간 응용분야에 직접적으로 적용될 수 있을 것으로 기대 된다.

  • PDF

퍼지 원 클래스 서포트 벡터 머신 (Fuzzy One Class Support Vector Machine)

  • 김기주;최영식
    • 인터넷정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.159-170
    • /
    • 2005
  • OC-SVM(One Class Support Vector Machine)은 주어진 전체 데이터의 분포를 측정하는 대신에. 데이터 분포의 서포트(support)를 측정하는 기술로서 주어진 데이터를 가장 잘 설명할 수 있는 최적의 서포트 벡터(support vector)를 구하는 기술이다. OC-SVM은 데이터 분포의 표현에 아주 뛰어난 접근 방법이지만, 사람의 주관적인 중요도를 반영하는 것은 힘들다. 본 논문에서는 각 데이터에 퍼지 맴버쉽(fuzzy membership)을 적용하여 기존의 OC-SVM에 사용자의 주관적인 중요도를 표현할 수 있는 FOC-SVM(Fuzzy One class Support Vector Machine)을 유도 하였다. FOC-SVM은 데이터들을 동등하게 다루는 것이 아니라, 데이터 객체의 중요도에 따라 데이터를 다룬다. 즉, 덜 중요한 데이터의 특징 벡터는 OC-SVM의 처리과정에 덜 기여하도록 하기 위하여, 객체의 중요도에 따라 특징 벡터의 크기를 조정하였다. 이를 증명하기 위하여 가상의 데이터를 가지고 실험을 하였고, 실험 결과는 예측된 결과를 보여 주었다.

  • PDF

One-Class 서포트 벡터 머신을 이용한 레벨 셋 트리 생성 (Creating Level Set Trees Using One-Class Support Vector Machines)

  • 이계민
    • 정보과학회 논문지
    • /
    • 제42권1호
    • /
    • pp.86-92
    • /
    • 2015
  • 레벨 셋 트리는 다차원에 정의된 확률 밀도 함수를 표현하는데 유용하다. 복잡한 데이터의 구조를 트리 형태로 시각화하여 데이터의 형태를 효율적으로 파악할 수 있으며 클러스터링 분석에 효과적으로 이용할 수 있다. 본 논문에서는 미지의 확률 밀도 함수에서 생성된 데이터 샘플로부터 레벨 셋 트리를 생성하는 알고리즘을 제안한다. 제안된 알고리즘은 레벨을 0에서부터 무한대로 증가시키며 밀도 함수의 각 레벨 셋을 추정하고, 이로부터 레벨 셋 트리를 생성한다. 이를 위해 본 논문에서는 one-class 서포트 벡터 머신 (OC-SVM)을 이용하여 직접적으로 레벨 셋을 추정한다. 이때 다양한 레벨 값에 대해 OC-SVM 학습을 반복해야 하는데, OC-SVM 솔루션 path 알고리즘을 통해 빠른 시간 안에 모든 레벨값에 해당하는 레벨 셋를 추정할 수 있다.

PoMEN 기반의 Latent One-Class SVM (PoMEN based Latent One-Class SVM)

  • 이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-11
    • /
    • 2012
  • One-class SVM은 데이터가 존재하는 영역을 추출하고, 이 영역을 서포트 벡터로 표현하며 표현된 영역 밖의 데이터들은 아웃라이어(outlier)로 간주된다. 본 논문에서는 데이터 포인트마다 숨겨진 변수(hidden variable) 혹은 토픽이 있다고 가정하고, 이를 반영하기 위해 PoMEN에 기반한 Latent One-class SVM을 제안한다. 실험결과 Latent One-class SVM이 대부분의 구간에서 One-class SVM 보다 성능이 높았으며, 특히 높은 정확율을 요구하는 경우에 더욱 효과적임을 알 수 있었다.

  • PDF

중요도 기반 퍼지 원 클래스 서포트 벡터 머신을 이용한 비디오 요약 기술 (Video Summarization Using Importance-based Fuzzy One-Class Support Vector Machine)

  • 김기주;최영식
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.87-100
    • /
    • 2011
  • 본 논문에서는 비디오 요약을 시각적으로 특징이 있고 주관적으로 중요한 비디오 세그먼트 집합을 구하는 새로운 요약 방식을 기술한다. 시각적으로 특징이 있는 데이터 포인트를 찾기 위해 novelty detection으로 잘 알려져 있는 OC-SVM(One-Class Support Vector Machine)을 사용할 수 있다. 그러나 OC-SVM의 처리과정에 비디오 세그먼트에 대한 사용자의 주관적인 중요도를 반영하기는 어렵다. OC-SVM의 처리과정에 사용자의 주관적 중요성을 반영하기 위해서, 본 논문에서는 OC-SVM의 퍼지 버전을 유도한다. IFOC-SVM(Importance-based Fuzzy One-Class Support Vector Machine)은 비디오 세그먼트의 중요도에 따라 각 데이터 포인트에 가중치를 부여하고 데이터 분포의 서포트를 측정한다. 이때, 구해진 서포트 벡터는 비 오 세그먼트의 중요도와 시각적 특징 관점에서 비디오의 내용을 축약하여 표현한다. 제안된 알고리즘의 성능을 증명하기 위하여 가상의 데이터들과 다양한 종류의 비디오들을 가지고 실험하였다. 실험 결과는 제안하는 방법의 성능이 다른 비디오 요약의 성능보다 우수함을 보여주었다.

서포트 벡터 데이터 서술을 이용한 대표 얼굴 영상 합성 (Synthesis of Face Exemplars using Support Vector Data Description)

  • 이상웅;박주영;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.835-837
    • /
    • 2005
  • 최근 얼굴 인식은 사용자의 편의성을 포함한 다양한 장점으로 인하여 생체 인식 시장에서 주요 기술로 대두되고 있다. 그러나 조명 변화에 기인한 얼굴 인식 성능의 저하는 실용화에 걸림돌이 되고 있는 실정이다. 따라서 조명 변화에 따른 얼굴의 외형 변화를 분석하는 연구들이 세계적으로 활발히 진행되고 있다. 그러나 기존 방법들은 다수의 등록 영상이나 조명에 대한 사전 정보가 필요하거나 실시간으로 구현되기 어렵기 때문에 실용 시스템에 적용하기는 어려운 실정이다. 따라서, 본 논문에서는, 여러 조명 영상들로 구성된 학습 데이터를 이용하여, 조명에 대한 정보가 없는 한 장의 입력 영상을 분석하는 방법을 제안한다. 제안된 방법은 SVDD를 이용하여 학습 데이터의 여러 조면 영상들로부터 입력 영상의 조명과 같은 대표영상을 합성하고 이 대표영상들의 선형 조합을 이용하여 입력 영상을 표현한다. 제안 방법의 효율성을 검증하기 위하여 공인 얼굴 데이터베이스들을 이용하여, 기존 방법들과 비교 실험을 수행하였으며, 조명 변화가 큰 영상에서도 안정된 조명 변화의 분석이 가능하였다.

  • PDF

다변량 관리도를 활용한 블로거 정서 변화 탐지 (Detection of the Change in Blogger Sentiment using Multivariate Control Charts)

  • 문정훈;이성임
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.903-913
    • /
    • 2013
  • 최근 소셜 네크워크 서비스의 발달로 인해 개인의 감정이나 의견을 표현하는 소셜 데이터들이 하루에도 수백만 건씩 생산되고 있다. 또한 소셜 데이터는 개인의 의견에 또 다른 생각을 더하는 등 정보의 생산과 소비가 누구나 가능해짐으로써 사회현상을 잘 반영해주는 도구로 성장하고 있다. 본 연구에서는 블로그에 올라온 부정적인 감성어들을 분석하여 블로거의 감성변화를 탐지하기 위해 다변량 관리도를 이용하고자 한다. 이를 위해 2008년 1월 1일부터 2009년 12월 31일 사이에 생성되었던 모든 블로그를 사용하였다. 품질 특성치가 다변량으로 주어지는 경우 호텔링의 $T^2$ 관리도가 널리 사용된다. 그러나 이 관리도는 품질 특성치들의 분포가 다변량 정규분포라는 가정을 하고 있어, 비정규 다변량 자료에 대한 관리도의 성능은 좋지 않다. 이에 본 논문에서는 Sun과 Tsung (2003)이 제안한 써포트 벡터머신에서 단일 집합 분류 기법 중 하나인 SVDD(support vector data description) 알고리즘과 이를 확장한 K-관리도를 소개하고, 실제 데이터 분석에 적용해 보았다.

부분 정보에 기반한 효과적인 음악 무드 분류 방법 (Effective Mood Classification Method based on Music Segments)

  • 박근한;박상용;강석중
    • 한국멀티미디어학회논문지
    • /
    • 제10권3호
    • /
    • pp.391-400
    • /
    • 2007
  • 기술의 발전으로 인하여, 대용량의 음악 데이터들을 저장하고 검색하는 것이 중요하게 되었다. 그러나 음악데이터들을 손쉽게 분류하고 검색하기 위한 방법론에 대한 집중적인 연구는 이루어 지지 않고 있다. 본 논문에서는 내용기반의 음악 분류/검색에 대한 새로운 방법론을 제안한다. 기존의 분류화 (classification) 방법들이 음악파일 전체에 대해서 수행하는데 비해 음악파일의 부분만을 분석하여 비슷한 성능을 낼 수 있다는 것을 보여 주었고, 소리의 톤(tone) 표현에 기반한 새로운 피쳐를 제안하여 기존의 피쳐들에 비해 효과적으로 분류를 할 수 있다는 것을 보여주었다. 또한 속도향상을 위한 여러가지 방법론들을 적용하여 실 제품 적용 시 보다 효과적인 방법론이 될 수 있음을 보여주었다. 제안한 방법론을 MuSE (Music Search/Classification Engine)엔진으로 구현함으로써 PC와 PDA상에서 잘 동작함을 보여주었다.

  • PDF

유기화합물의 승화열 예측을 위한 QSPR분석 (QSPR analysis for predicting heat of sublimation of organic compounds)

  • 박유선;이종혁;박한웅;이성광
    • 분석과학
    • /
    • 제28권3호
    • /
    • pp.187-195
    • /
    • 2015
  • 승화열은 대기 유기 오염물질의 확산에 관련된 환경적인 문제를 해결하거나, 위험한 화학 물질의 위해성을 평가하는 데에 중요한 변수이다. 하지만 실험적으로 승화열을 측정하려면 많은 시간과 비용이 소모 되며, 그 실험자체도 복잡하고 위험하다. 따라서 본 연구에서는 유기화합물의 승화열을 간단하게 예측하는 모델을 개발하기 위하여 정량적 구조-물성 상관관계 연구를 이용하였다. 군기반 전진선택방법을 적용하여 다중선형회귀방법과 서포트 벡터 머신과 같은 학습방법에 적합한 분자표현자들을 선택하도록 하였다. 개별 모델과 복합모델들은 부스트래핑 방법과 y-임의추출법에 의해 내부검증이 되었다. 외부 테스트 데이터의 예측 성능은 적용범위를 고려하므로서 개선되었다. 다중선형회귀모델에 따르면, 승화열은 분자간의 분산력, 수소결합, 정전기적 상호작용, 쌍극자-쌍극자 상호작용과 관련이 있는 것을 나타낼 수 있었다.

2D-QSAR방법을 이용한 농약류의 무지개 송어 급성 어독성 분석 및 예측 (Prediction and analysis of acute fish toxicity of pesticides to the rainbow trout using 2D-QSAR)

  • 송인식;차지영;이성광
    • 분석과학
    • /
    • 제24권6호
    • /
    • pp.544-555
    • /
    • 2011
  • 본 연구는 농약류에 대하여 구조-활성의 정량적 관계(QSAR)를 이용하여 무지개 송어(학명: Oncorhynchus mykiss)의 급성 독성을 예측-분석하는 과정을 수행하였다. 모델 구현을 위해 사용된 275종의 농약류에 대한 수중 독성(96h $LC_{50}$) 값은 DEMETRA프로젝트의 데이터를 사용하였다. 예측 모델에 사용된 2차원 분자 표현자는 PreADMET프로그램으로부터 계산을 하였고, 선형 (다중 선형 회귀 방법)모델과 비선형(서포트 벡터 머신, 인공 신경망) 학습 방법들은 실험값과 예측값의 적합도를 고려하여 최적화 되었다. 데이터 전처리 과정을 거친 뒤에, 5묶음 교차 검증과정을 포함한 모집단 기반 전진 선택법을 통해서 각 학습 방법의 최적의 표현자 집합을 결정하였다. 가장 좋은 결과는 SVM 방법 ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) 이었고, EU의 규제 기준에 따른 분류에서는 87%의 정확도를 나타내었다. MLR방법을 통해서는 무지개 송어의 급성 독성에 대하여 독성을 나타내는 농약류의 구조적 특징과 지질 층과의 상호작용을 설명할 수 있었다. 개발된 모든 모델들은 5묶음 교차 검증과 Y-scrambling test을 통해 검증되었다.