• 제목/요약/키워드: SVM (Support Vector Machine)

검색결과 1,265건 처리시간 0.026초

유기화합물의 승화열 예측을 위한 QSPR분석 (QSPR analysis for predicting heat of sublimation of organic compounds)

  • 박유선;이종혁;박한웅;이성광
    • 분석과학
    • /
    • 제28권3호
    • /
    • pp.187-195
    • /
    • 2015
  • 승화열은 대기 유기 오염물질의 확산에 관련된 환경적인 문제를 해결하거나, 위험한 화학 물질의 위해성을 평가하는 데에 중요한 변수이다. 하지만 실험적으로 승화열을 측정하려면 많은 시간과 비용이 소모 되며, 그 실험자체도 복잡하고 위험하다. 따라서 본 연구에서는 유기화합물의 승화열을 간단하게 예측하는 모델을 개발하기 위하여 정량적 구조-물성 상관관계 연구를 이용하였다. 군기반 전진선택방법을 적용하여 다중선형회귀방법과 서포트 벡터 머신과 같은 학습방법에 적합한 분자표현자들을 선택하도록 하였다. 개별 모델과 복합모델들은 부스트래핑 방법과 y-임의추출법에 의해 내부검증이 되었다. 외부 테스트 데이터의 예측 성능은 적용범위를 고려하므로서 개선되었다. 다중선형회귀모델에 따르면, 승화열은 분자간의 분산력, 수소결합, 정전기적 상호작용, 쌍극자-쌍극자 상호작용과 관련이 있는 것을 나타낼 수 있었다.

특징 분리를 통한 자연 배경을 지닌 글자 기반 CAPTCHA 공격 (Breaking character and natural image based CAPTCHA using feature classification)

  • 김재환;김수아;김형중
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1011-1019
    • /
    • 2015
  • 컴퓨터 사용자가 사람인지 아닌지를 판별하는 CAPTCHA는 많은 포털 사이트에서 자동 프로그램에 의한 비정상적인 회원가입 또는 다중 로그인 방지 등을 위해 사용되고 있다. 많은 웹 사이트들은 숫자 혹은 영어로 구성된 문자열 기반 캡챠를 대부분 사용하는데, 최근에는 OCR 기술의 발달로 단순한 텍스트 기반 캡챠는 쉽게 무력화 된다. 이에 대한 대안으로 많은 웹 사이트들은 글자 판독을 어렵게 하기 위해 잡음을 첨가하거나 글자를 왜곡시키는 등 다양한 시도를 하고 있다. 본 논문에서 대상으로 하는 국내 한 포털 사이트 역시 공격자들에 의해 많은 공격을 당하였고, 끊임없이 캡챠를 발전시키고 있다. 본 논문에서는 해당 사이트에서 현재 사용되고 있는 다양한 자연 배경을 지닌 캡챠에 대해 분석하고, SVM을 이용한 특징 분리 후 CNN을 이용한 글자 인식을 통해 해당 캡챠의 취약성을 검증하였다. 실험 결과, 총 1000개의 캡챠 이미지 중 368개에 대해 정확히 맞추었고, 이를 통해 해당 포털 사이트에서 현재 사용하고 있는 새로운 버전의 캡챠 역시 안전하지 않음을 입증하였다.

No-reference Image Quality Assessment With A Gradient-induced Dictionary

  • Li, Leida;Wu, Dong;Wu, Jinjian;Qian, Jiansheng;Chen, Beijing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권1호
    • /
    • pp.288-307
    • /
    • 2016
  • Image distortions are typically characterized by degradations of structures. Dictionaries learned from natural images can capture the underlying structures in images, which are important for image quality assessment (IQA). This paper presents a general-purpose no-reference image quality metric using a GRadient-Induced Dictionary (GRID). A dictionary is first constructed based on gradients of natural images using K-means clustering. Then image features are extracted using the dictionary based on Euclidean-norm coding and max-pooling. A distortion classification model and several distortion-specific quality regression models are trained using the support vector machine (SVM) by combining image features with distortion types and subjective scores, respectively. To evaluate the quality of a test image, the distortion classification model is used to determine the probabilities that the image belongs to different kinds of distortions, while the regression models are used to predict the corresponding distortion-specific quality scores. Finally, an overall quality score is computed as the probability-weighted distortion-specific quality scores. The proposed metric can evaluate image quality accurately and efficiently using a small dictionary. The performance of the proposed method is verified on public image quality databases. Experimental results demonstrate that the proposed metric can generate quality scores highly consistent with human perception, and it outperforms the state-of-the-arts.

깊은 신경망 기반 대용량 텍스트 데이터 분류 기술 (Large-Scale Text Classification with Deep Neural Networks)

  • 조휘열;김진화;김경민;장정호;엄재홍;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.322-327
    • /
    • 2017
  • 문서 분류 문제는 오랜 기간 동안 자연어 처리 분야에서 연구되어 왔다. 우리는 기존 컨볼루션 신경망을 이용했던 연구에서 나아가, 순환 신경망에 기반을 둔 문서 분류를 수행하였고 그 결과를 종합하여 제시하려 한다. 컨볼루션 신경망은 단층 컨볼루션 신경망을 사용했으며, 순환 신경망은 가장 성능이 좋다고 알려져 있는 장기-단기 기억 신경망과 회로형 순환 유닛을 활용하였다. 실험 결과, 분류 정확도는 Multinomial Naïve Bayesian Classifier < SVM < LSTM < CNN < GRU의 순서로 나타났다. 따라서 텍스트 문서 분류 문제는 시퀀스를 고려하는 것 보다는 문서의 feature를 추출하여 분류하는 문제에 가깝다는 것을 확인할 수 있었다. 그리고 GRU가 LSTM보다 문서의 feature 추출에 더 적합하다는 것을 알 수 있었으며 적절한 feature와 시퀀스 정보를 함께 활용할 때 가장 성능이 잘 나온다는 것을 확인할 수 있었다.

구간 분할 및 HMM 기반 융합 모델에 의한 온라인 서명 검증 (On-line Signature Verification Using Fusion Model Based on Segment Matching and HMM)

  • 양동화;이대종;전명근
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.12-17
    • /
    • 2005
  • 기존의 참조서명과 입력서명을 비교하는 방법 쿵 분절 단위 비교 방법은 전역적 방법과 점 단위 방법에 비하여 우수한 장점을 가지고 있다. 그러나 분절 단위 비교 방법은 인식률과 직접적인 관계가 있는 분절의 불안정 문제점이 있다. 본 연구에서는 분절 단위 비교 방법을 이용한 서명검증의 신뢰도를 향상시키기 위해 두 가지 형태의 모델을 구축하였다. 우선 기존에 사용된 구간 분할 매칭 방법을 사용하여 서명의 동적정보에 대한 매칭도를 산출하였다. 다음으로 서명의 정적정보를 균일하게 분할한 후 분할된 영역을 주성분 분석 기법에 의해 특징 벡터를 산출하고 HMM에 의해 서명간의 매칭도를 산출하였다. 최종 융합단계에서는 SVM 분류기에 의해 서명의 진위여부를 결정하도록 구축하였다. 실험 결과 제안된 기법은 분절단위 기반의 구간 분할 매칭 기법에 비해 우수한 성능을 나타냈다.

Pose and Expression Invariant Alignment based Multi-View 3D Face Recognition

  • Ratyal, Naeem;Taj, Imtiaz;Bajwa, Usama;Sajid, Muhammad
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권10호
    • /
    • pp.4903-4929
    • /
    • 2018
  • In this study, a fully automatic pose and expression invariant 3D face alignment algorithm is proposed to handle frontal and profile face images which is based on a two pass course to fine alignment strategy. The first pass of the algorithm coarsely aligns the face images to an intrinsic coordinate system (ICS) through a single 3D rotation and the second pass aligns them at fine level using a minimum nose tip-scanner distance (MNSD) approach. For facial recognition, multi-view faces are synthesized to exploit real 3D information and test the efficacy of the proposed system. Due to optimal separating hyper plane (OSH), Support Vector Machine (SVM) is employed in multi-view face verification (FV) task. In addition, a multi stage unified classifier based face identification (FI) algorithm is employed which combines results from seven base classifiers, two parallel face recognition algorithms and an exponential rank combiner, all in a hierarchical manner. The performance figures of the proposed methodology are corroborated by extensive experiments performed on four benchmark datasets: GavabDB, Bosphorus, UMB-DB and FRGC v2.0. Results show mark improvement in alignment accuracy and recognition rates. Moreover, a computational complexity analysis has been carried out for the proposed algorithm which reveals its superiority in terms of computational efficiency as well.

전라북도 강수량의 기상특성 분류 및 공간상관성 분석 (Classification of meteorological state and spatial correlation analysis of precipitation in Jeonbuk province)

  • 이정주;권현한;홍민;이종석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.404-404
    • /
    • 2011
  • 최근 기상변동성 증가와 극치수문사상의 발생빈도 증가로 인한 기상재해가 빈번하게 일어나고 있다. 이러한 기상현상으로 인한 재해의 예방을 위해서 사전에 위험을 인지하고 그 규모를 예측할 수 있는 여러 기법들이 기상레이더 또는 수치예보자료 등을 이용하여 개발 및 적용되고 있다. 이 과정에서 해결해야 할 여러 문제점들이 있는데, 우선 수치예보자료 또는 기상레이더자료를 종관기상관측소 및 자동기상관측지점의 지상관측 강수량과 연계하여 평가하는 과정이 필요하고, 현재시점에 형성되어 있는 강우장의 공간 이동 예측 기법이 확보되어야 할 것이다. 전북지역은 게릴라성 집중호우가 빈번한 산악형 강수와 산지유역의 급한 하천경사가 맞물려 인명 및 재산피해가 매년 발생하고 있으며, 과거 돌발홍수가 발생한 사례가 있어 이상기후 및 기후변화로 인한 홍수 위험도가 커질 것으로 전망되고 있다. 본 연구는 전라북도의 기상재해 예측모형 개발을 위한 사전 분석과정으로 전라북도지역에서 관측된 기존의 대규모 강수사상을 이용한 강수사상의 특성 분류 및 관측소간 공간상관성을 분석하는데 목적을 두고 있다. 강수사상의 특성분류를 통해 강수 발생형태에 따른 기상학적 영향인자, 강수의 발생량 및 이동특성 예측의 정도를 향상시킬 수 있으며, 분류 기법으로 SVM(support vector machine)을 이용한 자동분류를 적용한다. 또한 관측소간 공간상관성 분석을 위하여 각 관측소 강수량간의 조건부 확률을 이용한다. 예로써 부안관측소에 강수가 발 생했을 때, 부안관측소의 강수량 조건에 의한 전주관측소 강수량 확률을 다음과 같이 구성할 수 있다. �揚滑斂�수량�咀刮활�수량��. 공간상관성 분석과정에서 관측소간 강수 이동시간에 따른 강수 발생 시간의 차이 또한 고려하며, 과거 기상관측 자료의 분석을 통해 전라북도지역의 관측소간 강수발생의 공간적 상관성을 규명하고, 단기예측 모델 개발을 위한 기초자료로 활용할 수 있을 것이다. 또한, 기후변화시나리오에 의한 미래 강수량의 지역적 상세화 과정에도 본 연구를 통한 결과를 이용할 수 있을 것이라 판단된다.

  • PDF

축소 다변수 다항식 분류기를 이용한 고속 차량 검출 방법 (Fast On-Road Vehicle Detection Using Reduced Multivariate Polynomial Classifier)

  • 김중락;유선진;;김도훈;이상윤
    • 한국통신학회논문지
    • /
    • 제37권8A호
    • /
    • pp.639-647
    • /
    • 2012
  • 비전 기반의 차량 검출 기술은 자동 주행 보조 시스템에 있어서 가장 중요한 기술 중의 하나이다. 하지만 자동차 외형의 다양성 및 주변 환경의 변화로 인하여 정확하고 신뢰성 있는 차량 검출 시스템의 개발은 여전히 해결해야 될 문제로 남아 있다. 일반적으로 차량 검출 시스템은 두 단계로 구분할 수 있다. 차량 후보 영역을 검출하는 가설 생성(Hypothesis Generation(HG)) 단계와 가설 생성 단계에서 검출된 영역을 검증하는 가설 검증(Hypothesis Verification(HV)) 단계이다. 차량 검출은 HV 단계에서 최종적으로 검증 및 결정되기 때문에, HV 단계의 성능에 의하여 차량 검출의 성능이 결정되게 된다. 따라서, 본 논문에서는 축소 다변수 다항식 분류기(reduced multivariate polynomial pattern classifier(RM))를 HV 단계에 이용하여 고속 차량 검출 시스템을 구성하였다. 실험 결과 RM 분류기가 SVM 분류기 기반의 차량 검출 시스템보다 처리 속도 측면에서 월등한 성능을 보여 실시간 처리 기반의 차량 검출 시스템에 적합하다.

사건중심 뉴스기사 자동요약을 위한 사건탐지 기법에 관한 연구 (A Study on an Effective Event Detection Method for Event-Focused News Summarization)

  • 정영미;김용광
    • 정보관리학회지
    • /
    • 제25권4호
    • /
    • pp.227-243
    • /
    • 2008
  • 이 연구에서는 사건중심 뉴스기사 요약문을 자동생성하기 위해 뉴스기사들을 SVM 분류기를 이용하여 사건 주제범주로 먼저 분류한 후, 각 주제범주 내에서 싱글패스 클러스터링 알고리즘을 통해 특정한 사건 관련 기사들을 탐지하는 기법을 제안하였다. 사건탐지 성능을 높이기 위해 고유명사에 가중치를 부여하고, 뉴스의 발생시간을 고려한 시간벌점함수를 제안하였다. 또한 일정 규모 이상의 클러스터를 분할하여 적절한 크기의 사건 클러스터를 생성하도록 수정된 싱글패스 알고리즘을 사용하였다. 이 연구에서 제안한 사건탐지 기법의 성능은 단순 싱글패스 클러스터링 기법에 비해 정확률, 재현율, F-척도에서 각각 37.1%, 0.1%, 35.4%의 성능 향상률을 보였고, 오보율과 탐지비용에서는 각각 74.7%, 11.3%의 향상률을 나타냈다.

빅데이터 분석을 이용한 문단 내의 감정 예측 (Emotion Prediction of Paragraph using Big Data Analysis)

  • 김진수
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.267-273
    • /
    • 2016
  • 모바일의 확산과 더불어 정형화된 자료뿐만 아니라 다양한 형태의 비정형화된 자료로부터 정보가 생성되고 정보 전달 및 공유가 활발히 이루어지고 있다. 최근에는 다양한 SNS 매체들로부터 생산 및 배포되는 많은 자료들 중에서 유의미한 정보를 추출하는 기술로 빅데이터 기술을 많이 사용하며, 빅데이터 분석 기법 중 하나인 데이터 마이닝 기법을 사용한다. 특히, SNS로부터 수집된 방대하고 다양한 자료들을 이용하여 대중의 집단지성에 표출된 일반적인 감정을 분석하여 다양한 분야에 활용한다. 본 논문에서는 SNS를 통해 작성된 짧은 문단 내 함축된 키워드와 키워드들 간의 연관성을 이용하여 문단에 나타난 감정을 예측하고 사용자별 감정에 따른 적절한 답변이나 예측된 감정과 유사한 상품이나 영화 등 다양한 추천시스템에 사용될 수 있도록 형태소 분석과 변형된 n-gram방법을 혼합하여 효율적인 감정 예측 시스템을 제안한다. 제안된 시스템은 평균 82.25%의 재현율을 보여 기존의 시스템에 비해 더욱 향상된 성능을 보여 주었고, 형태소분석을 통해 의미 있는 키워드 추출에 도움이 될 것으로 기대한다.