• 제목/요약/키워드: Probability Vector

검색결과 284건 처리시간 0.021초

비대칭 오류비용을 고려한 분류기준값 최적화와 SVM에 기반한 지능형 침입탐지모형 (An Intelligent Intrusion Detection Model Based on Support Vector Machines and the Classification Threshold Optimization for Considering the Asymmetric Error Cost)

  • 이현욱;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.157-173
    • /
    • 2011
  • 최근 인터넷 사용의 증가에 따라 네트워크에 연결된 시스템에 대한 악의적인 해킹과 침입이 빈번하게 발생하고 있으며, 각종 시스템을 운영하는 정부기관, 관공서, 기업 등에서는 이러한 해킹 및 침입에 의해 치명적인 타격을 입을 수 있는 상황에 놓여 있다. 이에 따라 인가되지 않았거나 비정상적인 활동들을 탐지, 식별하여 적절하게 대응하는 침입탐지 시스템에 대한 관심과 수요가 높아지고 있으며, 침입탐지 시스템의 예측성능을 개선하려는 연구 또한 활발하게 이루어지고 있다. 본 연구 역시 침입탐지 시스템의 예측성능을 개선하기 위한 새로운 지능형 침입탐지모형을 제안한다. 본 연구의 제안모형은 비교적 높은 예측력을 나타내면서 동시에 일반화 능력이 우수한 것으로 알려진 Support Vector Machine(SVM)을 기반으로, 비대칭 오류비용을 고려한 분류기준값 최적화를 함께 반영하여 침입을 효과적으로 차단할 수 있도록 설계되었다. 제안모형의 우수성을 확인하기 위해, 기존 기법인 로지스틱 회귀분석, 의사결정나무, 인공신경망과의 결과를 비교하였으며 그 결과 제안하는 SVM 모형이 다른 기법에 비해 상대적으로 우수한 성과를 보임을 확인할 수 있었다.

SVM과 로짓회귀분석을 이용한 흥미있는 웹페이지 예측 (Predicting Interesting Web Pages by SVM and Logit-regression)

  • 전도홍;김형래
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.47-56
    • /
    • 2015
  • 흥미 있는 웹페이지의 자동화된 탐색은 다양한 응용 분야에 활용될 수 있다. 웹페이지에 대한 사용자의 흥미는 판단하는 것은 사용자의 행동을 관찰함으로 자동화가 가능하다. 흥미 있는 웹페이지를 구분하는 작업은 판별 문제에 속하며, 우리는 실증을 위해 화이트 박스의 학습 방법(로짓회귀분석, 지지기반학습)을 선택한다. 실험 결과는 다음을 나타내었다. (1) 고정효과 로짓회귀분석, polynomial 과 radial 커널을 이용한 고정효과 지지기반학습은 선형 커널보다 높은 성능을 보였다. (2) 개인화가 모델 성능을 향상시킴에 있어 주요한 이슈이다. (3) 사용자에게 웹페이지에 대항 흥미를 물을 때, 구간은 단순히 예/아니 도 충분할 수 있다. (4) 웹페이지에 머문 기간이 매초 증가할 때마다 성공확률은 1.004배 증가하며, 하지만 스크롤바 클릭 수 (p=0.56) 와 마우스 클릭 수 (p=0.36) 지표는 흥미와 통계적으로 유의한 관계를 가지지 않았다.

소형 유전자 알고리즘을 이용한 스테레오 영상으로부터의 3차원 모델 추출기법 (3D Model Extraction Method Using Compact Genetic Algorithm from Real Scene Stereoscopic Image)

  • 한규필;엄태억
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.538-547
    • /
    • 2001
  • 최근 2차원 실시간 영상통신기술들이 급속한 발전을 거듭하여 여러 제품에 상용화되고 있는 추세이다. 그러나 이 기술들은 2차원 영상의 시각적 전송이므로 가상현실의 도래로 인해 수반된 3차원 현실감을 다루기에는 불충분하다고 할 수 있다. 이밖에 컴퓨터 그래픽 분야의 3차원 가상현실 연구가 합성 영상에 국한되어 연구되어졌기 때문에 실 영상에 대한 가상현실의 구현이 어려운 실정이다 그러므로 본 논문에서는 스테레오 시각을 이용하여 실 영상 가상현실 구현에 적용될 수 있는 유전자 알고리즘 기반의 새로운 3차원 객체 추출기법을 제시한다. 제안한 방법은 저장공간의 낭비와 알고리즘의 복잡성을 줄이기 위해서 확률벡터와 반복학습에 기반한 개체군기반 증가 학습이라는 소형 유전자 알고리즘을 정합 환경에 맞게 변형시켰다. 그 결과 정합 성능이 기존의 스테레오 정합 기법보다 우수하며, 간단하고 빠른 정합 알고리즘을 제시할 수 있었다. 또한, 영상의 특성에 무관하게 알고리즘의 변경 없이 안정된 결과를 얻을 수 있다는 장점이 있었다.

  • PDF

선택적 중계 기법을 적용한 다중 안테나 기반 협력 통신 시스템의 선형 전처리 기술 (Linear Precoding Technique for Cooperative MIMO Communication Systems Using Selection-Type Relaying)

  • 유병욱;이충용
    • 대한전자공학회논문지TC
    • /
    • 제47권11호
    • /
    • pp.24-29
    • /
    • 2010
  • 선택적 중계 기법은 수신 복잡도가 낮으면서도 선택 다이버시티로 인하여 성능 향상을 도모할 수 있는 협력 통신 시스템의 전송 기법 중 하나이다. 본 논문에서는 이 시스템의 오차 확률을 최소화 할 수 있는 선형 전처리 기술을 다룬다. 전 채널 상태 정보가 모든 단말에서 이용 가능하다는 가정 하에, 수신 신호의 평균 제곱 오차를 최소화하기 위한 송신 및 중계 전처리 필터를 제안한다. 중계 전송을 위한 최적의 송신 및 중계 전처리 필터는 수식적으로 표현하기 어렵고 반복 연산을 요구하므로 이를 단순화한 기법을 적용한다. 게다가, 고정된 신호 대 잡음비의 임계치를 사용하는 기존의 선택적 중계 기법과 달리 직접 경로와 중계 경로에서의 신호 검출 후 최소 신호 대 잡음비를 비교하여 더 큰 값을 갖는 경로를 전송 경로로 선택하는 기법을 소개한다. 모의실험을 통하여 제안한 선택 중계 기법이 기존의 중계 기법 및 선택적 중계 기법보다 우수한 성능을 보임을 확인할 수 있다.

간략화된 메쉬에서 보간된 법선 벡터의 분포를 이용한 3차원 모델 검색 (3D Model Retrieval using Distribution of Interpolated Normal Vectors on Simplified Mesh)

  • 김아미;송주환;권오봉
    • 한국멀티미디어학회논문지
    • /
    • 제12권11호
    • /
    • pp.1692-1700
    • /
    • 2009
  • 본 논문에서는 메쉬 법선 벡터들의 방향 분포를 3차원 모델의 특징 기술자로 제안한다. 특징 기술자로써 요구되는 회전 불변을 주성분 분석법(PCA)으로 처리하고 잡음첨가에 강건하도록 메쉬 간략화를 수행한다. 표면적이 작은 면에 대한 정보가 특징 기술자를 구성하는데 더 적게 반영되도록 법선 벡터의 분포를 각 다각형의 면적에 비례하게 표본을 뽑아 법선 벡터에 가중치를 적용하고 보간하여 변별력을 높인다. 모델간의 유사도는 특징 기술자의 거리를 정규화한 확률 밀도 히스토그램의 L1-norm으로 측정한다. 제안한 방법이 기존 방법에 비해 검색 순위 평균(ANMRR)으로 나타낸 검색 성능이 약 17.2%, 정량적 변별 척도로 나타낸 검색 성능이 최소 9.6%에서 최대 17.5%까지 향상되었음을 알 수 있었다.

  • PDF

GAODV 라우팅 프로토콜의 연결성 (Connectivity of the GAODV Routing Protocol)

  • 최영철
    • 한국정보통신학회논문지
    • /
    • 제21권7호
    • /
    • pp.1306-1312
    • /
    • 2017
  • Ad-hoc on-demand distance vector (AODV) 경로요청 패킷의 브로드캐스트 스톰 문제를 개선하기 위해 제안된 라우팅 프로토콜들은 경로 요청 패킷을 선택적으로 재방송하는데, 노드 밀집도가 낮은 시나리오에서 이러한 선택적 재방송 기법들의 연결성은 AODV보다 작아지게 된다. 경로 요청 패킷을 선택적으로 재방송하는 라우팅 프로토콜의 동작 요구 조건을 명확하게 하기 위해서는, 연결성과 노드 밀집도 사이의 관계 규명이 필요하다. 본 논문에서는 노드들이 균일 분포로 배치되었다는 가정 하에, 임의의 위치에서 geographical AODV (GAODV)의 연결성이 손상되지 않을 확률을 유도한다. 또한, 연결성이 손상되지 않을 확률을 이용해서 GAODV의 종단 간 연결성을 근사할 수 있는 직관적인 방안을 제시한다. 시뮬레이션을 통하여 0.9 및 0.99의 연결성을 보장하기 위한 노드 밀집도를 도출하고, 이론적인 결과와 비교함으로써, 이론적으로 유도된 연결성의 유효성을 보인다.

보건조사연구에서 다변량결측치가 내포된 자료를 효율적으로 분석하기 위한 통계학적 방법 (Statistical Methods for Multivariate Missing Data in Health Survey Research)

  • 김동기;박은철;손명세;김한중;박형욱;안재형;임종건;송기준
    • Journal of Preventive Medicine and Public Health
    • /
    • 제31권4호
    • /
    • pp.875-884
    • /
    • 1998
  • Missing observations are common in medical research and health survey research. Several statistical methods to handle the missing data problem have been proposed. The EM algorithm (Expectation-Maximization algorithm) is one of the ways of efficiently handling the missing data problem based on sufficient statistics. In this paper, we developed statistical models and methods for survey data with multivariate missing observations. Especially, we adopted the EM algorithm to handle the multivariate missing observations. We assume that the multivariate observations follow a multivariate normal distribution, where the mean vector and the covariance matrix are primarily of interest. We applied the proposed statistical method to analyze data from a health survey. The data set we used came from a physician survey on Resource-Based Relative Value Scale(RBRVS). In addition to the EM algorithm, we applied the complete case analysis, which uses only completely observed cases, and the available case analysis, which utilizes all available information. The residual and normal probability plots were evaluated to access the assumption of normality. We found that the residual sum of squares from the EM algorithm was smaller than those of the complete-case and the available-case analyses.

  • PDF

Bag of Visual Words Method based on PLSA and Chi-Square Model for Object Category

  • Zhao, Yongwei;Peng, Tianqiang;Li, Bicheng;Ke, Shengcai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권7호
    • /
    • pp.2633-2648
    • /
    • 2015
  • The problem of visual words' synonymy and ambiguity always exist in the conventional bag of visual words (BoVW) model based object category methods. Besides, the noisy visual words, so-called "visual stop-words" will degrade the semantic resolution of visual dictionary. In view of this, a novel bag of visual words method based on PLSA and chi-square model for object category is proposed. Firstly, Probabilistic Latent Semantic Analysis (PLSA) is used to analyze the semantic co-occurrence probability of visual words, infer the latent semantic topics in images, and get the latent topic distributions induced by the words. Secondly, the KL divergence is adopt to measure the semantic distance between visual words, which can get semantically related homoionym. Then, adaptive soft-assignment strategy is combined to realize the soft mapping between SIFT features and some homoionym. Finally, the chi-square model is introduced to eliminate the "visual stop-words" and reconstruct the visual vocabulary histograms. Moreover, SVM (Support Vector Machine) is applied to accomplish object classification. Experimental results indicated that the synonymy and ambiguity problems of visual words can be overcome effectively. The distinguish ability of visual semantic resolution as well as the object classification performance are substantially boosted compared with the traditional methods.

No-reference Image Quality Assessment With A Gradient-induced Dictionary

  • Li, Leida;Wu, Dong;Wu, Jinjian;Qian, Jiansheng;Chen, Beijing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권1호
    • /
    • pp.288-307
    • /
    • 2016
  • Image distortions are typically characterized by degradations of structures. Dictionaries learned from natural images can capture the underlying structures in images, which are important for image quality assessment (IQA). This paper presents a general-purpose no-reference image quality metric using a GRadient-Induced Dictionary (GRID). A dictionary is first constructed based on gradients of natural images using K-means clustering. Then image features are extracted using the dictionary based on Euclidean-norm coding and max-pooling. A distortion classification model and several distortion-specific quality regression models are trained using the support vector machine (SVM) by combining image features with distortion types and subjective scores, respectively. To evaluate the quality of a test image, the distortion classification model is used to determine the probabilities that the image belongs to different kinds of distortions, while the regression models are used to predict the corresponding distortion-specific quality scores. Finally, an overall quality score is computed as the probability-weighted distortion-specific quality scores. The proposed metric can evaluate image quality accurately and efficiently using a small dictionary. The performance of the proposed method is verified on public image quality databases. Experimental results demonstrate that the proposed metric can generate quality scores highly consistent with human perception, and it outperforms the state-of-the-arts.

화자인식에서 연속밀도 은닉마코프모델의 혼합밀도 결정방법 (Gaussian Density Selection Method of CDHMM in Speaker Recognition)

  • 서창우;이주헌;임재열;이기용
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.711-716
    • /
    • 2003
  • 본 논문은 연속밀도 은닉마코프모델에서 각 상태별 혼합성분 개수를 결정하는 방법을 제안한다. 지금까지의 대부분의 연구가 연속밀도 은닉마코프모델에서 화자의 스펙트럼 특성에 상관없이 각 상태별 동일한 혼합성분 개수를 적용하였다. 이런 접근방법은 많은 계산량을 요구할 뿐만 아니라, 각 상태의 특성을 무시하고 있기 때문에 각 상태별 음성신호의 정확한 모델링을 할 수 없다. 따라서 본 논문에서 제안한 연속밀도 은닉마코프모델의 파라미터 추정은 각 상태별 혼합성분에 대한 발생 확률값에 따라서 결정하였다. 또한 혼합성분의 개수를 줄이는 과정에서 신호의 상관성을 줄이고 시스템의 전체적인 안정성을 얻기 위해서 주성분 분석을 이용하였다. 제안한 방법은 기존의 은닉마코프모델에 비해서 평균 10% 작은 혼합성분 개수를 이용했을 때를 기준으로 실험하였다. 실험결과에서 혼합성분 결정만을 적용했을 때 거의 비슷한 성능을 얻을 수 있었다. 그리고 주성분 분석을 이용했을 때, 특정벡터가 16 차일 때 평균 0.35%의 성능감소가 일어났지만, 25 차에서는 평균 0.65%의 성능개선을 얻을 수 있었다.