• Title/Summary/Keyword: 속성분류

Search Result 863, Processing Time 0.027 seconds

Data Mining Using Reversible Jump MCMC and Bayesian Network Learning (Reversible Jump MCMC와 베이지안망 학습에 의한 데이터마이닝)

  • 하선영;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.90-92
    • /
    • 2000
  • 데이터마이닝 문제는 데이터를 그 속성들에 따라 분류하여 예측하는 것뿐만 아니라 분류된 속성들간의 연관성에 대해 잘 설명할 수 있어야 한다. 일반적으로 변수들간의 연관성을 잘 설명할 수 있으면서도 높은 예측력을 가지는 방법으로는 베이지안 네트웍 분류자(Bayesian network classifier)가 있다. 그러나 이것은 데이터 마이닝과 같은 대용량 데이터에서는 성능이 떨어지는 단점이 있다. 이에 이 논문에서는 최근 RBF 신경망이 입력변수 선정문제에 성공적으로 적용된 Reversible Jump Markov Chain Monte Carlo 방법을 이용하여 최적의 입력변수들만을 선택하여 베이지안 네트웍을 학습하는 Selective BN Augmented Naive-Bayes Classifier를 새로운 방안으로 제안하고 이를 실제 데이터마이닝 문제에 적용한 결과를 제시한다.

  • PDF

Hybrid Gene Selection Method for Cancer Classification (암 분류를 위한 하이브리드 유전자 선택 기법)

  • Piao, Yongjun;Hiep, Vu Quang;Erdenetuya, Namsrai;Piao, Minghao;Ryu, Keun-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.154-156
    • /
    • 2012
  • 암 분류를 위한 마이크로어레이 데이터로부터의 유전자 선택은 최근 각광을 받고 있는 연구분야이다. 마이크로어레이 데이터는 적은 샘플 수에 비해 대규모의 유전자로 구성된다. 그렇기 때문에 분류의 정확도를 높이기 위하여 대상 암과 관련된 유전자만 선택할 수 있는 차원 축소 기법이 필요하다. 따라서 본 논문에서는 Symmetrical Uncertainty와 Support Vector Machine (SVM)을 이용한 하이브리드 속성선택 기법을 제안하였다. 제안한 기법은 실험 결과를 통해 다른 속성 선택 기법보다 좋은 성능을 보여주었다.

A Study on Attributes to Define Malware (악성 코드 정의를 위한 속성 연구)

  • Park, Min-Woo;Seo, Sangwook;Chung, Tai-Myoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.982-983
    • /
    • 2011
  • 악성코드의 수가 급격히 늘어나면서, 최근에는 하루에도 수 만개의 신 변종 악성코드가 쏟아져 나온다. 악성코드로 인한 국내 피해를 줄이기 위해 한국인터넷진흥원에서는 신 변종 악성코드를 즉각적으로 분석하고 분석 결과를 공유하기 위해 노력하고 있다. 하지만 악성코드를 정의하고 분류하는 방침에 있어서 표준화된 규칙이 없어 악성 코드 분석 결과를 공유하는 대에 어려움이 따른다. 본 논문에서는 현재의 악성코드 정의 및 분류 방안에 대한 한계점을 개선하기 위해 악성-속성을 규정하고 이를 이용한 악성 코드 정의 및 분류 방안에 대해 제시한다.

Multi-Attribute based on Data Management Scheme in Big Data Environment (빅 데이터 환경에서 다중 속성 기반의 데이터 관리 기법)

  • Jeong, Yoon-Su;Kim, Yong-Tae;Park, Gil-Cheol
    • Journal of Digital Convergence
    • /
    • v.13 no.1
    • /
    • pp.263-268
    • /
    • 2015
  • Put your information in the object-based sensors and mobile networks has been developed that correlate with ubiquitous information technology as the development of IT technology. However, a security solution is to have the data stored in the server, what minimal conditions. In this paper, we propose a data management method is applied to a hash chain of the properties of the multiple techniques to the data used by the big user and the data services to ensure safe handling large amounts of data being provided in the big data services. Improves the safety of the data tied to the hash chain for the classification to classify the attributes of the data attribute information according to the type of data used for the big data services, functions and characteristics of the proposed method. Also, the distributed processing of big data by utilizing the access control information of the hash chain to connect the data attribute information to a geographically dispersed data easily accessible techniques are proposed.

A Study on the Object Interoperability using the Fuzzy Property Space (퍼지 속성 공간을 이용한 객체 상호 작용에 관한 연구)

  • 이진호;이전영
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1997.10a
    • /
    • pp.387-390
    • /
    • 1997
  • 퍼지 속성 공간(fuzzy property space)은 데이터베이스의 각 객체를 분류하고 분석하는데 유용한 도구로서 사용됨을 보였다[1]. 이는 수학적인 속성 집합 이론(property set theory)[2]에 근간을 두고 만들어진 이론으로, 데이터의 분석에 무척 유리한 도구로 사용될 수 있다. 본 연구에서는 근래에 들어 많은 연구가 이루어지고 있는 분산 데이터베이스 환경(distributed database management)에서 이를 응용해보고자 시도하였다. 즉, 분산 환경에서 어떠한 객체의 데이터를 상호 교환하고자 하는 간단한 상호 작용(object interoperability)을 수행함에 있어, 각 시스템은 이들 상호간의 규약에 의한 합치(object integration)를 이룰 수 있어야 한다. 여기에 퍼지 속성 공간을 이용하여, 가장 근사한 합치를 이룰 수 있도록 하는 것이다. 예를 들어, A와 B 두 개의 시스템에서 객체의 상호 작용을 수행한다. 하면, A시스템의 하나의 객체를 두 개의 공통된 속성 공간에 위치시키고, B라는 시스템에서 이를 다시 해석하여 자신의 데이터베이스에 입력으로 받아들이는 방식을 채택하여 상호 작용의 연산을 설계하는 방식이다.

  • PDF

Fine-Grain Weighted Logistic Regression Model (가중치 세분화 기반의 로지스틱 회귀분석 모델)

  • Lee, Chang-Hwan
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.53 no.9
    • /
    • pp.77-81
    • /
    • 2016
  • Logistic regression (LR) has been widely used for predicting the relationships among variables in various fields. We propose a new logistic regression model with a fine-grained weighting method, called value weighted logistic regression, by assigning different weights to each feature value. A gradient approach is utilized to obtain the optimal weights of feature values. We conduct experiments on several data sets and the experimental results show that the proposed method shows meaningful improvement in prediction accuracy.

EPG User Interface based on Specifying Multiple Program Attributes (프로그램 속성 값 지정을 통한 EPG User Interface)

  • Lee Jae Hoon;Jung Moon Ryul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2004.11a
    • /
    • pp.277-280
    • /
    • 2004
  • 디지털 방송의 시작과 함께, TV화면에서 채널이나 프로그램을 직접 검색학 수 있는 EPG(Electronic Program Guide)라는 새로운 방송 서비스가 제공되고 있다. 그러나 아직까지는 시청자 입장을 고려한 EPG의 사용자 인터페이스에 대한 연구는 미흡한 실정이다. TV는 특정 계층이 아닌 모든 사람이 시청하는 매체이의로 시청자에게 프로그램을 쉽게 찾게 하기 위해서는 직관적인 사용자 인터페이스가 필요하다. 즉 EPG를 이용해 TV 시청자가 쉽게 이해할 수 있는 속성들을 선택해 프로그램을 빨리 찾을 수 있게 하는 것이다. 이를 위해본 논문에서는 먼저 TV 프로그램을 구분하는 대표적인 속성들인 장르, 시간, 등급 등을 체계적으로 분류하였다. 이렇게 체계화된 속성득의 값들을 시청자들이 EPG를 통해 지정하게 하되, 값을 지정하는 속성들의 순서를 편한 데로 선택할 수 있게 하는 사용자 인터페이스를 설계하였다. 그리고 기존의 상용 EPG와 본 논문에서 제안하는 EPG의 Usability Test를 통해 두 가지 EPG의 기능의 우수성을 비교평가 하였다.

  • PDF

Study on the differences in the beauty shop selection attributes between Koreans and Chinese Consumers (한국과 중국 소비자 간의 뷰티샵 선택 속성 차이 비교 연구)

  • Lee, Ju-Ran;Kim, Sang-Soo
    • Journal of the Korea Convergence Society
    • /
    • v.11 no.12
    • /
    • pp.275-282
    • /
    • 2020
  • As interest in the high-potential Chinese beauty market is growing, understanding the disposition of Chinese consumers different from Korea is becoming more important for successful entry into the Chinese market. This study attempted to compare differences in beauty shop selection attributes between Korean and Chinese consumers. In order to achieve this research purpose, the beauty shop selection attribute was classified into five components: environmental attribute, structural attribute, external attribute, awareness, and service attribute. Survey responses were collected from 162 Chinese and 111 Koreans, respectively, and empirical analysis was conducted. Both Chinese and Koreans had significant relationships between environmental attribute, service attribute and satisfaction, but the relationship between the remaining attributes and satisfaction were not significant. In addition, significant differences exist between Chinese and Koreans in the relationship between environmental attribute, service attribute and satisfaction. The results of this study can help companies to establish and operate a higher quality beauty shop based on understanding the situation and characteristics of each country in the fierce competition in the beauty market.

The weight analysis research in developing a similarity classification problem of malicious code based on attributes (속성기반 악성코드 유사도 분류 문제점 개선을 위한 가중치 분석 연구)

  • Chung, Yong-Wook;Noh, Bong-Nam
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.23 no.3
    • /
    • pp.501-514
    • /
    • 2013
  • A grouping process through the similarity comparison is required to effectively classify and respond a malicious code. When we have a use of the past similarity criteria to be used in the comparison method or properties it happens a increased problem of false negatives and false positives. Therefore, in this paper we apply to choose variety of properties to complement the problem of behavior analysis on the heuristic-based of 2nd step in malicious code auto analysis system, and we suggest a similarity comparison method applying AHP (analytic hierarchy process) for properties weights that reflect the decision-making technique. Through the similarity comparison of malicious code, configured threshold is set to the optimum point between detection rates and false positives rates. As a grouping experiment about unknown malicious it distinguishes each group made by malicious code generator. We expect to apply it as the malicious group information which includes a tracing of hacking types and the origin of malicious codes in the future.

User and Item based Collaborative Filtering Using Classification Property Naive Bayesian (분류 속성과 Naive Bayesian을 이용한 사용자와 아이템 기반의 협력적 필터링)

  • Kim, Jong-Hun;Kim, Yong-Jip;Rim, Kee-Wook;Lee, Jung-Hyun;Chung, Kyung-Yong
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.11
    • /
    • pp.23-33
    • /
    • 2007
  • The collaborative filtering has used the nearest neighborhood method based on the preference and the similarity using the Pearson correlation coefficient. Therefore, it does not reflect content of the items and has the problems of the sparsity and scalability as well. the item-based collaborative filtering has been practically used to improve these defects, but it still does not reflect attributes of the item. In this paper, we propose the user and item based collaborative filtering using the classification property and Naive Bayesian to supplement the defects in the existing recommendation system. The proposed method complexity refers to the item similarity based on explicit data and the user similarity based on implicit data for handing the sparse problem. It applies to the Naive Bayesian to the result of reference. Also, it can enhance the accuracy as computation of the item similarity reflects on the correlative rank among the classification property to reflect attributes.