• Title/Summary/Keyword: Associative Classification

Search Result 35, Processing Time 0.023 seconds

Protein Structure Prediction Using Associative Classification (연관적 분류기법을 이용한 단백질 구조예측)

  • Cho Kyung-Hwan;Lee Heon-Gyu;Lee Bum-Ju;Jung Kwang-Su;Ryu Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.31-34
    • /
    • 2006
  • 단백질 구조로부터 단백질 기능을 예측하고자 하는 일은 생명정보학 에서 중요한 이슈 및 연구과제가 되어 왔다. 그 중 단백질의 3 차 구조를 이해하고 분류하는 데에는 계층적인 분류방법을 이용하는 CATH database가 사용되고 있다. 이 논문에서는 CATH database 의 계층적 분류의 특성을 이용하되, 단백질의 3 차 구조가 아닌 단백질 서열로부터 데이터마이닝 기술을 적용, 마이닝 기법 중 순차패턴과 연관적 분류 기법을 이용하여 CATH database 의 계층별 구조 분류 기법을 제안 하였다.

  • PDF

Implementation of Document Classification Engine by Using Associative Knowledge (연상 지식을 이용한 문서 분류 엔진의 구현)

  • Jang Jung-Hyo;Son Ju-Sung;Lee Sang-Kon;Ahn Dong-Un
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.625-628
    • /
    • 2006
  • 인간은 문서 내용의 적절성을 파악하기 위해서는 문서 전체를 읽어 보아야 그 적절성 여부를 알 수 있다. 그러나 문서의 양이 많은 경우나 문서 내에 여러 화제가 산재되어 있으면 문서의 분야를 파악하기 위해 많은 시간과 노력이 필요하게 된다. 따라서 본 논문에서 제안하는 방법은 이러한 비용을 절감하기 위해 카테고리의 트리 정보와 문서의 내용에서 추출한 분야연상어를 지식사전으로 구축하고 이를 이용하는 분류기를 설계하여 수집과 분류에 소요되는 비용을 절감하는 자동 분류기를 구현하였다.

  • PDF

ON 2-GENERATING INDEX OF FINITE DIMENSIONAL LEFT-SYMMETRIC ALGEBRAS

  • Yang, Xiaomei;Zhu, Fuhai
    • Journal of the Korean Mathematical Society
    • /
    • v.54 no.5
    • /
    • pp.1537-1556
    • /
    • 2017
  • In this paper, we introduce the notion of generating index ${\mathcal{I}}_1(A)$ (2-generating index ${\mathcal{I}}_2(A)$, resp.) of a left-symmetric algebra A, which is the maximum of the dimensions of the subalgebras generated by any element (any two elements, resp.). We give a classification of left-symmetric algebras with ${\mathcal{I}}_1(A)=1$ and ${\mathcal{I}}_2(A)=2$, 3 resp., and show that all such algebras can be constructed by linear and bilinear functions. Such algebras can be regarded as a generalization of those relating to the integrable (generalized) Burgers equation.

User Preference Prediction Method Using Associative User Clustering and Bayesian Classification (연관 사용자 군집과 베이지안 분류를 이용한 사용자 선호도 예측 방법)

  • 정경용;김진현;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.109-111
    • /
    • 2001
  • 기존의 협력적 필터링 기술을 이용한 사용자 선호도 예측 방법에서는 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법(Nearest-Neighborhood Method)을 사용하고, 피어슨 상관 계수에 의해 사용자의 유사도를 구하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하였다. 본 논문에서는 기존의 사용자 선호도 예측 방법의 문제점을 보완하기 위하여 연관 사용자 군집과 베이지안 분류를 이음한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서의 희박성(Sparsity)문제를 해결하기 위하여 ARHP 알고리즘을 사용하여 사용자를 장르별로 군집하며 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도출 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 기존의 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게 하여 예측의 정확도를 높일 수 있다. 제안된 방법의 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다.

  • PDF

Classification of Web Documents Using Associative Word Frequency for Collaborative Filtering (협력적 필터링을 위해 연관 단어 빈도를 이용한 웹 문서 분류)

  • 하원식;정경용;정헌만;류중경;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.160-162
    • /
    • 2004
  • 기존의 웹 문서 분류 시스템서는 많은 시간과 노력을 요구하며, 연관 단어가 아닌 단일 단어만으로 웹 문서들을 분류하여 단어의 중의성을 반영하지 못해 많은 오분류가 있었다. 이러한 문제점을 해결하기 위해 본 논문에서는 협력적 필터링을 위한 연관 단어 빈도를 사용한 웹 문서 분류 방법을 제안한다. 제안된 방법에서는 웹 문서 내에서 단어들을 추출하고 빈도 가중치를 계산한다. 추출된 단어를 Apriori 알고리즘에 의해 연관 규칙을 생성하고 신뢰도에 단어 빈도 가중치를 반영한다. 수정된 신뢰도를 ARHP 알고리즘에 적용하여 연관 단어들 사이의 유사정도를 계산하고 유사 클래스를 구성한다 생성된 유사 클래스들을 기반으로 웹 문서를 $\alpha$-cut을 이용하여 분류한다 성능평가를 위해 기존의 문서 분류 방법들과 비교 평가를 하였다.

  • PDF

Associative Classification based Customized Tourist Attraction Recommendation System applying CPFP-tree (CPFP-tree를 적용한 연관분류 기반의 사용자 맞춤형 관광명소 추천 시스템)

  • Kim, Hyeong-Soo;Park, Soo-Ho;Lee, Dong-Gyu;Ryu, Keun-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.134-136
    • /
    • 2012
  • u-City 환경에서 사용자 맞춤형 국토정보를 제공하기 위해 대용량의 데이터를 효과적으로 분석할 수 있는 데이터마이닝 기법이 적용되고 있다. 따라서 이 논문에서는 데이터마이닝 기법 중 연관분류기법을 적용하여 사용자 맞춤형 관광명소 추천 시스템을 개발하였다. 특히, CPFP-tree를 이용하여 빈발항목집합 탐사에 대한 시간을 단축하였으며, 연관분류를 통해 보다 높은 정확도로 결과를 예측 및 분류할 수 있게 하였다. 제시한 시스템은 공간정보에 대해 사용자 맞춤 서비스를 제공할 수 있음을 보였으며, 다양한 시나리오 적용을 통해 맞춤형 국토정보화 기술의 기반이 될 수 있다.

AUX Model for restoring and analyzing Associative User Experience informations (연상된 사용자 경험정보 축척 및 분석을 위한 AUX 모델)

  • Ryu, Chun-Yeol;Yang, Hae-Sool
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.12
    • /
    • pp.586-596
    • /
    • 2011
  • In the IT industry, processing units of IT applications are getting smaller and high efficient. Furthermore, the realization of various smart functions is highly feasible now due to advances in sensing technology. The service infrastructures on high efficient and compact mobile devices are applied to various areas. These also could be possessed by users and is built into the devices. Currently, studies on the UX(User Experience) field to attempt an analysis and prediction of user's information are continuing with reference to the UI(User Interface). However, research on the common framework of classification and storing the user-information, and standardization of form has not been attempted yet. In this study, we proposed the AUX(Associative user Experience) model and process structure to store various empirical data by users. The AUX model expressed a diversity of user's empirical data using extended E-TCPN model. And also, we expressed the data structure using XML with reference to the application of AUX model. This expressed model and separation of process structure guarantee its specialty, productivity and flexibility through the humanistic characteristics of users and the independence of technical process structure. The AUX model maps out the AUX information process architecture and expressed the process with the improved MPP algorithm, to analyze of its performance. The simulation of movements applying to MPP traffic allocation of VOD is used to analyze of its performance. The playback deviation of MPP Graphic Allocation Algorism where the AUX model was applied was improved by 10.41% more than the one where it was not applied. As a result of that, playback performance has improved due to the conversion of AUX with accessing media, content of users and dynamic traffic allocation such as MPI and CPI.

Dominance effects of ion transport and ion transport regulator genes on the final weight and backfat thickness of Landrace pigs by dominance deviation analysis

  • Lee, Young?Sup;Shin, Donghyun;Song, Ki?Duk
    • Genes and Genomics
    • /
    • v.40 no.12
    • /
    • pp.1331-1338
    • /
    • 2018
  • Although there have been plenty of dominance deviation analysis, few studies have dealt with multiple phenotypes. Because researchers focused on multiple phenotypes (final weight and backfat thickness) of Landrace pigs, the classification of the genes was possible. With genome-wide association studies (GWASs), we analyzed the additive and dominance effects of the single nucleotide polymorphisms (SNPs). The classification of the pig genes into four categories (overdominance in final weight, overdominance in backfat thickness and overdominance in final weight, underdominance in backfat thickness, etc.) can enable us not only to analyze each phenotype's dominant effects, but also to illustrate the gene ontology (GO) analysis with different aspects. We aimed to determine the additive and dominant effect in backfat thickness and final weight and performed GO analysis. Using additive model and dominance deviation analysis in GWASs, Landrace pigs' overdominant and underdominant SNP effects in final weight and backfat thickness were surveyed. Then through GO analysis, we investigated the genes that were classified in the GWASs. The major GO terms of the underdominant effects in final weight and overdominant effects in backfat thickness were ion transport with the SLC8A3, KCNJ16, P2RX7 and TRPC3 genes. Interestingly, the major GO terms in the underdominant effects in the final weight and the underdominant effects in the backfat thickness were the regulation of ion transport with the STAC, GCK, TRPC6, UBASH3B, CAMK2D, CACNG4 and SCN4B genes. These results demonstrate that ion transport and ion transport regulation genes have distinct dominant effects. Through GWASs using the mode of linear additive model and dominance deviation, overdominant effects and underdominant effects in backfat thickness was contrary to each other in GO terms (ion transport and ion transport regulation, respectively). Additionally, because ion transport and ion transport regulation genes are associative with adipose tissue accumulation, we could infer that these two groups of genes had to do with unique fat accumulation mechanisms in Landrace pigs.

A Study of Developing and Evaluating a Pansoree Retrieval System Using Topic Maps (토픽맵-기반 판소리 검색시스템 구축 및 평가에 관한 연구)

  • Oh Sam Gyun;Park Ok-Nam
    • Journal of Korean Library and Information Science Society
    • /
    • v.36 no.4
    • /
    • pp.77-98
    • /
    • 2005
  • The purpose of this research is to propose a powerful alternative in designing knowledge portals using Topic Maps(TM). To demonstrate the power of TM In constructing knowledge portals. we designed a TM-based korean folk music(pansori) site, tested It with an existing pansoree site (pansoree.com ) employing diverse query patterns : simple, advanced, associative, and cross referential Queries. The results show that the TM-based site outperforms the pansoree.com in searching time and steps. The TM-based site also provide novice users who do not know pansori domain with easy access to Information that they need.

  • PDF

Toward Successful Management of Vocational Rehabilitation Services for People with Disabilities: A Data Mining Approach

  • Kim, Yong Seog
    • Industrial Engineering and Management Systems
    • /
    • v.11 no.4
    • /
    • pp.371-384
    • /
    • 2012
  • This study proposes a multi-level data analysis approach to identify both superficial and latent relationships among variables in the data set obtained from a vocational rehabilitation (VR) services program of people with significant disabilities. At the first layer, data mining and statistical predictive models are used to extract the superficial relationships between dependent and independent variables. To supplement the findings and relationships from the analysis at the first layer, association rule mining algorithms at the second layer are employed to extract additional sets of interesting associative relationships among variables. Finally, nonlinear nonparametric canonical correlation analysis (NLCCA) along with clustering algorithm is employed to identify latent nonlinear relationships. Experimental outputs validate the usefulness of the proposed approach. In particular, the identified latent relationship indicates that disability types (i.e., physical and mental) and severity (i.e., severe, most severe, not severe) have a significant impact on the levels of self-esteem and self-confidence of people with disabilities. The identified superficial and latent relationships can be used to train education program designers and policy developers to maximize the outcomes of VR training programs.