• 제목/요약/키워드: Category Hierarchy

검색결과 83건 처리시간 0.022초

Building Topic Hierarchy of e-Documents using Text Mining Technology

  • Kim, Han-Joon
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2004년도 e-Biz World Conference
    • /
    • pp.294-301
    • /
    • 2004
  • ·Text-mining approach to e-documents organization based on topic hierarchy - Machine-Learning & information Theory-based ㆍ 'Category(topic) discovery' problem → document bundle-based user-constraint document clustering ㆍ 'Automatic categorization' problem → Accelerated EM with CU-based active learning → 'Hierarchy Construction' problem → Unsupervised learning of category subsumption relation

  • PDF

비음수 행렬 분해와 동적 분류 체계를 사용한 자동 이메일 다원 분류 (Automatic Email Multi-category Classification Using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.378-385
    • /
    • 2010
  • 이메일 사용의 증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 늘고 있다. 현재의 이메일 분류는 SVM, 베이지안 분류자, 규칙 기반 분류자 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 그러나 이러한 지도 학습 방법들은 적합한 이메일을 인식하기 위하여서 사용자가 규칙이나 색인어 목록을 작성해야 한다. 비지도 학습 방법으로 군집을 이용한 다원 분류 방법은 메일의 분류 주제를 설정해주어야 한다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factorization)를 기반으로 한 자동 분류 주제 생성 방법과, 동적 분류 체계(DCH, Dynamic Category Hierarchy) 방법을 이용한 분류 주제 내에 이메일을 재구성하는 방법을 결합한 새로운 이메일 다원 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 다원 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 사용자가 분류 결과를 만족하지 못하면 분류 주제 내의 이메일을 동적으로 재구성하여 분류의 정확률을 높인다.

E-mail Classification and Category Re-organization using Dynamic Category Hierarchy and PCA

  • Park, Sun;Kim, Chul-Won;An, Dong-Un
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.351-355
    • /
    • 2009
  • The amount of incoming e-mails is increasing rapidly due to the wide usage of Internet. We often group e-mails into categories for maintaining e-mail efficiently. However reading the email messages and classifying them is still tedious task. Moreover, the number of e-mails and manual classifying is increasing everyday. So, automatic e-mail classification is important techniques. In this paper, we propose a multi-way e-mail classification method that uses PCA for automatic category generation and dynamic category hierarchy for re-organizing e-mail categories. It classifies a huge amount of receiving e-mail messages automatically, efficiently, and accurately.

카테고리 계층을 고려한 회선신경망의 이미지 분류 (Image Classification Using Convolutional Neural Networks Considering Category Hierarchies)

  • 정노권;조수선
    • 한국멀티미디어학회논문지
    • /
    • 제21권12호
    • /
    • pp.1417-1424
    • /
    • 2018
  • In order to improve the performance of image classifications using Convolutional Neural Networks (CNN), applying a category hierarchy to the classification can be a useful idea. However, the visual separation of object categories is very different according to the upper and lower category levels and highly uneven in image classifications. Therefore, it is doubtable whether the use of category hierarchies for classification is effective in CNN. In this paper, we have clarified whether the image classification using category hierarchies improves classification performance, and found at which level of hierarchy classification is more effective. For experiments we divided the image classification task according to the upper and lower category levels and assigned image data to each CNN model. We identified and compared the results of three classification models and analyzed them. Through the experiments, we could confirm that classification effectiveness was not improved by reduction of number of categories in a classification model. And we found that only with the re-training method in the last network layer, the performance of lower category classification was not improved although that of higher category classification was improved.

논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법 (A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results)

  • 배경만;황재원;고영중;김종훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.214-221
    • /
    • 2010
  • 검색 결과 내 군집화(search-result clustering)는 검색 엔진으로부터 검색된 결과 내에서 비슷한 문서를 자동으로 군집화하는 기법이다. 본 논문에서는 논문 검색 서비스에 전문화된 새로운 결과 내 군집화 기법을 제안한다. 제안하는 시스템은 '범주체계생성기(Category Hierarchy Generation System)'와 '논문군집기(Paper Clustering System)'로 구성되어있다. '범주체계생생기'는 KOSEF의 연구 범주 체계를 이용하여 분야 시소러스라 불리는 범주 체계를 생성하고, K-means 알고리즘을 이용한 단어 군집화 알고리즘을 사용하여 분야 시소러스의 키워드 집합을 확장한다. '논문군집기'는 top-down 방식과 bottom-up 방식을 이용하여 각 논문의 범주를 결정한다. 제안하는 시스템은 논문 검색 서비스와 같은 전문 분야에 대한 검색 서비스에 유용하게 사용될 수 있을 것이다.

PCA와 동적 분류체계를 사용한 자동 이메일 계층 분류 (Automatic e-mail Hierarchy Classification using Dynamic Category Hierarchy and Principal Component Analysis)

  • 박선
    • 한국항행학회논문지
    • /
    • 제13권3호
    • /
    • pp.419-425
    • /
    • 2009
  • 인터넷 사용의 보편화로 인해 이메일의 양이 급속히 증가하고 있다. 이에 따라서 수신된 메일을 효율적이고 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류 기술들은 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 이메일의 다원분류 방법중 군집(clustering)을 이용한 분류 방법은 분류의 정확도가 떨어지고 분류 레이블이 없는 단점이 있으며, 분류(classification)를 이용한 방법은 미리 분류 레이블을 사용자가 지정해야 하며 학습시켜야 하는 단점을 갖는다. 본 논문에서는 PCA (Principal Component Analysis)를 기반으로 한 자동 카테고리 생성 방법과 동적 분류 체계 방법을 결합한 새로운 자동 이메일 계층 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

개념지식의 유형에 따른 표상차이: 범주와 각본의 위계성과 전형성 비교1) (Knowledge Representation Characteristics of Categories and Scripts: An Investigation on Hierarchy and Typicality Effects)

  • 이재호;이정모
    • 인지과학
    • /
    • 제11권3_4호
    • /
    • pp.73-81
    • /
    • 2000
  • 이 연구는 지식유형에 따른 표상 차이를 확인하기 위해서 범주지식과 각본지식의 위계성과 전형성에 대한 점화효과를 측정하였다. 실험 1에서는 상위개념을 점화단어로 제시하고 하위개념을 목표단어로 제시한 다움 목표단어의 어휘판단시간을 측정하였다. 그 결과, 범주지식은 전형단어가 비전형단어보다 반응시간이 빨랐지만, 각본지식은 두 조건간의 차이가 없었다. 실험 2에서는 하위개념을 점화단어로 제시하고 상위개념을 목표단어로 제시한 다음 목표단어의 어위판단시간을 측정하였다. 범주지식이 각본지식보다 반응시간이 빨랐으며, 두 지식 모두 전형성 효과는 관찰되지 않았다. 이러한 결과는 범주지식은 전형성에 따른 위계구조를 구성하지만 각본지식은 범주지식에 비해서 위계성과 전형성이 약회된 구조로 표상될 가능성을 시사하는 것이다.

  • PDF

주성분 분석과 동적 분류체계를 사용한 자동 이메일 분류 (Automatic e-mail classification using Dynamic Category Hierarchy and Principal Component Analysis)

  • 박선;김철원;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.576-579
    • /
    • 2009
  • 인터넷 사용의 보편화로 이메일의 양이 급속히 증가하고 있다. 따라서 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 주성분 분석(PCA, Principal Component Analysis)을 기반으로 한 자동 카테고리 생성 방법과 동적 분류 체계 방법을 결합한 새로운 자동 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

RUG-III를 이용한 노인환자군분류의 타당성검증 (Application of RUG-m for Long-Term Care Elderly Patients)

  • 이지전;유승흠;오희철;남정모;박은철;이윤환
    • 한국병원경영학회지
    • /
    • 제6권3호
    • /
    • pp.148-166
    • /
    • 2001
  • The purpose of this study is to classify elderly patient in long-term care facilities using RUG(Resource Utilization Group)-III. It is designed by measuring patient medical characteristics and medical staff time. Elderly patients are classified into 7 categories by clinical(medical and behavioral) hierarchical typology of patients. Through the tertiary split, all 44 groups are formulated. This classification is explained by each patient resource(staff time) utilization level which is called CMI(Case-Mix Index). Major findings are as follows; 1. The objects in this study were classified into 35 groups out of 44 groups. The most frequent category is clinical complex category(CCC; 38.9%). And extensive service category(ESC; 18.8%), reduced physical function category(RPC; 13.1%), special rehabilitation category(SRC; 12.8%), and impaired cognitive category(ICC; 0.00%) are followed. 2. The mean of total CMI was $1.02{\pm}0.36$, ranging from 0.68 to 1.44(1 vs 2.12). The mean of CMI of SRC is only 1.17 which should be the highest. The means of ESC and see are equally 1.20. The means of CMI of CCI, ICC, BPC, and RPC were 0.90, 0.75, 0.83 and 0.96, respectively. 3. The validity of this classification was tested. Trend-test using Regression Analysis was done in the secondary split level. SCC, CCC, ICC, and RPC which covered 68.4% of this research objects showed linear trend of CMI in interim classification. This results were statistically significant. 4. In clinical hierarchy, the trend were showed linearity. But the multiple comparison of categories using Scheffe-test showed that SRC, ESC and see had same level of CMI means and CCC and ICC, too. This results were statistically significant. Classifying elderly patients with RUG-III, the results showed partly linear trend in clinical hierarchy and in interim classification in conclusion. But, in clinical hierarchy, it was failed to show the consistent order of CMI. It can be explained by two reasons. One is that this research subjects were overlapped in each clinical hierarchy group. And the other is that the some of the characteristics for clinical hierarchy is not appropriate for them. For the further study, it needs to have proper sample size and to modify RUG-III to K-RUG to consider our.. medical environment.

  • PDF

계층적 분석 과정을 이용한 학교급식 운영 품질 평가 분야의 중요도 분석 (Analytic Hierarchy Process Approach to Estimate Weights of Evaluation Categories for School Food Service Program in Korea)

  • 이민아;양일선;이보숙;김현아;박소현
    • Journal of Nutrition and Health
    • /
    • 제39권1호
    • /
    • pp.74-83
    • /
    • 2006
  • The purposes of this study were to (1) identify the evaluation categories, areas, attributes, and criteria of the school food service program using both a qualitative and a quantitative analyses, (2) define the relative importance of the evaluation categories, areas, attributes, and criteria of the school food service program using analytic hierarchy process, (3) organize the evaluation system to improve quality of the school food service in Korea. A survey was conducted from August to October 2004 to collect data from 172 dietitians, 15 school food service officials at the educational board, 10 professionals of school food service. Statistical analyses were performed on the data utilizing the SPSS 12.0 for Windows and Excel, such as Descriptive statistics and analytic hierarchy process was performed. The result of the analytic hierarchy process indicated that relative importance of evaluation category was 0.4319 (food service manage ment), 0.2369 (nutrition education), 0.1455 (satisfaction) and 0.0912 (parent involvement program). 'Sanitation, safety and facility (0.1739)' was the most important area among the subcategories of food service management, followed by nutrition management (0.1581), procurement (0.1375), production (0.1345), organization and personnel management (0.0662), planning (0.0644), food service evaluation (0.0585), financial accountability (0.0555), and information management (0.0554). There existed a relative importance on the three areas of the nutrition program and satisfaction evaluation category: students (0.5281, 0.6221), parents (0.1812, 0.1491), and teachers (0.1838, 0.1618). In the parent involvement program evaluation category, relative importance of committee and monitoring management was 0.4658 and information communication was 0.3724. The quality of food and service to school children can be improved by the appropriate application of the developed evaluation tool for the school food service program.