• 제목/요약/키워드: Subject Based Classification

검색결과 322건 처리시간 0.025초

주제어기반 분류의 특성 분석 - 범주화 및 분류체계의 측면을 중심으로 - (An Analysis of the Characteristics of the Subject-based Classification System)

  • 백지원
    • 한국문헌정보학회지
    • /
    • 제47권1호
    • /
    • pp.57-79
    • /
    • 2013
  • 본 연구는 전통적인 문헌분류와 주제어기반 분류(Subject-Based Classification: SBC)의 상대적인 비교를 통하여 SBC 체계가 범주화 및 분류체계의 측면에서 갖는 특성을 분석함으로써 SBC의 정체성을 명확히 정립하는 데 목적이 있다. 분석을 위하여 12종의 실제 SBC 체계를 수집하여 그 체계의 전반 및 특성을 개괄하고, 범주화의 관점과 내용, 그리고 분류의 이론적 측면에서 DDC와 상대적인 방식으로 분석하였다. 분석의 결과 SBC 체계는 분류의 관점의 차이에서 비롯되는 범주화의 내용과 구조적인 측면에서 DDC와 큰 차이가 있으며, 분류체계로서의 요건이 적용되는 정도와 방식에 있어서도 기존의 문헌분류체계와 상반된 특성이 명확하게 드러남을 파악할 수 있었다. 따라서 향후 이러한 SBC의 특성을 고려한 분류론적 논의와 이론 개발이 필요함을 밝혔다.

콜론분류법에 바탕한 자동분류시스템의 개발에 관한 연구 - 농학 및 의학 전문도서관을 사레로 - (Developing an Automatic Classification System Based on Colon Classification: with Special Reference to the Books housed in Medical and Agricultural Libraries)

  • 이경호
    • 한국문헌정보학회지
    • /
    • 제23권
    • /
    • pp.207-261
    • /
    • 1992
  • The purpose of this study is (1) to design and test a database which can be automatically classified, and (2) to generate automatic classification number by processing the keywords in titles using the code combination method of Colon Classification(CC) as well as an automatic recognition of subjects in order to develop an automatic classification system (Auto BC System) based on CC which can be applied to any research library. To conduct this study, 1,510 words in the fields of agricultrue and medicine were selected, analized in terms of [P], [M], [E], [S], [T] employed in CC, and included in a database for classification. For the above-mentioned subject fields, the principle of an automatic classification was specified in order to generate automatic classification codes as well as to perform an automatic subject recognition of the titles included. Whenever necessary, editing, deleting, appending and reindexing of a database can be made in this automatic classification system. Appendix 1 shows the result of the automatic classification of books in the fields of agriculture and medicine. The results of the study are summarized below. 1. The classification number for the title of a book can be automatically generated by using the facet principles of Colon Classification. 2. The automatic subject recognition of a book is achieved by designing a database making use of a globe-principle, and by specifying the subject field for each word. 3. The automatic subject-recognition of input data is achieved by measuring the number of searched words by each subject field. 4. The combination of classification numbers is achieved by flowcharting of classification formular of each subject field. 5. The efficient control of classification numbers is achieved by designing control codes on the database for classification. 6. The automatic classification by means of Auto BC has been proved to be successful in the research library concentrating on a Single field. The general library may have some problem in employing this system. The automatic classification through Auto BC has the following advantages: 1. Speed of the classification process can be improve. 2. The revision or updating of classification schemes can be facilitated. 3. Multiple concepts can be expressed in a single classification code. 4. The consistency of classification can be achieved with the classification formular rather than the classifier's subjective judgement. 5. A user's retrieving process can be made after combining the classification numbers through keywords relating to the material to be searched. 6. The materials can be classified by a librarian without subject backgrounds. 7. The large body of materials can be quickly classified by means of a machine processing. 8. This automatic classification is expected to make a good contribution to design of the total system for library operations. 9. The information flow among libraries can be promoted owing to the use of the same program for the automatic classification.

  • PDF

Subject Independent Classification of Implicit Intention Based on EEG Signals

  • Oh, Sang-Hoon
    • International Journal of Contents
    • /
    • 제12권3호
    • /
    • pp.12-16
    • /
    • 2016
  • Brain computer interfaces (BCI) usually have focused on classifying the explicitly-expressed intentions of humans. In contrast, implicit intentions should be considered to develop more intelligent systems. However, classifying implicit intention is more difficult than explicit intentions, and the difficulty severely increases for subject independent classification. In this paper, we address the subject independent classification of implicit intention based on electroencephalography (EEG) signals. Among many machine learning models, we use the support vector machine (SVM) with radial basis kernel functions to classify the EEG signals. The Fisher scores are evaluated after extracting the gamma, beta, alpha and theta band powers of the EEG signals from thirty electrodes. Since a more discriminant feature has a larger Fisher score value, the band powers of the EEG signals are presented to SVM based on the Fisher score. By training the SVM with 1-out of-9 validation, the best classification accuracy is approximately 65% with gamma and theta components.

인터넷 서점의 주제별 분류체계 설계에 관한 연구 (A Study on a Design of Subject Classification Schemes for Internet Bookstores)

  • 정연경
    • 한국문헌정보학회지
    • /
    • 제35권3호
    • /
    • pp.17-34
    • /
    • 2001
  • 인터넷 서점에서 이용자를 위한 정보자료의 효율적인 조직화는 매우 중요하다. 그러므로 주제접근을 용이하게 하고 검색 효율성을 높이는 도구로서 분류체계에 대한 관심을 가져야할 시점이다. 본 연구에서는 국내외 인터넷 서점의 분류체계의 대분류 항목 및 접근 방법을 구조적 측면에서 조사하고 이에 대한 비교 분석을 통해 인터넷 서점에서 보다 효과적인 주제별 분류체계 설계 방안에 관해 살펴보았다. 이를 위하여 현재 국내외에서 활발하게 운영 중인 인터넷 서점 9개를 선정하여 주제별 분류의 측면에 중점을 두고 조사 분석하였다. 끝으로 본 연구 결과를 바탕으로 이용자 중심의 효과적인 주제별 검색 기능을 제공할 수 있는 인터넷 서점의 효과적인 주제별 분류체계의 모형을 제안하였다.

  • PDF

주제어기반 분류의 분류론적 개념 정립 및 발전 방안 - 발전과정 및 기능 분석을 통하여 - (Subject Based Classification: Conceptualization and the Development Plan as a Classificatory System)

  • 백지원
    • 한국비블리아학회지
    • /
    • 제23권4호
    • /
    • pp.5-24
    • /
    • 2012
  • 본 연구는 주제어기반 분류의 발전 과정 및 현황을 종합적으로 분석하고 그 기능과 유형을 명확히 함으로써 주제어기반 분류의 분류론적 개념을 정립하고, 향후 분류체계로써의 정착 및 발전을 위한 제안을 하고자 하는 목적을 가지고 있다. 이를 위하여 본 연구는 1937년부터 현재에 이르기까지 발표된 주제어기반 분류의 필요성에 대한 논의를 수집하여 분석하고, 주제어기반 분류에 해당하는 다양한 사례를 수집하여 그 명칭과 유형을 분석하였다. 또한 분류로써의 주요 기능 수행력을 기존의 문헌분류와 비교하고, 분류와 주제명표목과의 비교 분석을 통해 지식조직체계로써의 기능과 특성을 밝히고자 하였다. 이러한 분석의 결과, 주제어기반 분류는 구체적인 기능 정의, 유형, 사용되는 정보환경, 지식조직체계간의 관계성 등을 면밀히 고려함으로써 그 분류론적 개념과 기능을 명확히 정의할 수 있음을 밝혔고, 향후 분류체계로써의 정착과 발전을 위한 발전방안을 제시하였다.

이용자 중심의 주제어 기반 분류를 위한 주제명 개발에 관한 연구: 지식조직체계 분석을 바탕으로 (A Study on Construction of Subject Headings for the Word Based Classification)

  • 백지원
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.171-193
    • /
    • 2011
  • 본 연구는 도서관 장서의 분류를 위하여 기존의 문헌 분류체계 대신 주제어 기반의 분류를 적용하고자 할 때 필수적인 주제명 개발의 필요성을 논하고, 개발 방법론의 하나로 기존의 다양한 지식조직체계의 주제어를 활용하는 방법의 가능성을 모색하는데 목적이 있다. 이를 위하여 분석 대상 저작을 선정하고 이에 대하여 부여된 문헌분류, 주제명표목, 국내외 대형 서점의 분류, 서가명 및 주제어, 이용자 태그 등 다양한 지식조직체계의 주제어를 수집하여 그 특성을 비교 분석하였다. 이러한 분석의 결과, 전통적인 도서관 중심의 지식조직체계와 상업성이 중심이 되는 지식조직체계의 성격과 범주화의 방식이 다름을 확인할 수 있었다. 한편, 이용자 태그는 최상위 빈도수의 태그인 경우 전통적인 지식조직체계 및 상업적 영역의 지식조직체계와 어휘의 측면에서 거의 차이가 없는 결과를 나타냈으나, 이용자 중심의 주제어로서 독특한 특성을 가지고 있음을 파악하였다. 이러한 분석을 바탕으로 분류를 대체하는 주제명 작성을 위해 기존의 지식조직체계를 활용할 때 고려해야 할 각각의 특성 및 상호 관계를 분석하였고, 국내에서의 적용을 위한 실질적인 고려사항을 제안하였다.

한의학 고문헌의 주제 분류와 자료적 특성 - 한의학 지식정보자원 웹서비스를 중심으로 - (Subject Classification and the Characteristics of Old Oriental Medicine Literature Focused on Web services of Oriental medicine knowledge and information resources)

  • 이정화
    • 한국의사학회지
    • /
    • 제19권1호
    • /
    • pp.65-76
    • /
    • 2006
  • The present study examined subject classification and the characteristics of old Oriental medicine literature focused on Web services of Oriental medicine knowledge and information resources. For this, we reviewed how subject classification is applied to Oriental medicine in the codified literature classification table and, based on the results, examined how the classification system is used in libraries. Second, subject classification and the characteristics of old Oriental medicine literature were studied focused on Web services of Oriental medicine knowledge and information resources, and related problems and solutions were suggested.

  • PDF

BERT 모형을 이용한 주제명 자동 분류 연구 (A Study on Automatic Classification of Subject Headings Using BERT Model)

  • 이용구
    • 한국문헌정보학회지
    • /
    • 제57권2호
    • /
    • pp.435-452
    • /
    • 2023
  • 이 연구는 딥러닝 기법의 전이학습 모형인 BERT를 이용하여 주제명의 자동 분류를 실험하고 그 성능을 평가하였으며, 더 나아가 주제명이 부여된 KDC 분류체계와 주제명의 범주 유형에 따른 성능을 분석하였다. 실험 데이터는 국가서지를 이용하여 주제명의 부여 횟수에 따라 6개의 데이터셋을 구축하고 분류 자질로 서명을 이용하였다. 그 결과, 분류 성능으로 3,506개의 주제명이 포함된 데이터셋(레코드 1,539,076건)에서 마이크로 F1과 매크로 F1 척도가 각각 0.6059와 0.5626 값을 보였다. 또한 KDC 분류체계에 따른 분류 성능은 총류, 자연과학, 기술과학, 그리고 언어 분야에서 좋은 성능을 보이며 종교와 예술 분야는 낮은 성능을 보였다. 주제명의 범주 유형에 따른 성능은 '식물', '법률명', '상품명'이 높은 성능을 보인 반면, '국보/보물' 유형의 주제명에서 낮은 성능을 보였다. 다수의 주제명을 포함하는 데이터셋으로 갈수록 분류기가 주제명을 제대로 부여하지 못하는 비율이 늘어나 최종 성능의 하락을 가져오기 때문에, 저빈도 주제명에 대한 분류 성능을 높이기 위한 개선방안이 필요하다.

Comparison of graph clustering methods for analyzing the mathematical subject classification codes

  • Choi, Kwangju;Lee, June-Yub;Kim, Younjin;Lee, Donghwan
    • Communications for Statistical Applications and Methods
    • /
    • 제27권5호
    • /
    • pp.569-578
    • /
    • 2020
  • Various graph clustering methods have been introduced to identify communities in social or biological networks. This paper studies the entropy-based and the Markov chain-based methods in clustering the undirected graph. We examine the performance of two clustering methods with conventional methods based on quality measures of clustering. For the real applications, we collect the mathematical subject classification (MSC) codes of research papers from published mathematical databases and construct the weighted code-to-document matrix for applying graph clustering methods. We pursue to group MSC codes into the same cluster if the corresponding MSC codes appear in many papers simultaneously. We compare the MSC clustering results based on the several assessment measures and conclude that the Markov chain-based method is suitable for clustering the MSC codes.

분류목록의 추리성에 관한 연구 (A STUDY OF INFERENCE IN CLASSIFIED CATALOGUE)

  • 유소영
    • 한국문헌정보학회지
    • /
    • 제14권
    • /
    • pp.3-18
    • /
    • 1987
  • The factors which can help the library users trace the specific subject that she or he needs are most important, when they are not sure of what they need exactly in front of a classified catalogue. This study is about what the factors are and how the factors affect the inference of users' reasoning structure. Since the classified catalogues are reflected by the classification structure, naturally the logic in the classification system becomes the focus of the study. This study concludes the classification system which enables the library users to use their reasoning capabilities, viz. the classification system which can help the users trace the specific subject even as they are not sure of the exact subject they need has following factors in the system. 1. It should have the validity based on the facts in the components of the classification system. 2. It should be logically arranged when the components of the classification system are placed in due sequence. 3. The notation of the system should be based on mnemonics. The reason is that the indispensable factors in the formation of inference of human reasoning structure are: 1. the premises which are based on the facts and 2. the logical relationship between the premises and conclusions which are induced from the premises.

  • PDF