• Title/Summary/Keyword: 인용필드

Search Result 6, Processing Time 0.02 seconds

Study on the Relation of Field Normalization with Citation Matching (인용 필드 정규화와 인용매칭의 관계 연구)

  • Koo, HeeKwan;Kang, In-Su;Jung, Hanmin;Sung, Won-Kyung
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.69-74
    • /
    • 2008
  • 본 논문은 인용필드 정규화와 인용매칭의 관계에 대한 분석을 제시한다. 인용매칭은 논문에서 수집된 인용레코드의 인용필드들 간의 비교 결과를 조합하여 동일 논문의 참조여부를 판별하여 인용레코드를 군집화한다. 따라서 인용매칭에 성능을 높일 수 있는 인용필드와 인용매칭 성능의 관계에 대한 연구가 필요하다. 본 논문에서는 인용필드 정규화 및 필드 별 결합에 의하여 인용매칭 성능이 변화하는 것을 보였다. 또한, 인용매칭 성능을 인용필드 유사도와의 관점에서 분석하였다. 앞으로, 인용필드 정규화 및 특성이 인용매칭에 미치는 영향에 대한 이해를 넓혀, 이를 인용매칭에 활용할 수 있으리라 여겨진다.

  • PDF

Influence of Normalization and Types of Citation Fields on Citation Matching (인용 필드 정규화와 타입이 인용매칭에 미치는 영향)

  • Koo, Hee-Kwan;Jung, Han-Min;Sung, Won-Kyung
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.11
    • /
    • pp.395-403
    • /
    • 2008
  • In this paper, we present the analysis of the fact that normalization and types of citation fields have an effect to the citation matching. Citation matching indicates the series of grouping process for the citation records referring to the same paper. The citation matching combines the comparison results of citation fields, and determines which citation records are the same. For the citation field comparison in the citation matching phase, studies on the normalization and types of citation fields are needed. But they are relatively insufficient when compared with the studies on citation matching methods. In this research, we showed that the citation matching performance was affected by the normalization and types of citation fields. Additionally, we also analyzed the combination of normalized multiple fields. According to the experimental result, the citation field had the overall performance improvement through a normalization, and the performance mode differently showed up at the citation field type.

Influence of Citation Field Segmentation on Citation Matching for Social Network Construction (사회연계망 구축을 위한 인용 매칭에서의 인용 필드 분해 영향 분석)

  • Koo, HeeKwan;Kang, In-Su;Jung, Hanmin;Lee, Seungwoo;Sung, Won-Kyung
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.194-201
    • /
    • 2007
  • 인용 매칭(Citation Matching, CM)은 동일한 논문을 지칭하는 인용레코드(Citation Record)를 군집화하는 것으로 인용 관계를 가진 사회연계망 구축시 필요한 기술의 하나이다. 인용 매칭의 전단계로써, 인용 레코드를 저자, 논문 제목, 게재지명, 발행연도 등의 필드로 구분하는 인용 필드 분해가 고려될 수 있다. 본 논문은 인용 필드 분해(Citation Field Segmentation, CFS)와 인용 매칭의 상관관계를 분석하고자 한다. 즉, 인용 필드 분해가 인용 매칭에 필수적인 단계인지를 밝히고 개별 인용 필드가 인용 매칭에 미치는 영향을 분석한다. 실험을 통해 인용 필드 분해를 한 인용 매칭(CFS-based CM)이 인용 필드 분해를 적용하지 않은 인용 매칭(CFS-free CM)에 비해 1% 내외의 성능의 차이를 보이므로, 인용매칭의 성능에 크게 영향을 미친다고 보기 어려웠다. 이는 인용 레코드의 서로 다른 필드들 사이에서 어휘 중복 비율이 크게 낮기 때문에 따로 필드를 구별하지 않아도 필드가 구별되는 특성때문이었다.

  • PDF

Evaluating an Influence of Individual Citation Field on Citation Matching (개별 인용 필드의 인용 매칭에 대한 영향력 평가)

  • Koo, HeeKwan;Kang, In-Su;Jung, Hanmin;Lee, Seung-Woo;Sung, Won-Kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.414-417
    • /
    • 2007
  • Citation matching (CM) is a method for clustering citation records that refer to the same paper. Normally, CM is preceded by citation field segmentation (CFS) which divides a citation record into its fields such as author(s), a title, a title of publication, year, etc. Although many studies have attacked CFS and CM, the relationship between CFS and CM was not sufficiently explored. Among many aspects of the effect of CFS on CM, this study concentrates on what citation fields should identify for CM. As its first attempt, we compared CM performances over different sets of citation fields manually segmented, and confirmed that the use of more citation fields help CM to cluster citation records better.

  • PDF

The Research Trends about the Big Data Using Co-word Analysis (동시출현 단어분석을 활용한 빅데이터 관련 연구동향 분석)

  • Kim, Wanjong
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2014.08a
    • /
    • pp.17-20
    • /
    • 2014
  • 본 연구는 동시출현 단어분석 기법을 이용하여 최근 전세계적으로 많은 주목을 받고 있는 빅데이터(Big Data) 관련 연구 동향과 연구 영역을 분석하는 것을 목적으로 한다. 이를 위하여 인용색인데이터베이스인 Web of Science SCIE(Science Citation Index Expanded)에서 분석 대상 논문을 수집하였다. 논문 수집을 위한 검색식은 은 Title(논문 제목), Abstract(초록), Author Keywords(저자 키워드), Keywords $Plus^{(R)}$의 네 가지 필드를 동시에 검색하는 주제어(topic)가 "big data"를 포함하고 있는 논문 563편을 대상으로 동시출현단어 분석을 수행하였다.

  • PDF

A Study on the Enriched Contents of OPACs of Public Libraries in Korea (공공도서관 온라인 목록의 보강된 콘텐츠에 관한 연구)

  • Yoon, Cheong-Ok
    • Journal of Korean Library and Information Science Society
    • /
    • v.50 no.4
    • /
    • pp.181-201
    • /
    • 2019
  • The purpose of this study is to analyze the present state of the enriched contents of OPACs of public libraries in Korea. Examined are the OPACs of 125 public libraries which hold Jeon Du-hwan Hoegorok, and 260 public libraries which hold Banil Jongjokjuui retrieved from KOLIS-NET of the National Library of Korea from Sept. through Oct. 2019. The enriched contents of these controversial books are mostly provided by Naver, Daum, and Aladin Internet Bookstore, and their so-called summaries, reviews, etc. are actually only excerpts supplied by publishers. They are given only as a link to external sources or the whole or partial display in a bibliographic record. Since these enriched contents contain only publishers' promotional statements, but not any objective and professional review, they are not much useful for library users. Therefore, more active participation of librarians in creating or evaluating the enriched contents are proposed, especially for such controversial books.