• 제목/요약/키워드: Citation Performance

검색결과 105건 처리시간 0.023초

인용 필드 정규화와 타입이 인용매칭에 미치는 영향 (Influence of Normalization and Types of Citation Fields on Citation Matching)

  • 구희관;정한민;성원경
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.395-403
    • /
    • 2008
  • 본 논문은 인용필드의 정규화와 타입이 인용매칭에 미치는 영향에 대한 분석을 제시한다. 인용매칭은 같은 논문을 참조하는 인용레코드를 군집화하는 일련의 과정을 지칭한다. 인용매칭은 인용레코드를 구성하고 있는 인용필드들 간의 비교 결과들을 조합하여 인용레코드의 일치 여부를 판별하는 것이다. 인용매칭 단계 내의 인용필드 간 비교를 위하여 인용필드 정규화 및 인용필드 타입에 대한 연구가 필요하였으나, 인용매칭 방법에 대한 연구에 비해 상대적으로 미흡하였다. 본 연구에서는 인용매칭 성능이 인용필드의 정규화 및 인용필드 타입에 따라 달라진다는 것을 보였다. 추가적으로, 정규화를 적용한 다중 필드 결합을 이용한 인용매칭 성능을 분석하였다. 실험결과에 의하면, 인용필드는 정규화를 통하여 전반적인 성능향상이 있었으며, 인용필드 타입에 따라 성능 양상이 다르게 나타났다.

어휘 자질 기반 기계 학습을 사용한 한국어 암묵 인용문 인식 (Recognition of Korean Implicit Citation Sentences Using Machine Learning with Lexical Features)

  • 강인수
    • 한국산학기술학회논문지
    • /
    • 제16권8호
    • /
    • pp.5565-5570
    • /
    • 2015
  • 암묵인용문 인식은 학술문헌의 본문 텍스트 내에서 명시적 인용표지가 누락된 인용문장을 자동 인식하는 것으로 인용 기반 논문 검색 및 요약의 핵심 기술이다. 기존 암묵인용문 인식의 최신 연구들은 단어 ngram, 단서어구, 명시인용문과의 거리, 기존 연구자의 성, 기존 방법의 명칭 등 다양한 자질을 활용하여 50% 이상 인식 수준을 보고하고 있다. 그러나 대부분의 기존 연구들은 영어에 대해 수행되었으며 한국어의 경우 최근 긍정/부정 단서어구 패턴을 활용한 규칙 기반 시도에서 42% 성능 수준이 보고되어 있어 추가 성능 향상이 요구되는 상황이다. 이 연구에서는 한국어 어휘 자질을 사용하여 한국어 암묵인용문의 기계학습 기반 인식을 시도하였다. 이를 위해 어절, 형태소, 음절 단위에 기반한 다양한 크기의 어휘 ngram 자질들의 인식 성능을 비교 평가하고 한국어 암묵인용문 인식에 적합한 어휘 자질로 형태소 1gram 및 음절 2gram 단위를 결정하였다. 또한 이들 어휘 자질들을 전후 명시인용문들과의 인접성을 표현한 위치 자질들과 결합하여 한국어 암묵인용문 인식 성능을 50% 이상 수준으로 대폭 향상시켰다.

Analysis of Academic Evaluation Indicators Based on Citation Quality

  • Zhang, Mingyue;Shi, Jin;Wang, Jin;Liu, Chang
    • Journal of Information Processing Systems
    • /
    • 제14권4호
    • /
    • pp.916-925
    • /
    • 2018
  • The academic research performance is often quantitatively measured by means of using citation frequency. The citation frequency-based indicators, such as h-index and impact factor, are commonly used reflecting the citation quality to some extent. However, these frequency-based indicators are usually carried out based on the assumption that all citations are equal. This may lead to biased evaluations in that, the attributes of the citing objects and cited objects are significant. A high-accuracy evaluation method is needed. In this paper, we review various citation quality-based evaluation indicators, and categorize them considering the algorithms being applied. We discuss the pros and cons of these indicators, and compare them from four dimensions. The outcomes will be useful for our further research on distinguishing citation quality.

인용 지표를 이용한 재순위화 및 질의 확장의 성능 평가 - 인용색인 데이터베이스를 기반으로 - (Performance Evaluation of Re-ranking and Query Expansion for Citation Metrics: Based on Citation Index Databases)

  • 이혜경;이용구
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.249-277
    • /
    • 2023
  • 본 연구의 목적은 인용 지표가 인용 색인 데이터베이스의 검색성능 향상에 기여할 가능성을 파악하는 데에 있다. 이를 위하여 본 연구는 문헌정보학 분야 10개의 질의를 Web of Science에서 검색하여 수집한 3,467건의 문헌과 2000년부터 2021년까지 SSCI 문헌정보학 분야 저널 85종에 수록된 60,734건의 문헌을 기반으로 적합성 판단을 거쳐, 검색 결과의 상위 100순위에 대한 성능 및 검색 방식과 인용 지표를 활용한 재순위화, 그리고 벡터 공간모형 검색시스템 구축 등에 따른 질의 확장 실험을 수행하였다. 그 결과 첫째, 인용 지표를 단독으로 사용한 재순위화의 성능은 Web of Science의 검색성능과 상이하였으며, 인용 지표는 Web of Science 기존 시스템에 적용되지 않는 독립적인 지표로 작용하고 있었다. 둘째, 고유 질의어 수에 질의어의 총 출현 빈도를 조합하고 인용수를 보조적으로 사용했을 때, 성능에 긍정적인 영향을 미칠 것으로 확인하였다. 셋째, 질의 확장에서는 전반적으로 벡터 공간모형 기반 검색시스템의 기본 성능 대비 성능이 향상되었다. 넷째, 이용자 적합성을 통해 질의 확장을 적용한 경우가 시스템 적합성을 적용한 경우보다 성능이 향상 되었다. 다섯째, 피인용 수를 적합 문헌과 더불어 사용하면 최상위권 내 적합 문헌에서의 순위 변동 가능성을 보여주었다.

Bibliometric Approach to Research Assessment: Publication Count, Citation Count, & Author Rank

  • Yang, Kiduk;Lee, Jongwook
    • Journal of Information Science Theory and Practice
    • /
    • 제1권1호
    • /
    • pp.27-41
    • /
    • 2013
  • We investigated how bibliometric indicators such as publication count and citation count affect the assessment of research performance by computing various bibliometric scores of the works of Korean LIS faculty members and comparing the rankings by those scores. For the study data, we used the publication and citation data of 159 tenure-track faculty members of Library and Information Science departments in 34 Korean universities. The study results showed correlation between publication count and citation count for authors with many publications but the opposite evidence for authors with few publications. The study results suggest that as authors publish more and more work, citations to their work tend to increase along with publication count. However, for junior faculty members who have not yet accumulated enough publications, citations to their work are of great importance in assessing their research performance. The study data also showed that there are marked differences in the magnitude of citations between papers published in Korean journals and papers published in international journals.

동시인용정보를 이용한 동명이인 저자의 중의성 해소 (Disambiguation of Author Names Using Co-citation)

  • 강인수
    • 정보관리연구
    • /
    • 제42권3호
    • /
    • pp.167-186
    • /
    • 2011
  • 동시인용은 서로 다른 두 연구가 이후의 새로운 연구에서 동시 인용되는 것이다. 이 연구는 동시인용과 저자식별의 관계를 다룬다. 저자식별은 문헌에 출현한 동명의 저자명들을 실 세계 저자로 식별하는 것이다. 동시인용은, 한 사람의 관련된 연구들이 이후 또 다른 연구들에서 타인 혹은 자신에 의해 동시 인용되는 증거를 수집함으로써, 저자식별의 절차와 성능에 영향을 미칠 수 있다. 이 연구는 구글 스칼라로부터 동시인용을 자동 수집하는 절차를 제시하고 동시인용 정보를 저자식별의 기존 자질들과 효율적으로 결합하는 새로운 군집알고리즘을 제안한다. 실험을 통해 동시인용이 저자식별에 미치는 긍정적 효과를 확인하였다.

피인용 특성 분석을 통한 출연(연) 임무중심형 기관평가의 질적 성과평가 개선 방향 (Developments of Evaluation System for Qualitative Performance Measurement in Government-Supported Research Institute by Article Citation Method)

  • 이문영;이찬구
    • 기술혁신학회지
    • /
    • 제19권4호
    • /
    • pp.768-798
    • /
    • 2016
  • 본 연구는 과학기술계 정부출연 연구기관 평가에서 논문의 질적 평가를 위해 새로 도입된 피인용도 지표가 성과지표의 구성요건 중 적시성을 충족할 수 있는가라는 문제의식에서 출발하였다. 이에 피인용 반감기와 즉시성 지수 등 논문의 주기적 특성을 분석 활용하여 실질적인 질적 성과체계로 전환하기 위한 기관평가의 개선방향을 제시하고자 한다. 연구 결과는 기술의 발달과 의존성이 높아짐에 따라 학문의 변화속도 또한 빠르게 변화하고 있으나, 공공기술은 타 분야에 비해 인용속도가 느리고, 산업과 연관된 분야는 지식이전 속도가 빠른 것으로 분석되고 있다. 또한, 학문분야 특성에 따른 피인용 주기는 차이가 없었으며, 각 분야의 질적으로 우수한 논문의 평가 시 피인용 지수의 타당성을 확보하기 위해서는 6년 정도의 기간이 누적된 데이터가 필요한 것으로 분석되었다. 분야별 질적 성과평가를 위해 필요한 피인용의 시간적 특성을 기술통계적으로 도출한 결과를 반영하여 임무중심형 연구기관 평가의 문제점을 도출하였다. 이를 개선하기 위한 객관적이고 타당한 질적 평가를 위한 정책적 개선방향을 제시하였다.

학술논문 품질평가를 위한 다방면 인용분석방식 (Multi-faceted Citation Analysis for Quality Assessment of Scholarly Publications)

  • 양기덕;로크만 메호
    • 정보관리학회지
    • /
    • 제28권2호
    • /
    • pp.79-96
    • /
    • 2011
  • 인용분석은 학자들의 연구실적 평가에 가장 많이 사용되는 방법 중 하나이지만 비평가들은 오늘날의 인용분석 자료와 방법론에 근본적인 문제가 있다고 주장한다. 전통적 인용분석 방식은 인용품질과 인용소음뿐만 아니라 언어, 시간, 문화와 같은 비수치적인 요소들을 고려하지 않아 단순하고 그릇된 평가를 가져올 수 있으며, 적용 범위가 각각 다르고 불완전한 인용 데이터베이스들은 충돌적인 인용분석결과를 초래하기 쉬울 수 있다. 이러한 문제들을 해결하려면 포괄적인 인용데이터를 다 방면과 다 방식으로 분석하는 새로운 인용분석연구가 필요하다. 본 논문은 Web of Science, Scopus와 Google Scholar를 비교 분석한 연구의 결과를 논의하며 기존의 인용분석 방법의 약점을 극복하기 위해 설계한 CiteSearch라는 프로토타입 시스템을 간략하게 설명한다.

자기 인용 네트워크와 인용 정체성을 이용한 연구자의 연구 이력 분석에 관한 연구 (Exploring a Researcher's Personal Research History through Self-Citation Network and Citation Identity)

  • 이재윤
    • 정보관리학회지
    • /
    • 제29권1호
    • /
    • pp.157-174
    • /
    • 2012
  • 이 연구에서는 연구자의 연구 이력을 분석하기 위해서 White(2000)가 제안한 인용 정체성과 Hellsten 등(2007)이 제안한 자기 인용 네트워크의 두 가지 최신 기법을 비교해보았다. 국내 대표적인 정보학자인 정영미의 연구 성과물을 대상으로 실험적인 분석을 수행해본 결과 두 기법에서 구분한 연구 시기가 동일하게 나뉘었으며 주요 연구 주제도 유사하게 파악되었다. 그러나 인용 정체성 지도에서는 주제영역별로 영향받은 주요 저자를 파악할 수 있는 반면에 자기 인용 네트워크에서는 시기별 핵심 문헌과 선도문헌이 식별되었다. 따라서 이 두 가지 기법을 상호보완적으로 사용할 때 연구자의 연구 이력에 대해서 풍부한 정보를 획득할 수 있다는 결론을 얻었다.

Publication Metrics and Subject Categories of Biomechanics Journals

  • Duane Victor Knudson
    • Journal of Information Science Theory and Practice
    • /
    • 제11권4호
    • /
    • pp.40-50
    • /
    • 2023
  • Research in interdisciplinary fields like biomechanics is published in a variety of journals whose visibility depends on bibliometric indexing that is often driven by citation analysis of bibliometric databases. This study documented variation in publication metrics and research subject categories assigned to 14 biomechanics journals. Authors, citation, and citation rate (CR) were collected for the top 15 cited articles in the journals retrieved from the Google Scholar service. Research subject categories were also extracted for journals from three databases (Dimensions, Journal Citation Reports, and Scopus). Despite the focus on biomechanics for the journals studied, these biomechanics journals have widely varying CR and subject categories assigned to them. There were significant (p=0.001) and meaningful (77-108%) differences in median CR between average, low, and high CR groups of these biomechanics journals. Since CR are primary data used to calculate most journal metrics and there is no one biomechanics subject category, field normalization for journal citation metrics in biomechanics is difficult. Care must be taken to accurately interpret most citation metrics of biomechanics journals as biased proxies of general usage of research, given a specific database, time frame, and area of biomechanics research.