• 제목/요약/키워드: Cited Documents Analysis

검색결과 21건 처리시간 0.024초

효율적인 인용분석을 위한 한국 SCI 시스템의 개발 (Development of a Korea SCI System for Efficient Citation Analysis)

  • 이계준;조현양;최재황;윤희준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.174-182
    • /
    • 2004
  • 정보가 생성되어 소멸되기까지의 과정에서 새로운 정보를 만들어내기 위해서 어떠한 형태로든 서비스되고 있는 정보를 수집하여 이것을 참고하고 인용하여 새로운 정보를 생성하게 된다. 본 논문에서는 인용한 문헌과 인용된 문헌 사이의 관계를 정의하고 관련 정보를 저장하여 서비스에 반영하는 KSCI (Korea Science Citation Index)을 구축하였다. KSCI 시스템은 현재 ISI사에서 서비스하고 있는 SCI(Science Citation Index)가 가지는 문제점인 순환 적인 검색을 해결하기 위하여 패스인코딩(Path Encoding) 색인 기법을 사용하여 본 시스템을 구축함으로서 저장의 측면에서 약 8.98%의 효율과 검색의 측면에서 약 40% 정도의 결과를 얻었다.

인용문헌에 의한 정보검색 효과에 관한 고찰 (A Study on Information Retrieval Effectiveness by Cited References)

  • 이란주
    • 한국문헌정보학회지
    • /
    • 제27권
    • /
    • pp.265-289
    • /
    • 1994
  • Databases publicly available for online searching permit both citation and subject searching, however, subject searching has dominated the online search environment. Despite the power of citation searching, it may be underutilized This study explored the relationship between the number of cited references used in a citation search and information retrieval effectiveness, a relatively unstudied phenomenon. Three articles in the library and information science literature were chosen to represent sample questions. Cited reference searches were conducted for each article and each of its references. All searches were conducted in Social Scisearch and Scisearch on DIALOG. Relevance judgments on the retrieved citations were obtained from the authors of the original articles. This research focused on analyzing, in terms of information retrieval effectiveness, the overlap among postings sets retrieved by various combinations of cited references. The findings from the three case studies clearly showed that the more cited references used for the citation search, the better the performance, in terms of retrieving more relevant documents, up to a point of diminishing retums. In addition, generally the overall level of overlap among relevant documents sets was found to be low. Therefore, if only some of the cited references among many candidates are used for a citation search, a significant proportion of relevant documents may be missed. The analysis of the characteristics of cited references provided the ways to predict which cited refereces would be useful to improve information retrieval. The findings of this comprehensive exploratory study are of interest for both theoretical and practical reasons. They contribute to the development of a theoretical model for the effective use of the citation search. This model might also be implemented in operational online systems. In addition, the findings potentially will help online searchers improve their search strategies using the citation search so that they can better achieve their information retrieval goals: the retrieval of items relevant to a given question and the suppression of nonrelevant items.

  • PDF

주요 4개 공학분야 연구자의 문헌인용 행태 연구 (A Comparative Study on the Citing Behavior of Scholars in Four Major Engineering Fields)

  • 조현양;조현선
    • 정보관리연구
    • /
    • 제36권2호
    • /
    • pp.1-24
    • /
    • 2005
  • 이 연구는 공학분야 가운데 4개 주요 분야에서 발행되는 학회지에 수록된 논문에 대한 인용분석을 실시하여 연구자들이 연구활동 시 이용한 형태별 정보, 평균 인용 건수, 인용된 문헌의 언어, 나이, 그리고 인용된 정보의 반감기에 있어서 분야별로 어떠한 차이가 있는 가를 규명해 보았다. 분석 대상은 1999년, 2001년, 2003년 3년에 걸쳐 기계, 건축, 전기, 전자 등 4개 분야의 학술지 논문 2,333편에 포함된 2만 9,610개의 인용된 문헌이었다. 분석결과 5개 항목 모두에서 분야별로 차이가 있음을 발견하였으며, 이에 근거하여 관련 분야의 장서개발 시 우선순위 및 수집된 장서의 서가배열에 대한 의견을 제안하였다.

패스파인더 네트워크 분석에 의한 ASIST Proceedings 인용흐름 연구 (Citation Flow of the ASIST Proceeding Using Pathfinder Network Analysis)

  • 김희정
    • 정보관리학회지
    • /
    • 제25권2호
    • /
    • pp.157-166
    • /
    • 2008
  • 본 연구에서는 ASIST 프로시딩을 인용한 저널들을 중심으로 패스파인더 네트워크 분석을 수행함으로써, ASIST 프로시딩의 지식이 어떠한 주제영역을 중심으로 네트워크 구조를 형성하고 있는지를 확인하는 데에 그 목적이 있다. 이를 위하여 Scopus 데이터베이스에서 검색한 240개의 문헌을 대상으로 완전연결 클러스터링 기법을 통하여 16개 클러스터를 도출하였으며, MDS 및 패스파인더 네트워크 분석을 통하여 지식 네트워크를 매핑하였다. 지금까지 대부분의 경우 학술지를 대상으로 수행되어 온 네트워크 분석을 프로시딩을 대상으로 분석을 시도하였으며, 분석결과 ASIST 프로시딩은 정보추구행태 및 탐색과 인터페이스, 계량서지학 및 지식관리 주제영역의 논문이 타 문헌에 활발하게 소비되고 있음을 확인할 수 있었다.

경영.경제.무역학분야의 인용문헌 분석에 관한 연구 (A Study on the Citation Document Analysis of Business Administration.Economics.Trade)

  • 정진식;원지욱
    • 한국비블리아학회지
    • /
    • 제20권1호
    • /
    • pp.5-22
    • /
    • 2009
  • 본 연구는 우리나라 경영, 경제, 무역학분야 연구자들의 연구영역과 연구동향을 파악하기 위하여 "경영학연구", "경제학연구", "무역학회지"를 선정하여 2005년부터 2007년까지 3개년동안 이에 게재된 540편의 원 문헌과 22,147건의 인용문헌을 분석하였다. 분석결과 단독보다는 공동연구에 의한 학술교류 커뮤니케이션 활동이 활발하게 진행되고 있으며, 연구자들이 이용하는 문헌의 77% 정도가 출판 된지 10년 이내 정확하게는 8.5년 정도의 문헌을 가장 많이 활용하고 있다. 반감기는 단행본은 국내 10.9년, 국외 11.1년이며, 학술지는 국내 6년, 국외 8.2년으로 국내문헌보다는 국외문헌에서 다소 길게 측정되었다.

기계공학 연구자들의 인용행태 분석 : P대학 기계공학부 박사학위논문을 중심으로 (A Research on Citing Behaviors of Researchers in Mechanical Engineering)

  • 장덕현;장환석
    • 정보관리연구
    • /
    • 제38권3호
    • /
    • pp.111-135
    • /
    • 2007
  • 이 연구는 기계공학 연구자들의 박사학위 진행에 있어서 주로 영향을 미치는 정보원의 종류와 정보원에 대한 선호도를 분석한 계량적 연구이다. 이를 위하여 P대학교의 기계공학과에서 1996년과 2004년에 생산된 박사학위논문을 대상으로 인용분석을 실시하고, 이 양년간의 인용행태 차이를 조사하였다. 그 결과 1)인용문헌의 유형에 있어서는 학술지를 가장 많이 인용하였으며 그 인용비율은 50% 수준으로 다른 유형의 인용문헌에 비해 월등히 높았다. 또한 웹자원의 인용도 점차 증가하는 양상을 보였다. 2) 인용문헌의 언어는 영어가 가장 많은 비중을 차지하였다. 영어와 한국어를 제외하면 일본어 자료가 가장 많았다. 3) 인용문헌의 출판 후 경과시간 분석에서는 가장 최신자료라고 할 수 있는 3년 이하의 자료보다는 4-7년, 8-11년이 경과한 자료들을 더 많이 인용하였다. 반감기 측정 결과, 1996년에는 7.7년 2004년의 7.5년으로 나타났다. 4) 인용문헌 수를 기준으로 한 SCI 등재비율에 있어서는 1996년과 2004년 모두 약 33%의 비슷한 비율로 SCI 등재 학술지를 인용한다는 결과값이 산출되었다.

국내 과학기술 연구자의 한국 학술지 인용패턴 연구 (A Study of Citing Patterns of Korean Scientists on Korean Journals)

  • 최선희;김병규;강무영;류범종;이종욱;박재원
    • 정보관리학회지
    • /
    • 제28권2호
    • /
    • pp.97-115
    • /
    • 2011
  • 국내 과학기술 분야 연구자들의 인용행태를 종합적으로 파악하고 분석하기 위해서는 대규모의 신뢰할 수 있는 인용색인 데이터베이스가 필요하다. KISTI는 한국 과학기술 인용색인 데이터베이스인 KSCD를 구축하고 한국과학기술인용보고서(KJCR) 및 한국과학기술인용색인서비스(KSCI)를 제공하고 있다. 본 논문에서는 국내 핵심 학술지 459종의 학술지를 커버하는 KSCD를 활용하여 국내 과학기술분야 연구자들의 한국 학술지 인용행태를 분석 연구를 수행하였다. 연구 범위로는 첫째, 대상 DB 수록 학술지의 통계적 주요 수치정보를, 둘째, 인용문헌의 형태별 분석을, 셋째, 인용문헌의 국내와 해외비율 및 타분야 인용비율을, 넷째, 국내 인용문헌의 즉시인용, 인용절정기, 반감기를 마지막으로 KJCR 인용지표를 통한 학술지의 영향력 분석이다. 국내학술지 인용분석을 통한 연구의 주요 성과로는 국내 인용 학술지의 즉시인용률(평균 2.36%), 인용절정기(평균 1.7년), 반감기(평균 5.2년)의 규명과 모든 주제분야에서 자기학술지 인용률이 평균 50%를 넘는다는 것을 밝힌 것이다. 본 연구를 통해 국내 과학자들의 국내 학술지 인용행태를 과학기술 전분야에 걸쳐 종합적으로 파악할 수 있었다.

우리나라 토목공학분야 연구자의 인용행태에 관한 연구 (Citing Behaviors of Researchers in Korea Civil Engineering)

  • 남영준;서현정;김규환
    • 정보관리학회지
    • /
    • 제28권4호
    • /
    • pp.201-220
    • /
    • 2011
  • 이 연구에서는 우리나라 토목공학분야 연구자들이 참조하는 정보원의 유형을 인용분석을 통해 조사하였다. 분석 결과는 다음과 같다. 1) 주요 인용정보원은 학술지(55.7%)와 단행본(15.6%)과 회의자료(10.2%) 순이었다. 2) 출판 후 10년 이내(26.1%)의 문헌을 가장 많이 인용하였다. 3) 핵심학술지는 국내학술지였으며, 상위권 핵심학술지 선호도에서도 국내와 국외문헌의 의존도가 유사하였다. 4) 최신자료의 경우 국내문헌을, 출판 이후 경과시간이 오래된 자료의 경우 국외문헌을 선호하였다. 5) 국내외 모든 핵심학술지들이 영향력 지수와 즉시성 지수의 값이 동시에 높게 나타나지 않았다.

자아 중심 주제 인용분석을 활용한 딥러닝 연구동향 분석 (Deep Learning Research Trends Analysis with Ego Centered Topic Citation Analysis)

  • 이재윤
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.7-32
    • /
    • 2017
  • 최근 들어 다양한 분야에서 딥러닝이 혁신적인 기계학습 기법으로 급속하게 확산되고 있다. 이 연구에서는 딥러닝 연구동향을 분석하기 위해서 자아 중심 주제 인용분석 기법을 변형하여 응용해보았다. 이를 위해 Web of Science에서 'deep learning'으로 탐색하여 검색된 문헌 중 소수의 씨앗 문헌으로부터 인용 관계를 통해 분석 대상 문헌을 확보하는 방법을 시도하였다. 씨앗 문헌을 인용하는 최근 논문들을 딥러닝 분야의 현행 연구를 반영하는 자아 문헌집합으로 설정하였다. 자아 문헌으로부터 빈번히 인용된 선행 연구들은 딥러닝 분야의 연구 주제를 나타내는 인용 정체성 문헌집합으로 설정하였다. 자아 문헌집합에 대해서는 공저 네트워크 분석을 비롯한 정량적 분석을 실시하여 주요 국가와 연구 기관을 파악하였다. 인용 정체성 문헌들에 대해서는 동시인용 분석을 실시하고, 도출된 문헌 군집을 인용하는 주요 키워드인 인용 이미지 키워드를 파악하여 주요 문헌과 주요 연구 주제를 밝혀내었다. 마지막으로 특정 주제에 대한 인용 영향력이 성장하는 추세를 반영하는 인용 성장지수 CGI를 제안하고 측정하여 딥러닝 분야의 선도 연구 주제가 변화하는 동향을 밝혔다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.