• 제목/요약/키워드: 인용필드

검색결과 6건 처리시간 0.019초

인용 필드 정규화와 인용매칭의 관계 연구 (Study on the Relation of Field Normalization with Citation Matching)

  • 구희관;강인수;정한민;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-74
    • /
    • 2008
  • 본 논문은 인용필드 정규화와 인용매칭의 관계에 대한 분석을 제시한다. 인용매칭은 논문에서 수집된 인용레코드의 인용필드들 간의 비교 결과를 조합하여 동일 논문의 참조여부를 판별하여 인용레코드를 군집화한다. 따라서 인용매칭에 성능을 높일 수 있는 인용필드와 인용매칭 성능의 관계에 대한 연구가 필요하다. 본 논문에서는 인용필드 정규화 및 필드 별 결합에 의하여 인용매칭 성능이 변화하는 것을 보였다. 또한, 인용매칭 성능을 인용필드 유사도와의 관점에서 분석하였다. 앞으로, 인용필드 정규화 및 특성이 인용매칭에 미치는 영향에 대한 이해를 넓혀, 이를 인용매칭에 활용할 수 있으리라 여겨진다.

  • PDF

인용 필드 정규화와 타입이 인용매칭에 미치는 영향 (Influence of Normalization and Types of Citation Fields on Citation Matching)

  • 구희관;정한민;성원경
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.395-403
    • /
    • 2008
  • 본 논문은 인용필드의 정규화와 타입이 인용매칭에 미치는 영향에 대한 분석을 제시한다. 인용매칭은 같은 논문을 참조하는 인용레코드를 군집화하는 일련의 과정을 지칭한다. 인용매칭은 인용레코드를 구성하고 있는 인용필드들 간의 비교 결과들을 조합하여 인용레코드의 일치 여부를 판별하는 것이다. 인용매칭 단계 내의 인용필드 간 비교를 위하여 인용필드 정규화 및 인용필드 타입에 대한 연구가 필요하였으나, 인용매칭 방법에 대한 연구에 비해 상대적으로 미흡하였다. 본 연구에서는 인용매칭 성능이 인용필드의 정규화 및 인용필드 타입에 따라 달라진다는 것을 보였다. 추가적으로, 정규화를 적용한 다중 필드 결합을 이용한 인용매칭 성능을 분석하였다. 실험결과에 의하면, 인용필드는 정규화를 통하여 전반적인 성능향상이 있었으며, 인용필드 타입에 따라 성능 양상이 다르게 나타났다.

사회연계망 구축을 위한 인용 매칭에서의 인용 필드 분해 영향 분석 (Influence of Citation Field Segmentation on Citation Matching for Social Network Construction)

  • 구희관;강인수;정한민;이승우;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-201
    • /
    • 2007
  • 인용 매칭(Citation Matching, CM)은 동일한 논문을 지칭하는 인용레코드(Citation Record)를 군집화하는 것으로 인용 관계를 가진 사회연계망 구축시 필요한 기술의 하나이다. 인용 매칭의 전단계로써, 인용 레코드를 저자, 논문 제목, 게재지명, 발행연도 등의 필드로 구분하는 인용 필드 분해가 고려될 수 있다. 본 논문은 인용 필드 분해(Citation Field Segmentation, CFS)와 인용 매칭의 상관관계를 분석하고자 한다. 즉, 인용 필드 분해가 인용 매칭에 필수적인 단계인지를 밝히고 개별 인용 필드가 인용 매칭에 미치는 영향을 분석한다. 실험을 통해 인용 필드 분해를 한 인용 매칭(CFS-based CM)이 인용 필드 분해를 적용하지 않은 인용 매칭(CFS-free CM)에 비해 1% 내외의 성능의 차이를 보이므로, 인용매칭의 성능에 크게 영향을 미친다고 보기 어려웠다. 이는 인용 레코드의 서로 다른 필드들 사이에서 어휘 중복 비율이 크게 낮기 때문에 따로 필드를 구별하지 않아도 필드가 구별되는 특성때문이었다.

  • PDF

개별 인용 필드의 인용 매칭에 대한 영향력 평가 (Evaluating an Influence of Individual Citation Field on Citation Matching)

  • 구희관;강인수;정한민;이승우;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.414-417
    • /
    • 2007
  • 인용 매칭(Citation Matching, CM)은 동일한 논문을 지칭하는 인용레코드(Citation Record)를 군집화하는 방법이다. 일반적으로, 저자, 논문제목, 게재지명이나 출판연도 등의 인용 필드로 구분하는 인용 필드 분해가 인용 매칭 보다 선행하게 된다. 상당히 많은 연구가 인용 매칭과 인용 필드 분해의 문제를 해결하고자 했지만, 인용 필드 분해와 인용 매칭과의 상관관계에 대한 연구는 부족하였다. 인용 매칭에 대한 인용 필드 분해의 여러 측면 중에, 본 논문은 인용 매칭에 가장 영향력이 있는 인용 필드를 밝히고자 한다. 첫 번째 시도로, 수작업으로 인용 필드 분해를 수행한 다양한 크기의 인용 필드 집합에 대하여 인용 매칭의 성능을 비교하였고, 그 결과 많은 인용 필드를 사용한 인용 매칭이 인용 레코드를 더 잘 군집화 할 수 있다는 것을 확인하였다.

  • PDF

동시출현 단어분석을 활용한 빅데이터 관련 연구동향 분석 (The Research Trends about the Big Data Using Co-word Analysis)

  • 김완종
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.17-20
    • /
    • 2014
  • 본 연구는 동시출현 단어분석 기법을 이용하여 최근 전세계적으로 많은 주목을 받고 있는 빅데이터(Big Data) 관련 연구 동향과 연구 영역을 분석하는 것을 목적으로 한다. 이를 위하여 인용색인데이터베이스인 Web of Science SCIE(Science Citation Index Expanded)에서 분석 대상 논문을 수집하였다. 논문 수집을 위한 검색식은 은 Title(논문 제목), Abstract(초록), Author Keywords(저자 키워드), Keywords $Plus^{(R)}$의 네 가지 필드를 동시에 검색하는 주제어(topic)가 "big data"를 포함하고 있는 논문 563편을 대상으로 동시출현단어 분석을 수행하였다.

  • PDF

공공도서관 온라인 목록의 보강된 콘텐츠에 관한 연구 (A Study on the Enriched Contents of OPACs of Public Libraries in Korea)

  • 윤정옥
    • 한국도서관정보학회지
    • /
    • 제50권4호
    • /
    • pp.181-201
    • /
    • 2019
  • 이 연구의 목적은 우리나라 공공도서관 OPAC이 제공하는 보강 콘텐츠의 현황 및 내용을 분석하고 도서관의 역할을 검토하는 것이다. 2019년 9월부터 10월 사이 국립중앙도서관의 '국가자료종합목록(KOLIS-NET)'에서 검색한 『전두환 회고록』 소장 125개 공공도서관 및 『반일 종족주의』 소장 260개 공공도서관 OPAC을 조사한 결과, 책 소개, 요약, 서평 등 보강 콘텐츠는 대부분 알라딘 인터넷 서점, 네이버, 다음 등 포털이 제공하였으며, 출판사의 일방적 홍보성 책 소개와 본문 인용만을 포함하였다. 보강 콘텐츠는 서지레코드에서 '외부정보' 등 별도 필드에서 링크 제공, 서지레코드 내에서 직접 전부 혹은 일부 디스플레이, 책 소개를 포함한 여러 보강 콘텐츠를 바로 보여주는 방식 등으로 제공되었다. 그러나 객관적, 전문적 서평 없이, 출판사의 일방적 홍보성 책 소개와 본문 인용에 한정된 보강 콘텐츠는 이용자의 책 이해에 크게 기여하기 어려움에 따라, 사서들의 적극적 평가와 직접적 작성 등 개입이 필요함을 지적하였다.