• 제목/요약/키워드: 키워드동시출현단어분석

검색결과 56건 처리시간 0.027초

동시출현단어 분석에 기반한 메타데이터 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Metadata Research by Using Co-word Analysis)

  • 최예진;정연경
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.63-83
    • /
    • 2016
  • 다양한 매체와 유형으로 생산되는 정보자원에 대한 이용이 높아짐에 따라, 정보자원을 기술하기 위한 정보조직의 도구로서 메타데이터에 대한 중요성이 높아지고 있다. 본 연구에서는 메타데이터 분야의 연구 영역을 파악할 수 있도록 동시출현단어 분석을 사용하여 메타데이터 분야의 지적 구조를 규명하고자 하였다. 이를 위하여 1998년 1월 1일부터 2016년 7월 8일까지 Web of Science 핵심컬렉션에 등재된 저널에 게재된 문헌을 대상으로 'metadata'라는 질의어로 Topic 검색을 수행하여, 총 727건의 논문에 대한 서지정보를 수집하였다. 이 중 저자 키워드를 가진 410건의 논문의 저자 키워드로 수집하고, 전처리 과정을 거쳐 저자 키워드 총 1,137개를 추출하여 최종적으로 빈도수 6회 이상의 키워드 37개를 분석대상으로 선정하였다. 이후 메타데이터 분야의 지적구조 규명을 위해 첫째, 네트워크 분석을 통하여 2개 영역 9개 군집을 도출하였으며, 메타데이터 분야 키워드들의 지적 관계를 시각화하고, 중심성 분석을 통한 전역 중심 키워드와 지역 중심이 높은 키워드를 제시하였다. 둘째, 군집분석을 실시하여 형성된 6개의 군집을 다차원축적지도상에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 메타데이터 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 향후 메타데이터 관련 교육과 연구의 방향성 모색에 유용하게 사용될 수 있을 것이다.

메타버스 관련 국내외 연구동향 분석 (An Analysis of Domestic and International Research Trends on Metaverse)

  • 김현정
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.351-379
    • /
    • 2023
  • 본 연구는 국내외 메타버스 관련 연구의 동향을 파악하기 위해 한국학술지인용색인(KCI)과 Web of Science(WoS), 그리고 Web of Science - CPCI(Conference Proceeding Citation Index)에서 메타버스를 검색어로 입력하여 KCI에서 913편, WoS에서 232편, WoS-CPCI에서 277편의 논문을 수집하였고, 각각 2,644개, 885개, 787개의 저자 키워드를 추출하여 동시출현단어 분석을 수행하였다. 정량분석을 통해 메타버스 관련 연구가 최근 들어 양적으로 폭증하였고, 국내에서 는 학제간연구, 컴퓨터학, 교육학 등의 주제분야에서 주로 연구되고 있으며, WoS에서는 경영·경제 분야에서, WoS-CPCI 에서는 컴퓨터공학 분야에서 주로 연구되고 있음을 알 수 있었다. 키워드 네트워크 분석에서는 모든 데이터베이스에서 Virtual Reality, Augmented Reality 등 메타버스의 기술적 측면과 관련된 용어들의 전역중심성이 공통적으로 높게 나타났으며 군집분석을 통해 국내에서는 교육 관련 연구와 메타버스 플랫폼에 관한 키워드의 군집이 포함되고, WoS에서는 계량서지학적 분석과 관련된 키워드 군집이 생성되었으며, WoS-CPCI는 주로 메타버스의 기술적 측면에 대한 키워드 군집이 주로 나타났다.

동시출현단어 분석을 이용한 보조공학 저널의 지적구조 분석 (An Analysis of the Intellectual Structure of Assistive Technology Journal Using Co-Word Analysis)

  • 양현규
    • 재활복지공학회논문지
    • /
    • 제11권1호
    • /
    • pp.15-20
    • /
    • 2017
  • 본 연구의 목적은 키워드에 대한 동시출현단어 분석을 사용하여 RESNA의 보조공학 저널의 연구 동향을 반영하는 지적구조를 파악하고 연구주제 영역의 구성을 제시하는데 있다. 이를 위해 Web of Science에서 2003년부터 2015년까지 보조공학 저널에 게재된 논문, 총 255편의 문헌을 수집하였고, 1,359개의 저자 키워드를 추출하였다. 보조공학 저널의 지적구조를 분석하기 위해 첫째, 군집분석을 실시하고 군집 5개를 결정하였다. 둘째, 다차원척도 지도에 군집 5개를 표시하고 지적구조를 제시하였다. 분석 결과는 지금까지의 보조공학 연구영역을 가늠하고, 향후 연구의 방향성을 탐색하는데 도움이 될 것으로 기대한다.

동시출현 단어 분석을 통한 지식 구조의 파악 : 인공지능 분야를 대상으로 (Exploration of Intellectual Structure of Artificial Intelligence Field Using Co-word Analysis)

  • 이미경;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.245-251
    • /
    • 2003
  • 이 연구에서는 통제된 색인어를 이용하여 파악한 지식 구조와 통제되지 않은 키워드를 이용한 지식 구조를 비교하여 두 구조가 어떤 차이점을 보이는지를 살펴보았다. 또한 색인효과가 어떻게 나타나는지, 비통제어를 사용한 경우가 실제적으로 더 상세한 하위 영역을 표현하는지를 확인하고자 하였다. 실험 결과 통제된 색인어인 주제명표목을 사용한 영역지도와 비통제 색인어인 키워드를 사용한 영역지도 둘 다 인공지능 분야의 주요 분야들을 비슷하게 나타냈지만, 주제명표목을 사용한 경우에 색인효과가 일부 나타났다. 그리고 대체적으로 주제명표목에 기반한 영역지도보다는 키워드에 기반한 영역지도가 더 상세하게 나타났다.

  • PDF

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

동시출현단어 분석을 활용한 오픈액세스 분야의 지적구조 분석: 2013년부터 2018년까지 출판된 문헌정보학 저널을 기반으로 (Domain Analysis on the Field of Open Access by Co-Word Analysis: Based on Published Journals of Library and Information Science during 2013 to 2018)

  • 김선겸;김완종;서태설;최현진
    • 한국도서관정보학회지
    • /
    • 제50권1호
    • /
    • pp.333-356
    • /
    • 2019
  • 기존 상업 출판사 중심의 학술 커뮤니케이션 체제가 가져온 위기를 해소할 수 있는 대안으로 오픈액세스가 등장하였다. 본 연구는 계량정보분석 기법 가운데 하나인 동시출현단어 분석을 활용하여 오픈액세스 분야의 최신 연구 경향을 반영하는 지적구조를 제시하고 주제영역이 어떻게 구성되었는지 확인하는 것을 주된 목적으로 두며, 기존에 수행되었던 오픈액세스 지적구조 분석 연구와 비교분석하였다. 이를 위해 Web of Science로부터 오픈액세스 관련 키워드 검색을 통하여 2013년 1월 1일부터 2018년 11월 31일까지 출판된 문헌정보학 분야 논문 총 761편을 수집하였으며, 이들 논문 가운데 제목과 초록으로부터 명사구 형태의 키워드 총 2,321개를 추출하였다. 오픈액세스 지적구조 분석을 위해 네트워크 분석을 통하여 13개의 세부 주제영역이 추출되었으며, 지적관계를 시각화하여 전역 및 지역 중심성이 높은 키워드를 도출하였다. 또한 군집분석을 실시하고 이 결과를 다차원축적지도에 표시하여 키워드들과의 상관관계를 분석하였다. 이를 통해 앞으로 오픈액세스 영역에서의 연구 방향성 모색에 도움이 될 것으로 기대한다.

동시링크를 이용한 웹 문서 클러스터링 실험 (Clustering of Web Document Exploiting with the Co-link in Hypertext)

  • 김영기;이원희;권혁철
    • 한국도서관정보학회지
    • /
    • 제34권2호
    • /
    • pp.233-253
    • /
    • 2003
  • 인간은 지식의 조직을 통해 세계를 이해한다. 정보검색분야에서 연구되고 있는 정보의 조직화에는 분류와 클러스터링이라는 두 가지 유형이 있다. 분류는 미리 정의된 범주에 각 항목을 배정하는 행위인 반면, 클러스터링은 유사하거나 관련된 항목을 집단화함으로써 정보를 조직한다. 인터넷 정보자원의 조직은 웹 문서에 출현하는 단어들에서 키워드를 추출하여 역파일을 작성함으로써 검색에 활용하는 것이 일반적인 방법이다. 그러나 키워드의 출현 위치나 단어빈도를 통한 문서유사도 기법은 사용된 언어가 다르거나 대부분이 앵커텍스트만으로 구성되어 있는 대문페이지처럼 적용하기 어려운 경우가 많다. 이 연구는 계량정보학적 분석 기법 중에서 동시인용 기법을 웹 문서의 하이퍼링크에 적용하여, 웹 문서의 클러스터링 가능성을 실험한다.

  • PDF

동시출현단어 분석을 활용한 비탈면 붕괴 예측 및 분석 연구에 관한 지적구조 분석 (Domain Analysis of Research on Prediction and Analysis of Slope Failure by Co-Word Analysis)

  • 김선겸;김승현
    • 지질공학
    • /
    • 제31권3호
    • /
    • pp.307-319
    • /
    • 2021
  • 최근 드론 및 빅데이터, 인공지능 등 디지털 기술을 활용한 비탈면 연구를 수행하고 있으나 다소 미흡한 실정이며, 여전히 비탈면 붕괴 대비에 취약하다. 이러한 이유로 비탈면 붕괴에 효과적으로 대처하기 위해 디지털 기술을 활용한 비탈면 붕괴 예측 및 분석 연구에 대한 발전방향을 제시하는 것이 필연적이며, 이를 위해 비탈면 붕괴 예측 및 분석에 관한 이해가 선제되어야 한다. 본 연구는 비탈면 붕괴 예측 및 분석 연구의 지적구조를 규명하여 연구방향을 제시하기 위해 2016년 1월 1일부터 2020년 12월 31일까지의 5년간의 Web of Science 기반으로 문헌 데이터를 수집하고 이를 동시출현단어를 활용하여 분석하였다. 네트워크 분석을 통하여 세부 주제 영역을 밝히고, 키워드 간의 지적 관계를 시각화하여 관계, 중심성 분석을 통한 전역 및 지역 중심성이 높은 키워드를 도출하였다. 또한 군집분석을 실시하여 형성된 군집을 다차원축적지도에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 비탈면 붕괴 분석 및 예측 연구의 지적구조를 밝히고, 향후 연구 방향을 찾는데 도움이 될 것으로 기대한다.

빅데이터 기반한 미세플라스틱 지적네트워크 분석 (Microplastics Intellectual Network Analysis based on Bigdata)

  • 김영희;장관종
    • 융합정보논문지
    • /
    • 제12권4호
    • /
    • pp.239-259
    • /
    • 2022
  • 2019년 이후부터 전 세계적으로 미세플라스틱(Microplastics)에 관한 연구가 활발하게 진행되고 있어 국내·외 미세플라스틱 연구에 대한 차이점을 분석하는 것은 국내연구 방향 수립에 이정표가 될 수 있다. 본 연구에서는 KCI와 WoS에서 미세플라스틱 논문들을 발췌하여 저자 키워드동시출현단어분석, 논문동시인용분석, 저자동시인용분석 등 빅데이터를 기반으로 한 네트워크 분석방법론으로 국내외 연구 차이점을 분석했다. 분석결과, 연구주제 분석은 인간의 생체에 영향을 미칠 수 있는 연구와 일상에서의 미세플라스틱의 처리에 관한 연구가 국내에서 추가로 필요함을 확인하였다. 연구 품질을 살펴보는 논문 인용 깊이 분석에서는 국외 2.25와 국내 1.39로 국내가 아직 부족함을 보였고, 다양한 연구자들이 참여하고 정보를 공유하는 공동연구전선 구성형태 분석은 국내는 22개 군집 중에서는 3개가 Star형 구조가 있고, 국외의 경우는 19개 군집 모두가 Mesh 구조로 되어 있어 국내는 특정 연구 분야에서는 정보의 흐름과 공유가 부족함도 확인할 수 있었다. 이런 연구 결과는 미세플라스틱의 연구주제 확장과 연구 질의 향상, 더불어 다양한 연구자들이 참여하는 연구 추진체계 개선 등이 필요함을 확인하였다. 추가로 주제 모델링(Topic Modeling)을 기반으로 자동화 프로그램 개발을 한다면 실시간 분석이 가능한 시스템 구축도 가능할 것이다.

트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구 (Topic-Network based Topic Shift Detection on Twitter)

  • 진설아;허고은;정유경;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.285-302
    • /
    • 2013
  • 본 연구는 높은 접근성과 간결성으로 인해 방대한 양의 텍스트를 생산하는 트위터 데이터를 분석하여 토픽의 변화 시점 및 패턴을 파악하였다. 먼저 특정 상품명에 관한 키워드를 추출한 후, 동시출현단어분석(Co-word Analysis)을 이용하여 노드와 에지를 통해 토픽과 관련 키워드를 직관적으로 파악 가능한 네트워크로 표현하였다. 이후 네트워크 분석 결과를 검증하기 위해 출현빈도 기반의 시계열 분석과 LDA 토픽 모델링을 실시하였다. 또한 트위터 상의 토픽 변화와 언론 기사 검색결과를 비교한 결과, 트위터는 언론 뉴스에 즉각적으로 반응하며 부정적 이슈를 빠르게 확산시키는 것을 확인하였다. 이를 통해 기업은 대중의 부정적 의견을 신속하게 파악하고 이에 대한 즉각적인 의사결정 및 대응을 위한 도구로 본 연구방법을 활용할 수 있을 것으로 기대된다.