• 제목/요약/키워드: 단어 동시출현 정보

검색결과 94건 처리시간 0.028초

텍스트 마이닝을 활용한 국내 제약·바이오 업종의 EU 공급망 실사법 대응 방안 연구 (A Study on the Countmeasures of the Korean Pharmaceutical/Bio Industry to the EU Corporate Sustainability Due Diligence Directive, by using Text Mining)

  • 김소리;기준학
    • 경영정보학연구
    • /
    • 제26권1호
    • /
    • pp.93-117
    • /
    • 2024
  • EU는 2022년 2월, 기업 공급망의 환경·인권 리스크 실사 이행 및 정보공시를 의무화하는 EU 기업 지속가능성 실사 지침(EU Corporation Sustainability Due Diligence Directive) 초안을 발표하였다. 추후 해당 지침의 최종안이 확정 및 발효되면 EU 회원국은 2년 내에 이를 자국법으로 제정하여야 한다. 본 연구에서는 EU가 요구하는 공급망 실사 의무 요건에 대한 13개 국내 제약·바이오 기업의 대응 현황을 살펴보고, 환경·인권 영향 관리를 잘하고 있다고 평가받는 13개 글로벌 선진 기업의 대응 현황과 비교 분석하였다. 비교 분석을 위해 R을 활용해 텍스트 마이닝 분석을 수행하였다. 기본적인 단어빈도와 동시출현단어를 분석하였고 Latent Dirichlet Allocation 기법을 적용해 토픽 모델링을 수행하였다. 분석 결과, 선진 기업 대비 국내 제약·바이오 기업은 부정적 이슈의 식별 및 보고 체계와 공급망 실사 이행 프로세스가 미흡하며, 환경·인권 정보공시를 위한 데이터 관리 고도화가 필요한 것으로 나타났다. 또한 국내 제약·바이오 기업은 단순히 자금 지원 등의 수준을 넘어 중소기업 공급망이 가진 리스크를 체계적으로 파악하고, 이를 저감할 수 있는 차별화된 지원방안을 마련하여야 할 것으로 판단된다. 정부 역시 전문가 컨설팅, 재원 지원 등 국내 제약·바이오 기업 공급망 실사 대응 역량 강화를 위한 지원과 함께 우리나라의 독자적인 공급망 환경·인권 관리제도 의무화 시행을 통해 정책적인 뒷받침을 강화할 필요가 있다.

학위논문 분석을 통한 미국 도서관학 및 정보과학 최근 연구 동향에 관한 연구 (A Study on Research Trends of Library Science and Information Science Through Analyzing Subject Headings of Doctoral Dissertations Recently Published in the U.S.)

  • 김현정
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.11-39
    • /
    • 2018
  • 본 연구는 2014년부터 2018년까지 최근 5년간 미국에서 발표된 도서관학 및 정보과학 분야 학위논문의 연구동향을 파악하기 위해 PQDT Global 데이터베이스에 수록된 1,016편의 박사학위 논문을 수집하여 각 논문의 관련 학문 분야를 나타내는 분야명들을 추출하고 네트워크 분석을 통해 분야명 간의 관계와 네트워크 전반에 걸쳐 다른 분야들과 관계가 있는 전역중심성이 높은 분야명을 파악하는 것과 동시에 군집분석을 통해 연관성 높은 분야명들이 어떠한 군집을 형성하는지, 각 군집 안에서 지역중심성이 높은 분야명들은 어떤 것들인지 살펴보았다. 103개 핵심 분야명 키워드를 이용한 네트워크 분석 결과 최근 5년간 미국의 도서관학 및 정보과학 분야 박사학위 논문의 관련 학문분야로는 컴퓨터 관련 분야, 교육 관련 분야, 커뮤니케이션 관련 분야 외에도 다양한 이용자 집단에 관한 연구와 정보시스템 관련 분야 등을 포함하여 26개의 군집을 형성하는 것으로 나타났다. 26개 군집들 중 정보과학을 중심으로 하는 군집에는 컴퓨터 관련 학문 분야명들이 다수 포함되었고, 도서관학을 중심으로 하는 군집에는 대부분 교육 관련 분야명들이 포함되었으며, 그 외에도 이용자 연구와 관련하여 특정 이용자 그룹과 관련된 젠더연구분야나 정보시스템과 관련하여 경영학, 지리학, 의공학 등 다양한 학문 분야와 연관되어 있음을 알 수 있다.

네트워크 분석 논문의 고찰: 계량서지적 분석과 내용분석을 중심으로 (An Investigation on the Network Analysis Papers by Content Analysis and Bibliometric Analysis)

  • 정은경
    • 정보관리학회지
    • /
    • 제38권1호
    • /
    • pp.169-190
    • /
    • 2021
  • 네트워크 분석 기법을 활용한 연구가 다양한 학문 분야에서 수행되고 있다. 본 연구는 2003년부터 2021년까지 국내 학술지에 게재된 네트워크 분석 논문 총 2,187건을 대상으로 계량서지적 분석과 내용분석을 수행하였다. 분석결과는 살펴보면, 논문 생산에 있어서 교육학, 학제간연구, 컴퓨터학, 문헌정보학, 행정학, 경영학 등의 우위를 확인할 수 있다. 학술지 단위로 보면, 메가 학술지의 강세가 나타난다. 그러나 피인용 기반의 영향력을 살펴보면, 행정학, 문헌정보학, 교육학의 영향력을 뚜렷하게 확인할 수 있다. 저자 단위로 분석한 결과 역시 언론정보학, 행정학, 문헌정보학의 우위를 확인할 수 있다. 파악된 1,537명의 저자 중에서 극소수의 저자가 활발한 연구활동을 하는 것으로 나타났으며, 이를 통해 연구자 저변 확대의 필요성도 확인할 수 있다. 내용분석의 결과를 살펴보면, 논문을 데이터셋으로 하여 가중/비방향네트워크를 형성하는 것이 가장 일반적인 네트워크 형태로 나타났다. 노드는 단어, 링크는 동시출현으로 표현되는 것이 보편적이며, 분석을 위해서는 KrKwic, UCINET, NetMiner, NetDraw 의 활용이 가장 두드러졌다.

대학 교양교육 주제영역의 계량적 분석연구 (An Informetric Analysis of Topics in University's General Education)

  • 최상희
    • 한국비블리아학회지
    • /
    • 제26권4호
    • /
    • pp.245-262
    • /
    • 2015
  • 대학의 교양교과 주제가 다양한 영역으로 분화되고 복합적인 주제로 융합되면서 점차 교양교육의 주제를 파악하는 것이 어려워지고 있다. 이 연구의 목표는 A 대학의 교양교육과정으로 개설되어 있는 교과목의 주제적 영역을 계량정보학적으로 분석하여 시각화하는 것이다. 분석을 위하여 수집된 계획서는 총 214개이며 분석에 적용된 요소는 교과목명, 교과개요, 목표, 주별 수업계획이다. 분석 대상에서 추출된 주제어는 모두 278종이며 총 8개의 주제 클러스터로 군집화 되었다. 주제 클러스터간 관계를 네트워크기법으로 분석한 결과 개인적 영역, 사회적 영역으로 나뉘어지는 것으로 나타났다. 개인적 영역은 다시 14개 하위 주제 클러스터로, 사회적 영역은 11개 하위 주제 클러스터로 분류되었다. 개인적 영역에서는 '언어', '과학', '인성'이 주요 주제 클러스터로 파악되었고 사회적 영역에서는 '다문화' 주제 클러스터가 4개의 다른 주제 클러스터와 다각적인 관계를 맺고 있는 것으로 분석되었다. 주제 네트워크로 교양교과목의 주제 영역을 분석한 방법은 교양교육을 강화하고 개선하거나 대학도서관이 교양교육을 위한 장서개발을 하는데 필요한 기초자료를 생산하는 목적으로 활용될 수 있을 것이다.

딥러닝 기반 소셜미디어 한글 텍스트 우울 경향 분석 (A Deep Learning-based Depression Trend Analysis of Korean on Social Media)

  • 박서정;이수빈;김우정;송민
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.91-117
    • /
    • 2022
  • 국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.

문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석 (Weighted Subject - Method Network Analysis of Library and Information Science Studies)

  • 이기헌;정효정;송민
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.457-488
    • /
    • 2015
  • 본 연구는 1990년부터 2014년까지 25년 간 국외 유수 문헌정보학 학술지들에 게재된 논문들을 대상으로 연구 주제와 연구 방법을 구분하여 현 선도 학술지의 연구 누적 현황을 분석하였다. 연구 주제와 연구 방법을 구분하고 그들 간의 관계를 살펴보기 위해 가중 주제-방법 네트워크를 개발하였다. 이는 주제와 방법으로 구성된 네트워크이며, 해당 토픽 소속 단어의 동시 출현 빈도를 기초로 주제와 방법에 가중치를 준다. 본 연구 결과에 따르면, 지난 25년간 경영정보시스템, 정보요구분석, 계량서지연구, 정보정책 등이 상위 연구 주제들이었다. 또한, 모델링, 개념/문헌연구, 연구협업분석, 웹데이터 분석 등이 상위 연구 방법들이었으며, 최근 텍스트 마이닝의 비상이 괄목할 만하다. 빈번히 짝을 이루는 연구 주제들과 연구 방법들의 지난 25년간의 군집들과 최근 5년간의 군집들을 살펴보면, 계량서지연구가 네트워크분석 방법들을 다수 적용하면서 그 저변을 넓히며 자리를 확고하게 하고 있으며, 텍스트 마이닝이 의료정보시스템, 이용자인터페이스에 특화되고 있음을 확인할 수 있다. 이러한 연구 결과는 문헌정보학의 선도 연구자들의 관심 연구 영역과 관점을 확인시켜주고, 향후 문헌정보학 발전을 위한 연구 설계의 기초자료로 활용될 수 있다.

동시출현단어 분석을 이용한 오픈 데이터 분야의 지적 구조 분석 (Intellectual Structure Analysis on the Field of Open Data Using Co-word Analysis)

  • 이혜경;이용구
    • 정보관리학회지
    • /
    • 제40권4호
    • /
    • pp.429-450
    • /
    • 2023
  • 본 연구의 목적은 오픈 데이터 관련 연구의 최근 동향과 지적 구조를 고찰하는 것이다. 이를 위하여 본 연구는 Scopus에서 저자 키워드로 'open data'를 검색하여 1999년부터 2023년까지 총 6,543건의 논문을 수집하였으며, 데이터 전처리 이후 5,589편 논문의 저자 키워드를 대상으로 오픈 데이터 관련 연구 분야 및 링크드 오픈 데이터 관련 연구 분야의 중심성 도출과 네트워크 분석을 수행하였다. 그 결과, 오픈 데이터 관련 연구에서는 'big data'가 가장 높은 중심성을 보였으며, 주로 공공데이터 개념의 오픈 데이터로서의 활용 및 정책 적용 연구, 빅데이터와의 연관개념으로서의 오픈 데이터를 활용한 데이터 분석에 관한 연구, 오픈 데이터의 재생산이나 활용 및 접근과 같은 오픈 데이터의 이용과 관련한 주제의 연구가 이뤄지고 있음이 나타났다. 그리고 링크드 오픈 데이터 관련 연구는 삼각매개중심성 및 최근접이웃중심성에서 모두 'semantic web'이 가장 높은 것으로 나타났으며, 정부 정책의 공공데이터보다 데이터 연계와 관계 형성을 중점으로 한 연구가 많이 수행된 것으로 나타났다.

Reddit 소셜미디어를 활용한 ChatGPT에 대한 사용자의 감정 및 요구 분석 (Analysis of Users' Sentiments and Needs for ChatGPT through Social Media on Reddit)

  • 나혜인;이병희
    • 인터넷정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.79-92
    • /
    • 2024
  • ChatGPT는 생성형 인공지능(Generative AI) 기술을 활용한 대표적인 챗봇으로서 과학기술 영역뿐만 아니라 사회, 경제, 산업, 문화 등 당양한 분야에서 유용하게 활용되고 있다. 본 연구는 글로벌 소셜미디어 레딧(Reddit)을 활용해 ChatGPT에 대한 사용자의 감정과 요구에 대한 탐색적인 분석을 수행한다. 이를 위해, 2022년 12월부터 2023년 8월까지의 댓글 10,796건을 수집하여 키워드 분석, 감성 분석, 니드마이닝(Needmining) 기반 토픽모델링을 실시하였다. 분석 결과, ChatGPT에 대한 댓글에서 출현 빈도가 가장 높은 단어는 "time"으로 답변의 신속성, 시간 효율성, 생산성 향상을 강조한 것으로 나타났다. 사용자들은 ChatGPT에 대해 신뢰와 기대의 감정과 동시에 사회적 영향에 대한 두려움과 분노의 감정을 표현하였다. 또한, 토픽모델링 분석을 통해 잠재적 니즈(Needs)를 포함한 14개의 주제를 도출하였고, 사용자들이 특히 ChatGPT에 대한 교육적 활용과 사회적 영향에 많은 관심을 보였다. 또한, ChatGPT와 관련된 언어모델, 직업, 정보, 의료, 서비스, 게임, 규제, 에너지, 윤리적 문제 등 다양한 주제들이 논의된 것을 알 수 있었다. 분석 결과를 바탕으로 사용자들의 요구를 반영하여 향후 실행계획의 방향을 제시하였다. 본 연구는 향후 ChatGPT를 이용하여 제품과 서비스를 개선하고, 새로운 서비스 플랫폼 기획 단계에서 유용한 정보를 제공할 것으로 기대된다.

해외 목록학 연구동향 및 지적구조 분석 (A Study on Analysis of Research Trends and Intellectual Structure in the Overseas Cataloging Research)

  • 이지원;이성숙
    • 정보관리학회지
    • /
    • 제41권1호
    • /
    • pp.367-387
    • /
    • 2024
  • 본 연구는 새로운 표준과 규칙의 제정이 이루어지고 또한 향후 예고되어 있음으로 큰 변화의 과정을 거치고 있는 목록학에 있어 그동안 연구가 거의 없었던 해외 연구들의 최근 동향과 지적 구조를 규명하고자 하였다. 이를 위해 2010년 이후 14년간 발행된 논문 680편을 수집한 후, 이로부터 전처리를 거쳐 추출한 1,942개의 저자 키워드를 분석해보았다. 주요 분석 결과는 다음과 같다. 첫째, 해외 목록학 연구는 2017년 이후 주목할만한 성장세를 보이고 있었다. 둘째, 상위빈도 연구주제는 편목, 메타데이터, RDA, 대학도서관, 전거 제어, 링크드 데이터, FRBR, 목록, LCSH, 도서관, 온라인목록이었다. 셋째, 연구주제들은 크게 도서관 목록의 전통적인 부분과 관련된 것과 최근 들어 더욱 활발하게 논의가 진행되고 있는 주제인 전거제어와 협동편목, RDA, 링크드데이터와 관련된 2개의 군집으로 나눌 수 있었고, 이를 14개 소군집으로 세분하여 분석하였다. 넷째, 키워드 군집 14개의 성장지수와 표준 성과지수를 살펴본 결과, 하나의 군집을 제외하고는 학문 분야의 성장의 측면에서 모두 성장을 나타내는 수치를 보여주었다. 본 연구는 향후 국내 학계와 현장을 위한 목록의 발전 양상 예측하기 위한 기초자료 및 관련 교육에 유용하게 활용될 수 있다는 점에서 그 의의가 있다.

COVID-19 관련 연구 동향에 대한 분석 - MEDLINE 등재 국내 의학 학술지를 중심으로 - (Analysis of Research Trends about COVID-19: Focusing on Medicine Journals of MEDLINE in Korea)

  • 서미진;이지수
    • 한국비블리아학회지
    • /
    • 제34권3호
    • /
    • pp.135-161
    • /
    • 2023
  • 본 연구는 국내 의학 학술지에 발행된 COVID-19(Coronavirus Disease 2019) 논문의 연구 동향을 분석하였다. 연구 대상은 MEDLINE에 등재된 의학 분야 학술지 25종으로 총 800건을 선정하였으며, 이를 대상으로 저자 분석, 빈도 분석, 주제 분석, 토픽모델링을 수행하였다. 연구 결과, 저자의 소속 기관은 국내 기관이 76.96%였으며, 국외 기관 저자의 비율은 소폭 감소하였다. 저자의 전공은 '내과학'(32.85%), '예방의학/직업환경의학'(16.23%), '방사선과학'(5.74%), '소아과학'(5.50%) 순이었으며, 공동 연구가 진행된 논문은 435건(54.38%)이었다. 저자 키워드는 'COVID19'(674번), 'SARSCoV2'(245번), 'Coronavirus'(81번), 'Vaccine'(80번) 등이 상위 키워드로 도출되었다. 전체 기간 등장한 단어는 'COVID19', 'SARSCoV2', 'Coronavirus', 'Korea', 'Pandemic', 'Mortality' 등 6개이다. MeSH 용어와 저자 키워드를 대상으로 동시 출현 네트워크 분석을 실시하였으며, 공통적으로 'covid-19', 'sars-cov-2', 'public health' 등의 중심 주제어가 도출되었다. 토픽모델링에서는 '백신 접종', 'COVID-19 발생 현황', '오미크론 변이 바이러스', '정신 건강, 방역 조치', '국내 감염의 전파 및 관리' 등 총 5가지의 토픽이 확인되었다. 이 연구를 통하여 '국제적 공중보건 비상사태'(Public Health Emergency of International Concern, PHEIC) 기간 동안 발행된 국내 COVID-19 논문의 연구 영역과 연도별 주요 키워드를 파악할 수 있었다.