• 제목/요약/키워드: 단어 동시출현 분석

검색결과 115건 처리시간 0.023초

문헌정보학의 지식 구조에 관한 연구 (A Study on Intellectual Structure of Library and Information Science in Korea)

  • 유영준
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.277-297
    • /
    • 2003
  • 이 연구는 색인어가 특정 주제 영역의 지식 구조를 표현할 수 있다는 것을 전제로 한다. 여기에서는 문헌정보학 관련 학술지인 정보관리학회지, 한국도서관정보학회지, 한국문헌정보학회지 등에 수록된 논문을 대상으로 국회도서관이 배정한 색인어를 클러스터링하여 문헌정보학의 지식 구조를 파악하였다. 그 과정에서, 색인어간의 연관도 및 동시 출현 빈도를 이용하여 색인어 군집을 생성하였고, 초출색인어와 시기 구분에 의한 시계열 분석을 수행함으로써 문헌정보학의 발전 과정과 그 동향을 밝혔다. 또한 색인어 군집에 의해 도출된 지식 구조와 기존의 전통적인 분류체계의 지식 구조를 비교하여 두 지식 구조간의 차이를 분석하였다.

텍스트마이닝 기법을 활용한 국내외 장소성 관련 연구동향 분석 (Analyzing the Study Trends of 'Sense of Place' Using Text Mining Techniques)

  • 이인아;김혜진
    • 한국비블리아학회지
    • /
    • 제30권2호
    • /
    • pp.189-209
    • /
    • 2019
  • 주경로 분석(Main Path Analysis, MPA)은 문헌의 인용정보를 기반으로 지식이 전달되는데 기여한 핵심 문헌을 추출하는 텍스트마이닝 기법 중 하나이다. 본 연구는 1990년부터 2018년까지 국내외에서 발행된 장소성 관련 논문의 인용정보와 초록을 토대로 주경로 분석과 단어동시출현빈도 연관어 네트워크 분석을 적용하여 연구동향을 파악하였다. 1990년부터 2018년까지 수집된 문헌을 5년씩 기간 구분하여 (마지막 기간은 3년) 각 기간 별로 국내외에서 장소성 관련 연구가 전반적으로 어떻게 진행되었는지 비교 분석하여 제시하였다. 주경로 분석 결과, 1990년부터 해외의 장소성 관련 연구는 개인 정체성, 공공 토지 관리, 환경 교육, 도시 개발 분야 순으로 진행되어 온 것으로 나타났다. 단어동시출현을 기반으로 한 연관어 네트워크를 통해서는 국내의 경우 도시 개발, 문화, 문학, 역사 등 다양한 차원에서 장소성이 논의되는 격변기를 겪는 것으로 해석할 수 있었다. 반면 국외에서는 건강, 정체성, 경관, 도시 개발 관련 논의가 90년대부터 꾸준히 이루어지고 있는 것으로 파악되었다. 본 연구는 장소성 연구동향을 기존의 특정 영역에 장소성 개념을 적용하여 분석하는 미시적 관점의 분석이 아닌 다양한 텍스트마이닝 기법을 적용하여 장소성을 주제로 삼고 있는 논문의 전반적인 흐름을 파악하는 통시적 접근의 방법을 제시하였다는 점에서 시사점을 지닌다.

텍스트 마이닝을 활용한 저출산 정책과 대중인식 비교 (Comparative Analysis of Low Fertility Policy and the Public Perceptions using Text-Mining Methodology)

  • 배기련;문현정;이재일;박미나;박아름
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.29-42
    • /
    • 2021
  • 한국의 저출산 심화에 따라 본 연구는 정부의 저출산 대응정책과 그에 대한 대중인식을 비교하여 근본적인 차이점을 밝히고자 했다. 이를 위해 네 차례의 '저출산·고령사회 기본계획'과 제3·4차 기본계획 발표 직후 2주간의 뉴스 댓글을 분석대상으로 선정하여, 빈도분석, 동시출현단어 분석, 구조적 등위성 분석을 실시하였다. 정책문서 빈도분석결과 제1·2차 시기는 직접적인 보육지원이, 제3·4차 시기부터는 사회구조적인 접근이 눈에 띄었다. 동시출현단어 분석에서는 정책과 댓글 모두 '육아'에서 일과 가정의 양립을 지향하였다. '결혼'과 '출산'의 경우 댓글은 연속성, 정책은 단절성이 두드러지며 특히 주거와 고용문제에서 큰 차이가 있었다. 댓글의 구조적 등위성 분석 결과에서는 대중들의 자녀 양육환경에 대한 관심, 정책 실효성에 대한 문제의식을 확인할 수 있었다. 본 연구는 빅데이터를 활용해 대중들의 인식을 확인하였다는 점에서 의의를 가지므로, 이에 근거한 정책 개선 등 향후 저출산 대응이 나아가야 할 방향을 수립하는 데 도움을 줄 수 있을 것이다.

디지털 인문학 연구 동향 분석 - Digital Humanities 학술대회 논문을 중심으로 - (An Investigation on Digital Humanities Research Trend by Analyzing the Papers of Digital Humanities Conferences)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제55권1호
    • /
    • pp.393-413
    • /
    • 2021
  • 디지털 정보기술과 인문학적 연구 문제의 결합을 통해 새롭고 혁신적인 지식을 창출하는 디지털인문학은 대표적인 다학제적 융합 학문 분야라고 볼 수 있다. 이러한 디지털인문학 분야의 지적구조를 규명하기 Digital Humanities 학술대회 최근 2년간(2019, 2020)의 논문 441건을 대상으로 저자사항과 키워드 동시출현 네트워크 분석을 수행하였다. 저자와 키워드 분석 결과를 살펴보면, 유럽, 북미 지역, 동아시권의 일본 중국의 저자의 활발한 활동을 찾아볼 수 있다. 공저자 네트워크를 통해서는 11개의 분절된 네트워크를 확인할 수 있으며, 이는 폐쇄적인 공저활동의 결과로 볼 수 있다. 키워드 분석을 통해서는 16개의 세부 주제 영역을 규명할 수 있으며, 이는 기계학습, 교육학, 메타데이터, 토픽모델링, 문체, 문화유산, 네트워크, 디지털아카이브, 자연언어처리, 디지털도서관, 트위터, 드라마, 빅데이터, 신경망 네트워크, 가상현실, 윤리으로 구성된다. 이러한 군집 구성은 디지털 정보기술이 주된 세부 주제 영역으로 자리매김하고 있음을 알 수 있다. 또한 출현빈도가 높은 키워드들은 인문학 기반 키워드, 디지털 정보기술 기반 키워드, 융합 키워드으로 구분될 수 있으며, 디지털인문학의 성장과 발전 과정의 역동성을 찾아볼 수 있다.

네이버 뉴스 댓글을 활용한 '비혼출산'에 대한 감성분석 (Sentiment Analysis on 'Non-maritalism Childbirth' Using Naver News Comments)

  • 허세영;김초원;정안용;이새봄
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.74-85
    • /
    • 2022
  • 한국 사회에서 결혼가치관의 변화, 비혼 만연 현상과 더불어 비혼출산이라는 새로운 가족 구성의 형태가 나타났고, 출생률 감소 문제와 결부되면서 사회적 논의가 이루어지고 있다. 이에 본 연구는 비혼출산에 대한 사람들의 감성과 인식을 알아보기 위해 방송인의 비혼출산 사실이 알려진 2020년 11월 16일부터 최근 2021년 8월 16일까지 비혼출산에 관한 뉴스기사 댓글을 이용해 감성분석을 수행하였다. 연구 결과, 방송인의 비혼출산 사실이 알려진 사회이슈기에는 긍정적인 댓글이 다수인 반면, 정부여당이 정책적 검토를 시작한 정책의제기부터 정책결정기까지는 부정적인 댓글이 다수였다. 단어 동시출현빈도에 기반한 네트워크를 살펴본 결과, 댓글에는 전통적 가족규범 측면, 정책적 측면, 개인적 측면의 인식이 나타났다. 본 연구는 비혼출산 이슈가 정책의 제화 이후 정책결정과정 동안 부정적 인식이 만연하였다는 점을 밝혀냈으며, 비혼출산에 대한 사회적 논의의 초석이 되었다는 점에서 의의가 있다.

클러스터링을 고려한 다차원척도법의 개선: 군집 지향 척도법 (Improved Multidimensional Scaling Techniques Considering Cluster Analysis: Cluster-oriented Scaling)

  • 이재윤
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.45-70
    • /
    • 2012
  • 개체들 사이의 관계를 저차원 공간에 매핑하는 다차원척도법을 수행하기 위한 다양한 방법과 알고리즘이 개발되어왔다. 그러나 PROXSCAL이나 ALSCAL과 같은 기존의 기법들은 50개 이상의 개체를 포함하는 데이터 집합을 대상으로 개체 간의 관계와 군집 구조를 시각화하는데 있어서 효과적이지 못한 것으로 나타났다. 이 연구에서 제안하는 군집 지향 척도법 CLUSCAL(CLUster-oriented SCALing)은 기존 방법과 달리 입력되는 데이터의 군집 구조를 고려하도록 고안되었다. 50명의 저자동시인용 데이터와 85개 단어의 동시출현 데이터에 대해서 적용해본 결과 제안한 CLUSCAL 기법은 군집 구조를 잘 식별할 수 있는 MDS 지도를 생성하는 유용한 기법임이 확인되었다.

사회학 분야의 연구데이터 특성과 지적구조 규명에 관한 연구 (An Investigation on Characteristics and Intellectual Structure of Sociology by Analyzing Cited Data)

  • 최형욱;정은경
    • 정보관리학회지
    • /
    • 제34권3호
    • /
    • pp.109-124
    • /
    • 2017
  • 여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 'Sociology'로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 'Sociology'로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

동시출현단어 분석을 이용한 토양침식 연구동향 비교 분석 (A Comparison of Current Trends in Soil Erosion Research Using Keyword Co-occurrence Analysis)

  • 임영협;김석우;남수연;전근우;김민석
    • 한국환경생태학회지
    • /
    • 제34권5호
    • /
    • pp.413-424
    • /
    • 2020
  • 최근의 환경정책과 산업은 사후관리에서 사전예방 중심으로 그 패러다임이 변화하고 있다. 이에 따라 국토의 유한자원으로서의 표토의 기능과 가치에 대한 인식 제고를 바탕으로 보전예방적으로 관리하기 위한 정책이 추진되고 있다. 이러한 배경을 바탕으로 이 연구에서는 국제·국내 전문학술지의 검색 데이터베이스(Web of science)를 기반으로 최근 10년간의 연구논문에 대하여 VOSviewer를 이용한 동시출현단어 분석을 실시하여 국내·외 토양침식 연구동향을 비교·분석하고 향후 연구방향을 제안하고자 하였다. 그 결과, 우리나라의 국토면적 대비 토양침식 관련 논문 게재건수는 세계적으로 비교적 상위에 속하고, 특히 토양침식 제어와 관련된 연구가 외국에 비해 큰 비중을 차지하고 있는 것으로 나타났다. 이러한 결과로부터 우리나라에서는 기후·지형·토지이용 여건에 따른 토양침식의 심각성을 인식하고 비교적 활발한 연구가 진행되고 있는 것으로 판단되었다. 그러나 토양침식 제어에 관한 연구영역은 외국에 비해 키워드 수가 적게 나타나 연구항목을 보다 다양화·확장할 필요가 있으며, 특히 토양침식의 프로세스와 이와 관련한 토양의 물리·화학적 특성에 대한 연구는 토양침식에 따른 문제의 근본적인 해결을 위하여 활발히 추진할 필요가 있는 분야로 나타났다.

빅데이터 분석 기법을 활용한 도서관발전종합계획 동향 분석 연구 (Analysis Study on Trends of Library Development Plan by Using Big Data Analysis)

  • 김동석;노영희
    • 한국비블리아학회지
    • /
    • 제29권2호
    • /
    • pp.85-108
    • /
    • 2018
  • 본 연구에서는 도서관발전종합계획에 대한 언론보도를 빅데이터 분석 기법을 활용하여 시기별 동향과 시사점을 도출하고자 하였다. 이를 위해 국내 주요 포털 사이트를 통해 2009년부터 2017년까지 관련 데이터를 수집하였다. 수집된 데이터는 텍스트 마이닝 과정을 통해 정제된 단어를 도출하였고 이를 바탕으로 빈도분석 및 중심성 분석, 구조적 등위성 분석 등을 수행하였다. 분석 결과 제1 2차 도서관발전종합계획이 시행되는 동안 도서관 정책의 흐름이 외연적 성장에서 도서관 운영의 내실화 고도화의 흐름으로 변화하고 있었으며, 도서관 시설 확충과 같은 특정 정책에 국한되어 언론보도가 이루어짐을 확인할 수 있었다. 이러한 연구 결과는 도서관발전종합계획으로 대변되는 도서관 정책을 어떤 관점에서 인식하고 이해하고 있는지 확인하는데 유용한 자료로 사용될 수 있으며, 향후 도서관발전종합계획의 비전을 모색하는데 활용되기를 바란다.

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.