• 제목/요약/키워드: word network analysis

검색결과 374건 처리시간 0.023초

동시출현단어분석을 통한 데이터과학 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Data Science Using Co-Word Analysis)

  • 김현정
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.101-126
    • /
    • 2017
  • 최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터 과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.

동시출현단어분석을 이용한 연관영화정보 분석 연구 (An Analysis of Related Movie Information Using The Co-Word Method)

  • 최상희
    • 정보관리학회지
    • /
    • 제31권4호
    • /
    • pp.161-178
    • /
    • 2014
  • 최근 이용자들이 정보를 공동생산하고 소비하는 웹기반 서비스들이 활발해지면서 이용자가 정보를 이용한 기록이나 이용자가 습득한 정보를 활용하여 생산한 다양한 부가 정보들이 다시 이용자에게 제공되고 있다. 또한 쌍방향으로 이용자들이 소통할 수 있는 정보채널이 다양해짐으로써 공통된 관심사를 가진 이용자의 정보소비 경험을 공유할 수 있는 방법이 활발하게 모색되고 있다. 이 연구에서는 동시출현정보 분석기법과 자아중심 네트워크 분석 기법을 적용하여 IMDB 서비스의 기존 이용자들이 자신이 보고 싶거나 좋아하는 영화를 선별하여 만들어 놓은 영화리스트에 나타난 정보를 토대로 특정 영화를 좋아하는 이용자가 선호할 만한 다른 영화를 찾아낼 수 있도록 연관영화정보를 다각적으로 표현하였다. 한 영화를 기준으로 연관 영화, 감독, 장르로 분석을 한 결과 영화의 테마나 주인공성향과 같은 다양한 자질로도 연관영화가 연결되었고 감독의 경우 영화내용보다는 감독의 인지도에 영향을 받는 것으로 나타났다. 또한 영화는 주제의 복합성이 큰 것으로 나타나 장르가 연관영화정보를 제공하기에 적합하지 않은 것으로 분석되었다.

연결망 분석을 활용한 우리나라 금연연구 동향분석 (A Social Network Analysis of Research Key Words Related Smoke Cessation in South Korea)

  • 안은성
    • 보건행정학회지
    • /
    • 제29권2호
    • /
    • pp.138-145
    • /
    • 2019
  • Background: The purpose of this study is supposed to figure out the keyword network from 2009 to 2018 with social network analysis and provide the research data that can help the Korea government's policy making on smoking cessation. Methods: First, frequency analysis on the keyword was performed. After, in this study, I applied three classic centrality measures (degree centrality, betweenness centrality, and eigenvector centrality) with R 3.5.1. Moreover, I visualized the results as the word cloud and keyword network. Results: As a result of network analysis, 'smoking' and 'smoking cessation' were key words with high frequency, high degree centrality, and betweenness centrality. As a result of looking at trends in keyword, many study had been done on the keyword 'secondhand smoke' and 'adolescent' from 2009 to 2013, and 'cigarette graphic warning' and 'electronic cigarette' from 2014 to 2018. Conclusion: This study contributes to understand trends on smoking cessation study and seek further study with the keyword network analysis.

Trends in Leopard Cat (Prionailurus bengalensis) Research through Co-word Analysis

  • Park, Heebok;Lim, Anya;Choi, Taeyoung;Han, Changwook;Park, Yungchul
    • Journal of Forest and Environmental Science
    • /
    • 제34권1호
    • /
    • pp.46-49
    • /
    • 2018
  • This study aims to explore the knowledge structure of the leopard cat (Prionailurus bengalensis) research during the period of 1952-2017. Data was collected from Google Scholar and Research Information Service System (RISS), and a total of 482 author keywords from 125 papers from peer-reviewed scholarly journals were retrieved. Co-word analysis was applied to examine patterns and trends in the leopard cat research by measuring the association strengths of the author keywords along with the descriptive analysis of the keywords. The result shows that the most commonly used keywords in leopard cat research were Felidae, Iriomte cat, and camera trap except for its English and scientific name, and camera traps became a frequent keyword since 2005. Co-word analysis also reveals that leopard cat research has been actively conducted in Southeast Asia in conjugation with studying other carnivores using the camera traps. Through the understanding of the patterns and trends, the finding of this study could provide an opportunity for the exploration of neglected areas in the leopard cat research and conservation.

속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구 (Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words))

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.163-170
    • /
    • 2019
  • 과거 10년은 웹의 발달로 인한 데이터가 폭발적으로 생성되었다. 데이터마이닝에서는 대용량의 데이터에서 무의미한 데이터를 구분하고 가치 있는 데이터를 추출하는 단계가 중요한 부분을 차지한다. 본 연구는 감성분석을 위한 재표현 방법과 속성선택 방법을 적용한 오피니언 마이닝 모델을 제안한다. 본 연구에서 사용한 재표현 방법은 백 오즈 워즈(Bag-of-words)와 Word embedding to vector(Word2vec)이다. 속성선택(Feature selection) 방법은 상관관계 기반 속성선택(Correlation based feature selection), 정보획득 속성선택(Information gain)을 사용했다. 본 연구에서 사용한 분류기는 로지스틱 회귀분석(Logistic regression), 인공신경망(Neural network), 나이브 베이지안 네트워크(naive Bayesian network), 랜덤포레스트(Random forest), 랜덤서브스페이스(Random subspace), 스태킹(Stacking)이다. 실증분석 결과, electronics, kitchen 데이터 셋에서는 백 오즈 워즈의 정보획득 속성선택의 로지스틱 회귀분석과 스태킹이 높은 성능을 나타냄을 확인했다. laptop, restaurant 데이터 셋은 Word2vec의 정보획득 속성선택을 적용한 랜덤포레스트가 가장 높은 성능을 나타내는 조합이라는 것을 확인했다. 다음과 같은 결과는 오피니언 마이닝 모델 구축에 있어서 모델의 성능을 향상시킬 수 있음을 나타낸다.

Text Mining of Wood Science Research Published in Korean and Japanese Journals

  • Eun-Suk JANG
    • Journal of the Korean Wood Science and Technology
    • /
    • 제51권6호
    • /
    • pp.458-469
    • /
    • 2023
  • Text mining techniques provide valuable insights into research information across various fields. In this study, text mining was used to identify research trends in wood science from 2012 to 2022, with a focus on representative journals published in Korea and Japan. Abstracts from Journal of the Korean Wood Science and Technology (JKWST, 785 articles) and Journal of Wood Science (JWS, 812 articles) obtained from the SCOPUS database were analyzed in terms of the word frequency (specifically, term frequency-inverse document frequency) and co-occurrence network analysis. Both journals showed a significant occurrence of words related to the physical and mechanical properties of wood. Furthermore, words related to wood species native to each country and their respective timber industries frequently appeared in both journals. CLT was a common keyword in engineering wood materials in Korea and Japan. In addition, the keywords "MDF," "MUF," and "GFRP" were ranked in the top 50 in Korea. Research on wood anatomy was inferred to be more active in Japan than in Korea. Co-occurrence network analysis showed that words related to the physical and structural characteristics of wood were organically related to wood materials.

이용자 반응 기반 이미지 감정 접근점 확장에 관한 연구 (An Expansion of Affective Image Access Points Based on Users' Response on Image)

  • 정은경
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.101-118
    • /
    • 2014
  • 컴퓨터 정보기술의 발전과 함께 감정 기반 컴퓨팅이 다양한 분야에 빠르게 발전하여 확산되고 있다. 감정 기반 컴퓨팅의 지속적인 발전을 위해서는 이미지와 같은 멀티미디어의 콘텐츠의 감정 기반 색인과 검색이 필수적이다. 그러나 감정과 같은 추상적 개념은 주관적이며 이미지의 하위 수준 속성에서 유추하는데 한계가 있기 때문에 감정 색인은 통상적으로 난제로 여겨진다. 본 연구는 감정 색인 개선을 위해서 이미지에 대하여 이용자가 느끼는 감정 반응을 활용하여 이미지를 감정으로 접근하는데 있어서 확장된 접근점을 제공하는 방안을 고찰하였다. 이를 위하여 유로피아나 DB에서 사랑, 행복, 분노, 공포, 슬픔의 5가지 기본 감정을 표현한 이미지 15건을 선정하여 20명의 연구 참여자에게 보여주고 용어를 수집하였다. 이용자의 이미지 반응에서 수집한 용어는 정련 후 총 399건의 고유한 용어로 나타났다. 고유한 399건의 용어는 전체 1,093회 출현하였으며, 동시출현단어분석을 수행하여 상위 출현한 용어 네트워크를 구현하였다. 동시출현단어분석 기반의 네트워크를 통해서 기본 감정 용어와 함께 빈번하게 출현하는 용어를 규명하였다. 이를 통해 기본 감정용어와 함께 확장되어 제시될 수 있는 용어는 형용사, 동작/행위 표현 등 다양하게 나타났다.

Deep neural network-hidden Markov model 하이브리드 구조의 모델을 사용한 사용자 정의 기동어 인식 시스템에 관한 연구 (A study on user defined spoken wake-up word recognition system using deep neural network-hidden Markov model hybrid model)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.131-136
    • /
    • 2020
  • 음성 인식기를 대기모드에서 동작 모드로 전환하기 위해 발화하는 짧은 단어를 기동어(Wake Up Word, WUW)라고 하며, 음성 인식기를 실제로 사용하는 사용자가 지정한 기동어를 사용자 정의 기동어라고 한다. 본 논문에서는 이러한 사용자 정의 기동어를 인식하기 위해 기존의 Gaussian Mixture Model-Hidden Markov Model(GMM-HMM) 기반의 시스템, Linear Discriminant Analysis(LDA)를 적용한 LDA-GMM-HMM 기반의 시스템과, LDA-GMM-HMM 모델에서 GMM을 Deep Neural Network(DNN)로 대체한 LDA-DNN-HMM 기반의 시스템을 제작하고 각 시스템의 사용자 정의 기동어 인식 성능 및 비기동어 거절 성능을 비교한다. 또한 기동어 인식기의 체감 성능을 향상시키고자 각 모델에 threshold를 적용하여 기동어 인식 실패율을 약 10 % 수준으로 감소 시킨 후에 비기동어(non-WUW)의 거절 실패율을 비교 평가한다. Threshold 적용시에 LDA-DNN-HMM 기반의 시스템의 경우 기동어 인식 실패율 9.84 % 수준에서 비기동어 거절 실패율이 0.0058 %의 인식 성능을 나타내어 LDA-GMM-HMM 시스템 보다 약 4.82배 향상된 비기동어 거절 성능을 나타낸다. 이러한 결과는 본 논문에서 제작한 LDA-DNN-HMM 모델이 사용자 정의 기동어 인식 시스템을 구축하는데 효과적임을 입증한다.

Comparison of Neural Network Techniques for Text Data Analysis

  • Kim, Munhee;Kang, Kee-Hoon
    • International Journal of Advanced Culture Technology
    • /
    • 제8권2호
    • /
    • pp.231-238
    • /
    • 2020
  • Generally, sequential data refers to data having continuity. Text data, which is a representative type of unstructured data, is also sequential data in that it is necessary to know the meaning of the preceding word in order to know the meaning of the following word or context. So far, many techniques for analyzing sequential data such as text data have been proposed. In this paper, four methods of 1d-CNN, LSTM, BiLSTM, and C-LSTM are introduced, focusing on neural network techniques. In addition, by using this, IMDb movie review data was classified into two classes to compare the performance of the techniques in terms of accuracy and analysis time.

S&T Policy Trend Using Language Network Analysis: Focusing on Science and Technology Basic Plan

  • Kim, Yun Jong;Jeong, Dae-hyun;Oh, Hyunchul
    • Asian Journal of Innovation and Policy
    • /
    • 제6권2호
    • /
    • pp.111-137
    • /
    • 2017
  • This study analyzes a language network of Science and Technology Basic Plan, which is the basis for science and technology policy in Korea, for the next Science and Technology Basic Plan. Language network analysis was adopted for a quantitative approach measuring the trend of policies. Several techniques such as keyword analysis, language network map analysis, quantitative characteristics analysis and keyword-related major-word analysis have been performed. Results show that there are common policies emphasized by all Science and Technology Basic Plans in the past, and there are also specific policies emphasized in each period of the Science and Technology Basic Plan. These specific policies come from a 'change of times' when the Science and Technology Basic Plans were established, as well as the philosophy of the national government.