• 제목/요약/키워드: Eigenvector Centrality

검색결과 81건 처리시간 0.022초

Is Text Mining on Trade Claim Studies Applicable? Focused on Chinese Cases of Arbitration and Litigation Applying the CISG

  • Yu, Cheon;Choi, DongOh;Hwang, Yun-Seop
    • Journal of Korea Trade
    • /
    • 제24권8호
    • /
    • pp.171-188
    • /
    • 2020
  • Purpose - This is an exploratory study that aims to apply text mining techniques, which computationally extracts words from the large-scale text data, to legal documents to quantify trade claim contents and enables statistical analysis. Design/methodology - This is designed to verify the validity of the application of text mining techniques as a quantitative methodology for trade claim studies, that have relied mainly on a qualitative approach. The subjects are 81 cases of arbitration and court judgments from China published on the website of the UNCITRAL where the CISG was applied. Validation is performed by comparing the manually analyzed result with the automatically analyzed result. The manual analysis result is the cluster analysis wherein the researcher reads and codes the case. The automatic analysis result is an analysis applying text mining techniques to the result of the cluster analysis. Topic modeling and semantic network analysis are applied for the statistical approach. Findings - Results show that the results of cluster analysis and text mining results are consistent with each other and the internal validity is confirmed. And the degree centrality of words that play a key role in the topic is high as the between centrality of words that are useful for grasping the topic and the eigenvector centrality of the important words in the topic is high. This indicates that text mining techniques can be applied to research on content analysis of trade claims for statistical analysis. Originality/value - Firstly, the validity of the text mining technique in the study of trade claim cases is confirmed. Prior studies on trade claims have relied on traditional approach. Secondly, this study has an originality in that it is an attempt to quantitatively study the trade claim cases, whereas prior trade claim cases were mainly studied via qualitative methods. Lastly, this study shows that the use of the text mining can lower the barrier for acquiring information from a large amount of digitalized text.

소셜 미디어 빅데이터 분석을 통한 장애 유아에 대한 사회적 인식 연구 (A Study on Social Perception of Young Children with Disabilities through Social Media Big Data Analysis)

  • 김경민
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.1-12
    • /
    • 2022
  • 본 연구는 장애 유아에 대한 최근 10년간의 사회적 인식을 알아보기 위해 인터넷 기반의 빅데이터 분석 시스템인 Textom을 활용하였다. Textom으로 수집된 자료는 데이터 클리닝 과정을 거쳐 빈도가 높은 순으로 50개의 키워드가 선정되었으며, 의미연결망 분석을 위해 UCINET6으로 중심성 분석과 CONCOR분석을 실시하였다. 분석된 자료는 NetDraw를 활용하여 시각화하였다. 그 결과 '교육, 요구, 부모, 통합교육' 등의 키워드가 빈도수, 연결 및 위세 중심성에서 높은 순위를 차지하였다. 그리고 매개 중심성은 '부모, 교사, 문제, 프로그램, 상담'이 높은 순위를 차지하였다. CONCOR분석에서는 '장애, 유아, 진단, 프로그램'의 키워드를 중심으로 하는 4개 군집이 형성되었다. 이러한 연구 결과를 바탕으로 장애 유아에 대한 사회적 인식의 주제가 무엇인지 살펴보고, 주제별 시사점을 논하였다.

데이터마이닝과 네트워크분석을 통한 팔맥교회혈의 배합 패턴 연구 (Eight Confluent Acupoint Combinations Patterns: Data Mining and Network Analysis)

  • 권민정;윤다은;문희영;류연희;이인선;채윤병
    • Korean Journal of Acupuncture
    • /
    • 제40권4호
    • /
    • pp.177-183
    • /
    • 2023
  • Objectives : One of the crucial combinations of acupoints for treating various disorders involves the Eight Confluent acupoints. The present study aims to investigate the selection patterns of the Eight Confluent acupoints in clinical trials and determine the most frequent pairings through network analysis. Methods : The frequencies of the Eight Confluent acupoints were extracted from the Acusynth database, which includes data from 421 clinical investigations. We examined the degree distribution, eigenvector centrality, proximity centrality, and betweenness centrality of these acupoint combinations using network analysis. Results : Data mining revealed that among the Eight Confluent acupoints, PC6 and TE5 were the most commonly applied in the treatment of 30 disorders. Additionally, we identified the most frequently co-occurring pairs of Eight Confluent acupoints by network analysis which included PC6-GV20, SP4-GV4, LU7-LI4, TE5-PC7, GB41-SP6, KI6-BL62, and SI3-BL62. Conclusions : Through the application of data mining and network analysis, we have elucidated the selection patterns and combinations of the Eight Confluent acupoints. These findings provide valuable insights that can enhance doctors' understanding of clinical database-driven Eight Confluent acupoint selection patterns.

간호관련 국민청원 분석: 텍스트네트워크 분석 및 토픽모델링 (National Petition Analysis Related to Nursing: Text Network Analysis and Topic Modeling)

  • 고현정;정석희;이은지;김희선
    • 대한간호학회지
    • /
    • 제53권6호
    • /
    • pp.635-651
    • /
    • 2023
  • Purpose: This study aimed to identify the main keyword, network structure, and main topics of the national petition related to "nursing" in South Korea. Methods: Data were gathered from petitions related to the national petition in Korea Blue House related to the topic "nursing" or "nurse" from August 17, 2017, to May 9, 2022. A total of 5,154 petitions were searched, and 995 were selected for the final analysis. Text network analysis and topic modeling were analyzed using the Netminer 4.5.0 program. Results: Regarding network characteristics, a density of 0.03, an average degree of 144.483, and an average distance of 1.943 were found. Compared to results of degree centrality and betweenness centrality, keywords such as "work environment," "nursing university," "license," and "education" appeared typically in the eigenvector centrality analysis. Topic modeling derived four topics: (1) "Improving the working environment and dealing with nursing professionals," (2) "requesting investigation and punishment related to medical accidents," (3) "requiring clear role regulation and legislation of medical and nonmedical professions," and (4) "demanding improvement of healthcare-related systems and services." Conclusion: This is the first study to analyze Korea's national petitions in the field of nursing. This study's results confirmed both the internal needs and external demands for nurses in South Korea. Policies and laws that reflect these results should be developed.

협업 필터링을 사용한 유사도 기법 및 커뮤니티 검출 알고리즘 비교 (Comparison of similarity measures and community detection algorithms using collaboration filtering)

  • 일홈존;홍민표;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.366-369
    • /
    • 2022
  • The glut of information aggravated the process of data analysis and other procedures including data mining. Many algorithms were devised in Big Data and Data Mining to solve such an intricate problem. In this paper, we conducted research about the comparison of several similarity measures and community detection algorithms in collaborative filtering for movie recommendation systems. Movielense data set was used to do an empirical experiment. We applied three different similarity measures: Cosine, Euclidean, and Pearson. Moreover, betweenness and eigenvector centrality were used to detect communities from the network. As a result, we elucidated which algorithm is more suitable than its counterpart in terms of recommendation accuracy.

영산강, 섬진강 수계 내 주요 저수지에 대한 동물플랑크톤 군집 구조의 유사성 분석 (Similarity of Zooplankton Community Structure among Reservoirs in Yeongsan-Seomjin River Basin)

  • 고의정;김구연;주기재;김현우
    • 생태와환경
    • /
    • 제52권4호
    • /
    • pp.285-292
    • /
    • 2019
  • 본 연구에서는 영산강, 섬진강 유역에서 호소 간의 동물 플랑크톤의 군집구조 특성이 만수면적에 따라 분류된 소·중·대형의 저수지에서 종 수 및 개체수가 유의한 차이를 보이는 것을 확인하였다. 윤충류보다 지각류에서 민감도가 높은 것을 확인하였으며, 특히 두 분류군 모두 양의 상관 관계를 나타냈지만, 지각류에서 조사지점이 늘어날수록 개체수 증가가 확연한 것을 알 수 있었다. 또한 네트워크 분석 개념을 활용한 고유벡터 중심성 및 그룹화 분석을 사용하여 호소 간의 동물플랑크톤 군집구조를 비교했을 때, 만수면적에 따른 대·중·소형 호소 내에서도 지리적 특성과 미소환경 공간의 차이점을 구별할 수 있었다. 따라서 이러한 특성을 볼 때, 네트워크 분석은 담수 동물플랑크톤 군집구조 분석에 있어 만수면적 크기, 지리적 특성, 미소환경 특성을 반영할 수 있는 것으로 고려된다. 마지막으로, 네트워크 분석은 다양한 군집분석을 간소화하며 시각화를 통한 직관적 이해를 돕는 데 유용할 것이다.

전북 서해안권 국가지질공원의 추진과정과 관련된 갈등 프레임 분석 (An Analysis of the Conflict Frames Related to the Process of the National Geopark in Jeonbuk Western Coast Area, Korea)

  • 정덕호;황경수;조규성;박경진
    • 한국지구과학회지
    • /
    • 제40권3호
    • /
    • pp.283-299
    • /
    • 2019
  • 본 연구의 목적은 국가지질공원 추진 과정에서 지역주민, 지질 전문가 및 지방자치단체 공무원 사이에서 나타나는 갈등 프레임의 양상을 규명하는 데 있다. 이를 위하여 각각 부안과 고창에서 실시된 국가지질공원 추진 관련 주민 공청회의 진행 과정을 참여자들의 사전 동의를 얻어 녹음한 후 텍스트 형태로 전사하였다. 이후 문헌연구를 통해 갈등 프레임을 분석하기 위한 기준 프레임을 개발하였으며, 이를 토대로 3명의 연구자에 의해 갈등 프레임을 분석하였다. 이렇게 분석된 갈등 프레임은 다시 언어네트워크 분석을 활용하여 지역별로 갈등 프레임 간의 구조적 특성을 분석하였으며, 그 결과는 다음과 같다. 먼저, 부안 지역에서는 'Sagree' 프레임, 'Snot' 프레임, 'Sdisagree' 프레임이 높은 위세중심성을 보였고, 언어네트워크의 중심에 위치한 'Snot' 프레임에 Cmexample 프레임, Gharm 프레임, Cmeconomy 프레임 등이 긴밀하게 연결되었다. 반면 고창에서는 'Aresource' 프레임, 'Cmexample' 프레임, 'Gharm' 프레임이 높은 위세중심성을 보였고, 언어네트워크의 중심에 위치한 'Aresource' 프레임에 'Cmexample' 프레임, 'Gharm' 프레임, 'Cmproblemsolution' 프레임 등이 긴밀하게 연결되었다. 이를 통해 부안 지역에서는 아직 이해당사자 사이의 갈등이 진행되고 있고, 고창 지역에서는 자신들의 자원을 자랑스럽게 인식하고 있음을 알 수 있었다. 그리고 부안의 이해당사자들은 갈등 해소에 있어서 경제적 이득에 초점을 둔 반면, 고창의 이해당사자들은 문제 해결에 초점을 두었다. 본 연구의 결과는 국가지질공원 추진에서 나타날 수 있는 갈등 관계를 해소하기 위한 중요한 정보를 제공했다는 점에서 의의가 있다.

빅데이터 분석을 통한 농촌관광 실태와 활성화 방안 연구: 전라북도를 중심으로 (Study of the Activation Plan for Rural Tourism of the Jeollabuk-do Using Big Data Analysis)

  • 박로운;이기훈
    • 한국지역사회생활과학회지
    • /
    • 제27권spc호
    • /
    • pp.665-679
    • /
    • 2016
  • This study examined the main factors for activating rural tourism of Jeollabuk-do using big data analysis. The tourism big data was gathered from public open data sources and social network services (SNS), and the analysis tools, 'Opinion Mining', 'Text Mining', and 'Social Network Analysis(SNA)' were used. The opinion mining and text mining analysis identified the key local contents of the 14 areas of Jeollabuk-do and the evaluations of customers on rural tourism. Social network analysis detected the relationships between their contents and determined the importance of the contents. The results of this research showed that each location in Jeollabuk-do had their specific contents attracting visitors and the number of contents affected the scale of tourists. In addition, the number of visitors might be large when their tourism contents were strongly correlated with the other contents. Hence, strong connections among their contents are a point to activate rural tourism. Social network analysis divided the contents into several clusters and derived the eigenvector centralities of the content nodes implying the importance of them in the network. Tourism was active when the nodes at high value of the eigenvector centrality were distributed evenly in every cluster; however the results were contrary when the nodes were located in a few clusters. This study suggests an action plan to extend rural tourism that develop valuable contents and connect the content clusters properly.

한중 4차산업혁명 기술교류 및 효과에 대한 실증연구: 기업 소셜 네트워크 분석 중심으로 (The Empirical Study on the Effect of Technology Exchanges in the Fourth Industrial Revolution between Korea and China: Focused on the Firm Social Network Analysis)

  • 저우전신;손권상;황윤민;권오병
    • 한국전자거래학회지
    • /
    • 제25권3호
    • /
    • pp.41-61
    • /
    • 2020
  • 중국의 4차 산업혁명 첨단기술 개발 및 사업화 속도가 빠르게 진행되며 효과적인 한중 기업 간 기술교류가 한국의 중장기 산업발전에 더욱 중요해지고 있다. 하지만 아직까지 한중 기업 간 기술교류가 어떻게 진행되는지와 그 효과에 대한 실증 연구가 부족하다. 이에 본 연구는 4차 산업혁명 관련 한중 기술교류 현황 및 효과에 대해 2018년부터 2020년 3월까지 뉴스에 소개된 한중 기업 기술교류 및 협력 기사의 텍스트 마이닝 데이터 기반으로 소셜 네트워크 분석을 진행하고 네트워크 중심성의 성과영향 회귀분석을 진행했다. 분석 결과 국내 전자 대기업들이 대부분 중심성 지표에서 높은 중심성을 보이며 중국 기업 및 기관들과 네트워킹을 활발히 진행하고 있다. 국내 통신사들이 매개 중심성과 부분그래프에서 높은 중심성을 국내 인터넷 서비스 업체와 방송 컨텐츠 업체들이 높은 고유벡터 중심성을 나타냈다. 또한 한국기업보다 중국기업이 높은 매개 중심성을 제조기업보다 서비스기업이 높은 근접 중심성을 보였다. 이러한 네트워크 중심성은 회귀분석결과 기업성과에 긍정적인 영향을 미쳤다. 본 연구는 4차 산업혁명 분야에 집중하여 한중간 협력 현황을 분석한 최초 연구라는 의미가 있으며, 학술적으로 글로벌 기업 협력에 있어 소셜 네트워크 분석 기반 실증 연구 방향을 제시하고 실무적으로 기업이나 정부의 한중 기술 협력 방향 설정에 있어 네트워크 분석 기반 가이드라인을 제시하였다.

웹 크롤링에 의한 네이버 뉴스에서의 한국농수산대학 - 키워드 분석과 의미연결망분석 - (Korea National College of Agriculture and Fisheries in Naver News by Web Crolling : Based on Keyword Analysis and Semantic Network Analysis)

  • 주진수;이소영;김승희;박노복
    • 현장농수산연구지
    • /
    • 제23권2호
    • /
    • pp.71-86
    • /
    • 2021
  • 빅데이터 분석기술인 웹 크롤링 기술을 이용하여 네이버 뉴스 데이터 내에 담겨 있는 '한농대' 에 대한 이미지 단어를 추출하였다. 뉴스 기사에서 언급된 빈도에 따라 중요한 단어로 평가는 단어빈도 분석에서는 청년농업인을 육성하는 한농대의 특성을 잘 설명하는 '농업', '교육', '지원', '농업인', '청년', '대학', '사업', '농촌', '대표' 등의 단어가 자주 사용되는 것으로 나타났다. 또한 '디지털', '스마트', '드론', '졸업생', '창업', '새만금', '교육과정' 등 디지털 농업 전문 인재를 육성하기 위한 학교의 교육, 지원, 비전 등과 관련한 단어들이 추출되었다. 모든 기사 데이터의 단어 빈도(TF) 및 역 문서 빈도(IDF)를 이용한 TF-IDF 가중치의 전체 순위는 '농업인', '드론', '농림축산식품부', '전북', '청년농업인', '농업', '전주', '대학', '장치', '파종' 등의 단어가 한농대와 관련된 뉴스 기사에서 중요한 핵심어 역할을 하는 것으로 나타났다. 단어 빈도에서 '드론', '농림축산식품부', '전북', '청년농업인', '전주', '장치, '파종' 등은 순위가 매우 낮았으나 TF-IDF 가중치 순위에서는 한농대를 표현하는 핵심어로 나타났다. TF-IDF 평가에서 '교육', '지원', '청년', '사업', '농촌' 등의 키워드는 단어빈도가 높으면서 많은 문서에서 자주 등장하는 키워드로서 핵심어 역할은 크지 않은 것으로 나타났다. 단어 간 연계성을 파악하기 위한 의미연결망 분석에서 추출한 바이그램은 '청년'-'농업인', '디지털'-'농업', '영농'-'정착', '농업'-'농촌', '디지털'-'전환' 등의 순으로 빈도가 높게 나타났다. 중심성 지표로 키워드의 영향력을 평가한 결과 모든 지표에서 '농업'이 1위로 나타났으며, 2위에는 '농업인'(근접 중심성, 매개 중심성), '교육'(연결 중심성, 페이지랭크 중심성) 및 '미래'(고유벡터 중심성)으로 나타났다. 스피어먼 순위 상관계수에 의한 중심성 지표별 키워드의 순위의 유사성은 연결 중심성과 페이지랭크 중심성이 0.89 전후의 가장 높은 상관관계를 보였다. 이상으로 네이버 뉴스의 한농대 관련 기사에서 단어 빈도로 보면 '농업', '교육', '지원', '농업인', '청년', '대학', '사업', '농촌', '대표' 등이 중요한 단어로 평가되었으나, 문서빈도를 함께 고려한 평가에서는 '농업인', '드론', '농림축산식품부', '전북', '청년농업인', '농업', '전주', '대학', '장치', '파종' 등의 단어가 핵심어 역할을 하는 것으로 나타났다. 한편 단어나 문서의 빈도가 아니라 단어 간 네트워크 연계성을 고려한 중심성 분석에서는 연결 중심성과 페이지랭크 중심성에 의한 평가가 적합한 것으로 나타났으며, '농업', '교육', '미래', '농업인', '디지털', '지원', '활용' 등이 중심성이 강한 단어로 나타났다.