• 제목/요약/키워드: Text frequency analysis

검색결과 464건 처리시간 0.035초

텍스트마이닝을 활용한 국내 산림생태 분야 연구동향(2001-2020) 분석 (A Study on Domestic Research Trends (2001-2020) of Forest Ecology Using Text Mining)

  • 이진규;이창배
    • 한국산림과학회지
    • /
    • 제110권3호
    • /
    • pp.308-321
    • /
    • 2021
  • 본 연구는 지난 20년(2001~2020)간 국내 산림생태 분야에 관한 전반적인 연구동향과 주요 연구 주제 분석을 통해 향후 연구의 방향성을 파악하고자 수행되었다. 이를 위해 한국교육학술정보원으로부터 국내 산림생태 관련 총 1015편의 논문 제목 및 키워드 데이터를 수집하여 빅데이터 분석프로그램 Textom과 UCINET을 활용하여 분석을 실시하였다. 분석 결과, 산림생태 관련 연구 논문수는 2006~2010년과 2011~2015년 사이에 증가율 137.6%를 나타내어 2011년 이후 급격히 증가한 것으로 나타났다. 단어빈도, N-gram 분석결과 지난 20년간 산림생태 분야의 주요 연구주제는 종다양성이었으며 2011년 이후 기후변화도 주요 연구주제로 출현하였다. CONCOR 분석결과 산림생태 분야의 주요 연구영역은 종다양성, 환경정책, 기후변화, 운영 관리, 식물분류, 서식지 적합성, 관속식물, 휴양복지로 구분되었다. 특히, 종다양성과 기후변화는 관련 정책 추진 현황을 고려할 때 향후에도 중요 연구주제로 다루어질 것이라 판단되며, 국외 사례를 참고하여 국내 실정에 맞는 연구주제의 다양화 및 범위 확대 등을 고려할 필요가 있다고 본다.

밀레니얼 세대의 Babywearing 제품에 대한 인식: 텍스트 분석 접근 (Millennial parents' perception of babywearing products: A text analysis approach)

  • 이완기;박명자;이규혜
    • 한국의상디자인학회지
    • /
    • 제23권2호
    • /
    • pp.17-28
    • /
    • 2021
  • The baby-tech industry, which combines IT with existing parenting product, is attracting increasing amounts of attention. Consequently various types of baby products incorporating functionality and design are being launched. In recent years, particularly as the market segments increases for babywearing products, parenting products that account for the child's comfort and parents' convenience are required. Therefore, this study examines the characteristics and consumer perception of babywear products, which are important for the emotional stability, development, and rearing of children. The study utilizes text mining and a network analysis by collecting unstructured text data. An examination of the network, based on the frequency of keywords for each babywear product and the degree of the connection to the centering index, revealed that consumers value convenience and price when purchasing products. The consumer perception and consideration factors that appear individually according to the product were also identified. In addition, studying body parts with high TF-IDF values revealed a difference in the body parts considered by consumers for each product. Lastly, through the visualization data based on the keywords that appeared in public, commonly appearing keywords, and those that appeared individually were examined. Through SNS, product characteristics as well as a new parenting culture that shared child-rearing routines were confirmed. This study suggests planning and marketing directions for the development of babywear products that meet consumer needs.

네트워크 텍스트 분석을 통한 대운하 문화유산에 대한 관광객 인식 연구 : 쑤저우시 핑장역사문화지구의 예 (Research on Tourist Perception of Grand Canal Cultural Heritage Based on Network Text Analysis : The Pingjiang Historical and Cultural District of Suzhou City as an example)

  • 정청캉;징치웨이;남경현
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.215-231
    • /
    • 2023
  • 본 논문은 쑤저우의 핑장 역사문화 지구을 예로 들어 Python 기술을 적용한 Ctrip.com에서 1436개의 관광객 댓글 데이터를 수집하고, 네트워크 텍스트 분석 방법을 사용하여 빈도 단어, 의미 네트워크 및 감정을 분석하여 대운하 문화의 관광객 인식 특성과 수준을 평가하였다유산.연구 결과: 평강역사문화지구 관광객들의 인식에 자연인문경관, 역사문화축적, 강남운하 풍경이 잘 나타나 있다 ; 관광객들은 평강로 역사문화지구에 대해 비교적 긍정적인 감정을 가지고 있지만, 지구의 개조와 개선은 여전히 큰 여지가 있다.마지막으로 보호우선, 문화통합, 혁신적 활용 등의 측면에서 대운하 문화유산에 대한 관광객의 인식을 높이기 위한 대책을 제시했다.

텍스트 마이닝 분석을 통한 노인학대 관련 연구 동향 분석 : 2004년~2021년까지 발행된 국내 학술논문을 중심으로 (Analysis of Research Trends in Elder Abuse Using Text Mining : Academic Papers from 2004 to 2021.)

  • 윤기혁
    • 사물인터넷융복합논문지
    • /
    • 제8권4호
    • /
    • pp.25-40
    • /
    • 2022
  • 본 연구는 초고령화사회 진입을 목전에 두고 있는 우리나라에서 지속적으로 증가하고 있는 노인학대 학술 연구 동향을 파악하기 위해서 텍스트 마이닝 기법을 활용하였다. 분석 자료는 노인보호전문기관이 설립된 2004년부터 2021년까지 18년간 국내 전문학술지에 게재된 노인학대 관련 학술논문의 제목, 주제어, 초록을 텍스트로 전환하고, 분석 시기는 3개 구간으로 세분화 하여 논문의 패턴 및 전체 데이터 속에 의미를 파악하였다. 연구 결과를 요약하면 다음과 같다. 첫째, 본 연구에서 총 249편의 논문이 선정되었고(1구간은 81편, 2구간 64편, 3구간은 104편이 논문이 각각 선정). 연 평균 13.8편으로 2014년 이후 꾸준히 증가 후 2020년부터 연 평균이하로 감소하고 있다. 둘째 노인학대 텍스트 마이닝 결과 i) 상위 주요 키워드인 단어 빈도분석 결과 모든 구간(2004년~2021년)에 공통적으로 나타난 키워드는 노인학대, 노인, 영향, 요인, 인식, 가족, 사회, 방안, 경험, 학대피해노인, 학대예방, 우울 등이다. ii) TF-IDF 분석 결과 모든 구간에 공통적으로 출현한 키워드는 영향, 인식, 사회, 방안, 학대예방, 경험, 우울 등으로 나타났고, iii) 연결중심성 분석 결과 전 구간에 공통적으로 출현한 키워드는 노인학대, 노인, 영향, 요인, 특성, 인식, 가족, 방안, 사회, 학대예방, 경험 등이다. 셋째, CONCOR 분석 결과 1구간은 5개의 군집으로, 2구간은 7개의 군집으로, 3구간은 6개의 군집으로 각각 나타났다. 상기의 분석 결과 등을 바탕으로 노인학대 학술 연구의 동향을 살펴보았고, 이를 바탕으로 향후 노인학대 학술 연구를 위한 다양한 제언을 제시하였다.

댓글 분석을 통한 19대 한국 대선 후보 이슈 파악 및 득표율 예측 (Issue tracking and voting rate prediction for 19th Korean president election candidates)

  • 서대호;김지호;김창기
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.199-219
    • /
    • 2018
  • 인터넷의 일상화와 각종 스마트 기기의 보급으로 이용자들로 하여금 실시간 의사소통이 가능하게 하여 기존의 커뮤니케이션 양식이 새롭게 변화되었다. 인터넷을 통한 정보주체의 변화로 인해 데이터는 더욱 방대해져서 빅데이터라 불리는 정보의 초대형화를 야기하였다. 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회로 여겨지고 있다. 특히 텍스트 마이닝은 비정형 텍스트 데이터를 이용해 패턴을 탐구하여 의미있는 정보를 찾아낸다. 텍스트 데이터는 신문, 도서, 웹, SNS 등 다양한 곳에 존재하기 때문에 데이터의 양이 매우 다양하고 방대하여 사회적 실제를 이해하기 위한 데이터로 적합하다. 본 연구는 한국 최대 인터넷 포털사이트 뉴스의 댓글을 수집하여 2017년 19대 한국 대선을 대상으로 연구를 수행하였다. 대선 선거일 직전 여론조사 공표 금지기간이 포함된 2017년 4월 29일부터 2017년 5월 7일까지 226,447건의 댓글을 수집하여 빈도분석, 연관감성어 분석, 토픽 감성 분석, 후보자 득표율 예측을 수행하였다. 이를 통해 각 후보자들에 대한 이슈를 분석 및 해석하고 득표율을 예측하였다. 분석 결과 뉴스 댓글이 대선 후보들에 대한 이슈를 추적하고 득표율을 예측하기에 효과적인 도구임을 보여주었다. 대선 후보자들은 사회적 여론을 객관적으로 판단하여 선거유세 전략에 반영할 수 있고 유권자들은 각 후보자들에 대한 이슈를 파악하여 투표시 참조할 수 있다. 또한 후보자들이 빅데이터 분석을 참조하여 선거캠페인을 벌인다면 국민들은 자신들이 원하는 바가 후보자들에게 피력, 반영된다는 것을 인지하고 웹상에서 더욱 적극적인 활동을 할 것이다. 이는 국민의 정치 참여 행위로써 사회적 의의가 있다.

한국농수산대학 신입생 자기소개서의 텍스트 마이닝과 연관규칙 분석 (2) (Text Mining and Association Rules Analysis to a Self-Introduction Letter of Freshman at Korea National College of Agricultural and Fisheries (2))

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제22권2호
    • /
    • pp.99-114
    • /
    • 2020
  • 본 연구는 2020년 한농대 입학생의 자소서에 서술된 학생들의 다양한 교내외 활동, 대학 지원 동기, 학업계획 및 향후 영농·영어계획 등의 텍스트 데이터를 대상으로 텍스트 마이닝에 의한 토픽 분석과 연관성 분석을 하였다. 텍스트 마이닝 결과에서 문항 3의 동아리 활동을 비롯한 다양한 활동 사례와 그 과정에서 배우고 느낀 점에 대한 키워드는 '친구' 빈도가 압도적으로 높았으며, '생각', '시간', '의견', '활동', '사람', '학교', '선생님', '학생', '동아리' 등의 키워드 순으로 많이 사용되었다. 문항 4의 대학 지원동기 및 졸업 후 진로계획에 대한 서술 데이터에는 '생각', '농업', '한농대', '농장', '지식', '공부', '사람', '관심', '전문', '아버지' 등의 키워드 빈도가 높게 나타났으며, 이 가운데 '아버지', '한농대', '전문', '농장' 등의 키워드는 다른 질문에 비하여 상위에 나타나는 특징을 보였다. 연관규칙 분석 결과에서 키워드 간 규칙의 발생 빈도이자 중요성을 나타내는 지지도는 문항 3에서 {친구} <=> {생각}, 문항 4에서 {생각} <=> {한국농수산대학} 규칙에서 가장 높게 나타났다. 두 단어 사이 연관성을 나타내는 신뢰도는 문항 3에서 {선생님} => {친구}, 문항 4에서 {농업, 한국농수산대학} => {생각}에서 높게 나타났다. 두 단어 간 밀접성을 나타내는 향상도는 문항 3에서 {친구} <=> {선생님}, 문항 4에서 {지식} <=> {전문}에서 높게 나타났다. 즉 두 단어는 우연히 함께 사용되지 않고 한 단어가 나타나면 뒤에 반드시 나머지 단어가 사용되었다는 것을 의미한다. 또한 키워드 간의 매개체 역할의 분석, 즉 키워드들 사이에 최단 경로를 파악하는 관계 중심성 분석과 연결 edge 수를 평가하는 연결 중심성 분석에서 문항 3은 '친구', '생각', '학교', '시간' 및 '사람', 문항 4는 '생각', '한국농수산대학', '지식' 및 '지원' 등의 키워드의 중심성이 매우 높은 결과를 나타냈다.

빅데이터 분석 기법을 활용한 도서관발전종합계획 동향 분석 연구 (Analysis Study on Trends of Library Development Plan by Using Big Data Analysis)

  • 김동석;노영희
    • 한국비블리아학회지
    • /
    • 제29권2호
    • /
    • pp.85-108
    • /
    • 2018
  • 본 연구에서는 도서관발전종합계획에 대한 언론보도를 빅데이터 분석 기법을 활용하여 시기별 동향과 시사점을 도출하고자 하였다. 이를 위해 국내 주요 포털 사이트를 통해 2009년부터 2017년까지 관련 데이터를 수집하였다. 수집된 데이터는 텍스트 마이닝 과정을 통해 정제된 단어를 도출하였고 이를 바탕으로 빈도분석 및 중심성 분석, 구조적 등위성 분석 등을 수행하였다. 분석 결과 제1 2차 도서관발전종합계획이 시행되는 동안 도서관 정책의 흐름이 외연적 성장에서 도서관 운영의 내실화 고도화의 흐름으로 변화하고 있었으며, 도서관 시설 확충과 같은 특정 정책에 국한되어 언론보도가 이루어짐을 확인할 수 있었다. 이러한 연구 결과는 도서관발전종합계획으로 대변되는 도서관 정책을 어떤 관점에서 인식하고 이해하고 있는지 확인하는데 유용한 자료로 사용될 수 있으며, 향후 도서관발전종합계획의 비전을 모색하는데 활용되기를 바란다.

Keyword Analysis of Arboretums and Botanical Gardens Using Social Big Data

  • Shin, Hyun-Tak;Kim, Sang-Jun;Sung, Jung-Won
    • 인간식물환경학회지
    • /
    • 제23권2호
    • /
    • pp.233-243
    • /
    • 2020
  • This study collects social big data used in various fields in the past 9 years and explains the patterns of major keywords of the arboretums and botanical gardens to use as the basic data to establish operational strategies for future arboretums and botanical gardens. A total of 6,245,278 cases of data were collected: 4,250,583 from blogs (68.1%), 1,843,677 from online cafes (29.5%), and 151,018 from knowledge search engine (2.4%). As a result of refining valid data, 1,223,162 cases were selected for analysis. We came up with keywords through big data, and used big data program Textom to derive keywords of arboretums and botanical gardens using text mining analysis. As a result, we identified keywords such as 'travel', 'picnic', 'children', 'festival', 'experience', 'Garden of Morning Calm', 'program', 'recreation forest', 'healing', and 'museum'. As a result of keyword analysis, we found that keywords such as 'healing', 'tree', 'experience', 'garden', and 'Garden of Morning Calm' received high public interest. We conducted word cloud analysis by extracting keywords with high frequency in total 6,245,278 titles on social media. The results showed that arboretums and botanical gardens were perceived as spaces for relaxation and leisure such as 'travel', 'picnic' and 'recreation', and that people had high interest in educational aspects with keywords such as 'experience' and 'field trip'. The demand for rest and leisure space, education, and things to see and enjoy in arboretums and botanical gardens increased than in the past. Therefore, there must be differentiation and specialization strategies such as plant collection strategies, exhibition planning and programs in establishing future operation strategies.

텍스트네트워크 분석을 활용한 국내 의사 직무역량 연구동향 분석 (Research Trends on Doctor's Job Competencies in Korea Using Text Network Analysis)

  • 김영전;이제욱;윤소정
    • 의학교육논단
    • /
    • 제24권2호
    • /
    • pp.93-102
    • /
    • 2022
  • We use the concept of the "doctor's role" as a guideline for developing medical education programs for medical students, residents, and doctors. Therefore, we should regularly reflect on the times and social needs to develop a clear sense of that role. The objective of the present study was to understand the knowledge structure related to doctor's job competencies in Korea. We analyzed research trends related to doctor's job competencies in Korea Citation Index journals using text network analysis through an integrative approach focusing on identifying social issues. We finally selected 1,354 research papers related to doctor's job competencies from 2011 to 2020, and we analyzed 2,627 words through data pre-processing with the NetMiner ver. 4.2 program (Cyram Inc., Seongnam, Korea). We conducted keyword centrality analysis, topic modeling, frequency analysis, and linear regression analysis using NetMiner ver. 4.2 (Cyram Inc.) and IBM SPSS ver. 23.0 (IBM Corp., Armonk, NY, USA). As a result of the study, words such as "family," "revision," and "rejection" appeared frequently. In topic modeling, we extracted five potential topics: "topic 1: Life and death in medical situations," "topic 2: Medical practice under the Medical Act," "topic 3: Medical malpractice and litigation," "topic 4: Medical professionalism," and "topic 5: Competency development education for medical students." Although there were no statistically significant changes in the research trends for each topic over time, it is nonetheless known that social changes could affect the demand for doctor's job competencies.

국내 모바일 뱅킹 애플리케이션에 대한 이용자 중요도-만족도 분석(IPA): 구글 플레이스토어 리뷰 데이터를 활용하여 (Importance-Performance Analysis for Korea Mobile Banking Applications: Using Google Playstore Review Data)

  • 김소희;김무건;류민호
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.115-126
    • /
    • 2022
  • 본 연구는 국내 모바일 뱅킹 애플리케이션에 대한 이용자 리뷰 데이터에 텍스트 마이닝 기법을 적용하여 중요도-만족도 분석을 시도하고, 개선의 우선순위를 도출하는 것을 목적으로 한다. 분석에는 구글 플레이스토어에서 국내 시중은행(국민은행, 신한은행, 우리은행, 하나은행), 지역은행(경남은행, 부산은행), 인터넷 은행(카카오뱅크, 케이뱅크, 토스)의 모바일 뱅킹 애플리케이션에 대한 이용자 리뷰 데이터를 활용하였으며, 주요 속성 도출 및 각 속성에 대한 중요도와 만족도 측정을 위해 토픽 모델링, 빈도분석 및 감성분석을 진행하였다. 분석 결과 '인증서비스', '기능 개선', '로그인', '속도/연결성', '시스템/업데이트' 그리고 '뱅킹서비스'가 이용자들이 모바일 뱅킹 애플리케이션을 사용할 때 느끼는 중요도가 상대적으로 높은 속성임에도 불구하고 그 만족도가 평균 수준에 미치지 못해 개선이 시급한 속성으로 나타났다.