• 제목/요약/키워드: Text frequency analysis

검색결과 464건 처리시간 0.027초

텍스트마이닝과 CONCOR을 활용한 중독 관련 국내 연구 동향 분석 (Analysis of trends in domestic research on addiction using text mining and CONCOR)

  • 이솔지;윤기혁
    • 사물인터넷융복합논문지
    • /
    • 제9권6호
    • /
    • pp.99-110
    • /
    • 2023
  • 이 연구는 한국의 중독 연구의 동향을 파악하고 발전 방향을 모색하기 위해 2020년부터 2022년까지 지난 3년간 국내 전문학술지 게재 논문 817 건을 대상으로 텍스트마이닝 기법을 활용하여 분석한 연구이다. 분석 결과는 다음과 같다. 첫째, 다양한 중독 관련 키워드가 나타났으나 스마트폰, 게임, 인터넷, 도박, 관계중독 등 모바일을 중심으로 한 온라인에서의 행위중독 관련 중독 연구들이 주요 상위 키워드로 두드러지게 나타났다. 둘째, TF-IDF 분석결과 중독연구에서 지난 3년 간 스마트폰이나, 게임, 인터넷, 일 중독과 같은 행위중독 관련 중독연구가 많이 수행되었고 특히, 아직 임상적으로 중독문제로 진단화 하고 있지 않은 스마트폰이나 게임, 인터넷 등에 대한 중독문제들에 대한 연구수행이 많다는 것을 알 수 있다. 셋째, 2-gram 분석 결과 스마트폰이나 게임, 인터넷 등 주로 행위중독에 해당 되는 단어들이 중독이라는 키워드와 나란히 등장하는 비율이 매우 높으며, 그 가운데 스마트폰과 중독문제와 관련하여 쌍을 이루는 단어들이 연구논문에서 많이 언급되고 있음을 알 수 있다. 넷째, CONCOR 분석결과 알코올사용장애, 인터넷 등 보편적 중독문제에 관한 연구, 마약과 도박중독의 회복 관련 연구, 모바일기기와 미디어 중독 관련 연구, 행위중독 관련 최신 경향 연구, 그 외 기타 중독 문제 관련 연구로 5개의 군집으로 나타났다. 마지막으로 본 연구 결과를 바탕으로 향후 중독 관련 연구를 위한 방향성을 제언하였다.

완전성과 간결성을 고려한 텍스트 요약 품질의 자동 평가 기법 (Automatic Quality Evaluation with Completeness and Succinctness for Text Summarization)

  • 고은정;김남규
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.125-148
    • /
    • 2018
  • 다양한 스마트 기기 및 관련 서비스의 증가에 따라 텍스트 데이터가 폭발적으로 증가하고 있으며, 이로 인해 방대한 문서로부터 필요한 정보만을 추려내는 작업은 더욱 어려워졌다. 따라서 텍스트 데이터로부터 핵심 내용을 자동으로 요약하여 제공할 수 있는 텍스트 자동 요약 기술이 최근 더욱 주목을 받고 있다. 텍스트 요약 기술은 뉴스 요약 서비스, 개인정보 약관 요약 서비스 등을 통해 현업에서도 이미 활발하게 적용되고 있으며, 학계에서도 문서의 주요 요소를 선별하여 제공하는 추출(Extraction) 접근법과 문서의 요소를 발췌한 뒤 이를 조합하여 새로운 문장을 구성하는 생성(Abstraction) 접근법에 따라 많은 연구가 이루어지고 있다. 하지만 문서의 자동 요약 기술에 비해, 자동으로 요약된 문서의 품질을 평가하는 기술은 상대적으로 많은 진전을 이루지 못하였다. 요약문의 품질 평가를 다룬 기존의 대부분의 연구들은 사람이 수작업으로 요약문을 작성하여 이를 기준 문서(Reference Document)로 삼고, 자동 요약문과 기준 문서와의 유사도를 측정하는 방식으로 수행되었다. 하지만 이러한 방식은 기준 문서의 작성 과정에 막대한 시간과 비용이 소요될 뿐 아니라 요약자의 주관에 의해 평가 결과가 다르게 나타날 수 있다는 한계를 갖는다. 한편 이러한 한계를 극복하기 위한 연구도 일부 수행되었는데, 대표적으로 전문에 대해 차원 축소를 수행하고 이렇게 축소된 전문과 자동 요약문의 유사도를 측정하는 기법이 최근 고안된 바 있다. 이 방식은 원문에서 출현 빈도가 높은 어휘가 요약문에 많이 나타날수록 해당 요약문의 품질이 우수한 것으로 평가하게 된다. 하지만 요약이란 본질적으로 많은 내용을 줄여서 표현하면서도 내용의 누락을 최소화하는 것을 의미하므로, 단순히 빈도수에 기반한 "좋은 요약"이 항상 본질적 의미에서의 "좋은 요약"을 의미한다고 보는 것은 무리가 있다. 요약문 품질 평가의 이러한 기존 연구의 한계를 극복하기 위해, 본 연구에서는 요약의 본질에 기반한 자동 품질 평가 방안을 제안한다. 구체적으로 요약문의 문장 중 서로 중복되는 내용이 얼마나 적은지를 나타내는 요소로 간결성(Succinctness) 개념을 정의하고, 원문의 내용 중 요약문에 포함되지 않은 내용이 얼마나 적은지를 나타내는 요소로 완전성(Completeness)을 정의한다. 본 연구에서는 간결성과 완전성의 개념을 적용한 요약문 품질 자동 평가 방법론을 제안하고, 이를 TripAdvisor 사이트 호텔 리뷰의 요약 및 평가에 적용한 실험 결과를 소개한다.

패션제품에 대한 모바일 구전효과 -페이스북을 중심으로- (The Effects of Fashion Mobile Word-of Mouth -Focus on Facebook-)

  • 정지은;추호정;이하경
    • 한국의류학회지
    • /
    • 제37권2호
    • /
    • pp.186-201
    • /
    • 2013
  • This study investigates the effects of information type, direction of information, method of suggestion, tie strength, and interactions among these variables on the acceptance and diffusion of fashion product information in the mobile Facebook environment. Two subsequent studies were conducted to test the relationships among mobile SNS WOM factors. Two independent on-line surveys were implemented. Six hundred forty consumers aged between 20 and 39 were recruited for Study 1, and four hundred and eighty for Study 2. We manipulated the WOM delivery situation by information type (factual/evaluative), information directionality (positive/negative), tie-strength (strong/weak), and information presentation method (text/image/rink). Eight scenarios were developed and randomly assigned to the research participants. Frequency analysis, reliability, factor analysis, regression analysis, and ANOVA were implemented using SPSS 18.0. The Analysis of experiment data produced interesting results. Most WOM factors (including the information type, information presentation method, and tie strength) influence WOM acceptance; however, only the tie strength effected WOM activity. It was also proven that people are prone to accept information that is more realistic, objective, and negative, and they tend to accept information with visual factors, such as images and video clips rather than a simple text message. In this study, we offer a practical perspective to fashion industry and marketers who have an interest in SNS marketing. We have defined the distinct characteristics of mobile WOM that have been formed by a combination of former on/off-line WOM characteristics. To examine the moderating roles of two types of consumer innovativeness, fashion innovativeness and technology innovativeness were also measured and found to have significant moderating effects between mobile SNS WOM factors and their consequences. The paper concludes with a discussion on managerial implications and limitations.

정보활용능력 주제영역의 계량분석 연구 (A Bibliometric Analysis of the Literature on Information Literacy)

  • 박명규;김희정
    • 정보관리학회지
    • /
    • 제28권2호
    • /
    • pp.53-63
    • /
    • 2011
  • 본 논문은 정보활용능력과 관련된 연구의 세부 주제영역을 분석해내고자 하는 데에 그 목적이 있다. 이를 위하여 LISA 데이터베이스에서 디스크립터, 표제 그리고 초록에 information literacy'가 포함된 논문들을 대상으로 텍스트마이닝 기법을 적용하였다. 분석 대상이 된 논문들은 총 908건이었고, 이 논문들을 게재한 학술지는 총 214개였는데, 이 중 상위 10개 고빈도 학술지를 대상으로 한 분석도 수행하였다. 연구결과 information literacy' 연구영역의 하위 주제 영역의 주요 주제어들은 User training'과 Students'였다. 또한 information literacy' 주제영역과 가장 밀접한 학술지는 Reference Services Review와 The Journal of Academic Librarianship으로 나타났다.

텍스트 네트워크 분석을 활용한 농촌 주거환경 연구 동향 (Rural residential environment: Identifying trends through text network analysis)

  • 이차희
    • 농촌계획
    • /
    • 제26권1호
    • /
    • pp.39-49
    • /
    • 2020
  • The study analyzed the frequency of simultaneous occurrence of keywords presented in a total of 805 papers published in domestic journals from 1995 to 2019 by social network analysis(SNS) method, and examined core keywords of each period(5 years), in order to understand the research trends of the rural residential environment. The main results are as follows. First, as a result of the analysis of centrality, 'Community', 'Tourism' and 'Comprehensive Rural Village Development Project' were the top 3 keywords. Second, examined by each period, the top keywords are 'Eco Friendly' in 2000~2004, 'Tourism' in 2005~2009 and 2010~2014, 'Community' in 2015~2019. Third, comparing the structural characteristics of core keywords 2nd, 3rd, and 4th period, a network centering on 'Tourism' was clearly formed in the 2nd period. 'Tourism' was divided into 'Community' and a movement to form a separate group appeared in the 3rd period. In the 4th period, 'Community' was found to form a network without direct connection with 'Tourism'. The results of this study suggest the trend change of viewpoint for the rural area in the domestic research on rural residential environment. It has been confirmed that while the research had been carried out with the viewpoint of rural area as a 'tourist attraction' or 'sightseeing spot' for the urban citizens until the mid-2010s, in the research of late 2010s the viewpoint has settled down as a 'residential space' or 'space for new economic activities' of a variety of rural residents.

Analysis of Descriptive Lectures Evaluation using Text Mining: Comparative analysis pre and post COVID-19

  • Lee, Sang-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.211-222
    • /
    • 2022
  • 본 연구는 코로나 이전과 코로나 이후의 강의평가를 비교 분석하여, 코로나 이후 시대에 대학수업에서 고려해야 되는 사항은 무엇인지를 도출하고자 하였다. 이를 위해 서울시 소재 A대학의 4개년도 자료를 이용하였고, 코로나 이전은 2018년~2019년까지, 코로나 이후는 2020년~2021년까지 자료를 이용하였다. 연구결과에 의하면, 교양의 경우에는 "과제"가 코로나 이전과 이후와 상관없이 빈도 및 연결중심성(DC)이 가장 가장 높은 단어로 나타났으나, 전공에서는 "이해"가 가장 중요한 단어로 나타났다. 에코 네트워크의 분석결과, "동영상" 및 "비대면수업"의 경우에는 어렵다고 느끼고 있으며, 교수와 학생간의 "상호작용"이 중요하다고 생각하고 있었다. 결론적으로 코로나 이후의 교양 수업에서는 과제에 대한 비중을 낮추고, 학생과의 상호작용을 높이는 것이 중요하며, 전공의 경우에는 비대면 수업보다는 대면수업으로 운영하고, 동영상도 어렵지 않게 내용을 구성하는 것이 필요하다는 것을 확인하였다.

비대면 교육 문제점 파악을 위한 빅데이터 텍스트 마이닝 분석 (Big data text mining analysis to identify non-face-to-face education problems)

  • 박성재;황욱선
    • 한국교육논총
    • /
    • 제43권1호
    • /
    • pp.1-27
    • /
    • 2022
  • 세계적으로 코로나19 바이러스가 만연해짐에 따라 다양한 분야에서 비대면화를 시행하게 되었고, 교육 시스템 또한 급격한 비대면화로 인해 많은 관심이 집중되기 시작하였다. 본 연구의 목적은 현재까지 계속적으로 변화하고 있는 교육환경에 맞추어 비대면 교육이 나아가야 하는 방향성에 대해서 분석하는 것이다. 본 연구에서는 다양한 의견들이 존재하는 소셜네트워크 빅데이터를 수집하기 위하여 텍스톰(Textom), 유씨넷6(Ucinet6) 분석 도구 프로그램을 사용하여 데이터를 시각화하였다. 연구 결과 '코로나'와 관련된 키워드가 주를 이루었으며 '기사', '뉴스'등의 높은 빈도의 키워드들이 존재했다. 분석 결과 네트워크 장애 및 보안 문제와 같은 비대면 교육에 관련한 다양한 이슈들을 확인해 볼 수 있었고, 분석 이후 교육 시장의 성장과 교육 환경의 변화에 따른 비대면 교육 시스템의 방향성에 관하여 연구하였다. 또한 빅데이터를 이용하여 분석한 비대면 교육시의 보안 강화 필요성과 수업 방식에 대한 피드백의 필요성이 존재한다.

하이퍼네트워크에서 본 단어간 긴밀성과 다양성 (Affinity and Variety between Words in the Framework of Hypernetwork)

  • 김준식;박찬훈;이은석;장병탁
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권4호
    • /
    • pp.166-171
    • /
    • 2008
  • 전체문서(Corpus)에서의 두 단어 간 연결 상태를 파악하여 앞 단어 다음에 오는 단어의 빈도수를 기반으로 여러 형태의 그룹을 분류하여 단어 간 다양성과 긴밀성을 살펴보았다. 기존의 연구에서 Zipf's Power Law는 Chinese Restaurant Process로 설명되었고 Scale Free Network에서는 edged의 수에 따른 노드의 profile을 조사하여 hub들을 찾는 연구가 수행되었다. 본 연구에서는 단어 간 연결의 유일성과 다양성을 조사하여 Zipf's Power Law와 hub profile을 동시에 살펴보았다. 데이타 분석 결과 단어 간 연결의 긴밀성과 다양성 사이에서 대칭성으로 함축되는 유의한 결과를 얻었으며 이는 소위 'exploitation'과 'exploration'의 관점에서 설명될 수 있다. 또한 분석 자료인 TIPSTER에서 관찰된 약간의 대칭성 깨짐(symmetry breaking)에 대해서도 논한다.

텍스트 마이닝과 토픽모델링 활용한 사회서비스 품질의 학술연구 동향 분석 (The Analysis of Research Trends in Social Service Quality Using Text Mining and Topic Modeling)

  • 이혜정;윤기혁
    • 사물인터넷융복합논문지
    • /
    • 제8권3호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 연구는 텍스트 마이닝과 토픽모델링을 활용하여 우리나라에 사회서비스가 본격적으로 도입된 2007년부터 2020년 까지의 사회서비스 품질에 대한 학술연구 동향을 분석하였다. 이를 토대로 사회서비스 품질에 관한 논문의 패턴 및 전체 데이터 속에 의미를 파악하여 사회서비스 발전방향에 대한 기초자료를 제공하고자 함에 목적이 있다. 자료수집은 학술연구정보서비스(RISS)에서 사회서비스, 사회복지서비스, 품질 키워드로 97편의 논문을 선정하였고, 2개 구간으로 구분하여 텍스트 마이닝을 활용하여 데이터를 분석하였다. 본 연구의 결과는 첫째, 본 연구에서 활용된 97개의 논문 중 1구간은 38편, 2구간은 59편으로 나타났고, 연 평균 6.9개의 논문이 발표되었다. 둘째, 단어빈도 분석 결과 1구간과 2구간의 공통 키워드는 서비스, 품질, 사회서비스, 만족도, 이용자, 품질관리, 재이용, 정책, 바우처 등의 순으로 나타났다. TF-IDF 분석 결과 1구간과 2구간의 공통 키워드는 사회서비스, 만족도, 이용자, 고객만족, 재이용, 바우처, 품질, 노인요양시설, 품질관리, 지역사회서비스투자사업 등의 순으로 나타났다. 셋째, 토픽 모델링 분석 결과 1구간의 주요 토픽은 서비스 제공유형, 서비스 비용, 재이용, 이용자 중심, 일자리 창출로 나타났고, 2구간은 품질관리체계, 공공성, 제공인력 관리체계, 공급방식체계, 서비스 만족도로 나타났다. 본 연구 결과를 바탕으로 사회서비스 품질 학술연구의 방향성을 제시하였다.

공유경제 기반의 고객리뷰를 이용한 토픽모델링 분석: 공유주차를 중심으로 (A Study on Analysis of Topic Modeling using Customer Reviews based on Sharing Economy: Focusing on Sharing Parking)

  • 이태원
    • 한국산업정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.39-51
    • /
    • 2020
  • 본 연구에서는 공유경제의 다양한 비즈니스 모델 중 공유주차로 범위를 제한하고, 이와 관련된 리뷰를 수집한 후 텍스트마이닝 분석을 통해 공유주차가 갖고 있는 사회적 이슈와 소비자 인식에 대해 살펴보고자 한다. 본 실험에서는 TFIDF (Term frequency inverse document frequency) 기법과 LDA (Latent dirichlet allocation) 기법을 이용하여 키워드별 토픽을 추출하여 분석한 결과 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 지자체 협약, 주차공간협소, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 본 연구는 정성적 연구, 기업 및 지역의 사례를 이용하여 기존의 탐색적 연구를 수행한 선행 연구와는 차별화된 연구로 학술적 기여도가 높다고 할 수 있다. LDA 분석을 본 연구에 활용하여 나타난 결과를 바탕으로 지역경제 활성화를 위한 공유경제 정책 수립에 응용하거나 활용할 수 있다는 실무적 기여도가 있다.