• 제목/요약/키워드: 텍스트마이닝분석

검색결과 1,004건 처리시간 0.027초

텍스트 마이닝 기법을 활용한 메타버스 플랫폼 고객 리뷰 분석 (Metaverse Platform Customer Review Analysis Using Text Mining Techniques )

  • 김혜진;이정승;김수경
    • Journal of Information Technology Applications and Management
    • /
    • 제31권1호
    • /
    • pp.113-122
    • /
    • 2024
  • This comprehensive study delves into the analysis of user review data across various metaverse platforms, employing advanced text mining techniques such as TF-IDF and Word2Vec to gain insights into user perceptions. The primary objective is to uncover the factors that contribute to user satisfaction and dissatisfaction, thereby providing a nuanced understanding of user experiences in the metaverse. Through TF-IDF analysis, the research identifies key words and phrases frequently mentioned in user reviews, highlighting aspects that resonate positively with users, such as the ability to engage in creative activities and social interactions within these virtual environments. Word2Vec analysis further enriches this understanding by revealing the contextual relationships between words, offering a deeper insight into user sentiments and the specific features that enhance their engagement with the platforms. A significant finding of this study is the identification of common grievances among users, particularly related to the processes of refunds and login, which point to broader issues within payment systems and user interface designs across platforms. These insights are critical for developers and operators of metaverse platforms, suggesting a focused approach towards enhancing user experiences by amplifying positive aspects. The research underscores the importance of continuous improvement in user interface design and the transparency of payment systems to foster a loyal user base. By providing a comprehensive analysis of user reviews, this study offers valuable guidance for the strategic development and optimization of metaverse platforms, ensuring they remain responsive to user needs and continue to evolve as vibrant, engaging virtual environments.

멸종위기 야생생물 민원 텍스트 마이닝 연구 - LDA 토픽 모델링과 네트워크 분석을 통한 주요 이슈 발굴 - (A Text Mining Study on Endangered Wildlife Complaints - Discovery of Key Issues through LDA Topic Modeling and Network Analysis -)

  • 김나영;남희정;박용수
    • 한국환경복원기술학회지
    • /
    • 제26권6호
    • /
    • pp.205-220
    • /
    • 2023
  • This study aimed to analyze the needs and interests of the public on endangered wildlife using complaint big data. We collected 1,203 complaints and their corresponding text data on endangered wildlife, pre-processed them, and constructed a document-term matrix for 1,739 text data. We performed LDA (Latent Dirichlet Allocation) topic modeling and network analysis. The results revealed that the complaints on endangered wildlife peaked in June-August, and the interest shifted from insects to various endangered wildlife in the living area, such as mammals, birds, and amphibians. In addition, the complaints on endangered wildlife could be categorized into 8 topics and 5 clusters, such as discovery report, habitat protection and response request, information inquiry, investigation and action request, and consultation request. The co-occurrence network analysis for each topic showed that the keywords reflecting the call center reporting procedure, such as photo, send, and take, had high centrality in common, and other keywords such as dung beetle, know, absence and think played an important role in the network. Through this analysis, we identified the main keywords and their relationships within each topic and derived the main issues for each topic. This study confirmed the increasing and diversifying public interest and complaints on endangered wildlife and highlighted the need for professional response. We also suggested developing and extending participatory conservation plans that align with the public's preferences and demands. This study demonstrated the feasibility of using complaint big data on endangered wildlife and its implications for policy decision-making and public promotion on endangered wildlife.

증강 현실 디지털 패션의 디자인 특성 (Design Characteristics of Augmented Reality Digital Fashion)

  • 김은정;서승희
    • 패션비즈니스
    • /
    • 제28권4호
    • /
    • pp.1-20
    • /
    • 2024
  • The aim of this study was to analyze contemporary sociocultural phenomena and values through characteristics of augmented reality (AR) digital fashion design. The research method included a literature review on the metaverse and augmented reality, combined with a case study using both quantitative analysis through big data text mining and qualitative analysis through constant comparison. Data analysis was conducted using Python-based open-source tools: First, 6,725 data entries were collected from AR digital fashion platforms and brands identified in articles from Vogue and Vogue Business containing keywords of 'augmented reality' and 'digital fashion. Second, text preprocessing involved stop word removal, tokenization, and POS-tagging of nouns and adjectives using the NLTK library. Third, top 50 keywords were extracted through term frequency (TF) and TF-IDF analysis, with results visualized using a word cloud. Fourth, characteristics of products' external design and internal concepts that contained top keywords were classified, with their value examined through repeated comparison. Results indicate that AR digital fashion design has the following characteristics. First, it embodies surreal fantasy through designs that mimic natural biological patterns using 3D scanning and modeling technology. Second, it presents a trans-boundary aspect by utilizing the fluidity of body and space to challenge vertical and discriminatory social structures. Third, it imagines a new future transcending traditional sociocultural concepts by expanding perceptions of space and time based on advanced technological aesthetics. Fourth, it contributes to sustainability by exploring alternatives for the fashion industry in response to climate change and ecological concerns.

텍스트 마이닝에 기반한 U-City 서비스 이슈 및 동향분석 - 네트워크분석 및 정보량계측기법을 활용하여 - (Study on U-City Service Issue and Trends based Text Mining - Using the Network Analysis and Information Measure Method -)

  • 정다운;유지송;이미숙;신동빈
    • Spatial Information Research
    • /
    • 제23권3호
    • /
    • pp.35-44
    • /
    • 2015
  • 최근 정부는 U-City 활성화를 위한 발전전략을 통해 시민들이 체감하는 서비스를 발굴 및 제공하는 것을 목표로 하고 있다. 이에 본 연구는 신문기사 중 U-City 서비스관련 기사를 대상으로 시사분석을 통해 서비스 이슈와 동향을 분석하여 시민체감형 서비스 추진방향을 모색하는데 목적이 있다. 분석을 위해 2009년부터 2014년까지 수집된 723개 신문기사는 전처리과정을 거쳐 키워드 빈도분석을 실시했으며, 빈도분석 결과를 바탕으로 네트워크 분석과 정보계측기법을 활용했다. 네트워크 분석결과 연결 중심성, 매개 중심성, 근접 중심성이 높은 키워드는 정보, IT, 환경, 기술, 센터 순으로 나타났다. 5개의 키워드는 지난 6년 동안 U-City를 추진하는데 있어 중요한 요소였다는 것을 알 수 있다. 정보계측기법결과 기존에 추진된 U-City는 인프라 구축에 중심을 뒀으며, 공공중심의 서비스를 제공했다는 동향을 파악할 수 있었다. 2009년은 관광, 2010년은 방범 방재, 2011년은 시설물 관리, 2012년은 행정, 2013년 2014년은 시설물 관리 분야를 중심적으로 서비스를 개발했다. 이에 기존에 구축된 인프라를 기반으로 시민체감도가 높은 서비스분야의 발굴 및 제공이 필요하다는 시사점을 도출하였다. 본 연구는 추후 U-City를 추진하는 지자체의 계획수립에 참고적인 역할을 할 수 있을 것으로 기대된다.

빅데이터 토픽모델링과 감성분석을 활용한 물공급과정에서의 수질사고 기사 분석 (Analysis of articles on water quality accidents in the water distribution networks using big data topic modelling and sentiment analysis)

  • 홍성진;유도근
    • 한국수자원학회논문집
    • /
    • 제55권spc1호
    • /
    • pp.1235-1249
    • /
    • 2022
  • 본 연구에서는 웹 크롤링 방법을 이용한 자료수집, 텍스트 마이닝을 활용한 데이터 분석과 같은 빅데이터 분석기법을 이용하여 국내 상수도 수질사고에 대한 전개양상 분석을 수행하였다. 상수도 시스템의 수질사고 빅데이터 뉴스의 추출을 위한 웹크롤링 기법을 적용하고 정확한 수질사고 뉴스를 획득하고자 알고리즘을 절차화하여 제시하였다. 또한 대규모 수질사고의 경우 사고발생에 따른 사고인지, 사고확산, 사고대응, 사고해결 등과 같은 전개양상이 나타나므로, 각 단계에 따른 적절한 뉴스기사를 추출하고, 이에 따른 정보분석을 실시하였다. 즉, 각 단계 별 주요 키워드, 감성분석을 통한 수질사고 전개양상분석을 사례기반으로 상세히 실시하고 그 의미를 분석, 도출하였다. 제안된 방법론을 2020년 발생한 인천광역시 유충사고기간에 적용하여 분석하였다. 그 결과, 수질사고와 같은 소비자에게 직접적인 영향을 미치는 정보의 공개가 제한된 상황에서 사고발생시 장기간의 피해 지속성이 있는 수질사고에 대한 뉴스 기사 언론보도의 논조 및 소비자의 긍부정도가 시간에 따라 명확히 변화됨을 확인할 수 있었다. 이것은 공급자 입장에서의 수질사고의 전개양상은 시설물의 빠른 복구도 매우 중요하지만 소비자의 긍정도를 높이기 위한 소비자 중심의 정책마련의 필요성을 제시하고 있다.

상황인식형 비즈니스 차트 추천기 개발을 위한 개방형 온라인 텍스트로부터의 시각화 규칙 추출 방법 연구 (A Method of Mining Visualization Rules from Open Online Text for Situation Aware Business Chart Recommendation)

  • ;권오병
    • 한국전자거래학회지
    • /
    • 제25권1호
    • /
    • pp.83-107
    • /
    • 2020
  • 데이터의 성격과 시각화의 목적에 따라 비즈니스 차트를 선택하는 것은 비즈니스 분석에 유용한 지식이다. 그러나 현재 시각화 도구에는 상황에 맞는 비즈니스 차트를 선택할 수 있는 기능이 부족하다. 또한 매번마다 시각화 방법에 대해 전문가의 도움을 요청하는 것은 비용과 시간이 소요된다. 따라서 본 연구의 목적은 온라인으로 게시된 문서로부터 비즈니스 차트 선정 규칙에 대한 지식을 추출하여 비즈니스 차트 생산성을 향상시키는 방법을 제안하는 것이다. 이를 위해 인터넷에서 비즈니스 차트를 묘사하는 한국어, 영어 및 중국어 비정형 데이터를 수집하고 TF-IDF를 사용하여 컨텍스트와 비즈니스 차트 간의 관계를 계산했다. 또한 Galois 래티스를 사용하여 비즈니스 차트 선택 규칙을 생성했다. 제안된 방법으로 생성된 규칙의 품질을 평가하기 위해 실험군과 대조군에 대해 실험을 수행했다. 그 결과 제안된 방법으로 의미 있는 규칙이 추출되었음을 확인했다. 본 연구의 결과물로 시각화 전문가의 도움 없이도 사무직 직원들이 비즈니스 차트를 효율적으로 선택할 수 있을 것으로 기대된다. 또한 작업 중인 문서를 기반으로 비즈니스 차트를 추천함으로 직원 교육에 유용할 것이다.

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

양자 컴퓨터 기술 트렌드 예측과 분석 (Trend Forecasting and Analysis of Quantum Computer Technology)

  • 차은주;장병윤
    • 한국시뮬레이션학회논문지
    • /
    • 제31권3호
    • /
    • pp.35-44
    • /
    • 2022
  • 본 연구에서는 양자 컴퓨터 관련 기술 트렌드 분석과 예측을 수행한다. 기존 양자 컴퓨터 기술 분석 관련 연구는 주로 기술 특징을 중심으로 응용 가능 분야에 집중되었다. 본 논문은 시장 중심의 기술 분석과 예측을 위하여 양자 컴퓨터 관련 국내 뉴스 기사를 기반으로 중요하게 다뤄지는 양자 컴퓨터 기술들을 분석하고 미래신호 감지와 예측을 수행한다. 뉴스 기사에서 사용된 단어들을 분석하여 빠르게 변화하는 시장의 변화와 대중의 관심사를 파악한다. 본 논문은 Cha & Chang (2022) 컨퍼런스 발표 자료를 확장했다. 연구는 2019년부터 2021년까지의 국내 뉴스 기사를 수집하여 진행된다. 먼저, 텍스트 마이닝을 통해 주요 키워드를 정리한다. 다음으로, Term Frequency - Inverse Document Frequency(TF-IDF), Key Issue Map(KIM), Key Emergence Map(KEM) 등의 분석을 통해 양자컴퓨터관련 기술을 탐색한다. 마지막으로, 랜덤포레스트, 의사결정나무, 연관분석 등을 통해 미래기술들과 수요 및 공급의 연관성을 파악한다. 연구결과 빈도분석, 키워드 확산도 및 가시성 분석에서 모두 AI의 관심도가 가장 높게 나타났다. 사이버보안의 경우 시간이 지날수록 뉴스기사에서 언급되는 비율이 다른 기술에 비해 압도적으로 높게 나타났다. 또한 양자통신, 내성암호, 증강현실 역시 관심도의 증가율이 높게 나타났다. 따라서 이를 트렌드 기술의 적용에 대한 시장의 기대가 높음을 알 수 있다. 본 연구의 결과는 양자컴퓨터 시장의 관심 분야 파악과 기술 투자 관련 대응체계 구축에 응용될 수 있다.

네트워크 분석을 활용한 국내·외 복합재난 연구 동향 분석 (A Comparative Analysis of Complex Disaster Research Trends Using Network Analysis)

  • 김우식;최연우;홍유정;윤동근
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.908-921
    • /
    • 2022
  • 연구목적: 도시의 물리적·비물리적 구조간 연결이 확대되고 복잡해짐에 따라 재난으로 인한 피해가 복합적으로 발생하는 복합재난의 위험성이 증가하고 있다. 이러한 복합재난에 대비하기 위해서는 복합재난으로 전개될 수 있는 재난들을 선제적으로 식별하여 관리하는 것이 중요하다. 이러한 배경에서 본 연구는 국내외 복합재난 관련 연구의 동향을 분석함으로써 복합재난으로 연구된 재난 유형을 분석하고, 이를 통해 향후 복합재난 관리의 방향성을 제시하고자 한다. 연구방법: 본 연구는 재난과 관련된 국내외 학술지에 최근 20년(2002-2021년)간 등재된 복합재난 관련 993편의 서지정보에 기반하여 동시출현 빈도분석을 수행하여 재난 유형 간 네트워크를 구축하였으며, 네트워크 분석을 통해 복합재난 연구 동향에 관한 국내외 및 시기별 비교분석을 수행하였다. 연구결과: 국내에서는 풍수해(집중호우, 태풍등), 기반시설 붕괴, 화재와 관련한 복합재난 연구의 비중이 높았으며, 최근 들어 지진과 산사태와 관련된 복합재난 연구가 증가하는 것으로 분석되었다. 반면, 국외에서는 풍수해 및 지진과 더불어 기반시설 붕괴에 관한 연구의 비중이 높았으며, 지진해일과 정전 등 재난 연계 유형이 다양하게 나타났다. 결론:본 연구는 복합재난 연구 동향에 대한 이해도를 높이고, 앞으로 국내 복합재난 연구가 가져야 할 방향성을 제안하는 데 활용할 수 있을 것으로 기대된다.

비정형 빅데이터를 이용한 치면열구전색(치아홈메우기)에 대한 인식분석 (A Study on the Perception of Pit and Fissure Sealant using Unstructured Big Data)

  • 조한아
    • 대한치위생과학회지
    • /
    • 제6권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 연구배경: 본 연구는 치면열구전색(치아홈메우기)에 대한 전반적인 인식을 살펴봄으로써 현재 정체되어 있는 치면열구전색의 활성화를 위한 방안을 제시하고자 수행되었다. 연구방법: 치면열구전색 보장성 정책의 변화에 따른 사회적 인식을 확인하고자 5개 차수로 시기를 분류하였다. 1차시기(2009.12.1.~2010.11.30.), 2차시기(2010.12.1.~2012.9.30.), 3차시기(2012.10.1.~2013.5.5.), 4차시기(2013.5.6.~2017.9.30.), 5차시기(2017.10.1.~2022.12.31.)로 각각 설정하였다. 비정형 빅데이터 분석방법인 텍스트마이닝 분석방법을 활용하였다. 텍스톰을 사용하여 키워드를 수집 및 분석하였으며, 상위 키워드 30개의 빈도수, 의미 연결망의 구조적 특징, 중심성 분석, QAP 상관분석 및 동시출현 단어분석을 실시하였다. 연구결과: 빈도분석 결과 시기별로 상위권에 속한 키워드는 '충치', '치료', '어린이' 등이 공통적으로 나타났다. 치면열구전색의 시기별 의미연결망 구조적 특징에서 밀도지수는 모든 시기별 약 1.00으로 확인되었다. QAP 상관분석결과 1차시기와 2차시기, 4차시기와 5차시기의 상관계수가 0.834로 가장 높은 상관을 보였다. 동시출현 단어분석결과 모든 시기에 걸쳐 '충치'와 '예방'이 1위로 나타났다. 결론: 본 연구를 통해 치면열구전색은 충치예방을 위한 술식과 예방치료로써 사회적 인식이 잘 형성되었음을 알 수 있었다. 그러나 보건교육에 대한 인식은 낮았다. 정체된 치면열구전색을 활성화하기 위해서는 효과적인 교육을 강화해 나가야 하는 노력이 필요하겠다.