• 제목/요약/키워드: 텍스트마이닝분석

검색결과 1,003건 처리시간 0.027초

텍스트마이닝을 활용한 빅데이터 기반의 디지털 트랜스포메이션 연구동향 파악 (Identifying Research Trends in Big data-driven Digital Transformation Using Text Mining)

  • 김민준
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.54-64
    • /
    • 2022
  • 빅데이터 기반의 디지털 트랜스포메이션은 데이터 및 데이터 관련 기술을 통해 기업의 성과 향상, 조직 변화, 사회 공헌 등의 목적 달성을 위해 수행하는 혁신적 프로세스를 의미한다. 성공적인 빅데이터 기반의 디지털 트랜스포메이션을 위해서는 관련 연구 현황, 주요 연구토픽, 주요 연구토픽 간의 관계를 이해하는 것이 필수적이다. 그러나 여러 연구들의 서로 다른 관점 및 이들 간 연계 가능성에 대해 이해하려는 노력은 아직 미진하다. 본 논문은 텍스트마이닝을 활용하여 관련 연구동향을 분석하고, 여러 연구의 다양한 관점을 통합적으로 이해하기 위한 기반 마련을 시도해보았다. Web of Science Core Collection에서 추출한 439편의 논문을 분석하여, 10개의 주요 연구토픽을 도출하였고, 이들 간의 관계를 분석하였다. 본 연구의 결과가 빅데이터 기반의 디지털 트랜스포메이션에 대한 통합적인 이해를 촉진하고, 성공을 위한 방향성 모색에 기여할 것으로 기대한다.

텍스트 마이닝을 활용한 웹툰 애플리케이션 사용자 리뷰 분석 (Analysis of User Reviews for Webtoon Applications Using Text Mining)

  • 신효림;최준호
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.457-468
    • /
    • 2022
  • 웹툰 산업이 급속도로 성장하며, 이러한 성장세와 함께 새로운 웹툰 애플리케이션 모델이 제시되었다. 웹툰 애플리케이션 1.0과 2.0을 지나 3.0의 시대가 시작된 것이다. 이러한 변화에도 불구하고 아직까지 웹툰 애플리케이션을 대상으로 한 사용자 리뷰 분석 연구는 부족한 실정이다. 이에 이 연구는 웹툰 애플리케이션 3.0 모델을 제시한 '카카오웹툰(다음웹툰)'을 대상으로 사용자 리뷰를 분석하고자 한다. 분석을 위해 애플리케이션 리뷰 20,382개를 수집한 후 전처리 과정을 버전 별로 TF-IDF, 네트워크 분석, 토픽 모델링, 감성 분석을 실시하였다. 이를 통해 웹툰 애플리케이션 변화에 따른 사용자 경험을 탐구하고 리뷰를 통한 사용성 평가를 진행하였다.

기업가 연설문의 주제와 시청자 댓글 간의 관계 분석: 유튜브 콘텐츠를 중심으로 (Entrepreneur Speech and User Comments: Focusing on YouTube Contents)

  • 김성범;이정환
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.513-524
    • /
    • 2020
  • 최근 유튜브의 성장이 주목받고 있다. 유튜브는 콘텐츠를 소비하는 채널일 뿐만 아니라 소비자의 의사를 표시하는 공간이 되고 있다. 소비자들은 댓글이라는 형식으로 유튜브 안에서 그들의 의견을 표출한다. 이 연구는 유튜브에 업로드되어 시청되는 글로벌 기업가 연설문과 영상을 시청하고 작성한 댓글의 텍스트를 연구대상으로 한다. 텍스트 마이닝 소프트웨어인 Leximancer를 사용하여 각각의 연설문과 댓글을 대상으로 내용 분석(content analysis)을 시행하였다. 각 기업가 연설문의 주제는 대응분석(correspondence analysis)을 사용하여 분석하였고 기업가 개인의 성향과 특성과 관련 있는 주제를 도출하였다. 댓글에서는 각 연설문의 내용과는 관계없이 공통적으로 money, work, need의 주제를 발견하였다. 텍스트의 길이가 다름을 고려하여 추가로 중요도 지표 (Prominence Index) 분석을 실행하였고 연설문 내용과 시청자 댓글의 공통적인 주제를 구성하는 핵심어로 time, future, better, best, change, life, business, need를 도출하였다. 유튜브 연설문의 시청자는 인생과 시간, 미래, 고객의 니즈, 긍정적 변화에 대한 메시지에 대하여 동일한 주제로 반응하는 것으로 나타났다.

한국 플랫폼 정부의 방향성 모색 : 공공기관 연구보고서에 대한 토픽 모델링과 네트워크 분석 (An Exploratory Study of Platform Government in Korea : Topic Modeling and Network Analysis of Public Agency Reports)

  • 남현동;남태우
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.139-149
    • /
    • 2020
  • 새로운 플랫폼 정부는 지능적인 정보기술을 활용하여 정부와 국민이 서로 협력하는 새로운 생태계 기반 정부 혁신과 지속 가능한 발전을 견인하는 역할을 할 것이다. 이에 플랫폼 정부의 플랫폼 구축을 위해 최근 관련 연구 동향에 대해 살펴보고 향후 미래정책 방향 및 연구기반을 마련하기 위한 토대를 구축하고자 한다. 연구 분석을 위해 각 부처와 정부산하기관에서 발행된 연구보고서를 텍스트마이닝 기법을 활용하여 텍스트 자료를 수집하고, 수집된 텍스트 자료를 토픽 모델링과 네트워크 분석을 시행하였다. 분석결과 미래전략과 집단 내에서의 네트워크 연결이 제대로 이루워지지 않고 있으며 연결 중심성이 강할수록 관계성이 약해지는 것을 도출하였다. 이는 정부가 플랫폼을 설계하고 데이터와 서비스를 공급하는 공급 역할에서 통합적, 상호 교류적 접점이 필요하며 정부와 시민, 기업의 협치가 가능한 생태계가 조성되어야 할 것이다. 본 연구를 통해 플랫폼 정부의 공급과 수요적 접근의 이해를 높이고 잠재적 토픽에 따라 적절한 변경관리 방법을 구현하기 위한 논의가 다각적으로 이루어지길 기대한다.

텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 소비자의 의복 맞음새(Fit)평가에 영향을 미치는 특성 (Using Text Mining and Social Network Analysis to Identify Determinant Characteristics Affecting Consumers' Evaluation of Clothing Fit)

  • 황수현;박주연
    • 감성과학
    • /
    • 제26권1호
    • /
    • pp.101-114
    • /
    • 2023
  • 본 연구의 목적은 텍스트 마이닝과 소셜 네트워크 분석을 활용한 소비자 맞음새 평가의 주요 특징을 규명하는 것이다. 이를 위해 SNS에서 수집된 소비자의 2,000여건의 의복 맞음새 평가 후기로부터 의복 맞음새 관련된 텍스트 데이터를 추출하고 의미연결망 분석과 CONCOR 분석을 수행하였다. 연구 결과, '팬츠'와 '스커트'가 많은 맞음새평가어를 공유하며 다양한 형태로 평가되는 것을 확인하였고 의복의 길이가 가장 많이 평가되었다. 인체부위 중 '허리'는 다양한 의복의 맞음새를 평가하는 가장 중요한 부분이며 의복 맞음새평가어 중 '넓은', '큰', '와이드한', '긴' 등이 가장 많이 사용되는 것으로 나타났다. 본 연구는 소비자 맞음새 평가에 사용된 언어의 구조적 관계와 의미를 구체적으로 규명하고 의복 맞음새의 향상을 위한 실증적 기초 자료를 제공하는데 의의가 있다.

WTO에서 한국은 무슨 말을 해왔나?: 각료회의 대표발언문 분석을 중심으로 (What has Korea told in the WTO? : An analysis on the Ministerial Conference Statements)

  • 서정민
    • 무역학회지
    • /
    • 제48권1호
    • /
    • pp.29-53
    • /
    • 2023
  • 본 연구는 WTO 최고 의사결정기구인 WTO 각료회의(MC)에서 회원국 대표들의 발언을 분석하여 지난 27년 동안 한국이 WTO에 대해 보여준 입장과 태도를 살펴본다. 이를 위해 WTO 문서 데이터베이스에서 회원국이 작성한 약 1,800개의 성명서 문서를 추출하여 텍스트 데이터셋을 구축한 후, 다른 회원국과 비교하여 한국 발언의 특징을 파악하기 위해 텍스트 마이닝 기법을 적용한다. 발언 수, 발언 길이 등 형식적 특징을 통해 한국의 WTO에 대한 관심 지속성, WTO에 대한 관심 정도 등 기본적인 태도를 측정하는 한편, 실체적 특징으로 LDA 토픽 모델을 통한 한국 발언의 주제들을 분류하고, 다른 회원국 발언과의 비교분석을 통해 각료회의 회기별 한국 대표 발언의 키워드를 분석한다.

텍스트 마이닝 기법을 이용한 컴퓨터공학 및 정보학 분야 연구동향 조사: DBLP의 학술회의 데이터를 중심으로 (Investigation of Topic Trends in Computer and Information Science by Text Mining Techniques: From the Perspective of Conferences in DBLP)

  • 김수연;송성전;송민
    • 정보관리학회지
    • /
    • 제32권1호
    • /
    • pp.135-152
    • /
    • 2015
  • 이 논문의 연구목적은 컴퓨터공학 및 정보학 관련 연구동향을 분석하는 것이다. 이를 위해 텍스트마이닝 기법을 이용하여 DBLP(Digital Bibliography & Library Project)의 학술회의 데이터를 분석하였다. 대부분의 연구동향 분석 연구가 계량서지학적 연구방법을 사용한 것과 달리 이 논문에서는 LDA(Latent Dirichlet Allocation) 기반 다항분포 토픽모델링 기법을 이용하였다. 가능하면 컴퓨터공학 및 정보학과 관련된 광범위한 자료를 수집하기 위해서 DBLP에서 컴퓨터공학 및 정보학과 관련된 353개의 학술회의를 수집 대상으로 하였으며 2000년부터 2011년 기간 동안 출판된 236,170개의 문헌을 수집하였다. 토픽모델링 결과와 주제별 문헌 수, 주제별 학술회의 수를 조사하여 2000년부터 2011년 사이의 주제별 상위 저자와 주제별 상위 학술회의를 제시하였다. 주제동향 분석 결과 네트워크 관련 연구 주제 분야는 성장 패턴을 보였으며, 인공지능, 데이터마이닝 관련 연구 분야는 쇠퇴 패턴을 나타냈고, 지속 패턴을 보인 주제는 웹, 텍스트마이닝, 정보검색, 데이터베이스 관련 연구 주제이며, HCI, 정보시스템, 멀티미디어 시스템 관련 연구 주제 분야는 성장과 하락을 지속하는 변동 패턴을 나타냈다.

텍스트 마이닝을 활용한 대학 화학 실험 수업의 서술형 강의 평가 내용 분석 (Analysis of Descriptive Course Evaluation of University Chemistry Laboratory Class using Text Mining)

  • 윤정현;박금주
    • 대한화학회지
    • /
    • 제66권3호
    • /
    • pp.218-227
    • /
    • 2022
  • 이 연구는 대학 화학 실험 수업에 참여한 수강생이 작성한 강의평가의 서술형 내용 중 수업의 좋은 점과 개선사항에 대해 텍스트 마이닝 기법을 적용하여 학생들의 의견을 분석하고, 수업의 개선 방안을 도출하는 데 목적이 있다. 연구 방법은 텍스트 마이닝 기법을 적용하여 핵심단어의 출현 빈도, 동시 출현 빈도, 네트워크 분석을 실시하였다. 연구결과, 화학 실험 수업의 좋은점 네트워크에서는 수업과 교수님 간 언급이 가장 많았고, 설명, 이해, 학생, 열정, 재미, 조교, 실험, 도움 등과 함께 언급되었다. 화학 실험 수업의 개선점 네트워크에서는 수업과 학생 간 언급이 가장 많았고, 교수님, 내용, 설명, 시험, 좋겠다, 실험, 이해, 어렵다, 생각, 문제 등과 함께 언급되었다. 즉, 학생들은 '쉽고 자세한 설명'과 '조교의 도움'으로 인해 실험 수업 내용이 잘 이해되고, 실험 과정에 재미와 만족을 느꼈다는 의견을 수업의 좋은 점으로 제시하였다. 반면에 '수업 내용과 시험의 어려움', '과도한 과제', '수업 환경'으로 인해 수업 내용에 대한 이해도와 집중도가 떨어진다는 부정적인 의견을 수업의 개선점으로 제시하였다.

텍스트 마이닝과 네트워크 이론을 활용한 권역별 국가하천 점용허가 키워드 분석 (Analysis of Keywords in national river occupancy permits by region using text mining and network theory)

  • 정성윤
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.185-197
    • /
    • 2023
  • 점용허가 정보를 기록하는 단순 용도로만 사용되고 있는 허가 대장에서 허가 내용에 내재한 점용 신청과 허가업무 수행에 유용한 정보를 추출하기 위해 텍스트 마이닝과 네트워크 이론을 활용하여 본 연구를 진행하였다. 텍스트 마이닝 기반으로 불용어 제거와 형태소 분석 등 정규화 과정을 비롯하여 서울·경기, 경상, 전라, 충청, 강원 등 5개 권역별로 어휘 출현 빈도와 토픽 모델링을 분석, 비교하였다. 네트워크 이론에 가정 많이 사용되는 단계, 근접, 매개 및 고유벡터 등 4종의 중심성 알고리즘을 적용하여 네트워크에서 중심적인 위치에 있거나 중간 매개체 역할을 하는 키워드를 살펴보았다. 이러한 어휘 출현 빈도, 토픽 모델링 및 네트워크 중심성을 종합적으로 분석하여 모든 권역에서 '설치' 키워드가 가장 영향력이 큰 것을 알 수 있었다. 이는 환경부의 허가관리청에서는 시설물을 건설하거나 공작물을 설치하는 허가가 많아서 나타난 결과라고 판단된다. 또한, 도로 시설, 치수 시설, 지하 매설 시설, 전력·통신 시설, 체육·공원 시설 등과 연관된 키워드가 토픽 모델링과 네트워크에서 중심적 위치에 있거나 중간 매개체의 역할을 하는 것을 알 수 있었다. 키워드 대부분은 출현 빈도와 분포 비율이 낮은 짚프의 원칙(Zipf' Law)의 통계분포 형태를 보이는 것으로 보였다.

학교폭력과 자살사고를 예방하기 위한 감성분석 시스템의 설계 (Design of a Sentiment Analysis System to Prevent School Violence and Student's Suicide)

  • 김영택
    • 컴퓨터교육학회논문지
    • /
    • 제17권6호
    • /
    • pp.115-122
    • /
    • 2014
  • 현 청소년들의 학교내 생활환경에서 문제점으로 대두되는 폭력 및 자살사고 발생률 증가에 대한 예방차원의 빅 데이터 처리 분석 시스템을 목표로 연구하였고 설계의 경제성과 용이성, 적용의 신속성 등을 고려해서 많은 이용률을 가지고 있는 오픈 소스인, 하둡 시스템(Hadoop system)의 맵리듀스(MapReduce) 알고리즘과 분산 병렬 환경을 위한 HDFS(Hadoop Distibuted File System) 구성을 사용하여 실험하였다. 연구에서 사용된 분석기법은 기존의 통계적인 분석기법들이 가지는 난이도를 피하기 위해 상업적인 사회 망의 비정형 대화 자료를 이용해서 폭력성 어휘에 대한 단어 수(word count) 분석을 적용하여 폭행, 자살사고를 사전에 감지하여 예방하는 감성분석(sentiment analysis) 시스템을 텍스트 마이닝 관점에서 제안하여 실험하였다.

  • PDF