• 제목/요약/키워드: 텍스트마이닝분석

검색결과 985건 처리시간 0.024초

서비스 분야의 주요 이슈와 주제에 대한 흐름 분석: 유튜브 동영상과 학술연구 비교 (Analysis of Trends of Critical Issues and Topics in the Service Sector: Comparing YouTube Videos and Research Publications)

  • 정의범;이돈희
    • 한국산업정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.59-76
    • /
    • 2023
  • 본 연구는 유튜브 동영상과 학문적 연구결과를 활용하여 서비스에 대한 주요 이슈와 주제를 파악하는데 목적이 있다. 2013년부터 2023년 6월까지 서비스 분야와 관련된 2,853편의 유튜브 동영상 콘텐츠와 19,973편의 연구논문을 텍스트 마이닝과 텍스트 네트워크 분석을 활용하였다. 또한, 수집된 데이터를 COVID-19 팬데믹 이전과 이후로 구분하여 서비스에 대한 주요 이슈와 주제가 어떻게 변화되는지를 분석하였다. 수집된 데이터는 텍스트 마이닝과 네트워크 구성 및 분석 절차를 통해 분석을 실시하였다. 분석결과, 유튜브 동영상 콘텐츠와 학술연구를 구분하여 연결 중심성 분석결과, 유튜브 동영상 콘텐츠에서 중심성이 높은 단어는 IT, data, solution 순으로 나타났고, 학술연구 분야에서는 서비스 품질, 품질, 고객만족 순으로 나타났다. 에고 네트워크 분석결과, 유튜브 동영상 콘텐츠의 경우 주요 이슈는 서비스 산업과 관련된 단어를 중심으로 나타났지만, 상대적으로 산업별 세부 분야를 포함하지 않고 있는 것으로 분석되었다. 그러나 학술연구 분야에서는 상대적으로 서비스 분야별 주요 이슈를 다양하게 포함하고 있는 것으로 분석되었다. 본 연구 결과는 서비스 산업에서 고객의 주요 관심사에 대한 변화를 학문적 실무적 관점에서 이해하는데 활용될 수 있다.

정보관리분야의 데이터 마이닝 기법 적용에 대한 연구 (A Study of Data Mining Application in Information Management Field)

  • 최희윤
    • 정보관리연구
    • /
    • 제31권3호
    • /
    • pp.1-20
    • /
    • 2000
  • 정보화가 진행됨에 따라 급속하게 축적되는 대량의 데이터로부터 가치있는 지식을 추출하려는 시도가 다양하게 진행되고 있으며, 그 일환으로 데이터 마이닝 기법이 관심의 대상이 되고 있다. 따라서 날로 증가하는 디지털 문헌에 대한 효율적인 처리와 서비스, 시스템구축이 필요한 정보관리분야에 있어서도 이러한 기법의 적용 필요성은 증대하고 있다. 본 고에서는 다양한 기법의 개발과 함께 활발하게 적용이 시도되고 있는 데이터 마이닝에 대한 이론적 배경 및 실제 적용 사례를 개관해 보고, 최근 들어 그 필요성이 대두되고 있는 정보관리분야에의 데이터 마이닝 기법의 적용 영역 및 활용 가능성을 관련 연구의 분석을 통해 살펴보고자 한다.

  • PDF

소셜네트워크서비스에 활용할 비표준어 한글 처리 방법 연구 (Research on Methods for Processing Nonstandard Korean Words on Social Network Services)

  • 이종화;레환수;이현규
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.35-46
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 관계망을 구축해주는 온라인 서비스인 소셜네트워크서비스(SNS), 자신의 관심사에 따라 자유롭게 글, 사진, 동영상 등을 올릴 수 있는 공간인 블로그(Blog) 등은 자신을 알리고 표현하는 사회현상으로 자리 매김하고 있다. 이러한 SNS나 블로그를 통해 사용자들이 자유롭게 표현한 글들을 분석하여 의미있는 정보와 가치, 그리고 패턴을 찾기 위한 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 의미 분석(Semantic Analysis) 등의 연구가 활발히 이루어지고 있다. 또한, 연구자들의 연구 효율을 보다 높이기 위하여 키워드 기반 연구들도 이루어져있다. 하지만 대부분의 연구들은 한글의 맞춤법에 많은 한계점을 나타내고 있다. 본 연구는 어근을 찾기 힘든 이상한 외계 언어, 무분별하게 표현되는 속어, 알기 힘든 한글 이모티콘 인터넷 언어, 마이닝 처리 과정에서 파악하기 어려운 단어들을 데이터베이스에 구축하여 데이터 사전 기반 마이닝 처리 기법의 한계를 극복하고자 한다. 특정 주제에 대한 주관적 견해로 구성된 블로그를 사례 분석 대상으로 연구를 진행하였으며 유니코드를 활용한 비표준어 추출은 텍스트 마이닝 처리에 유용함을 발견할 수 있었다.

텍스트 마이닝을 적용한 한국교통방송제보 비정형데이터의 분석 (Analysis of the Unstructured Traffic Report from Traffic Broadcasting Network by Adapting the Text Mining Methodology)

  • 노유진;배상훈
    • 한국ITS학회 논문지
    • /
    • 제17권3호
    • /
    • pp.87-97
    • /
    • 2018
  • 교통사고 관련 제보는 비정형 데이터로서 교통사고를 유발한 가해자나 피해자의 관점이 아닌, 교통사고 발생 지점과 구간, 시간대에 있었던 타 운전자의 관점에서 생성된 교통정보의 가치를 가지고 있다. 그러나, 비정형 데이터인 교통제보가 빅 데이터로서 교통사고 통계나 교통관련 연구에 활용되지 못하였으나, 텍스트 마이닝 기법을 활용한 본 연구를 통해 비정형의 빅 데이터를 시각화하고 해석하여, 기존의 정형 데이터에서 분석하지 못한 정보를 도출할 수 있었다. 그리고 교통사고 발생으로 인한 도로상 영향을 파악할 수 있었다. 이러한 분석으로 교통제보의 트랜드를 파악하고, 운전자가 제보하는 "도로명", "지점명", "시간대"를 추출하였으며, 교통사고 발생으로 다른 운전자에게 가장 많은 영향을 미치는 지점과 구간의 파악이 가능하였다. 향후 실제 교통사고 데이터와 결합하여 교통제보와의 상관성 분석 등을 통해 비정형 데이터의 활용방안을 모색할 계획이다.

텍스트 마이닝을 이용한 혁신 분야의 국외 연구 동향 분석 (Research Dynamics in Innovation Studies Using Text Mining)

  • 정효정
    • 기술혁신연구
    • /
    • 제24권4호
    • /
    • pp.249-275
    • /
    • 2016
  • 지난 50년 동안 혁신 분야는 학문의 정착과 진화의 시기를 지나왔다. 시간이 흐름에 따라 연구 주제의 범위가 확장되고 다양해지고 있으며, 양적 측면에서도 증가 추세를 보이고 있다. 혁신 분야와 같이 다학제적인 분야에서 새로운 연구 주제를 탐색하고, 기존 연구의 흐름을 파악하는데 있어 연구 현황 및 동향에 대한 포괄적인 이해는 필수적이다. 본 연구에서는 텍스트 마이닝 기법을 이용해 2000년부터 2015년까지의 국외 혁신 분야의 연구 현황 및 동향을 거시적인 관점에서 분석하였다. 분석 결과, 혁신 분야에서는 전통적인 주제와 최근에 주목받고 있는 주제를 중심으로 연구가 이루어지고 있었으며, 일부 전통적인 주제에서 학문의 분화 현상이 나타났다. 연구 결과는 지난 16년 동안 혁신 분야에서 나타난 연구 주제의 현황 및 동향에 대한 이해를 도모할 것이며, 연구자들에게 새로운 패러다임이 정착하고 진화해가는 과정을 학술적 관점에서 통찰할 수 있는 기회를 제공할 것이다.

텍스트마이닝과 주경로 분석을 이용한 미발견 공공 지식 추론 - 췌장암 유전자-단백질 유발사슬의 경우 - (Inferring Undiscovered Public Knowledge by Using Text Mining Analysis and Main Path Analysis: The Case of the Gene-Protein 'brings_about' Chains of Pancreatic Cancer)

  • 안혜림;송민;허고은
    • 한국비블리아학회지
    • /
    • 제26권1호
    • /
    • pp.217-231
    • /
    • 2015
  • 본 연구에서는 췌장암의 유전자-단백질 상호작용 네트워크를 구성하고, 관련 연구에서 주요하게 언급되는 유전자-단백질의 유발관계 사슬을 파악함으로써, 췌장암의 원인을 규명하는 실증적인 연구로 이어질 수 있는 미발견 공공 지식을 제공하려 하였다. 이를 위하여 텍스트마이닝과 주경로 분석을 Swanson의 ABC 모델에 적용해 중간 개념인 B를 방향성을 가진 다단계 모델로 확장하고 가장 의미 있는 경로를 도출하였다. 본 연구의 주제가 된 췌장암의 사례처럼 시작점과 끝점조차 한정할 수 없는 미발견 공공 지식 추론에서 주경로 분석은 유용한 도구가 될 수 있을 것이다.

텍스트 마이닝을 활용한 영화흥행 예측 연구 (Study on prediction for a film success using text mining)

  • 이상훈;조장식;강창완;최승배
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1259-1269
    • /
    • 2015
  • 최근 빅 데이터는 학계에서 키워드로 자리매김을 하고 있다. 빅 데이터의 유용성은 학계뿐만 아니라 정부, 지자체 그리고 기업체까지 파급되고 있고, 빅 데이터 속에서 유용한 정보를 도출해 내기 위해 노력하고 있다. 본 연구에서는 영화에 대한 리뷰를 가지고 텍스트 마이닝 (text mining)을 이용한 빅 데이터 분석을 수행한다. 본 연구의 목적은 포털 사이트 'D'사와 영화진흥위원회의 영화에 대한 리뷰 데이터, 그리고 고객들의 평점평균 (score)과 스크린 수 (screen number)를 설명변수로 사용하고, 영화 흥행 여부를 종속변수로 하여 로지스틱 회귀분석을 통한 영화 흥행 예측 모형을 제안하는 것이다. 분석결과, 본 연구에서 제안한 예측모형의 정분류율은 95.74%로 얻어졌다.

텍스트 마이닝을 활용한 '학교 공간 혁신' 정책 키워드 분석 - 뉴스 기사를 중심으로 - (An Analysis of Keywords on 'School Space Innovation' Policies using Text Mining - Focused on News Articles -)

  • 이동국
    • 교육녹색환경연구
    • /
    • 제19권2호
    • /
    • pp.11-20
    • /
    • 2020
  • 본 연구의 목적은 텍스트 마이닝을 활용하여 한국의 주요 언론 매체를 통해 드러난 학교 공간 혁신 정책의 실행과 관련 이슈를 알아보는 것이다. 이러한 목적을 달성하기 위하여 언론에서 발행한 학교 공간 혁신 관련 기사 총 519개를 수집하여 빈도 분석과 네트워크 분석을 하였다. 연구 결과를 기반으로 학교 공간 혁신의 특징을 다음과 같이 요약할 수 있다. 첫째, 학교 공간 혁신은 미래교육에 대한 대응으로 추진되고 있다. 둘째, 사용자가 학교 공간 혁신의 주체로 참여한다. 셋째, 전문가는 협력 체제를 갖추어 학교 공간 혁신을 지원하고 있다. 넷째, 학교 공간 혁신에 지역사회를 적극적으로 참여시키고 있다. 다섯째, 교육부와 교육청의 주요 사업으로, 상향식과 하향식이 조화를 이루어 진행되고 있다. 본 연구 결과는 학교 공간 혁신 정책의 주요 이슈를 이해하고, 차후 연구와 실천에 시사점을 제공할 수 있을 것이다.

LSTM과 증시 뉴스를 활용한 텍스트 마이닝 기법 기반 주가 예측시스템 연구 (A study on stock price prediction system based on text mining method using LSTM and stock market news)

  • 홍성혁
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.223-228
    • /
    • 2020
  • 주가는 사람들의 심리를 반영하고 있으며, 주식시장 전체에 영향을 미치는 요인으로는 경제성장률, 경제지료, 이자율, 무역수지, 환율, 통화량 등이 있다. 국내 주식시장은 전날 미국 및 주변 국가들의 주가지수에 영향을 많이 받고 있으며 대표적인 주가지수가 다우지수, 나스닥, S&P500이다. 최근 주가뉴스를 이용한 주가분석 연구가 활발히 진행되고 있으며, 인공지능 기반한 분석을 통하여 과거 시계열 데이터를 기반으로 미래를 예측하는 연구가 진행 중에 있다. 하지만, 주식시장은 예측시스템에 의해서 단기간 적중이 되더라도, 시장은 더 이상의 단기 전략대로 움직여지지 않고, 새롭게 변할 수밖에 없다. 따라서, 본 모델을 삼성전자 주식데이터와 뉴스 정보를 텍스트 마이닝으로 모니터링하여 분석한 결과를 나타내어 예측이 가능한 모델을 제시하였으며, 향후 종목별 예측을 통하여 실제 예측이 정확한지 확인하여 발전시켜 나갈 예정임.

텍스트 마이닝을 이용한 4차 산업 연구 동향 토픽 모델링 (Topic Modeling on Research Trends of Industry 4.0 Using Text Mining)

  • 조경원;우영운
    • 한국정보통신학회논문지
    • /
    • 제23권7호
    • /
    • pp.764-770
    • /
    • 2019
  • 본 연구에서는 "4차 산업"과 관련된 논문들의 세부 연구 주제를 파악하기 위하여 텍스트 마이닝 기법을 이용하여 논문들을 분석하였다. 이를 위하여 2016년부터 2019년까지 한국학술지인용색인(KCI)에서 "4차 산업"이라는 키워드로 논문을 검색하여 총 685편의 논문을 수집하였다. 논문 수집을 위해서는 Python 기반의 웹 스크랩핑 프로그램을 사용하였으며, 자료 분석을 위해서는 R 언어로 구현된 LDA 알고리즘 기반의 토픽 모델링 기법들을 활용하였다. 수집된 논문들에 대한 Perplexity 분석 결과, 9가지 토픽이 최적으로 결정되었고 수집된 논문들의 9가지 대표 토픽들을 Gibbs 샘플링 방법을 사용하여 추출하였다. 분석 결과, 인공지능, 빅데이터, 사물인터넷, 디지털, 네트워크 등이 상위 주요 기술들로 나타났으며, 산업, 정부, 교육 현장, 일자리 등 4차 산업과 관련한 다양한 분야에서 주요 기술들로 인한 변화에 대한 연구들이 이루어져 왔음을 확인할 수 있었다.