• 제목/요약/키워드: 텍스트마이닝분석

검색결과 985건 처리시간 0.025초

텍스트마이닝 방법론을 활용한 웨어러블 관련 키워드의 트렌드 분석 (Analyzing the Trend of Wearable Keywords using Text-mining Methodology)

  • 김민정
    • 디지털융복합연구
    • /
    • 제18권9호
    • /
    • pp.181-190
    • /
    • 2020
  • 본 연구는 신문기사로부터 수집한 웨어러블 관련 텍스트를 대상으로 텍스트마이닝을 수행하여 웨어러블 관련 키워드의 트렌드를 분석하였다. 이를 위해 1992년부터 2019년까지 신문기사 11,952건을 수집하여 빈도분석과 바이그램 분석을 적용하였다. 빈도분석 결과 삼성전자, LG전자, 애플이 최상위 빈도어로 추출되었으며 스마트워치, 스마트밴드가 기기 측면에서 지속적으로 등장하였음을 알 수 있었다. 또한 IT전시회가 매년 고빈도어로 나타났으며 차세대 기술 관련 키워드와 융합된 내용이 기사화되는 것을 볼 수 있었다. 바이그램 분석 결과, 세계-최초, 세계-최대 같은 단어 묶음이 지속적으로 등장하였으며 이슈나 이벤트가 발생할 때마다 관련된 새로운 단어 묶음이 도출됨을 확인할 수 있었다. 이러한 웨어러블 관련 키워드의 트렌드 추이 파악은 웨어러블 동향과 향후 방향성을 이해하는데 유용할 것이다.

소셜 네트워크 분석을 이용한 4차 산업혁명 기술 분야의 연구 동향 분석 (The Analysis of Research Trends in Technology to the Fourth Industrial Revolution using SNA)

  • 김홍광;안종욱
    • 지적과 국토정보
    • /
    • 제49권1호
    • /
    • pp.113-121
    • /
    • 2019
  • 본 연구에서는 국내 외 4차 산업혁명 관련 기술 분야의 연구 동향을 분석하기 위해서 웹 기반의 텍스트 마이닝 및 소셜 네트워크 분석 기법을 이용하였다. 이를 위해 2014년 1월 1일부터 2018년 12월 31일까지 국내 외 4차 산업혁명 관련 기술에 대한 연구 논문 및 보고서의 제목 텍스트와 날짜를 대상으로 하여 텍스트 마이닝을 수행하였다. 이후 개념적인 차원에서의 키워드 간 연관성을 분석하기 위해서 형태소 분석을 통한 대표 키워드를 도출하였다. 이후 사회 연결망 분석을 활용하여 핵심 키워드 및 연관 키워드 등을 도출하였다. 그 결과, 우리나라에서는 4차 산업혁명 기술 관련 연구 개발 및 법 제도적 완화 등에 대한 초점을 두고 있다고 유추할 수 있다. 반면, 국외는 단위 서비스 형태로의 접근을 통해 도시에 대한 실질적 적용 기술에 초점을 두고 있음을 파악할 수 있었다.

비교 문장으로부터 비교 요소 자동 추출 (Extracting Comparative Elements from Comparative Sentences)

  • 양선;고영중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.225-228
    • /
    • 2011
  • 본 논문은 비교 마이닝(comparison mining) 의 일환인 비교 요소 자동 추출에 관하여 연구한다. 비교 마이닝은 텍스트 마이닝의 한 분야로서 대용량의 텍스트를 대상으로 비교 관계롤 자동 분석하며, 비교 문장인지 아닌지를 식별하는 단계, 비교 타입을 분류하는 단계, 다양한 비교 요소들을 추출하는 단계, 추출된 요소를 분석 및 요약하는 단계 등을 거치게 된다. 본 연구에서는 특정 타입의 비교 문장이 주어졌을때, 그 문장에서 비교 요소를 자동으로 추출하는 단계의 과제를 수행하며, 우열 비교 타입 및 최상급 타입 문장들을 대상으로 비교 주체, 비교 대상, 비교 술어를 추출한다. 실험 과정으로는, 우선 비교 요소 후보들을 선정하고, 그 후 각 요소별로 확률을 계산하여 가장 높은 수치를 기록한 요소를 정답으로 채택하게 된다. 확률 계산은 지지 벡터 기계 (Support Vector Machine)를 이용한다. 인터넷 상의 다양한 도메인에서 추출된 비교 문장들을 대상으로 비교 요소 추출을 수출한 결과, 정확도 86.81 %의 우수한 성능을 산출 할 수 있었다.

지능형 지식서비스를 위한 의미기반 XML 마이닝 시스템 연구 (Development of Semantic-Based XML Mining for Intelligent Knowledge Services)

  • 백주련;김진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.59-62
    • /
    • 2018
  • XML을 대상으로 하는 연구가 최근 5~6년 사이에 꾸준한 증가를 보이며 이루어지고 있지만 대다수의 연구들은 XML을 구성하고 있는 엘리먼트 자체에 대한 통계적인 모델을 기반으로 이루어졌다. 이는 XML의 고유 속성인 트리 구조에서의 텍스트, 문장, 문장 구성 성분이 가지고 있는 의미(semantics)가 명시적으로 분석, 표현되어 사용되기 보다는 통계적인 방법으로만 데이터의 발생을 계산하여 사용자가 요구한 질의에 대한 결과, 즉 해당하는 정보 및 지식을 제공하는 형식이다. 지능형 지식서비스 제공을 위한 환경에 부합하기 위한 정보 추출은, 텍스트 및 문장의 구성 요소를 분석하여 문서의 내용을 단순한 단어 집합보다는 풍부한 의미를 내포하는 형식으로 표현함으로써 보다 정교한 지식과 정보의 추출이 수행될 수 있도록 하여야 한다. 본 연구는 범람하는 XML 데이터로부터 사용자 요구의 의미까지 파악하여 정확하고 다양한 지식을 추출할 수 있는 방법을 연구하고자 한다. 레코드 구조가 아닌 트리 구조 데이터로부터 의미 추출이 가능한 효율적인 마이닝 기법을 진일보시킴으로써 다양한 사용자 중심의 서비스 제공을 최종 목적으로 한다.

  • PDF

텍스트 마이닝을 활용한 한국학 주경로(Main Path) 분석: '한국'을 키워드로 포함하는 SCOPUS 문헌을 대상으로 (The Main Path Analysis of Korean Studies Using Text Mining: Based on SCOPUS Literature Containing 'Korea' as a Keyword)

  • 김혜진
    • 정보관리학회지
    • /
    • 제37권3호
    • /
    • pp.253-274
    • /
    • 2020
  • 이 연구는 한국학의 주류를 이루는 연구영역들의 기원과 발전경로를 파악하기 위하여 텍스트 마이닝과 주경로 분석(main path analysis, MPA) 기법을 수행하였다. 이를 위하여 전통적인 인문학 연구방법론이 아닌 디지털 텍스트를 기반으로 한 정량적 분석을 시도하였고 인용 데이터베이스를 활용하여 인용정보가 포함된 한국학 관련 문헌들을 수집하고 직접 인용 네트워크를 구축하여 한국학 분야 주경로를 추출하였다. 주경로 추출 결과, 한국학 인문분야에서는 키루트(key-route) 주경로 탐색에서 두 개의 주경로 군집(①한국 고대 농경문화(역사·문화·고고학), ②한국인의 영어습득(언어학))이 발견되었고, 한국학 인문·사회분야에서는 키루트 주경로 탐색에서 네 개의 주경로 군집(①한국 지역(공간)개발·조경, ②한국 경제발전(경제원조·소프트파워), ③한국의 산업(정치경제학), ④한국의 인구구성(남아선호)·북한경제(빈곤·중국협력))이 발견되었다. 이 연구의 결과가 한국학의 정체성을 파악하는데 기존의 지엽적 분석에서 벗어나 한국학이라는 학문에서 논의되고 있는 주 영역의 발전과 진화를 거시적으로 분석·제시함으로써 한국학이 가지는 포괄성과 모호성을 다소 해소하고 한국학 외연을 가시적으로 조망하는데 기여할 수 있으리라 기대한다.

특허 및 뉴스 기사 텍스트 마이닝을 활용한 정책의제 제안 (Policy agenda proposals from text mining analysis of patents and news articles)

  • 이새미;홍순구
    • 디지털융복합연구
    • /
    • 제18권3호
    • /
    • pp.1-12
    • /
    • 2020
  • 본 연구의 목적은 텍스트 마이닝을 활용하여 특허와 뉴스 기사 분석을 통해 블록체인 기술 동향을 탐색하고 사회적 관심을 파악하여 블록체인 정책의제를 제안하는 것이다. 이를 위해 국내 블록체인 특허 요약문 327건과 온라인 뉴스기사 전문 5,941건을 수집하고 전처리 과정을 거쳐 LDA 토픽모델링 방법을 사용하여 특허 토픽 12개와 뉴스 토픽 19개를 추출하였다. 특허 분석을 통해 인증과 거래 관련 토픽이 높은 비중을 차지하였다. 뉴스 기사 분석 결과, 사회적 관심은 암호화폐에 치중되어 있는 것으로 나타났다. 이러한 분석 결과와 의제설정이론에 근거하여 블록체인 관련 정책의제를 도출하였다. 본 연구는 대용량 텍스트 문서 분석의 자동화된 기법을 활용하여 분석을 효율적·객관적으로 수행하였으며, 블록체인 기술 동향과 사회적 관심도를 파악한 실증된 기초 분석 자료를 기반으로 정책의제를 제안하였다. 본 연구에서 제시된 정책의제는 향후 정책 결정과정에의 기초자료로 활용될 수 있을 것이다.

빅데이터 기반 시민의견 모니터링 방안 연구 : "경기지역화폐"를 중심으로 (A Study on Monitoring Method of Citizen Opinion based on Big Data : Focused on Gyeonggi Lacal Currency (Gyeonggi Money))

  • 안순재;이새미;유승의
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.93-99
    • /
    • 2020
  • 본 연구에서는 비정형적인 대용량의 텍스트 자료로부터 유의미한 정보를 추출하는 빅데이터 분석방법 중 텍스트 마이닝을 이용하여 시행 중인 정책과 제도에 대한 시민의견을 모니터링 할 수 있는지 확인하였다. '경기지역화폐'와 관련된 5,108건의 신문기사와 748건의 온라인 카페글을 수집하여 빈도분석, TF-IDF분석, 연관분석, 워드트리 시각화 분석을 수행하였다. 그 결과로 기사에서는 지역화폐의 도입 목적, 제공되는 혜택, 사용방법에 관련된 내용이 많았고 카페글에서는 지역화폐의 실사용과 관련된 내용 위주로 작성이 되어있음을 확인하였다. 또한 지역화폐 활성화를 위해서 뉴스는 정보전달자로서 지역화폐의 홍보에 관여하고 있었고 카페글은 지역화폐 사용자인 시민들의 의견으로 이루어져 사용과 관련된 실제적인 정보 교환의 장으로 기능하고 있었다. 지역화폐뿐만 아니라 다양한 정책과 제도에 관해서도 SNS와 텍스트 마이닝을 통해 시민들의 의견을 수렴하여 효과적으로 활성화시킬 수 있을 것으로 보인다.

텍스트마이닝을 이용한 한국 대통령의 해양관에 관한 연구 (A Study on Text Mining Analysis of Presidential Maritime Concept in KOREA)

  • 김성국;이태휘
    • 한국항만경제학회지
    • /
    • 제36권3호
    • /
    • pp.39-54
    • /
    • 2020
  • 대통령 중심제의 정치체제에서는 대통령의 언어가 국가정책의 형성과 의사결정 과정에 지대한 영향을 미치게 된다. 대통령의 이념과 중심가치에 따라 정책우선순위가 결정되고 그 우선순위에 따라 다양한 정책이 수립되고 집행된다. 그래서 대통령의 연설문을 내용분석하는 연구가 관심의 대상이 되고 있다. 대통령의 연설문은 언어 자료이기 때문에 비정형이면서 비구조화 된 텍스트를 분석하기 위해서는 기계학습과 딥러닝의 방법을 통해 빅데이터 분석이 이루어지고 있다. 본 연구에서는 1996년부터 24년간에 걸쳐 "바다의 날" 기념식의 대통령 연설문을 확보하여 텍스트마이닝 방법의 일종인 토픽모델링의 방법으로 분석하였다. 분석결과 역대 대통령은 모두 자신의 국정운영 방향에 부합되는 해양관을 가지고 연설문을 발표하였다는 것을 확인하였다. 해양의 고유가치인 해양-산업-자원 토픽은 훼손되지 않고 지속적으로 역대 대통령이 모두 강조하고 있음을 확인하였다.

문장으로부터 여러 단어로 구성된 여러 유형의 요소 추출 (Extracting Multi-type Elements Consisting of Multi-words from Sentences)

  • 양선;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.73-77
    • /
    • 2014
  • 문장을 대상으로 특정 응용 분야에 필요한 요소를 자동으로 추출하는 정보 추출(information extraction) 과제는 자연어 처리 및 텍스트 마이닝의 중요한 과제 중 하나이다. 특히 추출해야할 요소가 한 단어가 아닌 여러 단어로 구성된 경우 추출 과정에서 고려되어야할 부분이 크게 증가한다. 또한 추출 대상이 되는 요소의 유형 또한 여러 가지인데, 감정 분석 분야를 예로 들면 화자, 객체, 속성 등 여러 유형의 요소에 대한 분석이 필요하며, 비교 마이닝 분야를 예로 들면 비교 주체, 비교 상대, 비교 술어 등의 요소에 대한 분석이 필요하다. 본 논문에서는 각각 여러 단어로 구성될 수 있는 여러 유형의 요소를 동시에 추출하는 방법을 제안한다. 제안 방법은 구현이 매우 간단하다는 장점을 가지는데, 필요한 과정은 형태소 부착과 변환 기반 학습(transformation-based learning) 두 가지이며, 파싱 혹은 청킹 같은 별도의 전처리 과정도 거치지 않는다. 평가를 위해 제안 방법을 적용하여 비교 마이닝을 수행하였는데, 비교 문장으로부터 각자 여러 단어로 구성될 수 있는 세 가지 유형의 비교 요소를 자동 추출하였으며, 실험 결과 정확도 84.33%의 우수한 성능을 산출하였다.

  • PDF

텍스트 마이닝으로 OTT 인터랙티브 콘텐츠 다시보기 (Analyzing OTT Interactive Content Using Text Mining Method)

  • 이석창
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.859-865
    • /
    • 2023
  • OTT 시장의 과열로 서비스 사업자들이 콘텐츠 개발에 주력하는 상황에서 시청자들의 능동적인 참여를 독려하는 인터랙티브 콘텐츠가 주목받고 있다. 그에 따라 인터랙티브 콘텐츠에 관한 연구 역시 활발히 이루어지고 있다. 본 연구는 온라인상의 비정형 데이터를 중심으로 텍스트 마이닝을 통해 인터랙티브 콘텐츠에 관한 분석을 목적으로 한다. 가중치에 따른 키워드 특징 도출, OTT와 인터랙티브 콘텐츠의 관계, 그리고 인터랙티브 콘텐츠의 트렌드 변화를 객관적인 데이터에 근거하여 '워드클라우드', '관계도 분석', 그리고 '키워드 트렌드'라는 세부 기법을 활용하여 연구 결과 및 함의점을 도출하였다.