• 제목/요약/키워드: natural language

검색결과 1,538건 처리시간 0.029초

텍스트 마이닝 기법을 활용한 고전 추리 소설 작가 간 문체적 차이와 문체 구조에 대한 연구 (A study on detective story authors' style differentiation and style structure based on Text Mining)

  • 문석형;강주영
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.89-115
    • /
    • 2019
  • 본 연구는 고전 추리 소설 작가로 유명한 아서 코난 도일과 애거서 크리스티의 문체적 차이점을 데이터 분석을 통해 제시하고, 나아가 텍스트 마이닝에 입각한 문체 연구의 해석적 방법론을 제시하고자 시행되었다. 추리 소설의 핵심 요소인 사건과 인물에 더해 작가의 문법적인 집필 방식을 문체로 정의하고 분석을 시도하였다. 작가 별로 각 2권, 총 4권의 책을 선정하였으며 문장 단위로 텍스트를 나누어 데이터를 확보하였다. 각 문장에 따른 감성 점수를 부여한 뒤 페이지 진행에 따른 감성을 시각화하였으며, 페이지에 따라 토픽 모델링을 적용하여 소설 속 사건 진행 흐름을 파악할 수 있었다. 동시 발생 매트릭스(co-occurrence matrix)를 구성하고 네트워크 분석(Network Analysis)을 시행함으로써 사건이 진행되는 과정에서 인물들 간 관계의 변화를 확인할 수 있었다. 또한 전체 문장을 총 6가지 문체를 기준으로 문법적인 체계를 나누어 작가 간, 그리고 작품 간 집필 방식의 차이점을 확인하였다. 이러한 일련의 연구 과정은 문체에 대한 이해를 바탕으로 글 전체의 맥락을 파악할 수 있도록 도움을 줄 수 있으며, 나아가 기존에 개별적으로 진행되었던 문체 연구를 통합시킴으로써 문체 구조에 대한 이해를 도울 수 있다. 그리고 이러한 선행된 이해를 통해 온라인 텍스트를 비롯한 비정형 데이터 속 문체의 존재를 발견하고 구체화하는 작업에 기여할 수 있다. 뉴미디어를 포함한 온라인 텍스트를 심도 있게 분석하고자 하는 시도가 증가하고 있는 상황에서 해당 연구들과 연계를 통해 보다 의미 있는 온라인 텍스트 분석에 기여할 것으로 기대된다.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

결혼이주여성의 자기문화 스토리텔링 활용 표현교육 사례 연구 (A Study on the Expression Class through Story-telling about Interracial Married Women's Homeland Cultures)

  • 김영순;허숙;응웬뚜언아잉
    • 비교문화연구
    • /
    • 제25권
    • /
    • pp.695-721
    • /
    • 2011
  • 본 연구는 결혼이주여성들이 출신국의 문화에 대한 자부심을 가지고 한국문화를 공부하기 위해 자신의 출신국 지역문화 스토리텔링(자기문화 스토리텔링) 활용 표현교육 모형을 제안하고자 한다. 이를 통해 결혼이주여성들이 자신의 문화에 대한 자부심을 가지고 한국문화를 공부할 수 있을 것으로 기대한다. 본 연구는 결혼이주여성들의 자기문화 스토리텔링 활용 표현교육 5단계 모형을 활용하여 한국어 고급 학습자 49명에게 한국어 쓰기와 말하기 활동을 주목하였다. 그 중 일본 출신 A씨의 한국어 쓰기 및 말하기 표현교육 사례를 중심으로 각 단계별 활동 결과물을 제시했다. 활동 결과 제시의 방법은 내러티브 기술법을 사용하였다. 본 연구에서 자기문화 스토리텔링은 스토리텔링의 '대중성', '상호작용성', '참여성'을 중심으로 구성하였다. 자기문화 스토리텔링은 결혼이주여성에게 출신국의 문화에 대한 쓰기와 말하기의 재구성을 포함한다. 이를 통해 결혼이주여성들은 자기문화에 대한 자부심 함양과 정체성의 확립에 긍정적인 변화가 있었을 뿐만 아니라 한국어 및 한국문화 이해도가 높아진 것을 확인할 수 있었다.

온라인 과학 기사 텍스트 마이닝을 통해 분석한 에너지 용어 사용의 맥락 (Analyzing Different Contexts for Energy Terms through Text Mining of Online Science News Articles)

  • 오치영;강남화
    • 과학교육연구지
    • /
    • 제45권3호
    • /
    • pp.292-303
    • /
    • 2021
  • 본 연구에서는 일상생활에서 에너지 용어가 사용되는 맥락을 알아보기 위하여 온라인 과학 기사를 수집하여 언어 네트워크, 토픽 모델링 분석 기법을 활용해 에너지 관련 기사에 사용된 용어의 빈도, 용어 네트워크, 기사의 주제를 분석하였다. 분석에 사용된 자료는 2018.3.1.부터 1년간의 온라인 과학 분야의 기사 중 에너지를 검색어로 하여 10개의 국내 중앙지에서 검색 및 선정된 2,171편이다. 이 기사들을 자연어 처리하여 51,224개의 문장과 507,901개의 단어로 데이터를 구성하였다. R 프로그램을 활용하여 용어 빈도수 분석 및 언어 네트워크 분석을 실시하였고, 에너지 용어 사용의 맥락 탐색을 위해 구조적 토픽 모델링 분석을 적용해 기사의 주제를 도출하였다. 기사에 사용된 용어 중 빈도수가 유난히 높은 용어는 기술, 연구, 개발로 새로운 소식을 알리는 기사의 특성을 반영한 것으로 나타났다. 한편, 기사 2편당 한 번 이상의 빈도로 사용되는 용어에는 산업 관련 용어(산업, 제품, 시스템, 생산, 시장)와 '전기', '환경'과 같이 에너지 관련 용어로 충분히 기대되는 용어들이 있었다. 한편, 에너지 관련 과학 수업에서 자주 사용되는 '태양', '열', '온도', '발전'도 빈도수 상위에 속하는 용어로 드러났다. 용어 네트워크 분석에서는 산업 및 기술과 관련된 용어와 기초과학 및 연구 관련 용어들이 약한 강도이지만 서로 군집을 이루는 것을 확인하였다. 한편, 에너지와 쌍을 이루는 용어의 분석에서는 '에너지 효율'을 비롯해 '에너지 절감', '에너지 소비' 등과 같이 에너지의 사용에 관한 용어들이 다수를 이루고 그 사용 빈도가 가장 높았다. 에너지 용어가 사용되는 맥락은 16개의 주제를 분류한 4가지 영역으로 '첨단산업', '산업', '기초과학', '환경 및 건강'으로 나타났다. 에너지 사용 관련 용어가 상당히 많이 사용된다는 결과는 에너지 수업의 시작점으로 에너지 저급화 개념의 도입이 효과적일 수 있음을 시사한다. 또한, 첨단산업이나 환경 및 건강의 맥락을 에너지 학습에 도입할 필요성도 보여준다. 본 연구에서 드러난 16개 주제에서 보이는 다양한 에너지 용어가 사용되는 맥락을 재구성해 에너지 관련 수업에 활용한다면 학생들이 학교에서의 에너지 학습과 일상적 상황을 통합적으로 인식하는 데 도움이 될 것이다.

토픽 모델링을 활용한 한국의 창업생태계 트렌드 변화 분석 (Analysis on Dynamics of Korea Startup Ecosystems Based on Topic Modeling)

  • 손희영;이명종;변영조
    • 지식경영연구
    • /
    • 제23권4호
    • /
    • pp.315-338
    • /
    • 2022
  • 1986년, 한국은 국가발전의 주축인 중소기업 창업지원을 위한 법 제도를 마련하였다. 이를 기반으로 지난 30여년간 창업정책의 수립 및 발전을 거듭하여 매년 100만 개가 넘는 신규 창업기업이 설립되는 역동적인 창업생태계를 구축하였다. 국가의 정책 방향과 사회, 경제, 문화 등의 외부환경 영향, 그리고 창업지원의 역사를 주요 이슈별로 분석하여 도출된 핵심문장 또는 키워드는 시대별 지원의 특징과 국가지원의 중심내용 등을 확인하는 데 매우 유용하다. 본 연구는 한국의 창업생태계 트렌드 변화를 분석하기 위해 1991년부터 2020년 12월까지 30년간의 언론기사에서 '창업', '벤처', '스타트업' 키워드가 포함된 118만여 건을 추출하고 네트워크 분석과 토픽 모델링을 활용하였다. 분석결과, 한국의 창업생태계 트렌드는 기업 및 산업육성, 확산 그리고 규제 완화, 활황 등, 정부 중심으로 스타트업 생태계의 변화와 발전이 이루어졌음을 파악할 수 있었으며, 다빈도 키워드 분석결과, 생태계 구성요인 간의 연계 활동을 통하여 기업가적인 생산성이 창출되었다. 생산성 창출의 주요 요인으로 한국은 대기업의 휴대폰 산업 발전과 이와 관련된 콘텐츠 스타트업의 성장, 인터넷과 쇼핑몰 중심의 플랫폼 기업의 발전, 그리고 청년창업과 글로벌 진출, 모바일과 인터넷 인프라 중심의 창업기업육성 노력 등으로 파악할 수 있었다. 본 연구는 30년간의 언론기사를 텍스트마이닝과 토픽 모델링을 활용하여 트렌드를 도출하였다. 이는 선행연구가 기존 정부와 정책의 변경 시기를 기준으로 트렌드 변화를 분석한 것과 달리, 언론기사의 키워드와 토픽 변화를 기준으로 창업생태계의 트렌드 변화를 분석하였다는 점에서 학술적 의의뿐만 아니라, 30년 간의 창업생태계 변화 및 주요이슈를 조명해 봄으로써 향후 창업지원의 방향성을 예측할 수 있는 실무적 시사점을 제공하였다.

죽방렴의 문화유산적 가치와 비즈니스적 가치 탐색 연구 (A Research of Cultural Heritage and Business Value of the Juk-Bang-Ryeum(Fishing Instrument made-by Bamboo Weir))

  • 강명화;이경주;권호종;정대율
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권12호
    • /
    • pp.425-435
    • /
    • 2018
  • 본 연구는 경남 사천지역에 잔존해 있는 죽방렴의 실제 현황조사와 여러 역사적 문헌 고찰을 통해 죽방렴의 문화적 가치와 비즈니스 가치를 연구하여 지역문화자원으로서의 가치를 입증하고 세계농어업유산과 세계문화유산의 등재에 필요한 기초자료를 만드는 것이 목적이다. 농업과 더불어 수산업은 인류 역사에 있어 지대한 의미를 가진다. 특히, 삼면이 바다로 둘러싸인 우리나라의 지정학적 요인으로 인하여 매우 중요한 산업으로 발전하여 왔다. 그럼에도 불구하고 기르는 양식산업 이전 원시산업의 채집, 수렵할 때부터 이어온 여러 어로방식 중 실제로 남아있는 것은 거의 없는 실정이다. 경남 남해안의 사천과 남해지역에는 오백년 이전부터 지금까지 존재하여 실제로 운영하는 '죽방렴'이 있다. 이것은 예전부터 국가의 중요한 어업자원으로 관리되어져 왔다는 것을 여러 문헌적 연구를 통하여 알 수 있었다. 죽방렴은 자연지리적인 해협의 조류 흐름을 이용하여 고기를 채집하는 과학적 원리에 기초하여 만들어진 것으로 우리조상들의 지혜가 담긴 것이다. 조사결과, 죽방렴과 관련한 독특한 지역공동체의 문화가 존재하였으며, 주민들에게도 중요한 자산으로 관리되어져 왔다. 죽방렴은 이러한 역사, 인문학적 가치뿐만 아니라, 과학적 어로원리 이해교육과 해양어로작업 체험장과 같은 교육적 가치와 주변의 역사유적 및 지질환경자원과 연계하여 지역의 중요한 관광자원으로서 비즈니스적 가치를 지닌다. 결론적으로 죽방렴은 우리의 소중한 문화유산으로서 전승해야할 주요 자산인 것이다.

대학수학교육에서의 챗GPT 활용과 사례 (Use of ChatGPT in college mathematics education)

  • 이상구;박도영;이재윤;임동선;이재화
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권2호
    • /
    • pp.123-138
    • /
    • 2024
  • 본 연구는 S대학 <인공지능을 위한 기초수학[Math4AI]> 강좌의 교수·학습과정에서 맞춤형 챗GPT를 개발하여 활용한 경험을 공유한다. 연구진은 ① 먼저 강좌 맞춤형 챗GPT (https://math4ai.solgitmath.com/)를 개발하였다. 이때 챗GPT가 부정확한 정보를 주지 않도록 수년간의 해당 강좌 주요 데이터(교재, 실습실, 토론 기록, 코드 등)를 우선적으로 학습하는 챗GPT의 기능을 적용하였다. ② 학생들이 교재를 스스로 학습하다 궁금한 부분이 생기면, 맞춤형 챗GPT 인터페이스를 통해 자연어로 수학 용어, 정리, 예제, 열린 문제 번호, 핵심어 등을 질문하여 도움을 얻을 수 있도록 하였다. 그러면 챗GPT는 관련된 주요 문제나 용어, 그리고 이전 학생들의 토론에 기반한 몇 가지 샘플 답안 또는 토론 내용과 함께 사용되었던 코드 샘플을 제공한다. ③ 학생들이 챗GPT를 통해 얻은 내용을 스스로 윤문하여 공유하고, 상호 토론하면서, 교재에서 제시하는 주요 개념과 열린 문제의 대부분을 이해하도록 하였다. ④ 학기 말에는 그간 본인이 얻은 열린 문제들에 대한 학습기록을 모아 PBL (Problem-Based Learning) 보고서로 제출하고, 발표하여 강좌를 수료하도록 하였다. 이러한 방식은 학생들이 학습을 포기하지 않고 한 단계 앞으로 더 나아갈 추진력과 동기를 주며, 궁극적으로 각각의 문제를 스스로 해결하는 자기 주도적 학습을 도울 수 있다. 또한 학생들 각자의 수준에 맞추어 실시간으로 최적화된 조언을 제시하므로 강좌뿐만 아니라 대학수학교육 전반에 대한 학생별 맞춤형 교육(personalized education)을 제공할 수 있다. 즉, 학생들이 담당교수(또는 조교)와 AI 조교의 도움으로 실시간 답변과 효과적인 조언을 받을 수 있게 됨을 의미한다. 이는 양질의 조교 부족에 대한 고민을 추가 비용 없이 획기적으로 해결할 수 있다. 본 연구는 강좌의 교수·학습과정에 교재 맞춤형 챗GPT를 접목한 것으로, 인공지능(AI) 기술을 기타 대학수학 과목들(미적분학, 선형대수학, 이산수학, 공학수학, 기초통계학 등)과 초·중·고 수학교육에 적용할 수 있는 새로운 방법을 제시한다. 특히 AI 기술을 적용하여 이전 수강생들의 학습기록(열린 문제 풀이, 토론 자료, 코드 등)을 참고하며, 각자 실습한 결과를 공유 및 상호 토론하여 문제를 해결하는 방식은, 다양한 전공의 학생들이 내용을 더 효과적으로 이해하고, 본인 전공 관련 문제 해결 능력을 향상시키는 데 획기적인 도움을 줄 것으로 예상된다. 또한 교재 맞춤형 챗GPT와 함께 자기주도적인 학습을 경험토록 하는 교수학습 방법은 평생 교육(lifelong learning, extension school, extension college, extended college) 또는 평생학습의 관점에서 중요하다.

이진 분류문제에서의 딥러닝 알고리즘의 활용 가능성 평가 (Feasibility of Deep Learning Algorithms for Binary Classification Problems)

  • 김기태;이보미;김종우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.95-108
    • /
    • 2017
  • 최근 알파고의 등장으로 딥러닝 기술에 대한 관심이 고조되고 있다. 딥러닝은 향후 미래의 핵심 기술이 되어 일상생활의 많은 부분을 개선할 것이라는 기대를 받고 있지만, 주요한 성과들이 이미지 인식과 자연어처리 등에 국한되어 있고 전통적인 비즈니스 애널리틱스 문제에의 활용은 미비한 실정이다. 실제로 딥러닝 기술은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Boltzmann Machine (DBM) 등 알고리즘들의 선택, Dropout 기법의 활용여부, 활성 함수의 선정 등 다양한 네트워크 설계 이슈들을 가지고 있다. 따라서 비즈니스 문제에서의 딥러닝 알고리즘 활용은 아직 탐구가 필요한 영역으로 남아있으며, 특히 딥러닝을 현실에 적용했을 때 발생할 수 있는 여러 가지 문제들은 미지수이다. 이에 따라 본 연구에서는 다이렉트 마케팅 응답모델, 고객이탈분석, 대출 위험 분석 등의 주요한 분류 문제인 이진분류에 딥러닝을 적용할 수 있을 것인지 그 가능성을 실험을 통해 확인하였다. 실험에는 어느 포르투갈 은행의 텔레마케팅 응답여부에 대한 데이터 집합을 사용하였으며, 전통적인 인공신경망인 Multi-Layer Perceptron, 딥러닝 알고리즘인 CNN과 RNN을 변형한 Long Short-Term Memory, 딥러닝 모형에 많이 활용되는 Dropout 기법 등을 이진 분류 문제에 활용했을 때의 성능을 비교하였다. 실험을 수행한 결과 CNN 알고리즘은 비즈니스 데이터의 이진분류 문제에서도 MLP 모형에 비해 향상된 성능을 보였다. 또한 MLP와 CNN 모두 Dropout을 적용한 모형이 적용하지 않은 모형보다 더 좋은 분류 성능을 보여줌에 따라, Dropout을 적용한 CNN 알고리즘이 이진분류 문제에도 활용될 수 있는 가능성을 확인하였다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.