• 제목/요약/키워드: News Importance

검색결과 112건 처리시간 0.028초

국방분야에서 인포그래픽 적용사례 연구 - 영(英) 가디언지 아프가니스탄전 데이터저널리즘을 중심으로 (A Case Study of Infographics for National Defense - Focusing on the Datajournalism of Afghanistan War in Guardian)

  • 김동환
    • Spatial Information Research
    • /
    • 제22권5호
    • /
    • pp.43-52
    • /
    • 2014
  • 최근 창조경제 시대를 맞이하여 급부상하는 단어가 바로 빅데이터이다. 이에 따라 공간정보 관련 기관들도 공간빅데이터체계를 구축하기 위해 노력하고 있다. 공간빅데이터는 공간정보와 빅데이터가 결합한 형태로써 사용자들이 효율적으로 이해하기 위해서 데이터 시각화 기술이 필수적이다. 최근 데이터 시각화 기술 중에 떠오르는 분야는 바로 인포그래픽이다. 국내에서는 조선닷컴이 2010년 8월부터 인포그래픽 뉴스를 서비스하고 있다. 대한민국 정부도 2013년 정부 부처 업무보고를 시작으로 인포그래픽을 선도적으로 활용하고 있다. 외국 인포그래픽 업체 Visual.ly의 경우 이집트 의원선거 결과를 인터랙티브 인포그래픽을 이용하여 직관적이고 효과적으로 데이터를 시각화했다. 국방분야 인포그래픽 가운데 영국 가디언지가 2010년에 발표한 아프가니스탄 전쟁 관련 인포그래픽을 완성도가 높은 데이터 시각화의 형태로 볼 수 있다. 가디언지가 제작한 인포그래픽을 연구한 결과 국방분야 인포그래픽이 갖추어야 할 5가지 조건을 도출하였다. 첫째, 원천 데이터는 시공간적으로 정확성을 갖추고 있어야 한다. 둘째, 인포그래픽의 이미지는 정보를 압축하여 담고 있어야 한다. 셋째, 인포그래픽은 지휘관을 위해 가공된 정보를 제공해야 한다. 넷째, 질 높은 인포그래픽 생산을 위해 공유과 개방, 소통이 필수적이다. 다섯째, 과거의 자료를 토대로 정보를 생산하고 미래의 사건을 예측할 수 있는 분석적 도구로써의 인포그래픽이 되어야 한다. 인포그래픽은 데이터를 직역하여 보여주는 것이 아닌 사용자의 판단과 결심을 돕는 분석적 도구로써 사용되어야 할 것이다.

포스트 코로나 시대 알베르 카뮈의 『페스트』에 관한 탐색적 빅데이터 분석 (Exploratory Big Data Analysis of Albert Camus's La Peste in Post Corona era)

  • 민진영
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.432-438
    • /
    • 2021
  • 이 글은 2000년에 들어 알베르 카뮈의 『페스트』가 한국 사회에서 갑작스럽게 인기를 끄는 것을 확인해보고 작품의 내용이 포스트 코로나 시대에 던져주는 시사점을 증명하기 위해서 4차 산업혁명 시대의 주요도구인 빅데이터로 접근한 논문이다. 언론 기사 검색을 통해 『페스트』의 인기를 확인하는 빅데이터 분석에서부터 시작하여 330여 페이지 분량에 해당하는 작품 자체에 대한 어휘 빈도수 분석까지 다양한 분석 도구를 활용하여 이 텍스트가 포스트 코로나 시대에 시사하는 바를 분석하였다. 분석도구로는 한국언론진흥재단의 빅카인즈와 프랑스어판 워드클라우드를 사용하였다. 지난 30여 년 동안 카뮈는 소설 『이방인』으로 한국 사회에 알려진 작가였다. 그러나 코로나바이러스의 창궐 이후 카뮈는 『페스트』의 작가로 한국의 독자들에게 적극적인 관심을 불러일으켰다. 합리적이지 못한 세계의 부조리에 대해 권태로 반항하는 인간상을 그린 『이방인』에 비해, 『페스트』는 연대를 통한 저항의 힘이 얼마나 중요한지 깨우쳐 주는 작품이다. 카뮈의 『페스트』는 포스트 코로나 시대에 전 지구적 공동체가 함께 고민하며 대처해 나아가야 할 문제를 보여줌으로써 하나의 트렌드로 자리 잡았다. 『페스트』에는 도시폐쇄와 격리로 인해 고통을 겪는 오랑시 시민들의 절절한 재난 상황을 보여주는 한편, 보건대를 조직하여 페스트에 정면으로 저항하는 인물들을 보여줌으로써 희망의 메시지를 전해준다. 『페스트』는 포스트 코로나 시대를 살아가는 한국 독자들에게 작가 카뮈를 새롭게 인식하게 해 준 작품이다.

국가핵심기술 관계망 구축을 통한 연관정보 분석연구: 디스플레이 기술을 중심으로 (A Study on the Analysis of Related Information through the Establishment of the National Core Technology Network: Focused on Display Technology)

  • 박세희;윤원석;장항배
    • 한국전자거래학회지
    • /
    • 제26권2호
    • /
    • pp.123-141
    • /
    • 2021
  • 경제 구조의 기술 의존성이 강해져 국가핵심기술의 중요성은 더욱 대두되고 있다. 하지만 기술 자체적 특성으로 인해 연관 범위가 추상적이고 국가핵심기술 고유의 특성상 정보공개가 제한적이기 때문에 보호대상이 될 기술의 범위를 정하는 것에 어려움이 있다. 이를 해결하기 위해 국가핵심기술과 연관성이 높은 중요 기술을 판별하는 데에 최적화 된 문헌 종류와 분석 기법을 제안하였다. 디스플레이 분야 국가핵심기술 키워드로 수집한 네 개 문헌종류(뉴스, 논문, 보고서, 특허) 데이터에 빅데이터 분석의 텍스트 마이닝 분석기법인 TF-IDF와 LDA 토픽 모델링을 적용하는 파일럿 테스트를 진행하였다. 그 결과로 특허 데이터에 LDA 토픽 모델링을 적용한 결과가 국가핵심기술과 연관성이 높은 중요기술을 추출하였다. OLED, 마이크로LED를 포함하여 디스플레이 전후방산업에 관련된 중요 기술을 판별 할 수 있었으며 이 결과를 관계망으로 시각화하여 국가핵심기술과 연관된 중요 기술의 범위를 명확히 하였다. 본 연구를 통해 기술이 가지는 연관범위의 모호성을 보다 명확히 하였으며, 국가핵심기술이 가지는 제한적인 정보공개 특성을 극복할 수 있다.

Analysis on Media Reports of the 「Security Services Industry Act」 Using News Big Data -Focusing on the Period from 1990 to 2021-

  • Cho, Cheol-Kyu;Park, Su-Hyeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.199-204
    • /
    • 2022
  • 이 연구의 목적은 경비업법에 대한 연구자들의 관점이 아닌 언론보도 빅데이터를 분석하여 경비업법에 대한 이해를 넓히고 다양한 현상들에 대한 의미를 살펴보는데 연구의 목적을 두고 있다. 연구방법은 우리니라의 범죄예방과 사회질서유지의 중요한 주체로써 경비업무의 대한 규정하고 있는 「경비업법」을 키워드로 검색하였다. 자료검색은 빅카인즈에서 제공가능한 1990년부터 2021년까지로 하였다. 또한 자료검색 기간동안의 구체적인 분석을 위해 정착기(1976~2001), 성장기-양적(2002~2012), 성장기-질적(2013~2021)로 구분하여 분석하였다 연구결과에 따른 경비업법의 언론보도 인식은 시대의 흐름에 따라 민간경비의 사회적 역할 및 중요성은 계속 강조되고 있다고 볼 수 있다. 그에 따른 민간경비의 시장성은 앞으로도 다양한 산업군과 결합되어 국민의 생명과 재산을 보호하는데 큰 역할을 할 것으로 판단된다. 하지만 경찰과 더불어 치안서비스를 제공하는 민간경비산업은 법적 규제 및 불법적인 문제들로 야기되는 다양한 사회적 이슈로 인해 민간경비산업의 발전을 저해하는 요소로 부각될 수 있기 때문에 거기에 따른 책임 및 역할을 더욱더 강화시킬 필요성이 제기된다.

언어 정보가 반영된 문장 점수를 활용하는 삭제 기반 문장 압축 (Deletion-Based Sentence Compression Using Sentence Scoring Reflecting Linguistic Information)

  • 이준범;김소언;박성배
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.125-132
    • /
    • 2022
  • 문장 압축은 원본 문장의 중요한 의미는 유지하면서 길이가 축소된 압축 문장을 생성하는 자연어처리 태스크이다. 문법적으로 적절한 문장 압축을 위해, 초기 연구들은 사람이 정의한 언어 규칙을 활용하였다. 또한 시퀀스-투-시퀀스 모델이 기계 번역과 같은 다양한 자연어처리 태스크에서 좋은 성능을 보이면서, 이를 문장 압축에 활용하고자 하는 연구들도 존재했다. 하지만 언어 규칙을 활용하는 연구의 경우 모든 언어 규칙을 정의하는 데에 큰 비용이 들고, 시퀀스-투-시퀀스 모델 기반 연구의 경우 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 이를 해결할 수 있는 방법으로 사전 학습된 언어 모델인 BERT를 활용하는 문장 압축 모델인 Deleter가 제안되었다. Deleter는 BERT를 통해 계산된 perplexity를 활용하여 문장을 압축하기 때문에 문장 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않다는 장점이 있다. 하지만 Deleter는 perplexity만을 고려하여 문장을 압축하기 때문에, 문장에 속한 단어들의 언어 정보를 반영하여 문장을 압축하지 못한다. 또한, perplexity 측정을 위한 BERT의 사전 학습에 사용된 데이터가 압축 문장과 거리가 있어, 이를 통해 측정된 perplexity가 잘못된 문장 압축을 유도할 수 있다는 문제점이 있다. 이를 해결하기 위해 본 논문은 언어 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 계산에 반영하는 방법을 제안한다. 또한 고유명사가 자주 포함되어 있으며, 불필요한 수식어가 생략되는 경우가 많은 뉴스 기사 말뭉치로 BERT를 fine-tuning하여 문장 압축에 적절한 perplexity를 측정할 수 있도록 하였다. 영어 및 한국어 데이터에 대한 성능 평가를 위해 본 논문에서 제안하는 LI-Deleter와 비교 모델의 문장 압축 성능을 비교 실험을 진행하였고, 높은 문장 압축 성능을 보임을 확인하였다.

다자간 국제회의 안전활동에 있어서 현장활동단계의 역할 및 중요성에 관한 연구 : 부산 APEC 행사를 중심으로 (The Study about Role and Importance of Site Activity Stage in Safety Activity for the International Conference among Several Countries)

  • 이선기
    • 시큐리티연구
    • /
    • 제19호
    • /
    • pp.105-138
    • /
    • 2009
  • 본 연구는 2005년 부산에서 개최된 APEC 행사의 안전활동 문제점을 도출하여 이를 토대로 향후 우리나라에서 개최될 다자간 국제회의 안전활동에 대한 제고방안을 모색해 보는데 그 목적이 있다. 이와 같은 목적을 달성하기 위하여 부산 APEC 행사에 직접 참여한 경찰, 소방, 군, 국정원 등 안전기관의 문제인식 차이를 통하여 제반적인 문제점을 도출해 보고자 한다. 이를 위해 APEC 행사에 차출되어 근접해서 근무한 4개 안전기관 직원을 대상으로 델파이방법에 의해 3차례에 걸쳐 의견을 수렴, 다자간 국제회의의 단계별 구성요소 및 문제점을 파악하고 구성요소별로 문제인식에 대한 통계처리를 실시하였다. 이와 함께 안전기관 전문가 4명과 1 : 1 면담결과를 통하여 다자간 국제회의 행사에 있어서 현장에서 주로 이루어지는 현장활동단계는 어떤 역할을 하며, 그 중요성이 무엇인지를 확인한 결과는 다음과 같다. 현장활동단계에서는 첫째, 인력운영 면에서는 안전기관의 유경험자를 데이터베이스화하여 관리함으로써 차제에 유사한 범국가적인 행사에 차출할 수 있는 시스템을 마련해야 한다. 둘째, 효과적인 폭발물 검측을 위해서는 첨단장비의 도입을 중기계획에 의거하여 차질 없이 수행하고 유관기관과 합동반을 구성하여 주요 취약시설에 대한 점검을 동시에 병행하여야 한다. 셋째, 안전장비의 첨단화를 위해서는 첨단장비 박람회를 통한 장비도입이 사전에 이루어져야 한다. 넷째, 국내 외 정보기관과 행사와 관련된 정보를 공유하고 협조체제를 강화하여 대테러활동에 최선의 대책을 강구해야 한다. 다섯째, 각 기관별로 홍보활동을 경쟁적으로 전개하는 것 보다 상호이해 증진차원에서 홍보기구를 설치하여 대국민 홍보대책을 강구해야 한다. 여섯째, 소방관련 기관과의 협력을 강화하기 위해서는 평시에 전기, 가스, 승강기 등 관련회사와 유기적인 협조체제를 강화하여 행사 시 유관기관과의 통합조정권이 확보될 수 있도록 정책적인 배려가 필요하다. 일곱째, 원활한 취재활동의 편의를 제공하면서도 안전 및 질서유지를 도모하기 위해서는 명확한 보도관리 지침수립이 필요하다.

  • PDF

텍스트마이닝 기법을 활용한 사용후핵연료 건식처리기술 관련 언론 동향 분석 (Analysis of media trends related to spent nuclear fuel treatment technology using text mining techniques)

  • 정지송;김호동
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.33-54
    • /
    • 2021
  • 최근 4차 산업혁명, 코로나로 인한 뉴노멀 시대의 도래 등을 계기로 인공지능, 빅데이터 연구와 같은 언택트 관련 기술의 중요성이 더욱 급상하고 있다. 각 종 연구 분야에서는 이러한 연구 트렌드를 따라가기 위한 융합적 연구가 본격적으로 시행되고 있으나 원자력 분야의 경우 자연어 처리, 텍스트마이닝 분석 등 인공지능 및 빅데이터 관련 기술을 적용한 연구가 많이 수행되지 않았다. 이에 원자력 연구 분야에 데이터 사이언스 분석기술의 적용 가능성을 확인해보고자 본 연구를 수행하였다. 원자로 연료로 사용된 뒤 배출되는 사용후핵연료 인식 동향 파악에 대한 연구는 원자력 산업 정책에 대한 방향을 결정하고 산업정책 변화를 사전에 대응할 수 있다는 측면에서 매우 중요하다. 사용후핵연료 처리기술은 크게 습식 재처리 방식과 건식 재처리 방식으로 나뉘는데, 이 중 환경 친화적이고 핵비확산성 및 경제성이 높은 건식재처리 기술인 '파이로프로세싱'과 그 연계 원자로 '소듐냉각고속로'의 연구개발에 대한 재평가가 현재 지속적으로 검토되고 있다. 따라서 위와 같은 이유로, 본 연구에서는 사용후핵연료 처리기술인 파이로프로세싱에 대한 언론 동향 분석을 진행하였다. 사용후핵연료 처리기술인 '파이로프로세싱' 키워드를 포함하는 네이버 웹 뉴스 기사 전문의 텍스트데이터를 수집하여 기간에 따라 인식변화를 분석하였다. 2016년 발생한 경주 지진, 2017년 새 정부의 에너지 전환정책 시행된 2010년대 중반 시기를 기준으로 전, 후의 동향 분석이 시행되었고, 빈도분석을 바탕으로 한 워드 클라우드 도출, TF-IDF(Term Frequency - Inverse Document Frequency) 도출, 연결정도 중심성 산출 등의 분석방법을 통해 텍스트데이터에 대한 세부적이고 다층적인 분석을 수행하였다. 연구 결과, 2010년대 이전에는 사용후핵연료 처리기술에 대한 사회 언론의 인식이 외교적이고 긍정적이었음을 알 수 있었다. 그러나 시간이 흐름에 따라 '안전(safety)', '재검토(reexamination)', '대책(countermeasure)', '처분(disposal)', '해체(disassemble)' 등의 키워드 출현빈도가 급증하며 사용후핵연료 처리기술 연구에 대한 지속 여부가 사회적으로 진지하게 고려되고 있음을 알 수 있었다. 정치 외교적 기술로 인식되던 사용후핵연료 처리기술이 국내 정책의 변화로 연구 지속 가능성이 모호해짐에 따라 언론 인식도 점차 변화했다는 것을 확인하였다. 이러한 연구 결과를 통해 원자력 분야에서의 사회과학 연구의 지속은 필수불가결함을 알 수 있었고 이에 대한 중요성이 부각되었다. 또한, 현 정부의 원전 감축과 같은 에너지 정책의 영향으로, 사용후핵연료 처리기술 연구개발에 대한 재평가가 시행되는 이 시점에서 해당 분야의 주요 키워드 분석은 향후 연구 방향 설정에 기여할 수 있을 것이라는 측면에서 실무적 의의를 갖는다. 더 나아가 원자력 공학 분야에 사회과학 분야를 폭넓게 적용할 필요가 있으며, 국가 정책적 변화를 고려해야 원자력 산업이 지속 가능할 것으로 사료된다.

시장공사적협동책략화소비자태도(时装公司的协同策略和消费者态度) (Collaboration Strategies of Fashion Companies and Customer Attitudes)

  • Chun, Eun-Ha;Niehm, Linda S.
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.4-14
    • /
    • 2010
  • 协同策略需要信息共享和其他各种对公司和股东都有利益的形式. 本文强调了在时装产业中运用到的特别形式的协同. 并且测试了对时装公司最成功的策略和消费者所感知到的协同的好处. 在本研究中, 我们定义了作为协作方的时装公司和品牌以及他们的合作方或股东. 我们定义协同为发生在至少两个公司, 品牌或个体之间, 在平等的基础上利用他们各自的竞争优势从而获得更大利益的合作关系. 协同策略需要信息共享和其他各种对公司和股东都有利益的形式. 本文强调了在时装产业中运用到的特别形式的协同. 通过合作, 时装公司一直都追求有形的差异例如设计和技术, 以及无形的差异例如对消费者情感和生理的好处. 结果就是, 时装产业中的合作已变成一个重要的创造价值的概念. 本文是一个定性研究, 使用案例研究和深度访谈来测试消费者对时装产业中协作的态度. 从1998年到2008年12月, 在韩国和国际市场中共有173个协同案例. 我们通过文件数据收集案例. 这些文件数据包括网站和产业数据和顶级门户搜索网站. 例如Rankey.com, Naver, Daum, 和Nate. 以及时装信息代表网站Samsungdesignnet 和Firstviewkorea. 我们搜集从2008年11月到2009年2月为止的个案. 个案用来分析有一个或多个合作方的时装产品生产(不包括纺织产品), 零售时装产品或设计服务. 其他在先前研究中的协同案例来自于新闻稿件, 期刊, 互联网门户网站和时装信息网站. 我们共选择了173个案例来进行分析. 清楚的显示了时装公司和股东的协作执行和策略所带来的产出和利益. 结果显示对所有参与协作的合作方(企业和顾客)来说, 最大的好处是通过共享资源降低了成本和风险. 例如设计能力, 形象, 成本, 技术和目标. 并且创造了协同作用. 考虑到协同产出的种类, 产品/设计是最重要的(55%), 紧跟其后的是推广促销(21%), 价格(20%)和地点(4%). 这个结果说明协同对给予产品和设计生命力有重要的作用. 尤其是在追求创造和新颖的时装产业里. 为了使协同可以成功, 本研究中深度访谈的结果确认了时装公司应该对为什么要进行这个协作有清晰的目标. 在设定目标之后, 时装公司应该选择符合产品形象和目标市场的合作方. 使得合作的产品有一定的概念和差异因素. 同时时装公司还要关注提升品牌知名度. 通过对消费者的深度访谈, 相互的利益可以分类为6个因素: 追求个人风格、追求品牌、追求稀有性、追求时尚、追求经济效率和社会性. 在访谈中顾客同时也强调了形象, 声誉和品牌信任. 然而, 在子范畴中, 本研究中的专家和顾客在成功因素认知方面有不同的结果. 因此, 从不同纬度研究目标客户和目标市场从而为成功的协作发展合适的策略.

WHICH INFORMATION MOVES PRICES: EVIDENCE FROM DAYS WITH DIVIDEND AND EARNINGS ANNOUNCEMENTS AND INSIDER TRADING

  • Kim, Chan-Wung;Lee, Jae-Ha
    • 재무관리논총
    • /
    • 제3권1호
    • /
    • pp.233-265
    • /
    • 1996
  • We examine the impact of public and private information on price movements using the thirty DJIA stocks and twenty-one NASDAQ stocks. We find that the standard deviation of daily returns on information days (dividend announcement, earnings announcement, insider purchase, or insider sale) is much higher than on no-information days. Both public information matters at the NYSE, probably due to masked identification of insiders. Earnings announcement has the greatest impact for both DJIA and NASDAQ stocks, and there is some evidence of positive impact of insider asle on return volatility of NASDAQ stocks. There has been considerable debate, e.g., French and Roll (1986), over whether market volatility is due to public information or private information-the latter gathered through costly search and only revealed through trading. Public information is composed of (1) marketwide public information such as regularly scheduled federal economic announcements (e.g., employment, GNP, leading indicators) and (2) company-specific public information such as dividend and earnings announcements. Policy makers and corporate insiders have a better access to marketwide private information (e.g., a new monetary policy decision made in the Federal Reserve Board meeting) and company-specific private information, respectively, compated to the general public. Ederington and Lee (1993) show that marketwide public information accounts for most of the observed volatility patterns in interest rate and foreign exchange futures markets. Company-specific public information is explored by Patell and Wolfson (1984) and Jennings and Starks (1985). They show that dividend and earnings announcements induce higher than normal volatility in equity prices. Kyle (1985), Admati and Pfleiderer (1988), Barclay, Litzenberger and Warner (1990), Foster and Viswanathan (1990), Back (1992), and Barclay and Warner (1993) show that the private information help by informed traders and revealed through trading influences market volatility. Cornell and Sirri (1992)' and Meulbroek (1992) investigate the actual insider trading activities in a tender offer case and the prosecuted illegal trading cased, respectively. This paper examines the aggregate and individual impact of marketwide information, company-specific public information, and company-specific private information on equity prices. Specifically, we use the thirty common stocks in the Dow Jones Industrial Average (DJIA) and twenty one National Association of Securities Dealers Automated Quotations (NASDAQ) common stocks to examine how their prices react to information. Marketwide information (public and private) is estimated by the movement in the Standard and Poors (S & P) 500 Index price for the DJIA stocks and the movement in the NASDAQ Composite Index price for the NASDAQ stocks. Divedend and earnings announcements are used as a subset of company-specific public information. The trading activity of corporate insiders (major corporate officers, members of the board of directors, and owners of at least 10 percent of any equity class) with an access to private information can be cannot legally trade on private information. Therefore, most insider transactions are not necessarily based on private information. Nevertheless, we hypothesize that market participants observe how insiders trade in order to infer any information that they cannot possess because insiders tend to buy (sell) when they have good (bad) information about their company. For example, Damodaran and Liu (1993) show that insiders of real estate investment trusts buy (sell) after they receive favorable (unfavorable) appraisal news before the information in these appraisals is released to the public. Price discovery in a competitive multiple-dealership market (NASDAQ) would be different from that in a monopolistic specialist system (NYSE). Consequently, we hypothesize that NASDAQ stocks are affected more by private information (or more precisely, insider trading) than the DJIA stocks. In the next section, we describe our choices of the fifty-one stocks and the public and private information set. We also discuss institutional differences between the NYSE and the NASDAQ market. In Section II, we examine the implications of public and private information for the volatility of daily returns of each stock. In Section III, we turn to the question of the relative importance of individual elements of our information set. Further analysis of the five DJIA stocks and the four NASDAQ stocks that are most sensitive to earnings announcements is given in Section IV, and our results are summarized in Section V.

  • PDF

텍스트 데이터 시각화를 위한 MVC 프레임워크 (A MVC Framework for Visualizing Text Data)

  • 최광선;정교성;김수동
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.39-58
    • /
    • 2014
  • 빅데이터의 중요성에 대한 인식이 확산되고, 관련한 기술이 발전됨에 따라, 최근에는 빅데이터의 처리와 분석의 결과를 어떻게 시각화할 것인지가 매우 관심 받는 주제로 부각되고 있다. 이는 분석된 결과를 보다 명확하고 효과적으로 전달하는 데에 있어서 데이터의 시각화가 매우 효과적인 방법이기 때문이다. 시각화는 분석 시스템과 사용자가 소통하기 위한 하나의 그래픽 사용자 인터페이스(GUI)를 담당하는 역할을 한다. 통상적으로 이러한 GUI 부분은 데이터의 처리나 분석의 결과와 독립될 수록 시스템의 개발과 유지보수가 용이하며, MVC(Model-View-Controller)와 같은 디자인 패턴의 적용을 통해 GUI와 데이터 처리 및 관리 부분 간의 결합도를 최소화하는 것이 중요하다. 한편 빅데이터는 크게 정형 데이터와 비정형 데이터로 구분할 수 있는데 정형 데이터는 시각화가 상대적으로 용이한 반면, 비정형 데이터는 시각화를 구현하기가 복잡하고 다양하다. 그럼에도 불구하고 비정형 데이터에 대한 분석과 활용이 점점 더 확산됨에 따라, 기존의 전통적인 정형 데이터를 위한 시각화 도구들의 한계를 벗어나기 위해 각각의 시스템들의 목적에 따라 고유의 방식으로 시각화 시스템이 구축되는 현실에 직면해 있다. 더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.