DOI QR코드

DOI QR Code

Development of the Guidelines for Expressing Big Data Visualization

공간빅데이터 시각화 가이드라인 연구

  • 김소연 (한밭대학교 UCRC 연구소) ;
  • 안세윤 (국립한밭대학교 산업디자인학과) ;
  • 주한나 (한밭대학교 UCRC 연구소)
  • Received : 2020.10.05
  • Accepted : 2020.10.26
  • Published : 2021.02.28

Abstract

With the recent growth of the big data technology market, interest in visualization technology has steadily increased over the past few years. Data visualization is currently used in a wide range of disciplines such as information science, computer science, human-computer interaction, statistics, data mining, cartography, and journalism, each with a slightly different meaning. Big data visualization in smart cities that require multidisciplinary research enables an objective and scientific approach to developing user-centered smart city services and related policies. In particular, spatial-based data visualization enables efficient collaboration of various stakeholders through visualization data in the process of establishing city policy. In this paper, a user-centered spatial big data visualization expression request method was derived by examining the spatial-based big data visualization expression process and principle from the viewpoint of effective information delivery, not just a visualization tool.

최근 빅데이터 기술시장의 성장과 함께 시각화 기술에 관한 관심은 지난 몇 년간 꾸준히 증가해왔다. 데이터 시각화는 현재 정보과학, 컴퓨터과학, 인간·컴퓨터 상호작용, 통계, 데이터마이닝, 지도학, 저널리즘 등의 광범위한 학문 분야에서 각기 조금씩 다른 의미로 사용되고 있다. 다학제적 연구가 필요한 스마트시티에서의 빅데이터 시각화는 사용자 중심의 스마트시티 서비스와 관련 정책을 전개하는데 있어 객관적이고 과학적인 접근을 가능하게 한다. 특히 공간 기반의 데이터 시각화는 도시정책 수립 과정에서 시각화 자료를 통해 다양한 이해관계자들의 효율적인 협업을 가능하게 한다. 본 논문은 선행연구를 통해 단순히 시각화 도구가 아닌 효과적인 정보전달 관점에서 공간기반의 빅데이터 시각화 표현 프로세스와 원리에 대해 고찰하였다. 데이터 시각화 모델 프로세스 및 시각화목적에 따른 시각화 표현기법, 디자인조형요소에 따른 특징과 시각화기법을 각각 도출하여 사용자 중심의 공간빅데이터 시각화 표현에 대한 방향성과 시사점을 제시하였다.

Keywords

Ⅰ. 서론

1. 연구의 배경과 목적

최근 빅데이터 기술시장의 성장과 함께 시각화 기술에 관한 관심은 지난 몇 년간 꾸준히 증가해왔다. 일반적으로 시각화라는 것은 정보를 효율적으로 전달하기 위한 표현기법을 의미한다. 데이터 시각화는 정보시각화(information graphics), 인포그래픽(infographics), 정보 일러스트레이션(information illustration) 등으로 사용되고 있으나 명확히 정의된 용어는 없다. 데이터 시각화는 현재 정보과학, 컴퓨터과학, 인간·컴퓨터 상호작용, 통계, 데이터마이닝, 지도학, 저널리즘 등의 광범위한 학문 분야에서 각기 조금씩 다른 의미로 사용되고 있다[1]. 다학제적 연구가 필요한 스마트시티에서의 빅데이터 시각화는 사용자 중심의 스마트시티 서비스와 관련 정책을 전개하는데 있어 객관적이고 과학적인 접근을 가능하게 한다. 특히 공간 기반의 데이터 시각화 자료는 도시정책 수립 과정에서 시각화 자료를 통해 다양한 이해관계자들의 효율적인 협업을 가능하게 한다. 하지만 이상적인 데이터 시각화는 데이터 과학 및 시각 디자인에 대한 이해를 융복합적으로 요구하는고난이도의 작업이므로, 숙련되지 않은 초심자가 시도하기에는 많은 어려움이 따른다[2]. 본 논문은 단순히 시각화 도구가 아닌 효과적인 정보전달 관점에서 공간기반의 빅데이터 시각화 표현 원리에 대한 가이드라인을 개발하고자 한다. 본 연구의 결과로 도출되는 공간 빅데이터 시각화 표현 가이드라인을 바탕으로 스마트시티의 빅데이터의 시각화표현의 이해와 활용성을 높일 수 있다.

2. 연구의 범위와 방법

본 연구의 연구방법으로는 문헌연구에 기반을 둔 내용분석법으로 수행된다. 공간빅데이터 시각화 및 스마트시티와 빅데이터의 개념과 활용과 관련한 선행연구와 문헌을 통해 공간빅데이터 시각화표현의 원리와 원칙을 고찰한다. 이를 통해 공간데이터 시각화 프로세스별로 탐색되고 논의되어야 할 분석항목을 비교 검토하여 가이드라인으로 제시하고자 한다. 특히 본 연구는 스마트시티 개념을 기반으로 한 빅데이터 시각화 표현 가이드라인으로 다소 광범위한 빅데이터 시각화 표현기법에 대한 연구들과 비교하여 연구의 범위를 특화한 점에 의의가 있다.

Ⅱ. 이론적 고찰

1. 스마트시티와 공간빅데이터

스마트시티는 정보에 기반을 둔, ICTs가 융합된, 정보의 수발신이 자유로운 지능화된 공간으로 정의된다. 스마트시티의 추진대상은 단순한 정보 시스템의 구축이나 연결에서 도시 인프라의 지능화와 도시민의 삶의 질 향상이라는 명확한 목표와 전략으로 바뀌고 있다. 스마트시티의 사용자는 기술 이해 여부와는 관계 없이 스마트해진 도시의 사용법을 알고, 즐기며, 일상에 자연스럽게 녹아든 기술이 익숙해진 사람이다. 사용자, 즉 인간의 니즈와 행태를 기술개발과 인프라 구축과 동등한 혹은 가치 중심에 두고 스마트시티의 역할을 심사숙고해야 한다. 사용자 피드백이 중요하며, 사용자 참여를 통해 진정한 공간의 가치를 창출하는 것이 중요하다. 즉 사용자 중심 스마트시티는 과거 기술 중심적이었던 도시개발에서 사람 중심의 도시개발로 계획되어야 함을 의미한다[4]. 공간정보는 시대의 흐름에 따라 형태 및 생산, 활용방법이 달라졌으나 항상 중요한 정보로 인식되어왔으며, 특히 스마트 사회 구현을 위한 필수요소인 공간정보서비스는 사용자 중심의 정보유통을 통해 참여와 소통을 강화하고, 공간정보의 경제적 활용을 통한 새로운 시장 창출로 효율성이 증진되며, 미래예측을 가능하게 함으로써 사회적 문제를 해결하는데 활용될 수 있다[5].

스마트시티의 도시정보는 크게 공간정보, 행정정보, 센싱정보로 구분할 수 있다. 공간정보는 대부분 GIS 형태로 저장되어 관리된다. 우리나라는 1995년부터 시행된 국가공간정보구축사업에 따라 다양한 공간정보가 유무상으로 제공되고 있다[6]. 공간정보는 공간자료로부터 추출되며, 공간상의 객체에 대한 위치와 속성에 대한 정보를 의미한다. 농업사회에서 산업사회, 정보사회, 스마트 사회로 변모하는 사회 패러다임 변화에 따라 공간정보의 필요성이 높아지고 있다. 공간정보는 IT 인프라 및 다양한 모바일 기기를 통해 수집된 정보를 가공, 활용함으로서 지역별 특성이나 수요에 맞는 인프라 구축이 가능하다. 정부는 국가공간정보포털(http:// www.nsdi.go.kr)을 통해 국가, 공공, 민간에서 생산한 공간정보를 누구나 쉽게 활용할 수 있도록 개방, 공유하고 있으며 이를 활용, 융합하여 신산업 및 일자리 창출에 기여하고 있다. 국가정보포털에서 제공하는 데이터는 도시개발지역개발, 도로교통물류, 환경자연기후, 재난방재공공안전, 문화체육관광, 무역산업에너지, 교육 공공행정, 농업임업수산해양, 보건의료, 사회복지, 과학기술정보통신, 통일외교국방분야와 각종 지도정보가 포함된다[5].

공간정보를 활용한 빅데이터는 공간빅데이터로 정의된다. 공간빅데이터의 정의는 기존 빅데이터의 3V (Volume, Variety, Velocity)의 특성을 확장시켜 3V (Value, Veracity, Visualization)의 특성을 더해 6V 의 특성을 갖는 빅데이터로 진화시키는 계기가 되었다[2]. 빅데이터의 유형은 다음과 같이 정형데이터, 반 정형데이터, 비정형데이터로 구분될 수 있다.

표 1. 데이터 유형

CCTHCV_2021_v21n2_100_t0001.png 이미지

정형데이터는 일관된 형식에 알맞게 저장된 데이터를 의미하며, 스키마 구조를 통해 탐색가능한 RDBMS 의 테이블이나 스프레드시트가 해당된다. 반 정형데이터는 일관된 형식으로 저장되어 있지는 않지만, 메타 데이터나 문서의 구조를 알 수 있는 스키마 정보를 포함하는 데이터를 의미한다. HTML의 형태로 URL 형태로 존재하거나, XML, JSON 등과 같이 오픈 API 형태로 제공되거나, 웹로그, IoT에서 제공하는 센서 데이터와 같이 로그형태의 데이터를 의미한다. 비정형데이터는 규칙이 전혀 없는 형식으로 저장된 데이터로 일반적 인문서 대부분을 지칭하며, 일반 텍스트 문서, 이미지, 동영상, 음성 등이 이에 해당된다.

빅데이터를 활용하여 성공한 사례는 대표적으로 서울특별시의 심야버스인 ‘올빼미 버스’가 있다. ‘올빼미 버스’는 대중교통 서비스가 중단된 자정부터 오전 5시까지 운행되는 대중교통 수단으로 수익성이 높은 서비스가 아니고, 많은 노선을 개설할 수도 없는 특징이 있었다. 이 문제를 해결하기 위해 통신사의 인프라를 활용하여 늦은 시간에 발생한 통화 및 문자 데이터를 분석하여 사람들의 위치지점과 목적지 정보를 활용하여 노선을 최적화하였다. ‘올빼미 버스’는 모두 9개의 노선이 운행되는데, 심야버스 정류장을 기준으로 500m 근처에 살고 있는 서울 시민들이 전체 시민의 약 40%에 해당하는 놀라운 결과도 얻을 수 있었으며, 그해 서울시민이 뽑은 가장 좋은 정책으로 선정되었다.

CCTHCV_2021_v21n2_100_f0001.png 이미지

그림 1. 서울 올빼미버스 노선도

빅데이터는 데이터의 신뢰성이 있고 수요자에게 가치를 다양한 형태로 제공해야 의미가 있다. 많은 양의 데이터를 어떻게 저장하고 꺼내 사용할 것인가, 다양한 종류의 데이터를 어떻게 분석하기 좋게 만들고 어떤 방법론을 활용할 것인가, 실시간에 가까운 데이터를 어떻게 취득하고 어떻게 처리 분 석할 것인가 등 데이터의 생명인 정보 가치를 얻기 위해 어떻게 정확한 자료를 만들것인가, 빅데이터를 연계 융합해 필요한 가치를 만들고 이를 어떻게 제공할 것인가 등은 빅데이터에 던지는 질문이다[6].

2. 공간빅데이터 시각화 동향

공간빅데이터는 기존 빅데이터의 특성과 함께 위치와 장소에 관한 정보를 포함하고 있을 뿐만 아니라, 다양한 시간차원을 가지고 있다고 할 수 있다. 따라서, 공간 빅데이터는 일반적인 빅데이터 보다도 볼륨, 다양성, 복잡성이 상대적으로 크다고도 할 수 있으며, 따라서 공간 빅데이터를 통해 사회경제적 현상을 직관적으로 이해하기 위해서는 기존 통계자료의 시각화와는 다른 차원의 접근이 필요하다[1].

공간빅데이터 시각화의 필요성과 중요성도 전통적 인공 간 정보 시각화와 유사한 연장선상에서 이해할 수 있다. 그러나 공간빅데이터는 행위주체자의 미시적(micro) 이며 동태적(dynamic)인 활동을 담고 있는 비집계적 (desegregated) 데이터의 성격을 가지고 있어, 정보의 구체성을 표현하기 어려운 관계로 행정구역 등을 단위로 집계하여 표현하는 경우가 많다[1].

시각화는 다양한 유형으로 구분되지만 모든 시각화는 다양한 의미가 혼재된 데이터에서 사용자가 원하는 의미를 정확하고 효율적이며 명확하게 전달하기 위한 시각적 표현이다. 시각화의 목표는 사용자가 잘 이해할 수 있도록 분석하고, 탐색하고, 검색하고, 설명하고, 정보를 전달할 수 있는 환경을 제공하여 데이터에 대한통찰력을 갖게 해주는 것이다. 마찬가지로 공간 빅데이터의 시각화는 위치정보를 중심으로 기록된 다양한 데이터에서 의미 있는 정보를 사용자가 이해하기 쉬운 시각적 표현을 통해 전달하기 위한 방법 및 과정으로 정의할 수 있다[3].

최근 공간빅데이터 시각화는 산업 곳곳에서 활발하게 이루어지고 있는 추세다. 특히 코로나바이러스 감염증(코로나 19) 대처에도 빅데이터 시각화가 적극 활용되었다. 보건복지부는 사이트를 통해 코로나19 바이러스 확진자 현황과 관련 뉴스를 시각화자료로 제공하고 있다. 제주도는 와이파이 및 통신사 기지국 접속 데이터를 활용하여 유동인구를 분석한 뒤 방역 우선순위를 선정했으며, 도내 스타트업과 시민들이 자발적으로 참여하여 운영한 코로나19맵 등 코로나 19 대응 방역 이력과 관련한 다양한 데이터를 시각화하여 민간에게 공개하여 자발적으로 코로나 19 관련 정보를 제공할 수 있도록 유도하였다.

CCTHCV_2021_v21n2_100_f0002.png 이미지

그림 5. 코로나바이러스감염증-19 보건복지부 사이트

특히 공간을 기반으로 한 빅데이터의 시각화 연구는 주로 GIS관련 연구를 중심으로 이루어졌다. GIS (Geographic Information System) 란 인간 생활에 필요한 지리정보를 컴퓨터 데이터로 변환하여 효율적으로 활용하기 위한 정보시스템으로, 지리적 위치를 갖고 있는 대상에 대한 위치자료와 (spatial data)와 속성자료(attribute data)를 통합·관리하여 지도, 도표 및그림들과 같은 여러 형태의 정보를 제공한다. 국내 GIS 연구는 80년대에 GIS도입과 구축이 활발하게 이루어지며 주로 지리적 정보자료의 전산화나 국토 정보시스템 개발 등 구성과 설계기법에 관한 연구가 이루어졌으며, 90년대에는 정보산업분야의 GIS활용이 증가하고범조직체내의 구성이나 외부기관과의 연계를 통한 광범위한 운용체계로 발전하면서 통합된 지형 정보 시스템에 관한 연구나 표준모델, 활용과 응용연구에 관한 연구가 이루어졌다. 2000년대에 와서는 웹브라우저로 사용자가 쉽고 편리하게 위치정보를 활용할 수 있는 GIS패러다임이 등장하면서 3차원의 공간정보 웹서비스도 사용가능하게 되었고, 2010년 이후 최근까지는 인공지능과 GIS결합으로 화재예측이나 재난감시 등의 예측시스템 연구로 발전하고 있다. 공간정보는 최근 GIS에 기반을 둔 단순 지도 정보에서 벗어나 LBS(Location Based Service, 위치기반서비스), 증강현실(AR, Augmented Reality), 지오웹(Geo-Web)등 새로운 기술 및 서비스를 결합해 LBSNS(Location Based SNS), 시설물 원격관리 등의 서비스로 확장되는 등 모바일 서비스의 발전과 결합하여 스마트시티의 핵심 서비스로 부상하고 있다[6].

3. 공간빅데이터 시각화 선행연구 동향

공간빅데이터에서 비즈니스 모델에 활용 가능한 의미 있는 정보를 추출하고 데이터에 대한 통찰력을 얻기 위해 공간빅데이터를 이용한 시각화가 중요하게 다루어지고 있다[3].

공간기반의 빅데이터 시각화 연구는 특히 공공데이터와 실질적인 인포그래픽 제시를 중심으로 연구가 이루어지고 있다. 최진원, 김이연(2012)은 빅데이터 시대에 효과적인 시각커뮤니케이션을 위한 인포그래픽 연구로 정부부처 및 공공기관의 인포그래픽 사례를 정보전달방식에 따른 유형별로 분류하고 시각적 표현요소의 4가지를 기준으로 도출하였다. 이미경, 박한우 (2015)는 공공 데이터 개방과 활용, 인터넷 및 SNS 이용자를 대상으로 한 소셜 여론조사와 빅데이터 방법론 도입을 통한 객관성 확보와 데이터 분석 결과에 따른 관광 기획 및 아이디어 발굴이 필요함을 활용방안으로 제시하였다. 박진아, 안세윤(2019)는 세종시 데이터 증거기반 정책수립을 위한 대시보드 디자인에 관한 연구로 - 세종시 생활지표인 사회, 인구, 경제, 부동산, 교통, 환경, 건강, 인프라 지표 데이터를 시각화하고, 데이터를 상호 연계하여 정책수립 및 운영에 주요 사회 동향을 파악하는데 적용 활용될 수 있도록 구조적 마크업 (HTML), 표현 및 레이아웃(CSS), 자바스크립트 (JavaScript)로 인포그래픽 대시보드를 디자인하여 제시하였다. 강경희(2020)는 사회 네트워크 분석을 통한 공공자전거 따릉이 이용특성과 장소 연결에 대한 연구로 따릉이 이용특성, 실제 이동 경로와 방문 장소를 조사하였고, 따릉이의 이용을 통해 좁은 골목과 교통 수단간 단절된 교통망을 서로 연결해, 지역격차, 교통, 인프라, 인구 편중으로 나타나는 도시 문제 해결에 도움을 줄 수 있음을 시사하였다.

공간빅데이터의 시각화는 원시데이터에서 텍스트 분류, 그룹화, 마이닝 등의 분석 기법을 이용하여 의미 있는 정보를 추출해야 한다. 이는 정보디자인교과서의 조직화된 데이터, Ben의 정보획득, 분석, 선별, 마이닝에 해당하는 단계로 시각화를 위한 데이터의 전처리 단계로 정의 할 수 있다. 추출된 정보는 시각적표현 기법을 통하여 사용자에게 표현된다. 표현기법은 정보의 유형에 따라 시간 시각화, 분포 시각화, 관계 시각화, 비교시각화, 공간 시각화, 인포그래픽 등으로 구분하며, 막대그래프, 누적막대 그래프, 시계열그래프, 계단식 그래프 파이차트, 도넛 차트, 선 그래프, 스캐터 플롯, 버블차트, 히트맵, 지도 등으로 표현이 가능하다. 표현기법을 통해 시각화된 정보를 사용자가 실제 비즈니스 모델에 적용하기 위해서는 지식과 지혜로 발전시킬 수 있어야 하며 이를 위해 시각화는 상호작용할 수 있는 사용자 환경(User Interface)과 공통 사용자의 경험을 기반으로 설계된 사용자 경험 환경(User Experience)을 제공해야 한다[2].

데이터 분석을 위한 다양한 시각적 요소가 존재하지만, Stephen Few는 대부분의 정량적 데이터가 Bar, Box, Line, Point 네 가지 시각적 요소만으로도 충분하게 표현될 수 있다고 주장하였다[12].

코펜하겐의 데이터 시각화 회사 Ferdio는 데이터 과학자와 디자이너(설계가)가 데이터를 표시하는 가장 좋은 방법을 찾는 데 도움이 될 수 있는 150가지 이상의 데이터 시각화 유형들로 구성된 ‘Data Viz Project’라는 웹 사이트를 개설했다. 이 회사는 데이터 시각화 유형을 ‘차트(chart), 다이어그램(diagram), 지리공간 (geospatial), 플롯(plot), 테이블(table)’로 구분 짓고, 이중 지리 공간 그룹에서 표현될 수 있는 시각화 유형을 제안하였다.

Ⅳ. 공간기반 빅데이터 시각화 요구사항 도출

본 연구는 선행연구를 통해 공간기반의 빅데이터 시각화 표현의 프로세스와 원리를 고찰하고 비교 검토하였다.

Tamara Munzner(2009)는 데이터 시각화 프로세스로 4단계 모델을 제시하였다. 시각화 설계 및 검증을 위한 중첩모델로 Domain problem characterization, Data/operation abstraction design, Encoding/interaction technique design, Algorithm design 의 네 개의 생성모델을 제시하였다.

Christa Kelleher, Thorsten Wagener(2011)는 핵심적인 시각화 선행문헌검토를 기반으로 효과적인 데이터 시각화를 위한 10가지 지침을 제시하였다.

Andy Kirk(2012)은 Setting the Purpose and Identifying Key Factors(목적설정 및 핵심요소 식별), Demonstrating Editorial Focus and Learning About Your Data(시연 및 데이터학습), Conceiving and Reasoning Visualization Design Option(시각화 설계 구상 및 추론), Taxonomy of Data Visualization Methods(데이터 시각화 방법 분류), Constructing and Evaluating Your Design Solution(디자인 솔루션 설계 및 평가)의 프로세스로 시각화가 필요함을 설명하였다. Katy Borner는 Data extraction, Unit of analysis, Measures, Layout, Display 단계로 시각화 프로세스를 제시하였다. Matthias는 Formulate the question(질문 설정), Gather the data(데이터 수집), Apply a visual representation(시각화 표현)로 주요한 시각화단계를 제시하였다. Textbook of Information Design(2014)에서는 Organized data(조직화된 데이터), Visual mapping(시각적 매핑), Visual form(시각적 형태), Representation(전달방식)의 순서로 시각화 프로세스를 설명하였다. Ben(2008)은 Acquire(데이터 수집), Parse(데이터 분류), Filter(필터링), Mine (데이터 마이닝), Represent(기본 시각화 모델 선정), Refine(시각화 모델 구체화), Interact(상호작용-데이터 조작 등)의 단계를 제시하였다. Nathan Yau(2011) 는 Visualize THIS이라는 서적을 통해 Data storytelling과 데이터 다루기, 도구선택의 기본적인 데이터 시각화 단계를 설명하였고 그 중 공간시각화는 위치 특정과 시각화방법선정과 비교를 통해 시각화가 가능하다고 설명하였다.

표 2. 연구자별 빅데이터 시각화 프로세스

CCTHCV_2021_v21n2_100_t0002.png 이미지

선행연구자 별 데이터 시각화 모델의 프로세스를 살펴본 결과 Christa Kelleher, Thorsten Wagener(2011)가 제시한 10가지 데이터 시각화 지침을 제외하고 공통적으로 4-5단계의 단계가 적용됨을 확인하였다.

표 3. 선행연구자별 데이터 시각화단계 비교

CCTHCV_2021_v21n2_100_t0003.png 이미지

[표 4]과 같이 1) 목표설정 2) 수집 및 유형화 3) 도구선정 4) 시각표현 4단계의 시각화단계로 재 유형화하였다. 1) 목표설정단계는 데이터 스토리텔링 단계로 무엇보다 어떠한 정보를 제공하는지 목적과 목표, 그에 따른 질문을 설정하는 것이 중요하다. 2) 수집 및 유형화는 데이터를 직접 수집하거나 이론적 고찰에서 설명한 개방된 공공데이터를 수집할 수 있다. 이 단계에서는 시각화전에 데이터의 오류 등을 미리 확인하는 선행작업이 요구된다. 세부적인 시각화 이전에 시각화 설계의 구상과 추론을 통해 데이터에 대한 이해와 정보의 체계를 설정한다. 또한 가장 간단하게 나타낼 수 있는 기본적인 시각화 유형을 미리 선행할 수 있다. 3) 도구선택 단계는 수집한 데이터의 정보를 잘 전달할 수 있는 시각화도구를 선정하여 시각화디자인의 구체적인 구상과 추론을 수행한다. 4) 시각화표현단계는 구체적인 시각화표현방법을 통해 정보를 표현하는 과정을 통해 수정보완하여 최종 시각화 결과물로 제시한다.

표 4. 데이터 시각화 모델 프로세스

CCTHCV_2021_v21n2_100_t0004.png 이미지

빅데이터 유형별 가능한 시각화표현 유형은 다음과 같다.

표 5. 빅데이터 시각화 표현기법

CCTHCV_2021_v21n2_100_t0005.png 이미지

빅데이터 시각화 표현기법은 연구자별로 다양하게 제안되고 있다.

Stephen Few는 대부분의 정량적 데이터가 Bar, Box, Line, Point 네 가지 시각적 요소만으로도 충분하게 표현될 수 있다고 설명하였고, 각각의 특징이 비교와 분포, 패턴, 관계로 구분되어 시각화 표현될 수 있음을 설명하였다. Bar의 형태는 개별값을 강력하게 강조하는 방식으로 사용할 수 있으며, Box는 단일 수치가 아닌 가장 높은 값에서 낮은 값으로 범위를 인코딩하는데 유용하다고 설명하였다. Line은 일련의 개별 값의 연결로 값에서 값으로 이동할 때 데이터 모양을 강조하며, Point는 개별값을 강조하며 점이나 사각형, 삼각형 등 간단한 개체의 모양을 취할 수 있음을 설명하였다.

코펜하겐의 데이터 시각화 회사 Ferdio는 데이터 시각화 유형을 크게 ‘차트(chart), 다이어그램(diagram), 지리공간(geospatial), 플롯(plot), 테이블(table)’로 구분 짓고, 지리공간 그룹에서 표현될 수 있는 시각화 유형으로 Flow Map과 Isoline Map, Choropleth Map / Choropleth Heatmap, Pie Chart Map, Bubble Map Chart, Dot Density Map, Bar Chart on a Map, Pin Map, Route Map, Connection Map, Cartogram을 제시하였다. Flow Map은 다 이어 그램과 지리 공간 유형으로 비교와 상관관계, 분포, 지리 데이터 활용을 목적으로 활용될 수 있다. Isoline Map은 등고선처럼 동일한 속성값들을 연결한 선으로 지리 공간 유형으로 비교와 분포에 유리하다. Choropleth Map / Choropleth Heatmap은 지역 내 지리적 특성의 총체적인 요약을 나타내는 통계변수에 비례하여 영역이 음영 또는 패턴화하여 데이터를 비교, 분포하는 시각 화가 가능하다. Pie Chart Map과 Bubble Map Chart, Dot Density Map. Bar Chart on a Map은 차트와 지리 공간 유형으로 비교나 분포의 목적으로 시각 화가 가능하다. 주로 지도상의 영역 위에 차트를 올려서 표현하는 방식으로 시각화가 가능하다. Muzammil Khan, Sarwar Shah Khan은 시각화 기법으로 데이터 시각화와 정보시각화 유형을 제시하였다. 데이터 시각화로는 Table, Pie chart, Bar chart, Histogram, Line chart, Area chart, Scatter plot, Bubble chart, Multiple Data Series을 제시하였다. 정보시각화로는 Parallel Coordinates, Tree Map, Entity Relationship Diagram, Cone Tree, Time Line, Flow Chart, Data Flow Diagram, Venn Diagram, Semantic Network을 구분하여 설명하였다.

본 연구는 선행연구의 시각화 표현기법이 Stephen Few의 Bar, Box, Line, Point 네 가지 시각적 요소를 중심으로 주로 유형화됨을 확인하였으나, 이는 정량적 데이터에 제한된 것으로 타 선행연구의 표현기법에 따라 반정형데이터와 비정형데이터 시각화가 가능한 개념시각화와 지리데이터 기법을 추가하여 6가지 요소로 범위를 재유형화하였다.

표 6. 시각화 목적에 따른 시각화 표현기법

CCTHCV_2021_v21n2_100_t0006.png 이미지

정형데이터는 절대 0값을 지니고 가감승제가 가능한 수치로 절대적 크기를 비교할 수 있는 모든 통계 데이터를 의미한다. 즉 비율과 등간의 성격을 가지므로 비교나 분포, 패턴, 관계 등을 위한 시각화 목표를 위해 다양한 시각화표현기법이 사용가능하다.

표 7. 데이터 유형에 따른 시각화 표현 예시

CCTHCV_2021_v21n2_100_t0007.png 이미지

반정형데이터는 속성의 정도에 따라 범주화하여 순서의 배열 등 시각화 표현이 가능하다. 최근의 반 정형데이터는 Open API나 XML, HTML의 형태로 제공되며 스키마에 해당하는 메타 데이터가 데이터 내부에 존재한다. 따라서 데이터 내부에 있는 규칙성을 파악하여 파싱 규칙을 적용하여 분석하는 것이 중요하다. 즉 속성의 정도에 따라 범주화하고 순서의 배열 즉 서열이 가능하며, 데이터 규칙을 파악할 수 있는 정도에 따라 정형데이터와 같은 시각화표현 또한 가능하다. 즉 ERD(Entity Relationship Diagram, 개체관계도: 말로 되어있는 요구분석사항을 그림으로 그려내어 그 관계를 도출하는 것. ER Diagram으로도 표현되며, 개념 데이터 모델링 단계에서 작성하는 다이어그램)와 같은 시각화가 가능하다.

비정형데이터는 분류적인 의미로 분리적이고 비수 치적인 범주를 갖는 데이터를 의미한다. 즉 소셜데이터의텍스트와 같은 스크립트 파일의 형태 또는 동영상이나 이미지와 같은 논텍스트파일을 포함한다. 비정형데이터는 텍스트마이닝을 통해 워드클라우드의 형태로 시각화하거나 텍스트구조를 파악하여 SNA(Social Network Analysis)분석이 가능하다. 최근 미디어기기사용보편화로 도시민들이 생성하는 문자나 이미지, 동영상 등과 같은 비정형데이터가 증가하고 있다. 즉 도시민들의 개인정보 속성값(위치, 성별, 연령 등)에 따라 다양한 분석이 가능하며, 이에 따라 정형데이터와 반 정형데이터와 같은 다양한 범주의 시각화가 가능할 것으로 보인다.

표 8. 디자인조형요소에 따른 특징과 시각화기법

CCTHCV_2021_v21n2_100_t0008.png 이미지

또한 본 연구는 선행연구의 빅데이터 시각화 프로세스와 표현원리를 통해 시각적 조형요소인 점, 선, 면, 형, 음영, 색, 질감, 공간이라는 특성을 기반으로 유형화하였다. 이는 최근 시각화에 대한 관심이 증가하면서 그에 대한 기법이 점차 다양해지고 있으나, 시각화 기법의 가장 근본이 되는 기본 원리와 원칙은 디자인 표현의 기본요소로 모두 함축되고 있다. 그에 따라 본 논문에서는 근본적인 시각화기법의 요소를 파악하기 위해 디자인 조형요소를 기반으로 제시하였다.

Ⅴ. 결론

본 연구는 공간기반의 빅데이터 시각화 표현에 대한 선행 연구 동향을 파악하고, 공간빅데이터를 활용한 시각화 제시를 위한 방향성과 시사점을 제시한 점에 의의가 있다.

공간기반의 빅데이터 시각화는 궁극적으로 이를 통해 스마트시티 서비스를 개발하는 것에 있다. 즉 공간기반의 빅데이터 시각화 프로세스와 표현원리에 대한목표설정은 다음과 같은 요구사항을 우선적으로 고민할 필요가 있다.

첫째, 공간기반 빅데이터 시각화표현은 궁극적으로 다양한 도시 서비스 도출을 지원할 수 있어야 한다. 즉시 각화 자료를 통해 ‘무엇을 볼 것인가’에 대한 목표가 정확히 설정될 수 있도록 다양한 시각화의 가시성을 최대한 고려하여야 한다. 공간기반 빅데이터 시각화 자료는 도시정책의 수립과정에서 다양한 이해관계자들의 효율적인 협업을 지원하여야 한다. 정확한 정보 전달을 기반으로 사용자 중심의 공간정보 서비스 도출이 가능하도록 시각화되어야 한다.

둘째, 빅데이터의 형태에 따른 시각화 기법을 고려하여야 한다. 정형, 비정형, 반정형의 데이터 특성에 따라 가능한 시각화 기법을 고려하여야 한다. 다양한 빅데이터 간의 관계, 패턴, 비교, 분포와 같은 다양한 공간분석이 이루어져야 하며, 시각적인 조형요소로 이에 대한내용이 구분되어야 한다.

셋째, 공간기반의 빅데이터는 무엇보다 도시공간의 다양한 인프라가 기반이 되는 만큼 기존의 다양한 민관데이터와 연계되어야 한다. 각 정보의 연계와 융합이 가능하도록 공간정보의 표준화기술이 지원되어야 한다.

넷째, 운영적인 측면에서 공간기반의 빅데이터를 활용하여 지속적으로 갱신되어야 한다.

본 연구는 선행연구의 고찰을 통해 데이터 시각화 모델 프로세스와 시각화 목적에 따른 시각화표현기법, 디자인 조형 요소에 따른 특징과 시각화기법을 도출하였다. 이러한 연구결과는 관련 연구자들이 스마트시티 공간 빅데이터 시각화연구의 주요 현황을 파악하는데 기초자료로 활용될 수 있다. 또한 다학제적 연구가 필요한 스마트시티에서의 공간빅데이터 시각화에 대한 중요성과 효율성을 강조함으로써 사용자 중심의 스마트시티 서비스 개발과 정책수립을 위한 활용이 증대될 것으로 기대된다.

본 연구는 시각화 표현 프로세스와 원리에 대한 고찰로 실질적인 공간 서비스 및 정책개발 단계에서 각 시각화 표현 방법에 대한 가독성 및 의미전달성에 대한 검증이 이루어지지 않은 점에 한계가 있다. 향후 공간 빅데이터 시각화 요구사항을 바탕으로 실제 도시공간의 빅데이터를 시각화하여 실질적인 활용과 검증연구가 필요할 것으로 보인다.

References

  1. 김동한, 김다윗, "공간빅데이터를 위한 동태적 시각화 모형의 개발과 적용," 한국지리정보학회지, 제21권, 제1호, pp.57-70, 2018. https://doi.org/10.11108/KAGIS.2018.21.1.057
  2. 이재용, 유승헌, "사용자 맥락에 기반한 인터랙티브 데이터 시각화 가이드라인 원칙 제안," 한국디자인학회 학술발표대회 논문집, pp.18-19, 2019.
  3. 서양모, 김원균, "공간빅데이터를 위한 정보 시각화방," 한국공간정보학회지, 제23권, 제6호, pp.109-116, 2015.
  4. 안세윤, 김소연, "스마트시티의 User Centered Design 개념 설계 및 활용," 한국콘텐츠학회논문지, 제19권, 제12호, pp.440-451, 2019. https://doi.org/10.5392/JKCA.2019.19.12.440
  5. 김소연, 안세윤, "스마트시티 사용자 체험 시나리오 도출 연구 : 지역공간정보 및 페르소나 모델을 활용하여," 한국콘텐츠학회논문지, 제18권, 제6호, pp.333-341, 2018. https://doi.org/10.5392/JKCA.2018.18.06.333
  6. 이상호, 임윤택, 안세윤, 스마트시티, 커뮤니케이션북스, p.30, 2017.
  7. M. Khan and S. S. Khan, "Data and Information Visualization Methods, and Interactive Mechanisms:A Survey," International Journal of computer Applications, Vol.34, No.1 pp.1-12, 2011. https://doi.org/10.5120/2004-2701
  8. Tamara Munzner, "A Nested Model for Visualization Design and Validation," IEEE Transactions on Visualization and Computer Graphics, Vol.15, Issue 6, pp.921-928, 2009. https://doi.org/10.1109/TVCG.2009.111
  9. Christa Kelleher and Thorsten Wagener, "Ten guidelines for effective data visualization in scientific publications," Environmental Modelling and Software, Vol.26, No.6, pp.822-827, 2011. https://doi.org/10.1016/j.envsoft.2010.12.006
  10. S. Julie and L. Noah, Beautiful Visualization, O'Reilly Media, 2010.
  11. Ben Fry, Visualizing Data, O'Reilly Media, 2008.
  12. Stephen Few, "Now you see it: simple visualization techniques for quantitative analysis," Analytics Press, 2009.
  13. http://bus.go.kr/nBusMain.jsp
  14. http://ncov.mohw.go.kr/
  15. https://www.youtube.com/watch?v=Bc7Ajlud0is
  16. 김근한, 전철민, 정휘철, "공간빅데이터의 개념 및 요구사항을 반영한 서비스 제공 방안," 한국지형공간정보학회지, 제24권, 제4호, pp.89-96, 2016. https://doi.org/10.7319/kogsis.2016.24.4.089