DOI QR코드

DOI QR Code

공유자전거 데이터 분석 및 활용방안 연구 세종특별자치시 공유자전거 어울링의 데이터를 적용하여

A Study on Analysis and Utilization of Public Sharing Bike Data - By applying the data of Ouling, Public Sharing Bike System in Sejong City

  • 안세윤 (국립한밭대학교 산업디자인학과) ;
  • 주한나 (국립한밭대학교 UCRC 연구소) ;
  • 김소연 (국립한밭대학교 UCRC 연구소) ;
  • 조민준 (국립한밭대학교 모바일융합공학과) ;
  • 김성환 (국립한밭대학교 기초과학부)
  • 투고 : 2021.02.19
  • 심사 : 2021.06.11
  • 발행 : 2021.07.28

초록

최근 친환경 교통수단에 대한 관심과 바이러스로부터의 안전성을 고려하여 도시 공간 내 공유자전거 활용에 대한 관심이 높아지고 있다. 정보통신기술의 발달로 데이터를 수집하고 저장하는 기술이 향상되면서, 시민들의 공유자전거 사용에 따라 수집·저장되는 데이터를 활용한 도시 공간 내 이동성(Mobility)에 대한 연구도 활발히 진행되고 있다. 따라서, 본 논문은 문헌고찰을 통해 도시 공간 내 공유자전거 시스템을 통해 수집되는 데이터의 속성과 활용사례를 분석하여, 고찰·분석한 결과를 바탕으로 국내 공유자전거 시스템 중 하나인 세종특별자치시 어울링의 데이터 분석에 적용함으로써, 공유자전거 데이터 활용방안을 모색하였다. 분석대상으로 선정한 문헌은 GIS데이터, O-D데이터, 대여 및 반납 이력, 대여소 위치정보 및 주변정보, 날씨정보 등을 활용하여 GIS 네트워크 분석기법, 방정식 및 비율 분석, 소셜 네트워크 분석, 통계 및 네트워크 분석 등의 방법을 사용하였다. 데이터 분석을 통해 공유자전거 시스템의 현황 및 문제점을 파악하여 해결방안을 제안, 공유자전거 사용의 확장 및 활성화 방안 도출, 효율적인 공유자전거 관리 및 운영방안 도출을 위한 기초자료를 마련하였다. 궁극적으로, 데이터 분석을 통해 공유자전거를 활용하여 도시 공간 내 이동성(Mobility)을 향상시킬 수 있는 방안을 모색할 수 있을 것이다.

Recently, interests in the use of Sharing Bike is increasing in consideration of eco-friendly transportation and safety from viruses. As the technology for collecting and storing data is improved with the development of ICTs, research on mobility using the Sharing Bike Data is also actively progressing. Therefore, this paper analyzes the properties of Sharing Bike Data and cases of researches on it through literature review, and based on the results of the review, data of Eoulling, the Sharing Bike System of Sejong City is analyzed as a way to utilize Sharing Bike Data. Most of the selected literature used structured data, and analyzed it through statistical methods or data mining. Through data analysis, it identified the current status, found out problems of the Sharing Bike System, proposed a solution to solve them, developed plans to activate the use of Sharing Bike. This provides basic data for efficient management and operation plans for Sharing Bike System. Ultimately, it will be possible to explore ways to improve mobility in urban spaces by utilizing Sharing Bike Data.

키워드

I. 서론

1. 연구의 배경 및 목적

최근 친환경에 대한 강조와 바이러스 전염으로부터의 직간접적 보호가 이슈화되면서 자전거 공유 시스템이 주목 받고 있다[1]. 더불어, 4차 산업혁명의 도래와 함께 데이터를 수집하고 분석하는 기술은 자전거 공유시스템의 효용성 및 활용성을 향상시킨다. 지식의 공유가 강화되면서, 자동결제시스템을 통해 수집되는 데이터를 활용한 이동성(Mobility)에 대한 연구도 활발히 진행되고 있다[2].

본 논문은 도시 공간 내 제공되는 공유자전거 시스템을 통해 수집되는 데이터의 속성, 분석방법과 활용사례를 고찰한다. 특히, 실제 세종특별자치시의 공유자전거 시스템인 어울링 데이터에 적용하여 공유자전거 시스템 데이터의 활용 방법을 검증한다. 이를 통해 도시 공간 내 향상된 이동성(Mobility)을 도모하고자 한다. 또한, 궁극적으로 공유자전거 데이터의 분석을 통한 활용성에 대해 논의한다. 데이터를 활용하여 도시 공간 내 이동성(Mobility)을 향상 시키는 것은 도시의 이동 효율성을 증가시켜 스마트시티로의 연결을 도모할 수 있을 것이다.

2. 연구의 방법 및 범위

공유자전거의 데이터 활용과 도시 공간 내 이동성 향상 방안을 논하기 위해, 아래의 연구방법을 사용한다.

먼저 문헌연구를 통해 데이터의 속성과 활용사례를 분석한다. 학술정보사이트를 통해 ‘데이터 속성’, ‘데이터 활용’, ‘데이터 특성’ 등 키워드로 검색하여 수집한 논문 및 보고서와 데이터 관련 단행본을 통해 기본적인 데이터의 속성 및 분석방법을 검토한다. 그리고, ‘공유자전거’, ‘sharing bikes in urban area’, ‘sharing mobility in urban area’ 등 키워드로 검색하여 수집한 논문을 통해 도시 공간 내 공유자전거 데이터의 활용사례를 분석한다.

둘째, 국내의 세종특별자치시 공유자전거 시스템인어울링 데이터를 python, excel, arcgis pro 등을 활용하여 분석 및 시각화하여 앞서 고찰·분석한 공유자전거 데이터 분석방법을 검증한다.

셋째, 앞서 고찰한 내용과 분석한 결과를 종합하여 도시 공간 내 이동성(Mobility) 향상을 위한 방안과 공유자전거 데이터의 활용성을 논의한다.

Ⅱ. 문헌고찰

1. 데이터의 속성

민금영(2013)은 기존 데이터의 속성을 시대의 흐름에 따른 연구자의 관점에 따라 정리하였다[3]. O’Brien(1991)은 데이터의 속성을 시간, 내용, 형태로 구분하였으며[표 1], Wang&Strong(1996)은 본질적, 문맥적, 접근적, 표현적 속성으로 구분하였다[표 2]. BK Kahn 외(2002)는 [표 3]과 같이 PSP/IQ(Product and Service Performance/ Information Quality) Model을 통해 데이터의 속성을 구분하였다[4].

표 1. O’Brien(1991)의 데이터 속성

CCTHCV_2021_v21n7_259_t0001.png 이미지

표 2. Wang&Strong(1996)의 데이터 속성

CCTHCV_2021_v21n7_259_t0002.png 이미지

O’Brien(1991)과 Wang&Strong(1996)이 데이터 자체의 특성에 초점을 맞추어 데이터의 속성을 구분하였다면, BK Kahn 외(2002)는 데이터가 갖는 특성과 데이터 사용자가 얻을 수 있는 정보 (즉, BK Kahn이 언급한 제품의 품질(Product Quality)과 서비스의 품질(Service Quality)를 모두 고려하여 데이터의 속성을 구분하였다.

표 3. PSP/ IQ (BK Kahn et al., 2002) 모델

CCTHCV_2021_v21n7_259_t0003.png 이미지

본 논문은 최근 가치와 활용이 증가하고 있는 형태의 데이터 활용방안을 모색하기 위해, 위에서 구분한 데이터의 속성에 더하여 빅데이터의 속성을 고찰하였다. 공유자전거 시스템을 통해 수집할 수 있는 데이터는 기존에 구분한 데이터의 속성을 포함하는 동시에, 최근 발전하고 있는 정보통신 기술을 활용하여 수집되는 빅데이터의 속성도 포함하고 있기 때문이다.

2. 빅데이터의 속성

Gartner의 분석가 Dough Laney는 2001년에 Vs(high-volume(규모), -velocity(속도), -variety(다양성)를 통해 빅데이터의 속성을 정리하였다. Vs는 빅데이터의 정량적 조건의 차원을 정의한다. 이후 Gartner는 2011년에 ‘데이터 관리의 12가지 차원’, 즉, 관리와 통제에 대한 4가지 차원과 정성적 조건의 4가지 차원을 더하였다[5].

표 4. Gartner(2013)의 빅데이터 속성

CCTHCV_2021_v21n7_259_t0004.png 이미지

이외에 빅데이터의 속성에 대한 정리는 다양하게 찾아볼 수 있지만, 기본적인 틀은 2001년 Gartner에서 정리한 내용의 일부인 V3를 바탕으로 하고 있다. 본 논문은 빅데이터의 속성에 더하여 데이터를 실질적으로 분석할 수 있는 방법을 모색하고자 한다. 그에 따라, 형태 관점에서 데이터의 유형을 고찰하였다.

3. 빅데이터의 유형 분류

빅데이터는 [표 5]1과 같이 DB, 스프레드시트 등 고정된 필드에 저장된 정형 데이터와 XML, HTML, 텍스트 문서, 이미지, 동영상 등 고정된 필드에 저장되어 있지 않은 비정형 데이터로 분류할 수 있다[2]. 최근에는 정형화 되어 있든 그렇지 않든 관계없이 대규모의 데이터를 다루기 위한 논의가 지속되고 있는데[6], 도시 공간 내 제공되고 있는 공유자전거 시스템에 의해 수집되고 있는 데이터도 그 중의 하나이다.

표 5. 데이터 유형 분류[2]

CCTHCV_2021_v21n7_259_t0005.png 이미지

4. 빅데이터 속성 및 유형에 따른 분석과정

앞서 고찰한 데이터와 빅데이터의 속성, 빅데이터의 유형을 바탕으로, 수집된 데이터를 실질적으로 분석하고 활용할 수 있는 방안을 모색하고자 하는 것이 본 논문의 목적이다. 이를 위해서는 먼저, 공유자전거 시스템을 통해 수집된 데이터가 데이터 및 빅데이터의 기본적인 속성을 만족시키는 지에 대한 확인이 필요하다. 이후, 수집된 데이터의 유형을 확인하여 활용 가능한 분석 방법을 통해 유의미한 결과를 도출할 수 있는 방안을 계획해야 한다.

이를 위한 데이터 분석과정을 LeCompte& Schensul(1999), Wolcott(1994), Beck(2003), Doucet&Mauthner(1998), Miles&Huberman(1994) 은 다음 5가지 단계로 정리한다[7]. 1) 수집된 데이터의 속성에 따라 데이터로부터 도출할 수 있는 연구문제 및 예상 결과를 구성한다(Narrative). 2) 실질적으로 수집된 데이터의 유형을 파악하고 적합한 데이터 분석 기술 (통계적 분석, 데이터 마이닝, 텍스트 마이닝, 소셜 네트워크 분석 등)을 활용하여 분석 값을 도출한다 (Coding). 3) 이론 및 기존 사례 등 논리적 근거를 바탕으로 분석 값을 해석한다(Interpretation). 4) 연구문제, 데이터분석, 분석값 해석 등 진행한 연구 과정의 타당성을 검증한다(Confirmation). 5) 도출한 결과를 스토리 구성, 그래픽 작업 등을 통해 효과적으로 전달할 수 있도록 작성한다(Presentation).

Ⅲ. 공유자전거 데이터 활용 사례분석

1. 국내 공유자전거 데이터의 활용 사례

국내 공유 자전거 시스템은 총 10개의 도시에서 운영되고 있다4. 이외에도 민간기업에서 스마트 공유 자전거 시스템을 운영하고 있다. 대부분 자전거 거치대에 있는 배치되어 있는 자전거를 키오스크나 휴대폰 앱을 통해 대여 및 반납하여 사용하지만, 거치대가 없는 형태도 있다.

사용자가 공유자전거를 사용하면, 관련 정보는 데이터로서 수집·저장된다. 데이터를 분석하는 목적은 공유자전거 이용률 및 회전율 파악, 시스템의 문제점 파악, 공유 자전거 사용에 영향을 미치는 요인 분석, 공유 자전거 사용을 활성화 시키기 위한 방안 제안 등이다. 수집·저장되는 데이터의 종류는 공유자전거 시스템 회원가입을 통한 사용자의 개인정보, 자전거 정보, 자전거 정류소 정보, 사용자의 자전거 이용정보이다. 연구자들은 이 데이터에 추가적인 데이터(예를 들어, 자전거 대여소 근처의 시설이나 지리적 환경, 날씨 등)를 더 하여 공유자전거와 관련된 데이터를 분석한다. 데이터를 분석하는 방법은 GIS 네트워크 분석기법, 소셜 네트워크 분석, 방정식을 활용한 비율 분석, 통계 기반 분석, 군집 분석 등을 활용 가능하다.

[표 6]은 국내의 공유자전거 데이터를 활용한 선행연구를 정리한 표로, 대부분 O-D (Origin-Destination) 데이터를 바탕으로 공유 자전거 시스템을 이용 중인 지역의 지리적 데이터(GIS, GPS 활용), 사용자가 공유 자전거를 사용한 날의 기본 데이터(날씨, 미세먼지 등)를추가하여 데이터를 분석한 것을 알 수 있다[8-13].

표 6. 국내의 공유자전거 데이터 활용[8-13]

CCTHCV_2021_v21n7_259_t0006.png 이미지

2. 해외 공유자전거 데이터 활용 사례

해외의 공유자전거 시스템은 네덜란드 암스테르담의 White Bike를 시작으로, 시대와 기술방식에 따라 크게 4세대로 구분할 수 있다. 3세대가 되어서야 IT 기술이 접목하여 Smart Bike라 명명하며, 마그네틱 카드를 통해 사용자들의 개인정보(인적사항 및 결제정보 등)를결합하여 도시 내에서 공유자전거를 이용할 수 있게 하였다. 4세대가 되면서 Smart Card로 변경하게 되었고, 3세대 마그네틱 카드의 한계를 극복하여 대용량의 데이터를 매우 안정적으로 읽고 쓸 수 있게 되었다. 누가, 언제, 어디서 자전거를 대여하여 어떤 경로로 이동하였는지 추적 가능하다[10].

최근에는 덴마크 코펜하겐의 Bycyklen, 스페인 바르셀로나의 Bicing, 네덜란드 암스테르담의 OV-fiets, 캐나다 몬트리올의 BIXI, 미국 워싱턴의 Capital Bikeshare, 영국 런던의 Barclays Cycles 등 대도시 내의 공유 자전거 이용이 꾸준히 증가하고 있다.

국내와 마찬가지로 해외에도 각 도시의 시민들이 공유자전거를 사용함에 따라 많은 연구자들은 공유자전거 데이터를 활용하여 유의미한 결과를 도출하기 위해 다양한 방법으로 데이터를 분석한다[표 7]. 해외의 경우 공유자전거 데이터를 분석하는 목적은 공유자전거의 사용현황 파악, 주변환경(시간, 공간 등)이 공유자전거사용에 미치는 영향 파악, 주변 교통수단과의 연결 방안 분석, 공유자전거 정류소 사용 예측 및 사용 불균형원인 파악, 공유자전거 관련 정책이 공유자전거 시스템사용에 미치는 영향 등이다. 이와 같은 목적을 달성하기 위해 사용한 데이터의 종류는 자전거 사용 경로 (O-D 데이터), 정류소 정보(위치, 수 등), 자전거 사용날짜 및 시간, 도시 지리정보 등을 활용한다. 데이터를 분석하기 위한 방법은 기술통계, 클러스터링, 데이터 마이닝, Spatial Temporal Analysis, 수학적 최적화 (Mathematical Optimization), Intelligent Data Analysis 등을 활용한다.

표 7. 해외의 공유자전거 데이터 활용[14-18]

CCTHCV_2021_v21n7_259_t0007.png 이미지

Ⅳ. 세종특별자치시 공유자전거 어울링 데이터 활용을 위한 분석방법 적용

본 장에서는 앞서 고찰한 데이터의 속성에 따른 분석과정·국내외 공유자전거 데이터 활용사례를 통해 도출한 데이터 분석방법을, 세종특별자치시 공유자전거인 어울링 데이터에 적용하여 활용성을 검증한다. 데이터를 분석하는 과정은 위에서 고찰한 5단계를 바탕으로 재구성하여 [표 8]과 같이 구성한다. (변수) 수집·저장한 데이터를 바탕으로 변수를 선정하고, (분석목적) 변수를 통해 도출할 수 있는 연구문제 및 예상결과를 도출한다.

표 8. 어울링 데이터 분석과정

CCTHCV_2021_v21n7_259_t0008.png 이미지

(Narrative). (분석방법) 변수종류와 분석목적에 적합한 분석방법을 선택하여 분석값을 도출한 뒤(Coding), (분석결과) 분석결과를 해석·검증·시각화 등을 통해 표현한다(Interpretation, Confirmation, Presentation).

1. 어울링 데이터 수집·저장

본 연구에서는 정보통신기획평가원의 지원을 받아 수행한 과제의 일환으로 한국전자통신연구 원(ETRI)로부터 제공받은 세종특별자치시 공유자전거 어울링 사용내역 중 2019년 1년간의 데이터를 활용하였다. 총 1,044,284건의 어울링 사용내역을 활용하였다.

2. 어울링 데이터 분석과정

2.1 변수 선정

어울링 데이터를 분석하기 위해 사용한 변수는 사용자의 정보(사용자의 아이디, 성별, 나이), 어울링의 기본정보(정류소 주소, 정류소 아이디, 정류소의 위치정보), 어울링 사용정보(대여날짜, 반납날짜, 대여요일, 사용 시간, 사용거리)이다[표 8].

2.2 데이터 분석목적

수집한 데이터를 바탕으로 선정한 변수를 통해 도출할 수 있는 분석목적을 도출한다. 사용자 아이디, 사용자 성별, 사용자 나이, 자전거 아이디, 정류소 위치정보, 정류소 아이디, 사용시간, 사용거리는 단일 변수로 사용하여 사용자의 수, 정류소 배치현황, 정류소 수량, 성별에 따른 자전거의 사용현황, 나이에 따른 자전거의 사용현황 등을 파악한다. 사용자 성별, 사용자 나이, 대여 날짜, 반납날짜, 대여요일, 사용시간, 사용거리 변수는 2개 이상의 변수를 사용하여 두 변수 간의 상관관계를 분석한다. 자전거의 이동경로를 파악하기 위해서는 자전거의 반납날짜와 대여날짜를 이용하여 O-D(Origin-Destination) 데이터를 구성한다. 이를 통해 자전거 사용현황을 파악한다.

2.3 데이터 분석방법

데이터 분석방법은 변수의 분석 단위에 따라 분류 할 수 있다. 단일변수는 기술통계를 사용하여 각 변수의 일반적인 특징(빈도수, 평균 등)을 분석한다. 또한, Clustering, GIS 분석 등을 통해 도시 공간 정보와 결합하여 변수 별 자전거 사용지역을 도출한다.

단일 & 다중변수는 단일변수로도 데이터 분석이 가능하지만, 다른 변수와 결합하여 다중변수로서 회귀분석, 상관분석 등을 통해 두 변수 간의 관계성을 파악한다. 또는, Spatial Temporal, Clustering, 예측모델을 적용한 분석, (순차)패턴분석을 한다.

3. 데이터 분석결과

3.1 사용자의 일반적 특성

사용자의 일반적 특성은 2019년 1년 간 세종특별자치시에 공유자전거를 사용하는 사람들의 수, 나이, 성별을 분석한 결과이다. 먼저, 2019년 1년 동안 세종특별자치시의 공유자전거인 어울링의 사용건수는 1,044,284건이다. 사용자의 성별은 남성 701명, 여성 166명으로, 여성보다 남성 사용자의 빈도가 훨씬 높았다. 사용자의 연령은 10대 11명, 20대 167명, 30대 30 명, 40대 564명, 50대 95명이 사용하여, 20대와 40대 시민들의 공유자전거 사용 빈도가 다른 연령대 보다 상대적으로 높았다.

CCTHCV_2021_v21n7_259_f0001.png 이미지

그림 1. 성별(좌) 및 연령(우)에 따른 공유자전거 사용

3.2 사용자의 나이 및 성별에 따른 특성

[그림 2]는 연령 및 성별에 따른 공유자전거 사용 빈 도수를 함께 분석하여 나타낸 그래프이다. 데이터 변수는 성별(남성, 여성)과 연령(0-9세, 10-19세, 20-29세, 30-39세, 40-49세, 50-59세, 60-69세, 70-79세, 80세 이상)을 사용하였다. [그림 2]의 연령 피라미드에서 보는 것과 같이, 성별은 여성보다 남성의 사용빈도가 높다. 연령은 다른 나이대와 비교하여 40대의 공유자전거 사용 빈도가 높으며, 그 외 남성은 20대, 50대, 10대, 여성은 30대 순으로 시민들의 공유자전거 사용빈도 가 높게 나타났다.

CCTHCV_2021_v21n7_259_f0002.png 이미지

그림 2. 연령 및 성별에 따른 공유자전거 사용

[그림 3]은 남녀가 연령에 따라 공유자전거를 얼마나 사용했는지 비율을 나타낸 그래프이다. 남성은 40-49 세가 전체 공유자전거 사용 비율의 80.9%, 여성은 40-49세가 82.6%를 사용비율을 보여 남녀 모두 40대가 공유자전거를 가장 활발하게 사용하고 있음을 볼 수 있다.

CCTHCV_2021_v21n7_259_f0003.png 이미지

그림 3. 연령에 따른 공유자전거 사용 비율

3.3 자전거 및 정류소의 일반적 특성

2019년에 어울링 사용자가 이용한 자전거 정류소는 총 411곳이다[그림 4]. 1년간 이용한 자전거의 수는 1,246개이다. 정류소는 2019년 12월 기준으로 세종특별자치시 상위 5개동 어진동 55개소, 다정동 46개소, 나성동 33개소, 고운동 30개소, 도담동 29개소를 활발하게 사용하였다5.

CCTHCV_2021_v21n7_259_f0004.png 이미지

그림 4. 세종특별자치시 공유자전거 대여소 위치 현황

3.4 자전거 사용빈도와 거리 간의 관계

공유자전거의 사용빈도와 거리 간의 상관관계를 분석하기 위해 “공유자전거의 출발정류소와 도착정류소의 거리는 공유자전거 사용빈도에 부(-)의 영향을 미칠 것이다”라는 가설을 설정하고 회귀분석을 실시하였다. 즉, 독립변수로 공유자전거 사용빈도, 종속변수로 공유자전거로 이동한 거리를 설정하였다.

표 9. 공유자전거 사용빈도와 거리 간의 관계 분석

CCTHCV_2021_v21n7_259_t0009.png 이미지

**.p < 0.01

먼저, R=.397로 독립변수와 종속변수의 상관관계가 다소 높게 나타났다. 또한, F값은 10.054, 유의확률은 .002로서 회귀선의 모델이 적합하다는 것을 보여주며, 회귀식에 대한 R2=.122로 12.2%의 설명력을 보인다. t 값이 –3.170으로 ±1.96보다 크고, 유의확률(p)은 .002로서 p<.05이므로 가설은 채택되었다. 따라서, 출발정류소와 도착정류소의 거리와 사용빈도는 상관성이 없다고 말할 수 없다.

3.5 자전거의 이동경로

공유자전거의 이동경로는 사용건수와 같이 1,046,865건이다. 그 중 [그림 5]는 자전거 출발정류소(Origin)가 127.24788, 36.5120(아름동 복합커뮤니티센터 앞 정류소)인 이동경로(O-D)를 나타낸 그림이다. 127.24788, 36.5120에서 출발하여 공유자전거를 사용한 건수는 총 25, 860건이며, 도착정류소는 총 67군데이다.

CCTHCV_2021_v21n7_259_f0005.png 이미지

그림 5. Origin이 127.24788, 36.5120인 자전거 이동경로

Origin 127.24788, 36.5120인 자전거의 O-D 빈도수를 분석해보면, 출발지로 되돌아온 경우가 가장 많았으며 도담동 먹자골목 근처, 종합청사, 그 외 주거지로 이동하기 위해 공유자전거를 사용한 사례가 많았음을 알 수 있다. 반면, 1회 혹은 2회의 빈도수로 조치원역, 조치원 공영버스터미널이나 글벗중학교, 세종예술고등학교·세종중앙공원, 홍익대학교 세종캠퍼스, 고려대학교 세종캠퍼스를 방문하기 위해 먼 거리를 사용한 사례도 볼 수 있었다.

표 10. Origin 127.24788, 36.5120인 자전거 O-D 빈도

CCTHCV_2021_v21n7_259_t0010.png 이미지

3.6 요일 별 자전거 사용현황

[그림 6]은 요일별 공유자전거를 사용한 빈도수를 나타낸 그래프이다. 주중(월-금)에는 약 20,000건 정도의 사용 빈도를 보인 반면, 휴일(토-일, 공휴일)에는 50,000건 정도의 사용빈도로 주중과 비교하여 2배 이상의 사용빈도가 나타난 것을 볼 수 있다.

CCTHCV_2021_v21n7_259_f0006.png 이미지

그림 6. 요일별 공유자전거 사용

Ⅴ. 공유자전거 데이터 분석 및 활용방안

1. 공유자전거 사용현황 및 문제점 파악을 통해 해결방안 도출

1.1 자전거 및 정류소의 단순 사용빈도 분석

공유자전거의 사용 현황과 문제점을 파악하기 위한 가장 기초적인 방법으로, 자전거와 정류소의 단순 하용빈도를 파악하는 방법이다. 통계적 분석 방법 중, 기술 통계량 분석법을 활용할 수 있다. 단순 사용빈도 분석을 통해 활발하게 사용되고 있는 지역과 상대적으로 활용 빈도가 낮은 지역의 자전거와 정류소가 도출된다. 또한, 자전거 및 정류소의 개수와 비교하여 과부하 되는 지역도 도출 가능하다. 도출 결과를 통해 현재 공유자전거 시스템 활용의 문제점을 파악할 수 있으며, 해결방안 제안을 위한 기초자료로 사용 가능하다.

1.2 O-D 데이터를 활용한 자전거 이동경로 분석

정류소의 위치정보를 활용하여 사용자가 자전거를 대여하여 출발한 지점과 도착하여 반납한 지점(O-D 데이터, Origin-Destination 데이터)의 데이터를 분석하여 자전거가 이동한 경로를 분석할 수 있다. 도시 내 자전거 이동경로와 이동경로의 빈도수를 분석하면, 어떤 지역의 공유자전거 활용이 가장 활발한지 파악할 수 있다. 또한, 날짜, 시간, 날씨 등 추가적인 정보를 더하여 통계적 분석(상관분석, 회귀분석 등)을 한다면, 이동 경로의 목적도 유추할 수 있다.

1.3 주변 환경 정보 분석을 통해 자전거 사용 현황에 대한 근거 도출

공유자전거 정류소 주변의 시설 및 지리적 환경 등을 분석하여 사용자가 자전거를 사용하는 빈도와 비교분석 할 수 있다. 주변 환경 정보 공유자전거 사용 불균형에 영향을 주는지 GIS(지리정보시스템)과 연결하여 분석한다면, 현재 공유자전거 사용현황 결과에 대한 근거를 도출할 수 있다. 공유자전거 시스템 활성화를 위해 보완해야 할 사항을 도출하기 위한 기초자료로 사용 가능하다.

2. 공유자전거 사용 확장 및 활성화 방안 도출

2.1 주변 교통수단과 연계하여 공유자전거 사용의 편의성 도모

자전거와 정류소에 대한 분석을 확장하여, 공유자전거 시스템이 구축되어 있는 지역 주변의 타 교통수단을 분석한다. 사용자가 먼 거리를 이동한다고 가정할 때, 자전거 이동경로의 도착지점에서 자전거를 반납한 뒤타 교통수단으로 환승하여 최종 목적지까지 이동할 수 있는 동선을 예측할 수 있다. 이와 같은 공유자전거 사용의 확장성에 대한 고찰은 자전거 정류소를 배치해야 하는 적절한 위치정보를 제공한다.

2.2 이동경로 분석 및 예측을 통해 공유자전거 사용의 활성화 도모

Spatial Temporal Analysis, Mathematical Optimization, Intelligent Data Analysis, 클러스터링 등의 분석방법을 통해 자전거 사용의 이동경로와 사용 불균형에 대한 분석 및 예측이 가능하다[19-21]. 이는 앞서 언급한 O-D 데이터를 활용한 자전거 이동 경로 분석에 더하여 예측이 가능하다는 점에서 차이가 있다. 사용자의 이동경로를 분석하여 자전거를 보다 편리하게 사용할 수 있는 방안 도출이 가능하다.

3. 효율적 공유자전거 관리 및 운영방안 도출

3.1 공유자전거 및 정류소 사용 분석 및 예측을 통해 자전거 재배치 및 거치대 설치

수요예측모델을 통해 자전거와 정류소 사용을 분석하고 예측한다. 분석 및 예측결과를 바탕으로 각 정류소에 설치해야 하는 거치대의 수량과 배치해야 하는 자전거의 수량을 파악한다. 공유자전거 이용 과부하로 인해 발생하는 문제를 해결할 수 있다.

3.2 관련시설 고장 패턴을 분석하여 대비

수집·저장되는 데이터를 통해 파악 가능한 시설 고장에 대한 정보를 활용하여, 자전거·키오스크·거치대·어플리케이션 등 관련 시설 고장 패턴을 분석한다. 발생 가능한 문제를 미리 대비하여 공유자전거를 사용하는데 불편함을 줄일 수 있다.

Ⅵ. 결론 및 시사점 – 공유자전거 데이터 활용의 한계 및 확장성

본 논문의 목적은 도시 공간 내 공유자전거 시스템을 통해서 수집되는 데이터를 활용하여, 도시 공간 내 이동성(Mobility)를 향상시킬 수 있는 방안을 모색하는 것이다. 이를 위해, 문헌고찰을 통해 데이터의 기본적인 속성과 유형, 분석방법을 고찰하고, 선행연구를 통해 실제 공유자전거 시스템 데이터의 활용사례를 분석하였다. 세종특별자치시의 공유자전거 시스템인 어울링 데이터를 적용하여 데이터 분석 및 활용방안 도출함으로써 앞서 고찰·분석한 내용을 검증하였다. 최종적으로, 공유자전거 데이터를 분석·활용하여 시스템 활성화 방안을 마련할 수 있는 방법을 제시하였다. 다양한 분석 방법 고찰을 통해 계획적 분석을 위해 수집된 데이터뿐 만 아니라, 비의도적으로 수집된 데이터 활용의 확장을 도모할 수 있다.

데이터 분석 방법은 다음 3단계와 같다. 수집한 데이터에서 변수를 선정하고, 선정한 변수를 통해 도출할 수 있는 유의미한 분석목적을 도출한다. 변수 1개를 분석하여 변수 자체의 특성을 파악하거나, 변수 2개 이상을 분석하여 변수 간의 상관관계를 파악한다. 분석 방법은 변수의 분석 단위에 따라 선택한다.

이와 같은 일련의 과정을 통해 1) 자전거의 사용 빈도 및 이동경로를 분석하는 등 공유자전거의 사용현황 및 문제점을 파악하여 해결방안을 도출하거나, 2) 주변 교통수단과의 연계, 혹은 예측을 통해 공유자전거의 활성화 방안을 도출하거나, 3) 자전거를 재배치하거나 관련 시설 고장 패턴을 분석하여 대비하는 등 공유자전거를 효율적으로 관리하고 운영할 수 있는 방안 도출 등 공유자전거 데이터를 분석하고 활용할 수 있는 방안을 제안하였다.

본 논문을 통해 공유자전거 관련 데이터를 분석하여 얻을 수 있는 결과를 미리 설정하고, 관련 데이터를 유형과 속성에 따라 수집하는 등 데이터 활용을 위한 기획이 가능하다. 도시공간과 연계되는 공유자전거 관련 데이터를 보다 체계적으로 수집하고, 도시의 이동성(mobile) 관련 문제를 해결할 수 있다. 나아가 자전거도로 구축 및 IT기술 기반 공유경제 비즈니스 모델 구축 등 비즈니스 사업으로 확장 가능하다[22].

또한, 본 논문은 문헌과 선행연구를 바탕으로 한 연구로, 분석 내용이 검토한 자료에 한정되어 있다는 한계를 갖는다. 검토한 자료에서 활용한 데이터는 모두 정형데이터이며, 선행연구에서 활용한 분석방법도 제한적이었다. 공유자전거 시스템의 활성화를 도모하기 위해서는 시스템 자체를 통해 수집·저장되는 데이터 외에도 사용자를 통해 획득할 수 있는 비정형 데이터가 있다. 예를 들어, 텍스트 혹은 이미지 기반의 소셜 미디어(SNS)를 통해 수집·저장할 수 있는 실질적인 사용자의 불편함이나 공유자전거 관련 시설 이용의 선호 등이 있다. 보다 다양한 유형의 데이터를 활용하여 새로운 분석 방법을 시도한다면 공유자전거 시스템 활성화를 위해 보다 다양한 방법이 도출될 것이다.

공유자전거는 도시 공간에 기반을 두고 있기 때문에, 공유자전거 시스템 활성화를 도모할 때 도시 공간에 대한 고려는 필수적이다. 추후 도시 공간과 도시 공간을 사용하는 거주자에 대한 데이터를 연결하여 공유자전거 데이터를 활용할 수 있는 범위를 확장해 가야 한다. 나아가 공유경제의 지속 가능한 경영 요인으로서 활용이 필요하다[23].

* 이 논문은 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.2018-0-00225, 과학적 정책 수립을 위한 도시행정 디지털트윈 핵심 기술 개발)

참고문헌

  1. E. Come, N. A. Randriamanamihaga, L. Oukhellou, and P. Aknin, "Spatio-temporal analysis of dynamic origin-destination data using latent dirichlet allocation: Application to velib'bike sharing system of paris," In TRB 93rd Annual meeting (p. 19p). TRANSPORTATION RESEARCH BOARD, p.2, 2014.
  2. 미래창조과학부, 빅데이터 활용 단계별 업무절차 및 기술 활용 매뉴얼 (Version 1.0), 2014.
  3. 민금영, 빅데이터 속성이 재난대응 의사결정에 미치는 영향에 관한 연구, 동국대학교, 박사학위논문, pp.26-27, 2013.
  4. B. K. Kahn, D. M. Strong, and R. Y. Wang, "Information quality benchmarks: product and service performance," Communications of the ACM, Vol.45, No.4, pp.184-192, 2002. https://doi.org/10.1145/505248.506007
  5. Gartner's Big Data Definition Consists of Three Parts, Not to be Confused with Three "V"s, https://blogs.gartner.com/svetlana-sicular/gartnersbig-data-definition-consists-of-three-parts-not-to-be-confused-with-three-vs/
  6. 하연편집부, 빅데이터와 DBMS 시장전망, 하연출판사, 2012.
  7. B. B. Kawulich, "Data analysis techniques in qualitative research," Journal of research in education, Vol.14, No.1, pp.96-113, 2004.
  8. 김형배, GPS와 GIS 데이터를 이용한 자전거 도로의 노선 적합성 연구, 경북대학교 과학기술대학원, 석사학위논문, 2013.
  9. 이문섭, 서울시 공공자전거 무인대여소의 이용특성 분석, 서울시립대학교, 석사학위논문, 2016.
  10. 박현규, 녹색교통으로서 통근통학 시간대의 서울시 공공자전거 따릉이 이용특성 분석, 서울시립대학교, 석사학위논문, 2018.
  11. 서다윤, 대전.세종시 공공자전거시스템 데이터 분석을 통한 운영효율성 제고, 한밭대학교, 석사학위논문, 2018.
  12. 사경은, 서울시 공공자전거 이용에 영향을 미치는 물리적 환경 요인에 관한 연구, 한양대학교, 석사학위논문, 2019.
  13. 이창환, 군집분석을 통한 서울시 자전거 공유 시스템 수요 예측, 서울과학기술대학교, 석사학위논문, 2020
  14. P. Borgnat, E. Fleury, C. Robardet, and A. Scherrer, "Spatial analysis of dynamic movements of Velo'v, Lyon's shared bicycle program," In ECCS'09. Complex Systems Society, 2009
  15. J. E. Froehlich, J. Neumann, and N. Oliver, "Sensing and predicting the pulse of the city through shared bicycling," In Twenty-First International Joint Conference on Artificial Intelligence, 2009.
  16. P. Borgnat, P. Abry, P. Flandrin, C. Robardet, J. B. Rouquier, and E. Fleury, "Shared bicycles in a city: A signal processing and data analysis perspective," Advances in Complex Systems, Vol.14, No.3, pp.415-438, 2011. https://doi.org/10.1142/S0219525911002950
  17. N. Lathia, S. Ahmed, and L. Capra, "Measuring the impact of opening the London shared bicycle scheme to casual users". Transportation research part C: emerging technologies, Vol.22, pp.88-102, 2012. https://doi.org/10.1016/j.trc.2011.12.004
  18. P. Vogel, "Service network design of bike sharing systems," In Service Network Design of Bike Sharing Systems, Springer, Cham, pp.113-135, 2016.
  19. J. Wang, C. H. Tsai, and P. C. Lin, "Applying spatial-temporal analysis and retail location theory to public bikes site selection in Taipei," Transportation Research Part A: Policy and Practice, Vol.94, pp.45-61, 2016. https://doi.org/10.1016/j.tra.2016.08.025
  20. S. Maas, P. Nikolaou, M. Attard, and L. Dimitriou, "Spatial and temporal analysis of shared bicycle use in Limassol, Cyprus," Journal of Transport Geography, Vol.93, 103049, 2021. https://doi.org/10.1016/j.jtrangeo.2021.103049
  21. X. Yang, Introduction to mathematical optimization, From linear programming to metaheuristics, 2008.
  22. 유옥길, IT 기술을 기반으로 하는 공유경제 비즈니스 모델 비교 연구 : 한국과 중국을 중심으로, 건국대학교, 석사학위논문, 2019.
  23. 최은진, 공유경제의 지속가능 경영 요인에 관한 연구: 중국 공유자전거 산업을 중심으로, 인하대학교, 석사학위논문, 2020.