1. 서 론
급속한 도시화 과정을 거친 대한민국은 도시 공간의 형성과정에서부터 안전·시설물관리, 환경· 교통문제, 건설 분야, 토지이용 등 여러 분야에서 다양한 문제들을 직면하고 있다. 이러한 도시문제와 불만을 해결하기 위해 각 지방자치단체에서는 민원신고를 통해 이를 접수·처리하고 있다. 민원은 크게 오프라인과 온라인으로 나뉘는데, 과거에는 오프라인 또는 팩스로 접수되었다. 하지만 정보통신기술의 발달에 따라 스마트기기의 보급률이 증가하였고, 소셜미디어의 등장으로 데이터가 기하급수적으로 증가하여 대용량의 데이터인 빅데이터(Big Data) 시대가 도래하면서 민원은 대부분 오프라인이 아닌 온라인에서 접수되고 있다(Ko, 2014). 한국정보화진흥원의 ‘전자정부서비스 이용실태 조사보고서(2014)’에 따르면 전자정부서비스를 이용해본 비율이 72.5%로 국민 10명 중 7명이 전자정부서비스를 이용하여 대부분 오프라인보다 온라인에서 접수되고 있는 것으로 나타났다(Jang, 2015). 이는 정보통신기술의 발전에 따라 편리함을 추구하는 온라인 민원 서비스가 제공되면서, 온라인을 통한 민원접수가 점점 많아지고 있음을 말한다.
이러한 민원을 효율적으로 해결하고자 공공기관에서 다양한 연구들이 제시되고 있다. 부산시는 공공데이터를 활용하여 빅데이터 활용 기반 공공데이터, 부산민원 상담DB, 복지종합서비스 등을 구축하여 스마트 도시 관리 추진 전략을 수립하고자 하였다(Lee, 2015). 그리고 경기도는 스마트폰으로 접수된 생활 민원을 빅데이터를 활용해 분석하고, 이를 바탕으로 민원의 원인을 찾고 해결하기 위한 연구를 하고 있으며(Park, 2014), 국민권익위원회는 공공분야뿐만 아니라 민간영역을 포함해 국내외 사례조사, 민원정보를 분석하기 위한 기술, 빅데이터 기반 민원분석업무의 발전 방안을 연구하고 있다(Sim et al., 2013). 이처럼 다양한 기관에서 많은 연구가 이루어지고 있으며 공간정보가 포함된 공간 빅데이터를 활용하여 사회적 문제를 해결하기 위한 노력들이 이루어지고 있지만 민원은 해를 거듭할수록 증가하고 있는 실정이다.
따라서 본 연구는 지방 중소도시인 진주시를 대상으로 2010년부터 2015년까지 총 6년간 제기된 전자민원을 수집하여 Visual Studio 2015 개발환경에서 Visual Basic 프로그래밍 언어로 개발한 민원 분류 프로그램을 이용해 민원사유별로 분류하고 발생지점 위치데이터를 추출한 뒤 지오코딩(Geocoding)을 통해 점 데이터로 변환하였다. 그리고 GIS 공간분석기능을 활용하여 민원 발생지점의 분포 특성과 토지이용의 연관성을 분석하여 지속적으로 발생되는 민원에 대해 공간적인 발생요인을 분석하였다.
2. 전자민원 데이터 분석
2.1 R 프로그램을 이용한 텍스트마이닝
R 프로그램은 오픈소스이며 무료 소프트웨어로 통계 데이터 분석과 수정에 사용되는 프로그램 중 하나이다. R 프로그램은 데이터 분석을 위한 다양한 패키지들을 제공한다. 커뮤니티 회원들은 R의 기능을 향상시키기 위해 주기적으로 패키지의 기능을 업데이트 시키고 있다. R은 통계와 그래픽스관련 기능을 확장할 수 있고, 고유 언어 내장 프로그램 기능과 더불어 수백 가지의 통계적 함수를 제공한다. R은 이러한 다양한 장점들을 바탕으로 통계 분야에서 인지도를 쌓아 왔으며, ‘RHIPE’ 패키지를 통해 하둡(Hadoop) 환경상에서 MapReduce와 연결시켜 데이터의 분산처리를 지원할 수 있기 때문에 구글, 페이스북 등 빅데이터 분석을 필요로 하는 기업에서 R을 사용하여 분산 컴퓨팅 환경을 구성해 대용량 데이터 통계분석뿐만 아니라 데이터 마이닝을 위해 널리 사용되고 있다(Han and Jin, 2014). 이러한 R 프로그램은 학제 간의 융합연구가 필요한 정형 및 비정형 빅데이터 분석에 요구되는 기본 프로그램 중 하나이다(Choi and Yoo, 2014). 또한 최근 화두가 되고 있으며 빅데이터(Big Data)에 공간정보 및 처리 기법이 포함된 공간 빅데이터(Spatial Big Data)의 분석 및 처리에도 사용되고 있다.
R 프로그램 내에서 ‘KoNLP’는 텍스트마이닝 기법에서 비정형 데이터 중 한국어를 처리하기 위해 만들어진 패키지다. 오픈소스인 카이스트의 Hannanum분석기와 연계하여 인터페이스를 구성하고 국립국어원의 오픈소스 지능형형태소분석기를 적용해 만들어진 패키지이다. 이 패키지는 한글 명사추출함수(extractNoun)와 같은 다양한 함수를 가지고 있다(Jeon, 2015; Seo, 2015).
2.2 커널밀도분석을 이용한 공간패턴분석
공간패턴분석이란 특정한 현상이 공간상에 분산되었는지 또는 집중되어 있는 가를 파악하는 것으로, 특정한 현상을 공간상에 점 데이터로 나타내어 점 개체에 대한 공간분포 패턴을 분석하는 것을 말한다. 점 개체의 분포는 빈도와 밀도, 군집도 등으로 표현될 수 있다. 일반적으로 밀도 추정을 위하여 가우시안 커널밀도 함수를 많이 사용하고 특정 지점 p에 대한 밀도는 대상지역의 점 개체의 분포를 토대로 대상지역 전체에 걸친 공간밀도를 추정하는 커널밀도분석에 의해서 추정된다(Eq. (1)).
where : Density estimator, n : Number of point, a(=πr2): Area of a circle, p: Specific spot, r: Radius, C(p,r): Kernel on r at p.
커널밀도분석은 대상지역 전체에 걸쳐 추정된 공간밀도를 시각화 할 수 있고, 점 데이터의 분포 패턴을 분석할 때 특정현상이 군집된 지역을 Hot spot으로 나타내어 보다 효과적이고 정량적으로 표현할 수 있기 때문에 다양하게 활용할 수 있는 분석 기법이다(Lee and Sim, 2011).
2.3 민원 분류 프로그램 개발
전자민원 데이터를 민원사유별로 분류하고 위치데이터를 추출하기 위해 Visual Studio 2015 개발환경에서 Visual Basic 프로그래밍 언어로 민원 분류 프로그램을 개발하였다. Fig. 1(a)는 민원 분류 프로그램의 전반적인 구조 및 UI(User Interface)이다. 프로그램의 구성은 총 5단계로 구성되어 있으며, 1단계는 취합한 전자민원 데이터를 입력하는 단계, 2단계는 민원사유 데이터베이스를 불러오는 단계, 3단계는 1단계에서 읽어온 전자민원 데이터 중 2단계에서 선택한 민원사유를 포함한 데이터만 추출하는 단계, 4단계는 위치데이터를 추출하기 위해 도로명·지번·동명 데이터베이스를 읽어오는 단계, 마지막으로 5단계는 읽어온 도로명·지번·동명 데이터베이스로 민원사유별로 분류된 민원들의 위치데이터를 추출하는 단계로 이루어져 있다(Fig. 1(b)).
Fig. 1.Civil complaints classification program
3. 데이터구축 및 결과분석
3.1 데이터구축
인터넷 전자민원은 각 지방자치단체에서 운영하는 홈페이지의 전자민원창구에서 접수할 수 있다. 다음 Fig. 2는 접수된 전자민원의 예시이다. 공개된 전자민원은 개인정보보호를 위해 해당 민원 접수자의 거주지 주소, 나이 등 자세한 정보는 공개하지 않는다. 하지만 현재 Fig. 2(a)처럼 전자민원은 민원을 제기한 사유와 제기된 장소를 포함하고 있다. 따라서 본 연구는 2010년부터 2015년까지 6년간 제기된 경남 진주시의 전자민원을 취득하여 민원 데이터베이스를 구축하였다(Fig. 2(b)).
Fig. 2.Construction of electronic civil complaints data
3.2 결과분석
진주시에서 2010년부터 2015년까지 제기된 전자민원은 총 1,664건으로, 2010년에는 163건이었으나 2014년은 2010년에 비해 약 2.85배인 464건이 발생하였고, 2015년에는 246건이 발생하여 해를 거듭할수록 증가하다가 약간 감소하는 추세인 것으로 나타났다(Fig. 3).
Fig. 3.Electronic civil complaints by year
6년간 발생한 전자민원을 월별로 나누어 분석한 결과, 전자민원은 여름(6,7,8월)에 648건, 봄(3,4,5월)에는 406건, 가을(9,10,11월)에는 360건, 겨울(12,1,2월)에는 250건이 발생하였다. 민원은 전체 1,664건 중 648건(약 39%)이 6,7,8월에 발생하여 다른 계절에 비해 여름에 집중되어 발생한 것으로 나타났다(Fig. 4).
Fig. 4.Electronic civil complaints by month
3.2.1 R 프로그램을 이용한 민원사유 분석
본 연구에서는 진주시청의 전자민원창구에서 2010년부터 2015년까지의 진주시 전자민원을 취득한 뒤 R 프로그램의 비정형 데이터 텍스트마이닝을 위한 패키지 중 'KoNLP'를 이용하여 키워드 분석을 통해 민원사유를 추출하여 민원사유 데이터베이스를 구축하였다. 다음 Fig. 5는 R 프로그램으로 키워드 분석을 실시하여 민원사유를 추출한 것이다. 추출한 민원사유(소분류)를 바탕으로 데이터베이스를 만들어 도로교통, 환경민원, 시설물 등 중·대분류로 취합한 결과는 다음 Table 1과 같다. 또한 전자민원에서는 민원 발생지점 위치를 도로명주소·지번주소·동명·건물명으로 나타내고 있다. 따라서 민원발생의 위치데이터를 추출하기 위해 앞서 구축해놓은 전자민원 및 민원사유 데이터베이스뿐만 아니라 도로명·지번·동명 데이터베이스를 추가로 구축하였다.
Fig. 5.Extraction of reasons for civil complaints
Table 1.Classification of reasons for civil complaints
3.2.2 민원 분류 프로그램을 이용한 민원사유별 분류
앞서 구축된 민원사유 데이터베이스를 개발한 민원 분류 프로그램 상으로 읽어와 전자민원을 민원사유별로 분류하였다. 분류한 결과 도로교통시설에 관한 민원이 267건으로 가장 많이 발생하였고 시설물민원은 135건이었으며 환경민원-2는 90건으로 가장 적게 발생한 것으로 나타났다(Fig. 6).
Fig. 6.Occurrence of reasons for civil complaints
민원 분류 프로그램으로 도로명·지번·동명 데이터베이스를 읽어와 민원 발생지점 위치데이터를 추출한 결과, 도로명·지번·동명으로 나타낸 민원이 1,664건 중 547건(33%)에 불과하여 민원위치를 건물명 등으로 약식표기된 것을 직접 위치데이터를 추출해서 593건(36%)을 추가하였다.
3.2.3 공간패턴분석
본 연구는 지속적으로 발생되는 민원에 대해 공간적으로 발생요인을 분석하기 위하여 앞서 추출한 전자민원의 민원사유별 발생지점 위치데이터를 지오코딩 하여 점 데이터화하여 공간상에 나타내고, GIS 공간분석기능 중 커널밀도분석을 이용하여 핫스팟분석을 실시해 토지이용과 민원사유별 발생지점 분포특성간의 연관성을 분석하였다. 그리고 민원 발생지점 반경 50m 이내 시설물의 종류에 관해 분석을 실시하였다. 도로명·지번·건물명은 정확한 발생지점으로 변환하였고, 동명은 동별 주민센터를 기준으로 변환하였다.
진주시 전체 민원에 대해 공간패턴분석을 실시한 결과, 진주시의 전자민원은 유동인구가 가장 많고 인구밀도 또한 가장 높은 시내지역에 집중되어 발생하는 것으로 나타났다(Fig. 7(a)). 따라서 시내지역을 확대하여 시내지역에 한해 다시 분석을 실시하였다. 그 결과 진주시 전자민원은 Table 2에서 나타내고 있는 진주시의 지역별 토지이용처럼, 중심상업지역인 A지역, 택지개발사업으로 형성된 주거지역인 B지역과 공업·주거시설이 혼재된 지역인 C지역에 집중되어 발생한 것으로 나타났다(Fig. 7(b)).
Fig. 7.Spatial distribution of electronic civil complaints
Table 2.Zonal land use
민원사유별로 공간분포 패턴분석을 실시한 결과는 Fig. 8과 같다. 시내버스에 관한 민원은 진주시내지역을 가로지르는 간선도로를 따라 시내버스관련 불편사항들이 발생하였다(Fig. 8(c)). 교통시설에 관한 민원은 여러 곳에서 핫스팟이 발생되었지만, B지역에서 가장 크게 발생하였다. 이곳은 최근 단지개발이 이루어져 형성된 곳으로 아파트단지, 상업시설 및 유흥시설이 많아 유동인구 또한 많은 곳으로 불법도로점유에 관한 민원이 가장 많이 나타났다(Fig. 8(a)). 환경민원-1(먼지·소음·악취·해충)은 B·D지역에 집중적으로 발생하였다. B지역의 핫스팟 지역은 진주시의 중심상업지역과 택지개발사업으로 형성된 주거지역을 이어주는 간선도로들이 교차되는 광장 오거리로 차량 통행량이 많아서 먼지와 소음에 관한 민원이 많이 발생하였고, D지역의 핫스팟은 진주시의 구도심지역으로 현재 전통시장이 있는 지역이지만 건축물 평균 경과연수가 20년 이상인 만큼 기반시설이 노후화된 곳으로 하수도 악취에 관한 민원이 많이 발생한 것으로 나타났다(Fig. 8(b)). 주차민원은 A·C지역에 집중적으로 발생했는데, A지역은 주차장부족으로 인해 불법주차단속이 지속적으로 요구되고 있으며, C지역은 공업·주거시설이 혼재된 지역으로 중심상업지역처럼 유동인구가 많지 않아 주차장부족에 관한 민원은 많지 않았지만 주거지에 차량 주차 때문에 불법주차단속에 관한 민원들이 지속적으로 발생하였다(Fig. 8(d)). 환경민원-2(불법쓰레기투기·수거·소각)은 A·C·E지역에 집중되어 발생하였다. A지역의 핫스팟은 음식점, 판매시설, 유흥시설 등 다양한 상업시설들이 집중된 중심상업지역으로 불법쓰레기투기 민원이 가장 많았고, C지역의 핫스팟은 단독주택·아파트·공장 등이 혼재된 지역으로 생활쓰레기가 많이 발생하여 이곳의 불법쓰레기투기 민원은 좀처럼 해결되지 않고 해를 거듭하며 증가하고 있는 것으로 나타났다. E지역의 핫스팟은 진주시 대학가에 있는 원룸밀집지역으로 상습적으로 생활쓰레기의 불법투기가 나타나는 지역이며 최근 3년간 발생이 급증하였다(Fig. 8(e)).
Fig. 8.Spatial distribution of electronic civil complaints
Fig. 9와 같이 토지이용별로 발생한 민원사유를 추출한 결과, 불법주차단속에 관한 민원이 가장 많았으며, 다음으로 불법쓰레기투기, 소음, 시내버스시간증설 등의 순서로 많이 발생하였다. 중심상업지역은 다양한 상업시설이 밀집된 만큼 불법쓰레기투기 민원이 가장 많았으며, 유동인구가 가장 많으므로 시내버스시간증설, 불법주차단속, 주차장부족 등의 민원이 많은 것으로 나타났다(Fig. 9(a)). 진주시의 옛 구도심인 주거지역은 진주시를 잇는 주도로로 인해 차량 통행량이 많기 때문에 불법주차단속과 소음 민원이 가장 많았다(Fig. 9(d)). 대학가의 상업·주거시설 밀집지역인 주거지역은 원룸밀집지역에서 거주하고 있는 대학생들의 상습적인 생활쓰레기투기로 인해 불법쓰레기투기 민원이 가장 많았다(Fig. 9(e)).
Fig. 9.Types of civil complaints according to the land use
앞서 나타난 결과를 바탕으로 가장 많이 발생한 불법주차 단속 민원의 핫스팟지역은 중심상업지역, 주거지역(구도심), 공업·주거시설 혼재지역이다. 이를 토대로 토지이용별로 나누고 위치를 정확한 주소 및 건물명으로 나타낸 불법주차단속 민원을 추출하여 발생지점 반경 50m 내의 시설물 종류에 관해 분석을 실시한 결과는 Table 3과 같다. 중심상업지역에서 발생한 불법주차단속 민원은 단독주택과 상점이 밀집된 곳에 발생되었고, 공업·주거시설이 혼재된 지역에서는 단독주택이 많은 지역에 발생한 것으로 나타났다. 그러나 구도심에서는 일반음식점이 많은 곳에 집중되어 발생한 것으로 나타났다.
Table 3.Types of facilities within 50m radius of reasons for civil complaints(in case of illegal parking crackdown)
4. 결 론
본 연구는 진주시를 대상으로 2010년부터 2015년까지 제기된 전자민원 데이터를 취득해 민원사유별로 분류하고, 민원발생지점 위치데이터를 추출한 후 공간상에 나타내어 민원발생의 공간분포패턴을 확인하고, 이를 통해 토지이용과 민원 사유별 공간분포특성의 연관성을 분석하여 다음과 같은 결론을 얻었다.
첫째, 취득한 전자민원 데이터를 R 프로그램에 의한 텍스트마이닝을 실시하여 민원사유를 추출하였고, 민원 분류 프로그램을 개발하여 진주시에서 발생한 전자민원을 민원종류별로 분류하였다.
둘째, 추출한 민원사유별 위치데이터를 지오코딩을 통해 공간상에 나타내어 공간패턴분석을 실시해 토지이용과의 연관성을 분석한 결과, 진주시 전자민원은 시내지역에 집중되어 발생하였고, 시내지역 중에서도 중심상업지역, 택지개발로 이루어진 주거지역, 공업·주거시설이 혼재된 지역에 핫스팟을 형성하여 가장 많이 발생한 것을 알 수 있었다. 그리고 민원사유별 공간패턴분석 결과, 불법도로점유 민원은 최근 단지개발로 이루어져 생성된 곳으로 아파트단지, 상업시설, 유흥시설이 밀집된 곳에 많이 나타났고, 불법쓰레기투기 민원은 중심 상업지역, 공업·주거시설 혼재지역, 대학가의 원룸밀집지역에 많이 발생하였으며, 주차민원은 주차장이 부족한 중심상업지역과 불법주차가 많이 이루어지고 있는 공업·주거 혼재지역에서 많이 발생하는 경향을 보였다.
셋째, 토지이용별로 발생한 민원사유를 분석한 결과 불법주차단속 민원이 가장 많았으며, 이를 토지이용별로 나누어 분석한 결과, 중심상업지역에서는 단독주택과 상점이 밀집된 지역에 발생하였고, 공업·주거시설 혼재지역에서는 단독주택이 많은 지역, 그리고 구도심의 주거지역에서는 일반음식점이 밀집된 곳에서 많이 발생한 것으로 나타났다.
각 지방자치단체는 민원을 접수받아 처리하여 해결하고 있음에도 불구하고, 민원은 오히려 증가하고 있는 추세이다. 이는 민원의 근본적인 원인을 분석하여 체계적으로 해결되고 있지 못함을 알 수 있다. 따라서 본 연구는 전자민원사유와 민원자료상에 포함된 위치정보를 추출하고 민원 발생지점을 행정지도상에 나타낸 후 각각의 민원과 토지이용현황을 비교분석함으로써 토지이용에 따른 민원의 공간적 분포특성을 공간 빅데이터 관점에서 분석하여 효과적인 민원해결 방안을 모색할 수 있는 방법을 제시하였다.
참고문헌
- Choi, K. and Yoo, J. (2014), A reviews on the social network analysis using R, Journal of Korea Convergence Society, Vol. 6, No. 1, pp. 77-83. (in Korean with English abstract) https://doi.org/10.15207/JKCS.2015.6.1.077
- Han, G. and Jin, S. (2014), Introduction to big data and the case study of its applications, Journal of the Korean Data Analysis Society, Vol. 16, No. 3, pp. 1337-1351. (in Korean)
- Jang, W. (2015), Utilization rates of electronic government services, New1, Seoul, http://news1.kr/articles/?2182799 (last date accessed: 25 March 2016).
- Jeon, H. (2015), Package "KoNLP", The R Project, Vienna, https://cran.r-project.org/web/packages/KoNLP (last date accessed: 14 May 2015)
- Ko, S. (2014), Analysis of Medical Complaints in a University-Based Dental Hospital, Master's thesis, Dankook University, Yongin, 15p. (in Korean with English abstract)
- Lee, H. and Sim, J. (2011), GIS Geographic Information Systems: The 2nd Edition, Bobmunsa, Paju.
- Lee, W. (2015), A Strategy for Urban Management with Big Data, ISBN 978-89-5896-537-4, Busan Development Institute, Busan, pp. 96-97.
- Park, H. (2014), Solving citizens' complaints through analysis of big data, Gyeonggi-do News Potal, http://gnews.gg.go.kr/news/news_detail_m.asp?number=201402191731034431C048&s_c (last date accessed: 20 March 2016).
- Seo, J. (2015), Data R Love: Analysis of Data for Introductory Using R, Ar-Eum, Suwon.
- Sim, J., Kim, K., Lee, K., and Kim, J. (2013), A Study on the Institutionalization of the Solution of Public Civil Complaints, Task of Anti-Corruption and Civil Rights Commission, The Korean Association for Policy Studies, Seoul, p. 274.
피인용 문헌
- 시계열적 공간통계 기법을 활용한 공시지가의 만족도 분석에 관한 연구 vol.36, pp.2, 2016, https://doi.org/10.7848/ksgpc.2018.36.2.95
- 수용체 기반 지역 위해관리를 위한 환경관련 민원 분석: 부산시 사례를 중심으로 vol.45, pp.6, 2019, https://doi.org/10.5668/jehs.2019.45.6.605
- Big Data Analysis of Busan Civil Affairs Using the LDA Topic Modeling Technique vol.27, pp.2, 2016, https://doi.org/10.22693/niaip.2020.27.2.066
- An Analysis of the Association between Residential Environment Satisfaction and Civil Complaints : Focusing on the Smart Civil Complaints Data in Seoul, Korea vol.55, pp.4, 2016, https://doi.org/10.17208/jkpa.2020.08.55.4.35