Ⅰ. 서론
코로나로 인한 생활 방식의 변화는 일회용 플라스틱 쓰레기라는 또 다른 환경적 문제를 확산시키고 있다. 이로 인하여 최근 선진국을 중심으로 플라스틱을 규제하는 정책 및 자연, 환경 보호에 관심이 높아졌고 UN은 2015년 지속가능 발전 목표의 하나로 ‘책임있는 소비와 생산’을 채택하며 지속가능성에 대한 중요성도 강조되었다. 대표적으로 많은 분야에서 업사이클[1][2] 관심도가 높아져, 새 제품들이 창출되고 있다.
여기서 자원 ‘업사이클(Upcycle)’이란 재활용을 의미하는 ‘리사이클(Recycle)’과 ‘업그레이드(Upgrade)’가 합쳐진 의미이다. 버려지는 물품에 디자인과 활용성을 더해서 높은 가치의 제품으로 재탄생 시키는 활동이다.
그림 1. 업사이클의 배경과 개념
Fig. 1. Background and Concepts of Upcycles
따라서 본 연구에서는 코로나, 플라스틱, 업사이클 세키워드의 연관성을 시각화로 나타내고 국내 플라스틱을 이용한 업사이클의 재활용 및 관련 관심 영역을 이해하며 각종 업사이클 산업 분야에 대해서 알아보고자 한다.
코로나와 플라스틱, 업사이클 관련 분석을 하기 위해 Windows10 운영체제 환경에서 Python 프로그래밍 언어와 사용자 인터페이스를 만들기 위해 C++로 구성된 프레임워크인 PyQt5를 사용하여 크롤링을 하고 크롤링한 자료를 기반으로 시각화로 나타낸다. 또한, 동시에 Python 스크립트를 작성하고 실행할 수 있는 Google Colab을 응용하여 Pandas와 Counter, Matplotib 라이브러리를 사용한 시각화를 나타냈다.
본 논문은 2장에서 관련 연구에 대해서 설명하고 3장에서는 대시보드를 제작하기 위해 필요한 각 시각화를 개발하게 될 것이다. 4장에서는 구현한 시각화를 기반으로 대시보드 결과에 대해서 분석 및 해설하였고 5장에서 결론을 맺는다.
Ⅱ. 관련 연구
1. 크롤링
크롤링[3]을 위해 개발된 소프트웨어를 크롤러(Crawler)라고 한다. 크롤러는 주어진 URL에 접근하여 관련된 URL을 찾아내고 조직되고 자동화된 방법으로 데이터를 분류하여 데이터베이스에 저장하는 작업을 수행한다.
본 논문에서 Beautiful Soup를 사용하여 Python 웹 크롤러를 만들었고 신문기사를 발췌하는 과정에서 Qt 프레임워크(version5)의 묶음인 PyQt5 프레임워크를 활용하였다. PyQt5의 GUI 클래스 모듈을 이용하여 사용자 인터페이스를 만들었고 보다, 편리한 크롤러 작동 환경을 제공하였다.
다음 그림2와 그림3은 PyQt5 프레임워크의 UI 요소를 제작하고 크롤링하는 과정이다. 포털 사이트에서 대략 1000페이지 분량 페이지를 발췌하였다. (약 9800~10000만 개의 기사)
그림 2. 키워드 신문기사 크롤링 과정 1
Fig. 2. Keyword Newspaper Crawling Course 1
그림 3. 키워드 신문기사 크롤링 과정 2
Fig. 3. Keyword Newspaper Crawling Course 2
키워드로 검색된 기사는 Request 라이브러리를 사용한 요청을 통해 응답을 받았을 때 해당 사이트에 접속하게 된다. 2020년도부터 2021년도 기간의 가장 최신 신문기사(헤드라인, 주 내용, 기자, 링크, 언론사)를 크롤링하였다.
한국어 형태소 분석기인 파이썬 패키지, KoNLPyOkr을 이용해서 각 해당하는 키워드를 검색했을 때 수집한 신문기사 안에서 중복되고 많이 출현하는 핵심 단어를 그룹화하기 위해 명사와 형용사만을 추출하였다.
2. 데이터 시각화
데이터 시각화(Data Visualization)[4]란 데이터의 시각적 표현을 의미하며, 도식적 형태 안에 추상적으로 표현된 속성 및 변수의 단위를 포함한 정보를 의미한다. 데이터 시각화는 관리하고자 하는 유용한 정보와 관계를 정의하고 목적에 따라 비교, 분포, 구성, 관계 등 다양한 방식으로 형상화하는 것이다.
그림 4, 5, 6은 각 코로나, 플라스틱, 업사이클 키워드로 크롤링하고 전처리했을 때의 막대 그래프 그림이다. 이를 통해 키워들 간의 연관성과 영역에 대한 관여도를 알 수 있다.
그림 4. 막대 그래프 시각화 _ 코로나 키워드
Fig. 4. Visualizing Bar Graph _ COVID-19 Keyword
그림 5. 막대 그래프 시각화 _ 플라스틱 키워드
Fig. 5. Visualizing Bar Graph _ Plastic Keyword
그림 6. 막대 그래프 시각화 _ 업사이클 키워드
Fig. 6. Visualizing Bar Graph _ Upcycle Keyword
3. 워드 클라우드
본 연구에서는 한글 Word Cloud를 구현하기 위해 Python의 wordcloud, konlpy, collentions 모듈과 Google Colab 환경을 활용히였다. 먼저 크롤링으로 수집한 기사를 내장 함수를 이용하여 각 포털 사이트로 구분된 텍스트 파일에 저장하고 twitter 함수를 통해 읽어들인 내용의 형태소를 Konlpy를 활용하여 분석하였다. 불필요하거나 부적절한 단어는 리스트에서 제거한 뒤 생성한다. matplotlib 모듈을 import 하여 결과를 화면에 출력한다. 다음 그림 7은 워드 클라우드의 예시 사진이다.
그림 7. 워드 클라우드 예시
Fig. 7. Word Cloud Example
4. 대시보드(Dash Board)
대시보드란 중요한 정보를 시각적으로 표현한 도구로 목적을 이루기 위해 조직 내외부에서 요구되는 데이터, 정보, 지식을 그래프, 표로 통합하여 표현한 것이다.
이제껏 코로나 대시보드는 바이러스의 확산 데이터, 지역별 정보, 환자 수 및 증가율 등을 비롯한 현황을 파악하도록 돕는 형태가 많았다. 따라서 코로나로 인해서 발생하는, 더 악화된 문제의 심각성 현황을 더욱 실용적으로 알리고자 본 논문에서 대시보드를 제작하게 되었다.
COVID-19, 플라스틱, 업사이클 각 키워드의 연관성을 파악하는 데 활용되는 시각화를 통합했다. 또한, 실질적으로 업사이클이 활발히 활용되고 있는 분야 및 업계를 조사하여 지속 가능한 시행 분야에 대해서 한눈에 파악할 수 있는 효과적인 업사이클 대시보드를 제작하였다.
Ⅲ. 시각화 대시보드 개발
본 논문에서의 데이터 시각화는 인터렉티브한 시각화(Scatter, Line, Area, Bar Chart, Histogram, Polar, Animation, Heat map, Tree map)를 사용자에게 제공해주기 위해 Plotly와 웹 기반의 Python 어플리케이션의 프레임워크를 제공해주는 Dash를 이용해서 대시보드를 제작하였다.
그림8에서 사용되는 주요 시스템은 Pycharm, Plotly|Dash, Python, Visualization Crawling을 순서대로 나타낸다.
그림 8. 시스템 구성도
Fig. 8. System Configuration Diagram
1. 연관 키워드 분석
다음 그림 9, 10, 11은 워드 클라우드 결과물이다. 각각 코로나, 플라스틱, 업사이클 키워드를 네이버, 다음, 동아 포털 사이트에서 수집한 신문기사를 기반으로 중복된 연관 키워드를 채집했다. 그중 상위 대략 20개의 중요 키워드를 선출했고 해당 기사 내 키워드의 빈도수가 많이 중복된 순서대로 크기에 차별점을 두어 랜덤으로 배치된다. 따라서 워드 클라우드 시각화를 통해 크기가 큰 단어는 검색한 키워드와의 연관성이 더 깊다는 것을 알 수 있다.
그림 9. 코로나 단어 기반 워드 클라우드
Fig. 9. COVID-19 word-based Word Cloud
그림 10. 플라스틱 단어 기반 워드 클라우드
Fig. 10. Plastic word-based Word Cloud
그림 11. 업사이클 단어 기반 워드 클라우드
Fig. 11. Upcycle word-based Word Cloud
2. 중복된 키워드 선출
다음 그림 12, 13, 14는 워드클라우드의 결과를 막대 그래프로 나타낸 결과이다. 워드 클라우드와 중복을 파악한다는 목적으로 제작되었지만, 각 특성 차이가 있어, 제작하게 되었다.
그림 12. 막대 그래프 시각화 _ 키워드 : 코로나
Fig. 12. Bar Graph visualization _ Keyword : COVID-19
그림 13. 막대 그래프 시각화 _ 키워드 : 플라스틱
Fig. 13. Bar Graph visualization _ Keyword : Plastic
그림 14. 막대 그래프 시각화 _ 키워드 : 업사이클
Fig. 14. Bar Graph visualization _ Keyword : Upcycle
막대 그래프는 워드 클라우드와 달리 통계를 나타낼 때 크고 작음을 순서대로 가독성 있게 보여지기 때문에 이해하기 편리하다. 항목이 적을수록 가로형태의 시각화가 좋기에 본 시각화를 적용하게 된 것이다.
3. 폐기물 발생량 추이
다음 그림 15는 한국환경공단에서 제공하는 ‘폐기물 배출 및 처리현황’ 공공데이터 자료를 기반으로 선 도표 시각화를 제작한 것이다. 추세 즉, 시간의 흐름에 따라 변화는 내용을 비교할 때 적합하여 활용하게 되었다.
그림 15. 꺾은선 그래프 시각화 _ 연도별 폐기물 발생량
Fig. 15. Visualization of line graph _ Annual waste generation
4. 업사이클 사업
신문기사를 크롤링할 때 상용한 소스코드를 활용해서 얻은 데이터로 현재 진행중, 혹은 진행했었던 업사이클 사업 및 제품 등의 사례를 데이터 필드로 제작하였다. 해당 시각화를 범주형 데이터로 나타내서 보다, 체계적이고 세부적으로 데이터를 표현하였다.
크롤링을 활용한 데이터를 기반으로 업사이클의 연관 검색어를 찾아본 결과 진행 현황 관련 제품과 사업[5]을 찾아볼 수 있었다. 다음 그림16은 업사이클 현황에 대해 간단히 정리된 데이터 필드 시각화를 나타낸 것이다.
그림 16. 표 시각화 _ 업사이클 현황
Fig. 16. Table Visualization _ Upcycle Status
5. 업사이클 현황
위에서 말한 업사이클의 사업 항목과 더불어 현재 업사이클 산업 분야에서 어떤 사업으로 업사이클링을 진행하고 있는지 비율을 파악하고자 Pie Chart를 사용했다.
Pie Chart는 전체 비율을 기준으로 각각의 항목의 비중을 더 세부적으로 살펴보는 차트로 유용하다. 다음 그림17은 현재 사업을 진행하고 있는 분야에 따른 구성비율을 나타내기 위한 시각화이다.
그림 17. 파이차트 시각화 _ 업사이클 분야 구성비율
Fig. 17. Pie Chart Visualization _ Upcycle composition ratio
Ⅳ. 구현 및 분석
각 대시보드의 시각화는 신뢰성있는 대시보드를 개발하기 위해 본 논문에 가용한 데이터베이스를 최대한 검토하고 활용하였다. 대시보드는 Python과 React를 활용하여 키워드 연관성과 업사이클에 대한 주요 현황들을 주목할 수 있는 대시보드를 개발하였다. 대시보드 내 시각화는 총 18개로 구성하여 제작하였고, 시각화 간의 관계를 용이하게 분석하고 파악하도록 배치하였다.
본 논문에서 개발된 대시보드는 평소 업사이클에 관심이 있는 사람뿐 아니라, 환경 및 현재 사회에 관심이 없는 사람이라도 충분히 이해가 가능하도록 제작하였기 때문에 확대 활용이 용이할 것이라고 생각한다.
추후에 자료들을 기반으로 분류와 세부 기능을 늘려서 웹 페이지를 제작하여 대시보드의 기능을 더 향상시키고자 한다. 이를 위해 어떤 환경변수를 개선할 수 있을지 환경을 개선시키기 위한 내용 보완 및 수정을 통해 시스템을 개선하고 기존 시스템 설정을 최신화하여 개발하고자 한다. 다음 그림18은 구현된 대시보드를 나타낸다.
그림 18. 대시보드 결과
Fig. 18. Dash Board result
Ⅴ. 결론
우리는 당장 눈앞에 놓인 코로나라는 문제를 해결하기 위해 기존에도 심각한 문제였던 환경문제[6][7]를 더욱 악화시켰다. 따라서 본 논문에서는 단순히 접촉과 감염을 막자는 의도로, 혹은 편리하다는 이유로 무심코 사용했던 일회용품의 사용을 줄이고 어쩔 수 없이 사용하더라도 이를 재사용하고, 새 제품으로 새활용하는 자세를 가져야 한다고 생각하였다.
본 연구는 코로나바이러스로 인한 사회적 거리두기와 같은 일상생활의 변화로 폐기물 쓰레기의 배출량이 증가된 것을 확인할 수 있었고, 그에 기반하여 현재 자원 순환을 목적으로 재활용하는 업사이클의 관심도와 진출 영역 및 가능성, 국내 현황 등을 알아낼 수 있었다.
이를 통해 코로나 확산에 비례하여 플라스틱 배출량 데이터를 수집했고, 환경문제를 하나의 창조적 대안으로서 업사이클의 가능성과 발전 영역 등을 가시화된 시각화를 통해 모니터링 할 수 있도록 각 시각화 간의 관계를 용이하게 분석하여 개발하였다. 업사이클 제품 및 사업 사례를 알려 환경에 책임을 가지도록 가능성을 제시했다.
즉, 본 논문에서 코로나로 인해 증가한 플라스틱 폐기물을 업사이클링이라는 하나의 수단을 통해 친환경의 중요성을 인식시키는 계기가 될 수 있다고 생각한다.
앞으로 ‘버려지는 것’에 초점을 맞춰서 자연을 위한 순환을 만들고 소비를 제안했으면 하는 바이다. 앞으로 여러 기관, 단체, 기업 그리고 개인이 버려지는 제품을 업사이클링하고 환경 지속 가능성을 추구하며, 업사이클 문화 확산을 통해 문화적 지속 가능성이 융합된 브랜드들이 많이 런칭하기를 기대한다.
참고문헌
- Hae-Min Yu, Jae-Hoon Chun, "A Study on Upcycle Fashion Design Based on the Characteristics of Materials and Techniques", The Journal of the Korean Society of Clothing and Textiles, Vol. 44, No. 5, pp. 984-1003, Oct 2020. DOI: https://doi.org/10.5850/JKSCT.2020.44.5.984
- Hyun-Hwa Oh, "A Study on Dashboard Convergence Design for Data Visualization", Graduate School of Tourism, Kyung Hee University, Korea Master's Degree Paper, Vol. 641, No. 7, pp. 108-120, Aug 2021. DOI: http://www.riss.kr/link?id=T15913276
- Eun-Su Jeon, Seung-Hoon Oh, Yeong-Mok Cho, "Keyword Analysis in Korean Articles Related to COVID-19 Using Topic Modeling", The Korean Journal of Public Health, Vol. 59, No. 1, pp. 1-11, Jun 2022.
- Jang-Mee Lee, "A Study on Dashboard Convergence Design for Data Visualization", Korean Society for Science & Arts, Vol. 38, No. 5, pp. 423-435, Dec 2020. DOI: https://doi.org/10.17548/ksaf.2020.12.30.423
- Ae-Ran Koh, Jeong-sun Lee, "Sustainable Fashion Consumption in the Post-COVID-19 Era", Korea Consumer Associations, Vol. 31, No. 5, pp. 1-17, Oct 2020. DOI: https://doi.org/10.35736/JCS.31.5.1
- Ji-Sun Ku, "A study on legal issues to realize responsibility for recycling plastic waste", Hongik University Research Institute of Korea, Vol. 22, No. 4, pp. 51-77, 2021.
- So-Ra Yi, "Analysis of Resource Circulation Policies in the Post-COVID-19 Era", Korea Institute of Environment, Urban research, Vol, No. 20, pp. 11-38, Dec 2021. DOI: https://doi.org/10.34165/urbanr.2021..20.11