Ⅰ. 서론
현대사회는 도시가 발전해가면서 음식물을 포함한 쓰레기 배출량이 늘어가고 있다. 이를 줄이기 위해서 종량제 봉투를 도입하여 연간 배출량을 근본적으로 줄여보고자 하였다. 하지만 산업화 및 최근 들어 코로나-19까지 유행하면서 집에서 시켜 먹는 배달 음식이 증가하였다. 그로 인해 일회용품 사용 증가와 함께 버려지는 음식물도 급증하고 있다. 종량제 봉투 시행 후 좀 더 배출량을 줄여보고자 버린 만큼 부과하는 칩 방식을포함해 다양한 방식의 음식물 종량제를 시행하였다[1,2]. 방식 중 하나인 RFID 기반 음식물류 폐기물 종량제도 2012년 전면 시행 의무화가 된 지 올해로 11년 차에 접어들고 있다. 그간 시행하면서 여러 시행착오로 인한 사용상 문제점들이 도출되었지만 각 지자체에서 발표하는 통계에 따르면 지역별로 다소 차이는 있지만 대략 평균적으로 20~30%의 감소율을 보였다[1,2]. 이러한 감소율에 대한 지표는 각 지자체와 주민들의 적극적인 동참으로 이제는 음식물류 폐기물 종량제가 어느 정도 정착이 되어가고 있다고 볼 수 있다.
이러한 감량 이면에는 수거에 대한 또 다른 문제점들이 발생하고 있다. 수거된 음식물들은 재활용을 위한 2차 수거를 각 지자체에서 운영하거나 위탁 운영을 하는 집하장으로 운반이 된다. 집하장에 운반된 음식물들은 가정을 포함해 상가에서 버려진 음식물들이 대다수이다. 이러한 음식물들에 각종 이물질이 함께 버려진다는 것이 다. 이러한 이물질로 인해 설비파손과 이물질을 구분하기 위한 많은 인력이 투입된다는 것이다.
따라서 본 연구에서는 이러한 문제를 인식하고 이를 개선하고자 인공지능을 활용하여 개선하고자 한다.
Ⅱ. 관련 연구
최근 인공지능은 다양한 분야에서 연구되어지고 있고 활용되고 있다. 이런 인공지능은 사람과 유사한 기능을 가지도록 인간의 학습능력, 추론능력, 지각능력, 자연어 이해능력 등을 컴퓨터 프로그램으로 실현하는 기술이다[3]. 머신러닝과 딥러닝이 해당된다. 머신러닝은 지도학습, 비지도 학습, 강화학습으로 분류된다. 머신러닝은 훈련 및 학습 데이터로부터 어떤 문제에 대한 지식, 시스템을 수정 보완하면서 다음에 그 문제를 좀 더 해결할수 있도록 하고자 하는 것이다.
그림 1. 집하장에서의 음식물쓰레기 처리과정
Fig. 1. Process of disposing of food waste in a collecting area
음식물쓰레기 집하장에서 처리 과정을 보면 1차 선별과정과 2차 선별과정으로 구분되어 있다. 본 연구는 이 부분에 카메라를 설치하여 여러 학습 모델을 선택하여 비교 연구를 통해 최종 선정된 학습 모델의 데이터를 기반으로 2차에 걸쳐 이물질을 구분하고자 한다[4].
본 연구에서는 학습하고자 하는 선행 모델은 이미지를 기반으로 하기에 기본 이미지 알고리즘인 CNN, VGG, ResNet, Eesemble을 선정하였다[5,6].
1. CNN
CNN은 인간의 눈 구조를 모방해서 만들어진 형태로 이미지를 이용한 학습에 주로 사용되고 있다. 이미지 기반 방식인 신경망 이론은 우리가 잘 알고 있는 인간 뇌의 뉴런을 모방한 이론으로 1943년 맥콜로치(McCulloch)와 피츠(Pitts)에 의해서 최초로 소개되었다. 이후 1958년 로젠블라트(Rosenblatt)의 퍼셉트론(Perceptron)과 다층 퍼셉트론(MLP : Multi-Layer Perceptron)으로 꾸준히 발전하여 왔다.
CNN은 이미지에서 객체, 얼굴, 장면을 인식하기 위해 패턴을 찾는데 특히 유용하다.
그림 2. CNN 모델
Fig. 2. CNN Model
2. VGG
VGG 모델은 네트워크의 깊이와 모델 성능 영향에 집한 모델이다. 커널 사이즈를 AlexNet보다 2배 이상의 레이어를 사용한다. 커널 사이즈가 크면 이미지 사이즈 축소가 급격하게 이루어져 깊은 층 만들기가 어렵고, 파마미터 개수와 연산량이 많이 필요하기 때문이다. 하지만 더 많은 레이어를 사용함에도 불구하고 오차율을 절반으로 줄인 모델이다[7,8].
그림 3. VGG-16 모델
Fig. 3. VGG-16 Model
3. ResNet
ResNet은 기본적으로 VGG-19의 구조를 바탕으로 한다. 거기에 컨볼루션 층들을 추가해서 깊게 만든 후에 shortcut들을 추가하는 것이 전부다. VGG와 마찬가지로 더 깊은 레이어에서 성능이 오히려 떨어지는 문제를 해결하기 위해서 구현한 모델이다. 즉, Vanishing Gradient Problem을 해결하고자 고안되었다[9,10].
그림 4의 두 번째 그림을 보면 오른쪽 블록이 해당 ResNet50의 BottleNect구조에 해당하며 input(x), output(relu(F(x)+x)을 취하고 있다.
그림 4. ResNet 모델
Fig. 4. ResNet Model
4. Ensemble
여러 개의 모델을 조화롭게 학습시켜 그 모델들의 예측 결과를 이용하여 더 정확한 예측값을 구하기 위해 서 모델을 사용하여 결과를 도출하는 모델이다. 결과를 도출하는 방식으로는 보팅(Voting), 배깅(Bagging), 부스팅(Boosting)이 있다[11,12,13]. 보팅은 여러 가지 다른 유형의 알고리즘을 같은 데이터셋에 적용해 학습하는 방법이다. 학습한 결과를 모아 다수의 분류기가 결정한 결과를 선택하거나 클래스별로 평균을 종합해 예측한다. 반면 배깅은 데이터 세트를 여러 개로 분리해 분류를 실행하는 방법이다. 부스팅은 특정 모델의 결과를 다른 모델의 입력값으로 사용하는 방식으로 모델간 가중치를 부여하여 결과를 산출한다. 배깅이 보팅과 차이점은 하나의 알고리즘을 사용하는 것이고 부스팅과의 차이점은 각 분류기를 제각각 따로따로 분류한다는 것이다. 학습하는 모델들의 결과를 투표를 통해 예측값을 결정하는 구조이다. 투표방식으로는 다수결 투표로 하는 직접 투표(Hard vote)와 개별 분류기의 예측을 평균해서 확률이 가장 높은 범주를 예측하는 간접 투표(Soft vote) 두 가지 방식이 있다.
그림 5. 투표 기반 Ensemble 방법[14]
Fig. 5. Voting-based Ensemble Method[14]
Ⅲ. 실험 및 결과
실제 상황에서 이진 분류 데이터보다 다중 클래스 분류 데이터가 더 많았으며, 음식물쓰레기 속 이물질은 사진을 찍거나 검츌 결과 값을 수집하는 등 데이터를 추가하거나 데이터에 라벨링을 하는 것은 시간과 비용이 많이 소모되는 현실적인 문제가 발생하였다. 이에 대한 대안으로 본 실험에서는 이상 이미지 분류를 모델에 사용하고자 한다[15,16]. 데이터는 AI-허브에서 공개 데이터를 사용하였다[17]. 또한, 불충분한 학습데이터 문제를 해결하기 위해 데이터 증가(Data Augmentaion)와 유사 라벨링(Pseudo-Labeling)을 활용하고자 한다.
그림 6은 케라스에서 제공하는 VGG-16 함수를 사용하였으며, Sequential 모델을 추가하여 모델을 구성하였다. 4개의 출력층(Output)을 가지고 있어 Dense Layer를 4로 설정을 하였다.
그림 6. VGG-16 모델
Fig. 6. VGG-16 Model
그림 7은 그림 6과 마찬가지로 구성하되 모델 함수만 케라스에서 제공하는 ResNet50 함수로 변경을 하였다.
그림 7. ResNet 모델
Fig. 7. ResNet Model
그림 6, 7은 밀집층 총 세 개로 구성되어 있다. 처음 두 개는 각각 렐루(ReLU) 활성화 함수를 사용하는 노드는 256개와 노드 128개로 구성되어 있고 마지막 밀집층은 노드 4개 소프트맥스 활성화 함수를 포함하고 있다. 손실함수를 사용하여 구한 값으로 기울기를 구하고 네트워크(신경망)의 파라미터(w, b)를 학습에 어떻게 반영할지 결정하기 위한 방법으로 ‘Adam’을 사용하였고 다수의 클래스를 사용하고 원-핫 인코딩 결과가 출력되므로 ‘ categorical crossentropy ’ 손실함수를 사용하였다.
그림 8은 기존 모델 CNN 기본형인 Base, VGG, ResNet과 이들 모델들을 약간 변형한 CNN2, VGG2, Res2 모델을 사용하여 6가지 모델을 사용하였다. 각 모델에서 제일 높은 정확도의 값을 구하고 그에 대응하는 Loss값을 구하고 결과값을 수치화하였다.
그림 8. Ensemble Voting, Bagging 모델
Fig. 8. Ensemble Voting, Bagging Model
여기에 만들어진 모델을 사용하여 라벨이 없는 데이터의 라벨을 얻고자 유사 라벨링(Pseudo-Labeling)을 사용하였다.
첫 번째 이유는 추가 데이터로 사용하기 위해서이다. 라벨이 없는 추가적인 데이터를 얻는 것은 라벨이 있는 데이터를 얻는 것보다 쉽기 때문에 라벨이 없는 많은 양의 데이터를 활용할 수 있다면 더 적은 오차의 모델을 만들 수 있기 있다. 즉, 데이터를 얻는 데 비용이 적은 지정되지 않은 데이터(Unlabeled Data)를 활용해 모델의 정확도를 높이고자 하였다.
두 번째는 불규칙한 클래스이다. 추가데이터를 사용하기 전에는 클래스별로 데이터의 비율이 달라서 문제가 되었다. 실제로 정상 데이터가 이상 데이터보다 비중이 많지만 우리가 비중을 두는 것은 이상 데이터이며 Pseudo Labeling을 통한 추가데이터 사용으로 문제를 해결할 수 있었다.
유사 라벨링(Pseudo-Labeling)은 만들어진 모델들을 사용하여 라벨을 예측하고 그중에서 가장 높은 가중치를 가진 모델의 라벨을 선택하여 사용하였다. 그리고 나서 기존의 라벨이 있는 훈련데이터와 합치고 이를 다시 모델을 학습하였다.
그림 9. CNN, VGG-16 Fit
Fig. 9. CNN, VGG-16 Fit
모델 예측 결과 그림 10과 같이 Voting 모델의 결과가 가장 좋았음을 알 수 있었다.
그림 10. 결과 분석
Fig. 10. Results analysis
Ⅴ. 결론
본 연구는 인공지능을 활용함으로써 이물질 구별에 대한 선별 조치로 유지보수를 절감하고 이물질 선별에 있어 정확도를 향상시켜 자원 활용에 대한 생산성증가에 한몫을 하고자 하였다. 실험을 통해 의외로 불특정 이물질로 인해 정확성이 떨어짐을 알 수 있었다. 이를 위해 이상 이미지 데이터를 여러 모델을 통해 훈련과 검증을 통해서 알 수 있듯이 정확성을 높이기 위해서는 다양한 유형의 이미지가 필요함을 인지하였다. 따라서 향후에는 이를 더 확장함과 동시에 이물질로 인한 잦은 고장의 원인을 유형별로 데이터를 수집하여 분석/학습하여 사전에 고장에 대한 알림 서비스 및 고장 원인별 수리 방법을 제시하는 방안에 대해서 연구하고자 한다.
References
- Geun-Ho Choi, "A Study on the Performance of Environmental Regulation Using RFID Technology: Focused on the Food Waste Volume", The Korean Association for Governance Studies. Vol. 2017, No. 1, pp. 1-15, 2017.
- Geun-Ho Choi, Tae-Ho Eom, "A Study on the Performance of Local Government Environmental Regulations Using Information Technology", The Korean Journal of Local Government Studues, Vol. 21, No. 2, pp. 77-102, 2017. DOI : https://doi.org/10.20484/klog.21.2.4
- B. H Gang, "Introduction to Artificial Intelligence (Machine Learning)", https://cupdf.com/document/-58f2b0d01a28ab2d4c8b456b.html?page=1#tabSectionPart, 2017(04)
- https://www.ui4u.go.kr/eco/contents.do?mId=010203b 0000
- W.S. McCulloch, P. Walter, "A Logical Calculus of The Ideas Immanent in Nervous Activity", The bulletin of mathematical biophysics, Vol. 5, No. 4, pp.115-133, 1943. https://doi.org/10.1007/BF02478259
- Lei, X., Pan, H., & Huang, X, "A dilated CNN model for image classification". IEEE Access, Vol. 7, pp. 124087-124095, 2019. DOI : https://doi.org/10.1109/ACCESS.2019.2927169
- Simonyan, K., & Zisserman, "Very deep convolutional networks for large-scale image recognition", arXiv preprint arXiv:1409.1556, Vol. 6, pp. 1-14, 2017. DOI : https://doi.org/10.48550/arXiv.1409.1556
- Kaur, T., & Gandhi, T. K, "Automated brain image classification based on VGG-16 and transfer learning", In 2019 International Conference on Information Technology (ICIT) pp. 94-98, IEEE, 2019. DOI : https://doi.org/10.1109/ICIT48102.2019.00023
- Li, B., & He, Y, "An improved ResNet based on the adjustable shortcut connections", IEEE Access, Vol. 6, pp. 18967-18974, 2018. DOI : https://doi.org/10.1109/ACCESS.2018.2814605
- Seung-Cheol Lim, Jae-Seung Go, "A Study on Design and Implementation of Driver's Blind Spot Assist System Using CNN Technique", The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 20, No. 2, pp. 149-155, 2020. DOI : https://doi.org/10.7236/JIIBC.2020.20.2.149
- Liu, X., Liu, Z., Wang, G., Cai, Z., & Zhang, "Ensemble transfer learning algorithm", Ieee Access, 6, pp. 2389-2396, 2017. DOI : https://doi.org/10.1109/ACCESS.2017.2782884
- Liu, X., Wang, G., Cai, Z., & Zhang, " Bagging based ensemble transfer learning", Journal of Ambient Intelligence and Humanized Computing, Vol. 7, No. 1, pp. 29-36, 2016. DOI : https://doi.org/10.1007/s12652-015-0296-5
- Onan, A., Korukoglu, S., & Bulut, "Ensemble of keyword extraction methods and classifiers in text classification", Expert Systems with Applications, Vol. 57, pp. 232-247, 2016. DOI : https://doi.org/10.1016/j.eswa.2016.03.045
- https://untitledtblog.tistory.com/156
- Young-Bok Cho, "Classification Algorithm for Liver Lesions of Ultrasound Images using Ensemble Deep Learning", The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 20, No. 4, pp. 101-106, 2020. DOI : https://doi.org/10.1016/j.eswa.2016.03.045
- Jae-Hyng Park, Cheol-Hong Kim, "Analysis of Accuracy and Computation Complexity of Bearing Fault Diagnosis Methods using CNN-based Deep Learning", Korean Institute of Next Generation Computing, Vol. 18, No. 1, pp. 7-18. 2022 DOI : https://doi.org/10.23019/kingpc.18.1.202202.001
- https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=140