DOI QR코드

DOI QR Code

Application of Bayesian network for farmed eel safety inspection in the production stage

양식뱀장어 생산단계 안전성 조사를 위한 베이지안 네트워크 모델의 적용

  • Seung Yong Cho (Department of Information & Technology Research, National Food Safety Information Service)
  • 조승용 (식품안전정보원 정보기술연구부)
  • Received : 2023.05.11
  • Accepted : 2023.06.14
  • Published : 2023.06.30

Abstract

The Bayesian network (BN) model was applied to analyze the characteristic variables that affect compliance with safety inspections of farmed eel during the production stage, using the data from 30,063 cases of eel aquafarm safety inspection in the Integrated Food Safety Information Network (IFSIN) from 2012 to 2021. The dataset for establishing the BN model included 77 non-conforming cases. Relevant HACCP data, geographic information about the aquafarms, and environmental data were collected and mapped to the IFSIN data to derive explanatory variables for nonconformity. Aquafarm HACCP certification, detection history of harmful substances during the last 5 y, history of nonconformity during the last 5 y, and the suitability of the aquatic environment as determined by the levels of total coliform bacteria and total organic carbon were selected as the explanatory variables. The highest achievable eel aquafarm noncompliance rate by manipulating the derived explanatory variables was 24.5%, which was 94 times higher than the overall farmed eel noncompliance rate reported in IFSIN between 2017 and 2021. The established BN model was validated using the IFSIN eel aquafarm inspection results conducted between January and August 2022. The noncompliance rate in the validation set was 0.22% (15 nonconformances out of 6,785 cases). The precision of BN model prediction was 0.1579, which was 71.4 times higher than the non-compliance rate of the validation set.

뱀장어 생산단계 안전성조사 부적합여부에 영향을 미치는 특성변수를 베이지안 네트워크(BN) 모델을 적용하여 분석하였다. 2012년부터 2021년까지의 통합식품안전정보망(IFSIN)의 뱀장어 생산단계 안전성조사 데이터에 양식장의 HACCP 정보, 지리적 정보 및 용수환경 데이터를 연계하여 BN 모델을 수립하였다. 뱀장어의 부적합여부에 영향을 주는 특성변수로 양식장의 HACCP 인증여부, 양식장의 이전 5년간 검사대상 유해물질의 검출여부, 해당 양식장의 이전 5년간 부적합적발이력, 사용되는 용수환경의 적정성이 제안되었으며, 이때 용수환경의 적정성은 총대장균군과 총유기탄소량으로부터 산출되었다. 뱀장어 부적합이 발생할 확률이 가장 높은 경우는 지난 5년간 검사대상 유해물질의 검출이력이 있으면서 동시에 부적합 적발 이력이 있는 HACCP 인증을 받지 않은 양식장으로서, 용수환경도 총대장균군 또는 총유기탄소가 높아 오염이 의심되는 용수를 사용하는 경우로 이때 부적합이 발생할 확률은 24.5%로 뱀장어 생산단계 안전성 조사 시 부적합률인 0.26%의 94배 높았다. 2022년 1월부터 8월까지 뱀장어 양식장 안전성조사 결과를 시험용 데이터세트(6,785건 중 부적합 15건)로 하여 BN 모델의 적정성을 검토하였다. 영향강도가 높았던 설명변수인 HACCP, 검출이력, 부적합이력으로 구성한 BN 모델을 시험용 데이터세트에 적용한 결과 부적합일 확률이 15.8%로 시험용데이터의 부적합률인 0.22%의 약 71.4배 개선할 수 있었다. 그러나 이 모델의 재현율은 0.2에 머물렀는데, 이는 특히 부적합항목인 유해물질의 기준·규격이 신설되어 해당 양식장에서 검사기록이 없는 경우와, 매우 드물게 발생하여 10년 동안 검출이력이 없어 학습데이터세트에는 없는 경우이었다. 베이지안 네트워크를 적용하여 부적합확률이 높은 생산단계 안전성 조사대상을 선정하게 되면 설명변수별로 시나리오에 따라 부적합확률을 설명가능하게 되어 다른 머신러닝 알고리즘을 적용하는 경우 지적되어온 설명불가능이라는 문제점을 해소할 수 있으며, 향후 안전성조사 데이터 축적 시 용이하게 모델 업데이트가 가능하며 이를 통해 모델의 예측성능개선도 기대할 수 있다는 장점이 있다.

Keywords

Acknowledgement

본 연구는 2022년 식품안전정보원 국가식품안전관리체계 선진화연구사업의 일환으로 수행되었음.

References

  1. Bouzembrak Y, Camenzuli L, Janssen E, Van Der Fels-Klerx HJ. Application of Bayesian networks in the development of herbs and spices sampling monitoring system. Food Control, 83, 38-44 (2018)  https://doi.org/10.1016/j.foodcont.2017.04.019
  2. Bouzembrak Y, Marvin HJP. Prediction of food fraud type using data from rapid alert system for food and feed (RASFF) and Bayesian network modelling. Food Control, 61, 180-187 (2016)  https://doi.org/10.1016/j.foodcont.2015.09.026
  3. Bouzembrak Y, Marvin HJP. Impact of drivers of change, including climatic factors, on the occurrence of chemical food safety hazards in fruits and vegetables: A Bayesian network approach. Food Control, 97, 67-76 (2019)  https://doi.org/10.1016/j.foodcont.2018.10.021
  4. Cho S, Cho SY. Improving efficiency of food hygiene surveillance system by using machine learning-based approaches. JBD, 5, 53-67 (2020) 
  5. Cho SY. A Study on the Domestic and Foreign Data Utilization Trends for Ensuring Fishery Product Safety. NFSI Research Report. National Food Safety Information Service 
  6. FAO. The State of World Fisheries and Aquaculture 2022. Towards Blue Transformation. Rome, FAO (2022) 
  7. Giles H. Using Bayesian networks to examine consistent trends in fish farm benthic impact studies. Aquaculture, 274, 181-195 (2008)  https://doi.org/10.1016/j.aquaculture.2007.11.020
  8. Hunte JL, Neil M, Fenton NE. A causal Bayesian network approach for consumer product safety and risk assessment. J Safety Res, 80, 198-214 (2022)  https://doi.org/10.1016/j.jsr.2021.12.003
  9. Jensen FV, Nielsen TD. Bayesian Networks and Decision Graphs. Springer, New York, USA, p 32-35 (2007) 
  10. Kim DH, Lee HG, Lim BS, Park SW. Present status of diseases detected from cultured eel, Anguilla japonica in Chungcheong and Jeolla provinces during 2004-2017. JFMSE, 31, 884-892 (2019)  https://doi.org/10.13000/JFMSE.2019.6.31.3.884
  11. Kjaerulff UB, Madsen AL. Bayesian Networks and Influence Diagrams: A Guide to Construction and Analysis. Springer, New York, USA, p 8-14 (2010) 
  12. KOSIS. Per capita Korean fish consumption. Available from: https://www.index.go.kr/unity/potal/main/EachDtlPageDetail.do?idx_cd=1317. Accessed Mar. 21, 2023. 
  13. Lee JS, Kim DY. The current status and future directions of Korean inland freshwater aquaculture. J Fish Bus Adm, 37, 1-24 (2006) 
  14. Lee K, Bak Y, Shin Y, Sohn K, Kwon O. A method of machine learning-based defective health functional food detection system for efficient inspection of imported food. J Intell Inform Syst, 28, 139-159 (2022) 
  15. Lupo C, Le Bouquin S, Balaine L, Michel V, Peraste J, Petetin I, Colin P, Jouffe L, Chauvin C. Bayesian network as an aid for food chain information use for meat inspection. Pre Vet Med, 109, 25-36 (2013) 
  16. Meng H, An X, Xing J. A data-driven Bayesian network model integrating physical knowledge for prioritization of risk influencing factors. Process Saf Environ, 160, 434-449 (2022)  https://doi.org/10.1016/j.psep.2022.02.010
  17. MFDS. Chapter 2. Common standards ans specifications for general. In: Food Code (No.2021-54)
  18. NFQS. Fishery product safety inspection results 2021. Available from: http://www.nfqs.go.kr/hpmg/board/actionBoardDetail.do?menuId=M0000402. Accessed Mar. 22, 2023. 
  19. Soon JM. Application of Bayesian network modelling to predict food fraud products from China. Food Control, 114, 107232 (2020) 
  20. Statistics Korea. Fishery Households by Aquaculture Species/Area of Culture Farm. 2020 Agriculture, Forestry & Fishery Census Report: Inland Water Fishery, 2 (2021) 
  21. Wang X, Bouzembrak Y, Marvin HJP, Clarke D, Butler F. Bayesian networks modeling of diarrhetic shellfish poisoning in Mytilus edulis harvested in bantry bay, ireland. Harmful Algae, 112, 102171 (2022)