Ⅰ. 서론
대한민국의 관세청은 수입 화물에 대한 다양한 위험 검사를 통해 수입 화물이 국내 안전 기준을 충족시키도록 유도함으로써 우리 국민의 안전을 보호하고 있다. 이를 위해 관세청은 국내로 수입되는 화물에 대하여 위험 기반 검사(Risk-based Inspection, RBI)[1]를 수행함으로써 잠재적인 위험 화물의 수입을 제한함과 동시에 세관 통과 시간을 단축시킬 수 있다. RBI를 위한 검사 방법으로는 물리적 검사, 화학적 분석, 방사선 분석, 샘플링 및 시험소 분석 등을 시행하고 있다. 또한 선박이나 항구에서 사용되는 선박검사기를 통해 선박 화물의 위험 여부를 판단하고 있다. 여러 국가의 관세청 또는 관련 집행 기관은 이러한 RBI 시스템을 채택함으로써 자국의 무역 촉진을 통한 수입의 증대 효과를 얻을 수 있다. 따라서 많은 선진국들은 항만 및 공항의 세관에 정교한 RBI 시스템을 도입하여 운영하고 있다. 그러나 일부 개발도상국가들에서는 단순한 무작위 선택이나 비율 할당에 따른 화물 검사를 수행하고 있다. 이러한 무작위 선택 시스템에서는 효과적인 위험물 제어 및 관리가 가능하지 않을 수 있지만, 많은 국가에서 도입하여 운영하고 있다[2]. 이것은 국가 간의 무역량이 지속적으로 증가하는 상황에서 무작위에 의한 화물의 선별 검사 방법은 운영의 간편성을 제공하기 때문이다. 모든 수입 화물에 대해 정밀 조사를 수행하는 것은 저위험 화물에 대한 무역 촉진을 방해할 수 있다. 또한 모든 화물에 대해 동일한 강도의 검사를 수행하는 것은 공급망의 속도를 늦추고, 경제 성장을 방해하며, 업무량 증가로 인한 오류 발생의 가능성을 높이고, 전반적인 검사의 강도가 낮아질 수 있다는 문제점을 유발한다. 또한 모든 화물에 동일한 강도를 적용하기 때문에 리소스 비용이 많이 들고, 세관의 반응을 예측 가능하게 함으로써 범죄자들이 이를 회피할 수 있는 기회를 제공할 수 있다는 문제점도 있다. 따라서 모든 화물에 대해 정밀 조사를 실행하는 방법으로는 효율적인 위험 관리를 수행할 수 없다. 이로 인해 다양한 위험 요인들을 획득하여 이들을 기반으로 자동으로 검사 대상 화물을 선별하고, 위험을 추적 관리하기 위한 RBI 시스템의 운영 필요성이 커지고 있다. 또한 이러한 효율적인 RBI 시스템을 운영하기 위해서는 위험 화물에 대한 효율적인 분류를 수행할 수 있는 분류 알고리즘의 개발이 선행되어야 한다.
본 논문의 구성은 다음과 같다. 2장에서는 수입 화물에 대한 위험 기반 검사와 관련된 관련 연구에 대해 살펴보고, 3장에서는 RBI 시스템 구축을 위한 규칙 기반 위험 분류 알고리즘에 대하여 기술한다. 4장에서는 3장에서 설계한 위험 분류 알고리즘의 구현에 대해 기술하고 테스트를 수행한다. 마지막 5장에서는 결론 및 향후 과제에 대해 기술한다.
Ⅱ. 관련 연구
수입 화물에 대한 RBI 시스템의 환경은 국가마다 매우 다양하다. 일부 개발도상국가나 더 작은 경제 규모를 갖는 국가들에서는 RBI 시스템을 사용하지 않는 경우도 있다. 또한 많은 국가에서 화물에 대한 고위험, 중위험, 그리고 저위험 등급 등을 사용하여 무작위 선택을 수행하거나 비율 할당에 의해 검사할 화물을 선별하고 있다. 일부 국가에서는 RBI 시스템을 건강, 안전 및 보안에 대한 위협에 중점을 두고 운영하는 반면, 다른 국가에서는 밀수, 잘못된 분류 및 잘못된 원산지 신고 등을 포함하는 제정 관련 위협에 중점을 두고 있다[2].
최근 들어 수입 화물에 대한 위험 관리와 관련된 연구도 활발히 수행되고 있다. D. Han 등[3]은 세관 입국 검사 시나리오에서 의사 결정을 보조하고 전문가의 경험에 의존하는 위험 규칙의 개선 방안을 연구하였다. 이 연구에서는 세관 신고 데이터의 속성을 기반으로 동적 가중치 할당 방법을 적용한 개선된 동적 가중치 Can-Tree 증가 마이닝 알고리즘을 제안하였다. 이는 세관 신고 데이터의 특성에 따라 가중치를 결정하고, 증분 연관 규칙 마이닝을 위한 Can-Tree 알고리즘에 가중치 방식을 적용하여 위험 규칙을 자동으로 추가하는 것이다. 그러나 이 연구에서 생성하는 위험 규칙은 RBI를 위한 위험 분류 규칙이 아닌 단순히 특정 규칙을 구성하는 일부 단편적인 규칙만을 생성할 수 있다. X. Zhou[4]는 세관에서 위험 관리의 정확성을 향상시키기 위해 의사 결정 트리를 사용하여 위험 감지를 위한 데이터 마이닝 프로세스를 연구하였다. 그러나 그의 연구는 위험에 대해 단순한 이진 분류(검사 혹은 패스)만 수행할 수 있어서 효율성이 떨어지는 문제점이 있다. Y.-H. Kuo 등[5]은 인공 신경망 기술을 사용하여 국경에서 발생하는 밀수에 대한 검사를 예측하는 모델을 제안하였다. 그러나 이 연구 또한 X. Zhou가 수행한 연구와 같이 단순한 이진 분류만 수행함으로써 효율성이 낮다는 문제점을 갖고 있다.
관세청과 같은 관세 관련 기관들은 고위험 화물이 자국에 도착하기 전에 이를 식별하기 위한 핵심 의사 결정 도구인 RBI 솔루션을 개발하고 운영해야 한다. RBI 시스템을 개발하기 위한 위험 분류 알고리즘이 필요한 데이터는 세관 신고서에서 취득할 수 있는 기본 정보인 HS Code[6], 제품명, 출발지와 도착지, 운송 방법, 수입자와 수출자 등의 데이터와 함께 별도의 데이터베이스(DB)로 유지해야 하는 과거 거래 기록 및 유사 사례의 검사 결과 등의 정보를 사용할 수 있어야 한다. 본 논문에서는 머신 러닝에 적용할 데이터가 없다는 가정하에 규칙 기반 RBI 솔루션을 위한 위험 분류 알고리즘을 개발하고 구현하였다. 이를 통해 수집된 결과 데이터는 향후 머신 러닝의 학습 데이터로 활용이 가능하여 보다 지능적인 RBI 시스템 개발에 활용할 수 있다.
Ⅲ. 규칙 기반 위험 분류 알고리즘
3.1 RBI 프로세스 다이어그램
우리가 목표로 하는 RBI 시스템을 위한 규칙 기반 위험 분류 알고리즘은 위험도가 낮은 화물의 신속한 반입 처리를 목표로 함과 동시에 잠재적 위험도를 갖는 화물에 대한 신속한 분류를 수행하는 것이다. 이를 위한 주요 원칙은 다음과 같다.
위험 평가: RBI 시스템은 위험 평가를 통해 수입 화물의 위험 수준을 판단한다. 화물의 위험 평가는 제조 과정, 제품의 특성, 운송 방법, 사용용도 등을 고려하여 평가된다. 이러한 위험 평가는 제품의 위험 수준을 정량화하는데 중요한 지표가 된다.
검사 빈도: 위험 평가 결과를 바탕으로 위험물에 대한 검사 빈도를 결정한다. 위험 수준이 높은 화물은 위험 수준이 낮은 화물에 비해 더 높은 검사 빈도를 갖는다.
검사 방법: 위험물에 대한 검사 방법은 제품의 종류, 위험 수준, 관련 규제 등을 고려하여 시류 체취 및 분석, 물리적/화학적 검사, 문서 검토 등이 포함될 수 있다.
<그림 1>은 목표 RBI 시스템을 위한 위험 관리 프로세스 다이어그램이다. RBI 시스템을 위한 위험 관리 프로세스의 세부적인 절차는 다음과 같다.
<그림 1> RBI 프로세스 다이어그램
위험 인식(Risk awareness) 단계에서는 화물과 관련된 위험 요인을 식별한다. 예를 들어 폭발물, 독성 물질, 유해 물질, 불안전한 기계 부품 등이 위험 요소로 인식될 수 있다.
위험 평가(Risk assessment) 단계에서는 위험 인식 단계에서 식별된 위험 요소를 기반으로 위험을 평가하기 위한 기준을 설정한다. 이 기준은 해당 제품 및 해당 위험 요소에 대한 규제 및 안전성 요구사항 등을 기반으로 한다. 또한 위험 평가 단계에서는 위험 분류를 위한 각 위험 요인의 위험 수준을 정량화 한다. 위험 정량화는 위험 등급이나 위험 지수를 사용하여 수행될 수 있다.
위험 분류(Risk classification) 단계에서는 본 논문에서 고안한 규칙 기반 분류 알고리즘을 기반으로 화물의 위험 등급을 할당하고, 그 결과를 DB에 등록한다. 목표 RBI 시스템은 세 가지 채널로 위험 등급을 할당한다. 저위험 화물은 Green 채널로, 중위험 화물은 Yellow 채널로, 그리고 고위험 화물은 Red 채널로 분류한다. 각 위험 채널에 따라 검사 빈도와 검사 방법이 달라진다.
위험 검사(Risk inspection) 단계에서는 위험 분류 단계의 결과를 바탕으로 적절한 검사를 실행하고, 그 검사 결과를 DB에 등록한다. 이는 위험 감소를 위한 전략 및 방법을 개발하고, 위험을 최소화하거나 통제하기 위한 조치를 적용하기 위해 필요하다.
결과 모니터링(Result monitoring) 단계에서는 위험물에 대한 엔드 유저나 시장에서의 사용 결과를 모니터링하고, 그 결과를 DB에 등록한다. 또한 위험 분류 결과와 결과 모니터링 결과 간에 차이가 발생하는 경우에는 이전 단계에서 수행되는 위험 평가에 반영되도록 해당 내용을 전달하여 위험 환류가 발생하도록 한다.
3.2 규칙 기반 위험 분류 알고리즘
앞 절에서 기술한 RBI 프로세스에서 위험 분류 단계를 위한 규칙 기반 위험 분류 알고리즘은 다음과 같은 위험 지표를 사용하여 설계되었다.
HS Code: 상품의 분류에 사용되는 국제 표준화된 세계 무역 품목 코드로 이를 통해 해당 화물의 품목을 확인할 수 있다.
원산지: 수입 화물의 원산지에 따라 위험도가 달라질 수 있다. 즉 원산지 국가의 위험도가 위험 분류에 영향을 미친다.
수입자의 신뢰도: 수입 신고자의 과거 기록, 실적 및 평판이 위험 분류에 영향을 미친다.
거래 관계: 수입자-수출자간 거래 기록, 거래 유형, 거래 규모 등 거래의 신뢰성과 안전성이 위험 분류에 사용된다.
물류 경로: 물류 경로, 운송 수단 등과 같은 환경 요인에 따라 위험이 증가할 수 있다. 따라서 복잡하거나 불투명한 물류 경로는 위험 분류에 영향을 미친다.
<표 1>은 앞에서 기술한 지표를 알고리즘의 입력으로 활용하여 수입 화물에 대한 등급을 할당하는 규칙 기반 위험 분류 알고리즘을 보인 것이다. 각 입력 지표의 값에 적절한 가중치(weight)를 할당하고, 각 지표의 카테고리별 위험도에 따른 랜덤한 범위값을 곱하여 모두 더하면 위험 총점수를 얻을 수 있다. 이 위험 총점수를 기반으로 Green, Yellow, Red 채널로 분류하게 된다.
<표 1> 규칙 기반 위험 분류 알고리즘
<표 1>에서 보인 것과 같이 규칙 기반 위험 분류 알고리즘은 먼저 각 입력 지표에 대해 가중치를 설정한다. 알고리즘의 기본 가중치는 HS Code는 30%, 원산지는 20%, 수입자 신뢰도는 20%, 거래 관계는 15%, 물류 경로는 15%로 설정하였다. 또한 이들 지표의 카테고리별 점수화 기준은 각각 고위험도, 중위험도, 저위험도에 따라 랜덤한 범위의 점수를 갖도록 하였다.
HS Code에서 고위험 카테고리에는 위험물이나 규제대상 화물 등이 포함되고, 중위험 카테고리에는 고가의 전자제품 등이 포함된다. 그리고 저위험 카테고리에는 일반 생활용품 등이 해당된다.
원산지에서 고위험 카테고리에는 현재 제재 대상인 국가가 해당되고, 중위험 카테고리에는 불안정한 정치상태를 갖는 국가가 해당된다. 그리고 저위험 카테고리에는 정치적으로 안정된 국가가 해당된다.
수입자의 신뢰도에서 고위험 카테고리에는 위반 기록이 많은 수입자가 해당되고, 중위험 카테고리에는 위반 기록이 약간 있는 수입자가 해당된다. 그리고 저위험 카테고리에는 과거 위반 기록이 없는 수입자가 해당된다.
거래 관계에서 고위험 카테고리는 불안정한 거래의 경우로 의심스러운 거래 조건이 있거나 거래 기록이 없는 경우가 해당되고, 중위험 카테고리는 일회성 거래인 경우가 해당된다. 그리고 저위험 카테고리는 안정적인 거래의 경우로 장기간 거래이거나 높은 거래 횟수인 경우가 해당된다.
물류 경로에서는 고위험 카테고리는 복잡한 경로를 갖는 경우로 여러 국가를 거쳐 수송된 경우가 해당되고, 중위험 카테고리는 별도의 중간 국가를 거쳐서 수송된 경우가 해당된다. 그리고 저위험 카테고리는 해당 국가로부터 직접 수송된 경우에 해당된다.
알고리즘은 각 지표별 카테고리에 따른 각각의 점수가 계산되면 해당 지표별 가중치 값을 곱하고 모두 더하여 총합 점수를 계산한다. 특정 화물에 대해 이와 같이 계산된 총합 점수가 75점에서 100점 범위에 있으면 Red 채널로, 35점에서 74점 범위에 있으면 Yellow 채널로, 그리고 35점 미만이면 Green 채널로 분류한다. 본 알고리즘에서 설정한 가중치, 카테고리 및 모든 기본 설정값과 랜덤값의 범위는 필요에 의해 변경할 수 있도록 대시보드(Dashboard) 시스템의 형태로 구현한다.
Ⅳ. 알고리즘의 구현 및 테스트
RBI 시스템을 위해 본 논문에서 고안한 규칙 기반 위험 분류 알고리즘은 최신 웹 애플리케이션 프레임워크인 Svelte[7]를 사용하여 컴포넌트 기반으로 구현하였다. 또한 앞에서 기술한 것처럼 기본 값과 카테고리 등은 언제든지 필요에 따라 변경이 가능하도록 대시보드 형태의 SPA(Single Page Application) 애플리케이션으로 구현하였다.
<그림 2>의 (a)는 본 알고리즘에서 설정한 기본 가중치(%)값을 보여준다. 이 값은 자국의 세관 상황이나 정책 등 필요에 따라 변경할 수 있도록 하였다. 따라서 <그림 2>의 (b)에서는 HS Code에 대한 가중치를 변경하는 화면을 보여준다. 여기에서 값이 변경되면 Svelte의 상태관리에 의해 자동으로 이전 (a)에서 보았던 화면의 기본 값이 자동으로 갱신된다. 이를 위해 Svelte의 상태관리 방법인 props와 store를 사용하였다. 또한 시스템에서 설정된 값을 저장하기 위해 JSON 데이터 형식을 사용하여 localStorage[8]에 객체 데이터로 저장하였다. 따라서 본 시스템에 다시 접속하더라도 이전에 설정된 값을 localStorage로부터 가져옴으로써 알고리즘이 이전에 설정된 값으로 동작할 수 있도록 하였다. 각 화면의 이동은 Svelte의 SPA 특성에 맞게 Router를 사용하여 전체 페이지를 재로딩하지 않고 해당 콘텐츠만 교체하도록 하였다. 이를 통해 빠른 로딩 및 데이터 처리가 가능하다.
<그림 2> 가중치 설정 및 변경 화면
<그림 3>은 알고리즘의 점수화 기준을 설정하는 화면이다. 각 입력 지표의 카테고리별로 고위험, 중위험, 저위험에 대한 기본 값은 각각 80~100, 40~79, 0~39의 값 범위에서 랜덤하게 설정되도록 하였다. 이 값의 범위도 필요에 의해 수정이 가능하도록 하였고, 값이 수정되면 자동으로 알고리즘에 적용이 되도록 하였다.
<그림 3> 점수화 기준 설정 화면
<그림 4>는 HS Code, 원산지, 수입자의 신뢰도에 대한 지표 카테고리 값을 설정하는 화면이다. HS Code에서는 고위험 및 중위험 상품에 대한 HS Code 값을 추가하고 변경할 수 있도록 하였다. 저위험 상품은 고위험이나 중위험 HS Code에 포함되지 않은 상품으로 자동으로 인식하도록 하였다. 원산지와 수입자의 신뢰도 또한 HS Code와 같은 방식으로 추가, 삭제 및 변경할 수 있다. 이 카테고리의 수정 또한 Svelte의 props와 store를 사용하여 상태변경이 자동으로 인식되도록 하였으며, localStorage를 사용하여 변경된 값을 저장하여 다시 시스템이 실행되었을 때 저장된 값으로 실행되도록 하였다.
<그림 4> 각 지표의 범주 설정 화면
<그림 5>는 설정된 지표에 기반하여 알고리즘을 테스트하는 화면이다. 본 테스트에서 사용된 실험 데이터는 세관 신고서로부터 얻을 수 있는 데이터와 이전 검사 이력 등의 데이터를 사용하였다. <그림 5>에서 보인 것과 같이 본 테스트에서 사용한 테스트 데이터는 HS Code 등 위험 분류 알고리즘에서 입력으로 사용하는 지표들로 구성하였다. 이 지표들은 알고리즘에서 설정한 기본 값을 갖거나 앞에서 보인 대시 보드 시스템에 의해 수정된 값을 가지고 평가된다. 예로 첫 번째 상품의 경우에는 위험 분류 알고리즘에 의해 계산된 총합 점수가 30.88이다. 이 값은 35점 미만이므로 Green 채널로 분류되었음을 보여준다.
<그림 5> 설정된 지표에 따른 위험 분류 테스트 화면
Ⅴ. 결론
본 논문에서는 수입 화물의 위험 검사를 효율적으로 수행하기 위해 위험 기반 관리(RBI) 시스템의 위험 분류 알고리즘을 규칙기반으로 설계하고 구현하였다. 이러한 효율적인 RBI 시스템의 위험 분류 알고리즘은 관세청의 업무 효율성을 향상시키고 자국민의 안전을 선제적으로 보호하는데 큰 도움이 될 것이다. 본 연구를 통해 개발된 규칙 기반 위험 분류 알고리즘을 해당 국가의 세관 신고서 정보와 함께 별도 데이터베이스로 관리하는 데이터에 맞게 개선시키고 발전시키면 수입화물의 신속한 통관 및 위험 관리에 효과적으로 활용할 수 있을 것이다. 또한 본 규칙 기반 위험 분류 알고리즘의 결과 데이터는 향후 지도 학습 기반 머신 러닝에 사용될 수 있어 머신 러닝 기반 RBI 시스템 개발에 용이하게 활용될 것으로 기대한다.
References
- R. Hillberry, B. Karabay, S. W. Tan, "Risk management in border inspection," Journal of Development Economics, Elsevier, Vol. 154, Jan. 2022.
- C. Thibedeau, "Perspective on risk management systems for Customs administrations," Point of View, WCO News, Oct. 2019.
- D. Han, J. Zhang, Z. Wan, M. Liao, "Dynamic Weights Based Risk Rule Generation Algorithm for Incremental Data of Customs Declarations," Information, Vol 14, No. 3, Feb. 2023.
- X. Zhou, "Data mining in customs risk detection with cost-sensitive classification," World Customs Journal, Vol. 13, No. 2, pp. 115-130, Sep. 2019. https://doi.org/10.55596/001c.116219
- Y.-H. Kuo, S.-C. Chou, "Manifest Monitoring Model as Support for Customs Risk Management: Evidence from Taiwan," World Customs Journal, Vol. 15, No. 2, pp. 73-82, Sep. 2021. https://doi.org/10.55596/001c.116449
- Harmonized System (HS) Codes, https://www.trade.gov/harmonized-system-hs-codes.
- Svelte: cybernetically enhanced web apps, https://svelte.dev/.
- N. Michael, "Storing and retrieving JavaScript objects in localStorage," Blog, LogRocket, Nov. 2021.