1. 서론
4차 산업혁명 시대의 ICT 기술은 최근 수년 사이에 급속도로 발전하여 이미 다양한 분야에서 활용되고 있다. 이러한 시대적 흐름에 발맞춰 주요 선진국들의 형사사법 분야에서는 효율적인 법률서비스 제공을 위해 인공지능을 활용한 리걸테크(Legaltech)에 주목하고 있다. 리걸테크의 정의는 다양한 견해가 있으나 법률 전문 분야에서의 소프트웨어 기술의 적용이라고 할 수 있다[1]. 리걸테크의 효율적 활용과 발전의 핵심은 데이터이다. 판결문은 그 데이터가 나날이 축적되고 있으므로 ICT 기술을 통한 빅데이터 활용이 용이하다. 또한, 범죄사건을 구성하고 있는 구체적이고 자세한 정보가 포함되어 있어 범죄 예측과 예방을 위한 데이터를 생성하기 적합하다고 할 수 있다. 따라서 본 연구는 판결문상 기술된 ‘범죄사실’ 부분을 기반으로 순환신경망(RNN)을 적용할 수 있는 범죄 예측 모델을 제시하고자 한다. 범죄사건은 단편적인 부분이 아닌 전체적인 부분, 즉 행위과정 전반에 걸친 의사 결정과 선택에 영향을 미치는 상황 요인에 대한 분석과 이해가 필요하다. 이를 위해 Cornish의 범죄 스크립트 분석을 중심으로 하여 범행 과정을 전·중·후 단계로 구분하였다. 또한, 각 시점에 따른 범죄의 수법과 증거 등은 문장 품사에 기반하여 객체 행위 환경으로 분류하였다. 이는 수사 8하원칙이 가지는 문장 구성 요소에 기초한다.
2. 관련 연구
2.1 리걸테크
리걸테크(Legaltech)는 법률(legal)과 기술(technology)이 결합된 용어로 정보기술을 활용하여 기존 법률서비스의 변화·혁신을 통해 법률서비스의 효율적인 제공을 목적으로 하는 새로운 접근 방식을 의미하는 용어이다. 법률은 다양한 사례가 판례에 포함되어 있고, 법령이나 이론을 규칙으로 변환할 수 있는 구조이므로 인공지능 알고리즘과의 결합이 적절하다. 이러한 기술적 장점은 미국을 중심으로 하여 법률서비스 관련 인공지능 기술 분야에서 빠르게 발전하고 있다. 그러나 해외의 인공지능 활용 법률서비스와 비교하여 볼 때 국내 인공지능 활용 법률서비스 기술은 대부분 법률자료 및 판례검색을 도와주거나 상대적으로 간단한 내용의 법률문서 작성이 가능하다는 점은 국내 리걸테크 성장의 필요성을 보여준다. 또한, 국내외 모두에서 본 논문에서 다루고자 하는 판결문을 사용하여 범죄를 예측하거나 예방하고자 하는 리걸테크는 현재 찾아보기 어렵다.
(표 1) 한국과 미국의 범죄예측·예방과 관련된 리걸테크
(Table 1) Legaltech Related to Crime Prediction and Prevention in South Korea and the United States
2.2 자연어처리와 범죄예방
자연어처리(Natural Language Processing; NLP)란, 대량의 자연어 텍스트 데이터를 처리하고 분석할 수 있도록 컴퓨터를 프로그래밍하는 방법이다. 자연어처리는 범죄 예방에 다양한 방식으로 도움을 줄 수 있으나 본 연구에서는 법률문서 및 판례를 자동으로 분석하여 유용한 정보를 추출하여 범죄예방과 예측에 도움을 줄 수 있다는 점에 주안점을 두었다.
그동안 법률정보서비스를 이용한 범죄예방 빅데이터 관련 국내 학술연구의 수행은 다소 미흡하였으며, 판결문 범죄사실 정보의 구조적 특성을 연구한 국내 선행연구는 거의 없었다. 또한, 국가마다 법률체계와 판결문의 구조가 상이함으로 국내 실정에 맞춘 구조화 작업이 선행될 필요가 있다고 판단된다. 아래의 표 2는 자연어처리와 범죄예방에 관련된 선행연구를 정리한 것이다.
(표 2) 자연어처리와 범죄예방 관련 선행연구
(Table 2) Previous Research on Natural Language Processing and Crime Prevention
2.2.1 순환신경망(RNN)
RNN(Recurrent Neural Networks)은 우리말로 순환신경망이라고 부르기도 하며, 시계열 데이터를 다루기 위한 전형적인 모형으로 알려져 있다. 그 이유는 RNN이 앞에서부터 순차적으로 미치는 영향을 계속 축적하는 모형이기 때문이다. 이는 인간이 문맥을 이해하는 과정과 유사하므로 어떤 문장에 있는 단어의 순서를 무작위로 바꿔 놓는다면 그 의미를 정확하게 파악하지 못할 가능성이 있다. 그러나, 판결문과 같은 공식적인 문서에서는 문장, 단락 및 내용 간의 의존성이 높으며 이전 내용에 따라 이후 내용이 결정되는 경우가 많다. 즉, 판결문은 일반적으로 시간에 따른 사건의 흐름을 다루기 때문에 RNN으로 데이터를 처리하는 데 적합하다고 할 수 있다. 예를 들어, 앞 단어에서부터 시작된 문맥의 정보가 마지막까지 순차적으로 축적되면 모아진 정보를 활용하여 문서를 분류할 수 있다. 아래의 (그림 1)은 RNN 모형에 대한 가장 일반적인 모형이다.
(그림 1) 일반적인 RNN 모형[5]
(Figure 1) General RNN Model[5]
2.3 범행과정 전·중·후 단계 : 범죄 스크립트 분석중심
범죄 스크립트 분석은 합리적 선택이론에 기반한 분석 기법이다. Cornish(1994)는 합리적 선택 관점의 핵심 개념들을 활용하여 범죄자가 아닌 범죄사건 자체에 주목하였다[6]. 특정 범죄를 대상으로 범행 과정 전반에 걸친 범죄자의 의사 결정과 행동을 설명하며, 의사 결정과 행동에 영향을 미칠 수 있는 다양한 상황적 요인을 각각의 장면이나 단계로 구분하여 그림으로 표현하였다. 범죄 스크립트 분석의 주요 목표는 두 가지이다. 첫째로, 특정 범죄의 단계별 과정에 대한 구조를 제공하는 것이다. 범죄자의 행동에는 특정 범죄와 관련된 의사 결정 과정이 숨어 있다. 이러한 과정을 분석하여 범죄자들이 어떤 생각을 하고 있는지를 이해하고, 범행의 근거를 파악하는 데 도움을 준다. 둘째로, 상황적 범죄예방을 위한 새로운 대응 방법을 제시하는 것이다. 범행 과정을 단계별로 분해하여 분석하지 않았다면 발견되지 않았을 수 있는 다양한 범죄예방 기회를 보여준다.
해외에서 진행된 다양한 스크립트 분석 선행연구를 살펴보면 Cornish와 Clarke[7]은 절도를, Cornish[8]는 강도, 반달리즘, 차량 절도를 분석하였고, Lacoste와 Tremblay[9]는 수표위조를, Morselli와 Roy[10]은 절도차량 수입에 대한 네트워크를 분석하였다. 최근에는 De Korte와 Kleemans[11]의 청부살인(contract killing) 연구나 William, Corner과 Taylor[12]의 차량 들이받기(vehicular ramming attack) 연구같은 흥미로운 스크립트 연구도 진행되었다.
2.4 수사 8하원칙
범죄 행위를 재현하기 위해서는 수사의 요소가 구비되어야 한다. 수사의 요소에는 범행 재현의 3요소인 ‘4하원칙’, ‘6하원칙’, ‘8하원칙’이 있다. 특히, 구체적으로 범죄의 사실적 내용을 입증하기 위해서는 8하원칙이 적용되는 것이 바람직하다. 아래의 표 3은 범행 재현의 3요소를 나타낸 것이다.
(표 3) 범행 재현의 3요소[13]
(Table 3) The Three Elements of Crime Reconstruction[15]
3. 연구방법
본 연구는 판결문상 범죄사실에 대하여 문장의 구조적 특성을 파악하고 이를 바탕으로 자연어처리를 위한 분석틀을 개발하고자 판결문 데이터를 수집 하였다. 이 연구를 위하여 웹크롤링 매크로를 통해 2023년 6월 30일 기준 한국심리과학센터(KAPS)의 ‘강력사건판결사례’에 등록된 최근 3개년의 판결문 500건을 수집하였다. 한국심리과학센터(KAPS)에 등록된 판결문은 오픈 데이터로서 제한된 판결문만 열람이 가능한 ‘대법원 종합법률정보’와는 달리 방대한 형사사건 판결문을 수집할 수 있을 뿐만 아니라, 다른 유료 판결문 검색 사이트에 비하여 접근성이 용이하므로 해당 사이트에 등록된 자료를 사용하였다. 이 중 행위 객체 환경요소가 종합적으로 들어가지 않은 데이터는 최종분석에서 제외하였으며 총 135건을 검토하였다. 아래의 그림 2는 본 연구의 주요 프로세스를 나타낸 것이다.
(그림 2) 연구의 주요 프로세스
(Figure 2) Research Main Processes
4. 연구결과
본 연구에서는 판결문상 “범죄사실” 부분의 내용을 범행 과정의 전·중·후 단계로 구분하여 구조적 특성을 파악하였다. 또한, 각각의 단계별 범행 전개 과정을 수사 8하 원칙에 따라 문장의 품사를 중심으로 한 구조화 작업을 진행하였다. 일반적으로 6하원칙을 통해 행위의 필연성을 설명하지만, 수사에서는 공범과 피해자의 구분이 명확해야 하므로 위에 제시된 분석틀과 같이 8하원칙의 인과적 구조를 활용하는 것이 적절하다고 판단하였다. 아래의 내용은 본 연구에서 도출된 사건요약 분석틀의 세부적인 구성들에 대한 설명이다.
먼저, 아래의 표4는 문장의 구성 요소 중 주어에 해당하는 “행동의 주체”에 대한 항목이다. 일반적으로 범행 과정에서 행동의 주체는 피고인이며, 공범의 존재 여부 및 피고인-피해자 간 접촉에 따라 공범과 피해자 역시 행동의 주체가 될 수 있다.
(표 4) 행동의 주체
(Table 4) Subject of Action
다음으로 아래의 표5는 사건의 발생 시간이나 기준일 전후 시점의 시간을 나타내는 항목이다. 일반적으로 행위가 발생한 특정 시점이 이에 해당한다. 행위 발생 시간이 명확하지 못한 경우에는 접미사 “경”을 붙인다.
(표 5) 행위 발생 시간
(Table 5) Time of Action
행위가 발생한 장소를 나타낸 항목은 다음의 표 6과 같다. 판결문상 발생 장소의 기재는 구체적인 장소와 장소의 소재지까지 포함한다. 지역(소재지)과 구체적 장소는 각각 조사 “의”와 “에서”를 붙인다.
(표 6) 행위 발생 장소
(Table 6) Scene of the Action
행위 시 사용한 도구를 나타낸 항목은 아래의 표 7과 같다. 일반적으로 범행 과정에서 피고인이 사용한 도구가 이에 해당하며, 행위의 주체가 피해자인 경우에는 기타 물리적으로 접촉 가능한 모든 대상물이 포함될 수 있다. 대상 객체의 뒤에는 수단·도구를 나타내는 격 조사 “로, 으로”가 붙는다.
(표 7) 행위 시 사용 도구
(Table 7) Tools Used During the Action
다음으로 아래의 표8은 행위의 결과 또는 동작을 나타낸 항목이다. 이는 범행행위, 행동 또는 특정 동작을 나타내며, 행위의 결과로도 볼 수 있다. 예컨대 절도 또는 강간 사건에서는 “빼앗는” 행위가, 폭행 사건의 경우 “때리는” 행위가 범죄의 결과에 해당한다고 할 수 있다. 행위의 결과(동작) 자체가 문장의 구성 요소 중 동사에 해당하므로 보통 “~하였다, 저질렀다”로 표현된다.
(표 8) 행위의 결과(동작)
(Table 8) Result of the Action
일반적인 강력범죄의 경우 과반수 이상이 단독범행이지만, 조직범죄이거나 횡령·배임 등 재산범죄의 경우에는 공동범행일 가능성이 농후하다. 또한, 사건의 직접적인 당사자는 아니더라도 참고인 등 관계인 역시 존재할 수 있으므로 이를 파악하는 작업은 중요하다고 할 수 있다. 판결문은 특정 피고인을 기준으로 작성되므로 뒤에 접속 조사 “와, 과”가 붙는다. 다음의 표9는 공범의 존재 여부에 관한 항목이다.
(표 9) 공범의 존재 여부
(Table 9) Existence of Co-conspirator
아래의 표10과 같이 피해의 종류는 크게 인적피해, 현물피해, 물적피해 등 3가지로 구분할 수 있다. 먼저, 인적 피해의 경우 폭행 등에 의해 부상 당한 신체부위나 이를 증명하기 위한 상해진단과 같은 내용이 포함된다. 다음으로 현물피해와 물적피해의 경우 현금 등 피해 액수를 산정할 수 있다. 이처럼 피해 대상은 사람 또는 물건이 될 수 있으며, 이를 통해 범행행위의 객체를 파악할 수 있다.
(표 10) 피해 대상
(Table 10) Damage Categories
다음의 표11은 범행 동기 및 발생 원인에 관한 항목이다. 대부분의 범행에는 그 동기가 있기 마련이다. 물론, 이상동기 범죄와 같이 범죄의 동기를 뚜렷하게 파악하기 어려운 유형도 존재하지만, 우발적 이상행위를 촉진시키는 촉발요인은 언제나 존재한다. 그러므로 해당 항목은 범죄예방에 있어 범죄 기회를 차단하기 위해 수사기관이 개입할 수 있는 개입 가능 지점을 제시하는데 매우 중요한 부분이라고 할 수 있다.
(표 11) 범행 동기, 발생 원인
(Table 11) Motive and Cause
이상의 내용을 종합하면 아래의 표 12와 같다. 위에서 언급 한 바 본 연구의 목적은 판결문상 구조항목 중 범죄 사실 부분과 관련된 내용을 기반으로 한 범행 과정 전·중·후 단계의 분석틀을 도출하는 것이다. 이를 통해 범죄의 수법 및 증거, 주체와 객체 간 구체적 행위사실 등 객관적 구성요건에 따라 분류함으로써 범죄자들의 선택에 영향을 미치는 물리적·환경적 조건과 선호하는 조건에 대한 파악이 가능하며, 범죄 행위에 대한 본질적인 이해를 도울 수 있다. 또한, 특정 범죄 수법과 범죄 행동 절차를 분석하는데 유용한 도구로 활용되며, 이상행위 범죄예방에도 도움을 줄 수 있다. 나아가 강력범죄 수사는 범죄 발생 또는 범죄 혐의가 있을 경우 ‘해당 사건의 범인은 누구인가?'와 ‘그 범인은 어떤 행위를 저질렀는가?' 등의 사실적인 내용을 명확히 해야 한다. 이를 위해서는 범행 동기, 장소 및 시간의 선택, 장소와 행동의 인과성 등 행위의 필연성을 설명하는 요소가 모두 포함되어야 한다. 이러한 필연성을 논리적으로 구성하는 것이 범죄 스크립트 분석의 핵심이다.
(표 12) 최종 분석 틀
(Table 12) Final Analysis Framework
과거 전통적인 범죄 스크립트 연구에서는 방대한 텍스트 데이터 수집 과정과 케이스별 범행 과정을 연구자가 직접 분류하는 절차를 거쳤다. 그러나 이러한 방법은 연구자의 주관성이 개입될 여지가 크며, 방대한 양의 자료 검토는 연구자로 하여금 피로도를 가중시킴으로써 분류의 정확도를 떨어뜨리는 요인으로 작용한다. 그러므로 위와 같은 사건 요약 분석 틀의 구축은 향후 사건정보 분류의 자동화를 위한 첫 단추이며, 이를 통해 범죄 스크립트 분석의 정확도를 극대화할 수 있을 것으로 판단된다.
5. 결론 및 제언
기존 관련 선행연구와 비교하였을 때, 이 연구의 가장 큰 차별성은 판결문 정보 구조화에 있어 범행 과정의 전·중·후 단계를 설정한 사건 요약표에 있다. 본 연구에서 제시한 사건 요약 분석 틀은 범죄학 분야의 범죄 스크립트 분석기법을 고려하여 작성된 것이다. 범죄 스크립트 분석은 범죄자들의 선택과 결정, 그리고 행동의 과정을 마치 연극의 대본처럼 묘사하는 것으로, 단계별로 범죄의 전 과정을 분석한다. 단계별 상세한 분석은 범죄자들의 선택에 영향을 미치는 물리적·환경적 조건과 선호하는 조건에 대한 파악이 가능하며, 범죄 행위에 대한 본질적인 이해를 도울 수 있다. 이러한 분석 결과는 특정 범죄 수법의 일반화를 가능하게 하고, 범죄 행동 절차를 분석하는데 유용한 도구로 활용되며, 상황에 맞는 범죄예방에도 도움을 줄 수 있다.
또한, 본 연구에서 도출한 최종 분석틀은 영어와는 차이가 있는 한국어의 품사 체계를 기반으로 작성되었다. 영어는 8품사로 구성된 반면, 한국어는 전치사와 접속사가 없고, 수사와 조사, 관형사가 들어간 9품사로 이루어진다[5]. 이러한 차이는 텍스트 전처리(Text Preprocessing)시 품사 태깅 과정에 있어 혼선을 야기할 수 있기 때문에 이 연구에서 제안된 최종분석 틀을 참고한다면 보다 정확한 분석수행이 가능할 것으로 사료된다. 따라서 향후 후속연구에서는 이 연구에서 제시된 문장의 품사에 기반한 사건 요약 분석 틀을 바탕으로 RNN모델을 이용한 범죄상황 예측 데이터를 생성함으로써 유용한 범죄예방 빅데이터를 구축할 수 있을 것으로 기대한다.
References
- M. Hartung, M.M Bues, & G. Halbleib, "Legal Tech", Bloomsbury Publishing Plc, 2017. https://www.bloomsbury.com/uk/legal-tech-9781509926329/
- Lwin Tun, Zeya, and Daniel Birks. "Supporting Crime Script Analyses of Scams with Natural Language Processing," Crime Science Vol. 12, No. 1, pp. 1-22, 2023. https://doi.org/10.1186/s40163-022-00177-w
- Meskela, Tsion Eshetu, et al., "Designing Time Series Crime Prediction Model Using Long Short-Term Memory Recurrent Neural Network." International Journal of Recent Technology and Engineering (IJRTE) Vol. 9, pp. 402-405, 2020. https://doi.org/10.35940/ijrte.d5025.119420
- HyeJin Ryu, et al. "A Study on Screening System for Vulnerable Users with RNN for Preventing Digital Sexual Crime." Journal of Digital Forensics, Vol. 16, No. 1, pp.118-130, 2022. https://doi.org/10.22798/kdfs.2022.16.1.118
- Sang-eon Park, Ju-young Knag, "The Complete Guide to Python Text Mining," Data Science Series_88, WikiBooks, 2023. https://wikibook.co.kr/textmining-rev/
- Cornish, Derek B. "The procedural analysis of offending and its relevance for situational prevention," Crime Prevention Studies, Vol. 3, No. 3, pp. 151-196, 1994. https://popcenter.asu.edu/sites/default/files/Library/CrimePrevention/Volume_03/06_cornish.pdf
- Clarke, R. V., & Cornish, D. B. "Modeling offenders' decisions: A framework for research and policy," Crime and Justice, Vol. 6, pp. 147-185, 1985. https://doi.org/10.4324/9781439817803-17
- Cornish, D. B., "In Proceedings of the International Seminar on Environmental Criminology and Crime Analysis," Tallahassee: Florida Criminal Justice Executive Institute, Vol. 1, pp. 30-45, 1994. https://bjs.ojp.gov/content/pub/pdf/pisecca.pdf
- Lacoste, J., & Tremblay, P., "Crime and Innovation: A Script Analysis of Patterns in Check Forgery." Crime Prevention Studies, Vol. 16, pp. 169-196, 2003. https://www-riss-kr-ssl.libproxy.kyonggi.ac.kr/search/detail/DetailView.do?p_mat_type=e21c2016a7c3498b&control_no=b8339d483cbf9b0cffe0bdc3ef48d419
- Morselli, C., & Roy, J. "Brokerage qualifications in Ringing Operations." Criminology, Vol. 46, No. 1, pp.71-98, 2008. https://doi.org/10.1111/j.1745-9125.2008.00103.x
- De Korte, LR., Kleemans, ER. "Contract Killings: a Crime Script Analysis." Trends in Organized Crime. Springer, 2021. https://doi.org/10.1007/s12117-021-09411-4
- Williams, A., Corner, E., Taylor, H., "Vehicular Ramming Attacks: Assessing the Effectiveness of Situational Crime Prevention Using Crime Script Analysis." Terrorism and Political Violence, Taylor & Francis, 2020. https://doi.org/10.1080/09546553.2020.1810025
- H.J Kim, "Police Investigation," ACL Communication, p. 14, 2020. https://www.aladin.co.kr/m/mproduct.aspx?ItemId=233999649