• 제목/요약/키워드: 구조 시스템

검색결과 20,341건 처리시간 0.057초

빅데이터 시대의 개인정보 과잉이 사용자 저항에 미치는 영향 (Personal Information Overload and User Resistance in the Big Data Age)

  • 이환수;임동원;조항정
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.125-139
    • /
    • 2013
  • 최근 주목 받기 시작한 빅데이터 기술은 대량의 개인 정보에 대한 접근, 수집, 저장을 용이하게 할 뿐만 아니라 개인의 원하지 않는 민감한 정보까지 분석할 수 있게 한다. 이러한 기술이나 서비스를 이용하는 사람들은 어느 정도의 프라이버시 염려를 가지고 있으며, 이것은 해당 기술의 사용을 저해하는 요인으로 작용할 수 있다. 대표적 예로 소셜 네트워크 서비스의 경우, 다양한 이점이 존재하는 서비스이지만, 사용자들은 자신이 올린 수많은 개인 정보로 인해 오히려 프라이버시 침해 위험에 노출될 수 있다. 온라인 상에서 자신이 생성하거나 공개한 정보일 경우에도 이러한 정보가 의도하지 않은 방향으로 활용되거나 제3자를 의해 악용되면서 프라이버시 문제를 일으킬 수 있다. 따라서 본 연구는 사용자들이 이러한 환경에서 인지할 수 있는 개인정보의 과잉이 프라이버시 위험과 염려에 어떠한 영향을 주는지를 살펴보고, 사용자 저항과 어떠한 관계가 있는지 분석한다. 데이터 분석을 위해 설문과 구조방정식 방법론을 활용했다. 연구결과는 소셜 네트워크 상의 개인정보 과잉 현상은 사용자들의 프라이버시 위험 인식에 영향을 주어 개인의 프라이버시 염려 수준을 증가 시키는 요인으로 작용할 수 있음을 보여준다.

양성자 치료 시 Intensity 기반의 영상 정합을 이용한 환자 자동화 Set up 적용 방법 (Automated patient set-up using intensity based image registration in proton therapy)

  • 장훈;김호식;최승오;김은숙;정종휘;안상희
    • 대한방사선치료학회지
    • /
    • 제30권1_2호
    • /
    • pp.97-105
    • /
    • 2018
  • 목 적 : Proton Therapy는 Bragg-peak를 이용해 종양에는 최대의 선량, 정상조직에는 최소의 선량을 줄 수 있는 특징을 가지고 있기 때문에 환자의 위치변화나 치료부위의 위치 변화를 정량화 할 수 있는 의료영상 분석 시스템은 양성자 치료에 있어서 무엇보다도 중요하다. 본 연구 목적은 Matlab 기반의 In-house Registration code를 제작하여 기존 DIPS program을 통한 Set-up과 In-house code를 통한 영상정합을 비교하여 Algorithm의 유용성을 평가하고 DIPS와 DRR간의 오차 값을 확인하여 기존 치료의 정확성을 평가하고자 한다. 대상 및 방법 : 본원에서 양성자 치료를 받은 13명의 뇌종양, 두경부암 환자를 대상으로 하였으며 영상비교에 필요한 DIPS Program System(Version 2.4.3, IBA, Belgium)와 환자의 치료계획을 위해 Eclipse Proton Planning System(Version 13.7, Varian, USA)을 사용하였다. Registration 방법에 대한 Validation을 위해 Test image를 인위적으로 회전 및 이동하여 기존 Image와 영상정합 하였고, 기존 Set up 방식의 DIPS program의 환자 일별 초기 Set up image를 plan DRR과 영상정합 하여 각각 오차 값을 얻어 Algorithm의 유용성을 평가하였다. 그리고 기존 Set up 방식의 정확성을 평가하기 위해 환자 일별 최종 Set up image와 DRR image를 영상정합하여 오차 값을 확인하였다. 결 과 : Test image를 left와 right 방향으로 각각 0.5, 1, 10 cm를 이동시켰을 때 평균 0.018 cm의 오차 값을 보였으며 시계와 반시계방향으로 각각 1, $10^{\circ}$씩 회전시켰을 경우에는 평균 $0.0011^{\circ}$의 오차를 나타냈다. 4명의 환자 일별 초기 image를 영상정합 하였을 때는 x, y, z 방향 순으로 평균 0.056, 0.044, 0.053 cm의 오차 값을 나타냈으며 Rotation, Pitch 순으로 0.190, $0.206^{\circ}$의 차이를 나타냈다. 13명의 환자 일별 최종 image를 영상 정합 하였을 때는 x, y, z 방향 순으로 평균 차이는 0.062, 0.085, 0.074 cm이였고 Vector 값으로는 평균 0.120 cm의 차이를 보였다. Rotation, Pitch 순으로는 평균 0.171, $0.174^{\circ}$의 차이 값을 나타냈다. 결 론 : 본 연구를 통해 제작된 Matlab 기반의 In-house Registration code는 단순한 Image 뿐만 아니라 해부학적 구조에서도 Intensity 기반의 정확한 영상정합을 나타냈다. 또한 기존 치료방식의 DIPS program을 통한 Set-up 오차는 매우 미미한 차이를 보임으로써 이는 양성자치료의 정확성을 확인할 수 있었다. 앞으로 임상적용을 위해 추가적인 프로그램 개발과 향후 Intensity 기반의 Matlab In-house code 연구가 필요하다고 사료된다.

  • PDF

서울올림픽대회 조직위원회 공문서의 성격에 관한 연구 (A Study on the Characteristics of Seoul Olympic Organizing Committee's Official Documents)

  • 천호준
    • 기록학연구
    • /
    • 제24호
    • /
    • pp.113-171
    • /
    • 2010
  • 이 연구는 서울올림픽대회 조직위원회의 공문서에 대한 균형적 시각을 제공하고, 이용과 관리의 체계화를 도모하기 위해서 서울올림픽대회 조직위원회 공문서의 성격을 규명하는데 그 목적이 있다. 이를 위해서 서울올림픽대회 조직위원회의 구성과 운영에 대한 사항을 고찰하고 공문서의 생산 구조를 분석하여, 기록이 생산되는 원리를 파악하였다. 이후 서울올림픽대회 조직위원회 공문서 관리의 실제와 잔존 기록과의 관계를 확인하여 이들과 생산 원리와의 종합적인 분석을 통해서 서울올림픽대회 조직위원회 공문서의 특성을 제시하였다. 서울올림픽대회 조직위원회의 공문서는 조직 구성의 난맥상과 의사 결정의 독점적 양상의 형태를 취하고 있던 조직에서 생성되었으며, 조직 규모에 적합하지 않은 문서관리 부서와 비현실적인 문서 관리 규정, 그리고 왜곡된 공문서의 생산과 관리환경 속에서 생산, 관리되었다. 또한 현재까지 남겨진 서울올림픽대회 조직위원회 공문서는 미흡한 관리 시스템의 영향 하에 놓여 있는 것이 있는 현실이다. 이와 같은 내용을 토대로 서울올림픽대회 조직위원회 공문서는 기록 출처의 다원성과 파편화, 잔존 기록의 불균형성 그리고 이용과 활용이 극히 제한적인 특성을 지니고 있음을 밝힐 수 있었다. 이상의 연구결과를 도출한 본 연구의 의의는 다음과 같이 정리할 수 있다. 우선, 서울올림픽대회 조직위원회 공문서에 대한 체계적인 관리 방법론을 마련하기 위한 후속연구에 공헌할 수 있을 것으로 판단한다. 구체적인 후속연구로는 서울올림픽대회 조직위원회 공문서를 대상으로 한 정리와 평가에 관한 연구를 제시할 수 있다. 다음으로, 이 연구는 2011년 대구세계육상선수권대회와 2014년 인천아시안게임 등과 같은 다수의 국제 스포츠 이벤트를 준비하고 있는 우리에게 시사하는 바가 매우 크다고 할 수 있겠다. 후대에 문화적 자산이 될 이들 행사에 대한 온전한 기록화에 본 연구는 일정한 공헌을 할 것으로 사료되기 때문이다. 끝으로, 공공기록물관리법령 속에 구현되어 있는 한시적 기관에 대한 기록 관리 규정의 보완과 국제 스포츠 이벤트 행사로서 서울올림픽대회와 같이 중요한 역사상을 온전하게 기록화하고 이를 후대에 효과적으로 전달할 수 있도록 하는 새로운 기록관리 대안 모델을 기대해 본다.

전자기록의 장기보존을 위한 이관절차모형에 관한 연구 (A Study on Transfer Process Model for long-term preservation of Electronic Records)

  • 천권주
    • 기록학연구
    • /
    • 제16호
    • /
    • pp.39-96
    • /
    • 2007
  • 기록관리 환경이 점차 자동화되고 효율성과 편리성을 보장해 주는 여러 가지 어플리케이션이 개발 보급됨으로써 기록은 사이버 공간에서도 생산, 관리될 수 있게 되었다. 이러한 상황에서 기록의 전자적 관리와 이관조항이 담긴 개정 법령이 시행된 점은 새로운 개념의 패러다임을 이행하려는 적절한 조치였다. 그러나 개정된 "공공기록물관리에관한법률"(이하 기록관리법)에서의 전자이관은 일반적인 개념만을 제시한 것으로 구체적인 실행방안과 절차가 조속히 마련되어야 한다. 기록을 이관한다는 것은 가치 있는 기록을 먼 훗날에도 이용하기 위해 수행하는 기록관리 과정의 일부이다. 따라서 기록을 생산한 생산자와 이관 받을 기관이 상호 협력하여 기록 자체와 그 맥락을 온전히 유지하면서 기준과 원칙에 따라 장기보존시설로 옮겨 보존해야 한다. 결국, 이관의 문제는 일정한 절차 속에서 있는 그대로의 기록을 신뢰할 수 있도록 아카이브로 옮겨서 장기보존 가능하도록 하는 것으로 귀결된다. 이를 위해, 모든 디지털 객체의 장기보존을 위한 표준인 OAIS 참조모형의 기능모델과 미항공우주국의 우주데이터 시스템 위원회(CCSDS : Consultative committee for Space Data Systems)에서 개발한 '생산자-아카이브 인터페이스 표준방법론(Producer-Archive Interface Methodology Abstract Standard-CCSDS Blue Book)'을 연구 분석하여 기록물관리기관간의 전자기록 이관을 위한 근거를 마련하였다. 또한 해외의 다양한 이관사례를 통해 표준과 실제의 갭을 최소화하고자 하였다. 결론적으로 '이관준비 ${\rightarrow}$ 전송(접수) ${\rightarrow}$ 검증 ${\rightarrow}$ 보존처리 ${\rightarrow}$ 저장소 저장'이라는 5단계와 단계별 하위절차로 구성되는 이관절차모형을 제안하였으며, 한국의 전자기록 이관구조를 '(특수)기록관에서 영구기록물관리기관으로의 이관'과 '민간부문에서 기록물관리기관으로의 이관'으로 구분하고 설계된 표준절차모형을 적용함으로써 실행 가능성을 입증해 보았다.

프로세스 거버넌스 메타모델과 프레임워크 (Process Governance Meta Model and Framework)

  • 이정규;정승렬
    • 인터넷정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.63-72
    • /
    • 2019
  • 기업 혹은 조직 거버넌스의 하위개념인 비즈니스 거버넌스와 IT 거버넌스는 학계에서 주요 연구과제가 되어 왔다. 그러나 비즈니스와 IT 도메인의 매개적 구조체로서 프로세스의 중요성에도 불구하고, 프로세스 거버넌스(PG)의 연구는 상대적으로 미흡하였다. PG는 비즈니스 전략을 IT시스템 구현과 연계하는 활동에 집중하며, 기업의 본원적 가치 창조 활동을 설명한다. 본 논문은 정치학, 사회학, 행정학에서의 기본적인 거버넌스 개념을 연구하고, 거버넌스 유형을 6개의 카테고리로 분류했다. 그리고 PG에 대한 일련의 메타모델을 제안한다. 예를 들면 전통적인 핸더슨과 벤카트라만의 SAM모델을 수정한 neo-SAM 모델, 조직 거버넌스 네트워크 모델, 조직거버넌스 순차모델, 조직 거버넌스 메타모델, 프로세스 거버넌스 큐브 모델, COSO와 프로세스 거버넌스의 비교 모델, 마지막으로 프로세스 거버넌스 프레임워크 등이다. SAM모델과 neo-SAM 모델의 주요한 차이점은 비즈니스 거버넌스와 IT 거버넌스 사이에 프로세스 거버넌스 도메인을 포함한 것이다. 여러 개의 메타 모델 중에서, 프로세스 거버넌스 프레임워크가 핵심 개념 모델로서 이는 4개의 활동차원 - 전략연계, 권한강화, 직능향상, 자율조직 - 으로 구성된다. 연구자는 각 활동차원 별로 5개씩 총 20개의 변인을 설계했다. 4개의 활동차원 외에도 프로세스 거버넌스 사이클을 움직이는 6개의 순환 동력 - 탈규범력, 미시권력, 활력, 자기조직력, 규범력, 센스메이킹 - 이 있다. 4개의 활동차원과 6개의 동력으로 조직은 내외부의 환경 변화에 대한 프로세스 거버넌스의 융통성을 유지할 수 있다. 본 연구는 프로세스 거버넌스 역량 모델과 프로세스 거버넌스 변인을 제안하는 목적을 가진다. 업계환경은 기능 중심 조직관리에서 프로세스 중심 관점으로 변화하고 있다. 연구자가 제안하는 프로세스 거버넌스 프레임워크가 향후 프로세스 거버넌스 도메인의 연구 확산을 위한 맥락적 참조모델과 아울러 프로세스 거버넌스 측정도구의 개발을 위한 조작적 정의의 틀을 제공할 것이다.

Potential Contamination Sources on Fresh Produce Associated with Food Safety

  • Choi, Jungmin;Lee, Sang In;Rackerby, Bryna;Moppert, Ian;McGorrin, Robert;Ha, Sang-Do;Park, Si Hong
    • 한국식품위생안전성학회지
    • /
    • 제34권1호
    • /
    • pp.1-12
    • /
    • 2019
  • 신선한 농산물 섭취와 관련된 많은 장점들이 전세계적으로 발표되고 있으며, 지속적인 섭취를 장려하고 있다. 일반적으로 과일과 채소는 최소한으로 가공되기 때문에 천연의 성분들이 건강을 증진시키는 역할을 하기도 하지만 그만큼 질병을 일으킬 수 있는 매개체가 존재할 수 있는 가능성이 매우 높다. 세계 보건기구 (WHO)의 보고서에 따르면 10명 중 1명이 식품에 의해 발생하는 질병으로 고통 받고 있으며, 전 세계적으로 매년 42만 명이 식중독으로 사망하는 것으로 밝혀졌다. 이러한 신선 식품은 농장에서 수확할 때부터 소비자의 식탁에 오르기까지 다양한 경로에서 쉽게 오염 될 수 있다. 본 리뷰논문에서는 신선식품에 의해 발생할 수 있는 질병을 이해하기 위해 화학적, 생물학적, 그리고 물리학적 위험요소로부터 식중독을 일으키는 원인과, 증상, 그리고 검출 방법에 대해서 기술 하였다. 화학적 위험요소의 대표적인 예로는 농약(살충제, 살균제, 및 제초제), 천연 독소 (곰팡이 독소 및 식물 독소), 그리고 중금속 (수은 및 카드뮴) 등이 있으며 이는 크로마토그래피 및 나노 기술 등을 이용하여 검출 할 수 있다. 하지만, 여러 실험에도 불구하고 화학적 위험 요소는 그 구조가 다양하기 때문에 위험 요소를 검출하는 하나의 표준 방법을 수립하기 힘들다. 신선한 과일과 채소는 영양분과 수분이 풍부하기 때문에 박테리아성 병원균 (Salmonella, E. coli O157: H7, Shigella, Listeria monocytogenes, Bacillus cereus), 바이러스 또는 기생충에 의해 쉽게 오염이 되며, 이를 검출하기 위해 주로 다양한 분자 생물학적 기술이 사용되고 있다. 마지막으로 물리적 위험요소인 유리, 금속, 자갈 등과 같은 매개체는 가공 공정 중에 식품에 유입되어 소비자에게 신체적 상해를 줄 수 있다. 이러한 위험요소를 줄이기 위해서 X-선 검사와 같은 투시 시스템을 이용하여 위해물질을 탐지하거나, 생산에 관여하는 직원 교육을 통해 2차 감염을 줄일수 가 있다.

출산율은 삶의 질과 비례하는가? OECD 국가의 삶의 질 요인과 출산율의 관계에 관한 추이분석 (Is Fertility Rate Proportional to the Quality of Life? An Exploratory Analysis of the Relationship between Better Life Index (BLI) and Fertility Rate in OECD Countries)

  • 김경희;유승호;정희태;김혜영;박형준
    • 국제지역연구
    • /
    • 제22권1호
    • /
    • pp.215-235
    • /
    • 2018
  • 출산율 제고에 대한 정책적 고민은 OECD국가들의 공통된 관심사일 뿐 아니라 세계 최하위인 출산율을 기록하고 있는 한국의 최대 관심사이기도 하다. 많은 국가 예산을 투입해왔고 출산율 관련 여러 연구들이 진행되어 왔음에도 불구하고 한국의 출산율은 계속 감소 추세이다. 따라서 본 연구는 기존 출산율 연구에서 다루어져 왔던 출산율에 영향을 주는 세부적 요인들의 영향력 및 효과성 검증과 유럽 선진국가들의 사례를 통한 정책적 접근의 문제점을 인지하고 출산율과 삶의 질에 관한 거시적이고 구조적 접근을 통해 전체적 흐름을 다시 파악하고자 함에 그 목적이 있다. 즉 선진국의 높은 삶의 질은 출산율을 높이는지, 삶의 질과 출산율이 모두 높은 국가 모델은 어느 나라이며 그 나라의 출산에 대한 사회 및 정책적 흐름은 어떠한지를 살펴보았다. OECD국가들의 삶의 질 요인(BLI)와 CIA출산율 자료를 이용하여 분석한 결과, 삶의 질 수준이 높은 국가 중에도 출산율이 낮은 국가가 많다는 사실을 확인할 수 있었다. 그러나 삶의 질 수준과 출산율이 모두 높은 국가가 한국이 지향해야 할 국가 모델임을 인지하고 본 연구에서 새로 도출된 아이슬란드, 아일랜드, 뉴질랜드의 사례와 삶의 질 수준은 높지만 출산율이 낮은 독일의 사회적 특성을 비교해 본 결과 앞의 세 나라는 양성평등에 대한 인식 수준이 높게 나타났고 그 결과로 성별에 따른 임금 차이는 낮게 나타났음을 확인하였다. 반면에 독일의 경우는 성별에 따른 임금 불평등이 비교적 더 크게, 출산율은 더 낮게 나타남으로써 양성평등을 위한 인식전환이 출산율에 주요한 영향을 미치고 있음을 확인했다. 부모- 자식 간의 '상승관계(synergy)' 에 기초하여 가정 및 노동시장에서 양성평등 의식을 고양하는 것이 정책의 최우선 순위가 되고, 여타의 삶의 질을 높이는 요소를 적극 활용하여야 한다는 결론을 도출하였다. 즉 출산율 정책의 우선순위와 인프라적 지원을 동시에 추진하기 위해 국가의 출산율 목표를 '임신 가용한 여성의 출산율 제고'에서 '국민이 행복한 사회를 만드는 것' 으로 재설정하여 행복한 사회가 되어가는 과정에서 스스로 출산을 결정할 수 있는 시스템을 만들어야 할 것이다.

가뭄 극복을 위한 댐의 비활용용량 활용 방안 연구 (On Utilization of Inactive Storage in Dam during Drought Period)

  • 주홍준;김덕환;김정욱;배영혜;김형수
    • 한국습지학회지
    • /
    • 제20권4호
    • /
    • pp.353-362
    • /
    • 2018
  • 본 연구에서는 가뭄 극복을 위하여 댐의 비활용용량 구간에 있는 저수량의 활용을 제고할 수 있는 구조적인 방안을 마련하고자 한다. 댐에서의 비활용용량(inactive storage)은 비상용량(emergency storage)과 사수용량(dead storage)으로 구성되어 있으며, 비상용량은 가뭄과 같은 비상시에 활용가능 하도록 하고 있지만 사수용량은 퇴사가 진행되는 구간으로 가정하여 일반적으로 정상적인 이용이 불가능한 용량으로 정해져 있다. 그러나 본 연구에서는 극심한 가뭄시에 비상용량과 더불어 사수용량 일부를 활용할 수 있는 방안을 모색하였으며, 비상용량과 퇴사위(Sediment Level, SL) 위의 사수용량을 추가적으로 활용할 수 있다고 가정하였고, 이 구간을 '댐의 갈수용량'이라고 새롭게 명명하였다. 갈수용량의 산정을 위해서는 정확한 퇴사위 분석이 선행되어야하므로, 본 연구에서는 SMS의 RMA-2 및 SED-2D 모형을 이용하여 현재와 미래의 댐 저수지의 퇴사위를 산정하였으며, 추가 이용 가능한 용량을 고려한 뒤 최종적으로 갈수용량을 산정하였다. RMA-2 및 SED-2D 모형 구축을 위해 현재는 과거 관측 자료를 이용하였으며, 미래는 대표농도경로(Representative Concentration Pathways, RCP) 8.5 시나리오에 의해 미래 기후 인자를 예측하고 TANK 모형을 이용하여 댐 유입량을 결정한 뒤 미래 기간별 퇴사위를 예측하였다. 현재와 미래의 퇴사위를 바탕으로 갈수용량을 제시한 결과, 활용할 수 있는 갈수용량은 현재에 비해 감소되었으며 특히, 미래 기간이 진행될수록 활용할 수 있는 양이 점진적으로 감소하는 결과를 보였다. 이는, 기후 변화의 변동성이 증가하는 것에 기인하며, 미래에 활용할 수 있는 갈수용량의 증대를 위해 기후 적응 대책 및 퇴사량을 효율적으로 저감할 수 있는 연구가 추가로 필요할 것으로 판단된다.

적대적 생성 모델을 활용한 사용자 행위 이상 탐지 방법 (Anomaly Detection for User Action with Generative Adversarial Networks)

  • 최남웅;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.43-62
    • /
    • 2019
  • 한때, 이상 탐지 분야는 특정 데이터로부터 도출한 기초 통계량을 기반으로 이상 유무를 판단하는 방법이 지배적이었다. 이와 같은 방법론이 가능했던 이유는 과거엔 데이터의 차원이 단순하여 고전적 통계 방법이 효과적으로 작용할 수 있었기 때문이다. 하지만 빅데이터 시대에 접어들며 데이터의 속성이 복잡하게 변화함에 따라 더는 기존의 방식으로 산업 전반에 발생하는 데이터를 정확하게 분석, 예측하기 어렵게 되었다. 따라서 기계 학습 방법을 접목한 SVM, Decision Tree와 같은 모형을 활용하게 되었다. 하지만 지도 학습 기반의 모형은 훈련 데이터의 이상과 정상의 클래스 수가 비슷할 때만 테스트 과정에서 정확한 예측을 할 수 있다는 특수성이 있고 산업에서 생성되는 데이터는 대부분 정답 클래스가 불균형하기에 지도 학습 모형을 적용할 경우, 항상 예측되는 결과의 타당성이 부족하다는 문제점이 있다. 이러한 단점을 극복하고자 현재는 클래스 분포에 영향을 받지 않는 비지도 학습 기반의 모델을 바탕으로 이상 탐지 모형을 구성하여 실제 산업에 적용하기 위해 시행착오를 거치고 있다. 본 연구는 이러한 추세에 발맞춰 적대적 생성 신경망을 활용하여 이상 탐지하는 방법을 제안하고자 한다. 시퀀스 데이터를 학습시키기 위해 적대적 생성 신경망의 구조를 LSTM으로 구성하고 생성자의 LSTM은 2개의 층으로 각각 32차원과 64차원의 은닉유닛으로 구성, 판별자의 LSTM은 64차원의 은닉유닛으로 구성된 1개의 층을 사용하였다. 기존 시퀀스 데이터의 이상 탐지 논문에서는 이상 점수를 도출하는 과정에서 판별자가 실제데이터일 확률의 엔트로피 값을 사용하지만 본 논문에서는 자질 매칭 기법을 활용한 함수로 변경하여 이상 점수를 도출하였다. 또한, 잠재 변수를 최적화하는 과정을 LSTM으로 구성하여 모델 성능을 향상시킬 수 있었다. 변형된 형태의 적대적 생성 모델은 오토인코더의 비해 모든 실험의 경우에서 정밀도가 우세하였고 정확도 측면에서는 대략 7% 정도 높음을 확인할 수 있었다.

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.