DOI QR코드

DOI QR Code

Multiple Sclerosis Lesion Detection using 3D Autoencoder in Brain Magnetic Resonance Images

3D 오토인코더 기반의 뇌 자기공명영상에서 다발성 경화증 병변 검출

  • Choi, Wonjune (Dept. of Computer Science and Engineering, Pusan National University) ;
  • Park, Seongsu (Major of AI., Dept. of Information Convergence Engineering, Pusan National University) ;
  • Kim, Yunsoo (Major of AI., Dept. of Information Convergence Engineering, Pusan National University) ;
  • Gahm, Jin Kyu (Dept. of Computer Science and Engineering, Pusan National University, Major of AI., Dept. of Information Convergence Engineering, Pusan National University)
  • Received : 2021.07.12
  • Accepted : 2021.07.14
  • Published : 2021.08.30

Abstract

Multiple Sclerosis (MS) can be early diagnosed by detecting lesions in brain magnetic resonance images (MRI). Unsupervised anomaly detection methods based on autoencoder have been recently proposed for automated detection of MS lesions. However, these autoencoder-based methods were developed only for 2D images (e.g. 2D cross-sectional slices) of MRI, so do not utilize the full 3D information of MRI. In this paper, therefore, we propose a novel 3D autoencoder-based framework for detection of the lesion volume of MS in MRI. We first define a 3D convolutional neural network (CNN) for full MRI volumes, and build each encoder and decoder layer of the 3D autoencoder based on 3D CNN. We also add a skip connection between the encoder and decoder layer for effective data reconstruction. In the experimental results, we compare the 3D autoencoder-based method with the 2D autoencoder models using the training datasets of 80 healthy subjects from the Human Connectome Project (HCP) and the testing datasets of 25 MS patients from the Longitudinal multiple sclerosis lesion segmentation challenge, and show that the proposed method achieves superior performance in prediction of MS lesion by up to 15%.

Keywords

1. 서론

다발성 경화증(MS, Multiple Sclerosis)은 신경세포의 축삭을 둘러싸고 있는 절연물질인 수초가 벗겨져 탈락할 경우 신경 신호의 전도에 이상이 생겨 해당 신경세포가 죽는 만성 염증성 질환의 가장 흔한 유형이다[1]. 해당 질환은 중추신경계의 여러 곳에 산재하여 나타나는 특성이 있으며, 재발과 완화를 반복한다[2]. 뇌는 이 질환이 발생할 시 병적인 변화가 가장 잘 생기는 곳이지만, 초기에는 이로 인해 나타나는 증상이 뚜렷하지 않다. 따라서 MS 질병의 진단은 환자의 병력, 신경학적 진찰을 바탕으로 결정하며, 추가로 뇌 자기공명영상(MRI, Magnetic Resonance Imaging), 뇌척수액검사, 유발전위검사 및 감별진단을 위한 혈액검사 등이 필요하다. 이 중 뇌 MRI 검사에서 병적인 변화가 가장 잘 관찰되기 때문에 이를 이용하면 조기에 MS를 진단 할 수 있다[3].

MS 병변(lesion)을 예측하는 방법으로는 지도학습 이상치 검출(Supervised Anomaly Detection), 비지도 학습 이상치 검출(Unsupervised Anomaly De- tection) 방법이 있다[4, 5, 6]. 지도학습 이상치 검출 방법은 모델을 학습할 때 병변 지역이 레이블링 된 MS 환자의 데이터로 학습한다. 이때 학습하기 위해 많은 MS 환자의 데이터가 필요하고, 모든 MS 환자 데이터의 병변 지역을 직접 레이블링해야 하기 때문에 많은 인력과 비용이 발생한다는 단점이 있다. 또 데이터를 확보하였다고 하더라도 MS 질환은 환자에 따라 병의 발병 위치, 크기, 모양, 분포가 다양하게 나타나기 때문에 지도학습 이상치 검출 방법으로는 새로운 패턴의 병변 지역을 잘 검출하기 어렵다. 반면에, 비지도학습 이상치 검출(Unsupervised Anomaly Detection) 방법은 건강한 사람의 뇌 데이터로 모델 학습을 진행하기 때문에 학습데이터에 레이블을 취득할 필요가 없고, 학습되지 않은 패턴의 병변도 잘 예측할 수 있다는 장점이 있다. 따라서 최근 비지도 학습 이상치 검출 방법 기반인 2D 오토인코더 (AE, Autoencoder)를 이용하여 MS 환자의 병변을 예측하는 연구가 활발하게 이루어지고 있다[7]. 3차원 데이터인 MRI 데이터를 2D 오토인코더에 적용하기 위해서는 횡단면(axial), 시상면(sagittal), 관상면 (coronal)​ 중 하나의 축으로 2D 슬라이스를 추출하여각 슬라이스를 개별적 입력으로 사용하게 된다. 하지만 MS 병변 영역은 일반적으로 랜덤한 3차원 비등방성(anisotropic) 모양을 가지고 있기 때문에, 이를 특정 축에 고정한 2D 오토인코더에 적용했을 때 일관되고 안정적인 병변 검출 성능을 기대할 수는 없다.

따라서 본 논문에서는 MRI 데이터의 3차원 정보를 한 번에 모두 활용할 수 있는 3D 오토인코더 기반의 비지도학습 MS 병변 검출 모델을 제안한다. 제안하는 모델은 어느 방향에서 보더라도 MS 병변의 분포 및 크기 정보를 추출할 수 있고, MRI 데이터를 2D 이미지로 가공하지 않고 바로 모든 방향에 대해 학습할 수 있다[8]. 먼저 MRI 볼륨 데이터를 한 번에 처리할 수 있는 3D CNN을 정의하고, 이 3D CNN을 바탕으로 3D 오토인코더의 인코더, 디코더 각각을 설계하였다. 또한 2차원에서 3차원으로 확장되었을 때 발생할 수 있는 차원의 저주(Curse of Dimen- sionality) 문제를 해결하고, 세부적인 데이터 복원을향상시키기 위해 3D 오토인코더의 인코더, 디코더단 사이에 skip connection을 추가하였다. 3D 오토인코더 모델의 학습 단계에서는 대량의 정상인의 MRI 볼륨을 입력으로 모델에서 복원된 데이터와 입력 데이터와 차이를 최소화하도록 학습한다. 테스트 단계에서는, 앞서 학습된 3D 오토인코더 모델에 MS 환자의 MRI 볼륨을 입력, MS 데이터를 정상처럼 되게 복원하고, 복원 데이터와 MS 데이터의 차이로 병변 영역을 검출한다. 제시한 모델의 성능을 평가하기 위해 기존의 2D 오토인코더로 예측한 병변과 본 논문에서 제시한 3D 오토인코더로 예측한 MS환자의 병변 영역을 시각적, 정량적으로 비교한다.

이후 본 논문의 구성은 다음과 같다. 2장에서 본 논문에서 제안하는 3D 오토인코더 기반의 MRI 병변검출 방법을 설명하고, 3장에서는 실험에 사용된 데이터 및 실험 과정, 평가 방법에 관하여 설명한다. 4장에서는 이러한 실험의 결과를 보여주고 5장에서 결론을 맺는다.

2. 방법

본 장에서는 MRI 볼륨 입력을 위한 3차원 합성곱 (3D CNN, 3D convolutional neural network)을 먼저 정의하고, 이를 이용한 3D 오토인코더 및 skip con- nection을 설명한다. 마지막으로 이를 이용한 MS 병변 검출 동작 원리에 관해 설명한다.

2.1 3차원 합성곱(3D CNN)

3차원 합성곱은 입력으로 받은 3차원 MRI 영상에서 3차원 축에 stride만큼 평행이동하며, 필터 크기의 local neighborhood 값과 필터의 요솟값을 합성곱 하여 입력 데이터의 특징을 추출한다. 여기서 추출된 모든 local neighborhood의 특징은 입력 데이터의 특징을 나타내며 데이터의 크기는 축소된다. 수식적으로는 입력 볼륨 \(X^{(l-1)} \in R^{H \times W \times D}\)(H, W, D: 가로, 세로, 깊이)의 복셀 위치를 \((x, y, z)\)라 하면, 출력 이미지 \(X^{(l)}\) f번째 필터에 대한 (p, q, r)의 요소는 식(1)과 같이 계산된다.

\(X_{f, p, q, r}^{(l)}=\sum_{i=0}^{F_{B}} \sum_{j=0}^{F_{W}} \sum_{k=0}^{F_{D}} F_{f}^{(l)}(i, j, k) X_{(x+i),(y+j),(z+k)}^{(l-1)}\)       (1)

여기서 \(F_{f}^{(l)} \in R^{H \times W \times D}\)는 번째 합성곱 층의 \(l\)번여기서 f번째 필터이다. 출력된 이미지 \(X^{(l)}\)을 다음 \(l\) + 1번째 합성 곱 층의 입력 이미지로 넣어 출력 이미지의 크기를 줄이고 원본 이미지를 가장 잘 나타내는 특징을 추출할 수 있다.

2.2 3D MRI 오토인코더

오토인코더는 비지도 학습 모델 중 하나로, 입력데이터를 임의의 차원으로 축소하고 다시 입력 크기로 복원한 뒤 입력 데이터와의 차이를 최소화하는 방향으로 모델의 가중치를 갱신하며 학습한다. Fig. 1의 그림과 같이 3D 오토인코더는 3D MRI 데이터 특징을 추출하기 위한 인코더 부분, 가장 대표적인 특징 정보를 저장할 수 있는 Z(latent space), 그리고 latent space를 기반으로 데이터를 복원하는 디코더로 구성되어있다. 3D 데이터 특징을 추출하기 위해 인코더 영역의 각 레이어는 3D Convolution, Batch Normalization, LeakyReLU가 순차적으로 연결되어있다. 반대로, 디코더 영역은 인코더에서 얻은 특징을 기반으로 하여 원본 데이터 크기로 복원하기 위해 3D Convolution 층 대신 3D Convolution의 역함수인 3D Convolution Transpose로 구성되어 있다.

MTMDCW_2021_v24n8_979_f0001.png 이미지

Fig. 1. Proposed 3D autoencoder architecture for lesion detection in MRI volumes. The encoder extracts the features from the original MRI volumes, and the decoder generates the reconstructed volumes. The skip connection links the encoder and decoder layer.

2.3 Skip Connection

오토인코더는 층을 거칠 때마다 비선형 활성화 함수를 거치게 된다. 이 때문에 층이 깊어질수록 기울기 소실 문제가 발생하여 오류역전파(backpropaga- tion) 과정에서 입력층까지 제대로 전달하지 못하여, 가중치 갱신이 제대로 일어나지 않아 결국 최적의 모델을 찾을 수 없다. MS 병변 검출에서는 기존의 순차적인 3D 오토인코더 모델로 학습을 진행하는 경우, 층이 너무 깊어서 층의 차원이 원본 데이터 정보를 충분히 저장하기 힘든 정도로 저차원이며, 복원 결과가 원본 데이터보다 많이 흐리거나 원본 데이터의 세부적인 형태를 잘 복원하지 못하는 경향이 있다. 이러한 점을 보완하기 위해서 오류역전파로 가중치를 갱신할 때 추가적인 선형변환 과정을 거칠 수 있지만, 이에 따른 손실비용이 복잡해지게 되므로 과적합 문제가 발생할 우려가 있다. 따라서 Fig. 2의 인코더와 디코더를 연결하는 skip connection을 추가하여 같은 크기의 인코더 층과 디코더 층을 연결하였다[9, 10, 11]. 단순히 활성값에 이전 층의 값을 더하면서 차원이 낮은 층에서는 기존의 학습 정보는 보존하고, 여기에 추가로 필요한 정보만 학습한다. 이렇게 하면 기울기 소실 문제를 해결하고, 각각의 층이 학습해야 하는 정보량을 줄여서 원본 데이터의 세부적인 정보까지 복원할 수 있다.

MTMDCW_2021_v24n8_979_f0002.png 이미지

Fig. 2. Concepts of unsupervised lesion detection based on the 3D autoencoder. A) Training: We learn the model from healthy people's brain MRI, B) Testing: We reconstruct the patient's healthy brain to healthy brain with trained model, and extract lesions by the difference between the original input and reconstructed volume.

2.4 병변 검출

먼저 3D 오토인코더 모델에 정상인의 뇌 MRI 데이터를 입력하고 Mean Squared Error(MSE) 손실함수를 이용하여 입력과 출력 데이터 사이의 차이가 최소한의 차이로 복원될 수 있도록 학습한다. 이렇게 정상인의 MRI 데이터로 학습된 모델에 MS 환자의 3D MRI 데이터를 입력으로 넣으면, Fig. 2와 같이 데이터에서 특징을 추출하여 해당 환자의 건강한 3D 뇌 MRI로 복원한다. 이후 복원한 데이터와 입력으로 넣은 MS 환자 데이터 사이의 차이를 계산한다. 이렇게 계산된 차이에서 필터링을 거치고 임계값 이 상의값들만 계산하면 환자의 뇌에서 병변이 있는 부분을 추출할 수 있게 된다. 이러한 후처리 과정은 실험 과정(3.5절)에서 더 자세히 설명하도록 하겠다.

3. 실험

3.1 데이터셋

3.1.1 학습 데이터셋

3D 오토인코더 모델 학습을 위해 80명의 정상인의 뇌 MRI 데이터 T1-weighted (T1w), T2-weighted (T2w) 볼륨을 Human Connectome Project (HCP) 공개데이터베이스에서 획득하였다[12]. HCP 에서 제공하는 Structural Pipelines 중 PreFreeSurfer Pipeline을 통과해 나온 결과 중 두개골이 제거된 T2w MRI 볼륨을 모델의 입력으로 사용하였다. HCP Pipelines에 대해서는 이어지는 3.2절에서 자세하게 설명하도록 하겠다.

3.1.2 테스트 데이터셋

Longitudinal multiple sclerosis lesion segmentation: Resource and challenge에서 제공하는 총 25명 MS 환자의 MRI를 사용했다[13]. 이 데이터셋은 T1w, T2w MRI와 ground-truth MS 병변 영역을 나타내는 마스크로 구성되어 있다. 데이터 모두 HCP 학습 데이터와 이미지 크기, 해상도, 위치 및 방향이 다르고 두개골이 제거되어있지 않기 때문에, HCP Structural Pipelines를 거쳐서 학습 데이터와 동일하게 맞추었다. PreFreeSurfer 처리가 끝난 데이터들에 대해 FreeSurfer의 복원과정을 추가로 진행하게 되면 brain segmentation 정보를 추출할 수 있다. 이렇게 얻은 brain segmentation 마스크도 최근접 이웃 (Nearest-Neighbors) 기법을 사용하여 학습 데이터와 동일한 크기인 128×128×128로 변환하였다.

3.2 전처리

3.2.1 HCP Pipelines

테스트 데이터셋을 학습 데이터셋과 동일하게 맞추기 위해서 HCP Structural Pipelines의 PreFree Surfer Pipelines를 적용한다. 먼저 MS 환자의 T1w 와 T2w DICOM 데이터를 NIfTI 포맷으로 변환한다. 이어서 기본 볼륨 공간인 native space를 생성하고 rigid transformation을 사용한 FSL의 FLIRT를 반복해서 T1w, T2w를 native space에 정렬한다[14,15]. 이후 FSL로 0.7 mm 해상도로 변환하고, Free Surfer의 복원과정을 통해 마스크를 생성한다. 이를 FSL의 BET에 적용하여 두개골이 제거된 T1w, T2w 를 획득하였다[16].

3.2.2 Data adjustment

HCP Pipelines를 거친 260×311×260 크기의 학습, 테스트 MRI 각각의 볼륨에 대해 전체 데이터 분포의 하위 2% 이하의 값은 하위 2% 값으로 보정하고 상위 2% 이상의 값도 상위 2% 값으로 보정하였다. 그리고 픽셀의 값들이 -1.0에서 1.0 사이의 값들을 갖도록 정규화를 진행하고 3차원 선형보간 방법을 사용하여 각 볼륨을 128×128×128 크기의 데이터로 변환하였다.

3.3 모델 최적화

각 층의 Convolution과 Convolution Transpose에서는 stride는 2, kernel 크기는 5로 사용하였다. 인코더는 128×128×128 크기의 입력 데이터가 층의 크기인 8×8×8×256가 될 때까지 이전 층의 데이터 크기를 절반씩 축소하였다. 인코더의 필터 개수는 1, 32, 64, 128로 4개의 레이어로 구성하였고, 디코더는 인코더와 대칭적으로 구성하였다. 층을 더 작은 크기로 사용할 경우 데이터의 노이즈가 심하여 복원이 잘 안되며, 큰 크기로 사용할 경우에는 원본 데이터와 복원데이터가 거의 유사하여 병변을 추출하기 어렵다 [17].

이처럼 구성된 모델은 층마다 3D 데이터를 사용하기 때문에 많은 메모리가 필요하다. 따라서 학습할 때 최대한 많은 데이터 학습을 위해 배치사이즈를 32로 설정하였다. 학습률은 0.0001로 1000 epoch 동안 정상인의 뇌 데이터로 복원 데이터와 원본 데이터 차이의 손실 값이 0으로 수렴하도록 학습하였다. 학습이 10 epoch 동안 손실비용이 감소하지 않으면 자동으로 학습이 조기 종료되도록 Early Stopping을 사용했다.

3.4 실험 환경 및 구현

HCP Pipelines로 전처리가 된 MRI NIfTI 파일을 3차원 선형보간법 알고리즘을 적용하여 128×128× 128 크기의 데이터로 변환하기 위하여, 파이썬 프레임워크에서 OpenCV 패키지를 사용했다. 모델의 학습은 Nvidia Tesla A100 40GB HBM2 with ECC GPU 2대를 사용하여 Tensorflow mirrored strategy 방법을 적용하여 분산 학습하였다. 나머지 과정은 Intel Xeon W-2265 3.50GHz CPU를 사용하여 진행했다. 위 GPU를 사용한 총 학습 시간은 평균 약 7시간이었다.

3.5 후처리

테스트셋 T2w 볼륨을 3D 오토인코더 모델에 넣어 건강한 뇌 T2w MRI 데이터를 복원한다. 이후 예측한 볼륨 데이터를 3×3×3 kernel의 중간값 필터 (median filter)를 적용하여 노이즈를 제거한다. 노이즈가 제거된 예측 데이터와 원본 데이터의 \(\ell_{1}\)-distance를 사용하여 그 차이를 계산한다. 계산 후대 뇌피질 영역에서 발생하는 노이즈를 제거하기 위해 침식(erosion) 연산이 반복 적용된 brain mask 데이터를 곱한다. 이후 3.1.2에서 얻은 brain segmentation 정보를 이용하여 MS가 주로 발병하는 basal ganglia, brain stem 부분 이외의 지역은 제거한 뒤 3×3×3 kernel의 중간값 필터를 적용하였다[1]. 마지막으로 모든 복셀 V 값에 대하여 식(2)의 수식을 적용하여 뚜렷한 MS 지역만 추출하였다.

\(V=\min \left(0, V-V_{\max } \times 0.5\right)\)       (2)

3.6 평가방법

본 논문에서 제안하는 3D 오토인코더 기반 병변검출 모델을 기존 2D 오토인코더와 비교, 평가하였다[7]. 2D 오토인코더 모델의 인코더는 MRI 특정 축으로 추출된 2D 슬라이스의 128×128 사이즈 입력을 8×8 까지 절반 사이즈로 축소하였다. Z층은 1차원 vector로 구성된 dense 모델과 2차원으로 구성된 spatial 모델 두 가지 방법을 사용하였다.

병변 검출의 성능을 정량적으로 평가하기 위해 ground-truth 영역과 병변 검출 영역 사이의 confusion matrix를 구하고 여러 지표를 계산하였다. 먼저 confusion matrix로부터 true positives(TP), false positives(FP), false negatives(FN)를 계산하여 \(\frac{2 T P}{2 T P+F P+F N}\)으로 정의된 DSC(Dice Similarity Coefficient) 지표를 이용해 [0,1] 사이의 값을 측정하였다. DSC의 값은 1에 가까울수록 성능이 좋다. 또한, 병변 영역은 정상 영역보다 빈도가 낮기 때문에 이를 위해 PRC(Precision-Recall-Curves)를 생성한 다음 그 아래의 영역(AUPRC)을 계산하였다. 그리고 ROC(Receiver-Operating-Characteristics) 곡선 아래 영역(AUROC)을 사용하여 병변 검출 성능을 평가하였다.

4. 실험 결과

Fig. 3은 3D 오토인코더를 이용하여 MS 환자의 병변 영역을 예측한 뒤 ground-truth 데이터와 비교한 것이다. 정상인 T2w MRI 볼륨으로 학습된 모델에 한 MS 환자의 T2w MRI(Fig. 3a)를 입력으로 넣어 복원 데이터(Fig. 3b)를 생성하였다. 이 둘의 차이를 계산하고 후처리 과정을 거쳐 나온 병변 데이터 (Fig. 3d, 녹색 영역)가 ground-truth 데이터(Fig. 3c) 와 유사한 병변 구조인 것을 관찰할 수 있다. Fig. 3에서 보여주고 있는 두 단면은 횡단면(axial)과 관상 면(coronal)으로 병변 지역이 잘 관찰되는 뷰이다.

MTMDCW_2021_v24n8_979_f0003.png 이미지

Fig. 3. Demonstration of the proposed 3D autoencoder-based method of lesion detection. (a) Axial and coronal views of the test T2w MRI, (b) Reconstruction of the test data by the 3D autoencoder, (c) Ground-truth lesion mask (green) overlaid on T2w, and (d) Predicted lesion (green) by the difference between the original (a) and reconstruction data (b).

Fig. 4에서는 한 MS 테스트셋에 대한 ground-truth 병변 지역(Fig. 4a), 2D 오토인코더의 dense (Fig. 4b), spatial 모델(Fig. 4c)과 3D 오토인코더 모델(Fig. 4d)의 병변 추출 결과를 보여주고 있다. 2D 오토인코더의 dense 모델은 2D 슬라이스 데이터를 1차원 vector로 구성하였고, spatial 모델은 2차원으로 구성하였다. 하지만 두 가지 2D 모델 모두 대략적인 병변 위치만 보여줄 뿐, 정확하고 디테일한 병변검출에 실패하였다. 하지만 3D 오토인코더 기반 모델에 대해서는 2D 모델 결과와 비교하여 훨씬 더 정확한 위치와 세부적으로 비슷한 형태를 가지는 병변 결과를 보여주고 있다.

MTMDCW_2021_v24n8_979_f0004.png 이미지

Fig. 4. A comparison of lesion detection results based on 2D and 3D autoencoder (AE). (a) Ground-truth data in test data, and MS lesion detected by (b) 2D AE (Dense), (c) 2D AE (Spatial), and (d) proposed 3D AE.

Fig. 5(a)에서는 두 개의 다른 축으로 추출된 2D 슬라이스 데이터를 사용한 2D 오토인코더(spatial) 모델에 대한 병변 검출 결과를 보여주고 있다. 관상 면 축의 2D 모델로 발견된 병변 지역이 횡단면 축의 2D 모델에서는 잘 검출이 되지 않는 것을 볼 수 있다. 하지만 3D 오토인코더의 경우에는 Fig. 5 (b)에서 볼 수 있듯이 특정 축과 관계없이 동일 지역에 있는 병변이 잘 예측되는 것을 확인 할 수 있다. 이처럼 2D 오토인코더에서는 이러한 비등방성 형태를 가지는 병변에 대해서 특정 축에서만 병변이 잘 나타나게 되고, 이러한 특정 축을 예측해야 하는 어려움이 있다. 반면에 3D 오토인코더의 경우에는 한 번에 전체볼륨을 사용하기 때문에 특정 축에 전혀 상관없이 일관적이고 안정적인 결과를 확인할 수 있었다.

MTMDCW_2021_v24n8_979_f0005.png 이미지

Fig. 5. A comparison of lesion detection results between 2D autoencoder with different axis and 3D autoencoder (AE). (a) MS lesion detected by 2D AE (Spatial) model along the axial axis (left), and coronal axis (right). (b) MS lesion detected by 3D AE in the axial (left), and coronal (right) views.

Table 1은 MS 테스트셋 25개에 대한 2D 오토인코더(dense, spatial) 모델과 3D 오토인코더 모델의 AUROC, AUPRC, DSC 정량적 지표 통계를 보여주고 있다. 2D 오토인코더의 경우에는 관상면 축을 기준으로 추출한 전체 2D 슬라이스를 사용하였고, 3D 오토인코더의 경우에는 전체 MRI 불륨을 사용하였다. AUROC는 본 논문에서 제안하는 3D 오토인코더방법이 기존의 2D 오토인코더(dense) 방법보다 평균 2.4% 증가, AUPRC는 11.8% 증가, DSC는 12.7% 증가하였다. 2D 오토인코더(spatial) 방법보다는 AUROC 는 9% 증가, AUPRC는 25.9% 증가, DSC는 28.7% 증가함을 확인하였다. 2D 모델의 경우에는 과적합 문제가 발생하여 dense 방법이 spatial 방법보다 좋은 성능을 보여주고 있다[7]. 마지막으로 skip con- nection을 적용하지 않은 3D 오토인코더 기본 모델에서는 z층의 크기가 8x8x8로 데이터 손실이 크기 때문에 세부적인 영역을 제대로 복원하지 못하여 false positive가 증가하나, skip connection을 추가함으로서 검출 성능이 현저히 향상되는 것을 확인할 수 있었다.

Table 1. Quantitative comparison of lesion detection between 2D, 3D autoencoder-based methods using 25 MS data-sets (mean±std).

MTMDCW_2021_v24n8_979_t0001.png 이미지

5. 결론

본 논문에서는 MS 환자의 뇌 MRI 볼륨 데이터에서 건강한 뇌 MRI 볼륨 데이터로 복원할 수 있는 3D 기반의 오토인코더 모델 구조와, 이를 이용한 MS 병변 지역 검출 알고리즘을 제시하였다. 3차원 공간정보를 한 번에 사용하여 학습하므로, 기존의 2차원 학습 방법에서 발생하는 특정 축의 병변 예측의 어려움을 보완할 수 있었다. 그리고 3D 오토인코더 모델에 skip connection을 추가함으로써 복원 데이터의 전체적인 구조와 세부적인 정보는 유지하면서 병변 영역만 추출할 수 있었다. 공개 MS 환자의 MRI 데이터를 이용한 검증에서 본 3D 오토인코더 기반 제안 방법이 기존 2D 기반 방법보다 최대 15% 정도의 병변 검출 성능 향상을 보여주었다.

본 제안 기술은 MS뿐만 아니라 MRI로 검출될 수 있는 다양한 질환 및 희소병에 적용하여 뇌에 어떤 특이사항이 있는지 발견할 수 있다. 특히 단일 병변이 아닌 여러 병변이 함께 발생한 복합 병변의 경우에 대해서도 단일 병변만 학습된 모델에서는 검출하기 힘든 병변 영역을 보다 정확하게 추출할 수 있다. 향후에는 제안한 방법으로 검출된 이상 영역들에 대해 어떠한 병변인지 분류할 수 있는 학습 모델을 개발하고자 한다.

References

  1. R. Hussian, H. Zubair, S. Pursell, and M. Shahab, "Neurodegenerative Diseases: Regenerative Mechnisms and Novel Therapeutic Approaches," Brain Science, Vol. 8, No. 9, p. 177, 2018. https://doi.org/10.3390/brainsci8090177
  2. S. Faissner and R. Gold, "Oral Therapies for Multiple Sclerosis," Cold Spring Harbor Perspectives in Medicine, Vol. 9, No. 1, p. a032011, 2019. https://doi.org/10.1101/cshperspect.a032011
  3. M. Stangel, T. Kuhlmann, P.M. Matthews, and T.J. Kilpatrick, "Achievements and Obstacles of Remyelinating Therapies in Multiple Sclerosis," Nature Reviews Neurology, Vol. 13, No. 12, pp. 742-754, 2017. https://doi.org/10.1038/nrneurol.2017.139
  4. M.S. To, I.G. Sarno, C. Chong, M. Jenkinson, and G. Carneiro, "Self-supervised Lesion Change Detection and Localisation in Longitudinal Multiple Sclerosis Braim Imaging," arXiv preprint arXiv:2106.00919, 2021.
  5. B. Zong, Q. Song, M.R. Min, W. Cheng, C. Lumezanu, D. Cho, and H. Chen, "Deep Autoencoding Gaussian Mixture Model for Unsupervised Anomaly Detection," The International Conference on Learning Representations (ICLR), 2018.
  6. H.E. Atlason, A. Love, S. Sigurdsson, V. Gudnason, and L.M. Ellingsen, "SegAE: Unsupervised White Matter Lesion Segmentation from Brain MRIs using a CNN Autoencoder," NeuroImage: Clinical, Vol. 24, pp. 102085, 2019. https://doi.org/10.1016/j.nicl.2019.102085
  7. C. Baur, S. Denner, B. Wiestler, N. Navab, and S. Albarqouni, "Autoencoders for Unsupervised Anomaly Segmentation in Brain MR Images: A Comparative Study," Medical Image Analysis, 101952, 2021.
  8. S. Park, Y. Kim, and J.K. Gahm, "MRI Image Super Resolution through Filter Learning Based on Surrounding Gradient Information in 3D Space," Journal of Korea Multimedia Society, Vol. 24, No. 2, pp. 178-185, 2021. https://doi.org/10.9717/KMMS.2020.24.2.178
  9. T. Tong, G. Li, X. Liu, and Q. Gao, "Image Super-Resolution Using Dense Skip Connections," Proceeding of the IEEE international conference on computer vision, pp. 4799-4807, 2017.
  10. N.J. Kwak, H.J. Shin, J.S. Yang, and T.S. Song, "CNN Applied Modified Residual Block Structure," Journal of Korea Multimedia Society, Vol. 23, No. 7, pp. 803-811, 2020. https://doi.org/10.9717/KMMS.2020.23.7.803
  11. K. He, X. Zhang, S. Ren, and J. Sun. "Deep Residual Learning for Image Recognition," Proceeding of the IEEE conference on computer vision and pattern recognition, pp. 770-778, 2016.
  12. M.F. Glasser, S.N. Sotiropoulos, J.A. Wilson, T.S. Coalson, B. Fischl, J.L. Andersson et al., "The Minimal Preprocessing Pipelines for the Human Connectome Porject," NeuroImage, Vol. 80, pp. 105-124, 2013. https://doi.org/10.1016/j.neuroimage.2013.04.127
  13. A. Carass, S. Roy, A. Jog, J.L. Cuzzocreo, E. Magrath, A. Gherman et al., "Longitudinal Multiple Sclerosis Lesion Segmentation Data Resource," Data in Brief, Vol. 12, pp. 346-350, 2017. https://doi.org/10.1016/j.dib.2017.04.004
  14. M. Jenkinson, and S. Smith, "A Global Optimisation Method for Robust Affine Registration of Brain Images," Medical Image Analysis, Vol. 5, No. 2, pp. 143-156, 2001 https://doi.org/10.1016/S1361-8415(01)00036-6
  15. M. Jenkinson, C.F. Beckmann, T.E.J Beherens, M.W. Woolrich, and S.M. Smith, "FSL," NeuroImage, Vol. 62, No. 2, pp. 782-790, 2012. https://doi.org/10.1016/j.neuroimage.2011.09.015
  16. M. Jenkinson, P. Bannister, M. Brady, and S. Smith, "Improved Optimization for the Robust and Accurate Linear Registration and Motion Correction of Brain Images," NeuroImage, Vol. 17, No. 2, pp. 825-841, 2002. https://doi.org/10.1006/nimg.2002.1132
  17. H. Arai, Y. Chayama, H. Iyatomi, and K. Oishi, "Significant Dimension Reduction of 3D Brain MRI using 3D Convolutional Autoencoders," Proceeding of the 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC), pp. 5162-5165, 2018.