DOI QR코드

DOI QR Code

Image Compression by Linear and Nonlinear Transformation of Computed Tomography

전산화단층촬영의 선형과 비선형변환에 의한 영상압축

  • Park, Jae-Hong (Department Radiological Technology, Choonhae College of Health Science) ;
  • Yoo, Ju-Yeon (Ocean ICT & Advanced Materials Technology Research Division)
  • 박재홍 (춘해보건대학교 방사선과) ;
  • 유주연 (중소조선연구원 해양IT융복합소재연구본부)
  • Received : 2019.06.26
  • Accepted : 2019.08.31
  • Published : 2019.08.31

Abstract

In the linear transformation method, the original image is divided into a plurality of range blocks, and a partial transform system for finding an optimal domain block existing in the image for each range block is used to adjust the performance of the compression ratio and the picture quality, The nonlinear transformation method uses only the rotation transformation among eight shuffle transforms. Since the search is performed only in the limited domain block, the coding time is faster than the linear transformation method of searching the domain block for any block in the image, Since the optimal domain block for the range block can not be selected in the image, the performance may be lower than other methods. Therefore, the nonlinear transformation method improves the performance by increasing the approximation degree of the brightness coefficient conversion instead of selecting the optimal domain block, The smaller the size of the block, the higher the PSNR value, The higher the compression ratio is increased groups were quadtree block divided to encode the image at best.

전산화단층촬영에서 선형 및 비선형변환방법을 이용하여 탐색밀도에 따른 압축률과 최대신호대 잡음비를 구하여 의료영상 압축의 화질에 대하여 알고자 한다. 선형변환방법은 원 영상을 여러 개의 레인지블록으로 나눈 후 각각의 레인지블록에 대하여 영상내의 존재하는 최적의 도메인블록을 찾는 부분변환시스템을 사용하여 닮은 블록을 찾아서 압축율과 화질의 성능을 조정가능 하므로 비선형변환방법은 8개의 셔플변환 중에서 회전변환만을 이용하는데, 한정된 도메인블록에서만 탐색이 이루어지므로 영상내의 임의의 블록에 대하여 도메인블록을 탐색하는 선형변환방법보다는 부호화 시간이 빠르나 실제 영상에서 레인지블록에 대한 최적의 도메인블록을 선택할 수 없기 때문에 성능은 다른 방법에서 보다 떨어질 수 있어서 비선형변환방법은 최적의 도메인블록을 선택하는 대신 밝기계수 변환의 근사화 정도를 높여서 성능을 개선하고, 블록의 크기가 작을수록 최대신호대 잡음비(PSNR;peak signal to noise ratio)값은 높아지며 블록의 크기가 클수록 압축비가 높아지므로 최적으로 영상을 부호화하기 위해 퀴드트리 블록분할을 하였다.

Keywords

Ⅰ. INTRODUCTION

사회적 이슈인 4차 산업혁명시대에는 연결성이 핵심가치로 네트워크를 통한 정보의 교환이 개인 및 산업전반의 전 영역으로 확대되어 인공지능(AI), 로봇, 사물인터넷(IoT), 가상현실(VR)등 국가적 정책대안으로 진행되고 있다.

인간 삶의 질 향상을 목표로 인체의 생체신호, 조직, 기관, 기능 등에 대한 정보를 정량화하여 질병의 진단과 치료를 목적인 의료산업은 기술 융복합화와 기기의 소형화‧사용편의성 증대 기술적 요인과 경제성장에 따른 의료시장의 확대 및 표준특허 경쟁 가속화로 인하여 어려운 국면을 맞고 있지만,[1] X-ray진단기기는 X-선을 이용하여 인체 내의 해부학적 구조를 2차원 혹은 3차원으로 영상화하여 유용한 정보를 제공하는 비침습적 영상진단기기로 향 후 3D CT에 시간을 4번째 차원으로 추가하여 호흡이나 심장박동 등의 움직임에 따른 3차원 해부학적 영상의 시간적 변화를 획득하는 의료영상 기술을 완성하기 위해서는 의료영상의 고화질 관리를 위한 전송 및 저장과 처리에서 대량의 데이터를 효율적으로 운영하기 위해서 의료영상압축 기술이 요구되어 왔다.[1,12-16]

본 논문에서는 선형변환방법은 프렉탈 부호화방법으로 원 영상을 여러 개의 레인지블록으로 나눈 후 각각의 레인지블록에 대하여 영상내의 존재하는 최적의 도메인블록을 찾는 부분변환시스템(PTS; piecewise transformation system)을 사용하여 닮은 블록을 찾기 위한 탐색시 계산양이 많아서 부호화 시간이 많이 걸리며, 크기가 크고 복잡한 블록을 근사화 시키기는 어려움이 있어서, 원 영상을 일정 크기의 도메인 블록으로 분할하여 각 블록을 다시 레인지로 나누어 도메인블록에서 레인지 블록을 찾아 부호화하는 비선형변환방법을 사용하여 전산화단층촬영의 선형 및 비선형변환방법을 영상압축에 적용하여 화질의 압축을 알아보고자한다.[2-18

Ⅱ. MATERIALS AND METHODS

1. 선형변환 방법

선형변환방법(Fisher)은 원 영상을 여러 개의 레인지블록으로 나눈 후 각각의 레인지블록에 대하여 영상 내에 존재하는 최적의 도메인블록을 찾는 부분변환시스템(PTS; piecewise transformation system)을 사용하여 닮은 블록을 찾도록 하여 각 도메인은 8가지 다른 방법(회전, 반사)으로 할 수 있으나, 선형변환방법을 사용하는 것은 고정된 회전만 정의하므로 한 방향 또는 두 방향으로만 고려된다.[16-17]

도메인 블록의 화소 밝기가 이고, 레인지 블록의 화소 밝기 인 Eq. (1)을 최소로 하면 와 의 최적치를  계산할 수 있다.

변환된 가 와 최소거리가 되도록 대조도와 휘도를 정하며, 의 최소값은 와 에 대해 편미분하고 각각을 0으로 두면 구할 수 있으며, 역행렬 연산을 이용하여 반복변환에 의해 영상을 복원하면

여기서, 는 조건 에 의해 결정되고, 해상도가 인 영상에 적용하면 영상을 열벡터(column vector)로 표현할 수 있다.[16-17]

만약, 이면, 첫째항의 극한값은 0에 수렴한다. 가 역 변환 가능하면

여기서, 는 항등행렬이며 의 각 화소값은 단지 한 개와 다른 에 의해서 결정된다는 것을 나타낸다.[16-17]

2. 비선형변환 방법

비선형변환방법(Monro)은 하나의 도메인 블록을 다시 4개의 레인지블록으로 나누며, 8개의 셔플(shuffle)변환 중에서 회전(rotational)변환만을 이용하는데, 한정된 도메인블록에서만 탐색이 이루어지므로 영상 내 임의의 블록에 대하여 도메인블록을 탐색하는 선형변환방법보다는 부호화 시간이 빠르며, 레인지블록에 대한 최적의 도메인블록을 선택할 수 없기 때문에 성능이 떨어질 수 있어서, 비선형변환방법은 최적의 도메인블록을 선택하는 대신 밝기 계수 변환의 근사화 정도를 높여서 에 대한 고차항을 갖는 근사식을 사용하면 화소값의 분포를 변화시킬 수 있게 되어, 도메인블록과 레인지블록이 서로 닮음 관계가 있지 않더라도 블록의 근사화가 가능하게 된다.[16]

일반적인 아핀(affine)변환을 영상 에 대해 적용하면 다음과 같이 표현된다.[2-12]

함수 f 에서 그 자신 위로 변환되는 축소 가능한 함수

가 존재한다면, 함수 R ">은 불변(invariant)이다. 즉 인 모든 점에 대해서

일반적으로 도메인블록과 레인지블록의 크기 비를 2:1로 하는 것이 효율적이므로 Eq. (5)는 다음과 같이 표현할 수 있다.

Eq. (8)를 Grayscale에 관한 계수(coefficient)변환과 기하(geometric)변환에 관한 식으로 표시하면

도메인블록영상 f 와 레인지블록영상 g 의 유사성은 평균자승오차(MSE)를 사용하여 측정한다.

여기서 L은 Lebesque 척도를 나타낸다.

그레이 레벨 영상을 나타내는 함수 g 에 대한 근사화 함수 V의 고정점을 f 라 하면 Collage정리에 의해 f 와 g는 다음 식을 만족한다.

근사화 함수V의 형태를 Eq. (10)과 같이 두면 우변을 ,에 대해 각각 최소화함으로서 역변환의 해답을 구할 수 있다. g 와 f 는 모두 이산함수이므로 Eq. (12)는 다음과 같이 표현할 수 있다.

이때, 는 실수 이다. 이제 Eq. (12)과 같은 척도를 사용할 때 Eq. (13)의 우변을 최소화시키는 것은 다음 식을 최소화시키는 것과 같다.

Eq. (14)의 우변에서 로 각 계수를 편미분 하고, 각각 0 이 되도록 하면 Eq. (15)와 같이 표현된다.

이 식에서 을 구하면 부호화 과정은 끝난다.

비선형변환방법을 적용한 아핀변환은 블록을 4개의 균일한 크기를 갖는 타일(tile)을 사용하여, 효율적인 압축과 복원을 위해 블록을 평탄영역, 중간평탄영역 및 에지영역으로 구분할 수 있는 분류기를 구현하고, 각 블록들에 대해 아핀변환을 적용하기 위해 사용된 는 다음과 같다.[16]

Eq. (15)에서 는 Eq. (16)의 에서 계산 되며, 각 타일에 대해 로 새로운 좌표를 계산하고 이 좌표에 위치한 계조도 로 구한다. 각 계수에 대해 역행렬을 계산하여 각 블록에 대해 4×4=16개의 정보를 만들어서, 블록분할을 행할 시 먼저 블록 크기는 16×16 타일크기를 8×8로 초기화하고 분류기를 통하여 블록을 평탄영역, 중간평탄영역, 에지영역으로 분류하여, 평탄영역인 경우 블록의 평균 밝기 값만 전송하고, 중간평탄영역인 경우 각각의 타일방향으로 아핀변환을 적용하여 프랙탈 계수 을 계산하고 각 계수를 양자화 하여 전송한다. 에지영역인 경우 8×8블록으로 분할하여 같은 과정을 4×4블록이 될 때까지 반복하여, 복원된 영상에 대해 수렴할 때까지 처음부터 되풀이한다.[16]

Ⅲ. RESULT AND REVIEW

본 연구의 실험에서 Fig. 1의 그레이 레벨영상은 512×512 크기의 CT(Brain)영상이며, 실험환경은 IBM-Workstation에서 C-언어로 프로그램 하였으며 실험결과에 대한 성능 비교의 기준은 압축률, 최대신호대 잡음비를 사용하였다. 레인지 블록의 크기는 32×32, 16×16, 8×8로 도메인 블록의 크기는 64×64, 32×32, 16×16로 쿼드트리 분할하였다.  

BSSHB5_2019_v13n4_509_f0001.png 이미지

Fig. 1. Original image(CT; Brain).

 Fig. 2는 그레이 레벨영상 512×512 크기의 CT(Brain)영상을 선형변환방법으로 원 영상을 여러 개의 레인지블록으로 나눈 후 각각의 레인지블록에 대하여 영상내의 존재하는 최적의 도메인블록을 찾는 부분변환시스템을 사용하여 닮은 블록을 찾아서 압축율과 화질의 성능을 개선하기 위해 부호화 후 탐색밀도를 D, D/2, D/4 분할하여 복원한 영상을 나타내며, 압축률은 9.6, 8.2, 7.2 이고, PSNR은 33.3, 36.8, 40.2로 탐색밀도에 따라 압축률 변화에 따른 PSNR도 함께 향상됨을 알 수 있다.

Table 1은 선형변환방법으로 부호화 후 탐색밀도를 D, D/2, D/4 분할하여 복원한 영상의 정보량, 부호화 바이트 및 압축률과 PSNR을 나타내고 있다.

Fig. 3은 그레이 레벨영상 512×512 크기의 CT(Brain)영상을 비선형변환방법으로 영상내의 임의의 블록에 대하여 도메인블록을 탐색하는 선형변환방법보다는 부호화 시간이 빠르나, 실제 영상에서 레인지블록에 대한 최적의 도메인블록을 선택할 수 없기 때문에 성능은 떨어져서 최적의 도메인블록을 선택하는 대신 밝기 계수 변환의 근사화 정도를 높여서, 부호화 후 탐색밀도를 D, D/2, D/4 분할하여 복원한 영상을 나타내며, 압축률은 8.6, 7.9, 7.2 이고, PSNR은 24.9, 25.2, 38.5로 탐색밀도에 따라 압축률 변화에 따른 PSNR도 함께 향상됨을 알 수 있다. Table 2는 비선형변환방법으로 부호화 후 탐색밀도를 D, D/2, D/4 분할하여 복원한 영상의 정보량, 부호화 바이트 및 압축률과 PSNR을 나타내고 있다.

BSSHB5_2019_v13n4_509_f0002.png 이미지

Fig. 2. Reconstructed CT images by linear transformation method.

선형변환방법이 비선형변환방법에 비하여 탐색밀도를 D, D/2, D/4 분할하여 복원한 영상의 압축률은 11%, PSNR은 45% 개선됨을 알 수 있어서 향 후 다양한 의료영상에 접목하여 영상의 화질을 개선하는 방법임을 알 수 있었다.

BSSHB5_2019_v13n4_509_f0003.png 이미지

Fig. 3. Reconstructed CT images by nonlinear transformation method.

Table 1. Linear transformation of CT images

BSSHB5_2019_v13n4_509_t0001.png 이미지

Table 2. Nonlinear transformation of CT images

BSSHB5_2019_v13n4_509_t0002.png 이미지

Ⅳ. CONCLUSION

선형변환방법은 원 영상을 여러 개의 레인지블록으로 나눈 후 각각의 레인지블록에 대하여 영상내의 존재하는 최적의 도메인블록을 찾는 부분변환시스템을 사용하여 닮은 블록을 찾아서 압축율과 화질의 성능을 조정가능하며, 비선형변환방법은 8개의 셔플변환 중에서 회전변환만을 이용하는데, 한정된 도메인블록에서만 탐색이 이루어지므로 영상내의 임의의 블록에 대하여 도메인블록을 탐색하는 선형변환방법보다는 부호화 시간이 빠르나 실제 영상에서 레인지블록에 대한 최적의 도메인블록을 선택할 수 없기 때문에 성능은 떨어질 수 있어서 비선형변환방법은 최적의 도메인블록을 선택하는 대신 밝기 계수 변환의 근사화 정도를 높여서 성능을 개선하고, 블록의 크기가 작을수록 PSNR(peak signal to noise ratio)값은 높아지며 블록의 크기가 클수록 압축비가 높아지므로 최적으로 영상을 부호화하기 위해 쿼드트리 블록분할을 하였다.

Acknowledgements

이 논문은 2018년도 춘해보건대학교 학술연구비 지원에 의한 것임

References

  1. J. H. Lee, Precision nuclear medicine medical imaging technology trend, KISTI, 2003.
  2. Benoit. B. Mandelbrot, The Fractal Geometry of Nature, W. H. Freeman and Company, New York, 1977.
  3. A. E. Jacquin, “Image coding based on a fractal theory of iterated contractive image transformations,” IEEE Transactions on Image Processing, Vol. 1, No. 1, pp. 18-30, 1992. https://doi.org/10.1109/83.128028
  4. D. M. Monro, F. Dudbridge, "Fractal approximation of image blocks," in Proc. Int. Conf. Acoust. Speech, Signal Processing, Vol. 3, pp. 485-488, San Francisco, California, Mar. 1992.
  5. S. Lepsoy, G.E. Oien, A. Ramstad, "Attracts image compression with a fast non-iterative decoding algorithm," in Proc. Int. Conf. Acoust. Speech. Signal Processing, Vol. 5, pp. 337-340, Minneapolis, Minnesota, Apr. 1993.
  6. M. Barnsley, Fractals Everywhere, San Diego: Academeic Press, San Diego, 1988.
  7. M. F. Barnsley, V. Ervin, D. Hardin, J. Lancaster, "Solution of an inverse problem for fractals and other Sets," Proceedings of the National Academy of Science U.S.A., Vol. 83, pp. 1975-1977, 1986. https://doi.org/10.1073/pnas.83.7.1975
  8. A. Jacquin, A Fractal Theory of Iterated Markov Operators with Application to Digital Image Coding, Ph.D thesis, Georgia Institute of Technology August 1989.
  9. A. J. Crilly, R. A. Earnshaw, H. Jones, Fractals and chaos, Springer-Verlag, New York, 1991.
  10. M. G. Alkhansari, T. S. husang, "A fractal-based image-coding algorithm," in Proc. Int, Cont. Acoust., Speech, Signal Processing, Vol. 5, pp. 345-348, Minneapolis, Minnesota, Apr. 1993.
  11. Y. Fisher, E. W. Jacobs, R. D. Boss, "Fractal Image Compression Using Iterated Transforms," Technical Report, Naval Ocean Systems Center, San Diego, CA92142-5000.
  12. H. O. Peitgen, H. Jrgens, D. Saupe, Chaos and Fractals, Springer-Verlag, New York, 1992.
  13. J. H. Park, C. W. Park, W. S. Yang, "Fractal image coding for improve the quality of medical images", J. Korean Social Radiology, Vol. 8, No. 1, pp. 19-26, 2014. https://doi.org/10.7742/jksr.2014.8.1.19
  14. J. H. Park, C. W. Park, "Color image coding for variable block of fractal", J. Korean. Social Radiology, Vol. 8, No. 7, pp. 435-441, 2014. https://doi.org/10.7742/jksr.2014.8.7.435
  15. J. H. Park, C. W. Park, "The YIQ Model of Computed Tomography Color Image Variable Block with Fractal Image Coding", J. Korean. Social Radiology, Vol. 10, No. 4, pp. 263-270, 2016. https://doi.org/10.7742/jksr.2016.10.4.263
  16. C. W. Park, "Fractal Image Compression using Variable-Size Block and Adaptive Selection of Coding Coefficients", Graduate School Dong-A University, 1996.
  17. J. H. Park, C. W. Park, "Fractal Image Coding by Linear Transformation of Computed Tomography", J. Korean. Social Radiology, Vol. 11, No. 4, pp. 241-246, 2017. https://doi.org/10.7742/jksr.2017.11.4.241
  18. J. H. Park, C. W. Park, "Improvement of Image Compression Using Quantization Technique in Computed Tomography Images", J. Korean. Social Radiology, Vol. 12, No. 4, pp. 505-510, 2018.