DOI QR코드

DOI QR Code

Maximizing WSQ Compression Rate by Considering Fingerprint Image Quality

지문 영상 품질을 고려한 WSQ 최대 압축

  • 홍승우 (고려대학교 컴퓨터정보학과) ;
  • 이성주 (고려대학교 컴퓨터정보학과) ;
  • 정용화 (고려대학교 컴퓨터정보학과) ;
  • 최우용 (한국전자통신연구원 휴먼인식기술연구팀) ;
  • 문대성 (한국전자통신연구원 휴먼인식기술연구팀) ;
  • 문기영 (한국전자통신연구원 휴먼인식기술연구팀) ;
  • 김장롱 (인하대학교 정보통신공학과) ;
  • 김학일 (인하대학교 정보통신공학과)
  • Received : 2009.07.06
  • Accepted : 2010.03.03
  • Published : 2010.06.30

Abstract

Compression techniques can be applied to large-scale fingerprint systems to store or transmit fingerprint data efficiently. In this paper, we investigate the effects of FBI WSQ fingerprint image compression on the performance of a fingerprint verification system using multiple linear regressions. We propose a maximum compression using fingerprint image quality score. Based on the experiments, we can confirm that the proposed approach can compress the fingerprint images up to 3 times more than the fixed compression ratio without significant degradation of the verification accuracy.

지문 인식 시스템이 보편화되면서 출입국 관리 등 국가 단위의 대규모 시스템 구축이 활발히 논의되고 있다. 이러한 대규모 지문 인식 시스템의 효율적인 자원 활용을 위해 영상 압축 성능을 향상시키는 방법이 연구되고 있다. 본 논문에서는 지문 영상 압축 표준인 FBI WSQ(Wavelet Scalar Quantization)의 압축 성능을 극대화하기 위한 최대 압축비 결정 방법을 제안한다. 지문 영상 압축을 고려하지 않는 기존 지문 영상 품질 평가 방법의 단점을 해결하기 위해, 지문 영상 품질 점수와 FBI WSQ 압축 인자가 인식률에 미치는 영향을 분석한다. 또한, 회귀분석 방법으로 영상 압축의 영향까지 고려한 인식률 예측 모델을 추정하고, 입력으로 주어진 최저 지문 인식률 조건을 만족하는 최대 압축비를 도출한다. 제안 방법의 정당성을 확인하기 위해 FVC2004의 DB1 지문 영상 데이터베이스로 실험하였으며, 인식률의 큰 저하 없이 기존의 FBI WSQ 권장 압축비 대비 약 3배의 압축 성능 향상을 확인하였다.

Keywords

Ⅰ. 서론

바이오인식은 보편성, 고유성, 영구성을 바탕으로 온라인 뱅킹 등의 전자상거래에서 정보 보안을 실현할 수 있을 뿐만 아니라, 출입통제, 근태관리. 기기의 사용자 제한 등과 같은 물리적 통제와 기계가 사용자를 인식함으로써 사용자의 요구에 부합하도록 기계 스스로 대응 할 수 있게 하여 편의와 안전을 제공할 수 있는 기술이다. 본 논문에서는 바이오 정보 중 가용성, 정확도, 경제적인 면에서 가장 일반적으로 사용되어지고 있는 지문〔1〕을 선택하였다.

지문 인식 시스템은 일반적으로 획득부. 신호 처리부. 정합부, 등록부, 결정부의 다섯 부분으로 구성되며. 원격 시스템은 전송부가 추가된다. 획득부는 지문인식기를 통해 지문 영상을 획득원격 시신호처리부에서는 획득한 지문 영상으로부터 특징점들을 추출하여 템플릿의 형태로 저장하며, 정합부 및 결정 부에서는 최초 등록된 사용자의 템플릿과 인증 요청 지문의 특징 점을 정합하여 사용자를 인증획득 원격등록부에서는 지문의 템플릿을 의 형태로 에 저장획득원격그러나 현쉴기를 다양한 종류의 지문 센서 및 지문 인식 알고리즘들 간의 호환 등쉽지 않아, 대규모 시스템에서는 특징점만을 저장/전송하는 것보다 지문 영상까지 저장/ 전송하는 것이 일반적이다〔2〕.

최근. 지문 인식 시스템이 보편화되면서 출입국 관리 등 국가 단위의 대규모 시스템 구축이 활발히 논의되고 있다. 일반적으로 지문 인식 시스템의 인식 성능을 보장받기 위해서는 320 X 320 pixel 이상의 지문 영상이 필요하다〔3〕. 이러한, 다수의 사용자를 수용하는 대규모 지문 인식 시스템의 경우 대용량의 저장 공간과 높은 네트워크 대역폭을 필요로 하며, 저장 공간과 대역폭의 문제점을 해결하기 위하여 지문 등의 바이오 정보 영상에 영상압축 기법을 적용하는 방법이 연구되고 있다〔4〕.

그러나 손실 압축의 경우, 영상의 해상도가 떨어지기 때문에 지문 인식률 성능이 저하 될 수 있다. 예를 들어, 미국 FBI에서 지문 영상 압축 표준으로 개발하고 사용중인 WSQ(Wavelet Scalar Quantization) [4] 는 손실 압축 방식으로, 손실 압축의 특성상 지문 영상의 왜곡 및 손실을 최소화하기 위하여 WSQ Guide에서는 지문 영상 품질을 고려하지 않고 단순히 모든 영상에 대해서 약 15배(0.75 bit per pixel) 까지만 압축하는 것을 권장하고 있다〔5〕. 지문 인식 시스템에서는 인식률이 중요한 문제가 되는데, 지문 인식률 성능을 향상시키는 방법으로, 지문 영상 품질을 측정하여 품질이 높은 영상을 데이터베이스화 하고, 인증과정에서 품질이 낮은 영상의 인식 시도를 거부함으로써 지문 인식률의 성능을 향상 시킬 수 있다〔6, 7〕. 따라서, WSQ 영상 압축과 지문 영상의 품질의 관계를 고려하여 지문 인식 시스템을 구축한다면. 인식률의 성능의 큰 저하 없이 더 높은 지문 영상 압축률을 달성할 수 있다.

본 논문에서는 지문 영상 품질을 고려하여 WSQ 영상 압축의 최대 압축비 도출 방법을 제안한다. 먼저 인식률 예측 모델을 기반으로 WSQ 영상 압축 인자를 측정하고, 통계학적 회귀 모델을 추정한다. 또한. 최대 영상 압축을 위한 입력 bpp(bit per pixel) 인자 결정 방법의 정당성을 확인하기 위해, 최대 압축 후지문 인식률과 기존 방법의 압축 성능 및 인식률을 비교한다.

본 논문의 구성은 다음과 같다. II장에서는 기존의 지문 영상 품질 측정 방법을 간략하게 설명하며 m장에서는 지문 영상 품질과 손실 영상 압축의 특성을 분석하여 회귀모델 추정 및 최대 압축인자 방법을 설명한다. IV장에서는 실험 환경 및 결과를 비교. 분석하며 마지막으로 V장에서 결론 및 향후 연구를 설명한다.

Ⅱ. 지문 영상 품질 측정

매칭 기반 지문 인식 시스템의 경우 지문 영상의 품질에 의해 시스템 전체의 성능이 결정된다. 이러한 지문 영상 품질 측정은 각 지문 영상을 인식률 성능을 기준으로 분류(classfication)하는 방법이다. NIST (National Institute of Standard and Technology)에서 개발한 지문 영상 품질 측정 알고리즘 NFIQ(NIST Fingerprint Image Quality) [6J 는 지문 영상의 분산과 방향성을 측정한 블록 영상의 스코어와 지문 영상내의 노이즈를 검출하는 노이즈 점수, 특징점의 분포를 고려한 특징점 밀도 점수, 상하좌우 균형도를 측정한 위치 점수, 지문 크기의 면적점수 등을 이용하여, 고품질의 영상을 Level L으., 저품질의 영상을 Level 5로 평가한다.

반면 본 논문에서 이용하는 지문 영상 품질 평가 방법〔7](FpIQ_INHA)은 블록별 품질 특성 분류 결과를 이용하여 전체 지문 영상의 품질을 수치화하는 방식이며. 고품질의 영상을 100으로, 저품질의 영상을 0으로 표기한다. 특히 , FpIQ_INHA는 다양한 지문 센서 환경에서 취득된 동일한 손가락의 영상들이 일관된 품질 수치를 나타낸다는 특징이 있다. 표 1은 3개의 샘플 영상을 대상으로 NFIQ의 품질과 FpIQ_ INHA의 품질 수치를 비교하였다. 표 1의 샘플 영상 A는 NFIQ의 품질 수치를 기준으로 평가할 경우. 샘플영상 日와 같은 레벨 2의 품질을 가진다고 평가하였다. 그러나, FpIQJNHA으로 샘플 영상 A와 B를 평가할 경우 각각 92.4와 59.5로 차별화된다.

〔표 1) 지문 영상 품질 점수 및 영상 샘플 (FVC2004 DB1)

그러나, 이러한 지문 영상 품질 분석은 WSQ 등의 영상 압축을 고려하지 .않았으며 , 압축 환경에서의 새로운 품질 분석 필요성을 설명하기 위하여 각 압축 인자로 압축된 영상 위에 특징점을 표시하면 표 2와 같다. 표 2의 A 샘플 영상의 경우 특징점의 위치가 압축비에 크게 영향 받지 않는 반면, C 샘플 영상의 경우 압축비가 증가함에 따라 원영상과 상이한 특징점들이 증가하는 현상을 볼 수 있다. 즉, 영상의 융선의 형태를 기준으로 판단하는 품질 평가 방법은 손실 압축된 영상의 왜곡된 정보를 지문 정보라고 판단할 가능성이 있기 때문에’ 기존의 지문 영상 품질 측정 방법으로는 압축과 인식률의 상관관계를 정확히 표현할 수 없다. 따라서、이러한 문제점을 해결하기 위해서 통계적인 실험 방법을 통하여 지문 영상 품질별 영상 압축의 특성을 고려한 지문 영상 인식률 예측 모델의 개발이 필요하다 .

(표 2) FBI WSQ 압축된 샘플자문영상과 특징점 (X표는 원 영상의 특징점 O표는 원영상과 압축된 영상의 상이한 특징점)

Ⅲ. 최대 영상 압축비 결정

본 장에서는 최소자승법〔8〕을 이용한 회귀 분석 방법으로 인식률 예측 모델을 추정하여 효과적으로 최대 압축 인자를 계산하는 알고리즘을 설명한다.

3.1 회귀 모델 추정

통계학에서의 회귀 분석〔9〕이란 두 연속형 변수의 관찰된 값에 대하여 독립 변수와 종속 변수사이의 선형 회귀식을 구하고, 그 모델을 이용하여 독립 변수가 주어졌을 때 종속 변수를 예측하는 분석 방법이다. 본 분석에서는 "원본 지문영상의 지문 영상 품질 점수는 WSQ 영상 압축후의 지문 인식률에 영향을 미친다." 를 가설로 설정하고, 관련 변수로 인식률, 압축률과 지문 영상 품질을 선택한다. 인식률에 관련된 변수들은 지문 영상 품질, 특징점 정보, 매칭 방법, 특징점 추출 및 센서의 종류 등이 있지만. 지문 영상 품질은 매칭 알고리즘 및 센서의 종류에 종속적으로 알려져 있다. 따라서, 지문 영상 품질에 따른 인식률 변화를 정확히 관측하기 위해서. 본 논문에서는 매칭 알고리즘 및 센서의 종류를 고정하여 실험한다. 압축률의 상관변수는 압축 인자가 있으며. 압축 인자와 압축률과의 관계는 일반적으로 지문 인식 시스템의 손실 영상 압축 특성상 지문 특징 정보의 왜곡 및 누락을 발생시키기 때문에, 일반적으로 0.75 bpp까지 제한하고 있다〔5〕. 지문 인식 성능과 지문 영상 압축 성능의 관계를 정리하면 그림 1과 같다.

(그림 1) 지문 인식 성능과 지문 영상 압축 성능의 관계

종합적으로, 인식률은 지문 영상 품질과 압축률에 의해 결정되며, 압축률은 압축인자에 의해 결정된다. 따라서, 인식률과 압축률에 영향을 주는 여러 요소들의 복합적인 관계를 정리하고 통계적 실험으로 수학적인 인식률 예측 모델을 결정하여 최대 압축률 결정 시 활용한다. 특히, 지문 영상 압축에 특화된 WSQ는 손실 압축 방식으로. 손실 압축 과정 중 양자화(Quantization) 는 복원 과정에서 영상 왜곡 현상이 발생한다. 즉, 특징점 매칭 방식의 지문 인식 시스템은 영상 압축 과정의 정보 손실 및 왜곡으로 인하여 특징점의 이동, 누락 및 거짓 특징점의 형성 등에 의해서 인식률에 영향을 줄 가능성이 있다. 그러나. 지문 인식 시스템에서 지문 영상 품질과 FBI WSQ 손실 영상 압축에 의한 인식률의 영향을 분석한 연구 결과는 아직까지 발표되지 않고 있다.

우선. 회귀 모델의 잔차(residual)를 줄이기 위해각 변수들을 역변환 공식〔9〕을 이용하여 변환시킬 필요.가 있다. 영상 압축 인자값(%)은 WSQ 영상 압축파라미터로 양자화 과정에서 사용되는 bpp 값이다. 또한. 영상 압축 파라미터와 지문 영상 압축비의 통계적 관계에 의해 변수 변환한 %는 추가적인 변수이다. 따라서. 각 변수의 특성들에 의하여 종속 변수는 인식률(g)이 되며. 독립 변수는 지문 영상 품질 점수(们) 와 영상 압축 파라미터伝J, 영상 압축 파라미터를 자연로그 취한 값(气)을 선택한다. 여기서 인식률S) 는각각 관측된 인식률에서 평균 관측 인식률의 편차로 정의한다.

각 변수의 특성을 바탕으로 회귀 모델을 정의하면 식 1과 같다.

#(1)

y : 인식률 평균의 편차

旳 : 품질 점수

% : 압축 인자

此 : 압축 인자의 자연로그

e : 오차

다음으로 최소자승법 (Least Square Method) 〔8〕방법으로 결정된 모델에 가장 적합한 모수(&、s (3) %)들을 찾는다. 최소자승법은 식 2의 잔차 제곱 £ 을 최소로 하는 모수들을 찾는 최적화 방법으로”, 여기서 既은 1번째 관찰된 인식률이다.

#(2)

마지막으로 모델의 적합도 검증을 통해서 최종적인 회귀 모델의 모수들을 추정한다. 추가적인 모형 요약과 분산 분석 결과는 4장에서 설명한다.

3.2 WSQ 최대 압축 모듈

#(3)

WSQ 최대 압축 모듈(Maximized WSQ Encoder. MWSQE)은 그림 2와 같이 품질 점수와 최소 인식률을 바탕으로 인식 예측 모델에 적용하여 최대 압축 인자값을 결정한다. 인식률 예측 모델은 압축인자와 품질 접수를 입력으로 인식률을 예측한다. 따라서 , WSQ 최대 압축 모듈은 품질 점수와 최소 인식률을 입력으로 최대 압축 인자를 출력하는 것이다. 최대 압축 인자(旳)를 효율적으로 계산하기 위해. 식 1 을 식 3과 같은 형태로 함수 변환한다n 여기서 압축인자의 최소값 및 최대값은 예상 가능하며. 압축 인자의 자연로그 값 阿도 계산 가능하다. 따라서, 식 3의 좌변 항을 계산하여 테이블에 저장■하고, 주어진 조건 (y, 气)으로 식 3의 우변항에 가장 가까운 값을 좌변값 테이블에서 찾음으로써, 에러를 포함하는 최대 압축 인자를 결정할 수 있다.

〔그림 2) 최대 지문영상 압축 순서도

최대 압축 인자 결정 알고리즘을 요약하면 그림 3 과 같다, 즉. 최소 인식률(?/), 인증용 영상의 품질(■引 과 최소자승법으로 계산된 각 모수(q, <如 e3, 门 ) 가입력되면, 식 3의 우변항 값을 계산하여 미리 계산된죄변항 값과의 차가 가장 작은 압축 인자(%)를 반복문을 통해서 찾아낼 수 있다.

〔그림 3) 최대 압축 인자 결정 알고리즘

Ⅳ. 실험 환경 및 결과

회귀 분석 모델 추정을 위해서 FVC2004C10] DB1 Set A의 400개 지문영상(100명의 사람이 4번씩 찍은 지문영상)을 이용하였다. 각 지문 영상은 Optical Sensor 방식의 지문 센서로 획득하였으며’ 영상의 크기는 640x480 픽셀. 이미지 해상도는 500dpi 이다. NFIQ 지문 영상 품질 측정 프로그램은 NIST에서 공개한 프로그램을 사용하였다. 본 실험에서 압축파라미터는 0.05에서 0.75까지 0.1 단위의 8단계로 나누어 압축하였다. 최종적으로 400개의 지문 영상을 품질 측정 후, 0에서 100까지 점수 범위를 FpIQ_ INHA 품질 점수 10 간격으로 10개의 품질 범위로 지정하고 8개의 압축 단계로 압축하였다. 각 지문 영상별로 본인 정합은 L600번, 타인 정합은 158, 400 번 수행하여 EER(Equal Error Rate)을 측정하였다. 또한, 지문 인식 시스템의 등록 템플릿은 지문 영상 품질이 FpIGLINHA 기준으로 50 이상인 지문 영상에서 15배 압축 후 특징점을 추출하여 등록하였다.

회귀 분석 실험을 위한 시나리오는 인증 지문 영상을 품질 검사하여 품질 점수를 구하고 실험 조합으로 정의된 여러 압축비로 압축과 복원 후, 지문 영상에서 특징점을 추출한다. 마지막으로 템플릿과 추출된 특징점을 매칭함으로써 EER을 계산한다. 각 관측별 샘플 결과는 표 3 및 표 4와 같다(2/ : 관측 인식률과 평균 인식률의 편차, 两 : 품질 점수. 勺 : 압축 인자, 电 : 압축 인자의 자연로그, e : 오차).

표 3) NFIQ 품질 평가를 사용한 관측값 샘플

〔표 4) FpIQJNHA 품질 평가를 사용한 관측값 샘플

그리고, 표 3 및 표 4와 같이 관측된 통계 실험결과를 바탕으로 변수의 단계 선택 방법으로 회귀 분석을 실시하면 표 5 및 표 6과 같다. 여기서 住 모든 측정치들이 표본 회귀선상에 머문다면 1이 되고, 종속변수와 독립 변수간 선형 관계가 존재하지 않는다면 0 이 된다. 즉. 厅은 모델이 모집단에 얼마나 잘 부합될 수 있는가에 대한 추정의 근거가 된다. FpIQJNHA 의 厅은 0.923이고 NFIQ의 密은 0.779이므로 FpIQJNHA를 이용한 회귀 추정 모델이 모집단에 더 부합된다고 할 수 있다. 따라서. 최대 압축비 예측 모듈은 FpIQJNHA를 기준으로 실험하였다. T 분포를 고려할 때 유의확률 값이 0300이므로 3.1 절에서 설정한 가설이 채택되어 이론적으로 비선형 관계에 있는 종속 변수(지문 영상 품질, WSQ 영상 압축)와 독립 변수(인식률)의 관계가 변수 변환에 의해서 선형관계로 변경되었음을 보여준다.

(표 5) NFIQ의 모수 값 및 통계 분석 결과

(표 6] FplQ_INHA의 모수 값 및 통계 분석 결과

그림 4의 A, B. C를 FRR(False Reject Rate) 0.05를 기준으로 비교하면, 품-질이 낮아질수록 FA代 (False Accept Rake)이 점차 감소함을 확인할 수 있다. 또* 한 각각의 A, B, C의 그래프는 0.75bpp, 0.50bpp, 0.25 bpp의 압축 인자 순으로 점차 인식률이 감소함을 확인할 수 있다.

(그림 4) FpIQJNHA 품질 범위별 지문 인식률 ROC

마지막으로, FpIQJNHA 품질 측정 방식을 기준으로 3.2절에서 설명한 최대 압축 인자 결정 방법을 실험하였다. MWSQE의 성능 실험에 사용된 지문 영상은 FVC2004에서 FpIQJNHA을 기준으로 영상품질이 우수한 DB1 을 선택하였으며, 충분한 EER 측정을 위해서 미리 정의된 품질 단계 중 영상 개수가 100개 이상인 (50.60), [60, 70), [70, 80) 범위의 지문 영상을 MWSQE 압축/복원한 후 인식률을 측정하였다. 표 7에서 요약한 바와 같이 ’ 영상 품질에 따라 가변비를 갖는 MWSQE의 압축비 평균은 45.7이고 94.2%의 인식률을 제공한다. 기존의 고정비 압축방식과 비교하면 약 3배 정도의 압축 성능 향상을 보이며 그림 5과 같이 인식률 저하는 미미하였다.

(표 7) 기존의 고정비 WSQ 영상 압축 방법과 MWSQE 모듈을 활용한 가변비 방법의 압축률 및 인식률의 차이

[그림 5) 기존의 고정비 WSQ 영상 압축 방법과 MWSQE 모듈을 활용한 가변비 방법의 ROC

Ⅴ.결론

일반적으로 지문 영상 품질 측정은 지문 영상의 지역 및 전역적 특징을 통계적으로 분석하여 지문 인식시스템의 인식 성능을 예측하는 기법이다. 본 논문에서는 기존의 지문 영상 품질 측정 기법을 WSQ 영상 압축 환경에 맞도록 수정하였다. 즉. 통계학적 방법으로 널리 이용되는 회귀분석을 이용하여 영상 압축비와 지문 품질, 그리고 인식률 사이의 관계를 분석하여 인식률 예측 모델을 만들고, 최소 인식률 조건 안에서 최대 영상 압축비를 결정하는 방법을 제안하였다. 실험을 통하여 고정 압축비 대비 평균 3배의 압축 성능개선을 확인하였다. 본 논문에서 제안한 인식률 예측 방법은 다른 바이오 인식 분야(얼굴, 홍채)에서도 활용 가능하며, 개선된 최대 영상 압축 방법은 단말기 및 네트워크 자원을 효율적으로 활용하는 문제 에도 적용이 가능할 것으로 기대된다.

* 이 논문은 2009년도 정부(교육과학기술부)의 재원으로 한국과학재단의 지원을 받아 수행된 연구임 . (No. 2009-0086148)

References

  1. D. Maltoni, D. Maio, A. Jain, and S. Prabhakar, Handbook of Fingerprint Recognition, Springer, May 2003.
  2. ISO/IEC JTC 1/SC 37 N 3066, "A Schematic of a Generic Biometric System Form of the International Standards Committee on Biometrics," Standing Document 11, American National Standards Institute (ANSI), Jan. 2009.
  3. C. Watson and C. Wilson, "Effect of Image Size and Compression on One-to-One Fingerprint Matching," NISTIR 7201, Feb. 2005.
  4. T. Hopper, C. Brislawn, and J. Bradley, "WSQ Gray-Scale Fingerprint Image Compression Specification," Document No. IAFIS-IC-0110(v2), Federal Bureau of Investigation, February 1993.
  5. ISO/IEC 19794-4, "Information Technology - Biometric Data Interchange Formats - Part4: Finger Image Data," Int. Org. Standardization, June 2005.
  6. A. Yoshida and M. Hara, "Fingerprint Image Quality Metrics That Guarantees Matching Accuracy," Proc. NIST Biometric Quality Workshop, Mar. 2006.
  7. J. Moon and H. Kim, "Scoring Method of Fingerprint Image Quality using Classified Block-level Characteristics," Korea Institutes of Information Security and Cryptology, vol. 17, no. 2, pp. 29-40, Apr. 2007.
  8. W.A. Stahel, "Purposes and Strategies in Regression Analysis," Elsevier, Journal of statistical planning and inference 122, pp. 175-186, Sep. 2003.
  9. S. Chatterjee and A.S. Hadi, Regression analysis by example, 4th Ed., Wiley, Apr. 2006.
  10. Fingerprint Verification Competition, http://bias.csr.unibo.it/fvc2004/, 2004.