Abstract
Of recent interests on high capacity DNA storage, DNA watermarking for DNA copyright protection, and DNA steganography for DNA secret communication are augmented, the reversible DNA watermarking is much needed both to embed the watermark without changing the functionality of organism and to perfectly recover the host DNA sequence. In this paper, we address two ways of DE based reversible DNA watermarking using noncoding DNA sequence. The reversible DNA watermarking should consider the string structure of a DNA sequence, the organism functionality, the perfect recovery, and the high embedding capacity. We convert the string sequence of four characters in noncoding region to the decimal coded values and embed the watermark bit into coded values by two ways; DE based multiple bits embedding (DE-MBE) using pairs of neighbor coded values and consecutive DE-MBE (C-DE-MBE). Two ways process the comparison searching to prevent the false start codon that produces false coding region. Experimental results verified that our ways have more high embedding capacity than conventional methods and produce no false start codon and recover perfectly the host sequence without the reference sequence. Especially C-DE-MBE can embed more high two times than DE-MBE.
대용량의 DNA 정보 저장, DNA 서열 저작권 보호를 위한 DNA 워터마킹, 및 비밀 통신을 위한 DNA 스테가노그라픽에 대한 관심이 증대되면서, 원본 DNA 서열의 기능 유지와 복원이 가능한 가역성 DNA 워터마킹이 필요하다. 본 논문에서는 비부호영역 DNA 서열을 이용한 DE(Difference expansion) 기반 가역 DNA 워터마킹 기법을 제안한다. 가역 DNA 워터마킹에서는 생물학적 기능 변경이 없고, 문자 형태의 서열 내에 대용량의 데이터를 은닉하여야 하며, 원본 DNA 서열이 복원되어야 한다. 제안한 방법에서는 문자 서열을 십진수 형태의 수치계수로 변환한 다음, 인접 수치 계수 쌍의 DE 기반 다중비트 은닉 방법(DE-MBE, DE based multiple bits embedding)과 이전 은닉 수치계수를 예측으로 한 연속 DE 기반 다중비트 은닉 방법들(C-DE-MBE, consecutive DE based multiple bits embedding)에 의하여 워터마크가 은닉된다. 은닉 과정에서는 워터마크된 서열에 의하여 부호영역을 나타내는 허위 시작코돈 발생을 방지하기 위하여 비교 탐색을 수행한다. 실험 결과로부터 제안한 방법이 기존 방법에 비하여 높은 은닉 용량을 가지며, 허위 시작코돈이 발생되지 않으며, 기준 서열없이 원본 DNA 서열이 복원됨을 확인하였다.