Character Extraction from Color Map Image Using Interactive Clustering

대화식 클러스터링 기법을 이용한 칼라 지도의 문자 영역 추출에 관한 연구

  • 안창 (단국대학교 전자공학과) ;
  • 박찬정 (강릉대학교 전자계산학과) ;
  • 이상범 (단국대학교 컴퓨터공학과)
  • Published : 1997.01.01


The conversion of printed maps into computerized databases is an enormous task. Thus the automation of the conversion process is essential. Efficient computer representation of printed maps and line drawings depends on codes assigned to characters, symbols, and vector representation of the graphics. In many cases, maps are constructed in a number of layers, where each layer is printed in a distinct color, and it represents a subset of the map information. In order to properly represent the character layer from color map images, an interactive clustering and character extraction technique is proposed. Character is usually separated from graphics by extracting and classifying connected components in the image. But this procedure fails, when characters touch or overlap lines-something that occurs often in land register maps. By vectorizing line segments, the touched characters and numbers are extracted. The algorithm proposed in this paper is intended to contribute towards the solution of the color image clustering and touched character problem.

지도 영상에 포함된 문자들을 효율적으로 인식하기 위해서는, 문자 영역만을 추 출하여 독립된 계층으로 만드는 전처리 단계가 선행되어야 한다. 본 논문에서는 칼라 지도 영상의 색 정보를 대화식 클러스터링 기법에 의해 색 별로 분리하고, 문자 영역 을 추출하는 알고리즘을 제안하였다. 제안된 대화식 클러스터링 기법은 칼라 영상 중 에서 사용자가 분리하기 원하는 색을 대화식으로 선택하여 각각의 선택된 색을 중심 으로 클러스터를 형성하고 분리한다. 문자를 추출하는 알고리즘은 문자를 표현하는 색만을 추출한 이전 영상을 벡터 데이터화 한 후 각 원시 요소들의 상호 관계를 고려 하여 직선, 원, 문자의 세 계층으로 분류하는 것으로서, 문자와 직선이 중첩되어, 하 나의 연결 요소를 이루고 있을 때에도 효과적으로 문자를 분리할 수 있다. 알고리즘 의 평가를 위해 1:3,000의 지번약도에 대한 실험을 수행하였으며, 선분과 문자가 중 첩되어 있는 경우에도 각각 분리할 수 있음을 확인하였다.
