• 제목/요약/키워드: 히스토그램 이진화

검색결과 100건 처리시간 0.025초

구간값 퍼지집합을 이용한 그레이 영상에서의 임계값 선택방법 (Threshold Selection Method in Gray Images Based on Interval-Valued Fuzzy Sets)

  • 손창식;정환묵;서석태;권순학
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.443-450
    • /
    • 2007
  • 본 논문에서는 주어진 영상의 그레이 레벨에 대한 통계적 정보와 구간값 퍼지집합에 기반을 둔 새로운 임계값 선택 방법을 제안한다. 제안한 임계값 선택 방법에서 구간값 퍼지집합은 영상의 픽셀과 그들이 속하는 영역, 즉 물체와 배경 간의 관계를 더욱 명확하게 나타내기 위해서 사용되고, 통계적 정보는 구간값 퍼지집합의 규칙과 파티션을 결정하기 위해서 이용된다. 제안한 방법의 타당성을 보이기 위해 다양한 형태의 히스토그램을 가진 5개의 테스트 영상들을 기존의 임계값 선택방법인 Otsu 방법과 Huang과 Wang의 방법과 비교하였다.

컬러 영상 위에서 DCT 기반의 빠른 문자 열 구간 분리 모델 (Fast Text Line Segmentation Model Based on DCT for Color Image)

  • 신현경
    • 정보처리학회논문지D
    • /
    • 제17D권6호
    • /
    • pp.463-470
    • /
    • 2010
  • 본 논문에서는 DCT 데이터에서 영상 데이터로의 해독 및 이진화 과정을 생략하고 컬러 영상의 DCT 관련 원자료를 사용하는 방법에 기반을 둔 매우 빠르고 안정적인 문자열 구간 분리 모형을 제안하였다. DCT 블록에 저장된 DC 및 3개의 주요 AC 변수들을 조합하여 축소된 저해상도 회색 영상을 만들고 횡렬 및 종렬 투영법을 통해 얻어진 픽셀 값의 히스토그램을 분석하여 문자 열 구간 사이에 존재하는 백색의 띠 공간을 찾아내었다. 이 과정 중 탐색되지 않은 문자 열 구간은 마코프 모델을 사용하여 숨겨진 주기를 찾아내어 복원하였다. 본 논문에 실험 결과를 제시하였으며 기존의 방법보다 약 40 - 100배 빠른 방법임을 입증하였다.

근막 정보를 이용한 초음파 영상에서의 근육 영역 추출 (Extraction of Muscle Areas from Ultrasonographic Images using Information of Fascia)

  • 김광백
    • 한국멀티미디어학회논문지
    • /
    • 제11권9호
    • /
    • pp.1296-1301
    • /
    • 2008
  • 초음파 영상은 초음파 펄스를 이용하여 반사파를 수신하여 진단에 필요한 영상을 구성하는데 신호가 약해 질 경우 잡음이 발생하며 미세한 명암도 차이 등에 의해 분석 과정에서 육안으로 인지하고 진단하는데 어려움이 있다. 특히 근골격계 검사를 위한 초음파 영상에서 근육 영역의 진단에 어려움을 준다. 따라서 본 논문에서는 초음파 영상에서 영상 처리 기법을 이용하여 근육 영역을 검출할 수 있는 방법을 제안한다. 초음파 영상에서의 근육 영역 검출은 피하지방층과 기타 영역 그리고 근육을 둘러싸고 있는 근막 후보 영역을 검출한 후, 위치 정보와 형태학적 특징을 이용하여 최종적으로 근막 내부 영역인 근육 영역을 검출한다. 제안된 방법의 근막 후보 영역의 검출 과정은 개선된 히스토그램 스트레칭과 Multiple 연산으로 대비차를 향상시키고 반복 이진화 기법을 적용한 후, 잡음에 의해 손실되거나 끊어진 근막 영역을 거리 및 방향 분석을 이용하여 연결한 후에 근막 후보 영역을 검출한다. 검출된 근막 후보 영역의 형태학적 특징과 위치정보를 이용하여 피하지방층과 기타 영역을 분류한 후, 최종적으로 근육 영역을 검출한다. 실제 초음파 영상을 대상으로 제안된 근육 검출 방법을 적용하여 검출된 근육 영역과 전문의가 분석한 근육 영역을 비교한 결과, 제안된 근육 검출 방법이 전문의가 육안으로 분석한 근육 영역과 근접하게 검출되어 본 논문에서 제안한 근육 영역 검출 방법이 효율적임을 확인하였다.

  • PDF

칼라 인접성과 기울기를 이용한 내용 기반 영상 검색 (Content-based Image Retrieval Using Color Adjacency and Gradient)

  • Jin, Hong-Yan;Lee, Ho-Young;Kim, Hee-Soo;Kim, Gi-Seok;Ha, Yeong-Ho
    • 대한전자공학회논문지SP
    • /
    • 제38권1호
    • /
    • pp.104-115
    • /
    • 2001
  • 본 논문에서는 칼라 인접성과 기울기를 이용한 새로운 내용 기반 영상 검색 방법을 제안한다. 칼라 영상의 특징 정보로 사용되는 칼라 히스토그램은 시점이나 영상의 회전등의 영향을 적게 받고 특징 정보의 계산이 간단하고 빠른 장점이 있지만 칼라의 위치 정보를 나타낼 수 없기 때문에 균일 양자화에 의해 비슷한 히스토그램을 가진 서로 다른 영상을 구별하지 못하고 특징 저장량이 많은 등 단점이 있다. 제안한 방법은 기존의 방법들에서 보편적으로 사용하는 양자화 대신 영상에서의 인접 화소의 칼라 변화량 즉 기울기를 계산하여 보다 정확한 색차를 구함으로써 비슷한 칼라가 서로 다르게 양자화됨으로 인한 오차를 감소시켰다. 동시에 영상의 주요 칼라 구성 특징을 나타나는 칼라 인접성 정보를 추출하여 이진 배열로 표시함으로써 특징 정보의 방대한 저장량을 줄이고 비교속도를 향상시켰다. 실험 결과 기존의 검색 방법에 비하여 제안한 방법은 적은 특징 저장 양으로 외부조건의 변화에 더욱 강건함을 보여주고 있다.

  • PDF

퍼지 벡터 양자화기 사상화와 신경망에 의한 화자적응 음성합성 (Speaker-Adaptive Speech Synthesis based on Fuzzy Vector Quantizer Mapping and Neural Networks)

  • 이진이;이광형
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.149-160
    • /
    • 1997
  • 본 연구에서는 퍼지사상화(fuzzy mapping)와 FLVQ(fuzzy learning vector quantization)에 의한 사상된(mapped)코드북을 사용하는 화자적용 음성합성 알고리즘 을 제안하고, 기존의 음성합성결과와 비교한다. 입력화자와 기준화자의 코드북은 FLVQ 방법으로 작성한다. 사상된 코드북은 퍼지 히스토그램을 작성하여 이들을 선형 결합함으로써 얻어지는 퍼지 사상화에 의하여 작성된다. 대응 코드벡터의 퍼지 히스 토그램은 동일 입력벡터에 대해 선택된 입력화자의 코드벡터와 기준화자의 코드벡터 사이의 DTW(dynamic time warping)을 행하여 대응하는 코드벡터들의 소속값 (membership value)을 누적하여 얻는다. 음성합성시에는 사상된 코드북을 사용하여 입력화자의 음성을 퍼지벡터 양자화한 다음, FCM(fuzzy c means) 합성규칙을 사용하 여 사상된 코드북내의 코드벡터가 아닌 새로운 하나의 합성벡터를 얻게 되어 좀 더 입력화자에 적응된 합성음을 얻게 된다. 이 기술의 성능평가는 성별이 서로 다른 화 자를 입력화자 및 기준화자로 선정하여 입력화자의 음성에 가까운 정도로 평가하였으 며 그 결과 기존의 음성합성보다 입력화자에 더 적용된 합성음을 얻었다.

  • PDF

신, 구 차량 번호판 통합 인식에 관한 연구 (A Study on Recognition of Both of New & Old Types of Vehicle Plate)

  • 한건영;우영운;한수환
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.1987-1996
    • /
    • 2009
  • 최근 들어 기존의 녹색 바탕의 차량 번호판에서, 흰색 바탕의 신 차량 번호판으로 교체되고 있다. 하지만, 아직 기존의 차량 번호판이 신 차량 번호판으로 전면 교체 되지 않아 두 번호판 모두 사용되고 있기 때문에 주차 관리 시스템, 속도위반, 신호 위반 등 무인 카메라를 이용한 시스템에서, 기존 차량 번호판과 신 차량 번호판 특징에 맞는 인식 시스템이 요구된다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 기존의 녹색 번호판과 흰색 번호판 모두를 추출하고 인식 할 수 있는 알고리즘에 관한 연구를 수행하였다. 다양한 환경 에서 획득한 차량 영상으로부터 번호판 영역을 추출하기 위하여 형태학적 특징을 이용하였고, 추출된 번호판 영역의 수평, 수직 히스토그램과 문자의 상대적 위치 정보를 이용하여, 문자를 분리하였다. 최종적으로, 분리된 문자를 인식하기 위해 주성분 분석법(PCA : Principal Component Analysis)과 선형 판별 분석법(LDA : Linear Discriminant Analysis)을 적용하여 인식 시스템을 구성하였다. 실험 결과, 불규칙한 조명 상태에서도 상대적으로 높은 추출률과 문자 인식률을 나타내었다.

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

웨이브릿 변환과 모멘트를 이용한 문자인식에 관한 연구 (A Study on Character Recognition using Wavelet Transformation and Moment)

  • 조민환
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권10호
    • /
    • pp.49-57
    • /
    • 2010
  • 본 논문에서는 웨이브릿 변환을 이용한문자인식 방법 중 문자의 최소 단위인자음과 모음을 분리시켜 문자의 모멘트를 분석하여 산출되는 정보를 사전에 컴퓨터에 입력시켜 문서화된 수기 문자를 컴퓨터에 저장하고 인식시키는 방법에 접근 하였다. 연구는 획득한 문장 이미지에서 잡음을 없애고 줄 단위로 분리, 분리된 줄 단위 문장은 한 문자 단위로 다시 분리된 후 자음과 모음으로 분리 하였다. 분리된 자소는 CVIPtools를 사용하여 히스토그램 평활화와 침식 및 평균값 필터를 처리한 후 C++를 이용하여 세선화 처리하고 세선화된 자소는 팽창 및 크기 변환하여 모든 자소가 동일 굵기, 크기 이미지로 만들었다. 표준화 이미지는 이진화 이미지로 변환하여 3단계 웨이브릿 변환을 이용하여 데이터의 양을 1/64로 줄인 후 해밍거리를 조사하였다. 연구 결과 다양한 'ㄱ'상호간 및 'ㅅ'상호간의 일치도는 매우 높게 나타났고, 서로 상이한 'ㄱ'과 'ㅅ'을 비교 했을 때 상호간 일치도가 매우 낮게 나옴을 알 수 있었다. 이 연구 결과로 더 많은 수기 자소들에 대한 해밍거리조사가 이루어지면 각각의 자음과 모음의 모멘트 구분하여 수기 문자 인식에 중요한 정보를 알 수 있을 것으로 판단된다.

모바일 시스템 응용을 위한 실외 한국어 간판 영상에서 텍스트 검출 및 인식 (Text Detection and Recognition in Outdoor Korean Signboards for Mobile System Applications)

  • 박종현;이귀상;김수형;이명훈
    • 전자공학회논문지CI
    • /
    • 제46권2호
    • /
    • pp.44-51
    • /
    • 2009
  • 자연 영상에서의 텍스트 이해는 지난 수년간 매우 활발한 연구 분야로 자리하고 있다. 논문에서 우리는 한국어 간판 영상으로부터 자동으로 텍스트를 인식하는 방법을 제안한다. 제안된 방법은 상호명의 인식을 위한 텍스트 영역의 검출 및 이진화를 포함하고 있다. 먼저 수직, 수평 방향의 에지 히스토그램을 이용하여 텍스트 영역의 정교한 검출을 수행하였다. 두 번째 단계는 검출된 텍스트 영역에 대해서 연결요소 기법을 적용하여 각각의 독립된 한 개의 문자 영역으로 분할되어지고, 마지막으로 최소 거리 분류법에 의해 각각의 글자를 인식한다. 각각의 문자 인식을 위해 모양 기반 통계적 특징을 추출한다. 실험에서 제안된 전체적인 효율성 및 정확성을 분석하였으며, 현재 구현된 모바일 시스템의 실용성을 확인할 수 있었다.

미디언 필터 기반의 Retinex 알고리즘을 통한 안개 영상에서의 차선검출 기법 (Lane detection method using Median Filter based Retinex Algorithm in Foggy Image)

  • 김영탁;한헌수
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권8호
    • /
    • pp.31-39
    • /
    • 2010
  • 본 논문은 도로 영상에서 안개의 존재 여부를 판단하여 미디언 필터를 기반으로 하는 Retinex 알고리즘을 적용하고 영상을 개선한 후 최종적으로 차선을 검출하는 알고리즘을 제안한다. 영상 내에서 특정 관심 영역을 지정하고 해당 영역에서의 히스토그램을 분석하여 안개의 존재 여부를 판단한다. 안개 낀 영상으로 판단되는 경우 영상의 화질개선을 위해 미디언 필터를 기반으로 하는 Retinex 알고리즘을 이용해 대비도를 향상시킨다. 기존의 Retinex 알고리즘은 가우시안 필터를 적용하기 때문에 연산에 많은 시간이 걸리며, 특히 도로의 안개 영상에서는 차선의 특징이 두드러지지 않았다. 본 논문에서는 가우시안 필터를 미디언 필터를 바꿈으로써 도로의 안개 영상에 대해서 강인한 대비도 향상 효과를 얻을 수 있었다. 개선된 영상에서 차선에 대한 정보를 획득하기 위해서 이중 임계치를 이용한 이진화를 수행하고 라벨링을 통해서 검출된 차선의 크기, 방향 등의 정보를 계산하여 최종적인 차선을 검출한다. 제안한 알고리즘의 성능은 다양한 환경의 도로를 주행하면서 획득한 연속적인 영상들에 적용함으로써 제안하는 알고리즘의 효율성 및 우수성을 평가하였다.