• Title/Summary/Keyword: 문자영상

Search Result 796, Processing Time 0.028 seconds

필기체 한글 인식에 유용한 세선화 알고리듬의 성능 개선에 관한 연구 (A Study on the Performance Improvement of Thinning Algorithm for Handwritten Korean Character)

  • 이기영;구하성;고형화
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.883-891
    • /
    • 1994
  • 본 논문에서는 화소에서의 방향성을 이용하여 필기체 한글 인식에 유용한 세선화 알고리듬을 제안하였다. 세선화하기 전에 방향성 검출을 시행한다. 검출된 방향성에 의해서 직선과 사선으로 분류한다. 직선성분에는 Rutovitz crossing number를 이용한 알고리듬을 적용한다. 사선성분에는 Hilditch crossing number를 이용한 알고리듬을 적용한다. 제안한 알고리듬을 이미 제안된 다른 6가지의 세선화 알고리듬을 적용한 세선화 영상들과 성능을 비교하였다. 비교 항목으로는 기준 골격선과의 유사도, 잔가지 수, 그리고 자소 분리율 등이 사용되었다. 실험은 570개 문자에 대해서 수행하였다. 실험 결과 제안한 알고리듬은 유사도와 필기체 한글 인식에 많이 사용되는 자소 분리율에서 6개 비교 대상 중에서 가장 우수한 결과를 보였다.

  • PDF

전술환경에서의 VoIP 서비스를 위한 Dynamic QoS 기법 연구 (Dynamic QoS Mechanism for supporting VoIP Service in Tactical Communication Environment)

  • 신동윤;김영길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.367-370
    • /
    • 2011
  • 군 전술통신환경은 ALL-IP 기반에서 음성, 영상, 문자 등의 다양한 서비스 제공을 목적으로 진화되고 있다. 제약조건이 많은 전술통신 인프라 환경에서 가입자의 요구 수준에 맞는 서비스의 품질 수준을 보장하면서 이러한 서비스를 제공하기 위해서는 전술통신환경의 무선 전송링크, 부대단위 및 개인 이동성 등의 특성을 고려한 서비스 품질 보장 방안이 요구된다. 이 논문은 전술통신환경에서 개인별 또는 임무별로 차별화 된 서비스 품질 보장을 위하여 QoS 제공 수준을 서비스 시점에 VoIP 교환기가 동적으로 결정함으로써 사용자의 이동상황에 관계없이 원래 받고 있던 동일한 서비스 품질을 제공받을 수 있는 기법을 제시한다.

  • PDF

주정차 단속을 위한 PDA 기반의 자동차번호판 인식 시스템 (Vehicle License Plate Recognition System on PDA for Illegal Parking Car Regulation)

  • 윤희주;조훈;구경모;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.792-795
    • /
    • 2006
  • 본 논문에서는 주정차 단속을 위해 PDA를 이용하여 자동차 번호판을 인식하는 방법을 제시한다. 현재까지 도입되어 사용 중인 세 종류의 자동차 번호판의 특징을 이용하여 번호판의 종류를 구분하고, 지역명, 지역코드, 용도문자 및 일련번호를 영역화하여 자동차번호판을 인식하였다. PDA를 이용해 영상을 획득하여 번호판 인식 시스템 실험 결과 88.7%의 인식률을 보였다.

  • PDF

딥러닝 기술을 활용한 효과적인 차량 번호판 인식 시스템 (An effective license plate recognition system using deep learning technology)

  • 장성수;정혁준;은애천;하영국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.733-735
    • /
    • 2018
  • 최근의 차량 주차관리 시설, 출입통제가 필요한 장소 그리고 도로 방범카메라를 통한 단속 등 다양한 곳에서 차량 번호판 자동 인식 기술들이 활용되고 있다. 하지만 현재 사용되고 있는 LPR(License Plate Recognition) 시스템에는 많은 장비와 비용이 들어간다는 큰 단점이 존재한다. 본 논문에서는 하나의 컴퓨터와 최소의 카메라를 가지고 할 수 있는 기계학습을 통한 영상처리를 제안하려 한다. 먼저 딥러닝 프레임워크 중 하나인 YOLO(You Only Look Once) [4]를 활용하여 자동차의 번호판 부분의 영역을 검출하고 Grayscale를 통해 햇빛 또는 조명 등의 영향을 감소시켜 번호판의 특징을 보존시킨다. 전처리 작업이 끝난 후 번호판에서 숫자를 인식 하는 부분에서는 k-NN(k-Nearest Neighbor) 알고리즘을 사용하였으며 한글 문자 인식부분은 Template Matching을 이용하였다. 제안한 알고리즘을 사용하여 기존 LPR 시스템에서 획득한 차량이미지를 대상으로 시뮬레이션 한 결과 좋은 결과를 얻을 수 있어 향후 연구 방향의 시스템 확장성의 가능성을 발견할 수 있었다.

NMF와 EMD를 이용한 영문자 활자체 폰트분류 (Font Classification using NMF and EMD)

  • 이창우;강현;정기철;김항준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.688-690
    • /
    • 2004
  • 최근 전자화된 문서 영상을 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문서의 자동 분류에 관한 많은 연구가 발표되고 있다. 본 논문에서는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법을 제안한다. 제안된 방법은 폰트의 구분 특징들이 공간적으로 국부성을 가지는 부분으로 표현될 수 있다는 가정을 바탕으로, 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 학습된 폰트의 특징들은 계층적 군집화 알고리즘을 이용하여 템플릿을 생성하고, 테스트 패턴을 분류하기 위하여 템플릿 패턴과의 EMD(earth mover's distance)를 사용한다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들의 폰트 식별을 위한 적절성을 보였다. 제안된 방법이 기존의 문자인식. 문서 검색 시스템들의 전처리기로 사용되면. 그 시스템들의 성능을 향상시킬 것으로 기대된다.

  • PDF

MPEG-7에 기반한 멀티미디어 메타정보 생성기 설계에 관한 연구 (A Study on Designing MPEG-7 Based Multimedia Metadata Generator)

  • 박성희;최동시;장명길;정경택;유성준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.137-140
    • /
    • 2000
  • 본 논문은 영상, 음성, 문자 정보를 포함한 대용량 멀티미디어 자료의 효율적인 검색을 위하여 진행되고 있는 MPEG-7 국제 표준화 활동의 동향에 대해서 알아 보며 국제표준 MPEG-7을 따르는 MPEG-7 Description Generator의 설계에 관하여 연구한다. 이 생성기는 크게 MPEG-7 DS 편집 모듈과 MPEG-7 Description 편집 모듈로 나뉘다. MPEG-7 Description Generator는 표준화 대상이 아닌 비표준 도구(non-normative tool)로서 세계적인 기업들이 경쟁적으로 개발 중에 있는 멀티미디어 응용 프로그램 중의 하나다. MPEG-7 은 현재 표준화가 진행 중이지만 MPEG-7 Metadata Generator를 개발함으로써 많은 수요가 예상되는 MPEG-7 표준안이 채택될 시점에 MPEG-7 관련 응용프로그램 시장에서 선점하고자 한다.

  • PDF

iPhone의 SNS 데이터 수집 및 디지털 포렌식 분석 기법 (Sensitive Privacy Data Acquisition in the iPhone for Digital Forensic Analysis)

  • 정진형;변근덕;이상진
    • 정보처리학회논문지C
    • /
    • 제18C권4호
    • /
    • pp.217-226
    • /
    • 2011
  • 최근 다양한 스마트폰이 개발 보급되면서 SNS(Social Network Service)를 사용하는 사용자 또한 급격히 증가하였다. SNS는 기존 모바일 기기에서 수집할 수 있었던 문자 및 통화내역과 같은 단순한 사용자 데이터 외에도 주고 받은 사진 및 동영상, 음성쪽지나 위치 공유, 대화 내역 등 다양한 정보가 저장되어 디지털 포렌식 관점에서 유용한 데이터 획득이 가능하다. 본 논문에서는 최근 많이 사용하고 있는 아이폰을 대상으로 스마트폰에서 이용할 수 있는 SNS 클라이언트와 각 클라이언트 별로 수집할 수 있는 데이터의 종류를 살펴본다. 또, 각 데이터간의 연관관계를 통해 수집된 데이터의 효율적인 분석 방법을 제시한다.

문자인식을 위한 공간 및 주파수 도메인 영상의 비교 (Comparison of Spatial and Frequency Images for Character Recognition)

  • ;최현영;고재필
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.439-441
    • /
    • 2019
  • 딥러닝은 객체인식 분야에서에서 강력하고, 강건한 학습 알고리즘이다. 딥러닝에서 자주 활용되고, 객체인식 분야에서 최고의 성능을 보여주는 네트워크는 Convolutional Neural Network(CNN) 이다. 숫자 필기 인식을 위한 MNIST 데이터셋를 CNN으로 학습하면 성능이 매우 뛰어나다. 이는 MNIST 데이터 셋의 숫자들이 중앙에 잘 정렬되어 있기 때문이다. 하지만, 실제 데이터들은 중앙에 정렬이 잘 되어있지 않다. 이러한 경우에 CNN은 이전과 같이 우수한 성능을 보여주지 못한다. 이를 해결하기 위해, 우리는 FFT를 활용하여 이미지를 주파수 공간으로 변환하여 입력으로 주는 방법을 제안한다.

  • PDF

HTML5기반 개방형 공공미디어 플랫폼에 관한 연구 (A Study on Media Platform System based on HTML5 for Public Media Access Development)

  • 이정륜;이재원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1479-1482
    • /
    • 2013
  • 공공기관에서는 인터넷 방송 서비스를 통해 문자, 그림, 사진, 영상, 음악 등 다양한 멀티미디어 정보를 제공하고 있다. 일반 지상파 tv방송과는 달리 공공 인터넷 방송은 양방향으로 커뮤니케이션이 가능한 웹 미디어 플랫폼을 통해 실시간으로 정보를 주고 받을 수 있을 뿐만 아니라 이용자가 원하는 정보를 주문하고 서비스를 받을 수 있어 공공기관과 이용자간 소통수단으로 활용되고 있다. 그러나 공공 인터넷 방송의 시청률과 참여하는 양방향 콘텐츠의 다양성 측면을 분석해 보면 예상과 달리 이용실적이 저조한 것으로 나타나고 있다. 이러한 문제의 주요한 원인으로는 근래에 들어 확산되고 있는 스마트 모바일 환경에 실시간으로 대응하여 공공미디어 서비스를 제공하지 못하는 공공미디어 접근성의 한계와 인터넷이라는 양방향 미디어 플랫폼을 지향하면서도 제공하는 공공콘텐츠는 공급형 중심의 콘텐츠 성격을 벗어나지 못한다는 점을 들 수 있다. 본 논문에서는 이러한 공공 인터넷 방송의 문제점을 사용자 접근성과 양방향 콘텐츠 활성화라는 측면에서 분석하였다. 그 결과 공공 인터넷 방송 플랫폼의 개방성이 필요한 것으로 나타났으며, 다양한 스마트 모바일 환경에서 공공콘텐츠의 생산, 게시, 공유가 자유로운 공공 미디어 플랫폼 형태가 필요한 것으로 나타났다. 이를 바탕으로 HTML5, SNS플랫폼 연계 등이 포함된 개방형 공공 미디어 플랫폼 모델을 정의하고 이를 기반으로 양방향 공공콘텐츠를 활성화 할 수 있는 공공 미디어 서비스 모델과 이를 구현한 구축 사례를 제시하였다.

YOLOv4 알고리즘을 이용한 저품질 자동차 번호판 영상의 숫자 및 문자영역 검출 (Detecting Numeric and Character Areas of Low-quality License Plate Images using YOLOv4 Algorithm)

  • 이정환
    • 디지털산업정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.1-11
    • /
    • 2022
  • Recently, research on license plate recognition, which is a core technology of an intelligent transportation system(ITS), is being actively conducted. In this paper, we propose a method to extract numbers and characters from low-quality license plate images by applying the YOLOv4 algorithm. YOLOv4 is a one-stage object detection method using convolution neural network including BACKBONE, NECK, and HEAD parts. It is a method of detecting objects in real time rather than the previous two-stage object detection method such as the faster R-CNN. In this paper, we studied a method to directly extract number and character regions from low-quality license plate images without additional edge detection and image segmentation processes. In order to evaluate the performance of the proposed method we experimented with 500 license plate images. In this experiment, 350 images were used for training and the remaining 150 images were used for the testing process. Computer simulations show that the mean average precision of detecting number and character regions on vehicle license plates was about 93.8%.