• 제목/요약/키워드: 문자패턴

검색결과 297건 처리시간 0.032초

Multimedia Message Service(MMS)상에서 전송되는 스팸이미지 필터링 시스템 (Multimedia Message Service(MMS) Spam Image Filtering System)

  • 박영만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.933-935
    • /
    • 2014
  • 휴대전화 사용의 대중화로 인하여 개개인의 휴대전화로 수신되는 스팸메시지의 양도 덩달아 증가하게 되었다. 이것은 휴대전화 사용자가 불법광고 노출의 원인이 되고 있다. 이에 많은 스팸메시지 차단기법이 제시되었지만 이는 텍스트기반의 문자메시지에 특화되어있어 문자가 포함되어있는 이미지스팸에는 차단이 어렵다는 문제점이 존재 한다. 이에 본 논문에서는 휴대전화로 오는 이미지메시지 중 스팸이미지를 검출해 내는 모바일 스팸이미지 필터링 시스템을 제시하고자 한다. 제시하고자 하는 시스템은 스팸이미지를 분석하여 이미지의 패턴을 검사하여 특정 패턴이 포함된 이미지에 대해서 스팸이미지로 분류하여 필터링하게 됨으로써, 실제 휴대전화로 수신되는 스팸이미지를 이용한 실험을 진행하였다. 그 결과 기존 텍스트기반 스팸필터링시스템에서 할 수 없었던 스팸이미지 필터링을 할 수 있음을 확인 하였다.

효율적인 써픽스 배열 합병 알고리즘과 응용 (Efficient Merging Algorithms for Suffix Arrays and their Application)

  • 전정은;박희진;김동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.973-975
    • /
    • 2004
  • 대표적인 인덱스 자료 구조인 써픽스 트리와 써픽스 배열은 긴 문자열에서 임의의 패턴을 검색하는 데 효율적이다. 써픽스 트리는 써픽스 배열보다 큰공간을 차지하지만, 이미 구축된 써픽스 트리의 정보를 이용하여 쉽게 합병할 수 있다. 본 논문에서는 문자열 A와 B에 대한 써픽스 배열이 구축되어 있을 때 A#B$의 일반화된 써픽스 배열을 구축하기 위한 합병 알고리즘을 두 가지 제시하였다. 이 알고리즘을 사용하면 기존의 유전체 서열 써픽스 배열을 재사용하는 방식으로 합병하여, 빠른 시간 안에 효율적으로 합병된 써픽스 배열을 만들 수 있다. 실험 결과, 합병 알고리즘은 일반화된 써픽스 배열을 다시 구축하는 것보다 5배정도 빠른 속도를 보였다.

  • PDF

문자패턴에서의 밀도정보를 이용한 이진영상 매핑 (The Bi-level Image Mapping Using Density Information in Character Patterns)

  • 김봉석;강선미;양정윤;양윤모;김덕진
    • 전자공학회논문지B
    • /
    • 제30B권8호
    • /
    • pp.8-15
    • /
    • 1993
  • This paper describes a normalization of character which is contained in the character recognition process. Line and dot density is computed on input character image and then image mapping is executed into destination. Also recognition is processed using overlap-partitioning of character image and extraction of 4 directional feature primitives. The validity of proposed nonlinear normalization algorithm could be verified by increment of recognition rate.

  • PDF

써픽스 배열을 구축하는 빠른 알고리즘 (A Fast Algorithm for Constructing Suffix Arrays)

  • 조준하;박희진;김동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.736-738
    • /
    • 2004
  • 써픽스 배열은 정렬된 모든 써픽스들의 인덱스를 저장한 자료구조이며, 긴 문자열에서 임의의 패턴을 효율적으로 검색을 할 수 있는 자료구조이다. 비슷한 자료구조인 써픽스 트리에 비해 적은 공간을 사용하기 때문에 대용량의 텍스트에 대한 처리에 더 적합하다. 본 논문에서는 써픽스 배열을 빠르게 구축하는 방법을 제안하고, 써픽스 배열 구축 알고리즘들 중에서 빠르다고 알려진 Larsson and Sadakane 알고리즘, 대표적인 선형 시간 알고리즘인 Karkkainen and Sanders 알고리즘 및 최근에 발표된 고정길이 문자집합에 효율적인 Kim et al. 알고리즘과 성능을 비교한다. 실험 결과 본 논문에서 제안한 알고리즘이 전반적으로 빠르게 써픽스 배열을 구축하였다.

  • PDF

FA 공정에서의 제품 ID 마크 자동분할을 위한 다중 템플릿 알고리즘 개발 (Development of a Multiple Templates Method segmenting object ID number far visual inspection in FA process)

  • 강동중;유동훈;김문조
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.579-582
    • /
    • 2003
  • 본 논문은 열화된 영상에서 문자 패턴의 자동 분할을 위해 농담정규화상관(NGC)법과 다중 템플릿을 이용하는 알고리즘을 제안한다. 기존의 NGC를 사용하는 검사 알고리즘은 환경조건의 영향으로 검사 영상의 획득이 불완전하다면 정합의 부독율(rejection rate)이 높아진다. 다중 템플릿의 상관관계를 이용하는 제안된 방법은 가시화가 졸지 않은 경우에도 문자부와 배경부를 효과적으로 분할하며, 이러한 방법을 실제 자동화 공정에서 획득된 영상을 이용하여 제안된 알고리즘을 적용하는 것을 목표로 한다.

  • PDF

거리반경기반 대표문자열 문제의 NP-완전 (The Consensus String Problem based on Radius is NP-complete)

  • 나중채;심정섭
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권3호
    • /
    • pp.135-139
    • /
    • 2009
  • 여러 문자열들을 비교하여 유사성 또는 거리(오차)를 계산하는 문제는 패턴매칭, 웹검색 바이오인포매틱스, 컴퓨터 보안 등 다양한 응용 분야와의 연관성으로 인해 활발히 연구되어 왔다. 주어진 문자열 집합 내의 여러 문자열들의 거리를 비교하기 위해 주어진 집합 내의 모든 문자열들을 대표하는 한 문자열(대표문자열)을 찾는 방법이 있다. 대표문자열 방법은 주어진 문자열 집합과 가장 유사한 한 문자열을 찾는 방법으로 주로 이용되는 목적함수는 거리반경과 거리합이 있다. 거리반경은 집합 내의 문자열들과 특정 문자열과의 거리들의 최대값으로 정의되며, 모든 문자열들 중에서 최소의 거리반경을 만드는 문자열을 주어진 문자열 집합에 대한 거리반경기반 대표문자열이라 한다. 거리합은 집합 내의 문자열들과 특정 문자열과의 거리들의 합으로 정의되며, 모든 문자열들 중에서 최소의 거리합을 만드는 문자열을 주어진 문자열집합에 대한 거리합기반 대표문자열이라 한다. 본 논문에서는 메트릭 거리함수에 대해 거리반경기반 대표문자열 문제가 NP-완전임을 증명한다.

변형에 무관한 필기체 문자 인식을 위한 퍼지 신경망과 학습 알고리즘 (A Novel Fuzzy Neural Network and Learning Algorithm for Invariant Handwritten Character Recognition)

  • 유정수
    • 정보교육학회논문지
    • /
    • 제1권1호
    • /
    • pp.28-37
    • /
    • 1997
  • 본 논문에서는 퍼지 집합을 기반으로한 새로운 신경망에 대해 기술하고 있다. 새로운 퍼지 신경망은 변형에 영향을 받지 않는 문자 인식을 적용하였다. 퍼지 신경망은 5개 층으로 구성되어 있다. 구현 결과 왜곡, 이동, 회전 및 필기체 문자의 크기가 서로 달라도 문자들을 정확하게 인식함을 보였다. 잡은(8${\sim}$30%)이 있는 경우에도 정확하게 인식을 하였다. 이동, 왜곡, 서로 다른 문자 크기 및 잡음은 L2 층에 의해서 이루어 졌으며, 회전에 영향을 받지 않게 하기 위해서 L5층을 구성하였다. 퍼지 신경망을 훈련하기 위해서 108개 문자를 사용하였으며 훈련 패턴에서 1- 또는 2-픽셀의 이동이 있는 경우에도 100%의 인식률을 보였다. ${\pm}20^{\circ}$ 도 정도 회전된 문자인 경우에는 정확하게 인식하였다. 또한 제안된 퍼지 신경망은 학습된 문자인 경우 100% 인식률을 가지고 recall하였다. 제안된 퍼지 신경망은 구조가 간단하고 학습 속도와 recall속도가 매우 빨랐다. 본 퍼지 신경망은 필기체 문자열의 분할과 인식에도 적용하였다.

  • PDF

자연 이미지에서 명암차이를 이용한 MSER 기반의 문자 검출 기법 (MSER-based Character detection using contrast differences in natural images)

  • 김준혁;이상훈;이강성;김기봉
    • 한국융합학회논문지
    • /
    • 제10권5호
    • /
    • pp.27-34
    • /
    • 2019
  • 본 논문에서는 문자 영역의 패턴을 분석하여 배경 영역을 제거하는 방법을 제안하였다. 명암이 일정한 영역을 구분하는 MSER(Maximally Stable External Regions)방법의 문자 검출에서는 배경 영역이 포함되어 검출되었다. 이러한 문제점을 해결하기 위해 자연 이미지에서 MSER 방법을 사용하여 명암 값이 차이가 나는 영역과 차이가 나지 않는 영역 즉 문자 영역과 배경 영역을 구해 변화율을 계산하여 배경을 제거하였다. 그러나 배경이 제거된 이미지에서 일부 제거되지 않는 배경 영역이 생겨 LBP(Local Binary Patterns)방법을 사용하여 이미지에서 균일한 값을 갖는 영역을 문자 영역이라고 판단하고 문자를 검출하였다. 실험 데이터는 배경이 단순한 이미지, 문자가 정면으로 구성된 이미지, 문자가 기울어진 이미지 등의 다양한 자연 이미지를 실험하였다. 제안하는 방법을 기존의 MSER, MSER+LBP 방법의 문자 검출 방법과 비교하였을 때 약 1.73%로 높은 검출률을 보였다.

동일한 입력 문자를 가지는 상태의 병합을 통한 메모리 효율적인 결정적 유한 오토마타 구현 (Design of Memory-Efficient Deterministic Finite Automata by Merging States With The Same Input Character)

  • 최윤호
    • 정보보호학회논문지
    • /
    • 제23권3호
    • /
    • pp.395-404
    • /
    • 2013
  • 패턴 정합 알고리듬은 침입 탐지 및 방지 시스템의 성능을 좌우하는 중요한 기능 요소로서 일반적으로 정규 표현식(Regualr Expressions)을 사용해 패턴을 표현한다. 공격 패턴이 복잡해지고 다양해짐에 따라, 정규 표현식 또한 복잡해지고 그 수가 증가하고 있으며 이로 인해, 패턴 매칭 알고리듬에서 정규 표현식을 인식하기 위해 사용된 결정적 유한 오토마타(Deterministic Finite Automata)를 구성하는 상태가 폭발적으로 증가(states blowup)하고 있다. 이러한 상태의 폭발적 증가 문제를 해결하고 메모리 효율적인 자료 구조를 구현하기 위해 많은 연구가 이루어졌다. 대부분의 연구 결과들에서는 하나의 정규 표현식을 변환한 결정적 유한 오토마톤(Automaton) 내 상태의 수를 감소시키기 위한 효과적인 방안들을 제안하였다. 하지만, 이들 연구 결과는 단일 패턴 내 상태의 수만을 감소시킬 뿐 패턴의 수에 따라 증가하는 상태의 수를 감소시키지 못하는 한계점을 가지고 있다. 본 논문에서는 이를 해결하기 위해 정규 표현식으로 구성된 유한 오토마타(Automata) 상의 상태 병합을 통한 상태 감소 방안을 제안한다. 이는 동일한 입력 문자를 가지는 상태를 병합함으로써 유한 오토마타 상의 상태의 수를 감소시켜, 기존 결정적 유한 오토마타에 비해 평균 40.0%의 메모리 감소 효과를 나타낸다.

자소 접촉특성 분석에 의한 한글패턴의 부분분리 및 인식 (Separation of Subpatern and Recognition of Hanguel Patterns by Analysis of Feature of Contacting Phonemes)

  • 고찬;진용옥
    • 한국통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.618-627
    • /
    • 1990
  • 본 논문은 한글문자 인식을 위하여 새로운 접촉소자의 분리 및 자획연결 특징추출 알고리즘을 제안하였다. 자소 접촉특징을 분석하여 자소접촉 형태별로 분류하고 자획연결특징 추출, 접촉자소의 분리, 문자형식 분류를 시행한다. 분리된 자소로부터 설정된 표준패턴으로 정규화하고 자소별 굴곡특징의 상대위치값으로 부터의 특징을 입력패턴으로 신경망을 이용하여 인식 실험을 하였다. 여기에서의 학습은 BEP 알고리즘을 이용하였다. 접촉자소의 분리, 형식분리, 자획연결특징 추출 및 인식 실험에서 제안된 알고리즘이 좋은 결과를 나타내었다.

  • PDF