• 제목/요약/키워드: 문자패턴

검색결과 297건 처리시간 0.029초

용어를 공유하는 패턴 쌍을 이용한 의미 관계 추출 (Semantic Relation Extraction using Pattern Pairs Sharing a Term)

  • 김세종;이용훈;이종혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.221-225
    • /
    • 2009
  • 대용량 코퍼스를 사용하여 온톨로지를 구축하는 것은 해당 코퍼스에서 등장하는 용어들과 이들 간의 의미관계를 보다 자동화된 방법으로 추출하는 것으로부터 시작한다. 이때 주로 사용하는 방법이 용어들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어들을 해당 패턴에 할당된 의미 관계로 설정하는 방법이다. 하지만 기존의 패턴 기반 의미 관계 추출 방법은 한 문장만을 대상으로 패턴을 추출 및 적용하기 때문에 서로 떨어진 용어에 대한 의미 관계를 추출할 수 없다는 단점을 가지고 있다. 본 논문은 이러한 한계점에 착안하여, 의미 관계를 대표하는 각각의 용어를 하나씩 포함하고 기타 용어를 공유하고 있는 서로 떨어진 패턴 쌍을 추출하여 확장된 패턴을 생성하고 이를 의미 관계 추출에 적용하였다. 본 방법론은 is-${\alpha}$ 관계의 경우 기존 방법론 보다 7.5% 향상된 83.75%의 정확률을, part-of 관계의 경우에는 5% 향상된 동일한 83.75%의 정확률을 보였으며 상대적 재현율을 통해 실제 재현율의 향상 가능성도 함께 제시하였다.

역전파 학습 신경망을 이용한 한글 숫자 인식에 관한 연구 (A Study on the Handwritten Korean Numeric Recognition using a Backpropagation Learning Neural Network)

  • 박창민;박귀순;김대원;이동춘;김명원;배현주;차의영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.137-141
    • /
    • 1989
  • 본 논문에서는 신경망 구조의 한 모델인 feed-forward multi-layered network에 역전파 학습(back-propagation learning) 기법을 이용하여 필기체 한글 숫자를 인식하고 그 가능성을 보였다. 문자 인식에 있어 입력 대상의 모양이 왜곡되거나, 대상의 크기 혹은 위치의 변화 등과 같은 잡음 (noise)에 대해서 정확히 대상을 인식하는 데는 대상의 구조 추출에 크게 관여되므로 한글의 구조 추출에 적합하다고 생각되는 bar mask 투사법을 제안하였다. 모델의 학습을 필기체 한글 숫자 16자의 입력 패턴과 타겟 ( target) 입력의 쌍을 이용해 학습시켰다. 또한, 모델의 인식 정도를 측정해 보기 위해 시험패턴을 적용하여 훈련된 패턴과 훈련되지 않은 패턴간의 인식률을 비교하여 보았다.

  • PDF

차량 규격과 특징 패턴을 이용한 자동차 번호판 추출 (Extracting Of Car License Plate Using Motor Vehicle Regulation And Character Pattern Recognition)

  • 남기환;배철수
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.339-345
    • /
    • 2002
  • 자동차의 번호판을 인식하는 것은 차량을 식별하는데 있어서 매우 중요하다. 어두운 조명에서나 날씨가 나쁠 경우 차량의 형상이 왜곡 될 수 있고, 번호판을 식별하는데 어려움이 있다. 본 논문은 차량의 규격을 이용하여 효율적으로 번호판을 추출하는 방법을 제안한다. 이 방법에서 색상이나 형태처럼 차량의 규격을 따르는 자동차 번호판의 특징들은 번호판의 후보영역으로 결정되고, 신경망에 의해 숫자나 문자의 패턴 갖는 영역이 번호판 영역으로 인식된다. 또한 특징패턴인식의 결과로서 번호판을 확정하였다. 70개 차량영상을 실험해 본 결과 번호판 추출률에서는 84.29 %, 인식률에서는 80.81 %의 결과를 나타내었다.

차량 규격과 특징 패턴을 이용한 자동차번호판 추출 (Extracting Of Car License Plate Using Motor Vehicle Regulation And Character Pattern Recognition)

  • 이종석;남기환;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.596-599
    • /
    • 2001
  • 자동차의 번호판을 인식하는 것은 차량을 식별하는데 있어서 매우 중요하다. 어두운 조명에서나 날씨가 나쁠 경우 차량의 형상이 왜곡 될 수 있고, 번호판을 식별하는데 어려움이 있다. 본 논문은 차량의 규격을 이용하여 효율적으로 번호판을 추출하는 방법을 제안한다. 이 방법에서 색상이나 형태처럼 차량의 규격을 따르는 자동차 번호판의 특징들은 번호판의 후보영역으로 결정되고, 신경망에 의해 숫자나 문자의 패턴 갖는 영역이 번호판 영역으로 인식된다. 또한 특징패턴인식의 결과로서 번호판을 확정하였다. 70개 차량영상을 실험해 본 결과 번호판 추출률에서는 84.29 %, 인식률에서는 80.81 %의 결과를 나타내었다.

  • PDF

규칙 적용 성능을 개선하기 위한 다중 패턴매칭 기법 (A Multiple Pattern Matching Scheme to Improve Rule Application Performance)

  • 이재국;김형식
    • 정보보호학회논문지
    • /
    • 제18권3호
    • /
    • pp.79-88
    • /
    • 2008
  • 인터넷 환경에서 내부 네트워크를 보호하기 위하여 침입탐지시스템이 광범위하게 사용되고 있다. 침입탐지시스템은 비정상 패킷의 특성을 분석하여 규칙을 생성하고 이 규칙들을 이용하여 패킷들을 필터링함으로써 내부 시스템들을 보호한다. 최근 공격 사례가 많아지고, 공격 형태가 구조화되면서 이를 탐지하는 규칙의 수도 지속적으로 증가하고 있다. 이에 따라 침입탐지시스템이 규칙을 적용하는 과정에서의 성능 하락 정도도 커지고 있다. 본 논문은 규칙을 적용하는 과정에서 상대적으로 오버헤드가 큰 문자열 검색 성능을 개선하고자 복수개의 부분패턴을 이용한 다중 패턴매칭 기법을 제안한다. 그리고 대표적인 고성능의 다중 패턴매칭 알고리즘인 Wu-Manber 알고리즘과 성능을 비교하고 그 결과를 보인다.

차량 식별마크와 번호판 인식을 통한 차량인식 (Vehicle Recognition with Recognition of Vehicle Identification Mark and License Plate)

  • 이응주;김성진;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1449-1461
    • /
    • 2005
  • 본 논문에서는 차량의 식별마크 분류 및 차량번호판 인식을 통한 차량인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 먼저 입력 차량영상으로 부터 잡음제거, 세선화 과정 등 전처리 과정들을 수행하고 명암값 변화 빈도 분포를 사용하여 차량식별마크와 번호판 영역을 추출하였다. 또한 추출된 후보 영역으로부터 차량 식별마크와 번호판 영역의 구조적 특성 정보를 사용하여 차량 식별마크, 번호판의 문자 및 숫자를 분류하였으며, 하이브리드 패턴벡터 및 수직수평 패턴벡터를 사용하여 식별마크, 문자 및 숫자를 인식하여 차량 정보 인식율을 개선하였다. 제안한 알고리즘에서는 차량의 식별마크가 차량의 종류에 따라 독립적인 특성, 식별마크와 번호판 영역에서는 문자와 배경이 뚜렷하게 구별되는 특성 및 수평 및 수직빈도수 분포가 식별마크 및 번호판 이외의 영역과 뚜렷이 구별된다는 특성들을 이용하였다. 제안한 방법의 성능을 확인하기 위하여 다양한 환경에서 촬영된 350여개의 영상에 대하여 차량인식 실험을 수행하였고 제안한 방법이 차량번호판의 크기와 위치에 무관하고 잡음의 영향에 덜 민감하였을 뿐만 아니라 불규칙적인 외부환경에서도 인식율이 개선되었다. 또한 식별마크와 번호판 인식의 실시간 처리가 가능하여 실제 주차장이나 도시화도로등에 적용이 가능하다.

  • PDF

문자열 부분검색을 위한 색인기법의 설계 및 성능평가 (Design and Performance Evaluation of an Indexing Method for Partial String Searches)

  • 강승헌;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1458-1467
    • /
    • 1999
  • 신장해슁이나 B+-트리와 같은 기존의 색인구조들은 문자열의 부분검색을 지원하지 못하거나 부분검색에 제약점을 가지고 있다. 최근 웹 환경에서 동작하는 정보검색 엔진들이 사용하는 역파일의 빠른 검색성능을 가지면서 문자열 부분검색을 효율적으로 지원하는 색인기법을 제안한다. 제안된 색인기법은 기본적으로 역파일 구조이며, 2음절 단위의 패턴으로 색인을 구성함으로써 문자열 부분검색을 지원한다. 제안된 색인기법의 특성을 분석하기 위해 제안된 방법의 성능을 다양한 환경에서 실험을 통하여 비교하고 분석한다. 또한 성능평가를 위해 기존의 역파일 기법, 요약 파일 기법들과 제안하는 색인기법의 분석적 모델을 검색시간과 저장공간 측면에서 세시하고, 그 모델을 기반으로 그들의 성능을 비교한다. 분석적 비교모델을 통한 성능비교 결과, 제안된 부분검색을 위한 색인기법은 저장공간의 오버헤드는 크지만 기존 요약 파일 기법에 비해 검색성능을 상당히 향상시킨다.

  • PDF

휴대형 정보기기의 한글 및 영숫자 필기 입력 방안 (The input method of the Hangul and Alphanumeric characters for the PDAs)

  • 홍성민;국일호;조원경
    • 전자공학회논문지T
    • /
    • 제35T권3호
    • /
    • pp.53-60
    • /
    • 1998
  • 본 논문에서는 키보드를 사용하지 않는 PDA 등 휴대형 컴퓨터에서 입력의 수단으로 사용하는 온-라인 문자 인식기를 위한 문자 필기글꼴을 제안하였다. 제안된 필기글꼴은 키보드를 통하여 입력 가능한 수준의 한글 자소와 영숫자이며, 필기글꼴의 정의를 위하여 한글의 풀어쓰기 글꼴과 영문자의 PDA용 필기 패턴인 그래피티 문자를 분석하여, 한글과 영숫자 입력 모드 전환이나 필기 영역의 구분 없이 연속 필기하여도 인식 가능하도록 중복되는 글꼴을 갖지 않도록 하면서 최대한 원형을 유지하도록 하였다. 본 논문에서 제안한 필기글꼴의 타당성을 고찰하기 위하여 그래피티 문자를 알고 있는 PDA 사용자 그룹과 일반인들을 대상으로 인지도와 만족도를 조사하였다. 두 피실험 그룹의 영숫자 및 한글의 자음의 인지도 및 만족도는 98% 이상이었고 한글 모음의 경우 95% 이상의 긍정적인 반응을 얻었다.

  • PDF

현대 한국어에서 아라비안 숫자의 읽기 규칙 연구 (A Study on the Arabic numeral reading rules in Modern Korean)

  • 정영임;김정세;김상훈;이영직;윤애선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.16-23
    • /
    • 2002
  • 본 논문에서는 아라비안 숫자를 포함한 텍스트를 음성으로 합성하기 위하여, 숫자 형태와 분류사 그리고 숫자가 나오는 문맥에 따라 숫자를 자동으로 문자화할 수 있는 전처리 규칙을 설정하는데 목적을 둔다. 먼저 선행연구를 통해 숫자를 포함한 수사 및 수사표현의 읽기 규칙의 적용 범위 및 한계점을 살펴보고, 음성 합성을 위한 아라비안 숫자의 문자화 규칙을 설정하고자 한다. 현대 한국어에서 아라비안 숫자를 읽는 방식은 크게 고유어 방식과 한자어 방식이 있으며 단(單)단위에서는 영어가 사용되기도 한다. 또한 한자어 방식에서도 단위를 붙여 읽는 경우와 모든 수를 단 단위로 읽는 경우가 있으므로, 아라비안 숫자의 문자화를 단순한 규칙을 설정하여 자동화하기에는 중의성이 높다. 본 연구에서는 (1) 숫자 전 전치어(pre-numeral), (2) 기호를 포함한 숫자열의 표현 형식과 크기, (3) 단위 표현, (4) 숫자 후치어(post-numeral), (5) 분류사(classifier) (6) 분류사 후치어(post-classifier), (7) 수사표현 앞뒤 문맥에 따라, 아라비안 숫자표현이 문자화되는 방식을 살펴보았다. 분석 대상 말뭉치는 C 신문의 2000년 1월부터 2000년 4월까지 전체 기사 1,400건에서 숫자가 포함된 숫자표현 약 63,000개론 구성하였다. 패턴화된 구조 및 중의성이 없는 구조를 12가지로 밝히고 중의성이 있는 구조의 유형을 밝혔으며 분류사 후치어와의 결합 관계, 좌우 문맥정보를 통해 중의성 해결의 단서를 제시하고자 하였다.

  • PDF

경북 울진·강원 삼척 등 산불에 따른 인구 이동 패턴에 대한 탐색적 연구 (Explorative Study on Movement Patterns in Uljin-gun and Samcheok-si Wildfire Event)

  • 정지혜;황우석;표경수
    • 대한원격탐사학회지
    • /
    • 제38권6_3호
    • /
    • pp.1805-1815
    • /
    • 2022
  • 2022년에 경북 울진·강원 삼척 등 산불이 발생하였으며, 이는 국내 최장 산불 기록이었지만 인명피해가 없었다. 산불은 지역주민이 직접 피해에 노출되어 대피를 해야 하는 재난으로, 산불 발생 시 대피를 이동 수요를 예측하는 것은 재난관리의 효율성을 위해 반드시 필요하다. 본 연구는 경북 울진·강원 삼척 등 산불 발생에 따라 지역주민의 이동을 분석하여 이동 패턴을 파악하고자 하는 탐색적 연구이다. 이를 위하여 SKT 유동인구 데이터를 활용하였으며, 경북 울진군 및 강원 삼척시의 인구 이동 패턴을 분석하였다. 주요한 연구 결과로는 첫째, 경북 울진군과 강원 삼척시 모두 거주인구 및 방문인구가 감소하는 인구 이동 패턴을 보였으나, 직장인구의 인구이동은 평상시와 유사한 것으로 나타났다. 둘째, 산불의 발화지인 경북 울진군 북면의 거주인구들은 산불을 피해 주변 지역으로 이동하는 것으로 나타났다. 셋째, 이동한 지역은 산불에서 안전하다고 판단되는 지역이며, 이때 긴급재난문자와의 관련성이 있는 것으로 나타났다. 본 연구는 산불이 발생한 지역의 인구가 산불에 대피하기 위해 이동하는 패턴을 양적 데이터인 유동인구 데이터를 통해 확인하였다는 의의를 지닌다. 또한 산불 발생 시 피해를 최소화하기 위하여 주민들에게 긴급재난문자를 통한 대피소 안내가 중요함을 시사한다.