• 제목/요약/키워드: 레이블링 알고리즘

검색결과 92건 처리시간 0.03초

복합 레이블을 적용한 한국어 구문 규칙 (Korean Syntactic Rules using Composite Labels)

  • 김성용;이공주;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.235-244
    • /
    • 2004
  • 본 논문에서는 한국어 구문 분석 및 구문 트리 표현을 위한 복합 레이블 생성 방법을 제안한다. 기존의 구문 트리 표현에서는 미리 정의된 구문 트리 레이블을 사용하여 구문 정보를 표현하였다. 본 논문에서는 이진 규칙하에서 품사태그 정보만을 이용하여 구문 레이블을 자동으로 생성하는 방법을 제시한다. 제안된 구문 레이블은 두 개의 하위 구성체의 품사정보를 적절히 구성하여 형성되며, 동시에 현 구성체의 상태 및 역할 정보를 표현할 수 있도록 고안되었다. 이와 같이 함으로써 품사태그 정보가 가지고 있는 정보를 그대로 구문 트리에 반영시킬 수 있었다. 또한, 품사 정보와 이진규칙만을 이용하여 구문 트리를 표현하기 때문에, 다양한 구문 규칙을 채택하고 있는 서로 다른 구문 분석기의 결과를 정규화 하는 데 적용할 수 있을 것이며, 일본어와 같은 다른 언어에도 쉽게 적용 가능하다. 약 31,080 문장에 대한 구문 분석의 결과, 79.30%의 정확도를 얻을 수 있었으며, 이는 제안된 구문 트리 표현 방법이 구문 분석기의 효율에도 좋은 영향을 미침을 보이는 것이다.

악성코드 분석의 Ground-Truth 향상을 위한 Unified Labeling과 Fine-Grained 검증 (Unified Labeling and Fine-Grained Verification for Improving Ground-Truth of Malware Analysis)

  • 오상진;박래현;권태경
    • 정보보호학회논문지
    • /
    • 제29권3호
    • /
    • pp.549-555
    • /
    • 2019
  • 최근 AV 벤더들의 악성코드 동향 보고서에 따르면 신종, 변종 악성코드의 출현 개수가 기하급수적으로 증가하고 있다. 이에 따라 분석 속도가 떨어지는 수동적 분석방법을 대체하고자 기계학습을 적용하는 악성코드 분석 연구가 활발히 연구되고 있다. 하지만 지도학습기반의 기계학습을 이용할 때 많은 연구에서 AV 벤더가 제공하는 신뢰성이 낮은 악성코드 패밀리명을 레이블로 사용하고 있다. 이와 같이 악성코드 레이블의 낮은 신뢰성 문제를 해결하기 위해 본 논문에서는 새로운 레이블링 기법인 "Unified Labeling"을 소개하고 나아가 Fine-grained 방식의 특징 분석을 통해 악성 행위 유사성을 검증한다. 본 연구의 검증을 위해 다양한 기반의 클러스터링 알고리즘을 이용하여 기존의 레이블링 기법과 비교하였다.

차량번호판 색상모델에 의한 번호판 영역분할 알고리즘 (An Algorithm for Segmenting the License Plate Region of a Vehicle Using a Color Model)

  • 전영민;차정희
    • 전자공학회논문지CI
    • /
    • 제43권2호
    • /
    • pp.21-32
    • /
    • 2006
  • 번호판인식은 번호판 영역분할, 개별문자 추출, 문자 인식의 세 가지 핵심부분으로 구성된다. 이 가운데 번호판 영역분할의 정확성은 전체 인식률을 결정한다. 본 논문에서는 다양한 도로주변 환경을 고려해야하는 불법주정차 무인단속 현장으로부터 획득된 영상에서 차량의 번호판 영역을 정확하고 빠르게 분할하는 방법을 제안한다. 접근방법은 현장영상으로부터 번호판영역의 분할성능을 높이기 위하여 번호판색상의 수학적 모델을 제시하고, 이를 이용한 이진화를 수행하며, Gaussian Smoothing과 Double Threshold을 이용한 잡영제거, 1-패스 경계추적 레이블링 및 레이블링 이후 MBR을 이용한 번호판 영역후보 판정과 판정된 번호판 영역후보에서 개별문자 추출을 통한 번호판영역 검증과정을 통해 최종적으로 번호판영역을 분할하는 방법이다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역분할 실패의 문제점을 해결하고 시간소요의 문제를 실시간 안에 처리함으로서 실용적 응용이 가능하게 되었다.

Haar-like Feature 및 CLNF 알고리즘을 이용한 차량 번호판 인식 (A Vehicle License Plate Recognition Using the Haar-like Feature and CLNF Algorithm)

  • 박승현;조성원
    • 스마트미디어저널
    • /
    • 제5권1호
    • /
    • pp.15-23
    • /
    • 2016
  • 본 논문은 한국의 차량 번호판 인식에 효과적인 방법을 제안한다. 획득한 자동차 이미지로부터 Haar-Like Feature를 이용해 대략적인 번호판 후보 영역을 찾아낸 후, 랭크 필터를 사용하여 전처리를 하고 캐니 에지 추출 (Canny Edge Detecting) 알고리즘을 이용하여 연결된 사각형을 찾아 번호판을 추출한다. 추출된 번호판의 색상 정보를 이용하여 흰색/녹색 번호판을 구분하고, 각 번호판을 OTSU 이진화와 주변 전경 픽셀 전파 알고리즘인 CLNF (CCLUF with NFPP)을 통해 문자를 제외한 잡음을 제거하고 레이블링하여 숫자 및 문자 영역을 분리한다. 분리된 문자 영역은 메쉬 방법 및 세선화 후 X-Y 투영 방법으로 특징 벡터를 추출한다. 추출된 특징 벡터는 역전파 알고리즘을 사용하여 학습된 신경망을 이용하여 문자 인식을 수행한다. 제안된 차량 번호판 인식 알고리즘의 효과적 동작은 실험을 통해 확인하였다.

표정 인식을 위한 얼굴의 표정 특징 추출 (Facial Expression Feature Extraction for Expression Recognition)

  • 김영일;김정훈;홍석근;조석제
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.537-540
    • /
    • 2005
  • 본 논문에서는 사람의 감정, 건강상태, 정신상태등 다양한 정보를 포함하고 있는 웃음, 슬픔, 졸림, 놀람, 윙크, 무표정 등의 표정을 인식하기 위한 표정의 특징이 되는 얼굴의 국부적 요소인 눈과 입을 검출하여 표정의 특징을 추출한다. 표정 특징의 추출을 위한 전체적인 알고리즘 과정으로는 입력영상으로부터 칼라 정보를 이용하여 얼굴 영역을 검출하여 얼굴에서 특징점의 위치 정보를 이용하여 국부적 요소인 특징점 눈과 입을 추출한다. 이러한 특징점 추출 과정에서는 에지, 이진화, 모폴로지, 레이블링 등의 전처리 알고리즘을 적용한다. 레이블 영역의 크기를 이용하여 얼굴에서 눈, 눈썹, 코, 입 등의 1차 특징점을 추출하고 누적 히스토그램 값과 구조적인 위치 관계를 이용하여 2차 특징점 추출 과정을 거쳐 정확한 눈과 입을 추출한다. 표정 변화에 대한 표정의 특징을 정량적으로 측정하기 위해 추출된 특징점 눈과 입의 눈과 입의 크기와 면적, 미간 사이의 거리 그리고 눈에서 입까지의 거리 등 기하학적 정보를 이용하여 6가지 표정에 대한 표정의 특징을 추출한다.

  • PDF

최적 문턱치 설정을 이용한 포탈영상에서의 자동 에지탐지 기법에 관한 연구 (Automated radiation field edge detection in portal image using optimal threshold value)

  • 허수진
    • 대한의용생체공학회:의공학회지
    • /
    • 제16권3호
    • /
    • pp.337-344
    • /
    • 1995
  • 방사선 치료에 있어서 치료전 및 치료도중에 치료부위를 확인하기 위한 수단으로 보편적으로 사용되고 있는 포탈필름은 높은 에너지를 이용하여 촬영되는 것이므로 영상이 매우 흐리며 어둡다는 구조적인 문제점이 있다. 이러한 영상을 개선하기 위하여는 치료필드와 그 주변필드로 영상을 먼저 분할한 후, 각 필드 별로 영상처리를 해야만 한다. 본 연구에서는 소벨 탐지자, 레이블링 기법을 이용하여 최적의 문턱치를 찾아내어 포탈영상을 분할 한 후 형태학적 세선화기법들을 적용하여 포탈영상 분할하는 알고리즘을 제안하였다. 이 알고리즘은 포탈영상에서 불필요한 에지들은 제거하고 치료필드 에지만을 탐지하며 촬영조건이 수시로 변하는 임상적 환경에서 얻어지는 포탈영상들에 적용하여도 균일한 결과를 얻을 수 있다.

  • PDF

비디오에서 오정색과 오간색 식별 (Identification of 5-Jung-color and 5-Kan-color In Video)

  • 신성윤;표성배
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.103-109
    • /
    • 2010
  • 색이란 인간이 조형 활동을 처음 시작할 때부터 사용되어진 조형언어로서 인간이 눈으로 볼 수 있는 모든 현상 세계에 존재하는 것이다. 본 논문에서는 장면 전환 검출에서 추출된 대표 프레임을 대상으로 한국의 전통색 조화를 식별한다. 전통색은 오정색과 오간색으로 분류하여 조화를 이루는지 판별하도록 한다. 빨강, 파랑, 노랑, 검정, 흰색을 오정색이라 부르고 분홍, 하늘색, 보라, 유황색, 초록을오 간색이라 하여 식별한다. 먼저, Canny 알고리즘을 이용하여 경계선을 추출한다. 그리고 경계선을 중심으로 색들을 레이블링 하고 클러스터링 한다. 마지막으로, 전통 색채 조화 식별 방법을 이용하여 전통색을 식별한다. 본 논문에서 제시한 연구는 실험을 통하여 우수성이 입증 되었다.

칼라 정보를 이용한 얼굴 영역 검출 및 Gabor Filter 에 의한 영역 검증에 관한 연구 (A Study on a Face Detection Using Color Information and Gabor Filter)

  • 한재성;이경무
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.861-864
    • /
    • 2000
  • 본 논문에서는 물체의 고유 칼라 정보 복원을 통하여 조명의 영향을 받지 않는 칼라 기반 얼굴검출 기법을 제안한다. 즉 주위 조명 영향으로부터 RGB 성분 계수를 파악하여 조명 성분에 영향을 받은 성분을 상쇄시키고, 색포화도와 밝기값 보상을 통해 고유 칼라를 복원(color recover)하는 실험을 하였고, 복원된 영상을 YCbCr 좌표계로 변환시킨 후, CbCr 각각에 대해 살색 성분이 나타내는 일정한 범위내의 부분을 검출하였다. 또한 이 진화 과정에서 생긴 잡음들을 형태학적인 모폴로지 필터를 통해 제거하였으며, 살색 후보 영역 중 같은 영역들은 레이블링하여 얼굴 후보 영역을 생성하였다. 그러나 칼라 정보만으로는 검출된 영역이 얼굴인지를 판단하기가 매우 어렵다. 그러므로 본 연구에서는 인간시각에 기반한 Gabor 필터를 사용하여, 검출된 살색 영역이 최종적으로 얼굴인지를 판별하는 효율적인 알고리즘을 제안한다.

  • PDF

통계적 모델에 의한 연속 숫자음의 인식 기술개발 (Development of Continuous Spoken Digit Recognition System using Statistical Model)

  • 이강성;안태옥;김순협
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.154-158
    • /
    • 1989
  • 본 연구는 통제적 모델에 의한 연속 숫자음의 인식에 관한 것으로 4 연속 숫자음을 인식 대상으로하여 실험한다. 시스템은 크게 음향 음성 처리부 및 어휘 해석부 두 부분으로 나뉜다. 음향 음성 처리부에서는 입력 음성으로부터 특정 벡터인 12차의 LPC cepstrum 계수를 구하여, 프레임 레이블링과 소음소 레이블링 (phone labelling)을 한다. 프레임 레이블링인 베이스 분류법을 이용하였으며, 소음소 레이블링은 프레임 레이블과 사후확률 (posteriori probability)로 부터 이루어 졌다. 어휘 해석부분에서는 소음소 단위를 입력으로 받아 음운규칙을 통해 작성된 소음소 망을 거쳐 연속 숫자음 출력을 얻도록 했다. 본실험은 화자 3 명이 발음한 35 개의 4 연속 숫자음을 인식 대상으로 하였으며, 4 연속 숫자음을 평가단위로 80%의 인식율을 얻었고, 각 숫자음의 음절을 단위로 95%의 인식율을 얻어 제시한 알고리즘의 유효성을 입증하였다.

  • PDF

음절의 의미역 태그 분포를 이용한 Bidirectional LSTM CRFs 기반의 한국어 의미역 결정 (Korean Semantic Role Labeling Based on Bidirectional LSTM CRFs Using the Semantic Label Distribution of Syllables)

  • 윤정민;배경만;고영중
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.324-329
    • /
    • 2016
  • 의미역 결정은 자연어 문장의 서술어와 그 서술어에 속하는 논항들 사이의 의미관계를 결정하는 것이다. 최근 의미역 결정 연구에는 의미역 말뭉치와 기계학습 알고리즘을 이용한 연구가 주를 이루고 있다. 본 논문에서는 순차적 레이블링 영역에서 좋은 성능을 보이고 있는 Bidirectional LSTM-CRFs 기반으로 음절의 의미역 태그 분포를 고려한 의미역 결정 모델을 제안한다. 제안한 음절의 의미역 태그 분포를 고려한 의미역 결정 모델은 분포가 고려되지 않은 모델에 비해 2.41%p 향상된 66.13%의 의미역 결정 성능을 보였다.

  • PDF