• 제목/요약/키워드: extraction of feature

검색결과 2,579건 처리시간 0.028초

특징점과 필터뱅크에 기반한 적응적 혼합형 지문정합 방법 (Adaptive Hybrid Fingerprint Matching Method Based on Minutiae and Filterbank)

  • 정석재;박상현;문성림;김동윤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권7호
    • /
    • pp.959-967
    • /
    • 2004
  • Jain 등은 한 지문 영상에 특징점 기반 지문 정합 방법과 필터뱅크 기반 지문 정합 방법을 적용해 두 정합 방법의 성능을 혼합하는 혼합형 지문정합 방법을 제안하고, 이 방법이 두 가지 각 정합 방법에 비해 높은 성능을 보인다는 것을 실험을 통해 입증하였다[l]. 그러나 이 방법은 혼합을 수행할 때 두 정합 방법을 별도로 수행한 후, 각 방법의 정합도(matching score)에 가중치를 부여해 최종 정합도를 결정하므로 두 정합 방법의 특성을 상쇄 시키는 결과를 얻게 된다. 본 논문에서는 두 가지 정합 방법을 특징값 추출 과정에서 혼합하는 방법을 제안하였다. 이 방법은 필터뱅크 기반 방법보다는 낮은 ERR(Equal eRror Rate)을 보이나 특징점 기반 방법보다 높은 ERR을 보였다. 이에 본 논문에서는 적응적인 정합도 혼합방법을 제안하여, 두 가지 방법의 특성을 살리도록 적응적으로 정합도를 선택하는 방법을 취했다. 이 방법을 이용해 Jain 등의 혼합형 방법보다 더 낮은 ERR을 얻을 수 있었다. 제안한 방법에 따라 NIST Special Database 14 지문 데이타로 실험한 결과 ERR에서 약 1%의 성능 향상을 보였다.

Haar-like 특징을 이용한 고성능 보행자 및 차량 인식 회로 설계 (Design of High-performance Pedestrian and Vehicle Detection Circuit using Haar-like Features)

  • 김수진;박상균;이선영;조경순
    • 정보처리학회논문지A
    • /
    • 제19A권4호
    • /
    • pp.175-180
    • /
    • 2012
  • 본 논문은 Haar-like 특징을 이용한 고성능 보행자 및 차량 인식 회로를 제안한다. 제안하는 회로는 영상의 매 프레임 마다 슬라이딩 윈도우를 적용하여 Haar-like 특징을 추출하고 보행자 및 차량을 인식한다. Haar-like 특징 추출 회로는 슬라이딩 윈도우 당 200개의 Haar-like 특징을 추출하며, 추출된 특징들은 AdaBoost 인식 회로에서 사용된다. 제안하는 회로는 속도 향상을 위해 병렬 회로 구조를 적용하였으며 두 개의 슬라이딩 윈도우가 동시에 보행자 또는 차량을 인식한다. 제안하는 고성능 보행자 및 차량 인식 회로는 Verilog HDL로 설계하였으며 130nm 표준 셀 라이브러리를 이용하여 게이트 수준의 회로로 합성하였다. 합성된 회로는 1,388,260개의 게이트로 구성되며 최대 동작 주파수는 203MHz이다. 제안하는 회로는 $640{\times}480$ 영상을 초당 약 47.8장 처리할 수 있기 때문에 보행자와 차량을 실시간으로 인식하기 위해 사용될 수 있다.

Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구 (A Study on Image Generation from Sentence Embedding Applying Self-Attention)

  • 유경호;노주현;홍택은;김형주;김판구
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.63-69
    • /
    • 2021
  • 사람이 어떤 문장을 보고 그 문장에 대해 이해하는 것은 문장 안에서 주요한 단어를 이미지로 연상시켜 그 문장에 대해 이해한다. 이러한 연상과정을 컴퓨터가 할 수 있도록 하는 것을 text-to-image라고 한다. 기존 딥 러닝 기반 text-to-image 모델은 Convolutional Neural Network(CNN)-Long Short Term Memory(LSTM), bi-directional LSTM을 사용하여 텍스트의 특징을 추출하고, GAN에 입력으로 하여 이미지를 생성한다. 기존 text-to-image 모델은 텍스트 특징 추출에서 기본적인 임베딩을 사용하였으며, 여러 모듈을 사용하여 이미지를 생성하므로 학습 시간이 오래 걸린다. 따라서 본 연구에서는 자연어 처리분야에서 성능 향상을 보인 어텐션 메커니즘(Attention Mechanism)을 문장 임베딩에 사용하여 특징을 추출하고, 추출된 특징을 GAN에 입력하여 이미지를 생성하는 방법을 제안한다. 실험 결과 기존 연구에서 사용되는 모델보다 inception score가 높았으며 육안으로 판단하였을 때 입력된 문장에서 특징을 잘 표현하는 이미지를 생성하였다. 또한, 긴 문장이 입력되었을 때에도 문장을 잘 표현하는 이미지를 생성하였다.

Mask R-CNN과 Dense-Net을 이용한 제조 현장에서의 작업자 행동 추출 (Extraction of Worker Behavior at Manufacturing Site using Mask R-CNN and Dense-Net)

  • 리타 리자얀티;황민태;진교홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.150-153
    • /
    • 2022
  • 본 논문은 작업자와 객체들이 서로 혼재되어 있는 제조 현장에서 Mask R-CNN을 이용해 객체들을 탐지한 후 이를 Dense-Net을 통해 객체 형상을 자동으로 추출하는 기술을 담고 있다. 이는 맞춤형 공장 데이터 세트를 기반으로 하며, 대상이 되는 객체는 작업자, 기계, 도구, 컨트롤 박스 및 제품들이다. Mask R-CNN은 이미 잘 알려진 객체 인식 방식으로서 다중 객체 인식을 지원하며, Dense-Net은 중첩된 객체들로 부터 개별 객체를 추출하는 데 탁월한 효과를 보여준다. 이러한 두 가지 기술을 이용한 기초구현 결과 제조 현장 모습에서 객체들을 정상적으로 추출해 이미지를 설명할 수 있으며, 향후 객체에 대한 레이블링과 객체 간의 상호 관계를 추가해 작업자의 이상 행동을 감지하는 용도로 활용할 계획이다.

  • PDF

포만트 기반의 가우시안 분포를 가지는 필터뱅크를 이용한 멜-주파수 켑스트럴 계수 (Mel-Frequency Cepstral Coefficients Using Formants-Based Gaussian Distribution Filterbank)

  • 손영우;홍재근
    • 한국음향학회지
    • /
    • 제25권8호
    • /
    • pp.370-374
    • /
    • 2006
  • 음성인식의 특징벡터로서 멜-주파수 켑스트럴 계수 (MFCC, mel-frequency cepstral coefficients)가 가장 널리 사용되고 있다. FMCC 추출과정은 입력되는 음성신호를 푸리에 변환한 후, 주파수 대역별로 필터를 취하여 에너지 값을 구하고 이산 코사인 변환을 하여 그 계수 값을 구한다. 본 논문에서는 멜-스케일 된 주파수 대역필터를 취할 때 가중함수에 의해서 구해진 각 대역필터별 가중치를 적용하여 필터의 출력 에너지를 계산한다. 여기서 가중치를 구하기 위해 사용된 가중함수는 포만트가 존재하는 대역을 중심으로 인접한 대역들이 가우시안 분포를 가지는 함수이다. 제안한 방법으로 실험한 결과, 잡음이 거의 없는 음성신호에 대해서는 기존의 MFCC를 사용했을 때와 비슷한 인식률을 보이고 잡음성분이 많을수록 가중치가 적용된 방법이 인식률에서 보다 높은 성능 향상을 가져온다.

상황인지 음악추천을 위한 음악 분위기 검출 (Detection of Music Mood for Context-aware Music Recommendation)

  • 이종인;여동규;김병만
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.263-274
    • /
    • 2010
  • 상황인지 음악추천 서비스를 제공하기 위해서는 무엇보다 상황 또는 문맥에 따라 사용자가 선호하는 음악의 분위기를 파악할 필요가 있다. 음악 분위기 검출에 대한 기존 연구의 대부분은 수작업으로 대표구간을 선정하고, 그 구간의 특징을 이용하여 분위기를 판별한다. 이러한 접근 방법은 분류 성능이 좋은 반면 전문가의 간섭을 요구하기 때문에 새로운 음악에 대해서는 적용하기 어렵다. 더욱이, 곡의 진행에 따라 음악 분위기가 달라지기 때문에 음악의 대표 분위기를 검출하는 것이 더욱 어려워진다. 본 논문에서는 이러한 문제점들을 보완하기 위해 음악 분위기를 자동으로 판별하는 새로운 방법을 제안하였다. 먼저 곡 전체를 구조적 분석 방법을 통하여 비슷한 특성을 갖는 세그먼트들로 분리한 후 각각에 대해 분위기를 판별한다. 그리고 세그먼트별 분위기 파악 시 Thayer 의 2차원 분위기 모델에 기초한 회귀분석 방법으로 개인별 주관적 분위기 성향을 모델링하였다. 실험결과, 제안된 방법이 80% 이상의 정확도를 보였다.

스테레오 영상과 준원근 카메라 모델을 이용한 객체의 3차원 형태 및 움직임 복원 (3D Object's shape and motion recovery using stereo image and Paraperspective Camera Model)

  • 김상훈
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.135-142
    • /
    • 2003
  • 본 논문은 영상내 객체정보의 정확한 복원을 위하여, 연속된 2차원 영상으로부터 특정 객체의 특징점을 추출하고, 특징점의 위치 데이터들로부터 원형의 3차원 모양 및 모션 정보를 복원하는 알고리즘과 결과를 제시하였다. 2차원 영상의 특징점 검출을 위해서는 물체와 배경이 명확히 구별되는 실험영상 환경에서 색상변환을 통한 자동 추출 방법을 사용하였다. 추출된 2차원 객체의 특징점들로부터 3차원 모앙, 움직임 정보를 복원하기 위하여 스테레오 카메라와 준원근 카메라 모델을 적용하고 SVD(SinEuiar Value Decomposition)에 의한 인수분해연산을 수행하였다. 준원근 카메라 모델의 근본적인 문제인 깊이정보의 복원 에러가, 스테리오 영상 분석에 의해 최소화 되었다. 본 논문에서 제시된 방법들의 성능을 객관적으로 평가하기 위하여 크기와 위치가 알려진 3차원 물체에 대해 실험을 행하였으며, 영상의 21개 특징점 위치와 공간상에서의 3개 방향으로의 움직임 각도를 연산에 의해 복원한 후 원형의 데이터와 비교하여 본 알고리즘의 정확성을 증명하였다.

수정된 영상 유도 기법을 통한 융합영상의 분광정보 향상 알고리즘 (Spectral Quality Enhancement of Pan-Sharpened Satellite Image by Using Modified Induction Technique)

  • 최재완;김형태
    • 대한공간정보학회지
    • /
    • 제16권3호
    • /
    • pp.15-20
    • /
    • 2008
  • IKONOS-2, QuickBird, KOMPSAT-2와 같은 고해상도 위성영상은 높은 공간해상도의 흑백영상과 멀티스펙트럴 영상을 동시에 제공하고 있다. 영상융합은 서로 다른 공간, 분광해상도를 가지는 영상을 이용하여 두 개의 장점을 모두 가지는 영상으로 재구성하는 것을 의미하며 위성영상을 영상의 시각화, 개체 추출 등에 더욱 효과적으로 사용할 수 있도록 한다는 점에서 중요한 연구분야이다. 이를 위해 많은 영상융합 알고리즘이 제안되었지만, 대부분 의 알고리즘들은 융합 후에 원 멀티스펙트럴 영상의 분광정보를 효과적으로 보존하지 못하는 문제점을 가지고 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 수정된 영상 유도 기법을 통하여 융합영상의 분광왜곡량을 줄이는 알고리즘을 제안하였다. 원 멀티스펙트럴 영상과 해상도를 낮춘 융합영상과의 비교 분석을 통하여 융합영상의 분광 정보 왜곡량을 보정하도록 유도기법을 조정하였다. QuickBird 영상에 적용한 결과, 다양한 융합영상들이 본 알고리즘을 적용할 경우에 분광왜곡량이 줄어드는 것을 확인할 수 있었다.

  • PDF

개인 정보가 노출된 목표 객체의 블로킹 알고리즘 (A Blocking Algorithm of a Target Object with Exposed Privacy Information)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.43-49
    • /
    • 2019
  • 초고속의 유무선 인터넷은 다양한 형태의 미디어 데이터를 손쉽게 획득할 수 있는 유용한 창구이다. 이에 반해, 일반인들이 개인 정보가 노출된 대상 객체를 포함하고 있는 미디어 데이터까지도 인터넷을 통해 용이하게 획득할 수 있으므로 사회적으로 문제가 되고 있다. 본 논문에서는 입력되는 여러 가지 종류의 영상으로부터 개인 정보가 노출된 대상 객체를 학습 알고리즘을 이용해 강인하게 검출하고, 검출된 대상 객체 영역을 효과적으로 블로킹하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 뉴럴 네크워크 기반의 학습 알고리즘을 사용해 영상으로부터 개인 정보를 포함하고 있는 대상 객체만을 검출한다. 그런 다음, 격자형 모자이크를 생성해 이전 단계에서 검출된 대상 객체 영역 위에 오버랩함으로써 개인 정보를 포함하고 있는 객체 영역을 효과적으로 블로킹한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 영상으로부터 개인 정보가 노출된 대상 영역을 강인하게 검출하고, 검출된 영역을 모자이크 처리를 통해 효과적으로 블로킹한다는 것을 보여준다. 본 논문에서 제시된 객체 블로킹 방법은 객체 보안, 물체 추적, 영상 블로킹 등과 같은 컴퓨터 비전과 관련된 여러 응용 분야에서 유용하게 활용될 것으로 예상된다.

소셜 네트워크 상에서의 재귀적 네트워크 구조 특성을 활용한 스팸탐지 기법 (Social Network Spam Detection using Recursive Structure Features)

  • 장보연;정시현;김종권
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1231-1235
    • /
    • 2017
  • 온라인 소셜 네트워크는 정보전파의 용이성 및 파급 영향력이 높지만 이를 악의적으로 활용하기 위한 스패머들이 다수 활동 중이다. 이러한 스패머를 식별하기 위한 스팸 탐지기법 연구가 다양한 분야에서 이루어지고 있지만 스패머들 또한 스팸 내용이나 스팸링크, 활동 주기 등의 특성을 변경하여 탐지를 피하고 있다. 하지만 다른 특성들과 달리 온라인 소셜 네트워크의 고유 네트워크 특성인 링크 특성은 쉽게 변화시키는 어렵다. 따라서 본 논문에서는 이러한 네트워크의 구조적인 특성을 활용하여 스패머를 일반사용자와 구분하는 방법을 제시한다. 즉 일반사용자 노드가 주변 노드와 비슷한 네트워크 특성을 갖는 점에 주목하여 인접 노드를 활용한 재귀적인 구조적 특성을 생성하여 활용함으로써 스패머의 식별확률을 높이고 있다. 이를 검증하기 위한 실험은 트위터의 실제 데이터셋을 Weka 프로그램에 탑재된 랜덤포레스트 알고리즘을 활용하여 측정하였으며, 재귀적인 특성을 활용하지 않는 방법과 기존 제안 알고리즘에 비해 탐지율이 0.82에서 0.90으로 향상됨으로써 제안하는 방법이 스패머를 탐지하는데 효과적임을 제시하고 있다.