• Title/Summary/Keyword: 특징값 추출

검색결과 947건 처리시간 0.03초

균일한 부류 확률값 학습을 통한 도메인 일반화 (Domain Generalization via Class Balanced Probability Learning)

  • 윤성준;심규진;김창익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.103-105
    • /
    • 2020
  • 본 논문에서는, 영상 분류 문제에서 손실 값 계산 시 정답 부류를 제외한 나머지 부류에서 우세한 결괏값이 나오지 않도록 평활화하는 보조적인 손실함수를 고안한다. 합성곱 신경망 구조를 이용해 학습이 진행되면 손실함수가 작아지는 방향으로 가중치가 갱신되기 때문에, 정답을 제외한 나머지 부류들의 결괏값은 줄어든다. 하지만, 정답을 제외한 나머지 부류들 사이의 상대적인 값이 고려되지 않고 손실함수가 줄어들기 때문에 값들은 균일하지 않게 되고, 정답 부류와 유사한 특징을 가진 부류들의 값이 상대적으로 커지게 된다. 이는 정답 부류와 나머지 부류 중 가장 값이 큰 부류 사이에 공통의 특징을 공유한다고 생각할 수 있다. 정답 부류만이 가지고 있는 고유의 특징을 추출하지 못하고, 다른 부류도 가지고 있는 특징의 흔적이 남아있게 됨으로써 테스트 시 소스 도메인과 전혀 다른 도메인의 영상이 보일 때 그러한 특징이 부각 되어 부정확한 결과를 초래하게 된다. 본 논문에서는 단순한 손실함수의 추가로 도메인이 다른 환경에서 기존의 연구보다 좋은 분류 결과를 보여주는 것을 실험을 통해 확인하였다.

  • PDF

주 인자 분석을 이용한 제스처 인식에 관한 연구 (A Study on Gesture Recognition Using Principal Factor Analysis)

  • 이용재;이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.981-996
    • /
    • 2007
  • 본 논문에서는 연속적인 제스처 영상으로 부터 주 인자 분석을 통해 얻어진 동작 특징 정보를 이용하여 제스처를 인식하는 방법에 대해 기술한다. 제안된 방법은 먼저, 인간의 신체 영상이 포함된 연속적인 입력영상에서 2차원 실루엣 제스처 영역을 분할한 다음 전역특징정보와 지역특징정보를 추출한다. 여기서 전역특징정보는 요인 분석을 통하여 제스처를 효과적으로 표현하는 의미 있는 소수의 핵심 특징을 선택하여 이용한다. 추출 된 특징정보로 부터 제스처의 시간 변화를 나타내는 특징히스토리정보를 얻어 저 차원 제스처공간을 구성한다. 마지막으로 제스처 공간상에 투영된 모델 특징 값은 은닉마르코프 모델의 입력 기호로 이용되기 위해 군집화 알고리즘을 통해 특정한 상태 기호로 구성되며 임의의 입력 동작은 확률 값이 가장 높은 해당 제스처 모델로 인식된다. 주 인자 분석으로부터 제스처에 기여도가 높은 특징인자로 모델을 구성하기 때문에 외관기반방법에서 몸의 형상 정보만을 특징 값으로 이용하거나 직관적인 방법으로 특징을 추출하는 방법보다 복잡한 동작에서 비교적 우수한 인식률을 나타낸다.

  • PDF

Flexible Subblock을 이용한 영상 검색 (Image Retrieval Using flexible Subblocks)

  • 고병철;이상봉;이해성;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.353-355
    • /
    • 1999
  • 본 논문에서는 영상의 flexible subblock을 이용하여 영상내에 물체의 이동이나, 빛의 변화, 시각점(view-point)의 변화등에 덜 민감한 영상 검색을 방법을 제안한다. 특징 값으로는 Ohta 컬러 공간으로부터 1, 2, 3차 central 모멘트 값을 추출해 내고, 쌍직교 웨이블릿 변환을 통해 고주파 영역으로부터 수직-수평 방향 성분을 추출하여 인덱스화 시킴으로써 인덱스를 위한 저장 공간을 줄이고 계산 시간을 향상시킬 수 있었다. 아울러, 2개의 특징 값을 다단계(multi-step) K-NN 방법에 적용시킴으로서 사용자가 검색하고자 하는 가장 유사한 k 개의 영상만을 사용자에게 보여 주도록 설계하였다. 본 논문에서는 제안하는 알고리즘의 우수성을 증명하기 위해 RGB 색상 공간을 그대로 적용하여 실험한 결과를 비교해 보았다. 추가적으로, 영상의 전역적인 유사성뿐만 아니라, 각 블록의 독립적인 특징 값을 이용하여 특정 블록에 대한 검색 환경도 제공하여 보다 의미있는 검색 환경을 제공하고 있다.

  • PDF

Wavelet변환과 신경회로망에 의한 위장 영상의 질환 부위 패턴 인식 알고리즘 (Disease Region Pattern Recognition Algorithm of Gastrointestinal Image using Wavelet Transform and Neural Network)

  • 이상복;이주신
    • 전자공학회논문지S
    • /
    • 제36S권5호
    • /
    • pp.70-77
    • /
    • 1999
  • 본 논문에서는 Wavelet을 이용한 위장 영상의 질환 부위 특징을 추출하여 질환 부위 패턴을 인식할 수 있는 알고리즘을 제안하였다. 전처리 과정으로서 위장 영상이 형태정보는 입력 영상을 DWT(Discrete wavelet transform)에 의해 4레벨 DWT 계수 행렬을 구하고 계수 행렬의 특징에 따라 저주파 계수 행렬로부터 저주파 특징 파라미터 32개, 수평 고주파 계수 행렬로부터 수평 고주파 특징 파라미터 16개, 수직 고주파 계수 행렬로부터 수직 고주파 특징 파라미터 16개, 그리고, 대각 고주파 계수 행렬로부터 대각 고주파 특징 파라미터 32개 등 모두 96개의 특징 파라미터를 추출한 후 각각의 특징 파라미터를 최대 값+0.5로 최소 값을 -0.5로 정규화 하여 신경회로망의 입력 벡터로 사용하였다. 위장 영상 패턴 인식을 위한 신경회로망은 교사 학습을 요구하는 다층 구조의 오차 역전파(Error back propagation)알고리즘으로 하였고 구조적 특성을 이용하여 입력층, 중간층, 출력층의 계층 구조로 설계하였다. 설계된 신경회로망의 학습은 학습계수를 0.2로 모우멘텀을 0.6으로 설정하여 출력층 최대오차가 0.01보다 작을 때까지 수행하였으며 약 8000회 정도 학습한 결과 설정값 보다 작은 결과를 얻었고 질환의 종류나 위치, 크기에 관계없이 100%의 인식률을 얻었다.

  • PDF

영상내의 다중 후보 블록의 통계적 특징을 이용한 객체추적 (Object Tracking using Statistical Properties of Multiple Candidate Blocks in Image)

  • 천재봉;박명철;하석운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.149-152
    • /
    • 2007
  • 비전 연구에 있어서 객체 추적은 무엇보다도 중요시 되어 왔다. 특히 비디오 감시 시스템에서의 객체 추적은 매우 중요하다. 본 논문에서는 영상 내에서 움직이는 객체를 추출하고 객체내의 다중 후보블록의 통계적 특징을 이용한 추적 시스템을 구성하였다. 객체를 추적하기 위해서는 먼저 움직이는 객체 추출이 선행되어야 한다. 객체 추출은 영상 내에서 배경 프레임과 매 프레임에서의 현재 프레임간의 차 연산에 의한 가중치를 이용하여 객체의 움직임을 판단하고 추출하였다. 움직이는 객체는 본 논문에서 제안한 다중 후보 블록 알고리즘을 수행하여 추적에 필요한 통계 값을 획득한다. 통계 값으로는 방향성에 필요한 블록의 중심 좌표 값과 객체추적에 필요한 객체간의 매칭 정도를 사용하였다. 본 논문에서 제안한 추적 시스템은 민감한 빛의 변화에도 강건하였으며, 특정 블록에 대해서만 연산 수행을 수행하므로 컴퓨터의 연산을 줄여 실시간 추적도 가능하다.

  • PDF

몽타주와 일치하는 영상검색 시스템의 구현 (An Implementation of The Image Searching System Corresponded with The Montage)

  • 최항영;남경선;윤태승;곽내정;안재형
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.559-564
    • /
    • 2002
  • 본 논문에서는 범죄수사의 초동수사 기법으로 사용되고 있는 몽타주와 실물 사진과의 근사 영상 검색 알고리즘을 제안한다. 입력 몽타주를 얼굴인식 기법에 적용하여 이진영상화와 형태학적 필터로 영상의 잡음을 제거한 후 경계선을 추출하였다. 추출된 경계선 영상으로 레이블링 과정을 거친 후 얼굴의 중요 요소를 포함하는 특징얼굴을 구성한다. 특징얼굴은 웨이블릿 변환을 통해 다운 샘플링 된 LL대역의 계수로 변환되며, 고유값 연산을 통해 계수 매트릭스의 고유 값을 추출 한다. 입력 몽타주의 고유값은 같은 절차를 거친 실물 사진의 저장된 고유값과 계수의 분포를 비교한다. 실험 결과 몽타주와 유사한 실물 사진을 검색할 수 있었으며 영상의 크기 변화와 왜곡 및 압축에 견고한 비교 검색 결과를 얻었다.

  • PDF

PCA와 입자 군집 최적화 알고리즘을 이용한 얼굴이미지에서 특징선택에 관한 연구 (A Study on Feature Selection in Face Image Using Principal Component Analysis and Particle Swarm Optimization Algorithms)

  • 김웅기;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1857_1858
    • /
    • 2009
  • 본 논문에서는 PCA와 입자 군집 최적화 알고리즘을 이용한 얼굴이미지에서 특징선택 방법에 대하여 제안한다. 2차원 얼굴이미지의 히스토그램 분표값에서 정규화합 연산을 이용한 히스토그램 평활화 기법을 거쳐 대비효과를 주어 화질을 개선시켜 준다. PCA는 2차원 얼굴이미지를 이용하여 공분산 행렬을 구한 후 그것의 고유값에 따른 고유벡터를 구하여 얼굴인식에 사용될 특징 벡터들을 추출한다. 또한 추출된 특징벡터 중에서 얼굴인식 성능에 중요한 요소가 되는 특징 벡터들을 입자 군집 최적화 알고리즘을 이용하여 최적화한다. 다항식 기반 RBF 신경회로망을 사용하여 얼굴인식 성능을 평가한다. 본 논문에서 제안된 방법을 통해 최적화된 특징벡터와 얼굴인식률과의 관계를 알 수 있다.

  • PDF

3차원 특징을 이용한 DOT 분류 코드 추출 (DOT Classification Code Extraction through 3-Dimensional Features)

  • 김재한;심재창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.394-396
    • /
    • 2001
  • 본 논문의 목적은 타이어에 각인되어 있는 DOT 코드 문자를 효과적으로 추출하는데 있다. 기존의 DOT 문자 인식 방법에서는 카메라와 조명에 의한 2차원 영상에서 DOT 문자 추출을 시도하였는데, 타이어는 DOT 문자와 배경이 동일한 색상이고, 조명에 민감해서 DOT 문자의 추출이 용이하지 않았다. 그래서, 본 논문에서는 타이어의 DOT 문자를 조명에 거의 영향을 받지 않는 3자원 레이저 스캐너를 이용해서 획득하고, 획득된 영상에서 높이 값 정보를 추출했으며 추출된 높이 값 정보를 가진 영상에 패턴 인식 기법을 적용하여 DOT 문자를 효과적으로 추출할 수 있었다.

  • PDF

자동차 전조등 검색을 위한 다중지식기반의 영상검색 기법 (The Multi Knowledge-based Image Retrieval Technology for An Automobile Head Lamp Retrieval)

  • 이병일;손병환;홍성욱;손성건;최흥국
    • 융합신호처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.27-35
    • /
    • 2002
  • 지식기반 영상검색은 영상이 갖는 다양한 데이터에서 추출되어진 특징값을 지식으로 하여 질의 영상에 대한 검색 결과영상을 찾아주는 방법이다. 본 연구에서 사용한 영상자료는 자동차 전조등 영상으로 전조등 영상에 대한 입력 자료는 차량마다 다양한 패턴을 갖는 영상과 문자, 숫자 및 특수문자이다. 영상에서의 정보는 화소값들의 분포상태나 통계적 분석 및 패턴의 상태 등인데, 전조등 영상에서는 이러한 정보가 영상 검색을 위한 지식 데이터로 사용된다. 영상데이터에서 추출된 다양한 정보를 다중 지식 기반으로 하여 본 논문에서는 교통사고나 기타 차량사건의 발생 시 활용할 수 있는 영상검색 시스템을 구축하였으며, 전조등 영상의 검색에 효율적으로 적용한 다중 지식기반 검색방법을 제안하였다. 다중지식 구축을 위한 특징함수는 컬러 영상에서와 그레이레벨 영상에서 각각 필요한 성분들을 추출하여 구성하였으며, 한 개나 두 개 정도의 특징값을 사용한 기존의 방법과 달리 복합적인 특징값의 사용을 통한 다중 지식 기반의 검색방법이 컬러정보나 패턴에 대한 유사성을 높여서 용의차량의 전조등 영상 검색 효율성을 향상시켰다. 소프트웨어의 제작을 위해 비쥬얼 베이직과 크리스탈리포트 그리고 MS 액세스 데이터베이스를 사용하였다. 검색 효율성 및 특성 함수의 구성을 효과적으로 발전시키면 검색시스템은 용의 차량의 추적 및 교통사고에서 효율적인 과학수사에 일조할 것으로 기대한다.

  • PDF

동작 검출 기법을 이용한 실시간 감시시스템의 구현 (Environment Implementation of Real-time Supervisory System Using Motion Detection Method)

  • 김형균;고석만;오무송
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.999-1002
    • /
    • 2003
  • 본 연구에서는 동작 검출 기법을 소형 화상 카메라에 적용하여 감시 영상을 실시간으로 검출하는 감시시스템을 구현하였다. 기존에 사용되던 차 영상의 화소 값을 이용한 동작 검출 기법은 배경 영상을 저장할 메모리가 필요하고 화소 단위의 데이터 처리로 인하여 수행 시간의 증가와 노이즈에 민감한 단점을 감수해야만 한다. 이러한 단점을 해결하고 노이즈에 강인한 성질을 갖게 하기 위해서 블록 단위로 특징값을 추출하여 비교하는 기법을 제안하였다. 블록별로 특징값을 얻는 경우 기준 영상의 블록 단위의 특징 값과 현재 영상의 블록 특징 값만을 비교하기 때문에 프레임 메모리가 필요없고 단지 기준 영상의 블록 특징 값만을 저장하면 된다. 또한 블록 단위로 특징 값을 구하는 과정에서 화소 값을 이용한 동작 검출 보다 노이즈에 대한 영향을 감소시키고 카메라의 흔들림 등에 덜 민감한 효과를 얻을 수 있었다.

  • PDF