• 제목/요약/키워드: 영역검출

검색결과 3,096건 처리시간 0.038초

주파수 영역에서의 Gaussian Mixture Model 기반의 동시통화 검출 연구 (Frequency Domain Double-Talk Detector Based on Gaussian Mixture Model)

  • 이규호;장준혁
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.401-407
    • /
    • 2009
  • 본 논문에서는 주파수 영역에서의 가우시안 혼합 모델 (Gaussian Mixture Model, GMM) 기반의 새로운 동시통화 검출 (Double-talk Detection, DTD) 알고리즘을 제안한다. 구체적으로 주파수 영역에서의 음향학적 반향억제 (Acoustic Echo Suppression, AES)를 위한 동시 통화 검출 알고리즘을 구성하기 위해 기존의 시간 영역에서의 동시통화 검출에 사용되는 상호 상관계수를 이산 푸리에 변환을 통해 16개 채널의 주파수 영역으로 변환하였다. 이러한 주파수 영역에서의 상호 상관계수를 GMM의 보다 효과적인 구성을 위해 통계적 분류 특성에 근거하여 우수한 7개를 선별하였다. 본 논문은 이러한 특징 벡터로 패턴인식에서 우수한 성능을 보이는 GMM을 구성하였으며 원단화자만 있는 구간, 동시통화 구간, 근단 화자만 있는 구간을 우도 (Likelihood) 비교에 따라 분류함으로써 별도의 원단 화자 신호에 대한 음성 검출기 (Voice Activity Detector, VAD)의 사용 없이 잡음환경과 반향 경로 변화에서 강인한 동시통화 검출 알고리즘을 제안한다. 다양한 실험 결과 제안된 방법은 기존의 상호 상관계수를 고정된 문턱 값과 가부 비교하여 동시 통화 구간을 검출하는 hard decision 방법에 비해 검출 오류 확률 (Detection Error Probability)을 비교한 결과 우수한 성능을 보였다.

멀티 브랜치 네트워크 구조 탐색을 사용한 구름 영역 분할 (Semantic Segmentation of Clouds Using Multi-Branch Neural Architecture Search)

  • 정치윤;문경덕;김무섭
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.143-156
    • /
    • 2023
  • 인공위성이 촬영한 영상의 내용을 정확하게 분석하기 위해서는 영상에 존재하는 구름 영역을 정확하게 인지하는 것이 필요하다. 최근 다양한 분야에서 딥러닝(deep learning) 모델이 뛰어난 성능을 보여줌에 따라 구름 영역 검출을 위해 딥러닝 모델을 적용한 방법들이 많이 제안되고 있다. 하지만 현재 구름 영역 검출 방법들은 의미 영역 분할 방법의 네트워크 구조를 그대로 사용하여 구름 검출 성능을 향상하는 데는 한계가 있다. 따라서 본 논문에서는 구름 검출 데이터 세트에 다중 브랜치 네트워크 구조 탐색을 적용하여 구름 영역 검출에 최적화된 네트워크 모델을 생성함으로써 구름 검출 성능을 향상하는 방법을 제안한다. 또한 구름 검출 성능을 향상하기 위하여 의미 영역 분할 모델의 학습 단계와 평가 단계의 평가 기준 불일치를 해소하기 위해 제안된 soft intersection over union (IoU) 손실 함수를 사용하고, 다양한 데이터 증강 방법을 적용하여 학습 데이터를 증가시켰다. 본 논문에서 제안된 방법의 성능을 검증하기 위하여 아리랑위성 3/3A호에서 촬영한 영상으로 구성된 구름 검출 데이터 세트를 사용하였다. 먼저 제안 방법과 의미 영역 분할 데이터 세트에서 탐색된 기존 네트워크 모델의 성능을 비교하였다. 실험 결과, 제안 방법의 mean IoU는 68.5%이며, 기존 모델보다 mIoU 측면에서 4%의 높은 성능을 보여주었다. 또한 soft IoU 손실 함수를 포함한 다섯 개의 손실 함수를 적용하여 손실 함수에 따른 구름 검출 성능을 분석하였으며, 실험 결과 본 연구에서 사용한 soft IoU 함수가 가장 좋은 성능을 보여주었다. 마지막으로 의미 영역 분할 분야에서 활용되는 최신 네트워크 모델과 제안 방법의 구름 검출 성능을 비교하였다. 실험 결과, 제안 모델이 의미 영역 분할 분야의 최신 모델들보다 mIoU와 정확도 측면에서 더 나은 성능을 보여주는 것을 확인하였다.

차량 주위 전방향 촬영영상을 이용한 차선 검출 시스템 개발 (Development of Lane Detection System using Surrounding View Image of Vehicle)

  • 금창훈;조동찬;김회율
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.331-334
    • /
    • 2013
  • 본 논문에서는 차량에 부착된 4대의 어안렌즈 카메라 영상을 이용하여 차량 주위 전방향의 주변 정보를 포함하는 정합 영상을 생성하고, 생성된 정합 영상에서 차선을 검출하는 알고리즘을 제안한다. 기존의 전방 카메라만을 이용하여 차선을 검출하는 방법들은 안개와 같이 기상 환경이 안 좋은 경우 가시거리가 짧아져 정상적인 차선 검출이 어려운 문제가 있다. 이에 반해 4대의 어안렌즈 카메라로 차량의 주변을 촬영한 영상은 기상 환경에 영향을 적게 받아 안정적인 차선 검출에 용이하다. 어안렌즈 카메라로 촬영한 영상은 왜곡이 심하기 때문에 왜곡 보정을 수행한 후 차량 위에서 아래로 내려다본 시점으로 투영 변환하여 하나의 영상으로 정합한다. 정합영상에서 관심영역을 설정한 후 차선 후보 영역을 검출하고, 검출된 후보 영역들로 차선을 직선으로 모델링한다. 점선 차선 구간이나 차량 흔들림에 대응하기 위해 직선으로 모델링된 차선 정보의 차선 각도와 차량으로부터 거리 정보를 칼만 필터 기반 추적 및 보정하여 안정적으로 차선 검출을 수행한다. 실험 결과 제안하는 방법은 실선구간에서 99.57%, 점선구간에서는 90.48%의 검출 정확도를 가진다.

  • PDF

지능형 영상회의를 위한 얼굴검출 (Face Detection for Intelligent Video Conference System)

  • 박재현;박규식;온승엽;김천국
    • 정보처리학회논문지B
    • /
    • 제8B권1호
    • /
    • pp.20-27
    • /
    • 2001
  • 얼굴검출은 현재 많은 연구가 활발히 진행되고 있는 분야로 보안, 인식 등 다양한 응용분야를 갖는다. 본 논문은 카메라가 화자의 이동에 따라 이를 추적하여 회전하고 회의상황에 맞는 앵글을 유지하는 지능형 영상회의 시스템 개발의 기본요소인 화자검출의 선행단계로 얼굴검출에 대한 새로운 방법을 제안한다. RGB 색 공간의 입력영상을 YIQ 공간으로 변환한 후 IQ 성분은 피부영역검출에 Y 성분은 얼굴의 특성을 추출하는데 사용된다. 색 분포도를 이용하여 피부영역을 검출하고, 마스크를 누적 적용하여 잡음을 제거한 후 얼굴의 구조적인 특성과 명암의 분포를 이용하여 얼굴영역이 검출된다. 실험결과 다양한 배경의 영상에서 여러 명의 얼굴이 오류 없이 검출됨이 관찰되었다.

  • PDF

얼굴 요소의 특징과 명암차를 이용한 원거리 얼굴 검출 (Face Detection Using Facial Features and Brightness on Long Distance)

  • 한상일;박성진;차형태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.359-362
    • /
    • 2005
  • 본 논문에서는 원거리에서 촬영한 영상을 가지고 얼굴 인식의 전처리 과정인 얼굴 영역 검출에 관한 알고리즘을 제안하였다. 원거리에서 촬영된 영상은 얼굴에 대한 특징 정보가 부족하여 검출 및 판별이 어려웠으나 본 논문에서 제안한 알고리즘을 적용하면 적은 정보만을 가지고 얼굴 검출 및 판별이 가능하다. 제안된 알고리즘은 피부색에 대한 색상 정보와 명암 정보를 이용하여 얼굴 영역을 추출하였고, 추출된 얼굴 영역으로부터 눈, 코, 입뿐만 아니라 이마 영역도 검출함으로써 얼굴 검출 효율을 개선하였다.

  • PDF

글로벌 가우시안 모델링 기반의 이동 외부 그림자 영역 검출 (Moving Cast Shadow Detection based on Global Gaussian Modeling)

  • 김철문;곽재호;김회율
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.259-262
    • /
    • 2009
  • 본 논문에서는 정확한 비디오 객체 분할을 위한 글로벌 가우시안 모델 기반의 이동 외부 그림자영역 검출방법을 제안한다. 이 방법은 현재 픽셀과 배경 픽셀의 컬러 벡터간의 사이 각을 가중치 함수로 변환하고, 이를 그림자 모델의 확률 밀도에 곱하여 구한 값을 그림자 검출에 사용하고 이를 다시 그림자 모델의 입력으로 하여 검출된 픽셀 들의 분포가 자동으로 영상의 실제 그림자 분포에 근접하게 하였다. 또한, 잘못 검출된 그림자 영역을 제거하기 위해 영역의 위치 정보를 이용한다. 실험 결과를 통해 제안하는 방법은 적응적으로 그림자를 검출하면서도 높은 분할 정확도를 가지고 있음을 보인다.

  • PDF

히스토그램 분석을 이용한 얼굴 윤곽선 영역 검출 (Segmentation of Face Contour Region using Histogram Analysis)

  • 도준형;김근호;김종열
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1867_1868
    • /
    • 2009
  • 본 논문에서는 다양한 조명 조건 및 배경 조건하에서도 정확하게 얼굴의 윤곽선 영역을 검출하기 위한 방법을 제안한다. 입력영상은 조명 조건과 배경 조건에 따라 색상 분포나 에지의 분포가 다르기 때문에 정확한 윤곽선 검출을 위해서는 입력 영상 마다 얼굴 윤곽선을 검출하기 위한 기준을 설정하여야 한다. 이를 위해 입력 영상의 히스토그램을 분석하여 얼굴 후보 영역을 추출하기 위한 임계값을 계산하고 이들의 임계값을 사용하여 얼굴 윤곽선 영역을 검출하였다. 그 결과 제안된 방법은 기존의 방법 보다 뛰어난 성능으로 얼굴 윤곽선을 검출함을 보여 주었다.

  • PDF

지능형 PVR을 위한 축구 동영상 하이라이트 요약 (Soccer Video Highlight Summarization for Intelligent PVR)

  • 김형국;신동
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.209-212
    • /
    • 2009
  • 본 논문에서는 MDCT기반의 오디오 특징과 영상 특징을 이용하여 축구 동영상의 하이라이트를 효과적으로 요약하는 방식을 제안한다. 제안하는 방식에서는 입력되는 축구 동영상을 비디오 신호와 오디오 신호로 분리한 후에, 분리된 연속적인 오디오 신호를 압축영역의 MDCT계수를 통해 이벤트 사운드별로 분류하여 오디오 이벤트 후보구간을 추출한다. 입력된 비디오 신호에서는 장면 전환점을 추출하고 추출된 장면 전환점으로부터 페널티 영역을 검출한다. 검출된 오디오 이벤트 후보구간과 검출된 페널티 영역장면을 함께 결합하여 축구 동영상의 이벤트 장면을 검출한다. 검출된 페널티 영역 장면을 통해 검출된 이벤트 구간을 다른 이벤트 구간보다 더 높은 우선순위를 갖는 하이라이트로 선정하여 요약본이 생성된다. 생성된 하이라이트 요약본의 평가는 precision과 recall을 통해 정확도를 평가하였다.

  • PDF

색상에 기반한 실시간 얼굴 검출 및 추적 시스템 (The Real-Time Face Detection and Tracking System based on Skin-Color)

  • 임옥현;이우주;이배호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.751-753
    • /
    • 2004
  • 본 논문에서 색상을 기반으로 한 알고리즘으로 얼굴을 검출하고 검출된 얼굴을 움직이는 Pan-Tilt 카메라 상에서 추적하는 방법을 제안하고자 한다. 얼굴 검출 알고리즘은 얼굴색의 특징인 피부색상을 이용하여 후보영역을 검출하고 후보 영역에서 얼굴형태의 특징인 타원 형태를 이용하여 최종적으로 얼굴을 검출하였다. 얼굴 추적은 영상에서 검출된 얼굴의 크기 및 위치 정보와 Pan-Tilt 카메라의 위치정보를 이용하여 항상 얼굴이 카메라의 중심에 위치하도록 하였다. 우리는 실제 실험에서 초당 10프레임 이상의 실시간 얼굴 검출 및 추적에 성공하였다.

  • PDF

제어 가능한 카메라 환경에서 실시간 다수 물체 검출 및 관심 보행자 추적 (Real-Time Multi-Objects Detection and Interest Pedestrian Tracking in Auto-Controlled Camera Environment)

  • 이병선;이은주
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2007년도 춘계학술대회
    • /
    • pp.38-46
    • /
    • 2007
  • 본 논문에서는 실시간으로 획득된 영상을 분석하여 움직이는 다수 물체를 검출하고, 카메라를 자동 제어하여 관심 보행자만을 추적하는 시스템을 제안한다. 다수 물체 영역 검출은 차영상과 이전변환 밀도값을 이용한다. 검출된 다수 물체 영역에서 사람의 구조적 정보와 형태 정보를 이용하여 나무들의 흔들림으로 인한 영역이나 차량의 움직임 영역은 제거되고, 관심 보행자 영역만을 검출하였다. 관심 보행자 추적은 무게중심 차를 이용한 움직임 정보와 k-means 알고리즘으로 구한 세 점의 평균 색상 정보를 이용한다. 원거리 관심 보행자는 인식률을 높이기 위해 줌을 실행하여 확대하고, 관심 보행자의 화면상 위치에 따라 카메라 방향을 자동으로 조정하여 관심 보행자반을 연속적으로 추적한다. 실험 결과, 제안한 시스템은 실시간으로 움직이는 다수 물체를 검출하고, 사람의 구조적 특정과 형태 정보로 관심 보행자만을 검출할 수 있었고, 움직임 정보와 색상정보로 관심 보행자를 연속적으로 추적할 수 있었다.

  • PDF