• 제목/요약/키워드: Image Indexing

검색결과 204건 처리시간 0.022초

교육 분야 응용을 위한 가상 현미경 시스템 (A Virtual Microscope System for Educational Applications)

  • 조승호
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.117-124
    • /
    • 2003
  • 본 논문에 의해 구현된 시스템은 광학 현미경을 통해 캡춰된 조직 샘플들에 대한 데이터들을 분산/병렬 시스템 상에 분한 저장한다. 사용자들은 컴퓨터 상에서 마치 현미경을 사용하듯이 이들 이미지들을 관찰할 수 있다. 이 시스템은 고객 서버 모델에 의거 고객, 조정자 노드, 데이터 관리자 노드로서 구성되고, 메시지를 통해 데이터를 송수신한다. 본 연구에서는 이미지 표시나 텍스트 주석 등 교육용 응용에 필요한 기능들을 갖춘 이미지 검색용 고객 프로그램을 구현하였고, 세 요소간 통신 규약을 정의하였다. 또한 대용량 데이터들을 저장하는 테이프 장치 도입을 위한 실험을 수행하였으며, 이러한 실험은 데이터 분할 및 인덱싱 기법에 의해 성능 향상을 나타내었다.

비디오 등장인물 검색을 위한 얼굴검출 (Face Detection for Cast Searching in Video)

  • 백승호;김준환;유지상
    • 한국통신학회논문지
    • /
    • 제30권10C호
    • /
    • pp.983-991
    • /
    • 2005
  • 드라마와 같은 비디오에서 사람의 얼굴은 일반적으로 자주 등장하며 비디오 내용을 분석하기 위한 유용한 정보를 제공한다. 얼굴검출은 얼굴인식 및 얼굴영상의 DB 관리와 같은 응용분야에 중요한 역할을 한다. 본 논문에서는 비디오 등장인물 검색을 위한 얼굴검출 기법을 제안하였다. 전체 과정은 크게 세단계로 구성되며 첫 번째 장면전환 검출단계, 두 번째 얼굴영역 검출단계, 마지막으로 얼굴의 특징점인 눈과 입 검출단계로 구성되며, 색상에 기반한 얼굴영역 검출단계에서 발생된 얼굴 특징점을 눈과 입의 검출에 적용하였다. 실험결과 다양한 환경에서 성공적으로 얼굴을 검출하며, 기존의 색상기반 얼굴검출 방법에 비해 측면영상에서 $24\%$의 성능향상을 보였다.

MPEG-7 기반 웹 이미지 색인 및 검색 (MPEG-7 Based Web Image Indexing and Searching)

  • 임재형;김문철;김진웅;현순주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1285-1288
    • /
    • 2000
  • 인터넷의 양적 질적 성장을 통해 인터넷상에 존재하는 웹 문서의 숫자는 엄청난 속도로 증가하여 왔다. 이러한 방대한 웹 문서를 대상으로 한 검색 방법은, 지금까지 일반적으로 텍스트 기반의 방법이 주류를 이루어 왔다. 그러나 웹 문서는 멀티미디어 형태로 존재하며 텍스트, 이미지, 동영상, 컴퓨터 그래픽 둥 다양한 미디어들로 구성되어 있다. 본 논문에서는 인터넷에 존재하는 웹 문서를 대상으로 내용 기반 이미지 검색방법을 제시한다. 내용기반 웹 이미지 검색 시스템은 웹 상의 텍스트 기반의 기존 상용 검색엔진을 이용하여 주요 검색어에 대한 이미지를 수집하는 웹 이미지 수집기와 수집된 이미지에 대해 MPEG-7 비주얼 기술자를 이용하여 데이터베이스에 색인하는 데이터베이스 불리기(population), 그리고 내용 기반 이미지 검색엔진으로 구성된다. 사용자는 장르, 주제 및 주요단어에 의해 분류되어 데이터베이스에 색인된 웹 이미지를 대상으로 검색이 가능하다. 이는 웹 문서를 직접 대상으로 한 특정 단어에 대한 내용 기반 이미지 검색이 가능하며 검색이 데이터베이스를 대상으로 이루어지기 때문에 빠른 검색 속도를 얻을 수 있으며, 또한 기존 웹에서 제공되는 텍스트 기반의 상용 검색엔진을 이용하여 주요단어에 대한 웹 이미지를 수집하여 색인하기 때문에 별도의 텍스트 검색엔진 구현을 필요로 하지 않는다.

  • PDF

Egocentric Vision for Human Activity Recognition Using Deep Learning

  • Malika Douache;Badra Nawal Benmoussat
    • Journal of Information Processing Systems
    • /
    • 제19권6호
    • /
    • pp.730-744
    • /
    • 2023
  • The topic of this paper is the recognition of human activities using egocentric vision, particularly captured by body-worn cameras, which could be helpful for video surveillance, automatic search and video indexing. This being the case, it could also be helpful in assistance to elderly and frail persons for revolutionizing and improving their lives. The process throws up the task of human activities recognition remaining problematic, because of the important variations, where it is realized through the use of an external device, similar to a robot, as a personal assistant. The inferred information is used both online to assist the person, and offline to support the personal assistant. With our proposed method being robust against the various factors of variability problem in action executions, the major purpose of this paper is to perform an efficient and simple recognition method from egocentric camera data only using convolutional neural network and deep learning. In terms of accuracy improvement, simulation results outperform the current state of the art by a significant margin of 61% when using egocentric camera data only, more than 44% when using egocentric camera and several stationary cameras data and more than 12% when using both inertial measurement unit (IMU) and egocentric camera data.

글자 영상을 위한 학습기반 초고해상도 기법 (Learning-based Super-resolution for Text Images)

  • 허보영;송병철
    • 전자공학회논문지
    • /
    • 제52권4호
    • /
    • pp.175-183
    • /
    • 2015
  • 본 논문은 글자 영상을 효과적으로 확대 (up-scaling)하기 위한 학습 기반 초고해상도 (super-resolution; SR) 기법을 제안한다. 제안 기법은 크게 학습 단계와 합성 단계로 나뉜다. 학습 단계에서 다양한 HR (high-resolution) /LR (low-resolution) 글자 영상 쌍들을 수집한다. LR영상들은 양자화를 하고, 충분히 많은 수의 HR-LR 블록쌍들을 추출한다. 양자화된 LR블록을 기준으로 블록 쌍들을 소정의 개수의 클래스들로 구분한다. 클래스 별로 최적의 2D-FIR 필터 계수를 계산하고, 양자화한 후색인용 LR 블록과 함께 사전에 저장한다. 합성 단계에서 입력 LR 영상 내 각 블록을 양자화한 후 사전 내 양자화된 LR블록들과 정합하여 가장 근사한 블록에 대응하는 FIR 필터계수를 선정한다. 마지막으로 선택된 FIR필터로 HR 블록을 합성하여 최종적인 HR영상을 생성한다. 또한, 우리는 잡음이 있는 글자 영상에 대응하기 위해 학습과정에서 잡음 세기에 따른 복수개의 사전들을 제작한다. 입력 LR 영상의 잡음 레벨에 맞는 사전을 선택하여 HR영상을 합성한다. 실험 결과는 제안 기법이 종래 기법보다 잡음이 없는 환경에서는 물론 잡음이 있는 환경에서 우수한 주관적/객관적 화질을 가짐을 보인다.

자동 주석 및 히스토그램 기법을 이용한 환경 교육 컨텐츠 검색 시스템 (A Retrieval System of Environment Education Contents using Method of Automatic Annotation and Histogram)

  • 이근왕;김진형
    • 한국산학기술학회논문지
    • /
    • 제9권1호
    • /
    • pp.114-121
    • /
    • 2008
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 환경 교육 컨텐츠 검색을 위한 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 설계하고 구현한 시스템은 실험을 통한 성능평가에서 90% 이상의 높은 정확도를 보였다.

Wavelet을 이용한 내용기반 검색에 관한 연구 (A Study on Contents-based Retrieval using Wavelet)

  • 강진석;박재필;나인호;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1051-1066
    • /
    • 2000
  • 디지털 압축기술의 발달과 컴퓨팅 능력이 발전함에 따라서 많은 양의 이미지, 그래픽, 오디오, 비디오 정보가 인터넷을 통한 멀티미디어 시스템에서 활발히 이용되고 있다. 이에 따라 사용자가 원하는 멀티미디어 컨텐츠를 탐색하기 위한 다양한 검색기법이 요구되고 있으며, 특히 단순한 텍스트형 키워드에 의한 검색보다는 내용에 의한 검색 기법이 절실히 요구되고 있다. 본 논문에서는 여러 가지 전처리 과정을 통해 영상을 분류하고, 여기에 색상의 공간적, 질감적 특징을 선별적으로 적용함으로서 처리 효율을 높이면서 검색 성능을 증가시킬 수 있는 내용기반 색인 및 검색 알고리즘을 제안하였다. 또한, 특정 상표에 대한 내용기반 데이터 검색요청 및 수행 결과 분석을 통해 제안된 기법의 성능을 평가하였고, 그 결과를 기술하였다.

  • PDF

MPEG 비디오의 통계적 특성을 이용한 검색 시스템 (Retrieval System Adopting Statistical Feature of MPEG Video)

  • 유영달;강대성;김대진
    • 전자공학회논문지CI
    • /
    • 제38권5호
    • /
    • pp.58-64
    • /
    • 2001
  • 현재 많은 정보들이 비디오 데이터로 전송 또는 저장되고 있으며 고성능 PC의 보급과 internet과 같은 통신망의 대중화로 이런 비디오 데이터는 급속도로 증가하고 있다. 본 논문에서는 이런 비디오 데이터의 검색을 위하여 비디오 스트립을 분석하여 shot을 찾아내고 이들 중 key frame을 찾는 방법에 대하여 연구하고 이로서 사용자의 질의에 부합하는 비디오를 검색한다. 본 논문에서는 shot 경계 검출을 위해 객체의 움직임에 강인하면서 shot 내에서의 칼라의 변화에 둔감한 새로운 feature를 제안하고, shot frame에서 구한 각 feature들의 통계적 특성을 이용하여 스트립의 특징에 따라 weight를 부가하여 구해진 characterizing value의 시간 변화량을 구한다. 구해진 변화량의 local maxima와 local minima는 비디오 스트림에서 각각 가장 특정적인 frame과 평균적인 frame을 나타낸다. 이 순간의 short frame을 구함으로서 효과적이고 빠른 시간 내에 key frame을 추출한다. 추출되어진 key frame에 대하여 원 영상을 복원한 후, 색인을 위하여 다수의 parameter를 구하고, 사용자가 질의한 영상에 대해서 이들 parameter를 구하여 key frame들과 가장 유사한 대표영상들을 검색한다. 실험결과 일반적인 방법보다 더 나은 결과를 보였고, 높은 검색율을 보였다.

  • PDF

주석 및 특징을 이용한 의미기반 비디오 검색 시스템 (A Semantics-based Video Retrieval System using Annotation and Feature)

  • 이종희
    • 전자공학회논문지CI
    • /
    • 제41권4호
    • /
    • pp.95-102
    • /
    • 2004
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색 기법과 최적 비교 영역 추출을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 제안한다.

자동 주석 갱신 및 카테고라이징 기법을 이용한 의미기반 동영상 검색 시스템 (A Semantic-based Video Retrieval System using Design of Automatic Annotation Update and Categorizing)

  • 김정재;이창수;이종희;전문석
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권2호
    • /
    • pp.203-216
    • /
    • 2004
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터 베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다 또한. 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

  • PDF