• 제목/요약/키워드: 이미지 내용정보

검색결과 550건 처리시간 0.027초

Recurrent Neural Network를 이용한 이미지 캡션 생성 (Image Caption Generation using Recurrent Neural Network)

  • 이창기
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.878-882
    • /
    • 2016
  • 이미지의 내용을 설명하는 캡션을 자동으로 생성하는 기술은 이미지 인식과 자연어처리 기술을 필요로 하는 매우 어려운 기술이지만, 유아 교육이나 이미지 검색, 맹인들을 위한 네비게이션 등에 사용될 수 있는 중요한 기술이다. 본 논문에서는 이미지 캡션 생성을 위해 Convolutional Neural Network(CNN)으로 인코딩된 이미지 정보를 입력으로 갖는 이미지 캡션 생성에 최적화된 Recurrent Neural Network(RNN) 모델을 제안하고, 실험을 통해 본 논문에서 제안한 모델이 Flickr 8K와 Flickr 30K, MS COCO 데이터 셋에서 기존의 연구들보다 높은 성능을 얻음을 보인다.

이미지 내용 기반 검색을 위한 이미지 타일 평균 RGB 방법 (Image Tile Average RGB Method for Image Content-Based Retrieval)

  • 한정운;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.296-298
    • /
    • 1999
  • 컬러 히스토그램은 멀티미디어 이미지 데이터의 특성을 표현하기 위하여 널이 이용되어 왔다. 그러나 컬러 히스토그램을 고차원으로 설정할 경우 색인 구조에 효율적이지 못할 뿐만 아니라 유사도 계산에서도 고비용이 요구된다. 이러한 단점을 보완하기 위해 히스트그램의 차원을 줄이는 여러 방법이 제시되어 왔으나 이미지의 색상정보 손실을 피할 수 없으며, 이미지의 전체 히스토그램으로는 이미지의 레이아웃을 고려할 수 없기 때문에 필터링을 통한 후보 선정 시 상이한 이미지가 선택되어지는 문제점을 지닌다. 본 논문에서는 이미지를 일정한 크기의 타일로 분할한 이미지 타일 평균 RGB 방법을 제안하였으며, 실험을 통하여 제안한 방법의 성능을 평가하였다.

  • PDF

웨이블릿 변환을 이용한 적응적 뇌영상 검색 방안 (Adaptative Retrieval Method for Brain Image using Wavelet)

  • 구혜영;엄기현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.447-452
    • /
    • 2001
  • 내용 기반 이미지 검색에서 질감정보는 이미지의 검색 속성으로 사용할 수 있는 중요한 정보를 가지고 있다. 본 논문에서는 검색의 이미지 속성으로서 질감 특징을 사용한다. 의료영상 MRI 중 특히 뇌영상의 검색에서 질감의 특징은 전체 이미지를 대상으로 한 전역 질감 특징 값과 종양이나 뇌출혈 부분 등 정상이 아닌 이상객체 부분의 지역 질감 특징 값을 3단계 웨이블릿 변환을 통해 추출하고 추출된 여러 개의 특징 중 검색 효율성을 높일 수 있는 특징만을 선별하여 검색에 이용하는 방안을 제안한다.

  • PDF

내용 기반의 멀티미디어 데이터 연관규칙 마이닝에 대한 연구 (A Study on Data Association-Rules Mining of Content-Based Multimedia)

  • 김진옥;황대준
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.57-64
    • /
    • 2002
  • 컴퓨터 처리기술과 저장기술 그리고 인터넷 등의 영향으로 멀티미디어 데이터의 양은 급속하게 증가하지만 체계적인 멀티미디어 데이터간의 연관규칙을 마이닝하는 연구는 초기 단계이다. 본 논문은 이미지 프로세싱 분야 및 내용기반 이미지 검색에 대한 기존 연구를 바탕으로 대형 영상 데이터 저장소에 저장된 이미지 데이터에서 재생성되는 항목간의 연관규칙을 찾으며 공간적 관계로 내용기반의 연관규칙을 마이닝하는 알고리즘을 제안한다. 제안된 연관규칙 탐색 알고리즘은 이미지의 색상, 질감, 모양 등 내용기반의 영상속성을 오브젝트 항목으로 하고 오브젝트가 이미지에서 재생성될 때를 이용하여 이미지간의 연관규칙을 찾고 오브젝트들이 이미지에서 차지하고 있는 공간적 위치관계를 통해 드러나지 않는 이미지간의 연관규칙을 마이닝한다. 본 논문의 재생성 항목을 고려한 연관규칙 알고리즘은 Apriori 알고리즘보다 빈번한 항목 집합을 찾아내는데 더 높은 성능을 갖는다는 것을 실험을 통하여 보여준다. 제안된 알고리즘은 동일한 정보원으로부터 받은 멀티미디어 데이터간의 연관성을 탐색하는데 특히 효과적이며 다양한 관련 응용분야에 적용할 수 있다.

빛의 방향을 이용한 내용기반 이미지 검색 시스템의 효율성 향상에 관한 연구 (A Study on the Performance Enhancement of Content-based Image Retrieval Systems Using Lighting Directions)

  • 안재욱;문성빈
    • 정보관리학회지
    • /
    • 제17권4호
    • /
    • pp.157-170
    • /
    • 2000
  • 색상에 의한 내용기반 이미지 검색 기법에 있어서 조명과 관찰자의 환경과 같은 주변 조건을 반영한 시지각 색상 모형은 사진 이미지속에 나타나는 반사광과 그림자와 같은 영역의 색상 정보를 알 수 없는 것이라고 간주하고 그 정보를 포기한다는 단점이 있다. 이 연구에서는 그와 같은 알 수 없는 색상을 빛의 방향에 의해 추정하여 검색 시스템의 효율을 향상시키는데 기여하려 하였으며, 검색 실험 결과 이러한 추정 작업과 검색 효율성 향상 사이에는 유의미한 관계가 존재하고 있는 것으로 결론지을 수 있었다.

  • PDF

멀티미디어 데이터의 다차원 연관규칙 마이닝 (Multi-Dimensional Association Rule Mining in Multimedia Data)

  • 김진옥;황대준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.233-236
    • /
    • 2001
  • 멀티미디어 데이터의 증가와 마이닝 기술의 발전으로 인해 멀티미디어 마이닝에 대한 관심이 증가하고 있다. 본 논문에서는 특성국지화를 이용한 내용기반의 정보검색 기술과 다차원 데이터큐브 구축기술을 통해 멀티미디어 데이터에서 연관규칙을 찾아내는 멀티미디어 데이터마이닝 시스템 프로토타입을 제안한다. 특히 멀티미디어 데이터의 칼라, 질감 등 거시적인 이미지 성분 대신 이미지의 영역성과 유사성을 이용한 특성국지화방법을 이용하여 이미지를 분할함으로써 방대한 데이타에서 효과적인 내용기반의 정의 검색을 시행하고 검색한 벡터를 메타데이타로 한 데이스베이스를 구축한다. 그리고 데이터베이스에서 데이터간 연관규칙을 찾아내어 지식을 마이닝하는데 효과적인 다차원 데이터큐브를 구축하고 여기에 연관규칙 검색 알고리즘을 적용한다.

  • PDF

3차원 그래픽 이미지를 위한 XML 데이타베이스 시스템 (An XML Database System for 3-Dimensional Graphic Images)

  • 황종하;황수찬
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.110-118
    • /
    • 2002
  • 본 논문에서는 3차원 이미지의 내용기반 검색을 지원하는 XML 기반의 3차원 그래픽 데이터 베이스 시스템에 대해 기술한다. 현재 대부분의 그래픽 응용들은 2차원 이미지를 대상으로 하고 있으며 3차원 그래픽스 분야에서는 3차원 이미지의 표현에 대해서만 중점적으로 연구가 되고 있을 뿐 이미지가 포함하고 있는 의미 단위로서의 객체 모델링이나 이들 간의 공간 관계에 대한 처리는 아직 미흡한 실정이다. 본 논문의 모델에서 3차원 이미지는 공간관계를 가지고 있는 3차원 그래픽 객체의 조합으로 표현된다. 복잡한 3차원 객체는 기존의 그래픽 시스템에서 사용하는 선과 면 대신에 기본적인 객체들을 이용하여 모델링된다. 이렇게 구성된 3차원 그래픽 이미지들은 객체 모양이나 객체간의 공간관계를 이용한 내용기반 검색의 대상이 된다. 3차원 그래픽 이미지들은 XML 문서 형태로 표현되며, 이를 위한 3DGML DTD를 정의하였다. 끝으로 웹 기반으로 구현된 프로토타입 시스템에서의 질의 예를 보인다.

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기발에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

비디오 의미 파악을 위한 멀티미디어 요약의 비동시적 오디오와 이미지 정보간의 상호 작용 효과 연구 (A Study on the Interactive Effect of Spoken Words and Imagery not Synchronized in Multimedia Surrogates for Video Gisting)

  • 김현희
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.97-118
    • /
    • 2011
  • 본 연구는 오디오 및 이미지 정보가 비동시적으로 결합된 오디오/이미지 요약이 오디오 요약 또는 이미지 요약만 사용했을 때 보다 어떤 상호 작용 효과를 가지고 있는지 살펴보았다. 이를 위해서 오디오/이미지 요약, 오디오 요약 및 이미지 요약을 비디오의 의미 추출에 있어서의 정확도 즉, 요약문 및 항목 선택의 정확도와 이용자들의 이 세 가지 요약에 대한 관점을 비교, 분석하였다. 분석 결과, 요약문 정확도에서는 비디오 유형에 관계없이 상호작용 효과를 확인하였으나 항목 선택의 정확도에서는 상호 작용 효과가 입증되지 못했다. 끝으로 이용자들은 오디오/이미지 요약에 대해 오디오와 이미지 정보를 병행하여 시청함으로서 비디오 내용에 대한 이해를 빠르게 하지만 때로는 이 두 정보간의 비동시성으로 인하여 비디오 의미 파악을 방해하는 경우도 생겨난다고 기술하였다.