• 제목/요약/키워드: 텍스트 이미지

검색결과 728건 처리시간 0.024초

이미지-텍스트 쌍을 활용한 이미지 분류 정확도 향상에 관한 연구 (A Study on Improvement of Image Classification Accuracy Using Image-Text Pairs)

  • 김미희;이주혁
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.561-566
    • /
    • 2023
  • 딥러닝의 발전으로 다양한 컴퓨터 비전 연구를 수행할 수 있게 됐다. 딥러닝은 컴퓨터 비전 연구 중 이미지 처리에서 높은 정확도와 성능을 보여줬다. 하지만 대부분의 이미지 처리 방식은 이미지의 시각 정보만을 이용해 이미지를 처리하는 경우가 대부분이다. 이미지-텍스트 쌍을 활용할 경우 이미지와 관련된 설명, 주석 등의 텍스트 데이터가 이미지 자체에서는 얻기 힘든 추가적인 맥락과 시각 정보를 제공할 수 있다. 본 논문에서는 이미지-텍스트 쌍을 활용하여 이미지와 텍스트를 분석하는 딥러닝 모델 제안한다. 제안 모델은 이미지 정보만을 사용한 딥러닝 모델보다 약 11% 향상된 분류 정확도 결과를 보였다.

텍스트 인식률 개선을 위한 한글 텍스트 이미지 초해상화 (Korean Text Image Super-Resolution for Improving Text Recognition Accuracy)

  • 권준형;조남익
    • 방송공학회논문지
    • /
    • 제28권2호
    • /
    • pp.178-184
    • /
    • 2023
  • 카메라로 촬영한 야외 일반 영상에서 텍스트 이미지를 찾아내고 그 내용을 인식하는 기술은 로봇 비전, 시각 보조 등의 기반으로 활용될 수 있는 매우 중요한 기술이다. 하지만 텍스트 이미지가 저해상도인 경우에는 텍스트 이미지에 포함된 노이즈나 블러 등의 열화가 더 두드러지기 때문에 텍스트 내용 인식 성능의 하락이 발생하게 된다. 본 논문에서는 일반 영상에서의 저해상도 한글 텍스트에 대한 이미지 초해상화를 통해서 텍스트 인식 정확도를 개선하였다. 트랜스포머에 기반한 모델로 한글 텍스트 이미지 초해상화를 수행 하였으며, 직접 구축한 고해상도-저해상도 한글 텍스트 이미지 데이터셋에 대하여 제안한 초해상화 방법을 적용했을 때 텍스트 인식 성능이 개선되는 것을 확인하였다.

MPEG-7 기반 웹 이미지 색인 및 검색 (MPEG-7 Based Web Image Indexing and Searching)

  • 임재형;김문철;김진웅;현순주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1285-1288
    • /
    • 2000
  • 인터넷의 양적 질적 성장을 통해 인터넷상에 존재하는 웹 문서의 숫자는 엄청난 속도로 증가하여 왔다. 이러한 방대한 웹 문서를 대상으로 한 검색 방법은, 지금까지 일반적으로 텍스트 기반의 방법이 주류를 이루어 왔다. 그러나 웹 문서는 멀티미디어 형태로 존재하며 텍스트, 이미지, 동영상, 컴퓨터 그래픽 둥 다양한 미디어들로 구성되어 있다. 본 논문에서는 인터넷에 존재하는 웹 문서를 대상으로 내용 기반 이미지 검색방법을 제시한다. 내용기반 웹 이미지 검색 시스템은 웹 상의 텍스트 기반의 기존 상용 검색엔진을 이용하여 주요 검색어에 대한 이미지를 수집하는 웹 이미지 수집기와 수집된 이미지에 대해 MPEG-7 비주얼 기술자를 이용하여 데이터베이스에 색인하는 데이터베이스 불리기(population), 그리고 내용 기반 이미지 검색엔진으로 구성된다. 사용자는 장르, 주제 및 주요단어에 의해 분류되어 데이터베이스에 색인된 웹 이미지를 대상으로 검색이 가능하다. 이는 웹 문서를 직접 대상으로 한 특정 단어에 대한 내용 기반 이미지 검색이 가능하며 검색이 데이터베이스를 대상으로 이루어지기 때문에 빠른 검색 속도를 얻을 수 있으며, 또한 기존 웹에서 제공되는 텍스트 기반의 상용 검색엔진을 이용하여 주요단어에 대한 웹 이미지를 수집하여 색인하기 때문에 별도의 텍스트 검색엔진 구현을 필요로 하지 않는다.

  • PDF

워터마킹 기법을 이용한 이미지 생성 시 워터마크 배치 방법 (Watermark Layout Method for Image Generation using Watermarking Technique)

  • 조진환;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.125-128
    • /
    • 2019
  • 이미지를 보호하기 위한 보안 수단으로는 크게 워터마킹, 스테가노그래피 기법 등이 있다. 그 중 워터마킹 기법은 배경 이미지 위에 사용자가 워터마크로 사용하기 위해 원하는 텍스트나 이미지를 새겨 다른 사람이 사용했을 때, 새겨둔 워터마크를 통해 저작권 등을 증명할 수 있는 용도로 사용하여 이미지를 보호하는 기법이며, 워터마크의 속성에 따라 텍스트 워터마킹, 이미지 워터마킹으로 나뉜다. 본 논문에서는 워터마킹 기법을 이용한 이미지 생성 시, 워터마크 대상 텍스트나 이미지의 크기 및 배치 등을 알맞게 설정하는 방법을 제시하였다. 워터마크 대상의 크기를 배경 이미지에 알맞게 자동으로 조절해 주거나 사용자가 임의로 지정하도록 하여 더욱 자유롭고 효과적인 워터마킹 기법을 구현하였다.

  • PDF

요괴 캐릭터 연구:요괴 이미지의 생성원리를 중심으로 (A study of a Japanese goblin character:Centered around the making method of goblins' image)

  • 김윤아
    • 만화애니메이션 연구
    • /
    • 통권16호
    • /
    • pp.141-163
    • /
    • 2009
  • 일본 요괴 애니메이션에 등장하는 요괴 캐릭터의 이미지를 검토하고, 요괴 캐릭터의 생성 원리를 찾아내고자 했다. 이론적으로 줄리아 크리스테바의 '상호텍스트성' 개념과 롤랑 바르뜨의 '텍스트'개념을 방법론으로 채택하여 중국의 신화 지리지 "산해경"과 상호텍스트적 관계를 보이는 <포켓몬스터>의 여러 캐릭터들의 생성원리와 일본의 애니미즘적 사고에 기초한 '백귀야행도'에 등장하는 전통 요괴 캐릭터들의 현대적인 변용을 고찰하였다. 상호텍스트성은 기억 혹은 역사와 연관되며 이는 텍스트에서 드러나기 때문에 요괴 애니메이션의 캐릭터 연구에 유용한 이론적 틀을 제공한다. 또한 요괴담이나 요괴의 이미지들은 민담처럼 집단적 담론의 결과물이며 끊임없는 첨가와 삭제가 이루어지는 텍스트적 속성을 고려해 볼 때, 변화하는 집단 상상력의 산물이라 보인다. 상호텍스트성에 기반한 괴물이나 요괴의 이미지 생성은 크게 '하이브리드'와 '뮤턴트'로 구분해 볼 수 있으며, 구체적인 이미지 제시와 분석을 통해 요괴 이미지의 생성원리를 설명하였다. 인간의 공포에 상상력의 날개를 달아 만들어지는 요괴 캐릭터들은 이미지에 있어 시각적 쾌락을 보여주며 문화 컨텐츠의 아이콘으로 기능하는 것을 알 수 있다.

  • PDF

SOM 기반 웹 이미지 분류에서 고수준 텍스트 특징들의 효과 (The Effectiveness of High-level Text Features in SOM-based Web Image Clustering)

  • 조수선
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.121-126
    • /
    • 2006
  • 본 논문에서는 웹 이미지의 분류 효과를 높이기 위해 이미지 자체에서 추출된 저수준의 비주얼 특징뿐만 아니라 이미지와 관련된 텍스트 정보로부터 나온 고수준 시맨틱 특징들을 이용하는 분류 방법을 제안한다. 이 고수준의 텍스트 특징들은 이미지 URL, 파일명, 페이지 타이틀, 하이퍼링크 및 이미지 주변 텍스트로부터 얻어진다. 분류 엔진으로는 Kohonen의 SOM(Self Organizing Map)을 사용한다. 고수준의 텍스트 특징들과 저수준의 비주얼 특징들을 동시에 사용하는 SOM 기반의 이미지 분류에서는 10개의 카테고리로부터 수집된 200개의 테스트 이미지들이 사용되었다. 분류 성능을 평가하기 위해 간단하면서도 새로운 두 가지 척도, 즉 동일 카테고리 이미지들의 산포 정도와 집적 정도를 나타내는 각각의 척도를 정의하고 사용하였다. 실험결과, SOM기반의 웹 이미지 분류에서는 고수준의 텍스트 특징들이 보다 유용한 것임이 밝혀졌다.

카메라 획득 영상에서의 색 분산 및 개선된 K-means 색 병합을 이용한 텍스트 영역 추출 및 이진화 (Text Detection and Binarization using Color Variance and an Improved K-means Color Clustering in Camera-captured Images)

  • 송영자;최영우
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.205-214
    • /
    • 2006
  • 이미지에 포함된 텍스트는 이미지의 내용을 함축적이고 구체적으로 표현하는 정보로서 이러한 정보를 실시간에 찾아내서 인식한다면 다양한 응용에 활용할 수 있다. 본 논문에서는 카메라로 취득한 다양한 종류의 이미지로부터 텍스트를 추출하는 방법과 추출된 영역에서 텍스트를 분리하는 방법을 새롭게 제안한다. 텍스트 영역 추출을 위해서 RGB 색 공간에서 색 분산을 특징으로 제안하며, 텍스트 영역 분리를 위해서 RGB 색 공간에서 개선된 K-means 병합을 제안한다. 실험은 디지털 카메라와 핸드폰 카메라로 취득한 다양한 종류의 문서유형 이미지와 실내외의 일반적인 자연이미지를 사용하였으며, ICDAR 콘테스트[1] 이미지의 일부도 사용하였다.

웹 기반 멀티미디어 검색 엔진 구현 (Web based Multimedia Search Engine)

  • 이상열;정성호;황병곤
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.437-441
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색 기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 n-gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기발에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF