• 제목/요약/키워드: text image

검색결과 981건 처리시간 0.033초

비디오 자막 문자의 효과적인 교환 방법 (An Effective Method for Replacing Caption in Video Images)

  • 전병태;김숙연
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.97-104
    • /
    • 2005
  • 자막 문자는 시청자의 이해를 돕기 위하여 제작된 비디오 영상에 종종 삽입한다. 영화의 경우 영상과 자막과 영상의 트랙이 달라 자막 교환이 영상에 손실을 주지 않고 이루어 질 수 있다. 자막이 삽입된 비디오 영상의 경우, 기존의 자막 교환 방법은 자막이 존재하는 부분 박스 형태로 일정 영역을 색칠한 후 그위에 새로운 자막을 삽입한다. 이러한 자막 교환 방법은 문자 영역을 포함한 주변 영역의 원영상의 손실을 초래함으로써 시청자에 시청의 불편을 초래하는 문제가 있다. 본 논문에서는 기존 방법의 문제점을 해결하기 위한 효과적인 자막 교환 방법을 제안하고자 한다 효과적인 교환 방법은 자막 영역을 원영상으로 복원한 복원된 문자 영역에 교환될 문자를 삽입하는 방법이다. 실험결과 대부분 자막이 복원이 잘 되어 효과적인 자막 교환이 이루어짐을 볼 수 있었다. 일부 복잡한 영상의 경우 복원 결과 약간의 왜곡 현상은 보여주나 왜곡된 위치에 새로운 자막을 삽입은 복원의 오류를 보완하는 역할을 함으로써 자연스런 자막 교환이 이루어짐을 볼 수 있었다.

  • PDF

이미지 손실없는 확대/축소가 가능한 아바타 생성 시스템 (The Avata Construction System for Image Lossless Scaling)

  • 김원중;장미화
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.181-189
    • /
    • 2002
  • 본 논문에서는 차세대 마크업 언어로 각광받고 있는 XML(extensible Markup Language)의 그래픽 표준인 SVG(Scalable Vector Graphic)를 이용하여 어떤 단말기에서도 같은 형식으로 디스플레이 되고, 사용자가 원하는 형태로 이미지의 손상없이 수정이 가능하여 각 부분 요소의 재사용성을 크게 높인 아바타(웹 캐릭터) 생성 시스템을 설계 및 구현하였다. SVG는 텍스트로 기술되기 때문에 그래픽에 대한 검색이 편리하고, 어플리케이션들이 SVG문서를 쉽게 사용할 수 있으며, 선, 폴리곤, 텍스트, 이미지 등의 모든 그래픽 요소에 쉽게 접근할 수 있으므로 데이터베이스와 연동하여 웹 그래픽 문서를 동적으로 생성할 수 있다. 또한 연구 결과를 이용하여 웹 상에서 발생할 수 있는 어떠한 컨텐츠에도 사용할 수 있는 기술을 구현할 수 있을 것이다.

A Consistent Quality Bit Rate Control for the Line-Based Compression

  • Ham, Jung-Sik;Kim, Ho-Young;Lee, Seong-Won
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권5호
    • /
    • pp.310-318
    • /
    • 2016
  • Emerging technologies such as the Internet of Things (IoT) and the Advanced Driver Assistant System (ADAS) often have image transmission functions with tough constraints, like low power and/or low delay, which require that they adopt line-based, low memory compression methods instead of existing frame-based image compression standards. Bit rate control in the conventional frame-based compression systems requires a lot of hardware resources when the scope of handled data falls at the frame level. On the other hand, attempts to reduce the heavy hardware resource requirement by focusing on line-level processing yield uneven image quality through the frame. In this paper, we propose a bit rate control that maintains consistency in image quality through the frame and improves the legibility of text regions. To find the line characteristics, the proposed bit rate control tests each line for ease of compression and the existence of text. Experiments on the proposed bit rate control show peak signal-to-noise ratios (PSNRs) similar to those of conventional bit rate controls, but with the use of significantly fewer hardware resources.

지식 그래프와 딥러닝 모델 기반 텍스트와 이미지 데이터를 활용한 자동 표적 인식 방법 연구 (Automatic Target Recognition Study using Knowledge Graph and Deep Learning Models for Text and Image data)

  • 김종모;이정빈;전호철;손미애
    • 인터넷정보학회논문지
    • /
    • 제23권5호
    • /
    • pp.145-154
    • /
    • 2022
  • 자동 표적 인식(Automatic Target Recognition, ATR) 기술이 미래전투체계(Future Combat Systems, FCS)의 핵심 기술로 부상하고 있다. 그러나 정보통신(IT) 및 센싱 기술의 발전과 더불어 ATR에 관련이 있는 데이터는 휴민트(HUMINT·인적 정보) 및 시긴트(SIGINT·신호 정보)까지 확장되고 있음에도 불구하고, ATR 연구는 SAR 센서로부터 수집한 이미지, 즉 이민트(IMINT·영상 정보)에 대한 딥러닝 모델 연구가 주를 이룬다. 복잡하고 다변하는 전장 상황에서 이미지 데이터만으로는 높은 수준의 ATR의 정확성과 일반화 성능을 보장하기 어렵다. 본 논문에서는 이미지 및 텍스트 데이터를 동시에 활용할 수 있는 지식 그래프 기반의 ATR 방법을 제안한다. 지식 그래프와 딥러닝 모델 기반의 ATR 방법의 핵심은 ATR 이미지 및 텍스트를 각각의 데이터 특성에 맞게 그래프로 변환하고 이를 지식 그래프에 정렬하여 지식 그래프를 매개로 이질적인 ATR 데이터를 연결하는 것이다. ATR 이미지를 그래프로 변환하기 위해서, 사전 학습된 이미지 객체 인식 모델과 지식 그래프의 어휘를 활용하여 객체 태그를 노드로 구성된 객체-태그 그래프를 이미지로부터 생성한다. 반면, ATR 텍스트는 사전 학습된 언어 모델, TF-IDF, co-occurrence word 그래프 및 지식 그래프의 어휘를 활용하여 ATR에 중요한 핵심 어휘를 노드로 구성된 단어 그래프를 생성한다. 생성된 두 유형의 그래프는 엔터티 얼라이먼트 모델을 활용하여 지식 그래프와 연결됨으로 이미지 및 텍스트로부터의 ATR 수행을 완성한다. 제안된 방법의 우수성을 입증하기 위해 웹 문서로부터 227개의 문서와 dbpedia로부터 61,714개의 RDF 트리플을 수집하였고, 엔터티 얼라이먼트(혹은 정렬)의 accuracy, recall, 및 f1-score에 대한 비교실험을 수행하였다.

체인 정합과 확장된 그룹핑 방법을 사용한 곡선형 텍스트 라인 추출 (Extracting curved text lines using the chain composition and the expanded grouping method)

  • ;윤진선;송영준;김남;김용기
    • 정보처리학회논문지B
    • /
    • 제14B권6호
    • /
    • pp.453-460
    • /
    • 2007
  • 본 논문은 정형화되지 않은 텍스트 라인들을 추출하기 위한 방법을 보여주고 있다. 텍스트 라인들은 각기 다른 각도로 구성되고, 심하게 굴곡이 있는 모양, 그리고 텍스트 라인내의 약간의 단어 사이의 공간이 생기게 된다. 그러한 텍스트 라인들은 포스터, 주소, 그리고 예술 문서 등에서 발견된다. 제안하는 방법은 기존의 직관적인 그룹핑 방법에 기반을 두고 있지만, 하나의 라인에서 발생하는 불충분한 특징점들과 모호한 회전 등을 극복하기 위한 방법을 개발하였다. 본 논문에서 텍스트 라인들은 몇 개의 연결된 성분들로 구성되고, 이 성분들은 하나의 문자 또는 연결된 문자들의 검은색 화소들의 집합이라고 가정하였다. 제안하는 방법은 반복적으로 증가되는 임계값과 가까운 성분들은 하나의 체인으로 병합하게 되고 확장되어 길어진 체인들은 라인의 원시 체인으로서 인지된다. 그때 원시 체인들은 텍스트 라인의 부분적 회전에 따라 좌우로 확장되어 진다. 텍스트 라인의 부분적인 회전은 원시 체인이 확장될 때, 체인들의 각 면에서 재구성될 것이다. 이러한 과정을 통해서 모든 텍스트 라인들이 구성되어 진다. 제안 방법은 로고와 슬로건에서 사용된 곡면으로 쓰여진 텍스트 라인들에 대해서 실험한 결과 직선 텍스트 라인은 98%, 곡선 텍스트 라인은 94%로서 높은 추출율을 보여주고 있다.

중국대학생 동영상 학습에서 텍스트 제시방식과 이미지 제시방식이 학습몰입, 학습만족, 학업성취에 미치는 효과 (Effect of text and image presenting method on Chinese college students' learning flow, learning satisfaction and learning outcome in video learning environment)

  • 장정;제혜금;김보경
    • 한국산학기술학회논문지
    • /
    • 제22권1호
    • /
    • pp.633-640
    • /
    • 2021
  • 본 연구는 동영상 학습에서 텍스트와 이미지 제시방식이 학습자의 학습몰입, 학습만족, 학업성취에 미치는 차이를 분석하였다. 이때 텍스트 제시방식은 2~3단어로 구성된 짧은 문장형태와 키워드형태로 구분하였고, 이미지 제시방식은 상세정보와 관계정보를 모두 표현하는 이미지와 관계정보만을 표현하는 이미지로 구분하였다. 실험연구를 위해 중국 형태대학교 1학년 167명을 텍스트와 이미지 제시방식에 따른 4가지 유형의 동영상 집단에 무선배정한 후 학습하게 하였다. 분석하기 위해 SPSS 25.0을 사용하여 다변량분산분석(MANOVA)을 실시하였다. 연구결과, 짧은 문장형태로 텍스트가 제시된 동영상을 학습한 집단이 키워드 형태의 텍스트가 제시된 동영상을 학습한 집단보다 학습몰입, 학습만족, 학업성취가 통계적으로 유의하게 높았다. 둘째, 상세정보와 관계정보를 모두 표현하는 이미지가 제시된 동영상을 학습한 집단이 관계정보만 표현하는 이미지가 제시된 동영상을 학습한 집단보다 학습몰입, 학습만족, 학업성취가 통계적으로 유의하게 높았다. 짧은 문장형태의 텍스트와 관계정보만 표현한 이미지가 제시된 동영상을 학습한 집단의 종속변인 평균이 가장 높았다. 반면에, 키워드 형태의 텍스트와 관계정보만 표현한 이미지가 제시된 동영상을 학습한 집단의 종속변인 평균이 가장 낮았다. 이러한 결과는 교수자 내레이션이 포함된 동영상을 설계할 때 이미지와 텍스트의 제시할 때 시사점을 준다.

카메라 기반 문서영상에서의 문자 추출 (Text extraction from camera based document image)

  • 박희주;김진호
    • 한국산업정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.14-20
    • /
    • 2003
  • 본 논문에서는 카메라로 획득한 문서영상에 대해 조명의 영향에 관계없이 고속으로 문자영역을 추출하는 알고리즘을 제안하였다. 카메라 문서는 스캐너 문서와는 달리 주변 환경이나 조명의 영향으로 인하여 문자영역을 추출하는 것이 매우 어렵다. 먼저 영상 사전처리 단계에서 컬러영상을 명도영상으로 변환한 후 조명의 영향에 무관하게 배경 그림으로부터 문자 영역을 정확히 추출하기 위해서 명도레벨 정규화를 사용하였다. 또한 배경 그림 및 잡음은 제거하고 문자 획의 손실 없이 문자 영역을 추출하기 위하여 국소-적응적-이진화-방법(local adaptive binarization method)을 새롭게 개발하여 문서영상을 이진화시켰다. 문자영역 추출 단계에서는 수평 및 수직 투영과 연결요소 정보에 의해 문자열, 단어 및 개별 문자 영역을 단계적으로 추출하였다. 제안된 방법의 타당성을 검증하기 위하여 ETRI에서 구축한 한글/영어/숫자/특수기호가 혼합된 현장 문서영상 DB를 가지고 실험해 보았다.

  • PDF

도로표지 영상에서 IRBP 기반의 문자 영역 추출 (Text Area Detection of Road Sign Images based on IRBP Method)

  • 정규수
    • 한국ITS학회 논문지
    • /
    • 제13권6호
    • /
    • pp.1-9
    • /
    • 2014
  • 최근 Mobile Mapping System을 활용한 영상의 수집과 도로표지 속성정보의 자동 인식을 위한 연구가 진행되고 있다. 도로표지는 판의 규격, 글씨크기 및 배치가 다양하고 가로수 등 타 시설물의 간섭으로 인해 일정한 패턴을 찾아 정보를 추출하기 어렵다. 본 연구에서는 다양한 크기의 한글 문자가 있거나, 한글문자 주변에 심벌이 위치한 도로표지에 대해서도 국문지명을 성공적으로 검출하기 위해서는, 한글문자 템플릿에 의존하지 않는 새로운 국문지명 검출 방법이 필요하다. 그 새로운 한 방법으로서, 점진적 좌측방향으로의 블럽 투사(incremental right-to-left blob projection, IRBP)를 제시하고, 그 가능성과 개선 정도를 평가하였다. 성능 평가하기 위하여, 60개의 도로표지 영상 데이터로 기존의 한글 템플릿을 사용하는 경우와 비교하여 성능을 평가하였다. 전반적으로, IRBP 방법으로 국문지명 검출 성능을 개선할 수 있음을 확인하였다.

Client/Server구조를 이용한 PDA기반의 문자 추출 시스템 (PDA-based Text Extraction System using Client/Server Architecture)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권2호
    • /
    • pp.85-98
    • /
    • 2005
  • 최근, PDA를 이용한 모바일 비젼 시스템에 관한 많은 연구가 진행되고 있다. 대부분의 PDA에서 사용하는 CPU는 실수 연산 구성요소(floating-computation component)가 없는 정수(integer)형 CPU를 사용하므로, 실수 연산이 많은 영상 처리 및 비젼 시스템에서는 많은 시간이 소요되는 단점이 있다 본 논문에서는 이를 해결하기 위해 무선 랜(LAN)으로 연결된 Client(PDA)/server(PC)구조론 이용한 시스템을 제안하며, 연속 영상에서 Client(PDA)와 Server(PC) 각각의 CPU를 이용하여 파이프라이닝 형식으로 시스템을 구축함으로써 수행 시간을 단축한다. Client(PDA)는 에지 밀도(edge density)론 이용하여 대략적인 문자 영역을 추출하며, Server(PC)는 Client(PDA)에서 대략적으로 검출된 견과를 바탕으로 정밀한 문자 영역을 추출하기 위해, MLP(multi-layer perceptron) 기반의 텍스춰 분류 방법과 연결 성분(connected component: CC) 기반의 필터링 방법을 이용한다. 본 실험에서 제안한 방법은 MLP와 CC를 이용함으로써 효과적인 문자 추출 결과를 보였으며, 파이프라이닝 형식의 Client(PDA)/server(PC)구조를 이용함으로써 빠른 수행 시간을 보였다.

2D 텐서 보팅에 기반 한 손상된 텍스트 영상의 복원 및 분할 (Corrupted Region Restoration based on 2D Tensor Voting)

  • 박종현;;이귀상
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.205-210
    • /
    • 2008
  • 본 논문에서는 잡음에 의해 손상된 텍스트 영상으로부터 복원 및 분할을 위한 새로운 접근 방법을 제안한다. 제안된 방법은 손상된 영역의 복원을 위하여 색상 및 비색상 성분을 2차 대칭 스틱 텐서로 표현하고 보팅 기반의 손상된 영역을 복원하였으며, 마지막으로 클러스터링 방법에 의해 분할을 수행한다. 먼저 우리는 제안된 색상 선택함수에 의해 잡음에 강건한 색상과 비색상 성분을 선택한다. 두 번째 단계에서는 각각의 선택된 특징 벡터들은 스틱 텐서로 표현하였으며 제한된 보팅 커널의 필드내에서 이웃하는 보터들과 통신을 통하여 새롭게 정의된다. 따라서 2차 보팅 후 각각의 스틱 텐서는 이웃하는 텐서와 같은 특성을 가지며 손상된 영역들을 복원할 수 있다. 마지막으로 복원된 영상의 성능을 평가하기 위하여 적응적 평균 이동 알고리즘과 클러스터링 알고리즘을 이용하여 영상 분할을 수행하였다. 실험에서 제안된 방법은 전체적인 처리과정을 자동적으로 수행 가능하였으며 배경 및 객체의 영역에서 효율적인 복원 및 분할을 수행할 수 있었다.