• Title/Summary/Keyword: 이미지 시퀀스

Search Result 69, Processing Time 0.022 seconds

Object Tracking Algorithm using Temporal Wavelet (Temporal 웨이브릿을 이용한 물체 추적 알고리즘)

  • Chang, Do-Im;Kim, Do-Nyun;Kang, Min-Sook;Cho, Dong-Sub
    • Proceedings of the KIEE Conference
    • /
    • 1999.07g
    • /
    • pp.2843-2845
    • /
    • 1999
  • Temporal 웨이브릿 변환은 2차원 이미지 시퀀스 즉, 프레임 사이의 시간적 변화를 포함한다. Temporal 웨이브릿 변환은 우선 2차원 이미지를 프레임 단위로 행방향, 열방향의 순서로 웨이브릿 변환을 수행한 후 원영상의 1/2 해상도의 영상 프레임 시퀀스를 시간축 방향으로 웨이브릿 변환을 수행한다. Temporal Wavelet 변환의 결과로 나온 계수는 각 프레임의 특성과 프레임과 프레임 사이의 특성을 포함한다. 본 논문에서는 이 Temporal 웨리브릿 변환 결과로 나온 계수의 특성을 이용하여 물체의 움직임을 추적하는 Division Rule을 제시하고, 더욱 정확한 결과를 얻기 위해 Division Rule이 적용된 결과에 실험적으로 최적화된 가중치를 결정하여 컨벌루션을 적용한다.

  • PDF

A Study on the OCR of Korean Sentence Using DeepLearning (딥러닝을 활용한 한글문장 OCR연구)

  • Park, Sun-Woo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.470-474
    • /
    • 2019
  • 한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.

  • PDF

Efficient Representation and Matching of Object Movement using Shape Sequence Descriptor (모양 시퀀스 기술자를 이용한 효과적인 동작 표현 및 검색 방법)

  • Choi, Min-Seok
    • The KIPS Transactions:PartB
    • /
    • v.15B no.5
    • /
    • pp.391-396
    • /
    • 2008
  • Motion of object in a video clip often plays an important role in characterizing the content of the clip. A number of methods have been developed to analyze and retrieve video contents using motion information. However, most of these methods focused more on the analysis of direction or trajectory of motion but less on the analysis of the movement of an object itself. In this paper, we propose the shape sequence descriptor to describe and compare the movement based on the shape deformation caused by object motion along the time. A movement information is first represented a sequence of 2D shape of object extracted from input image sequence, and then 2D shape information is converted 1D shape feature using the shape descriptor. The shape sequence descriptor is obtained from the shape descriptor sequence by frequency transform along the time. Our experiment results show that the proposed method can be very simple and effective to describe the object movement and can be applicable to semantic applications such as content-based video retrieval and human movement recognition.

Learning and Transferring Deep Neural Network Models for Image Caption Generation (이미지 캡션 생성을 위한 심층 신경망 모델 학습과 전이)

  • Kim, Dong-Ha;Kim, Incheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.617-620
    • /
    • 2016
  • 본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하고, 컨볼루션 신경망 층의 출력을 임베딩 층뿐만 아니라 멀티 모달 층에도 연결함으로써, 캡션 문장 생성을 위한 매 단계마다 이미지의 시각 정보를 이용할 수 있는 연결 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 우수성을 입증하였다.

Image Mosaic from a Video Sequence using Block Matching Methods (블록매칭을 이용한 비디오 시퀀스의 이미지 모자익)

  • 이지근;김희숙;정성태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.604-606
    • /
    • 2001
  • 최근 들어 이미지 모자익은 가상현실과 웹 브라우저 상에서의 가상환경 구축, 관광, 광고 등, 많은 응용분야에서 관심을 모으고 있다. 이미지 모자익을 위해 해결해야 할 주된 문제는 이미지들 간의 중복되는 영역에서 정확한 대응점을 찾는 것이다. 지금까지 이 대응점을 찾기 위한 노력은 시스템의 많은 계산량과 시간을 투자해야만 했다. 또한 대부분의 모자익이 여러 차례의 촬영에 의한 정지 화상들 간의 모자익에 그치고 있다. 따라서 본 논문에서는 비디오 카메라를 이용하여 프레임들 간의 중복되는 영역에서 일정한 비교 영역을 지정하고 그 비교 영역 안에서 대응점을 찾는 블럭 매칭 방법을 적용함으로써 전체적인 모자익 시간을 줄이는 방법을 구현하였다.

  • PDF

Height Measurement using the image sequences (연속 입력된 영상을 이용한 높이 측정)

  • Kim, Tae-Eun
    • Journal of Digital Contents Society
    • /
    • v.7 no.1
    • /
    • pp.9-14
    • /
    • 2006
  • In this paper, we propose the algorithm that automatically measures the height of the object to move on the base plane by using the geometric information. To extract a moving object from images, we use the difference image and morphology operation. The top and bottom point of an object are extracted by the histogram vertical projection in the extracted region. The two points, top and bottom, are used for measuring the height. Given the vanishing line of the ground plane, the vertical vanishing point, and at least one reference height in the scene; then the height of any point from the ground may be computed by specifying the image of the point and the image of the vertical intersection with the ground plane at that point. Through a confidence valuation of the height to be measured, we confirmed similar actual height and result in the simulation experiment.

  • PDF

The Structure of Text and Spatial Image - Focused on the Signification and Dramatic Space of ${\ulcorner}$the Sea-gull${\lrcorner}$ - (텍스트와 공간이미지의 구조 - "갈매기" 의 극공간 구조와 의미작용을 중심으로 -)

  • 오경환
    • Archives of design research
    • /
    • v.14 no.4
    • /
    • pp.199-207
    • /
    • 2001
  • The public performance of drama has essence to convert text to visual images as stage and to represent, inform such visual images. Visual image is formed through a space as stage. Stage is a dish to fill the texts and is the mother's womb of visual image. Namely, visual image of drama equals space image. The purpose of this study is a trial to grasp the structure and system represented through interpreting. Especially, the concerns of this study are not semiology of letter imported in image but spacial image text importing just contents of text and the process and contents grasping the structure and meaning of dramatic space. Finally, this study proposed 'the system of space embodiment'from the semiotic point of view as interpretation methodology of actual memorial, symbolic space.

  • PDF

Reversible Data Embedding Algorithm based on Pixel Value Prediction Scheme using Local Similarity in Image (지역적 유사성을 이용한 픽셀 값 예측 기법에 기초한 가역 데이터 은닉 알고리즘)

  • Jung, Soo-Mok
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.10 no.6
    • /
    • pp.617-625
    • /
    • 2017
  • In this paper, an effective reversible data embedding algorithm was proposed to embed secrete data into image. In the proposed algorithm, prediction image is generated by accurately predicting pixel values using local similarity existing in image, difference sequence is generated using the generated prediction image and original cover image, and then histogram shift technique is applied to create a stego-image with secrete data hidden. Applying the proposed algorithm, secrete data can be extracted from the stego-image and the original cover image can be restored without loss. Experimental results show that it is possible to embed more secrete data into cover image than APD algorithm by applying the proposed algorithm.

Efficient Rotation-Invariant Boundary Image Matching Using the Envelope-based Lower Bound (엔빌로프 기반 하한을 사용한 효율적인 회전-불변 윤곽선 이미지 매칭)

  • Kim, Sang-Pil;Moon, Yang-Sae;Hong, Sun-Kyong
    • The KIPS Transactions:PartD
    • /
    • v.18D no.1
    • /
    • pp.9-22
    • /
    • 2011
  • In this paper we present an efficient solution to rotation?invariant boundary image matching. Computing the rotation-invariant distance between image time-series is a time-consuming process since it requires a lot of Euclidean distance computations for all possible rotations. In this paper we propose a novel solution that significantly reduces the number of distance computations using the envelope-based lower bound. To this end, we first present how to construct a single envelope from a query sequence and how to obtain a lower bound of the rotation-invariant distance using the envelope. We then show that the single envelope-based lower bound can reduce a number of distance computations. This approach, however, may cause bad performance since it may incur a larger lower bound by considering all possible rotated sequences in a single envelope. To solve this problem, we present a concept of rotation interval, and using the rotation interval we generalize the envelope-based lower bound by exploiting multiple envelopes rather than a single envelope. We also propose equi-width and envelope minimization divisions as the method of determining rotation intervals in the multiple envelope approach. Experimental results show that our envelope-based solutions outperform existing solutions by one or two orders of magnitude.

A Study on the Tendencies of the Motion Graphic Expressions in the Title sequence (타이틀 시퀀스에서 모션그래픽의 표현경향에 관한 연구)

  • Jung, Hee-Jin;Na, Jun-Ki
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.195-199
    • /
    • 2006
  • In the field of video design, motion graphics tends to be realized to deliver a certain message properly incorporating basic motion graphics components such as space, form of expression, and time, and has continued to be used as a powerful communication tool. Many cases proved that title sequences were produced as a result of combination of a variety of quick images and effects with appropriately chosen sounds to meet the demands of audience. This study indicated that motion graphics began to be widely used as a more powerful video communication tool for title sequences and also applied for M-NET, DMB, CABLE TV, IPTV, and others.

  • PDF