• Title/Summary/Keyword: 영상기반분석

Search Result 3,482, Processing Time 0.036 seconds

Design of Image Metadata for Mobile Augmented Reality (모바일 증강현실을 위한 영상 메타데이터 설계)

  • Lee, Yong-Hwan;Park, Je-Ho;Yoon, Kyoungro;Kim, Cheong-Ghil;Kim, Youngseop
    • Journal of Digital Contents Society
    • /
    • v.15 no.2
    • /
    • pp.263-270
    • /
    • 2014
  • This paper proposes a new metadata schema for effective mobile service of augmented reality technology, which is used in the convergence of media into a frame among the real world image and objects of virtual world. The proposed metadata schema is extended from JPSearch Core Metadata Schema (ISO/IEC 24800-2 International Standard) with analysis of the functionalities under industrial requirements, and enables to provide an effective application in the actual services. In addition, the proposed schema is available to organize the exchange of information between heterogeneous systems. With development of the prototype system, the proposed metadata schema is going to be submitted and verified under ISO/IEC JTC1 SC29 WG1 JPEG AR standard project.

Implementation of Component Ware for Medical Image Annotation and Analysis (의료영상 정보표현 및 분석을 위한 컴포넌트웨어 개발)

  • 장철진;강영민;정태락;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.703-705
    • /
    • 2004
  • 의학적 진단이나 치료를 하는 과정에선 실험이나 촬영을 통한 사진이나 영상이 많이 생성된다 의학용 이미지들은 각각 생성된 환경에 따른 특성을 가지고 있기 때문에. 효율적으로 이미지를 관리하기 위해서는 이미지의 특징이나 증상과 같은 정보들을 함께 표현해야한다. 본 논문에서는 의료 영상이 나타내는 정보를 표기하고, 카메라로부터 입력받는 영상을 출력 및 분석할 수 있는 컴포넌트웨어에 대해서 살펴본다. 본 논문에서 개발한 컴포넌트웨어는 다른 프로그램에서도 쉽게 영상관련 처리를 할 수 있도록 COM 기반의 Activex 컨트롤로 개발하였으며 이미지의 주석기능과 더불어 각각의 이미지나 카메라로부터 입력받는 동영상의 색 공간변환 및 왜곡보정 등의 기능을 가지고 있어, 보다 정교한 작업을 요하는 의료 영상처리 프로그램에 손쉽게 추가하여 사용할 수 있다.

  • PDF

Visualization and Image Processing for Measurement of Propagational Velocity of Shear Front (유동장의 이동속도측정을 위한 가시화 및 영상처리 방안)

  • Kim Jae-Won;Han Sang-Hoon;Ahn Eun-Young
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.10
    • /
    • pp.1322-1328
    • /
    • 2005
  • The circulation flows passing through the Ekman boundary layer on the rotating disk and transfer the angular momentum into the interior region of the container. Consequently, the circulation enhances the momentum transfer and the interior fluid is divided by a propagating shear front. This investigation focuses on computer vision and image processing technique for analysis of Non-Newtonian Fluids. To visualize marching velocity shear front for the transient flow, a particular shaped particles and light are used. To validate the proposed method, quantitative image are compared with the optical data acquired by a direct measurement of LDV (Laser Doppler Velocimetry).

  • PDF

A FRINGE CHARACTER ANALYSIS OF FRINGE IMAGE (Fringe 영상의 주파수 특성 분석)

  • Seo Young-Ho;Choi Hyun-Jun;Kim Dong-Wook
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.30 no.11C
    • /
    • pp.1053-1059
    • /
    • 2005
  • The computer generated hologram (CGH) designs and produces digital information for generating 3-D (3-Dimension) image using computer and software instead of optically-sensed hologram of light interference, and it can synthesis a virtual object which is physically not in existence. Since digital hologram includes an amount of data as can be seen at the process of digitization, it is necessary that the data representing digital hologram is reduced for storing, transmission, and processing. As the efforts that are to handle hologram with a type of digital information have been increased, various methods to compress digital hologram called by fringe pattern are groped. Suitable proposal is encoding of hologram. In this paper, we analyzed the properties of CGH using tools of frequency transform, assuming that a generated CGH is a 2D image by introducing DWT that is known as the better tool than DCT for frequency transform. The compression and reconstruction result which was extracted from the wavelet-based codecs illustrates that it has better properties for reconstruction at the maximum 2 times higher compression rate than the Previous researches of Yoshikawa[2] and Thomas[3].

Face Emotion Recognition by Fusion Model based on Static and Dynamic Image (정지영상과 동영상의 융합모델에 의한 얼굴 감정인식)

  • Lee Dae-Jong;Lee Kyong-Ah;Go Hyoun-Joo;Chun Myung-Geun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.5
    • /
    • pp.573-580
    • /
    • 2005
  • In this paper, we propose an emotion recognition using static and dynamic facial images to effectively design human interface. The proposed method is constructed by HMM(Hidden Markov Model), PCA(Principal Component) and wavelet transform. Facial database consists of six basic human emotions including happiness, sadness, anger, surprise, fear and dislike which have been known as common emotions regardless of nation and culture. Emotion recognition in the static images is performed by using the discrete wavelet. Here, the feature vectors are extracted by using PCA. Emotion recognition in the dynamic images is performed by using the wavelet transform and PCA. And then, those are modeled by the HMM. Finally, we obtained better performance result from merging the recognition results for the static images and dynamic images.

MPEG-4 Encoding for Stereo Video Stream (스테레오 비디오 스트림을 위한 MPEG-4 인코딩)

  • Na, In-Soon;Kim, Myoung-Eun;Cho, Dong-Sub
    • Proceedings of the KIEE Conference
    • /
    • 2002.07d
    • /
    • pp.2843-2845
    • /
    • 2002
  • 본 논문에서는 입체 영상 재현을 위한 한쌍의 이미지 스트림 데이터를 MPES-4 표준을 기반으로 효율적으로 인코딩하는 방식을 제안하고, 이에 대한 인코더를 분석, 설계하였다. 최근 하이비전 보다 더욱 인간의 감성에 호소하는 영상 시스템으로서 3차원 입체 영상에 대한 기대가 고조되고 있고, 영상 정보의 현실감 부여와 정보 전달의 리얼리티에 관한 많은 정보론 요구하고 있다. 또한 현대의 정보 통신 분야는 방송, 통신 및 컴퓨터가 통합되고, 무선과 유선이 융합되는 새의운 정보 통신 기술로 진화하고 있다. 이러한 변화의 영향으로 영상 서비스에 대한 기술 개발 경향도 영상 정보의 효율적인 전달 및 저장이라는 기존의 동영상 압축 표준이 갖는 기능뿐만 아니라, 보다 더 향상된 기능을 제공하는 방향으로 나아가고 있다. 기존 입체 영상 인코딩 방식은 상관 관계가(Correlation) 높은 각각의 입체 영상을 독립적으로 인코딩하는 반면, 본 논문에서는 한 인코더에서 동시에 인코딩하는 방식을 제안하였으며, 이 방식은 저장 공간과 이미지 스트림 전송에 효율적일 것이나 MPEG-4는 현재 각광받고 있는 인터넷 등의 멀티미디어 서비스에 있어서 효율적이고 필수적인 핵심기술로 본 논문의 기반이 되었다. 본 논문에서 제안하는 방식은 MPEG-4를 이용한 입체 영상 관련 응용에 적용될 수 있다.

  • PDF

A Study on Learning Medical Image Dataset and Analysis for Deep Learning (Deep Learning을 위한 학습 의료영상 데이터셋 및 분석에 관한 연구)

  • Noh, Si-Hyeong;Kim, Ji-Eon;Jeong, Chang-Won;Kim, Tae-Hoon;Jun, Hong-Yong;Yoon, Kwon-Ha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.350-351
    • /
    • 2018
  • 최근 의료 현장에 인공지능 기술의 도입이 가속화 되고 있다. 특히, 의료영상 분석 분야의 관련된 기 시스템 및 소프트웨어의 패러다임을 변화시키고 있다. 본 연구는 인공지능 기술을 적용하기 위한 학습의료영상 구성을 제안하고 이를 기반으로 X-ray 영상 중 손부위에 적용하여 오른손과 왼손을 판별하는 응용에 적용하였다. 그리고 Deep Learning Algorithm의 CNN을 개선하여 개발한 Advanced GoogLeNet를 적용하여 97%이상의 정확도를 보였다. 본 연구를 통해 얻어진 인공지능에 적용하기 위한 학습데이터 셋 구성과 개선된 알고리즘은 다양한 의료영상분석에 적용하고자 한다.

Pre-processing and implementation for intelligent imagery interpretation system (지능형 영상 판독 시스템 설계를 위한 전처리 및 구현)

  • Jeon, TaeHyeon;Na, HyungSun;Ahn, Jinhyun;Im, Dong-Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.305-307
    • /
    • 2021
  • 군사 분야에서 사용하는 기존 영상융합체계는 영상에서 미확인 개체를 식별하는 Activity-Based Intelligence(ABI) 기술과 객체들에 대한 지식정보를 관리하는 Structured Observation Management(SOM) 기술을 연동하여 다양한 관점에서 분석하고 있다. 그러나 군사적인 목적을 달성하기 위해서는 미래 정보가 중요하기 때문에 주변 맥락 정보를 통합하여 분석해야 할 필요성이 있으며 이를 위해 주변맥락 정보를 분석하는 딥러닝 모델 적용이 필요하다. 본 논문에서는 딥러닝 모델 기반 영상 판독 시스템 구축을 하기 위한 전처리 과정을 설계하였다. pyhwp 라이브러리를 이용하여 영상 정보 판독 데이터를 파싱 및 전처리를 진행하여 데이터 구축을 진행하였다.

Dialogue based multimodal dataset including various labels for machine learning research (대화를 중심으로 다양한 멀티모달 융합정보를 포함하는 동영상 기반 인공지능 학습용 데이터셋 구축)

  • Shin, Saim;Jang, Jinyea;Kim, Boen;Park, Hanmu;Jung, Hyedong
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.449-453
    • /
    • 2019
  • 미디어방송이 다양해지고, 웹에서 소비되는 콘텐츠들 또한 멀티미디어 중심으로 재편되는 경향에 힘입어 인공지능 연구에 멀티미디어 콘텐츠를 적극적으로 활용하고자 하는 시도들이 시작되고 있다. 본 논문은 다양한 형태의 멀티모달 정보를 하나의 동영상 콘텐츠에 연계하여 분석하여, 통합된 형태의 융합정보 데이터셋을 구축한 연구를 소개하고자 한다. 구축한 인공지능 학습용 데이터셋은 영상/음성/언어 정보가 함께 있는 멀티모달 콘텐츠에 상황/의도/감정 정보 추론에 필요한 다양한 의미정보를 부착하여 활용도가 높은 인공지능 영상 데이터셋을 구축하여 공개하였다. 본 연구의 결과물은 한국어 대화처리 연구에 부족한 공개 데이터 문제를 해소하는데 기여하였고, 한국어를 중심으로 다양한 상황 정보가 함께 구축된 데이터셋을 통하여 다양한 상황 분석 기반 대화 서비스 응용 기술 연구에 활용될 것으로 기대할 수 있다.

  • PDF

Object-of-Interest Oriented Multi-Angle Video Acquisition Technique Using Object-Tracking based on Multi-PTZ Camera Position Control (객체 추적 연동 다중 PTZ 카메라 제어 기반 객체 중심 다각도 영상 획득 기술)

  • Kim, Y.K.;Um, G.M.;Cho, K.S.
    • Electronics and Telecommunications Trends
    • /
    • v.31 no.3
    • /
    • pp.1-8
    • /
    • 2016
  • 최근 개인화된 미디어의 출현과 더불어 방송통신 미디어 분야에서 개인별 맞춤형 방송 서비스에 대한 관심과 지원이 빠르게 확산되는 추세다. 특히, 다중 카메라를 이용한 관심 인물에 대한 다각도 영상과 같은 차별화된 영상을 제공하려는 수요가 꾸준히 증가하고 있다. 객체 중심의 영상을 생성하기 위한 관련 기술의 발전 및 수요 변화에 발맞춰 본고에서는 관련 기술의 개요 및 연구동향을 살펴보고, ETRI에서 개발 중인 객체 추적 기반의 다중 Pan-Tilt-Zoom(PTZ) 카메라 제어를 통한 객체 중심 다각도 영상 획득 기술을 소개하고자 한다.

  • PDF