• Title/Summary/Keyword: 영상기반분석

Search Result 3,472, Processing Time 0.032 seconds

Development of the video-based smart utterance deep analyser (SUDA) application (동영상 기반 자동 발화 심층 분석(SUDA) 어플리케이션 개발)

  • Lee, Soo-Bok;Kwak, Hyo-Jung;Yun, Jae-Min;Shin, Dong-Chun;Sim, Hyun-Sub
    • Phonetics and Speech Sciences
    • /
    • v.12 no.2
    • /
    • pp.63-72
    • /
    • 2020
  • This study aims to develop a video-based smart utterance deep analyser (SUDA) application that analyzes semiautomatically the utterances that child and mother produce during interactions over time. SUDA runs on the platform of Android, iPhones, and tablet PCs, and allows video recording and uploading to server. In this device, user modes are divided into three modes: expert mode, general mode and manager mode. In the expert mode which is useful for speech and language evaluation, the subject's utterances are analyzed semi-automatically by measuring speech and language factors such as disfluency, morpheme, syllable, word, articulation rate and response time, etc. In the general mode, the outcome of utterance analysis is provided in a graph form, and the manger mode is accessed only to the administrator controlling the entire system, such as utterance analysis and video deletion. SUDA helps to reduce clinicians' and researchers' work burden by saving time for utterance analysis. It also helps parents to receive detailed information about speech and language development of their child easily. Further, this device will contribute to building a big longitudinal data enough to explore predictors of stuttering recovery and persistence.

Efficient Motion Estimation for Depth Map (깊이영상에 적합한 효율적인 움직임 예측 방법)

  • Oh, Byung Tae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.348-350
    • /
    • 2013
  • 본 논문에서는 깊이영상의 특징을 이용하여 깊이영상에 보다 적합한 움직임 예측방법에 대한 방식을 제안한다. 기존 컬러영상 기반으로 제안되었던 대부분의 움직임 예측 방법들이 깊이영상에 적용할 경우 local minimum 에 빠지게 되어 이에 따른 압축 성능 저하가 있음을 확인하였다. 본 논문에서는 이러한 문제점들이 깊이영상의 오브젝트 경계 영역에서 나타나게 됨을 분석하며, 이러한 문제점을 해결하기 위해 깊이영상의 경계 영역에 대해 feature matching 방식을 이용한 full search 방식을 제안한다. 실험적인 결과는 제안방식이 기존 full search 방식과 비교하여 성능은 비슷하게 유지한 채 복잡도를 크게 개선할 수 있음을 보여준다.

  • PDF

A Service Strategy of Binary Document Images in Digital Library (전자도서관에서의 이진 문서영상 서비스 방안)

  • 한영미;허봉식;김민환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.04a
    • /
    • pp.154-159
    • /
    • 1998
  • 최근의 전자도서관에서 문서영상 데이터베이스를 구축하여 사용자에게 원하는 정보의 원문을 그대로 서비스하고 있는데, 주로 200 dpi 문서영상에 대해 TIFF 영상포맷에서의 ITU-T T.6 압축방법을 사용하고 있다. 본 연구에서는, 문서영상 데이터베이스의 확장성, 지속성, 효율성 등을 고려하여, 문서 영상의 스캐닝 해상도의 600 dpi가 적당하며, 압축방법은 JBIG이 타당함을 제시하였다. 아울러, 모니터 및 프린터 기반 서비스의 특성을 분석하여 서비스 해상도를 차별화하는 방법인 단계별 서비스 방안을 제시함으로써 JBIG의 단점인 과다한 복구시간 문제를 해결하였다. 대표적인 문서영상들에 대한 실험을 통해, JBIG의 높은 압축율 및 제시된 단계별 서비스 방안의 타당성을 확인하였다.

  • PDF

Plenoptic Image Processing Technology Trends (플렌옵틱 영상처리 기술동향)

  • Son, W.H.;Jang, H.W.;Bae, S.J.;Park, S.J.;Kim, J.W.;Kim, D.H.
    • Electronics and Telecommunications Trends
    • /
    • v.31 no.4
    • /
    • pp.1-12
    • /
    • 2016
  • 깊이감, 시점 등의 3차원 영상정보 제공 방법에는 양안 시차에 의한 스테레오 방식, 다시점 기반의 스테레오 방식, 라이트필드 기반의 스테레오 방식, 체적 내에 실제 발광점들을 물리적으로 형성하는 체적형 방식, 빛의 간섭과 회절현상을 이용하여 실제 물체의 파면을 재현하는 홀로그래피 방식 등이 존재한다. 본고에서는, 3차원 영상기술로써 최근 이슈화되고 있는 플렌옵틱 영상기술의 개념을 다시점 영상생성 및 재초점 기능의 관점에서 소개하고, 동시에 관련 국내외 기술개발 동향을 파악하고자 한다. 또한, 플렌옵틱 영상기술의 고도화를 위한 최신 연구개발 이슈 및 응용 가능한 서비스 시나리오에 대해 탐구해 봄으로써, 향후 플렌옵틱 영상처리 기술의 발전 및 활용도를 전망해 보고자 한다.

  • PDF

Hierarchical shot Boundary Detection Using Time-Space Image (시공간 영상을 이용한 계층적인 장면 전환 검출)

  • 홍기진;김영봉
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.496-498
    • /
    • 2000
  • 동영상 비디오 시퀸스에서 필요로 하는 장면을 빠르고 쉽게 찾을 수 있도록 해주는 내용 기반 검색에 대한 연구가 활발히 이루어져 오고 있다. 특히, 내용 기반 검색 시스템의 기초 기술인 비디오 데이터의 샷(shot)에 따른 분할 연구는 다양한 방법으로 소개되었으나 정확도가 높은 분할 알고리즘이 아직 개발되지 않고 있는 실정이다. 본 논문에서는 비압축 비디오에서 컷(cut) 검출의 효율성을 향상시키기 위해 기존의 히스토그램 비교법과 시공간 영상을 활용하는 계층적인(hierarchical) 방법을 제안한다. 이를 위해 먼저 동영상의 각 프레임에서 한 행(row)씩 추출하여 동영상 전체를 대표하도록 시공간 영상을 생성하고, 생성된 시공간 영상에서 수평 에지(edge)를 이용한 프레임(frame) 특징값으로 장면 전화의 후보 영역을 선택하였다. 그리고 선택된 후보 영역을 히스토그램 비교법으로 분석하게 된다.

  • PDF

Resolution improvement of 3D images in plane-based computational integral imaging reconstruction technique (평면기반 컴퓨터 집적 영상 재생 방법에서 3차원 영상의 해상도 개선)

  • Shin, Dong-Hak
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.11 no.10
    • /
    • pp.1944-1949
    • /
    • 2007
  • In this paper, a new plane-based computational reconstruction technique for three-dimensional (3D) objects in 3D internal imaging based on a lens model is proposed. For the proposed technique, computational experiments have been carried out for various test images. Resolution of the reconstructed images is analyzed and compared with that obtained by the conventional technique. From experiments, it is shown that the resolution of a 3-D reconstructed image was improved by using the proposed technique.

Performance Evaluation of VCM based on Neural Network (Neural Network 기반 VCM의 성능평가)

  • Park, Seonguk;Lee, Haelim;Lee, Jooyoung;Jeong, Se-Yoon;Cho, Seunghyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.172-175
    • /
    • 2020
  • 최근 스마트시티, 자율 주행 자동차 등 기계에 의해 소비되는 영상 데이터의 양이 증가함에 따라 기계의 임무 수행 능력을 향상시킬 수 있는 압축기술이 필요하게 되었다. 그런데, 전통적 방식의 영상 코덱은 사람의 인지 화질 특성을 고려해 개발된 기술이기 때문에 기계의 임무 수행에 필수적인 정보 외에도 불필요한 정보가 존재한다. 따라서 사람이 아닌 기계의 임무 수행에 대해 효율적으로 영상을 압축하기 위한 비디오 코덱 기술이 필요하다. 이와 관련하여, 최근 MPEG에서 Video Coding for Machines라는 영상 압축기술에 대한 표준화가 논의되고 있다. 본 논문에서는 기계를 위한 영상 압축기술의 연구배경과 연구를 통해 전통적인 영상 압축 코덱 방식과 neural network 기반 압축 코덱 방식에 대해 각각의 방식이 머신비전 임무를 수행한 정확도를 기준으로 영상 압축성능을 비교해 효율적인 압축 코덱 방식에 대해 분석한다.

  • PDF

Pansharpening Method for KOMPSAT-2/3 High-Spatial Resolution Satellite Image (아리랑 2/3호 고해상도 위성영상에 적합한 융합기법)

  • Oh, Kwan-Young;Jung, Hyung-Sup;Jeong, Nam-Ki
    • Korean Journal of Remote Sensing
    • /
    • v.31 no.2
    • /
    • pp.161-170
    • /
    • 2015
  • This paper presents an efficient image fusion method to be appropriate for the KOMPSAT-2 and 3 satellites. The proposed method is based on the well-established component substitution (CS) approach. The proposed method is divided into two parts: 1) The first step is to create a intensity image by the weighted-averaging operation of a multi-spectral (MS) image and 2) the second step is to produce an optimal high-frequency image using the statistical properties of the original MS and panchromatic (PAN) images. The performance of the proposed method is evaluated in both quantitative and visual analysis. Quantitative assessments are performed by using the relative global dimensional synthesis error (Spatial and Spectral ERGAS), the image quality index (Q4), and the spectral angle mapper index (SAM). The qualitative and quantitative assessment results show that the fusion performance of the proposed method is improved in both the spectral and spatial qualities when it is compared with previous CS-based fusion methods.

A Parametric Imaging Technique for Characterizing Focal Liver Lesions in Contrast-Enhanced Ultrasound (간 병변 분석을 위한 조영증강 초음파 데이터의 영상화기법)

  • Park, So-Jeong;Sung, Myung-Chul;Lee, Seung-Kang;Kim, Ho-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.369-372
    • /
    • 2012
  • 조영증강 의료 초음파 영상에서 조영제의 확산효과에 대한 분석은 간질환과 연관된 각종 병변을 검출하고 분석하는 과정에서 매우 유용한 정보를 제공한다. 본 연구에서는 초음파 영상에서 조영제의 확산 패턴을 분석하고 이를 영상화하는 방법을 제안한다. 이 과정에서 부수적으로 호흡에 의한 흔들림 현상을 보정하고 노이즈의 영향을 극복할 수 있는 방법론을 고찰한다. 호흡주기에 따른 모멘텀 요소를 고려한 ROI 추적 기법은 측정과정에서의 흔들림과 노이즈에 의한 오류를 최소화 할 수 있게 한다. 조영제의 확산 단계에 따라 서로 다른 노이즈 비율을 고려하여 동적 가중치를 할당하는 방법으로써 흔들림을 보정하였으며, 조영제의 전이 시간과 패턴을 분석하고 그 특성을 분류함으로써 간 병변 분석을 위한 효과적인 영상화기법을 구현하였다. 또한 생성된 영상에서 노이즈를 제거하고 영상을 개선하는 방법으로서 MRF 기반의 최적화 알고리즘을 적용하는 영상 개선 기법을 제시한다.

A New Intermediate View Reconstruction Scheme based-on Stereo Image Rectification Algorithm (스테레오 영상 보정 알고리즘에 기반한 새로운 중간시점 영상합성 기법)

  • 박창주;고정환;김은수
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.29 no.5C
    • /
    • pp.632-641
    • /
    • 2004
  • In this paper, a new intermediate view reconstruction method employing a stereo image rectification algorithm by which an uncalibrated input stereo image can be transformed into the calibrated one is suggested and its performance is analyzed. In the proposed method, feature point are extracted from the stereo image pair though detection of the corners and similarities between each pixel of the stereo image. And then, using these detected feature points, the moving vectors between stereo image and the epipolar line is extracted. Finally, the input stereo image is rectified by matching the extracted epipolar line between the stereo image in the horizontal direction and intermediate views are reconstructed by using these rectified stereo images. From some experiments on synthesis of the intermediate views by using three kinds of stereo image; a CCETT's stereo image of 'Man' and two stereo images of 'Face' & 'Car' captured by real camera, it is analyzed that PSNRs of the intermediate views reconstructed from the calibrated image by using the proposed rectification algorithm are improved by 2.5㏈ for 'Man', 4.26㏈ for 'Pace' and 3.85㏈ for 'Car' than !hose of the uncalibrated ones. This good experimental result suggests a possibility of practical application of the unposed stereo image rectification algorithm-based intermediate view reconstruction view to the uncalibrated stereo images.