• 제목/요약/키워드: visual frame

검색결과 420건 처리시간 0.026초

SAD 알고리즘을 이용한 차량 속도 측정 (Vehicle Speed Measurement using SAD Algorithm)

  • 박성일;문종대;고영혁
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.73-79
    • /
    • 2014
  • 본 논문에서는 비디오 시?스에서 차들을 추적하고 검출하기 위해서 비디오와 이미지 처리를 활용하여 고속도로 및 일반 도로상의 교통흐름과 차량의 속도를 계측하는 기법을 제안했다. 제안된 기법은 배경이미지를 평가하기 위해서 비디오 스트림의 처음 프레임을 활용하였다. 비쥬얼 추적 시스템은 프레임 절대 차의 합을 토대로 한 단순한 알고리즘이다. 그것은 각 비디오 프레임으로부터 전경 이미지를 산출하기 위해서 배경화면을 빼고, 각 전경 이미지에 형태적 제거를 실행하고 임계값화 함으로서 임계치 윈도우에서 보인 이진이미지를 산출한다. 첫 번째 하얀 라인과 두번째 하얀 라인사이 거리를 측정하여 차의 위치를 찾았다. 평균속도는 물체의 위치 변화를 장소가 변하는 시간으로 나눔으로서 정의했다. 제시된 기법의 결과는 측정된 데이터와 잘 일치되었고, 실시간으로 결과를 본다.

Visibility Evaluation for Agricultural Tractor Operators According to ISO 5006 and 5721-1 Standards

  • Kabir, Md. Shaha Nur;Song, Mingzhang;Chung, Sun-Ok;Kim, Yong-Joo;Kim, Su-Chul;Ha, Jong-Kyou
    • Journal of Biosystems Engineering
    • /
    • 제40권1호
    • /
    • pp.19-27
    • /
    • 2015
  • Purpose: A system to measure the visibility of agricultural tractor operators was designed and evaluated according to ISO standards, and a blind area diagram around the tested tractor was created based on the manual method recommended by the National Institute for Occupational Safety and Health (NIOSH). Methods: A visibility measurement system was designed and evaluated based on the ISO 5006 and ISO 5721-1 standards. Two bulbs used to simulate the operator's eyes were mounted on a bar with a supporting frame. A wooden frame was used to determine the seat index point position. The 12-m visibility test circle was divided into six sectors of vision, and the test tractor was placed at the center of the circle. Artificial light was supplied in the darkened environment, and shadow or masking effects were measured manually around the 12-m circle. Results: When the bulbs were placed at the operator's eye level, front visibility was good; no masking was found in the "A" vision sector, but larger masking widths were found in the "B" and "C" vision sectors. Since the masking width exceeded 700 mm, additional tests, such as movement of the light sources to both sides of the operator's eye level, were performed. Less than six masking effects were found in the semi-circle of vision to the front, and more than one masking was found in the "B" and "C" visual fields. The minimum distance between the centers of two masking effects exceeded 2500 mm when measured as a chord on the semi-circle of vision. A blind area diagram was created to define the exact nature of the blind spots and mirror visibility. Conclusions: Visibility evaluation is an effective way to enable proper and safe operation for agricultural tractor operators. Inclusion of this visibility evaluation test in the general testing process might aid tractor manufacturers.

효과적인 실시간 배경 모델링을 위한 환경 변수 결정 방법 (Determining Method of Factors for Effective Real Time Background Modeling)

  • 이준철;류상률;강성환;김승호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.59-69
    • /
    • 2007
  • 다양한 환경을 포함하고 있는 동영상에서 움직이는 객체를 추출, 인식하기 위해서는 배경 모델링이 중요하다. 이러한 객체 인식을 위한 전처리 과정인 배경 모델링을 위한 여러 방안이 제안되었다. 그중 큐 기반 배경 모델링으로 대표되는 Kumar의 방법이 있다. 하지만 이는 프레임의 갱신검사 주기가 고정되어 있어 여러 시스템에 적용시키는데 한계점이 있다. 본 논문은 큐 기반 배경 모델링 기법을 이용하고 이때 주요한 환경 변수가 되는 슬라이딩 윈도우의 크기 및 영상의 자기 단계에 따른 그룹핑 크기, 프레임의 갱신검사 주기를 배경 모델에 따라 적응적으로 결정하는 방법을 제안한다. 배경 모델에 따른 환경변수를 결정하기 위해 객체 검출율, 객체 오검출율, 갱신율을 평가 기준으로 삼는다. 제안된 방법으로 실시간 처리에 부적합한 기존의 배경 모델링 방법을 개선하여 보다 효과적으로 객체를 인식할 수 있다.

H.263의 화질 개선을 위한 적응 양자화기 설계 (The Design of Adaptive Quantizer to Improve Image Quality of the H.263)

  • 신경철;이광형
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.77-83
    • /
    • 1999
  • H.263은 영상전화, 영상회의 등의 서비스를 64Kbps 이하 전송로에서 가능하게 하는 ITU-T의 국제 표준이다. 이 권고안에서는 움직임 추정/보상, 변환 부호화, 양자화방법을 기본으로 사용하고 있다. H.263의 성능평가에 사용된 TMN5는 변환부호화 방법으로 DCT를 사용하고, DCT 변환계수를 양자화하기 위한 양자화기가 제시되고 있다. 본 논문에서는 TMN5의 구조를 그대로 유지하면서 인간 시각 특성을 고려하여 DCT 계수를 효과적으로 양자화할 수 있는 적응 양자화기를 제안한다. 제안된 DCT 기반 H.263의 양자화기는 같은 전송 속도에서 TMN5보다 더 많은 프레임을 전송 처리함으로 화면 드롭현상을 줄일 수 있었다. 또한 객관적 화질 평가를 위한 평균 PSNR에서 TMN5보다 휘도 신호는 -0.3 ~ +0.7dB의 차이를 보이고 색차 신호에서는 1.5dB 정도의 개선을 나타냈다. 결과적으로 주관적 화질평가에서는 TMN5에 비하여 더욱 선명한 화질의 영상을 얻을 수 있었다.

  • PDF

계산량 감축을 위한 DCT-Based H.263 양자화기의 비교 연구 (The Study of Comparison of DCT-based H.263 Quantizer for Computative Quantity Reduction)

  • 신경철
    • 융합신호처리학회논문지
    • /
    • 제9권3호
    • /
    • pp.195-200
    • /
    • 2008
  • 동영상 데이터를 효율적으로 압축하기 위해서는 입력 영상 데이터의 공간 및 시간적인 중복성 제거가 요구된다. 움직임 추정 및 보상방법은 시간적인 중성을 효과적으로 제거할 수 있지만 프래임간 예측 때문에 계산량이 증가된다. 따라서 계산량을 줄이면서 실시간 처리가 가능한 알고리즘의 연구가 요구된다. 본 논문에서는 인간 시각 특성을 고려하여 DCT 계수를 효과적으로 양자화할 수 있는 양자화기를 제안한다. 제안된 DCT-based H.263의 양자화기는 같은 전송 속도에서 TMN5보다 더 많은 프레임을 전송 처리함으로 화면 드롭현상을 줄일 수 있었다. 또한 객관적 화질 평가를 위한 평균 PSNR에서 TMN5보다 휘도 신호는 $-0.3{\sim}+0.65dB$의 차이를 보이고 색차 신호에서는 1.73dB 정도의 개선을 나타냈다. 계산량 비교에서는 NTSS에 비하여 $30{\sim}31%$, 4SS에 비하여 $20{\sim}21%$ 계산량의 감소를 나타냈다.

  • PDF

누설요소와 인간 시각 시스템을 이용한 HDTV 영상 압축 알고리듬 (HDTV Image Compression Algorithm Using Leak Factor and Human Visual System)

  • 김용하;최진수;이광천;하영호
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.822-832
    • /
    • 1994
  • DSC-HDTV 시스템은 영상에 존재하는 공간, 시간, 진폭의 중복성을 제거하기위하여 변환 부호화, 움직임 보상 예측 부호화, 적응 양자화를 이용한다. 본 논문에서는 장면 변화와 전송 잡음으로부터 신속히 화질을 복원하는데 이용하는 누설요소의 적용 방법과 인간 시각 시스템을 이용한 인식하중치를 구하여 적응 양자화하는 방법을 제안한다. 인식하중치는 대비 민감도, 시공간 매스킹과 주파수 민감도에 따라 구한다. 적응 양자화는 인식하중치와 버퍼이력상태로부터 얻은 전체 왜곡 레벨을 이용하고 그에 따른 잉여 비트량은 다음 프레임의 화질 개선에 이용된다. 장면이 변할 경우 복원된 영상은 큰 양자화 오차를 포함하기 때문에 움직 보상 예측 부호화에서 구한 변위프레임 차신호가 큰 값이 되어 비트량이 증가하고 버퍼의 상태가 불안정하게 된다. 그러므로 본 논문에서는 누설요소를 장면이 변할 경우 0으로 하고 그이후의 프레임에서의 15/16으로 고정하여 전체왜곡레벨을 표준편차를 이용하여 조절한다. 실험결과 제안된 방법의 영상의 화질은 수 프레임내에 복원되고 버퍼상태도 신속히 안정화된다.

  • PDF

MPEG 부호화 영역에서 Video Genre 자동 분류 방법 (Automatic Video Genre Classification Method in MPEG compressed domain)

  • 김태희;이웅희;정동석
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.836-845
    • /
    • 2002
  • Video Summary는 길이가 긴 Video를 고속으로 효율적으로 열람할 수 있도록 하는 도구의 하나이다. Video Summary는 대표 프레임(Key-frame)들의 집합으로 볼 수 있는데 대표 프레임은 Video의 Genre에 따라서 달리 정의 및 생성될 수 있다. 즉 모든 Genre의 Video에 대해서 획일적인 방법으로 Summary를 만드는 것은 적절하지 못한 결과를 초래할 수 있다. Video의 Genre를 구별해내는 기술은 위와 같이 효율적인 Video Summary 생성에 유용한 처리 과정이라 할 수 있다. 본 논문에서는 이와 같이 효율적 Video 관리를 위해 MPEG 부호화 영역에서 MPEG Video의 Genre를 분류하는 방법을 제안한다. 제안된 방법은 프레임을 복호하지 않고 비트스트림을 직접 처리하여 기존 방법들에 비해 계산이 비교적 단순하고 처리시간을 단축시키는 장점을 가지고 있다. 또한 제안된 방법은 대부분의 작업을 시각 정보만을 이용하여 수행하며 이 정보들의 시, 공간적 해석을 통해 Genre를 확인하게 된다. 실험은 만화(Cartoon), 광고(Commercial), Music Video, 뉴스, Sports, Talk Show의 6개 Genre Video에 대하여 실행하였다. 실험 결과, 구조가 명확한 Talk Show와 Sports의 경우 90% 이상의 결과를 얻었다.

급격한 조명 변화에 강건한 동영상 대조비 개선 방법 (Robust Method of Video Contrast Enhancement for Sudden Illumination Changes)

  • 박진욱;문영식
    • 전자공학회논문지
    • /
    • 제52권11호
    • /
    • pp.55-65
    • /
    • 2015
  • 동영상 대조비 개선 과정에서 단일 영상을 위해 연구된 대조비 개선 방법들을 사용할 수 있지만, 동영상의 연속성이 고려되지 않으면 원본 동영상에 없는 깜박임을 야기할 수 있다. 또한 동영상의 연속성을 고려하는 경우, 깜박임은 억제할 수 있지만 연속성 때문에 조명의 급격한 변화할 때 불필요한 페이드인/아웃(fade-in/out) 현상이 발생하는 단점이 발생할 수 있다. 본 논문에서는 깜박임과 페이드인/아웃 현상 없이 동영상의 대조비를 개선하는 방법을 제안한다. 제안하는 방법은 Fast Gray-Level Grouping(FGLG)를 사용하여 각 프레임의 대조비를 개선하고, 깜박임을 억제하기 위해 Exponential smoothing 필터를 사용한다. 불필요한 페이드인/아웃 현상을 억제하기 위해서는 S형 함수로 Exponential smoothing 필터의 평활화 비율을 프레임 별로 적응적으로 계산하여 적용한다. 실험에서 제안하는 방법과 기존의 방법들은 6가지 측정 기준을 적용하여 성능을 비교 및 분석한다. 실험 결과, 제안하는 방법은 영상 형태 보존을 측정하는 MSSIM과 깜박임을 측정하는 Flickering score에서 정량적으로 가장 높은 결과를 보여주었으며, 시각적인 품질 비교를 통해 조명 변화에 따른 적응적인 개선을 정성적 결과로 입증하였다.

Development of a Brain Phantom for Multimodal Image Registration in Radiotherapy Treatment Planning

  • H. S. Jin;T. S. Suh;R. H. Juh;J. Y. Song;C. B. Y. Choe;Lee, H .G.;C. Kwark
    • 한국의학물리학회:학술대회논문집
    • /
    • 한국의학물리학회 2002년도 Proceedings
    • /
    • pp.450-453
    • /
    • 2002
  • In radiotherapy treatment planning, it is critical to deliver the radiation dose to tumor and protect surrounding normal tissue. Recent developments in functional imaging and radiotherapy treatment technology have been raising chances to control tumor saving normal tissues. A brain phantom which could be used for image registration technique of CT-MR and CT-SPECT images using surface matching was developed. The brain phantom was specially designed to obtain imaging dataset of CT, MR, and SPECT. The phantom had an external frame with 4 N-shaped pipes filled with acryl rods, Pb rods for CT, MR, and SPECT imaging, respectively. 8 acrylic pipes were inserted into the empty space of the brain phantom to be imaged for geometric evaluation of the matching. For an optimization algorithm of image registration, we used Downhill simplex algorithm suggested as a fast surface matching algorithm. Accuracy of image fusion was assessed by the comparison between the center points of the section of N-shaped bars in the external frame and the inserted pipes of the phantom and minimized cost functions of the optimization algorithm. Technique with partially transparent, mixed images using color on gray was used for visual assessment of the image registration process. The errors of image registration of CT-MR and CT-SPECT were within 2mm and 4mm, respectively. Since these errors were considered within a reasonable margin from the phantom study, the phantom is expected to be used for conventional image registration between multimodal image datasets..

  • PDF

웹툰의 사운드 표현에 관한 연구 (A Study of Sound Expression in Webtoon)

  • 목혜정
    • 만화애니메이션 연구
    • /
    • 통권36호
    • /
    • pp.469-491
    • /
    • 2014
  • 웹툰은 출판만화에서 사운드를 시각적으로 표현했던 방법을 발전시켜왔으며, 웹 기술의 발전을 토대로 직접 소리를 들려주기까지 한다. 직접 들리는 소리는 당연히 사운드 분석의 대상이 된다. 그러나 들리지 않는 사운드도 분석 대상이 될 수 있다. 본 연구는 들리지 않는 소리를 분석할 수 있다는 것의 이론적 토대를 인지심리학의 이중부호 개념에 둔다. 작가는 자신의 청각적 기억을 시각적으로 기호화할 수 있고, 독자는 기억과 인출의 과정을 통해 시각화된 기호를 보고 사운드를 떠올릴 수 있다. 이와 같은 웹툰의 들리지는 않지만 떠올릴 수 있는 사운드와 직접 들리는 사운드 두 경우를 본 연구는 함께 분석대상으로 한다. 구체적 분석을 위해서는 이론적 성과물이 있는 영화 사운드 분석 방법을 활용할 수 있다. 소리를 구성하는 세 요소인 음량, 음조, 음색은 음향학에서는 주파수 등으로 설명되고 직접 들을 때는 느낌으로 알지만, 시각적으로는 사운드를 표현한 글자나 이미지의 선의 굵기와 위치, 음원의 이미지 등으로 알 수 있다. 내화면 사운드와 외화면 사운드의 시각적 표현은 만화의 칸과 관련이 있다. 일반적으로는 칸 외부로 외화면 사운드를 표현하지만 웹툰에서는 듣는 자를 강조하는 방법으로 칸 내부에 외화면 소리를 표현하기도 한다. 그리고 영화의 호러 장르가 장르 효과를 높이기 위해 사운드를 많이 사용하는데 웹툰에서도 호러 장르가 같은 효과를 위해 사운드를 많이 사용한다. 이러한 영화 사운드 분석 방법을 활용해 사운드를 이미지로 표현한 작품들을 분석해볼 때, 초창기 출판만화에서부터 시작한 사운드의 청각적 표현들이 계속 발전해서 웹툰에서 창의적으로 표현되고 있음을 알 수 있다. 특히 세로 이동을 활용한 칸의 배치 및 소리표현의 방식들은 웹툰이 보여준 새로운 방법들이며, 칸 모양도 훨씬 다양해졌다. 직접 들려주는 소리로는 BGM이 가장 먼저 사용되었는데 최근에는 한 회의 분위기에 맞춰 음향효과까지 섞어 맞춤 작곡된 곡들이 사용된다. 그리고 스크롤 이동에 맞춰 소리를 들려주는 프로그램이 개발되면서 특정 순간의 음향효과나 특정 장면에 어울리는 음악들을 들을 수 있게 되었다. 특히 호러 장르에서는 특정한 이미지와 공포를 불러일으키는 사운드를 같이 사용하여 장르적 효과를 배가시킨다. 이렇게 웹툰에서는 다양한 사운드 시각화 방법이 계속 창조되고 있으며 기술과 접목된 새로운 시도들이 이루어지고 있다. 이러한 발전은 웹툰이 하나의 문화콘텐츠로서의 융합의 장이 될 수 있음을 보여준다.