• 제목/요약/키워드: Visual Saliency

검색결과 63건 처리시간 0.022초

동영상 내용 분석을 위한 관심 객체 추출 (Segmentation of Objects of Interest for Video Content Analysis)

  • 박소정;김민환
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.967-980
    • /
    • 2007
  • 동영상에서의 관심 객체를 추출하는 것은 비디오 내용 분석과 비디오 검색 및 압축의 성능을 개선시키는데 큰 역할을 한다. 관심 객체는 단순히 사람 눈의 시선을 끄는 대상물이 아니라 내용전개의 중심이 되거나 제작자가 표현하려고 하는 핵심 객체를 의미한다. 이러한 관심 객체는 움직이는 객체뿐만 아니라 정지해 있는 객체도 될 수 있으나, 사람의 관심을 절차적으로 표현하는 것이 어렵기 때문에 관심 객체를 명확하게 정의하기가 곤란하다. 이에, 본 논문에서는 동영상 샷에서의 움직이는 객체의 위치, 크기, 움직임 패턴의 변화에 대한 조건을 정의하여 필터링에 의해 사람의 관심을 끄는 움직임 관심 객체를 추출하는 방법을 제시하고, 아울러 동영상 샷에서 정지되어 있는 객체에 대해서도 컬러/텍스처 특이성, 위치, 크기, 출현 빈도 등에 대한 조건을 정의하여 정지 관심 객체도 추출할 수 있는 방법을 제안한다. 제안한 방법을 50개의 동영상 샷에 대하여 실험한 결과, 사람이 선정한 움직임 및 정지 관심 객체를 84% 정도 추출할 수 있음을 확인할 수 있었다.

  • PDF

Image-based Soft Drink Type Classification and Dietary Assessment System Using Deep Convolutional Neural Network with Transfer Learning

  • Rubaiya Hafiz;Mohammad Reduanul Haque;Aniruddha Rakshit;Amina khatun;Mohammad Shorif Uddin
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.158-168
    • /
    • 2024
  • There is hardly any person in modern times who has not taken soft drinks instead of drinking water. The rate of people taking soft drinks being surprisingly high, researchers around the world have cautioned from time to time that these drinks lead to weight gain, raise the risk of non-communicable diseases and so on. Therefore, in this work an image-based tool is developed to monitor the nutritional information of soft drinks by using deep convolutional neural network with transfer learning. At first, visual saliency, mean shift segmentation, thresholding and noise reduction technique, collectively known as 'pre-processing' are adopted to extract the location of drinks region. After removing backgrounds and segment out only the desired area from image, we impose Discrete Wavelength Transform (DWT) based resolution enhancement technique is applied to improve the quality of image. After that, transfer learning model is employed for the classification of drinks. Finally, nutrition value of each drink is estimated using Bag-of-Feature (BoF) based classification and Euclidean distance-based ratio calculation technique. To achieve this, a dataset is built with ten most consumed soft drinks in Bangladesh. These images were collected from imageNet dataset as well as internet and proposed method confirms that it has the ability to detect and recognize different types of drinks with an accuracy of 98.51%.

보행자 내비게이션 서비스를 위한 건물 속성정보를 이용한 랜드마크 추출 (Extraction of Landmarks Using Building Attribute Data for Pedestrian Navigation Service)

  • 김진형;김지영
    • 대한토목학회논문집
    • /
    • 제37권1호
    • /
    • pp.203-215
    • /
    • 2017
  • 최근 스마트폰 보급과 측위 기술의 향상으로 보행자용 내비게이션 서비스(Pedestrian Navigation Service, PNS)에 대한 관심이 높아지고 있으며, 보행자의 이동 특성과 길 찾기 성공률 측면에서 보행자에게 길안내를 하는데 랜드마크를 이용하는 것이 효율적이다. 이에 PNS를 위하여 랜드마크를 추출하려는 연구들이 진행되어 왔다. 그러나 이들 선행연구는 랜드마크를 추출할 때 건물들 간의 차이만을 고려하고, PNS가 구동되는 화면 속 지도에 대한 사용자의 시각적 주의를 고려하지 않았다는 한계를 가지고 있다. 본 연구는 건물의 속성을 지역적 변수와 전역적 변수로 정의함으로써 이와 같은 문제를 개선하고자 한다. 지역적 변수는 건물들 간의 차이를 나타내고 전역적 변수는 건물이 가지는 고유한 특성을 나타냄으로써 건물의 현출성과 시각적 주의 정도를 반영한다. 또한, 네트워크 보로노이 다이어그램을 이용하여 네트워크의 연결성을 고려하고 랜드마크 후보군 추출 시 발생하는 중첩 현상을 해결한다. PNS를 위한 랜드마크를 추출하기 위하여 선행 연구를 바탕을 건물 속성정보를 정의하였다. 다음으로, 보행자를 위한 선택점을 선정하고, 해당 선택점 별로 랜드마크 후보군을 추출하였다. 이들 랜드마크 후보군에 대해서 정의된 건물 속성정보를 산출하고, 주성분 분석을 이용하여 랜드마크를 추출하였다. 제안된 기법을 서울특별시 관악구 일부 지역을 대상으로 적용하여 랜드마크를 추출하고, 네이버와 다음 지도 서비스의 레이블과 길찾기 시 표출되는 랜드마크와 비교하여 정확도를 평가하였다. 그 결과, 네이버와 다음 레이블 219개 중에서 60.3%에 해당하는 132개가 제안된 방법으로 랜드마크로 추출되었으며, 네이버와 다음 지도 서비스에는 없지만 선택점에서 추가로 추출된 228개의 랜드마크는 지역적 수준에서 길 찾기 시 방향 전환을 결정하는데 도움이 될 수 있음을 확인하였다.