• 제목/요약/키워드: Multi-Scene

검색결과 187건 처리시간 0.028초

다중 단계 신호의 적응적 전파를 통한 동일 장면 영상의 이원 영역화 (Bilayer Segmentation of Consistent Scene Images by Propagation of Multi-level Cues with Adaptive Confidence)

  • 이수찬;윤일동;이상욱
    • 방송공학회논문지
    • /
    • 제14권4호
    • /
    • pp.450-462
    • /
    • 2009
  • 최근까지 단일 영상이나 동영상을 영역화하는 기법들은 다양하게 제시되어 왔으나, 유사한 장면에 대한 여러 장의 영상을 동시에 영역화하는 기법은 많지 않았다. 본 논문에서는 한 장소에서 연속적으로 촬영하였거나 전경 물체가 유사한 여러 영상들을 동일 장면 영상으로 정의하고, 이런 동일 장면 영상들을 적은 양의 사용자 입력을 통해 효과적으로 영역화하는 기법을 제안한다. 구체적으로, 사용자가 최초의 영상 한 장을 직접 영역화한 후, 그 영상의 영역화 결과와 영상의 특성을 토대로 다중 단계 신호를 적응적 가중치를 주어서 인접 영상으로 전파하고, 이를 통해 제안하는 기법은 인접 영상을 반복적으로 영역화한다. 영역화는 마르코프 랜덤 장에서의 에너지 최소화를 통해 이루어지는데, 전파되는 신호는 각 픽셀에 대한 에너지를 정의하는 바탕이 되며, 픽셀, 픽셀 패치, 그리고 영상 전체로부터 비롯되었는가에 따라 낮은 단계, 중간 단계, 그리고 높은 단계의 신호로 지칭된다. 또한 에너지 최소화 틀 안에서 전파된 신호를 통해 정의되는 에너지 역시 낮은 단계, 중간 단계, 그리고 높은 단계의 세 단계로 정의한다. 이런 과정을 통해 전파된 신호를 최대한 다양하게 활용하고, 이를 통해 다양한 영상에 영역화 결과가 일관되게 유지된다. 다양한 동일 장면 영상들에 제안하는 기법을 적용하여 성능을 평가하고, 픽셀 패치를 바탕으로 하는 중간 단계 신호만을 이용한 결과와 제안하는 다중 신호를 적용하는 기법의 결과를 비교한다.

An Offloading Strategy for Multi-User Energy Consumption Optimization in Multi-MEC Scene

  • Li, Zhi;Zhu, Qi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4025-4041
    • /
    • 2020
  • Mobile edge computing (MEC) is capable of providing services to smart devices nearby through radio access networks and thus improving service experience of users. In this paper, an offloading strategy for the joint optimization of computing and communication resources in multi-user and multi-MEC overlapping scene was proposed. In addition, under the condition that wireless transmission resources and MEC computing resources were limited and task completion delay was within the maximum tolerance time, the optimization problem of minimizing energy consumption of all users was created, which was then further divided into two subproblems, i.e. offloading strategy and resource allocation. These two subproblems were then solved by the game theory and Lagrangian function to obtain the optimal task offloading strategy and resource allocation plan, and the Nash equilibrium of user offloading strategy games and convex optimization of resource allocation were proved. The simulation results showed that the proposed algorithm could effectively reduce the energy consumption of users.

제약 조건 기반 서술구조를 이용한 동시 진행 이야기의 생성 (Creating Simultaneous Story Arcs Using Constraint Based Narrative Structure)

  • 문성현;김석규;홍의석;한상영
    • 한국콘텐츠학회논문지
    • /
    • 제10권5호
    • /
    • pp.107-114
    • /
    • 2010
  • 인터랙티브 스토리텔링 시스템(Interactive Storytelling System) 상에서 다양한 이야기의 진행과 결말을 표현할 수 있는 비선형적인 이야기(nonlinear story)는 사용자와의 상호작용으로 생성된다. 또한 연극이나 영화에서 관객은 하나의 장면에서 진행되고 있는 이야기만을 볼 수 있고 다른 장면의 이야기를 보기 위해서는 현재 장면이 끝난 후 다른 장면의 이야기를 볼 수 있다. 그러나 현실에서는 여러 가지 사건들이 여러 장소에서 동시에 발생하고 게다가 특정 사건들은 다른 사건들에 영향을 미치기 때문에 전체적인 이야기의 흐름에 큰 영향을 줄 수 있다. 본 연구에서는 비선형 스토리의 생성을 위한 제약 조건 기반의 서술구조(Constraint Based Narrative Structure)를 소개하고 동시 진행 이야기(Simultaneous Story Arcs)의 제어를 위한 멀티뷰포인트(multi viewpoint)를 제안한다.

GPU를 이용한 DNA 컴퓨팅 기반 패턴 분류기의 효율적 구현 (Efficient Implementing of DNA Computing-inspired Pattern Classifier Using GPU)

  • 최선욱;이종호
    • 전기학회논문지
    • /
    • 제58권7호
    • /
    • pp.1424-1434
    • /
    • 2009
  • DNA computing-inspired pattern classification based on the hypernetwork model is a novel approach to pattern classification problems. The hypernetwork model has been shown to be a powerful tool for multi-class data analysis. However, the ordinary hypernetwork model has limitations, such as operating sequentially only. In this paper, we propose a efficient implementing method of DNA computing-inspired pattern classifier using GPU. We show simulation results of multi-class pattern classification from hand-written digit data, DNA microarray data and 8 category scene data for performance evaluation. and we also compare of operation time of the proposed DNA computing-inspired pattern classifier on each operating environments such as CPU and GPU. Experiment results show competitive diagnosis results over other conventional machine learning algorithms. We could confirm the proposed DNA computing-inspired pattern classifier, designed on GPU using CUDA platform, which is suitable for multi-class data classification. And its operating speed is fast enough to comply point-of-care diagnostic purpose and real-time scene categorization and hand-written digit data classification.

INITIAL GEOMETRIC ACCURACY OF KOMPSAT-2 HIGH RESOLUTION IMAGE

  • Seo, Doo-Chun;Lim, Hyo-Suk;Shin, Ji-Hyeon;Kim, Moon-Gyu
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.780-783
    • /
    • 2006
  • The KOrea Multi-Purpose Satellite-2 (KOMPSAT-2) was launched in July 2006 and the main mission of the KOMPSAT-2 is a high resolution imaging for the cartography of Korea peninsula by utilizing Multi Spectral Camera (MSC) images. The camera resolutions are 1 m in panchromatic scene and 4 m in multi-spectral imaging. This paper provides an initial geometric accuracy assessment of the KOMPSAT-2 high resolution image without ground control points and briefly introduces the sensor model of KOMPSAT-2. Also investigated and evaluated the obtained 3-dimensional terrain information using the MSC pass image and scene images acquired from the KOMPSAT-2 satellite.

  • PDF

Improved Social Force Model based on Navigation Points for Crowd Emergent Evacuation

  • Li, Jun;Zhang, Haoxiang;Ni, Zhongrui
    • Journal of Information Processing Systems
    • /
    • 제16권6호
    • /
    • pp.1309-1323
    • /
    • 2020
  • Crowd evacuation simulation is an important research issue for designing reasonable building layouts and planning more effective evacuation routes. The social force model (SFM) is an important pedestrian movement model, and is widely used in crowd evacuation simulations. The model can effectively simulate crowd evacuation behaviors in a simple scene, but for a multi-obstacle scene, the model could result in some undesirable problems, such as pedestrian evacuation trajectory oscillation, pedestrian stagnation and poor evacuation routing. This paper analyzes the causes of these problems and proposes an improved SFM for complex multi-obstacle scenes. The new model adds navigation points and walking shortest route principles to the SFM. Based on the proposed model, a crowd evacuation simulation system is developed, and the crowd evacuation simulation was carried out in various scenes, including some with simple obstacles, as well as those with multi-obstacles. Experiments show that the pedestrians in the proposed model can effectively bypass obstacles and plan reasonable evacuation routes.

Video Segmentation and Key frame Extraction using Multi-resolution Analysis and Statistical Characteristic

  • Cho, Wan-Hyun;Park, Soon-Young;Park, Jong-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.457-469
    • /
    • 2003
  • In this paper, we have proposed the efficient algorithm that can segment the video scene change using a various statistical characteristics obtained from by applying the wavelet transformation for each frames. Our method firstly extracts the histogram features from low frequency subband of wavelet-transformed image and then uses these features to detect the abrupt scene change. Second, it extracts the edge information from applying the mesh method to the high frequency subband of transformed image. We quantify the extracted edge information as the values of variance characteristic of each pixel and use these values to detect the gradual scene change. And we have also proposed an algorithm how extract the proper key frame from segmented video scene. Experiment results show that the proposed method is both very efficient algorithm in segmenting video frames and also is to become the appropriate key frame extraction method.

Saliency-Assisted Collaborative Learning Network for Road Scene Semantic Segmentation

  • Haifeng Sima;Yushuang Xu;Minmin Du;Meng Gao;Jing Wang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권3호
    • /
    • pp.861-880
    • /
    • 2023
  • Semantic segmentation of road scene is the key technology of autonomous driving, and the improvement of convolutional neural network architecture promotes the improvement of model segmentation performance. The existing convolutional neural network has the simplification of learning knowledge and the complexity of the model. To address this issue, we proposed a road scene semantic segmentation algorithm based on multi-task collaborative learning. Firstly, a depthwise separable convolution atrous spatial pyramid pooling is proposed to reduce model complexity. Secondly, a collaborative learning framework is proposed involved with saliency detection, and the joint loss function is defined using homoscedastic uncertainty to meet the new learning model. Experiments are conducted on the road and nature scenes datasets. The proposed method achieves 70.94% and 64.90% mIoU on Cityscapes and PASCAL VOC 2012 datasets, respectively. Qualitatively, Compared to methods with excellent performance, the method proposed in this paper has significant advantages in the segmentation of fine targets and boundaries.

사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법 (An User Controllable Object Audio File Format and Audio Scene Description)

  • 조충상;김제우
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.25-33
    • /
    • 2010
  • 최근의 오디오 기술은 사용자 중심으로 변화하고 있으며, 사용자의 환경과 의도에 따라 능동적으로 서비스가 이루어지는 대화형 오디오 서비스 시대로 변화하고 있다. 이에 맞추어 시장에서는 고품질 오디오 서비스를 위한 무손실 오디오 기술을 탑재한 멀티미디어 기기와 사용자가 선택적으로 악기를 조절할 수 있는 객체 오디오 음원 서비스가 이루어지고 있다. 본 논문에서는 사용자가 컨트롤 할 수 있는 실감 객체 오디오 파일 포맷을 설계하고 실감 정보를 낮은 복잡도에서 저장 매체와 전송 매체에 적용 가능한 오디오 장면 묘사 방법을 제안한다. 설계된 실감 객체 오디오 파일 포맷은 MPEG-4 파일 포맷을 기반으로 설계되었다. MPEG-4 파일 포맷은 MPEG-4에 속하는 고성능 오디오 코덱을 오디오 코덱 객체 번호를 통해서 쉽게 적용가능하다. 또한 오디오 객체 개수의 변화에 따라 파일 포맷의 트랙을 변화 시켜 사용하면 되므로 객체 오디오를 포함하기에 적절하다. 본 연구에서 개발된 파일 포맷은 실감 객체오디오 생성시 MPEG-4 오디오 코덱으로 압축된 객체 오디오, 실감 객체 오디오를 위한 오디오 장면 묘사 데이터를 독립적인 트랙으로 포함하고 있다. 포함된 오디오 장면 묘사 기법은 저장 매체를 위해 전체 오디오 장면에 적용되는 오디오 묘사 기법과 각각의 오디오 객체에 적용되는 오디오 묘사 기법을 노드 구조로 설계 하였으며, 전송 매체를 위해서 기본적인 객체 오디오 동작을 하기위한 필수 정보와 오디오 세부장면 묘사를 위한 정보로 분할하여 설계하였다. 이를 바탕으로 본 연구에서는 실감 객체 오디오 시뮬레이터를 개발하였다. 개발된 시뮬레이터는 객체 음원과 오디오 장면 묘사 정보를 부호화하여 MPEG-4 파일 포맷에 저장하며, 생성된 실감 객체 오디오 파일은 재생 모듈에서 오디오 객체에 입력 받은 사용자 정보와 오디오 장면 묘사 정보가 적용되어 사용자에게 몰입감이 높은 실감 오디오 서비스를 제공한다.

컬러 이미지 화질 개선을 위한 Retinex 기반의 로그변환 기법 (Retinex-based Logarithm Transformation Method for Color Image Enhancement)

  • 김동형
    • 한국산학기술학회논문지
    • /
    • 제19권5호
    • /
    • pp.9-16
    • /
    • 2018
  • 광원 자체의 밝기가 낮거나 그림자 등의 이유로 어두운 영역을 포함하는 이미지는 Retinex 기반의 영상화질 개선기법을 통해 주관적 화질을 높일 수 있다. Retinex 이론은 인간의 시각 시스템이 장면을 인식할 때 특정 위치에서의 장면의 밝기를 인식하는 것이 아니라 주변과의 상대적인 밝기를 인식하는 특징을 적용한 방법으로 크게 SSR, MSR, MSRCR의 방법으로 나눌 수 있다. 제안하는 방법은 컬러복원단계를 포함하고 있는 MSRCR에 기반한 방법으로 크게 3단계로 구성되어 있다. 첫 번째 단계에서는 기존의 MSRCR 방법을 적용하고 두 번째 단계에서 MSRCR 출력의 동적 영역을 이미지의 히스토그램분포에 따라 조정한다. 마지막 단계에서는 인간의 시각특성을 고려한 로그변환함수를 이용하여 Retinex 출력 값을 디스플레이 동적영역으로 변환한다. 실험결과 제안하는 알고리즘은 전체적으로 어두운 이미지뿐만 아니라 밝은 영역과 어두운 영역을 모두 포함하는 이미지에서도 주관적 화질을 효과적으로 증가시키는 것을 볼 수 있다. 특히 낮은 밝기를 갖는 이미지의 경우 제안한 알고리즘은 기존의 방법들 보다 높은 성능향상을 보였다.