• Title/Summary/Keyword: 다중스케일 모델

Search Result 46, Processing Time 0.028 seconds

Eye Localization based on Multi-Scale Gabor Feature Vector Model (다중 스케일 가버 특징 벡터 모델 기반 눈좌표 검출)

  • Kim, Sang-Hoon;Jung, Sou-Hwan;Oh, Du-Sik;Kim, Jae-Min;Cho, Seong-Won;Chung, Sun-Tae
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.1
    • /
    • pp.48-57
    • /
    • 2007
  • Eye localization is necessary for face recognition and related application areas. Most of eye localization algorithms reported thus far still need to be improved about precision and computational time for successful applications. In this paper, we propose an improved eye localization method based on multi-scale Gator feature vector models. The proposed method first tries to locate eyes in the downscaled face image by utilizing Gabor Jet similarity between Gabor feature vector at an initial eye coordinates and the eye model bunch of the corresponding scale. The proposed method finally locates eyes in the original input face image after it processes in the same way recursively in each scaled face image by using the eye coordinates localized in the downscaled image as initial eye coordinates. Experiments verify that our proposed method improves the precision rate without causing much computational overhead compared with other eye localization methods reported in the previous researches.

Bayesian Texture Segmentation Using Multi-layer Perceptron and Markov Random Field Model (다층 퍼셉트론과 마코프 랜덤 필드 모델을 이용한 베이지안 결 분할)

  • Kim, Tae-Hyung;Eom, Il-Kyu;Kim, Yoo-Shin
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.44 no.1
    • /
    • pp.40-48
    • /
    • 2007
  • This paper presents a novel texture segmentation method using multilayer perceptron (MLP) networks and Markov random fields in multiscale Bayesian framework. Multiscale wavelet coefficients are used as input for the neural networks. The output of the neural network is modeled as a posterior probability. Texture classification at each scale is performed by the posterior probabilities from MLP networks and MAP (maximum a posterior) classification. Then, in order to obtain the more improved segmentation result at the finest scale, our proposed method fuses the multiscale MAP classifications sequentially from coarse to fine scales. This process is done by computing the MAP classification given the classification at one scale and a priori knowledge regarding contextual information which is extracted from the adjacent coarser scale classification. In this fusion process, the MRF (Markov random field) prior distribution and Gibbs sampler are used, where the MRF model serves as the smoothness constraint and the Gibbs sampler acts as the MAP classifier. The proposed segmentation method shows better performance than texture segmentation using the HMT (Hidden Markov trees) model and HMTseg.

Fusion of Multi-Scale Features towards Improving Accuracy of Long-Term Time Series Forecasting (다중 스케일 특징 융합을 통한 트랜스포머 기반 장기 시계열 예측 정확도 향상 기법)

  • Min, Heesu;Chae, Dong-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.539-540
    • /
    • 2022
  • 본 논문에서는 정확한 장기 시계열 예측을 위해 시계열 데이터의 다양한 스케일 (시간 규모)에서 표현을 학습하는 트랜스포머 모델을 제안한다. 제안하는 모델은 시계열의 다중 스케일 특징을 추출하고, 이를 트랜스포머에 반영하여 예측 시계열을 생성하는 구조로 되어 있다. 스케일 정규화 과정을 통해 시계열의 전역적 및 지역적인 시간 정보를 효율적으로 융합하여 종속성을 학습한다. 3 가지의 다변량 시계열 데이터를 이용한 실험을 통해 제안하는 방법의 우수성을 보인다.

Texture segmentation using Neural Networks and multi-scale Bayesian image segmentation technique (신경회로망과 다중스케일 Bayesian 영상 분할 기법을 이용한 결 분할)

  • Kim Tae-Hyung;Eom Il-Kyu;Kim Yoo-Shin
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.42 no.4 s.304
    • /
    • pp.39-48
    • /
    • 2005
  • This paper proposes novel texture segmentation method using Bayesian estimation method and neural networks. We use multi-scale wavelet coefficients and the context information of neighboring wavelets coefficients as the input of networks. The output of neural networks is modeled as a posterior probability. The context information is obtained by HMT(Hidden Markov Tree) model. This proposed segmentation method shows better performance than ML(Maximum Likelihood) segmentation using HMT model. And post-processed texture segmentation results as using multi-scale Bayesian image segmentation technique called HMTseg in each segmentation by HMT and the proposed method also show that the proposed method is superior to the method using HMT.

Lightweight Key Point Detection Model Based on Multi-Scale Ghost Convolution for YOLOv8 (YOLOv8 을 위한 다중 스케일 Ghost 컨볼루션 기반 경량 키포인트 검출 모델)

  • Zihao Li;Inwhee Joe
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.604-606
    • /
    • 2024
  • 컴퓨터 비전 응용은 우리 생활에서 중요한 역할을 한다. 현재, 대규모 모델의 등장으로 딥 러닝의 훈련 및 운행 비용이 급격히 상승하고 있다. 자원이 제한된 환경에서는 일부 AI 프로그램을 실행할 수 없게 되므로, 경량화 연구가 필요하다. YOLOv8 은 현재 주요 목표 검출 모델 중 하나이며, 본 논문은 다중 스케일 Ghost 컨볼루션 모듈을 사용하여 구축된 새로운 YOLOv8-pose-msg 키포인트 검출 모델을 제안한다. 다양한 사양에서 새 모델의 매개변수 양은 최소 34% 감소할 수 있으며, 최대 59%까지 감소할 수 있다. 종합적인 검출 성능은 비교적 대규모 데이터셋에서 원래의 수준을 유지할 수 있으며, 소규모 데이터셋에서의 키포인트 검출은 30% 이상 증가할 수 있다. 동시에 최대 25%의 훈련 및 추론 시간을 절약할 수 있다.

  • PDF

Speech detection from broadcast contents using multi-scale time-dilated convolutional neural networks (다중 스케일 시간 확장 합성곱 신경망을 이용한 방송 콘텐츠에서의 음성 검출)

  • Jang, Byeong-Yong;Kwon, Oh-Wook
    • Phonetics and Speech Sciences
    • /
    • v.11 no.4
    • /
    • pp.89-96
    • /
    • 2019
  • In this paper, we propose a deep learning architecture that can effectively detect speech segmentation in broadcast contents. We also propose a multi-scale time-dilated layer for learning the temporal changes of feature vectors. We implement several comparison models to verify the performance of proposed model and calculated the frame-by-frame F-score, precision, and recall. Both the proposed model and the comparison model are trained with the same training data, and we train the model using 32 hours of Korean broadcast data which is composed of various genres (drama, news, documentary, and so on). Our proposed model shows the best performance with F-score 91.7% in Korean broadcast data. The British and Spanish broadcast data also show the highest performance with F-score 87.9% and 92.6%. As a result, our proposed model can contribute to the improvement of performance of speech detection by learning the temporal changes of the feature vectors.

Development of Multiscale Simulation Technique for Multiphase Fluid System (다상 유체 시스템의 다중 스케일 시뮬레이션 기법에 관한 연구)

  • Han, Min-Sub
    • Transactions of the Korean Society of Mechanical Engineers B
    • /
    • v.34 no.6
    • /
    • pp.569-577
    • /
    • 2010
  • A multiscale particle simulation technique that can be applied to a multiphase fluid system has been developed. In the boundary region where the macroscopic- and microscopic-scale models overlap each other, three distinctive features are introduced in the simulation. First, a wall is set up between the gas and liquid phases to separate them and match the phases respectively to the macroscopic conditions stably. Secondly, the interfacial profile is obtained near the matching region and the wall translates and rotates to accommodate the change in the liquid-vapor interfacial position in the molecular model. The contact angle thus obtained can be sent to the macroscopic model. Finally, a state of mass and temperature in the region is maintained by inserting and deleting the particles. Good matching results are observed in the cases of the complete and partial wetting fluid systems.

Mesh Saliency using Global Rarity based on Multi-Scale Mean Curvature (다중 스케일 평균곡률 기반 전역 희소치를 이용한 메쉬 돌출 정의)

  • Jeon, Jiyoung;Kwon, Youngsoo;Choi, Yoo-Joo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1579-1580
    • /
    • 2015
  • 본 논문에서는 3차원 메쉬 모델의 중요 영역을 표현하는 메쉬 돌출맵(mesh saliency map)을 생성하기 위하여 다중 스케일 평균 곡률 (multi-scale mean curvature)을 기반으로 정의된 전역 희소치(global rarity)를 이용하는 방법을 제안한다. 제안 방법에서는 우선, 메쉬 모델의 지역 영역 특성을 정의하기 위하여 기존 관련 연구들에서 많이 사용하고 있는 가우시안 가중치 평균곡률(Gaussian-weighted mean curvature)을 5단계 서로 다른 스케일에서 정의하고, 메쉬의 각 정점(vertex)에 대하여 중심주변 연산자(center-surround operator)를 적용하여 5단계 지역 돌출특성(local saliency)을 정의한다. 주어진 메쉬 모델의 전역 희소치를 구하기 위하여 메쉬의 모든 정점쌍 (vertex pair)에 대하여 5단계 지역 돌출 특성 공간에서의 거리를 계산하고, 각 정점별로 5단계 지역 돌출 특성 공간에서의 다른 정점과의 거리의 합으로 전역 희소치를 정의한다. 이러한 전역 희소치를 각 정점의 메쉬 돌출치로 정의한다. 서로 다른 형태의 3차원 모델에 대하여 제안방법에 의한 메쉬 돌출맵과 지역 특성만을 고려한 기존 메쉬 돌출맵을 생성하여 중요 영역 표현 결과를 비교 분석한다.

Development of Multi-scale Model for Concrete Strength Estimation using Intelligent Self-diagnostic sensor (지능형 자가진단센서를 이용한 콘크리트 강도추정을 위한 다중스케일모델 개발)

  • Kim, Dong-Jin;Park, Woong-Ki;Lee, Chang-Gil;Hong, Seok-Inn;Park, Seung-Hee
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2011.04a
    • /
    • pp.303-306
    • /
    • 2011
  • 본 논문은 콘크리트의 양생 강도 발현을 모니터링하기 위하여 매립형 압전 센서를 이용하여 콘크리트 내부의 임피던스 및 유도초음파 신호를 측정함으로써, 콘크리트의 양생 강도를 실시간 추정할 수 있는 기법을 개발하였다. 임피던스 및 유도초음파 신호는 구조물의 물성을 나타내며 특히 양생 기간 중 임피던스 및 유도초음파의 변화는 해당 콘크리트 구조물의 강도변화를 나타낼 수 있다. 이를 이용하여 매립형 압전 센서로부터 저비용의 셀프 센싱 기반 임피던스 및 유도초음파를 계측하여 콘크리트의 임피던스 공진 주파수 및 유도초음파의 전달 강도를 측정하고 측정된 신호를 통하여 콘크리트 양생 강도를 추정할 수 있게 된다. 제안된 기법의 적용가능성을 검증하기 위하여 설계 압축강도 30MPa의 콘크리트 슬라브 내부에 매립형 압전 센서를 매립하고 양생기간 동안 임피던스 및 유도초음파 신호를 측정, 비교 분석 하였다. 측정된 신호 및 압축강도를 통하여 임피던스 및 유도초음파 기반 강도 추정 모델을 도출하고 보다 높은 정확도를 얻기 위해 다중스케일 강도 추정 모델을 개발하였다. 결과적으로 본 연구를 통해 매립형 압전 센서를 이용하여 콘크리트의 양생 강도를 실시간 모니터링할 수 있음이 검증되었다.

  • PDF

Comparative Study on Illumination Compensation Performance of Retinex model and Illumination-Reflectance model (레티넥스 모델과 조명-반사율 모델의 조명 보상 성능 비교 연구)

  • Chung, Jin-Yun;Yang, Hyun-Seung
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.11
    • /
    • pp.936-941
    • /
    • 2006
  • To apply object recognition techniques to real environment, illumination compensation method should be developed. As effective illumination compensation model, we focused our attention on Retinex model and illumination-Reflectance model, implemented them, and experimented on their performance. We implemented Retinex model with Single Scale Retinex, Multi-Scale Retinex, and Retinex Neural Network and Multi-Scale Retinex Neural Network, neural network model of Retinex model. Also, we implemented illumination-Reflectance model with reflectance image calculation by calculating an illumination image by low frequency filtering in frequency domain of Discrete Cosine Transform and Wavelet Transform, and Gaussian blurring. We compare their illumination compensation performance to facial images under nine illumination directions. We also compare their performance after post processing using Principal Component Analysis(PCA). As a result, illumination Reflectance model showed better performance and their overall performance was improved when illumination compensated images were post processed by PCA.