• Title/Summary/Keyword: 모달 영역

Search Result 52, Processing Time 0.027 seconds

Bimodal Speech Recognition Modeling Using Neural Networks (신경망을 이용한 이중모달 음성 인식 모델링)

  • 류정우;성지애;이순신;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.567-569
    • /
    • 2003
  • 최근 잡음환경에서 강인한 음성인식을 위해 음성 잡음에 영향을 받지 않은 영상정보를 이용한 이중모달 음성인식 연구가 활발히 진행되고 있다. 기존 음성인식기로 좋은 성능을 보이는 HMM은 이질적인 정보를 융합하는데 있어 많은 제약과 어려움을 가지고 있다. 하지만 신경망은 이질적인 정보를 효율적으로 융합할 수 있는 장점을 가지고 있으며 그에 대한 많은 연구가 수행되고 있다. 따라서 본 논문에서는 잡음환경에 강인한 이중모달 음성 인식 모델로 이중모달 신경망(BN-NN)을 제안한다. 이중모달 신경망은 특징융합 방법으로 음성정보와 영상정보를 융합하고 있으며. 입력정보의 특성을 고려하기 위해 윈도우와 중복영역의 개념을 적용하여 시제위치를 고려하도록 설계되어있다. 제안된 모델은 잡음환경에서 음성인식기와 성능을 비교하고, 화자독립 고립단어 인식에서 기존 융합방법인 CHMM과 비교하여 그 가능성을 확인한다.

  • PDF

Estimation of Modal Parameters for Plastic Film-Covered Greenhouse Arches (비닐하우스 아치구조의 모달계수 산정)

  • Cho, Soon-Ho
    • Journal of the Earthquake Engineering Society of Korea
    • /
    • v.14 no.2
    • /
    • pp.67-74
    • /
    • 2010
  • To a series of vibration records obtained from experimental modal testing using a fixed hammer and roving accelerometers for greenhouse arch structures, modal parameters such as natural frequencies, damping ratios and mode shapes are extracted by applying the two most advanced system identification methods in the frequency-domain up to now, so-called PolyMAX and FDD. The former involves both input and output data, while the latter utilizes only the output data. The possibility of determining the static buckling load, detecting damages, etc., for very slender steel-pipe arches by means of a non-destructive testing method based on vibration measurements is primarily investigated. The extracted modal parameters generally correlated well with those obtained using finite element analysis, demonstrating promising results for further on-going research.

Quantitative Analysis of Metabolism for Brain Hippocampus based on Multi-modality Image Registration (다중모달리티 영상정합기반 뇌 해마영역 기능대사 정량분석)

  • Kim, Min-Jeong;Choi, Yoo-Joo;Kim, Myoung-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.1645-1648
    • /
    • 2004
  • 해마를 비롯하여, 뇌 기능과 밀접한 관련을 가지는 뇌 하위조직의 분석에 대한 최근 연구로 MR 영상 등의 해부학적 영상으로부터의 볼륨 추출, 형상 복원, 대칭성 비교 등을 들 수 있다. 이러한 연구들은 뇌의 해부학적 정보에만 의존함으로써 관심영역에 대한 신진대사 등의 분석에 한계를 가진다. 본 논문에서는 뇌 해마영역에 대하여 해부학적, 기능적 특성의 동시 분석이 가능한 프로시저를 제안한다. 먼저 해부학적 영상과 기능적 영상의 다중모달리티 영상정합을 수행하고 이를 기반으로 해마 SPECT 볼륨이 추출되며, 나아가 체적 측정 및 강도 분포 등의 정량분석을 수행함으로써 해부학적 영역의 기능정보에 대한 직관적이며 객관적인 분석이 가능하도록 하였다.

  • PDF

Bone Segmentation Method of Visible Human using Multimodal Registration (다중 모달 정합에 의한 Visible Human의 뼈 분할 방법)

  • Lee, Ho;Kim, Dong-Sung;Kang, Heung-Sik
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.7_8
    • /
    • pp.719-726
    • /
    • 2003
  • This paper proposes a multimodal registration method for segmentation of the Visible Human color images, in which color characteristics of bones are very similar to those of its surrounding fat areas. Bones are initially segmented in CT images, and then registered into color images to lineate their boundaries in the color images. For the segmentation of bones in CT images, a thresholding method is developed. The registration method registers boundaries of bodies in CT and color images using a cross-correlation approach, in which the boundaries of bodies are extracted by thresholding segmentation methods. The proposed method has been applied to segmentation of bones in a head and legs whose boundary is ambiguous due to surrounding fat areas with similar color characteristics, and produced promising results.

Design of the Multi-Modal Media Art Contents using Touch Screen based on Affordance Theory (어포던스 이론 기반 터치 스크린을 이용한 멀티 모달 미디어 아트 콘텐츠의 설계)

  • Lee, Gang-So;Choi, Yoo-Joo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.36-37
    • /
    • 2015
  • 본 논문에서는 전시 공간에서 전시 콘텐츠를 그냥 지나치거나 적극적으로 상호작용하려 하지 않는 관람객의 관심과 흥미를 이끌어 내기 위하여 어포던스(affordance, 행위 유발성) 특성을 반영한 인터랙티브 아트 콘텐츠 설계에 관한 내용을 다룬다. 이를 위하여, 우선, HCI 나 인지심리 영역에서 다루고 있는 어포던스 이론을 고찰하고, 특히 전시 공간에 나타나는 어포던스의 요소를 연구한 기존 연구들 분석하였다. 이를 기반으로 사람들의 행동과 흥미를 유발 시킬 수 있는 전시공간에 적합한 어포던스 기반 멀티 모달 인터페이스 설계 방향을 제시하였다. 또한, 제시된 멀티 모달 인터페이스 설계 특성을 반영하여 터치 스크린을 이용한 멀티 모달 미디어 아트 콘텐츠를 설계 제작하였다.

  • PDF

Multi-Modal User Distance Estimation System based on Mobile Device (모바일 디바이스 기반의 멀티 모달 사용자 거리 추정 시스템)

  • Oh, Byung-Hun;Hong, Kwang-Seok
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.14 no.2
    • /
    • pp.65-71
    • /
    • 2014
  • This paper present the multi-modal user distance estimation system using mono camera and mono microphone basically equipped with a mobile device. In case of a distance estimation method using an image, we is estimated a distance of the user through the skin color region extraction step, a noise removal step, the face and eyes region detection step. On the other hand, in case of a distance estimation method using speech, we calculates the absolute difference between the value of the sample of speech input. The largest peak value of the calculated difference value is selected and samples before and after the peak are specified as the ROI(Region of Interest). The samples specified perform FFT(Fast Fourier Transform) and calculate the magnitude of the frequency domain. Magnitude obtained is compared with the distance model to calculate the likelihood. We is estimated user distance by adding with weights in the sorted value. The result of an experiment using the multi-modal method shows more improved measurement value than that of single modality.

Audio-Visual Integration based Multi-modal Speech Recognition System (오디오-비디오 정보 융합을 통한 멀티 모달 음성 인식 시스템)

  • Lee, Sahng-Woon;Lee, Yeon-Chul;Hong, Hun-Sop;Yun, Bo-Hyun;Han, Mun-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.707-710
    • /
    • 2002
  • 본 논문은 오디오와 비디오 정보의 융합을 통한 멀티 모달 음성 인식 시스템을 제안한다. 음성 특징 정보와 영상 정보 특징의 융합을 통하여 잡음이 많은 환경에서 효율적으로 사람의 음성을 인식하는 시스템을 제안한다. 음성 특징 정보는 멜 필터 캡스트럼 계수(Mel Frequency Cepstrum Coefficients: MFCC)를 사용하며, 영상 특징 정보는 주성분 분석을 통해 얻어진 특징 벡터를 사용한다. 또한, 영상 정보 자체의 인식률 향상을 위해 피부 색깔 모델과 얼굴의 형태 정보를 이용하여 얼굴 영역을 찾은 후 강력한 입술 영역 추출 방법을 통해 입술 영역을 검출한다. 음성-영상 융합은 변형된 시간 지연 신경 회로망을 사용하여 초기 융합을 통해 이루어진다. 실험을 통해 음성과 영상의 정보 융합이 음성 정보만을 사용한 것 보다 대략 5%-20%의 성능 향상을 보여주고 있다.

  • PDF

Multimodal Brain Image Registration based on Surface Distance and Surface Curvature Optimization (표면거리 및 표면곡률 최적화 기반 다중모달리티 뇌영상 정합)

  • Park Ji-Young;Choi Yoo-Joo;Kim Min-Jeong;Tae Woo-Suk;Hong Seung-Bong;Kim Myoung-Hee
    • The KIPS Transactions:PartA
    • /
    • v.11A no.5
    • /
    • pp.391-400
    • /
    • 2004
  • Within multimodal medical image registration techniques, which correlate different images and Provide integrated information, surface registration methods generally minimize the surface distance between two modalities. However, the features of two modalities acquired from one subject are similar. So, it can improve the accuracy of registration result to match two images based on optimization of both surface distance and shape feature. This research proposes a registration method which optimizes surface distance and surface curvature of two brain modalities. The registration process has two steps. First, surface information is extracted from the reference images and the test images. Next, the optimization process is performed. In the former step, the surface boundaries of regions of interest are extracted from the two modalities. And for the boundary of reference volume image, distance map and curvature map are generated. In the optimization step, a transformation minimizing both surface distance and surface curvature difference is determined by a cost function referring to the distance map and curvature map. The applying of the result transformation makes test volume be registered to reference volume. The suggested cost function makes possible a more robust and accurate registration result than that of the cost function using the surface distance only. Also, this research provides an efficient means for image analysis through volume visualization of the registration result.

Prediction and Validation of Design Loads of Satellite Components Using Modal Mass Acceleration Curve (모달 질량 가속도 곡선을 이용한 인공위성 탑재품의 설계하중 예측 및 검증)

  • Go, Myeong-Seok;Lim, Jae Hyuk;Kim, Kyung-Won;Hwang, Do-Soon;Oh, Hyunung
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.49 no.9
    • /
    • pp.739-748
    • /
    • 2021
  • This paper discusses the prediction and validation of design loads of satellite components using modal mass acceleration curve (Modal MAC). To calculate the acceleration upper bound of the satellite components subjected to the launch environment by the Modal MAC, the parameters of SpaceX Falcon 9 launch vehicle were used, and the acceleration upper bound curve in the modal domain was derived. After that, the maximum acceleration loads applied to the satellite components were predicted by combining Modal MAC with the spacecraft interface loads of the satellite/launch vehicle and modal information of the satellite. In addition, the accuracy of the Modal MAC was validated through comparison with the results of the coupled loads analysis using a simple satellite and launch vehicle model.

Damage Evaluation of a Railroad Bridge Using Time-domain Deflection Shape (시간영역 변형형상을 이용한 철도교량의 손상평가)

  • Choi, Sang-Hyun;Lim, Nam-Hyoung;Kang, Young-Jong
    • Journal of the Korean Society for Railway
    • /
    • v.12 no.1
    • /
    • pp.129-134
    • /
    • 2009
  • To ensure the safety and functionality of a railroad bridge, maintaining the integrity of the bridge via continuous structural health monitoring is important. However, most structural integrity monitoring methods proposed to date are based on modal responses which require the extracting process and have limited availability. In this paper, the applicability of the existing damage identification method based on free-vibration reponses to time-domain deflection shapes due to moving train load is investigated. Since the proposed method directly utilizes the time-domain responses of the structure due to the moving vehicles, the extracting process for modal responses can be avoided, and the applicability of structural health evaluation can be enhanced. The feasibility of the presented method is verified via a numerical example of a simple plate girder bridge.