• 제목/요약/키워드: Feature detector

검색결과 191건 처리시간 0.027초

음성인식을 위한 새로운 혼성 recurrent TDNN-HMM 구조에 관한 연구 (A study on the new hybrid recurrent TDNN-HMM architecture for speech recognition)

  • 장춘서
    • 정보처리학회논문지B
    • /
    • 제8B권6호
    • /
    • pp.699-704
    • /
    • 2001
  • 본 논문에서는 혼성 모듈 구조의 recurrent 시간지연신경회로망(time-delay neural network)과 HMM(hidden Markov model)을 결합한 음성인식을 위한 새로운 구조에 대해 연구하였다. 시간지연신경회로망에서는 윈도우 크기를 확장하는 것이 인식률 향상에 유리하므로 이를 위해 첫 번째 은닉층에 궤환 구조를 사용하여 윈도우 크기를 실제로 크게 하지 않고도 동일한 효과를 얻을 수 있도록 하였다. 다음 이 시간지연신경망에서 입력된 음소의 특징 벡터의 시간에 따라 변화하는 성질을 잘 처리 할 수 있도록 시간지연신경회로망의 입력층을 복수의 상태로 나누어 음소특징의 시간축에 대한 각 상태마다 특징 감지기를 갖도록 하였다. 이때 시간지연신경회로망은 전체 음성인식 영역에 적용될 수 있도록 모듈 방식의 구조로 구성되었다. 그리고 이 모듈 구조 시간지연신경망의 출력 벡터를 HMM에 연결하여 서로 결합 하므로써 양 구조의 장점을 취하는 혼성 구조의 인식시스템을 구성하였고 이때 이 혼성 구조에서 효율적으로 적용할 수 있는 HMM 파라미터 smoothing 방법을 제시하였다.

  • PDF

얼굴 랜드마크의 들로네 삼각망을 이용한 얼굴 모핑 기법 (A Facial Morphing Method Using Delaunay Triangle of Facial Landmarks)

  • 박경남
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.213-220
    • /
    • 2018
  • 얼굴 모핑은 원본 이미지에서 목표 이미지로 점진적이면서 자연스럽게 영상을 변화시키는 기법으로 영상처리와 그래픽 분야에서 자주 사용되는 강력한 영상처리 기술 중의 하나이다. 본 논문에서는 Dlib 얼굴 랜드마크 검출기를 이용하여 생성된 얼굴 랜드마크 정점들을 이용하여 들로네 삼각망을 생성하고 원본 영상에서 목표영상으로의 들로네 삼각망들의 와핑과 크로스 디졸브를 통해 모핑을 구현하는 방법을 제안하였다. 본 논문에서 제안한 방법은 들로네 삼각망을 생성하기 위한 정점들을 수동으로 만들어 주는 것이 아니라, 얼굴 모핑에서 얼굴의 주요한 부분인 눈, 눈썹, 코, 입 등의 얼굴의 주요 특징점이라 할 수 있는 얼굴 랜드마크들을 이용함으로써 자동으로 들로네 삼각망을 생성할 수 있다는 것이 특징이다. 그리고 수동으로 정점을 추가할 수도 있어 더욱 자연스러운 모핑 결과를 얻을 수 있을 수 있다는 것을 시뮬레이션을 통해 확인하였다.

A semi-supervised interpretable machine learning framework for sensor fault detection

  • Martakis, Panagiotis;Movsessian, Artur;Reuland, Yves;Pai, Sai G.S.;Quqa, Said;Cava, David Garcia;Tcherniak, Dmitri;Chatzi, Eleni
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.251-266
    • /
    • 2022
  • Structural Health Monitoring (SHM) of critical infrastructure comprises a major pillar of maintenance management, shielding public safety and economic sustainability. Although SHM is usually associated with data-driven metrics and thresholds, expert judgement is essential, especially in cases where erroneous predictions can bear casualties or substantial economic loss. Considering that visual inspections are time consuming and potentially subjective, artificial-intelligence tools may be leveraged in order to minimize the inspection effort and provide objective outcomes. In this context, timely detection of sensor malfunctioning is crucial in preventing inaccurate assessment and false alarms. The present work introduces a sensor-fault detection and interpretation framework, based on the well-established support-vector machine scheme for anomaly detection, combined with a coalitional game-theory approach. The proposed framework is implemented in two datasets, provided along the 1st International Project Competition for Structural Health Monitoring (IPC-SHM 2020), comprising acceleration and cable-load measurements from two real cable-stayed bridges. The results demonstrate good predictive performance and highlight the potential for seamless adaption of the algorithm to intrinsically different data domains. For the first time, the term "decision trajectories", originating from the field of cognitive sciences, is introduced and applied in the context of SHM. This provides an intuitive and comprehensive illustration of the impact of individual features, along with an elaboration on feature dependencies that drive individual model predictions. Overall, the proposed framework provides an easy-to-train, application-agnostic and interpretable anomaly detector, which can be integrated into the preprocessing part of various SHM and condition-monitoring applications, offering a first screening of the sensor health prior to further analysis.

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구 (Implementation of Intelligent Image Surveillance System based Context)

  • 문성룡;신성
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.11-22
    • /
    • 2010
  • 본 논문은 컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구로써 기존 연구의 시공간적 제약성 및 실시간 처리가 어려운 단점을 보완하여 초당 30 프레임으로 이루어져 있는 저해상도 동영상(320*240)을 대상으로 다양한 환경에서 실시간 처리가 가능한 움직임 검출 및 장면 분석 알고리즘을 제안하고 이를 이용해 동영상 감시 시스템을 구축한다. 먼저 장면 분석을 수행하기 위한 전처리 과정인 움직임 검출 알고리즘에서는 연속된 프레임 중 의미 없는 유사 프레임과 배경을 제거하고 움직임 영역만을 검출하기 위해 웨이브렛 변환과 에지 히스토그램을 이용하여 샷의 경계를 검출한다. 다음으로 키프레임 선정 파라미터에 의해 샷 경계 내 대표 키프레임을 선정하며, 에지 히스토그램 및 수학적 형태론을 이용하여 움직임 영역만을 검출한다. 장면 분석 알고리즘에서는 검출된 객체의 수직 수평 비율과 질량 중심을 통해 재구성된 허프 변환 후의 각도를 이용해 독립 객체 분석을 수행하며, '서다, 걷다, 눕다, 앉다'의 4가지 기본 상황 정보를 정의한다. 또한 각 상황의 연결 상태 추정을 통해 일반 상황 및 위급 상황으로 구성되는 단순 상황 모델을 정의함으로써 장면 분석을 수행하며, 제안된 알고리즘의 실시간 처리 가능성을 확인하기 위해 시스템을 구성한다. 제안된 시스템은 저해상도 영상을 대상으로 인식률 면에서 평균 92.5%의 성능을 보였으며, 처리속도는 프레임 당 평균 0.74초로 실시간 처리가 가능함을 확인하였다.

V2X 통신환경에서의 독립교차로 신호 최적제어 알고리즘 개발 연구 (The Development of an Algorithm for the Optimal Signal Control for Isolated Intersections under V2X Communication Environment)

  • 한음;박상민;정하림;이철기;윤일수
    • 한국ITS학회 논문지
    • /
    • 제15권6호
    • /
    • pp.90-101
    • /
    • 2016
  • 본 연구에서는 V2X 통신환경 하에서 개별 차량 기반 수집 데이터를 활용하여 독립교차로의 실시간 교통상황대응 최적 교통신호 제어 알고리즘을 개발하였다. 매초 간격으로 V2X 통신환경에서 수집되는 정보를 이용하여 주기, 현시, 현시 순서를 결정하는 알고리즘과 이 알고리즘 안에서 감응식 신호를 적용하여 독립신호 교차로의 신호 최적제어를 실시하였다. 최적화된 신호시간과 본 연구에서 개발된 알고리즘을 활용한 신호제어 성능을 비교하면 전제적으로 평균 지체, 평균 정지지체, 정지횟수, 평균속도가 개선되었음을 나타나고 있으며, 개선 폭이 교통량이 많아질수록 커지는 것으로 분석되었다. 또한 시장점유율에 따른 도입 시기 평가 결과, 평균 지체의 경우 교통량이 500대의 경우 시장점유율이 50% 이하로 내려가면 본 연구에서 개발된 알고리즘이 기존 신호알고리즘보다 높은 지체를 보였으나, 교통량이 1,000대일 경우 시장 점유율 25% 이하에서 지체가 높아졌다. 하지만 1,500대일 경우 시장점유율에 25%에 불과해도 기존의 신호제어 알고리즘보다 지체가 낮아지는 것으로 분석되었다.

영역 추출을 위한 Hough 변환 기반 에지 검출과 영역 확장을 통합한 방법 (A Combined Hough Transform based Edge Detection and Region Growing Method for Region Extraction)

  • ;김용권;정진완;이석룡;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.263-279
    • /
    • 2009
  • CBIR(Content-based Image Retrieval) 시스템의 질의 처리에 사용되는 모양 특징은 크게 경계 기반과 영역 기반 등 두 가지로 나눌 수 있다. 경계기반 특징은 간단하지만 영역 기반 특징에 비해 효과적이지 않다. 영역 기반 모양 특징을 사용하는 대부분의 시스템은 먼저 영역을 추출해야 한다. 하지만 기존의 영역 기반 시스템들은 구현이 복잡하고, 특히 정확한 영역 추출이 어려우며 영역 간의 위치적인 관계가 거리 모델(distance model)에 반영되어 있지 않다. 본 논문에서는 Canny 에지 검출과 Hough 변환에 기반하여 목표 내부의 에지를 검출하고, 이와 함께 영역확장을 이용하여 목표 물체 내부의 영역을 정확히 추출할 수 있는 방법을 제안하였다. 또한 영역 간의 인접 관계를 이용한 수정된 IRM(Integrated Region Matching) 기법을 제안하였다. 이는 모양 특징을 이용한 유사성 검색에서 영상 간의 거리 모델로서 사용된다. 그리고 실험을 통해 수정된 IRM 기법과 우리의 영역 추출 기법이 효과적임을 보였다. 실험 결과는 새로운 영역 추출 방법이 기존의 다른 방법보다 훨씬 우수함을 보여준다.

Standard Measurement Procedure for Soil Radon Exhalation Rate and Its Uncertainty

  • Seo, Jihye;Nirwono, Muttaqin Margo;Park, Seong Jin;Lee, Sang Hoon
    • Journal of Radiation Protection and Research
    • /
    • 제43권1호
    • /
    • pp.29-38
    • /
    • 2018
  • Background: Radon contributing about 42% of annual average dose, mainly comes from soil. In this paper, standard measurement procedures for soil radon exhalation rate are suggested and their measurement uncertainties are analyzed. Materials and Methods: We used accumulation method for estimating surface exhalation rate. The closed-loop measurement system was made up with a RAD7 detector and a surface chamber. Radon activity concentrations in the system were observed as a function of time, with data collection of 5 and 15-minute and the measurement time of 4 hours. Linear and exponential fittings were used to obtain radon exhalation rates from observed data. Standard deviations of measurement uncertainties for two approaches were estimated using usual propagation rules. Results and Discussion: The exhalation rates (E) from linear approach, with 30 minutes measurement time were $44.8-48.6mBq{\cdot}m^{-2} {\cdot}s^{-1}$ or $2.14-2.32atom{\cdot}cm^{-2}{\cdot}s^{-1}$ with relative measurement uncertainty of about 10%. The contributions of fitting parameter A, volume (V) and surface (S) to the estimated measurement uncertainty of E were 59.8%, 30.1% and 10.1%, in average respectively. In exponential fitting, at 3-hour measurement we had E ranged of $51.6-69.2mBq{\cdot}m^{-2} {\cdot}s^{-1}$ or $2.46-3.30atom{\cdot}cm^{-2}{\cdot}s^{-1}$ with about 15% relative uncertainty. Fitting with 4-hour measurement resulted E about $51.3-68.2mBq{\cdot}m^{-2} {\cdot}s^{-1}$ or $2.45-3.25atom{\cdot}cm^{-2}{\cdot}s^{-1}$ with 10% relative uncertainty. The uncertainty contributions in exponential approach were 75.1%, 13.4%, 8.7%, and 2.9% for total decay constant k, fitting parameter B, V, and S, respectively. Conclusion: In obtaining exhalation rates, the linear approach is easy to apply, but by saturation feature of radon concentrations, the slope tends to decrease away from the expected slope for extended measurement time. For linear approach, measurement time of 1-hour or less was suggested. For exponential approach, the obtained exhalation rates showed similar values for any measurement time, but measurement time of 3-hour or more was suggested for about 10% relative uncertainty.

트랜스포머 기반의 다중 시점 3차원 인체자세추정 (Multi-View 3D Human Pose Estimation Based on Transformer)

  • 최승욱;이진영;김계영
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.48-56
    • /
    • 2023
  • 3차원 인체자세추정은 스포츠, 동작인식, 영상매체의 특수효과 등의 분야에서 널리 활용되고 있는 기술이다. 이를 위한 여러 방법들 중 다중 시점 3차원 인체자세추정은 현실의 복잡한 환경에서도 정밀한 추정을 하기 위해 필수적인 방법이다. 하지만 기존 다중 시점 3차원 인체자세추정 모델들은 3차원 특징 맵을 사용함에 따라 시간 복잡도가 높은 단점이 있다. 본 논문은 계산 복잡도가 적은 트랜스포머 기반 기존 단안 시점 다중 프레임 모델을 다중 시점에 대한 3차원 인체자세추정으로 확장하는 방법을 제안한다. 다중 시점으로 확장하기 위하여 먼저 2차원 인체자세 검출자 CPN(Cascaded Pyramid Network)을 활용하여 획득한 4개 시점의 17가지 관절에 대한 2차원 관절좌표를 연결한 8차원 관절좌표를 생성한다. 그 다음 이들을 패치 임베딩 한 뒤 17×32 데이터로 변환하여 트랜스포머 모델에 입력한다. 마지막으로, 인체자세를 출력하는 MLP(Multi-Layer Perceptron) 블록을 매 반복 마다 사용한다. 이를 통해 4개 시점에 대한 3차원 인체자세추정을 동시에 수정한다. 입력 프레임 길이 27을 사용한 Zheng[5]의 방법과 비교했을 때 제안한 방법의 모델 매개변수의 수는 48.9%, MPJPE(Mean Per Joint Position Error)는 20.6mm(43.8%) 감소했으며, 학습 횟수 당 평균 학습 소요 시간은 20배 이상 빠르다.

  • PDF

설포라제 캡슐(아세브로필린 100 mg)에 대한 부로필 캡슐의 생물학적 동등성 (Bioequivalence of Burophil Capsule to Surfolase Capsule (Acebrophylline 100 mg))

  • 조혜영;박은자;강현아;김세미;박찬호;오인준;임동구;이명희;이용복
    • Journal of Pharmaceutical Investigation
    • /
    • 제35권3호
    • /
    • pp.179-185
    • /
    • 2005
  • Acebrophylline is a compound produced by salifying ambroxol with theophylline-7 -acetic acid. After acebrophylline administration, the salt splits into these two components which feature a peculiar pharmacokinetic behavior, an adequate ambroxol and a low theophylline-7-acetic acid serum levels. The purpose of the present study was to evaluate the bioequivalence of two acebrophylline capsules, Surfolase (Hyundai Pharm. lnd. Co., Ltd.) and Burophil (Kuhnil Pharm. Co., Ltd.), according to the guidelines of the Korea Food and Drug Administration (KFDA). The release of ambroxol from the two acebrophylline formulations in vitro was tested using KP VIII Apparatus II method with various dissolution media (pH 1.2, 4.0, 6.8 buffer solution and water). Twenty eight healthy male subjects, $23.25{\pm}1.43$ years in age and $64.82{\pm}6.77$ kg in body weight, were divided into two groups and a randomized $2{\times}2$ cross-over study was employed. After two capsules containing 100 mg as acebrophylline were orally administered, blood was taken at predetermined time intervals and the concentrations of ambroxol in serum were determined using HPLC with electrochemical detector (ECD). The dissolution profiles of two formulations were similar at all dissolution media. In addition, the pharmacokinetic parameters such as $AUC_t$, $C_{max}$ and $T_{max}$ were calculated and ANOVA test was utilized for the statistical analysis of the parameters using logarithmically transformed $AUC_t$, $C_{max}$ and untransformed $T_{max}$. The results showed that the differences between two formulations based on the reference drug Surfolase, were -1.64, -3.33 and -0.92% for $AUC_t$, $C_{max}$ and $T_{max}$, respectively. There were no sequence effects between two formulations in these parameters. The 90% confidence intervals using logarithmically transformed data were within the acceptance range of log 0.8 to log 1.25 $(e.g., \;log\;0.93{\sim}log\;1.05\;and\;log\;0.88{\sim}log\;1.05$ for $AUC_t$, and $C_{max}$, respectively). Thus, the criteria of the KFDA bioequivalence guideline were satisfied, indicating Burophil capsule was bioequivalent to Surfolase capsule.