• 제목/요약/키워드: Network Feature Extraction

검색결과 491건 처리시간 0.023초

시멘틱 세그멘테이션을 활용한 이미지 오브젝트의 효율적인 영역 추론 (Efficient Inference of Image Objects using Semantic Segmentation)

  • 임헌영;이유림;지민규;고명현;김학동;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.67-76
    • /
    • 2019
  • 본 연구에서는 다중 라벨링이 되어 있는 이미지 데이터를 대상으로 시멘틱 세그멘테이션을 활용한 효율적인 오브젝트별 영역 분류 기법을 연구한다. 이미지 데이터에 포함된 색상 정보, 윤곽선, 명암, 채도 등 다양한 픽셀 단위 정보와 프로세싱 기법뿐만 아니라 각 오브젝트들이 위치한 세부 영역을 의미 있는 단위로 추출하여 추론 결과에 반영하는 실험을 진행하고 그 결과에 대해 논의한다. 이미지 분류에서 훌륭한 성능을 검증받은 뉴럴 네트워크를 활용하여 비정형성이 심하고 다양한 클래스 오브젝트가 포함된 이미지 데이터를 대상으로 어떤 오브젝트가 어디에 위치하였는지 파악하는 작업을 진행한다. 이러한 연구를 기반으로 향후 다양한 오브젝트가 포함된 복잡한 이미지의 실시간 세부 영역 분류를 진행하는 인공지능 서비스 제공을 목표로 한다.

Subset 샘플링 검증 기법을 활용한 MSCRED 모델 기반 발전소 진동 데이터의 이상 진단 (Anomaly Detection In Real Power Plant Vibration Data by MSCRED Base Model Improved By Subset Sampling Validation)

  • 홍수웅;권장우
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.31-38
    • /
    • 2022
  • 본 논문은 전문가 독립적 비지도 신경망 학습 기반 다변량 시계열 데이터 분석 모델인 MSCRED(Multi-Scale Convolutional Recurrent Encoder-Decoder)의 실제 현장에서의 적용과 Auto-encoder 기반인 MSCRED 모델의 한계인, 학습 데이터가 오염되지 않아야 된다는 점을 극복하기 위한 학습 데이터 샘플링 기법인 Subset Sampling Validation을 제시한다. 라벨 분류가 되어있는 발전소 장비의 진동 데이터를 이용하여 1) 학습 데이터에 비정상 데이터가 섞여 있는 상황을 재현하고, 이를 학습한 경우 2) 1과 같은 상황에서 Subset Sampling Validation 기법을 통해 학습 데이터에서 비정상 데이터를 제거한 경우의 Anomaly Score를 비교하여 MSCRED와 Subset Sampling Validation 기법을 유효성을 평가한다. 이를 통해 본 논문은 전문가 독립적이며 오류 데이터에 강한 이상 진단 프레임워크를 제시해, 다양한 다변량 시계열 데이터 분야에서의 간결하고 정확한 해결 방법을 제시한다.

저전력 장치를 위한 자원 효율적 객체 검출기 (Resource-Efficient Object Detector for Low-Power Devices)

  • 악세이 쿠마 샤마;김경기
    • 반도체공학회 논문지
    • /
    • 제2권1호
    • /
    • pp.17-20
    • /
    • 2024
  • 본 논문은 전통적인 자원 집약적인 컴퓨터 비전 모델의 한계를 해결하기 위해 저전력 엣지 장치에 최적화된 새로운 경량 객체 검출 모델을 제안합니다. 제안된 검출기는 Single Shot Detector (SSD)에 기반하여 소형이면서도 견고한 네트워크를 설계하였고, 작은 객체를 효율적으로 감지하는 데 있어 효율성을 크게 향상시키도록 모델을 구성하였다. 이 모델은 주로 두 가지 구성요소로 구성되어 있습니다: Depthwise 와 Pointwise Convolution 레이어를 사용하여 효율적인 특징 추출을 위한 Light_Block, 그리고 작은 객체의 향상된 감지를 위한 Enhancer_Block 으로 나누었다. 우리의 모델은 300x480 의 이미지 크기를 가진 Udacity 주석이 달린 데이터셋에서 처음부터 훈련되었으며, 사전 훈련된 분류 가중치의 필요성을 제거하였다. 약 0.43M 의 파라미터로 5.5MB 만의 무게를 가진 우리의 검출기는 평균 정밀도 (mAP) 27.7%와 140 FPS 의 처리 속도를 달성하여, 정밀도와 효율성 모두에서 기존 모델을 능가하였다. 따라서, 본 논문은 추론의 정확성을 손상시키지 않으면서 엣지 장치를 위한 객체 검출에서의 효과적인 경량화를 보여주고 있다.

전화망에서의 음성인식을 위한 전처리 연구 (Front-End Processing for Speech Recognition in the Telephone Network)

  • 전원석;신원호;양태영;김원구;윤대희
    • 한국음향학회지
    • /
    • 제16권4호
    • /
    • pp.57-63
    • /
    • 1997
  • 본 논문에서는 다양한 전화선 채널에서 수집된 한국통신(KT)의 데이터베이스를 이용하여 인식 시스템의 성능을 향상시키기 위한 효율적인 특징벡터 및 전처리방법을 연구하였다. 먼저 잡음 및 주변 환경 변화에 강인한 갓으로 알려져 있는 특징벡터들을 이용한 인식 성능을 비교하고, 가중 켑스트랄 거리측정 방법을 이용하여 인식시스템의 성능 향상을 검증하였다. 실험 결과, KT의 인식 시스템에서 이용하는 LPC 켑스트럼의 경우에 비하여 PLP(Perceptual Linear Prediction)과 MFCC)Mel Frequency Cepstral Coefficient)등에 대하여 인식률이 향상되었다. 켑스트럼간의 거리측정에 있어서는 RPS(Root Power Sums)와 BPL(Band Pass Lifter)과 같은 가중 켑스트랄 거리측정 함수들이 인식성능 향상에 도움을 주었다. 스펙트럼 차감법(Spectral Subtraction)의 적용은 왜곡에 의한 효과가 커서 인식률이 저하되었지만, RASTA(RelAtive SpecTrAl) 처리방법, CMS(Cepstral Mean Subtraction), SBR(Signal Bias Removal)의 적용시에는 인식 성능 향상을 보였다. 특히, CMS 방법은 간편하면서도 높은 인식 성능 향상을 보였다. 마지막으로, CMS의 실시간 구현을 위한 방법들의 인식 성능을 비교하고, 인식 성능 저하를 막기 위한 개선책을 제시하였다.

  • PDF

CUDA와 OPenMP를 이용한 빠르고 효율적인 신경망 구현 (Fast and Efficient Implementation of Neural Networks using CUDA and OpenMP)

  • 박안진;장홍훈;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.253-260
    • /
    • 2009
  • 컴퓨터 비전이나 패턴 인식 분야에서 이용되고 있는 많은 알고리즘들이 최근 빠른 수행시간을 위해 GPU에서 구현되고 있지만, GPU를 이용하여 알고리즘을 구현할 경우 크게 두 가지 문제점을 고려해야 한다. 첫째, 컴퓨터 그래픽스 분야의 지식이 필요한 쉐이딩(shading) 언어를 알아야 한다. 둘째, GPU를 효율적으로 활용하기 위해 CPU와 GPU간의 데이터 교환을 최소화해야 한다. 이를 위해 CPU는 GPU에서 처리할 수 있는 최대 용량의 데이터를 생성하여 GPU에 전송해야 하기 때문에 CPU에서 많은 처리시간을 소모하며, 이로 인해 CPU와 GPU 사이에 많은 오버헤드가 발생한다. 본 논문에서는 그래픽 하드웨어와 멀티코어(multi-core) CPU를 이용한 빠르고 효율적인 신경망 구현 방법을 제안한다. 기존 GPU의 첫 번째 문제점을 해결하기 위해 제안된 방법은 복잡한 쉐이팅 언어 대신 그래픽스적인 기본지식 없이도 GPU를 이용하여 응용프로그램 개발이 가능한 CUDA를 이용하였다. 두 번째 문제점을 해결하기 위해 멀티코어 CPU에서 공유 메모리 환경의 병렬화를 수행할 수 있는 OpenMP를 이용하였으며, 이의 처리시간을 줄여 CPU와 GPU 환경에서 오버 헤드를 최소화할 수 있다. 실험에서 제안된 CUDA와 OpenMP기반의 구현 방법을 신경망을 이용한 문자영역 검출 알고리즘에 적용하였으며, CPU에서의 수행시간과 비교하여 약 15배, GPU만을 이용한 수행시간과 비교하여 약 4배정도 빠른 수행시간을 보였다.

ASM기반 (2D)2 하이브리드 전처리 알고리즘을 이용한 얼굴인식 시스템 설계 (Design of ASM-based Face Recognition System Using (2D)2 Hybird Preprocessing Algorithm)

  • 김현기;진용탁;오성권
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.173-178
    • /
    • 2014
  • 본 연구에서는 ASM기반 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용한 얼굴인식 분류기와 그것의 설계방법론을 소개한다. 얼굴인식을 위한 이미지는 외부 환경에 쉽게 영향을 받기 때문에, 전처리 단계로 이러한 문제를 해결하기 위해서 ASM을 사용하였다. 특히 사람 얼굴의 특징 추출을 목적으로 널리 이용되고 있다. ASM을 이용해 얼굴영역을 추출 한 뒤 PCA와 LDA를 이용한 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용하여 차원을 축소한다. 전처리 알고리즘을 통한 얼굴데이터는 제안된 다항식 기반 방사형 기저함수 신경회로망의 입력으로 사용된다. 기존의 신경회로망과는 달리 제안된 지능형 패턴 분류기는 강인한 네트워크 특성을 가지며, 예측능력이 우수할 뿐만 아니라 다차원 입출력에 대한 문제도 해결했다. 분류기의 중요한 필수 설계 파라미터(행의 고유벡터의 수, 열의 고유벡터의 수, 클러스터의 수, 퍼지화 계수)는 ABC알고리즘에 의해 최적화 되어진다. 얼굴인식에 많이 사용되는 Yale과 AT&T를 사용하여 인식률을 평가하였다.

신경 회로망과 통계적 기법을 이용한 종합주가지수 예측 모형의 개발 (Development of the KOSPI (Korea Composite Stock Price Index) forecast model using neural network and statistical methods))

  • 이은진;민철홍;김태선
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.95-101
    • /
    • 2008
  • 주가지수는 경제 및 정치적 상황을 포함한 다양한 주변 환경에 영향을 받는 관계로 정확한 주가지수 예측모형의 개발은 매우 어려운 문제로 여겨지고 있다. 본 논문에서는, 신경회로망과 통계적인 방법을 이용하여 종합주가지수(KOSPI)를 예측하는 에이전트 시스템 기법을 제안한다. 예측오차의 평균 및 편차를 최소화하기 위해서, 에이전트시스템은 특징추출, 변수선정, 예측 엔진선정 및 분석을 위한 부(sub)에이전트 모듈들을 포함하고 있다. KOSPI(Korea Composite Stock Price Index) 예측을 위한 에이전트시스템 구현의 첫 번째 단계로서, 주성분분석을 이용하여 22개의 표준기본경제지표에서 12개의 경제지표를 추출하였다. 열두 개의 추출된 경제지표들은 예측하고자하는 예측일에 따라 최량부분적합법을 이용하여 다시 한 번 입력 변수들을 선정하게 된다. 성능평가를 위해 주가지수의 변동폭이 다른 두 종류의 실험데이터를 대상으로 예측을 진행한 결과 30일의 연속적인 종합주가지수예측에 있어 11.92포인트의 평균오차율을 보였다. 또한, 예측시점에 따라 관련이 높은 기본지표의 종류 및 개수가 다르게 나타나므로 제안한 주가예측 에이전트시스템 구조가 유용함을 보였다.

PoseNet과 GRU를 이용한 Skeleton Keypoints 기반 낙상 감지 (Human Skeleton Keypoints based Fall Detection using GRU)

  • 강윤규;강희용;원달수
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.127-133
    • /
    • 2021
  • 낙상 판단을 위한 최근 발표되는 연구는 RNN(Recurrent Neural Network)을 이용한 낙상 동작 특징 분석과 동작 분류에 집중되어 있다. 웨어러블 센서를 기반으로 한 접근 방식은 높은 탐지율을 제공하나 사용자의 착용 불편으로 보편화 되지 못했고 최근 영상이나 이미지 기반에 딥러닝 접근방식을 이용한 낙상 감지방법이 소개 되었다. 본 논문은 2D RGB 저가 카메라에서 얻은 영상을 PoseNet을 이용해 추출한 인체 골격 키포인트(Keypoints) 정보로 머리와 어깨의 키포인트들의 위치와 위치 변화 가속도를 추정함으로써 낙상 판단의 정확도를 높이기 위한 감지 방법을 연구하였다. 특히 낙상 후 자세 특징 추출을 기반으로 Convolutional Neural Networks 중 Gated Recurrent Unit 기법을 사용하는 비전 기반 낙상 감지 솔루션을 제안한다. 인체 골격 특징 추출을 위해 공개 데이터 세트를 사용하였고, 동작분류 정확도를 높이는 기법으로 코, 좌우 눈 그리고 양쪽 귀를 포함하는 머리와 어깨를 하나의 세그먼트로 하는 특징 추출 방법을 적용해, 세그먼트의 하강 속도와 17개의 인체 골격 키포인트가 구성하는 바운딩 박스(Bounding Box)의 높이 대 폭의 비율을 융합하여 실험을 하였다. 제안한 방법은 기존 원시골격 데이터 사용 기법보다 낙상 탐지에 보다 효과적이며 실험환경에서 약 99.8%의 성공률을 보였다.

기상레이더 강수 합성데이터를 활용한 심층신경망 기반 초단기 강수예측 기술 연구 (Short-Term Precipitation Forecasting based on Deep Neural Network with Synthetic Weather Radar Data)

  • 안소정;최윤;손명재;김광호;정성화;박영연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.43-45
    • /
    • 2021
  • 초단기 강수예측 시스템은 단시간 발생하는 집중호우와 같은 위험기상에 대응하기 위해 사회·경제적으로 중요하다. 최근 국내·외에서 심층신경망을 활용한 초단기 강수예측 연구가 활발히 진행되고 있다. 심층신경망을 이용한 강수예측 모델은 훈련 데이터를 만들 때 기상데이터의 구조와 종류가 복잡하고 방대하므로 기상학적 이해를 바탕으로 복잡한 전처리 과정이 필요하다. 또한, 비선형적인 패턴의 강수 현상을 예측하기 위하여 기상의 상호작용에 대한 이해를 바탕으로 입력 데이터를 구성해야 한다. 따라서 본 연구에서는 다음과 같은 접근법을 제안하고자 한다. i) 기상레이더 합성 강수장과 강수발달에 영향을 줄 수 있는 주요 인자(레이더, 지형, 온도, 등)를 훈련 데이터 구축을 위해 패턴 분석에 적합한 형태로 정제하고 이를 구조화하여 통합한다. ii) 합성곱 신경망과 합성곱 장단기 기억 신경망을 접목하여 초단기 예측 강수장을 산출한다. 2020년 강수 사례를 이용하여 제안한 모델의 정확성을 검증하였다. 제안한 모델은 비선형적인 패턴의 강수 현상을 잘 모의하였고, 강수의 규모 및 강도에 대한 예측성능이 향상되었다. 이는 강수를 동반한 초단기 위험기상의 방재에 활용할 수 있을 것으로 기대된다.

  • PDF

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.