• Title/Summary/Keyword: 뉴럴넷

Search Result 5, Processing Time 0.021 seconds

Dimensionality Reduction of Speeded Up Robust Features Using Neural Networks for Object Recognition in Mobile Environments (모바일 환경 영상인식을 위한 신경망기반 Speeded Up Robust Features 차원 감소)

  • Yoon, Du-Mim;Kim, Kyung-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.421-424
    • /
    • 2011
  • 최근에 스마트폰이 발달하고 대부분의 모바일 기기에 카메라가 달리면서 카메라를 이용한 애플리케이션 또한 늘어나고 있는데 기존의 PC상에서 로고 인식등을 위해 사용되는 SURF를 이용한 이미지 매칭에는 유클리드 거리 계산을 사용하고 있다. 그러나 이 방법으로는 PC보다는 사양이 낮은 모바일 기기에 적용하기에는 기존에 사용하고 있는 방법이 인식할 이미지마다 모든 특징점을 비교하는 방법을 사용하기 때문에 연산량이 높은 편이다. 본 논문에서는 미리 인식할 이미지를 뉴럴넷에 학습시킨 뒤, 뉴럴넷을 필터링으로 사용하여 일부의 특징점만을 비교해 연산량을 줄여서 속도를 향상시키는 방법을 제안하였으며 이를 이용하여 대략 30%가량의 성능 향상이 나타난 것을 알 수 있었다.

렌더링 비교 뉴럴넷 기반 가구 조립 설명서 부품의 6D 자세 추정

  • Park, Jaewoo;Kang, Isaac;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.100-105
    • /
    • 2021
  • 본 논문에서는 뉴럴넷 기반 렌더링 비교 방식을 사용하여 가구 조립 설명서에 표기된 부품의 자세를 추정하는 방법을 제안한다. 제안하는 방법은 부품의 자세를 임의로 가정한 후, 가정한 자세로 투사한 부품의 영상과 설명서의 부품 영상을 비교하여 두 영상의 부품을 일치시키는 자세 변화를 추정하는 방식으로 진행된다. 또한, 설명서에 반복적으로 모델을 적용하여 부품의 자세를 점차적으로 정확하게 보정하는 방식을 사용하였으며, 네트워크의 구성 및 자세 추정에 사용되는 목표 함수를 다양하게 실험하여 성능을 비교하였다. 본 연구에선 IKEA 의 Stefan 의자 조립 설명서의 부품 데이터셋으로 실험을 진행하였으며, 해당 데이터셋에 대하여 제안하는 방법이 정확하게 자세를 보정함을 확인하였다.

  • PDF

Correlation Analysis of Feature Space Data in End-to-end Image Compression Network (종단간 인공신경망 기반 이미지 압축 기술의 피쳐 공간 상관관계 분석)

  • Lee, Jooyoung;Jeong, Se-Yoon;Choi, Jin Soo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.151-154
    • /
    • 2020
  • 뉴럴넷 기술이 발전과 힘께 다양한 분야에서 획기적인 성능 향상이 이루어지고 있다. 이미지 압축 분야에서도 기존의 전통적인 툴 제인 구조의 압축 방식에서 벗어나 종단간(end-to-end) 뉴렬넷 기반의 이미지 압축 기술에 대한 연구가 활발히 이루어지고 있다. 특히 최근 네트워크를 통해 변환된 피쳐 데이터의 엔트로피를 최소화하는 방식에 대한 연구가 활발히 이루어지고 있으며, 이에 기반한 최근의 연구는 VVC 화면 내 코딩 기술보다 우수한 코딩 효율성을 제공하고 있다. 그러나 변환된 피쳐 데이터에 대한 특성 분석은 부족한 실정이며, 이에 본 논문에서는 엔트로피 최소화 기반 종단간 이미지 압축 네트워크의 피쳐 공간 데이터에 대한 공간적 (spatial) 상관관계와 채널간(inter-channel) 상관관계(correlation)를 분석하고, 나아가 최근 제안된 종단간 이미지 압축 네트워크의 문맥 기반 예측 기능을 통해 잔존하는 데이터 중복성이 효과적으로 제거됨을 보인다.

  • PDF

Text-to-speech with linear spectrogram prediction for quality and speed improvement (음질 및 속도 향상을 위한 선형 스펙트로그램 활용 Text-to-speech)

  • Yoon, Hyebin
    • Phonetics and Speech Sciences
    • /
    • v.13 no.3
    • /
    • pp.71-78
    • /
    • 2021
  • Most neural-network-based speech synthesis models utilize neural vocoders to convert mel-scaled spectrograms into high-quality, human-like voices. However, neural vocoders combined with mel-scaled spectrogram prediction models demand considerable computer memory and time during the training phase and are subject to slow inference speeds in an environment where GPU is not used. This problem does not arise in linear spectrogram prediction models, as they do not use neural vocoders, but these models suffer from low voice quality. As a solution, this paper proposes a Tacotron 2 and Transformer-based linear spectrogram prediction model that produces high-quality speech and does not use neural vocoders. Experiments suggest that this model can serve as the foundation of a high-quality text-to-speech model with fast inference speed.

Neural network analysis using neuralnet in R (R의 neuralnet을 활용한 신경망분석)

  • Baik, Jaiwook
    • Industry Promotion Research
    • /
    • v.6 no.1
    • /
    • pp.1-7
    • /
    • 2021
  • We investigated multi-layer perceptrons and supervised learning algorithms, and also examined how to model functional relationships between covariates and response variables using a package called neuralnet. The algorithm applied in this paper is characterized by continuous adjustment of the weights, which are parameters to minimize the error function based on the comparison between the actual and predicted values of the response variable. In the neuralnet package, the activation and error functions can be appropriately selected according to the given situation, and the remaining parameters can be set as default values. As a result of using the neuralnet package for the infertility data, we found that age has little influence on infertility among the four independent variables. In addition, the weight of the neural network takes various values from -751.6 to 7.25, and the intercepts of the first hidden layer are -92.6 and 7.25, and the weights for the covariates age, parity, induced, and spontaneous to the first hidden neuron are identified as 3.17, -5.20, -36.82, and -751.6.