• 제목/요약/키워드: 뉴럴넷

검색결과 5건 처리시간 0.025초

모바일 환경 영상인식을 위한 신경망기반 Speeded Up Robust Features 차원 감소 (Dimensionality Reduction of Speeded Up Robust Features Using Neural Networks for Object Recognition in Mobile Environments)

  • 윤두밈;김경중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.421-424
    • /
    • 2011
  • 최근에 스마트폰이 발달하고 대부분의 모바일 기기에 카메라가 달리면서 카메라를 이용한 애플리케이션 또한 늘어나고 있는데 기존의 PC상에서 로고 인식등을 위해 사용되는 SURF를 이용한 이미지 매칭에는 유클리드 거리 계산을 사용하고 있다. 그러나 이 방법으로는 PC보다는 사양이 낮은 모바일 기기에 적용하기에는 기존에 사용하고 있는 방법이 인식할 이미지마다 모든 특징점을 비교하는 방법을 사용하기 때문에 연산량이 높은 편이다. 본 논문에서는 미리 인식할 이미지를 뉴럴넷에 학습시킨 뒤, 뉴럴넷을 필터링으로 사용하여 일부의 특징점만을 비교해 연산량을 줄여서 속도를 향상시키는 방법을 제안하였으며 이를 이용하여 대략 30%가량의 성능 향상이 나타난 것을 알 수 있었다.

렌더링 비교 뉴럴넷 기반 가구 조립 설명서 부품의 6D 자세 추정

  • 박재우;강이삭;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.100-105
    • /
    • 2021
  • 본 논문에서는 뉴럴넷 기반 렌더링 비교 방식을 사용하여 가구 조립 설명서에 표기된 부품의 자세를 추정하는 방법을 제안한다. 제안하는 방법은 부품의 자세를 임의로 가정한 후, 가정한 자세로 투사한 부품의 영상과 설명서의 부품 영상을 비교하여 두 영상의 부품을 일치시키는 자세 변화를 추정하는 방식으로 진행된다. 또한, 설명서에 반복적으로 모델을 적용하여 부품의 자세를 점차적으로 정확하게 보정하는 방식을 사용하였으며, 네트워크의 구성 및 자세 추정에 사용되는 목표 함수를 다양하게 실험하여 성능을 비교하였다. 본 연구에선 IKEA 의 Stefan 의자 조립 설명서의 부품 데이터셋으로 실험을 진행하였으며, 해당 데이터셋에 대하여 제안하는 방법이 정확하게 자세를 보정함을 확인하였다.

  • PDF

종단간 인공신경망 기반 이미지 압축 기술의 피쳐 공간 상관관계 분석 (Correlation Analysis of Feature Space Data in End-to-end Image Compression Network)

  • 이주영;정세윤;최진수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.151-154
    • /
    • 2020
  • 뉴럴넷 기술이 발전과 힘께 다양한 분야에서 획기적인 성능 향상이 이루어지고 있다. 이미지 압축 분야에서도 기존의 전통적인 툴 제인 구조의 압축 방식에서 벗어나 종단간(end-to-end) 뉴렬넷 기반의 이미지 압축 기술에 대한 연구가 활발히 이루어지고 있다. 특히 최근 네트워크를 통해 변환된 피쳐 데이터의 엔트로피를 최소화하는 방식에 대한 연구가 활발히 이루어지고 있으며, 이에 기반한 최근의 연구는 VVC 화면 내 코딩 기술보다 우수한 코딩 효율성을 제공하고 있다. 그러나 변환된 피쳐 데이터에 대한 특성 분석은 부족한 실정이며, 이에 본 논문에서는 엔트로피 최소화 기반 종단간 이미지 압축 네트워크의 피쳐 공간 데이터에 대한 공간적 (spatial) 상관관계와 채널간(inter-channel) 상관관계(correlation)를 분석하고, 나아가 최근 제안된 종단간 이미지 압축 네트워크의 문맥 기반 예측 기능을 통해 잔존하는 데이터 중복성이 효과적으로 제거됨을 보인다.

  • PDF

음질 및 속도 향상을 위한 선형 스펙트로그램 활용 Text-to-speech (Text-to-speech with linear spectrogram prediction for quality and speed improvement)

  • 윤혜빈
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.71-78
    • /
    • 2021
  • 인공신경망에 기반한 대부분의 음성 합성 모델은 고음질의 자연스러운 발화를 생성하기 위해 보코더 모델을 사용한다. 보코더 모델은 멜 스펙트로그램 예측 모델과 결합하여 멜 스펙트로그램을 음성으로 변환한다. 그러나 보코더 모델을 사용할 경우에는 많은 양의 컴퓨터 메모리와 훈련 시간이 필요하며, GPU가 제공되지 않는 실제 서비스 환경에서 음성 합성이 오래 걸린다는 단점이 있다. 기존의 선형 스펙트로그램 예측 모델에서는 보코더 모델을 사용하지 않으므로 이 문제가 발생하지 않지만, 대신에 고품질의 음성을 생성하지 못한다. 본 논문은 뉴럴넷 기반 보코더를 사용하지 않으면서도 양질의 음성을 생성하는 Tacotron 2 & Transformer 기반의 선형 스펙트로그램 예측 모델을 제시한다. 본 모델의 성능과 속도 측정 실험을 진행한 결과, 보코더 기반 모델에 비해 성능과 속도 면에서 조금 더 우세한 점을 보였으며, 따라서 고품질의 음성을 빠른 속도로 생성하는 음성 합성 모델 연구의 발판 역할을 할 것으로 기대한다.

R의 neuralnet을 활용한 신경망분석 (Neural network analysis using neuralnet in R)

  • 백재욱
    • 산업진흥연구
    • /
    • 제6권1호
    • /
    • pp.1-7
    • /
    • 2021
  • 본 연구는 다층 퍼셉트론과 지도형 학습알고리즘에 대해 알아보았고, 아울러 neuralnet이라는 패키지를 사용하여 공변수들과 반응변수 간의 함수적 관계를 어떻게 모델링하는지 살펴보았다. 본 연구에서 적용된 알고리즘은 반응변수 값의 실제치와 예측치 간의 비교에 근거한 오차함수의 최소화를 위한 모수인 가중치들의 계속적인 조정을 특징으로 한다. 본 연구에서 설명하는 neuralnet 패키지는 활성화함수와 오차함수를 주어진 상황에 맞게 적절히 선택하고 나머지 매개변수들은 기본값으로 둘 수 있다. 본 연구에서 살펴본 불임 데이터에 대해 neuralnet 패키지를 활용한 결과 4개의 독립변수 중에서 age는 불임에 영향력이 거의 없음을 파악할 수 있었다. 아울러 신경망의 가중치는 -751.6부터 7.25에 이르기까지 다양한 값을 취하며, 첫 번째 은닉층의 절편은 -92.6과 7.25이며, 첫 번째 은닉뉴런으로 가는 공변수 age, parity, induced, spontaneous에 대한 가중치는 각각 3.17, -5.20, -36.82, -751.6임을 파악했다.