Analysis of Weight Distribution of Feedforward Two-Layer Neural Networks and its Application to Weight Initialization

순방향 2층 신경망의 연결강도 분포 특성 분석 및 연결강도 초기화에 적용

  • Go, Jin-Wook (Dept. Electrical and Electronic Eng., Yonsei University) ;
  • Park, Mig-Non (Dept. Electrical and Electronic Eng., Yonsei University) ;
  • Hong, Dae-Sik (Dept. Electrical and Electronic Eng., Yonsei University) ;
  • Lee, Chul-Hee (Dept. Electrical and Electronic Eng., Yonsei University)
  • 고진욱 (연세대학교 전기.전자공학과) ;
  • 박민용 (연세대학교 전기.전자공학과) ;
  • 홍대식 (연세대학교 전기.전자공학과) ;
  • 이철희 (연세대학교 전기.전자공학과)
  • Published : 2001.05.25

Abstract

In this paper, we investigate and analyze weight distribution of feed forward two-layer neural networks with a hidden layer in order to understand and improve time-consuming training process of neural networks. Generally, when a new problem is presented, neural networks have to be trained again without any benefit from the previous training process. In order to address this problem, training process is viewed as finding a solution point in the weight space and the distribution of solution points is analyzed. Then we propose to initialize neural networks using the information of the distribution of the solution points. Experimental results show that the proposed initialization using the weight distribution provides a better performance than the conventional one.

본 논문에서는 순방향 2층 신경망의 연결강도(weight) 분포 특성을 분석한다. 일반적으로 신경망의 학습은 많은 시간이 소요되지만, 현재 학습 알고리즘으로는 새로운 문제가 주어질 때 이전에 수행된 학습 정보의 도움 없이 새로이 학습과정을 수행해야 하는 문제점이 있다. 본 논문에서는, 신경망의 학습을 주어진 문제를 해결할 수 있는 연결강도 공간(weight space)상의 한 점(point)을 찾는 과정으로 이해하고, 연결강도 공간에서 이러한 해(solution)가 되는 점들의 분포를 조사하여 이를 새로운 문제의 학습 시 초기 연결강도의 선정에 적용하는 방법을 제안한다, 제안된 연결강도 분포를 이용한 초기화 방법을 패턴분류 문제에 적용하였고, 기존의 무작위 초기화보다 학습 성능을 향상시킬 수 있음을 확인하였다.

Keywords

References

  1. J. N. Hwang, S. Y. Kung, M. Niranjan, and J. C. Principe, 'The Past, Present, and Future of Neural Networks for Signal Processing,' IEEE Signal Processing Magazine, vol. 14, no. 6, pp. 28-48, 1997 https://doi.org/10.1109/79.637299
  2. John A Richards, Remote Sensing Digital Image Analysis. New York: Springer-Verlag, 1993
  3. G. Mirchandani and W. Cao, 'On Hidden Nodes for Neural Nets,' IEEE Trans. Circuits and Systems, vol. 36, no. 5, May, 1989 https://doi.org/10.1109/31.31313
  4. J. Makhoul, A. El-Jaroudi, and R. Schwartz, 'Partitioning Capabilities Two-Layer Neural Networks,' IEEE Trans. Signal Processing, vol. 39, no. 6, June, 1991 https://doi.org/10.1109/78.136554
  5. G. J. Gibson and C. F. N. Cowan, 'On the Decision Regions of Multilayer Perceptrons,' Proceedings of the IEEE, vol. 78, no. 10, Oct, 1990 https://doi.org/10.1109/5.58343
  6. I. Bellido and E. Fiesler, 'Do Backpropagation Trained Neural Networks have Normal Weight Distributions?,' ICANN93, pp. 772-775, 1993
  7. L. L. Biel and et al., 'A Crops and Soils Data Base For Scene Radiation Research,' Proc. Machine Process. of Remotely Sensed Data Symp., West Lafayette, Indiana, 1982
  8. R. P. Lippmann, 'An introduction to computing with neural nets,' IEEE ASSP Magazine, vol. 1, no. 2, Apr. 1987