【基础】BP神经网络的本质

作者 : 老饼发表日期 : 2022-06-13 02:57:45 更新日期 : 2024-04-18 14:45:39

本站原创文章，转载请说明来自《老饼讲解-BP神经网络》www.bbbdata.com

从仿生角度理解BP神经网络往往是抽象的、不可捉摸的

故本文尝试从曲线拟合角度去理解BP神经网络是如何工作的

并解读BP神经网络隐节点、参数的实际意义，使BP神经网络更加具体、形象

01. BP神经网络的本质

本节从曲线拟合角度理解BP神经网络的各个元素的意义

并从中了解BP神经网络的本质

BP神经网络的模型本质

BP神经网络的模型的意义
以常用的三层BP神经网络为例，它的数学表达式有如下形式

从表达式可以看到，网络的输出y其实就是由多个tansig线性组合而成
也就是说，我们使用BP神经网络的本质就是，
已知数据点，求n个tansig函数，使其叠加后能拟合任意数据点

BP神经网络-隐节点的意义

由上述可知，BP神经网络的每个隐节点都代表着一个tansig

我们设置多少个隐节点，就意味着我们打算用多少个tansig来逼近目标函数

BP神经网络-参数与训练的本质

参数的意义
而对于每个tansig而言

👉1. 内层的W控制了tansig曲线的宽
👉2. 外层的W控制了tansig曲线的高
👉3. b则控制了tansig的位置
而训练的过程，
就是调整各个tansig曲线(曲面/超曲面)的高矮肥瘦和位置，
使所有tansig叠加后越来越迫近y
最后用拟合曲线来预测新样本的y值

End