深度学习基础之正向传播与反向传播

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

文章目录

前言
正向传播
链式法则
反向传播
实例
- Sigmoid函数
- Softmax-with-Loss 层
参考

前言

因为这学期上了一门深度学习的课老师上课推公式写密密麻麻一黑板看也看不清讲完擦了之后说这推导如果考试必考人都傻了只能回过头来看她课件理解理解了。
以下都是以计算图为例。

正向传播

正向传播非常好理解就是一步一步算到最后。
在这里插入图片描述
这是一个基于计算图求解出最后结果的一个例子。
一步步从左向右计算最后得出结果这就是称为正向传播forward propagation。

使用计算图的好处局部计算。
计算图的特征是可以通过传递“局部计算”获得最终结果。“局部”这个词的意思是“与自己相关的某个小范围”。局部计算是指无论全局发生了什么都能只根据与自己相关的信息输出接下来的结果。

举个例子在这里插入图片描述假设经过复杂的计算购买的其他很多东西总共花费4000元。这里的重点是各个节点处的计算都是局部计算。这意味着例如苹果和其他很多东西的求和运算4000 + 200 → 4200并不关心4000这个数字是如何计算而来的只要把两个数字相加就可以了。换言之各个节点处只需进行与自己有关的计算在这个例子中是对输入的两个数字进行加法运算不用考虑全局。

综上计算图可以集中精力于局部计算。无论全局的计算有多么复杂各个步骤所要做的就是对象节点的局部计算。虽然局部计算非常简单但是通过传递它的计算结果可以获得全局的复杂计算的结果。

我感觉这和递归分治的思路是差不多的用小而简单的部分解得出最终复杂问题的解。

因为计算图拥有计算局部性的优点所以可以通过正向传播和反向传播高效地计算各个变量的导数值从而高效的完成计算。

链式法则

例如有这么一个函数
在这里插入图片描述

链式法则是关于复合函数的导数的性质定义如下
如果某个函数由复合函数表示则该复合函数的导数可以用构成复合函数的各个函数的导数的乘积表示。
在这里插入图片描述

其实就是高数中复合函数求偏导的方法。因此数学基础还是蛮重要的。

反向传播

计算图的反向传播backward propagation也就是BP算法计算的方式沿着与正方向相反的方向上游传来的导数乘上局部导数得出传给下游的导数。

这样通过链式法则就能够完成反向传播了。
例
在这里插入图片描述

如果看这个例子有点似懂非懂继续看完下面回过头来看应该就会很明了。

下面介绍一些节点的反向传播的方法

加法节点的反向传播

在这里插入图片描述
首先来考虑加法节点的反向传播。这里以z = x + y为对象观察它的反向传播。z = x + y的导数可由下式解析性地计算出来。

那么其反向传播就如下:

在这里插入图片描述
加法节点的反向传播将上游反向传播右边为上游的值原封不动地输出到下游

例子
在这里插入图片描述

乘法节点的反向传播

在这里插入图片描述
接下来我们看一下乘法节点的反向传播。这里我们考虑z = xy。这个
式子的导数用式5.6表示。

乘法的反向传播会将上游的值乘以正向传播时的输入信号的“翻转值”后传递给下游。翻转值表示一种翻转关系如下图正向传播时信号是x的话反向传播时则是y正向传播时信号是y的话反向传播时则是x。
在这里插入图片描述
例子

注意
因为乘法的反向传播会乘以输入信号的翻转值所以各自可按1.3 × 5 = 6.5、1.3 × 10 = 13计算。另外加法的反向传播只是将上游的值传给下游并不需要正向传播的输入信号。但是乘法的反向传播需要正向传播时的输入信号值。因此实现乘法节点的反向传播时要保存正向传播的输入信号。