首页 / 神经网络 / python神经网络编程

python神经网络编程

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python神经网络编程，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含7937字，纯文字阅读大概需要12分钟。

内容图文

神经网络如何工作

思路

多层神经网络，每一层中的神经元都与前后层的神经元互相连接，不采用创造性的方式将神经元连接起来，原因有两点：

第一是这种一致的完全连接方式事实上可以相对容易地编码成计算机指令；
第二是神经网络的学习过程将会弱化这些实际上不需要的连接（也就是这些连接的权重将趋于0），因此对于解决特定任务所需最小数量的连接冗余几个连接，也无伤大雅。

方法

使用矩阵乘法来进行神经网络的计算：

通过神经网络向前馈送信号所需的大量运算可以表示为矩阵乘法；
不管神经网络的规模如何，将输入输出表达为矩阵乘法，使得我们可以更简洁的进行书写；
更重要的是，一些计算机编程语言理解矩阵运算，并认识潜在的计算方法的相似性。并允许计算机高速高效地进行这些计算。

计算过程

以3层神经网络为例：
$输入层到隐藏层： X_{hidden} = W_{input-hidden} . I$ 输入层到隐藏层：Xhidden?=Winput?hidden?.I
$隐藏层输出矩阵： O_{hidden} =sigmoid(X_{hidden})$ 隐藏层输出矩阵：Ohidden?=sigmoid(Xhidden?)
$输出层的组合调节输入信号： X_{output} = W_{hidden-output} . O_{hidden}$ 输出层的组合调节输入信号：Xoutput?=Whidden?output?.Ohidden?
$输出信号： O_{output} = sigmoid(X_{output})$ 输出信号：Ooutput?=sigmoid(Xoutput?)

下一步，将神经网络的输出值与训练样本中的输出值进行比较，计算出误差。我们需要利用这个误差值来调整神经网络本身，进而改进神经网络的输出值。

多个输出节点反向传播误差

将输出误差标记为 $e_{output}$ eoutput?，将在输出层和隐藏层之间的链接权重标记为 $w_{ho}$ who?。通过将误差值按权重的比利进行分割，我们计算出与每条链接相关的特定误差值。将与隐藏层节点相关联的这些误差标记为 $e_{hidden}$ ehidden?，再次将这些误差按照输入层和隐藏层之间的链接权重 $w_{ih}$ wih?进行分割。
但是，对于隐藏层的节点，我们没有目标值或希望的输出值。我们只有最终输出层节点的目标值，这个目标值来自于训练样本数据。
实际上，我们可以重组这两个链接的误差，形成这个节点的误差(可以理解为过程中误差)，如下图所示：

$e_{hidden,1}$ ehidden,1? = 链接 $w_{1,1}$ w1,1?和链接 $w_{1,2}$ w1,2?上的分割误差之和
= $e_{output,1} * \frac{w_{1,1}}{w_{1,1} + w_{2,1}}$ eoutput,1??w1,1?+w2,1?w1,1?? + $e_{output,2} * \frac{w_{1,2}}{w_{1,2} + w_{2,2}}$ eoutput,2??w1,2?+w2,2?w1,2??
可以按照此方法继续向后传播误差，得到输入层的误差
对于计算机语言而言，即可用矩阵的方法来计算：
$error_{hidden} = W^T_{{hidden-output}} . error_{output}$ errorhidden?=Whidden?outputT?.erroroutput?

如何更新权重

到目前为止，我们已经理解了让误差反向传播到网络到每一层。接下来就是如何使用误差来指导如何调整链接权重，从而改进网络输出的总体结果。
思考一下：假如有一个3层、每层3个神经元的神经网络，如何调整输入层第一个节点和隐藏层第二个节点之间链路的权重，以使得输出层第三个节点的输出增加到0.5呢？即使我们碰运气做到了这一点，这个效果也会由于需要调整另一个权重来改进不同的输出节点而被破坏。
神经网络的误差函数取决于许多的权重参数，这些参数通常有数百个！

最优化权重参数的方法：梯度下降

梯度下降法是求解函数最小值的一种很好的方法，当函数非常复杂困难，并且不能轻易使用数学代数求解函数时，这中方法可以发挥很好的作用；
更重要的是，当函数有很多参数，一些其他方法不切实际，或者会得出错误答案，这种方法依然可以适用；
这种方法也具有弹性，可以容忍不完善的数据，如果我们不能完美的描述函数，或我们偶尔意外走错一步，也不会错的离谱。

选择差的平方，即 $(目标值-实际值)^2$ (目标值?实际值)2，即 $(t_k-o_k)^2$ (tk??ok?)2，不选择绝对值误差的原因：

使用误差的平方，我们可以很容易使用代数计算出梯度下降的斜率；
误差函数连续平滑，这使得梯度下降法很好的发挥作用——没有间断，也没有突然的跳跃；
越接近最小值，梯度越小，这意味着，如果我们使用这个函数调节步长，超调的风险就会变得较小。

用图形来演示：
python神经网络编程 - 文章图片
当函数具有多个参数时，要画出误差曲面相对较难，但是使用梯度下降寻找最小值的思想是相同的。让我们使用数学的方式写下想要取得的目标：
$\frac{\partial E}{\partial w_{j,k}}$ ?wj,k??E?
首先，展开误差函数，这是对目标值和实际值之差对平方进行求和，这是针对所有n个输出节点对和。
$\frac{\partial E}{\partial w_{j,k}} = \frac{\partial}{\partial w_{j,k}} \sum_{n}(t_n-o_n)^2$ ?wj,k??E?=?wj,k???n∑?(tn??on?)2
注意，在节点k的输出 $o_k$ ok?只取决于连接到这个节点的链接 $w_{j,k}$ wj,k?，而不依赖于权重 $w_{j,b}$ wj,b?，其中，b和k之间没有链接，因此b于k无关联。权重 $w_{j,b}$ wj,b?是连接输出节点b的链接权重，而不是输出节点k的链接权重。这意味着，除了权重 $w_{j,k}$ wj,k?所链接的节点（也就是 $o_k$ ok?）外，我们可以从和中删除所有的 $o_n$ on?，即：
$\frac{\partial E}{\partial w_{j,k}} = \frac{\partial}{\partial w_{j,k}} (t_k-o_k)^2$ ?wj,k??E?=?wj,k???(tk??ok?)2
目标值 $t_k$ tk?是一个常数，上面表达式可表示为：( $o_j$ oj?是隐藏层节点的输出)
$\frac{\partial E}{\partial w_{j,k}} = \frac{\partial E}{\partial o_k} . \frac{\partial o_k}{\partial w_{j,k}}=-2(t_k-o_k).\frac{\partial o_k}{\partial w_{j,k}}=-2(t_k-o_k).\frac{\partial}{\partial w_{j,k}}sigmoid(\sum_jw_{j,k}.o_j)$ ?wj,k??E?=?ok??E?.?wj,k??ok??=?2(tk??ok?).?wj,k??ok??=?2(tk??ok?).?wj,k???sigmoid(j∑?wj,k?.oj?)
根据微分的知识：
$\frac{\partial}{\partial x}sinmoid(x) = sigmoid(x)(1-sigmoid(x))$ ?x??sinmoid(x)=sigmoid(x)(1?sigmoid(x))
则：
$\frac{\partial E}{\partial w_{j,k}} =-2(t_k-o_k).sigmoid(\sum_jw_{j,k}.o_j)(1-sigmoid(\sum_jw_{j,k}.o_j)).\frac{\partial}{\partial w_{j,k}}(\sum_jw_{j,k}.o_j)$ ?wj,k??E?=?2(tk??ok?).sigmoid(j∑?wj,k?.oj?)(1?sigmoid(j∑?wj,k?.oj?)).?wj,k???(j∑?wj,k?.oj?)
$=-2(t_k-o_k).sigmoid(\sum_jw_{j,k}.o_j)(1-sigmoid(\sum_jw_{j,k}.o_j)).o_j$ =?2(tk??ok?).sigmoid(j∑?wj,k?.oj?)(1?sigmoid(j∑?wj,k?.oj?)).oj?
这个表达式描述了误差函数的斜率，正负表示斜率的方向。我们只关心斜率的方向，可以把2去掉。式子第一部分，是（目标值-实际值）可用 $e_j$ ej?来表示；中间部分，sigmoid中的求和表达式就是进入最后一层节点的信号，可称之为 $i_k$ ik?，这是应用激活函数之前，进入节点的信号；最后一部分是是前一隐藏层节点j的输出。

现在，我们可以使用这个表达式，在应用每层训练样本后，更新权重。注意权重的改变方向与梯度的方向相反：
$new\ w_{j,k} = old\ w_{j,k} - \alpha \frac{\partial E}{\partial w_{j,k}}$ new wj,k?=old wj,k??α?wj,k??E?
注：如果斜率为正，我们希望减小权重，如果斜率为负，我们希望增加权重，因此，要对斜率取反。符号 $\alpha$ α是一个因子，称为学习率。
这个表达式不仅适用于隐藏层和输出层之间的权重，而且适用于输入层和隐藏层之间的权重。差值就是误差梯度，我们可以使用上述两个表达式来计算误差梯度。

$\begin{pmatrix} \triangle w_{1,1}\ \triangle w_{2,1}\ \triangle w_{3,1} \ ... \\ \triangle w_{1,2}\ \triangle w_{2,2}\ \triangle w_{3,2} \ ...\\ \triangle w_{1,3}\ \triangle w_{2,3}\ \triangle w_{j,k}\ ... \\ ...\quad \ ...\ \quad ...\ \ \quad ...\ \quad \\ \end{pmatrix} = \begin{pmatrix} E_1*S_1(1-S_1)\\ E_2*S_2(1-S_2)\\ E_k*S_k(1-S_k)\\ ...\\ \end{pmatrix}. \begin{pmatrix} o_1\ o_2\ o_j\ ...\\ \end{pmatrix}$ ?????△w1,1? △w2,1? △w3,1? ...△w1,2? △w2,2? △w3,2? ...△w1,3? △w2,3? △wj,k? ...... ... ... ... ??????=?????E1??S1?(1?S1?)E2??S2?(1?S2?)Ek??Sk?(1?Sk?)...??????.(o1? o2? oj? ...?)
上式右边：下一层的值.前一层的值
由于学习率只是一个常数，并没有真正改变如何组织矩阵乘法，因此我们省略了 $\alpha$ α。权重改变矩阵中包含的值，这些值可以调整链接权重 $w_{j,k}$ wj,k?，这个权重链接了当前层节点j与下一层节点k。表达式中的第一项使用下一层节点k的值，最后一项使用前一层节点j的值。仔细观察最后一项是单行的水平矩阵，是前一层 $o_j$ oj?的输出的转置。因此，权重更新矩阵有如下的矩阵形式，可以用计算机语言进行计算：
$\triangle w_{j,k} = \alpha .E_k.O_k(1-O_k).O_j^T$ △wj,k?=α.Ek?.Ok?(1?Ok?).OjT?
由于我们简化了节点输出 $o_k$ ok?，那些sigmoid已经消失了。

python实现

待更新

内容总结

以上是互联网集市为您收集整理的python神经网络编程全部内容，希望文章能够帮你解决python神经网络编程所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/842918.html

来源：【匿名】

【上一篇】神经网络基础-梯度下降和BP算法【下一篇】怎样用Python实现两层神经网络和感知器模型

更多 ►

【python神经网络编程】教程文章相关的互联网学习教程文章

《吴恩达深度学习》学习笔记002_神经网络的编程基础(Basics of Neural Network programming)【图】

http://www.ai-start.com/dl2017/html/lesson1-week2.html神经网络的编程基础(Basics of Neural Network programming) 二分类(Binary Classification) 我们来看看一张图片在计算机中是如何表示的，为了保存一张图片，需要保存三个矩阵，它们分别对应图片中的红、绿、蓝三种颜色通道，如果你的图片大小为64x64像素，那么你就有三个规模为64x64的矩阵，分别对应图片中红、绿、蓝三种像素的强度值。为了便于表示，这里我画了三个很小的...

Python神经网络编程笔记【图】

神经元想一想便知道，当一个人捏你一下以至于你会痛得叫起来的力度便是神经元的阈值，而我们构建的时候也是把这种现象抽象成一个函数，叫作激活函数。而这里便是我们使用sigmoid函数的原因，它是一个很简单的函数，平滑更接近显示。 ? \[y=\frac{1}{1+e^{-x}}\]神经网络传递信号神经网络便是通过一个一个神经元连接，使用权值x输入的和在通过sigmoid函数得到最终的输出值，然后一层一层的传递下去。 \[O = sigmoid(W\cdot I)\] ...

神经网络的编程基础(Basics of Neural Network programming)【图】

一、二分类(Binary Classification) 在神经网络中，如何处理训练集。在这里将使用逻辑回归(logistic regression)来传达这些想法，以使大家能够更加容易地理解这些概念。即使你之前了解过逻辑回归，我认为这里还是有些新的、有趣的东西等着你去发现和了解，所以现在开始进入正题。逻辑回归是一个用于二分类(binary classification)的算法。首先我们从一个问题开始说起，这里有一个二分类问题的例子，假如你有一张图片作为输入，比...

[Deep Learning] 神经网络编程基础 (Basics of Neural Network Programming)【图】

在神经网络中，假如有m个训练集，我们想把他们加入训练，第一个想到得就是用一个for循环来遍历训练集，从而开始训练。但是在神经网络中，我们换一个计算方法，这就是前向传播和反向传播。对于逻辑回归，就是找出合适得参数w和b，在二分类中，输出得结果是0或者1，所以我们得假设函数得输出应该在0，1之间。那么线性肯定是不合适的。我们称输出结果在0，1之间的函数为 S 函数（sigmoid 函数）。那么逻辑回归的代价函数又是什么呢？...

每周一书《Python神经网络编程》分享【图】

内容简介神经网络是一种模拟人脑的神经网络，以期能够实现类人工智能的机器学习技术。本书揭示神经网络背后的概念，并介绍如何通过Python实现神经网络。全书分为3章和两个附录。第1章介绍了神经网络中所用到的数学思想。第2章介绍使用Python实现神经网络，识别手写数字，并测试神经网络的性能。第3章带领读者进一步了解简单的神经网络，观察已受训练的神经网络内部，尝试进一步改善神经网络的性能，并加深对相关知识的理解。附录...

Tariq Rashid+《Python神经网络编程》中文PDF英文PDF源代码+Make Your Own Neural Network【图】

《Python神经网络编程》揭示神经网络背后的概念，并介绍如何通过Python实现神经网络。下载：https://pan.baidu.com/s/1UTwTGYnxWquxjMueIcaNwQ《Python神经网络编程》中文版PDF+英文版PDF+源代码中文版，255页，带目录和书签，彩色配图，文字可以复制；英文版，207页，带目录和书签，彩色配图，文字可以复制；两版对比学习。配套源代码。作者: [英]塔里克拉希德（Tariq Rashid）原作名: Make Your Own Neural Network译者: ...

神经网络 - 相关标签

神经网络模型神经网络算法神经网络与深度学习

神经网络 - 最热教程

【深度学习】③--神经网络细节与训练注...Python实现BP神经网络实现对公路客运量深度学习原理与框架-神经网络-cifar10分...《转》循环神经网络(RNN, Recurrent Ne...神经网络中反向传播算法（BP）利用自编码神经网络，检测未标记数据集...数据挖掘——回归分析2——简单神经网络...机器学习算法之神经网络神经网络算法开发总结--网络结构开发卷积神经网络的详解

首页 / 神经网络 / python神经网络编程

python神经网络编程

内容导读

内容图文

目录

神经网络如何工作

思路

方法

计算过程

多个输出节点反向传播误差

如何更新权重

python实现

内容总结

内容备注

内容手机端

【python神经网络编程】教程文章相关的互联网学习教程文章

《吴恩达深度学习》学习笔记002_神经网络的编程基础(Basics of Neural Network programming)【图】

Python神经网络编程笔记【图】

神经网络的编程基础(Basics of Neural Network programming)【图】

[Deep Learning] 神经网络编程基础 (Basics of Neural Network Programming)【图】

每周一书《Python神经网络编程》分享【图】

Tariq Rashid+《Python神经网络编程》中文PDF英文PDF源代码+Make Your Own Neural Network【图】

python神经网络编程【图】

分享《Python神经网络编程》中文版PDF+英文版PDF+源代码【图】

分享《Python神经网络编程》中文版PDF+英文版PDF+源代码【图】

PYTHON - 相关标签

神经网络 - 相关标签

编程 - 相关标签

神经网络 - 最新教程

神经网络 - 最热教程