首页 / 深度学习 / deeplearning.ai 神经网络和深度学习 week3 听课笔记

deeplearning.ai 神经网络和深度学习 week3 听课笔记

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了deeplearning.ai 神经网络和深度学习 week3 听课笔记，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1282字，纯文字阅读大概需要2分钟。

内容图文

1. 第i层网络 Z^[i] = W^[i]A^[i-1] + B^[i]，A^[i] = f(Z^[i])。

其中， W^[i]形状是n^[i]*n^[i-1]，n^[i]是第i层神经元的数量；

A^[i-1]是第i-1层的神经元，形状是n^[i-1]*p，p是样本数量；

B^[i]形状是n^[i]*p，B^[i]的每一列都是一样的，所以其实有效的参数只是n^[i]个，python里直接用n^[i]*1的b^[i]然后boradcasting成n^[i]*p方便做加法。

A^[0]对应输入层，n^[0]是单个输入样本的特征数量。f()是激活函数。

2. 永远不要用sigmoid函数，唯一的例外是二元分类问题的输出层，因为这需要输出是0或1。

tanh(z) = (e^z-e^(-z))/(e^z+e^(-z)) 作为激活函数几乎总比sigmoid函数效果好，直观地说是因为tanh的中心店是0而不像sigmoid是0.5，于是对于下一层有中心化数据的作用。

tanh和sigmoid函数的共同缺点是当输入很大或者很小时，函数会饱和，梯度为0。

ReLU是现在的默认选择，f(z) = max(0, z)。ReLU的收敛速度比tanh和sigmoid都要快得多。Leaky ReLU ( max(0.01z, z) )的表现更好一点，但是不明显，所以还是ReLU用的更多。

3. 为什么激活函数是必须的？如果没有激活函数，系统就成了只对输入做线性运算，内部的隐含层一点用也没有，网络层数再多也没用，因为线性函数的组合也是线性函数。

4. sigmoid σ(z) = 1/(1+e^(-z))，σ‘(z) = σ(z)(1-σ(z)).

tanh g(z) = (e^z-e^(-z))/(e^z+e^(-z)) ，g‘(z) = 1-(g(z))^2.

ReLU g(z) = max(0, z)，g‘(z) = { 0 , if z<0;

{ 1, if z>0;

{ undefined, if z = 0. 实际使用中可以把这个点的导数设为0或者1，都无所谓。

5. 训练神经网络时，随机初始化权重W非常重要，全部设为0的话会使得梯度下降法无效，b可以初始化为0。

w[i] = np.random.randn((n^[i]，n^[i-1]))*0.01. 乘以0.01是为了把它初始化成很小的随机数，因为对于tanh、sigmoid类似的函数，权重太大容易饱和。如果不用tanh、sigmoid，用ReLU，那么问题不大，但如果最终是个二分类问题，最后一个输出还是用了sigmoid，那么还会遇到这个问题。所以干脆全部初始化成很小的随机数吧。对于浅层神经网络，一般这种初始化方法就ok了。但对于很深的神经网络，有时候要挑选0.01以外的常数。

b[i] = np.zero((n^[i], 1))。

原文：http://www.cnblogs.com/zonghaochen/p/7722136.html

内容总结

以上是互联网集市为您收集整理的deeplearning.ai 神经网络和深度学习 week3 听课笔记全部内容，希望文章能够帮你解决deeplearning.ai 神经网络和深度学习 week3 听课笔记所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1250769.html

来源：【匿名】

【下一篇】关于Nginx的深度学习内容

更多 ►

【deeplearning.ai 神经网络和深度学习 week3 听课笔记】教程文章相关的互联网学习教程文章

deeplearning.ai 神经网络和深度学习 week3 听课笔记

1. 第i层网络 Z[i] = W[i]A[i-1] + B[i]，A[i] = f(Z[i])。其中， W[i]形状是n[i]*n[i-1]，n[i]是第i层神经元的数量； A[i-1]是第i-1层的神经元，形状是n[i-1]*p，p是样本数量； B[i]形状是n[i]*p，B[i]的每一列都是一样的，所以其实有效的参数只是n[i]个，python里直接用n[i]*1的b[i]然后boradcasting成n[i]*p方便做加法。 A[0]对应输入层，n[0]是单个输入样本的特征数量。f()是...

深度学习之五：使用GPU加速神经网络的训练

使用神经网络训练，一个最大的问题就是训练速度的问题，特别是对于深度学习而言，过多的参数会消耗很多的时间，在神经网络训练过程中，运算最多的是关于矩阵的运算，这个时候就正好用到了GPU，GPU本来是用来处理图形的，但是因为其处理矩阵计算的高效性就运用到了深度学习之中。Theano支持GPU编程，但是只是对英伟达的显卡支持，而且对于Python编程而言，修改一些代码就可以使用GPU来实现加速了。一，首先需要安装GPU环境（说明：我...

吴恩达《深度学习》第一门课（4）深层神经网络【图】

4.1深层神经网络（1）到底是深层还是浅层是一个相对的概念，不必太纠结，以下是一个四层的深度神经网络：（2）一些符号定义：a[0]=x（输入层也叫做第0层）L=4：表示网络的层数g:表示激活函数第l层输出用a[l]，最终的输出用a[L]表示n[1]=5:表示第一层有五个神经元，第l层神经元个数用n[l]表示4.2前向传播和反向传播（1）前向传播：输入a[l-1],输出是a[l],缓存为z[l]，步骤如下：（下面第一个式子应该是a[l-1]）向量化：（2）反向传播...

深度学习笔记（六）卷积神经网络【图】

1.通常神经认知机包含两类神经元，即承担特征抽取的S-元和抗变形的C-元。S-元中涉及两个重要参数，即感受野与阈值参数，前者确定输入连接的数目，后者则控制对特征子模式的反应程度。在传统的神经认知机中，每个S-元的感光区中由C-元带来的视觉模糊量呈正态分布，也就是说如果眼睛感受到物体是移动的，即已感受到模糊和残影，S-感光区会调整识别模式，这时它不会完整地提取所有的特征给大脑而是只获取一部分关键特征，屏蔽其他的视...

深度学习_1_神经网络_1【代码】【图】

神经网络感知机解决分类问题http://playground.tensorflow.org神经网络定义:? 在机器学习领域和认知科学领域,人工神经网络(artificial neural network) 简称ann或类神经网络,一种放生物神经网络的结构和功能的计算模型,用于对函数进行估计或近似.种类:? 基础神经网络:单层感受器,线性神经网络,BP神经网络,Hopfield神经网络? 进阶神经网络:玻尔兹曼机,受限玻尔兹曼机,递归神经网络? 深度神经网络:深度置信网络,卷积神将网络,循环神...

吴恩达深度学习课程第一课 — 神经网络与深度学习 — 第四周练习【代码】【图】

第四周 - 深度神经网络的核心概念第 31 题在我们的前向传播和后向传播实现中使用的“缓存”是什么？A.它用于在训练期间缓存成本函数的中间值。B.我们用它将在正向传播过程中计算的变量传递到相应的反向传播步骤。它包含了反向传播计算导数的有用值。C.它用于跟踪我们正在搜索的超参数，以加快计算速度。D.我们用它将反向传播过程中计算的变量传递到相应的正向传播步骤。它包含用于计算正向传播的激活的有用值。第 32 题以下哪些是“...

MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（三）【代码】【图】

版权声明：本文为博主原创文章，欢迎转载，并请注明出处。联系方式：460356155@qq.com在前两篇文章MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（一）、MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（二）中，采用全连接神经网络（784-300-10），分别用非深度学习框架和基于pytorch实现，训练结果相当。这里采用卷积神经网络（CNN）中著名的LeNet-5网络来训...

深度学习笔记（一）卷积神经网络(Convolutional Neural Networks)【图】

一、卷积卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络。使用数层卷积，而不是数层的矩阵相乘。在图像的处理过程中，每一张图片都可以看成一张“薄饼”，其中包括了图片的高度、宽度和深度（即颜色，用RGB表示）。在不改变权重的情况下，把这个上方具有k个输出的小神经网络对应的小块滑遍整个图像，可以得到一个宽度、高度不同，而且深度也不同的新图像。卷积时有很多种填充图像的方法，以下主要介...

神经网络与深度学习笔记（四）：向量化以提高计算速度【代码】

我们在计算模型w的转置乘上x的时候，往往需要把w和x分别进行向量化然后运算，因为这样会使我们的计算机得到结果的时间更快，而且这种方法不管是在CPU还是在GPU上都是成立的，首先我们来看看代码：import numpy as np import time a=np.random.rand(1000000) b=np.random.rand(1000000) toc=time.time() c=np.dot(a,b) tic=time.time() print("向量化之后计算的时间为："+str(1000*(tic-toc))+"ms") c=0 tic=time.time() for i in r...

deeplearning.ai 神经网络和深度学习 week4 听课笔记

1. 计算深度神经网络的时候，尽量向量化数据，不要用for循环。唯一用for循环的地方是依次在每一层做计算。 2. 最常用的检查代码是否有错的方法是检查算法中矩阵的维度。正向传播：对于单个样本，第i层网络 z[i] = W[i]a[i-1] + b[i]， a[i] = f[i](z[i])。其中，z[i]是n[i]*1，W[i]是n[i]*n[i-1]，a[i-1]是n[i-1]*1，b[i]是n[i]*1。对于向量化后的所有样本，第i层网...

深度学习-卷积神经网络的发-笔记【图】

CNN的开山之作是LeCun提出的LeNet-5，而其真正的爆发阶段是2012年AlexNet取得ImageNet比赛的分类任务的冠军，并且分类准确率远远超过利用传统方法实现的分类结果，AlexNet之后，深度学习便一发不可收拾，分类准确率每年都被刷榜，下图展示了模型的变化情况，随着模型的变深，Top-5的错误率也越来越低，目前已经降低到了3.5%左右，同样的ImageNet数据集，人眼的辨识错误率大概为5.1%，也就是深度学习的识别能力已经超过了人类。LeNe...

深度学习原理与框架-神经网络-cifar10分类(代码)【代码】

cifar神经网络的代码说明：数据主要分为三部分：第一部分：数据的准备第二部分：神经网络模型的构造，返回loss和梯度值第三部分：将数据与模型输入到函数中，用于进行模型的训练，同时进行验证集的预测，来判断验证集的预测结果，保留最好的验证集结果的参数组合第一部分：数据的准备第一步：构造列表，使用with open() as f: pickle.load进行数据的载入, 使用.reshape(1000, 3, 32, 32).transpose(0, 3, 1, 2)...

深度学习入门 01----- 神经网络，反向传播算法---轻易理解【图】

机器学习AI算法工程公众号： datayx 深度学习学习7步骤 1．学习或者回忆一些数学知识因为计算机能做的就只是计算，所以人工智能更多地来说还是数学问题[1]。我们的目标是训练出一个模型，用这个模型去进行一系列的预测。于是，我们将训练过程涉及的过程抽象成数学函数：首先，需要定义一个网络结构，相当于定义一种线性非线性函数；接着，设定一个优化目标，也就是定义一种损失函数（loss function）。而训练的过程，就是求解最...

这套人工智能算法书已经出版了3卷，其中卷3深度学习和神经网络最受程序员喜欢【图】

人工智能算法系列图书以一种数学上易于理解的方式讲授人工智能相关概念，这也是本系列图书英文书名中“for Human”的含义。本系列图书的每一卷均可独立阅读，也可作为系列图书整体阅读。但需要注意的是，卷1中列出了后续各卷所使用的各种基本算法，并且这些算法本身既是基础，也不失实用性。 2020年1月，人工智能算法系列图书第一卷出版。欲建高楼，必重基础。本书会讲授诸如维度法、距离度量算法、聚类算法、误差计算、爬山算...

Python深度学习笔记07--使用Keras建立卷积神经网络【代码】

1 from keras.datasets import mnist2 from keras.utils import to_categorical3 4 #1. 获取数据5 (train_images, train_labels), (test_images, test_labels) = mnist.load_data()6 7 #2. 处理数据8 train_images = train_images.reshape((60000, 28, 28, 1))9 train_images = train_images.astype(float32) / 255 10 11 test_images = test_images.reshape((10000, 28, 28, 1)) 12 test_images = test_images.astype(float32) /...

深度学习 - 最热教程

【深度学习】③--神经网络细节与训练注...Ubuntu16安装深度学习环境流程基于tensorflow2.x版本python代码实现深...深度学习笔记（三）—— 反向传播[Back...在NLP中深度学习模型何时需要树形结构？Windows系统基于tensorflow+keras+cuda...深度学习原理与框架-神经网络-cifar10分...使用RTX3080显卡搭建基于Pycharm+Pytho...Java 深度学习实践 DJL中文系列课程深度学习模型里super函数的作用和def _...

首页 / 深度学习 / deeplearning.ai 神经网络和深度学习 week3 听课笔记

deeplearning.ai 神经网络和深度学习 week3 听课笔记

内容导读

内容图文

内容总结

内容备注

内容手机端

【deeplearning.ai 神经网络和深度学习 week3 听课笔记】教程文章相关的互联网学习教程文章

深度学习 - 最新教程

深度学习 - 最热教程