首页 / 深度学习 / python – 深度学习南失的原因

python – 深度学习南失的原因

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 深度学习南失的原因，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1520字，纯文字阅读大概需要3分钟。

内容图文

也许是一般性的问题,但任何人都可以解释什么会导致卷积神经网络发散？

具体细节：

我正在使用Tensorflow的iris_training模型和我自己的一些数据并继续获取

ERROR:tensorflow:Model diverged with loss = NaN.

Traceback…

tensorflow.contrib.learn.python.learn.monitors.NanLossDuringTrainingError: NaN loss during training.

回溯源于线：

 tf.contrib.learn.DNNClassifier(feature_columns=feature_columns,
                                        hidden_units=[300, 300, 300],
                                        #optimizer=tf.train.ProximalAdagradOptimizer(learning_rate=0.001, l1_regularization_strength=0.00001),                                                          
                                        n_classes=11,
                                        model_dir="/tmp/iris_model")

我已经尝试调整优化器,使用零学习率,并且不使用优化器.任何有关网络层,数据大小等的见解都是值得赞赏的.

解决方法:

我看到很多东西使模型分歧.

>学习率太高.如果损失开始增加然后发散到无穷大,您通常可以判断是否是这种情况.
>我不熟悉DNNClassifier,但我猜它使用了分类交叉熵成本函数.这涉及在预测接近零时取得预测的对数.这就是为什么人们通常会在预测中添加一个小的epsilon值来防止这种分歧.我猜测DNNClassifier可能会这样做或使用tensorflow opp.可能不是问题.
>其他数值稳定性问题可能存在,例如除以零,其中添加epsilon可以提供帮助.另一个不那么明显的一个,如果在处理有限精度数时,如果没有正确简化,那么导数的平方根可以发散.我再次怀疑这是DNNClassifier的问题.
>您可能对输入数据有疑问.尝试在输入数据上调用assert not np.any(np.isnan(x))以确保不引入nan.还要确保所有目标值都有效.最后,确保数据已正确规范化.您可能希望像素在[-1,1]范围内,而不是[0,255].
>标签必须在损失函数的范围内,因此如果使用基于对数的损失函数,则所有标签必须是非负的(如evan pu和下面的注释所述).

内容总结

以上是互联网集市为您收集整理的python – 深度学习南失的原因全部内容，希望文章能够帮你解决python – 深度学习南失的原因所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/709385.html

来源：【匿名】

【上一篇】python – 如何利用Keras在深度学习中利用多处理和多线程？【下一篇】关于Nginx的深度学习内容

更多 ►

【python – 深度学习南失的原因】教程文章相关的互联网学习教程文章

python: 深度学习-梯度【代码】【图】

梯度的实现： 1import numpy as np2 3def numerical_gradient(f,x): 4#数值微分求梯度,f为函数，x为NumPy数组，该函数对数组x的各个元素求数值微分 5 6 h=1e-4#0.0001 7 grad=np.zeros_like(x)#生成和x形状相同的数组 8 9for idx in range(x.size): 10 tmp_val=x[idx] 11#f(x+h)的计算12 x[idx]=tmp_val+h 13 fxh1=f(x) 1415#f(x-h)的计算16 x[idx]=tmp_val-h 17 fxh2=f(x) ...

好书推荐计划：Keras之父作品《Python 深度学习》

大家好，我禅师的助理兼人工智能排版住手助手条子。可能非常多人都不知道我。由于我真的难得露面一次，天天给禅师做底层工作。p>wx_fmt=jpeg" />今天条子最终也熬到这一天！最终也有机会来为大家写文章了！激动的我啊。都忘了9月17号中午和禅师在我厂门口兰州料理吃饭。禅师要了一碗牛拉+一瓶可乐+一碟凉菜，总共30元。让我结账至今还没还钱的事儿了。真的，激动的我一点儿都想不起来了。国庆长假就要開始了，作为人工智能头条的读...

《Python深度学习》第一章阅读笔记【图】

第1章什么是深度学习前言在阅读这本书的过程中，我终于知道了人工智能，机器学习和深度学习的关系……之前虽然接触过一些相关的内容，也用过一些里面的方法，但是对于这些概念着实是傻傻分不清楚hhh 人工智能的简洁定义如下：努力将通常由人类完成的智力任务自动化。因此，人工智能是一个综合性的领域，不仅包括机器学习与深度学习，还包括更多不涉及学习的方法。例如，早期的国际象棋程序仅包含程序员精心编写的硬编码规则，并...

python深度学习（图像识别）的学习方法或者入门书籍有什么？

最近要学习python深度学习，因为要用python做图形的识别，求相关的入门书籍。中文的最好。就是给一张图，能够识别出图像是什么。回复内容：这是一个较完整的应用深度学习进行图像识别的学习路径，不是深度学习的捷径！1. 模式识别从你的描述问题的语言来看，题主似乎对模式识别没有较高的认识。所以在做基于深度学习的图像识别前，建议先大致阅读模式识别和计算机视觉相关书籍。先理解图像这个信息本身，才来尝试识别。《学习Open...

python深度学习之基于LSTM时间序列的股票价格预测【代码】【图】

1.本文是一篇LSTM处理时间序列的案例我们先来看看数据集，这里包含了一只股票的开盘价，最高价，最低价，收盘价，交易量的信息。本文基于LSTM对收盘价（close）进行预测 2. 单维对单步的预测我们这是用前n天的数据预测第n+1天的数据。单维单步的蛤含义如下图，利用2天的数据预测第三天的数据。 trainX的形状为（5,2），trainY的形状为（5,1） 3.导入所需要的数据 #关于lstm对时间序列数据的预测 import numpy as np import m...

tensorflow实现python深度学习步骤——keras搭建网络八股sequential

搭建网络八股步骤 Import Train, test Model = tf.keras.models.Sequential 搭建网络结构 Model.compile 配置训练参数，告知优化器、损失函数、评测指标 Model.fit 配置训练过程，告知训练集的输入特征和标签、batch、迭代次数 Model.summary 具体步骤 1.Model = tf.keras.models.Sequential([网络结构]) 描述各层网络网络结构举例：拉直层：tf.kears.layers.Flatten() 全连接层：tf.kears.layers.Dense(神经元个数，activation=...

Python 深度学习常用包汇总【代码】

Python 深度学习常用包汇总更新历史2021/2/281.pytorch 网站：https://pytorch.org/ 当前安装版本：1.7.1 pip install torch===1.7.1+cu110 torchvision===0.8.2+cu110 torchaudio===0.7.2 -f https://download.pytorch.org/whl/torch_stable.html2. scikit-learn(sklearn) pip install scikit-learn当前版本：0.24.1 3.pandas pip install pandas当前版本：1.2.2 安装pandas会安装numpy 4.numpy pip install numpy当前版本：1.2...

Python深度学习：PyTorch API【代码】【图】

Python深度学习：PyTorch API 1、nn.Module initforward：完成一次前向计算的过程nn.Linear(input的特征数量， output的特征数量) class Lr(nn.Module):'''定义模型'''def __init__(self):super(Lr, self).__init__()self.linear = nn.Linear(1, 1)def forward(self, x):out = self.linear(x)return outmodel = Lr() # 实例化模型 predict = model(x)2、优化器类 optimizer = optim.Ad...

Python深度学习笔记08--处理文本数据的常用方法【代码】

6.1 处理文本数据 6.1.1 单词和字符的one-hot编码 (1)单词级的one-hot编码： 1 # 单词级的one-hot编码2 import numpy as np3 4 # 初始数据：每个样本是列表的一个元素(本例中的样本是一个句子，但也可以是一整篇文档)5 samples = [The cat sat on the mat., The dog ate my homework.]6 7 # 构建数据中所有标记的索引8 token_index = {}9 for sample in samples: 10 # 利用split方法对样本进行分词，在实际应用中，还需要从样本...

Python深度学习笔记07--使用Keras建立卷积神经网络【代码】

1 from keras.datasets import mnist2 from keras.utils import to_categorical3 4 #1. 获取数据5 (train_images, train_labels), (test_images, test_labels) = mnist.load_data()6 7 #2. 处理数据8 train_images = train_images.reshape((60000, 28, 28, 1))9 train_images = train_images.astype(float32) / 255 10 11 test_images = test_images.reshape((10000, 28, 28, 1)) 12 test_images = test_images.astype(float32) /...

Python深度学习笔记06--机器学习基础【代码】

4.1 机器学习的四个分支 4.1.1 监督学习含义：给定一组样本，它可以学会将输入数据映射到已知目标。常见监督学习有：分类、回归、序列生成、语法树预测、目标检测、图像分割。 4.1.2 无监督学习含义：是指在没有i目标的情况下寻找输入数据的有趣变换，其目的在于数据可视化、数据压缩、数据去噪或更好地理解数据中的相关性。常见无监督学习有：降维、聚类。 4.1.3 自监督学习含义：是没有人工标注的标签的监督学习，可以看...

Python深度学习笔记04--使用Kears进行多分类【代码】

1 import keras2 from keras.datasets import reuters3 import numpy as np4 from keras import models5 from keras import layers6 import matplotlib.pyplot as plt7 8 #1. 获取数据集9 (train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000)10 11 # print(train_data.shape)#(8982,)12 # print(test_data.shape)#(2246,)13 14 15 #2. 数据处理16 #2.1 将整数序列编码为二进制矩阵17 def ...

Python深度学习02：神经网络的数学基础【代码】【图】

2.1 初始神经网络 MNIST数据集：手写数字的灰度图像（28 像素28 像素），包含 60 000 张训练图像和 10 000 张测试图像。类：分类问题中的某个类别叫作类（class）样本：数据点叫作样本（sample）标签：某个样本对应的类叫作标签（label）损失函数（loss function）：网络如何衡量在训练数据上的性能，即网络如何朝着正确的方向前进。优化器（optimizer）：基于训练数据和损失函数来更新网络的机制。在训练和测试过程中需要监...

Python 深度学习，你的 Keras 准备好了吗？【图】

Python 深度学习，你的 Keras 准备好了吗？点击上方“AI有道”，选择“置顶”公众号重磅干货，第一时间送达前天我在公众号推荐了《Python Deep Learning》这本书。该书是由 Keras 作者写的，所以全书基本围绕着 Keras 讲深度学习的各种实现，从 CNN，RNN 到 GAN 等，偏入门，但理论和实战部分都讲的还不错，承载着很多作者对深度学习整体性的思考。目前该书的中英文版包括源码见下面的链接：链接：https://pan.baidu.com/s/1kTTGpz...

机器学习笔记使用Face recognition、OpenCV、Python和深度学习进行人脸识别【代码】【图】

一、安装相关包安装dlib、cmake、face_recognition 二、获取人脸的128位数组编码使用基本演绎法这两个演员的脸测试，只用了这两张正脸进行识别，如果要识别准确，得准备多种角度的照片，才能比较精准。# 使用Face recognition获取人脸128位数组from imutils.video import VideoStream from imutils import paths import face_recognition import argparse import pickle import cv2 import os import imutilsdef train():# grab ...

深度学习 - 相关标签

深度学习模型深度学习算法

深度学习 - 最热教程

【深度学习】③--神经网络细节与训练注...Ubuntu16安装深度学习环境流程基于tensorflow2.x版本python代码实现深...深度学习笔记（三）—— 反向传播[Back...在NLP中深度学习模型何时需要树形结构？Windows系统基于tensorflow+keras+cuda...深度学习原理与框架-神经网络-cifar10分...使用RTX3080显卡搭建基于Pycharm+Pytho...Java 深度学习实践 DJL中文系列课程深度学习模型里super函数的作用和def _...

首页 / 深度学习 / python – 深度学习南失的原因

python – 深度学习南失的原因

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 深度学习南失的原因】教程文章相关的互联网学习教程文章

python: 深度学习-梯度【代码】【图】

好书推荐计划：Keras之父作品《Python 深度学习》

《Python深度学习》第一章阅读笔记【图】

python深度学习（图像识别）的学习方法或者入门书籍有什么？

python深度学习之基于LSTM时间序列的股票价格预测【代码】【图】

tensorflow实现python深度学习步骤——keras搭建网络八股sequential

Python 深度学习常用包汇总【代码】

Python深度学习：PyTorch API【代码】【图】

Python深度学习笔记08--处理文本数据的常用方法【代码】

Python深度学习笔记07--使用Keras建立卷积神经网络【代码】

Python深度学习笔记06--机器学习基础【代码】

Python深度学习笔记04--使用Kears进行多分类【代码】

Python深度学习02：神经网络的数学基础【代码】【图】

Python 深度学习，你的 Keras 准备好了吗？【图】

机器学习笔记使用Face recognition、OpenCV、Python和深度学习进行人脸识别【代码】【图】

PYTHON - 相关标签

深度学习 - 相关标签

深度学习 - 最新教程

深度学习 - 最热教程