首页 / TENSORFLOW / python – Tensorflow,在RNN中保存状态的最佳方法？

python – Tensorflow,在RNN中保存状态的最佳方法？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – Tensorflow,在RNN中保存状态的最佳方法？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3815字，纯文字阅读大概需要6分钟。

内容图文

我目前在tensorflow中有一系列链接在一??起的RNN的代码.我没有使用MultiRNN,因为我稍后会对每一层的输出做一些事情.

 for r in range(RNNS):
    with tf.variable_scope('recurent_%d' % r) as scope:
        state = [tf.zeros((BATCH_SIZE, sz)) for sz in rnn_func.state_size]
        time_outputs = [None] * TIME_STEPS

        for t in range(TIME_STEPS):
            rnn_input = getTimeStep(rnn_outputs[r - 1], t)
            time_outputs[t], state = rnn_func(rnn_input, state)
            time_outputs[t] = tf.reshape(time_outputs[t], (-1, 1, RNN_SIZE))
            scope.reuse_variables()
        rnn_outputs[r] = tf.concat(1, time_outputs)

目前我有固定的时间步数.但是我想把它改成只有一个时间步,但要记住批次之间的状态.因此,我需要为每个图层创建一个状态变量,并为每个图层指定最终状态.像这样的东西.

for r in range(RNNS):
    with tf.variable_scope('recurent_%d' % r) as scope:
        saved_state = tf.get_variable('saved_state', ...)
        rnn_outputs[r], state = rnn_func(rnn_outputs[r - 1], saved_state)
        saved_state = tf.assign(saved_state, state)

然后,对于每个层,我需要在sess.run函数中评估已保存的状态以及调用我的训练函数.我需要为每个rnn层执行此操作.这看起来很麻烦.我需要跟踪每个保存的状态并在运行中对其进行评估.此外,运行将需要将状态从我的GPU复制到主机内存,这将是低效且不必要的.有没有更好的方法呢？

解决方法:

下面是更新LSTM初始状态的代码,当state_is_tuple = True时,通过定义状态变量.它还支持多个层.

我们定义了两个函数 – 一个用于获取具有初始零状态的状态变量和一个用于返回操作的函数,我们可以将其传递给session.run以便使用LSTM的最后隐藏状态更新状态变量.

def get_state_variables(batch_size, cell):
    # For each layer, get the initial state and make a variable out of it
    # to enable updating its value.
    state_variables = []
    for state_c, state_h in cell.zero_state(batch_size, tf.float32):
        state_variables.append(tf.contrib.rnn.LSTMStateTuple(
            tf.Variable(state_c, trainable=False),
            tf.Variable(state_h, trainable=False)))
    # Return as a tuple, so that it can be fed to dynamic_rnn as an initial state
    return tuple(state_variables)


def get_state_update_op(state_variables, new_states):
    # Add an operation to update the train states with the last state tensors
    update_ops = []
    for state_variable, new_state in zip(state_variables, new_states):
        # Assign the new state to the state variables on this layer
        update_ops.extend([state_variable[0].assign(new_state[0]),
                           state_variable[1].assign(new_state[1])])
    # Return a tuple in order to combine all update_ops into a single operation.
    # The tuple's actual value should not be used.
    return tf.tuple(update_ops)

我们可以使用它来更新每批后的LSTM状态.请注意,我使用tf.nn.dynamic_rnn进行展开：

data = tf.placeholder(tf.float32, (batch_size, max_length, frame_size))
cell_layer = tf.contrib.rnn.GRUCell(256)
cell = tf.contrib.rnn.MultiRNNCell([cell] * num_layers)

# For each layer, get the initial state. states will be a tuple of LSTMStateTuples.
states = get_state_variables(batch_size, cell)

# Unroll the LSTM
outputs, new_states = tf.nn.dynamic_rnn(cell, data, initial_state=states)

# Add an operation to update the train states with the last state tensors.
update_op = get_state_update_op(states, new_states)

sess = tf.Session()
sess.run(tf.global_variables_initializer())
sess.run([outputs, update_op], {data: ...})

与this answer的主要区别在于state_is_tuple = True使LSTM的状态成为包含两个变量(单元状态和隐藏状态)的LSTMStateTuple,而不仅仅是单个变量.使用多个层然后使LSTM的状态成为LSTMStateTuples的元组 – 每层一个.

重置为零

使用训练模型进行预测/解码时,您可能希望将状态重置为零.然后,您可以使用此功能：

def get_state_reset_op(state_variables, cell, batch_size):
    # Return an operation to set each variable in a list of LSTMStateTuples to zero
    zero_states = cell.zero_state(batch_size, tf.float32)
    return get_state_update_op(state_variables, zero_states)

例如,如上所述：

reset_state_op = get_state_reset_op(state, cell, max_batch_size)
# Reset the state to zero before feeding input
sess.run([reset_state_op])
sess.run([outputs, update_op], {data: ...})

内容总结

以上是互联网集市为您收集整理的python – Tensorflow,在RNN中保存状态的最佳方法？全部内容，希望文章能够帮你解决python – Tensorflow,在RNN中保存状态的最佳方法？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/713344.html

来源：【匿名】

【上一篇】python – Tensorflow在C中导出和运行图形的不同方法【下一篇】详解tensorflow载入数据的三种方式

更多 ►

【python – Tensorflow,在RNN中保存状态的最佳方法？】教程文章相关的互联网学习教程文章

[TensorFlow]TensorFlow安装方法【代码】

下载*.whl文件方法安装：方法：http://www.python36.com/install-tensorflow-using-official-pip-pacakage/ 在线安装：方法：https://blog.csdn.net/y1250056491/article/details/78670710 Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA测试时出现上面警告时，想解决需要重新编译TensorFlow源码，也可用下面代码隐藏：import os os.environ[‘TF_CPP_MIN_LOG_LEVEL‘] = ‘2‘参...

自己总结的Tensorflow安装教程（附部分报错解决方法）【代码】【图】

之前自己安了一遍Tensorflow，踩了很多雷，总也安不上，经过好大一番折腾，终于被我弄好了，在这里分享一下我的安装经验，希望能帮到大家，话不多说，直接进入正题。一、到官网https://www.anaconda.com/distribution/，下载适合自己版本的Anacoada，在这里我下载的是windows python3.7 version，按照安装向导一步一步安装就可以。二、配置Tensorflow环境在开始菜单输入navigator在左侧Enviroments里，此时只有一个base（root），点...

tensorflow冻结层的方法【代码】

其实常说的fine tune就是冻结网络前面的层，然后训练最后一层。那么在tensorflow里如何实现finetune功能呢？或者说是如何实现冻结部分层，只训练某几个层呢？可以通过只选择优化特定层的参数来实现该功能。示例代码如下： #定义优化算子 optimizer = tf.train.AdamOptimizer(1e-3) #选择待优化的参数 output_vars = tf.get_collection(tf.GraphKyes.TRAINABLE_VARIABLES, scope=‘outpt‘) train_step = optimizer.minimize(loss_...

深度神经网络可解释性方法汇总，附 Tensorflow 代码实现【图】

深度神经网络可解释性方法汇总，附 Tensorflow 代码实现知识库 ? 小白学CV ? 于 10个月前 ? 2076 阅读理解神经网络：人们一直觉得深度学习可解释性较弱。然而，理解神经网络的研究一直也没有停止过，本文就来介绍几种神经网络的可解释性方法，并配有能够在Jupyter下运行的代码链接。 1.Activation Maximization通过激活最化来解释深度神经网络的方法一共有两种，具体如下：1.1 Activation Maximization (AM)相关代码如下：https:...

吴裕雄 python 神经网络——TensorFlow pb文件保存方法【代码】【图】

import tensorflow as tf from tensorflow.python.framework import graph_utilv1 = tf.Variable(tf.constant(1.0, shape=[1]), name = "v1") v2 = tf.Variable(tf.constant(2.0, shape=[1]), name = "v2") result = v1 + v2init_op = tf.global_variables_initializer() with tf.Session() as sess:sess.run(init_op)graph_def = tf.get_default_graph().as_graph_def()output_graph_def = graph_util.convert_variables_to_const...

吴裕雄 python 神经网络——TensorFlow ckpt文件保存方法【代码】【图】

import tensorflow as tfv1 = tf.Variable(tf.random_normal([1], stddev=1, seed=1)) v2 = tf.Variable(tf.random_normal([1], stddev=1, seed=1)) result = v1 + v2init_op = tf.global_variables_initializer() saver = tf.train.Saver()with tf.Session() as sess:sess.run(init_op)saver.save(sess, "E:\\Saved_model\\model.ckpt")with tf.Session() as sess:saver.restore(sess, "E:\\Saved_model\\model.ckpt")print(sess....

【Python学习】 - TensorFlow.keras 不显示epochs进度条的方法【代码】

一、概述在我们使用TensorFlow进行神经网络的搭建时，难免遇到需要训练很多次来拟合数据的情况，假设需要拟合1000次数据，那么可能前800次的拟合效果都不是很好，所以显示进度条就会使得输出面板被填满，输出的信息我们并不关心，我们只关心最后200次的拟合效果，此时思考能否可以有一种办法可以简便的在训练多个epochs时隐藏进度条的输出呢？二、具体操作阅读这个函数 tensorflow.keras.models.Sequential.fit 在上述函数原型...

tensorflowTFRecords文件的生成和读取的方法

这篇文章主要介绍了关于tensorflow TFRecords文件的生成和读取的方法，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下TensorFlow提供了TFRecords的格式来统一存储数据，理论上，TFRecords可以存储任何形式的数据。TFRecords文件中的数据都是通过tf.train.Example Protocol Buffer的格式存储的。以下的代码给出了tf.train.Example的定义。message Example { Features features = 1; }; message Features { map<st...

tensorflow使用flags定义命令行参数的方法

本篇文章主要介绍了tensorflow 使用flags定义命令行参数的方法，现在分享给大家，也给大家做个参考。一起过来看看吧tf定义了tf.app.flags，用于支持接受命令行传递参数，相当于接受argv。import tensorflow as tf#第一个是参数名称，第二个参数是默认值，第三个是参数描述 tf.app.flags.DEFINE_string(str_name, def_v_1,"descrip1") tf.app.flags.DEFINE_integer(int_name, 10,"descript2") tf.app.flags.DEFINE_boolean(bool_nam...

将TensorFlow的模型网络导出为单个文件的方法

本篇文章主要介绍了将TensorFlow的网络导出为单个文件的方法，现在分享给大家，也给大家做个参考。一起过来看看吧有时候，我们需要将TensorFlow的模型导出为单个文件（同时包含模型架构定义与权重），方便在其他地方使用（如在c++中部署网络）。利用tf.train.write_graph()默认情况下只导出了网络的定义（没有权重），而利用tf.train.Saver().save()导出的文件graph_def与权重是分离的，因此需要采用别的方法。我们知道，graph_def...

Tensorflow分类器项目自定义数据读入的方法介绍（代码示例）【图】

本篇文章给大家带来的内容是关于Tensorflow分类器项目自定义数据读入的方法介绍（代码示例），有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。Tensorflow分类器项目自定义数据读入在照着Tensorflow官网的demo敲了一遍分类器项目的代码后，运行倒是成功了，结果也不错。但是最终还是要训练自己的数据，所以尝试准备加载自定义的数据，然而demo中只是出现了fashion_mnist.load_data()并没有详细的读取过程，随后我又...

TensorFlow实现非线性支持向量机的实现方法【图】

本篇文章主要介绍了TensorFlow实现非线性支持向量机的实现方法，现在分享给大家，也给大家做个参考。一起过来看看吧这里将加载iris数据集，创建一个山鸢尾花（I.setosa）的分类器。# Nonlinear SVM Example #---------------------------------- # # This function wll illustrate how to # implement the gaussian kernel on # the iris dataset. # # Gaussian Kernel: # K(x1, x2) = exp(-gamma * abs(x1 - x2)^2)import matplot...

TensorFlow实现随机训练和批量训练的方法【图】

本篇文章主要介绍了TensorFlow实现随机训练和批量训练的方法，现在分享给大家，也给大家做个参考。一起过来看看吧TensorFlow更新模型变量。它能一次操作一个数据点，也可以一次操作大量数据。一个训练例子上的操作可能导致比较“古怪”的学习过程，但使用大批量的训练会造成计算成本昂贵。到底选用哪种训练类型对机器学习算法的收敛非常关键。为了TensorFlow计算变量梯度来让反向传播工作，我们必须度量一个或者多个样本的损失。 ...

TensorFlow模型保存和提取方法示例【图】

本篇文章主要介绍了TensorFlow模型保存和提取方法示例，现在分享给大家，也给大家做个参考。一起过来看看吧一、TensorFlow模型保存和提取方法1. TensorFlow通过tf.train.Saver类实现神经网络模型的保存和提取。tf.train.Saver对象saver的save方法将TensorFlow模型保存到指定路径中，saver.save(sess,"Model/model.ckpt")，实际在这个文件目录下会生成4个人文件：checkpoint文件保存了一个录下多有的模型文件列表，model.ckpt.meta保...

Tensorflow框架无法调用GPU而使用CPU计算的解决方法【图】

问题： ?? ?? 错误提示：Cannot dlopen some GPU libraries.Please make sure the missing libraries. Please make sure the missing libraries mentioned above are installed properly if you would like to use…Skipping registering GPU devices… 一、解决方法： ??我用的是tensorflow无法使用GPU通常是Tensorflow版本和cuda版本不一致，根据cuda和tensorflow版本对应表，下载合适的版本即可。按照要求安装好，最后安装cudn...

首页 / TENSORFLOW / python – Tensorflow,在RNN中保存状态的最佳方法？

python – Tensorflow,在RNN中保存状态的最佳方法？

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – Tensorflow,在RNN中保存状态的最佳方法？】教程文章相关的互联网学习教程文章

TENSORFLOW - 相关标签

PYTHON - 相关标签

状态 - 相关标签

TENSORFLOW - 最新教程

TENSORFLOW - 最热教程