如何在TensorFlow中应用梯度裁剪？

问题内容：

我想知道如何在RNN上的该网络上应用梯度剪切，而梯度可能会爆炸。

tf.clip_by_value(t, clip_value_min, clip_value_max, name=None)

这是可以使用的示例，但是我在哪里介绍呢？在RNN中

    lstm_cell = rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0)
    # Split data because rnn cell needs a list of inputs for the RNN inner loop
    _X = tf.split(0, n_steps, _X) # n_steps
tf.clip_by_value(_X, -1, 1, name=None)

但这没有意义，因为张量_X是输入，而不是grad，要裁剪的内容是什么？

我是否需要为此定义自己的优化器，还是有一个更简单的选择？

问题答案：

在计算梯度之后，但在应用梯度更新模型参数之前，需要进行梯度修剪。在您的示例中，这两种AdamOptimizer.minimize()方法均由该方法处理。

为了裁剪您的渐变，您需要按照TensorFlow
API文档
中本节的说明显式计算，裁剪和应用它们。具体来说，您需要minimize()使用类似以下内容的方法来代替对方法的调用：

optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)
gvs = optimizer.compute_gradients(cost)
capped_gvs = [(tf.clip_by_value(grad, -1., 1.), var) for grad, var in gvs]
train_op = optimizer.apply_gradients(capped_gvs)

如何在TensorFlow中应用梯度裁剪？

微信关注