强化学习第三四章

时间：2019-09-14 14:18:24 阅读：77 评论：0 收藏：0 [点我收藏+]

1、梯度下降选择固定步长可能产生的情况：收敛、发散、重复的在两个数之间跳跃

2、np.zeros_like(x) 生成一个shape和x一样的全为0的数组

3、plt.counter画等高线图

4、tensorflow的scope 变量命名空间

（1）若tf.Variable(初始值,name=‘ ‘)这种方式，每一个scope都会对名字产生影响

　　若tf.variable_scope(‘123‘)这种方式，只有variable_scoope这种会对名字产生影响

（2）在同一个scope内，当同样名字的name_scope再次被声明的时候，scope的名字不会直接被复用，而是会通过改名创建全新的scope

　　当同样名字的variable_scope再次声明的时候，scope直接复用了

5、tensorflow进行图运算之前需要：(1）创立回话层with tf.Session() as sess （2）初始化所有的变量sess.run(global_variables_initializer())

　　　　　　　　　　　　　　　　(3) sess.run([运算1,运算2]，feed_dict={}) feed_dict是输入参数

若要访问计算图，两步（1）graph=tf.get_default_graph() (2) print(graph.get_operations())

6、当使用加操作的时候，若用c=a+b，get_operations 输出得到的是“add:0"，若用c=tf.add(a,b,‘c‘),输出得到的才是一个叫c的变量，通过graph.get_tensor_by_name可以访问的到，尽可能为每一个option起好名字

7、还存在的问题：共轭梯度方法和自然梯度方法

原文：https://www.cnblogs.com/lin-kid/p/11516379.html

踩

(0)

评论一句话评论（0）

分享档案

更多>