最优化学习3

时间：2019-01-08 11:27:45 阅读：147 评论：0 收藏：0 [点我收藏+]

对几个经典方法的整理和比较

手打一下公式

梯度下降法：面向任何函数，收敛速度一阶，有发散可能。梯度下降法考虑函数的一阶梯度，找到一个合理的迭代方向，但是不能确定步长。

只利用了当前点的切线的信息

$x = x_0 - \lambda\nabla{F(x)}$

牛顿法：面向任何函数，收敛速度二阶，有发散可能。使用了二阶的梯度，lllaaa

$f^{'} (x) \approx f ‘ (x 0) + (x － x 0) f^{″} (x 0)$

原文：https://www.cnblogs.com/zherlock/p/10237825.html

踩

(0)

评论一句话评论（0）

分享档案

更多>