调试梯度下降。用x轴上的迭代数绘制一个图。现在测量成本函数,J(θ)随迭代次数下降。如果J(θ)不断增加,那么你可能需要减少α。
自动收敛试验。如果该声明收敛(θ)小于E在一次迭代中减少,其中E是一些小的值,如10?3。然而,在实践中很难选择这个阈值。
它已被证明,如果学习率α足够小,那么J(θ)每次迭代都减小。
总结:
如果α太小,收敛速度慢
如果α太大:?可能不会在每次迭代不收敛,从而降低。
原文:http://www.cnblogs.com/zhengzhe/p/7224573.html