torch.optim.SGD返回一个优化器类。
sgd=torch.optim.SGD(paramater,lr=0.5);
lr表示学习率,paramater表示参数。
sgd.zero_grad()清除各点的梯度
sgd.step()进行一次优化
torch.optim.SGD
原文:https://www.cnblogs.com/hahaah/p/15063037.html