https://pytorch.org/docs/stable/generated/torch.optim.SGD.html?highlight=sgd#torch.optim.SGD、
其中weight_decay 参数作用是在SGD中增加的l2的惩罚项
torch.optim.SGD 参数
原文:https://www.cnblogs.com/pyclq/p/15212270.html