参考《深度学习》花书。 推导L1实现参数稀疏性的原理,L2使得权重参数变小的原理。 字不好看,见谅啊。
L1和L2正则化原理推导.md
原文:https://www.cnblogs.com/zuotongbin/p/11914558.html