Softmax:
Overfitting:
参数:w和b
手写数字输入每张图片28*28=784,30个隐层神经元与输入连接就是784*30=23520个权重参数,隐层神经元与输出的10个神经元连接就是30*10=300个权重参数,23520+300=23820,30+10=40个偏置,参数公有23820+40=23860
虽然上个图中cost不断减小,但是在训练某一轮之后accuracy就不再增加了
防止Overfitting的发生:
原文:https://www.cnblogs.com/fenglivoong/p/12530159.html