单个神经元,只能二分类;需要多搭几个构成网络,来进行多分类。
y=w*x+b;权重和偏置
预测值与真实值差异->损失函数->梯度下降方法优化参数
真实值one-hot编码
损失函数:
每次更新,朝着最优解方向走。学习率0-1。
sigmod函数,左为0,不适合隐藏层,不然损失函数为0,梯度消失。
有了激活函数
每一层W的行列:行为此层数,列为下一层数。
练习:
原文:https://www.cnblogs.com/wxl845235800/p/10105088.html