https://zhuanlan.zhihu.com/p/32819991,这个给出具体模型,但是也太具体了,公式都不是很教科书。
https://www.cnblogs.com/pinard/p/6422831.html,刘建平这个我不明白它推导的时候那么注意T转置这个负号干什么?
//其实我不太懂,如果是面试的时候推导,那么是画一个简单的神经网络呢,还是推到一个总的公式呢?感觉后一个好难,前一个好乱。
//反向传播我居然看不懂了,我哭了。
原文:https://www.cnblogs.com/BlueBlueSea/p/13028856.html