对于单个数据点$(x,g=k)$来说,其所属类别$g=k$为1,其余类别为0
-
$L(\theta)=logp(g=k|x)$ 需要最大化
-
$CE(p,q)=-\sum_x p(x)logq(x)$
对应到本例$CE=-\sum_i p(g=i)logp(g=i|x_i)=-logp(g=k|x)$ 需要最小化
-
$KL(p,q)=\sum_x p(x)log\frac{p(x)}{q(x)}$
对应本例$KL=\sum_i p(g=i)log\frac{p(g=i)}{p(g=i|x)}=log\frac{1}{p(g=k|x)}=-logp(g=k|x)$需要最小化