前馈神经网络.ppt
文本预览下载声明
* * * * * * * * * * * * * 它最终寻求的是极值函数:它们使得泛函取得极大或极小值。 函数应该存在我们优化过的函数家族中。 * * * 也可以让最大似然学习高斯分布的协方差,或者让高斯分布的协方差成为一个输入的函数。但是作为输入时,要让协方差矩阵正定。线性单元难以做到。 * * * 讨论如何定义一个在y上的分布,该分布使用z值。作者说sigmoid函数可以被一个未归一化的概率分布激活。 我们设想:未归一化的log概率在y z中是线性的。 * 解释正确答案,正确项是让cost函数最小! 当z符号错误时,(1-2y)z会趋近于绝对值z。 绝对值的导数成为符号函数,因此梯
显示全部