240 发简信
IP属地:北京
  • L1, L2 正则项

    L1正则:sparse, 参数特别多时,使一部分变为0,只选出比重大的参数 L2正则:雨露均沾 Elastic Net: 一篇经典论文,讲 L1...

  • Resize,w 360,h 240
    softmax简单代码实现(浅谈交叉熵和反向传播)

    softmax激活函数: , (x属于分类 j的概率) 用在多分类问题,输出的结果为和为 1的多个概率值 (该图为2分类, 代码是3分类, 原理...

  • Resize,w 360,h 240
    分布函数和概率密度

    1.连续型随机变量的分布函数 F(x):随便举一个例子 性质:1.单调不减,一定为增函数 2.处处右连续,有有限个间断点 3...

  • Resize,w 360,h 240
    一元线性回归的梯度下降

    1.Linear regression of one variable: 一个一次线性模型: (预测值:prediction) 2.代价函数 c...

  • Resize,w 360,h 240
    全概率公式和贝叶斯公式(先验概率和后验概率)

    完备事件组:,两两互斥,且并集为全集 S 全概率公式: 根据条件概率公式得: 即: 因为 A的发生是由 B的原因引起的,所以又叫“由原因推结果”...