DS from scratch CH8

梯度，gradient，简化的理解是偏微分
random.shuffle随机洗一个list in place,返回值是None
Stochastic gradient descent,这个高级的名字,直译过来是随机梯度下降，通常用来对比的是batch gradient descent，批量梯度下降。
http://blog.csdn.net/zouxy09/article/details/20319673
- 在用迭代得到最优解的时候，如果cost function是凸函数，有全局唯一最优解。
- SVM是个二分类的例子，找到让两类的区别最大化的超平面。
- logisitic regression既能回归又能分类。
这个用法好特别，next_theta = min(next_thetas, key=target_fn)
cost_function一般是所有样本值和theta的一个组合,也叫error function, batch gradient descent用到了所有点来算偏微分（也就是gradient descent)。stochastic gradient descent把cost function在概念上简化成每个点得cost function的和（sum），用一个一个的点来取偏微分，做gradient descent。

最后编辑于：2017.11.27 03:54:59

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

1赞2赞

赞赏

手机看全文