70bcc5a9baf5 - 简书

发简信

70bcc5a9baf5

1
关注
1
粉丝
0
文章
0

字数
0

收获喜欢
0

总资产

IP属地：北京

70bcc5a9baf5

第一章统计学习方法概论
统计学习具有以下特点： 1.统计学习以计算机及网络为平台，建立在其上；2.以数据为研究对象，是数据驱动的学科；3.目的是对数据进行预测与分析；4.以方法为中心，构建模型并应用...

小蛋子
324 0 1
70bcc5a9baf5

简书上添加代码
在简书上添加代码段时，首先点击左下角的设置，将默认编辑器切换为MarkDown编辑器，然后用三个'(esc下的键)包裹代码段，注意：第一行如果与前三个`同行会被忽略，即：这...

小蛋子
506 0 1

70bcc5a9baf5

文档排重之SimHash算法
不同网站间相互转载内容的情况非常常见，即使同一网站，不同的URL地址也可能对应相同内容，只是以不同的形式显示出来（不同的UI），而我们在爬取大量内容时，除了靠URL去重外，还...

小蛋子
1873 0 1
70bcc5a9baf5

python中实现单例模式
python中实现单例模式的方式大致有四种：1.模块2.改写类的new方法，控制实例生成3.装饰器4.元类1.模块python中的模块是天然的单例模式，并且是线程安全的，所有...

小蛋子
918 0 2
70bcc5a9baf5

二分法查找有序数组中大于等于v的第一个数
题目要求：有序数组L，利用二分法查找数组中第一个大于等于v的数，如果不存在，则返回-1

小蛋子
1172 0 2
70bcc5a9baf5

求逆序对
问题：对于一个包含N个非负整数的数组A[1..n]，如果有i < j，且A[ i ]>A[ j ]，则称(A[ i] ,A[ j] )为数组A中的一个逆序对。例如，数组（3...

小蛋子
1178 0 2
70bcc5a9baf5

word2vec 之 skip-gram
Word2vec 主要有两种形式，CBOW 和Skip-gram，其中CBOW是通过上下文context来预测当前位置词，SKip-gram则是通过当前词来预测上下文 Fak...

小蛋子
1568 0 2

70bcc5a9baf5

判断一个正整数是否是2的整数次幂
给定一个正整数n，如何最快速判断n是否是2的整数次幂第一种方法：将n除2，得到商和余数，若余数不为0，则不是；当商不为0时，继续除2，当商为0时，此时余数为0，则是整数次幂，...

小蛋子
3396 0 2
70bcc5a9baf5

二叉树相关
二叉树是一种常用的数据结构，其涉及的相关算法也较多，简单做一些总结在二叉树中，每个节点最多只有两个子树，即左子树和右子树。性质1.在一个非空二叉树的第n层上至多有2^(n-1...

小蛋子
366 0 2
70bcc5a9baf5

leetcode-剪绳子
给你一根长度为n的绳子，请把绳子剪成m段，记每段绳子长度为k[0],k[1]...k[m-1],求k[0]k[1]...k[m-1]的最大值。已知绳子长度n为整数，m>1(至...

小蛋子
1544 0 2
70bcc5a9baf5

随机森林的树是否越多越好？
面试时被问到在随机森林的树是否数量越多越好？开始只考虑构建更多的树一来浪费资源，二来数量一定后模型的性能基本保持稳定，随着树的增加提升非常小。回来后又想了想，随机森林中通过引...

小蛋子
7917 0 4
70bcc5a9baf5

XGBoost原理
更好的阅读体验请跳转至XGBoost原理[https://xv44586.github.io/2019/10/14/xgb/] 一.绪论在实际应用的机器学习方法里，Gradi...

小蛋子
104668 4 35

70bcc5a9baf5

python多线程
最近在看Python的多线程，经常我们会听到老手说：“Python下多线程是鸡肋，推荐使用多进程！”，但是为什么这么说呢？要知其然，更要知其所以然。所以有了下面的深入研究...

小蛋子
241 0 2
70bcc5a9baf5

python中的GIL
熟悉Python的人对GIL肯定都不陌生, 其全称是全局解释器锁(Global Interpreter Lock)。但是，很多人都误以为GIL是python的特性，所以，首先...

小蛋子
517 0 2
70bcc5a9baf5

判断是否是平衡二叉树
题目：输入一个二叉树，判断其是否是平衡二叉树。平衡二叉树的定义是任何节点的左右子树高度差都不超过1的二叉树。解法一：编写一个求解节点深度的方法，然后从根节点开始判断其左右节...

小蛋子
378 0 1
70bcc5a9baf5

Bagging为什么能降低过拟合
偏差与方差偏差 (bias) 定义为：即模型的期望预测与真实值之间的差异。方差 (variance) 定义为：有了偏差和方差的定义，我们就能推导出模型的期望泛化误差： ...

小蛋子
3087 0 1
70bcc5a9baf5

神经网络语言模型（NNLM）
首先看一个例子： ztc/ 上下/ 齐/ 拼搏/ ，誓为/ 春战/ 做/ 贡献这句话呢通顺，意思明白，那如果换一下词的位置：上下/ 齐/ 拼搏/ ztc/ ，春站/ 做/...

小蛋子
8152 2 5

70bcc5a9baf5

深入谈谈word2vec
原始的NNLM在训练词向量时非常耗时，尤其是大规模语料上，作者在论文后也提出了可能的优化方案，所以word2vec的关注点就是如果更加有效的在大规模语料上训练词向量。每个训练...

小蛋子
965 0 4
70bcc5a9baf5

Glove模型
一、整体思路获取词向量基本上有两种思路：1.利用全局统计信息，进行矩阵分解（如LSA）来获取词向量，这样获得的词向量往往在词相似性任务上表现不好，表明这是一个次优的向量空间结...

小蛋子
3570 0 2
70bcc5a9baf5

词向量小结
更好的阅读体验请跳转至词向量小结[https://xv44586.github.io/2019/10/22/w2v-summary/] 本文主要讨论Glove和word2ve...

小蛋子
1760 0 4

暂无个人介绍