在天上眺望 - 简书

发简信

在天上眺望

1
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
2

总资产

IP属地：江苏

pcqlegend

Spark Repartition 使用
看到一些同学的Spark代码中包含了很多repartition的操作，有一些不是很合理，非但没有增加处理的效率，反而降低了性能。这里做一个介绍。 repartition 从字...

51841 0 17
羋学僧

PySpark的使用
Spark中使用Python实现WordCount业务 PySpark中的DataFrame DataFrame类似于Python中的数据表，允许处理大量结构化数据 Data...

8561 0 3
一技破万法

pytorch中torch.utils.data.DataLoader数据类型
DataLoader是PyTorch中的一种数据类型。在PyTorch中训练模型经常要使用它，那么该数据结构长什么样子，如何生成这样的数据类型？ Dataloader中的属性...

11281 0 2
让数据告诉你

25、pandas的reshape(1,-1)什么意思？
在创建DataFrame的时候常常使用reshape来更改数据的列数和行数。 reshape可以用于numpy库里的ndarray和array结构以及pandas库里面的Da...

94357 4 49
舟舟洋

用Spark简单实现阿里Swing，效果比itemCF优化后的模型好很多
Swing公式思路 Swing模型构建流程思路举例代码直接掉用fitOnline就好，按照PvEntity给出的数据格式构造数据，param为文件中SwingParam...

8850 4 4
婉妃

一文理解拉格朗日对偶和KKT条件
一. 最优化问题求解 1. 等式约束的极值求法目标函数: , 引入Lagrange算子: 2. 不等式约束的极值求法目标函数: 约束条件: 很多情况, 不等式约束条件可引...

14387 3 9
vivien_liu

推荐系统Java库使用方法：LibRec
做推荐系统的圈子里，大家最常用的库应该就是LibRec了，它是一个基于Java的开源项目。这两天摸索了一下，为避免以后忘记，还是记录一下：我是在Intelli J中导入了L...

19611 0 11
guoweikuang

Python标准库模块之heapq
该模块提供了堆排序算法的实现。堆是二叉树，最大堆中父节点大于或等于两个子节点，最小堆父节点小于或等于两个子节点。创建堆 heapq有两种方式创建堆，一种是使用一个空列表，...

94820 4 28
机器学习算法工程师

15分钟入门NLP神器—Gensim
前言作为自然语言处理爱好者，大家都应该听说过或使用过大名鼎鼎的Gensim吧，这是一款具备多种功能的神器。Gensim是一款开源的第三方Python工具包，用于从原始的...

58779 0 22