之前看《数据化营销》的时候,只是粗略的把内容过了一遍。今天把书的车品觉写的序言看了一遍,看完之后觉得深有感触,业务分析永远都是在问题中产生的,是有问题才有分析。我打算摘录一些...
之前看《数据化营销》的时候,只是粗略的把内容过了一遍。今天把书的车品觉写的序言看了一遍,看完之后觉得深有感触,业务分析永远都是在问题中产生的,是有问题才有分析。我打算摘录一些...
简述 最近和第三方数据接触较多,数据量也开始陡增,从一开始的1KW行,最大到了1亿行,这让我这个常年处理‘小数据’的人有点捉襟见肘。本来数据放在hive中也是可以操作的,但是...
一、市场定义流失率的几种方式? 1、资讯行业,一段时间内(30天内)未访问或登录过网站的用户 2、电商行业,一段时间内(90-180天内)没有任何交易行为的用户 备注:时间周...
写过Python程序的人大都知道,Python日期和时间的处理非常繁琐和麻烦,主要有以下几个问题: 有众多的package,类和方法,包括time,datetime,pytz...
11、pandas的分组操作 12、pandas的连接操作 13、pandas的时间/日期操作 14、pandas的IO操作 15、pandas的可视化操作 16、Panda...
1、导入库 2、连接数据库 3、创建一个游标对象 cursor 4、编写SQL语句 5、执行SQL语句 6、通过fetchall获得数据,数据以元组形式保存 7、打印前2条数...
隐藏代码code 修改安装路径 cmd中输入jupyter notebook --generate-config,->输入"N" 打开jupyter_notebook_con...
参考资料:Git教程 创建一个空目录 通过git init命令把这个目录变成Git可以管理的仓库 把文件添加到仓库 修改文件内容并提交: 查看修改的历史记录 退回到上一个版本...
1、软件准备 jdk spark hadoop winutils 2、软件安装、解压,其中hadoop包的解压需要管理员权限 3、系统环境变量配置 需要新建的变量 需要在变量...
导入库 创建RDD .collect()函数:执行把全部数据集送回驱动的操作 索引其中某一个数值 读入压缩包文件 .take():读取指定行数 示例函数 map()转换:对每...
搬运:来自DataCamp的实用cheatsheet,标题为pdf下载链接,感谢DataCamp,含基础和五个常用库。 1. python数据分析基础 2. numpy 3....
Understanding the Transform Function in Pandas Pandas具有丰富的功能让我们探索,transform就是其中之一,利用它可以...
一、聚类算法 聚类属于无监督学习,是数据挖掘十大经典算法之一 。 二、k-means聚类算法简介 1、k-means聚类算法的逻辑 a. 给定一组数据集,先确定好需要分类个数...
random模块用于生成随机数 导入模块 numpy.random.rand(d0, d1, ..., dn):生成一个[0,1)之间的随机浮点数或N维浮点数组。 numpy...
转载来源: python中math模块常用的方法整理 导入函数 e exp pi ceil floor copysign fabs trunc factorial gcd h...
1.collections库-累加器
本文转载来源:Python绘图库Matplotlib入门教程本文同时使用了这里的教学代码:Matplotlib 画图教程系列 _ 莫烦Python 0、入门代码示例 下面我们...
更多参考1:http://wiki.jikexueyuan.com/project/explore-python/File-Directory/os.html更多参考2:ht...