目标:给定某电信机构实际业务中的相关客户信息,包含69个与客户相关的字段,其中“是否流失”字段表明客户会否会在观察日期后的两个月内流失。任务目标是通过训练集训练模型,来预测客...
目标:给定某电信机构实际业务中的相关客户信息,包含69个与客户相关的字段,其中“是否流失”字段表明客户会否会在观察日期后的两个月内流失。任务目标是通过训练集训练模型,来预测客...
1.认识监督学习与非监督学习 有监督学习:的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。即:利用训练数据集学习一个模型,再用模型对测试样本...
Matplotlib: 一个python版的matlab绘图接口,以2D为主,支持python、numpy、pandas基本数据结构 1、Matplotlib主要组成部分: ...
1.合并数据 concat、join、append、merge方法 1.1 concat pd.concat()通常用来连接DataFrame对象。默认情况下,axis=0,...
1.缺失值观察 .info()计算每一列的缺失值的个数,输出非空值non-null的个数及数据类型 .isnull()查看某一或者多列的缺失值 2.对缺失值进行处理 2.1一...
知识点梳理: 1.相对路径及绝对路径载入数据(使用os.getcwd()查看当前工作目录) 2.读取数据:read_table, read_csv, read_excel 3...
一:建表规约 1.【强制】表达是与否概念的字段,必须使用is_xxx的方式命名,数据类型是unsigned tinyint(1表示是,0表示否),此规则同样适用于odps建表...
select count(*)应该是一个比较常用的语句,用来统计记录行数。 但是,慢慢地你会发现,这个语句越来越慢了,为什么呢? count(*) 的实现方式 首先,我们来看...
1.查询某年的数据 1.1 select * from oa_item_info where created like '2018-%'; 1.2 select * from...
1. 查询“001”课程比“002”课程成绩高的所有学生的学号; 2. 查询课程编号“002”的成绩比课程编号“001”课程低的所有同学的学号、姓名; 3. 查询平均成绩大于...