功能简介 计算多变量间关系 可视化类别变量的观测与统计 可视化单变量或多变量分布并与其子数据集比较 对多表统计图的制作高度抽象并简化可视化过程 提供调色板工具生动再现数据 s...

IP属地:浙江
功能简介 计算多变量间关系 可视化类别变量的观测与统计 可视化单变量或多变量分布并与其子数据集比较 对多表统计图的制作高度抽象并简化可视化过程 提供调色板工具生动再现数据 s...
监督学习和非监督学习的区别 监督学习是有一个有标签的训练集,我们的目标是能找到区分正负样本的决策边界,需要使用已有数据拟合一个假设函数;而非监督学习的数据不带有任何标签,需要...
监督学习 KNN 基本原理 寻找目标数据点附近最近的K个点,采用投票的方式判断测试数据点所属类别 算法步骤 1.计算测试数据与训练数据之间的距离2.按照距离的递增关系进行排序...
分箱法 原理 建模过程中会遇到很多连续型特征,对此需要进行离散化,特别情况下需要按照属性值划分子区间,在此基础之上模型会更加稳定,降低了模型过拟合的风险 方法 有监督分箱 卡...
数据了解 1.数据读取 open(), pd.read_csv(), datasets.load_iris() 注:原始数据的行、列标题;分隔符;其中使用datasets时运...
学生小白一枚,准备求职产品运营相关的工作,首先就拜读了张亮的《从零开始做运营》入门篇和进阶篇,并把两本书的内容整理成思维导图。这两本书内容很实用,没有高深的理论,更多的是一些...