240 发简信
IP属地:浙江
  • Seaborn

    功能简介 计算多变量间关系 可视化类别变量的观测与统计 可视化单变量或多变量分布并与其子数据集比较 对多表统计图的制作高度抽象并简化可视化过程 ...

  • 分类模型—非监督学习

    监督学习和非监督学习的区别 监督学习是有一个有标签的训练集,我们的目标是能找到区分正负样本的决策边界,需要使用已有数据拟合一个假设函数;而非监督...

  • Resize,w 360,h 240
    分类模型—监督学习

    监督学习 KNN 基本原理 寻找目标数据点附近最近的K个点,采用投票的方式判断测试数据点所属类别 算法步骤 1.计算测试数据与训练数据之间的距离...

  • 特征工程—分箱

    分箱法 原理 建模过程中会遇到很多连续型特征,对此需要进行离散化,特别情况下需要按照属性值划分子区间,在此基础之上模型会更加稳定,降低了模型过拟...

  • 数据建模—流程

    数据了解 1.数据读取 open(), pd.read_csv(), datasets.load_iris() 注:原始数据的行、列标题;分隔符...

  • Resize,w 360,h 240