240 发简信
IP属地:北京
  • 线性回归

    似然函数 什么样的参数跟我们的数据组合后恰好是真实值。既什么样的参数的极值点 对数似然 似然是累乘,转换为对数似然,把乘法转换为加法(对数里的乘法可已转换为加法)只是极值变换...

  • 120
    决策树算法概述

    树模型 决策树:从根节点开始,一步步走到叶子节点(决策) 所有的数据最终都会落到叶子节点,既可以做分类也可以做回归image.png决策树对过滤策略的先后顺序有要求,第一步过...

  • 120
    5.2.4 聚类可是化工具-TSNE

    通常输入的特征数据是高维的(大于3维),一般难以直接以原特征对聚类结果进行展示。而TSNE提供了一种有效的数据降维方式,让我们可以在2维或者3维的空间中展示聚类结果 对餐饮客...

  • 120
    5.2.2 K-Mean聚类算法

    K-Means算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据换分为预定的类数K,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。...

  • 4.4 主成分分析

    在Python中,主成分分析的函数位于Scikit-Learn下:sklearn.decomposition.PCA(n_components = None, copy = ...

  • 120
    4.3.3 连续属性离散化

    一些数据挖掘算法,要求数据是分类属性形式的。所以常常需要将连续属性变换成分类属性,即连续属性离散化。 常用的离散化方法 等宽法将属性的值域分成具有相同宽度的区间,区间的个数由...

  • 4.3.2 数据规范化

    数据规范化(归一化)处理是数据挖掘中的一项基础工作。消除指标间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例缩放,使之落入一个特定的区域,便于进行综合分析。如...

  • 120
    Series/DataFrame Selecting/Indexing/Reindexing/多级index

    Pandas DataFrame Selecting and Indexing image.png image.png image.png image.png image.p...

  • 120
    Pandas Series/DataFrame创建/操作/理解

    Pandas Series创建/操作 Pandas Series创建 Pandas Series操作 Pandas Dataframe DataFrame操作 深入理解Ser...

  • 数组/矩阵的创建/查询/计算/序列化

    数组的创建和查询 普通列表的形式创建数组 数组属性 全零矩阵和单位矩阵 查询数组元素 数据与矩阵运算 数组的创建 数组的运算 矩阵创建 矩阵的运算 array常用的函数 使用...