
IP属地:浙江
功能简介 计算多变量间关系 可视化类别变量的观测与统计 可视化单变量或多变量分布并与其子数据集比较 对多表统计图的制作高度抽象并简化可视化过程 ...
监督学习和非监督学习的区别 监督学习是有一个有标签的训练集,我们的目标是能找到区分正负样本的决策边界,需要使用已有数据拟合一个假设函数;而非监督...
监督学习 KNN 基本原理 寻找目标数据点附近最近的K个点,采用投票的方式判断测试数据点所属类别 算法步骤 1.计算测试数据与训练数据之间的距离...
分箱法 原理 建模过程中会遇到很多连续型特征,对此需要进行离散化,特别情况下需要按照属性值划分子区间,在此基础之上模型会更加稳定,降低了模型过拟...
数据了解 1.数据读取 open(), pd.read_csv(), datasets.load_iris() 注:原始数据的行、列标题;分隔符...