项目简介: 这是一个音乐服务数据集,项目里有个小型的数据集。该数据集记录艺术家,歌曲,时长,包括一些人口统计和地理数据,时间戳,性别,用户等级,...
SQL 常用命令 注意尽管 SQL 不区分大小写(它不在乎你将语句全部大写还是小写),但是命令关键字最好是大写,还有关键词的顺序非常重要!
什么是过拟合和欠拟合 什么是过拟合和欠拟合,我们来看一下下图: 在图中,第一张图是欠拟合,第二张图拟合刚好,第三张图是过拟合; 欠拟合就是模型在...
这里我介绍数据分析的两个评估指标,F1 score跟ROC曲线,在介绍F1 score跟ROC曲线之前,我们要先了解以下概念: 混淆矩阵 准确率...
我们知道机器学习领域的一些最重要的分类算法,包括以下算法: 逻辑回归 神经网络 决策树 支持向量机 现在我们将有机会在实际数据中运用它们!在 s...
Mac安装 首先,你需要访问 http://cran.rstudio.com,下载并安装 R 编程语言。下载后,我们一直点下一步安装就可以了。 ...
下面我们通过一个简单例子来梳理数据清理步骤,也可以直接打开我的项目查看源代码; 1.收集数据 首页我们要加载项目里的数据集,代码如下: 2.评估...
流程 在进行任何清理操作之前,请先将每份数据备份,所有清理操作请在这份复件上进行,保留肮脏和/或凌乱的原始数据集以便日后查看。要在 pandas...
Show Me(智能显示) Show Me 功能使你能够快速了解可以添加的基本图表。你可以在工作表的右上角找到该功能,我们点开Show Me(智...