2021-04-23

EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。

当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。

引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。

完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、赛题理解 1、赛题题目:零基础入门数据挖掘 - 二手车交易价格预测 2、 赛题概况 训练集:15万条 测试集A...
    微微微微辣阅读 116评论 0 0
  • EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习...
    4d2551dd443a阅读 100评论 0 0
  • 1.1 问题阐述 二手车的剩余价值是二手车交易流通中的一个重要环节,传统的剩余价值评估方法主要依靠二手车评估人员的...
    萌新昊宇阅读 3,359评论 1 0
  • day2:今天进行的是EDA部分,也就是数据探索性分析 EDA的目标 -主要在于熟悉数据集,了解数据集,对数据集进...
    酱油啊_阅读 523评论 0 1
  • 1️⃣.1️⃣ 赛题重述 1️⃣.2️⃣ 数据集概述思考💭💡 1️⃣.3️⃣ 预测结果评价指标⚒️ 2️⃣.1️⃣...
    柯摩Excalibur阅读 974评论 0 2