前言:在我的上一份文章中,介绍到了数据清洗的常用方法及其Python实现。这篇文章主要是在数据清洗后的特征工程的实现,特征工程包含三个方面,分别为特征提取、特征创造、特征选择...
IP属地:四川
前言:在我的上一份文章中,介绍到了数据清洗的常用方法及其Python实现。这篇文章主要是在数据清洗后的特征工程的实现,特征工程包含三个方面,分别为特征提取、特征创造、特征选择...
前言:经过前面两篇文章的阅读,我们已经对数据的获取有了一定的概念。在数据挖掘的工作中,我们很大一部分的时间都会花在数据处理和特征工程上面,真正的可视化和建模反而时间占比不大。...
一:爬虫认知 爬虫名称由来于蜘蛛结网,蜘蛛在一个一个的蛛网节点中等待猎物的到来。而我们的爬虫也是从网页页面的HTML资源中取出我们要的节点资源。二者过程相似,因此爬虫称之为S...
在正则表达式介绍中,我们学习了正则表达式的基本用法。列举了一些简单的例子。在这一部分,将介绍更高级的用法,捕获分组。 捕获分组 上一部分我们用正则从字符串搜索出我们想要的,并...
1.SQL的语句顺序(理论) 2.SQL数据库的选择命令 2.1 数据库的选择(实操) 作用命令查看当前有哪些数据库show databases;选择数据库use datab...
如果使用keras的cifar10.load_data()函数,你会发现,代码会自动去下载 cifar-10-python.tar.gz 文件实际上,通过查看cifar10....