前言 xgboost是一种集成学习算法,通过回归树,每一次对残差(实际值与预测值之差)进行拟合,最后把预测值相加得到最终的预测值。比如一个小男孩是10岁,我用一棵树去拟合,得...
前言 xgboost是一种集成学习算法,通过回归树,每一次对残差(实际值与预测值之差)进行拟合,最后把预测值相加得到最终的预测值。比如一个小男孩是10岁,我用一棵树去拟合,得...
r: 必须打开一个存在的文件,且只能进行读操作 r+:和r一样,必须打开一个已有的文件。最开始光标在文件前面。如果先读,读完后光标在文件末尾,再写,只是在原来文件末尾追加;...
本文主要摘自官方文档 1.可以指定多个网址。如果是规律的。例如: http://example.com/page/1 http://example.com/page/2 ht...
@iHTCboy 我用了一下那个 是驱动浏览器去爬取吧 一直叫我输入验证码
Python爬虫天猫店铺全部商品一记1、前言 最近小姐姐工作需要,需要爬取天猫某店的全部商品,正好小哥学习了Python几个月,就答应上手试试!结果第一道题就难住了,天猫登陆需要账号密码和验证码!!!虽然知道可...
@iHTCboy 好吧 还是要多谢你
Python爬虫天猫店铺全部商品一记1、前言 最近小姐姐工作需要,需要爬取天猫某店的全部商品,正好小哥学习了Python几个月,就答应上手试试!结果第一道题就难住了,天猫登陆需要账号密码和验证码!!!虽然知道可...
@iHTCboy 可以给一个参考链接或是告知下用什么包么
Python爬虫天猫店铺全部商品一记1、前言 最近小姐姐工作需要,需要爬取天猫某店的全部商品,正好小哥学习了Python几个月,就答应上手试试!结果第一道题就难住了,天猫登陆需要账号密码和验证码!!!虽然知道可...
本文内容主要摘自python machine learning 2nd edition 1、假设我们有以下三个文本 • 'The sun is shining' • 'Th...
今天想梳理一下kaggles上面的项目,对于一些感兴趣的,以后再仔细研究下 1、https://www.kaggle.com/c/titanic description:St...
-----程序员遇到问题,或者想学习什么,第一个念头可能都是百度/谷歌。然而作为全球最大的代码托管平台,github上面有着海量的代码以及教程,前者是csdn 博客园等网站不...
------朴素贝叶斯是一个基于概率的多分类算法 举个例子,周六了,群主加班的概率是0.3,爬山的概率是0.2,和wanxian约会的概率是0.5.这时贝叶斯就会判定群主周六...
一、基本概念 1.cart使用基尼系数作为划分标准。基尼系数越小,则不纯度越低,区分的越彻底。 2.假设有k个类别,第k个类别的概率为,则基尼系数表达式为: Gini(p)=...
一、EDA ------explore data analysis,顾名思义,数据探索性分析。主要目的是对数据有个大体的认识 1、看下整体数据信息,有多少行,多少特征,特征是...
在spss中,正态分布的考察方法有,计算偏度系数和峰度系数加以考察;通过绘制直方图、PP图来考察。也可以通过各种假设检验,最常用的对正态分布的检验就是K-S单样本检验 1.K...
1.小概率事件 习惯上将发生概率很小,如P<=0.05的事件称为小概率事件。 2.小概率反证法 假设某一事件是小概率,如果在一次抽样研究中竟然就发现了该事件。这显然违反了小概...
最近做一个项目,需要对时间类型进行选择,然而,当我在选择个案输入条件V1>2010/01/01&V1<2010/07/01时一个都没选中(V1是时间格式)。于是上百度找,没发...
想到哪里就写到哪里了 1、报表筛选 是对下表中所有的信息进行筛选。比如日期中有1到31日的数据,就可以把日期字段加入到报表 筛选里面 2、报表筛选以及行,列标签还可以自定义...
本篇文章暂不讨论DQL,按照数据库/表/列/数据分别介绍 一、对数据库的操作 1、创建数据库:create database db_name/create schema d...