![240](https://cdn2.jianshu.io/assets/default_avatar/12-aeeea4bedf10f2a12c0d50d626951489.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
XGBoost现在风头正盛,把它也用在Titanic试试咯这个Kernel值得一试 最终测试结果0.886644219978,比RF好,最重要的是快啊
Kaggle上的Titanic,先跟着别人做,学习下别人的特征工程和调参。https://www.kaggle.com/startupsci/titanic-data-sci...
这段时间在看GBDT,这篇文章写的很好转载过来。http://www.cnblogs.com/LeftNotEasy/archive/2011/03/07/1976562.h...
自己造轮子系列今天造的是AdaBoost,基分类器用的是DS(decision stump)。之所以会写这个系列主要是我觉得一方面可以锻炼coding能力,而另一方面也有助于...
自己造轮子是理解算法的好办法,今天写了一个ID3的,对决策树理解更加深刻了
特征工程里会遇到属性非数值难以处理的情况,这时就可以用One-hot Encoding了 今天学习了sklearn里面的OneHotEncoder,笔记如下:在很多机器学习任...
在Python中字符串处理函数里有三个去空格(包括'\n', '\r', '\t', ' ')的函数: strip只能删除两侧的字符 in:'****adf ****adfa...
今天写程序的时候发现两个axis其实是有区别的,程序如下 DataFrame numpy 乱了吧,原因是没有理解axis简单的来说就是axis=0代表跨行(down) = 列...
这两天学习的时候对python中的闭包产生了兴趣,网上这篇文章写得很好,写在这里大家看看。 1. 闭包的概念 首先还得从基本概念说起,什么是闭包呢?来看下维基上的解释: 复...
跟着机器学习实战写代码,决策树这里有一段是保存决策树,使用pickle模块保存,原书是基于2.7的,在3.6上有坑,在这里跟大家分享下。 ''' def storeTree(...
做数据分析的时候经常会用到字典,有时需要对键值做一些处理,py2中支持dict.keys()[]的这种形式直接提取键值,py3不支持了,会直接报错。给大家提供一个简单的办法,...
socket的连接是很方便的,但是代码复用性差就不那么方便了。比方说,不同的请求有不同的msgid,端口也可能不通,所以拼接的时候就比较蛋疼了。那么怎么办呢,很简单就是抽...
在网上看很多牛人都有自己的博客,访问量超多,也指导了我们的成长,现在我也要开始写我的博客了,虽然不是牛人,但是也可以记录我遇到的坑和问题,供大家参考啊!
01. 我一直觉得人生最幸运的事情之一就是有人能够给你提供他们自己辛苦研究的成果,无论是工作上的还是生活上的。这让我们可以站在巨人的肩膀上前进,避免一次又一次地掉进他们陷入过...
“我想成为有成就的人”“我想摆脱消极的思考方法,积极地生活下去”“我想改掉坏习惯”……或许很多人都对自己抱有这样的期望吧,但实际上,能够真正做到的人少之又少。 如果想要改变人...
最近在看《沟通的艺术》这本书,对沟通有了全新的认识。《沟通的艺术》这本书再版了14次,初版至今超过了30年。许多沟通类的课程或者书籍,都是以这本书为蓝本。 《沟通的艺术》全书...
1.Markdown Here Markdown Here 的用法非常简单,如果你当前编辑的页面是在安装前打开的,需要先刷洗一下页面。然后在编辑区域里使用 Markdown ...