Kaggle Blog里的新知

Diabetic Retinopathy

  1. 处理彩色图像时,对所有点减去局部平均色,降低光照的影响

Kaggle做了一个Scripts板块,可以不用搭建本地环境也不用下载数据,就可以写代码Run模型,目前提供三种语言R/RMarkdown/Python。Kaggle Scripts

今日头条的公司叫字节跳动,Bytedance。

XGBoost再三出现在Kaggle的获奖者访谈中。

TF-IDF,一下来自百度百科:TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。

Feature Engineering似乎很重要。

一些想法

Data Science很深,是整个industry的挺细的一个部分。我觉得我的兴趣不在做深,而是什么都玩一点,感受人类发展的前沿或者次前沿,这样当未来降临时我已经准备好了。

在一段时间内不要自己去写算法,多了解和使用已有的包。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容