Python for data analysis

python for data analysis.jpg

看的是第二版英文版, pandas 作者写的,主要介绍用 pandas 进行数据处理。看了前 8 章后面的看不下去了,还是有一点收获的,pandas 也不是说看完这本书就能掌握的,要在使用中慢慢熟练。

工欲善其事必先利其器, IPython + jupyter notebook + pandas 确实很强大,能够很方便的进行数据处理与分析。所以熟练使用 NumPy Pandas Matplotlib 是必须的。

数据分析中数据的采集、清洗、转换要占去至少一大半的时间,真正分析、建模、跑机器学习算法只是其中的一个环节,所以数据处理的过程是非常重要的。对于初学者来说不要太关注机器学习等算法的细节,很多问题并不是一个算法就能解决的(除非是颠覆性的算法),实践证明好的数据 + 简单的算法要比一般的数据 + 复杂的算法效果好的多,我们应该花更多的精力在数据上,而不是去死磕一个算法的参数。

对于程序员来说把技术应用到产品中产生价值才是有意义的,不要把机器学习算法细节看的这么重(那是研究人员的活),大体了解原理,会用第三方库训练模型,运用到产品中产生价值才是有意义的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容