大数据分析主要做什么?

数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。但从狭义上来看,我认为数据科学就是解决三个问题:

1、data pre-processing

2、data interpretation

3、data modeling and analysis

这也就是我们做数据工作的三个大步骤

1、原始数据要经过一连串收集、提取、清洗、整理等等的预处理过程,才能形成高质量的数据

2、我们想看看数据“长什么样”,有什么特点和规律

3、按照自己的需要,比如要对数据贴标签分类,或者预测,或者想要从大量复杂的数据中提取有价值的且不易发现的信息,都要对数据建模,得到output。

这三个步骤未必严谨,每个大步骤下面可能依问题的不同也会有不同的小步骤,按照这个思路走,数据一般不会做跑偏。

有兴趣的小伙伴可以多关注一下科多大数据:

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 我肯定感冒了。 这几天家的温度一点不稳定,温差大的不行,早晨一点儿没有春天的感觉,到了两三点钟又热得不行。我抽抽鼻...
    永日嬷阅读 4,592评论 0 0
  • 漫步曾溜達的街道 回憶在擺盪 擺花街邊上豆花店 何日君再來 她依舊如煙火寂寞 橫街 夾集昔日浮生 陪伴 陋巷一醉方...
    秋鳶子阅读 3,146评论 0 1
  • 早上8点,给阿焕发了一条消息。 “早” “不行了” “怎么了,晚点了” 我知道这小子昨天一定兴奋的晚睡,早上铁定的...
    李叁柒阅读 2,761评论 3 2
  • n 是Node的一个模块,作者是TJ Holowaychuk(鼎鼎大名的Express框架作者),就像它的名字一样...
    ShindouHikaru阅读 24,396评论 1 1

友情链接更多精彩内容