数据分析一般会遵循经典的数据科学流水线方法,其名为OSEMN
1.Obtain(获取):解决问题首先要能获取到数据;
2.Scrub(清洗):这包含对缺失数据或无效数据的数据填充和固定列名;
3.Explore(探索):再然后就是探索数据,期待从数据中得到一些启发,找出离群数据和怪异数据,并理解每一个可解释性变量和响应变量之间的关系,为此我们可以用相关数矩陈来搞定,
4.Model(建模):数据建模可以预测员工是否是嫌疑人;
5.INterpret(解读):最后一步是解读数据。随着数据分析,最后会得出什么结论?什么因素导致员工dao pian
数据学科OSEMN原则
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- //我所经历的大数据平台发展史(三):互联网时代 • 上篇http://www.infoq.com/cn/arti...
- 连着考了四天试泡了四天图书馆的我终于可以放几天假了orz 于是今天在宿舍刷完了这部由我十元主演的日剧,剩下一...