数据分析与挖掘简介

       20世纪40年代第一台数字计算机出现到 90年代中期之前,信息化建设可归为以单机应用为主要特征的数字化阶段(可称为信息化 1.0),而第一次的信息化浪潮,始自 20世纪 80年代个人计算机的大规模普及应用。

       从90年代中期开始,以美国提出“信息高速公路”建设计划为重要标志,互联网开始了其大规模商用进程,带来了信息化建设的第二次浪潮,即以联网应用为主要特征的网络化阶段(可称为信息化 2.0)。

        当前,信息化建设的第三次浪潮扑面而来。过去20余年信息科技和信息化的井喷式发展,信息技术的不断低成本化与互联网及其延伸所带来的无处不在的信息技术应用,宽带移动泛在互联驱动的人机物广泛连接,云计算模式驱动的数据大规模汇聚,导致了数据类型的多样性和规模的指数增长,积累了规模巨大的多源异构数据资源,产生了“大数据现象”。以此为标志,信息化正在开启一个新的阶段,即以数据的深度挖掘与融合应用为主要特征的智慧化阶段(可称为信息化3.0)。

        信息化发展的三个阶段,数字化、网络化和智能化。数字化奠定基础,实现数据资源的获取和积累;网络化构造平台,促进数据资源的流通和汇聚;智能化展现能力,通过多源数据的融合分析呈现信息应用的类人智能,帮助人类更好认知事物和解决问题。

        由于数据往往是大规模、时变、高维和多属性的, 将信息论、数据挖掘、机器学习等手段引入科学数据分析中,辅助分析人员对复杂科学数据进行半自动的分析,是一种有前景的解决方案。

        数据挖掘就是从大量数据(文本)中挖掘出来隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。它利用各种分析工具在大量数据中寻找其规律和发现模型与数据之间的关系过程,是统计学、数据库技术和人工智能技术的结合。

1、数据分析与挖掘过程

数据挖掘的一般过程

2、数据分析与挖掘的算法

(1)数据挖掘算法:

数据挖掘算法概况
分析与预测各类详细算法
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 前段时间,一位朋友的一个爱好户外的朋友刘银川,一个人进入羌塘无人区,想60天穿越羌塘。后来,他消失了,已经和世界失...
    杨群Nice阅读 477评论 0 1
  • 喵喵~ 清晨的第一声叫唤 离家上学后就很少能听到猫的呼声 前不久偶然发现楼道上出现的小猫 不知该喜还是忧 十分惹人...
    小橙cc阅读 665评论 9 4
  • 人这一辈子,如果后悔的事情太多,就证明是个渣了。可能本就是对自己都不负责任的人,便不用提对别人负责了。 ...
    Latte__阅读 266评论 0 1
  • 在知识奠定的基础上出去旅游,去感受各地风土人情,感受历史气息,这种美超越简单拍照的快感。
    兰呃呃阅读 340评论 0 0

友情链接更多精彩内容