数据科学简谈


       随着互联网、大数据技术的快速发展,数据量成指数级增长,近年来,数据科学成为一个热门的话题。简单的说,数据科学是关于如何处理数据、获取知识,并用知识解决业务问题(预测、优化、分类、聚类,协助决策等)的过程。

    数据科学的发展简史:

    -->数据科学在20世纪60年代已被提出。

    -->1974年彼得.诺尔出版《计算机方法的简明调查》中将数据科学定义为:“处理数据的科学,一旦数据与其代表事物的关系被建立起来,将为其他领域与科学提供借鉴”。

    -->1996年在日本召开的“数据科学、分类和相关方法”,已经将数据科学作为会议的主题词。

    -->2001年美国统计学教授威廉.s.克利夫兰发表了《数据科学:拓展统计学的技术领域的行动计划》,有人认为是克利夫兰首次将数据科学作为一个单独的学科,奠定了数据科学的理论基础。

    -->2015年,美国政府任命 DJ Patil为史上第一任首席数据科学家。被认为是对众多科技公司大规模招募数据团队行为的效仿。

    一张图看数据科学涉及的领域:


数据科学韦恩图

            数学包括:微积分,线性代数,概率论,统计学等;

            计算机部分包括:计算机编程语言(JAVA,R,Python,C/C++,Ruby,Go,SQL等),数据库技术(Mysql,Oracle,MongoDB等),大数据技术(Hadoop,Spark等)

            专业知识包括:金融、零售、医药、教育、生物等等各行各业的专业领域知识

    数据科学的流程:


数据科学的流程

    数据科学的核心问题,是对数据进行分析、挖掘并提取其价值,以获得对事物的洞察。

    数据科学家:数据科学家是伴随着大数据技术的崛起和数据科学的兴起而出现的新的就业岗位。数据科学家被誉为21世纪最性感的职业!数据科学家需要拥有一系列的知识和技能,包括一定的数据知识,机器学习、数据可视化方面的知识和技能,编程能力,以及对具体应用领域(行业问题)的深入了解。此外,数据科学家需要具有良好的沟通能力,能够和业务部门深入沟通,对问题进行抽象,并把分析结果清楚地展示给业务部门,帮助他们做出决策。

    数据科学的基本原则:

        原则1:数据分析可以划分成一系列明确的阶段。

        原则2:数据分析可以分为 描述性分析 和 预测性分析。

        原则3:实体的相似度。(没有一片叶子是相同的,但它们是相似的~)

        原则4:需要严格考察模型的泛化能力。

        原则5:分析结果的评估与特定应用场景有关。

        原则6:相关性不同于因果关系。(闪电和雷声是相关的,但它们不是因果关系,它们有共同的原因:大气中放电现象)

        原则7:通过并行处理提高数据处理(分析)速度。

        原则8:对增量数据与存量数据进行区分处理。

    后续,我会从数据 - 编程 - 建模 - 业务案例 的方式对数据科学慢慢道来。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,372评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,368评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,415评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,157评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,171评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,125评论 1 297
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,028评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,887评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,310评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,533评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,690评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,411评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,004评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,659评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,812评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,693评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,577评论 2 353

推荐阅读更多精彩内容