本专辑内容的阅读对象是有一定的高数和线性代数基础,但是缺少编程训练的人。
曾经我只能对着数学公式发呆,现在学会怎么在现实世界中使用了。
现在大数据火了,各种培训机构和大数据书籍层出不穷,喊口号更是惊人,像什么‘从零入门机器学习’,‘21天从入门到精通大数据’ ,‘从零开始挑战30万年薪’等等,其火热程度不逊于当年Java。大数据被吹得神乎其神,似乎只要上了大数据,就能翻云覆雨,业绩蹭蹭蹭蹭,追赶BAT不是梦。再加上机器学习框架越来越完善,使得做机器学习的门槛越来越低,似乎只要懂点简单的电脑技术的人都能搞机器学习。各公司不管大公司还是小公司,不说自己搞大数据人工智能都不好意思。
大数据领域积累了巨大的泡沫,泡沫之后谁在裸泳?那些趁着风口进入这个行业的人,大部分都是半吊子,以为会调API,会暴力调参就万事大吉了。在人工智能应用中,最最最根本的是对业务场景的理解,以及对背后数学公式的理解,这些都不是依样画葫芦的暴力调参的人能做的。
撇开金融,互联网等在大数据做得比较早的领域,还有很多很多领域需要大数据的改造,那里同样需要人才。可是大学生为什么不受待见呢,那些脑残的“读大学不如搬砖”的言论就像月经贴时不时来一波。说白了,就是不懂理论联系实际啊。
什么是理论联系实际?以前我看过一些鸡汤文,天真认为只要肯接受基层的苦和累就不怕成不了事,就能将所学知识用上,这就是理论联系实际。后来发现不是这样的,我们是上过大学的人,思考的事情自然不是一线工人所思考的,也许他们看到的是生产线正常运行,懂得看技术操作手册,而我们则是要明白其中的原理,懂得模拟状态,知道怎么改善。他们看到的是产品被生成出来的样子,我们看到的是背后的数学原理和工程技术。如果不能看到这一层,怎么理论联系实际,如何做事,大学生的成本可比普通工人高。
为何大学无用论盛行,除了教育的失败,另外就是错误的社会风气罢了。“上了大学就轻松了”,“大学就是享受的”,“60分万岁”...等等这些话以前是不是经常听到呢,这就是所谓的少壮不努力,老大徒伤悲吧。
这不是我们要讲的主题,我们要讲的是,为什么我在学校学习了那么多知识,到了工作中用不上?
因为你不懂用啊,明明知道可以这样做,却不知道从何入手,学校教会你怎么从理论上解决问题,但没有教会你在实际上解决问题。
举个简单的例子,在市场营销领域,有一个简单好用的预测模型--BASS模型,你知道可以用可以用最小二乘方法求解参数,可是你会求解吗?如果在实际的应用场景中需要加入广告的因素,需要多加一个参数,只是在公式的后边增加一个修正项,类似LR中的正则化,和书本中的公式不一样了,这时候又该怎么办呢?
下面我们以BASS模型的数学公式以及简单变种,告诉大家我们在说什么。
这样的数学模型在工作学习中经常遇到,不算太难,但是没有现成的工具可用,特别是在实际情况中,我们经常会根据现实场景加入各种调节参数,此时就需要我们自己手动求解了。
BASS的数学公式:
你会求解其中的m,p,q等参数吗?明明很简单的数学模型却无从下手,你是不是也遇到这种尴尬的情况呢?这就是我为什么要写这个专辑的原因。旨在帮助那些有一定的高数和线性代数基础,但是不会编程的同学,学习怎么将数学公式转成计算机代码,用计算机求解数学公式,将书本理论转成实际生产力。
我曾经什么都不懂,因为好奇看了一些模式识别和数据挖掘方面的书籍,觉得有用但是不知道怎么用。直到我发现了MATLAB,相信很多同学都知道这款在高校最受欢迎的最强大的数值计算软件,当时简直是亮瞎了我的眼睛。说亮瞎我的眼一点也不为过,我不是学霸,虽然知道高数和代数等是所有工程学的基础,但是我的成绩一般。当我发现MATLAB后我觉得我的数学有救了,就算我不懂其中的数学奥秘,我也可以用MATLAB来计算,大不了我暴力求解啊。从此,我不再害怕数理逻辑和工程学,尽管对其中的数学推导过程依旧一知半解。
但是我们这个专辑不用MATLAB作为我们的开发软件,而是用python。并不是我不喜欢MATLAB,至今我依旧对MATLAB青睐有加,只是离开毕业后就没再用过MATLAB,已经基本忘记怎么使用了。如果你还没毕业,我强烈建议你取学习MATLAB,学习其基本变成方法,数值计算和各种工程学库,相信我,尽管毕业后可能也不会再用MATLAB,但是你学到的知识对今后的工作学习有深远影响。以后你就会明白,最重要的是思考问题的能力和学习的能力,工具并不重要,现在大数据领域各种工具层出不穷,C的,java的,python的,R的...但是,其基本数学模型并没有太大变化,终究我们是要用数学模型去解决现实中的问题,而不是显摆学了哪个软件,知道多少小技巧。
向大家推荐python,这个软件在大数据领域出尽了风头,而且这两年超过R语言成为大数据与人工智能领域的标配语言,市场上已经出现各种python培训课程,口号你懂的,“30天从入门到精通,挑战年薪30w”,其火热程度可想而知。python刚开始在大数据领域发力的时候,对标的是MATLAB,口号是:和MATLAB一样强大,比MATLAB更加好用。在numpy,scipy,staticmodel,pandas,sklearn等库越来越流行下,python已经成为数据科学工作者最常用的语言。此外,python作为一门胶水语言,可以无缝和hadoop,spark,TensorFlow等大数据,深度学习系统中,对数据库,网站后台等也有很好的支持。学习python,你不会后悔。
后话
在接下来的一段时间里,我们将一同学习怎么使用python,学习使用python解决常见的数学模型,学习怎么对生活现象建模。在此期间,我们将具体学习python基础语法,python简单绘图,numpy,scipy,pandas等数据处理有科学计算库的使用,以及参数方程的求解方法,通过专辑的学习,能够掌握一般难度数学建模问题,并享受解决问题的乐趣。
好了,下次见。
master苏.