一名前端工程师的机器学习之旅

内容来源:2017年6月24日,美登科技前端架构师邓鋆在“腾讯Web前端大会 TFC 2017”进行《一名前端工程师的机器学习之旅》演讲分享。IT 大咖说(WeChat_ID:itdakashuo)作为独家视频合作方,经主办方和讲者审阅授权发布。

阅读字数:1980 | 4分钟阅读

观看嘉宾完整演讲视频及PPT,请点击:http://t.cn/ELJPm9v

摘要

美登科技前端工程师邓鋆分享自己的机器学习之旅心路历程。

未来的前端

多元输入。现有的输入从最早的键盘鼠标到现在的触屏,以后可能会是语音和手势。

另外一个方面就是因人而异。我认为多年以后,可能每个用户看到同一个产品的交互都是不一样的。在人工智能面前,我们要做的事情不再是一个产品,也许会为每一个用户创造一个新的产品,用最适应这个用户的方式去改造他的体验。

以及信息层次丰富。信息应该有一种层次化的表达,应该跟随人的注意力和一些细节的动作主动把一些信息展示出来,而其它的信息更多是保留在背后,在整个应用中作为一个暂时没有接触到的部分。但是当你需要它的时候,它能够第一时间跳到你面前。

还有就是VR和AR。通过近几年反复的推广,这两个技术已经是开始小有成果的状态了。但什么时候前端用户交互之间能被这两个技术所颠覆,目前仍是未知数。

五分钟搞懂机器学习

人工智能在近几年的突破巨大,主要体现在几个方面。第一个是硬件的突破,第二个是算法的突破,第三个是大数据的存储。这三件事促使了现在机器学习的领域一次又一次大的爆炸。

机器学习是什么

机器学习赋予了计算机“不需要特定的编程而能够自行学习”的能力,通过训练来解决特定的简单问题。

传统编程与机器学习

传统编程最开始是人类去发现需求,然后人类把需求转化成一个抽象的设计。要实现它必须要有客户端各种程序和服务端巨大的库,在此基础之上再去做相应的开发,逐步分解并解决每一个子问题。最后还需要人或者机器来进行测试。而真正交给机器去做的一步只有运行,其它步骤都是需要人工进行操作的。

在机器学习的方式下,首先假设要解决一个特定的问题,第一个步骤还是了解需求,可以预见将来有一天机器能够去发现人类的需求,然后机器去找寻需求的规律。机器自动通过大量的数据、实验,找到这些事情相互的关联,这个过程是完全没有人工参与的。我们只是设定了网络结构和目标函数,除此之外的思考过程都是机器完成的,机器会自己在事后在验证它的方式。由于机器需要吃掉大量的数据,所以人类需要准备数据。最后由机器完成执行,人类辅助机器做测试与纠错。

浅层学习

如上图所示,右边区域是我们的问题,黄色区域里面有很多的点是我们所收集到的数据,背景色是我们找到的解。这幅图展现的就是通过浅层学习找到了问题的解。但是浅层学习有一个巨大的缺点就是特征需要人工提前做抽取和处理。

深度学习

深度学习从结构上和浅层学习有巨大的区别,我们引入了很多hidden layers。如图所示,在一次乘法、一次加法、一次取极值之后,到最后输出结果。深度学习就是这样一个公式。

数据很重要

硬件最大的变化就是对GPU的使用越来越频繁。人工智能深度学习的函数、公式内部涉及的是大量的浮点运算。这些函数在GPU出现之后,有大量的浮点运算就交给GPU。事实上,深度学习在GPU上的执行效率可能是在CPU上的30~50倍。GPU也给机器学习带来了巨大的促进作用。

我们的尝试

千里之行始于足下,我们的第一个目标是想要知道用户喜欢多大的字体,这是一个很简单同时也很有用的事。不同年龄用户喜欢的字体大小都是不一样的,老年人比较喜欢偏大的字体,但是年轻人或使用电脑显示器的会倾向于使用小的字体。这个就是机器学习很擅长解决的预测。

怎么做

第一步是数据的采集。先要有大量的数据,什么用户喜欢多大的字体。第二步就是训练,把之前采集到的数据通过机器学习的方式去训练,让这个网络拥有根据新用户的特征能判断出用户喜欢多大字体的能力。还有服务,就是把它最终用到应用内,对前端开放,让前端程序能够得到这些用户信息。再然后就是实际的把这些东西做到前端应用上去。

常用函数与网络结构

预测服务我们通常会用softmax,要判断一个用户属于哪个类别,使用softmax来对它进行预测。

在没有预先知道有几个类别的时候,可以使用k-means让机器学习告诉我们是怎样的情况,指定分类的数量,然后机器学习自动帮助我们完成分类。

t-SNE是一个很好的降维方式。降维有一个很大的作用就是数据可视化,我们能直观地看到这些数据的分布。另一个作用是寻找最近点的命令。

CNN用于处理机器视觉,RNN和LTSM是做流式处理。

DeepQ Learning是近年来机器学习的一个热点,当机器有几种选择的时候,它会尽量让机器去预测哪个选择最好,然后看这个选择是否和机器预测的一样。这就意味着当我们要解决这类问题的时候,不需要预先准备测试数据,这个算法可以自己学习。

一些奇奇怪怪的优化

预训练与组合网络。预训练是机器学习中很重要的部分,当你需要解决的问题有些复杂的时候,可以预训练网络的部分组合,这样可以大幅提高网络的训练速度。

还有就是规则化调整与网络简化,以及极端偏见和理性仲裁者。

实际业务

实际上我们接下来准备去探索一些其它的事情,比如语义搜索、功能推荐、智能推荐、流失防止和催化转化,以及自动化兼容性测试。

值得一提的是谷歌发布了deeplearn.js,正式拉开了在前端做机器学习的工业化序幕。

今天的分享就到这里,谢谢大家!

编者:IT大咖说,转载请标明版权和出处

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容