在中文互联网圈,锤子发布会的热度似乎不亚于 Apple、Google,甚至还有简书的直播分会场。虽然当时没想过参与观看直播,但架不住这几天网络上对锤子的吐槽太多,处于好奇,周末还是补看了这场发布会。这也是我第一次完整地观看锤子发布会,之前只看过媒体的摘要以及知乎上的花式评论。
发布会开头老罗介绍坚果手机时,表达了一个观点「微创新并不是无关紧要的」。从 UX/UI 设计师的角度,我无比赞同,因为这是我们本职工作中仅有的、可以用户被感知到的亮点;企业领导人重视细节当然也是好事,因为这会使 UX/UI 的工作有更大的施展空间。但是,我更倾向于将这些微创新、设计细节当做是 Little Big Details 那样让用户感动的贴心关怀、或是会心一笑的惊喜彩蛋,而不应该成为的主要卖点。
不过,这不是本文的重点,R1 也不是本次发布会的主角,重新定义了众多领域的坚果 TNT 才真正是焦点。
TNT 工作站建立了三种新的交互方案分别称作:Touch and Talk、Crystal Ball 以及 Poker Dealer。
对于 TNT 的褒奖,大家可以去看锤子发布会、锤子官网。至于批评,那网上就更多了。我只是在看发布会时,联想到自己公司的产品,有感而发,随便写写。
Action
虽然我从事交互设计,但由于最近做的一直是与 AI 相关的产品,因此在看老罗演示「革命性的交互方式」时,并没太注意交互的表象,而是不由自主地在想它们与 AI 的关联、实现方式。 就 Touch and Talk、Crystal Ball 而言,如果映射到 RL(Reinforcement Learning,增强学习)的概念,这 2 个功能背后的核心设计思想是一致的,都是:减小 Action Space、以得到更精准的推荐 Action。
什么是 Action ?
简单理解就是各种可用操作,点击按钮、填表单、选择元素、语音输入、等等都是 Action。在 RL 的模型中,Action 是可以由机器来自动执行的,因此不只是用户的操作。
什么是 Action Space ?
在某一个状态下,所有的「可用 Action」就是 Action Space。如果 Action Space 中只有一个 Action,可以直接自动执行;如果有多个 Action,可以再通过某种规则选 Top1,或是列出 TopN 个 Action 让用户再做选择。
对于 TNT 工作站的这 2 个功能来说:
Touch and Talk,是先根据「Touch 的元素」通过算法得到一个 Action Space、再通过「Talk 的内容」根据另一种算法进一步缩小 Action Space,最后选择一个匹配度最高的 Action 自动执行;
Crystal Ball,是根据「选中的元素」通过算法得到一个 Action Space,然后让用户去做选择。
算法
前面这样笼统地说概念,似乎很简单的样子,因为我一笔带过了最核心的问题 —— 推荐算法。
算法需要能推荐出来的足够精准的 Action,这才是用户体验的核心,至于以何种方式呈现,是第二位的事情。
比如最近 Google.IO 上所展示的 Smart Compose 功能:
观众能为之欢呼,是因为这种 AutoComplete(自动补全)的交互方式么?显然不是,几乎 90% 网站的输入框,都有这功能。对用户真正有价值的,是自动补全的「内容文字」,而这段「内容文字」,正是来自于背后的「推荐算法」。FLAG、
失败教训
我们做的是一款 PC 端平台类产品,之前每次 Demo 时,效果都不错,有很多强大的功能。但客户的试用效果都不理想,因为我们的算法(在 AI 的时代甚至都不能称之为算法)是比较初级的预设规则、模板,只要碰到「预设」之外的场景时,往往在体验上就会打折扣。
作为一款比较底层的产品,我们很少会针对上层的某一个具体场景去做针对性设计,更多还是考虑全局的兼容、通用性。而产品如果想好用,最理想的情况又是根据每一个细分场景去「量身定制」。
在摸索了一段时间后,我们深感一般的规则实在是难以同时兼顾到「通用」与「定制」,所以后来改变了方向、引入 RL 算法,期望通过机器学习,根据用户的实际场景实现「定制」的效果。
虽说要得到一个非常合适的算法,仍是一条漫长的道路,但可以确定的是:至少对我们而言,没有 RL 算法是条死路。
回到锤子
「TNT 工作站」的 Slogan 是「来自未来、改变一切」。
我坚信产品的未来是属于 AI 的,能否「改变一切」,AI 算法的能力是一个关键因素。
我不知道 Touch and Talk、Crystal Ball 背后的实现方案是什么,毕竟我对 AI 的理解还很浅薄、也没有实际体验过锤子的产品,不敢妄加猜测。
但是我注意到一个事实:锤子官网的招牌职位里,似乎没有 AI 相关岗位。