本文译自 Jakob Nielsen 的 Guesses vs. Data as Basis for Design Recommendations

摘要：不要觉得只有大数据才有意义，哪怕是最小集的事实作证（例如观察2名用户）也能大大提升界面设计决策的正确性。

一个交互设计在线小组里讨论了一个问题（参与者的真实信息将不会公开）：

如果需要调整网页字体大小，是应该向用户提供额外的辅助功能，还是依赖浏览器本身的字体大小设置功能就够了？

12个人回复了这个问题，大部分都只是抛出了他们对各自偏好的见解。几乎所有人都有着自己的个人使用偏好。但是发出的帖子中有6个讨论的不是设计师自己的个人使用偏好，而是对其它人来说什么方案可能是最好的。

这6个帖子中的4个是纯粹的猜测，余下的2个是基于通过观察真实用户得来的某种形式的数据。

猜测类的帖子：

· “如今这个年代……大部分对修改字体有需求的人都已经知道怎么用浏览器的这项功能了。”（错误结论）

· “想要修改字体大小的人会用浏览器这么做的，而且也不难啊。”（错误结论）

· “这又不是1995年了，不是所有50岁以上的人都像第一次接触一样，对用浏览器修改字体大小那么无知或不愿意学习。”（错误结论）

· “真正需要增加字体大小的人大多在65岁以上，这类人群不太可能知道如何修改设置。”（正确结论）

数据类的帖子：

· “我平时都必须要手动给我的父母设置这些。虽然65岁以上的人群里精明的越来越多，但是想设置字体大小这种隐藏设置对他们来说还是不那么容易”（正确结论）

· “我有不少网站的可用性研究观察经验，其中就有关于字体大小设置组件的……绝大部分情况下，那些用户……根本不知道那是什么东西。”（正确结论）

数据比猜测可靠

通用的设计原则是要允许用户调整字体大小（前提是他们知道怎么做），但是要使用较为清晰的默认字体大小。得出这个结论是因为很多次用户观察中发现年纪大的用户并不知道如何调整字体大小。

为什么要让用户能够调整字体大小：Let Users Control Font Size

为什么年纪大的用户不知道如何调整字体大小：Seniors as Web Users

在这次讨论组的案例中：

· 借用了外部数据的设计师中，100%得出了正确的结论

· 依赖于个人观点的设计师中，只有25%得出了正确的结论

值得注意的地方在于，75%的猜测都是错的，这几率比抛硬币猜正反面还低。

单看这个简单的案例，哪怕是最小集的事实佐证（自己的父母或几次用户观察），都让设计建议的正确率翻了三倍。

P.S. 虽然从你父母那里获得的数据比没有数据要好点，但我不建议这么做，因为他们很有可能比用户的平均水平更高一些。（因为那你自己作为设计师，知识水平更高一些。）

哪怕2个用户测试都好过猜测

前面的字体大小案例的样本数量太小。但是接下来的案例用更大的样本量得出了相似的结论。

我们请每组76，共152名用户测试了两种展示银行账号信息的方式。用户被要求执行一些如查看账号余额、寻找利率信息等类似的任务。结果是这样的：

不论是从以上哪个度量维度来看，方案B都是最好的，而且仅仅是成功率这一条的差距就足够明显了，所以其优势是毋庸置疑的。

（补充一下，有的测试中两个方案可能在不同的度量维度上表现不同。例如一个方案可能有更高的成功率，而另外那个方案的任务完成时间却更短一些。这种情况你需要对比权衡，或者分析得出能够集合这两个方案优点的第三个方案。）

除了可用性测试之外，我还将这两个方案给了21个正在学习交互设计课程的人看，并询问他们觉得哪个更值得推荐。他们全凭个人观点猜测哪个方案更好，结果作出正确选择（方案B）的比率是50%。你看这个几率，和抛硬币差不多了（从成本上来看，还比不上抛硬币）。

我之后又拿着这两个方案去问了38个正在学习相同课程的人，并让他们找2名用户来测试这每个方案。通过对2名用户的真实观察，他们猜中最佳方案的几率提升到了76%。

换一个视角，仅仅是给每个方案增加了2个用户测试，就将设计决策的错误了从50%降低到了24%——几乎是减半了。然而24%的错误率对于要求较高的设计来说还不够，所以我们明显需要不止2个用户测试（我个人推荐5个）

Z Yuhan：想了解为什么5个就够了，可以去看《为何我如此推崇低保真用户测试》

可见哪怕只是为明个方案增加2个用户测试，如此精简的调研还是足以改变与抛硬币没什么两样的主观设计决策。

（附带一句，这两个方案一眼看上去差不多，这点对调研测试很重要。因为如果用一个很粗糙的线框图和一个视觉设计完备的方案对比，很可能造成结果偏差。）

什么导致猜测错误？

对比上文的两个案例，前者（字体大小设置的那个案例）设计师猜测的错误率达3/4，比后者1/2还要糟一些。

那么为什么第一个案例中，讨论小组里的结论那么偏颇？答案隐藏在下面两条描述中：

“如今这个年代……”

“这又不是1995年了……”

很遗憾，太多设计师还是无法相信可用性原则的时效性足够长。“以前困难的事情，现在肯定变得简单了”这种想法让很多网站越来越糟。

为什么可用性原则的时效性足够长：Durability of Usability Guidelines

当我们借用真实用户进行研究时，我们才能看到他们学习技术的过程是多么慢，并且他们使用“先进的”网站的能力有多么弱。而且，更重要的是，我们还可以看到他们有多么不屑于学习新的网站使用方法。人们就想要打开网站，把事情完成，然后走人，根本不想学习。

为什么猜测的结果那么糟糕？因为很多设计师迫切地想要相信“先进的”设计有多么好，以至于无法体会大部分人对他们喜爱的东西是有多么难以理解。

（是的，在最近的研究中，我们确实发现用户的技能有所提升，不过过程非常缓慢，你最好做好需要几十年才能改变现状的心理准备）

用户的技能是如何有提升的：User Skills Improving, But Only Slightly

哪怕少量的数据也能带来巨大的改变

本文两个案例中，一点点事实佐证就能为设计决策的正确性带来颠覆性的改变，哪怕只是观察一下你的父母，或者找两个用户使用一下你的方案。

当然数据量越大越好，但是任何数据都好过没有数据。

——

Z Yuhan：

1、“任何数据都好过没有数据”这句话对于没怎么亲自做过用户测试的人来说可能难以相信，但是这确实是国际上几十年来的业界主流观点。我认为界面审美、统一性等主观因素是可以全凭自己喜好的，但是可用性作为客观存在的东西，是需要依托实施作证的。

2、“设计原则的有效期足够长”这句话在这个浮躁的年代很容易被挑战。但是那些经典的设计原则，经过二三十年再看也照样可用。人的基本社会技能会改变，但是本性变得非常缓慢的。这篇文章写于2009年，现在看起来也不觉得里面讨论的东西有多过时。

3、我发现很多老的文章都非常不错，内容很有价值却因为表现形式或者年代而不受关注了，接下来我会陆续推荐一些。

——

未经允许请勿转载

做交互设计靠猜的可以吗？

做交互设计靠猜的可以吗？

数据比猜测可靠

哪怕2个用户测试都好过猜测

什么导致猜测错误？

哪怕少量的数据也能带来巨大的改变

友情链接更多精彩内容