可用性评估 — Usability Evaluation

Tim lu
Feb 18, 2021
10 min read

Updated: May 21, 2021

作者：Timmy

前言

现今我们的世界越来越受科技设备所控制，它们也越来越频繁地被使用我们的生活中，特别是在个人用户的使用当中。不同种类的智能产品或家电电器的市场份额通常在科技设备当中是压倒性的。而如今各个产品之间的差异不仅在于外观和功能的多少，还在于可操作性和用户友好性的类型。本文将浅谈最基本的可用性入门。在理解定义之后，其次是关于可用性评估的方法，最后我们将讨论互联网环境中万维网网页的可用性。

可用性的定义

在可用性背后有一系列的观点和方法。可用性的一般定义可以在ISO标准9241中可以找到：

“可用性是指在特定的使用场景下，产品为特定用户用于特定目的时所提供的有效性、效率和满意度的程度”

上述定义强调，必须始终在特定使用条件和目标用户群体的背景下考量可用性。使用条件和目标用户群体的不同会导致对技术设备的要求也极其不同。因此，不能笼统地确定产品的可用性，而必须针对特定的使用情境和目标用户群体分别进行测量。例如，对于一个带有语音控制的产品，使用情景的依赖性便尤为明显。在安静的工作环境中，此类产品的可用性将比在嘈杂的环境中更高。

可用性评估

Evaluation是对已计划的，进行中的或已完成的项目的系统性并且尽可能客观的评估。在可用性评估中，使用尽可能客观的评估方法来衡量可用性。一般来说，产品的可用性高低程度不会很明显，只有在实际使用情况下才变得清晰。此外，必须有标准制定才能科学地衡量可用性。所以，衡量可用性的三个核心参数：有效性，效率和满意度。这些核心参数展现了产品如何实现设计目标以及目标结果。有效性包括用户实现特定目标的准确性和完整性。效率意味着用户需要尽可能少的精力来达到自己的使用目标。当达到或超过用户对目标的期望时，就会产生满足感。

自己以前的课堂笔记整理

可用性评估包含多种方法和方式。形成性评估与总结性评估之间存在全局差异。形成性评估在产品开发生命周期的早期进行，理清产品思路，制定设计方向，一般使用可用性检查方法或对低保真原型进行的可用性测试。总结性评估，通常是在产品开发生命周期的后期进行，对高保真原型或实际的最终产品进行评估。

自己以前的课堂笔记整理

上述向我们表明，评估应在产品开发的不同阶段进行。那么在技术设备的开发生产中应如何以非常实用高效的方式使用可用性评估？在下文中，我们将更详细地讨论，如何将可用性评估整合到产品开发流程中。

产品开发中的可用性评估

可用性评估通常在新技术系统的开发流程中处于落后地位。在许多公司中，可用性评估是一项可选工具，因为其会产生额外费用。因此许多中小企业根本不评估系统，或者原型已经落地后才对系统进行评估。如果在开发流程的后期阶段的评估中出现可用性问题，通常会出现以下难题：根据可用性评估的结果需要对产品进行某些调整和改进。此外，这些调整通常会带来显著的费用。不仅如此，KPI责任者通常不愿承认自己的最终产品不合格。最后也是很重要的一点是，改进会延迟产品的上市时间。

解决这个难题的方法就是在产品开发中高度重视可用性评估。最好的情况是，可用性评估在产品开发中不是作为一个单独的阶段，而是穿插在所有阶段中。此过程如下图所示。用户应该在早期阶段就参与产品开发。项目和需求分析有助于确定使用情境和目标用户群体的需求。根据探索和定义阶段产生的结果，在分析与创意阶段中绘制出产品方案草图。此时这些方案应该根据可用性问题已经进行过评估。在设计与开发阶段，将之前分析后得到的概念付诸于实践，以便可以测试第一代原型。最后，还需要评估先导实验Pilot Testing的结果。

项目管理和规划中的可用性评估

应当注意的是，此图是理想的产品开发流程。通常，产品的迭代过程是必需的，其中出现的可用性问题会导致需要退回到较早的开发阶段，但每次迭代都会提高产品的质量。理想情况下，应保持此迭代过程，直到完成最终产品为止。

为了了解可用性评估的一般流程，下面介绍一下若干不同的可用性评估方法。

可用性评估方法

在可用性评估的方法中，一类分为面向专家的方法和一类面向用户的方法。在使用面向专家的方法时，专家充当鉴定官，将自己放在用户的角色情境中。而对于面向用户的方法，挑选的目标用户作为测试人员进行评估。在这一点上要强调的是，所有评估方法都具有优点和缺点。每种方法只能衡量可用性的某些方面，而其他方面则会被忽略。因此，高质量评估的关键要素在于不同评估方法的组合。

在下文中，将介绍两个面向专家的评估方法（启发式评估，认知演练），然后介绍一些面向用户的评估方法（问卷调查过程，焦点小组，可用性测试）。

启发式评估

在启发式评估中，专家检查产品或产品原型是否符合某些可用性启发法。可用性启发法是公认的系统设计原则，通常遵循这些原则就意味着高度的可用性，违反这些启发法可作为改进的起点。

在1990年，在ACM研究的框架“改善人机对话”中，Jakob Nielsen和Rolf Molich发现，他们在研究中记录的大多数可用性问题都可以归为某些类别。1994年Nielsen和Molich基于对249个可用性问题的因子分析对启发式算法进行了完善，总结出十种一般可用性启发法：

系统状态的可见性：该系统应始终在合理的时间内通过适当的反馈使用户了解发生的情况。
系统与现实之间的对应关系：系统应该使用用户熟悉的单词，短语和概念来讲用户的语言，而不是面向系统的术语。遵循现实世界的惯例，使信息以自然和逻辑的顺序出现。
用户控制和自由度：用户经常错误地选择系统功能，并且需要明确标记的“紧急出口”以离开不需要的状态，从而无需更多的对话与指令。应当支持撤消和重做。
一致性和标准：用户不必怀疑不同的词语，情况或动作是否意味着同一件事。应遵循平台约定。
错误预防：为了防止问题发生的精心设计比一个精心设计的报错提醒要更好。
识别而不是记住：对象，动作和选项应该可见。用户不必记住对话框的一部分到另一部分的信息。在适当的情况下，系统使用说明应清晰可见或易于检索。
灵活性和效率：新手用户看不见的Accelerators通常可以加快专家用户的交互速度，从而使系统可以同时满足没有经验的用户和有经验的用户。允许用户定制自己常用的操作。
美观和简约的设计：应剔除无关紧要或很少需要的信息。
帮助用户识别，诊断错误并从错误中恢复：报错提醒应该用简单的语言表达，准确地描述问题并提出建设性的解决方案。
帮助和文档：虽然可以在没有文档的情况下使用系统会更好，但可能仍需要提供帮助和文档。此信息应易于搜索，并应专注于用户的任务；还应该列出要执行的具体步骤，不要太广泛。

认知演练法（认知走查法）

作为认知演练的一部分，专家会检查产品的可用性，目的是评估没有经验的新手用户是否能够快速学习如何使用该产品及其认识其功能。此方法基于观察法得出的结论：接触未知技术系统的用户更喜欢探索性学习，而不是参考手册。认知演练的重点是将学习使用产品作为可用性指标。

具体方法如下：首先，产品开发人员定义使用情境，目标用户和一系列要执行的任务，然后为每个任务制定出理想的解决方案。接下来将由专家检验，此产品或系统在多大程度上支持或阻碍目标用户实施解决方案。

问卷调查

借助问卷调查，可以为产品评估环节提供大量用户样本。用户对可用性的主观评价应当是调查员的考量重点。

定性与定量调研中的数据分析

焦点小组

焦点小组是与潜在用户进行的有组织的小组讨论。在形成性评估的背景下，焦点小组用于分析需求，以记录未来用户的意愿和需求。在总结性评估的意义上，焦点小组的作用是收集用户对产品的正面和负面的体验，以寻求改进的机会。

可用性测试

作为可用性测试的一部分，用户可以使用原型或成品执行测试任务。可用性测试通常在可用性实验室中进行。

可用性测试中使用了各种调查和记录方法。使用“Think aloud protocol”，当用户大声说出所有想法和动作来完成任务时，记录用户的认知。运用“Teach-back method“，来分析用户的心智模型。熟悉技术系统的人员需要向外行人口头解释该系统的操作和功能。这样，可用性专家可以从系统中接收有关用户心智模型的信息，并可以得出有关可用性问题的结论。在“Video-Feedback“中，测试人员处理的任务会被记录在视频中。测试人员和测试负责人稍后将一起观看视频。测试人员可以对自己的行为发表评论，而测试负责人则可以提出进一步的问题。

实物和数字产品的可用性测试

网页可用性

万维网的起源可以追溯到几年前。近年来，互联网的普及和接受度大大提高。这种趋势导致网站也必须符合可用性原则。因此，现在的前端技术流行语出现了网页可用性这个词。在电商时代，网页可用性正成为一个紧密联系的主题。比较可以清楚地看出这一点：当新的技术设备投放到市场时，如果存在现有的可用性问题，该公司会设置客户热线或免费召回，但这样会带来显著的附加成本。相反，互联网上的情况则不同。潜在客户会首先与供应商的网站联系。因此用户友好程度决定了潜在客户对网站的满意度。只有具有较高的网页可用性，客户才会访问该网站并进行在线购买。这表明，网站运营商还应该对网页可用性采取高度的重视，因为随着竞争网站的数量增加，客户将获得越来越多的替代选择。

对于可用性不佳的网站，Nielsen（2000年）提出了以下问题：

“„With about 10 million sites on the Web in January 2000 (and about 25 million by the end of the year and a hundred million by 2002), users have more choices than ever. Why should the waste their time on anything that is confusing, slow or that doesn´t satisfy their needs?”

网页可用性要求

出于两个原因，对网站的可用性原则的考虑尤其重要。第一个是，网站的目标用户群体与传统目标用户群体极为不同。网站是为广泛的不同用户而设计的。另一方面，互联网主要被用作信息媒介。因此，必须着重考虑能否立即检索出有效信息。

因此，网页可用性的目标是为客户提供一个提供最大有效性，效率和满意度的网站。而一些因素对网页可用性具有决定性影响。这些因素可以分为技术因素和知觉心理因素。

影响网页可用性因素概述

1. 技术因素：

A）命名：

网页可用性始于网站的名称。易用性是由与网站内容相关的名称创建的，以及易于记忆或填写。例如 www.alibaba.com 是一个很好地实现这些命名标准的网站。

B）处理等待时间：

使用网页的等待时间（在加载时或执行特定流程时会出现）在感知层面会对网页可用性产生总体负面影响。如果没有通知用户等待时间，则这种负面影响会增加。因此，网页应以符号形式告知用户等待时间。在加载过程中，可以特定的方式来告知用户，这样可以将被动等待过程变为主动等待过程，从而减少了用户感知到的等待时间。

C）网站信息架构：

信息架构也是网页可用性的重要标准，具有高可用性的信息架构一般拥有清晰，易懂的结构以及透明，直观和逻辑的菜单导航。用户友好的信息架构可帮助用户在网站上自己快速掌握内容并了解主题之间的联系。建议使用扁平的信息架构以提高网页可用性。如下图，从起始页访问每个内容页面最多需要单击两次。

扁平的信息架构

深度信息架构降低了网页可用性的程度，因为这降低了透明度，并且对内容的访问需要更多的精力。该下图显示，这里需要四次单击才能到达最低层级的内容。

在设计用户友好的信息架构时，还应避免“死胡同”，比如只能通过使用“后退”按钮来离开当前页面。

深度信息架构

2.知觉的心理因素：

A）内容排版

我们是用眼睛记录视觉印象，然后传递到相交的视神经中的大脑皮质中。紧接着左右半球执行不同的任务。简而言之，右半球优先选择空间方向和图片内容，左半球优先选择语言和文本。所以内容排版时应考虑到这种任务的划分，以提高网页可用性。此外，基于First Clicking Testing 和 Eye Tracking的定量数据调查发现，大部分用户浏览习惯是从左到右，从上往下。因此最重要的信息应该展示在左边，从而突出内容。当有着较为复杂信息的图像被展示于左侧时，便会一定程度上限制大脑理解速度；而相比而言，文字相比图像可以更直观准确地传达内容和信息，因此在右侧展示图像，在左侧展示文字较为合适。

而当图片简洁易懂且占有较小面积时，可将图片置于左侧。

B）视觉层级清晰

视觉感知的基本要求是各个元素的层级清晰。层级是通过人眼视觉排列的基本特征而划分的，例如通过颜色，点，线，面的对比等。

C）视效效应统一

感知心理学表明，相似的物体会被认为是属于同一物体的。相似度可以指亮度，色相或形状。因此网站的所有页面应具有统一风格的外观，所以排版，图形样式和导航栏位置等应当是一致的。

结论

目前的工作流程表明，可用性原则与日常生活息息相关，并且极大地提高了实物和数字产品的易用性。因此在这种背景下，可用性评估在开发流程中有着举足轻重的作用。

参考文献

Beier, M. & von Gizycki, V. (Hrsg.). (2012). Usability: Nutzerfreundliches Web-Design. Berlin: Springer.

Sarodnick, F. & Brau, H. (2006). Methoden der Usability Evaluation. Bern: Hans Huber.

Schweibenz, W. & Thissen, F. (2002). Qualität im Web: Benutzerfreundliche Webseiten durch Usability- Evaluation. Berlin: Springer.