结合实例讲解:可用性测试的具体做法及经验总结

玩技站长
玩技站长
玩技站长
管理员, Keymaster
10833
文章
669
评论
测试资讯评论127字数 6418阅读21分23秒阅读模式
摘要本文主要是作者结合自身经验介绍了可用性测试、可用性测试的具体流程及注意事项以及ASQ等相关内容。

用户调研分为两种形式,一种是定量,一种是定性。

定性的方式里面又包含可用性测试、用户访谈。可用性测试是用户调研中一种定性研究的方法,让产品更好的服务用户,可以说是一种低成本高回报的一种研究方法。文章源自玩技e族-https://www.playezu.com/193607.html

今天我主要通过以下几个层面来讲解可用性测试的亲身操刀经验:文章源自玩技e族-https://www.playezu.com/193607.html

一. 什么是可用性测试文章源自玩技e族-https://www.playezu.com/193607.html

1. 什么是可用性测试?文章源自玩技e族-https://www.playezu.com/193607.html

2. 可用性测试的好处是什么?为什么有很多公司不用呢?文章源自玩技e族-https://www.playezu.com/193607.html

二、可用性测试的具体流程及注意事项文章源自玩技e族-https://www.playezu.com/193607.html

1. 需求收集文章源自玩技e族-https://www.playezu.com/193607.html

2. 资料准备文章源自玩技e族-https://www.playezu.com/193607.html

3. 用户招募文章源自玩技e族-https://www.playezu.com/193607.html

4. 测试脚本设计文章源自玩技e族-https://www.playezu.com/193607.html

5. 预测试

6. 测试开始

7. 输出分析报告

三. 什么是ASQ?什么是SUS量表?

1. 关于ASQ

2. 什么是SUS量表?

四、可用性测试一般在什么时候进行?

五、什么功能适合做可用性测试?

六、总结

一. 什么是可用性测试?

1.什么是可用性测试

可用性测试,是通过观察有代表性的用户,完成产品中的各项任务,界定出可用性问题并解决这些问题。展开来讲就是:观察代表性用户;完成所测产品的典型任务;测试出产品有哪些问题;解决问题

举个例子:

拿咪咕圈圈的弹幕功能来说,用户通常在什么场景下会使用弹幕,在使用时是否能熟练使用以及是否对弹幕功能有自己的意见或不满?

代表性的用户:会使用咪咕圈圈看漫画的深度用户

典型任务:用户在观看视频时,想要发送一条弹幕,再发一条好友弹幕

测试出的产品问题:

觉得填写@调出好友界面的操作流程比较麻烦且隐藏,期望简化操作流程

扩大分享到站外好友

解决问题:

可以优化聊天框,将@功能显示出来

增加扩大分享到站外好友功能

2.可用性测试的优点是什么?为什么还有那么多公司不用呢?

第一种情况是,他认为我的产品没问题,用户都会用,不需要做可用性测试;第二种情况是压根没有这个意识,也不去了解学习,就这样用户离她们越来越远,过上YY的生活;第三种情况是,有意识去做,但不专业,害怕做不好,不知道怎么入手

有人又要问了,可用性测试很重要吗?当然重要。是必须要做的吗?也不是。因为并不是每次迭代更新都要做可用性测试,会很浪费时间人力成本,可能效果还不好。

那为什么可用性测试又如此重要呢?因为它可以让你接近真实用户,除了给你带来某功能的具体使用情况外,还可以带给你更多的用户信息。很多时候,可用性测试就是一次小型的用户访谈。

二.可用性测试的具体流程及注意事项

整个可用性测试可以分为以下几个阶段:

  • 需求收集;
  • 资料准备;
  • 用户招募;
  • 测试任务设计;
  • 预测试;
  • 开始测试;
  • 分析报告

1.需求收集

通常在进行可用性测试之前,用户研究员会去向产品经理、设计师、运营等人员收集他们的需求,当然,也可以用盐组内部提出需求,通常都会有专门的需求收集模版,让相关角色根据模版填写即可,然后进行整理汇总。

用盐需求模版基本包含:

需求名称/功能:描述需要验证的是什么功能

需求类型:是验证型(已上线)还是探索型(未上线)

配合方:在进行中是否需要其他部门人员配合或提供资料等

时间要求

需求提出方

需求背景

可用性测试目的:

调研内容:比如用户在使用弹幕社交的看法态度及潜在需求

调研对象;

提供素材:是否有可疑提供的素材或资料

2. 资料准备

在测试之前,一定要做好资料准备

一个是设备资源,当然不是专业的测试实验室,拥有各项专业设备、录音设备、观察室等,这种测试环境距离我们比较遥远。对于普通公司来说,实际上不需要非常专业的测试设备。通常情况下只需要2台电脑、2台手机。

如果是测试PC端,那完全可以用QuickTime等录屏软件,不仅可以记录操作,还可以录音;如果是测试iOS移动端,最新的iOS系统已经自带录屏软件了,老系统的话可以数据线连接电脑,通过QuickTime来显示并录屏;如果是安卓机,可以在应用市场下载录屏软件。

为什么要2台电脑2台手机呢?

因为1台电脑用户做测试用,1台是观察员记录笔记用,可以把问题直接记录下来,以免后期再重复且记不清。手机的话,1台做测试用,1台录音用,当然也可以用录音笔

除了测试设备之外,还需要准备一些小礼物。

礼物根据做测试的用户来定,如果是同事或朋友,耽搁不了很久的,买点小礼物意思一下即可;如果是你的目标用户,还很费时间,那投入就大了。

礼物注意事项:礼物可以提前送,打消用户心理的顾虑和隔阂,能快点进入状态,用户拿到礼物后,会比较敬业的完成测试,毕竟拿人嘴短。

3.用户招募

很多人不知道在招募用户的时候,招多少人合适,也没有对用户进行区分,所以我们需要了解招募用户的正确方法:

(1)招募5个用户

尼尔森博士说:有5个人参加的用户测试,就可以发现85%左右的产品可用性问题。

为什么5个就够了呢?Jakob Nielsen博士统计了尼尔森集团在2012年做的83个可用性测试项目发现:参与可用性测试的用户越多,并不能发现更多的问题。

结合实例讲解:可用性测试的具体做法及经验总结插图

(2)招募目标用户

做可用性测试一定要招募目标用户,不是真实用户的话很难融入到场景当中,反馈给你的没有太大帮助。还有一点是,招募的用户需要有能力并且有经验完成任务,而且有一定的动机来完成。

举个例子:

咪咕圈圈是一款偏向二次元用户的产品,那么在招募用户时,就需要招募对二次元感兴趣的用户,喜欢看二次元的内容,即有一定动机来完成任务。

如果项目很简单,只想测试一下项目的交互流程是否有问题,为了节约成本,可以找其他部门同事来帮忙,做肯定要比不做要好,避免后期开发阶段发现太多问题导致推翻方案或项目延期

招募用户时,还需要做用户筛选,用户一般分为:小白用户、大众用户、深度用户,如果只招募其中的一种,那么结果很定会有偏差。小白用户对于行业不了解,像一张白纸,很难提出建设性意见;专家用户对产品足够了解,他会去关注各种细节,所想的范围超出了普通用户的范畴。所以在招募时,这三种用户都需要招募,这样能反馈更多有效的问题。

(3)招募用户有哪些途径呢?

对于B端产品来说,用户招募不是问题;对于C端比较简单的可用性测试,直接找内部同事即可,最难的是C端真实用户的招募

基本上有以下几个方法:

核心人际圈:你的同事,其他部门的同事、朋友等

万能的朋友圈、各大微信群

符合测试条件的陌生人:官微、官博、粉丝群等等

举个例子:

近期在做的项目,需要找初高中生群体测试产品的核心功能,我们首先在公号、app的banner区域宣传,还有运营部门的外部支持,以及可以汇集初高中生较多的地方宣传招募,成功征集到6个真实用户做测验

4.测试任务设计

任务的设计,是整个测试的关键点,任务设计的好坏决定了后期的成败。

(1)首先要明确测试的目的,这个一定要牢记

(2)确定测试的功能

在设计任务的时候,一定要明确本次测试的重点是什么,这个在前期收集需求的阶段就要明确,一个模块包含很多个功能,如果每个功能都测一遍,那用户也会很不满意,所以一定要有所取舍,而且最好在正式测试之前,先预测试一番。

关于测试的时长,最好控制在1小时左右,这样,用户也不会觉得烦

(3)任务设计要场景化、情感化

任务场景化,是测试人员很容易忽略的问题。设计任务时可能只简单描述一下任务,比如,打开咪咕圈圈app,在看动画的时候发一条弹幕吐槽一下。这样描述问题,很难让用户带入到场景中,结果就是简单完成了任务,但是不能给你反馈的建议。

那我们怎么设计呢?我们要营造一个气氛,让用户感觉身处在这个场景当中。比如:请选择一部你感兴趣的漫画进行观看,在观看的过程中你发现有一个画面很有趣,想发表吐槽,并且分享给你的好友

(4)任务设计的数量

在设计任务时,经常容易设计的任务过多,前面讲过,1个可用性测试最好在1小时内完成,时间过长的话,用户的耐心和配合度都会减弱,1小时内完成3-6个任务是比较合适的。如果每个任务都很重要的话,可以分成2次来测试,先测一部分,剩余的并入下一期来测;或者是本期测完,但真对某些任务只测部分用户

5.预测试

预测试是指把测试设备、测试脚本都准备好,按照正常测试流程走一遍,尽可能的模拟真实环境,主持人要讲完所有的串词,注意不是拿稿子念,观察员要看完用户操作全程并记录,如果真实测试是在户外进行,还要考虑Wi-Fi不良的情况。

预测试的结果也要写进分析报告中,非百分百的真实用户提出来的体验问题也是具有参考意义的。

预测试结束后,需要问一下被测用户在整个流程中是否有不适的地方?哪些环节是我们需要完善的?主持人和项目组讨论复盘整个流程和所有文档。

复盘后改动的工作量可能比较大,所以预测试和正式测试最好不要放在同一天进行,这样有比较充足的时间修改和打印资料。

6.开始测试

测试的时候总会有一些意想不到的情况发生,比如忘开录音、录屏,测试人员经常会偏离测试任务等。

那么在测试进行时,需要注意哪些问题呢?

(1)关于测试人员

测试人员最好2个,不要超过3个,为什么不能超过3个呢?可以想象一下一群人围着你看你完成任务是什么感受。人太多会给测试者带来心理压力,选择座位的时候也要注意,让测试者坐主要位置,让被测者有一种主人的感受,最好不要面对面做,要有一定的角度。

测试人员分为主持人和观察员,有人会说,一个人岂不是更好?其实并不是,一个人的话往往会让气氛比较尴尬,有时候你都不知道该说什么了,或者出了问题没人提醒你。

主持人最好是项目相关人员,比如产品经理、交互设计师,其次,主持人最好具备良好的沟通能力和随机应变能力。

主持人需要注意用户在做任务时的操作和我们预想的不一样而打断,直接引导他们完成任务,这是测试中很忌讳的,对于新手主持人一定要亲自跑一遍流程,主持人要和蔼可亲,不要板着脸,最好和用户成为朋友。

观察员要默默降低自己的存在感,跟用户打招呼,介绍自己,然后坐一边默默观察全过程,并记录发现的问题。观察员切记不要直勾勾盯着用户,会让用户感到紧张不安,除了在专门的提问环节,不要随意打断测试插入问题。

如果很多人都想参与测试呢?我们可以轮换着听,或者把测试后的录音录屏等资料给他们

(2)测试的环境

最好找一个相对安静、不会被打扰的地方进行测试,以防被测者被外部环境打断和围观,如果使用产品的场景就是在户外或者公共场所的话,那么要保持和使用场景一致或相似。

(3)暖场

暖场是指测试前的简单介绍,包括自我介绍、本次测试的目的、缓解气氛,把用户带入测试场景。可以和用户聊聊被测产品相关的小问题,平时怎么用的?一般什么时候用?感受怎么样等等

介绍测试时,一定要强调,我们测试的是产品,不是用户本人,告诉用户本次测试大概需要多久时间,让用户有个心理准备。但尽量少说一点,比如可以说这次测试大概需要半小时,但实际上可能达到1小时以上。

还需要告诉用户在测试时会录音、录屏,便于后期整理,但是一定会对测试资料进行保密。

还有一点一定要告诉用户:在测试期间您有任何问题,都可以问。但我可能不会立刻回答,因为我想知道大家在没有旁人帮助的时候会如何做。如果测试结束后,还有问题我将尽最大努力做出回答。

(4)发声思考法

发声思考法是指:用户一边操作,一边说出心里的想法,有些用户不太懂,测试人员可以演示一下。这样的话我们方便了解用户的真实想法,了解用户和我们的任务是否偏离,反馈更多我们意想不到的信息。

有时用户进行测试时,默默的完成了任务,忘记了发声思考,我们可以以问句的形式去提醒用户:

您现在看什么呢?

您现在想什么呢?

您现在在做什么操作?

您觉得接下来怎么做比较好?

这是您想要的结果吗?

您现在觉得怎么样?

(5)不要对用户进行指导

有时用户在做任务时,不知接下来如何操作或者问你该怎么操作等,有的测试人员觉得被测者很笨,实在受不了,直接告诉用户。这是做测试时的大忌,我们需要时刻记住,我们测试的是产品,不是用户。

当用户偏离你的任务时,你可以提醒下用户;当他不知道怎么操作或者某个地方是否能点击时,你可以鼓励用户去尝试下,而不是立即告诉用户答案

(6)时刻观察用户

在测试时,需要注意观察用户的肢体反应和情绪、表情变化,并不时的问用户为什么感到惊讶、疑惑等。方便我们挖掘更多有用信息

在做完一个任务时,趁着用户记忆还比较新鲜,可以让他们直接说出来自己的体验或者不好的地方;在用户操作任务时发现用户有异常情绪但没紧跟着追问,可以在这时候补问。

(7)再来给大家简单归纳一下流程:

整个测试阶段的流程大致为:

开场白:做简单介绍,说明录音录屏情况及保密协议签订等

事前访谈:询问用户背景、基本信息,及任务相关内容

事前说明:发声思考法介绍演示、设备的简单操作等

任务执行:提示任务并观察

事后访谈:询问用户有什么感想、评价和期望等

结束:支付报酬、感谢、送客

7.输出分析报告

分析用户测试数据,总结报告,推动完善产品,才是我们的终极目的。

具体怎么做分析报告呢?

根据我们前期的记录和录音录屏开始整理,把整个测试任务中遇到的问题和测试出来的问题记录下来,然后对这些问题作出区分:关键问题、重要问题、次要问题,然后将这些问题反馈给产品经理、开发、设计师,根据这些问题进行优化排期。

关键问题:该问题未得到解决,用户无法顺利完成任务

重要问题:该问题未得到解决,将影像很多用户的实际操作,比如多次操作不成功、用户求助度很高等

次要问题:用户在操作时可能感到麻烦,但仍然会继续完成任务,比如有些按钮、反馈很不显眼,需要仔细查找。

结合实例讲解:可用性测试的具体做法及经验总结插图1


三.什么是ASQ?什么是SUS量表?

1. 关于ASQ

通常我在设计测试脚本时,会在每个任务后面,针对该任务进行一个小问卷调查,通常包含2-3个个问题,只需要打分即可,对用户来说很简单,辅助我们客观评价任务。

结合实例讲解:可用性测试的具体做法及经验总结插图2

上图这个问卷,也可称为ASQ量表,即情景后问卷,是让用户完成一系列任务或者一个情景任务后,对产品进行可用性的评价。最好是完成1个任务后就开始回答一下,这时的记忆最新鲜,具体设置几道题根据具体情况而定,量表的分值可以设为5分。

ASQ问题涉及到可用性的3个方面:有效性(问题一)、效率(问题二)、满意度(问题三),问题如上图所示。

什么时候要用ASQ量表呢?可以让用户完成1个任务后填写,也可以完成全部任务后填写。如果这个任务不是特别重要,也可以不设置ASQ

2. 再来说说SUS量表。

SUS量表,即情景后问卷,量表一般由10道题组成,包括奇数项的正面阐述,也包括偶数项的反面阐述,要求被测者在使用产品后对每个题目进行打分,满分5分。

SUS的优势在于小样本量都能得出较为准确的结果。

SUS量表题目如下:

结合实例讲解:可用性测试的具体做法及经验总结插图3

当参与者完成问卷之后,我们开始打分,奇数项的记分采用原始分数-1,偶数项得分采用5-原始得分,由于是5点量表,每个题目的得分范围是0-4,SUS的范围是0-100,故需要将每个题目得分相加后再乘以2.5,即可获得SUS的最终分数。

SUS的平均分数为68分,50以下是不可接受的,70分以上是可以接受的。

结合实例讲解:可用性测试的具体做法及经验总结插图4

举个例子:

结合实例讲解:可用性测试的具体做法及经验总结插图5

用户1的计算公式为:Q1(5-1)+Q2(5-1)+Q3(5-1)+Q4(5-2)+Q5(4-1)+Q6(5-1)+Q7(5-1)+Q8(5-1)+Q9(4-1)+Q10(5-1)=37

然后37*2.5=92.5,这样就得到了用户1的得分,再把其他用户的得分算出来,最后得出平均分为84分

在使用SUS量表时需要注意什么呢?

(1)10个题目中,有个别题目对参与者来说比较难以理解,比如2、5、6题,需要和参与者进行解释。也可以根据具体情况优化一下问题表达方式。比如第二题,可以改为:我认为这个产品太复杂。第五个问题可以加上文字说明:我觉得这个产品多种功能结合的很好(比如我想要的一些基本功能都有,并且很容易找到)。第六个问题加上文字说明:我觉得这个产品有太多不一致(比如文字提示不一致、点击某个功能后出现的页面和我预想的不一致)

(2)在使用时,需要把“产品”换成我们产品具体的名字,如“咪咕圈圈app”

(3)SUS问卷除了给我们一个科学的打分方法以外,还有助于我们对用户进行追问。

四.可用性测试一般在什么时候进行?

1.四个阶段

(1)产品开发初期

也被称为探索式测验,这时候是对初期概念在市场上进行验证,并评估这一概念的可行性及后期的如何运作变现

(2)产品实现中期

这一阶段主要是对某一功能的交互流程进行验证,看能否跑通,其次是对交互或视觉上不同设计方案的验证

(3)产品开发后期

主要是检验产品的性能、功能方面是否达到标准

(4)产品上线后

这一阶段主要是为下一次的迭代做准备,更加深入的了解用户群体对该产品的使用体验及意见反馈

PS:可用性测试能在初期的时候做,就在初期做,这样避免后期各种状况不佳导致推倒产品重来的危险,成本巨大。

2.举个例子

目前我们在做一款新的app,在放手做前期,就开始做市场调研、用户人群定位,充分了解该项目从各方面都可做的情况下,才开始动手去做的。

在原型、视觉稿出来之后,会出demo给到被测人员做可用性测试,检查使用流程上是否麻烦、流畅等,从视觉上,是否有icon表意不清等问题,检查出问题后再去优化,然后才是程序开发阶段,后面还有阶段包来验证产品等等。产品上线后还要继续新一轮的用盐分析。

五.什么功能适合做可用性测试?

不是所有的产品和功能都要做可用性测试的,比如一个表单、一个字段的修改等等,是不需要去做测试的。

那什么情况和功能适合去做呢?

(1)新开发的产品,急需得到验证

我们需要对整个产品的核心功能做测试,来验证产品是否符合目标用户的需求,用户在使用中是否有疑惑

(2)功能变更。可能是操作路径的变更,也可能是功能入口的变更

比如对不感兴趣功能的交互,以前是点击之后出现弹窗,现在是长按直接拖出画面,部分用户已经习惯了之前的交互方式,需要对新的方式进行测验

(3)新增比较复杂的功能

有些功能会比较复杂,步骤比较多,这种情况也需要做一下测试,看看用户的接受度,看哪里需要做出调整

(4)设计阶段有争议的

当在设计前期,无论是交互层面还是视觉层面,双方观点不一致,谁也说服不了谁,或者拿不准到底用哪套方案,可以去做一下可用性测试,看哪种方案接受度更高

当你想所有的功能都做测试,但有没有那么多资源,可以通过以下步骤来确定:

(1)讨论测试功能

从以下几个方面例举:

经常使用的

主推的

新的

早期版本反馈中有问题的

对用户来说重要的

如果不正确使用有潜在危险或者不良作用的等等

(2)通过功能优先级排序法来筛选本次测试的功能

通过给每个功能的重要程度和对于该功能的疑问打分,并且相乘得出总分,来突出每个功能间的分数差异。

结合实例讲解:可用性测试的具体做法及经验总结插图6

(3)确定本次测试的功能

六. 总结

以上是我的个人经验,有了可用性测试的结果,在评审或者后期做方案时会比较有说服力哦~

 
匿名

发表评论

匿名网友
确定

拖动滑块以完成验证