解锁卡片分类全过程

什幺是卡片分类?

 

卡片分类是一种简单易行的信息整理工具,它将信息系统中的元素组织得让用户易于理解,用于帮助设计或者评估信息架构,通常在用户研究与设计初期执行。邀请用户参与可以真正了解符合用户习惯的信息架构。研究者通过使用标有单词、图片的若干主题卡,鼓励参与者按他们的偏好顺序对其进行整理归类。卡片分类可以帮助研究者获得诸多洞察,甚至可以在卡片分类后进行深入的对话,了解他们归类的原因、价值观。

 

主要方法

 

开放式卡片分类:给定待分类的主题卡。参与者根据他们的理解将主题卡聚合成若干组别,并以他们描述内容的方式命名组别。

 

封闭式卡片分类:给定待分类的主题卡和组别,参与者根据他们理解将主题卡划入既定的组别。

 

执行类型

 

一对一执行:配备一名可用性团队成员,参与者独立执行。这样可以更深入地了解参与者的思考过程,但耗时较长。

 

一对多执行:配备一名可用性团队成员,各参与者独立执行。这样可以快速收集多份分类,但需要准备更多的材料,同时对每位参与者的了解不深。

 

团队共同执行:配备一名可用性团队成员,各参与者共同执行。协作可以更快地完成分类,但需要将团体动力学考虑进去,如群体气氛、群体成员间的关系、领导作风对群体性质的影响。

 

远程执行:不需要配备可用性团体成员,参与者各自执行。这样可以跨地区执行,但无法了解参与者思考的过程。

 

 

为什幺要使用卡片分类?

 

邀请用户参与卡片分类测试,有助于了解站在用户的角度来理解信息的组织。了解用户整理归类的方式可以帮助产品团队验证分类是否符合用户预期,并进一步优化信息架构。

 

如何执行卡片分类?

 

创建卡片

 

 

    1. 主题卡 。根据需要测试的主题准备单词主题卡或图片主题卡,每张卡片只有一个主题。通常数量在 50 至 60 ,过量容易造成参与者疲劳。

 

    1. 空白卡 。准备若干空白卡,以便参与者自行添加主题。

 

    1. 组别卡 。考虑使用不同于空白卡的组别卡,让参与者为组别命名。

 

    1. 主题卡编号 。考虑在不明显的地方编号,以便于后续研究者进行分析。

 

 

执行准备

 

 

    1. 邀请用户 。相关实验表明,15 个样本量得出来的分类结果与全部用户的分类结果之间的相关系数达到 0.90 。

查看报告

    1. 估算时间 。提供估算时间有助于参与者建立完成时的预期。

 

    1. 足够空间 。以便参与者将主题卡平铺在在桌上或者粘贴在墙上。

 

    1. 随时记录 。可用性团队成员可以随时记录参与者的想法、理由或挫折。

 

    1. 准备奖励 。如果合适,为参与者准备若干小奖品。

 

 

执行测试

 

 

    1. 说明目的 。向参与者简要说明本次开放式、封闭式卡片分类的目的。在开放式中,请说明要求参与者针对自定义的组别命名;在封闭式中,请说明想要了解参与者如何定义这些组别。

 

    1. 随机演示 。随机出现的卡片有助于参与者进行分类。

 

    1. 执行分类 。尽量不要打断参与者。并允许参与者使用空白卡添加主题,或弃置不想要的主题卡。

 

    1. 大声思考 。鼓励参与者大声思考,有助于可用性团队成员随时记录。

 

    1. 提供奖励 。如果合适,为参与者提供若干小奖品。

 

    1. 及时记录。 及时拍摄分好类的主题卡,记录分组的名称、数量以及主题卡。为下一次测试重新洗牌。

 

 

 

还可以线上执行卡片分类

 

有很多桌面工具、在线工具可以执行卡片分类,且多数工具都具备基本的分析能力,以下是较为常见的工具:Cart Sort ( Windows 应用程序)、xSort ( Mac 应用程序)、 OptimalSortUsabilityTest Card Sorting 等。

 

如何分析开放式卡片分类

 

原理

 

通过测量所有卡片两两之间的 距离 ,来研究它们之间的 相似性 。故可以使用任何研究距离矩阵的标准统计方法,如层级聚类分析 (hierarchical cluster analysis)、多维标度法 (multidimensional scaling)。

 

在数学中, 一个距离矩阵是一个包含一组点两两之间距离的矩阵  (即二维数组)。因此给定 N 个欧几里得空间中的点,其距离矩阵就是一个非负实数作为元素的 N × N 的对称矩阵。——维基百科

 

工具

 

1. Donna Spencer’s Card Sort Analysis Spreadsheets

 

Donna 的模板提供了 20 * 200 以及 40 * 400 的 联动数据表 。除此之外,Donna 的模板还在数据表中提供了标准化的处理。

 

2. SPSS Statistics

 

很多商业统计工具可以实现,包括 Excel 在 Windows 上的插件 Unistat  。下面以SPSS 的操作分层聚类分析的路径为例。

 

路径:SPSS – Analyze – Classify – Hierarchical Cluster

 

步骤

 

1. 将每位参与者的数据转成 N * N 的对称矩阵。

 

根据不同的定义,在录入数据的时候有两种预处理思路,但异曲同工:

组内距离为 0 ,组外距离为 1 ,即相异矩阵。
组内距离为 1 ,组外距离为 0 ,即共生矩阵。

以共生矩阵为例,设定单个参与者放置在同一组的卡片之间距离为 1 ,录入参与者的卡片分组,可以得到一张这样的矩阵——矩阵中的距离只能是 1 或者 0 。

 

 

2. 将所有参与者的 N * N 对称矩阵叠加。

 

叠加之后的对称矩阵可以看到两两卡片被放到一组的频次。因分析数据的需要,需要补齐完整的矩阵,包括对角线。

在相异矩阵中,对角线为0。
在共生矩阵中,对角线为用户数。

以共生矩阵为例,所有参与者的对称矩阵如下。

 

 

3. 调整数据格式。

 

在变量视图里面,将卡片名调整为定类变量,将卡片频次调整为定距变量。

 

 

4. 层级聚类分析。

 

在使用 SPSS 运行层级聚类分析时,可以使用不同的联接方法和度量距离进行运算。根据经验, Between-Groups Linkage (组间联接法) 、 Within-Groups Linkage (组内联接法)  以及 Ward’s Method (Ward法)  是比较行之有效的连接方法;同时,由于我们是对观察记录 (cases) 进行分类,在选取度量区间上使用 Q 型聚类的 Euclidean distance (欧氏距离)  或 Squared Euclidean distance (欧氏距离平方) 。

 

联接方法

Between-Groups Linkage (组间联接法):合并两类,使所有两类的平均距离最小。系统默认选项。
Within-Groups Linkage (组内联接法):合并两类,新类中所有项之间的平均距离最小。
Nearest Neighbor (最近邻法):以两类间最近点间的距离,代表两类间的距离。
Furthest Neighbor (最远邻法):以两类间最远点间的距离,代表两类间的距离。
Centroid Clustering (重心聚类法):定义类与类之间的距离为两类中各样本的重心之间的距离。
Median Clustering (中位数聚类法):定义类与类之间的距离为两类中各样本的中位数之间的距离。
Ward’s Method (Ward法):聚类中使类内各样本的离差平方和最小,类间的离差平方和尽可能大。

度量区间

Euclidean distance (欧氏距离):即两观察单位间的距离为其值差的平方和的平方根。用于 Q 型聚类。
Squared Euclidean distance (欧氏距离平方):即两观察单位间的距离为其值差的平方和。用于 Q 型聚类。系统默认项。
Cosline (余弦相似性测度):变量矢量的余弦,这是模型相似性的度量。
Pearson conelation (皮尔逊相关系数):即相关系数距离,是线性关系的测度,范围是-1~+1。用于 R 型聚类。
Chebychev (切比雪夫距离):即两观察单位间的距离为其任意变量的最大绝对差值,用于 Q 型聚类。
Block (Manhattan 距离):两项之间的距离是每个变量值之差的绝对值总和,用于 Q 型聚类。
Minkowski (闵科夫斯基距离):距离是一个绝对幂的度量,即变量绝对值的第 p 次幂之和的平方根。p 由用户指定。
Customized (自定义距离):距离是一个绝对幂的度量,即变量绝对值的第 p 次幂之和的第 r 次根。p 与 r 由用户指定。

结果

 

从冰柱图 (Vertical Icicle) 和系统树图 (Dendrogram) 查看分类结果。

 

1. 冰柱图怎幺看。

观察纵轴,通过添加切割线进行水平切分。
观察0至切割线区间,白柱间的间隔,间隔即为组。

 

2. 系统树图怎幺看。

从左至右看,可以看到哪些卡片在最开始就聚类到一起。
从右往左看,通过添加切割线进行垂直切分,了解组数;组数可以是参与者的平均组数,也可以是业务方的目标组数。

 

通常,一个开放式卡片分类后,可以紧跟一个或多个封闭式卡片分类,通过封闭式卡片分类来验证信息归类是否合适。

 

如何分析封闭式卡片分类

 

原理

 

定义衡量指标为把主题卡放置各组别中的参与者比例。每张主题卡在组间比例悬殊较大的,是较有把握的分类;反之,是存在分歧的分类。

 

工具

 

使用 Excel 就可以完成基础统计。

 

步骤

 

 

    1. 邀请参与者将主题卡与组别匹配。

 

    1. 将每位参与者的数据转成 N * N 的对称矩阵。

 

    1. 将所有参与者的 N * N 的对称矩阵叠加。

 

    1. 将频次转化成百分数,标记出每张主题卡的最大百分数。

 

    1. 求最大百分数的平均数,该平均数可以衡量该组组名是否有效。

 

 

 

当我们列举了多种分类方式,需要验证求其一时,则需要基于每种分类方式,邀请数量一致的不同参与者。同时需要考虑:

多种分类方式中组别数量一致,可以直接使用最大百分数的平均数来衡量。
多种分类方式中组别数量不一致,可以使用最大比例与第二比例的差值的平均数来衡量。

写在最后的一些经验

 

 

    1. 主题卡编号提高录入效率。 将线下数据转录至线上是一个量大效率低的事,结合卡片编号可以有效提高录入效率。

 

    1. 主题卡的措辞尽量精准,避免偏差、歧义。 无法避免时,可以在主题卡上加以解释。否则难以理解的主题卡会被用户分到无法解释的类别。

 

    1. 用户的结果不一定是合适的。 在主题卡涉及领域较广且主题卡理解有不可避免的偏差时,目标用户的分类受知识所限,可以考虑专家法,执行封闭式卡片分类。

 

 

参考资料

 

https://www.usability.gov/how-to-and-tools/methods/card-sorting.html
http://www.designkit.org/methods/24
https://zh.wikipedia.org/wiki/%E8%B7%9D%E7%A6%BB%E7%9F%A9%E9%98%B5
http://blog.sina.com.cn/s/blog_777d52410101ilyz.html

发表评论

电子邮件地址不会被公开。 必填项已用*标注