Oh!Coder

Coding Life

读《认知与设计》

| Comments

本周读了一下《认知与设计》,算作UI设计的入门书籍。书比较薄,一共只有140多页。文字和排版都比较养眼,读起来还是比较轻松的,:D。

整体来看,本书从认知学角度解释了一些UI设计的初衷。也就是说为什么一些UI会这样设计,而不是那样设计,从原理上做了简单的解释。

影响人认知的主要有两个方面,一方面是我们的视力。另一方面是我们的思维。本书的核心也是围绕这两方面展开。另外介绍了一些设计方面的基本原则,然后结合人的视力和思维这两方面会产生的影响进行了讲解。好吧,下面对各个章节做一个简单的概述。

第一章:我们感知自己的期望

经验影响感知

书中通过一些例子证明了先入为主会影响感知。并通过一个著名例子进行了说明。

pic

图片来源:R.C.James的一张素描

大部分人对它的第一印象就是随手泼出的墨点。只有在告诉你这是一只在树附近嗅着地面的斑点狗之后,你的视觉系统才会把影响组织成一幅完整的画面。如果你一旦“看到了”这只狗,就很难再回头把这张素描看成随机无序的点。

环境影响感知

当我们试图去理解视觉如何工作时,很容易认为它是一个自下而上的过程,将边、线条、角度、弧线和纹路等基本要素组成图案并最后形成有意义的事物。以阅读为例,你可能假设我们的视觉系统首先识别字母,把它们组合成单词,再将单词组合成句子,如此继续。

周围环境对感知的影响也同样存在不同于感官之间。五个感官任何之一的感知都可能同时影响其他感官的感知。例如:

  • 我们听到的能影响我们看到的,反之亦然。
  • 我们听到、看到或者闻到的能影响我们的触觉。

目标影响感知

除经验和当前环境会影响感知外,我们的目标和对将来的计划也会影响我们的感知。具体地说,我们的目标会过滤我们的感知:与目标无关的东西会被提前过滤掉,而不会进入到意识层面。

这一点,不用多说,相信很多人平时都会有所体会,尤其是成年人。书中说目标对感知的过滤在成年人身上特别可靠,他们比儿童对目标更专注。儿童更容易被刺激驱使,目标较少地过滤他们的感知。

当前的目标影响我们的感知的机理有两个(Page.6~Page.7)。

  • 影响我们注意什么。
  • 使我们的感知系统对某些特性敏感。

对设计意味着什么

关于这一点,书中列出了三点。

  • 避免歧义。
  • 保持一致。
  • 理解目标。

第二章:为观察结构优化我们的视觉

这一章主要介绍了格式塔原理。那什么是格式塔原理呢?

20世纪早期,一个德国心里学家组成的研究小组有一个最基础的发现是人类视觉是整体的:我们的视觉系统自动对视觉输入构建结构,并且在神经系统层面上感知形状、图形和物体,而不是只看到互不相连的边、线和区域。“形状”和“图形”在德语中是Gestalt,因此这些理论也就叫做视觉感知的格式塔(Gestalt)原理。

书中对格式塔原理讨论了几个方面。

格式塔原理:接近性

接近性原理说的是物体之间的相对距离会影响我们感知它们是否以及如何组织在一起。。互相靠近(相对于其他物体)的物体看起来属于一组,而那些距离较远的就不是。

格式塔原理:相似性

格式塔相似性原理指出了影响我们感知分组的另一个因素:如果其他因素相同,那么相似的物体看起来归属于一组。

格式塔原理:连续性

连续性原理:我们的视觉倾向于感知连续的形式而不是离散的碎片。

pic

图片来源:IBM标志

格式塔原理:封闭性

我们的视觉系统自动尝试将敞开的图形关闭起来,从而将其感知为完整的物体而不是分散的碎片。

pic

图片来源:Google图片

格式塔原理:对称性

我们倾向于分解复杂的场景来降低复杂度。我们的视觉区域中的信息有不止一个可能的解析,但我们的视觉会自动组织并解析数据,从而简化这些数据并赋予它们对称性。

格式塔原理:主体/背景

主体/背景指出我们的大脑将视觉区域分为主体和背景。主体包括一个场景中占据我们主要注意力的所有元素,其余的则是背景。

pic

图片来源:Google图片(M.C.Escher作品)

格式塔原理:共同命运

前面介绍的格式塔原理都是关于静态(非运动)图形和对性,最后一个则涉及运动的物体。共同命运原理与接近性原理和相似性原理相关,都影响我们所感知的物体是否成组。共同命运原理指出一起运动的物体被感知为属于一组或者是彼此相关的。

本章最后大而统的介绍了一下,各种格式塔原理不是孤立的,而是共同起作用的。

第三章:我们寻找和使用视觉结构

这一章没有讲什么特别的内容,只是结合上一章的格式塔原理展示了几个例子,说明了一下信息的组织形式如何对用户浏览有帮助。

其中,举了几个关于文字布局的例子。并提出,可视化信息显示的最重要目标之一是提供一个视觉层次,即信息的布置安排能够:

  • 将信息分段,把大块整段的信息分割为各个小段;
  • 显著标记每个信息段和子段,以便清晰地确认各自的内容;
  • 以一个层次结构来展示各段及其子段,使得上层的段能够比下层更重点地被展示。

第四章:阅读不是自然的

这一章主要是讲阅读相关。书中引用了一句话(Page.29)阅读其实是一种人造的、通过系统的指导和训练获得的能力,就像拉小提琴、玩杂耍或者读乐谱一样(Sousa,2005)。阅读涉及识别特征和模式。模式识别可以是自下而上、特征驱动的过程,也可以是自上而下的、上下文驱动的过程,因此阅读也是如此。

可以看出,阅读其实也是一种技能,需要不断的进行训练。看到这,我想之前我的阅读量太小了,以后应该加大阅读量,一方面可以提高阅读速度。另一方面要提高阅读质量。

熟练阅读者和不熟练阅读者使用大脑的不同部位。然而,对于糟糕的信息设计也会影响阅读,例如软件中阻碍阅读的常见方式之一是使用用户不熟悉的词汇。除此之外,字体的排版和格式的设计同样会影响人的阅读。这一点可以参考第二章的格式塔原理。

书中据了很多例子来说明糟糕的文字设计如何影响阅读。从一些糟糕设计当中也得到了一些启示。

  • 支持,而不是干扰阅读
  • 尽量少让人阅读

我觉得这两条建议非常中肯,比如可以用图说明的,尽量不用文字展现。为文字的阅读提供辅助性的帮助,尤其对于电子类阅读更容易做到。

第五章:色觉是有限的

这一章讲了人类色觉的工作原理。并指出不是所有人的色觉系统都是完美无缺的,比如书中提到的色盲。所以说,在进行设计的时候需要考虑周全。

书中具体提到的色觉如何工作的,以及相关的原理,书中作出了一些科普性的解释,并通过图文并茂的方式进行了整理。因为一些插图很难找到,所以这里也不做多解释了,有兴趣的同学可以去读一读。

第六章:我们的边界视力很糟糕

这一章的核心就是在讲我们的视力如何影响我们认知。并在一开始提出中央凹的概念。

人类视野的空间分辨率从中间向边缘锐减。每只眼睛大约有600万视网膜视锥细胞,它们在视野的中央——一个很小的叫做中央凹的区域——分布得比在边缘紧密得多。中央凹仅占视网膜面积的1%,而大脑的视觉皮层却有50%的区域用于接受中央凹的输入。

由于中央凹的视觉识别有一定的范围,所以提出了边界视觉的概念,并解释了边界视觉大致的工作方式,也简单的说明了如何影响我们的视野。

对于边界视觉的作用,书中说,(Page.58)边界视觉的存在主要是为了提供低分辨率的线索,以引导眼球运动,使得中央凹能够看到视野里所有有趣和重要的东西。我们的眼睛不是随机扫瞄环境的。眼动是为了使中央区关注重要的东西。

接下来,书中结合人类眼睛的这些特点,举例说明了电脑用户界面应该如何设计比较合理。

第七章:我们注意力有限,记忆力也不完美

对于记忆力,心理学历来就把记忆力区分为短期记忆和长期记忆。短期记忆涵盖了信息被保留从几分之一秒到几秒,甚至长达一分钟的情况。长期记忆则从几分钟、几小时、几天到几年甚至一辈子。其实,整体来看,这一章开始就是在说人类的思维是如何影响认知的。

在讲解长期记忆这部分,书中提到(Page.68)一个神经记忆的模式越经常被再次激活,就变得越“强烈”——也就是说,再激活它越容易。这意味着其对应的感觉就越容易被识别和回忆。神经记忆模式也能被大脑其他部分发出的刺激性或者抑制性的信号强化或削弱。

对于短期记忆,是感觉和注意现象的组合。人类大脑有多个注意机制,一些是主动的,一些是被动的。它们使我们的意识专注于感觉和被激活的长期记忆中非常小的子集,而忽略所有其他部分。这个存在与我们“此刻”的意识中,来自于感觉系统和长期记忆的信息的非常小的子集,构成我们短期记忆的主要部分,也被认知科学家称为工作记忆。

对于短期记忆的特点。短期记忆等于注意的焦点,即任何时刻我们意识中专注的任何事务。短期记忆最重要的特点就是低容量和高度不稳定性。

针对记忆的这些特点,书中随后列举了一些用户界面设计应该注意的地方。

第八章:对注意力、形状、思考以及行动的限制

从本章的名称可以看出,这一章从四个方面做了说明。并介绍了六种重要的模式。

模式一:我们专注于目标而很少注意使用的工具

我觉得这部分有一句话说的很到位,(Page.82)如果你要让我考虑怎么用你的软件或者网站,而不是做我要做的事情,那你就失去了我这个用户了。

模式二:我们使用外部帮助来记录正在做的事情

因为我们的短期记忆和注意力如此有限,我们学会了不依赖它们,而是在周围的环境中做出标记来提醒自己任务做到哪一步了。这也就是说,交互系统应该分别标识出哪些是用户已经完成的,而哪些是用户还没完成的。

模式三:我们跟着信息“气味”靠近目标

把注意力集中在目标上使得我们只从字面上理解在屏幕上看到和从电话菜单中听到的信息。人们只会注意到屏幕上与他们的目标所匹配的东西,并且使用电脑完成任务时仅从字面上考虑的行为被称为“跟随信息的气味靠近目标”(Chi,Pirolli,Chen&Pitkow,2001;Nielsen,2003)。

模式四:我们偏好熟悉的路径

这部分有一句话讲的很到位。(Page.85)用电脑时不动脑子很重要。人们更愿意为了少动脑子而多敲键盘。

模式五:我们的思考周期:目标,执行,评估

这部分没什么好说的,就是在说通常我们进行评估的思考周期是什么样的。

模式六:完成任务的主要目标之后,我们经常忘记做收尾工作

目标-执行-评估周期与短期记忆有着强烈的相互影响。这种相互影响是非常有道理的,因为短期记忆正是任一时刻我们的注意力的焦点。对于注意力转移的结果之一就是人们经常忘记任务的扫尾工作。

第九章:识别容易,回忆很难

题目说的很明白,这一章就是在说对于识别是比较容易的,但是对于回忆则回比较难。但是为什么呢?

在这里简单的引用一下书中的语句。(Page.91~Page.92)在核心上,识别就是感觉与长期记忆的协同工作。套用计算机术语,我们可以说人类长期记忆中的信息是通过内容寻址的,但“寻址”这个词错误地暗示了每个记忆都处于大脑的某个具体位置。实际上,每个记忆对应的是一个散布于大脑很大区域内的神经活动的模式。

(Page.94)与识别相反,回忆是在没有直接类似感觉输入时,长期记忆对神经模式的重新激活。这要比用相同或者接近的感觉去激活要困难得多。人们能够回忆,因此显然能够从其他模式的神经活动或者大脑其他区域的输入去重新激活对应某个记忆的神经活动模式。然而,回忆所要求的协调与时间提高了激活错误模式或者只有部分正确模式被激活的可能性,从而导致无法回忆。

识别与回忆对用户界面设计的影响

  • 看到和选择比回忆和输入要容易
  • 尽可能使用图像来表达功能

第十章:从经验中学习与学后付诸实践容易,解决问题和计算很难

本章讲了题目中提到的三方面内容,然后根据这三方面的内容结合UI设计进行了讲解,并通过列举一些例子进行了说明。

我们有三个大脑

  • 旧脑
    主要是脑干,即脊髓进入大脑底部的地方。随着第一条鱼进化出来,脑干就出现了(鱼类出现之前的昆虫和软体动物没有通常意义上的大脑)。旧脑将所有东西分成三类:可以吃的、危险的以及性感的。它也负责调节身体的自动功能,例如消化、呼吸和反射活动。爬行动物、两栖动物和大部分的鱼类只有旧脑。

  • 中脑
    大脑的这部分被称作“中脑”有两重意思:(a)物理上,它居于旧脑之上和大脑皮层之下;(b)在进化的顺序上,它在旧脑之后和新脑之前。中脑控制着情绪,对事物产生愉悦、难过、害怕、竞争意识、忧虑和愤怒等。鸟类和低等哺乳动物只有旧脑和中脑。

  • 新脑
    这部分主要由大脑皮层组成。它控制着有目的、有意识的活动,包括制作计划等。大部分的哺乳动物在旧脑和中脑之外还有新脑,但只有小部分高度进化的哺乳动物如大象、海豚、鲸以及猴子、猿人和人类才拥有相当大的新脑。实际上,旧脑和中脑的反映比新脑快,因此有时在大脑皮层做决定甚至做出反应之前,我们就按照旧脑和中脑的指挥行动了。

从经验中学习(通常)是容易的

人们善于从具体的经验和观察中概括并得出结论,生活中我们就在不断地概括总结。然而,我们从经验中学习的能力并不完美,书中列出了几方面的原因(Page.100)。

第一,对复杂的情况,比如涉及了很多可变因素或者受许多难以预料的外界因素影响的情况,人们很难做出预测,或者从中学习并概括。
第二,从自己生活中或者亲人好友们那里获得的经验要比那些读到的或者听到的经验对我们更有影响力。
第三,当人们犯了错后,并不总能学到正确的教训。当发现自己处于一个糟糕的处境时,他们并不能很好地记起最近的行为从而将自己当前的处境与真正的原因联系起来。

操作已经学会的动作是容易的

当我们到了一个之前去过很多次的地方,或者做一件已经做过很多次的事情时,我们的行为几乎是无意识的,不需要多少主动意识。

当人们想要把更多事情做完时(而不是挑战自己的脑力),为了节省实践和脑力,也为了减少犯错的机会,他们倾向用那些无意识的或者至少半无意识的方法。

一个交互系统的设计者该如何将任务设计得更快、更容易和更少出错呢?答案就是把任务的操作设计得能够很快使其成为无意识的。

解决问题和计算是困难的

这一部分主要说明了解决问题和计算并不是一件容易的事情。书中用大量的例子列举了不同动物受大脑的影响而对解决问题和计算所做出的反应。并通过事实论证了这些行为是困难的。

在用户设计上的影响

这部分书中给出了一些设计上的规则,用以让交互系统应该尽可能减少用户不得不投入注意力去操作它们(krug,2005),否则这会把稀缺的认知资源从他们要用电脑解决的任务行抽取出来(Page.109)。

  • 显著地标识系统状态和用户当前进度
  • 引导用户完成他们的目标
  • 不要让用户诊断系统问题
  • 尽可能减小设置的数量和复杂度
  • 让用户使用感觉而不是计算
  • 让系统令人感到熟悉
  • 让电脑去计算

第十一章:许多因素影响学习

本章就是在讲那些影响人们学习使用交互系统的因素。

当操作专注于任务、简单和一致时,我们学得更快

认知心里学家把用户想要的工具和工具所能提供的操作之间的差距称为“执行的鸿沟”(Norman & Draper, 1986)。使用工具的人必须好用认知力量将他想要的转换成该工具能够提供的操作,反之亦然。这种认知努力将人的注意力从任务上拽走,放到了对工具的要求上。一个工具提供的操作与用户想要的之间的鸿沟越小,用户就越不需要去考虑工具本身,而能更专注于他们的任务。因此,这个工具也就能更快地自动化了。

其实,总结就一句话,只要能够很好地让用户达到目标完成任务,少即是多。对于功能需求方面,很多团队或个人总是担心功能单一或太少。对于此,书中给出了建议,(Page.115)在面临这种压力到时,除非确有迹象表明会有很多潜在客户或者用户需要它,否则一定要坚决抵制。

在UI操作方面,系统不同功能的操作越可预期,它的一致性就越高。一致性越高,学习成本就会相应越低。

当词汇专注于任务、熟悉和一致时,我们学得更快

这部分对于词汇的运用给出了一些建议。例如,

  • 词汇应该是专注于任务的
  • 词汇应该是熟悉的
  • 专用词汇应该保持一致

其实这部分,我觉得就是需要有一个好的文案。

第十二章:我们有时间要求

这一章是分析了系统的反应时间对用户体验的影响。无法与用户的时间要求很好地同步的系统不能称为有效的工具,并会被用户认为是反应不灵敏。对于高响应度的系统即使无法立刻完成用户的请求,也要让用户了解状况。系统的及时反馈非常的重要。

声音中我们所能察觉到的最短的沉默间隔:1ms(0.001s)。在短暂的事件和微小差距上,我们的听觉比视觉更敏感。

可见且能对我们产生影响(或许是无意识的)的视觉刺激的最短时长:5ms(0.005s),这是所谓潜意识知觉的基础。

挠反射的速度(对危险的非自主的运动反应):80ms(0.08s)。挠反射要比对于一个感知到的事件有意识地反应快得多:快了近十倍。

一个视觉事件与我们对它完整感知之间的时间差:100ms(0.1s)。

可使我们感觉一个事件产生另一个事件的连续事件之间最长的时间间隔:140ms(0.14s)。这个时间间隔是感知因果的最长时限。

从感觉上判断视野中4~5个物体的时间:200ms(0.2s,每个物体50ms)。

事件进入意识的编辑“窗口”:200ms(0.2s)。识别了一个事物之后的注意力暂失(对其他事物失去注意):500ms(0.5s)。

视觉-运动反应时间(对非预期事件的有目的的反应):700ms(0.7s)。

人们对话中交换发言时的最长沉默间隔:大约1s。不受干扰地执行单一(单位)操作的时长:6~30s。

经过上面的这些罗列也可以看出,其实这一章就是在说明不同的应用场景,系统的响应时间也不一样,书中列举了很多这种例子。这里就不一一列举了。

Comments