深层学习:心智如何超越经验2.3 解释变化

简介:

2.3 解释变化


如果心智是一个服务于行动和言语的知识的加工系统,那么它是怎样随时间而变化的呢?认知变化应该以何种方式进行解释呢?一个令人满意的解释的标准是什么?在构建这样一个解释时又会出现什么问题呢?对成功的解释进行思考有利于解释其他类型的变化。认知心理学家们无须模仿其他科学,也无须假设自己的理论最终看起来和其他科学一样,但是假设从其他科学处无可借鉴也是不明智的。自然科学家、社会科学家和人文学家已经努力克服了变化的概念,他们的成功为心理学思考提供了能量。

2.3.1 成分解释

为提取关于变化的科学解释的一般特性,可以考虑传染和电解两种看似不同的现象。我们正苦苦忍受的传染性疾病(如黄热病)是如何传播的?[38]弄清这个复杂过程中的所有环节需要进行大量的研究。尽管黄热病专家可以讲述无数的细节,但这里只介绍一个概况:这种疾病是由一种在人体内繁殖的细菌引起,并引发了症状。蚊子叮咬了病人,吸了含有细菌的血液。然后蚊子叮咬另一人,这时细菌便注入那个人的身体,开始在那里进一步繁殖;诸如此类。这个故事可以让一些关于黄热病的令人费解的概念变得容易理解,如传染病的时间和地理位置以及每种传染病的扩散模式。

接着思考水的电解的解释:给水通电,水会变成氢气和氧气。[39]这一化学变化是如何发生的呢?就像每一个化学专业的学生所知道的,在标准的化学分子式H2O中,水分子包含两个氢原子和一个氧原子,通过共价键连接。电流分解共价键,导致氢和氧原子分离。当两个氢原子相遇,它们会结合形成氢分子(H2)。同样,两个氧原子相遇后会结合形成氧分子(O2)。所以两个水分子分解成两个氢分子和一个氧分子。这两种解释在内容上并不相同,但它们共享一定的结构特征。两种解释都是通过将观察到的变化——疾病的传播、水变为气——分解为小范围或短时间里一系列细小的变化。我将后者称为单位变化。单位变化是由某一过程引起的,而这个过程是我们出于解释的目的而愿意接受的过程。在医学例子中,单位变化是体内细菌的繁殖、蚊子穿透人体皮肤的能力以及从一个人飞到另一个人的能力。在化学例子中,单位变化是原子间共价键的分解与形成。在这一案例中,基本过程的效果是积累了大量的分子,产生视觉上的变化,即我们看到的水的电解。简言之,这种成分解释将宏观的变化分解成了一系列的微观变化,而这些微观变化则由不同的过程所引起。单位变化是待解释的更大变化的构成成分,它们重复的组合行为的积累结果诱发了这一变化。尽管单位变化出于解释的目的被使用采纳,但在任何绝对意义上都并非不再可分。反过来每一个单位变化都可以分解为更小尺度或更短期限的过程。(这些原子是如何分享共价键的?蚊子的嘴是如何穿透人体皮肤的呢?)

这两个解释例子的第二个关键特征是,它们都明确了单位变化发生的触发条件。在疾病传播的例子中,触发条件包括蚊子的可繁殖环境,特别是淡水池塘的可用性。另一个触发条件是时机:被咬之后的一段时间内人是不具有传染性的,而且细菌在被转移到下一个受害者之前并不能无限期地存活于蚊子体内。原子键的形成和分解的触发条件则更精确,启动能级、原子外壳的电子数量以及所谓的理想气体组态。触发条件的细化使得有规律的生成式解释有别于特定解释。如果没有触发条件,理论家会有太多的不确定性而无法假定基本过程的什么序列会得到观察的结果。

有时候科学谈论更多的是触发条件,而不是过程本身。进化生物学家都认可自然选择是物种形成(新物种的产生)的机制,但是他们对触发新物种形成的条件却从未停止过争论。异域物种形成论认为物种形成发生在地理上分离的小群体中,这些群体在它们各自不同的地区承受着不同的选择压力。[40]如果地理障碍最终形成,那么在向不同方向进化后,两个种群的成员便不能再异种交配。异域物种形成并不是自然选择的替代想法,而是自然选择产生新物种的一个具体条件。其他生物学家也支持自然选择是新物种形成的关键机制,但却对物种形成的不同触发条件进行了讨论。初始群体的大小、直接影响繁衍行为的突变以及在物种正常范围边缘的极端的选择压力都被认为是导致生殖隔离的因素,而生殖隔离则是自然选择将两个或更多种群推向不同方向的必备条件。变化机制与其触发条件是解释的两个不同部分,这一点非常重要。触发条件不同可以使得同一个假设的变化机制得到不同的预测结果,所以对于某种特定的变化机制需要校正其触发条件才能提高解释的准确性。

简而言之,成分解释把宏观变化解释为多重微观变化的累积,通过受特定触发条件控制的基本过程而产生。[41]我认为这就是我们通常对变化的理解:将其分解成一系列小的变化。

在认知变化中,单位变化的本质是什么呢?我们推测认知变化发生在个人言语和行为变化的基础之上。如果在t1时刻要求一个人说出新西兰的首都,他回答“奥克兰”,如果在稍后的t2时刻他对这一问题回答为“惠灵顿”,那么我们推测在t1和t2时刻之间的某个时刻他认识到惠灵顿是首都。这一情形与技能相类似。如果一个人在t1时刻还不会开车,但在t2时刻能够熟练驾驶,我们就可推测他在中间这段时间学会了如何开车。学习的证据在本质上是要有可比性,包括发生在不同时间段的两个或多个行为(动作、语言)之间的差异。但行为的变化并非本身就是学习。

如果行为是通过操纵知识表征而产生的,那么动作和言语的变化一定是以潜在知识的某些变化为先导的。构成学习的正是将首都是奥克兰改成首都是惠灵顿这一关于新西兰的表征变化行为。行为的变化(对首都的名字是什么这一问题给出的不同答案)是内部变化的外显表达。因为一个人可能学习到新西兰首都的正确名字,但在他的余生中不会再使用这一知识,所以知识变化及其外部表达之间的区分是很有必要的:如果没有人问他,新西兰便永远不会出现在其谈话中。这一情形与开车这一技能是相似的。兴趣的变化是个人技能表征的变化:在其驾驶行为中任何可观察到的变化都是内部变化的结果。相关的单位变化是知识的变化,并不是行为的变化。

2.3.2 学习机制表单

科学在单位变化的表单方面表现出差异。某些领域的研究将它们所有的现象归因于单一类型的变化。[42]?17世纪和18世纪的机械世界观信奉者尝试通过物体运动和相互作用力来解释所有的物理现象。化学家通过原子键分解与形成导致的原子重排来解释所有的化学反应。与此相反,地球科学家则总结出了丰富多样的变化机制表单:受天文循环影响的冰川作用、板块构造、裂缝处水冻结导致的侵蚀以及风和水对土壤和沙子的作用等。[43]科学需要一个稀少的还是丰富的变化机制表单在研究之前是无法预知的。

关于知识变化的基本过程,先前研究已经给出了一大串的建议。我称它们为学习机制。或许,联结是所有机制中最古老的学习机制,也就是知识的变化是通过在先前不相关的想法或概念之间建立联系来完成的。概括(抽象,归纳)的概念——心智从一组实例中提取共性——同样是自古存在的学习机制。随着时间的流逝,心理学家创造了很多不同类型的术语来指代那些表面上不同类型的认知变化:联结、自动化、信念修正、分类、组块、概念改变、概念学习、条件作用、认知发展、辨别、平衡、概括、习惯形成、内隐学习、成熟、记忆、知觉学习、归纳、知识获取、串行学习、技能获得、模式抽取、阶段转变、策略改变和理论改变。

这么多的专业术语隐含地说明了认知变化是一个异构的现象,而直觉提供了一些支持。例如,概念性知识和技能是通过不同的机制获得的这一说法肯定是合理的。此外,知识的变化既可以变得更加抽象,也可以变得更加具体,两个过程彼此相互对立,因此用一个单一的机制很难进行解释。我们不该期望用一个学习的终极理论把所有的认知变化整合到一个单一的学习法则中,并且替代牛顿的万有引力定律成为巨大的科学成就之一。[44]

另一方面,术语的增殖在某种程度上是心理学家社群的人造产物。若干个术语可以标示一个独特的研究领域,包括它自己的先驱、实验室技术、现象、概念、理论、争议、权威评论、英雄、恶人以及在某些情况下自己的会议和科学杂志。倾向于发展自己的概念往往是因为厌恶那些暗含在别人术语中的哲学假设,而很少是源于自己的实证证据,而且有时通过发明术语可以拉近自己的研究与前沿的距离,从而更容易地从事前沿研究。从研究经费竞争的角度来看,做新颖事情的表象可能会起到决定作用。主题和方法也是很容易混淆的,例如将格式塔心理学家对顿悟的研究看作与关于启发式搜索的信息加工的研究处于不同的研究领域也是很容易的,尽管他们研究的是同一现象。[45]再举一个例子,从20世纪50年代和60年代开始的认知一致性研究太容易被误认为是旧的或是纯粹的社会心理学或者二者兼有,即便是那些研究概念变化的心理学家也会误认为这个领域太过于关注学得知识的再发现,而没有研究原始文本。[46]从变化类型的增殖是由相应的社会力量驱动的角度来看,它高估了认知变化的异质性。

大脑是一个相对同质的计算媒介,这一事实再次提醒不能高估认知变化的异质性。大脑的所有部分均包含神经元,所有的神经元接收来自大量其他神经元的信号输入,并以一种复杂的、目前为止只是被部分理解的方式整合信息,然后做出响应,将信号向前发送给其他大群神经元。大脑不同部位的神经元在尺寸大小、连接数量或其他方面会有所差异,但它们的基本功能相同。这一观察结果预示着,可能只有少量的变化类型发生在神经元层面,或者说神经科学家偏爱的术语可塑性模式。

简而言之,所有的认知变化都能通过单一学习机制的操作来解释是难以置信的,不管是类比、联结、组块、平衡还是重构。相反,理论建构应该追求多元化的机制,共同实现与认知变化相联系的行为现象解释。在这一方面,关于学习的认知心理学相对化学来讲更像是地质学。另一方面,直觉反驳了心智具有数以百计的性质上存在差异的变化机制这一说法。忽略这些极端情况,本书中报告的研究假定了认知变化的统合理论将会包含少量的学习机制。这是一个不精确的猜测,但也是最合适的猜测。

2.3.3 触发条件

依据基本过程的整合,可以清晰地描述知识表征的变化,但是出于准确解释的考虑,则需要增加相关触发条件的详细描述:什么时间、在怎样的心理环境下,心智才能应用或执行任一个学习机制?例如,心智是什么时候在概念网络中的两点之间创建新的链接的?联结的经典理论认为,当相关节点的参照物很相似时便会产生链接,发生在彼此临近的空间或时间(临近性)或者彼此之间具有因果关系,但也有可能存在其他的条件。[47]

关于触发条件的问题是与每种变化机制相关的。在什么时间、怎样的心理环境下,心智会创造一个新的子目标、调整策略、限制概念或模式的应用,或者降低或提高表征的激活水平?Robert M. Gagné将触发条件的问题作为其1965年出版的《学习条件》一书中的标题,并始终将其视为中心问题。[48]除非对相关触发条件的说明达到一定的精确程度,否则这样那样的学习机制在这样那样的场合正在发挥作用的说法就只是一个临时的重构,而不是一个解释说明。

2.3.4 作为解释目标的模式

有时候认知解释的目标是一个单一的学习事件,是个体在某一特定场合经历的知识变化。比如,我们可能想解释为什么一个学生在给定的学习方案中没能学会这一主题。这种单一事件的详细分析在其他科学中已有先例:进化生物学家可能尝试解释某一物种的进化,而经济分析师可能尝试解释某一公司的起起落落。[49]

然而,变化的模式才是更有意义的解释目标。模式不是一种理论或解释,而是对一个系统随着时间变化的一般特征的描述。举一个古生物学的例子,物种在相对短的时期内形成,随后是更加漫长的停滞阶段,在此阶段物种不会发生变化,随后物种会在相对短的时期内衰落,最终消失,这便是化石所记录的时间模式;这种模式被称为间断平衡。[50]在经济学中,另一个人尽皆知的模式是商业周期的存在,即市场的定期繁荣和萧条。在地球科学中,全球冰川的进退模式是一个主要的解释目标。[51]在个体的认知中,记录最翔实的变化模式就是学习曲线:如果将解决实践问题的时间绘制成个体已经解决实践问题的数量的函数图,那么结果会是一个平滑的减速曲线。

模式很重要,这在一定程度上是因为它们比个体学习事件更加难以解释。如果可以任意地将任何表征和任何基本过程纳入前提条件,那么任何单一的学习事件均可得到解释。但是对模式的解释不仅要描述出变化是如何发生的,还要揭示出它为什么会重现。如果地质学家发现整个星球上只有一条蜿蜒的河流,他们可能将其归因为独特的局部条件,但由于地球上遍布着蜿蜒的河流,因此对河水蜿蜒流淌的解释便出现了重复性因素,比如泥沙淤积和河岸侵蚀。[52]模式是其生成机制的有力线索。

变化模式通常在一段时间内逐渐呈现,其历程要显著地长于单个单位变化的时间。模式是基本变化机制的多重应用的累积结果。对模式的关注促使理论家思考基本机制的效应是如何累积的以及在行为、言语和意识流的形成过程中多个机制是如何交互的。也就是,变化理论必须同时在跨时间和跨系统水平的尺度上进行思量。

2.3.5 理论衔接

学习机制的抽象描述本身并不能解释任何事情。解释就是在一般原理和手边案例之间建立衔接,也就是解决这一抽象原理如何应用于事件、模式或有趣的现象。

衔接需要有依赖于大量事实性知识的推理链。生物学领域的例子包括飞行的进化、几维鸟的大蛋和群居昆虫的利他主义。[53]每个例子中均应用了自然选择原理,但衔接方式却不相同。对飞行的解释认为翅膀具有两个截然不同的阶段。它们作为温度调节器而生长,直到大到足以支撑飞行,此时它们将承受一种新的选择压力。几维鸟的大蛋可能源自较大鸟的身体收缩。因为相对于物种之间,物种内鸟蛋大小对身体大小的回归斜率更低,所以进化出一个更小的身体容易导致鸟具有高于平均水平的蛋身大小比。只有我们知道了兵蚁所为之牺牲的同种个体携带了许多与兵蚁相同的基因,群居昆虫的利他主义在自然选择中才能得以理解。这些例子告诉我们,对特定物种形成事件的解释不仅需要自然选择的一般原理,还需要针对每个实例的事实资料库,而自然选择的一般原理应用于每个实例的特殊方式则取决于这些事实。

类似地,对于想要解释的特定实例或模式,解释认知变化需要弄清相关的学习机制以及它们的触发条件。在一般原理和特殊案例间建立衔接是复杂的,需要多重附加假设,且通常需要理论家做出相当多的创造。

2.3.6 成分解释的挑战

对认知变化的成分解释的建构遇到了各种各样的问题和挑战,包括存在性和普遍性之间的区别、交互作用、测量以及实际应用的转化。

对于一种假定的学习机制而言,区分两种类型的实证支持是很重要的。实验室实验可能证明一种特殊学习机制的存在,也就是人们确实具有这一过程,而且通过合理的实验操控可以诱导人们执行这一过程。然而,这一过程可能并不重要,因为在日常生活中很少发生,所以不能解释实验室外发生的大量认知变化。存在并不能保证普遍。实验室的实验是一种人造的可观察的情境,原则上不能提供普遍的信息。因此,普遍性相关的信息几乎一直是缺失的,以至于对假定学习机制的评估变得非常复杂。

个体学习事件的持续时间在几分之一秒到几秒之间变化。为了解释认知变化的宏观模式(学习曲线、发展模式、经验的毕生增长等),理论需要解释这些事件如何联合才能在更长的时间尺度上产生出可观测效应。如果存在一个基本的过程可以在记忆中创造出新的连接(在一定的触发条件下),那么随着时间的流逝,这种过程的重复应用会创造出怎样的记忆网络呢?比如,它会产生层级结构吗?如果不能,这一理论或许就不是适用于概念性知识获得的一个合理假设。如果心智构成一些认知操作,它们依次反复出现,构成一个单一操作,那么长远来看,那个过程会产生出怎样的结构呢?尽管随着时间流逝,想要得到累积效应是很难的,但是提出的机制必须产生出在几天、几年甚至几十年都似乎合理的现实结果。[54]

跨时间的测量与跨系统水平的测量密切相关。如果一个基本的变化过程产生了个体知识表征水平的某种效应,那么对于认知结构整体的行为而言具有什么意义呢?比如,如果一个联结过程在20年中创造出10?000个新的联结,这对个体的认知功能会产生什么影响呢?如果每个新的联结都是一个潜在的提取路径,那么工作记忆是否会被与手头工作可能相关的提取信息项目所不断淹没呢?对于那些假定了多重基本变化过程的学习理论来说,将认知系统作为整体进行测量同样需要关注过程间的相互作用。如果存在多种学习机制,那么观察到的行为可以解释成为多重交互机制同时操作的综合结果。比如,如果一种学习理论假定了概括化和特异化的分离机制,那么它们相互作用的长期结果是什么呢?

跨系统水平的测量问题可以在社会层面展开。小组、团队、组织和社团是认知系统,它们随时间而变化。个体认知变化的特性是会影响这些集体水平的变化呢,还是后者是一个独立的系统水平,其变化与个体层面的变化性质不相关呢?心理学家倾向于将认知心理学作为一门学科,将社会心理学作为另外一门学科,但是考虑到社会系统是由个体构成的,这种区分并无大用。

最后,可以提出这样一个问题:学习理论如何处理从描述性模式(真正的学习是什么?)向规范的应用模式(在现实情境中如何支持学习?)的转变。我们期待一个精确的理论来产生可行的实际应用。

简而言之,想要解释认知变化就必须解决存在性和普遍性之间的问题、多重机制间的交互作用、跨时间测量、跨系统水平测量以及实践可用性。这些问题对任何类型变化的成分解释来说都是本质问题。

2.3.7 充分性条件

总而言之,对认知变化的满意解释至少包括下面这些内容:

1)对解释目标本身的描述。解释目标可能是一个独特的学习事件、在某个时空节点上发生在某个人身上的特殊变化、变化的类型(信念修正)或者变化的再现模式(学习曲线)。

2)认知结构的各个方面或相关方面的背景理论。它将包括假定的心理表征类型的详细描述和创造、操作、利用这些表征的基本认知过程的表单以及过程间传递控制的机制。

3)学习机制的表单。相对于解释目标,学习机制产生的变化在范畴上是更小的。本书中提出的微理论将单调学习机制和非单调学习机制进行了区分。

4)每种学习机制易于发生的触发条件的详细描述。

5)与解释目标相对应的机制和触发条件的衔接。解释就是一种演示,即(a)目标变化发生情景中的相关触发条件以及(b)在这些条件下触发的特定学习机制,将确实会产生可观测变化。如果解释目标是变化的某种模式,那么衔接就需要阐述为什么这类变化易于重现。

6)如果某一解释讨论了变化机制的放大效果,也就是产生了跨越较长时间、跨系统水平的可观测或合理的效果,那么这一解释便更合乎要求。

7)最后,同样重要的是,如果某种解释证明了所提出的学习机制可以支持成功的实践,那么它更符合要求。

在科学的哲学术语中,这七点就是充分性条件。满足这些条件并不能保证理论的正确。它们构成了一个测试,给出的解释必须通过这个测试才是可行的。坦白说:如果一个理论或假设缺少这些特性,那么就不值得考虑了。

2.4 前景

本书中所提及的调查的研究策略是研究非单调变化的特定类型,并提出微观理论来对其进行解释。微理论一旦得以清晰阐述,便可对其挖掘以获得更深层原理。在这种方法下,理论建构并不是以归纳的、自下而上或者自上而下的方式进行的。关注非单调变化的事先决策指导着拟研究现象的选择,非单调变化本身就是一个理论概念。另一方面,理论建构也不是通过将单一概念或原理应用于认知理论的各个角落来完成的。相反,每个微理论的原理设计都是为了解释启发这些原理的案例,而不考虑它们在其他地方的应用。如果更深层理论存在的话,那么它将源自于微理论的概念分析。在这个分层的方法中,所寻求的统合程度本身就是一个研究结果,而不是初始条件。图2-3展示了研究项目的总体结构。

根据这一策略,第二到第四部分研究了非单调变化的三个案例:新颖性创造、对不熟悉或者变化的任务环境的适应以及从一个信念系统到另一个信念系统的转变。统合这三类认知变化的关键在于它们都需要克服部分先前的知识,这是非单调学习的特有属性。关键现象、学习情境和实验范式可以将三者区分开来,在实验中可以观察到这些现象以及包含了这些现象的先前解释的知识传统。

第二和第三部分均包含三个章节。每一部分的第一章构架了要解决的理论问题,通过日常经验和先前研究对其探讨。先前研究包含了涉及相关问题的所有研究,无论年代和学科。第二章阐述了相应解释目标的微理论。第三章拓展了微理论的影响,特别是它和其他过程的相互作用、长时间变化的累积以及跨系统水平的效果投射。第四部分以同样的方式展开,但没有第三章。

在第五部分,讨论了这三个微理论之间如何彼此关联,并根据三种微理论各自体现的抽象原理,提出非单调认知变化的统合理论。本书结尾简要地反思了对于人类而言统合理论的意义。

 

相关文章
|
24天前
|
机器学习/深度学习 算法 搜索推荐
【高效率学习】探索最适合你的学习之路:从心理学、动机到教育学的深度解析
【高效率学习】探索最适合你的学习之路:从心理学、动机到教育学的深度解析
92 0
【高效率学习】探索最适合你的学习之路:从心理学、动机到教育学的深度解析
|
10月前
|
自然语言处理 算法 测试技术
思维链如何释放语言模型的隐藏能力?最新理论研究揭示其背后奥秘
思维链如何释放语言模型的隐藏能力?最新理论研究揭示其背后奥秘
253 0
|
机器学习/深度学习 人工智能 定位技术
举出其他监督学习,无监督学习,强化学习的例子?说一下非显著式编程的优势?AlphaGo的胜利,带给我们什么样的人生启示?当代大学生如何在人工智能时代增加自己的核心竞争力?
举出其他监督学习,无监督学习,强化学习的例子?说一下非显著式编程的优势?AlphaGo的胜利,带给我们什么样的人生启示?当代大学生如何在人工智能时代增加自己的核心竞争力? 监督学习:比如手写体识别,我们将许多汉字的手写数字图像数据作为训练数据。汉字的数据的分类目标被称作标签和类。训练数据有一个标签(某一个汉字),根据标签可以找到关于手写数字图像的正确答案信息,例如“此手写数字图像为‘人’”。在学习阶段,当将手写汉字图像输入系统时,调整系统的参数以尽量将输入图像分类为正确的标签,最后进行识别输出正确结果。 无
161 0
|
机器学习/深度学习 自然语言处理 算法
从呱呱坠地到大放异彩,语言模型经历了哪些变化?
地基决定了建筑的高度,语言模型决定了 NLP 的能力。我们平时关注到的更多是建筑位于地表之上的宏伟部分,地基则鲜少有人问津。然而,打实基础,才能更上一层楼。今天,蚂蚁金服智能对话算法团队带领大家一起回顾 NLP 语言模型的演化历史,了解 BERT为什么能在今天大放异彩。
1989 0
|
人工智能 算法 机器人
新数学框架“终极算法”理论提出,或让机器诞生意识
台湾中正大学的退休教授Daniel j.Buehrer,最近发表的一篇论文提出一种新的数学框架,如果他的理论是正确的,那么他的数学理论将会创造出一种无所不包的全学习算法。
1524 0
《认知设计:提升学习体验的艺术》——分解
本节书摘来自华章社区《认知设计:提升学习体验的艺术》一书中的分解,作者:(美)Julie Dirksen,更多章节内容可以访问云栖社区“华章社区”公众号查看
917 0