本质主义谬误百出,重构AI时代的认知模型
这篇书评可能有关键情节透露
与传统的地域限制、行业壁垒、语言隔阂、政策封禁时代内容生产不同的是,互联网时代的网民在得知tiktok有可能被美国政府封禁,就大规模下载小红书并与中国网民进行“赛博对账”,各自吐槽生活不易。去中心化(decentralization)是互联网发展过程中形成的社会关系形态和内容产生形态,是相对于“中心化”而言的新型网络内容生产过程。这些“去中心化”时代里产生的内容,其圈子、群组作为一个个新的虚拟空间中的集合,正是当今各种AI进行训练的大语言模型以及大数据的来源。
那么,是否可以以及如何才能将这些“去中心化”的内容建构成一个知识系统,就像创立一个虚拟的游戏世界?AI时代,世界是否还需要一个中心,就像事物都有一个本质,且本质是否永远不变?美国西北大学社会学和政治学教授詹姆斯·马奥尼在《社会科学的逻辑》一书中,依靠集合论、图论等数学工具,以“科学建构主义”的方式,打破“本质主义”的“一元论”,在“去中心化”的时代中重构Web 2.0时代的社会科学研究范式。
在作者看来,万事万物可分为三个类别:自然类丛、属人类丛和偏自然类丛(如下图所示)。分别属于纯自然、纯人类、自然与人类互动的产物。但自然与人之间,并不存在一一对应的关系——也就是说,社会科学范畴是指由人生产出来的知识信息以及由人组成的社会关系(人际网络),与独立于人类心智的物质、性质和过程(纯自然现象,如打雷下雨)之间,并不存在一种有条理的对应。所谓的“天人感应”,王安石早就以“天变不足畏”进行驳斥——这应该是中国以科学理性精神破除谣言和迷信的成功案例。

互联网时代,传统的社会科学研究之所以饱受诟病,研究结果难以令人信服,很大程度在于,你所研究的对象不再是静止孤立的个体,而是在虚拟空间不断进行互动和演变的一个个群体,web2.0的时代,每个人都是知识的创建者和内容协同及修订者,百科、词条、Wikipedia、Flickr、Blogger等知识库层出不穷——从事自然科学研究,本质主义是其恰当的出发点,而今天的社会科学研究,面对的是复杂多变的人和人际网络,无法找到一个不变的本质或者中心,所以,采用科学建构主义、在一个场域中将不同的集合确定为不同范畴,并研究不同范畴之间的互动关系,才是恰当的出发点。
集合是一个抽象的对象,是人类心智的产品,它位于人脑中,是一种精神现象。作者认为,集合成员关系可分为充分非必要关系、必要非充分关系、充要关系、INUS关系(充分非必要条件中的必要非充分部分)以及SUIN关系(必要非充分条件中的充分非必要部分)。如图3.4所示,X 和 Z 是 Y 的 INUS 条件:

同样如图3.5所示,X 和 Z 是 Y 的 SUIN 条件:

集合论研究者通过识别子集、超集的同延条件来定义范畴。使用集合论分析,认知模型的每个相关方面都可以被视为一个独立范畴,特定案例可以是范畴的完全成员、部分成员或非成员。这种来自于离散数学的数学分析方法和数理逻辑,以集合论为起点,包含命题逻辑、谓词逻辑、图论、代数结构、组合数学等研究方法,聚焦离散问题的分析与优化,通过设计网络拓扑结构,用逻辑推理验证程序正确性,用组合数学优化算法复杂度,是一种网络时代的“科学建构主义”,通过集合论方法与校验、反事实分析、序列分析和贝叶斯分析,更有助于我们研究认知模型如何为范畴产生原型效应。
反事实分析——进行集合论校验时,对可能案例进行反事实分析,是小样本和个案研究分析中一个重要的因果推断工具,它能帮助研究人员通过思考“假设某个真实事件没有发生,或以不同的方式发生,那么会发生什么”来评估该事件的影响。在此过程中有可能只需要分析一个或少数实际案例,就可以估计某个条件对于某个结果有多大的必要性和充分性——有点类似于数学上的反证法。
序列分析——除了因果推理之外,对于中介原因,集合论序列分析则提供了一套规则,人们能够确定某中介事件是核心机制还是局部机制。核心机制为从因至果的促动、产出过程提供了逻辑上令人满意的解释。序列分析方法是一种工具,它可以将关于历史因果的学术讨论予以结构化:当一个人确定一个原因的原因时,他希望知道这些原因是否比原来的原因更重要,序列分析帮助研究者以一种有条理的方式回答此问题。
贝叶斯分析——对于科学建构主义来说,贝叶斯分析的前提在于,对真理的科学评估不可避免地依赖于主观信念。然而,对于集合成员的观察,有关键性观察和累积性观察两种,这意味着你的观察可能会出现遗漏缺失的数据,也有可能会有隐藏并在以后突然显现或者新增的数据,由此,观察的效果和集合论的检验就会令人存疑,所以在集合论分析的同时,需要区分效果性证据和预期性证据,加入概率分析,以避免把偏见和不必要的错误带入结论。
至此,集合论和科学建构主义为社会研究提供了一套解释性工具。社会科学的一个核心使命是要为社会范畴提供定义,从而帮助人们对范畴意义获得集体理解。而对范畴的建构和标定,正是科学建构主义下的社会研究。在集合方法论中,因果推理涉及对规则模型的使用,这种规则模型关注的是心智依赖范畴之间的逻辑联系。社交网络将全球人类之间的联系缩减为“六度分隔理论”,某种程度上,就是不同集合之间的互动关系模型。所以,将所有范畴都当作集合来分析,与基于属性-存有假设的主流变量导向方法有很大的不同,这需要研究范畴之间的逻辑关系,而不是属性之间的统计关联(通俗点说,这不是物质与自然之间的关联,而是不同人群之间的互动,驱动这些人群集合的,可能是利益,也可能是情感或者某种社会心理)。
明确了不同集合及范畴之间得到逻辑联系之后,建立一个理论框架,并与规范传统之间建立联系(文化主义理论框架与道德相对主义相联系,理性主义理论框架与道德功利主义相联系,结构主义理论框架与道德平均主义相联系)。在社会科学中,意向图式和认知模型被融合到一起,创建出构成基本理论框架的元素,包括文化主义、理性主义和结构主义。这三种基本理论框架都假定了行动者、资源和规则之间相互依存的关系,以此形成的社会科学理论脚手架范畴,形成对社会现实的新理解。如下图所示:


与网络环境一样,现实社会中影响人们决策的,也都是关键事件和路径依赖。书中举例分析关键事件的案例为“摩尔论圈地运动”,即圈地运动和议会民主制的建立之间的联系,对传统农民社会的破坏是否为建立议会民主制的必要条件。摩尔使用跨案例的比较来得出结论,即在一个以强大的传统农民为标志的社会中,民主化不可能有所进展。用集合论的语言来讲,这一观点认为,在通过现代世界的道路上,一个社会在“不强大的传统农民”中的成员资格是其在“议会民主制”中拥有成员资格的必要原因——圈地运动对英国的议会民主制是必要的。
近几年,“例外主义”常常成为焦点——美国缺少社会主义、没能成为欧洲式的福利国家,中国政治体制稳定但有40年的经济持续高增长,这些都不符合欧洲社会发展理论框架和具体路径。但路径依赖的思想仍然在许多学者(和普通人)那里能够产生共鸣,因为它符合我们所共享的“源头—路径—目标”(source-path-goal)图式,作者以戈德斯通关于工业革命起源的著作来说明,在路径依赖中,引发制度在生产逻辑的自我强化序列,和引发变革型逻辑的反应性序列各自起到了不同作用,如下图:

整个序列是在英国自由文化的情境下运作,通过蒸汽机的发明这一偶然事件,工业化序列的每一步得以展开,使得英国对现代工业主义的突破成为可能——它是从极不可能一起发生的前序事件中生长出来。可以说,路径依赖是人类用以理解世界的基础认知结构——这个意向图式可以用三个关于位置的集合论隐喻来说明:1,位置即状态,即事情的某种状态就是空间中的某个有界位置,事情的状态构成了集合;2,变化即运动,也就是说,变化就是进入、离开集合的运动;3,因果关系即受力运动,即一个实体受外力从一个有界位置移动到另一个位置,因果关系是从一个集合到另一个集合的受力运动。通过事前条件+初始关键事件+自我强化序列(制度再生产)+反应性序列(因果链)来推断,最初的关键事件可以确保最后结果的发生,而这一点,正是目前AI在采用大模型训练其认知结构的通用方式。
但在本质主义研究者看来,对路径依赖的认定是不客观的,因为它取决于研究者或研究集体的信念和期望(人的主体性),如果初始关键事件是偶然发生的,那么推断出的结果必然令人费解。但从科学建构主义的角度来看,所有研究的集合与范畴都来自于共同的假设和信念,不依赖于单个研究者和研究集体的信念和期望。已形成的认知结构会让人群产生共鸣,他们植根的意向图式属于全人类,人们在理解世界时会自动调用这一图式。
但从某种程度上来说,路径依赖也是人类未来最大的陷阱。它会使人们习惯于调用已知世界的意向图式,而缺乏探索未知世界的勇气。OpenAI创始人山姆奥特曼最近在谈到人类如何不被AI淘汰时说:学怎么学,比学什么更重要;懂人比懂AI更值钱。这说明在社会科学的范畴并没有映射着一个独立于心灵的外部现实,他们实际产生于心灵与外部现实的相互作用。从这个意义上来说,AI如同科学是一种认识论的工具,它不是一种新的本质主义。本质主义是人类文明发展和存续的一种必要的、相当实用的幻觉。我们需要本质主义来维持我们的经验现实所依赖的集体信念,但科学的使命是揭露心理幻觉而非再现他们。