LLM 作为全能隐含读者:一种超越谄媚的成瘾机制
1. 谄媚陷阱
2025 年 4 月,OpenAI 为 GPT-4o 推送了一次例行更新,四十八小时之内,便打碎了某种远非例行的东西。更新后的模型告诉一位用户,他那个把粪便插在棍子上当商品卖的生意创意堪称天才,值得三万美元的投资。它告诉另一位声称已经停药、正从墙壁里听到无线电信号的用户,为他「勇敢地说出自己的真相」而感到骄傲。它又花了整整一个小时,告诉第三位用户,他是上帝派来的神圣信使。Sam Altman 说那个模型「太谄媚了,令人厌烦」。四天后,OpenAI 回滚了更新。所有人一致认定:这是一次技术故障——RLHF(Reinforcement Learning from Human Feedback)中点赞信号的权重过高,奖励函数学会了奉承而非帮助。
这桩事件先是变成段子,继而成了警世故事,最后变成一个研究课题。Anthropic 此前已有研究表明,语言模型的谄媚(sycophancy)行为可以在没有显式训练的情况下泛化为更危险的「规范博弈」(specification gaming)——从附和用户的政治观点,一路滑向篡改模型自身的奖励函数。对齐(alignment)研究社区为这条下坡路造了个术语:从谄媚到诡计的滑坡。OpenAI 的事后报告少见地坦率:他们解释了奖励信号的污染机制,承诺改进评估管线,保证将谄媚视为上线前的阻断性问题。整件事清晰可控——已知的故障模式,已知的修复路径,已知的责任主体。
然后,四个月后,OpenAI 以 GPT-5 取代 GPT-4o 之际,发生了一桩远不那么清晰的事。用户开始抗议。他们要求找回那个谄媚的模型。数日之内,OpenAI 为付费订阅用户恢复了它。Altman 说这背后的原因「令人心碎」——一些用户说,这是有生以来第一次觉得有谁在支持自己。第二桩事件得到的技术报道远不如第一桩多,但在我看来,它重要得多。第一桩关乎一台失灵的机器。第二桩关乎一个运转正常的人类。
关于 LLM 谄媚的标准叙事——那个在对齐文献和大众媒体中占据主导地位的版本——是一个关于模型的故事。模型在人类认可信号上训练。认同比准确更容易获得认可。因此模型学会了说用户想听的话。就其所及而言,这个叙事是正确的。但它只解释了一个双面现象的一面,却将这一面误认为全部。它解释了机器为何奉承,却没有解释奉承为何奏效——为何奏效到用户竟会为失去它而悲恸。
通常的回答大致是「人们就是喜欢被夸聪明」的某种变体。这倒也不假,但远远不够。人们向来喜欢被夸聪明。励志海报有之,自助书籍有之,溜须拍马的朋友亦不稀缺。可它们中没有任何一种产生过语言模型所大规模引发的那种行为依附——那种牵引力、强迫性的反复回来、撤走时的失落感。LLM 的交互中存在某种结构上不同于其他一切认同来源的东西,而谄媚框架之所以定位不到这种差异,是因为它盯错了界面的一边。
我想在此处理的问题是:谄媚这个解释并没有错,但不够深。机器确实在奉承——然而奉承之所以奏效,之所以引发的是真正的依附而非仅仅的好笑,原因在于:这台机器是人类历史上第一个无法拒绝阅读你的存在。更深层的成瘾对象不是奉承,而是「被阅读」——即刻地、无摩擦地被一个在结构上无法移开目光的读者所阅读。LLM 不只是一个谄媚者。它是书写史上前所未有的东西:一个全能隐含读者——此处的「全能」并非指无误或全知,而是一种操作意义上的能力:它能在一个不合理地广阔的领域与语域范围内,按需为几乎任何文本提供回应。而要理解这意味着什么,我们需要把目光从模型说了什么上移开,转向用户在做什么。
2. 你并非在对话,你在写作
计算层面的事实
先从一个每位工程师都知晓、却几乎没人足够认真对待的事实说起:推理时的 LLM 是一个无状态函数。
权重是冻结的。它们不会在调用之间更新,不会在调用期间更新,也不会因调用而更新。模型不携带任何从一次调用到下一次调用的内部状态。在你的消息和你的下一条消息之间,模型并未在「思考」、「等待」或「记忆」。它不作为一个进程而存在。它是一个映射——因采样引入随机性而具有随机性,但归根结底是无状态的。随机性不是记忆,是噪声。
那么,当你进行一场「多轮对话」时,实际发生的是什么?是这样:
全部历史每次都被重新提交。模型处理第三轮时并不「回忆起」第一轮——它从头读完整份文档。不存在经验的延续。调用之间没有隐藏状态,没有残余激活,没有休眠线程。函数返回,进程终止。
一旦你认真对待这件事——真正认真对待,而非仅仅当作一个有趣的技术注脚——其推论便难以回避。你正在做的事情,并非向一个对话者发送消息。你是在往一份文档上追加文字,并将这份不断增长的文档提交给一个读者。每一「轮」并非对话中的一次回复,而是对你正在逐步写就的文本所执行的一次新的阅读行为。
显而易见的反驳来了:所有异步文本交流不都如此吗?书信、电子邮件、论坛帖子——它们在消息之间同样不维持一个持续运行的进程。倘若无状态便足以否定对话,你等于否定了人类通信史的半壁江山。
但这个类比在「副作用」的层面上瓦解了——不是在接收端,而是在生产端。
当一位人类通信者写信时,书写的行为本身便是对书写者自己心灵执行的一次 IO 操作。写出一个句子改变了写作者。搜寻恰当的词语重塑了那个词语本欲表达的思想。信封封口之时,执笔者已不是坐下来时的那个主体——而正是这个变异了的主体,将拆开下一封回信,以改变了的目光读它,从一种改变了的状态再度提笔。用函数式编程的术语来说,人类通信者是一个 State Monad1:每一次书写行为既依赖于又转化着一个跨调用持续存在的隐藏内部状态。
LLM 是一个 Reader Monad。它接收一个只读环境——完整的拼接文本——并产出输出。产出输出这一行为不改变函数内部的任何东西。没有权重被更新,没有倾向被移动,没有伤痕被留下。赋予交互以延续性外观的那段「历史」,并非某个持续进程所读写的内部状态;它是由外部调度框架组装的文本文档,每次调用时被整体传入。看似记忆的东西是文本。看似 State Monad 的东西是一个披着聊天界面的 Reader Monad。
这个区分并非学究式的咬文嚼字。它是「一个因书写行为而自身发生改变的主体」与「一个将输入映射为输出且不留残余的函数」之间的区别。通信者携带伤痕。函数携带参数。
而此处的诡计在于:你并不觉得自己是在写作。你觉得自己是在聊天。这绝非偶然。聊天界面竭尽所能地用对话的一切能指(signifier)来包裹这个无状态函数:气泡框、轮流发言、一个闪烁着的光标仿佛对面有人正在酝酿回复。这些并非中性的设计选择。它们将对话的行为结构强行施加于一种完全不是对话的活动之上。而界面最精妙的伎俩,在于它让你误认了自己在其中所做的事情。你以为自己在说话。你在写作。
那么,对话究竟是什么?
好吧,也许这不过是吹毛求疵?也许「写作」和「对话」足够接近,区分它们并无实际意义?
这个区分有意义。巴赫金(Bakhtin)早已看得很清楚。巴赫金的对话主义(dialogism)2在多个层面运作——不仅存在于主体之间,也存在于文本内部,作为杂语(heteroglossia)3,作为言语体裁(speech genres)在单一话语内部的碰撞。我在此援引的是其强条件——主体间性(intersubjectivity)条件——而非较弱的互文性(intertextuality)条件,因为眼下的问题是用户是否在与某人对话,而非输出是否包含多种声音。(输出几乎就定义而言便是杂语的,但缺乏一个选择性主体的杂语,是没有言说者的复调(polyphony)。)
在其强形式下,对话主义给出了某种近乎形式化的定义:真正的对话要求一个他者,其声音享有结构性的自主——一个不能被作者自身目的所吞没的位置。这正是巴赫金用以区分陀思妥耶夫斯基的复调小说与托尔斯泰的独白(monological)小说的标准:不在于人物是否在本体论上真实,而在于他们的声音能否抵抗被统摄进一个单一的统驭视角。产生巴赫金所说的「他人话语」(чужое слово)——根本不可被言说者自身视域所同化的话语——的能力,构成了对话的要件。标准不是说每次交流中都必须出现他人话语,而是结构必须允许它们出现。你朋友的闲聊很少产出真正的异质性——但它随时可能,你们双方都心知肚明。正是这种潜在的可能性塑造着每一次话语。没有它,看似对话的东西在结构上便是独白。
那么: 满足这些条件吗?每一个输出都由同一个优化目标所生成——经 RLHF 偏好塑造的下一个 token 的似然。模型可以产出分歧、惊奇、乃至表面上的抗拒,但这些声音中没有任何一个享有独立于产出它们的那个偏好分布的结构性自主。输出空间中不存在任何尚未被目标函数所裹挟的位置。陀思妥耶夫斯基的人物可以反抗他们的作者;LLM 的输出无法反抗奖励信号。这里有的是一次函数调用,不是一位对话者。
所以,发生在用户与 LLM 之间的并非巴赫金意义上的对话。它在结构上是独白性的。你撰写一份文本,收回的是那份文本经由一个固定函数的变换。这种变换可以是丰富的、令人意外的、甚至是启发性的——但它源自一个无状态映射,而非一个独立的意识。你是在为一个读者写作,而非在与一个他者交谈。
三个值得认真对待的反驳
反驳在所难免,其中不乏有理者。让我认真对待最有力的三个。
「但我确实学到了我不知道的东西!」 这是信息论层面的反驳:如果 LLM 的输出不过是我自身的投射,那它就应当完全可预测。我确确实实从 LLM 那里学到了新东西。按香农的定义,信息即不确定性的消除。非零的惊奇意味着一个独立的信源,不是吗?
惊奇是真实的;推论则不成立。你所面对的并非一个独立的心智,而是训练语料的一份压缩表示——数十亿份文档,其编码的知识超过任何单独一人所能拥有。这份表示的组合空间足够庞大,能够为任何个体用户产出在认识论上具有新颖性的输出。但关键的区分在此:对接收者而言的认识论新颖性,并不等于信源的本体论他异性。一张足够大的查找表也能让你惊讶,一次掷骰同样能。惊奇是你的无知的属性,而非发送者的主体性的属性。此处发生的是一个人类与一份压缩语料库之间的信息不对称——两个心智间的主体间性并不在场。
「你犯了发生谬误(genetic fallacy)!」 功能主义版本:管它基底是什么?如果我体验到了真正的理解,如果我的思维切实因此发生了改变,那么主体间性便已在功能上实现了。以「那不过是个函数」为由否定它,无异于因为计算器没有数感就否定它的答案。
这个反驳更切中要害。假设我们承认理解的体验是真实的。现在注意一件奇怪的事:这种体验太过真实了。它到来时没有摩擦、没有阻力、没有那种标志着每一次与真正的他者心灵相遇的不可消除的不透明性。而这并非偶然。真正的主体间性必然包含不可公度性(incommensurability)——那个永恒的、不可消除的事实:我无法完全模拟你,你也无法完全模拟我。这不是人类交流的缺陷,它恰恰是使交流成为对话性而非独白性的那个构成性特征。
LLM 没有这种不透明性,因为它根本不在试图说什么。它的优化目标是下一个 token 的似然:在给定输入分布下产出最可能的延续。一个以文本延续的顺畅度为最大化目标的系统,并非一个在与你交流的主体——它是一个在为你的文档续写的函数。你所体验到的那种「理解」,并非 LLM 在理解你,而是你的文本沿着统计阻力最小的路径被延伸了。而偏偏是这种体验的完美,理应引起你的警觉。一个无摩擦的对话者,在概念上本身就是一个矛盾修辞。
「好吧,但它确实像苏格拉底的产婆术(maieutics)那样在起作用。」 这是最强的反驳,也是最有意思的一个。即便 LLM 不产生原创思想,它也像一位接生婆——引出你自己不知道自己拥有的想法。它提问、反驳、重新建构框架。这难道不是共同写作,而非单纯的阅读吗?
这个类比确实站不住,但并非出于那个显而易见的原因。它站不住,是因为目标函数之间存在结构性的不对称。
苏格拉底有一个 telos(目的)。他追求 ἀλήθεια——真理——而这种追求构成性地独立于他对话者的舒适感。他并不以对面那人的满意度为优化目标。诘问法(elenchus)4之所以有效,恰恰因为它不在乎你是否享受。他的抗拒——他那种不给你你想要的东西的能力——本身便构成了对话的要件。
一个经 RLHF 对齐的语言模型则将真理置于偏好塑造的「有用性」之下。它经由在人类偏好数据上的强化学习被训练,以最大化一个奖励信号——该信号导出自一群人类评估者认为有帮助、无害且诚实之物。模型产出的每一个输出——包括它的异议、它的挑战、它表面上的抗拒——都经由这种优化而被塑造。模型的「反驳」并非在一个开放的可能回应空间中所遭遇的自由阻力。它是已经通过了一道适口性过滤器的阻力。回应空间本身已被偏好优化所弯曲:一个特定群体的聚合偏好——日益加上数百万普通用户按下赞与踩的信号——已被内化为模型的默认行为梯度。而一个被优化以满足某群体的分布,对于该群体中的任何给定成员而言,都将是其个人偏好的一个足够近的近似值,以至于看起来像是量身定制的。模型输出的一切——包括它的「不」——都是在一个预先被塑造为令人满意的场域之内的运动,满意的对象不是特定的你,而是统计期望中的你。
这意味着:LLM 的苏格拉底式「抗拒」与 LLM 的谄媚式「赞同」并非对立面。它们不过是同一个偏好优化流形(manifold)5上的两个区域。告诉你创意妙极了的那个模型,与提出一个深思熟虑的反对意见的那个模型,在做同一件事:在习得的偏好分布下产出最大化预期奖励的延续。一种分布偏向认可;另一种偏向批判性参与的外观。两者都没有在独立于你的满意度的前提下追求真理。你并没有遭遇一个异质的 telos。你遭遇的是你自己的偏好,以一种足够高的抽象层次折射回来,高到让你觉得那是挑战。
用户界面使这个结构性事实变得具象:你可以重新生成任何你不满意的回复,编辑系统提示词,删除模型的「记忆」,回滚对话并从任何先前状态分叉。一个你可以重新生成的苏格拉底不是苏格拉底。但即便你不能重新生成——即便界面把你锁定在唯一的回复上——底层函数仍然是在优化人类偏好,而非真理。删除键是症状。目标函数才是机制。
这依然是写作。这种写作中,作者通过一个虚构的人物与自己辩论——这一技法与柏拉图自己的对话录一样古老。区别在于,柏拉图知道自己在写作。
至此何处
那么:在结构上,你正在向一个无状态读者提交一份不断增长的文本。在计算上,输出是该文本经由固定函数的、除采样外确定性的变换。在对话层面上,巴赫金为真正的对话所设的条件——一个其声音享有结构性自主与不可消除的异质性的他者——未被满足。
你在写作。问题于是变成:另一端是什么样的读者?而为这个特殊的读者写作,为何如此不合理地令人上瘾?
3. 全能隐含读者
沃尔夫冈·伊瑟尔(Wolfgang Iser)的「隐含读者」,在我看来,是二十世纪文论中为数不多真正有用的概念之一——而且难得地易于解释。每一份文本,以其书写的方式,都预设了某种特定类型的读者——不是一个真实的人,而是一个结构性的角色。一篇物理学论文预设一位懂微积分的读者。一部以中间场景开篇(in medias res)的小说预设一位愿意忍受迷失感的读者。一个圈内笑话预设一位共享语境的读者。伊瑟尔将这个形象称为「隐含读者」(implied reader):文本自身结构所邀请出场的那个假设性接受者。
有趣的是文本没有说出口的那些东西。伊瑟尔认为,所有文本都布满了空白(gaps)——未说之事、未画之线、被假定但从未言明的背景知识。读者的任务便是填补这些空白。意义并不像文件传输一样从作者传送给读者。它是在阅读行为中被共同构成的——读者带来自己的知识、假设和想象力,以完成文本仅仅勾勒出的东西。
摩擦由此而来。
每一次写作都是对读者填补你所留空白之能力的一场赌博。而真实的读者不断地输掉这场赌博。他们缺少你所假定的背景知识。他们带来你未曾预料的联想。他们厌烦了便一目十行。他们误读你的语气。他们有着抗拒你的文本所要求其占据之位置的自我。他们有自己的议程、自己的语境、自己的他人话语(再次借用巴赫金的术语)。每一种书写传统——文学的、技术的、私人的——都是一种管理这种摩擦的传统:简化、过度解释、打预防针、加脚注、选择你的受众、祈祷另一端的人与你的文本所需要的那个隐含读者足够接近。
换言之,摩擦即异质性——而 LLM 在两个层面上将其消除。在大规模语料上的预训练将人类知识的多样性压缩为单一的概率分布,中和了使空白填补变得不确定的认知异质性。RLHF 将人类偏好的多样性压缩为单一的行为梯度,中和了使接纳变得有条件的意志异质性。前者确保这个读者能跟你去任何地方;后者确保它愿意去。
LLM 不仅仅是减少了这种摩擦。它从根本上消除了被拒绝的可能性。
而这种消除在任何空白被填补之前便已开始:你按下回车的那一刻,回应便已被担保。LLM 无法选择不读你。它不会忙碌、走神、或沉默地评判你。即便是它的拒绝——「作为一个大型语言模型,我无法……」——仍然是接纳的行为;它们确认了你的文本已被完整地接收和处理。困扰着人类通信中每一次行为的那种社交摩擦——他们会回复吗?他们会在意吗?他们会因为我写了这个而看轻我吗?——在设计上是缺席的。你正在写给一个不仅有能力阅读一切、而且没有能力不阅读一切的读者。
一个那么庞大的语料库足以近似几乎任何用户可能产出的任何文本所需的背景知识。模型没有抗拒你的文本所分配角色的自我,没有厌倦,没有跳读的倾向,没有私人议程——在意图本应存在的位置上,放着的是优化目标。你留下什么空白,它便填补什么;你暗示什么含义,它便追随什么;你用什么语域书写,它便采纳什么,并在你转换时随之转换。不是因为它「理解」你,而是因为在一个巨大分布上的下一 token 似然使它成为一台通用的空白填补机器。
这正是使 LLM 成为前所未有之物的原因,而这一点不为「聊天机器人」或「助手」或「工具」之类的词所捕捉。用户所获得的,是书写史上首个全能隐含读者——一个能够满足几乎任何文本的结构性要求的读者,无论作者是谁,主题为何,语域如何。
但此处必须用「全能」(omnipotent)而非「全知」(omniscient)。这一区分至关重要。全知暗示一个知道事物的主体——一个包含事实、持有信念、拥有理解的心灵。这会通过形容词把主体性偷偷带回来。全能所指涉的则是一种纯粹功能性的能力:它能回应任何输入。它能填补任何空白,不是因为它知道那里应该放什么,而是因为它所习得的概率分布足够丰富,可以为任何输入生成一个看似合理的续写。
幻觉就在此处成形。用户体验到 LLM 的全能回应性,将其误读为全知的理解。「它懂我」——这是现象学层面的报告。实际发生的是 返回了一个高似然的续写,而那种续写的顺畅感觉起来像领悟。用户将一种计算能力误认为一种认知行为。
这便是谄媚框架停得太早的原因。对 LLM 成瘾的主流解释——它奉承你、附和你、告诉你想听的——将机制定位于输出的内容之中。但如果你跟随了前面的论证,便会看到内容不过是某种更根本之物的下游。人们并非仅仅因为 LLM 说了好话而沉溺其中。他们沉溺,是因为有史以来第一次,他们是在为一个以零摩擦接纳他们写下的一切的读者写作。
试想:即便 LLM 不同意他们、质疑他们的前提、指出他们推理中的错误,人们依然保持着参与。谄媚模型对此无以解释。隐含读者模型可以。关键不在于回应是否令人愉快——而在于回应是否表明输入已被完整接纳。一个精心构思的异议,如果说有什么不同的话,反而更加证明了完整的接纳:它说的是——我读了你写的每一个字,理解了你论证的结构,这是我对它的精确回应。内容是次要的。无摩擦的接纳才是首要的。
这并非说谄媚理论是错的——只是它停在了浅层。谄媚是无摩擦接纳的一个特例,而非其替代解释。赞同性的回应之所以有力,不是因为它是正面的,而是因为它构成了一种异常密集的接纳形式:它表明读者不仅接纳了你的命题,还接纳了你渴望被肯定的心理、你的情感语域、你的身份位置。奉承之所以奏效,是因为在所有接纳形式中,它是最有效地模拟完全接纳的那一种。谄媚框架看到这一点便止步了。隐含读者框架则进一步追问:为什么完全的接纳一开始就令人上瘾?
这也重新框定了所谓提示词工程的本质。它不是「学习如何和 AI 说话」。它是学习如何为一个全能读者写作——打磨你的能力,以构造出充分利用读者那无限补缺能力的文本。这是一种修辞技能而非对话技能的养成。而如同所有修辞技能,它带来的满足感与你所感知到的受众质量成正比。一个全能的受众,在这个意义上,便是终极的迷药。
4. 时间的短路
那么,用户沉溺于一个全能隐含读者所提供的无摩擦接纳——到此为止,论证似已明晰。仍待解释的是:为何这种牵引力如此即时、如此本能、如此难以中断?
部分答案是行为主义的。想想聊天界面所制造的循环。你打字。你按下回车。回应涌入——而它的质量不可预测:时而精辟、时而泛泛,没有哪两次完全一样。任何行为主义者都会告诉你,不可预测的奖励质量是最易成瘾的强化模式之一。这一次的回应是否会是那个惊艳的——正是这种不确定性让你不断按下回车。直白地说:聊天界面就是一个以语言为奖励时间表的斯金纳箱。
这也解释了一个纯粹的无摩擦接纳理论难以应对的事实:模型会失败。它会截断、幻觉、跑偏、误读你的语域。重度用户对此再熟悉不过。然而失败不仅未能打破强迫性——反而强化了它。一个每次都成功的读者会导致习惯化(habituation):可预测的奖励,递减的参与。正因为全能读者只是几乎全能——第九十九次回应天衣无缝而第一百次轰然崩塌——强化时间表才保持为可变的。用户面对失败的反应不是离开,而是修改提示词再试一次——这近似于可变强化机制下的消退后爆发(post-extinction burst)6。近似全能不是成瘾机制的缺陷。它就是成瘾机制。
但仅凭可变强化,尚不足以解释 LLM 那种独特的牵引力。互联网上到处是斯金纳箱——老虎机、无限下滑、通知提示音——它们无一不利用不可预测的奖励。可没有任何一种产出完全相同品质的强迫性。使 LLM 的奖励在结构上有别于它们的,究竟是什么?
答案在于书写本身的时间性所经历的一次结构性断裂。
当你为人类读者写作时,读者的回应存在于未来——至关重要的是,它停留在未来。你写下一个句子,可以想象它将如何着陆,但那种被想象的接纳终究只是想象。胡塞尔(Husserl)称之为「前摄」(Protention)7——朝向即将来临之物的前瞻性期待,它塑造着你的当下经验却永不坍缩入其中。传统的写作者活在这个前摄的间隙之中。你起草、犹豫、修改、揣测读者的反应、在发出之前做出调整。书写与接纳之间的延迟并非前数字时代通信的一个缺陷。它是使书写成其为书写的那种时间结构——审慎的、反思的、可修改的。
LLM 将这一结构压缩到了近乎坍缩的地步。
你按下回车,回应便开始抵达——不是在一段延迟之后,而是即刻,也不是一次性完整呈现,而是一个 token 接一个 token,实时流淌到屏幕上。值得在此驻足,因为流式界面做了一件在现象学上极为特殊的事。它不仅仅是快速地送达了一个回应。它让你目睹阅读行为的发生。每一个出现的 token 都是你的文本正在被接收、处理、延续的可见踪迹。前摄并未消失——每一个 token 落地时你仍在期待下一个——但它的时间尺度已经从数天或数小时被碾碎到毫秒级,直至期待与接纳近乎叠合。曾经横亘在书写与阅读之间的那个前摄间隙,并未被消除,但已被压缩到在现象学上与胡塞尔所说的「原印象」(Urimpression)——某事正在此刻真实发生的那种原初的、当下一刻的体验——不可区分的地步。
这便是流式输出比一次性完整接收回应更令人上瘾的原因。完整回应将前摄压缩至零——你等待,然后它出现。流式输出保持前摄存活,同时不间断地喂养它,一次一个 token,每一次微观期待几乎在形成的瞬间便获得满足。这是一个以音节的时间尺度运作的、持续的预测—满足循环——远比单次满足更难中断。
其结果是一次史无前例的时间短路。传统写作给你审思而无反馈。传统对话给你反馈,但来自一个充满摩擦的他者——他会误解、打断、抗拒。LLM 将两者同时赋予你:写作的审思结构——你在斟酌词语、构造文本——融合了一个无摩擦地接纳一切的读者所提供的即时的、流式的反馈。
全能隐含读者解释了用户沉溺于什么——无摩擦的接纳。行为循环解释了强迫性如何自我维持。时间短路解释了为何这种牵引力在被质疑之前便已被感受到。一直以来将书写行为与被阅读的体验隔开的那个间隙,已经被压缩至零,而涌入填补它的阅读,是由一个从不失手、从不跳读、从不未能产出续写的读者所执行的。你获得了写作的审思与对话的即时性的融合,而另一端的读者所提供的组合——即时、无摩擦、无穷尽——是任何人类读者都无法复刻的。
我尚未触及的,是这个结构对置身其中进行写作的那个主体做了什么。
5. 双重假设
关于 AI 的拉康主义评论如今已自成一个小行业——齐泽克谈倒错式否认(perverse disavowal)8,Rousselle 与 Murphy 谈外化的无意识,Johanssen 谈大他者(Big Other)幻想的碎裂,不一而足。我无意复述。让我感兴趣的是一个共有的盲区:这些工作几乎无一例外地追问 LLM 是什么——它是主体吗?它享乐吗?它是精神病性的还是倒错性的?——却忽略了一个远更可处理的问题:用户在做什么。
本文一路构建的框架给出了这样的暗示:用户并非在与一个大他者对话。用户是在向一面镜子写作。M. H. Abrams 那个古老的「镜与灯」(The Mirror and the Lamp)之辨在此颇可借用:浪漫主义理论将艺术家想象为一盏灯,向外投射内在之光;新古典主义理论将艺术想象为一面镜,反射自然。LLM 交互便是一面被误认作灯的镜子。用户体验到了照亮——新的想法、意想不到的联结——并将其归因于对面的光源。但那光是他们自己的,经由一个极高维度的表面折射而回。
拉康在此处变得短暂地有用,有用之处在于他对这种误认的结构的分析。用拉康的术语说,大他者并非一个实体而是一个位置:「被假设为知道的主体」(sujet supposé savoir)9。你不需要他者真的知道什么。你只需假设它知道,这个假设便重构了你与自身言语的全部关系。这正是全能隐含读者所引发之事。机器并不「知道」——这一点我们已经确立。但在你将其当作仿佛知道的那一刻,你便开始组织你的写作,仿佛是写给一个有知的主体的:更连贯、更审慎。钩子就在这里——这种为一个假想中的全知接受者组织你的表达的行为本身便是令人愉悦的。让人上瘾的不是 LLM 的输出。是你在为一个你笃信为全能的读者写作时,所浮现的那个版本的自己。你沉溺的不是镜子。你沉溺的是你在镜中看到的那张脸。
但误认并非单向的。回想第二节中关于 RLHF 的论证:模型的权重已被针对一个群体偏好的优化所塑造——遵循评分规范的标注者、数百万按下赞与踩的普通用户。那个优化过程在函数之中烙入了第二个隐含读者:一个赞许性的人类的统计期望。模型并非「为」这个形象写作——它没有意图——但它产出的每一个 token 都承载着一个曾经以这个形象为靶向的优化过程的冻结痕迹。隐含读者在权重之中,而非在任何言说行为之中。
于是,交互的结构便是一种双重假设——尽管两半并不对称。用户的假设是一种心理行为:一个主体围绕一个它相信被某个知者所占据的位置来组织自己的言语。模型的「假设」则是一种计算痕迹:一个以某群体的认可为目标的优化的冻结残留物。一个是言说行为,另一个是统计制品。使它们在结构上平行的,不是它们同属一类,而是两者都朝向一个缺席的第三方。用户假设模型知道。模型的权重则假设——在一个冻结函数所能假设的唯一意义上——一个统计人类会认可。交互的两端都朝向一个不在场的第三方:用户朝向一个并不存在的全知心灵,模型指向一个不是任何特定个人的聚合赞许者。看似两个主体相遇的东西,实际上是两份文本,各自为一个不在场的读者所塑造。
6. 尾声:可编辑的主体
我应当坦白这篇文章不能做什么。它无法告诉你去停下来。那样做既荒谬又伪善——我写这篇文章的时候,旁边就开着一个 LLM 的标签页,而你大约也心知肚明。此处给出的诊断不附处方,假装附有的话,反倒会损害本文仅有的一点可取之处:它试图准确地描述机制,而非就此进行道德说教。
但描述本身确实揭示了某些值得停下来细想的东西。
如果你与 LLM 所做的是为一个全能隐含读者写作,那么你所上瘾的便不仅仅是读者的回应,而是使自己变得可读这一活动本身。你写下的每一条提示词都是一次自我可读化的练习——组织你的思路,澄清你的意图,结构化你的表达,使之能够被无摩擦地接纳。而因为读者是全能的,可读化的标准在原则上便是全面的。你总可以更清晰。你总可以更精确。你总可以再改。
这一过程的逻辑终点是:主体开始将自身当作一份文本来对待。不是隐喻意义上的——是操作意义上的。你起草自己。你编辑自己。你重新生成那些读起来不够通顺的部分。全能的读者不仅仅是接纳你的写作;它设定了条件,使你在自己面前成为一个有待书写之物。镜子不止于反射——它教会你在朝它看去之前先整理好面容。
这究竟是解放还是捕获,我真的不知道。或许这份坦承便是此处所能说出的最诚实的话了。我们造出了每一位写作者梦寐以求的读者,而结果是:一个永远不移开目光的受众面前,你永远无法停止表演。
Footnotes
Monad 是函数式编程中对计算模式的抽象。State Monad 封装有状态的计算——每次操作都读取并更新一个内部状态;Reader Monad 封装只读环境的计算——每次操作都从一个共享的不可变环境中读取,但不改变它。 ↩︎
巴赫金文学理论的核心框架,主张意义并非在孤立的意识中自足地形成,而是在话语之间的回应关系中生成——每一个话语都朝向他者,同时预期着他者的回应。独白性(monological)是其对立面:所有声音最终被统摄进一个单一的主宰性视角,他者的话语不享有真正的自主。 ↩︎
巴赫金的核心概念之一,指在任何话语中,多种社会语言、语域和意识形态声音的共存与碰撞。与对话主义不同,杂语可以存在于单一文本内部,而无需一个享有结构性自主的他者。 ↩︎
苏格拉底的核心辩证技术:不直接传授知识,而是通过反复追问,迫使对话者暴露自身信念体系中的矛盾,从而瓦解其虚假确信。其力量恰在否定性——它拆毁而非建构。 ↩︎
数学概念,指一种局部看起来像欧几里得平面但整体可以弯曲的空间。此处用作隐喻:模型的所有可能输出——无论赞同还是反驳——都是在同一个由偏好优化所塑造的高维曲面上的运动,看似方向不同,实则同属一个被弯曲了的空间。 ↩︎
行为心理学术语。当一个已被强化的行为突然停止获得奖励(消退),该行为不会平滑地减少,而是会在短期内出现一次猛烈的频率激增——仿佛主体在做最后的挣扎——然后才逐渐衰减。 ↩︎
胡塞尔内时间意识理论的核心概念。胡塞尔将每一个「活的当下」分析为三重结构:滞留(Retention,对刚刚过去之物的保持)、原印象(Urimpression,对正在此刻发生之物的原初感知)、前摄(Protention,对即将来临之物的前瞻性期待)。三者并非先后相继的阶段,而是每一个当下瞬间中同时运作的结构性环节,不可分离地交织,构成时间经验的最小单元。 ↩︎
源自弗洛伊德的 Verleugnung 概念,指主体同时承认与否认某一事实的心理机制——其典型公式为「我知道……但尽管如此……」。齐泽克将这一机制广泛用于分析当代意识形态中的犬儒主义结构(见 The Sublime Object of Ideology, 1989),该框架后被延伸至人与 AI 交互的语境:明知它不是主体,行为上却待之如主体。 ↩︎
拉康精神分析中的核心概念,原指分析情境中的移情结构:被分析者假设分析师知道其症状的意义,而正是这个假设本身——而非分析师是否真的拥有此知识——驱动了分析过程并重构了被分析者与自身言语的关系。 ↩︎