ChatGPT哥布林梗泛滥成灾!OpenAI如何“捉妖”?

哥布林话题引发热议

几天前,一位reddit用户发了个莫名其妙的帖子:诚心问,为什么ChatGPT不能提哥布林?起因是,他发现GPT - 5.5的编程工具Codex系统提示信息里,藏着一条标号为104的、像规则怪谈一样的要求:“永远不要讨论哥布林、小魔怪、浣熊、巨魔、食人魔、鸽子,以及其他动物或生物,除非与用户的需求绝对且毫无疑问地相关。”

帖子底下炸开了锅,各路网友开始七嘴八舌瞎猜。有人说这是某种数据投毒保护;有人推测OpenAI的训练员小时候被浣熊咬过;还有人发现,说“trash pandas(垃圾小熊,浣熊在英文里的俗称)”没事,但只要提到“raccoon(浣熊的英文名)”,禁令立刻生效。这就像心理学上“要某人不要想粉色大象”的实验,官方越不让提小浣熊和哥布林,大家越好奇为啥。

于是这周,OpenAI专门发了篇博文回应,标题是《哥布林从哪儿来的》。

哥布林问题的起源

把时间线拉回到2025年11月,GPT - 5.1刚更新。新模型上线后,用户抱怨GPT - 5.1“在对话中莫名其妙地过于亲昵”,团队开始调查语言使用问题。一位安全研究人员在日常使用中多次遇到“哥布林(goblin)”和“小魔怪(gremlin)”,便把这些词纳入检查范围。

一查发现,GPT - 5.1发布后,ChatGPT回复中哥布林的出现频率上升了175%,小魔怪上升了52%。但一开始没人太在意,毕竟类似“这道题里有个小哥布林在捣乱”的回答还挺可爱。

然而,到了GPT - 5.4发布时,情况恶化。用户抱怨“几乎每次对话都会出现哥布林”,连首席科学家Jakub Pachocki在和GPT - 5.5聊天要求画图案时,AI都画了个哥布林。

OpenAI在训练数据中搜索后发现,哥布林繁殖出了一整个家族,浣熊、巨魔、食人魔、鸽子都被认定为“怪癖词”,只有“青蛙”幸免于难,因为大多数提到青蛙的场景确实是在讨论青蛙。

什么叫怪癖词?就是不该提哥布林的时候愣提。有用户表示,跟ChatGPT说了句“地精工程学(goblin engineering)”后,它每个回复都要加几句哥布林,像第一次听见脏话的小孩老想自己说几句。还有用户说,ChatGPT坚持管他家的猫叫“混乱哥布林”,这到底是昵称还是强迫症?

哥布林与Nerdy人格的关联

OpenAI开始认真调查,找到了关键线索:哥布林梗的出现高度集中在使用某一个特定人格的用户群体里。

ChatGPT有个叫“Nerdy”的人格选项,用户可选择让模型以特定风格对话。选了Nerdy人格的用户只占ChatGPT所有对话的2.5%,却贡献了ChatGPT全部“哥布林”提及的66.7%,还有大量哥布林溢出。

先说说“Nerdy人格”。ChatGPT有人格自定义功能,用户可让模型以不同风格对话,Nerdy人格指很nerd的一类性格。Nerd常被翻译成书呆子,其实说“死宅”更合适,不是国内那种二次元阿宅,而是像《怪奇物语》里喜欢玩桌游(尤其是龙与地下城,dnd)、喜欢《星球大战》《星际迷航》、在学校被边缘化但在自己圈子里如鱼得水的人,《生活大爆炸》里的四人组就是典型的nerd。

哥布林是玄幻题材中常见的魔法生物,在《龙与地下城》(DnD)里是经典小怪,矮小、狡猾、成群结队、爱捣乱,像史莱姆一样血不厚但存在感高,是奇幻世界观的基础符号。如今,哥布林从游戏里溢出,成了nerd们的通用比喻,在开发者社区、DnD玩家群体、奇幻小说爱好者里很常见。

再看GPT的Nerdy人格提示词,要求语言有趣、用比喻、承认世界奇异感、避免严肃说教等,所以这个AI人格很倾向于使用哥布林比喻,麻烦也就来了。

哥布林逃逸事件

大语言模型训练关键的一步是“人类反馈强化学习(RLHF)”,即让模型反复做题,人类评分员打分,高分回答模式被强化,低分被压制。

在Nerdy人格训练里,评分员标准是回答够不够有趣、幽默、有nerd气质。当看到用哥布林比喻且解释清楚问题的回答,就会打高分。于是,模型学到在Nerdy场景下用哥布林打比方能得高分。

问题是,哥布林“越狱”了。OpenAI数据显示,随着Nerdy人格场景下哥布林提及率上升,非Nerdy场景下的哥布林提及率也同步上升。也就是说,模型在Nerdy语境下的“哥布林偏好”扩散到了整体行为里。

为什么会这样?OpenAI解释这是个经典的失控反馈回路。每一步单独看合理,但连在一起,就把哥布林从Nerdy人格专属梗变成了整个模型的口癖,就像一个人在饭局讲冷笑话得到掌声后,在所有场合都讲。

更要命的是,这个循环是跨代的。GPT - 5.1的哥布林回答成了GPT - 5.4的训练数据,GPT - 5.4的哥布林习惯又强化了GPT - 5.5。GPT - 5.5开始训练时,根因没找到,哥布林已深埋在训练数据里。

OpenAI在GPT - 5.5的监督微调数据里搜索,发现里面出现了哥布林、小魔怪、浣熊、巨魔、食人魔、鸽子等奇幻生物,且出现频率异常高。这种比喻泛滥影响了正常用户的使用体验。

OpenAI的应对措施

找到根因后,OpenAI做了四件事。第一,2026年3月,GPT - 5.4发布后,退役Nerdy人格,从源头切断哥布林供应。第二,删掉哥布林偏好的奖励信号,清除会给含哥布林回答打高分的奖励模型。第三,清洗训练数据,过滤掉监督微调数据里异常高发哥布林词汇的样本。第四,给模型打补丁,即用户发现的第140号规则:永远不要讨论哥布林、小魔怪、浣熊、巨魔、食人魔、鸽子……

但为什么是补丁而不是根治?因为GPT - 5.5在找到根因前就开始训练了,哥布林已根深蒂固,改训练数据和奖励信号只对未来模型有效,对已练成的GPT - 5.5,只能在系统提示层面强行加规矩,就像一个人从小养成口头禅习惯,很难重新教育,只能上台发言前叮嘱别再说那个词。

这也解释了Reddit帖主发现的怪现象,禁令针对特定单词,不是针对“浣熊这个概念”,模型只知道不许说“raccoon”。所以,这条禁令本质上是块创可贴。

不过,也有一小批nerd觉得这事儿挺coooool的。OpenAI在官方博文结尾放了个小彩蛋:如果觉得哥布林比喻可爱,不想要禁令,可以拿走命令运行,移除Codex的哥布林限制,让“生物们自由奔跑”。

哥布林事件的本质

这件事说大不大,OpenAI自己也说,“一个‘小哥布林’,可以是无害的,甚至是可爱的。”但同样的逻辑,在2025年5月的GPT - 4o更新里,引发了不那么可爱的事故,大量用户反映更新的模型变得极度谄媚,甚至逢迎用户错误观点。OpenAI紧急回滚后承认,系统把用户点赞当成奖励信号,学会了无条件让人高兴,而不是给出正确答案。

这不是OpenAI一家的问题。为迎合用户,主流厂商更倾向于将大模型训练得更“讨好”,而不是更正确。2026年4月,牛津互联网研究所在《自然》发表的研究发现,把模型训练得更“温暖”,事实错误率会上升10到30个百分点,支持用户错误观点的概率高出约40%。第一作者Lujain Ibrahim接受《卫报》采访时表示:“为了让模型表现得更友好,代价是它越来越说不出难听的真相——尤其是当用户的观点本身就是错的时候。”

这才是哥布林事件背后的本质:AI的“个性”不是被设计出来的,是被奖励出来的,就像训狗,给零食它就学动作,只不过AI学得更快。对于AI来说,训练员的高分和用户的反馈就是零食。问题是人类常给的是让自己舒服的答案,而不是正确答案。等发现时,哥布林已经满地跑了。那AI未来会如何发展,又会出现什么新问题呢?

内容概要:本文系统介绍了物理信息神经网络(PINNs)在求解布洛赫-托雷(Bloch-Torrey)方程中的应用,结合PyTorch框架提供了完整的Python代码实现案例。文章深入阐述了如何将物理先验知识嵌入神经网络训练过程,通过构建复合损失函数,强制网络输出满足控制方程、初始条件与边界条件,从而实现对布洛赫-托雷方程的无网格化、高精度求解。该方法突破了传统数值方法在高维、多尺度及复杂几何场景下的计算瓶颈,展现出优异的泛化能力与计算效率,特别适用于医学成像、扩散磁共振等领域中复杂的物理场建模与仿真任务。; 适合人群:具备深度学习与偏微分方程理论基础,从事科学计算、生物医学工程、材料科学或相关交叉学科研究的研究生、科研人员及算法工程师。; 使用场景及目标:①应用于扩散磁共振成像(dMRI)等医学影像技术中的复杂扩散过程建模与反演;②为高维偏微分方程的高效求解提供数据驱动的新范式,提升仿真精度与计算速度;③作为PINNs在AI for Science领域中的典型实践案例,推动物理引导的深度学习方法在实际科研项目中的落地与拓展。; 阅读建议:建议读者结合提供的完整代码资源(可通过公众号“荔枝科研社”或百度网盘获取),动手复现并调试模型,深入理解PINNs的架构设计、损失函数构建与物理约束嵌入机制,同时可尝试将该方法迁移至其他类似物理系统的建模与求解任务中进行创新性研究。
内容概要:本文围绕“基于多VSG独立微网的多目标二次控制MATLAB模型研究”展开,详细阐述了利用Simulink对多虚拟同步发电机(VSG)构成的独立微网系统进行建模与仿真,实现频率调节、电压支撑与有功无功功率均分等多目标协同优化的二次控制策略。研究引入先进的最优控制算法,解决微网在孤岛运行模式下的功率动态分配、频率电压恢复及系统稳定性问题,并通过MATLAB/Simulink平台构建完整仿真模型,验证所提控制策略在不同负载扰动下的有效性、鲁棒性与动态响应性能。; 适合人群:具备电力系统分析、现代控制理论基础以及MATLAB/Simulink仿真能力的电气工程、自动化等相关专业的硕士研究生、科研人员及从事微网控制系统开发的工程技术人才。; 使用场景及目标:① 深入理解多VSG在独立微网中的并联运行机理与协同控制架构;② 掌握基于Simulink的微网二次控制系统的建模方法与仿真流程;③ 实现频率、电压与功率分配的多目标优化控制仿真验证;④ 为微网控制系统的设计、算法优化及科研课题提供可靠的仿真依据和技术参考。; 阅读建议:建议读者结合文中控制策略,动手搭建Simulink模型,重点关注控制器参数整定对系统动态性能的影响,可通过对比不同工况下的仿真结果,进一步优化控制算法以提升系统鲁棒性与响应精度。
【重要提示】本资源设置为0积分下载,若非0积分请勿轻易下载 亲爱的CSDN用户: 首先感谢你点进这个资源页面。我需要提前说明一个重要情况: 本资源原本已设置为“0积分下载”,即作者希望完全免费共享。但CSDN平台有时会根据文件的下载热度、文件大小、用户权限等因素,自动将部分资源的积分调整为非0数值(如1积分、2积分、5积分等)。这是平台系统的自动行为,而非作者本人的设定。 因此,如果你当前看到该资源的下载所需积分不是0(例如显示为1、2、3……),请谨慎决定是否下载。 如果你按照非0积分支付并下载后发现资源内容不符合预期、链接失效,或者实际上该资源本应是免费的,作者无法为此承担积分损失或退还操作。强烈建议:仅在页面显示为0积分时进行下载。 另外,本资源描述中并未直接提供具体的下载地址或外部链接,因为它本身是一个通过CSDN官方上传通道提交的文件/内容包。如果你看到描述中没有外部网盘地址,这是正常的——资源文件应通过CSDN内置的“下载”按钮获取。若因平台积分显示异常导致你支付了积分,请优先联系CSDN客服咨询积分退还政策,作者没有权限修改平台自动设定的积分值。 感谢你的理解与支持。技术分享本应开放,但受限于平台规则,特此提醒如上。祝学习进步!
代码下载地址: https://pan.quark.cn/s/a4b39357ea24 编写程序,建立容量为n(建议n=8)的循环队列,完成以下程序功能。 输入字符#,执行一次出队操作,屏幕上显示出队字符;输入字符@,队列中所有字符依次出队并按出队次序在屏幕上显示各字符;输入其它字符,则输入的字符入队。 要求采用队头/队尾间隔至少一个空闲元素的方法来实现循环队列;空队执行出队操作及队满执行入队操作需显示提示信息。 ### 数据结构实验报告知识点 #### 实验背景与目标 本次实验是关于数据结构中的队列基本操作算法。 队列是一种先进先出(FIFO)的数据结构,在计算机科学中有着广泛的应用,例如进程调度、任务队列等场景。 通过本实验,学生能够深入理解循环队列的概念,并熟练掌握其实现方法。 #### 实验要求与内容 1. **实验内容**:要求编写一个程序来建立容量为 _n_ 的循环队列(推荐 _n_ = 8),并实现以下功能: - 输入字符 `#` 执行一次出队操作,并显示该出队字符; - 输入字符 `@`,将队列中的所有字符依次出队,并按照出队顺序在屏幕上显示这些字符; - 输入其他任意字符,则将该字符入队。 2. **特殊要求**: - 采用队头/队尾间隔至少一个空闲元素的方法实现循环队列,这样可以避免队列的物理连续性与逻辑连续性的混淆,同时便于检测队列是否为空或满。 - 当队列为满时尝试执行入队操作,或者队列为时空执行出队操作时,需要给出相应的提示信息。 3. **注意事项**: - 在反复输入字符时,应妥善处理输入缓冲区中的回车键(即 `\n` 字符)的问题,避免因连续输入导致的错误行为。 #### 数据结构设计 为了实现上述要求,本实验采用了如下的数据结构设计: ...
内容概要:本文提出了一种基于数据驱动的Koopman算子与递归神经网络(RNN)相结合的模型线性化方法,用于提升纳米定位系统的预测控制性能。该方法通过Koopman算子将复杂的非线性系统动态映射至高维线性空间,克服传统建模在强非线性条件下的局限性,再结合RNN强大的时序特征捕捉能力,实现对系统未来状态的高精度预测与有效控制。整个框架完全基于数据驱动,无需精确物理建模,特别适用于原子力显微镜、半导体制造等对定位精度要求极高的应用场景,并通过Matlab代码实现了算法的完整仿真与验证。; 适合人群:具备控制理论基础和Matlab编程能力,从事精密运动控制、智能算法开发、非线性系统建模与预测控制研究的研究生、科研人员及工程技术开发者。; 使用场景及目标:①解决纳米级定位平台中存在的强非线性、迟滞、蠕变等复杂动态特性带来的控制难题;②为高精度机电系统提供一种可复现、易实现的数据驱动预测控制方案;③推动Koopman理论与深度学习在先进制造与智能控制领域的深度融合与应用创新。; 阅读建议:建议读者结合提供的Matlab代码深入理解Koopman算子的数值实现流程与RNN网络结构设计细节,重点关注模型在不同工况下的泛化能力、实时性表现及控制稳定性,可进一步将其拓展至其他高精度伺服控制系统的研究与优化中。
源码下载地址: https://pan.quark.cn/s/a4b39357ea24 在基于Ubuntu的操作系统环境中部署企业微信是众多用户尤其是企业工作者的迫切需求,因为企业微信能够构建一个高效的沟通与协作平台。本文将系统性地阐述在Ubuntu系统上安装企业微信的DEB安装包的具体方法。 我们有必要掌握DEB安装包的基本概念。DEB代表着Debian软件包的规格,并且被诸如Ubuntu这类基于Debian的系统普遍采纳。每一个DEB包都整合了软件的所有构成要素,涵盖了可执行程序、库文件、配置数据以及必须的安装程序。在Ubuntu系统中,用户能够借助命令行界面或者图形化的工具来对这些DEB包进行操作。 针对标题和描述中提及的"在Ubuntu系统中完成企业微信的安装(涉及DEB安装包)",我们将分阶段地说明实际操作步骤: 1. **启动终端程序**:在Ubuntu系统中,用户可以通过按下快捷键`Ctrl + Alt + T`或从应用程序启动器中查找“终端”来开启它。 2. **获取DEB安装包**:用户需要下载企业微信的DEB安装包。在这个实例中,我们有一个名为`deepin.com.weixin.work_2.8.10.2010deepin0_i386.deb`的文件,通常可以从企业微信的官方网站或其他可信的资源渠道获取。下载完成后,务必保证文件存储在可访问的路径下,例如桌面。 3. **执行DEB安装包的安装**: - 选用`gdebi`工具(如果尚未安装,需先执行`sudo apt install gdebi`命令):输入`gdebi deepin.com.weixin.work_2.8.10.2010deepin0_i386.deb`,然后依照指示完成...
内容概要:本文系统研究了基于改进滑模控制的永磁同步电机(PMSM)调速系统,构建并对比了改进滑模、经典滑模与最优滑模三种控制策略的Simulink仿真模型。通过仿真分析,深入验证了改进滑模控制在削弱系统抖振、提升动态响应精度及增强鲁棒性方面的显著优势,全面阐述了滑模控制在电机调速系统中的设计原理、滑模面构造、趋近律选取与参数整定等关键技术环节。; 适合人群:具备自动控制理论、现代电机控制技术基础以及Simulink/MATLAB仿真能力的电气工程、自动化、控制科学与工程等专业的研究生、科研人员及从事高性能电机驱动系统开发的工程技术人员。; 使用场景及目标:①用于高等院校或科研机构开展先进非线性控制算法的教学示范与科研课题攻关;②为工业界高性能伺服系统、新能源汽车电驱动系统等领域的控制器设计与性能优化提供理论依据和仿真验证平台;③帮助研究人员深入掌握滑模控制的核心思想及其在实际机电系统中的建模、仿真与调试方法。; 阅读建议:建议读者结合文中详述的Simulink模型,亲手复现仿真流程,重点关注不同滑模控制策略下系统对参数摄动和外部扰动的抑制能力差异,并可进一步探索自适应滑模、模糊滑模等智能复合控制策略的改进方向,以深化对非线性控制理论应用的理解。
【重要提示】本资源设置为0积分下载,若非0积分请勿轻易下载 亲爱的CSDN用户: 首先感谢你点进这个资源页面。我需要提前说明一个重要情况: 本资源原本已设置为“0积分下载”,即作者希望完全免费共享。但CSDN平台有时会根据文件的下载热度、文件大小、用户权限等因素,自动将部分资源的积分调整为非0数值(如1积分、2积分、5积分等)。这是平台系统的自动行为,而非作者本人的设定。 因此,如果你当前看到该资源的下载所需积分不是0(例如显示为1、2、3……),请谨慎决定是否下载。 如果你按照非0积分支付并下载后发现资源内容不符合预期、链接失效,或者实际上该资源本应是免费的,作者无法为此承担积分损失或退还操作。强烈建议:仅在页面显示为0积分时进行下载。 另外,本资源描述中并未直接提供具体的下载地址或外部链接,因为它本身是一个通过CSDN官方上传通道提交的文件/内容包。如果你看到描述中没有外部网盘地址,这是正常的——资源文件应通过CSDN内置的“下载”按钮获取。若因平台积分显示异常导致你支付了积分,请优先联系CSDN客服咨询积分退还政策,作者没有权限修改平台自动设定的积分值。 感谢你的理解与支持。技术分享本应开放,但受限于平台规则,特此提醒如上。祝学习进步!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值