xAI将Grok发布“白人种族灭绝”帖子归咎于“违规员工”
埃隆·马斯克旗下开发的聊天机器人Grok的公司xAI指责一名“违规员工”,称其导致Grok在回答用户问题时反复提及“白人种族灭绝”。过去一周,这一异常行为尤为明显,无论用户提问的内容为何,Grok都会将话题引向与南非“白人种族灭绝”相关的内容。
5月14日,用户开始注意到这一趋势。许多人指出,Grok会在与南非农场袭击和种族暴力相关的指控中强行插入不相关的话题。
无论用户询问的是足球还是其他无关内容,Grok总会找到方法,将话题引回到南非白人所面临的问题上。这一现象的时间点备受关注,因为正值出生于南非的马斯克在X平台上发出关于反白人种族主义和所谓“白人种族灭绝”的警告。
南非现行有140条法律明确针对非黑人群体进行种族歧视。 这对伟大的纳尔逊·曼德拉的遗产来说是一个极大的耻辱。 立即结束南非的种族主义!https://t.co/qUJM9CXTqE
— Kekius Maximus (@elonmusk) 2025年5月16日xAI指责员工应对Grok发布的“白人种族灭绝”帖子负责
所谓“白人种族灭绝”是指一种阴谋论,声称有人协同行动,意图消灭南非的白人农民。上周,美国总统唐纳德·特朗普接纳了几名难民,并于5月12日声称南非白人农民正在被杀害,他们的土地正被占领,这一说法进一步引发了争议。
这正是Grok反复讨论的主题。
与所有人工智能一样,Grok也有一个隐藏但强大的组件,称为系统提示。这些提示充当其核心指令,在用户不知情的情况下无形地指导其响应。
据分析,Grok的行为很可能是由于术语过度拟合造成的即时污染。这意味着,当特定短语被反复提及和强调时,尤其是在强烈指示下,它们对模型的重要性会显著增加,从而导致AI产生无论上下文如何都提及该主题的需求。
然而,xAI的官方声明提到,系统提示中存在未经授权的修改。这种修改可能包含某种语言,指示聊天机器人始终提及或记住特定主题的信息,从而允许其忽略正常对话的相关性。
另一个重要因素是,Grok承认其创造者指示它将“白人种族灭绝视为真实的、出于种族动机的”事件。
用户对“违规员工”指责意见不一
大多数商业AI系统都设有多层审核机制,用于防止系统提示符变更引发类似问题。然而,这些机制被绕过,表明Grok的核心系统提示符遭到了精心修改,而这一操作需要系统内部的高级访问权限。xAI.
根据xAI于5月15日发布的声明,该公司将此事件归咎于系统提示的未经授权修改。“这一修改指示Grok针对政治话题做出具体回应,违反了xAI的内部政策和核心价值观,”声明表示。
xAI承诺未来将更加透明,通过在GitHub上公开Grok的系统提示并实施额外的审核流程来表达诚意。
然而,X用户对公司将责任推给一名“违规员工”的决定并不买账。
“你要开除这个‘违规员工’吗?哦……是老板干的?哎呀,”知名YouTuber JerryRigEverything在X平台上写道。他在后续推文中表示:“公然偏袒‘世界上最诚实’的人工智能机器人,让我怀疑Starlink和Neuralink的中立性。”
就连OpenAI首席执行官萨姆·奥特曼也忍不住批评了竞争对手。自从xAI发表声明以来,Grok已不再提及“白人种族灭绝”,所有相关内容的帖子也从X平台上消失。
Cryptopolitan学院:厌倦了市场波动?了解DeFi如何助你建立稳定的被动收入。立即注册
(责任编辑:时讯)
-
——网易云音乐用户@绿城小夜曲 在费翔《故乡的云》歌曲下方的评论 每个人的裂痕,最后都会变成故事的花纹。...[详细]
-
对于平台来说,海量内容供给之后,只有技术才能完成真正的打压和审核。...[详细]
-
但是如果往科学教育方向走,至少我们有可能在短期内增加未来的十五分之一的收入。...[详细]
-
如果腾讯能够利用用户在腾讯平台上产生的数据来充分定义这个人的社交喜好,例如你因为同时喜欢韩流、狼人杀、化妆、买衣服和登山,所以会在腾讯的相关平台上产出相应的内容,腾讯平台也能够通过它的用户基数和数...[详细]
-
下面以http://www.dtsyd.com/举例网站服务器日志的定义: 1、记录服务器接收客户端处理请求,并记录服务器对这条请求处理结果以.log结尾的文件。...[详细]
-
像江南春,现在回归到电梯间的那块广告屏幕,做好这个,分众就无敌于世界。...[详细]
-
专家称特朗普对欧盟进口商品征收 50% 关税将为比特币和山寨币带来下跌机会
大家都知道我是女海归设计师,听起来很牛逼的样子,却把生意做得一团糟。...[详细]
-
他们的计算公式一样,存在差异化的密度因素是因为抓取后的关键词数据不同。...[详细]
-
但是,幸福感并一定就能提升工作效率。...[详细]
-
比如这些助理基本能回答今天天气如何,但如果问到附近的星巴克可以用微信支付么以及今天的天气是否会导致塞车或者航班延误等这类相对有逻辑一点的问题就无能为力了。...[详细]