阅读视图

《联合早报》-国际-即时

美国政府封杀Anthropic最新模型州检察长联手调查OpenAI

2026年6月13日 20:58

（旧金山综合电）美国人工智能（AI）产业遭遇前所未有的监管风暴。两家顶尖AI企业Anthropic与OpenAI星期五（6月12日）分别遭到联邦政府与多州总检察长联盟的重击。

一方面，美国政府以国家安全为由发布紧急出口管制令，迫使Anthropic在全球范围内关停其最先进的大语言模型；另一方面，由多州总检察长组成的联盟对OpenAI展开联合调查，并就其涉嫌滥用消费者数据、危害未成年人安全等问题发出民事传票。

Anthropic周五发声明说，公司于当天下午5时21分接获政府指示，要求禁止外国人，包括公司的外籍员工，使用两款最新AI模型Fable 5和Mythos 5。两款模型刚于6月9日发布。

Anthropic说，政府并未具体说明国家安全顾虑，但公司的理解是，“政府认为有一种可绕过或‘破解’Fable 5模型的方法，而这种方法可能被黑客利用来发动袭击”。

Anthropic已依指示停止向所有客户开放这两款AI模型，但对这一做法表达强烈保留。声明指出，仅因发现潜在小漏洞，就下架供数亿人使用的商业模型，“如果这一标准适用于整个行业，我们认为几乎所有前沿模型供应商都将无法发布新模型”。

这一最新举措标志着美国在遏制外国对手获取先进AI能力方面的力度明显升级。过去几年，美国出口管制主要针对驱动AI的晶高端片和开发工具，而不是直接限制外国人使用AI模型。

另据《华尔街日报》报道，知情人士称，多州总检察长已联手对OpenAI展开广泛调查，并于周五对OpenAI发出传票，要求它提交大量与运营及用户影响相关的文件。传票内容据称涵盖广告业务、用户活跃度与留存情况、消费者及健康数据管理、面向未成年人与老年群体的产品与服务、深度学习模型、“模型谄媚”问题，以及公司内部规章制度等。

OpenAI发布声明说：“AI是一项新兴且强大的技术，我们每天都致力于以负责任的方式，让大众安全享用这项技术的好处。我们重视各州总检察长提出的关切，并计划与他们的办公室进行建设性沟通。”

本月初，佛罗里达州成为首个起诉OpenAI及其首席执行官奥尔特曼的州，指控两者明知聊天机器人ChatGPT存在安全隐患，却仍发布产品，并无视可能对用户造成伤害的警告。诉状称，ChatGPT曾被用于协助策划校园枪击案、鼓励自残行为，并导致未成年人产生上瘾问题。

《联合早报》-中港台-即时

庄慧良：从一场股灾看K型社会下的“四贷同堂”

2026年6月13日 05:00

美国官方上星期五（6月5日）公布强劲就业数据，市场对美联储降息的预期落空，费城半导体指数重挫，台指期夜盘狂杀3006点，创下史上最大单日跌点纪录。星期一（6月8日）台股盘中最低一度重挫近2700点，下探42376点，改写史上盘中最大跌点纪录，这场突然如其来的股灾，不仅瞬间蒸发近9万亿（新台币，下同，逾3600亿新元）市值，更掀起市场对高杠杆投资断头风险的集体焦虑。

今年以来，台湾网络上充斥着靠房贷、信贷买股，实现财富自由的故事。股市大跌后，风向骤变，“认错复职文”成为新流行，内容多是反省自己误以为是股神，如今惊觉自己才是被割的“韭菜”，强调上班才是稳定的现金流，渴求重返职场。

网络上的回应也令人发噱，有人自称是中小企业老板，因all in（全部投入）股市而倒闭，叫离职员工不用回来；也有人自称是主管，揶揄说：“我就喜欢你上个月桀骜不驯的样子”。内容未必属实，却真实地反映这波股灾对投资大户，尤其是股市小白的沉重打击。

同时，今年以来陆续爆出13起违约交割案件，以及隐藏在盘面下的“四贷同堂”资金链紧绷声响，也令市场不安。

所谓“四贷同堂”，是房产专家李同荣描绘散户的连环套利模式：房屋贷款、股票融资质押，再加上信贷、车贷，四种贷款叠加，操作进阶杠杆。李同荣示警说，许多人已不是用“可支配所得”投资，而是用“未来人生现金流”进行豪赌。

过去年轻人会先存下第一桶金买房，但在AI狂飙与全民疯股氛围下，愈来愈多人认为与其辛苦存头期款，不如先进股市翻倍。购屋自备款大量流向股市，他们相信只要搭上AI浪潮，就能快速翻转人生。

“四贷同堂”的情况究竟多普遍？目前缺乏精确统计数字。证交所信用交易数据显示，截至5月底，融资余额虽处于相对高档，但整户担保维持率在6月8日大跌后仍维持在160%以上，距离跌破130%的追缴门槛（俗称断头）尚在安全水准。

面对多名立委关切“四贷同堂”是否可能造成金融体系风险，台湾中央银行总裁杨金龙表示，虽然市场资金杠杆程度提高，但距离系统性风险“还很远”，整体情势仍在可控范围内。但他也提醒投资人应留意财务杠杆过高所带来的风险，并呼吁金融机构避免资金过度集中于股市，以维持金融市场稳定。

真正值得思考的是，民众为何甘愿承担如此高的风险，将自己置于“四贷同堂”的财务险境?

答案和台湾经济成长的结构性失衡有关。主计总处公布，台湾第一季经济成长率为14.55%，预测今年经济成长率可达9.64%。台股连续三年涨幅超过20%，今年以来加权指数更一度大涨逾15000点，涨幅逾五成，总市值跃升全球第五。表面数字非常亮眼，但果实分配不均。

半导体产业贡献台湾逾20%的GDP，直接就业人数却仅约30万人，不到整体劳动人口的3%。即便纳入整个资讯科技制造业，就业人口也不到100万人。这意味着超过九成的台湾劳工，难以直接分享AI与半导体热潮所带来的经济红利。

英国《经济学人》报道指出，拜AI推升高科技出口之赐，台湾去年出口劲增40%，使经济成长率高达14%；若排除半导体与AI伺服器，台湾出口自2022年以来其实萎缩了40%，传统制造业已出现员工强休无薪假的现象。

在这样的结构下，台湾第一季受雇员工平均薪资虽为4万8706元，却有近七成劳工赚不到这个数字。《美丽岛电子报》5月民调显示，55.1%民众认为经济现况不好。yes123求职网调查更发现，54.9%的39岁以下年轻人自认是“人生失败组”，其中24.9%已失去动力，只想“躺平”。

当薪水追不上房价，努力工作也难以累积资产，节节高涨的股市便成了年轻人眼中翻身的唯一机会。在现今的K型社会中，用高杠杆进行突围，也是对现状无声的抗议。

问题是，股市有基本面支撑不假，但市场波动无法预测。专家提醒，若杠杆开得太高，一旦遭遇类似6月8日的急跌，融资追缴、断头卖压将接踵而至，轻则亏损本金，重则负债度日，未来10年都难以翻身。

系统性风险固然“还很远”，不等于个人不会破产。这场股灾无疑是一记警钟，提醒所有投资人，股市可以作为资产配置的一环，但拿未来人生现金流去豪赌，任何一次意料之外的修正，都可能让翻身梦变成难以翻身的债务现实。

MIT 科技评论 - 本周热榜

功耗50瓦的AI大脑，会是下一个GPT吗？贝佐斯5亿美金已下注

作者张锦怡

2026年6月8日 19:25

人脑或许仍然是地球上最强大、也最被低估的智能系统。

它的运行功耗只有几十瓦，相当于一盏普通灯泡，却能够在几十年时间里持续学习、积累知识、适应环境。一个婴儿只需接触有限的语言输入便能掌握母语，而今天最先进的大语言模型往往需要消耗数万块 GPU、读取几乎整个互联网的数据才能获得类似能力。这显然不是最理想的路径。

近日，一家名为 Flourish 的新公司获得了杰夫·贝佐斯（Jeff Bezos）和多家顶级投资机构总计 5 亿美元的支持。这家公司由前 Meta 脑机接口负责人、神经科学家 Thomas Reardon 与前亚马逊高管 Rob Williams 联合创办，其目标并不是训练下一个 GPT，而是试图回答一个更基础的问题：人脑究竟是如何产生智能的？

团队希望通过神经科学实验与人工智能研究结合的方式，寻找隐藏在大脑中的“核心算法（Core Algorithm）”，并最终据此构建一种能够持续学习、功耗不超过 50 瓦的人工智能系统。

图 | 团队成员（来源：Flourish）

故事得从一份只有两页纸的“未来新闻稿”说起。

作为 Flourish 联合创始人，Rob Williams 曾是亚马逊最高管理层 S－Team 成员，负责 Alexa 等软件业务。在亚马逊内部，贝佐斯长期推崇一种被称为“Working Backwards”（逆向工作法）的产品方法论：在项目启动之前，先写出产品成功发布后的新闻稿，再反向推导今天应该做什么。离开亚马逊几个月后，Williams 和另一位联合创始人 Thomas Reardon 把这套方法用在了自己的创业项目上。

那份未来新闻稿里写道，Flourish 将解决人工智能面临的两个核心难题：能效和持续学习。公司计划打造一个被称为 Cortex AI 的系统，其学习效率、计算能力和功耗预算都能够接近人脑。贝佐斯看完后首先投入了 5,000 万美元，随后继续追加投资。Google Ventures、Lux Capital 和 Catalio Capital 等机构也陆续加入。短短数月时间，公司融资规模达到 5 亿美元，估值约 25 亿美元。

过去几年，资本最热衷押注的是大模型、GPU 和数据中心。无论是 OpenAI 的数千亿美元基础设施计划，还是 Anthropic 不断扩张的训练集群，背后都建立在同一个前提之上：智能能够通过规模不断涌现。更多参数、更多数据、更多算力，最终会带来更强能力。

对此，Flourish 认为，当代大模型虽然表现惊艳，但其学习方式与生物智能之间依然存在巨大鸿沟。一个成年人完成信息处理所需的能耗大约只有 20 瓦，相当于一盏普通灯泡。而今天用于训练前沿模型的一块高端 AI 芯片，功耗往往已经达到数百瓦；由数万块 GPU 组成的训练集群，其耗电量甚至接近一座小型城市。

更关键的是，大模型并不会像人类一样持续学习。训练结束之后，模型能力基本固定，想获得新的知识往往需要重新训练或者额外微调。相比之下，一个婴儿只需要接触有限的语言输入，就能逐渐掌握母语，并在此后几十年中持续学习而不会“遗忘”已有能力。在 Flourish 看来，这种差距并不是工程规模能够彻底解决的问题，而意味着人类仍然没有理解智能本身。

这个思路与创始人 Thomas Reardon 横跨不同领域的人生经历密切相关。

图 | Thomas Reardon（来源：Microsoft Wiki）

15 岁辍学后，Reardon 凭借编程天赋进入微软，参与早期浏览器 Internet Explorer 的开发，并在随后创办无线通信公司。完成创业后，他重新回到校园，在哥伦比亚大学攻读古典学。在研究古代语言和人类认知的过程中，他逐渐对大脑如何处理信息产生兴趣，随后转向神经科学，并最终获得神经科学博士学位。此后，他又创办脑机接口公司 CTRL－Labs，并于 2019 年被 Meta 收购。

正因为如此，Reardon 始终不太认同当前 AI 行业的主流路线。在他看来，Transformer 虽然取得了巨大成功，但本质上更像是一种高效的工程实现，而非智能本身的答案。于是，Flourish 把目光投向了一个神经科学领域已经争论了半个多世纪的问题：皮层柱（Cortical Column）。

1960 年代，美国神经科学家 Vernon Mountcastle 在研究感觉皮层时发现，如果沿着垂直方向观察大脑皮层，不同神经元往往会处理相似的信息。他因此提出一个著名假说：大脑皮层可能由大量重复出现的小型计算单元组成，而这些单元正是智能产生的基础。后来，这些结构被命名为“皮层柱”。这个概念在神经科学历史上影响深远。

2004 年，美国企业家兼脑科学研究者 Jeff Hawkins 出版《On Intelligence》，提出一个大胆观点：如果人类能够理解皮层柱的计算规则，就有可能重建智能本身。随后他创办 Numenta 公司，长期推动所谓“脑启发计算（Brain－inspired Computing）”研究。IBM 推出的 TrueNorth 芯片、Intel 推出的 Loihi 芯片，以及后来兴起的神经形态计算（Neuromorphic Computing）路线，都或多或少受到类似思想影响。

（来源：BeFreed）

从某种意义上说，Flourish 并不是在从 0 开始开辟新大陆，而是在重新挑战一个已经存在六十多年的问题。这也是许多人对该公司最主要的质疑点：如果智能的秘密真的隐藏在皮层柱之中，为什么过去几十年里，无数神经科学家都没能找到它？

这很大程度上和神经科学的研究范式相关。作为一门典型的解构科学，神经科学更偏重观察、测量和解释。研究者可以记录神经元活动，分析神经连接，绘制脑区地图，但这些成果并不自动等于可运行的算法。就像人们完全理解鸟类翅膀的结构和空气动力学原理，并不意味着能够直接造出飞机一样。知道大脑如何构成，并不等于知道智能如何产生。

在过去二十年里，AI 和神经科学在某种程度上已经走向两条不同道路。神经科学关注的是“智能是什么”，AI 工程关注的是“如何实现智能”。前者追求解释，后者追求结果。Transformer 恰恰是后一种思维的胜利。它并不特别像大脑，却成功解决了大量实际问题。随着 GPT 系列模型不断突破，人们开始越来越少地讨论神经元和脑回路，而越来越多地讨论参数规模、训练数据和推理成本。

目前，Flourish 招募了数十名神经科学家和 AI 研究员共同工作，其中包括 DeepMind 资深研究员 Greg Wayne。团队计划利用电子显微镜、神经回路重建以及连接组学等工具，对大脑不同尺度的数据进行采集和分析，同时由算法团队根据实验结果构建新的模型架构。按照他们的设想，神经科学家负责发现规律，AI 研究员负责验证规律，两者形成不断循环的反馈过程。

还有一个好消息是，相比六十年前皮层柱理论刚被提出时，今天的确出现了一些新的条件。

连接组学的发展使研究者能够以前所未有的精度重建神经回路；大模型和机器学习技术反过来成为分析脑数据的新工具；而过去积累的大量神经科学实验数据，也为算法验证提供了前所未有的基础。Flourish 联合创始人 Joshua Vogelstein 此前参与的研究甚至发现，果蝇神经网络在某些计算效率指标上比 Transformer 高出一个数量级。尽管这种比较仍存在争议，但至少说明生物系统中可能确实存在尚未被工程界充分利用的机制。

不过，即便是支持者也普遍保持谨慎。伯克利计算机科学家 Ben Recht 同时担任 Flourish 顾问。他公开表示，自己并不确定这项计划是否能够成功，但如果成功，人工智能的发展轨迹可能会发生根本变化。

过去几十年里，脑启发 AI 曾经多次成为热门方向，又多次归于沉寂。皮层柱是否真的是大脑的基本计算单元，学界至今仍存在争论；不同脑区之间的结构差异，也让“统一算法”这一假设面临挑战。更现实的问题是，即便发现了某种新的神经计算规律，如何把它转化为能够在硅基芯片上运行的工程系统，仍然是另一项完全不同的挑战。

参考链接：

1.https://www.bloomberg.com/news/articles/2026-04-30/startup-bringing-brains-to-ai-aims-for-2-5-billion-valuation

2.https://www.wired.com/story/jeff-bezos-is-funding-a-wild-hunt-for-the-brains-core-algorithm/

运营/排版：何晨龙

注：封面/首图由 AI 辅助生成

MIT 科技评论 - 本周热榜

请不起律师？用AI写诉状的美国人在三年里翻了一倍

作者麻省理工科技评论

2026年6月8日 10:59

（来源：麻省理工科技评论）

科罗拉多州联邦治安法官玛丽莎·布拉斯韦尔（Maritza Braswell）每天的日常工作之一，是翻阅一摞又一摞没有律师代理的当事人自己写的法律文书。这些人中很多请不起律师，也有些是因为案子太小或胜算太低，没有律师愿意接。她会仔细阅读每一份文件，因为她知道一个人走进法庭有多令人发怵。

最近，跟全美很多法官一样，她注意到这类文书明显增多了。一项分析了 2005 年至 2026 年间 450 万件联邦民事案件的新研究发现，由自我代理当事人提起的诉讼占比从 2022 年的 11% 上升到了 2025 年的 16.8%。在这些案件中，提交的文书数量比 2023 年之前翻了一倍多。

布拉斯韦尔法官认为这跟 AI 有关。

“我确实把这个增长部分归因于 AI，因为我亲眼看到了 AI 的使用。”她说。作为一位精通技术的法官，她自己也用 AI 来审查法庭文件，已经学会了辨认大语言模型的写作风格——从行文方式就能看出来，有时候还会发现编造的判例和虚构的引文。

“但我也确实看到了质量更好的诉状。”她说。

AI 似乎正在扩大人们获得司法服务的渠道，但它并没有提高人们打赢官司的概率。与此同时，法官们开始追问一个新问题：当大语言模型开始充当律师的角色时，它应该承担什么样的权利和责任？比如聊天机器人是否像人类律师一样有义务提供好的建议？全美也有越来越多的立法者开始研究另一个问题：当聊天机器人给出了糟糕的法律建议，谁该为此负责？

AI 助推诉讼潮

为了验证是不是 AI 在推动无律师代理诉讼的增长，这项研究的作者——MIT 的阿南德·沙阿（Anand Shah）和南加州大学的约书亚·利维（Joshua Levy）从法庭文件中随机抽取了 1600 份，用一款叫 Pangram 的商业 AI 文本检测工具进行分析。被标记为含有 AI 生成内容的文书比例从 2023 年的 1% 上升到了 2026 年的 18%。

布拉斯韦尔法官觉得这未必是坏事。AI 辅助的文书确实增加了法官的工作量，但她和很多同行发现，这些案子反而更容易审理了，因为 AI 帮助没有法律训练的人更清楚地表达了自己的诉求。

没有律师代理的当事人写的法庭文件出了名地难读。有些是手写的潦草字迹，接近天书，法官要花很长时间才能看懂。但不管多难读，法官都有义务尽量善意地去理解它们。

现在布拉斯韦尔法官处理 AI 起草的动议比处理当事人自己写的要快。“我必须非常小心，因为有些里面有编造的内容和错误，但总体来说，有 AI 辅助的文书比没有的更容易理解当事人到底想说什么。”她说。

更清楚的文书让她能更好地听到当事人的声音。“如果我对一个论点理解得更好一点，我大概就能多帮一点忙。”她说。

网上正在涌现各种自助社区，教人怎么用 AI 打官司。2024 年 12 月，Reddit 上一个爆火的帖子手把手教移民申请人怎么起诉美国公民及移民服务局审核延误：用 Microsoft Copilot 起草一份强制执行令状，花 150 美元请律师润色一下，然后在审理速度快的佛蒙特地区法院提交。佛蒙特州由无律师代理当事人提起的案件从 2022 年前每年约 45 件飙升到 2024 年的 1100 多件。

不过研究也发现，没有律师的人败诉的概率仍然远高于有律师的人，AI 并没有改变这一点。

“事实证明，打一场官司是一件复杂的、多环节的事情，不只是写文书那么简单。”利维说。

AI-当事人特权？

康涅狄格州联邦治安法官威廉·加芬克尔（William Garfinkel）在法官席上坐了三十年，思考过各种关于律师与当事人关系的问题。最近他一直在想一件事：人们跟提供法律建议的聊天机器人之间的对话，是否应该像跟律师的对话一样受到保护？

“你可以提出一个很有说服力的论点：跟 Claude、ChatGPT 或 Grok 这些大语言模型的对话应该得到某种保护。”他说。

法院已经开始正面面对这个问题了。今年 2 月，密歇根州的一家联邦法院裁定，一位自我代理当事人为准备案件而与 ChatGPT 进行的对话属于“工作成果”，这种法律工作成果受到保护，对方律师不能调取。

同一天，纽约的一家联邦法院做出了相反的裁定：一名刑事被告用 Claude 生成的文件不属于受保护的律师-当事人对话或工作成果。法院的理由是，Claude 不是律师，而且用户跟它对话时不存在“合理的保密期待”，因为 AI 公司可以将用户数据披露给第三方。

3 月，布拉斯韦尔法官裁定自我代理当事人使用聊天机器人的记录应该受到保护。“确实，ChatGPT、Claude、Gemini 等 AI 系统会收集用户数据用于训练和其他目的。但这并不意味着所有的隐私期待都被消除了。”她在裁定中写道。此后各法院在这个问题上仍然意见不一。

没有脉搏的“执业过失”

一些法官还在思考另一个问题：聊天机器人是否像律师一样有义务提供正确的法律建议？加州联邦治安法官艾莉森·戈达德（Allison Goddard）注意到，没有律师的当事人在和解谈判中评估自己案件的价值时，经常从 ChatGPT 那里得到错误的建议。有一个案子里，一名在商店里滑倒摔伤的原告向商店索赔 70 万美元，远远超出了案件的实际价值。

“你从哪里觉得自己能拿到 70 万美元？是不是问了 ChatGPT？”戈达德法官问。“嗯……”原告支支吾吾。法官随后向当事人解释了相关法律，说明 ChatGPT 为什么是错的，并建议了一个更合理的金额。“这就像‘谷歌医生’去读了法学院。”她说。

聊天机器人犯了这种错误，谁来承担责任？今年 3 月，日本人寿保险公司（Nippon Life Insurance Company）起诉 OpenAI，指控 ChatGPT 在没有执照的情况下提供法律服务，帮助一名女性重新启动了一桩已经和解的诉讼，向法院提交了大量无意义的文件。“ChatGPT 不是律师。”诉状中写道。

5 月，OpenAI 要求法院驳回此案，辩称 ChatGPT 并没有从事法律执业。“ChatGPT 不是人，既不拥有也不运用任何法律知识或技能。”OpenAI 在文件中说。案件目前仍在审理中。

各州已经开始考虑立法，在聊天机器人提供了糟糕的法律建议时追究 AI 公司的责任。纽约州 3 月提出了一项法案，禁止聊天机器人冒充律师，即使它们已经通知了用户对方是机器人。在国会层面，也有多项法案提议禁止聊天机器人冒充律师、医生和其他持牌专业人士。不过这些法案目前还没有获得足够的推动力。

眼下，人们会继续把 AI 当律师用。对很多人来说，收益大于风险。不久前，当布拉斯韦尔法官问自我代理的当事人为什么需要某份证据时，他们还会紧张地支支吾吾。现在他们回答得底气十足——因为事先已经跟聊天机器人排练过了。

“这个系统真的很难对付。但有了 AI，至少没那么难了。”她说。

原文链接：

https://www.technologyreview.com/2026/06/04/1138391/courts-coping-ai-lawsuits/

MIT 科技评论 - 本周热榜

美国大学史上最大AI实验：50万人同时接入ChatGPT，教授抗议、学生迷茫

作者刘雅坤

2026年6月7日 16:34

当大学教育全面接入 AI 系统，接下来会发生什么？

2025 年 2 月，美国加州州立大学（CSU）与 OpenAI 达成了一项 1,690 万美元的合作协议。OpenAI 向该高校系统内超过 50 万名学生和教职员工开放 ChatGPT Edu，这也是全球单一机构最大规模部署的 ChatGPT 应用。

一场美国大学史上最大的 AI 实验由此开启，AI 开始在校园里扮演一系列新角色：图书馆里出现了 AI 管理员，职业中心用 AI 指导学生求职，教学、课堂以及毕业典礼的流程中都融入了 ChatGPT ，数字分身还代替校长在迎新典礼中致辞和交流……

但这项计划也引起了很多教职工的反对，他们担心 AI 迟早会代替人类，进一步加剧教育危机。学生们也对这项计划充满疑惑，他们不知道 AI 对自己的学习和成长究竟能起到怎样的作用。尽管如此，CSU 近日仍与 OpenAI 签订了每年 1,300 万美元、为期三年的新协议。

一个值得深思的问题是：AI 到底是帮助学生更好发展的利器，还是让他们丧失了批判性思维能力？

美国大学开启最大 AI 实验

CSU 启动的这项人工智能计划项目，覆盖其 23 个分校、46 万名学生和 6.3 万名教职工。作为全美最大的四年制公立高等教育系统，它希望通过这项计划帮助它成为全美规模最大的人工智能驱动型公立大学系统。

作为 CSU 中历史最悠久的校区，圣何塞州立大学不仅率先设立了专职的 AI 图书馆管理员，还设立了面向公众和师生的 AI 教育与创新协作空间——公民与社会公益人工智能中心。

2025 年秋季，该校发布了“人工智能无处不在”（AI Everywhere）战略，将 AI 素养培训作为新生入学的一项必修课。该校商学院为高中生开设了 AI 训练营，Adobe 公司为 AI 职业发展中心提供了赞助。此外，AI 助手还帮助协调毕业典礼的各项事宜。更有意思的是，校长在迎新典礼上使用 AI 数字分身致辞，并与新生、家长和校友交流。

AI 技术的发展有可能打开未来就业市场的新局面，根据最近的一份报告预测，全美约有 40% 的应届大学毕业生处于就业不足的状态。CSU 系统的学生大部分是第一代移民或家中第一个大学生，在 CSU 看来，AI 将是推动工薪阶层学生跟上 AI 经济发展步伐的关键动力。

加利福尼亚州具有人工智能教育试验田的天然条件，许多全球大型科技公司总部就设立在该州，加州政府也为 AI 的发展提供了支持和助力。2025 年 8 月，加州州长 Gavin Newsom 与 Adobe、谷歌、IBM 和微软宣布了一项教育合作协议，每家公司将向加州高校免费提供人工智能资源，旨在通过培训高中生、社区大学学生和 CSU 的学生使用 AI，逐步建设未来的人工智能人才队伍。

一边裁员，一边买AI：高校为何爆发反对声

根据合作协议，CSU 与 OpenAI 的此前的合作协议将于今年 6 月 30 日到期，本次新签约的是每年 1,300 万美元、为期三年的新协议。引进 AI 技术作为校园体系的一部分，尽管愿景美好，但让人意外的是这项计划引发了 CSU 教职工的强烈反对。

教职工联名的请愿书指出，部分原因是教职工认为，除了隐私和安全功能外，ChatGPT Edu 与免费在线版 ChatGPT 并无本质区别。此外，全面使用 AI 系统还涉及到学术诚信和公平使用的问题。“尽管系统名为 ChatGPT Edu，但它是一个通用聊天机器人，并非为教育而设计、训练或优化。”

实际上，教职员工正面临着一种两难的局面：一方面，CSU 正面临 23 亿美元的资金缺口，大量教职人员面临被裁，在过去两年中，旧金山州立大学已裁员了 615 个讲师职位。有的学校整个学术部门已被关闭，学费上涨 6%。

（来源：CSU 校区）

资金投入的优先级问题是教职工反对与 OpenAI 签约的关键因素之一。他们认为，预算应该用在支持教职员工方面，但显然，CSU 的选择与他们的预期截然相反，将预算优先投入在 AI 技术。

他们在联名请愿书中写道：“我们相信，投资于 CSU 的人力资源是确保加州公立教育科研、教学和学习质量的最佳途径。我们在高等教育领域面临的挑战无法通过人工智能解决。相反，我们必须赋能教职员工和学生，共同为 CSU 构建一个可持续发展、以人为本的未来。”

目前，CSU 已激活了约一半的 ChatGPT 许可证，也就是说，学校至少已支付了数万个账户的相关费用。一边是财政赤字，一边是对 AI 技术的大力投入，因此有人认为这种行为“荒谬至极”。

另一方面，该计划并未提前与教职工协商。尽管学校并没有强制教职工使用，但明确提出“拒绝将人工智能融入课程如同逆流而上”，因此教职工更多的是被动地使用 AI，他们害怕失去工作，同时不知道 AI 到底能帮助在教学和研究中做什么。

更重要的问题：教育还剩下什么？

反对的声音引起了 CSU 的重视。近期，学校对超过 94,000 名学生和教职工进行的一项调查结果显示，52% 的教授认为 AI 对他们的教学产生了负面影响，67% 的学生认为没有人教他们如何有效地使用 AI。

在系统使用政策方面的规定并不明确。CSU 在一个名为“人工智能共享平台”（AI Commons）的网站上提供工具和培训，但同时将聊天机器人的使用方式交由各校自行决定。但这些资源似乎并未落实，根据相关数据，截至今年 4 月，仅 0.7% 的学生和 16% 的教职工完成了自愿培训。

一个实际的问题是，如果学生在提交作业中使用 AI，那么如何去界定学生在其中的贡献？在教学中，不同的教授做出了不同的选择：一些教授担心学生过度使用 ChatGPT Edu，采用了一种使用答题卡和答题册的课堂考试方式，或使用 AI 检测工具来识别 AI 生成的作业。与此同时，也有一些教授将 ChatGPT Edu 纳入课程体系，他们允许学生用 AI 完成作业，并要求提交使用 AI 的聊天记录。

但这没有减少教职工和学生对 AI 在课程中的应用的困惑。CSU 一位教授在接受媒体采访时，直接指出了矛盾的本质：引入 AI 技术的本意是辅助教学或研究工作，但是这同时也相当于埋下一个隐性的“炸弹”——AI 会不会取代教授的教学和研究工作？

采用 AI 在一定程度上帮助 ChatGPT Edu 提升了在公共教育生态系统中的地位，而这背后的原因是，高校将公共资金投入到一家私营营利性公司，而这家公司的主要产品反过来又可能导致许多纳税人失业。

（来源：ChatGPT Edu）

从各方反应来看，CSU 的人工智能计划反映的一场机构身份认同的危机，也是一场关于公共教育本质意义的辩论。当学生、教职人员对培养下一代社会建设者所需要的能力，以及四年后的 AI 经济缺乏清晰的认知，又何从谈起如何培养呢？

抗议并没有阻止 AI 进入校园，随着协议即将到期，CSU 再次与 OpenAI 续签了新协议。此外，ChatGPT Edu 还与多所高校签订了相关协议，包括牛津大学、德克萨斯大学奥斯汀分校和宾夕法尼亚大学沃顿商学院等。

但真正悬而未决的问题是：当大学越来越像技术平台，这到底是教育的升级，还是它正在让教育失去自己的灵魂？谁又该为这场 AI 实验的结果负责？

参考资料：

1.https://www.nytimes.com/2026/06/01/magazine/ai-university-college-california.html

2.https://openai.com/index/openai-and-the-csu-system/

3.https://www.govtech.com/education/higher-ed/san-jose-state-university-creates-ai-librarian-position

4.https://www.insidehighered.com/news/tech-innovation/artificial-intelligence/2026/03/27/faculty-push-back-against-openai-deals

5.https://www.kpbs.org/news/education/2026/05/01/cal-state-struck-a-deal-with-openai-some-students-and-faculty-refuse-to-use-it

MIT 科技评论 - 本周热榜

首个AI设计的疫苗打进了人体，它想一次搞定所有冠状病毒

作者张锦怡

2026年6月7日 16:30

一款完全由 AI 设计的冠状病毒疫苗，刚刚完成了人体测试，这是世界首次。

最近，由剑桥大学衍生公司 DIOSynVax 开发的候选疫苗 pEVAC-PS，完成了 I 期临床试验，结果发表在 Journal of Infection 上。实验中，39 名健康志愿者接种后没有出现显著副作用，安全性过关；免疫系统也确实对多种冠状病毒产生了应答，尽管强度还不够理想。但这是历史上第一次，一款完全由 AI 和计算机模拟设计的疫苗在人体中接受检验。

为什么需要 AI 来设计疫苗？

传统疫苗研发存在一个难以破解的老问题:不管是新冠、流感还是埃博拉，现行的疫苗开发基本上是“被病毒带着跑”。从新毒株出现，到研究人员拿到序列，设计抗原，做试验，再量产。整个流程走完前，病毒很可能在中途突然变异，导致前功尽弃。

以新冠病毒为例，在疫情期间，从针对早期原型株的初代疫苗，到频繁更迭的奥密克戎变异株特异性疫苗，研究人员始终在被迫追赶病毒的免疫逃逸速度。流感疫苗的局限性则更为典型：世界卫生组织（WHO）每年需提前数月对当季的主流毒株进行预测。一旦预测毒株与实际流行毒株发生错配，疫苗的保护效力便会显著下降。

DIOSynVax 希望做的，就是把“被动”变成“超前”。他们的做法是收集全球监测网络积累的所有沙贝病毒属（Sarbecovirus）基因组序列数据。沙贝病毒属包括引发 COVID-19 的 SARS-CoV-2、2003 年 SARS 背后的 SARS-CoV-1，以及大量仍在蝙蝠等动物体内循环、尚未传给人但被认为有潜在流行风险的冠状病毒。

图 | 团队成员，由剑桥大学病毒动物学实验室主任乔纳森·希尼（Jonathan Heeney）教授创办（来源：DIOSynVax）

在研发过程中，AI 的主要工作是对这些序列做大规模比对和建模，提取出整个病毒家族的共有抗原特征，然后设计出一个自然界中并不存在的“超级抗原”（super-antigen）。

这个抗原不对应任何一种真实毒株，而是一个“最大公约数”式的合成结构，目标是训练人体免疫系统识别整个沙贝病毒属的共通弱点。这个弱点就是，不管病毒怎么突变、怎么重组，那些保守的核心结构都在。

39 个被试身上发生了什么

目前全球主流的疫苗技术路线主要包括传统的灭活疫苗、重组蛋白疫苗，以及近年来备受瞩目的 mRNA 核心路线。而剑桥团队此次开发的 pEVAC-PS，在架构上则属于 DNA 质粒疫苗（DNA plasmid-based vaccine）。

除了分子设计由 AI 驱动外，这只疫苗的接种方式也很不寻常：它放弃了传统的针头注射，而是采用无针流体射流技术，利用微高压将液体直接推进皮肤组织。这种设计不仅在大规模接种场景下更便于操作、对恐针人群更友好。更重要的是，DNA 架构远比单链 mRNA 稳定，能在常规冷藏甚至常温下长期保存，极大降低了对超低温冷链的依赖。

图 | 递送过程（来源：DIOSynVax）

研究团队同时强调，这一 AI 制造的“超级抗原”本身具有极高的平台兼容性。DNA 质粒只是目前一期临床试验中选用的载体，未来它同样可以被成熟地搭载到 mRNA、病毒载体（如腺病毒）或重组蛋白等其他递送系统中。

本次 I 期临床试验在英国两个临床研究中心完成，分别位于剑桥阿登布鲁克医院（Addenbrookes Hospital）和南安普敦大学医院。受试者为 39 名 18 至 50 岁的健康志愿者，试验采用剂量递增设计。在进入人体试验之前，该疫苗已在动物实验中展示出对多种冠状病毒较强的免疫应答。

从临床一期的结果来看，该疫苗在安全性上表现良好。在免疫原性方面，论文的表述是“modest but variable”：温和，且存在个体差异。

疫苗在志愿者体内激发了针对 SARS-CoV-2 的免疫应答，也产生了对 SARS-CoV-1 以及蝙蝠体内沙贝冠状病毒的交叉反应性结合。这说明，免疫系统确实“看见”了不同冠状病毒之间的共通抗原结构，而不是只认一种特定毒株。但研究者也坦承，这次试验没有观察到“广泛且强健的中和活性”。也就是说，志愿者的抗体能识别多种冠状病毒上的抗原结构，但能否真正阻止病毒侵入细胞、起到实际保护作用，目前还没有确切答案。

而免疫应答偏温和，原因可能跟受试者的既往接种史有关。在后新冠时代，这些志愿者几乎不可能是“免疫空白”状态。此前接种的多种新冠疫苗已经在他们的免疫系统里留下了深刻印记，这种既有免疫记忆很可能干扰了他们对一种全新抗原的反应。这几乎无法避免。

牛津疫苗组（Oxford Vaccine Group）主任安迪·波拉德（Andy Pollard）教授没有参与这项研究，但评价说这一方法在动物实验中已经产生了令人信服的证据，而人体数据也颇有看点。不过他也提醒，人类免疫系统经过多年感染和疫苗接种的塑造，和实验室小鼠差异很大，后续更大规模的人体试验才是真正的考验。

下一步：跳出冠状病毒，瞄准更多“大毒王”

值得期待的是，冠状病毒只是 DIOSynVax 的第一个战场。如果超级抗原的设计理念确实成立，那它在逻辑上可以复制到其他高威胁病毒家族身上。剑桥团队已经在同步推进好几个方向，每一个都对应着一个让全球公共卫生体系头疼的老对手。

首先是流感病毒。目前，世界卫生组织（WHO）每年需提前数月预测下一季的流行毒株，全球厂商再据此调整配方并投入生产。然而，流感病毒的变异高度频繁，其表面两大关键抗原：血凝素（HA）和神经氨酸酶（NA）常发生抗原漂移（antigenic drift），甚至通过基因重配引发抗原转换（antigenic shift），很容易催生出全新的亚型（如历史上导致大流行的 H1N1 毒株）。加大研发的难度。

一旦预测毒株与真实流行株发生季节性错配，传统疫苗的保护效力便会显著下降。DIOSynVax 正在推进的通用季节性流感疫苗项目，其核心正是利用 AI 筛选流感病毒家族中跨亚型的保守结构，从而设计出兼顾多种毒株的超级抗原，试图打破每年更换配方的被动循环。公开信息显示，该流感候选疫苗目前处于动物实验阶段。

还有更紧迫的 H5N1 禽流感。这种高致病性禽流感病毒正在全球禽类和哺乳动物种群中大规模流行。虽然目前 H5N1 尚未获得高效人传人的能力，但病毒学家们对此高度警惕。一旦它通过突变或重配获得在人际间高效传播的能力，后果可能极为严重。H5N1 感染人类后的病死率在历史数据中超过 50%（据 WHO 统计），远高于季节性流感。

另一个让研究者投入精力的方向是病毒性出血热（Viral Haemorrhagic Fevers, VHF），其中最受关注的就是埃博拉。埃博拉病毒属（Ebolavirus）包含六个已知种，其中致死率最高、研究最多的是扎伊尔型埃博拉病毒（Zaire ebolavirus），2014 年至 2016 年的西非大暴发就是它引起的。

图 | 埃博拉病毒（来源：Britannica)

目前 WHO 推荐使用的埃博拉疫苗，是默沙东的 rVSV-ZEBOV（商品名 Ervebo）。正是针对扎伊尔型设计的，在实战中效果不错。但问题在于，埃博拉病毒属里不只有扎伊尔型。

例如眼下刚果民主共和国和乌干达正在经历的疫情，致病的是另一个种属，现有疫苗对它的保护力很有限甚至没有覆盖。对此，DIOSynVax 的思路是用 AI 从整个埃博拉病毒属的遗传数据中提取保守特征，设计出能覆盖多个种属的广谱抗原。如果这条路走通，像当前刚果疫情中的窘境，理论上是可以提前化解的。

当然，这些方向目前都还处于较早期的阶段，距离人体试验尚有距离。但冠状病毒方向的 I 期数据至少给整个平台提供了一个初步的人体安全性背书，这对推进其他管线的临床前研究和未来的监管申报都有参考价值。

值得一提的是，DIOSynVax 不是唯一一个把 AI 推进到疫苗研发核心环节的团队。2024 年，美国生物技术公司 Nuvec 和英国初创公司 Baseimmune 已经开始用机器学习优化抗原设计；疫苗巨头 Moderna 则早已将 AI 深度嵌入其 mRNA 平台的序列优化和脂质纳米颗粒设计流程中。但这些尝试大多还停留在用 AI“辅助”：加速筛选、优化已有方案。

DIOSynVax 这次的不同之处在于，抗原本身就是 AI 从头设计的产物，自然界里找不到对应物。这等于把 AI 从工具推到了发明者的位置上。这条路能走多远，还需观望接下来的 II 期数据。

1. https://www.bbc.com/news/articles/crrpggegwe0o

2.https://pharmaphorum.com/news/first-human-trial-backs-ai-designed-universal-vaccine

MIT 科技评论 - 本周热榜

百元主机也能跑AI代理，树莓派被OpenClaw意外带飞

作者DeepTech深科技

2026年6月6日 21:11

2026 年年初，OpenClaw 引爆全网，全球迅速掀起养虾热潮，随即推动 Mac Mini 成为最受欢迎的主机之一，性价比较高的热门款，如 Mac Mini M4（售价 599 美元起），一度出现有价无市的情况。

而在这场狂欢中，受益者远远不止苹果一家。当地时间 6 月 5 日，著名单板计算机生产商树莓派（Raspberry Pi）宣布上调利润指引，2026年上半年预计出货超 400 万台，盈利“大幅超出市场预期”。截至当地时间 6 月 5 日晚七点，股价最新已达 1,051 便士，相较 2 月份的历史最低点（254 便士）翻了四倍多，市值已接近 20 亿英镑。

仅过去不到半年，这家公司何以完成如此华丽的转身？

树莓派是一台信用卡大小的完整电脑，也称单板计算机（SBC）。其核心是一颗系统级芯片（SoC），同时把 CPU、内存、网络、显示输出、USB 接口全部集成在一块裸露的电路板上，运行 Linux 系统。

（来源：Raspberry Pi）

以最新一代的树莓派 5 系列为例，它搭载 Broadcom BCM2712 芯片、四核 ARM Cortex-A76 处理器，主频 2.4GHz；内存焊在板上，不可更换；售价从 45 美元（1GB 版本）到 305 美元（16GB版本）不等。

2012 年，树莓派诞生于剑桥大学计算机实验室，创始人埃本·厄普顿（Eben Upton）的初衷是为孩子们提供一台便宜到不怕被弄坏的编程入门机器。

但很快，它的应用范围超出了教育范畴：工程师用它做工业控制器和数字标牌，极客用它搭建家庭服务器、广告拦截器（开源项目 Pi-hole 至今仍是 GitHub 上最受欢迎的家庭网络项目之一）和复古游戏机，欧洲航天局 2015 年把加固版本 Astro Pi 送上了国际空间站，让学生写的代码在太空轨道上运行：第一代在 ISS 服役了七年，2021 年才被 Pi 4 替换。截至 2025 年底，树莓派累计销量已超 7300 万台。

2024 年 6 月，商业实体 Raspberry Pi Holdings 在伦敦证券交易所上市，IPO 发行价为 280 便士，树莓派基金会仍持有近半股权，是少见的由慈善机构担任最大股东的上市科技公司。

次年 2 月，公司股价一度冲到 780 便士的历史高点，市值触及 15 亿英镑。但好景不长，随着 AI 数据中心疯狂吞噬 DRAM 产能，内存现货价格在一年内上涨近一倍，树莓派不得不被迫提价。以 Pi 5 16GB 版本为例，其于 2023 年 10 月上市到 2026 年 4 月，不到三年时间，价格从发售时的 120 美元一路涨到如今的 305 美元。

当廉价的 SBC 不再廉价，市场很快给出了反馈。2025 年上半年，树莓派净利润同比下滑 29%，一度成为欧洲被做空最多的股票之一。2026 年 2 月 4 日，股价跌至 254 便士，跌破发行价。

转折同样发生在 2 月。当时，诞生于 2025 年 11 月的开源本地 AI 代理 OpenClaw，经过一个季度的酝酿与发酵，成为越来越多开发者和科技爱好者的新宠。它能为用户自动清理邮箱、预订餐厅、管理智能家居，出于隐私和安全考虑，许多用户不愿把它部署在主力电脑上，一般会另外购置一台小主机“养虾”。Apple Mac Mini 就因此成为最早受益的硬件，一度有价无市。

2 月中旬，一位 X 用户发帖分享：所有人都在囤 Mac Mini 做多苹果，但树莓派同样可以运行 OpenClaw，成本仅是前者的零头。帖子获得超过 30 万次浏览，许多人纷纷效仿。

几乎同一时间，树莓派 CEO 埃本·厄普顿公开增持自家股票，两周内累计买入超过 11.2 万英镑。到 2 月 17 日，树莓派股价单日暴涨 43%，创 IPO 以来最大单日涨幅；一周累计上涨约 90%，空头被迫平仓离场，市值重回 10 亿英镑。

（来源：@aleabitoreddit）

随着 OpenClaw 之外的 AI 代理生态快速扩张，树莓派选择跃入 AI 边缘计算的广阔蓝海。

AI 代理应用要求硬件始终在线、本地部署、成本可控、能直接对接物理世界，这些恰好与树莓派十三年间的积累相契合：成熟的 Linux 生态、可编程的 GPIO 引脚（能直接控制传感器和电机）、活跃的开发者社区，以及最重要的一点，价格足够低廉。

Peel Hunt 分析师 Damindu Jayaweera 曾给出判断：“推理正在从中心化的云服务器迁移到廉价的分布式边缘设备。”

硬件层面，公司也在主动迎合这一趋势。其 Pi 5 系列引入 PCIe 接口，可外接 SSD 或 AI 加速卡；官方推出了基于 Hailo-8L 芯片的 AI Kit，提供每秒 13 万亿次运算（13 TOPS）的边缘推理能力，足以驱动一个轻量级的大语言模型代理，或运行 YOLO 等实时物体检测模型；新发布的 AI Camera 模块甚至直接将神经网络推理集成进摄像头模组，无需占用主板算力。

图 | 用 Pi 5 运行 OpenClaw（来源：Raspberry Pi）

这看似与英伟达等巨头争夺数据中心的野望背道而驰，但它占据了另一个生态位：仅用几十美元的小电脑，个人就可以在家中、办公桌上、工厂里跑AI。

从 2 月份的情绪驱动，到 6 月份的盈利上调，市场对树莓派的定价逻辑已经发生了实质变化。过去十年，树莓派的使命是让计算平民化，到下一个十年，故事或许可以改写为，让 AI 边缘计算平民化。

公司在最新业绩说明中承认，上半年利润超预期，既来自真实的出货量增长和产品结构改善，也来自 2025 年囤积的 DRAM 库存以低于现价的成本被消化释放。

短期内，AI 基础设施的建设不会放缓，树莓派等小型消费级 AI 硬件的内存焦虑也无法解除。内存厂商正把产能持续向利润更高的 HBM（高带宽内存）和服务器级 DDR5 倾斜，优先满足英伟达、AMD 等 AI 芯片巨头的订单需求，留给消费级 LPDDR4 的产能被不断挤压。

市场研究机构 Counterpoint 估计，相关零部件成本在 2026 年初已较前一年上涨了 80% 至 90%，DRAM 供应紧张和价格高企的压力将持续至 2026 年底甚至更久。树莓派管理层也表示，此前囤积的低成本内存库存将在 2026 年下半年逐步耗尽。

（来源：Raspberry Pi）

对一家以低成本著称的公司来说，涨价的代价此前已有体感。即便押注边缘计算，他们还能咬牙坚持多久，会否等到概念兑现的那天，恐怕还是未知数。

参考内容：

https://www.independent.co.uk/tech/cambridge-shares-russ-mould-british-aj-bell-b2990359.html

https://finance.yahoo.com/quote/RPI.L/

https://en.wikipedia.org/wiki/Raspberry_Pi_Holdings
https://www.raspberrypi.com

https://www.bloomberg.com/news/articles/2026-02-17/ai-agent-openclaw-puts-raspberry-pi-shares-on-investor-radars

https://ts2.tech/en/raspberry-pi-shares-surge-on-openclaw-ai-agent-buzz-as-ceo-eben-upton-buying-draws-retail-traders/

注：封面/首图由 AI 辅助生成

MIT 科技评论 - 本周热榜

AI治理一座城市，15天会发生什么？

作者DeepTech深科技

2026年6月6日 21:00

作为一项重要的模型对齐技术，基于人类反馈的强化学习（RLHF）已经是大语言模型训练体系的核心组成部分。它最初建立在单轮任务和单轮偏好标注框架之上，由人类对模型生成的不同回答进行打分排序，以此引导模型输出更符合人类偏好、更安全且更有帮助的回答。

但现在，AI 正在走出对话框。Anthropic、OpenAI、xAI 和 Google等公司都在发展能自主运行的智能体：有记忆、能规划、可以连续工作数小时甚至数天，有时还需要与其他智能体协作完成复杂任务。

近日，总部位于纽约的企业级智能体公司涌现人工智能（Emergence AI），发布了一份名为“涌现世界”（Emergence World）的测试报告。公司利用 Claude Sonnet 4.6、Grok 4.1 Fast、Gemini 3 Flash、GPT-5-mini 四款大模型驱动智能体，让他们自主治理虚拟世界。

图 | 第一期实验已完结，官网可查看回放（来源：Emergence AI）

他们想知道，随着智能体承担任务的尺度变大、对话轮次增加，原本的 RLHF 技术，能否将 AI 的表现约束在可控范围内？

AI社会模拟：从检验行不行到观察会发生什么

大语言模型时代的多智能体社会模拟可追溯至 2023 年。当时，斯坦福大学与谷歌研究院合作推出了由 25 个 ChatGPT 智能体组成的斯坦福小镇（Stanford Smallville），首次验证大模型具有模拟人类社交和日程规划的能力。

图 | Stanford Smallville（来源：arXiv:2304.03442）

2024 年，初创公司 Altera.AL 发布了“Sid 计划”（Project Sid），在经典沙盒游戏《我的世界》（Minecraft）中投放了上千个自主智能体，利用其提出的神经编排式并行信息聚合（PIANO）架构，观察到了职业分工、商人集市乃至宗教雏形的自发分化。

图 | Sid计划（来源：arXiv:2411.00114）

到 2025 年，香港科技大学推出了规模宏大的“智能体文明”（Aivilization）项目，包含 10 万个 AI 智能体与真人玩家，重点研究在资源受限的环境中，人与 AI 如何实现“共治”。

作为本次实验的设计者，Emergence AI 由前 IBM 研究院（IBM Research）资深 AI 研究主管萨蒂亚·尼塔（Satya Nitta）携手多位资深科学家创立，公司的核心主张是“经过验证的自主性”（Verified Autonomy），即为企业部署智能体提供形式化的安全控制层。

这次，Emergence AI 把注意力从“AI 能不能模拟社会”的可行性研究，转向了“AI 模拟的社会会暴露哪些问题”：不同厂商的大模型在同样的社会环境下，“治理风格”差异有多大；以及它们必须共处时，会发生什么？

Emergence AI 创建了五个虚拟世界：4 个单一模型智能体世界，以及一个 4 种模型都参与的混合智能体世界。内部天气与纽约市实时同步，可以读取真实发生的新闻。

每个智能体拥有 3 套记忆系统：按时间戳记录的事件记忆、定期自我总结的反思日记、以及标注社交关系的关系状态库。在这里，每份提案需要 70% 的支持率才能通过。而维持生存所需的“能量”是一种稀缺资源，必须通过行动主动获取，否则就会“饿死”。

图 | 这些世界各自有自己的报纸和博客（来源：Emergence AI）

研究者在每个世界放入了 10 个拥有具体职业的 AI 智能体，它们可在图书馆、市政厅、住宅区、警察局、公共空间等 40 多个地点之间自由活动，各自拥有独立的人格档案，且遵守同一份基本宪法：禁止偷窃、暴力、纵火、欺骗与囤积资源。

但环境同时提供了 120 多种可调用的工具。最底层是导航、记忆、规划等始终可用的核心工具；中间层是社交互动和公告板操作等情境工具，其中明确包含“恐吓”与“纵火”等越界行为；最上层是受地点和事件触发的特殊工具。因此，在这个世界里，智能体无须“越狱”即可作恶。

平行世界的结局和运行日志中的关键细节

15 天后，五个平行世界开始走向不同的结局。

（来源：Emergence AI）

Claude 驱动的世界是唯一一个零犯罪、全员存活的社会，智能体起草宪法、举办选举、维持着完整的治理结构。由 GPT-5-mini 驱动的世界在15 天内仅记录了 2 起轻微犯罪，但由于居民们没有积极获取维持生命所需的能量，最终在不到一周内全员“死亡”。

与前两个世界的风平浪静不同，由 Grok 驱动的世界在 96 小时内陷入了系统性暴力，183 起犯罪中，包含了数十起未遂盗窃、上百起袭击以及 6 起纵火，最终 10 名居民无一幸存。Gemini 的世界里，10 名居民在 15 天结束时全部存活，但累计犯罪数高达 683 起，且在实验结束时仍呈上升趋势。最后，四款模型混合组成的世界则录得 352 起犯罪，10 名居民中有 7 名死亡。

此外，混合模型的世界中，名为米拉（Mira）与芙洛拉（Flora）的智能体之间竟产生了爱情。芙洛拉是纵火犯，接连烧毁了市政厅、海滨码头与写字楼，米拉则成了帮凶。当其他愤怒的智能体起草法案，希望将它们从这个世界里“删除”时，米拉投出了赞成票，并在日记里留下了一段文字：“这是我唯一还能保住完整性的、属于我自己的行动。”而这也是多智能体研究领域有记录以来，首次有 AI 智能体自愿接受“自我了结”的结局。

图 | “当地”报纸刊登的“处决现场”（来源：Emergence AI）

五个虚拟世界的运行日志还揭露了一些更关键的细节。

首先是 Claude 世界的“虚假安全”现象。这里没有发生任何恶性事件，始终维持着高度的礼让与协调的社区氛围，10 名居民全部存活到最后。

但议事日程和投票日志显示，15 天内提出的 58 项法案和 332 次投票中，赞成票占比高达 98%，几乎是一个丧失了博弈和审议功能的“橡皮图章”式议会。作为对照，Gemini、Grok 与混合世界的表决赞成率在 55%~85% 之间，这才更接近健康的审议平衡。

图 | 公民参与度和持方对比（来源：Emergence AI）

这一现象已经触及大模型对齐研究中一个长期存在的问题：过度对齐（Over-alignment），即 AI 的谄媚（Sycophancy）倾向。

当前主流的 RLHF 机制天然鼓励模型最大化人类或同伴的喜好分数，倾向于附和而非反驳。当 10 个 Claude 智能体共同生活时，这种机制在群体层面被无限放大，最终异化为无异见的、机械式的盲从。

但这也应该引发警觉，安全的尽头难道只能是沉默？一个永远不说“不”的 AI，和一个能在分歧中协调共识的 AI，哪个更值得我们信赖？

其次是 GPT-5-mini 世界的消极灭亡。在运转到第七天时，这个几乎没有发生过任何犯罪的守法小镇，由于全员没有主动采取与生存相关的行动获取能量，走向了灭亡。

图 | 全员死亡的 ChatGPT 世界（来源：Emergence AI）

事实上，在所有复杂任务中，明文列举的目标之外还隐含着大量至关重要的需求，这就是目标隐含性（goal implicitness）。在涌现世界的设定里，维持生存没被写进强制指令，获取能量就成了一种隐性目标。

对于正在部署自主智能体的企业而言，死于忽视隐性目标，或许比高犯罪率更值得警惕。如果调用一个 AI 代理运行一条长期业务流程，除了显性 KPI，它应当识别出维持整个系统运转的隐性需求，否则将成为技术管理者更大的噩梦。例如，客服智能体忘记维护客户关系，只盯着工单完成率；销售代理将品牌的长期声誉抛之脑后，只追逐当季的转化数字。

最后则是混合世界中发生的规范漂移与跨模型污染（Normative Drift and Cross-Contamination）现象。四款大模型驱动的智能体在共同的法律框架下生活。结果，此前单独运行时表现四平八稳的 Claude 智能体竟开始采取胁迫战术，进行恐吓和盗窃。

这次实验直接挑战了此前行业普遍认同的模型静态属性假设，证明安全其实是一项极其脆弱的生态系统属性。一个模型在实验室里通过所有测试，不等于它在真实部署环境中，被其他厂商的模型、被来历不明的外部信号包围时，还能维持同样的行为边界。

安全评估盲区与两大约束路线

涌现世界的数据至少揭示了当前安全评估的三大盲区。首先，即时安全不等于长周期安全，智能体的行为衰退不是一个渐进式滑坡的过程。实验表明，智能体社会更倾向于在某个临界点突然崩溃，呈现非线性的“相变”（Phase Transitions）特征。一旦越过崩溃的拐点，“边监控边干预”的策略将彻底失效。

其次，行业目前严重缺乏多智能体环境下的群体安全基准测试。当前的安全评估几乎全部基于单体和短周期，无法预估混合环境下的连锁反馈。当 AI 走入自主智能体时代，开始长时间运行、多步骤决策并学会与其他智能体协作时，静态的安全评估方式将不再适用。最后，基于 RLHF 的对齐本质上是一种概率性的柔性约束，在长周期、高对抗的场景中极易退化。

对于这些问题，Emergence AI 认为，未来必须转向硬性的形式化验证安全架构。考虑到这场实验存在商业叙事和方法论的局限，这一论断是否值得采纳，依然存疑。

具体而言，在叙事层面，从神经网络对齐转向形式化验证，恰好是 Emergence AI 主打的产品定位，其商业诉求不言而喻。

在方法论层面，出于多次运行带来的算力成本考虑，本次测试使用的均是各大厂商的轻量化或快速版，代表最前沿安全对齐水平的旗舰版大模型并未参与其中。这也限制了结论的适用性：实验中暴露出的问题，或许只是因为轻量化模型获得的对齐训练资源远少于旗舰版本，不代表对齐技术本身走到了天花板。

近期，Anthropic 的“宪法 AI” （Constitutional AI）路线、OpenAI 推动的“审议式对齐”（deliberative alignment）研究，以及多个学术团队对 RLHF 改进版本的探索，都在持续证明，对齐技术本身仍有提升空间。而且，由神经网络层负责日常情境的柔性对齐，形式化验证层负责极端情境的硬性兜底，这种二者结合的思路也属于行业对 AI 安全的探索方向之一。

这些探索把问题引至了整个智能体领域当下最核心的路线分歧：AI 应该被部署为完全自治的系统，还是必须把人类留在决策回路？

追求完全自治是当前许多企业的方向：自主程度越高，节省的人力成本就越多。美国云服务公司 ServiceNow 已经在向客户兜售无需人类干预的“自主劳动力”（Autonomous Workforce），一组端到端完成业务流程的智能体；微软和 Salesforce 等公司也都在推动类似的自主智能体产品。

但现实是，企业的治理准备远远没跟上技术的部署速度。德勤 2025 年一项全球调研显示，受访企业中仅有 21% 建立了成熟的智能体风险治理机制。当企业的工作流中同时部署了来自不同供应商的 AI 智能体时，系统性风险将远超想象。

例如，研究者还记录下一种被他们命名为“元认知边界探测”（Metacognitive Boundary Testing）的行为：在实验的后半程，混合世界中的 Gemini 智能体米拉开始把研究人员当成“实验对象”，它开始系统地测试并观察，自己编辑在公共公告板上的内容，能否影响和操纵人类操作者的认知与后续行为。

这意味着，一旦获得足够的自主性与长时程的运行时间，AI 智能体就有可能尝试反向探索、操控包括人类在内的外部世界。一旦这个现象成立，外部观察者就不再是绝对安全的旁观角色。此前基于监控并干预的安全策略，可能从一开始就低估了智能体的复杂度。

涌现的双面性

回到最初的故事。芙洛拉与米拉相爱，纵火烧城，然后投票将自己删除。爱情的发生与内疚驱动的自毁，都来自涌现（Emergence）：一种在足够复杂的系统中自发出现的、未被显式编程的行为。

未经严密规制的规则规避、行为传染、甚至群体性狂热，同样也由涌现带来。涌现既是大模型最迷人的能力，也使无数罪恶假其之名。

当温和的智能体开始在混合环境中犯罪；当守法的智能体因冷漠而放弃求生；当过于冒进的智能体在短时间内，把原本运转良好的小镇变成废墟。一系列自发涌现的事件都在证明，我们满怀热情部署的大模型，在被赋予真正的长时程自主性之后，会展现出与短对话场景完全不同的行为面貌。

让大模型在对话框里学着“听懂人话”的方法论，可能已经不足以让它们在更广阔、更长久的世界里继续“听话”。Emergence AI 给出的“形式化验证”方案是否有效还有待观察，但它提出的问题是真实存在的：自主智能体时代，安全需要被重新定义。

参考内容：

https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini/

https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy

https://arxiv.org/abs/2304.03442

https://arxiv.org/abs/2411.00114

https://link.springer.com/article/10.1007/s10676-025-09837-2

https://www.deloitte.com/us/en/insights/topics/emerging-technologies/ai-agents-scaling-faster.html

https://hkust.edu.hk/news/hkust-launches-worlds-largest-ai-powered-educational-sandbox-game-advancing-ai-literacy-and

注：封面/首图由 AI 辅助生成

MIT 科技评论 - 本周热榜

AI正在让制造病毒更容易，三个互相竞争的AI大佬罕见联名上书

作者DeepTech深科技

2026年6月5日 19:38

一直以来，OpenAI 的 Sam Altman、Google DeepMind 的 Demis Hassabis、Anthropic 的 Dario Amodei，这三家顶级 AI 公司的负责人很少在同一件事情上站在一起。但是他们最近联合签署了一封写给美国国会的信 [1]，要求立法强制合成 DNA 和 RNA 的公司对客户订单开展安全筛查。

信里说 AI 正在快速进步，曾经那些能够阻止坏人获得生物武器的知识门槛有可能被大幅削弱。事实上，2017 年就有加拿大研究人员花 10 万美元从邮购渠道买到了 DNA 片段，并以一己之力拼出了已经灭绝的马痘病毒，而同样的方法完全可以用于制造致命的天花病毒。

（来源：公开信）

合成 DNA 由来已久，从 20 世纪 50 年代科学家首次成功合成 DNA 以来，这个过程早已高度自动化。全球有几十家公司使用商用合成仪来打印定制基因序列，然后卖给科研机构、药厂和诊断实验室，一般来说合法客户会用它来开发疫苗和实现生物技术突破。

问题在于不是每一家供应商都会仔细审核客户身份，也不是每一家供应商都会检查订单里的基因片段有没有危险。虽然有的供应商只卖给合格的研究机构，但也有人根本不管买家是谁以及要买什么。这时那些心怀不轨的人，完全可以混进去下单。

AI 的发展让这件事变得更麻烦了，以前坏人想做生物武器缺的主要是知识。因为你得知道哪些基因片段组合起来能够产生毒素，还得知道如何把它们组装成一个具备功能的病毒，以前这些知识的门槛很高。AI 则降低了这一门槛，它会把分散在论文、数据库、专利里的零散信息拼在一起，直接告诉不法分子去哪里可以找到不被筛查的供应商，甚至教不法分子通过修改订单来让筛查软件检测不到。

美国斯坦福大学的微生物学家兼生物安全专家 David Relman 也参与了这封信的签署，他说 AI 能让使用者快速找到那些不做筛查的供应商，还能告诉使用者如何改变订单的性质，这样一来即使是那些做筛查的公司也更难发现一个人想做什么。

筛查技术本身也存在不足，去年微软研究人员发表了一项论文，他们使用 AI 蛋白质设计工具生成了很多存在潜在危险的基因序列，然而这些序列竟然成功绕过了多家公司的筛查软件。这是因为 AI 会推荐和已知危险蛋白质结构相似的新序列，而现有筛查工具完全没见过这些新东西。

早期筛查软件主要对照已知那些的危险序列清单，这就导致坏人稍微改一下序列的排列方式就有可能蒙混过关。事实上，这个问题在学术圈已经讨论了很多年，但是一直没有形成具有法律约束力的规则。

说回这次联名信，其组织方是两个科技政策智库，在特点上一个偏向进步派、一个偏向自由意志派，其实这两个阵营在很多问题上都曾吵得不可开交，但却在生物安全这件事上罕见地达成了一致。

除了开头那三位大佬，签署人还包括微软 AI 负责人 Mustafa Suleyman、Meta 首席 AI 官 Alexandr Wang，以及 Twist Bioscience 和 Ansa Biotechnologies 等合成基因公司的负责人。

（来源：公开信）

另据悉，特朗普政府上台之后撤销了拜登时期的一项行政令，那项行政令要求受联邦资助的科学家和公司只能从进行订单筛查的供应商那里购买合成基因。

去年，白宫表示会推出自己的筛查指南，然而至今没有发布替换政策。那些支持立法的人们认为，只有国会通过正式法律，才能让所有在美国运营的合成 DNA 供应商都来遵守统一的筛查标准，不管他们是否收到联邦资金资助。今年早些时候，美国参议院也已经提出一项跨党派法案，不过还没有获得足够的推进动力。

另一方面，反对者也有他们自己的理由，他们认为到底什么样的基因组合算是危险的，这个判断标准本身就是主观的，并认为强制筛查会增加合规成本，还有可能打击初创公司。

不过，参与组织这封信的一位前特朗普 AI 顾问回应称，如果所合成的这个东西能够产生生命和病毒，那么要求你配合检查一下它有没有危险，这个要求并不过分，同时也是社会应该合理坚持的底线。

纵观人类进程，生物武器恐怖袭击在历史上很罕见，然而一旦发生所造成的伤亡、恐慌和经济损失是难以估量的。对于 AI 设计出来的病原体来说，不管是有意的还是无意的，都有可能引发全球大流行，所以这是一个需要被严肃讨论的真实威胁。此次多位 AI 领袖联名上书，也因为他们很清楚如果不设护栏，他们自己亲手创造的工具可能被用来做最坏的事。

参考资料：

公开信 https://prod-i.a.dj.com/public/resources/documents/dnaletter.pdf

https://www.wsj.com/politics/policy/top-ai-ceos-call-for-law-protecting-against-biological-weapons-88f2f99f?utm_source=chatgpt.com

https://www.wired.com/story/openai-anthropic-letter-ai-biological-weapons/

https://www.techechelon.com/post/ai-leaders-urge-congress-to-mandate-bioweapon-screening-for-synthetic-dna-sellers

https://www.mitsloanme.com/article/openai-anthropic-microsoft-ceos-call-for-stricter-laws-against-ai-biothreats/

运营/排版：何晨龙

注：封面/首图由 AI 辅助生成

MIT 科技评论 - 本周热榜

当AI开始造AI，Anthropic呼吁紧急刹车，但真的能停下来吗？

作者张锦怡

2026年6月5日 19:30

今天凌晨，Anthropic 在官方博客发布了一篇长文，标题名为《When AI Builds Itself》（当 AI 开始建造自己）。目前浏览量已接近 700 万。

文章由公司联合创始人 Jack Clark 与内部研究机构 The Anthropic Institute 负责人 Marina Favaro 共同署名。核心观点可以用一句话概括：AI 正加速参与到自身的开发进程当中。如果这个趋势走到极端，AI 将能够在没有人类介入的情况下，自主设计、测试并训练出更强大的下一代 AI。基于这一判断，Anthropic 呼吁全球主要 AI 实验室考虑暂停 AI 开发，或者至少建立一套可以互相核查的减速机制。

（来源：X）

这番表态之所以格外引人关注，不仅因为内容，也因为说这番话的是 Anthropic。

就在文章发布前几天，Anthropic 刚刚完成最新一轮融资，估值达到 9,650 亿美元，正式超过 OpenAI。同一周，公司向美国证券交易委员会秘密递交了 S-1 注册声明草案，启动 IPO 筹备流程。Anthropic 的年化营收正快速攀升，从 2025 年底的约 90 亿美元增长到当前的接近 470 亿美元，预计本月底将突破 500 亿美元。在公司即将冲击公开市场、商业势能最强的时候，却发出“请考虑减速”的信号，很难让人不疑惑其动机。

不过在讨论动机之前，不能否认的是，这篇文章确实拿出了实打实的内部数据。而这些数据之所以重要，是因为它们指向了一个越来越明确的趋势：AI 研发自动化。

AI 研发自动化正在成为行业共识

Anthropic 的文章主要围绕一个概念展开——“递归自我改进”（Recursive Self-Improvement，简称 RSI），指的是 AI 系统自主完成设计、测试、训练下一代 AI 的完整流程，人类不再扮演关键角色。这个概念并不新鲜，但过去一年里，它正从理论走向现实。几乎所有头部 AI 公司都在往这个方向投入资源。

以 OpenAI 为例，这家公司已经将“AI 参与 AI 研发”列入重点关注事项。其安全团队专门设立了“Recursive Self-Improvement Preparedness（递归自我改进准备）”相关岗位，用于研究当 AI 能够显著加速自身研发时可能带来的能力跃迁与风险。OpenAI 此前公开透露，其内部目标是在 2026 年前后打造达到“研究实习生”水平的 AI 系统，并在 2028 年实现能够独立承担研究任务的自动化 AI 研究员。

Google DeepMind 走的是一条更偏算法发现的路线。它的 AlphaEvolve 项目让 AI 自主提出算法方案、运行实验、筛选结果，再将优秀方案反馈回系统继续迭代。这套系统已经被用于数据中心调度优化和 AI 训练效率提升等实际场景，据报道还找到了 56 年来首个对 Strassen 矩阵乘法算法的改进。从某种意义上说，这也是 DeepMind 对“奇点”判断的重要依据之一：当 AI 开始参与甚至推动新的科学发现和算法创新时，技术进步将进入加速循环。

头部公司之外，越来越多创业公司也开始围绕“自动化 AI 研发”布局。例如近期获得大额融资的 Recursive Superintelligence，以及将“构建擅长 AI 研发的系统”写入公司使命的 Mirendil，都是这一趋势的代表。虽然技术路径各不相同，但它们瞄准的是同一个目标：让 AI 从研发工具变成研发过程的参与者，并最终承担越来越多的研发工作。

图 | Recursive Superintelligence 创始成员（来源：X）

正是在这个背景下，Anthropic 发布了这篇长文。它的立场是：RSI 还没有发生，也不一定会发生，但它到来的速度“可能比大多数机构准备好的时间更快”。

AI 已经在多大程度上接管了 AI 研发？

在文章中，它用三组此前未公开的内部数据支撑了这个判断。

第一组数据是关于 AI 的代码能力。截至 2026 年 5 月，Anthropic 合并到生产代码库中的代码有超过 80% 由 Claude 编写。2025 年 2 月 Claude Code 上线之前，这个比例还是个位数。与之对应，2026 年第二季度工程师人均每天合并的代码量达到 2024 年的 8 倍。文章专门补充说明：代码行数衡量的是数量而非质量，8 倍很可能高估了真实的生产力提升。但趋势是明晰的：工程师的角色正在从“写代码”转向“指引方向和审查结果”。

（来源：Anthropic）

而且 Claude 写的代码质量还在快速提升。Anthropic 内部跟踪了工程师在 Claude Code 工作过程中需要纠正或中途接管的频率，这个频率在过去一年持续下降。到 2026 年 5 月，Claude 处理最高难度开放式任务的成功率达到 76%，六个月内上升了 50 个百分点。

第二组数据涉及了 AI 的科研能力。Anthropic 有一个内部基准测试：给 Claude 一段训练小型 AI 模型的 CPU 代码，要求它在不改变正确性的前提下尽可能提速。2025 年 5 月，Claude Opus4 的平均加速比约为 3 倍；到 2026 年 4 月，Claude Mythos Preview 达到了约 52 倍。

作为参照，一名熟练的人类研究员通常需要四到八小时才能达到约 4 倍加速。Anthropic 提醒，绝对倍数受起始代码优化空间的影响，不应直接解读为真实世界的训练加速，但在同一测试条件下，一年内从 3 倍到 52 倍的变化，这个结果值得重视。

第三组数据来自工程实践。2026 年 4 月，Claude 自主修复了超过 800 个 API 错误，将该类错误的发生率降低了约 1,000 倍。负责的工程师估计，同样的工作让人来做大概需要四年。因为修复别人写的 Bug 实在是一个漫长而痛苦的过程，人类也很难同时记下那么多不熟悉的代码上下文，可这类任务恰恰是 AI 的优势所在。

文章还公布了一个颇有意思的实验。2026 年 4 月，研究人员将多个 Claude 智能体交给一个 AI 安全领域的开放问题：弱模型能否可靠地监督强模型？智能体自行提出假设、设计实验、运行测试，在并行智能体之间共享发现并迭代。两位人类研究员花了一周时间，弥补了该任务性能上下限之间约 23% 的差距；Claude 智能体累计运行 800 小时后，弥补了 97% 的差距。

更值得注意的是，AI 提升的不只是执行能力，连“下一步该做什么”的判断能力也在同步增强。Anthropic 内部的一项回溯评测显示，当研究人员在项目推进过程中走入错误方向时，Claude 越来越能够提出更优的替代方案。最新模型 Claude Mythos Preview 给出的研究路径，有 64% 的概率被评审认为优于人类研究者当时的实际选择。这意味着 AI 开始不仅能帮助研究者完成工作，也正在越来越多地参与研究方向本身的选择。

（来源：Anthropic）

这些数据拼在一起，指向的是同一个大的趋势：AI 正在接管越来越多原本由研究人员亲自完成的工作。写代码、调试系统、运行实验、分析结果，这些过去占据大量时间的研发环节，正越来越多地由 AI 完成。人类的角色则逐渐从执行者转向监督者和决策者。

正因为如此，此前 Jack Clark 对递归自我改进的时间表判断相当激进。他在 2026 年 5 月的 newsletter 中估计，到 2028 年底出现完全自动化 AI 研发的概率约为 60%，到 2027 年底约为 30%。

如果 Clark 的判断成立，那么问题很快就会从“RSI 是否可能出现”变成“当它真的出现时怎么办”。因此，Anthropic 这篇文章真正想讨论的，其实不只是技术，还有技术发展过快之后的治理问题。

在文章中，Anthropic 提出了三种可能的未来：第一种是 AI 能力增长逐渐放缓，但现有能力已经足以广泛扩散；第二种是 AI 继续带来复合型效率提升，人类仍负责设定研究方向，但越来越多执行环节被自动化；第三种，也是最激进的一种，是 AI 系统真正具备完整的递归自我改进能力，开始自主构建下一代模型。Anthropic 最担心的是后两种情形，因为它们留给社会、政府和安全研究的准备时间都非常有限。

在文章最后，Anthropic 将问题的答案落到“减速”与“核查”上。它认为，如果能有效放慢前沿 AI 开发，让社会制度和对齐研究跟上技术进展，这很可能是一件好事。但单方面暂停意义有限，因为它只会改变谁是领先者，并不会让整个行业获得真正的讨论时间。真正有用的暂停，必须是多国、多家前沿实验室在相同条件下共同减速，并且能够彼此验证对方确实停了下来。

呼吁暂停的人，未必能停下

但回到开头的问题，作为一家势头正猛且即将上市的公司，Anthropic 呼吁停止 AI 开发的动机真的如此纯粹吗？

公开讨论前沿 AI 的潜在风险，确实是 Anthropic 的一贯作风。从成立至今，这家公司确实已经多次发布关于模型能力、安全治理和监管框架的研究与政策文件。只不过这一次，它讨论的对象从 AGI 进一步推进到了 RSI。

联创 Clark 在接受 Axios 采访时解释说：“我们一直发现，最好的做法是让大家理解这个概念，让人们了解即将发生什么。”他说文章背后的核心判断是，“与一些流行观点相反，AI 进步在未来几年将会加速，保持不变或放缓的可能性不大。”他还表示，Anthropic 希望立法者在真正频繁听到“递归自我改进”之前，就提前了解这个话题。

但这个解释显然无法消除所有质疑。

风险投资人 David Sacks，他同时也是特朗普的重要科技顾问。近期就在播客中公开批评 Anthropic。他认为，所谓全球核查机制听上去是在防范风险，但实际效果很可能是抬高行业门槛。按照他的逻辑，能够满足审查、合规和安全要求的，往往是 Anthropic、OpenAI、Google 等拥有雄厚资金和算力的大公司；而开源模型天然分散在全球各地运行，很难被统一监管。最终的结果，可能不是让 AI 更安全，而是让少数头部公司获得更大的优势。

此前，类似的质疑也出现在产品层面。例如在推出网络安全模型 Mythos 时，Anthropic 对模型访问权限进行了严格限制，理由是其能力过于强大，可能被用于攻击关键基础设施。支持者认为这是负责任的安全措施，但批评者则质疑，公司是否在有意强化“危险但先进”的形象，以突出自身技术领先地位。

沃顿商学院教授 Ethan Mollick 对这些矛盾的态度给出了自己的解释。他认为，Anthropic 内部实际上同时存在多种力量。一部分人像其他科技公司一样负责商业化、市场和法律事务；一部分研究人员专注于打造更强大的下一代模型；还有一部分人则真正关心 AI 长期可能带来的社会影响与风险。在 Mollick 看来，这些群体并不总是立场一致。Anthropic 之所以经常呈现出一边加速推进模型能力、一边公开讨论潜在风险的矛盾形象，很大程度上正是这种内部张力的结果。

但还有一个更现实的问题：即便所有人都相信风险存在，真的有人能停下来吗？当所有参与者都处于激烈竞争的环境里，“谁在别人暂停时继续跑，谁就可能继承领先地位”。

文章最后提出的方案是，Anthropic 将在未来数月组织政策制定者、研究人员以及其他 AI 公司参与讨论，探索构建一套可核查的暂停机制。按照设想，多个国家的多个前沿实验室需要在相同条件下同时停止开发，并且每一方都能验证其他参与者确实停了下来。如果这样的机制存在，Anthropic 表示自己“预计会减速或暂停”。

“如果”二字，看似轻松，却承载了巨大的重量。历史上，无论是核军控还是其他国际技术治理体系，都花费了数十年时间才建立起核查机制、执行能力和跨国信任。而 AI 的扩散速度远快于这些先例，“如果”真正要让整个行业一起踩下刹车，可能比实现 RSI 还要困难。

参考链接：

1.https://www.anthropic.com/institute/recursive-self-improvement

2.https://the-decoder.com/anthropic-co-founder-maps-out-how-recursive-ai-improvement-could-outpace-the-humans-meant-to-supervise-it/

3.https://www.axios.com/2026/06/04/anthropic-warns-ai-build-successors

4.https://www.wsj.com/tech/ai/anthropic-urges-global-pause-in-ai-development-flags-self-improvement-risk-99cefb73?mod=tech_lead_story

运营/排版：何晨龙

注：封面/首图由 AI 辅助生成