普通视图

Received before yesterday

功耗50瓦的AI大脑,会是下一个GPT吗?贝佐斯5亿美金已下注

作者张锦怡
2026年6月8日 19:25

人脑或许仍然是地球上最强大、也最被低估的智能系统。

它的运行功耗只有几十瓦,相当于一盏普通灯泡,却能够在几十年时间里持续学习、积累知识、适应环境。一个婴儿只需接触有限的语言输入便能掌握母语,而今天最先进的大语言模型往往需要消耗数万块 GPU、读取几乎整个互联网的数据才能获得类似能力。这显然不是最理想的路径。

近日,一家名为 Flourish 的新公司获得了杰夫·贝佐斯(Jeff Bezos)和多家顶级投资机构总计 5 亿美元的支持。这家公司由前 Meta 脑机接口负责人、神经科学家 Thomas Reardon 与前亚马逊高管 Rob Williams 联合创办,其目标并不是训练下一个 GPT,而是试图回答一个更基础的问题:人脑究竟是如何产生智能的?

团队希望通过神经科学实验与人工智能研究结合的方式,寻找隐藏在大脑中的“核心算法(Core Algorithm)”,并最终据此构建一种能够持续学习、功耗不超过 50 瓦的人工智能系统。

图 | 团队成员(来源:Flourish)

故事得从一份只有两页纸的“未来新闻稿”说起。

作为 Flourish 联合创始人,Rob Williams 曾是亚马逊最高管理层 S-Team 成员,负责 Alexa 等软件业务。在亚马逊内部,贝佐斯长期推崇一种被称为“Working Backwards”(逆向工作法)的产品方法论:在项目启动之前,先写出产品成功发布后的新闻稿,再反向推导今天应该做什么。离开亚马逊几个月后,Williams 和另一位联合创始人 Thomas Reardon 把这套方法用在了自己的创业项目上。

那份未来新闻稿里写道,Flourish 将解决人工智能面临的两个核心难题:能效和持续学习。公司计划打造一个被称为 Cortex AI 的系统,其学习效率、计算能力和功耗预算都能够接近人脑。贝佐斯看完后首先投入了 5,000 万美元,随后继续追加投资。Google Ventures、Lux Capital 和 Catalio Capital 等机构也陆续加入。短短数月时间,公司融资规模达到 5 亿美元,估值约 25 亿美元。

过去几年,资本最热衷押注的是大模型、GPU 和数据中心。无论是 OpenAI 的数千亿美元基础设施计划,还是 Anthropic 不断扩张的训练集群,背后都建立在同一个前提之上:智能能够通过规模不断涌现。更多参数、更多数据、更多算力,最终会带来更强能力。

对此,Flourish 认为,当代大模型虽然表现惊艳,但其学习方式与生物智能之间依然存在巨大鸿沟。一个成年人完成信息处理所需的能耗大约只有 20 瓦,相当于一盏普通灯泡。而今天用于训练前沿模型的一块高端 AI 芯片,功耗往往已经达到数百瓦;由数万块 GPU 组成的训练集群,其耗电量甚至接近一座小型城市。

更关键的是,大模型并不会像人类一样持续学习。训练结束之后,模型能力基本固定,想获得新的知识往往需要重新训练或者额外微调。相比之下,一个婴儿只需要接触有限的语言输入,就能逐渐掌握母语,并在此后几十年中持续学习而不会“遗忘”已有能力。在 Flourish 看来,这种差距并不是工程规模能够彻底解决的问题,而意味着人类仍然没有理解智能本身。

这个思路与创始人 Thomas Reardon 横跨不同领域的人生经历密切相关。

图 | Thomas Reardon(来源:Microsoft Wiki)

15 岁辍学后,Reardon 凭借编程天赋进入微软,参与早期浏览器 Internet Explorer 的开发,并在随后创办无线通信公司。完成创业后,他重新回到校园,在哥伦比亚大学攻读古典学。在研究古代语言和人类认知的过程中,他逐渐对大脑如何处理信息产生兴趣,随后转向神经科学,并最终获得神经科学博士学位。此后,他又创办脑机接口公司 CTRL-Labs,并于 2019 年被 Meta 收购。

正因为如此,Reardon 始终不太认同当前 AI 行业的主流路线。在他看来,Transformer 虽然取得了巨大成功,但本质上更像是一种高效的工程实现,而非智能本身的答案。于是,Flourish 把目光投向了一个神经科学领域已经争论了半个多世纪的问题:皮层柱(Cortical Column)。

1960 年代,美国神经科学家 Vernon Mountcastle 在研究感觉皮层时发现,如果沿着垂直方向观察大脑皮层,不同神经元往往会处理相似的信息。他因此提出一个著名假说:大脑皮层可能由大量重复出现的小型计算单元组成,而这些单元正是智能产生的基础。后来,这些结构被命名为“皮层柱”。这个概念在神经科学历史上影响深远。

2004 年,美国企业家兼脑科学研究者 Jeff Hawkins 出版《On Intelligence》,提出一个大胆观点:如果人类能够理解皮层柱的计算规则,就有可能重建智能本身。随后他创办 Numenta 公司,长期推动所谓“脑启发计算(Brain-inspired Computing)”研究。IBM 推出的 TrueNorth 芯片、Intel 推出的 Loihi 芯片,以及后来兴起的神经形态计算(Neuromorphic Computing)路线,都或多或少受到类似思想影响。

(来源:BeFreed)

从某种意义上说,Flourish 并不是在从 0 开始开辟新大陆,而是在重新挑战一个已经存在六十多年的问题。这也是许多人对该公司最主要的质疑点:如果智能的秘密真的隐藏在皮层柱之中,为什么过去几十年里,无数神经科学家都没能找到它?

这很大程度上和神经科学的研究范式相关。作为一门典型的解构科学,神经科学更偏重观察、测量和解释。研究者可以记录神经元活动,分析神经连接,绘制脑区地图,但这些成果并不自动等于可运行的算法。就像人们完全理解鸟类翅膀的结构和空气动力学原理,并不意味着能够直接造出飞机一样。知道大脑如何构成,并不等于知道智能如何产生。

在过去二十年里,AI 和神经科学在某种程度上已经走向两条不同道路。神经科学关注的是“智能是什么”,AI 工程关注的是“如何实现智能”。前者追求解释,后者追求结果。Transformer 恰恰是后一种思维的胜利。它并不特别像大脑,却成功解决了大量实际问题。随着 GPT 系列模型不断突破,人们开始越来越少地讨论神经元和脑回路,而越来越多地讨论参数规模、训练数据和推理成本。

目前,Flourish 招募了数十名神经科学家和 AI 研究员共同工作,其中包括 DeepMind 资深研究员 Greg Wayne。团队计划利用电子显微镜、神经回路重建以及连接组学等工具,对大脑不同尺度的数据进行采集和分析,同时由算法团队根据实验结果构建新的模型架构。按照他们的设想,神经科学家负责发现规律,AI 研究员负责验证规律,两者形成不断循环的反馈过程。

还有一个好消息是,相比六十年前皮层柱理论刚被提出时,今天的确出现了一些新的条件。

连接组学的发展使研究者能够以前所未有的精度重建神经回路;大模型和机器学习技术反过来成为分析脑数据的新工具;而过去积累的大量神经科学实验数据,也为算法验证提供了前所未有的基础。Flourish 联合创始人 Joshua Vogelstein 此前参与的研究甚至发现,果蝇神经网络在某些计算效率指标上比 Transformer 高出一个数量级。尽管这种比较仍存在争议,但至少说明生物系统中可能确实存在尚未被工程界充分利用的机制。

不过,即便是支持者也普遍保持谨慎。伯克利计算机科学家 Ben Recht 同时担任 Flourish 顾问。他公开表示,自己并不确定这项计划是否能够成功,但如果成功,人工智能的发展轨迹可能会发生根本变化。

过去几十年里,脑启发 AI 曾经多次成为热门方向,又多次归于沉寂。皮层柱是否真的是大脑的基本计算单元,学界至今仍存在争论;不同脑区之间的结构差异,也让“统一算法”这一假设面临挑战。更现实的问题是,即便发现了某种新的神经计算规律,如何把它转化为能够在硅基芯片上运行的工程系统,仍然是另一项完全不同的挑战。

参考链接:

1.https://www.bloomberg.com/news/articles/2026-04-30/startup-bringing-brains-to-ai-aims-for-2-5-billion-valuation

2.https://www.wired.com/story/jeff-bezos-is-funding-a-wild-hunt-for-the-brains-core-algorithm/

运营/排版:何晨龙

注:封面/首图由 AI 辅助生成

首个AI设计的疫苗打进了人体,它想一次搞定所有冠状病毒

作者张锦怡
2026年6月7日 16:30

一款完全由 AI 设计的冠状病毒疫苗,刚刚完成了人体测试,这是世界首次。

最近,由剑桥大学衍生公司 DIOSynVax 开发的候选疫苗 pEVAC-PS,完成了 I 期临床试验,结果发表在 Journal of Infection 上。实验中,39 名健康志愿者接种后没有出现显著副作用,安全性过关;免疫系统也确实对多种冠状病毒产生了应答,尽管强度还不够理想。但这是历史上第一次,一款完全由 AI 和计算机模拟设计的疫苗在人体中接受检验。

为什么需要 AI 来设计疫苗?

传统疫苗研发存在一个难以破解的老问题:不管是新冠、流感还是埃博拉,现行的疫苗开发基本上是“被病毒带着跑”。从新毒株出现,到研究人员拿到序列,设计抗原,做试验,再量产。整个流程走完前,病毒很可能在中途突然变异,导致前功尽弃。

以新冠病毒为例,在疫情期间,从针对早期原型株的初代疫苗,到频繁更迭的奥密克戎变异株特异性疫苗,研究人员始终在被迫追赶病毒的免疫逃逸速度。流感疫苗的局限性则更为典型:世界卫生组织(WHO)每年需提前数月对当季的主流毒株进行预测。一旦预测毒株与实际流行毒株发生错配,疫苗的保护效力便会显著下降。

DIOSynVax 希望做的,就是把“被动”变成“超前”。他们的做法是收集全球监测网络积累的所有沙贝病毒属(Sarbecovirus)基因组序列数据。沙贝病毒属包括引发 COVID-19 的 SARS-CoV-2、2003 年 SARS 背后的 SARS-CoV-1,以及大量仍在蝙蝠等动物体内循环、尚未传给人但被认为有潜在流行风险的冠状病毒。

图 | 团队成员,由剑桥大学病毒动物学实验室主任乔纳森·希尼(Jonathan Heeney)教授创办(来源:DIOSynVax)

在研发过程中,AI 的主要工作是对这些序列做大规模比对和建模,提取出整个病毒家族的共有抗原特征,然后设计出一个自然界中并不存在的“超级抗原”(super-antigen)。

这个抗原不对应任何一种真实毒株,而是一个“最大公约数”式的合成结构,目标是训练人体免疫系统识别整个沙贝病毒属的共通弱点。这个弱点就是,不管病毒怎么突变、怎么重组,那些保守的核心结构都在。

39 个被试身上发生了什么

目前全球主流的疫苗技术路线主要包括传统的灭活疫苗、重组蛋白疫苗,以及近年来备受瞩目的 mRNA 核心路线。而剑桥团队此次开发的 pEVAC-PS,在架构上则属于 DNA 质粒疫苗(DNA plasmid-based vaccine)。

除了分子设计由 AI 驱动外,这只疫苗的接种方式也很不寻常:它放弃了传统的针头注射,而是采用无针流体射流技术,利用微高压将液体直接推进皮肤组织。这种设计不仅在大规模接种场景下更便于操作、对恐针人群更友好。更重要的是,DNA 架构远比单链 mRNA 稳定,能在常规冷藏甚至常温下长期保存,极大降低了对超低温冷链的依赖。

图 | 递送过程(来源:DIOSynVax)

研究团队同时强调,这一 AI 制造的“超级抗原”本身具有极高的平台兼容性。DNA 质粒只是目前一期临床试验中选用的载体,未来它同样可以被成熟地搭载到 mRNA、病毒载体(如腺病毒)或重组蛋白等其他递送系统中。

本次 I 期临床试验在英国两个临床研究中心完成,分别位于剑桥阿登布鲁克医院(Addenbrookes Hospital)和南安普敦大学医院。受试者为 39 名 18 至 50 岁的健康志愿者,试验采用剂量递增设计。在进入人体试验之前,该疫苗已在动物实验中展示出对多种冠状病毒较强的免疫应答。

从临床一期的结果来看,该疫苗在安全性上表现良好。在免疫原性方面,论文的表述是“modest but variable”:温和,且存在个体差异。

疫苗在志愿者体内激发了针对 SARS-CoV-2 的免疫应答,也产生了对 SARS-CoV-1 以及蝙蝠体内沙贝冠状病毒的交叉反应性结合。这说明,免疫系统确实“看见”了不同冠状病毒之间的共通抗原结构,而不是只认一种特定毒株。但研究者也坦承,这次试验没有观察到“广泛且强健的中和活性”。也就是说,志愿者的抗体能识别多种冠状病毒上的抗原结构,但能否真正阻止病毒侵入细胞、起到实际保护作用,目前还没有确切答案。

而免疫应答偏温和,原因可能跟受试者的既往接种史有关。在后新冠时代,这些志愿者几乎不可能是“免疫空白”状态。此前接种的多种新冠疫苗已经在他们的免疫系统里留下了深刻印记,这种既有免疫记忆很可能干扰了他们对一种全新抗原的反应。这几乎无法避免。

牛津疫苗组(Oxford Vaccine Group)主任安迪·波拉德(Andy Pollard)教授没有参与这项研究,但评价说这一方法在动物实验中已经产生了令人信服的证据,而人体数据也颇有看点。不过他也提醒,人类免疫系统经过多年感染和疫苗接种的塑造,和实验室小鼠差异很大,后续更大规模的人体试验才是真正的考验。

下一步:跳出冠状病毒,瞄准更多“大毒王”

值得期待的是,冠状病毒只是 DIOSynVax 的第一个战场。如果超级抗原的设计理念确实成立,那它在逻辑上可以复制到其他高威胁病毒家族身上。剑桥团队已经在同步推进好几个方向,每一个都对应着一个让全球公共卫生体系头疼的老对手。

首先是流感病毒。目前,世界卫生组织(WHO)每年需提前数月预测下一季的流行毒株,全球厂商再据此调整配方并投入生产。然而,流感病毒的变异高度频繁,其表面两大关键抗原:血凝素(HA)和神经氨酸酶(NA)常发生抗原漂移(antigenic drift),甚至通过基因重配引发抗原转换(antigenic shift),很容易催生出全新的亚型(如历史上导致大流行的 H1N1 毒株)。加大研发的难度。

一旦预测毒株与真实流行株发生季节性错配,传统疫苗的保护效力便会显著下降。DIOSynVax 正在推进的通用季节性流感疫苗项目,其核心正是利用 AI 筛选流感病毒家族中跨亚型的保守结构,从而设计出兼顾多种毒株的超级抗原,试图打破每年更换配方的被动循环。公开信息显示,该流感候选疫苗目前处于动物实验阶段。

还有更紧迫的 H5N1 禽流感。这种高致病性禽流感病毒正在全球禽类和哺乳动物种群中大规模流行。虽然目前 H5N1 尚未获得高效人传人的能力,但病毒学家们对此高度警惕。一旦它通过突变或重配获得在人际间高效传播的能力,后果可能极为严重。H5N1 感染人类后的病死率在历史数据中超过 50%(据 WHO 统计),远高于季节性流感。

另一个让研究者投入精力的方向是病毒性出血热(Viral Haemorrhagic Fevers, VHF),其中最受关注的就是埃博拉。埃博拉病毒属(Ebolavirus)包含六个已知种,其中致死率最高、研究最多的是扎伊尔型埃博拉病毒(Zaire ebolavirus),2014 年至 2016 年的西非大暴发就是它引起的。

图 | 埃博拉病毒(来源:Britannica)

目前 WHO 推荐使用的埃博拉疫苗,是默沙东的 rVSV-ZEBOV(商品名 Ervebo)。正是针对扎伊尔型设计的,在实战中效果不错。但问题在于,埃博拉病毒属里不只有扎伊尔型。

例如眼下刚果民主共和国和乌干达正在经历的疫情,致病的是另一个种属,现有疫苗对它的保护力很有限甚至没有覆盖。对此,DIOSynVax 的思路是用 AI 从整个埃博拉病毒属的遗传数据中提取保守特征,设计出能覆盖多个种属的广谱抗原。如果这条路走通,像当前刚果疫情中的窘境,理论上是可以提前化解的。

当然,这些方向目前都还处于较早期的阶段,距离人体试验尚有距离。但冠状病毒方向的 I 期数据至少给整个平台提供了一个初步的人体安全性背书,这对推进其他管线的临床前研究和未来的监管申报都有参考价值。

值得一提的是,DIOSynVax 不是唯一一个把 AI 推进到疫苗研发核心环节的团队。2024 年,美国生物技术公司 Nuvec 和英国初创公司 Baseimmune 已经开始用机器学习优化抗原设计;疫苗巨头 Moderna 则早已将 AI 深度嵌入其 mRNA 平台的序列优化和脂质纳米颗粒设计流程中。但这些尝试大多还停留在用 AI“辅助”:加速筛选、优化已有方案。

DIOSynVax 这次的不同之处在于,抗原本身就是 AI 从头设计的产物,自然界里找不到对应物。这等于把 AI 从工具推到了发明者的位置上。这条路能走多远,还需观望接下来的 II 期数据。

1. https://www.bbc.com/news/articles/crrpggegwe0o

2.https://pharmaphorum.com/news/first-human-trial-backs-ai-designed-universal-vaccine

当AI开始造AI,Anthropic呼吁紧急刹车,但真的能停下来吗?

作者张锦怡
2026年6月5日 19:30

今天凌晨,Anthropic 在官方博客发布了一篇长文,标题名为《When AI Builds Itself》(当 AI 开始建造自己)。目前浏览量已接近 700 万。

文章由公司联合创始人 Jack Clark 与内部研究机构 The Anthropic Institute 负责人 Marina Favaro 共同署名。核心观点可以用一句话概括:AI 正加速参与到自身的开发进程当中。如果这个趋势走到极端,AI 将能够在没有人类介入的情况下,自主设计、测试并训练出更强大的下一代 AI。基于这一判断,Anthropic 呼吁全球主要 AI 实验室考虑暂停 AI 开发,或者至少建立一套可以互相核查的减速机制。

(来源:X)

这番表态之所以格外引人关注,不仅因为内容,也因为说这番话的是 Anthropic。

就在文章发布前几天,Anthropic 刚刚完成最新一轮融资,估值达到 9,650 亿美元,正式超过 OpenAI。同一周,公司向美国证券交易委员会秘密递交了 S-1 注册声明草案,启动 IPO 筹备流程。Anthropic 的年化营收正快速攀升,从 2025 年底的约 90 亿美元增长到当前的接近 470 亿美元,预计本月底将突破 500 亿美元。在公司即将冲击公开市场、商业势能最强的时候,却发出“请考虑减速”的信号,很难让人不疑惑其动机。

不过在讨论动机之前,不能否认的是,这篇文章确实拿出了实打实的内部数据。而这些数据之所以重要,是因为它们指向了一个越来越明确的趋势:AI 研发自动化。

AI 研发自动化正在成为行业共识

Anthropic 的文章主要围绕一个概念展开——“递归自我改进”(Recursive Self-Improvement,简称 RSI),指的是 AI 系统自主完成设计、测试、训练下一代 AI 的完整流程,人类不再扮演关键角色。这个概念并不新鲜,但过去一年里,它正从理论走向现实。几乎所有头部 AI 公司都在往这个方向投入资源。

以 OpenAI 为例,这家公司已经将“AI 参与 AI 研发”列入重点关注事项。其安全团队专门设立了“Recursive Self-Improvement Preparedness(递归自我改进准备)”相关岗位,用于研究当 AI 能够显著加速自身研发时可能带来的能力跃迁与风险。OpenAI 此前公开透露,其内部目标是在 2026 年前后打造达到“研究实习生”水平的 AI 系统,并在 2028 年实现能够独立承担研究任务的自动化 AI 研究员。

Google DeepMind 走的是一条更偏算法发现的路线。它的 AlphaEvolve 项目让 AI 自主提出算法方案、运行实验、筛选结果,再将优秀方案反馈回系统继续迭代。这套系统已经被用于数据中心调度优化和 AI 训练效率提升等实际场景,据报道还找到了 56 年来首个对 Strassen 矩阵乘法算法的改进。从某种意义上说,这也是 DeepMind 对“奇点”判断的重要依据之一:当 AI 开始参与甚至推动新的科学发现和算法创新时,技术进步将进入加速循环。

头部公司之外,越来越多创业公司也开始围绕“自动化 AI 研发”布局。例如近期获得大额融资的 Recursive Superintelligence,以及将“构建擅长 AI 研发的系统”写入公司使命的 Mirendil,都是这一趋势的代表。虽然技术路径各不相同,但它们瞄准的是同一个目标:让 AI 从研发工具变成研发过程的参与者,并最终承担越来越多的研发工作。

图 | Recursive Superintelligence 创始成员(来源:X)

正是在这个背景下,Anthropic 发布了这篇长文。它的立场是:RSI 还没有发生,也不一定会发生,但它到来的速度“可能比大多数机构准备好的时间更快”。

AI 已经在多大程度上接管了 AI 研发?

在文章中,它用三组此前未公开的内部数据支撑了这个判断。

第一组数据是关于 AI 的代码能力。截至 2026 年 5 月,Anthropic 合并到生产代码库中的代码有超过 80% 由 Claude 编写。2025 年 2 月 Claude Code 上线之前,这个比例还是个位数。与之对应,2026 年第二季度工程师人均每天合并的代码量达到 2024 年的 8 倍。文章专门补充说明:代码行数衡量的是数量而非质量,8 倍很可能高估了真实的生产力提升。但趋势是明晰的:工程师的角色正在从“写代码”转向“指引方向和审查结果”。

(来源:Anthropic)

而且 Claude 写的代码质量还在快速提升。Anthropic 内部跟踪了工程师在 Claude Code 工作过程中需要纠正或中途接管的频率,这个频率在过去一年持续下降。到 2026 年 5 月,Claude 处理最高难度开放式任务的成功率达到 76%,六个月内上升了 50 个百分点。

第二组数据涉及了 AI 的科研能力。Anthropic 有一个内部基准测试:给 Claude 一段训练小型 AI 模型的 CPU 代码,要求它在不改变正确性的前提下尽可能提速。2025 年 5 月,Claude Opus4 的平均加速比约为 3 倍;到 2026 年 4 月,Claude Mythos Preview 达到了约 52 倍。

作为参照,一名熟练的人类研究员通常需要四到八小时才能达到约 4 倍加速。Anthropic 提醒,绝对倍数受起始代码优化空间的影响,不应直接解读为真实世界的训练加速,但在同一测试条件下,一年内从 3 倍到 52 倍的变化,这个结果值得重视。

第三组数据来自工程实践。2026 年 4 月,Claude 自主修复了超过 800 个 API 错误,将该类错误的发生率降低了约 1,000 倍。负责的工程师估计,同样的工作让人来做大概需要四年。因为修复别人写的 Bug 实在是一个漫长而痛苦的过程,人类也很难同时记下那么多不熟悉的代码上下文,可这类任务恰恰是 AI 的优势所在。

文章还公布了一个颇有意思的实验。2026 年 4 月,研究人员将多个 Claude 智能体交给一个 AI 安全领域的开放问题:弱模型能否可靠地监督强模型?智能体自行提出假设、设计实验、运行测试,在并行智能体之间共享发现并迭代。两位人类研究员花了一周时间,弥补了该任务性能上下限之间约 23% 的差距;Claude 智能体累计运行 800 小时后,弥补了 97% 的差距。

更值得注意的是,AI 提升的不只是执行能力,连“下一步该做什么”的判断能力也在同步增强。Anthropic 内部的一项回溯评测显示,当研究人员在项目推进过程中走入错误方向时,Claude 越来越能够提出更优的替代方案。最新模型 Claude Mythos Preview 给出的研究路径,有 64% 的概率被评审认为优于人类研究者当时的实际选择。这意味着 AI 开始不仅能帮助研究者完成工作,也正在越来越多地参与研究方向本身的选择。

(来源:Anthropic)

这些数据拼在一起,指向的是同一个大的趋势:AI 正在接管越来越多原本由研究人员亲自完成的工作。写代码、调试系统、运行实验、分析结果,这些过去占据大量时间的研发环节,正越来越多地由 AI 完成。人类的角色则逐渐从执行者转向监督者和决策者。

正因为如此,此前 Jack Clark 对递归自我改进的时间表判断相当激进。他在 2026 年 5 月的 newsletter 中估计,到 2028 年底出现完全自动化 AI 研发的概率约为 60%,到 2027 年底约为 30%。

如果 Clark 的判断成立,那么问题很快就会从“RSI 是否可能出现”变成“当它真的出现时怎么办”。因此,Anthropic 这篇文章真正想讨论的,其实不只是技术,还有技术发展过快之后的治理问题。

在文章中,Anthropic 提出了三种可能的未来:第一种是 AI 能力增长逐渐放缓,但现有能力已经足以广泛扩散;第二种是 AI 继续带来复合型效率提升,人类仍负责设定研究方向,但越来越多执行环节被自动化;第三种,也是最激进的一种,是 AI 系统真正具备完整的递归自我改进能力,开始自主构建下一代模型。Anthropic 最担心的是后两种情形,因为它们留给社会、政府和安全研究的准备时间都非常有限。

在文章最后,Anthropic 将问题的答案落到“减速”与“核查”上。它认为,如果能有效放慢前沿 AI 开发,让社会制度和对齐研究跟上技术进展,这很可能是一件好事。但单方面暂停意义有限,因为它只会改变谁是领先者,并不会让整个行业获得真正的讨论时间。真正有用的暂停,必须是多国、多家前沿实验室在相同条件下共同减速,并且能够彼此验证对方确实停了下来。

呼吁暂停的人,未必能停下

但回到开头的问题,作为一家势头正猛且即将上市的公司,Anthropic 呼吁停止 AI 开发的动机真的如此纯粹吗?

公开讨论前沿 AI 的潜在风险,确实是 Anthropic 的一贯作风。从成立至今,这家公司确实已经多次发布关于模型能力、安全治理和监管框架的研究与政策文件。只不过这一次,它讨论的对象从 AGI 进一步推进到了 RSI。

联创 Clark 在接受 Axios 采访时解释说:“我们一直发现,最好的做法是让大家理解这个概念,让人们了解即将发生什么。”他说文章背后的核心判断是,“与一些流行观点相反,AI 进步在未来几年将会加速,保持不变或放缓的可能性不大。”他还表示,Anthropic 希望立法者在真正频繁听到“递归自我改进”之前,就提前了解这个话题。

但这个解释显然无法消除所有质疑。

风险投资人 David Sacks,他同时也是特朗普的重要科技顾问。近期就在播客中公开批评 Anthropic。他认为,所谓全球核查机制听上去是在防范风险,但实际效果很可能是抬高行业门槛。按照他的逻辑,能够满足审查、合规和安全要求的,往往是 Anthropic、OpenAI、Google 等拥有雄厚资金和算力的大公司;而开源模型天然分散在全球各地运行,很难被统一监管。最终的结果,可能不是让 AI 更安全,而是让少数头部公司获得更大的优势。

此前,类似的质疑也出现在产品层面。例如在推出网络安全模型 Mythos 时,Anthropic 对模型访问权限进行了严格限制,理由是其能力过于强大,可能被用于攻击关键基础设施。支持者认为这是负责任的安全措施,但批评者则质疑,公司是否在有意强化“危险但先进”的形象,以突出自身技术领先地位。

沃顿商学院教授 Ethan Mollick 对这些矛盾的态度给出了自己的解释。他认为,Anthropic 内部实际上同时存在多种力量。一部分人像其他科技公司一样负责商业化、市场和法律事务;一部分研究人员专注于打造更强大的下一代模型;还有一部分人则真正关心 AI 长期可能带来的社会影响与风险。在 Mollick 看来,这些群体并不总是立场一致。Anthropic 之所以经常呈现出一边加速推进模型能力、一边公开讨论潜在风险的矛盾形象,很大程度上正是这种内部张力的结果。

但还有一个更现实的问题:即便所有人都相信风险存在,真的有人能停下来吗?当所有参与者都处于激烈竞争的环境里,“谁在别人暂停时继续跑,谁就可能继承领先地位”。

文章最后提出的方案是,Anthropic 将在未来数月组织政策制定者、研究人员以及其他 AI 公司参与讨论,探索构建一套可核查的暂停机制。按照设想,多个国家的多个前沿实验室需要在相同条件下同时停止开发,并且每一方都能验证其他参与者确实停了下来。如果这样的机制存在,Anthropic 表示自己“预计会减速或暂停”。

“如果”二字,看似轻松,却承载了巨大的重量。历史上,无论是核军控还是其他国际技术治理体系,都花费了数十年时间才建立起核查机制、执行能力和跨国信任。而 AI 的扩散速度远快于这些先例,“如果”真正要让整个行业一起踩下刹车,可能比实现 RSI 还要困难。

参考链接:

1.https://www.anthropic.com/institute/recursive-self-improvement

2.https://the-decoder.com/anthropic-co-founder-maps-out-how-recursive-ai-improvement-could-outpace-the-humans-meant-to-supervise-it/

3.https://www.axios.com/2026/06/04/anthropic-warns-ai-build-successors

4.https://www.wsj.com/tech/ai/anthropic-urges-global-pause-in-ai-development-flags-self-improvement-risk-99cefb73?mod=tech_lead_story

运营/排版:何晨龙

注:封面/首图由 AI 辅助生成

❌