普通视图

Received today — 2026年4月26日

《麻省理工科技评论》年度AI洞察:10个关键词理解正在发生的AI趋势

2026年4月23日 22:47
(来源:麻省理工科技评论)

在嘈杂喧嚣的 AI 世界里,什么才是真正值得关注的?《麻省理工科技评论》的记者和编辑花了多年时间思考这个问题,追踪 AI 的进展,描绘下一步走向。现在,我们第一次把答案浓缩成了一份清单。

受我们每年评选的“十大突破性技术”启发,这是一份全新的盘点:那些正在推动进步或改变权力格局的 AI 大趋势、大方向和新突破——它们定义着今天,也将塑造明天的可能性。

人形机器人数据

Humanoid Data

就像我们说的话和写的字变成了大语言模型的训练数据一样,人类运动的视频如今也在被大规模收集,用来训练人形机器人。

这股风潮始于一个简单的类比:ChatGPT 靠海量文本学会了生成语言,那人形机器人能不能靠海量运动数据学会在真实世界里干活?问题在于,描述人类运动方式的数据集远不像互联网文本那样现成。虚拟仿真曾经是替代方案,但仿真永远无法完美还原真实世界的物理特性,训练出来的机器人一到现实中就容易摔跤。

于是企业决定走笨办法:直接收集真实世界的数据。世界各地出现了大型训练中心,工人穿着外骨骼一天擦几百次桌子;尼日利亚和印度的零工把手机绑在头上,在家拍自己做家务;美国的快递公司给员工装上传感器记录搬箱子的动作,一边研究工伤,一边为未来可能取代他们的机器人积累训练数据。

2025 年,仅人形机器人领域就吸引了 61 亿美元投资。但一段我打开微波炉的视频到底值多少钱?要多少个这样的片段才能教会一个机器人做晚饭?没有人知道这条路能不能走通。

更强大的大语言模型

LLMs+

ChatGPT 之后,下一个大事件是什么?答案可能让人意外:还是大语言模型——只不过更强、更高效、更能独立干活。

当前 LLM 的核心瓶颈在于:它们擅长回答一个问题,但让它们连续工作几天、独立攻克一个复杂的多步骤任务,就很容易跑偏或遗忘。要从“聊天助手”进化成“AI 劳动力”,LLM 需要在三个方向上突破。

第一是效率。混合专家模型(MoE)把一个大模型拆成多个小模块,每次只启动需要的那部分,大幅降低算力消耗。扩散模型和 DeepSeek 提出的“文本转图像编码”等实验性方案也在探索更便宜的计算路径。

第二是工作记忆。两年前 LLM 一次只能处理几十页文本,现在最新模型的上下文窗口已经扩展到了 100 万个 token,相当于一整摞书。但窗口越大,模型越容易在长任务中迷路。MIT CSAIL 提出的“递归 LLM”提供了一种新思路:把输入拆成小块分发给自己的多个副本,各自处理再汇总,在长任务上的可靠性远高于传统方案。

第三是成本。部署 LLM 的费用正在急速下降,一些模型的服务成本按年化计算已经降了几百倍。

LLM 没有过时,它正在脱胎换骨。

AI 诈骗

Supercharged Scams

ChatGPT 让所有人看到了生成式 AI 的威力,犯罪分子也不例外。自 2022 年以来,网络犯罪者迅速把 AI 工具整合进了自己的作业流程:用 LLM 写钓鱼邮件、用深伪技术制作以假乱真的视频、用 AI 自动扫描系统漏洞、让恶意软件变得更难检测……AI 没有从根本上改变黑客攻击的本质,但它大幅降低了入行门槛,让攻击变得更快、更便宜、更容易规模化。

这种趋势已经在全球显现。国际刑警组织警告说,东南亚的诈骗中心正在用廉价 AI 工具提速扩量;阿联酋声称挫败了一系列由 AI 辅助的攻击;Anthropic 则透露,其正在测试的模型 Mythos 在所有主流操作系统和浏览器中都发现了严重漏洞,公司因此推迟了模型发布,并联合多家科技公司成立了名为 Project Glasswing 的防御联盟。

攻击在变强,防御也在跟进。仅微软一家,每天就要用 AI 系统处理超过 100 万亿个可疑信号,一年内拦截了价值 40 亿美元的诈骗和欺诈交易。让攻击成为可能的同一种技术,也可能是未来防御的最大依仗。

眼下,基本的安全措施仍然能挡住大部分粗糙的 AI 辅助攻击。但随着公开可用的生成式 AI 能力不断增强,未来面对更精密的攻击时我们能否守住,还远没有答案。

世界模型

World Models

AI 在数字世界里已经很厉害了,但物理世界仍然是人类的地盘。写小说、写代码远比叠衣服、上街导航容易得多。许多研究者认为,要跨过这道坎,需要一种叫做“世界模型”的技术。

世界模型的核心理念是:让 AI 像人类一样在脑子里构建一个外部世界的模型,用它来预测行动的后果,再据此做决定。你知道把杯子推下桌子会摔碎,是因为你的大脑里有一个够用的物理模型。AI 目前还没有这个东西。LLM 看似能回答“杯子推下桌会怎样”,但研究表明这种“理解”很脆弱,稍微换个条件就彻底失灵。

这个方向最近突然热了起来。谷歌 DeepMind 和斯坦福教授李飞飞创办的 World Labs 都在积极推进,杨立昆从 Meta 离职创办了专注世界模型的初创公司,OpenAI 也把关闭 Sora 视频应用后释放的资源转投到了“长期世界模拟研究”上。

目前的应用还比较初级。谷歌 DeepMind 和 World Labs 在做的事情是根据文本、图像或视频生成可交互的 3D 虚拟环境,可以用在游戏设计和 VR 体验中。《宝可梦 Go》的开发商则在用玩家收集的数十亿张图片构建世界模型的雏形,目标是引导配送机器人。

真正的突破可能要等到世界模型被整合进灵活的智能体,既能理解环境,又能预判后果,还能自己做决定。到那一步,机器人才有可能真正走进物理世界。

战争中的 AI 指挥

The New War Room

把伊朗冲突称为第一场“AI 战争”并不准确。从阿富汗到乌克兰再到以色列,算法帮军方做分析、识别目标已经有好多年了。真正新的东西是:指挥官们开始向基于大语言模型的对话式 AI 寻求行动建议,而不只是让它帮忙分析情报。

过去十年,Maven 等 AI 系统干的是初级分析师的活,从海量监控画面和卫星图像中挑出有价值的信号。现在大语言模型让这些系统变得更具交互性:军方人员可以把一份潜在目标清单丢给聊天机器人,让它建议先打哪一个。Anthropic 的 Claude 已经深度嵌入美军作战流程,以至于五角大楼说要花六个月才能替换掉它。

问题是显而易见的。用过生成式 AI 的人都知道,同一个提示词每次跑出来的结果不一样,建议未必准确。正常情况下用户应该逐条核查,但在“五分钟内决定打哪个目标”的压力下,核查很可能被省略。军事专家还警告说,指挥官可能过度信赖 AI 把复杂战场压缩成一块整洁仪表盘后呈现的画面,而科技公司也可能借此对军方决策产生不当影响。

与此同时,五角大楼正计划让 AI 公司用机密军事数据训练新模型,这将带来全新的安全风险,也让硅谷与五角大楼的距离前所未有地近。

算法自动化军事中的苦差事已经有很长一段时间了,但现在生成式 AI 在作战室里有了自己的席位,指挥官们开始认真对待它的建议。它正在重塑军方共享情报、与大型科技公司合作以及做出致命决策的方式。

被武器化的“深度伪造”

Weaponized Deepfake

随着生成式 AI 的进步和工具的普及,伪造图像、视频与音频的门槛大幅降低,普通人也能制造高度逼真的虚假内容。这些内容已被广泛用于色情制作、诈骗和政治操控,不仅伤害个体,也在更深层次侵蚀社会信任。

其中,女性与边缘群体承受的影响尤为严重,大量深度伪造内容带有性剥削性质。与此同时,政治领域的滥用也在加剧,一些 AI 生成的图像和视频被用于影响公众认知,甚至误导选民。

尽管业界提出了技术防护、用户自我保护和立法监管等解决方案,但都存在明显局限:技术可以被绕过,行为难以改变,监管执行也充满不确定性。随着美国中期选举临近,而相关监管与研究力量却在削弱,深度伪造可能进一步加剧信息混乱。

当真假难辨成为常态,人们失去的或许不只是判断力,而是对现实本身的信任。

多智能体协作

Agent Orchestration

当前,生成式智能体(Generative Agent)正在摆脱只能“聊天”的功能边界,走向任务的自主执行。在此基础上,多智能体系统通过角色分工与动态调度,可协同完成编程、调研、流程管理等复杂任务,让个体工作者具备团队级产出能力。从代码协作到科研辅助,这类工具试图将知识工作模块化、流水线化,重构白领岗位的价值链条。

效率提升的背后是控制力的让渡。当智能体开始操作真实系统、调用敏感数据,模型幻觉、目标错位或提示词注入都可能引发难以追溯的连锁错误。而当前评估标准、审计机制与应急方案普遍缺位,技术落地跑在了安全基建前面。

更深层的拷问在于:当我们习惯将决策链条交给自主代理,人类是变得更高效,还是逐渐丧失对过程的理解与干预能力?信任不该是黑箱的副产品,而需建立在可解释、可回退、可问责的基础之上。

中国的开源押注

China’s Open-source Bet

中国 AI 实验室正以“开源”为杠杆,影响全球的开发者生态。不同于硅谷将核心模型封装收费,DeepSeek、阿里巴巴的千问、月之暗面的 Kimi 等机构选择直接释放模型权重,允许任何人下载、微调、本地部署。这一策略迅速赢得预算有限、追求灵活性的开发者青睐。去年中国开源模型下载量首次超越美国,阿里系模型的社区衍生版本数量已超过谷歌与 Meta 之和。

开源对于中国来说不仅是技术共享,更是地缘博弈下的务实路径:在高端芯片受限的背景下,借助全球开发者的反馈与贡献,反而能加速模型迭代。

当然,开放也伴随着压力。关于模型内容合规约束、能力蒸馏争议依然存在。但当越来越多产品建立在中国开源底座之上,AI 技术的权力结构已悄然重构:多极化不是预测,而是正在发生的现实。

人工智能科学家

Artificial Scientist

当“自主探索”成为可能,AI 在科研中的角色正悄然转变。如今的大模型已能检索文献、撰写论文、生成代码,而下一步的目标更加清晰:打造能独立提出假设、设计实验、解读结果的“人工智能科学家”。

2024 年,DeepMind 凭借 AlphaFold 斩获诺贝尔奖,点燃了新一轮竞争。随后,OpenAI 发布 GPT-Rosalind,Anthropic 深耕生物领域,谷歌推出多智能体协作工具——由不同角色分工配合,共同推进研究流程。

突破不止于代码。为弥补 AI“无法动手”的局限,研究者开始将其接入自动化实验室:OpenAI 与 Ginkgo Bioworks 合作,让 AI 自主迭代实验方案,成功将某种蛋白的合成成本降低 40%。

但效率提升的同时,隐忧也随之浮现。Nature 的一项研究提醒,当科研过度依赖 AI 分析既有数据,探索方向可能偏向“易建模、数据足”的领域,而那些冷门却关键的问题,反而容易被忽视。技术可以加速发现,但科学应有的广度与多元,终究需要人类主动守护。

人工智能抵制浪潮

Resistance

一股对人工智能的质疑浪潮,正在全球悄然蔓延。人们担忧的不再是遥远的科幻场景,而是眼前的现实:数据中心推高了电费,工作岗位被悄然替代,聊天机器人影响青少年心智,军事应用缺乏边界,创作成果被无偿调用。

抗议行动随之浮现。伦敦街头出现示威人群,美国不同立场的群体罕见联合,签署宣言呼吁“技术应服务于人”;部分用户因军方合作卸载常用工具,家长联名要求校园暂缓引入聊天机器人。民意调查显示,多数公众对 AI 的快速渗透持保留态度。

这些声音已开始影响政策走向:纽约、加州为陪伴型机器人设立规则,英国在艺术家反对下撤回版权豁免提案,多地社区成功延缓数据中心建设。技术演进的速度从未放慢,但越来越多的人希望,在塑造未来的过程中,普通人的关切也能被认真倾听。

原文链接:

https://www.technologyreview.com/2026/04/21/1135643/10-ai-artificial-intelligence-trends-technologies-research-2026/

外国科学家从汉字中找到了设计超强材料的灵感!“天”字形材料最坚固

2026年4月22日 22:16

折纸艺术曾启发工程师设计出可折叠的航天结构,伊斯兰几何图案曾为材料学家提供抗振骨架的灵感。凡是人类文化中出现过的几何形式,似乎都有可能成为新一代功能材料的结构源泉。但你是否想过,中华文明书写了数千年的文字,其形状也会成为高性能材料的设计蓝图?

4 月 21 日,爱丁堡大学(The University of Edinburgh)的研究人员在《应用物理学杂志》(Journal of Applied Physics)上发表了一篇颇为新颖的论文,他们将汉字“人”“大”“天”“夫”的字形转化为超材料的结构单元,并通过压缩实验探究其机械性能,最终发现,汉字中特有的弧线、横撇和方形框架中,蕴藏着可以为工程材料设计所用的力学规律。

(来源:Journal of Applied Physics)

机械超材料的底层逻辑:当“几何结构”决定物质命运

了解这项研究之前,我们有必要先知道“机械超材料”(Mechanical Metamaterials)这一概念。“超材料”一词源自希腊语,意指“超越物质本身”,它描述的是一类性能主要由其几何排列结构决定、而非单纯由化学组成决定的人工材料。

传统材料的力学特性,如强度、刚度、韧性,很大程度上取决于其原子组成和化学键合方式。超材料的设计逻辑则截然不同:通过在微观或介观尺度上对结构单元进行精心的几何设计并阵列化,工程师可以赋予材料自然界罕见的物理特性。例如,横向拉伸时不收缩反而膨胀的负泊松比(Auxetic)效应、超轻却拥有极高比强度的多孔结构等。

这种“结构即性能”的设计哲学,使得超材料的研究空间极为广阔。研究者们的核心任务之一便是寻找并探索新的几何形式,看看哪些形状和结构能带来工程师所需要的特殊力学行为。

藏在文化图腾里的力学密码

在这项爱丁堡大学的最新研究之前,从人类文化遗产中提取结构灵感的尝试已有先例。折纸艺术就是其中最广为人知的例子。日本折纸的几何折叠原理,尤其是“三浦折叠”(Miura-ori),因其特殊的机械双稳态效应,已被广泛应用于可重构超材料的设计,出现在航天展开结构、柔性电子器件以及软体机器人等场景中。

图 | 三浦折叠折痕图案和折叠形式。(来源:DOI:10.1109/OJAP.2021.3121102)

此外,来自伊朗卡拉甘双子陵塔(Kharraqan twin towers)的砖砌几何纹样,也曾被研究人员转化为双稳态辅助(auxetic)超材料的设计原型。事实上,早在工程师开始系统研究之前,古代工匠就已经将某些具有优良力学性质的几何排列应用于建筑装饰之中,让今天的人们依然能够从这些漫长实践智慧的积淀中寻找灵感。

为何选择汉字?论文的通讯作者、爱丁堡大学工程学院的帕尔维兹·阿拉姆(Parvez Alam)副教授解释道:“某些汉字具有强烈而独特的几何特征,从直觉上就‘感觉’到,它们有潜力展现出独特的力学性质和行为。”

从字形分析的角度来看,汉字具备几个在超材料设计中颇具价值的结构特质。

图 | 伊朗卡拉甘双子陵塔的几何纹样(来源:维基百科)

首先是曲线与弧度。 许多汉字的笔画含有弯曲成分,而曲线在力学结构中往往意味着特殊的柔韧性和能量分散路径。与直线笔画相比,曲线笔画会以不同方式响应外力,影响材料的整体刚度与变形模式。

其次,大量汉字还包含水平方向的笔画,这类结构在工程上相当于贯穿整体的“横梁”,可以有效地将集中载荷分散至周围结构。

图 | 帕尔维兹·阿拉姆(Parvez Alam)(来源:爱丁堡大学工程学院)

初学汉字时,我们需要在田字格、米字格中反复练习,这正是因为汉字是典型的方块字,笔画被约束在离散的方格内,这意味着它们天然适合被转化为周期性超材料的基础网格单元。每个字都能整齐地填充一个方格,再通过重复排列,形成具有规则周期性的结构阵列。

把汉字放进压缩机,“天”字结构为何脱颖而出?

为了便于系统性对比,研究团队挑选了四个笔画简单且在结构上具有演进关系的汉字:“人”“大”“天”“夫”。

其中,“人”字形如一个向下张开的倒置“V”形,两笔撇捺从顶端向下方向外延展,构成一个锥形发散结构;“大”字在“人”字的基础上增加一横,将两条发散的笔画从中部横向连接;“天”字则在“大”字的顶部再增加一横,形成顶部也有横向连接的三层结构。最后的“夫”字与“天”字类似,但顶部横画稍短,且整体布局略有偏移,不与上方完全平齐。

研究团队通过增材制造(3D 打印)技术,将这些字形的对称单元制作成阵列超材料,并通过施加重载压缩,以经典的六边形蜂窝结构作为参照,系统测试其力学性能。

结果显示,这些“汉字材料”展现出了截然不同的压缩与变形规律。其中,由“人”字构成的超材料在受压时最先发生变形。研究指出,构件的曲率和倾斜角度是控制材料刚度与柔性的关键变量。

细而发散的构件更容易发生弯曲主导的变形,赋予材料较高的柔韧性;而较粗或更加垂直取向的构件则更能抵抗压缩,倾向于拉伸主导变形,提供更高的初始刚度。因此,像“人”字这样撇捺细长、向外发散且带有弧度的构件,在受力时往往会最先弯曲。

实验还发现,含有水平笔画的字形在压缩时表现出更强的稳定性。“大”字和“天”字中的横起到了交叉横梁的作用,使其在压缩时表现出更强的荷载分散能力,力不仅沿竖向传导,还通过横画被横向分散至相邻的结构单元,从而增强材料的稳定性,延缓了材料结构的整体坍塌失效。

横梁系统是提升结构整体稳定性的常用手段,而在汉字超材料中,横画数量的增加与材料抵抗失效能力的提升与经典结构工程原理高度吻合。

图 | 汉字超材料阵列与蜂窝阵列的压缩破坏对比(来源:https://doi.org/10.1063/5.0304459)

这项研究中最重大的发现,是“天”字型超材料展现出了压倒性的性能优势。数据显示,“天”字结构的模量和强度显著高于其他汉字设计,也超越了传统的六边形对照组。它不仅拥有最高的比强度和比刚度,甚至达到了高性能金属或刚性塑料泡沫的水平。

更深层的力学机制在于变形模式的转变。论文指出,大多数汉字结构在受力时表现出“弯曲主导”的强度特征,即结构容易发生屈曲,较为柔韧。而“天”字结构却展现出了罕见的“拉伸/压缩主导”强度。研究者推断,这是因为“天”字特有的双层横向支柱产生了相互作用,极大地抵抗了受载后的结构侧向位移。

此外,“夫”字与“天”字虽然相似,但由于顶部横画较短且有偏移,其力学表现就大相径庭。这也证实,超材料的性能对对称性等几何细节极其敏感。只做微小的参数调整,就会显著改变材料的变形模式与整体力学表现。

用工程学的视野重审人类文明结晶

这项研究从汉字超材料本身出发,揭示了一个极具启发性的设计方法论:几乎任何具有几何规律性的人类文化符号,都可能成为有效的超材料结构单元候选。

在数千个常用汉字中,“人、大、天、夫”只是沧海一粟。帕尔维兹强调,这只是“从众多潜在字符中提取的一滴水”。未来,孟加拉语字母、阿拉伯书法、印度梵文等其他人类书写符号,甚至各类装饰艺术中的几何图形,都有可能成为力学超材料的灵感源泉。

文字符号不只是语言的载体,也是特定文化对几何形式长期审美与实践选择的结晶。它们在漫长的历史演变中,经受了书写效率、视觉平衡的筛选,这些经过漫长时间检验的形式,或许在某种意义上也经历了一种非显式的"结构优化"。

从汉字实验中提炼出的规律,未来可直接应用于航空航天(轻质高强可编程材料)、生物医学(可控柔性植入物)以及防撞能量吸收系统等前沿工程领域。

值得注意的是,这项研究目前选取的四个汉字字形简单且相互关联,这在研究设计上便于变量控制与系统比较,但也意味着研究尚处于探索性阶段。

但阿拉姆在接受采访时特别强调了这项研究的跨学科意义。他表示,符号形式的运用“不仅在工程设计中有其价值,还应当激发另一种类型的学习兴趣”,并希望借此推动工程学、材料科学与历史学、文化研究之间更深入的交叉合作。

一篇从汉字中提炼力学规律的论文,出现在严肃的物理学期刊《应用物理学杂志》上,本身就是一件颇具象征意味的事情。它提醒我们,科学与文化从来不是两个相互隔绝的世界:前者追求普遍规律,后者积淀人类经验。最具创造力的结构灵感,或许正来自对人类已有知识体系的重新审视。

参考资料:

https://publishing.aip.org/publications/latest-content/what-can-chinese-characters-tell-us-about-designing-strong-materials/https://pubs.aip.org/aip/jap/article/139/15/155102/3387398/Mechanical-metamaterials-built-from-Chinese

运营/排版:何晨龙

❌