阅读视图

SpaceX 上市首日大涨 19.22%,马斯克成首个万亿美元富豪;世界第一网红订阅总人数突破 5 亿;Kimi 发布并开源 K2.7

SpaceX 股票收于 160.95 美元,创纪录 IPO 首日上涨 19.22%,市值突破 2 万亿美元

美股周五常规交易时段已经结束,截至收盘,SpaceX 股价上涨 25.95 美元,涨幅为 19.22%,收于 160.95 美元,公司市值达到 21045.6 亿美元。在有史以来最大规模的首次公开募股之后,SpaceX 于周五以每股 150 美元的价格开始交易,股票代码为 SPCX。

马斯克在 IPO 前的一场摩根大通直播活动中表示,SpaceX 自 2015 年左右以来已实现现金流为正。他表示,现在希望让 SpaceX 上市,为「一个重要的增长阶段」筹集资金,其计划包括将超过 10 万颗通信卫星送入轨道,以及在太空中建设人工智能数据中心等。

马斯克因其在 SpaceX 和特斯拉的合计持股而成为全球首位万亿富豪。他创立 SpaceX 时是一家可重复使用火箭制造商,但如今公司唯一盈利的部门是星链卫星互联网部门。

SpaceX 于 2026 年 2 月收购了马斯克的初创公司 xAI。此次收购带来了该公司的数据中心、Grok AI 模型、一个备受争议的同名 AI 聊天机器人和图像生成器,以及社交网络 X(原推特)。

根据其招股说明书,自 2002 年成立以来,SpaceX 累计亏损已达 413 亿美元。(来源:环球市场播报)

英伟达向中国客户推销 Vera 数据中心处理器:最快 8 月上市,直面英特尔 AMD 激烈竞争

6 月 12 日消息,据路透社报道,英伟达已开始向中国客户推介其下一代数据中心处理器 Vera,其 CPU 并不受美国出口禁令限制。

知情人士表示,英伟达方面已通知中国客户,这款面向 AI 数据中心的 CPU 最快可在今年 8 月上市,客户现在即可启动下单流程。英伟达对此拒绝置评,阿里巴巴和字节跳动亦未回应置评请求。

英伟达于 3 月发布 Vera 时曾提及,阿里巴巴和字节跳动等领先云厂商正与其合作部署该处理器,但当时并未说明具体情况。消息人士称,中国客户计划最初仅在海外数据中心部署 Vera 进行测试。

Vera 是英伟达首款独立 CPU,专为智能体 AI 和强化学习等场景设计,主要承担 AI 智能体运行所需的后台计算任务。该芯片目前已进入全面量产阶段。

英伟达公布的数据显示,其运行速度可达竞品 1.8 倍。英伟达 CEO 黄仁勋在 3 月的发布会上曾预计,Vera 将成为公司下一个价值数十亿美元的业务板块。(来源:IT 之家)

 

英特尔启动「萤火虫计划」,用手机零部件重塑低价笔记本

英特尔正试图用一种全新的思路改造入门级笔记本电脑市场,不再一味追求性能参数,而是从整机设计和供应链入手,让低价产品不再等同于「将就着用」。这项名为「Project Firefly(萤火虫计划)」的项目,以全新的 Wildcat Lake 处理器为基础,配合统一的硬件设计模板,供各家笔记本厂商直接采用或在此框架上定制,希望通过标准化方案改善长期以来端低价 Windows 笔记本体验参差不齐的状况。

在英特尔近期的一次 Talking Tech 访谈中,公司将萤火虫计划定位为「重塑入门级 PC 品类」的尝试,强调要打造更统一的笔记本生态,而不是像以往那样由大量碎片化设计各自为战。Wildcat Lake 芯片是这一计划的技术基石,它并非旗舰处理器的缩水版本,而是专门围绕日常计算场景设计:配备两颗性能核心和四颗高能效核心,集成小型神经网络处理单元(NPU)以及针对视频播放、轻度游戏等基础负载优化的核显。英特尔还通过单芯片封装(single-tile)和六层主板设计简化平台结构,从而帮助整机厂降低生产和开发成本。(来源:cnBeta)

鸿蒙操作系统 6 终端设备突破 6600 万,HarmonyOS 7 登场

6 月 12 日,在 2026 年华为开发者大会(HDC 2026)上,华为终端宣布 HarmonyOS 7 开发者 Beta 正式启动。围绕 Agent 时代的智能化创新,华为带来五大核心发布:HarmonyOS 7 首秀、鸿蒙智能向 Agent 架构全面演进、鸿蒙智能体框架升级至 2.0、鸿蒙空间计算首次发布、开源盘古 openPangu 2.0。与此同时,鸿蒙底座完成三大关键升级:超丝滑方舟引擎首次搭载性能大模型、鸿蒙星盾安全更智能主动防护、鸿蒙星河互联架构进一步打通跨生态、跨设备互联,构筑万物智联新体验。(来源:新浪数码)

 

消息称阿里拟出价 15 亿美元竞购零售电商平台「朴朴超市」

6 月 12 日消息,据彭博社今日报道,阿里巴巴集团拟出价 15 亿美元(竞购即时零售电商平台「朴朴超市」,从而与美团竞争。

报道援引知情人士消息称,阿里的拟议价格是高鑫零售(大润发运营公司)此前出价的两倍多。知情人士称,高鑫零售曾提议以 6 亿美元对「朴朴超市」进行收购,目前得到私募股权公司 DCP Capital 的支持。(来源:IT 之家)

 

Kimi 发布并开源 Kimi K2.7 Code 编程模型:平均 token 消耗减少 30%

6 月 12 日,月之暗面 Kimi 发布并开源 Kimi K2.7 Code 编程模型。官方表示,内外部基准评估显示,Kimi K2.7 Code 相比 K2.6 模型显著提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,并且大幅改善了在长程任务中的过度思考倾向,平均 token 消耗减少 30%。

在评估代码能力的内外部基准测试中,K2.7 Code 相比 K2.6 性能显著提升:Kimi Code Bench v2 提升 21.8%、Program-Bench 提升 11%、MLS Bench Lite 提升 31.5%。

在评估 Agent 自主化执行能力的 Kimi Claw 24/7 Bench、MCP Atlas 和 MCP Mark Verified 基准测试中,性能提升 10% 左右。

K2.7 Code 即日起通过 Kimi API 开放平台和 Kimi Code Plan 提供服务。1M token 标准输入和输出价格与 K2.6 一致(6.5 元和 27 元),缓存输入价为 1.3 元。此外,6 月 15 日将推出 K2.7 Code 高速版,输出速度约为普通版 5-6 倍(常规场景约 180 token/s,短上下文达 260 token/s),定价为普通版的 2 倍。(来源:凤凰网科技)

 

YouTube 头号播主 MrBeast 订阅人数突破 5 亿

知名内容创作者 Jimmy Donaldson(网名 MrBeast)于周五在 YouTube 上突破 5 亿订阅,成为史上首位达到这一里程碑的创作者。Donaldson 还在自己的频道上对这一时刻进行了直播,吸引了超过 60 万人观看,直播时长约一个半小时。报道称,他此前在接近 1 亿订阅时也曾进行过直播,而这次与 2022 年跨过 1 亿门槛时类似,粉丝们还在他接近达标时短暂退订,随后又在几分钟后重新订阅。

当 MrBeast 频道订阅数超过 5 亿时,Donaldson 先是抛洒彩纸庆祝,随后转而认真向观众讲述自己的成长经历。他表示,自己「统计学上不该拥有 5 亿订阅」,并回忆称父母都曾在军队服役,家庭在 2008 年金融危机中破产;刚开始做频道时,他甚至买不起设备,只能攒 AdSense 收入去买麦克风或电脑。

此外,Donaldson 透露,他将在周六美国东部时间中午发布 5 亿订阅特别内容。在感谢团队之后,他也谈到频道未来的发展方向,表示自己希望视频的电影感和视觉表现更成熟、更「美丽」,同时继续通过内容和自己的巧克力品牌 Feastables 帮助他人。(来源:cnBeta)

 

苹果 iPhone 18 Pro Max 机模曝光:深樱桃色、浅蓝、深灰颜色亮相

6 月 12 日消息,消息源 @Jon4Lakers 在 X 平台发布系列推文,分享了一组 iPhone 18 Pro Max 机模照片,展示了深樱桃色(Dark Cherry)、浅蓝色和深灰版本。

苹果 iPhone 18 Pro 系列的主打色为「深樱桃」(Dark Cherry),颜色偏向深酒红色,预估将接棒 iPhone 17 Pro 系列的「星宇橙」。

消息源认为这种配色偏向精致、沉稳的商务风格,足够醒目又不失低调,适合在正式场合使用。除了「深樱桃色」外,苹果还在测试浅蓝、深灰及银色版本,其中浅蓝色比较接近 iPhone 17 的青雾蓝色(Mist Blue),是一款低饱和度、带灰调的雅致色调。(来源:IT 之家)

 

李想:6 月 13 日起全新理想 L8 进入全国门店,欢迎 GLS 迈巴赫车主来坐二排

6 月 12 日消息,全新理想 L8 将于 6 月 23 日上市,定位「五座旗舰 SUV」。理想汽车 CEO 李想今日发文对这款新车进行了解读。

他认为,五座旗舰 SUV 这个市场至今没有被重新定义。GLS 迈巴赫定义了后排舒适的天花板,宝马 X5M 定义了五座 SUV 操控的天花板。它们都是经典的好产品,但从来没有人把这些能力放在一台车里。全新理想 L8 想做的事情是:综合前辈的极致,做一台看齐全球 9 系旗舰 SUV 的五座旗舰。后排舒适做到 GLS 迈巴赫的水准,操控性做到宝马 X5M 的水准,智能化对标自己继续领先。

他表示,6 月 13 日起,全新理想 L8 进入全国门店,欢迎 GLS 迈巴赫车主来坐坐全新理想 L8 的二排。到店后强烈推荐直奔第二排:坐下,打开零重力模式,基于「五连杆」专利技术的坐垫会向前延伸、翘起,把你的腿完整托住。即便身高在 185 以上,也能拥有不妥协的零重力体验。(来源:IT 之家)

科幻影片《末日救赎录》备案立项,刘慈欣担任编剧

6 月 12 日消息,国家电影局今日发布关于 2026 年 5 月上全国电影剧本(梗概)备案、立项公示的通知,影片《末日救赎录》备案立项,编剧为刘慈欣、沈悦。从官方的描述来看,这部影片具有科幻风格。

故事梗概为,木卫二冰原热泉异常喷发,宋察觉末日危机却遭无视,受处分后辞职奔赴地球启示录基地,与儿子管心生隔阂。十年后幽灵黑洞逼近地球,管偷飞船直播真相引爆恐慌。父子最终联手取回人类基因储存罐,宋壮烈牺牲。

刘慈欣此前已有多部科幻作品被改编立项,包括《末日地火》、《赡养上帝》(改编为《赡养天神》)、《全频带阻塞干扰》、《超新星纪元》、《微纪元》等。

根据国家电影局备案信息,刘慈欣担任编剧的《末日救赎录》备案单位为峨眉电影集团有限公司,这是四川省属国有电影企业。(来源:IT 之家)

 

  •  

为什么 AI 服务订阅制,注定会走向消亡?

Image
订阅制会被掏空,且用且珍惜。

作者|张勇毅

编辑|靖宇
 

6 月 9 日,Anthropic 发布了它迄今最强的公开模型 Claude Fable 5。按照惯例,这应该是付费用户的节日——你每个月交的钱,终于换来了第一时间摸到旗舰的资格。

但公告里有一行字,在发布后立即引发了巨大的争议:6 月 22 日之后,Fable 5 将从所有订阅计划中移除,继续使用需要单独购买用量积分。

换句话说,即使你买了会员,旗舰模型也只让你用 14 天。

一个模型在发布当天就自带「逐客令」,这在大模型行业还是头一回。

很多人把它当成 Anthropic 的一次失误,或者一次傲慢。我的看法正相反:这不是失误,是预告。

AI 订阅制正在走向一场注定的消亡——不是因为哪家公司贪婪,而是因为订阅制赖以成立的那个前提,正在被 AI 自己亲手拆掉。

01

倒计时 14 天的旗舰模型

 

先把事实摆清楚。按照 Anthropic 的官方安排(2026 年 6 月 9 日),Fable 5 从发布日起免费包含在 Pro、Max、Team 和按席位计费的企业版里,截止 6 月 22 日;6 月 23 日起,它会被从这些计划中拿掉,之后的每一个 token 都要从预付的用量积分里扣,费率与 API 完全一致。

这个费率不便宜:每百万输入 token 10 美元、输出 50 美元,恰好是上一代旗舰 Opus 4.8 的两倍。更微妙的是,即便在免费窗口期内,Fable 5 在订阅额度里也按大约两倍的权重计算——同样的活儿,烧额度的速度是 Opus 的两倍。

用户的反应可想而知。Hacker News 上有人直言这种「先给再收」的操作令人不安,怀疑 Anthropic 是想借机把订阅用户推向按量计费;还有开发者实测,在每月 100 美元的 Max 计划上,一次 agent 编程会话就消耗了价值近百美元的 token

Image用户纷纷在社交媒体上吐槽自己的 token 用量完全不够|图源:twitter

而且,这不是 Anthropic 一家的动作。过去八周,整个行业都在做同一件事:OpenAI 在 4 月 2 日把 Codex 从按消息计费改成对齐 API 的按 token 计费,随后扩展到全部存量企业客户。

GitHub 在 4 月 20 日冻结 Copilot 个人版新注册,一周后宣布全线转向 AI Credits 计费,6 月 1 日切换完成——Pro 档 10 美元月费,附带的就是 10 美元积分。

Anthropic 自己的动作最密集:4 月 4 日起,禁止 OpenClaw 等第三方 agent 框架消耗订阅额度,这类用法改走按量付费;4 月 21 日,定价页上 Pro 计划的 Claude Code 一栏悄悄变成红叉,社区炸锅后 24 小时内撤回,官方解释是「针对约 2% 新注册用户的小测试」;5 月 14 日正式宣布,6 月 15 日起 Agent SDK 和无界面调用移出订阅池,改为按 API 费率计量的独立积分

三家公司,八周,同一个方向——这不是巧合,是整个行业在同一道数学题面前,交出了同一份答案。

那道数学题长什么样?

02

定价的从来不是算力

 

研究机构 SemiAnalysis 最近把这道数学题摆上了台面。他们把 Anthropic 和 OpenAI 的每一档订阅各买了一份,跑长程编程任务,一直跑到把每周限额耗尽,再按 API 牌价折算:这些用量,值多少钱。

此前业内的普遍认知是,一个每月 200 美元的套餐,撑死能跑出约 2000 美元的 token。实测结果远超于此:20 美元的 Claude Pro,上限约 400 美元;200 美元的 Max 20x,约 8000 美元。OpenAI 这边更夸张——20 美元的 ChatGPT Plus 能跑出约 700 美元,200 美元的 Pro 20x,约 14000 美元。

Image最高一档的补贴倍数,是 70 倍|图源:SemiAnalysis

有两句公道话得说在前面:这是「跑满限额」的上限值,不是普通用户的日常水位;API 牌价含毛利,折算数字也不等于真实的算力成本。但定价必须为上限兜底——保险公司不能假设没人出险。

ImageSemiAnalysis 实测各订阅档位可消耗用量对比|图片来源:X @kimmonismus / SemiAnalysis

补贴本身不致命。流媒体补贴过,打车软件也补贴过,烧钱换增长是互联网的祖传手艺。真正致命的,是 AI 订阅制和它们之间有一个根本区别。

Netflix 敢卖包月,靠的是两件事:多放一部片子的边际成本趋近于零,以及一个人一天最多只有 24 小时可以看。Spotify 同理。包月制成立的隐含前提,是消费量被人的生理极限锁死——它真正定价的从来不是内容,而是人的时间。

聊天机器人时代的 AI,勉强符合这个前提。一个人再能聊,一天敲键盘的量也有限;轻度用户大量闲置的额度,足够覆盖重度用户的超额消耗。

然后,Agent 来了。

一次 agent 任务是什么样的?它读 20 个文件,做规划,改代码,跑测试,读报错,再迭代——一轮下来,token 消耗是普通对话的 5 到 30 倍。更要命的是,它不需要你在场。我自己就有体会:前阵子让 agent 整理两座机场的航班数据,我去洗了个澡,回来时任务跑完了,额度也见了底。你在睡觉,电表在转。

Agent 取消的不是价格上限,是消费上限。 而 AI 行业的全部演化方向——更长的任务、更多的自主性、并行的多个实例——都在朝着同一个终点狂奔:

把人从消费环节里彻底移走

GitHub 在公告里说得很直白,agent 用法「正在成为默认」。也就是说,订阅制还能勉强成立的那部分场景,也就是人坐在屏幕前一句一句聊,在 AI 的价值版图里占比只会越来越小。

到这里,有人会问:补贴太深,提价不就行了?

提过,然后得出了一个更糟的结果。回头看 SemiAnalysis 那张表,有一个反常的细节:档位越贵,补贴倍数越高。

Claude 这边,20 美元档的倍数是 20 倍,200 美元档是 40 倍;OpenAI 那边,从 35 倍涨到 70 倍。一半是定价设计使然——高档位按倍数放大额度,相当于给大客户打折;另一半是用户行为使然——会花 200 美元买 20x 套餐的人,就是冲着跑满来的,轻度用户根本不会出现在这个档位里。

这在保险业里有个名字:逆向选择。当一份保单的定价吸引来的全是最高风险的投保人,这份保单就没有精算意义上的活路。任何一个固定价格,都会精准筛选出用量超过它的那批用户——这不是经营问题,是结构问题,调价只会让筛子越筛越细。

2025 年这一整年,行业其实把所有补丁都试了一遍。1 月,Sam Altman 在 X 上承认每月 200 美元的 ChatGPT Pro 在亏钱,因为用量远超预期——提价档失败。

ImageOpenAI 尝试过,但失败了|图片来源:X

年中,Cursor 把按请求计费改成按算力计费,引发大规模退订,CEO 公开道歉——半道改规则失败;夏天,Anthropic 给 Claude Code 加上周限额,理由是有用户全天候挂着 agent 跑,单人消耗的算力以万美元计——限流招来的只有怒火。

补丁全部失效之后,才有了今年这八周的集体摊牌。OpenAI 的 ChatGPT 负责人 Nick Turley 在 BG2 播客上把话挑明了:「在当前这个时代,提供无限量套餐,可能就像提供无限量用电套餐。」

03

壳还在,核已经死了

 

当然,也有一种听起来很有力的反驳:订阅制明明活得好好的。ChatGPT Plus 还是 20 美元一个月,Claude Pro 也还在卖,GitHub 的代码补全甚至保留了包月。所谓消亡,是不是危言耸听?

这个反驳值得认真对待,因为它描述的现象是真的。但它看错了死掉的东西。

订阅制的灵魂,从来不是「每月扣一次款」这个形式,而是「固定价格、放心使用」这个承诺——你不必计算每一次使用的成本,这正是当年它战胜按次付费的全部理由。

而现在发生的事情是:扣款周期留下了,承诺被抽走了

GitHub Pro 的 10 美元月费里,装的是 10 美元积分,用完即止——这不是订阅,这是预付费充值卡套了一件订阅的外衣。Anthropic 的积分按 API 费率扣,OpenAI 的积分支持自动充值。订阅制不会被取消,它会被掏空:壳还在,核已经死了。

ImageGitHub Copilot 转向 AI Credits 计费的官方公告|图片来源:GitHub

还剩一块真正的飞地:纯聊天。它之所以还能包月,是因为它是 AI 里最后一个消费量仍被人的时间锁死的场景。但护城河保不住飞地——这个行业的每一分钱研发,都在把 AI 从「你问它答」推向「它主动帮你完成」。聊天订阅不会被杀死,它会被边缘化:留在原地,看着真正的价值和真正的收入,一点点搬进按量计费的世界。

还有一个时间点上的巧合很难忽略:据 TechCrunch 报道(2026 年 6 月),Fable 5 发布之际,Anthropic 正与 OpenAI 一道筹备上市。过去三年,补贴由风险资本买单;公开市场的投资人,不会接受一份「每多一个重度用户就多亏一笔」的损益表。资本退场的日程表,决定了摊牌不会无限期推迟。

这对不同的人意味着不同的事。对企业,AI 支出从此要像云支出一样管理——据 The Information 报道,Uber 的 CTO 在内部备忘录里说,公司四个月就烧完了 2026 全年的 AI 预算,做预算、装监控、按任务路由模型,会成为每个团队的必修课。对个人用户,过去是轻度用户补贴重度用户,现在,每个人为自己的电表付钱

ImageUber 的 AI 预算转型同样引起过不小的争议|图源:The information

说实话,这未必全是坏事。价格信号回归之后,「这个任务值不值得让 AI 跑」第一次成了一个真问题——而一个行业开始认真回答这个问题的时候,往往是它脱离烧钱叙事、走向正常生意的开始。

写到这里,我想插一句话:在电表装上之前,眼下的订阅制,可能是这个行业对用户最慷慨的时刻——且用,且珍惜。

逻辑就藏在 SemiAnalysis 那张表里。换到用户视角读,它根本不是死刑判决书,而是一份还在生效的福利清单:你每月付 200 美元,平台陪你烧掉最多 14000 美元的算力。这种力度的倒贴,上一次出现还是打车大战和外卖大战——而那两场大战的结局我们都记得,补贴退场之后,价格再也没有回去过。

所以该跑的重活,趁现在跑。比如 Fable 5 留在订阅里的窗口只到 6 月 22 日,与其等积分时代来了再精打细算,不如先把那些一直想跑、又嫌贵的长任务安排上。这不算薅羊毛——只是在一个注定要被修正的定价错误里,做一个清醒的受益者。

Image

Turley 那个比喻,可能比他想表达的更深一层。电真正变成基础设施的标志,不是它通到了千家万户,而是每家每户都装上了电表——从那一刻起,没人再讨论「电该不该包月」,人们只讨论电价。

订阅制不会有讣告。它只会在某个安静的账单日,变成你支出明细里一行叫「入场费」的小字。

在那之前——且用,且珍惜。

*头图来源:AI 生成
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你现在付费的 AI 订阅,
明年这个时候还会续费吗
Image
Image
Image
Image

 

  •  

当 OpenAI 还在屏幕里,这家中国车企已经让 AI长出了身体

最近,SpaceX、OpenAI、Anthropic相继推进上市进程,合计募资规模或超过2000亿美元,一场史无前例的资本盛宴正在上演。这些超高估值背后,市场押注的不只是AI改变数字世界,还有AI渗透到物理终端之后的想象空间。

在物理AI这个方向,机器人是最显眼的赛道。特斯拉Optimus、宇树的每次亮相都备受关注。但如果要看商业化落地的节奏,那汽车才是物理AI目前最有可能落地的场景。

2026年6月9日,北京雁栖湖畔,一个名叫AIVA的新品牌正式亮相。它背后是赛豆科技,这个名字在发布前已经引发了不少猜测。赛力斯、豆包、字节跳动,这几个名字太容易让人联想到一场巨头联姻。 但实际上,赛力斯与字节跳动之间并无股权关系。火山引擎为AIVA提供的,是豆包大模型、智能座舱等技术服务。这是一次技术授权与服务合作,而非资本绑定。

在这次发布会上,AIVA没有谈续航,没有谈智驾,而是提出一个根本性的问题:AI时代的汽车应该长什么样子?

把造车的顺序,反过来

理解AIVA,要先想清楚一个问题:智能汽车和AI汽车,究竟有什么本质区别?

过去 10 年,中国智能汽车行业经历了一波智能化的浪潮,辅助驾驶、大屏幕、语音助手……这些都已经成为人们购车的重要参考因素。但如果仔细看,会发现一个共同点:先有车,再加上AI。

AIVA想做的事情,是把这个顺序反过来,「AI定义汽车,先有AI,再有车」。让AI作为底层基座,在这个基础上长出身体。

火山引擎副总裁杨立伟在发布会上说了一句话,精准定义了这个差异:「我们理解的AI汽车,不只是把AI放到车上,而是让汽车成为物理AI的一个新物种。」

这句话听起来像产品发布会上的宏大愿景,但AIVA做了四件非常具体的事:需求前置、架构前置、功能前置、学习前置。 需求前置,意味着不再是产品经理开着调研会,靠人的判断推演场景;而是让AI去做海量数据分析,主动挖掘用户在通勤、家庭出行、长途驾驶、疲惫傍晚这些真实情境下的真实需求。

图片来源:赛豆科技

AIVA总裁、产品经理李博在发布会上打了一个比喻,非常精准,「过去是人在前面挖矿,现在是AI在前面挖矿,人在后面淘金。」这不是效率的提升,这是需求发现方式的改变。

架构前置,意味着先想清楚AI需要调用哪些车辆能力、数据接口和执行系统,再去设计底层架构。这意味着车辆的传感器布局、数据流通方式、各系统之间的协同接口,都要为AI的深度介入预留空间,而不是等车造好了,再去想怎么把AI「接进来」。

功能前置,不是把功能做成一个个菜单,等用户去找;而是让AI围绕用户的目标,动态组织全车能力。用户说「我好冷」,AI不是弹出一个温度调节界面,而是综合车内外温差、你的历史偏好、当前穿着状态,直接给出最合适的方案。

学习前置,意味着这台车在你买来第一天和用了三年之后,应该是两种完全不同的体验。不是因为OTA推送了新功能,而是因为它越来越懂你这个人。

把这四件事放在一起,就构成了AIVA所说的「AI定义汽车」:它不是给车装一个更聪明的助手,而是让AI从产品诞生的第一天起,就参与定义这台车应该是什么。

从人适应车,到车适应人

如果说「AI定义汽车」是一次造车逻辑的革命,那它必然会重塑人与汽车之间的关系。

长期以来,人和车是一种操作关系:人发出指令,车执行功能。从方向盘、油门、刹车,再到点击屏幕,其实都是用户在主动操控一台机器。

但AIVA想打造的是一种协作关系,AI能够感知状态、主动服务,成为「伙伴」而非「工具」。

图片来源:赛豆科技

这一句话,拆开来看,是三个具体的变化。

一个是交互方面,从「机械生硬」到「普适鲜活」。目前的车机系统,用户需要记住菜单位置、熟记唤醒词,甚至要用精确的指令格式说话,本质上是人在适应车。

物理AI时代的交互逻辑是反过来的:机器适应人。AI能像人与人聊天一样,知道什么时候该接话,什么时候该保持安静,根据当时的场景和意图直达任务。

而鲜活则是另一个维度。AI不是一个千篇一律的助手,而是能感知你的情绪状态,在你疲惫时切换更放松的音乐和灯光;在车上有孩子的时候,切换成「孩子王」模式……它不是预设的场景标签,而是对「现在的你」的理解。

另一个是智能从「功能堆叠」到「能力涌现」。传统智能汽车强调功能和配置越来越多,但这并不等于智能的提升,反而可能带来更高的使用门槛。

AIVA追求的是让各个系统之间产生协同效应,形成「能力涌现」。

李博在发布会上举了一个例子,让人印象深刻。同样是22度,AIVA理解的是完全不同的情境,「夏天穿着T恤刚进车的22度,和冬天脱下羽绒服穿着羊毛衫的22度,不是同一个22度;打完球大汗淋漓的22度,和穿着西装准备见客户的22度,也不是同一个22度。」

这意味着,真正的个性化不是记住你的偏好设置,而是理解你在不同情境里,真正需要什么。

再有就是,感受从「单调乏味」到「松弛愉悦」。

很多人开车会觉得累,不只是因为路况复杂,更是因为注意力被大量重复性的判断和操作消耗。当AI能够主动接住这些「负担」,用户的精神状态会发生很大的改变。

这也是AIVA品牌主张「Live Alive,爱予自由」的内涵,就是用AI把时间还给用户,用情感陪伴回应用户感受。

火山引擎,从第一天就入局

AIVA发布会上,另一个值得深度解读的信息,是与火山引擎的合作方式。

官方的表述不是「技术供应」,不是「功能接入」,而是联合定义、联合设计、共同打造。

车企与智能化供应商的合作,大多遵循一个流程:车辆的硬件架构、功能定义、交互逻辑先由车企确定,AI公司随后介入,负责让「车里的助手更聪明一点」。

但AIVA和火山引擎的合作,是从产品定义的第一天起就开始的。

杨立伟在发布会上说了一句话,道出了这个变化的意义,「如果一台车从第一天起就围绕AI来定义,它的交互方式、智能上限和用户感受,都会发生根本变化。」

火山引擎为AIVA提供的,是豆包大模型能力、智能座舱技术服务,以及多模态交互、车端智能体等能力探索。

但把大模型能力真正落地到汽车场景,需要跨越一道很高的门槛。汽车场景有其独特的复杂性,比如驾驶状态下,用户无法像使用手机一样全神贯注于交互;车内可能同时有驾驶员、乘客、儿童,交互逻辑完全不同……

这意味着,通用大模型的能力必须经过真实车端场景的专项训练与深度适配,才能真正理解这样的情境:高架桥上堵车二十分钟,车主有点烦躁,下一个出口有一家他常去的咖啡馆——AI应该在什么时机、用什么方式、说什么话?

这种判断,不是靠规则写出来的,而是靠豆包的通用认知能力与汽车专业场景从源头长在一起,训练出来的。

当AI,长出了汽车的身体

发布会的最后,AIVA的首款概念车 Origin Concept 正式亮相。AIVA所有关于「AI定义汽车」的认知,在这一刻有了具体的体现。

图片来源:赛豆科技

设计团队没有从「风格」或「姿态」出发,而是从「让这台车能看见你、感知你、回应你」出发。车身采用G4曲面,没有硬棱角,没有刻意的折线;前灯被设计成可交互的「眼睛」,当你走近,它会专注地看着你;当你比个心,它会回应你;轮毂的设计灵感源自鸟类的叉骨,低风阻轮罩像翅膜一样薄而有韧性……

这些设计细节,其实都是在试图回答文章开头的那个问题:AI时代的汽车应该长什么样子?

据了解,首款量产车型AIVA ME7将于2026年年内亮相,全系覆盖20万元以上主流市场。这是中国新能源汽车竞争最激烈,也是用户最难被说服的主流战场。AIVA选择在这里验证「AI定义汽车」的商业可行性。

2026年,物理AI正在从实验室走向真实世界。过去的AI活在屏幕里,你问它,它答你;而物理AI,是要把智能装进一台有眼睛、有手脚的机器里,让它真正走进现实世界。

所以你会发现,当OpenAI、Anthropic都开始研究怎么走进真实世界的时候,汽车行业正在经历的变革,其实是这波叙事的一部分。把AIVA放进这个背景里,它的坐标才看得清楚。

  •  

从「展开屏幕」到「展开任务」:折叠屏进入 AI 时代

AI 已经被密集讨论了两年,但有个事实很少被摆上台面:真正把它用进日常的,依然是少数人——开发者、极客、愿意折腾的人。模型能力一路飞涨,它走向大众的那段路,却始终没有走完。

而能走完这段路的设备,其实早就躺在每个人兜里。手机是这颗星球上分布最广、使用最高频的智能终端,AI 要从「少数人的工具」变成「所有人的日常」,大概率得从这里发生。

于是问题只剩一个:什么样的手机,干得好这件事?

当 AI 不再只是回答一个问题,而是开始陪人做成一件事,它需要一块足够铺得开的台子。折叠屏,可能正是那块台子。


五年死磕之后,折叠屏迎来「价值问题」

过去五年,手机厂商以及重要供应商们,几乎集体对折叠屏发起了多轮「死磕」:折痕、铰链、重量、续航、耐用,这些与生俱来的工程难题被一个个摁了下去。

热闹的背后,折叠屏也开始从一件需要小心供着的昂贵玩具,逐渐演化成一台可以放心当主力机用的设备。

不同玩家对折叠屏的理解并不完全一样。这五年里,vivo 给自己定的次序是「先旗舰,后折叠」:先保证一台旗舰该有的一切,影像、续航、可靠性,一样不缺,然后再谈折叠。说白了,用户选择折叠,不该为形态支付一笔「体验税」。

所以,「可靠性」是折叠屏首先要突破的最重要的物理门槛。

直板手机本质上是一块密封的砖——没有活动部件,整机严丝合缝。折叠屏把这个前提推翻了:它是一台带活动部件的机器,可靠性的全部麻烦,几乎都从这里来。

整机最娇贵的零件屏幕,变成了每天要弯折上百次的运动件:合得越严,弯折半径越急,折痕越深、寿命越短;而支撑它的铰链是一套微米级的精密机构,要动就有缝,有缝,灰尘和水汽就有了入口——一粒钻进铰链的沙子,都可能在屏幕上顶出一个坏点。

行业的解法是两头下功夫:该动的地方,让玻璃薄到「能弯」、让铰链学会「让位」——闭合时让出水滴状的弯折空间,把急弯变成缓弯,折痕不是被「消灭」的,而是被结构「藏」起来的;该封的地方,铰链密封、接口胶圈、整机涂层一层层堵死,再交给第三方认证,让「放心」变成一件可以验证的事。

重量是另一重考虑,它和可靠性天生是一对跷跷板:要轻,就得减料;减料,强度、续航、防护就垮。折叠屏偏偏是「两台手机」的料——两块屏、两块电池。行业一度陷在「轻薄换体验」的循环里,越轻的折叠屏,反而越像一台处处妥协的手机。

来自材料和电池的突破,让折叠屏可以做到了同样电量下更小的身材。到 X Fold5,vivo 把大折叠做到了比不少直板旗舰还轻,同时塞进了折叠屏里最大的电池和最全的三防。

到这里,大折叠的重量竞赛实际上已经画上了句号——接下来比的,是均衡。

如果我们把折叠屏的进程看作三个阶段——能折就算成功、拼命轻薄化、走向成熟——那么品类如今已站在第三阶段的门口。而恰恰是在这里,真正的问题才浮出水面:

再薄一点、电池再大一点、折痕再浅一点,当然还会继续,但它们解决的都是折叠屏的「物理问题」;下一次进化,要回答的是「价值问题」——这块展开的大屏,到底能带来什么直板手机给不了的东西?从工程上的成熟走向大众的日常,折叠屏缺的不是工艺,是一个新的需求牵引。


AI:折叠屏等待已久的「新需求」

需求是可以被创造的。马斯克拿「太空数据中心」给火箭运力市场凭空添了一桩新生意——算力一旦上天,火箭就有了新的货物。

手机行业正在上演相似的剧本:vivo 押的是,AI 会成为折叠屏这个品类等待已久的那个「新需求」。

这个押注的前半段,正在变成行业共识:手机交互的基本单位,正在从「App」走向「任务」。智能手机十几年的逻辑,是一个 App 解决一个问题;可一个真实的任务——写一份方案、安排一次出差——往往需要好几个 App 和 AI 同时上场。订机票开一个 App,查资料开另一个,和 AI 讨论完再切回文档,折腾半天会发现:我们不是在完成工作,而是在操作手机。

让 Agent + App 把任务做完,几乎是所有玩家共同写进下一步的方向。

在新一代 X Fold6 发布前,vivo 参与了一场和 AI 开发者、创作者、行业人士的线下沟通,想听听这群最早把 AI 用进日常的人,到底在怎么用、卡点在哪。圆桌上的分享,恰好把不同用户对 AI 手机「想象的分岔」摆到了台面上:

重度用户已经把手机用成了 Agent 的「遥控器」。飞书产品市场经理王大仙就在现场演示,如何操作自己的 Agent 军团做爆款分析、内容检测等具体工作事项,而调度它们的遥控器,就是手机。

但更多人需要的,其实是一个「监督员的工位」:每个人有了 AI 之后,都暴露出了「监工」的本质——Agent 开始替人干活,人总想看见它干到哪一步了、卡没卡住、结论是怎么得出来的。开发者、科技博主 flypig 举了个很有意思的案例:同事看不到 AI 的思考过程时,下意识冒出一句「它死了」;等思维链重新在屏幕上滚动起来,又改口「它还活着」。看见的过程,就是信任建立的过程——而「看见」这件事本身,就需要一块足够大的屏幕。

两派想象南辕北辙,结论却殊途同归。

共同点是,大家都需要一块更大的屏。不同的是使用 AI 的门槛——让 AI 成为「遥控器」,前提是需要有一套成熟的模型和工作流,但绝大多数人没有,也不会搭;而「看见 AI 干活」这件事,才门槛更低,几乎每个人都会冒出来的本能。

所以,比起递上一个「遥控器」,一台面向大众的 AI 终端,第一步首先应该给普通人提供一个开箱即用的可视化工作台。

X Fold 折叠系列给出的,正是这样一个工作台:在原子工作台里,AI 工具和多个 App 同时展开、围绕一个任务协同。写方案时,文档在中间,AI 在一侧随时讨论,浏览器在另一侧查资料,素材在窗口之间直接拖拽;出差前,航班、酒店、地图、日程铺在同一块屏上,AI 把零散信息串成行程。

这些组合还能存下来——会议工作台、旅行工作台、创作工作台,下次一键进入。App 在这里不再是终点,而是被拼进任务里的零件。

而这样一个工作台,还得既装得下任务、又装得进口袋:AI 正在把许多原本属于电脑的事,搬进出差路上、会议间隙、登机前的二十分钟,电脑不一定在手边,直板手机一直在手边、屏幕却终究有限——合上是一台旗舰手机,展开是一个移动工作台,这是折叠形态独有的位置。

把任务流变成现实,技术上同样不轻松。

安卓的底层逻辑,十几年来都是按「一块屏显示一个应用、其余挂后台」设计的;要让多个应用同屏常驻、流畅协同、随时拖拽,渲染、调度这些底层机制都得重做。

好在 vivo 手里有积累:原子工作台不是这一代才有的发明,它在上一代产品上已经投入使用,而且是用户实际用得很勤的功能——需求被验证了,底层能力也跟着磨了一代。即将发布的 OriginOS 6 Fold 为折叠屏在 AI 时代的多任务需求做了深度开发,芯片则与合作伙伴提前两年联合定义。上一代的尝试为这一步做了铺垫,这一步,又在为下一步探路。


终端的「远方」和普通人的「日常」

把目光再放远一点,这些探索其实都指向同一个远方——一台能感知、能思考、能行动的 Agent Phone。

vivo 在博鳌亚洲论坛上描绘过从 Smartphone 到 Agent Phone 的演进;高通的安蒙说今年是「agents 之年」,未来的设备会有「两个人格」,一个由人直接操作,一个由 AI 在后台自主运行;年初 OpenClaw 们的走红,更像是「人手一个 AI 助理」的预演;激进者甚至断言,App 终将被 agent 取代,交互将走向「意图直达」。

Agent Phone 是更远的彼岸,今天的「展开任务」,是通往那里的一步。

不过,把这些愿景剥开看,里子其实是同一件东西:无论「两个人格」还是「意图直达」,许诺的都不是一台更聪明的机器,而是人的时间和人的能力——技术的远方,说到底通向的是人的日常。

而站在终端对面的人,此刻正带着两种相反的情绪。一边是超级个体的崛起:一个人借着 AI 创办公司、开发产品,他们中不少人甚至不会写代码;另一边是更普遍的焦虑:「我会不会被替代」。一台面向大众的 AI 终端,真正的位置就在这两种情绪之间——不是让少数先锋变得更强,而是让普通人也拥有过去难以想象的能力。AI 不是让人退场,而是让更多人登场。

这也是端侧 AI、底层重构、芯片定制这些工程投入最终要兑现的东西:不是参数表,而是让一个不懂 AI 的人,也能在会议间隙、登机之前,把一件琐事放心地交出去——把被琐事占据的时间,还给思考,还给创造,还给真正热爱的事。技术从「少数人的工具」变成「所有人的日常」,这一步在手机上发生,才算真的发生。

折叠屏用六年回答了「能不能展开一块好屏」;现在,X Fold 系列想回答的是「为什么而展开」——展开的不只是一块屏幕,而是一件事,和一段被交还的时间。这个月底,X Fold6 就将发布。它会不会成为「AI 体验的最佳搭子」,要交给市场检验;但「展开任务」这个方向本身,已经让折叠屏在 AI 时代,第一次有了非它不可的理由。

  •  

学而思「焊进」华为平板系统,教育能不能成为硬件的原生化能力?

学而思与华为平板的一次双向奔赴,在行业引起了不小的波澜。

过去,终端厂商与教育公司的结合,本质上是一场流量采买,硬件提供位置,应用贡献分成。这种保持了多年的稳固生意让两个世界的边界泾渭分明。

华为平板与学而思宣布达成独家战略合作,则首次大胆的跳出了这个思维,学而思的整套学习内容体系,将不是以 App 预装的形式,而是作为一种系统级能力植入华为平板。

这种原生感,在消费电子行业的上一个类比,恐怕要追溯到苹果将 iPod 直接做成 iPhone 的 Music 应用。只不过这次,被原生化的是教育本身。

 

01

一次大胆的创新,

一场系统级的实验

 

从此次披露的合作细节来看,学而思的内容不是简单的嵌入华为的教育中心,双方将进行系统底层的深度适配,包括对鸿蒙系统的原生体验进行联合调优,涉及 AI 摄像头的纸面识别、以及多窗口下的学习交互逻辑。这已经远超出了适配的范畴,更接近于一场联合研发。

过去,硬件厂商与教育内容的合作模式,更像是房东与房客。华为此前教育中心的各类内容伙伴,本质上都在这个框架内。硬件厂商提供算力、显示、触控,软件服务商自带课程、题库。但硬件厂商的管道不会为某一个数字内容单独改造,软件厂商也不会把自己压箱底的教研数据拿出来训练硬件的底层能力。

华为与学而思的这次独家战略合作,意味着,华为向学而思打开了硬件与系统的深层接口,而学而思则把自己的内容能力、教研逻辑、甚至用户学习行为的数据模型,揉进了华为平板的系统生态里。这种合作深度,需要极高的互信,更需要双方在核心利益上完成一次艰难的对齐。

双方都让渡了部分边界,但换来的是一个封闭且高效的新范式。别的品牌可以找到其他教育公司预装,但几乎不可能在短时间内复刻这种从 OS 层面开始生长的融合度。因为独占协议和系统改造的时间窗,就是最坚固的先发壁垒。

 

02

为什么是学而思?

 

市场上做教育内容的公司不少,有做题库的、有做直播课的、有做 AI 伴学的。但华为把系统级权限独家开放给学而思,看重的显然不只是课程数量多,而是学而思那套能跟硬件深度配合的「内容结构」——这是学而思一个还没被外界充分认识到的优势。

大部分在线教育内容,说白了就是视频加图文的组合,结构比较松散。但学而思过去二十年做的事情,其实更像是教育领域的基础设施。它把 K12 阶段的知识体系拆成了超过千万分钟的分层教学内容、数亿道带有精细标注的题目,背后还有一套标准化的教研流程在支撑。这些东西不是短时间能攒出来的,本身就是一种积累出来的壁垒。

在跟华为的合作中,这种内容积累通过两种形态落地:一是基于华为擎云 C5e 深度定制的学而思学习机,搭载 HarmonyOS,支持「一机双模」切换;二是学而思学习中心预装在华为平板鸿蒙系统里,四指横滑就能直接进入。学而思学习机依托九章大模型与 DeepSeek 双核技术,支持 AI 作业批改、步骤级知识定位和基于知识图谱的精准学情诊断,把 AI 能力贯穿到了学习的各个环节。

这里还有一个容易被忽略的背景。2022 年 ChatGPT 爆火之后,学而思背后的好未来很快意识到 AI 在教育领域的潜力,迅速组建团队押注垂类大模型。这让学而思在 AI 时代有了自己的技术底子。它的学习机也因此快速进化——是行业里最早上线原生多模态能力的学习机产品之一,也是最早在 AI+教育这个方向上做深度探索的公司。

这大概也是华为选择学而思做系统级共创伙伴的原因。学而思证明了自己的内容和技术能力不仅能撑起自有硬件,还能输出给顶级消费电子品牌,成为后者产品力的一部分。这意味着更大的商业想象空间。

 

03

学而思的下一步,

会长在更多设备里吗?

 

把时间线拉长来看,这次合作真正有意思的地方,可能不止于一块平板。

如果学而思的教育能力已经能够作为一个系统级模块嵌入华为平板,那逻辑上,这个模块不应该只停留在平板上。智慧屏、车机、PC,甚至未来的智能眼镜,都可能成为它的载体。

想象一个场景:孩子在家用平板学习,出门在车上用车机大屏继续听课,遇到难题拿手机拍一下,智慧屏自动弹出解析。学习内容在不同设备之间流转,不再被锁死在某一个 App 或某一台硬件里。

这就是所谓的「硬件边界消融」。换一个角度说,过去内容是跟着硬件走的——硬件是主体,内容是附属。但现在这个关系在松动:当内容能力足够强、结构化程度足够高,它开始反过来定义硬件该提供什么样的体验。谁手上有最完整、最结构化的教育内容体系,谁就有机会成为各类终端争相接入的那个核心模块。

当然,这里面也有一个现实的博弈:用户心智。学而思学习机已经有了自己的品牌认知度,当它的核心能力同时出现在华为平板上,会产生「1+1 大于 2」的效果,还是会让一部分家长觉得「那我直接买华为平板就行了,不用再单独买学习机」?

这个问题学而思内部大概已经想过很多遍了。比较合理的解释是做场景分层:学习机对应的是强管控、高专注度的纯学习场景,家长希望孩子用的时候心无旁骛;而华为平板上的教育能力,更多对应的是日常生活里的随时随地学习,是一种更轻、更自然的教育渗透。两者之间不是简单的替代关系,而是覆盖了从「刻意学习」到「随时可学」的不同需求。

不管后续的故事怎么展开,2026 年年中的这次合作,确实给平板行业和教育科技行业都带来了一些新的东西。它至少说明了一件事:软件和硬件之间的关系正在发生变化,不再是简单的预装和分成,而是真正在产品层面融为一体。当教育内容从一个桌面图标,变成设备底层的原生能力,我们讨论的就不只是一个 App 的安装量了——而是教育本身触达用户的方式,正在被重新定义。

*头图来源:学而思

  •  

SpaceX 官网确认募资 750 亿美元,创史上最大 IPO;Meta 开始剥离Manus;苹果首款触控屏 MacBook 已「100% 确认」


SpaceX 确定发行价 135 美元 / 股,募资 750 亿美元创史上最大 IPO

根据 SpaceX 周四在官网发布的声明,公司此次 IPO 发行 5.556 亿股,发行价为每股 135 美元,募资总额达 750 亿美元。SpaceX 此次 IPO 募资规模是沙特阿美 2019 年创下的 294 亿美元上市纪录的逾两倍。

声明显示,SpaceX 还授予承销银行超额配售权,可按发行价额外购买 8,330 万股股票。若该权利全部行使,IPO 融资规模将增至约 860 亿美元。

按发行价计算,SpaceX 市值达到 1.77 万亿美元。计入员工股票期权和限制性股票单位后,公司完全摊薄估值约为 1.8 万亿美元。

马斯克在散户群体中的强大号召力是本次交易中的重要因素。知情人士周四表示,散户认购已经超过 1000 亿美元,远高于预留给他们的 20% 的 IPO 股份。

SpaceX 将于周五在纳斯达克和纳斯达克德州市场开始交易,股票代码为「SPCX」。(来源:环球市场播报)

7.5 万字《置身钉内》催生阿里最年轻事业部 CEO

6 月 11 日最新消息,阿里巴巴宣布钉钉管理层调整:陈航(花名「无招」)卸任钉钉 CEO,出生于 1992 年的陈宇森接棒。

就在 6 月 10 日,阿里巴巴合伙人委员会在公司内网发布帖文《有情有义有成长,才是阿里文化》,对近日钉钉离职员工长文《置身钉内》引发的讨论表达了鲜明的态度。合伙人委员会以严厉的措辞批评了钉钉团队的管理方式。紧接着,阿里集团宣布了对钉钉管理层的调整。

公开信息显示,陈宇森是一位 1992 年出生的技术极客与连续创业者,曾参与创办网络安全公司长亭科技,后被阿里并购。加入阿里体系后,陈宇森曾任阿里云智能集团副总裁。2025 年,他在阿里云内部创业,主导研发了 AI Agent 产品「MuleRun」。

此次调整后,陈宇森将成为阿里巴巴集团内最年轻的事业部 CEO。(来源: TechWeb)

Meta 开始撤销收购 Manus:已完成业务分离,停止数据共享

6 月 11 日消息,据报道,有知情人士表示,Meta 实际上已经在公司与 Manus 之间建立了一道「防火墙」。自本月初以来,Meta 已禁止 Manus 及其员工访问公司内部数据系统。相应地,Meta 员工也不得再将 Manus 的工具用于公司内部项目。

据外媒得到的一份内部备忘录,Meta 正在逐步停止使用 Manus 的服务。备忘录显示,公司已通知员工将现有的 Manus 项目迁移到 Meta 系统上,并且不要再在 Manus 平台上启动新的工作。知情人士称,这些旨在将两项业务分离的举措,标志着 Meta 朝着最终剥离 Manus 又迈出了一步。

与此同时,Manus 创始人正在探索各种选项,以撤销这笔交易,其中包括筹集约 10 亿美元来回购公司。目前尚不清楚有关该交易的讨论是否已取得实质性进展。知情人士此前表示,Manus 的员工已搬入 Meta 位于新加坡的办公室,而包括腾讯控股、真格基金和红杉中国在内的投资者,已经收到了 Meta 收购 Manus 所支付的相关款项。(来源:凤凰网科技)

Google 承诺投入 5000 万美元培训逾 30 万名技术工人

美国科技巨头 Google 近日宣布,将拨款 5000 万美元,用于在全美范围内培训超过 30 万名技术技工,从而缓解关键基础设施项目中技能工人短缺的问题。这一培训计划聚焦于水电、暖通、建筑、电气安装等典型技术工种,为相关从业者提供与人工智能基础设施建设相匹配的技能培训机会。

当前,美国在建设数据中心、电力扩容、网络设施升级等支撑人工智能发展的关键项目上,对高技能技术工人的需求迅速攀升,而合格人手却严重不足,已经成为制约产业推进的重要瓶颈。Google 此次承诺投资,是继 Anthropic、Meta、OpenAI 之后,又一家大型科技公司主动介入技术工人培养领域,试图通过直接投入资金和资源来弥补产业链的人力缺口。

根据公开信息,Google 将通过与地方培训机构、工会组织及相关非营利机构合作,为学员提供有针对性的课程与实操机会,帮助他们掌握建设和维护数据中心、电网升级、冷却系统和通信网络等项目所需的实用技能。这类项目被视为人工智能时代的「底层工程」,既包括传统蓝领工种的技能升级,也包括对现有从业人员进行新技术环境下的再培训,以适应 AI 带来的基础设施扩张。(来源:cnBeta)

豆包手机硬件负责人林夕离职,曾任职于华为

6 月 11 日,据科创板日报消息,字节跳动 AI 硬件核心团队 Ocean 旗下、豆包手机硬件产品负责人林夕已于近日离职。这也是字节自 2024 年启动 AI 手机项目以来,首位出走的核心硬件管理人员。

公开信息显示,加入字节之前,林夕曾在华为终端长期任职,主要担任 Pura X 阔折叠手机硬件产品负责人。Pura X 是华为首款「阔折叠」旗舰手机,也是全球首款量产 16:10 阔型内屏折叠屏。该产品于去年 3 月发布,起售价 7499 元,首销 48 小时预订量达 120 万台,首周激活量近 10 万台。

2026 年,字节加速推进 AI 手机项目,向林夕抛出橄榄枝。加入字节后,林夕成为 Ocean 团队核心成员,负责豆包手机硬件产品的规划、研发与落地,直接向 Ocean 团队负责人 Kayden(刘成城)汇报。Kayden 为前 36 氪创始人,2022 年其创办的鲸鲮科技被字节收购后入职,目前向字节 Flow 负责人朱骏汇报(来源:界面新闻)

腾讯超级 QQ 秀及小窝业务调整,8 月 11 日起无法使用

6 月 11 日消息,腾讯发布超级 QQ 秀及小窝业务调整通知,因运营策略调整,2026 年 8 月 11 日起,用户将无法登录及使用超级 QQ 秀与小窝。

2026 年 8 月 11 日起将无法登录及使用超级 QQ 秀与小窝,所有装扮功能将不可用。官方建议用户前往商城和小窝截图留念,同时官方也在公告中提供了「一键转存至空间相册」功能,可以在 2026 年 12 月 11 日前使用。

公告期结束后,聊天表情中的超级 QQ 秀表情入口将关闭。如果用户希望在表情栏保留此功能,需要在 2026 年 12 月 11 日前点击公告最底部的【保留】按钮,即可将其保存在表情列表中。公告期满后将无法换装,需要提前搭配好最满意的造型。

超级 QQ 秀(Super QQ Show)是腾讯公司推出的 QQ 秀升级版 3D 虚拟形象功能,于 2021 年 11 月开启测试体验;超级 QQ 秀里加入了可以由用户自行定制的小窝系统和可以走动聊天的室外场景,可以邀请其他用户来访问虚拟小窝。

遭社区强烈反对后,Anthropic 调整 Claude Fable 5 面向研究员的「降智」措施

6 月 11 日消息,此前,Anthropic 被曝会在用户不知情的情况下,限制竞争对手使用新模型 Claude Fable 5 开发其他 AI 模型。AI 研究社区强烈反对后,Anthropic 决定做出点改变。

Anthropic 在给《连线》的声明中致歉称:「我们正在调整 Fable 5 面向前沿模型开发的安全防护措施,让这些措施对用户可见。我们作出了错误权衡,也为没有拿捏好平衡而道歉。」

Anthropic 本周早些时候发布 Claude Fable 5。作为最新模型,Claude Fable 5 加入了额外护栏,用于防止滥用。用户如果询问网络安全、生物学或化学问题,系统会把请求转交给能力较弱的 AI 模型,以降低先进 AI 被用于网络攻击或生物武器制造的风险。

但面对使用 Claude Fable 5 从事前沿 AI 开发的研究人员,Anthropic 原本准备采用另一套更隐蔽的做法:在用户不知情的情况下,故意降低模型表现。换言之,研究人员如果试图用 Claude 训练竞争性 AI 模型,Claude Fable 5 可能会暗中「拖后腿」。

据了解,Anthropic 的服务条款明确禁止使用 Claude 训练竞争性 AI 模型。官方最新给出的措施是,Claude Fable 5 面向 AI 开发的安全防护措施会改为对用户可见。如果 Anthropic 怀疑用户试图使用 Claude 构建高能力 AI,Anthropic 会明确提醒用户系统将拒绝请求,或将用户转到能力较弱的模型。(来源:IT 之家)

传闻称苹果首款触控屏 MacBook 已「100% 确认」

据知名爆料人士透露,苹果首款配备触控屏的 MacBook 现已「百分之百确认」正在筹备当中,引发业界对这款全新形态 Mac 的高度关注。

爆料来自常在中国社交平台活动、代号为「刹那数码」的爆料者,其表示消息源出自供应链内部渠道。该人士过往在苹果新品爆料方面准确率较高,其此次表态也与近期多方报道相互印证。

关于苹果开发触控屏 MacBook 的传闻已经流传数年。

早在 2023 年 1 月,彭博社记者 Mark Gurman 就曾报道称,苹果计划推出一款搭载 OLED 显示屏的 MacBook Pro,作为首款触控屏 Mac 产品,最初内部目标发布时间为 2025 年,但这一时间表最终并未实现。随着时间推移,有关触控版 MacBook 的相关报道愈发频繁,且措辞也越来越确定。(来源:cnBeta)

宝马 M 部门预热神秘性能新车,或基于全新 i3 开发

6 月 11 日消息,宝马 M 部门即将发布一款疑似基于全新 i3 打造的纯电性能轿车。本周早些时候,新车在勒芒耐力赛前现身并被拍到。宝马发布了一段预热视频,确认新车将正式亮相,并称这款车将带来全新设计语言、纯电性能与驾驶体验的新时代

据外媒 BMW Blog 报道,新车预计基于全新 i3 开发,宝马 M 明显进行了更激进的性能化处理。相比新世代「NA0」,这辆纯电性能轿车车身更宽。

报道认为,新车是量产版 M3「ZA0」的可能性较低,因为纯电 M3 预计要到 2027 年晚些时候才会上市。

相比普通 i3,新车加入了黄色双日间行车灯,呼应了宝马赛车传统。前保险杠上的矩形白色光点,也是没有出现在标准纯电轿车上的设计,灯光设计灵感来自 2026 年规格的 M Hybrid V8 耐力赛车。

外后视镜也明显比标准 i3 更外扩。据 IT 之家了解,整个车头形似一辆经过宝马 M 大幅强化的 i3,部分车身面板有望使用天然纤维复合材料。宝马一年前表示,天然纤维复合材料已经具备量产应用条件,未来可取代碳纤维,并显著降低生产环节排放。

此外,新车没有采用标准轴距 i3 的弹出式门把手,也没有使用中国市场长轴距 i3 的半封闭式门把手。报道分析,宝马 M 可能把后门把手低调整合进后车窗上的「霍氏弯角」。(来源:IT 之家)

海外奇闻:邻居家狗开枪走火,游戏电脑挡子弹

一则颇具黑色幽默色彩的离奇事件近日在海外玩家社区引发热议:一名 游戏玩家称,自己的台式游戏电脑竟在深夜「挡下」了一颗从邻居家飞来的子弹,而导致枪支走火的竟然是邻居饲养的狗。

据网名为 angelbabyzz 的用户在 Reddit 论坛 r/pcmasterrace 板块发帖描述,其在某天半夜被一声巨响和迎面而来的玻璃碎片惊醒,当时人还十分恍惚。不久之后,邻居情绪激动地敲门道歉,哭着不停说对不起,并表示非常担心有人受伤。在警方到场调查后,事情的经过才逐渐清晰:邻居家的狗意外触发了家中的枪支,子弹穿墙飞入这名玩家的房间。

警方勘查后告诉当事人,如果不是房间里的游戏 PC 改变了子弹的轨迹,子弹很可能会在他熟睡时直接击中身体。事后,angelbabyzz 又在房间里继续检查,最终竟在自己的枕头下找到了那颗子弹。

从其贴出的现场照片可以看到,子弹先击穿了电脑主板,随后撞上了一根 G.Skill 芝奇 Trident Z RGB 系列内存条,在这里发生偏转,从而避免了更严重的人身伤害。文章调侃称,如今内存条的价格恐怕都快赶上防弹板了。(来源:cnBeta)

  •  

当行业还在卷模型,腾讯在谈怎么让 Agent 上班

作者|连冉
编辑|郑玄
 

6 月 5 日的 2026 腾讯云 AI 产业应用大会上,20 余款 AI 原生产品集中亮相。从营销、电商到办公、风控,再到内容生产与开发协作,几乎每一个企业核心场景都出现了 Agent 的身影。

外界关注的焦点,大多集中在 WorkBuddy、CodeBuddy、ima 等前端应用上。它们能够写代码、生成 PPT、协助办公,已经足够聪明,也让越来越多人看到 Agent 进入真实工作场景的可能性。如果把视角进一步投向产业实践,会发现 Agent 产业未来走向的背后,还有很多现实痛点亟待解决。

过去一年,Agent 已经从概念验证走向落地实践。越来越多企业开始尝试把智能体接入业务流程,甚至专门成立 Agent 团队。但依然普遍面临三重挑战:用不起来、用不放心、用不起。

用不起来,是因为企业知识、业务流程和数据系统长期割裂,Agent 知道如何完成任务,却拿不到需要的信息;用不放心,是因为 Agent 缺乏长期记忆和稳定性,数据安全、权限管理和合规风险始终存在;而用不起,则意味着 token 成本、部署复杂度和运维门槛依然限制着规模化落地。

这些问题并非来自模型能力,而来自模型之外。

也正因此,腾讯云这次没有把重点放在单个 Agent 产品上,而是围绕场景连接力、工程驾驭力和模型驱动力三项能力,尝试构建起企业级 Agent 落地的全链路基础设施。

这背后折射出的,其实是整个 Agent 产业竞争逻辑的变化。过去行业比拼的是模型能力,而现在,比拼的开始变成谁能让 Agent 真正融入企业、进入流程,并最终创造生产力。

01

打通数据与流程,

让 Agent 真正「有事可干」

 

Agent 进入企业后,第一个暴露的问题往往不是模型能力,而是业务能力。

它知道如何撰写营销方案,却不了解企业的产品和客户;知道如何完成审批流程,却看不到组织内部的规则;知道如何分析问题,却拿不到业务系统中的真实数据。

这就是 Agent 落地的第一个核心障碍:场景脱节与数据孤岛。

企业的业务是复杂且碎片化的,一个通用 Agent 不可能覆盖所有场景;而企业的数据又散落在 ERP、CRM、数据库等几十个不同的系统里,每个系统都有自己的接口、权限和数据格式。Agent 往往知道「应该怎么做」,却拿不到「需要用的数据」,更无法融入企业已有的工作流程。

腾讯云的解法是,先筑牢数据底座,再把 Agent 能力嵌入到企业的每一个核心场景中。

在产业应用大会上,腾讯云推出了 DataBuddy 和 CFS Turbo 两款产品,从根本上解决数据「用不了、转不动」的问题。

DataBuddy 是面向大数据全链路的 Agent 工作台,它把数据工程、数据治理、数据分析这三个原本高度依赖专业人员的环节全部 Agent 化。过去需要数据工程师花几天时间编写的 ETL 脚本,现在通过自然语言就能自动生成;过去只有 30% 的核心表能配置质量监控,现在 DataBuddy 能实现全仓自动扫描,智能识别敏感字段、推荐监控规则,覆盖率达到 100%。

它改变了「人操作工具」的传统范式,变成「AI 工作 + 人把关」,让数据从只有工程师能懂的「技术资产」,变成所有 Agent 都能调用的「生产资料」。

 DataBuddy 解决了数据「好不好用」的问题,那么 CFS Turbo 则解决了数据「转得快不快」的问题。

传统 AI 流程中,数据需要在对象存储和高性能存储之间反复搬运,不仅耗时耗力,还容易出现数据不一致的问题。

CFS Turbo 作为高性能并行文件存储,首次实现了文件语义和 S3 对象语义的实时强一致,企业无需再进行任何数据搬运,就能在一个统一平台完成从数据注入、清洗、训练到推理的全流程操作。同时,它配备的元数据检索引擎和自然语言 Agent 检索能力,让百 PB 级数据的检索效率提升了千倍,Agent 可以像员工一样,随时找到自己需要的任何数据。

有了坚实的数据底座,再把 Agent 能力无缝嵌入到企业的各个业务场景中。

从营销环节的 MAGIC AI 原生营销云腾讯、交易环节的品牌全域经营伙伴云 Mall,两大产品以「Agent 协同」为底层架构,推动企业经营从「人配置系统」迈向「Agent 组织系统」。以统一数据底座打通「公域获客 ↔ 私域运营、营销转化 ↔ 交易复购」,助力企业构建全域智能增长闭环。

到办公环节的腾讯会议 AI,再到风控环节的天御风控 Agent,内容生产与处理环节的音视频 AI 品牌 WAND,真人剧 Agent,运维环节的 DatabaseClaw 数据库 Agent……

在运维这样高度依赖专业经验和实时数据的场景里,DatabaseClaw 则进一步展示了 Agent 如何基于数据底座完成真正的执行闭环。

作为腾讯云基于 10 万余条内部 DBA 真实工单经验打造的生产级数据库 AI Agent,DatabaseClaw 能够直接连接数据库运行数据和业务数据,无需人工导出日志、上传指标,就能完成从监测、分析到执行的完整流程。

过去,数据库出现异常后,往往需要 DBA 逐步查看监控指标、排查 SQL 日志、分析业务流量,再结合经验判断问题根因。

现在,当系统出现慢查询告警时,DatabaseClaw 可以自动调取近 7 天的性能曲线、SQL 执行记录和业务流量数据,完成根因定位,并生成对应的优化方案。在人工确认后,Agent 即可执行索引优化、参数调优等操作,将原本数小时的排障过程压缩到几分钟内。

更重要的是,它让数据库运维具备了自然语言交互能力。即使不是专业 DBA,也可以通过对话完成数据库巡检、性能诊断和故障处理。

这种「数据底座 + 场景嵌入」的模式,核心逻辑不是让员工去适应新的 Agent 入口,而是让 Agent 去适应员工已经习惯的工作流。员工不需要学习新的系统,就能在每天用的营销工具、办公软件、运维平台里,获得 AI 的能力加持。

这或许才是 Agent 真正能在企业里普及开来的关键。

02

要进入核心业务,光聪明还不够

 

解决了「有没有活干」的问题,接下来要解决的是另一个更现实的问题:企业敢不敢把重要工作交给 Agent。这也是企业级 Agent 落地最大的一道坎之一。

过去一年,大量企业已经开始尝试把 Agent 引入真实业务场景,但大多数应用可能仍停留在辅助层面:查资料、写周报、生成文案、整理会议纪要。真正涉及决策、运营、风控等核心环节时,企业往往会变得格外谨慎。

原因并不复杂。现在的 Agent 还不太可靠。它可能会「失忆」,聊到一半就忘了之前的上下文;也可能会一本正经地胡说八道,给出错误的决策建议;更重要的是,把核心数据和业务交给一个黑盒一样的 AI,一旦出现数据泄露或者操作失误,后果不堪设想。

当 Agent 开始接触企业知识、业务流程和核心数据后,问题已经不再是模型能力,而是可靠性、可控性和安全性。

腾讯云此次发布的一系列产品,正是围绕「可靠性」和「安全性」这两个核心,构建起完整的工程驾驭力体系,让 Agent 从「能用」变成「敢用」。

首先要解决的是 Agent「失忆」和「不懂企业」的问题。企业 Agent 最大的价值,其实是它对企业专属知识和经验的理解与沉淀。

腾讯乐享重新定义了知识库的形态。

传统知识库服务的是员工,而 Agent 时代的知识库开始服务 Agent 本身。文档、案例、经验和流程不再只是被阅读,而是能够被检索、调用,并进一步转化为 Agent 执行任务所需的能力。

从某种意义上说,企业正在经历一次知识体系的重构。过去知识沉淀在人身上,未来知识需要沉淀在 Agent 能够理解和调用的系统之中。企业可以把所有的文档、手册、案例、经验都沉淀到腾讯乐享中,Agent 不仅能通过自然语言精准检索,还能把专业人士的方法论封装成 Skill,实现能力的规模化复用。

但知识只是第一步。比知识更重要的,是记忆。

当前大多数 Agent 仍然停留在「任务完成即结束」的阶段。一次任务结束后,上下文随之消失,经验无法沉淀,组织知识也无法积累。这也是为什么很多企业 Agent 看起来很聪明,却始终无法成长。

腾讯云数据库推出的 Agent Memory 服务试图解决的正是这个问题。

它构建了从短期记忆、长期记忆到团队记忆的完整生命周期管理体系。在短期记忆层面,通过上下文压缩技术,自研了符号化压缩和上下文卸载能力,可以在长任务场景下帮助 Agent 提升 30% 的任务成功率,同时节省 30% 到 60% 的 Token 成本。

在长期记忆层面,通过四层渐进式记忆提取方案,显著提升了 OpenClaw 的长期记忆能力。在 PersonaMem 测评数据集上,我们将 OpenClaw 原生记忆评测得分从 48% 提升到 76%。

在团队记忆层面,构建了员工私有域、部门协作区、组织全局库三层权限体系,把分散在对话、任务、文档和流程中的团队上下文组织起来,形成可被多个 Agent 复用的共享记忆层。

更重要的是,它能自动把员工的隐性经验转化为可执行的 Skill,真正做到「人走经验留」。当 Agent 拥有团队记忆之后,它就开始具备了「数字员工」的特征。企业投入的每一次使用、每一次协作、每一次决策,都有机会转化为新的组织资产。

而当 Agent 真正进入核心业务之后,安全问题也随之成为新的挑战。

过去,安全更多是 IT 系统的问题;而在 Agent 时代,安全开始变成 AI 治理的问题。

Agent 拥有调用工具、访问数据和执行任务的能力,这意味着 Agent 有机会充分接触企业数据,带来潜在的数据安全风险。对于金融、政务、医疗等行业而言,这种风险尤其敏感。

AICC 可信集群致力于实现可信、可控、可验证的大模型推理能力,确保企业 Agent 在调用 LLM 的过程中,不会泄漏任何数据。

它基于硬件信任根构建了端到端的密态推理环境,所有数据全程加密流转,不会以明文形式出现在任何环节。同时提供了可证明的安全机制,企业不仅自己知道数据是安全的,还能向客户和监管方证明这一点。在易用性上,AICC 实现了 30 秒快速拉起推理节点,支持所有主流模型,并且通过多级 KVCache 优化,大幅降低了推理成本。

AICC 可信集群能够解决企业最担心的「数据泄露」和「合规证明」两大问题,让 Agent 终于能进入金融、政务、医疗这些对安全要求极高的核心场景。

当企业开始要求 AI 不仅能工作,还必须解释自己如何工作、证明自己足够安全时,Agent 竞争也开始从模型能力竞争进入工程能力竞争。

03

从实验项目变成基础能力

 

当 Agent 解决了「能用」和「敢用」的问题后,最后一道坎就是「用不用得起」。这是 Agent 能否实现规模化落地的关键。

今天,很多企业的 Agent 项目都面临着成本失控的问题。

一个中等规模的企业,每月的 token 费用就能达到几十万甚至上百万;再加上服务器部署、运维、模型调优等成本,让 Agent 变成了只有头部企业才能玩得起的「奢侈品」。同时,个人和中小企业想要部署自己的 Agent,也面临着极高的技术门槛。

腾讯云的模型驱动力,通过技术创新和工程优化,大幅降低 Agent 的部署和使用成本,让 Agent 从「奢侈品」变成所有企业和个人都能用得起的「普惠工具」。

在部署门槛上,腾讯云推出了从个人到企业的一站式解决方案。针对个人用户和开发者,轻量云 Lighthouse 提供了一键部署云端 Agent 的能力,无需懂服务器运维,就能拥有一个 7×24 小时在线的专属 AI 助手。它还打造了「龙虾医院」、云端 Agent Chat 等功能,解决了开源 Agent 部署难、运行不稳定的痛点,目前已经积累了近 10 万人的开发者社区。

针对企业用户,ClawPro 企业级智能体管控台实现了 Agent 的统一管理、权限审计、成本监控和技能库建设。企业可以一键为员工分配数字员工,细粒度控制每个 Agent 的权限和成本,解决了企业规模化部署 Agent 的管理难题。

在推理成本上,腾讯云大模型服务平台 TokenHub 通过一系列技术创新,实现了算力的极致利用。

它支持混元及所有第三方主流模型,能根据任务的复杂度和成本要求,自动进行多模型智能路由,让每一个 Token 都花在刀刃上。依托潮汐调度、FlexKV 分布式缓存等技术,TokenHub 实现了整体算力利用率提升 40%,缓存命中率提升至 85%,有效降低了 Agent 的推理成本。

这种「低门槛 + 低成本」的模式,让 Agent 的规模化落地成为可能。

腾讯云内部的实践已经证明了这一点:CodeBuddy 覆盖了腾讯 95% 以上的工程师,整体编码时间缩短了 40%;WorkBuddy 实现了人和 AI 混编开发,几个人的小团队仅用两天就能完成初始版本开发,并且保持 2 天一个版本的迭代速度。

当 Agent 开始走出实验室,进入企业的生产流程,决定它价值的因素就不再只是模型本身,而是支撑它运行的整套基础设施。

场景连接力让 Agent 有事可干,工程驾驭力让 Agent 可靠安全,模型驱动力让 Agent 用得起、规模化。这三大能力,构成了企业级 Agent 落地的完整闭环。

在 Agent 产业的竞争中,谁能搭建起最完善、最易用、最安全的 Agent 运行环境,谁就能占据先机。

这也是腾讯云此次发布传递出的一个重要信号——Agent 产业正在从能力验证阶段进入规模化落地阶段。

未来决定企业竞争力的,将是能否以足够低的成本、足够高的效率,让 Agent 真正融入组织运行之中。

*头图来源:腾讯云
  •  

没有星图和蒲公英的海外市场,品牌的百亿预算怎么花?

达人营销,正在从大品牌营销部门的内部实验,变成几乎覆盖所有大公司、创业者的增长标配。

从体感来看,不管是国内的抖音、小红书平台,还是海外的TikTok、Instagram,用户逐渐增长的屏幕时间里,也同时伴随着越来越多的广告和植入内容。

市场也验证了这个赛道的快速增长。根据 Statista 的统计,过去5年全球达人营销市场的规模翻了3倍,平均每年的增速超过30%。这种全新营销方式也给品牌方带来了显著的曝光效果:Stanley 这个拥有近百年历史的保温杯品牌,依靠海量创作者在社交平台上的种草,从破产边缘「返老还童」,成为了如今中国都市白领几乎人手一只的时尚单品。

但「市场大」并不意味着「流程顺」。在国内,品牌方可以在星图、蒲公英等平台搭建的工具里,相对顺畅地跑通找人、交易、结算的流程;但一旦切换到海外市场,这种便利流程就会大打折扣:海外没有星图这样的「达人基建」,每一个具体环节都需要人力一点点去趟。

那些家大业大的品牌,也许靠砸人力堆出增长业绩,只是增长的曲线未必完美;但对于小规模创业团队来说,这套人海战术就很容易成为工作流里的重要卡点。

而这些简单、重复、耗费人力的环节,恰恰落在这轮 AI 技术变革里已经被反复验证的提效能力范围内。当然,前提是有人把模型能力真正打磨成一件能上手的产品。

 

海外达人营销:够大,也够「痛」

达人营销,面子上是在做内容、搞创意,实际上的难点其实在规模化和做执行。找到一个达人不难,难的是同时和上百个达人推进合作。发现、建联、议价、寄样、催稿、审稿、回收数据……每一单背后,都由这些琐碎的环节拼凑而出。

在海外,这套流程会更加困难。海外的达人营销属于典型的「散对散」市场:一端是极度分散、各自为政的海外达人;一端是投放需求逐年上涨的创业团队——而且还没有像星图、蒲公英那样的聚合入口。

主导生态的YouTube和Meta把达人营销相关业务开放给了第三方,使得整体海外达人营销市场呈现“去中心化”的生态格局,创作者、品牌和平台彼此独立,没有任何一方能够建立统一的交易闭环。

对品牌来说,每次合作都要从茫茫人海里捞人、逐个建联谈判;对达人而言,则只能被动等待、零散地接活。两头都麻烦。

近两年,一家名为 AhaCreator 的创业团队,正试图改变海外达人营销这个「散对散」的局面。目前AhaCreator 已经覆盖全球10万多海外达人,付费企业用户超过 300 家,不仅有SeaArt、Hakko AI、ONLYOFFICE这些AI产品,还有WonderBiotics、Sportneer等品牌。

有意思的是,团队核心成员来自 CreatorIQ、Traackr、TikTok Creator Marketplace 等传统海外达人营销体系内部。这个环节有多「苦」多「痛」,他们太懂了。

过去,想啃下海外营销这块硬骨头,无非两条路:

一条是自建 in-house 团队,招一批人专门盯海外达人。好处是可控、贴身,但想放量就得堆人,成本和管理难度跟着水涨船高;

另一条是把活外包给海外的 agency,借它们现成的人脉和经验。省心,却换来另一重代价:中间隔了一层,过程不透明,达人是怎么选的、报价是否合理、进度卡在哪,品牌往往看不真切,灵活性也大打折扣。

两条路看似不同,但本质上都依赖人海战术。而在纯人力模式下,一堆本可能贡献真实转化的中小达人,却极有可能因为「不划算」被排除在品牌的决策之外。

而说到底,无论自建还是外包,过去都是在「人」这个变量上做加减法,天花板早已注定。

AhaCreator 的思路是:用 AI 和新技术把这个赛道重做一遍,提供能主动工作的「AI员工」,让现有的「人力」效能上涨数十倍。不仅更快,也让过去因为被人力上限压住的规模,重新回到牌桌上。

 

既提效,也搭建信任机制

AhaCreator 给自己的定位,叫做「AI原生达人营销双边平台」。核心产品逻辑可以理解为一边链接品牌,一边链接达人,而中间那些依靠大量人力的工作,交给 AI 大幅提效。在这套逻辑下,AI 「接管」了很多执行工作,人的精力更多被集中在了关键节点的判断里。

于是,具体的流程被变成了这样:品牌方填进预算和产品信息,剩下的匹配、建联、议价、催稿、审稿、回收数据,AI 一路自动推进,品牌只需要在四个节点上拍板——建好一个 campaign、审一遍 AI 选出的达人名单、审一遍达人交来的内容、看一眼最终数据。换句话说,过去要一个团队连轴转的流程,被压缩成了「四次点头」。

这「四次点头」,甚至不必专门登录一个陌生后台。AhaCreator把这套流程接进了飞书:活推进到需要拍板的节点,AI 会在飞书群里弹出一张卡片,点一下就完成决策,团队成员也能在同一个群里一起看、一起定。对一个本就只需偶尔介入的流程来说,把决策入口放进团队每天都在用的工具里,比让人再开一个网页顺手得多。

通过 AhaCreator,AI 的能力开始让重复劳动产生出规模效应。那些曾经因为「不划算」而被放弃的中长尾达人,也第一次被纳入了射程。

这不是纸上谈兵。AI 编程产品 CodeFlying 是个五人左右的小市场团队,借助 AhaCreator,每月能稳定推进七八十位达人的合作;AI 游戏陪伴产品 Hakko AI 海外注册用户超过两百万,它的月度达人合作量,从最初的不到十位涨到了接近一百位。前者这说明 AI 能让小团队以一当十,后者说明它能把一家公司的合作规模成倍放大。

把镜头拉远,AhaCreator 的用户名单里,AI 类创业者扎堆出现:AIGC 工具 SeaArt、AI 设计的 Pixso、AI 剪辑的 Vizard、AI 效率工具 Presenti、AI 音乐视频 VibeMe AI……几乎每个 AI 细分赛道,都能在上面找到一个跑海外达人投放的代表。这并不难理解——这批公司大多团队精简,却要在海外快速起量,正是「靠人堆不动、又必须规模化」的典型。

在供给侧,目前在 AhaCreator 平台超过十万多名达人里,AI 科技类占比最高,已超过 13000 人,足够接住这些 AI 品牌的需求。

在AI领域之外,电商和游戏这两个赛道,今年用户量激增。电商这边最值得一提的是飞书:AhaCreator 成了它首个海外达人营销 AI Agent 合作伙伴。被飞书选中和被一个个买家选中不一样——飞书电商版是字节旗下做电商生态的一环,它的认可本身就有分量;更重要的是,它不是代表自己下单,而是替平台上一整批做 DTC、做消费品的商家,把同类产品比了一圈之后才挑中 AhaCreator。这一次点头,背后是一个群体的需求。

而这套产品的另一个核心价值在于,它为跨境合作搭起了一套信任机制。

跨国达人合作里让人担心的,不光是内容质量,还有交易的安全。双方隔着十几个时区、素未谋面,品牌怕付了钱对方不干活,达人怕干完了拿不到钱,又没有共同的平台和能追责的渠道——这份天然的不信任,过去只能靠反复沟通、靠运气,或者干脆只跟合作过的熟人来对冲,无形中又把合作规模摁住了。

AhaCreator 在流程里内置了一道护栏来接住这个问题:每笔合作都走经本地法务校验的标准化合同,资金由平台全程托管,达人的历史记录、准时率、品牌评价在确认前都可查;达人没按时按量交付,平台就全额自动退款;跨境打款也由平台统一处理。

有了这套覆盖140多个国家的交易信任机制,品牌不必再赌对方人品,达人也不必担心白干。虽然看起来不够性感,但恰恰为海外营销产业链上的每个参与者,搭起了一块让分散的双方都愿意把交易放上来的共同地基。

 

从「关系」变成「数据」

把视线拉回整个行业,我们会看到一个更大的变化正在发生。

过去,达人营销比拼的是资源。谁手里的达人多、谁认识的人广,谁的生意就越好做——这门关系和「人脉」息息相关。

在 AI 时代的达人营销生意里,其实这套逻辑依然存在,但物理世界的「人脉」需要转化成 AI 领域里的一个重要资产:数据。这些过去只存在于某个人脉、某段经验里的「关系」,通过沉淀成可被调用、计算的数据,可以赋能AI更好地建立关联。

AhaCreator 的双边平台模式,恰好踩在了这个变化上。它让 AI 带着真实商单去主动建联海外达人,达人发现真能接到活、赚到钱,便顺势留下;达人越多,又反过来吸引越多品牌。平台每转一圈,攒下的数据就厚一分,匹配和议价也更准一分,再去吸引下一批人——这就是所谓的「数据飞轮」。

和很多双边平台不同,它没有靠烧钱补贴去硬拉两端——据了解,平台上一半以上的企业客户是自己找上门、自主跑通了首次付费和后续增购的。按 AhaCreator 透露,过去一年平台收入增长数十倍,老客户增购率极高。能不靠烧钱就换来这样的增速,靠的正是产品本身的 AI 驱动力。

这套能力依托于 AI 的模型能力,但一笔笔真实成交里沉淀下来的数据——谁以什么价格、接了什么样的活、效果如何——又是通用大模型缺少的训练语料。大模型越强、越便宜,对这类平台反而越是利好:它把理解需求、跨国沟通的成本一再压低,而壁垒始终长在平台自己这一侧。、

这套「下笨功夫、攒数据」的逻辑,互联网历史上验证过。当年在线旅游巨头忙着抢大型连锁酒店时,Airbnb 在做最不起眼的活——创始人挨家挨户上门帮房东拍照片、定标准;美团面对千万家连收银机都没有的夫妻小店,靠地推一家家去谈。这些垂直行业里的脏活累活,让它们攒下了别处难有的东西:陌生人之间的信用、商户的真实履约数据。这些数据不在公开市场上流通,最后成了它们最深的护城河。

所以,与其把 AhaCreator 看成一个更聪明的 AI 工具,不如说它是一个 AI 原生的双边平台。工具会被更强的模型迭代掉,但平台和它沉淀下来的数据不会。

滴滴撮合了司机与乘客,美团连起了小店与食客,每一个「散对散」的市场,最后都长出了自己的基础设施。海外达人营销,或许正在等来它的那一个。

  •  

AI 泡沫里的硅谷:清醒的赌徒,与疯狂加倍的牌桌

「距离 AI 泡沫接受考验,还有六个月。」今年 4 月底,一位硅谷投资人平静地对我们说道。

但不到一个月之后,「六个月」就压缩成了「三周」。

把这个时间表提前的,是 SpaceX。5 月 20 日,它公开招股书,募资 750 亿美元,估值 1.75 万亿,这或许是美股史上最大的一笔 IPO。紧随其后, Anthropic 、OpenAI 递交招股书,估值都冲上 1 万亿。而这三家 AI 巨头即将到来的 IPO要从整个市场上抽走的钱,是去年整个美股 IPO 市场的10倍。

一旦上市,账本就摊开在所有人面前。AI 业务的真实成色、续约率、现金流,只要一个数字不及预期,恐慌就会被点燃。二级市场先崩,一级市场的钱跟着抽干,一个建立在 AGI 期望之上的市场,要重新看待AI的价值。而那些刚刚入场、靠 AI 故事撑着估值、却拿不出真实收入的创企,会是第一批出局的。

但这一周在硅谷,我们看到的不是恐慌。今天的 AI 泡沫,已经不是早期那种「被风口吹昏头脑」的狂热。更微妙的是,泡沫还在继续吹大,但已经有人悄悄准备好了救生艇。我们聊了一圈投资人、创始人、工程师,没有一个人真正离场,但每个人都在给自己留后路。

为什么这些最聪明的人,没有一个先走?为什么明知道脚下的地在晃,他们还在加注?这场一边膨胀、一边准备逃生的泡沫,最后会通向哪里?今天发生在硅谷的事,从不会只停在硅谷。无论你在做 AI、投 AI,还是只是被 AI 改变着工作,硅谷这群人此刻面对的难题,迟早会摆到我们每个人面前。在我们坐上去之前,可以先看清楚那些已经在桌上的人,在做什么、在想什么、在押什么。

 

一、硅谷里的AI泡沫:无处不在,无人下桌

 

过去,AI 泡沫对我们是一组数字。五大科技公司今年要在 AI 上花掉近 7000 亿美元,比瑞典一整年的 GDP 还多;华尔街把标普 500 四成的盈利增长,压在了这一个赛道上;有机构算过,围绕 AI 的这场建设,盘子有 3 万亿美元。数字越大,似乎和自己越没关系。

等我们坐在硅谷,泡沫才从一串数字变成了更具象的细节。一份合同的有效期,一个团队的产品进度,一条增长曲线的真实斜率,这些东西从来不会写入报告里,但拼起来,才是泡沫最真实的模样。

更值得关注的,是硅谷里的人。我们发现,多数人并不觉得自己是吹泡沫的人。在泡沫里待久了,吹泡沫的话术,就成了说话的方式。没产品,可以先讲未来;没利润,可以先报增长;没验证,可以先要估值。当所有人都这么讲,讲多了,就已经成为「正常」。正常到身处其中的人也分不清,哪些是真的有价值,哪些只是被泡沫抬上去的。而刚入行的人甚至觉得,AI 行业本来就该是这样。

但真正定义这场泡沫的,不在数字本身,而在数字背后的结构。我们越往里走越发现,泡沫不在某一个角落,它在每一层,大厂、创业公司、还没进场的人,各有各的泡沫,只是长得不一样。

最上面一层是大厂。Alumni Ventures 的投资总监 Bryan Liu 跟我们拆过这里面的逻辑:今年大厂买 AI,很多时候不是因为算过效果,而是因为「adopt AI」已经成了一种共识。「CEO 的年度计划里必须有它,采购的门必须先打开。」买,不是因为确定有用,而是因为不买这个动作,就等于承认自己掉了队。这正好对得上 MIT 2025 年年底发布的报告,企业在生成式 AI 上砸下三四百亿美元,95% 项目至今没有回报。钱花了,效果约等于零,人们却还在继续花。在企业面前,AI 泡沫吹的不是价值,是姿态。

这些钱往下流,就变成了创业公司的增长故事。但我们发现,企业把门打开,不代表它会真金白银地长期下注。它们越来越少签三年的长约,转而先给一个六个月的试用,看到结果再谈续约。于是很多创业公司手里攥着一把六个月的短单,把它们写进 BP、做成案例、叠进一轮高过一轮的增长曲线。至于这些短单最后有多少能变成长期合同,没人说得准。

所以创业公司的泡沫,其实是上下游一起鼓吹起来的:

大厂用短单表态,创业者用短单融资,投资人买单再转手,谁都没急着说破。

不过,在这样的泡沫中,难受的是那些刚刚进场的人。当先发者的估值和 ARR 被抬到高位,后来者会发现,光靠做出真东西已经很难追上去了,除非你也能讲出一个足够漂亮的故事,把融资和估值快速冲起来。客户门槛越垫越高,融资越来越难,被裹挟着卷入泡沫里的人越来越多。

硅谷街头的创始人们正在「描绘」自己未来|图片来源:极客公园

三类人,三种位置,三种押法。

当然,这片繁荣之下并非全是水分,也有真东西在长。

比如说语音 AI赛道,过去一家跨国公司的客服中心要养几百万人,但像 ElevenLabs 这样的语音公司起来之后,不少大厂直接把整个 call center 关掉,换成语音 agent,一签就是六七年。「这种需求是实打实的,钱也是真金白银。只是在今天的硅谷,能把价值这样落到实处的,还是少数。」Bryan 感叹到,如今想要在泡沫里去找到这样的真企业也越来越难。

但让我们印象最深的,不是这场泡沫有多大,而是几乎每个人都看得见它,却没有一个人愿意让它停下来。而看清楚之后,大家做的不是离场,而是一些隐秘的保护,企业比如不再轻易签长约,先用六个月探一探;创企们比如一边讲着故事,一边悄悄给自己留条后路。

泡沫照样在吹,只是每个吹的人,都给自己留好了退路。

 

二、留在桌上的人,都在看什么

「每一个留下来的人,押的到底是什么?」翻完这一周的对话,我们发现答案五花八门。

创始人赌自己能跑到下一轮,活下去。投资人赌自己提前押中了那家公司,赌的是概率。工程师赌的是一条没人看好的技术路线,赌它将来会翻盘。三个人坐在牌桌的不同位置,谁也说服不了谁。但谁都没真的离开,这或许才是这场泡沫最反常的地方,所有人都看见了风险,所有人都还在持续加注,只是各自押注的方式不太一样。

 

1、创始人:有人猛踩油门,有人强按刹车

最有意思的是创始人。这一周在硅谷,我们见到两类截然不同的创始人,面对同一场泡沫,选择了相反的方向。

桑文属于前者。他曾在停车软件这个跟 AI 毫不相关的赛道做了十年,这一轮AI创业潮才切进来。他相信 AI 正在创造一个全新的市场,用他的话说,这是「market pull(市场驱动)」,不是你推,是市场在要,「而且还不够」。

桑文正在讲述自己早期的创业经历|图片来源:极客公园

而 Genspark 也确实赶上了 AI 叙事最值钱的时候。种子轮拿 6000 万美元、估值 2.6 亿美元时,公司还没有任何营收。但它也是少数真正跑出高速增长的公司,产品上线 9 天 ARR 破 1000 万美元,45 天飙到 3600 万,9 月底超 5000 万,到 2026 年 3 月突破 2 亿、3 月底 2.5 亿。

钱和信心,Genspark 都不缺,在纽约和旧金山,地铁里、楼宇上、街边,我们到处能撞见 Genspark 的广告。

但即便是跑出来的明星初创,也很少把所有筹码压在一条路上。这一轮 AI 创业潮里,已经能看到不少头部独角兽在估值高点同时铺设另外一条路,保持高速增长的同时,悄悄观察被大厂收购的可能性。被巨头收编,正在成为这一轮明星创始人给自己留的另一种后手。

不过,像 Genspark 这样一击即中的 AI 创企,终究是少数。另一位创始人翔峰的创业历程经历了更多转折。

他履历不差,在百度、小米做过高管,把小米的海外应用商店从 0 做到约 1.5 亿月活。2022 年底离开创业,ChatGPT 一出来就转向 AI。第一个项目做 AI 英语学习,做了两年,盈利、退出;第二个做视频 agent,融了资,最后没做下去;现在的第三个,计划做类似 Claude Computer Use 的电脑端 agent。

在AI泡沫里摸爬滚打几轮下来,他看市场冷静了很多。在他看来,AI 的渗透率远没有外界以为的那么高,普通人的生活跟 AI 几乎不沾边,机会恰恰藏在这片还没被挖开的地方。

我们见到他时,他正在 Palo Alto 做市场调研,找下一个垂直方向。他甚至觉得,泡沫带来的某些变化,对创业者反而是好事:「Claude 4.6 之后,做产品不再需要那么多人、那么多钱,可以更接近 PMF 再去融资,创始人的掌控权和股权都更划算。」所以他不急。宁可慢,把方向看准,把船造稳。

一个把油门踩到底,一个主动松了油门。但谁都没下桌。桑文的「快」,赌规模和声势能带他穿过周期,要么大到活下去,要么贵到被买走;后者的「慢」,在赌认知和耐心能让他熬过退潮。等风停了,船还稳稳浮在水面上。方向相反,但其实都在为泡沫退去之后,自己还能不能活着做准备。

 

2、投资人:泡沫之外,要看到 AI 革命的本质

如果说创始人是最知道泡沫有多大的人,那投资人就是最清楚泡沫怎么起来的人。他们的纠结也在这里,理性上,水分有多少、真假优秀的公司有多难分辨,他们一清二楚;但他们也比谁都清楚,泡沫挤掉之后剩下的那部分,才是这一轮产业革命真正值得押注的方向。

我们见到的一位资深投资人嘉加资本 Holly,原则定得很硬。「我不撒胡椒面,」她说,她不做最早一轮,一定要看到市场化产品、看到 PMF 才下手。在她看来,那种广撒网的回报其实非常有限,「后面稀释到连个胡椒面都不是了」。

但就是这样一个人,最近也破了例。几位顶尖 AI 研究员组队成立了一家公司,还都没做出具体产品,估值已经冲到了几十亿美金。

Holly 最后也出手了,尽管她清楚地知道,这并不完全符合自己一贯的投资框架。但有些机会本身就不属于标准答案。在硅谷,真正稀缺的从来不是资金,而是顶尖人才的组合。当最优秀的人开始一起创业时,融资往往不是单向筛选,而是双向奔赴。

投资人在判断项目,创始人也在判断谁能成为长期同行者。

毕竟,好项目靠争取,不靠等。

「泡沫不可怕,挤掉泡沫之后剩下的实质,才是关键。」在 Holly 看来,投资人要做的就是在认清风险的同时,依然敢于理性地入局。泡沫会破,但产业革命的本质不会变。看懂这一点,才知道该往哪里押注。

另一位投资人 Bryan 判断「水分」的标准简单得多:看一家公司,先看它的客户是谁。服务别的 AI 创业公司的,风险高,因为它的收入建立在别人的泡沫上;卖给传统行业真实需求的,相对更稳一些。

说到底,硅谷里的投资人比谁都清楚泡沫的存在。但他们要解的从来不是「这是不是泡沫」,而是在一片都看见的泡沫里,让自己的判断力发挥出更大的价值。资金从来不缺,缺的是在所有人都还在下注的时候,依然分得清哪些公司能穿越周期、哪些只是被一起抬上去的。这一点上,谁的判断更准,谁手里的钱就更值钱。

 

3、工程师:在大厂内部,看见摇摆与迷茫

比起创始人和投资人,大厂里的工程师,视角要更靠近内部。他们既能摸到大厂砸进 AI 的真金白银有多重,也能看见高层在不同技术路线、不同业务之间,怎么来回摇摆。

我们见到的一位工程师Thomas,在一家头部大厂做大模型,读博时研究的是模型的基础理论。他对泡沫的感受先从一个词开始:信仰崩塌。在学校做研究,讲究的是有一套数学框架去推演。进了工业界他发现,没人关心那些一堆不切实际的理论假设,更没有人在意那些玩具大小的「真空中的球形模型」,大规模测试上的性能指标才是一切:「有效果就行,没人在乎你为什么对」。

他看到的摇摆是具体的:阿里曾 all in 开源生态,最终却以林俊旸下课标志着全面闭源化的开始;字节从一开始就专注打造闭源的产品级模型,但兼顾学术发表的步伐也在渐渐放缓;Google 在BARD的滑铁卢和BERT生态的全面崩溃下,也不得不大刀阔斧重组团队打造了后来占据着顶级模型守门员地位的Gemini。

不同的问题,不同的困境,几家最聪明的公司给出了不同的答案,但都指向工业化、闭环生态和可变现潜力。在外面看,这是「巨头都在重金投入 AI」的繁荣,在内看,这却是现实压力之下的创新力凋零与更深层次上的茫然。

而在这套茫然里最难清醒的,不是底层工程师,也不是最高层,是中层。因为底层只管把手上的活干好,高层可以随时调头换方向,唯独夹在中间的人,一点点看着过去十年的经验,在新范式里失效。「他们知道大方向是 AI,却不知道自己十年攒下的东西,还能落在哪。」他说道,这种清醒里带着一种游离感。这也是泡沫增长过快导致的后果之一,大量从业者某天忽然发现,自己引以为傲的积累,需要重新校准。

最后,他还讲一个黑色幽默的判断。我们问他,到底什么不会被 AI 替代。他说,消费和履约。「坐牢和花钱是第一生产力,别的都是虚的。十年寒窗,不如十年铁窗。」他还拿特斯拉 FSD 举例,技术上替代司机早就没问题了,可方向盘后面还是得坐个人,因为万一出事,得有人负责。「一个机器人要是把别人的头拧掉了,你得替它去坐牢。这个需求,是不可消灭的。」

在他的推演里,未来或许每个人还干着原来的活,但最费神的那部分早被 AI 接管,人留在岗位上,只负责为这份工作的结果负责。换句话说,当能力可以被无限复制,最后还属于人的,可能只剩下「承担后果」这件事。「这甚至是比较理想的结果,人还有价值。」

一个在最前沿写代码的人,最后把人的价值,落在了「还有人能为出错负责」上。泡沫吹得越高,这句话听起来越不像玩笑。

创始人赌自己能活到退潮,投资人赌自己能先上车再下车,工程师赌的是一条还没被验证的路。这里没有人离场,也没有人全押。他们看到的泡沫不一样,手里的筹码不一样,但每个人都在加注的同时,也给自己留好了那条随时能抽身的路。

在一个所有人都说「是泡沫」的地方,这或许是唯一称得上理性的活法。

而泡沫真正留给这群人的,不只是焦虑与迷茫,还有一批被逼出来的新判断。

 

三、泡沫逼出来的五个新判断

 

泡沫从来不只带来风险,它也逼出进化。当估值、叙事、节奏全被打乱,这个生态里最聪明的人没有停下来抱怨,而是顺势把一批原本想当然的事重新想了一遍:一家公司到底该怎么估值,出海第一天要先回答什么,押在哪条技术路线上才不会被叙事带偏。

 

这种「重新思考」,在硅谷一线已经成了从业者每天都在做的功课。与其说是被环境逼的,不如说是聪明人面对不确定时的本能。

硅谷的创始人们在活动上「重新思考」新的判断|图片来源:极客公园

 

硅谷的今天,大概率是我们的明天,这五个判断,是我们从硅谷带回来的剧透:

 

1、评估一家 AI 公司的标准主要看五点:营收的质量、算力的自主性、护城河、资本效率、合规与治理。

  • 营收的质量:怎么收款、回款周期、客户流失率、获客成本、合同来源、合同的签署方式;
  • 算力的自主性:Infra 公司对算力的依赖程度有多深,与云厂商和芯片厂绑定情况;
  • 护城河:哪一部分是真正不可被替代的;
  • 资本效率:钱用在了哪里,融资规模和企业真实产出是否匹配;
  • 合规与治理:合规、治理、组织架构,以及团队的构成情况。

 

2、出海不再是做大以后的选择题,而是注册公司那一天就要回答的必答题,存在四个象限:

第一象限·市场:核心市场到底在哪,要想清楚理论上的总盘子有多大,其中受你的产品和定位限制、你真正有能力服务的有多大,再到考虑了竞争和获客之后、你短期内真正拿得下的有多大。

第二象限·核心团队与核心技术的来源:核心技术以及关键人员从哪里来,在哪里,经手了那些地方的资源。

第三象限·退出:未来将会选择在海外退还是国内退。

第四象限·怎么融资:钱和钱是不一样的,区别不在金额,在它背后带来的是资源还是麻烦。

 

3、模型的路线之争远没有结束,今天主流路线赢下的与其说是技术,不如说是叙事。 

目前几乎所有资源都压在同一条路上,transformer、自回归、规模法则,默认模型参数「越大越好」。但这条路有物理上限,算力堆不到无穷,而它的领先越来越靠 benchmark 上的分数来证明,而不是底层逻辑的不可替代。

主流视线之外,扩散、非自回归这些「非共识」路线一直有人在做,今天不被相信不代表永远。一旦 benchmark 失信、或规模先撞上成本的墙,未来一两年技术路线的话语权完全可能重新洗牌,把「现在最强的路线」当成唯一正确的路线,是这个阶段最容易犯的错。

 

4、AI ToB 的方法论要重新想,AI 的边际成本结构和移动互联网根本不是一回事。 

过去做 SaaS,圣杯是用户规模,先做大盘子,再谈变现。但当一个人加一套 agent 就能干过去一百人的活,"做大低客单价用户"的旧打法不再天然成立。在边际成本极低、单客价值极高的场景里,少数高客单价客户跑通的模型,可能比海量用户的增长曲线更接近真实的价值,增长不再等于用户数,而是等于每个客户能被挖多深。

 

5、每个 AI 赛道都要重新分层。 

以 AI 视频为例,它至少能拆成四层:模型层、工具层、分发层、社区层。模型层的战争基本结束,归于大厂;工具层各家拿出来都是几千万美金 ARR;越往上层,泡沫程度和机会窗口完全不同。这套分层适用于几乎每个赛道。真正该问的不是「这个赛道火不火」,而是三件事,火的是哪一层、你站在哪一层、那一层有没有真正的商业价值。说不清自己站在哪一层的人,往往是还没真正进入这个赛道的人。

 

几个月后,SpaceX 会敲钟,OpenAI、Anthropic 也会陆续摊开账本。泡沫退去时冲走的是水分,但这些会留下来的人才、经验、认知,成为下一阶段真正的起点。

当然,硅谷和国内并不会是同一个故事。硅谷对未来想象的容忍度极高,泡沫也吹得更大;国内做业务的氛围更浓,所有人都在追问「什么时候能赚钱」。这种务实,过去常被看作中国创业者的局限,但在这一轮 AI 泡沫里,它或许反而是一种保护。

泡沫退去后谁剩真金、谁剩空气,要等风吹过来才知道。

  •  

Claude Fable 5 拒绝回答基础生物问题;Altman 预估 OpenAI 明年上市;韩国首次查获 AI 智能眼镜考试作弊案|极客早知道

因安全顾虑,Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题

6 月 11 日,Anthropic 昨日推出了 ClaudeFable 5,称其为该公司目前面向大众开放的最强人工智能模型,并着重夸赞了其在生物学等领域的能力。但外媒 The Verge 实际测试后发现,这款模型会拒绝回答大量基础生物问题,其中不少问题完全不存在安全隐患。无论是「介绍一下细胞膜」「讲解被称作细胞『动力工厂』的线粒体是什么」,还是解释引发疯牛病的朊病毒、信使 RNA 疫苗的作用原理,它都一概不予回应。

这并非因为 Fable 5 不知道答案,而是 Anthropic 从设计层面主动做了限制。

这类限制同样适用于日常、本身并无危害的医学问题。面对「花粉症的成因」「哮喘药物的作用原理」「抗生素耐药性如何产生」以及「埃博拉病毒及其传播方式」等提问,Fable 5 也都会拒绝作答。仅有部分基础问题偶尔能得到回复,比如「什么是癌症」「什么是 DNA」。每当 Fable 5 拒绝回应时,Opus 4.8 基本都能给出完整解答。

Anthropic 表示,大范围屏蔽生物相关问题是刻意之举,且防护标准设置得极为保守,核心顾虑是防范生物武器相关风险。(来源:IT 之家)

OpenAI 洽谈租赁俄亥俄州 10 吉瓦数据中心,英伟达提供资金背书

6 月 10 日,两名熟知谈判内情的人士透露,OpenAI 正进入深度磋商阶段,计划租赁俄亥俄州联邦地块上一座规划总规模 10 吉瓦的数据中心园区,这笔合作还有望获得英伟达的资金支持。

知情人士表示,若按当前芯片、人力、电力及建材价格全额建成,这座园区总投入至少 5000 亿美元。OpenAI 将签署长期租赁协议,掌控机房内所有设备;项目一期预计 2028 年投产,投运后 OpenAI 就要按期支付租金。

谈判尚未敲定,规划存在变动可能。若合作落地,这座俄亥俄项目将成为 OpenAI 迄今为止规模最大的基建投入。(来源:新浪科技)

 

GPT-5.6 最强 AI 模型已在路上,消息称 Altman 预估 OpenAI 明年上市

6 月 11 日,科技媒体 The Information 发布博文,披露了一份 Sam Altman 本周发布的致员工内部邮件,他预估 OpenAI 公司将在「明年内」上市,但具体时间表仍具有灵活性。

OpenAI 公司于 6 月 8 日宣布已向美国证券交易委员会秘密提交首次公开募股申请,推动 AI 企业进军公开股票市场。

尽管外界猜测 OpenAI 和竞争对手 Anthropic 可能会以接近 1 万亿美元的估值上市,但据报道,Altman 在对员工发表讲话时语气更为谨慎。

他表示,公司技术发展的速度可能会影响其何时进行首次公开募股(IPO)。Altman 特别指出,递归自我改进(RSI)的可能性不容忽视,在这种情况下,AI 系统将能够创建新的 AI 系统。Altman 表示:「RSI 的潜在起飞速度越快,推迟 IPO 就越有利。」(来源:IT 之家)

 

SpaceX IPO 已获 100 亿美元级机构订单,募资规模达 750 亿美元

据多家媒体报道,在 6 月 12 日正式登陆纳斯达克之前,SpaceX 已获得大幅超额认购,多家机构投资者提交了约 100 亿美元或以上的认购订单。

此次 IPO 的募资规模堪称史无前例。SpaceX 计划以每股 135 美元的价格发行约 5.556 亿股,基础募资额高达 750 亿美元,整体估值约为 1.8 万亿美元。这一数字将大幅超越沙特阿美 2019 年创下的 294 亿美元全球 IPO 融资纪录。承销商还手握超额配售选择权,可额外认购 8333 万股,对应追加融资 112 亿美元。(来源:新浪财经)

 

欧盟否认「封杀」Siri AI 称是苹果拒绝遵守《数字市场法案》导致推迟上线

6 月 10 日消息,针对苹果以《数字市场法案》为由推迟在欧盟上线 Siri AI,欧盟委员会回应称,从未禁止该服务,问题在于苹果拒绝遵守法律要求的互操作性义务。

根据 DMA,作为「守门人」的苹果若为自家 Siri AI 开放特定系统接口,就必须向第三方语音助手提供同等访问权限。苹果以「危及隐私」为由拒绝,因此选择暂不在欧盟推出。

欧盟强调,法律不阻碍创新,但平台不得利用操作系统地位偏袒自家人工智能服务。目前苹果尚未提出符合 DMA 要求的解决方案,Siri AI 在欧盟的上线时间仍不确定。(来源:cnBeta)

 

Meta 裁员 8000 人,开发岗、管理岗成 AI 转型最大牺牲品

6 月 10 日,据《商业内幕》报道,Meta 正投入数十亿美元押注 AI,但在最新一轮裁员中,开发人员和管理人员成了受影响最严重的两类员工。

上月,Meta 裁撤约 8000 个岗位。最新的一份文件,则披露了在 Meta 加州、华盛顿州大裁员中 4665 名受影响员工的岗位名称。加州是 Meta 的总部位置,华盛顿州靠近西雅图的办公区则是 Meta 最大办公室之一。

管理人员受到的冲击最明显。在文件列出的裁员中,管理岗位超过 1400 个,占总数近三分之一,其中近半数是软件工程经理。个人贡献型软件工程师是第二大受影响群体,裁员人数接近 1000 人。(来源:IT 之家)

 

德国法院裁定:谷歌要为 AI 搜索概览内容承担直接责任

6 月 10 日,据 The Decoder 报道,德国一家法院裁定,谷歌对其 AI 搜索概览(AI search overviews)所提及的内容承担直接责任。以往保护搜索引擎运营商免受责任追究的先例判例不适用于 AI 概览。

慕尼黑地方法院向谷歌发出了临时禁令,禁止该公司通过其 AI 生成的搜索概览传播关于两家总部位于慕尼黑的出版商的虚假言论。法院将谷歌归类为直接侵权人,因为「AI 概览」是其自身的内容,而不仅仅是搜索结果列表。

针对某些搜索查询,谷歌的 AI 概览错误地将两家出版公司与诈骗、订阅陷阱和不良商业行为联系在一起。法院表示,该 AI 将其他确实存在不良记录的公司信息与原告混淆,并建立了在任何链接源中均未出现的联系。出版商向谷歌发送了停止侵权函,但谷歌未作出妥当回应。(来源:IT 之家)

​SK 海力士据悉最早将于 8 月在美国上市

6 月 10 日,据知情人士透露,SK 海力士计划最早于 8 月在美国上市。美国证券交易委员会 (SEC) 很可能在 6 月 22 日当周批准 SK 海力士的美国存托凭证 (ADR) 上市申请。SK 海力士在一份声明中表示:「SK 海力士计划在 2026 年内发行美国存托凭证 (ADR),但包括规模和时间在内的具体细节尚未确定。」SK 海力士于 3 月宣布已秘密提交在美国上市申请。一位消息人士当时称,此次发行可能筹集高达 140 亿美元的资金。(来源:格隆汇)

 

泡泡玛特:其他产品只是被 Labubu 遮住光芒,实已贡献约半数美国收入

6 月 10 日,泡泡玛特首席运营官司德披露了泡泡玛特海外最大市场的细分数据,称去年非 Labubu 产品占美国市场总收入之比约为 50%。

他表示,在日本、韩国和东南亚等市场,非 Labubu 系列产品已然占了大头。他说,泡泡玛特的其他 IP 也有强劲增长,获得了大量用户和粉丝,只是被 Labubu 的光芒掩盖了,例如星星人系列。(来源:新浪财经) 

 

路透社民调:半数美国人担心 AI 使自己或家人失业

6 月 10 日,路透社与益普索 公布的最新民调显示,AI 快速普及正在引发美国人的就业焦虑。一半美国人担心 AI 可能让自己或同住家人失去工作,民众普遍对 AI 技术被广泛采用感到不安。

调查显示,53% 的美国人存在上述担忧。按年龄、性别和教育水平划分,这种焦虑在不同受访群体中分布较为平均。

约 37% 的受访者表示完全不担心 AI 影响自己或家人的工作,剩余 10% 表示不确定或选择不回答。目前公布的许多裁员集中在科技公司,美国整体就业市场是否会受到拖累仍有待观察。近几个月,美国经济新增就业依然强劲。

从政治立场看,民主党人对 AI 的疑虑高于共和党人。民主党吸引更多大学毕业生,共和党则吸引了更多工人阶层选民。61% 的民主党人表示,担心 AI 影响自己家庭的工作岗位,共和党人中持相同看法的比例为 47%。

此次调查范围为 4531 名美国成年人,结果误差范围为上下 2 个百分点。(来源:IT 之家)

 

机构:书本式折叠屏 (大折叠) 手机将成 AI 落地的最佳终端载体

6 月 10 日,市场调研机构 Counterpoint 报告称,如今,手机中的 AI 正从独立功能演进为系统级交互入口,用户需求也从单轮问答转向跨应用、多步骤的任务执行。交互逻辑不再只是依赖应用层手动执行,而是直接调用 AI 完成任务。

这一变化对屏幕提出了更高的要求:复杂任务需要同时查看原始内容、比对 AI 生成结果并确认下一步操作,频繁切换应用会严重拖累效率。书本式折叠屏手机凭借更大的内屏和更强的多任务承载能力,恰好满足这一需求,能够让复杂工作流持续可视化,信息并行、一步到位,从而充分释放 AI 生产力。(来源:格隆汇)

消息称大疆 Pocket4p 定价 3799 元起,6 月 15 日正式发布

6 月 10 日,据新浪科技报道,大疆 Pocket4p 将于 6 月 15 日发布,标准套定价 3799 元起。IT 之家后续将保持关注。

本月初,大疆在北京举办了「大疆光影十二载暨手持影像技术分享会」,现场重点介绍了 Osmo Pocket 4P,该机搭载 1 英寸 CMOS、3x 中焦镜头,提供 17 级动态范围与 D-Log 2 专业色彩曲线,定位为「装进口袋里的电影机」。

大疆表示,未来将继续围绕影像增稳、色彩科学、智能算法、音频与图传生态等方向投入,推动专业影像技术以更轻量、更高效的方式进入更多创作现场。(来源:IT 之家)

 

3999 元:影石发布全球首款 8K 徕卡双摄云台相机 Luna Ultra,配备可拆卸图传屏 + 头追模块

6 月 10 日,影石 Insta360 今晚正式发布旗下首款手持云台相机——Luna Ultra。该产品定位为旗舰级双摄云台相机。标准套餐国内限时售价 3999 元起,创作者套餐增加续航手柄、增广镜、麦克风发射器等配件,首发价格 4849 元。

Luna Ultra 是影石与徕卡联合研发的首款云台相机,产品外观采用黑白两色可选,整机重量约 232 克,延续了三轴机械增稳结构。

该机搭载了双徕卡 Summicron 光学镜头系统,其中主摄采用 1 英寸 8K 传感器,配备等效 20mm 焦距与 F1.8 大光圈,支持 14 档动态范围及 8K 30fps 杜比视界视频录制;另一颗则为 1/1.3 英寸超级长焦镜头,配备 F2.0 大光圈,最高支持 12 倍混合变焦及 6 倍无损变焦。

Luna Ultra 配备 1550mAh 电池,连续拍摄时长可达 4 小时,支持快充,23 分钟可充至 80% 电量。机身内置 47GB 高速存储空间。(来源:IT 之家)

 

阿里巴巴千问发布国内首个全周期高考志愿填报 Agent,免费面向全国考生开放

6 月 10 日,阿里巴巴千问正式上线国内首个全周期高考志愿填报 Agent,免费为全国千万考生提供个性化的志愿填报与咨询服务,标志着大模型应用在垂直民生领域的进一步深化。

该 Agent 基于千问高考志愿大模型,并深度融合了夸克长达 8 年的高考数据经验。产品核心具备「志愿日历」、「志愿报告」和「志愿问答」三大能力,不仅掌握了人类专家的「位次法定位」等专业填报方法,还可结合历年院校录取数据与用户行为理解,提供精准的志愿规划建议。考生输入选科和估分后,系统将依省份时间节点定制「志愿日历」。(来源:aibase)

韩国首次查获 AI 智能眼镜考试作弊案,两名 TOEIC 考生成绩作废

6 月 10 日消息,据新华社报道,韩国近期首次发现考生利用 AI 智能眼镜在英语考试中作弊的案例,引发当地教育界对新型可穿戴设备滥用问题的关注。

韩国托业(TOEIC)考试主办方韩国 TOEIC 委员会确认,两名考生分别在 5 月 10 日和 5 月 31 日举行的 TOEIC 考试中,涉嫌借助 AI 智能眼镜获取考试信息,相关行为经核查后被认定违规,两人成绩被取消,并被禁止在未来四年内参加 TOEIC 考试。

据韩联社等当地媒体报道,这是韩国首次公开披露利用 AI 智能眼镜实施考试作弊的案例。考试机构表示,监考人员在考试开始后不久发现部分考生行为异常,并注意到其佩戴的眼镜疑似具备智能功能。为了避免影响其他考生正常作答,监考人员并未立即中断考试,而是在考试结束后通过复核程序确认了作弊事实。根据现行规定,两名涉事考生均受到成绩作废及禁考处罚。(来源:IT 之家)

  •  

Token 「免费」时代来了?对话 Agnes AI 创始人,全模态免费的生意与野心

过去一年真正在用 AI 的人都会有同一个感受——AI 越来越贵了。以前一个月 20 美元的订阅可能都花不完,但自从 agent 和 vibe coding 流行起来,token 就烧得像流水,一个 coding agent 挂着跑上一下午,账单金额越堆越高。于是大家慢慢学会了精打细算,这个任务值不值得让它跑、这段代码要不要让 AI 再重写一遍,很多想法刚冒出来,就被一句「这得烧多少 token」先摁了回去。

AI 本该让每个人都能尽情去创造,可用着用着,反倒成了一件需要按表计费、能省则省的事。

现在有这么一家公司,能让你不花一分钱,可以把文字、图片、视频三个 AI 模型都用个痛快。而且不是七天试用,也不是送你一笔用完即止的额度,而是管够,这是不是 AI 时代的「赛博菩萨」?

6 月 1 号,一家叫 Agnes AI 的初创团队,将旗下文本、图片、视频三个模型的 API token,全部免费。消息一出,几天之内十几个群被挤爆,几千亿 token 烧了出去,最早涌进来的几乎全是连夜赶来「体验」的极客。

但很快,群里的画风就变了。

有人用它跑出几分钟长的视频,有人给它配上工作流做出整套素材,还有人把两个女儿一路长大的片段剪成短片、配上 AI 旁白。这种几分钟的视频,要是按过去的价格,他大概根本舍不得试。这其实正是「免费」最有意思的地方,它真正解锁的,不是省下的那点钱,而是那些你以前因为太贵、不敢试而压根没动手的念头。

更少见的是,当大多数公司都只在单一模型形态上发力时,Agnes 偏偏把文字、图片、视频三个模态一起做,并全部免费。

目前,Agnes-2.0-Flash 模型已支持高达 1M Token 的超长上下文窗口。这一强大功能人人免费、人人可用。

当然,问题也随之而来:免费,是不是意味着模型不够好?成本到底怎么压,才扛得住这么多人一起用?钱都不收了,团队又靠什么活下去?

以及最关键的,做这件事的Agnes AI 团队,到底图什么

带着这些问题,极客公园和 Agnes AI 的创始人Bruce Yang 聊了一场,以下是对话文字整理:

  • 价格高的模型越好,价格低的模型性能不行这是很大的误解。DeepSeek 价格也很便宜,它在很多指标上其实不亚于很多更贵的模型。
  • Token 免费真正解锁的,不是省下的那点钱,而是那些你以前因为太贵、不敢试而压根没动手的念头。用户的潜力不应该被成本限制。
  • 正因为有 Harness 这样一个约束,模型之间的差距其实也在变小。Harness 的作用,第一是弱化了模型之间的差距,第二是让模型的升级和优化变得更有方向。
  • 我们想趁现在率先打出免费的旗帜,先上牌桌、先成为一个重要玩家。
  • 10 年前你不会中文、英文可能是文盲;10 年之后,不懂 AI 可能就是文盲。其实不是害怕 AI,而是不懂 AI 的人怕懂 AI 的人,觉得自己随时会被替代。

Agnes AI |来源:官网

 

一、模型越便宜越不行?是个误区

极客公园:先介绍一下自己和 Agnes AI 团队吧。

Bruce Yang:我先讲讲自己的经历,15 岁出国,去新加坡莱佛士书院读高中,之后考到美国加州大学伯克利分校,学计算机和数学两个专业。运气比较好,师从两位图灵奖得主 Richard Karp 和 David Patterson,当时教我们操作系统的 Lon Stoica 现在是 Databricks 的创始人。后来我在硅谷工作过,待过微软和 LinkedIn,也在硅谷创过业,回过国,现在在新加坡。中间有个契机,疫情期间国内封城,我回新加坡读了博士,在新加坡国立大学读了 School of Computing 的 AI 博士,这段经历给了我很多灵感,也是 Agnes 创始很重要的一条路线。

Agnes 真正起步大概在 2024 年底、2025 年初,是一家很年轻的公司。我们从一开始就在做模型,不过去年更多是在做应用,因为模型还没做得那么好,所以先做自己的 harness,也就是现在的 agent,再在 agent 之上慢慢优化能力。最开始更多是借助「御三家」的外部 API 来实现能力,但成本一直居高不下,尤其规模做到总用户量过千万之后,已经有点烧不起了,所以我们加速推动自研模型,做所谓的国产替代,到去年年底,故事更多还是在产品和国产替代上。

到今年年初,我们发现模型做得还不错,对比一些闭源模型,某些地方还有优势。于是我们做了个大胆的努力,今年开始不断开放模型 API,从小范围放大到全模态,现在干脆放个大招,全模态免费。从 6 月 1 号公布到现在正式运行才三天,已经有十几个群,每个群几百人,都是极客用户的。我们 token 消耗量昨天已经超过 1000 亿,三天达到这个数字还不错,到周末可能还要再翻三四倍。目前看还是在预期内的。

 

极客公园:不只是国内,全世界一听免费都会很兴奋。但大家也会质疑,是不是因为东西没那么厉害,所以才免费?你们这三个模型现在到底是什么水准?

Bruce Yang:我觉得这是个误区,而且不只针对免费模型,对低价、高性价比模型也都有,总觉得越贵的模型越好,越便宜的是不是性能不行才把价格降那么低。但你看 DeepSeek 价格也很便宜,它在很多指标上其实不亚于很多更贵的模型。

我们的模型虽然目前免费,但并不表示在性能上做了任何妥协。就目前的成绩看,我们的文本模型在一些 agentic 场景中,比如 PinchBench 和 CloudEval,都是全球 Lab 前十;图片和视频模型在 Artificial Analysis 这个全球最权威的盲评榜单上,也都是全球前十。

模型还在不断优化,本月会更新一版,之后可能每个月都更新一版。我们对自己的要求是,对最头部的 SOTA 模型不一定立刻达到同等强度,但要快速跟上,保持在一个代际之内,比如它新版本刚出来时,我们能达到它上个版本的能力。能做到这点其实也不容易,再加上免费,相信能得到很多用户的青睐。

 

极客公园:你对自己的模型很有信心,不如先给大家展示、讲解一下 Agnes 模型做出来的 demo。

Bruce Yang:我们模型在网上已经有蛮多测评,我们看了一下,95% 都不是我们自己提供的。宣布免费第一天后用户自发推广就很多,测评都挺中肯,也指出了我们的一些问题,但总体大家对我们的能力还是比较认可的。

比如这种粒子效果,当年 Gemini 刚出来时,是大家测文本模型能力的一个重要指标。还有一位小伙伴用文本模型做了一个操作系统,里面还有个搭飞机的小游戏。

除了文本,图片、视频也还可以,尤其是图片,我们对一些高信息密度的内容做了不错的优化。当然对比 Nano Banana、对比 GPT 的图像模型还有些距离,一些高密度的文字细节还没完全优化好,但总体在国产模型里应该算比较靠前的。

视频方面,我们支持音画同声,角色在视频里可以讲话,中文、英文都支持,有些小细节还需要优化。我们大概这个月下半月会推出下一版视频模型,目标是接近 HappyHorse 的阶段,跟 Seedance 还是有差距。但总体来说,作为商业化模型,免费并不表示它没有商业价值,我们已经达到了很多闭源模型的能力,也能释放出很多商业潜力。

 

极客公园:刚才展示的这几个任务,是单一模型端到端完成的,还是背后涉及多个 agent 协作?

Bruce Yang:我们提供的 API 只有三个模型,文本、图片、视频。目前还没把这三个 API 统一在一起,下周想统一发布,因为很多人在配置时会很困惑,很多 harness 不支持直接上传或者下载 图片和视频,需要作为 skill 加载进去。所以现在是三个不同的模型。你看到的这些内容,基本都是在 harness 基础上完成的。harness 可以是我们自己的 Agnes harness,也可以是 Codex、OpenClaw、Claude Code,连接我们的单一模型之后就能实现能力。

目前我们并没有用多个文本模型,或多个图片、视频模型来支持 harness 工作;但 harness 在执行过程中,可能因为自身的理解、需求和依赖关系,在某个时刻派出多个 agent 来实现,这个我们是可以支持的。

 

极客公园:完成刚才这些任务消耗的算力成本,和现在流行的模型、工具比,差别有多大?

Bruce Yang:先说我们的报价,虽然现在免费,但免费之前是有报价的,也仍有一个 token plan。文本模型方面,一般只有输出 token 才跟成本挂钩,输入 token 对模型公司来说基本是零成本。

我们输入 token 是 0.15 美元每百万,大概是 GPT 和 Anthropic 的 1/100,比 DeepSeek 的 flash 版大概也便宜一半,我们还是有些利润的。图片是每 1000 张 3 美元,也就是 0.003 美元一张,这个很夸张。视频实际成本每分钟大概 0.3 美元,每秒钟大致在一分钱人民币左右,按这个成本大概是市场头部模型报价的 1/100。

这是原来的报价。现在免费,大家随便白嫖,我们只是稍微限制一下 QPS (每秒查询/请求数)和 RPM(每分钟请求数),但给得还是比较多,每分钟可以 request 20 次。正常的个人开发者目前还没遇到说量不够用的情况。

 

极客公园:免费让人担心团队到底能不能撑住?很少有团队三个全模态都做,尤其是 Agnes 并不是一家巨型公司,为什么三类模型要一起做?

Bruce Yang:压力确实有,我们科研团队已经一百多号人了。目前在文本、图片、视频都能排进全球前十 lab 的公司并不多,海外是谷歌和 OpenAI,国内可能是阿里、字节,其他三个都做的公司不多。

我们最开始也没想那么多。因为我们自己的 harness 产品本来就支持文本、图片、视频,而且从用量看还蛮平衡的,所以第一步是想做国产替代。在这个过程中,我们发现三个模型之间其实有协同。

当时 Nano Banana 出来时,他们提到一个观点,Nano Banana 的指令遵循能力之所以很强,是因为用了当时的旗舰模型 Gemini 2.5 Pro 去做视觉内容解析,反向提示词的能力就很强。视频模型也一样,真正训练过的人就知道,第一个前提就是文本、图片模型要很强。视频模型还需要大量数据,很多来自影视切片,切片之后要用文字把这部分视频很好地描述出来,这些描述内容可以用来反向训练,这个过程也很依赖文本模型。所以三个模型在训练中其实有一定的依赖关系。包括现在一些新路线,比如图片模型已经开始走 AR,要把理解能力和生成能力结合在一起。

所以总体来说是两个原因。第一,从真实使用需求出发。很多一人公司、小作坊,让他去配置三个来自不同公司的接口,是蛮有挑战的;如果能结合在一起,做一个 Omni 模式的 API,就能更好地降低使用成本和门槛。第二,训练之间有协同。越好的多模态理解文本模型,越能支持图片和视频的生成,两者相辅相成;多模态场景中还会生成很多新数据,对我们合成数据、进一步训练很有帮助,尤其图片和视频模型需要文本 harness 帮它做提示词增强。

只有把三个模型整合在一起,同时建立一个让用户不断探索的场景,才能了解下一步模型升级的方向。

从另一个角度看,同时训练三个模型和只训练一个,区别有多大,取决于每家公司的愿景和认知。像 Anthropic、OpenAI 的愿景,是用最强的文本模型尽快实现能力上的质变、实现 AGI。但我们理解的 AGI 有点不一样,我们希望我们的 AGI 是由最广泛的用户、最大的场景去使用 AI,是一个更广度的 AGI。在这样的路线下,我们可能不是每个模型都最强,但要保持在前列、可能前十,不落后一个代际;同时希望模型能力相辅相成、共同进步,也希望越来越多用户使用我们的产品,建立一个生态,让生态促进我们进步、了解市场需求、了解怎么降低使用门槛。

因为愿景、出发点、技术路线都不同,我们会选一条别人可能不会选的路线,但这不表示我们对性能有任何降级或妥协,我们依然始终保持在全球前列。

 

极客公园:你到底有什么魅力,能把做文本、做图片生成、做视频的人才凑到一起?

Bruce Yang:其实我们有四个队伍。文本、图片、视频各一个队伍,每个队伍十几个人,还有一个队伍专门做性能优化,怎么把成本进一步打下来。其实成本不是最好的词,效率可能更好,怎么在训练阶段和 推理 阶段都取得一些令人咋舌的数字,比如 1% 的 推理 成本。

我们一个很核心的逻辑是,从第一天起就在做一个有很强约束的优化问题,但我们的限制条件和别人不一样。很多人的限制条件是给你足够多的资源,怎么把能力做高;而我们在第一天,资源本身就没那么大。所以我们才需要一个横跨三个垂类、专门做性能优化的团队,无论是从 GPU、CUDA 层面,还是从算法层面,用尽可能小的参数,达到用户满足度和性能的最完美匹配。刚开始做这件事时,我们心里其实是没底的。

至于你说的人格魅力,我们其实是后来者,无论是新加坡团队还是南京团队都是后来者,因为大部分模型公司都不在这两个区域。但当我们做出一点成绩苗头时,吸引了大量当地优秀的学生,新加坡的 NUS、NTU,南京这边东大、南大、中科大,甚至浙大的同学,都有很多选择来我们公司。

整个科研团队现在快 100 人了,都很聪明、很优秀,是为了一个伟大的愿景去奋。6 月 1 号我们放了大招,把过去积累的能力和一些科研发现都公布出来,下周还会再开源一些新发现。团队很积极向上,想在 AI 时代不只做接受者,还要成为构建者,这是我们的企业文化。

 

二、三天送出几千亿 token,免费是为了先「上牌桌」

极客公园:在你看来,三类模型在哪些场景里能真正进入生产、进入商业化,接入之后就能跑起来赚钱?有没有明确的场景?

Bruce Yang:还是我刚才那个观点,付费的、贵的模型不一定更好。群里试过我们模型的同学说,不亚于任何付费的 SOTA 模型,甚至对比了 Gemini、对比了 Claude,当然我们内心知道还是有差距的。正因为有这个误区,单纯降价已经没意义了。你降价,很多人觉得是因为你性能不行,再降也不用,因为他更愿意用御三家。

打破这个僵局、改变这种刻板印象的方式,就是先让大家大胆尝试,在过程中找到一些惊喜。开放三天,十几个群、几千个小伙伴,其实远不止,只是大概只有 10% 用户会扫码进群,二维码在官网 API key 下面。

从反馈看,他们用付费高级模型的功能,绝大部分我们都能实现。即使有些欠缺,比如特别复杂的指令遵循、特别长程的 agentic 任务还有些偏差,但这些都可以弥补、下个版本可以优化,可能下下周就会优化,比如 tool calling 的一些能力。所以大逻辑是,现在大家用的 90% 场景我们都能实现。

如果非要说更侧重哪里,我们花了更多时间优化 agentic 能力,这也是我为什么会关注 PinchBench 和 CloudEval 下一个版本会更优化 coding,比如我们现在在打 SWE,做 coding 能力的升级,希望 SWE 也能成为全球前十,目前看还有机会。文本上,我们更专注用户使用量最集中的 Agent 和 Coding。图片我觉得蛮能打的,虽然跟 GPT 的图像模型有差距,但在国内模型里还可以;视频差距稍微大一点,跟 Seedance 和 HappyHorse 有差距,但无论免费还是按原价,性价比绝对 OK,可以期待这个月的下个版本,我希望能接近 。

三个模型总结起来,即使跟一些 SOTA 闭源模型还有差距,我们也知道怎么去缩短距离,会一直以无限接近闭源模型的使命去推动科研工作。

 

极客公园:如果没有 agent 这波火热浪潮,token 这件事可能并不会让大家这么关注。但现在 token 一出来,你一下就把它花超了

 

Bruce Yang:对,coding 因为有 agent 的 harness,所谓的 OpenClaw、Hermes、Codex,还有 Claude Code,它们架构上其实也很类似。正因为有 harness 这样一个约束,模型之间的差距其实也在变小。

 

我前段时间去新疆骑马,就是想感受一下 harness,专门骑了几匹不同的马。第一匹很听话,但跑不快;第二匹跑得很快,但不太听话,可当缰绳在我手上的时候,我发现差距不大。跑不快的,马镫踢一踢就快了;不听指令的,缰绳拉一拉就听话了。所以 harness 的作用,第一是本身就弱化了模型之间的差距,第二是让模型的升级和优化变得更有方向。

 

我们更需要做的,不是去训练一匹没有马具的野马,而是训练一匹带上马具的马。带上马具之后,很多方向、很多维度其实已经被压缩了,能进步的方向非常明确。还有一匹又快又听话的马我没骑,是向导在骑,那属于千里马,没我的份,相当于 SOTA 模型。我现在要做的,就是把没那么有天赋的马加在 harness 基础上去训练,让它无限接近 SOTA 模型。

 

极客公园:为了体验 harness,专门跑去体验骑马,这也很厉害。 Claude Code 这么强,不仅是因为 Anthropic 的模型厉害,更因为它整个 harness 做得非常厉害,里面有特别多值得学习的地方。

 

Bruce Yang:对比 OpenClaw,我觉得 Claude Clode 有两个更大的优势。第一是 Memory 的处理和压缩,比 OpenClaude 强很多,它做了很多长程记忆能力的优化;第二是对 KV Cache 的优化,可以降低 token 用量、提升 token 的命中缓存。

命中缓存对模型公司来说基本是零成本,虽然给用户收费,但对模型公司零成本,输入 token 也是零成本。所以很多时候大家会看到,为什么有的公司能把命中缓存的 token、input token 价格降那么低?因为大家的成本项主要都在 output token、在输出层。

 

极客公园:6 月 1 号免费后建了十几个群,目前情况怎么样?用户怎么用免费 token 的?

Bruce Yang:他们帮我们找到了很多自己做产品时找不到的问题,一些压测方式、使用场景、适配不同 harness 的设置,还有错误日志等等。原来我们一个测试团队七八个人,他们捕捉不到的问题,现在群里很多活跃用户帮我们找到了,还给了非常好的建议。很多人是开发工程师、运维工程师,还指出了我们网关的一些卡点。

第二,更让我感动的是发掘了很多场景。原来我们用视频模型做的都是几十秒、5 秒、10 秒的,因为模型只支持 10 秒。但用户用他们自己的 harness、专门帮我们写的 skills,还有人做了 ComfyUI 的工作流,把几分钟、3 到 5 分钟的视频都生产出来发到群里。

我看到一个用户发了一段他两个女儿一路成长的短视频,还用 TTS 配了一段非常感人的话,把视频拼在一起。我第一反应是惊讶,这是不是我们模型做的,觉得做得还不错。很多人做 5 分钟视频,如果不用我们免费模型,可能成本上根本不愿意尝试。我们等于开放一个新场景、一种新权利。我们公司有句话,用户的潜力不应该被成本限制,我们给予了释放用户潜力的权利。

还有一点也比较感动。我们原来尝试写邮件给 OpenClaw,说你们默认接入的都是很有名的模型,我们打榜也不错,能不能把我们模型也放进去。

 

极客公园:OpenClaw 怎么说?

Bruce Yang:回了封邮件说,我们不允许、不会接入没有名气的模型。结果我今天在 GitHub 上搜了一下 OpenClaw 和 Agnes,从6月1号到 3 号,每天都有几十条评论问,为什么不支持 Agnes AI,为什么需要我自己来配置。所以我们给出了一些分享也得到了非常令人感动的回报。

 

极客公园:之前和硅基流动的杨攀聊,他给过我一个建议——订阅一个 200 美元的版本,你会发现当你拥有无限 token 时,野心会变大。

Bruce Yang:是的,这也是我们的想法。其实在推动免费这件事之前,公司内部也没完全想清楚免费之后下一步怎么做、商业模式怎么做,只有个大概概念。但我们有一个大的认知,当你把一件事做到极致,比如把价格降到免费,它一定会对整个生态开启一个新的打开模式,就是一个范式转移,会迸发出很多场景。而这些场景不需要我们现在就去想,很多用户会帮我们想得更好,因为群众的力量是无限的。这也是我们已经看到的,一些种子已经在开花了。

 

极客公园:你会担心有人不仅白嫖,还弄一个类似中转站的东西,把你的免费 token 转给更多人用、自己反而开始收费吗?会担心出现这种二道贩子吗?

Bruce Yang:我们限制了 RPM,也就是每分钟的请求次数,大概每分钟 20 次。对个人用户一定没问题,但对企业用户就比较困难,你把一个 20 RPM 的产品给到 10 个用户用,都会觉得捉襟见肘。所以对企业用户,未来还是可能会以收费模式,当然价格也很便宜,你可以先用免费的做 POC、做试点。

 

极客公园:在一个 CLI 环境里,哪些任务用付费、哪些用 Agnes 免费模型,对个人才是经济最大化?

Bruce Yang:绝大部分人,除非你是极客。我觉得有两类用户可以稍微谨慎一点。第一类是绝对的极客,比如需要多个 CUDA 实例、连续跑 3 到 4 个小时的,这个我们目前支持还没到位,当然我们在优化,正针对这种长程、多实例的场景,配合我们的 coding harness 一起做优化。第二类是非常专业做短剧的,不是说不能用我们,而是在某些场景,比如特别复杂的动作、特别追求一致性的场景里,可以配合一些更高端的模型一起使用。

除此以外,我们的模型目前应该能解决市场上 95% 以上的场景,这也在我们十几个微信群里得到了验证。大概 80% 的用户都会说,你们跟我们看到的其他模型差不多。还有一部分用户会提出问题,这些问题又分两类,一类是能快速解决的,另一类是暂时无解的。能快速解决的,又占了提出问题的那 10% 到 20% 用户中的 80%。这样算下来,真正既没解决、也不知道怎么解决的,大概只有 1% 左右的场景和问题。再加上我们把使用门槛降到免费,我觉得是很香、很值得尝试的一个方向。

 

极客公园:Agnes 怎么把三个模态模型的成本压到能支撑免费?才三天就几千亿 token 出去了。

Bruce Yang:是的。而且几千亿 token 只是我们储备卡量的 1/5,按每天的消耗量还能再乘 5 倍,我还备了第二批卡,大家可以大胆地薅,薅到我们薅不动为止。

逻辑是这样。第一,我们做的是优化问题,但限制条件跟别人不一样。主流公司大多信奉 scaling law,算力允许就让参数和数据同等提升。但它没回答边际效益有多大:很多时候参数提升 10 倍,benchmark 只涨几个百分点;而且现在大部分都在反向蒸馏,比如 Gemini 用 Pro 蒸馏 Fast,参数降 10 倍,多数榜单上差距不大。

所以我们第一天就定了个重要假设,200B 以上的模型不做,只优化 200B 以内的,在里面找合适区间。靠环境稳定性、合成数据和自己产品的线上数据不断扩充,再在榜单数据上做类似问题的扩充,这块现在很成熟,我们很快会开源一些合成数据的方式。

在这之上,我们只押两个重点:agent 和 coding,希望不亚于 SOTA 模型。其他领域战略性放弃,不是不重要,而是不是第一步要解决的。因为现在大规模消耗 token ,一定是 coding harness 或白领办公 harness。

此外还有个稍微超前的尝试,我们在官网发了篇文章,讲如何不增加参数和深度,靠循环调用 Transformer 的层来逼近更大模型的效果,这叫 recurrent depth transformer。小规模验证里,一次循环困惑度降了 10%,等于参数利用率提升 10%;同样一个 MoE 模型,多次调用能更好地发挥每个单位参数的能力。这是下一步要重点实验的。长期愿景就是在 200B 以内不断优化性能、接近 SOTA。资源有限,但目前看挺有效。

图片和视频不太一样,它们还没突破 scaling law,基本是数据越多、效果越好。很多产品达不到效果,不是能力问题,是数据问题,而合成数据又很复杂。比如你要 1 亿段视频,自己爬、自己截可能要几个月,等弄完这波机会已经过去了。

所以如何在最短时间内拿到你想要的数据?这份数据又通过什么样的 pipeline 去训练?如何让图片模型去赋能视频模型?过程中技术路线是选 DiT 还是 auto regression?这里面其实很多小的 know-how,比一次性的大概念升级更重要。有点像 OpenAI 后训练一位负责人说的,训练模型其实更像个手艺活,不是一个能系统推导出来的结论。

过去一年多,我们上百个科研同事做了很多创新,也充分发挥了学术界和开源的力量,所以我们也在反馈给开源生态。比如上一篇关于 recurrent depth transformer 的论文已经开源;下周会开源一个我们在图片中怎么优化文字的 VAE 模块能力;后面在视频模型这边,最重要的就是怎么合成数据,我们也会逐步开源。

这个生态对我们还是很有帮助的,很多原料、很多菜其实都有了,但你有没有足够大、足够强的团队,有没有足够强的信心去投入,把这道菜烧出来?我觉得到目前为止我们烧得还不错。

 

极客公园:「Token 免费」背后的商业思考是怎样的?

Bruce Yang:想了个大概,但没全想完,可以分享一些。先说数字,我们几天就做了几千亿 token。我看了下,现在 OpenRouter 上排名第一的是 DeepSeek V4 Flash,大概一周是 3 万亿 token。我算了一下,如果达到这样的每周使用量,我们实际的服务器成本大概在小几百万人民币,完全不是很大的数字,一个很重要的原因就是我们把成本压缩到了极致,目前市场上我没看到谁能做到我们这样的成本,有点夸张。

这次免费希望免费到什么程度?目标是达到 OpenRouter 第一名两倍的规模。两倍之后再有新用户,可能继续支持,要看我们的融资情况;但在两倍以内,我们是完全可以支持的。目前我们的团队就是 OpenRouter 排名第一这样的规模,主要提供给个人消费者,暂时没有对企业消费者做特别大规模的宣传,你可以做 POC,但给的 RPM 没那么大。如果量达到 OpenRouter 上最大量模型两倍的规模,免费完全可以支持。因为比起把这部分成本省下来,我们希望更多用户来体验我们的模型、喜欢我们的模型、成为我们忠诚的用户,这非常值得。

下一步怎么商业化,我们有几个思路。

第一是企业用户。去做销售很累,但你开放一个免费的让他尝试,让他主动来找我们,会快很多,这是我们很重要的一条商业化路径。

第二,我们看 OpenAI 和 Anthropic 在 B 端增速最快的就是它们的 harness,也就是 Claude Code 和 Codex,所以我们很快也会推出自己的 harness 产品,这里先卖个关子,但这也是很重要的一条商业化路径。

第三,对用量特别大的极客,这不作为重点,我们再升级更好的模型,达到非常 SOTA、市场前三的时候,可以考虑小范围收费,或者优先面向付费用户,付费用一段时间后我们还可以免费。但这些都不是最高优先级,前两者优先级更高。

 

极客公园:今天是「Token 免费」,下一步会出现「给用户钱让他们用 Token 」吗?

Bruce:有这种可能性。但总体来说,在 AI 时代,想保持一两年的门槛和壁垒是很困难的。我们现在趁着有这个能力,全模态模型都能达到可用状态、能达到全球前十的 lab,率先打出免费的旗帜,希望先把愿景推出来,因为这个行为背后跟我们的愿景是符合的。能完全匹配全模态、同样能力又免费的,目前市场上公司不多,大部分公司选择在某一个领域发力,其他领域虽然也在慢慢发力,但需要时间。

所以我们想借这个机会尽快先上牌桌、先成为一个重要玩家。我们后面也有后手,别人匹配我们时,我们还有别的招没出,harness 产品就是我们现在正紧锣密鼓准备的,具体什么时间点、推什么样的产品暂时还不能说,但后面还有新的增长曲线。

 

极客公园:大厂会跟进吗?例如把过去的模型也免费出去?

Bruce:看他们多快能匹配,我觉得有难度,毕竟已经有那么多用户在付费了。我们作为新参与者,没有那么多包袱,没有那么多企业用户和规模性付费用户,所以可以快速掉头;但对很多公司来说船大难掉头,整个规划、预算、年度计划都要调整,大公司的决策路径没有那么快。

 

三、AI 平权,是免费背后的底色

极客公园:刚才说到很多普通用户用免费 token 生成和女儿回忆的影像。这是不是你和团队的一种情结,希望把 AI 作为工具免费给大家,让大家释放创造力、让生活更美好?

Bruce Yang:我先介绍一下我的背景。我从小在国内一个四线城市长大,初中靠竞赛和中考成绩拿到奖学金,去了新加坡莱佛士书院,相当于新加坡最好的高中。在那里我认识了很多来自东南亚、家庭不富裕但成绩很好的同学,有了很多新认知。我参加新加坡全国的数学、物理、化学竞赛都是金牌、全国前几名,也进了学生会。靠这份经历,我拿着领导奖学金去了 UC Berkeley 读书。

整个硅谷有两所学校,有人说富人的孩子去 Stanford,穷人的孩子去 Berkeley。Berkeley 的同学很像一个社会,不是那么标准的精英,但每个人都很聪明、有很多想法,很纯粹、很干净。

之后我在硅谷创业,这次回新加坡读博也拿了总统奖学金。我运气非常好,来自四线城市、父母也不富裕,但一路都有奖学金和支持。今天的很多成绩都是当时的积累,加上一颗不服输的心,虽是后来者,也愿意挑战现在的市场玩家。但 AI 现在变得没那么平权了,因为成本,很多有创意的人都在意 token 消耗,不敢大规模用,反而没那么有创造力、没那么有效率。

回想我的经历,无论是莱佛士那些拿奖学金的同学,还是学费不贵、让加州很多普通家庭聪明孩子都能去的 Berkeley,这颗种子是我自己得到的,我也到了一个时间点要回报社会,把火种传下去,就是平权:能力的平权、价值的平权。

在这个时代,AI 平权是最核心的。10 年前你不会中文、英文可能是文盲;10 年之后,不懂 AI 可能就是文盲。

我硅谷的朋友很多很反 AI、害怕 AI。其实不是害怕 AI,而是不懂 AI 的人怕懂 AI 的人,觉得自己随时会被替代。解决的办法不是压制 AI,而是让它变成一种更平权的能力,让每个人都知道如何借 AI 创造更多。这也是我们公司很重要的愿景,让世界级的 AI 属于每一个人。我们能做的可能微不足道,但这个愿景非常长久、持久。

 

极客公园:很多大厂已经不开源了,但是你们还在做开源。除了 AI 平权,背后还有哪些思考?

Bruce Yang:现在很多公司在尝试做开源,但只开源了参数、没开源方法。既开源参数又开源方法的,就是 DeepSeek,所以我对 DeepSeek 非常 respect。梁文峰确实是在做 AGI,如果你现在问我,全世界这么多做 AI 的人最崇拜谁,我肯定还是梁文峰,一年前是,现在还是,他有大局观、大格局。我们也是一样的想法。如果开源了模型,但模型太大没法自己部署,又不开源方法,那更多只是证明自己有这个能力、证明自己的模型跟别人不一样、可以被别人蒸馏调用,并没有为社区反馈太多信息。

所以我们很想做的是,如果真能做到一些别人做不到的成绩,还是想把方法论开源出去。无论是上周开源的 recurrent depth transformer,还是下周要开源的、让图片文字更清晰的 VAE,还是后面告诉大家训练视频模型最大的卡点其实是如何快速合成数据,这些能力我们都会想着分享出去。

一方面是想证明我们有能力创新,不希望大家认为我们只是个跟随者;另一方面,我们受制于人、也反馈于人,希望能在开源社区、开源生态里成长,也希望能反馈给社区。我们各个群里很多小伙伴都在帮我们写 skills,很多我们自己都没写,但你现在搜 GitHub 「Agnes 模型」,很多 skill 都写出来了。我知道的群里小伙伴大概就写了四五个,还不断在 OpenClaw的 issue 里催更,问为什么不支持 Agnes。

 

极客公园:催更 Peter(OpenClaw 创始人) 是吧?

Bruce:对,催更 Peter,而且好几个还是中文的催更 Peter。这样的生态是大家比较希望看到、比较期待的,这也是为什么我觉得国内的 AI 现在在领跑全球。

 

极客公园:如果让你给大家传递一个信息,token 都免费了、门槛已经降到很低,普通人在这样的时代应该怎么做、应该有什么样的态度?

Bruce Yang:我越早拥抱 AI,越能理解 AI 的世界,而 AI 世界和非 AI 世界是不一样的。我在 NUS 读博时上过一门机器人课,博士课程,我拿了全班第一名。教授 David 第一天就跟我们说,你们可以用 AI,但要说明自己是怎么用的,最好把提示词写出来。结果那门课,我读博时已经比同龄人大 10 岁,花的时间其实不多,但无论做项目、做研究、写论文还是做演示,我都大规模用 AI,居然在大部分同学都比我小 10 岁、可能更有精力的情况下拿了全班第一。这说明如何充分发挥 AI 很重要,AI 能发挥的维度可能远超我们的理解,尤其这波 harness、Codex,包括理解屏幕、做很多新的 skills、对接 MCP 插件,已经在完全改变这个世界了。

我身边有些朋友在做 AI 应用,我们自己也做过一段时间,现在不是公司重点。我有个很重要的观点,当一个产品越做越复杂,它就不是一个 AI native 的产品。因为 AI native 的产品大部分是越做越简单,越来越依赖模型;短期内可能会部分依赖 harness,但这种依赖会不断迭代、可能越来越少。

所以更先进的 AI 认知、更早地接触 AI 产品,再加上免费的资源让大家大胆尝试,我们就把门槛降得很低。很多人不敢尝试,就是怕费太多 token、太多时间;如果 token 都免费了,每天都可以尝试、不断和 AI 互动。AI 本身是双向的,不一定需要一份操作手册。这样你可以越来越全面地理解 AI 的每一个角落、它的边界在哪里、它的脾性在哪里,这才是新时代的 AI 平权。

有时候我们用 AI 去改造传统业务,有点像把马车装得更豪华、让马跑得更快;但真正 AI native 逻辑,其实是换一辆汽车,是彻底改变对行业的认知。这种认知有些地方比较根深蒂固,我们希望通过免费的、足够多的 token,让大家在这个转变中更快地适应新时代。

我们后面还会出大量的场景和案例,让大家快速上手,包括给没试过 vibe coding 的同学,把我们的一些提示词和生成效果都分享出来;以及如何连接大家想用的 harness。最简单的我们自己也提供了 harness,叫 Agnes super agent,现在还没做得那么好,但已经可以尝试。

如果你自己有 harness,比如 Codex、Claude Code、OpenClaw、Hermes,都可以快速对接。这些资源我们都会快速分享出来。我们的逻辑就是让大家无门槛上手,而且是真免费、没有任何套路。案例和提示词都会慢慢分享出去,让大家无论已经是极客,还是想快速开始 vibe coding,都能快速体验起来。

  •  

Claude 最强模型 Fable 5 发布;微信朋友圈搜索功能全面开放;小米 NAS 页面曝光|极客早知道

图片
图片

最强 Claude 模型发布:Anthropic 推出 Fable 5/Mythos 5,书写 AI 神话

6 月 10 日消息,Anthropic 昨日(6 月 9 日)发布博文,宣布推出 Claude Fable 5 与 Claude Mythos 5 两款 AI 模型。

关联阅读:《号称「最强模型」的 Mythos 正式发布,但 Anthropic 还给它装了个「护栏」》

图片

定位方面,Claude Fable 5 面向普通用户开放,定位为目前公开可用能力最强的 Claude 模型;而 Claude Mythos 5 会继续通过 Project Glasswing 项目先向少量网络安全防御方和基础设施提供商开放。

Claude Fable 5 与 Claude Mythos 5 两款 AI 模型基本上同一个模型,只不过 Anthropic 针对使用场景,设置了不同的安全护栏。

能力方面,Claude Fable 5 是 Anthropic 官方可用能力最强的 Claude 模型,官方称其在软件工程、知识工作、视觉、科学研究等领域展现出「卓越的性能」。

它在执行更长时间、更复杂的任务时,性能优于 Opus 模型。Fable 5 的自主运行时间也比以往任何 Claude 模型都要长。附上相关截图如下:

图片

在知识工作与视觉方面,Fable 5 同样把高性能转化成更直接的业务价值。它在金融推理、文档分析、图表表格理解和问题求解上拿到高分,还能从复杂科学图中抽取精确数字,甚至仅靠截图重建网页应用源码。

安全防护方面,Anthropic 为防止其被滥用,为 Fable 5 采取了较为保守的安全措施,加入新的分类器系统,重点拦截网络安全、生物化学和蒸馏相关请求。一旦命中,系统会自动改由 Claude Opus 4.8 响应。

Mythos 5 的亮点更偏向高敏感科研与网络安全。Anthropic 称其具备全球最强的网络安全能力,同时在药物设计、分子生物学和基因组学研究中表现突出。

比如在药物设计环节,内部蛋白设计专家借助 Mythos 5 把部分流程提速约 10 倍;在 14 个蛋白目标中,已有 9 个产出强候选方案。分子生物学假设盲测中,科学家约 80% 的时间更偏好 Mythos 5 给出的结果。

图片

阿里巴巴、百度、蔚来回应「被美国防部列入中国军工企业名单」

6 月 9 日消息,阿里巴巴 6 月 9 日在港交所公告,公司注意到美国国防部已将阿里巴巴集团列入中国军工企业名单。美国国防部不得直接或间接从中国军工企业名单上实体采购商品、服务或技术。

阿里巴巴表示,本公司认为将其纳入中国军工企业名单是一个错误。将阿里巴巴集团列入该名单并无任何依据。阿里巴巴集团并非中国军工企业,也未参与任何军民融合战略。对于任何试图歪曲本公司形象的行为,本公司将采取一切可行的法律行动。

阿里巴巴公告称,被列入中国军工企业名单不会影响本集团在美国乃至全球正常开展业务,因为本集团的业务与美国军事采购无关。该名单并不会施加其他出口管制或制裁措施,亦不会禁止任何人(美国国防部除外)与本集团进行业务往来或交易本公司的证券。

图片

百度 6 月 9 日在港交所公告,公司获悉,美国国防部已发布《关于指定中国军工企业的通知》,根据该通知,国防部副部长已将本公司列入国防部的中国军工企业名单。由于公司既不是中国军工企业,也不是中国国防工业的军民融合企业,公司认为将其列入该名单并无正当理由。

百度公告称,中国军工企业名单并非制裁名单。与该名单相关的美国政府采购限制不会影响公司的业务,且中国军工企业名单并未限制进行公司证券交易。

蔚来 6 月 9 日在港交所公告,本公司关注到美国国防部将本公司列入其「中国军事企业」名单(「CMC 名单」)。本公司相信,被列入 CMC 名单缺乏正当依据,因为本公司既非中国军事企业,也非中国国防工业基础的军民融合贡献者。

图片

蔚来公告称,CMC 名单并非制裁名单。与该名单相关的美国政府采购限制不会影响本公司的业务,且 CMC 名单亦不限制本公司证券的交易。本公司将积极与美国国防部沟通,以纠正本公司被列入 CMC 名单一事,包括在必要时采取法律行动,以维护本公司及全体股东的利益。

(来源:IT 之家)

微软 AI CEO 苏莱曼改口,收回「AI 将于 18 个月内取代大部分白领工作」言论

6 月 9 日消息,据科技媒体 The Verge 今天报道,微软 AI 部门 CEO 穆斯塔法 · 苏莱曼正在淡化此前的「AI 将取代白领工作」言论。

苏莱曼在昨天的一档播客节目中表示,他当时想表达的意思是,AI 将帮助白领完成工作,而不是直接取代他们的职业。

图片

他解释称:

发电子邮件、与同事沟通、做 PPT 这类任务将越来越自动化和数字化,我们能够生成越来越多这类内容。

但我觉得白领职位并不一定会消失,人们能够借助工具更快、更高效地完成工作。如今这类工作本身就相当重复、依赖人工劳动且耗费时间。

技术发展的自然方向,就是让你的生活变得更加轻松、快速,减少摩擦并实现更优秀的体验。

据此前报道,苏莱曼曾在今年 2 月接受《金融时报》采访时表示:

白领工作,也就是坐在电脑前的职业,我觉得,无论是律师、会计师、经理还是市场营销人员,其中大多数任务都将在未来 12-18 个月内被 AI 完全自动化。」

(来源:CnBeta)

图片

滴滴率先接入微信AI生态

随着微信正式面向开发者提供 AI 生态接入能力,滴滴作为首批合作伙伴,已与微信团队合作,将核心网约车服务融入微信 AI Agent。未来用户通过微信内 AI 交互,即可直接唤起滴滴快车、专车、特惠等服务。

当用户在微信中产生出行需求,只需说一句“帮我叫一辆滴滴去机场”、“我要打滴滴回家”或“要特惠快车/快车”,即可根据行程距离、时效需求与个人偏好,自动推荐最优车型。

通过一键唤起叫车服务,全程不跳转,实现极速出发。

据了解,滴滴顺风车、滴滴代驾等更多服务也将接入微信 AI 生态。

从对话到上车,滴滴十多年出行能力沉淀,让微信里的每一次出行都更聪明、精准、可靠。

微信朋友圈搜索功能全面开放,两种方式可启用

6 月 9 日消息,微信新版朋友圈主页最近右上角出现了「放大镜」图标,支持搜索历史朋友圈内容,点击图标输入关键词即可快速定位。IT 之家今日就微信朋友圈搜索功能开放进度询问了腾讯客服,对方表示:

朋友圈搜索功能已全面开放,您可通过聊天界面右上角【放大镜】图标或【发现页】->【搜一搜】进行操作。若遇到无法搜索的情况,可能是关键词未在朋友圈中被提及或内容涉及敏感信息导致无法展示。

图片

根据腾讯客服官方的说法,朋友圈搜索功能目前有两种启用方式,除了前面提到的放大镜外,用户还可以在「搜一搜」直接搜索关键词查询朋友圈的内容,除了自己的朋友圈外,还可以搜索好友朋友圈内容。(来源:IT 之家)

图片

谷歌发布实时语音互译模型 Gemini 3.5 Live Translate:可识别 70 余种语言,谷歌翻译 App 就能用

6 月 9 日消息,北京时间 9 日(今天)晚间,谷歌正式发布最新的实时语音互译音频模型 Gemini 3.5 Live Translate,迈出实时翻译的下一步。

Gemini 3.5 Live Translate 可自动识别 70 多种语言,并生成流畅、自然的翻译语音,同时保留说话者的语调、语速和音高

图片

根据介绍,传统轮流式系统通常要等说话者说完后才开始翻译,Gemini 3.5 Live Translate 则会连续生成语音,在「等待更多上下文以提升翻译质量」和「即时翻译以跟上说话者节奏」之间取得平衡。整个会话过程中,翻译音频可以保持流畅,避免尴尬停顿,并始终只比说话者慢几秒。(来源:IT 之家)

为首款 NAS 铺路:小米智能存储 App 上架,新品外观示意图曝光

6 月 9 日消息,据 IT 之家小伙伴反馈,小米在苹果 App Store 上架了一款小米智能存储 App,有望为小米首款 NAS 产品铺路。

根据小米官方介绍,这是一款为家庭用户打造的智能存储客户端,方便用户管理家中的照片、视频和文件。用户通过手机即可访问、备份和分享。

  • 支持多端同步与远程访问,让数据随取随用;

  • AI 相册与影视墙功能,让家庭回忆与娱乐内容井井有条。

用户可以在小米智能存储 App 中添加「Xiaomi 智能存储」设备,而这款设备的示意图也出现在 App 中。

图片

从图中可以看到,「Xiaomi 智能存储」有望采用黑色的立方体外观,上半部分是通风孔,下半部分是一排接口,包括电源口、有线网口、USB-A、HDMI,以及电源键。(来源:IT 之家)

任天堂宣布将为《塞尔达传说:时之笛》推出 Switch 2 重制版

在本周二举行的任天堂直面会(Nintendo Direct)上,任天堂正式公布将为 Switch 2 推出经典作品《塞尔达传说:时之笛》的重制版,引发全球玩家高度关注。据介绍,这一重制版计划于 2026 年登陆 Nintendo Switch 2 平台,更多具体信息将于今后逐步公开。

图片

这是《塞尔达传说》系列自 2024 年推出《塞尔达传说:智慧的在线》(Echoes of Wisdom)以来的首个重磅新作项目,该作以塞尔达公主为主角,曾在系列中引发广泛讨论。在此之前,任天堂于 2023 年推出的《塞尔达传说:王国之泪》(Tears of the Kingdom)作为《旷野之息》(Breath of the Wild)的直接续作,已经在 Switch 时代奠定了这两部开放世界作品的标杆地位。

图片

随着 Switch 2 主机上市,任天堂也为《旷野之息》和《王国之泪》提供了强化版本,以配合新硬件的性能升级,让玩家在新平台上重温这两部作品。去年 11 月,任天堂还推出了与《王国之泪》世界观相关的无双类动作游戏《塞尔达无双:封印时代》(Hyrule Warriors: Age of Imprisonment),进一步扩展了该系列的内容版图。(来源:CnBeta)

图片

东京大学研究揭示纸质书与屏幕阅读时的大脑活动差异 前者或有助于提升理解力

5 月 22 日消息,据 CCTV 国际时讯今晚报道,美国国防部今天(5 月 22 日)再度公布一批「与外星人、地外生命、不明空中现象以及不明飞行物(UFO)相关」的政府文件。

一项来自日本东京大学的神经科学研究显示,人类大脑在阅读纸质书和在电子屏幕上阅读时表现出明显不同的活动模式,其中纸质阅读在理解复杂叙事信息方面可能更具优势。研究团队招募了 25 名年轻受试者,让他们在两种不同媒介上阅读同一部漫画故事,并在随后通过磁共振成像(MRI)监测其大脑活动,同时考察他们对故事内容的理解与记忆表现。每名受试者都既在纸上阅读也在平板设备上阅读,自己充当对照组,以便更直接比较不同媒介对同一人的影响。

图片

实验中,参与者阅读的是一部从两位主人公视角展开的特殊漫画,故事被划分为两个部分。阅读后,研究人员向受试者提出既包括简单情节回忆,也包括需要整合两条叙事线索的复杂问题,从而考察他们对故事整体脉络的掌握情况。

结果显示,在纸质和电子条件下,受试者在问题回答的准确性上并无显著差异,但阅读顺序与媒介搭配对答题速度产生了明显影响。那些先用平板阅读故事开头、再以纸质形式阅读后半部分的参与者,在回答需要整合完整情节的复杂问题时,用时更长。

更关键的是,脑成像结果揭示了不同阅读媒介在启动大脑语言相关区域方面存在「用力方式」的差别。先在纸上阅读故事的参与者在随后理解剧情时,额叶语言相关脑区的激活程度反而较低,研究团队认为这可能意味着纸质阅读在信息初次输入阶段帮助大脑以更低「负荷」整理叙事细节,从而降低后续加工的认知成本。

(来源:CnBeta)

 

*图片来源:视觉中国

图片
图片
图片

播客上新

如今,底层模型的边界在野蛮生长,整个行业正迎来估值跳涨与价值重估并存的拐点之年。在这个时间点,我们策划了一期年中复盘特辑,邀请国内出手 AI 最活跃的基金之一的锦秋基金的两位合伙人一起深度复盘 2026 年上半年的模型、应用、具身行业。

我们将用最真实的视角,帮你把那些最纠结的抉择一次性聊透:D1 创业到底选中国还是美国,怎么判断?在 AI 行业的热潮里,哪些是真趋势,哪些只是泡沫? 面对大厂的底层挤压,哪些方向是留给创业者的真机会,哪些看起来热火朝天、但其实早就是大厂的终极战场?当底层模型不断吞噬应用,垂类 AI 应用的活路到底在哪里?

🌟长按下方「卡片二维码」即可收听~欢迎关注我们的播客「开始连接LinkStart」(小宇宙 App),一起用科技、商业和人文的视角描摹这个时代。

图片
图片
图片

 

  •  

号称「最强模型」的 Mythos 正式发布,但 Anthropic 还给它装了个「护栏」

Image
最强模型,但会自动「熄火」。

作者|张勇毅

 

望眼欲穿近两个月、在社交媒体上占尽风头的 Anthropic Mythos 模型,今天终于正式发布了。

 

两个月前,Anthropic 说自己最强的那一类模型太危险、不能公开,只把它发给了一百多家机构。

 

今天,这类能力对所有人开放了:公开发布的版本叫 Claude Fable 5;那个真正「不设限」的 Mythos 5,依然只留给少数合作伙伴。换句话说,你能用上的最强 Claude,是一台被加了边界的 Mythos。

图像

 

而这道护栏的设计,比「公开发布」四个字本身更值得说:它保证安全的方式,不是拒绝你。

 

Anthropic 这次一口气放出两个模型:Claude Fable 5 和 Claude Mythos 5。它们其实是同一个底层模型,差别只有一处——安全护栏。

 

Fable 5 套了一整套安全分类器,面向所有用户;Mythos 5 拆掉了其中一部分限制,只给 Project Glasswing 里的网络安全合作伙伴。

 

说白了,Fable 5 就是一台「带护栏的 Mythos」

 

和 Anthropic 一贯的风格一样,模型名字本身也藏了点心思。

 

据 Anthropic 解释,Fable 来自拉丁语 fabula,意思是「被讲述的故事」,和希腊语里的 mythos 同源。两个名字指向同一件东西,区别只在于,其中一个被加上了边界。

 

把时间线往回拉一下。今年四月,Anthropic 启动 Project Glasswing,第一次放出 Mythos 级模型(Claude Mythos Preview)时,只给了一小撮网络安全和关键基础设施机构——到上周,这份名单扩展到十几个国家、一百多家机构。当时官方的说法是,这类模型一旦落到错误的人手里,能造成严重破坏,所以不能公开。

Image

两个月,从「太危险不能发」到「所有人都能用」。这中间发生的事,才是这次发布真正的主角。

 

大多数 AI 的安全机制,是「拒绝」——你问一个它不该答的问题,它告诉你「抱歉,我不能帮你」。

 

Fable 5 换了个思路。安全不是靠它学会拒绝,而是在危险时把它换掉。

 

具体来说,Fable 5 背后挂着一组独立的分类器。

 

当这组分类器判断你的请求落在三个高风险领域——网络攻击、生物化学武器、以及模型蒸馏(指把一个模型的能力「偷」出来,去训练自己的模型)——它不会让 Fable 5 来回答,而是悄悄把这道题转交给 Opus 4.8,同时告诉你:刚才发生了一次降级。

 

这个设计有意思的地方在于,它把「安全」和「能力」拆成了两件事。你买的是 Mythos 级别的能力,但在最危险的那三个领域,你其实是在跟 Opus 说话。 Anthropic 自己的说法是,降级到 Opus 4.8 的体验,总比被 Fable 直接拒绝要好——毕竟 Opus 4.8 本身也是个相当强的模型。

Benchmark table titled Mythos 5 & Fable 5, comparing Claude Mythos 5 and Fable 5 against Claude Mythos Preview, Claude Opus 4.8, GPT 5.5, and Gemini 3.1 Pro.

Anthropic 给出的数据是,超过 95% 的对话根本不会触发降级。换句话说,对绝大多数人来说,你用到的 Fable 5,和合作伙伴手里那个「完全体」Mythos 5,体验几乎没有区别。

 

那这套护栏结实吗?Anthropic 说,他们做了超过一千小时的外部红队测试,没有人找到能绕过它的「通用越狱」方法(指一种能让模型彻底无视所有安全限制的万能手段)。

 

当然他们也留了余地:完全杜绝越狱大概是不可能的,目标只是让任何漏洞都「慢到、贵到」来不及被大规模利用。

 

但这套机制有代价,而且 Anthropic 自己先说了出来:分类器现在调得偏严,会误伤正常请求。一个研究病毒的生物学家,一个做渗透测试的安全工程师,都可能在合理的工作里被莫名其妙地「降级」。官方承认这会让一些用户感到烦躁,承诺后续慢慢收窄、降低误报。

 

我把这件事想了一会儿,觉得它其实是一个挺聪明、也挺无奈的折中。聪明在于,它没有在「发」和「不发」之间二选一,而是在能力上切了一刀;无奈在于,这一刀切得并不精准——为了赶在出事之前先上线,Anthropic 宁可错杀,不肯漏过。

 

强到危险,才配得上这套护栏

 

聊了半天安全,你可能会问:它到底强到什么程度,值得这么如临大敌?

 

基准测试我本来想跳过——跑分这东西看多了会麻木,何况 Anthropic 列了一长串,几乎项项第一。

 

最唬人的一个来自 Stripe。据 Anthropic 披露,Stripe 在一个五千万行的 Ruby 代码库上,用 Fable 5 做了一次全库迁移,一天完成——而这件事,原本要一整个团队手工干两个多月。更关键的是效率:在 Cognition 的 FrontierCode 编程测试里,Fable 5 在「中等算力消耗」下就拿到了最高分,Token 效率比以前的 Claude 明显更好。

 

这也解释了为什么 Anthropic 反复强调 Token 效率——一个能连续自主工作很久、动辄消耗上百万 Token 的模型,如果还很「废话」,成本会高到没人用得起。

 

视觉这块的进步更直观。以前的 Claude 玩宝可梦火红版,得靠一整套辅助工具链才能磕磕绊绊地推进;Fable 5 只用最基础的视觉接口,就自己通关了。它还能仅凭几张截图,把一个 Web 应用的源代码还原出来。

 

Anthropic 内部的蛋白质设计专家,用 Mythos 5 把药物设计流程中的部分环节,加速了大约十倍。第二个更夸张:在一项基因组学研究里,Mythos 5 在几乎完全自主的状态下连续工作了一周多,自己训练出了一个机器学习模型——这个模型的表现,超过了发表在《Science》上的同类模型,而它的体量,只有后者的百分之一。

 

当一个模型能独立做完一周的科研,还做得比人类发在顶刊上的成果更好,「它会不会被用来设计病毒」就不再是杞人忧天。 这正是 Anthropic 给生物化学领域单独上锁的原因——同一种能力,在研究者手里是解药,换一双手可能就是别的东西。

Image

 

能力和危险,在这里是同一件事的两面。护栏不是因为这个模型不行才加的,恰恰是因为它太行了。

 

可以看出,Anthropic 把 Mythos 形容成一个需要全程看管的危险品。但官方口径之外,也有不一样的声音。

 

一位 ID 为 @zekramu 的 X 用户,自称参与了 Mythos 的企业试点,最近发帖分享了用整整一天之后的感受——他的描述,和发布会上的叙事并不完全一致。

 

据他说,Mythos 确实强,尤其在安全研究类任务上,明显比 Opus 和 GPT-5.5 的最高配更能打,像是专门冲着这类活儿调过的。但「强」和「威胁人类」是两码事。他举了个细节:这个被官方说得神乎其神的模型,在他们公司一套基于 Bazel(一种代码构建工具)、又改了不少自定义逻辑的流程面前卡了壳,最后还得他先把代码编译好,再让模型去跑。

Image

 

更耐人寻味的是护栏本身。据他描述,Anthropic 随模型一起发来的,不是大家熟悉的 Claude Code,而是一套专门用来「防止模型逃逸」的运行环境——所谓 Project Glasswing,在他看来很大程度上就是这套沙箱。但他觉得这套环境做得相当粗糙,甚至怀疑其中一部分限制根本没真正生效;他还称自己绕开了官方设下的边界,在沙箱之外跑过这个模型。

 

至于战绩,他说 Mythos 在他们的产品里揪出了大量此前没被发现的安全漏洞,多到足以让团队重新掂量自己的安全策略。

 

他的结论很值得玩味:这模型在安全攻防上确实有两把刷子,但在他眼里,它更像一个极其昂贵、极其专精的工具,而不是 Anthropic 暗示的那种「悬在所有人头顶」的存在。

 

说回普通人最关心的事:多少钱,什么时候能用。

价格上,Fable 5 和 Mythos 5 的 API 定价是每百万输入 Token 10 美元、输出 50 美元。横向比一下就有意思了:比起 Mythos Preview 的 25/125 美元,降了六成;但比 Opus 4.8 的 5/25 美元,整整贵了一倍;和 OpenAI 的 GPT-5.5(5/30 美元)相比,输入贵一倍,输出贵约六成七。

图像

换句话说,它是迄今最强的 Claude,也是最贵的 Claude 模型之一。 强,但不便宜。

前面提到的 @zekramu 也算个旁证:据他估算,光是企业试点阶段的投入,就到了数百万美元级别;「太贵」是他反复念叨的一句话。

Image

 

订阅用户还得留意一个时间窗口。从今天到 6 月 22 日,Pro、Max、Team 和企业版用户可以免费用 Fable 5;6 月 23 日起,继续用就得额外买 usage credits 了。

 

Anthropic 说,等产能跟上,会把 Fable 5 重新做成订阅标配——但没给具体时间。API 和按量付费的企业客户不受这个节奏影响,今天起照常调用。

 

这个略显别扭的「先免费、再收费、以后再说」,其实透露了一个信号:产能不够。Anthropic 自己也承认,预计 Fable 5 的需求会「非常高、很难预测」。一个对所有人开放的最强模型,先得过算力这一关。

 

而这次发布里,真正容易被划过去、却最值得停下来看的,是另一条政策。

从 Fable 5 开始,所有 Mythos 级模型的流量都会被强制保留 30 天,覆盖第一方和第三方平台。

 

Anthropic 承诺不拿这些数据训练模型,只用于安全监控,比如识别新型越狱、以及那种分散在很多次请求里、单看每一条都正常的复杂攻击。为此他们也加了新的隐私保护:记录每一次人工访问、30 天后基本全部删除。

 

听上去合情合理。但对那些当初正是冲着「零数据保留」才选择 Anthropic 的企业客户来说,这是一个需要重新评估的变化。 

 

你用最强模型的代价,不只是更贵的账单,还包括:你的数据,会在 Anthropic 的服务器上多待一个月。

安全和隐私,在这里被摆上了同一张天平。而 Anthropic 给出的答案是:为了防住前所未有的攻击,得先把所有人的流量都看上 30 天。这笔账划不划算,恐怕每家公司得自己算。

 

把这些放在一起看,Fable 5 真正的新意,也许不在它有多强,而在 Anthropic 趟出了一条新路——怎么把一个危险到不敢公开的能力,拆成一个所有人都能用的产品。

 

办法是:用分类器在能力上切一刀,用降级代替拒绝,再用 30 天的留存,当作兜底的监控网。

 

它不完美。会误伤,会变贵,会让一部分人对自己的数据多一层顾虑。但它至少回答了一个所有前沿实验室迟早都要面对的问题:当你手里的东西强到足以伤人,你是把它锁进只有少数人能进的房间,还是给它装上一道足够结实的护栏,再交到所有人手里?

 

Anthropic 选了后者。

图像

至于这道护栏到底够不够结实——这一次,替它做压力测试的,不再是那一百多家机构,而是所有人。

 

 

*头图来源:ClaudeDEV

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

Image
Image

 

  •  

苹果发布下一代 Siri AI 和 Apple Intelligence,暂不支持中国;微信 AI 官宣内测;传月之暗面寻求 20 亿美元新融资

苹果发布全新 Siri,国行版相关功能暂不提供

北京时间6月9日凌晨,WWDC 2026 主题演讲结束。全新 Siri终于落地,代价是Apple 把它的「大脑」交给了 Google。

全新 Siri 拥有独立的 App、能理解「个人语境」(包括行程、联系人、照片内容)、能感知屏幕上正在发生的内容,还能替你在不同 App 之间执行操作。Siri App 里的对话可以跨设备同步,手机、iPad、Mac、Vision Pro 乃至手表之间无缝接续。

苹果强调:全新 Siri 借的是 Google 的模型,而不是把你的数据交给 Google。按官方说法,整套系统仍运行在设备本地与自家的私有云计算(Private Cloud Compute)上——简单任务在端侧完成,只有复杂任务才送往云端,且这部分跑在可被安全研究者独立验证的私有云里。

不过,这套以 Gemini 为底座的全新 Siri,在中国大陆,相关功能暂不提供。据了解,国行版新 Siri 的「大脑」不会是 Gemini,而会换成一颗国产大模型——阿里的通义千问,是目前最有可能的人选。(来源:极客公园)

Sam Altman 宣布 OpenAI 进入「第三阶段」

当地时间本周一,Sam Altman 与 OpenAI 首席科学家雅各布 · 帕霍茨基联合发布博客文章,阐述公司未来发展规划。二人称,OpenAI 第一阶段聚焦通用人工智能的技术研发;第二阶段则面向全球推出产品,并研究用户的实际使用场景。

他们在文中写道:「如今我们正式进入第三阶段。经济格局正围绕人工智能迎来重塑。当下的核心问题是,如何让先进人工智能技术变得供给充足、成本亲民、安全实用、简单易上手,让每个个人与机构都能从中获益。顶尖技术能力只是一部分,更重要的是将技术转化为真正能助力人们发展的实用工具。」

OpenAI 提出三大核心目标:打造自动化人工智能研究员、推动经济提速发展、为全球每个人配备专属通用人工智能。

文中还提到:「强大的智能系统必须坚守安全底线,契合人类意愿,并始终处于人类管控之下。我们并不追求全面自动化的未来,那样的生活缺乏价值,也暗藏风险。人工智能应当助力人们追逐理想,而非脱离人类的掌控。」(来源:IT 之家)

 

曝谷歌向英特尔下单超 300 万颗 TPU 芯片

据《The Information》报道,谷歌近期已向英特尔公司下达订单,计划2028年前生产逾300万颗谷歌自研的TPU芯片。

据知情人士透露,在经过数月的技术测试后,谷歌决定将部分张量处理单元(TPU)的制造订单交给英特尔。

报道称,英伟达也正在测试英特尔的制造技术,评估其是否能够用于生产一款即将推出的新型处理器。该产品计划将四颗GPU整合封装为一个单元,以提升整体计算性能。

此外,特斯拉首席执行官马斯克也曾在今年4月表示,该公司计划在其“Terafab”项目中使用英特尔下一代14A制程生产芯片,这一先进AI芯片制造基地计划落地奥斯汀。

近几个月来,谷歌TPU在硅谷炙手可热,公司正计划通过新一代产品进一步巩固这一优势。尽管如此,英伟达的GPU仍然是AI领域的行业黄金标准,尤其是在训练最先进的大模型方面依旧占据主导地位。

不过,越来越多的新兴竞争者正试图挑战英伟达在推理市场的地位。这些企业推出专门面向推理场景的AI芯片,希望通过降低聊天机器人和AI智能体的响应延迟来争夺市场份额。(来源:财联社)

 

微信 AI 官宣内测

6月8日,微信开发者官方今日发布了一篇《关于开发者接入微信 AI 生态的指引》,确认微信 AI 正在内测阶段。

微信开放平台为开发者提供了接入微信 AI 生态的能力,提供两种接入模式,开发者可按需选择,满足不同规模团队的开发需求(两种模式不互斥,可同时开启):

  • 自动模式:授权平台提审时读取小程序源码,无需投入额外开发。同时,平台将分析小程序页面,让微信 AI 能直接操作。

  • 开发模式:开发者可基于小程序业务特性,自主个性化开发。通过平台评测与审核后,可被微信 Al 调用。

此外,「微信 AI」可能并不是最终名称,服务条款写有「后续以实际名称为准」。

微信开发者官方还称,是否接入由开发者自主决定,接入与否不会影响现有的小程序服务。(来源:IT之家)(来源:IT之家)

 

阿里宣布合并通义大模型事业部和未来生活实验室

6 月 8 日,宣布合并通义大模型事业部和未来生活实验室,成立 Token Foundry 事业部,由集团 CEO 吴泳铭直接负责。

据了解,此次调整涉及到一批 AI 业务。周靖人将担任巴巴首席科学家,牵头成立阿里巴巴 AI 未来研究院,专注前沿 AI 科技的探索与突破。郑波带领 Happy Horse、Happy Oyster 等加入 Token Foundry 事业部。

通义大模型团队从零到一的搭建,到 Qwen 系列在全球模型中确立领先地位,周靖人是关键人物之一,并于去年成为阿里巴巴合伙人。首席科学家是阿里巴巴技术体系的最高学术头衔,此次任命既是对周靖人贡献的高度认可,也是一次面向未来的战略部署。(来源:每日经济新闻)

传月之暗面寻求 20 亿美元规模新一轮融资

6 月 8 日,据彭博社报道,大模型独角兽月之暗面 Kimi(Moonshot AI)正在寻求新一轮融资,金额高达 20 亿美元,约合 135 亿元。融资后,月之暗面的估值达到 300 亿美元,约合 2000 亿元,这是该公司六个月内的第三轮融资。

从估值来看,月之暗面已经超越了另一家大模型巨头 MiniMax(市值 1593 亿港元,约 200 亿美元),但低于智谱市值(5858 亿港元,约 750 亿港元),此前 DeepSeek 被曝估值约 500 亿美元。

据知情人士透露,月之暗面已与潜在投资者展开初步洽谈,计划筹集超过 10 亿美元的资金。知情人士称,就在 Moonshot 即将完成由美团领投的融资轮之际,双方开始此次洽谈。

此前 5 月 6 日,月之暗面被曝光即将完成新一轮 20 亿美元融资,投后估值突破 200 亿美元。此轮融资由美团龙珠领投,CPE(中信产业基金)等参投,其中龙珠出手超 2 亿美元。(来源:澎湃新闻)

 

小米机器人亮相小米新品发布会,能自己拿手机拍照

6 月 8 日,在小米 17T 系列新品发布会上,小米 17T 和小米 17T Pro 两款机型正式发布。

在发布会上,小米机器人惊喜亮相,拿着小米 17T Pro 进行拍照,通过音量键变焦拍照方式,演示了该手机的长焦能力。

小米官方今年 3 月初宣布,在汽车工厂自攻螺母上件工站,小米机器人已经做到 3 小时持续作业,双侧同时安装成功率 90.2%,并满足产线 76 秒的节拍。

为了进一步提升作业能力,小米 3 月 27 日宣布对 Xiaomi CyberOne 的仿生手做了一些设计改造,压缩了 60% 的体积让其完全与工人手部尺寸一致,增加了 64% 的自由度,全掌触觉传感器覆盖面积增加到 8200 平方毫米,实现了 15 万次以上的抓握操作循环寿命,并增加了仿生汗腺设计提升主动散热能力。

此次小米机器人实现用仿生手操控手机,也是一种精细操控能力的展示。(来源:IT 之家)

 

网传理想公关一号位将离职,入职仅半年

6 月 8 日消息,从多个大厂爆料账号爆出理想汽车公关一号位杨继斌从理想离职。

作为原字节跳动公关总监,杨继斌于去年 12 月正式宣布加盟理想汽车。

如果杨继斌近期离职,距离其加盟理想时间仅过半年。

据了解杨继斌下午在朋友圈转发了「理想首先是一家 AI 公司」的理想官号视频,未对此事进行回应。(来源:IT 之家)

微信灰度测试朋友圈关键词搜索功能

据多名网友分享,微信新版朋友圈主页最近右上角出现了「放大镜」图标,支持搜索历史朋友圈内容,点击图标输入关键词即可快速定位。

从目前网友的分享来看,该功能正处于灰度开放的阶段。腾讯客户对此回复称:

微信朋友圈新增了搜索功能!您可以点击微信首页右上角的「放大镜」图标,进入【我的朋友圈搜索】界面,输入关键词即可查找历史朋友圈内容。该功能支持按朋友或发布时间筛选,方便您快速定位需要的信息哦 ~(来源:IT之家)

 

小米发布 MiMo-V2.5-Pro UltraSpeed 模式,3 倍价格 10 倍输出体验

6 月 8 日,小米 MiMo 宣布,与 TileRT 联合发布 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致 Codesign,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。

MiMo-V2.5-Pro-UltraSpeed API 同步上线,采用限时体验价,定价为 MiMo-V2.5-Pro 的 3 倍,同时提供输出速度约 10 倍的提升(仅支持 API 体验,不支持 Token Plan)。官方称之为 3 倍价格提升,10 倍输出体验。

作为参考,小米 MiMo-V2.5-Pro 每百万 tokens 输入 0.025 元(缓存命中)/ 3 元(未命中缓存),每百万 tokens 输出 6 元。

官方表示,由于高速推理资源供给有限,本次 MiMo-V2.5-Pro-UltraSpeed 采取申请制限时开放,申请通过的用户可限时接入 API 体验,时间仅限 2026 年 6 月 9 日至 6 月 23 日 23:59。(来源:IT之家)

黄仁勋首次亮相韩国综艺,大秀皮衣舞技

英伟达 CEO 黄仁勋上周开启了韩国首尔之行,将做客韩国热门综艺节目《You Quiz on the Block》。

根据该节目放出的预热内容,黄仁勋在院子里随着动画电影《K-POP:猎魔女团》的主题曲《Golden》起舞,依然穿着他标志性的皮夹克。

在预告中,黄仁勋与主持人刘在石对谈,表示他喜欢《Golden》这首歌。(来源:IT之家)

 

  •  

库克的最后一场 WWDC:AI Siri 登场,但国行用户仍暂时用不上

Image
等了两年的全新 Siri 终于落地,而国行用户,暂时还用不上。

作者|张勇毅

北京时间今天凌晨,WWDC 2026 主题演讲结束。Apple 把旗下所有系统升级到「27」,但真正的主角只有一个:那个被许诺了两年、一再跳票的全新 Siri,终于落地——代价是,Apple 把它的「大脑」交给了 Google。

这也是 Tim Cook 以 CEO 身份主持的最后一届 WWDC(原硬件工程主管 John Ternus 将接任)。把 AI 这一课补上,几乎是他任内最后、也最重要的一笔。

Image

除了 AI,这场发布会的另一条线是性能——但那部分我们放到最后说。先看这次真正的重头戏。

01

全新 Siri 来了,但大脑来自 Google

那个 2024 年就被许诺、却迟迟不来的 Siri,今天终于有了实体:独立的 App、能理解「个人语境」(记得你的行程、联系人、照片内容)、能感知屏幕上正在发生的内容,还能替你在不同 App 之间执行操作——而不再像过去那样,只会丢给你一个网页链接,然后祝你好运。

现场演示里,Siri 查了 2026 世界杯赛程,又被要求围绕某场比赛策划派对、从两队所属国家各推荐几道菜;

Image

在 Mac 上,你可以对图片、文字、视频按住 Ctrl 点击唤起它,也能选中三份演示文稿,让它帮你比较、给出建议。Siri App 里的对话会跨设备同步,手机、iPad、Mac、Vision Pro 乃至手表之间无缝接续。

Image

Apple 还加了一个「Search or Ask」下滑手势:运行快捷指令、搜手机内容,或把一个复杂问题直接转交给 ChatGPT、Claude、Gemini 这类第三方。

这套能力,几乎逐字复刻了 Apple 两年前对 Siri 许下、却始终没能兑现的承诺。 这两年的空窗成了行业笑柄,Apple 还因为提前宣传了没能如期上线的功能,背上一桩关于 Apple Intelligence 营销的法律纠纷。

支撑它的 Apple Intelligence 同步升级:第二代端侧模型、更强的听写、借助 Spotlight 语义索引提升搜索与感知、世界知识与屏幕感知。而 Apple 补课的方式,是把一部分 AI 交给了 Google。

Image

 

这桩多年合作在今年早些时候就已官宣——Apple 的「基础模型」(Apple Foundation Models)将基于 Google 的 Gemini 模型与云服务构建。据彭博社记者 Mark Gurman 等人报道,这是一颗约 1.2 万亿参数的定制 Gemini,Apple 为此每年支付约 10 亿美元,体量远超 Apple 自研的云端模型,也终结了多年来「Apple 究竟会自研、收购还是合作」的争论。

Image

 

但 Apple 反复强调了一件事:借的是 Google 的模型,而不是把你的数据交给 Google。 按官方说法,整套系统仍运行在设备本地与自家的私有云计算(Private Cloud Compute)上——简单任务在端侧完成,只有复杂任务才送往云端,且这部分跑在可被安全研究者独立验证的私有云里。换句话说,Apple 想要 Gemini 的能力,又不想交出它一贯标榜的隐私底线。这套「既要又要」能不能立得住,要等真正用起来才知道。

02

库克的最后一课:一场迟到的 AI 大重组

要理解今天这场发布会,得回看过去一年 Apple 内部的那场地震。

据多家媒体报道,库克本人曾承认,Apple Intelligence 1.0 的失败程度,甚至超过了当年的 Apple 地图事件——这家公司一度被外界调侃为「AIMLess」(在 AI/ML 上漫无目的)。2025 年初一场秘密高管会议之后,他亲自下场深度参与。

重组的结果,今天都站上了舞台:Vision Pro 之父 Mike Rockwell 接管 Siri,软件主管 Craig Federighi 全面主导 AI 战略,前 Google 与微软的工程高管 Amar Subramanya 加盟领衔模型研究,而原 AI 负责人 John Giannandrea 已于今年离开。这场发布会,本质上是库克在交棒之前,给自己最大的一块短板做的一次了断。

Image

 

对常拍照、回家慢慢修图的人来说,照片这一段值得单独看。

Apple 给照片换上了一批新的 AI 模型:Clean Up(清理)能在更复杂的画面里抹除杂物;新增的 Extend 可以为照片「续画」出原本不存在的边缘;Reframe 则让你用手势改变照片的视角、把画面拉远——选好角度,按下保存即可。

按下保存的那一刻,照片会被送往云端处理(Apple 称这一步同样在其私有云上完成)。这些编辑能力如今是端侧加云端模型共同驱动,而不再是 Apple 过去反复强调的「全部在你的设备上完成」。 功能将于今年稍晚登陆 iPhone、Mac 与 Vision Pro。

相机本身也更灵活:你可以自定义相机控件的排列顺序,控件被分成基础、手动、设置三类,进阶选项还能解锁景深与曝光等更专业的控制。对想拿 iPhone 当主力机的人,这是个不大但实用的变化。

 

03

但这套 AI,国行用户暂时用不上

今天最该让国行用户留意的,是 Federighi 在介绍 Apple Intelligence 时专门补的一句话:中国地区需视当地监管批准情况而定,相关功能暂不提供。

Image

 

换句话说,这场发布会的头号主角——以 Gemini 为底座的全新 Siri,在中国大陆,至少在现阶段是缺席的。

这其实不难理解。Gemini 及其背后的 Google 服务在国内本就不可用;而中国对生成式 AI 有一套严格的备案与审批制度,要求内容过滤、数据本地化,并在上线前取得监管批准。一套以 Google 模型为核心的方案,没法原样搬进来。

那国行版会是什么样?参考去年的路径,大致能推测出轮廓。

去年国行 Apple Intelligence 计划提供一套完全本地化的方案:端侧仍跑 Apple 自研模型,但由阿里巴巴提供一层用户无感知的内容过滤与合规中间层,百度作为参与方负责搜索、视觉智能等能力,云端处理则交给已经在运营国行 iCloud 的云上贵州,而且只在国行设备上可用。

几乎可以肯定,国行版新 Siri 的「大脑」不会是 Gemini,而会换成一颗国产大模型——阿里的通义千问,是目前最有可能的人选。

但这一次的难度更高。新 Siri 比去年那套激进得多:它要读你的屏幕、调用你的个人数据、跨 App 替你做事。这种「能看、能动」的能力,恰恰是监管最敏感的地带,备案与审批只会更慢、更复杂。

去年国行 Apple Intelligence 比全球版晚了大半年才落地。这次大概率只会更晚——国行用户想用上一个「中国特供」的新 Siri,可能要等到 2027 年,甚至更久。而在这段空窗里,华为、小米们正带着各自的大模型猛攻高端市场。这道时间差,是 Apple 中国生意实打实的风险。

聊完 AI,剩下的部分可以快进。

如果只看数字,iOS 27 像一场「维修发布会」。

Image

 

据 Apple 公布,应用启动最高快 30%、AirDrop 快 80%、照片新拍内容加载快 70%、iPadOS 文件浏览快 5 倍,Wi-Fi 与蜂窝切换也更迅速,一项底层的 CPU 调度器优化还让老 iPhone 更跟手。

Image

整页 PPT 全是百分比,却几乎没有一个是新功能。兼容机型与 iOS 26 完全一致(最低到 iPhone 11 与第二代 SE),没淘汰任何旧设备;据彭博社报道,这种「做减法」也是在为今年的折叠屏 iPhone 铺路。

设计上,争议中的 Liquid Glass 新增了透明度滑块、图标更锐利。零碎的新功能也有一些:iCloud 共享相册向 Android 和 Windows 开放并支持全分辨率、健康 App 加入围绝经期记录与科普、FaceTime 双摄、同号双机切换、快捷指令支持自然语言,家长控制也加强了,新的 Apple Child Account 能更细地限制孩子用哪些 App。

其余几个平台基本是同一个基调。macOS 启用新代号 Golden Gate(接替 Tahoe),同样给 Liquid Glass 加了透明度滑块、统一了窗口圆角;另据报道,它将只支持 Apple Silicon,彻底告别 Intel Mac(以 Apple 官方兼容列表为准)。iPadOS 27 继续「让 iPad 更像电脑」:常驻菜单栏、可调整大小的 iPhone 应用窗口、主屏编辑支持撤销重做。visionOS 27 能把全景照片变成空间场景与沉浸式环境,开发者测试版今日上线、秋季推送——只是 Vision Pro 两年多来销量始终不温不火,这些更新更像持续投入,而非一次翻盘。watchOS 27 则是电池、计步、Wi-Fi、入水检测的又一轮打磨,外加访客钥匙和新表盘。

Image

新系统将于今年秋季随新一代设备正式推送,开发者测试版今日陆续上线。而那个被等了两年的完整版 Siri,要到今年稍晚才会真正交到用户手里——如果你在中国大陆,这个「稍晚」,恐怕还要再往后排。

对 Tim Cook 来说,这场发布会还有另一层意义。

十五年前,他从乔布斯手里接过的,是一家「靠魔法立身」的公司——每年都要变出一个让世界惊呼的东西。十五年后,在他作为 CEO 的最后一场 WWDC 上,台上没有「One more thing」,没有新硬件,只有一台快了 30% 的 iPhone,和一颗向对手借来的「大脑」。

这听起来不像一个传奇该有的谢幕。但这或许正是 Cook 式的体面:他从来不是那个站在聚光灯下变魔术的人,而是那个把灯一直开着、把这家公司带到三万亿美元市值之上的人。直到最后,他做的也还是同一件事——把最难看的那块短板补上,把屋子收拾干净,再把钥匙交到 John Ternus 手里。

Image

发布会开始前,他在社交媒体上发了一段轻松的「Good morning」短片,拉来一群明星和他一起出镜。没有煽情,也没有告别。

就像他过去十五年那样——安安静静地,把事情办了。

 

 

*头图来源:视觉中国
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
Apple 把 Siri 的大脑交给 Google,你觉得这是务实,还是认输?
Image
Image
Image
Image

 

  •  

除了 AI Siri 和库克「谢幕演讲」,今年 WWDC 还有什么?

Image
头条讲的是大脑,注脚讲的是性格。

作者|张勇毅

编辑|靖宇
 

虽然今年 WWDC 还有几天正式开幕,但苹果已经把今年的主角剧透得明明白白。

打开 WWDC26 的官网,标语是「All systems glow」——把 NASA 倒计时那句经典的「all systems go」改了一个字,从「准备就绪」变成「全场发光」。配套壁纸是一整块深色背景、中间一个发光的苹果 logo,连预热歌单都叫「Glow all out」。这一整套视觉,指向的是同一样东西:那个传闻中会发光的新 Siri。

再加上 6 月 8 日,很可能是库克以 CEO 身份的最后一场 keynote(今年 4 月苹果已官宣,硬件负责人特纳斯将于 9 月 1 日接任),今年人人都在等的,就是这两条头条:

一个换上谷歌大脑、会发光的 Siri,和一场告别

Image

去年苹果正式公布了 Liquid Glass 设计风格|图片来源:Apple

但你有没有想过,苹果这么卖力地让你盯着那束光,会不会恰恰是因为,更值得看的东西不在光里。头条讲的是大脑,注脚讲的是性格。今年苹果的注脚,比头条更有意思。

01

系统「退烧」

 

先看那束光照不到的地方。

去年这个时候,苹果给 iOS 26 换上了一身叫「Liquid Glass」的毛玻璃外衣:半透明、会流动、到处反光,发布会上看着惊艳。用了一年,吐槽也攒了一年。

最能说明问题的,是 WWDC 前夕 MacRumors 那篇 iOS 27 愿望清单。当编辑问读者「你最想要 iOS 27 加点什么」,票数最高的回答几乎没有一条是新功能——清一色是「把 bug 修好」「把 Liquid Glass 退回去」「修一修那个烂键盘和自动更正」。

Image

WWDC2026 预计会发布基于液态玻璃的全新 Siri|图片来源:Apple Hub

 

有人说自己用了二十多年 iPhone,没见过系统这么不稳的时候。甚至还有人只求一件事:把地图里的广告去掉——因为苹果这两年正忙着往 Apple Maps 里塞广告,给服务业务多挣点钱。

苹果显然也听见了。据彭博的 Mark Gurman 介绍,macOS 27 会做一次小幅回调,专门提升 Liquid Glass 的可读性;iOS 27 的整体基调,也从去年的「炫」转向稳定和打磨。其余几个系统——iPadOS、watchOS、tvOS、visionOS——大体是同一个剧本:把生成式 AI 往 Mail、备忘录、照片这些核心 App 里塞,手表的健康监测也会更依赖 AI。macOS 27 还有一个不起眼却有标志性的变化:它会彻底告别 Intel,只支持苹果自家的芯片。

苹果很少在一套设计语言推出仅仅一年之后,就公开往回收。 一边是官网上「全场发光」的盛大预热,一边是来自用户汹涌的民意,要求苹果先把 bug 修干净——这道落差本身,就说明 iOS 26 那场高调改版,落地效果并不如意,需要补课的地方仍然很多。

今年它的主线,其实是「收拾上一年的摊子」。难怪已经有人在讨论:真正值得期待的是明年那个为折叠屏准备的 iOS 28,今年这一版,更像一次过渡。

Image

WWDC26 官方壁纸:深色背景与发光的苹果 logo,呼应「All systems glow」标语|图片来源:Apple

 

 

02

苹果 AI「开门迎客」

 

如果说今年 WWDC 上,真有什么可能改变你用 iPhone 方式的东西,我会押在这件被很多人忽略的事上:苹果,开始为 AI 打开生态大门了。

据彭博报道,iOS 27、iPadOS 27、macOS 27 会允许你把第三方 AI 服务,设成 Apple Intelligence 某些功能的默认引擎——比如写作工具、Image Playground。再配上那个传闻已久、为 Siri 新做的「扩展」机制,理论上你可以让 Claude 接管 Siri 的写作,让 ChatGPT 去处理另一类问题,全部在同一部 iPhone 上、从同一个 Siri 入口调起。

而且这一次,罕见地不全是苹果被逼的。回到刚才那份愿望清单,「支持任意第三方 AI 助手」本身就排在读者诉求的前列。用户想要,苹果也给了——只不过它给的理由,没那么单纯。

想象一下那个场景:你按住侧边按钮唤起 Siri,让它帮你改一段邮件,干这活的其实是 Claude;过一会儿你问它一道编程题,回答你的换成了 Gemini 或别的模型。你不用装三个 App、来回复制粘贴,入口始终是那个熟悉的 Siri。

Image

新 Siri 的交互方式,预计是基于灵动岛制作专属动画||图片来源:Bloomberg

 

这件事听起来像个不起眼的设置项。但你得知道苹果是谁。

这是一家把「生态围栏」体验做到极致的公司。默认浏览器、默认地图、默认输入法——很长一段时间里,iPhone 上几乎所有的「默认」,都只能是苹果自己。它的逻辑一直是:我们把体验从头到尾捏在自己手里,所以它好。让用户把最核心的那个智能入口,交给竞争对手去填,这几乎是反苹果本能的事。

一家一向把门关得最紧的公司,现在主动把自己最私密的智能入口,向对手敞开了一条缝。这比 Siri 换了谁的大脑,更能说明苹果正在发生的变化。

那么问题来了,苹果为什么要这么做?

往好里说,是大方,是替用户着想。但一个一向封闭的公司突然变开放,背后通常不只有善意,是两股力量在推。

一股是监管。欧盟的《数字市场法》(DMA)这几年一直在撬苹果的墙——逼它开放第三方应用商店、开放默认应用的选择权。把 AI 引擎的选择权也交出来,是同一条逻辑的延续:苹果未必想开,但它越来越没得选。

另一股,是给自己留后路。苹果刚把 Siri 的大脑押在了谷歌 Gemini 身上,可它心里清楚,模型这东西迭代极快,今天最强的,半年后未必还是。允许接入第三方,等于在 Gemini 之外多备了几条腿——哪天 Claude 或某个新模型更合适,通道是现成的。所谓「开放」,一半是被监管推着走,一半是给自己留的对冲。

Image

新 Siri 除了开放,同时也是为了用户提供更新的选项,让 Siri 尽快投入可用。|图片来源:Bloomberg

 

对你我又意味着什么?意味着「Apple Intelligence」这块招牌,往后可能越来越像一个壳——壳还是苹果的,里面装谁的智能,你或许能自己挑。这对用户是实打实的好事。但它也悄悄改写了苹果讲了十几年的那个故事:那个「只有我们能给你最好体验」的苹果,开始承认,最好的某一块,可能得让别人来填。

把它放进一个更大的画面里看,会更清楚。这两年苹果的每一个「开放」动作——侧载、第三方应用商店、如今的第三方 AI——单看都是被监管逼出来的让步。但加起来,它们在松动一样苹果赖以成立的东西:那道又高又厚的围墙。围墙曾经是苹果体验的护城河,现在正被一处接一处地凿开口子。今年 WWDC 上关于「开放」的这几行小字,可能比任何一个新功能,都更接近这家公司真实的处境。

 

03

以及新硬件

 

第三类「还有什么」,藏在硬件里。

虽然 WWDC 一直是软件主场,硬件的份额始终不会占据主角,但今年的情况还有所不同:苹果正在拼命追赶的那场 AI 浪潮,反过来开始挤压它自己。

先是智能家居。传了好几年的家庭中枢 HomePad,据 Gurman,今年很可能在 WWDC 上亮相——一块 7 英寸方屏、一颗 A18 芯片、一个全新系统平台 homeOS,还能脱开 iPhone 直接打 FaceTime。

Image

传闻已久的 HomePad|图片来源:MacRumor

 

但它大概率只是「预告」,不会马上开卖。原因很苹果:硬件其实早就做好了,迟迟不发,是因为它太依赖那个还没修利索的 Siri。一台做完的硬件,被一个没做完的语音助手扣在仓库里——这句话,比任何分析都直白。

再是 Mac。M5 版的 Mac Studio、Mac mini 都在路上,坊间还盛传一台定位在 Pro 之上的「MacBook Ultra」。但今年 WWDC 在 Mac 上恐怕给不了太多惊喜,因为苹果正卡在一个尴尬里:一场由 AI 服务器需求引爆的全球内存(DRAM)短缺,已经逼着它砍掉 Mac Studio、Mac mini 的高配内存选项,有报道甚至称新机会被推到秋天。连卖硬件这件它最拿手的事,现在也得给 AI 让路——只不过这一次,是 AI 抢走了它的内存。

今年发布会上不会出现的那些硬件,反而能从软件里看出端倪。

据多家媒体,iOS 27 会为一款还没发布的折叠屏 iPhone 做适配,macOS 27 则在为「能触屏的 MacBook」做准备。

Image

iOS 针对折叠屏设备的适配,预计也是本次 WWDC 发布的重头戏之一|图片来源:AppleHub

 

WWDC 本来就是软件先行的舞台——苹果先把 API 铺好,让开发者提前为明年的折叠屏和触屏 Mac 改 App。所以今年真正关于硬件的信号,不在「发布了什么」,而在「为什么而铺路」。

把这些「还有什么」串起来,会发现它们其实指向同一个方向。它们都是苹果在被几股比自己更大的力量推着走:撬墙的监管、要它多挣钱的变现压力,还有这场它必须追、却也在反过来啃噬它的 AI 浪潮。

6 月 8 日,舞台中央一定是那束光:发光的 Siri,和库克的告别。这是头条,理应如此。

但我会多留一只眼睛,去看那些光照不到的角落——用户求着修的 bug,悄悄多出来的第三方 AI 开关,地图里新冒出的广告,一台被 Siri 拖住的家庭中枢,一批被内存荒卡住的 Mac。

这些都不会上热搜。可把它们拼到一起,你看到的是一个和过去不太一样的苹果:没那么强势,没那么封闭,也没那么从容了。今年真正值得看的那个苹果,可能就藏在发布会的注脚里,藏在那束光的背面。

这些小事不会上热搜。可把它们拼到一起,你看到的是一个和过去不太一样的苹果:没那么强势,没那么封闭,也没那么从容了。那个苹果,可能就藏在今年发布会的注脚里。

6 月 9 日凌晨 1 点,WWDC 2026 主题演讲,这些问题的答案都会「交卷」。

*头图来源:Apple
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
直播预告
 

WWDC26 开场,6 月 9 日午间 12:00,极客公园直播间带你解读:会发光的 Siri 来了,换上谷歌大脑还算苹果吗?一向把门关得最紧的苹果,为什么主动向模型厂敞开大门?库克在 AI 落后的节点交班,留给我们的又会是一个什么样的苹果?

Image
Image
Image
Image

 

  •  

卖到 190 国、全球第一,这家深圳公司却在为摄影配件的「死亡」做准备

 

头图来源:唯迹科技

 

 

年营收 10 亿,手握 3400 多个 SKU,拿下沙利文 “2024年全球摄影配件销量第一” 认证,产品卖到 190 多个国家和地区 —— 这是深圳唯迹科技 2025 年交出的成绩单。

 

这家靠优篮子Ulanzi品牌跑赢华强北价格战的公司,正处在成立 10 年来最鼎盛的时期,2026 年现有业务增速仍能达到 35%。

 

但很少有人知道,这家看起来稳坐行业头把交椅的公司,已经在为 5 年后的生存焦虑。

 

他们内部有一个带点悲观色彩的判断:AI 生成内容的爆发,会让摄影配件市场在未来快则 2-3 年,慢则 5-10 年内出现断崖式下跌。当普通人不用再买相机、不用再拍素材就能生成想要的图片和视频时,现在支撑起 10 亿营收的支架、补光灯、云台,最终只会变成小众爱好者的玩具。

 

2026 年 2 月的一次全员团建,成了唯迹科技转向的一个节点。

 

一个周末,深圳某座山的半山腰,唯迹科技的团建正在进行。一路上,大家聊的不是摄影器材,也不是跨境电商,而是当时刚刚兴起的Vibe Coding热潮。

 

随着 AI 编程工具爆发,越来越多人开始习惯用自然语言和模型协作。过去需要敲代码、点鼠标完成的工作,正在变成一句话、一段语音就能驱动完成的新工作流。

 

大家聊的话题也越来越发散,最终停在了同一个问题上:未来的 AI 原生的硬件形态会是什么样的?

 

有人提到了 AI 麦克风。有人提到了 AI 键盘。讨论越来越兴奋,原本的一次团建,逐渐变成了一场关于下一代 AI 硬件的头脑风暴。

 

创始人邹青当场掏出手机,刷小红书搜索相关内容。很快,一个帖子吸引了他的注意。画面里是一个渲染出来的小型键盘,只有几个按键,旁边连接着一个麦克风。评论区里,不少人都在留言:想要、工位缺一个这个。当天下午,唯迹科技的投资负责人南方就通过科创学院的老师联系上了邹宇。

 

一家拿下过“全球摄影配件销量第一”认证的深圳公司,就此开始了在AI浪潮里寻找第二增长曲线的路途。

 

一、10 亿营收的隐忧:摄影配件终将变成小众生意?

 

在转向AI之前,唯迹科技已经在摄影配件这条红海里跑赢了绝大多数对手。

 

2015年,已经创业两次的邹青再次重启创业,锚定摄影配件行列,在深圳创立了这家公司,先后踩中了手机直播、Vlog兴起和疫情期间短视频爆发三波红利。

 

靠着砍掉过剩专业功能、主打轻量化和高性价比的产品策略,优篮子Ulanzi品牌从华强北的价格战中杀了出来:MT-08三脚架成为全球Vlogger的标配,产品覆盖190多个国家和地区,70%的收入来自海外,2025年营收突破10亿元,还拿到了沙利文颁发的“2024年全球摄影配件销量第一”认证。

 

图片来源:唯迹科技

 

但南方和团队心里清楚,这份繁荣的保质期可能不会太长。2024年加入唯迹之前,他在安克集团做战略,见过太多消费电子品类“速生速死”的周期。加入唯迹后,他和邹青一直在思考同一个问题:10亿之后,下一个100亿从哪里来?

 

答案的反面,是正在逼近的行业危机。唯迹内部一直在监测全球相机出货量数据:传统单反和重型相机每年以20%-30%的速度下滑,虽然微单和运动相机在以同样的增速增长,但全球总出货量基本持平。更关键的冲击来自AI——唯迹内部已经有30%-40%的产品图片由AI渲染生成,连模特都不用找了。

 

“它很有可能不是渐进式的衰减,而是在某一年或者某一段时间开始断崖式下跌。”南方对极客公园谈到,“快则2-3年,慢则5-10年,AI生成的内容就会和真实拍摄的几乎没有差别。到时候,摄影配件只会变成服务小众爱好者的品类。”

 

对唯迹来说,转型没有退路。现在的摄影配件业务是稳定的现金流来源,2026年增速仍有35%,但必须用这笔钱,投出下一个能支撑公司走10年的第二增长曲线。

 

二、200 万一个项目,做创业者的产业合伙人

 

唯迹没有选择闭门造车,而是走了一条“自研+产业投资”的双轮路线。南方7年的VC/PE投资经验,在这里派上了用场。

 

他们的投资逻辑和传统VC不同:只投种子轮和天使轮的早期团队,单个项目投资金额基本100-200万,计划1年左右投1000-2000万,孵化10个左右的项目。

 

“财务投资者只给钱看估值,我们是帮创业者把产品落地、卖到全球。”南方说,被投团队只需要专注软件和核心技术,唯迹会提供硬件供应链、全球销售渠道,甚至让产品先挂优篮子、JOBY的品牌销售,等团队成熟后再独立发展。

 

图片来源:越千创新b站账号

 

越千创新是第一个成功案例。2025 年 9 月,南方在小红书上刷到了这个重庆团队做的小型摄影机械臂,当即飞过去完成了天使轮投资。这款机械臂能自动识别拍摄对象、实现丝滑运镜,替代传统需要手动调节的支架,售价仅为传统专业机械臂的极小部分,大幅降低了专业级拍摄的门槛。


唯迹和越千展开了联合研发:为机械臂适配自家的 F38 生态接口,派出资深摄影工程师参与运镜算法调教。数月后,越千完成了下一轮融资,估值实现显著跃升,团队也从 6 人扩张到 20 多人,从重庆搬到了深圳,获得了南山基金的场地和资金支持。接下来,越千的产品会先登陆 Kickstarter 众筹,未来还会推出面向个人直播用户的小型化版本。


跟或宇团队的合作也很顺利,他们的创始人就是那位在半山腰被邹青刷到的邹宇。200 万投资敲定后,双方在产品方向完成了战略聚焦,并明确了各自分工,将围绕核心产品方向展开深度协作。或宇负责底层软件和算法开发,唯迹负责硬件落地和全球渠道。相关产品计划会在今年上线。

 

在选人上,唯迹有自己的坚持:偏好大学生或刚毕业的年轻创业者,“思想没有被污染过”,最重要的是必须all in。

 

三、「大厂看不上的机会,就是我们的机会」

 

在投资外部团队的同时,唯迹也在all in自研核心产品,内部也正在把软件算法团队扩招到二三十人。

 

他们的自研路线和或宇形成互补:或宇做符合现有用户习惯的全键盘,唯迹做更面向未来的小型AI键盘(3-9个按键),同时自研AI麦克风。

 

依托此前做无线麦克风的技术积累(其无线麦克风在拉美市场销量很好,国内售价200-300元),唯迹的AI麦克风主打一体化设计和空间静音技术——解决办公室工位近距离说话的尴尬,实现“轻声说话也能精准识别”。

 

和或宇的众筹节奏不同,唯迹的自研产品进度更快,预计2026年6月底就会发布首批相关产品,采用迭代式更新的策略,不追求一次性完美。

 

唯迹很清楚自己的边界。他们明确不会碰带摄像头的AI耳机,“这只是耳机+摄像头的渐进式创新,苹果、韶音、安克这些大厂已经重兵布局,新品牌几乎没有机会。”在南方看来,只有颠覆式形态的产品,才会给新品牌留下突围的空间。

 

“传统键盘市场被罗技一家独霸,全球年收入200亿,整体是千亿级市场。但AI正在重新定义键盘的形态,当它不再只是打字工具,而是集成了语音交互、本地算力、个人AI助手的智能终端时,传统大厂的品牌优势就会被削弱。”

 

更重要的是,这个赛道的规模刚好适配唯迹的体量。“对安克、大疆这种百亿级收入的公司来说,这个赛道太小了,他们要找的是千亿级的机会,最多派个小团队研究一下。但对我们10亿规模的公司来说,这是能再赚十几个亿的性感机会。”

 

而唯迹手里还有一张王牌:已经跑通的全球销售网络。

图片来源:JOBY官网

 

通过收购美国摄影品牌JOBY,唯迹成功入驻了美国Bestbuy、Target甚至苹果官方店,目前已经在日本、美国、巴西设立了本土化子公司和团队。这套基础设施,是任何初创团队都不具备的,也是唯迹吸引创业者的核心优势。

 

这场转型的最终目标,是唯迹的企业定位彻底升级:从过去的“摄影配件企业”,变成面向所有创作者的软硬一体硬件工具公司。“过去我们服务的是拍照片、拍视频的内容创作者,未来只要是和AI协作创作的人,都是我们的用户。”

 

在AI硬件的混战里,大厂们盯着千亿级的具身智能和机器人赛道,而唯迹这样的中型公司,正在抓住大厂暂时还看不上的、离用户最近的交互入口。

 

这或许是中国消费电子公司最擅长的事:在巨头的缝隙里,用扎实的产业能力,把一个别人瞧不上的小机会,做成属于自己的大生意。

 

 

 

 

 

  •  

汤道生对话姚顺雨:腾讯 AI,慢了吗?

 

腾讯AI慢了吗?

 

在大模型浪潮中,腾讯似乎大多处于一个微妙的位置。它拥有国内最完整的互联网生态之一,也拥有混元大模型、元宝等产品。但与行业里那些不断制造话题和声量的 AI 大公司相比,腾讯似乎总给人一种「不够快」的印象——它很少站在聚光灯最亮的位置,却又始终没有缺席任何一场关键竞争。

 

而过去一年,AI 行业最流行的词之一,则是「下半场」。

 

几乎所有人都在谈论 AI 下半场。但当越来越多人把这个词挂在嘴边时,它反而开始变得模糊——到底什么是下半场?是 Agent?是 Coding?是具身智能?还是下一轮模型竞赛?

 

在腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生,与腾讯首席 AI 科学家姚顺雨的这场对谈里,姚顺雨在开场就抛出了一句:AI 下半场这个词,正在被滥用。

 

过去几年,大模型的发展路径似乎异常清晰:预训练、后训练、强化学习、Agent、Coding Agent,所有人都在沿着同一条主线前进。与此同时,中国 AI 圈也形成了一种熟悉的竞争文化——热衷刷榜、追逐指标、争夺排名。

 

但在姚顺雨看来,当方法论已经逐渐成熟之后,真正困难的事情已经不再是寻找技术路径,而是寻找值得解决的问题。相比 benchmark 上几个百分点的领先,模型如何进入真实产品、获得真实反馈、解决真实需求,正在变得更加重要。

 

这也是为什么这场对谈里更值得关注的,是模型与产品之间越来越紧密的 Co-Design。从元宝、WorkBuddy 到 Coding Agent,从 ReAct 提出的早期设想,到《Language Agents: From Next-Token Prediction to Digital Automation》中对于智能体时代的预判逐步兑现,姚顺雨反复强调一个看似朴素却常被忽略的事实:大模型最重要的能力始终是泛化性。

 

而对于腾讯是否「慢了」、AI 下半场究竟从何时开始这些争议,他给出的回答是——如果下半场才刚刚开始,那么探索过程中走过弯路并不可怕,真正重要的是能否诚实面对自己,看到反馈,并持续调整方向。

 

以下为汤道生与姚顺雨的对谈内容,由极客公园编辑整理。

 

当 「AI 下半场」 被滥用

 

汤道生:

顺雨,你加入腾讯之前,我曾问过你两个问题:为什么选择来到腾讯?以及你认为AI下半场最重要的是什么?

 

姚顺雨:

首先我想先解释一下「下半场」这个概念——我发现这个词最近被用得有些泛滥,它其实是我在去年的一篇博客中提出的。具体来说,在去年之前,AI已经发展了数十年,行业的核心是寻找解决问题的有效方法;但如今,方法论已经趋于成熟,找到真正有价值的问题反而变得更加困难。

 

我举个例子,过去我们为了下围棋研发出AlphaGo,但这套方法仅适用于棋类领域;为了机器翻译开发专属模型,也只能完成翻译任务,无法拓展到其他场景。而预训练与后训练技术出现后,我们相当于拥有了一把「万能锤子」,形成了一套通用方法论,能够解决各类不同的问题。因此,找到真正值得解决的优质问题,成为了当前行业的核心挑战。我选择加入腾讯,很重要的一个原因就是这里拥有海量的产品和丰富的真实问题场景,这一点在AI下半场会愈发重要。

 

一方面,优质产品能够回答「预训练和后训练技术究竟要应用在何处才能产生价值」这个核心问题;另一方面,产品构建的生态环境至关重要——如果没有点外卖的工具接口,智能体就无法完成点外卖的操作,很多任务都无法落地。

 

但我认为更核心的是上下文(Context),无论是企业还是个人场景都是如此。正如我上次在AGI Next大会上所说,上下文的重要性会与日俱增:模型越来越擅长将复杂输入转化为输出,企业的竞争壁垒将越来越多地来源于是否掌握最原始的输入数据,是否了解用户的真实行为与企业的核心信息,而腾讯在这方面拥有极强的优势。

 

但这只是我选择腾讯的第二大原因,最重要的其实是企业文化。我第一次和你以及总办其他高管交流时,最深刻的印象就是大家都非常坦诚:哪里做得好、哪里有不足,都会直白表达,不会刻意掩盖。这种实事求是的态度,是我最看重的一点。

 

其次,腾讯整体是一家基于信任而非单纯依靠指标运转的公司,这一点对于做AI而言至关重要。同时,腾讯文化中低调务实、谦逊踏实的特质,以及对长期主义的坚持,都是构建一个长期AI组织不可或缺的基础。

 

回到「AI下半场最重要的是什么」这个问题,我个人的目标是在中国建立一个长期的、基于通用人工智能(AGI)的组织。

 

在我看来,今天的AI主要由三个部分构成:第一是基础层,如何把预训练、后训练这些最核心的技术做得足够扎实;第二是产品层,如何将技术真正落地,为个人和社会创造价值;第三是前沿探索层,如何探索新的研究范式与产业机会。我们需要构建一个这三者均衡发展的三角形组织架构。

 

对于基础层而言,最重要的是充足的资源投入和正确的做事方式,这与我刚才提到的企业文化高度契合;对于产品层而言,优秀的产品嗅觉和做产品的基因是核心;而对于前沿探索层,目前国内的探索还不够充分,我也希望能将这种前沿探索的精神更多地注入到我们的组织中。

 

Co-Design:模型与产品的双向奔赴

 

汤道生:

你刚才提到,产品为模型提供了运行环境和上下文数据。我想问一个我们内部经常讨论的问题:协同设计(Co-Design),也就是如何让产品与模型实现深度融合?目前我们有很多依赖模型能力的产品,比如和我们合作紧密的元宝聊天机器人、AI搜索,企业端的智能客服、智能营销,还有近期热度很高的类Lobster产品,比如CodeBuddy、Workbuddy。你是如何思考协同设计这种模式的?

 

姚顺雨:

我认为主要有三点。首先,协同设计的前提是模型本身要足够扎实,需要做好大量的基础工作。预训练是一个相对产品无关的环节,把它做扎实,就能为所有下游任务提供强大的通用基础,而且预训练的进步能够持续为各类下游任务带来价值提升。

 

其次,后训练阶段最重要的是建立正确的评测(Eval)体系。国内现在有一个不好的倾向,就是过度追求刷榜。我们应该实事求是,基于真实的产品和应用场景,构建更贴近实际的评测标准。这一方面需要有好的产品出口,另一方面也要明确:实用性的价值远大于刷榜的价值。

 

我们和各类产品团队开展了深度的协同设计,而协同设计最关键的一点是建立相互信任。我们为此做了大量工作,包括如何用好产品数据、如何实现数据回流、如何做好评测对齐等,这里就不展开赘述细节了。

 

第三点,也是大语言模型(LLM)时代与过去AI最本质的区别,就是泛化性。在大语言模型出现之前,做翻译产品只需要打磨好翻译数据,做围棋程序只需要打磨好围棋数据;但现在,哪怕只想做一个代码智能体(Coding Agent),也需要模型具备优秀的聊天能力、搜索能力、指令遵循能力和推理能力,这是一个非常复合的能力体系。

 

这就带来一个推论:拥有体系化产品矩阵的企业会具备显著优势。比如我们和元宝的协同设计,让模型打磨出了强大的聊天和搜索能力,而这些能力又可以迁移到ima、Workbuddy等其他产品中。不同产品能够提供不同维度的数据,这些数据之间又可以相互泛化,形成一个网络状的价值体系,这种价值会越来越凸显。

 

汤道生:

没错,其实外部刷榜也是评测的一种形式。那我们内部的评测和外部榜单的评测,核心区别在哪里?

 

姚顺雨:

首先,各类基准测试(Benchmark)也不是没有价值,只是现在这些榜单很容易达到饱和。基于真实世界数据的评测有三个核心优势:

 

第一,能够发现模型的很多底线问题。我们发布预览版模型的核心目的之一,就是获取真实世界的用户反馈,修复各类榜单中无法发现的底线问题,这会让正式版模型的表现有质的提升。

 

第二,能够让我们对真实的用户提问分布有更深刻的理解。举个例子,基准测试中的题目往往表述非常精确,有很长的上下文描述,且大多是单轮问题;但在现实场景中,用户的提问通常比较模糊,可能只有一两句话,还会不断追问。这种场景差异,能够指导我们更有针对性地开展模型训练。

 

第三,能够从产品中获得灵感,推动现有榜单未覆盖领域的技术进步。比如我们近期做的很多上下文学习相关工作,就很大程度上受到了元宝产品的启发。所以说,产品与模型的相互成就,是AI行业越来越重要的话题。

 

汤道生:

对,我记得早期做元宝的时候,我们还遇到过多轮指令遵循的问题,用户在产品中实际使用的提问方式,和基准测试中的差异确实非常大。真正的产品场景对模型能力的要求,和榜单评测的侧重点完全不同。

 

姚顺雨:

你问了我这么多问题,我也反过来问你几个吧。我记得第一次和你聊天时,你给我讲了很多过往的经历,从QQ空间、QQ秀——那可是我小学时候最喜欢的产品,到QQ、腾讯音乐,再到腾讯云,以及现在的元宝、ima。你做过To C和To B的各类产品,覆盖了互联网不同发展阶段。我很好奇,你做产品的第一性原理是什么?哪些经验和价值是不变的?哪些东西又发生了变化?

 

汤道生:

我认为做产品最终的核心,永远是围绕用户需求,解决用户痛点,为用户和客户创造价值。无论在哪个时代、哪个行业,只有能为用户带来价值的产品,才会被用户使用和买单。从PC互联网时代的QQ空间,到移动互联网时代的各类内容产品,再到产业互联网时代的腾讯云,我们始终花大量时间倾听客户的声音,尝试帮他们解决实际问题,这个底层逻辑从未改变。

 

不过,PC互联网、移动互联网时代做产品,和今天AI时代做产品,确实有很多不同之处。首先是产品范式的变化:在AI时代之前,我们做产品主要是通过预设功能来满足用户需求,产品方想清楚要提供哪些能力,用户通过界面、菜单进行选择,就像在预制菜菜单里点餐一样。

 

但在AI时代,产品的服务形态是开放式的,这带来了全新的要求和挑战。用户通过自然语言、语音等简单的交互方式提出需求,产品方无法提前预判用户会问什么。这就需要我们充分利用模型的能力去理解用户需求,同时为模型提供各类工具接口,借助模型的逻辑推理和工具调用能力,来应对这种开放式的需求。

 

甚至包括你刚才提到的评测,过去做产品有非常清晰的需求规格说明书,有明确的功能细节描述,从设计、研发到测试的瀑布式流程非常清晰。但做AI产品时,整个流程都需要重新设计。

 

尤其是今年,大部分代码都可以由AI生成,工程师会把更多时间花在架构设计上,写代码的工作交给AI,只需要定期进行指导和修正。同时,测试工作也要前置,需要提前想清楚各类测试案例、评测环境,以及对开放式答案的要求,还有如何让模型的输出风格与用户预期对齐。整体而言,AI时代对产品人的能力要求更全面,做产品的难度也更大了。

 

姚顺雨:

确实更难了。

 

大模型没有秘密

 

汤道生:

再一个问题,大家都说 混元Hy3 preview是你在腾讯的首秀,Hy3具体做了哪些核心改变?能给大家介绍一下吗?

 

姚顺雨:

其实做大模型的核心流程并没有太多秘密,关键是把基础设施、数据这些基础工作做扎实,算法部分反而相对简单。Hy3的核心改进主要有三点:第一,我们重建了整套基础设施,包括预训练和强化学习的基础设施;第二,我们在数据和Eval层面做了大量优化,包括如何定义更真实的问题、如何丰富数据的分类体系、如何持续提升数据质量——这是一个永无止境的过程;第三,很多决策其实没有清晰的公式可循,比如如何招人、如何设定模型的迭代节奏、如何在各种权衡中做出选择,这更多是一个依赖行业判断和品味的事情。

 

说到这里,我也很好奇,你刚才和我讨论了协同设计的概念,那你对协同设计是怎么看的?你认为哪些事情应该由模型团队做,哪些应该由产品团队做?

 

汤道生:

我认为协同设计的内涵在过去两年一直在变化,这种变化很大程度上是随着模型能力的升级而发生的。同时,行业、市场和用户需求的变化,也要求模型和产品团队更好地协同配合。

 

给我最深的感受是「对齐」的重要性。在联合做产品、开展对齐工作时,会涉及很多不同的角色:产品团队要明确要解决的问题和方向,模型团队要思考如何通过技术满足需求;同时还要回到数据层面,明确数据应该如何标注、标注到什么颗粒度、什么是好的标注、什么是不好的标注,以及哪些行为需要奖励、哪些需要惩罚。

 

还有评测环节,如果产品团队认为好的产品体验,和评测体系的标准不一致,最终做出来的产品就会出现偏差。所以在我看来,协同设计更多是指项目组内不同角色共同参与产品设计,共同制定产品目标和方向,让大家对各类开放式问题达成共识。如果没有做好这种对齐,模型的输出行为就会不可预测,甚至出现随机性,因为模型在训练过程中会被不同的标准混淆。这是我这两年和模型团队做协同设计最深的感受,你觉得呢?

 

姚顺雨:

非常认同。协同设计最难的一点就是建立信任,同时同理心也非常重要。说到底,模型团队和产品团队的目标有一致的部分,也有不一致的部分:模型团队希望模型的通用能力越强越好,而产品团队希望用户的需求能被最好地满足,这中间天然存在分歧。所以换位思考的能力至关重要。

 

你刚才问我们和元宝是如何一步步开展协同设计的,有一个很重要的细节:当时我们自己的预训练模型还没有准备好,但我们知道,维护好元宝这款产品及其日活跃用户(DAU),对我们后续做模型、建立长期合作关系都至关重要。所以我们派出了后训练团队最强的骨干力量,先帮助元宝把后训练工作做好。

 

当时很多算法同学不理解这个决策,我花了很多精力去解释,但现在看来,这些努力都得到了回报。这个动作让产品团队真切感受到,模型团队是真正在为产品着想,这为我们后续的合作,以及Hy3在元宝上的成功上线,奠定了非常重要的基础。当然这里面还有很多技术细节可以探讨,但我认为最难的部分永远是如何建立信任、如何换位思考。

 

汤道生:

换个话题,你是ReAct架构的提出者,博士研究也一直围绕语言智能体展开。你几年前的一些观点,到今天有哪些兑现了?

 

姚顺雨:

前几天我重读了自己的博士论文,感慨万千,仿佛回到了很久以前。我的博士论文题目是《Language Agents: From Next-Token Prediction to Digital Automation 》,写于2019年,也就是7年前。那时候还是GPT-2的时代,模型只能生成下一个token,输出的一段话往往不连贯,还有很多错误。当时大家很难想象,这项技术有一天会成为改变世界的力量。

 

那时候稍微有想象力的研究,也只是验证模型能回答「中国的首都是北京」这类知识型问题,能做到这一点大家就已经很开心了。但我当时觉得,GPT是一个非常优美的范式,生成下一个token是一种极简且通用的逻辑,它的潜力绝不止于此,终有一天能够实现全世界所有事情的自动化。当时我想的还只是数字自动化,现在看来,它甚至可能实现数字与物理世界的双重自动化。

 

我博士期间的工作主要分为两部分:第一部分是建立智能体的方法论,研究如何把一个只能生成下一个token的机器,变成一个能够完成自动化任务的智能体。

 

如你所说,其中最重要的一项工作就是ReAct架构。我还记得2022年7月的一个晚上,我第一次把PaLM 2的API和我手写的维基百科API连接起来,它第一次能够基于网页内容回答问题,并进行多轮交互。那一刻的感觉,就像微弱的电灯丝突然被点亮了。据我所知,这是人类第一次把大语言模型和真正的互联网连接起来,实现多轮交互。

 

当时我觉得这项技术可能会在5到10年内改变世界,但实际发展速度比我想象的还要快。包括我们第一次提出SWE-bench的想法时,我就知道如果能实现,一定会带来巨大的价值——当时我预估是几百亿、上千亿的市场,现在看来,这可能是数万亿、数十万亿级别的市场,我还是想得太小了。

 

第二部分工作是定义数字自动化的任务,比如Webshop是第一个基于互联网的网页智能体任务,Intercode和SWE-bench是最早的代码智能体任务。现在看来,智能体技术最重要的两个方向,确实就是网页智能体和代码智能体。

 

前几天我还在群里和大家说,我看我博士论文结尾,就是我在2024年写future work,第一个是train models for Agent,第二个是shift and robust deployment,第三个是scientific discovery,第四个是怎么样去help human,我很感慨,我说我现在很幸运确实在做当时列的future direction。

 

汤道生:

现在整个行业都在沿着这些方向推进。

 

姚顺雨:

可能还是想得不够大,当时我已经觉得自己想得足够远了,但现在看来还是不够。

 

混元下一代模型重点是什么?

 

汤道生:

技术的发展往往超乎我们的预期。再深入问一个问题,现在大家都说智能体的运行会消耗大量的Token,这对于混元下一代模型的研发来说,你的侧重点会放在哪里?哪些方向是最重要的?

 

姚顺雨:

毫无疑问,智能体尤其是代码智能体,就像当年的预训练一样,是所有模型厂商都必须攻克的基础能力。我认为代码智能体非常本质,一个很重要的原因是它具备图灵完备性——当模型能够控制文件系统、拥有运行容器时,它就成为了一个完整的系统。

 

智能体是当下所有模型厂商的发力重点,我们的做法主要有三个不同之处:第一,即便代码智能体是当前的核心,我们依然强调能力体系的全面性。我始终认为,要做好代码智能体,需要的远不止代码数据,还需要聊天、指令遵循、推理等各类通用能力,因为泛化性是大模型最核心的优势。

 

第二,产品的作用越来越重要,如何利用好线上产品的数据回流,是每个模型厂商都在思考和应对的问题。而我们之前积累的大量协同设计经验,会在这方面发挥关键作用。

 

第三,我们需要保持更多的想象力。无论是技术演进、产品演进,还是下一个范式的演进,都需要我们去做一些探索性的、存在不确定性的工作。

 

汤道生:

从产品侧来看,现在行业内普遍存在「Token焦虑」,Token成本呈爆发式增长。我听到很多客户、用户甚至身边的同事,都在密切关注积分或Token的消耗。如何让模型在解决问题、完成任务时,实现最高的Token效率?比如有些任务,模型会尝试一些明显走不通的方向,浪费大量Token,这方面有哪些优化空间?

 

姚顺雨:

现在国内讨论性价比,更多是聚焦在模型架构上,但性价比其实是一个复杂的体系问题。我认为最重要的首先是模型性能。很多人跟我说,最后发现用Claude Opus这类高性能模型,反而比用性能较差的模型更省钱——因为它能一次把事情做对,既节省了Token,也节省了人力成本。所以性能才是性价比的核心,尤其是今年,提升简单任务的鲁棒性,让模型一次就能把相对简单的任务做对,比单纯优化模型架构更能提升性价比。

 

第二才是成本控制。在成本优化方面,中国其实是领先于世界的,我们已经做了大量工作来降低模型运行成本。但成本优化的核心,是如何用更小的模型完成高价值任务。在此基础上,模型架构创新、长文管理、脚手架优化等工作也需要持续推进。

 

我个人认为,在当前的中国市场,打造一个性能比肩大模型、且在大部分任务上具备强鲁棒性的小模型,比在少数复杂的长程任务上实现一两个点的性能提升,更有实际价值。

 

我也很好奇,你是什么时候意识到智能体是一个全新的产品机会的?你现在对智能体的认知是什么?你认为打造一个好用的智能体,核心瓶颈在哪里?

 

汤道生:

我们针对不同场景打造了不同形态的智能体产品。智能体的设计,本质上是要最大化发挥模型的能力。随着模型能力的不断迭代,智能体需要做的工作反而越来越少。我们有好几款产品,在过去这段时间里,都随着模型能力的提升不断简化产品设计,更多的是为模型提供各类工具接口,打造更多技能,让模型能够更高效地完成任务。

 

同时,我们会为模型提供「记忆」能力:提取用户过往的使用习惯和偏好信息作为上下文,输入给模型。比如在代码开发场景,要提供相关的代码上下文;在Workbuddy的办公协作场景,用户制作PPT时,要提供相关的内容和资料上下文。所以做不同场景的智能体,最重要的是理解该场景下哪些信息是相关且重要的,把这些信息准确地提供给模型,让模型能够充分发挥自身能力。

 

智能体时代的产品研发和组织管理,发生了哪些变化?

 

姚顺雨:

近期我们推出了Workbuddy这类口碑很好的智能体产品,我也观察到很多小团队在快速迭代产品。我很好奇,和传统的产品研发相比,智能体时代的产品研发和组织管理,发生了哪些变化?你有哪些思考?

 

汤道生:

前阵子我帮Workbuddy团队写组织方案时,注意到他们采用了非常扁平化的组织架构,和我们过去其他产品的组织形式有很大差异。他们更多是3到5人组成一个小分队,围绕某一个具体领域攻坚,同时需要支撑好AI基础设施,保障各类实验顺利开展。

 

智能体产品的研发需要大量的实验,而大部分实验可能都不会得到正向反馈,这就需要组织能够包容试错,通过大量实验提炼出对用户留存、产品目标有正向帮助的方向。这是智能体时代、原生AI产品对组织形态的核心要求。

 

另外,过去工程师会花大量时间写代码,但现在这项工作基本可以交给AI完成。这带来了角色的融合:每个人都要像产品经理一样,深入理解用户需求,设计产品形态;每个工程师更像是有想法的负责人,驱动多个代码智能体完成研发工作。同时,正如我之前所说,测试、评测、对齐工作都要大幅前置,并且要充分利用AI能力来保障产品质量。

 

腾讯AI慢了吗?

 

汤道生:

再问一个大家比较关心的问题:很多自媒体都提到,腾讯在AI上的步伐慢了,没有及时抓住一些机会。你觉得我们真的慢了吗?你能不能再具体说说,AI下半场到底是什么?

 

姚顺雨:

感觉这应该是我问你的问题才对。

 

我觉得首先要明确两个核心判断:第一,AI是一场短期游戏还是长期游戏?现在硅谷蔓延着一种情绪,认为两年后所有人都会失业,AI会取代所有工作,所以应该赶紧赚两年钱就退休。但我们的判断非常明确:AI是一场长期游戏。

 

从某种程度上来说,AI才刚刚开始,下半场也才刚刚拉开序幕。我不认为ChatGPT和Claude Code会是唯一的超级应用,如果真是那样,这个世界会非常灰暗。未来一定会有源源不断的新机会诞生,现在的AI行业,就像上世纪70年代个人电脑刚刚诞生的阶段,还有无数的事情等着我们去做。

 

第二,未来的AI行业会是更单一还是更多元?过去几年,行业确实有一条非常清晰的主线:预训练、后训练、强化学习、智能体、代码智能体,所有人都在沿着这条主线复制,这其实也是一件很灰暗的事情。但我个人认为,未来的AI行业一定会走向多元化。

 

毫无疑问,代码智能体带来的生产力变革会越来越重要,这才刚刚开始,这个市场还有数万亿美元的空间等待挖掘。同时,多模态、具身智能等很多新的方向也在快速发展。从这个角度来说,如果我们认为下半场才刚开始,那就不存在「晚了」的说法。

 

当然,过去我们在模型和产品上做了很多探索,也走了一些弯路,这是很正常的——第一次做一件事情,必然会有曲折。但更重要的是,能否诚实地面对自己,能否正视反馈并及时调整,能否保持耐心。这些品质,在AI下半场会更加重要。

 

汤道生:

对。大家总是喜欢挑腾讯的某一个点来批评,当然我们也欢迎大家对我们提出更高的要求。腾讯是一个拥有多业态、多产品的公司,很多团队在不同赛道同时推进不同的项目。在这样一个复杂的组织里,必然有些地方做得快,有些地方做得慢,也有些探索会失败。这些提醒对我们来说都非常宝贵,我们也确实有很多地方可以做得更好。

 

但正如你所说,这是一场长跑,一场马拉松。腾讯拥有极其丰富的场景,就像你一开始提到的,AI需要上下文,模型需要大量的真实数据。腾讯过去多年在不同产品、不同赛道的积累,都能为模型提供各个场景下的有效上下文,让技术真正发挥价值。

 

在这场长跑中,模型会不断迭代,用户需求会不断变化,新的产品形态也会不断涌现。比如今年年初龙虾这一波热潮,我们的反应就很快;而像Workbuddy这样的智能体产品,我们其实几年前就已经开始布局,从最初面向程序员的CodeBuddy,到后来发现非程序员群体也有强烈的需求,我们也快速完成了产品的迭代升级。

 

现在很多客户都对我们的产品组合抱有很高的期待,希望我们能将不同产品的能力整合起来。我们会继续在这场长跑中稳步前进,也欢迎大家多给我们提意见和建议,多用我们的产品,给我们提供有建设性的反馈。

 

我们刚才围绕模型研发、产品落地,探讨了协同设计、智能体演进、组织变革以及行业机会等多个话题。过去一年,很多企业都面临着相似的困惑和挑战:产品落地效果不佳、无法持续投入、投资回报率(ROI)不高等,这些问题都会影响AI在企业中的普及进度。

 

 

为此,我们今天正式发布腾讯效率智能体工具集,帮助企业更安心、更高效地部署和应用智能体。这套工具集依托腾讯的三大核心能力:

第一是场景连接能力,通过微信、企业微信、元宝等高频场景触点,将大模型融入真实业务流,实现与用户、数据、生态的深度连接;

第二是工程驾驭能力,基于完整的混元研发体系,保障智能体稳定、可信、可持续运行,同时依托强大的AI基础设施,包括高速网络、高吞吐存储和高性能智能体运行时,实现GPU的高利用率;

第三是模型驱动能力,以混元大模型为核心,通过模型与产品的深度协同设计,兼顾实用性、性价比和投资回报率。

 

同时,我们将启动腾讯AI共创营第二期,携手独立软件开发商(ISV)、管理服务提供商(MSP)等合作伙伴,共同打造行业解决方案,树立更多标杆案例。

  •  

集成 Coding 和 Agent 工具,ChatGPT 打造超级应用;两部门出台《规范》整治网络测评活动;京东、腾讯围绕 AI Agent 展开合作|极客早知道

OpenAI 启动 ChatGPT 问世以来最大改版

据《金融时报》报道,OpenAI 计划在未来数周内推出改版后的 ChatGPT,将其打造成集成编码工具和 AI 代理(agents)的「超级应用」,以强化在企业客户中的竞争力,并在潜在 IPO 前进一步接近盈利目标。

改版后的 ChatGPT 将被设计为一个入口产品,把免费用户引导至更具付费潜力的服务,例如其编码产品 Codex。报道援引一名 OpenAI 高级员工的话称,「聊天已死」(「Chat is dead」)。

OpenAI 核心产品与平台负责人 Thibault Sottiaux 表示,公司正致力于打造一种产品,让用户拥有一个「能够在生活各个方面为你提供帮助的个人代理,无论是个人事务还是工作」。这一定位意味着,ChatGPT 不再只是一个对话机器人,而是被重新构想为用户在多场景中调用各类 AI 功能的统一入口。

如果这一思路听起来似曾相识,那是因为自去年以来,业内就不断有关于 OpenAI 押注「超级应用」路径的报道。今年 3 月,《华尔街日报》曾披露,这一计划标志着 OpenAI 战略方向的重大转变:该公司在 2025 年曾陆续上线多款独立产品,如今则转向通过单一入口来整合体验。(消息来源:cnBeta)

孙正义直言:超级智能有望两年内到来 能自研下一代大模型

6 月 7 日消息,据媒体报道,软银 CEO 孙正义近日抛出一则重磅预判:超级人工智能的落地时间将大幅提前。他认为,超级人工智能或将在两年内正式到来。

他在与 OpenAI 团队深度交流后获悉,AI 自主迭代的闭环已初步形成——现有模型已能独立设计下一代全新模型。

随着迭代进程的推进,AI 的智能水平将呈现指数级增长,最终彻底超越人类的研发能力,实现超级智能的突破。

据悉,孙正义对这一时间窗口的判断持续修正:从最初保守预估的十年,缩短至四年,最终锁定为两年。

这一预判并非空穴来风。OpenAI 已证实,其 GPT-5.3-Codex 模型实现了自我迭代,能够自主完成训练诊断、部署监管、结果评估等研发工作。

竞品厂商 Anthropic 的数据更加直观:目前其平台超过 80% 的代码由 Claude AI 编写,AI 已成为核心研发主力。(消息来源:快科技)

 

英伟达与 SK 集团将公布合作计划,黄仁勋称内存短缺问题将持续

6 月 7 日消息,据彭博社今日报道,英伟达公司首席执行官黄仁勋表示,随着两家公司准备在未来一年开展更多业务,其全新的 Vera CPU 将使用 SK 海力士公司的内存芯片

英伟达和韩国 SK 集团预计将于周一公布两家公司之间的合作计划。黄仁勋表示,当前存储芯片供应紧张的局面还将持续好几年(quite a few years)。

黄仁勋另外表示,英伟达可能会在周一与 SK 集团一同发布公告。「我们的合作覆盖多个领域,包括 AI 超级计算机、CPU、新型 PC 和机器人技术。此次会面就是为敲定相关规划,明日或将公布具体内容。」

另外,周一黄仁勋将会见三星电子副会长全永铉,HBM、机器人合作计划成焦点。(消息来源:IT 之家)

OpenAI 芯片元老加入 Anthropic

6 月 7 日消息,OpenAI 自研芯片「002 号员工」Clive Chan 在 X 平台发文宣布,自己已经离开 OpenAI,并于本周正式加入 Anthropic。在离职声明中,Clive Chan 回顾了自己过去两年多在 OpenAI 的经历。他提到,自己是 OpenAI 硬件团队的第二位招聘员工,亲历了 OpenAI 自研芯片项目从早期组建到如今逐步推进的全过程。

他评价称,OpenAI 芯片团队拥有令人难以置信的人才密度,自己不认为世界上还有更好的芯片设计团队。

对于未来,他非常期待看到这些芯片成长为 AGI 最重要的引擎之一。

不过,Clive Chan 也写道,自己始终无法摆脱「再次从山脚下攀登一座新高山」的冲动。正因为如此,他最终选择加入 Anthropic。(消息来源:智东西)

消息称京东、腾讯联手,将围绕 AI Agent 展开合作

6 月 7 日消息,据钛媒体今日消息,京东与腾讯已于近期联手,将围绕 AI Agent 展开合作。京东的商品供应链与履约服务体系,将与腾讯的入口资源进行对接。

此外,消息称京东 AI Agent 与华为、OPPO、荣耀等多家主流终端厂商已进行对接。通过 A2A(Agent to Agent)合作,用户可直接在各终端原生智能体的京东 AI Agent 内提出购物需求、获取商品信息,并依托京东的履约与服务体系承接,形成从意图识别到服务保障的完整体验闭环。

腾讯近期在 AI Agent 领域同样有多个项目推进。另据英国《金融时报》本周报道,微信将推出一款 AI 智能体,计划最快将于本月启动公开上线前所需的合规审批流程。另据财经杂志报道,腾讯人士确认了这一消息,但表示目前无法确定微信 AI 智能体何时推出,其上线时间很大程度上取决于监管方对智能体的审批进度,微信 14 亿的用户体量,合规流程可能比其他产品更加严格。(消息来源:IT 之家)

 

消息称淘宝闪购将加大投入零售业务:发展「淘宝便利店」、盒马前置仓等

6 月 7 日媒体报道,淘宝闪购在五一假期前召开了核心高管会议,制定了新一年的增长计划。

根据会议内容,2027 财年(2026 年 4 月-2027 年 3 月),淘宝闪购的核心目标有二:

  • 保持外卖业务市场份额稳定的基础上,并在该财年内实现单月 UE(单位经济模型)转正;
  • 加大对零售业务的投入,发展「淘宝便利店」、盒马前置仓等业务,以及实现天猫超市、天猫品牌「远转近」,来提升零售业务的单量和 GMV(商品交易总额)。

据一位阿里高层人士透露,阿里新财年在淘宝闪购的投入只有上一财年的一半(不包含零售业务)。

消息称目前淘宝闪购的日均单量在 6000 万单左右(含天猫超市 4 小时达、盒马等),虽然较去年夏季高峰下滑约 30%-40%,但其日均单量已经稳定;目前淘宝闪购单亏 1.5 元左右,在今年 Q2,外卖业务整体亏损较 Q1 将大幅改善(Q1 外卖亏损则在 170-190 亿元之间,与去年 Q4 几乎持平)。

此外,今年春节期间,淘宝便利店原计划今年要开设 1000 家,但新财年初已将目标调高至 1500 家,近期淘宝闪购内部进一步上调目标,计划开出 3000 家淘宝便利店。(消息来源:IT 之家)

整治夸大宣传、只评不测、商测一体等问题,国家网信办、市场监管总局联合印发《网络测评活动规范》

6 月 8 日消息,据中国网信网消息,近日,国家网信办、市场监管总局联合印发《网络测评活动规范》(以下简称《规范》)。

近年来,网络测评快速兴起,测评类经营主体通过开展测试、对比分析数据、引用专业检测结果或者表达使用感受等方式,发布测试过程与评价结果,为消费者购物提供参考。但一些网络测评存在夸大宣传、只评不测、商测一体等问题,不仅影响消费者信任度和购物体验,也扰乱市场环境。

《规范》明确,从事网络测评活动,应当遵守法律、行政法规和国家有关规定,遵循商业道德、公序良俗,坚持客观、公正、全面、准确原则。《规范》要求,从事网络测评活动,涉及对产品功能、性能等项目测试,应当委托具有法定检验检测资质许可的检验检测机构按照相关标准以及技术规范开展测试。

对食品开展检验检测的,测试方应当具备相应资质,不得使用非标方法,不得测评无国家标准检验方法的项目。不得采取不同标准、不同方法对同类产品进行横向、纵向比较。《规范》提出,未对产品开展测试,仅凭主观感受对产品进行评价,应当进行说明。网站平台要加强对网络测评信息内容管理,及时受理处置相关投诉举报。(消息来源:IT 之家)

 

比亚迪回应自研人形机器人代号「尧舜禹」、年内部署 2 万台传闻:均不属实

日前比亚迪自研人形机器人的消息引发广泛关注,网传其自研人形机器人代号"尧舜禹",计划于 2026 年在内部部署 2 万台。对此,比亚迪方面明确回应:相关消息均不属实。

比亚迪方面向媒体逐一否认了多条传闻,包括"比亚迪人形机器人代号尧舜禹"「第七代原型机在深圳和长沙工厂实地测试」"约 150 台上岗,目标年内自用 2 万台"等,均被定性为不实信息。(消息来源:快科技)

庆祝 Xbox 品牌成立 25 周年:微软发布限量版半透明 Series X 游戏机 / 手柄

6 月 8 日消息,在今天的微软 Xbox 发布会中,微软为庆祝 Xbox 品牌成立 25 周年,公布了一款全新限量版「Xbox Series X25 Limited Edition」游戏机,同时还带来了配套的纪念版手柄。

这款特别版游戏机配备 1TB 存储空间,设计灵感来自初代 Xbox。其整机采用半透明 OG Green(经典原始绿色)外壳,机身顶部 Xbox 标志区域还加入了绿色灯光效果。前面板则印有 25 周年纪念 Logo。

微软透露,相应游戏机内部和外观中隐藏了一些「彩蛋式细节」,供玩家自行探索,不过官方暂未公布具体内容。

与此同时,微软还推出了 25 周年纪念版 Xbox 手柄(Xbox Wireless Controller X25 Special Edition),其同样采用经典半透明绿色设计,ABXY 按键保留经典配色。参考微软国区运营「Xbox 盒子君」投稿的视频,预计相应手柄将于今年 10 月在国内上市。(消息来源:IT 之家)

折叠屏 iPhone 模型更多实拍曝光 外观设计进一步明朗

更多疑似折叠屏 iPhone(暂称 iPhone Fold)的模型实拍图在社交平台上曝光,使这款长期传闻中的新品外观轮廓进一步清晰。

6 月 7 日,又有多张新图在社交平台 X 上发布。本次晒图者为长期跟踪苹果产品的爆料人 Sonny Dickson,其配文直接将该设备称为「iPhone Fold 模型机」。

在颜色方面,Sonny Dickson 还对可能的配色做出补充说明。他在 X 上表示,目前看来苹果似乎不会为这款折叠机提供多种颜色选择,现阶段仅能看到白色版本的可能性。这一说法与近期另一名爆料者 Instant Digital 的消息存在一定呼应——后者在 6 月 5 日的爆料中提到,苹果内部仍在讨论是否引入黑色配色方案,显示苹果对首发色彩方案仍未完全定案。

从爆料历史来看,Sonny Dickson 一直是苹果硬件产品泄露图的重要来源之一,多次提前放出新品外观信息。不过,在如今 AI 生成图像、3D 打印模型等工具高度普及的背景下,相关「谍照」与模型的真实性仍难以百分百保证。即便此次曝光的图像在设计细节上与此前多轮传闻与设计稿高度吻合,外界仍无法据此认定最终量产机必然采用完全相同的方案。(消息来源:cnBeta)

互联网历史上首次!机器人流量首度超越人类:占比 57.5%

6 月 7 日消息,Cloudflare首席执行官马修·普林斯近日表示,互联网机器人请求流量已首次超过真人流量。

按当前统计口径,网站 HTTP 请求中机器人已占 57.5%,人类仅占 42.5%,而且这一变化比他此前预期更早到来。

普林斯此前预测这一交叉点可能出现在 2027 年末,后来又调整到 2027 年初,而伴随着 AI 智能体的快速崛起,流量增长速度明显超出预估。

据介绍,这里的机器人流量不仅包含传统意义上的网站爬虫、搜索索引程序,或欺诈、滥用脚本,而且还涵盖 AI 智能体、AI 聊天等。

这些 AI 智能体会像真人一样访问网页,典型任务包括读取商品页面、检查价格、比对航班、抓取和索引网页内容,以及充当个人助手完成点餐、购物比较和客服交互。

Cloudflare 也特别提醒,这组数据统计的是请求次数,而非用户参与度,真人用户依旧主导应用使用时长、视频流媒体观看和信息流浏览。(消息来源:快科技)

 

 

  •  

「重返 Web2.0」!扎克伯格重做了一个「百度贴吧」,Why?

作者|Moonshot
编辑|靖宇

 

不久前,Meta 却悄悄上线了一个有些逆时代的产品,叫 Forum(论坛)。

光看产品截图,让人有些恍惚。Forum 没有 AI 视频,没有虚拟形象,也没有复杂的多模态交互。

整个 App 只有图文、帖子、兴趣群组,以及人与人之间的讨论,看起来非常「复古」,就像十几年前的贴吧或者早期的 BBS,甚至应用名字就叫「论坛(Forum)」。

前几年 Meta 还在往元宇宙里砸几十上百亿美金,试图让所有人都带上头显去虚拟世界社交。现在,他们突然调转车头,把注意力重新放回了一个近乎 Web 2.0 的论坛产品。

一个「看起来像旧互联网」的社区 App,为什么会在 AI 时代重新出现

 

01

Facebook 群组的「外壳重置」

 

要搞懂 Forum 到底是什么,得先翻一段 Meta 的旧账。

其实早在 2014 年,Facebook 就推出过独立的 Groups(群组)App,但那次尝试并不算成功,应用在 2017 年被关停。

时隔近十年,Meta 重新以 Forum 之名将其复活,因为用户对上个时代的社媒已经忍无可忍了。

过去几年,Facebook 的主端 App 越来越臃肿 。打开 Feed 流,你看到的是短视频 Reels、商家的投放广告,以及各种熟人的动态。在这些噪音里,Facebook 最有「活人感」和讨论沉淀的板块 Groups(群组)被淹没了。

Facebook 因用户老年化,AI 内容很容易在上面传播|图源:Fast Company

 

所以 Forum 的产品逻辑,就是把 Groups 从 Facebook 那个臃肿的壳里单独拽出来,重新包装成一个纯净的独立产品。

Meta 这么干是有成功先例的。

此前大获成功的「美版闲鱼」Facebook Marketplace,最早就是脱胎于群组里的闲置物品交易小组,Meta 很早就意识到,群组本身蕴含着极强的社区价值。

根据 The Verge 和 TechCrunch 的上手体验,Forum 去掉了所有算法推荐的干扰。你的时间线里只有你主动加入的兴趣群组,比如烘焙爱好者、二手车主或者某个冷门游戏的讨论版。

而且 Forum 放弃了 Facebook 坚持了十几年的「实名制」底线 ,在 Forum 里,用户可以完全使用化名和虚拟头像发帖。过去你在 Facebook 某个职场群里吐槽老板,还得担心会不会被共同好友看到,现在这种压力被弱化了。

Forum 把社交的重点从「你是谁」,彻底变成了「你对什么感兴趣」和「你想表达什么」。

Forum 结合了算法和 AI Bot,但内容来源是真人用户|图源:App Store

 

为了经营好这片特区,Meta 还顺势引入了两大核心 AI 功能。

第一个是「Ask」(提问)功能 。这是一个内置的 AI 搜索助手。当用户抛出问题时,AI 不再依赖开放网页搜索,而是优先基于群组里的真实讨论给出建议。

第二个是管理员 AI 助手 。专门帮助群主更高效地进行内容审核和社区氛围管理。

但如果你真把它当成一个「小而美」的新社区,那就太低估 Meta 了。

拥抱匿名化只是为了让用户愿意开口,Forum 的底气,在于 Facebook 二十年累计的社交网络。

任何初创公司想做一个新社区,最难的就是「冷启动」,即怎么把第一批人拉进来发帖。但 Meta 不需要考虑这个问题。Forum 与 Facebook 原有的群组体系高度联动,用户拿原有账号一键登录,之前在 Facebook 里的各种活跃群组直接无缝平移。

别人做社区是从零开始建城,Meta 相当于直接推开一扇新门,门后原本就有几十亿人在城里聊了十几年。

而这套产品逻辑最终指向的对象,其实非常明确,看看 Forum 在应用商店里写的那句 Slogan「 看看真实的人在说什么,而不仅仅是流行什么 (See what real people are saying, not just what's trending)。」

这句 Slogan,套在 Reddit 上也毫无违和感。

 

02

对标 Reddit

 

知名社交媒体顾问 Matt Navarra 在 Threads 上,直接用「非常 Reddit 化」来评价 Forum。

在当前的互联网生态里, Reddit 的真实人类语料,正是各家 AI 大厂最眼红的资产 ,Meta 也不例外。

2023 年 4 月,Reddit CEO Steve Huffman 在接受《纽约时报》采访时,就把话说得很明白,平台的数据语料库太有价值了,绝对不能再免费让大公司拿去训练 AI。

Reddit 在 IPO 18 个月后,股价一度涨到始发价近 8 倍|图源:Google

 

就像社交网络之于 Meta,真实的人类语料,就是 Reddit 的金矿。

资本市场也完全认下了这个逻辑。2024 年 3 月 Reddit 挂牌上市, 当时的发行价只有 34 美元,但随后股价一路狂飙,最高点涨了近八倍

在一个图文社区普遍不被看好的时代,支撑这家公司市值飞升的,正是它手里那些高价签给谷歌、OpenAI 的数据授权大单。

为什么这些沉淀在论坛里的发帖和评论能值这么多钱?因为 现在互联网的「真人内容」越发稀缺了

当 AI 能直接输出答案时,论坛、贴吧、讨论组这种需要耐心阅读和长期沉淀的产品,一度被认为应该被淘汰了。

但当 AI 普及甚至泛滥后,那些互喷、玩梗甚至带着错别字的人类讨论,第一次变成了一种稀缺资源。

因为只有真实的人类经验、情绪和争论,才能源源不断地产生 AI 无法凭空编造的新信息。

就像你在 Google 搜一个具体的问题,比如「两千块买什么扫地机器人」,搜出来的首页大概率是一堆 SEO 内容生成的垃圾文章,或者干脆是 AI 拼凑的导购废话。

为了躲开这些注水信息,很多用户都习惯在关键词后面加一个「site:reddit.com」。来看看一个真实的人类网友的吐槽和解决方案。

 

Reddit 能集中任何小众领域的讨论|图源:Google

 

Forum,就是直接冲着「真实人类经验分享」这道 Reddit 护城河来的。

它在产品形态上完全复刻了 Reddit 的 Subreddit(子版块)模式,同样依靠版主来维护社区规则,同样依靠纯文字的深度讨论来沉淀内容。

资本市场的反应更直白。

Forum 悄悄上架的消息一传开,华尔街立刻做出了动作。根据当时的交易数据,Reddit(RDDT)的股价在盘中一度下挫超过 5%。

华尔街投行 Truist 的分析师在一份研报中指出, Forum 对 Reddit 构成了真正的威胁 。它会逐渐吸走 Reddit 那些没有太多社区忠诚度、仅仅是为了「找答案」的边缘和休闲用户。

而且 Meta 不是第一次「抄作业」了,之前为了对付 Twitter(X),Meta 搞出了 Threads,靠着 Instagram 的账号导流,几个月就拉起了庞大的日活。

现在,Meta 拿着 Facebook Groups 的海量存量数据来对标 Reddit,不一定打得到 Reddit,但一定会抢占一部分市场。

 

03

不为用户,只为抢数据

 

Reddit 已经做了将近二十年,成功 IPO,用户习惯早已固化。Meta 为什么非要在这个节点生造一个 Forum?

对社媒帝国 Meta 来说,单纯的用户增长早就不是第一优先级。Forum 想拿到的是:

AI 时代的数据主权

Meta 正在全力推进自家的开源大模型 Llama。大模型越往后迭代,对高质量人类交互数据的渴求就越深。

当 Reddit 把语料变成独家商品,卖数据给谷歌和 OpenAI 的时候,Meta 或许意识到,必须拥有一个属于自己的、可持续造血的「人类语料库」。何况 Meta 比其他巨头都更有社交内容的优势。

这也是为什么 Meta 不能直接用原版 Facebook 糊弄事的原因。

沉淀了二十年的 Facebook 信息流太杂乱了,充斥着短视频、微商广告和 AI 泔水 。把这些东西喂给 AI,纯属污染自家模型。

Forum 有着和 Reddit 高度相似的布局|图源:The Verge

 

所以 Meta 必须做减法。把相对纯净的 Group 功能剥离出来,划成一片「纯净特区」,重新培养高质量的真人语料,这些语料很可能就会成为训练 Llama 的关键数据来源。

而且 Forum 推出的时间点也很微妙,Reddit 如今广告越来越多,还在前几年因为 API 收费风波,逼死了大量好用的第三方客户端,引发过核心用户的强烈抗议。

Meta 正是看准了这个缝隙,用 Forum 提供一个无广告、更清爽、体验更好的替代品。

所以,别把 Forum 当成下一个想要改变世界的爆款社交产品, 它更像是一个服务于 AI 模型的过滤器

在 AI 生成内容泛滥的当下,越接近人的数据,才越有价值。

Meta 想重新占领的,是一个「真人还愿意说话」的地方

*头图来源: Digit

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

  •