普通视图

Received today — 2026年1月27日极客公园

「AI 无处不在」的达沃斯,科技巨头们都说了哪些金句?

2026年1月27日 04:36

首先,其实这个文章标题有点标题党:今年或许并不是 AI 味儿最浓的一届达沃斯。

但是在世界经济论坛上,AI 毫无疑问,已经成为与世界经济息息相关的议题:超过 84 位世界领导人、800 位 CEO 以及数以千计的其他与会者齐聚瑞士达沃斯,在阿尔卑斯山间参加年度会议。

今年的达沃斯,再也没有围绕「AI 会不会改变世界」的讨论,而是集中在两个更难回答、也更具冲突的命题上:「AI 的时间表到底有多激进」以及「AI 的成本、收益和风险如何在社会中分配,哪些群体先承受冲击,哪些群体先拿到红利」。

在现场,多位主持人都抛出了一个长期争论不休的话题:AI 行业是否正处在泡沫之中——也就是企业估值远远超过其当前可兑现的实际价值。行业领袖从不同角度回应,但结论却趋于一致:一切都还好。

无论是围绕 AI 时间表,还是 AI 对就业的影响,各路大佬都在演讲中产生了直接交锋。这让今年的达沃斯变得更具看点。

 

01

马斯克:

年内会有比人类更聪明的 AI

 

不同于其他经常混迹达沃斯的科技大佬,在社交媒体上频繁刷金句、甚至曾把达沃斯形容为「无聊到爆」的马斯克,反而是首次参加达沃斯论坛,虽然是作为临时加入议程的嘉宾,但还是贡献了诸多名场面:不仅有自称「外星人」的时刻,还有放话「2026 年底前,AI 将超越人类智慧」的狂言。

 

马斯克在达沃斯论坛现场 | 图片来源:视觉中国

 

「我们可能在今年年底就拥有比任何人类都更聪明的 AI;最迟不会晚于明年。」

这个激进的时间表,可能是目前整场达沃斯来自科技大佬的 AGI 时间线预测中最激进的一个。

马斯克的主要叙事是将 AI 的价值落到「物理世界的执行者(机器人)」,强调未来生产与服务会由大量机器人完成。同时这也是他「技术驱动丰裕」的核心世界观:当机器人把边际生产成本打到极低,社会将进入「供给极大充足」的状态。

在某个阶段,商品与服务会极其充裕,因为我预测机器人会比人还多

马斯克预测,普及化的人工智能与机器人技术将带来前所未有的全球经济扩张,最终会让工作变得不再必要;他还预计,「到 2030 年或 2031 年,AI 将比全人类的集体智慧更聪明」。

「如果你拥有数十亿台人形机器人——我认为会有——我认为地球上每个人都会拥有一台、也都会想要一台,因为你会希望有一个机器人——前提是足够安全——来照看孩子、照顾宠物……年轻人不足以照顾老年人。所以如果你有一个机器人能照顾并保护年迈的父母,那就太好了。我认为我们最终都会拥有这些。」

除了这些预测,马斯克倒是也的确给出了一个更具体的时间表:他预计特斯拉将在明年年底前开始把人形机器人 Optimus 对公众开售。

「我想我最后想说的是,我鼓励每个人都保持乐观,并对未来感到兴奋,」马斯克说。

他补充道:「总体而言,就生活质量来说,宁愿站在乐观一边,哪怕最后被证明错了,也好过做一个悲观的人,即便你是对的。」

 

02

微软 CEO 纳德拉:

大公司在 AI 时代更容易被颠覆

 

相比起其他名嘴,一贯以低调形象示人的微软 CEO 纳德拉的金句并不夸张,看起来也更适合出现在达沃斯这个场合,因此他靠的是把 AI 绑到宏观经济的硬约束上,让人无法继续用「模型很强」来搪塞现实问题。

在演讲中,纳德拉还提出了一个更容易击中公众情绪的概念:社会对 AI 产业的容忍度。

如果 AI 只是消耗稀缺能源生成大量 token,却没有改善健康、教育和产业结果,社会会很快失去继续容忍这种资源消耗的意愿。

纳德拉认为,过去十几年互联网基础设施扩张之所以被接受,不是因为它没有成本,而是因为回报足够明显。AI 若在短期呈现出「耗电机器」的形象,回报又看不见,它就会触发公共层面的反弹。

 

 

微软 CEO 纳德拉在达沃斯论坛现场 | 图片来源:Techrader

 

反弹可能不是一句空话,它更有可能会以实操方式出现:数据中心选址更难、电网接入更慢、能耗与排放监管更严、公共财政资源的分配争议更大,大科技公司的垄断问题也会被重新点燃。

在同一套逻辑之下,纳德拉还引出他对 AI 泡沫的解决方式判断:收益需要更均衡、更普惠地扩散。

要让 AI 最终不变成泡沫,收益必须更均衡、更普惠地扩散。

听上去像价值观,但这实际是来自微软 CEO 的商业判断:扩散不足意味着市场容量不足,意味着估值建立在少数行业和少数高购买力群体之上。

这种论调在达沃斯倒并不显得奇怪,毕竟听众里有大量跨国企业管理者,他们最关心的问题很朴素:我能不能用得起,用了之后能不能改变效率,能不能改造组织。纳德拉反复强调工作流,就是在把讨论从「技术供给」转向「组织需求」。

纳德拉把当下与 20 世纪 80 年代相提并论:那时计算技术重塑了职场,打开了新的增长与生产力空间,并催生出一类新的劳动者。「我们创造了一个完整的新类别,叫作『知识工作』,人们开始真正使用计算机,用软件放大我们想实现的目标,」他说。「我认为在 AI 的语境下,同样的事情也会发生。」

企业真正能拿到的价值不来自模型的智商,它来自流程、权限、责任和协作方式的重构。AI 进入企业,常常会变成一场管理工程。

「对大型组织而言,」纳德拉表示,「存在一个根本性挑战:如果你的变化速度跟不上技术所能实现的可能性,你就会被那些更小的公司上课——它们能够借助这些工具实现规模化。」

把这个说出来,比任何参数指标都更像达沃斯语言。

 

03

黄仁勋:具身是一代人一次的机会

 

除了老一套「应该把 AI 当成基础设施预算,而非单点的 IT 采购」这种说法之外,黄仁勋在达沃斯上,说的更多的是更多配套设施的建设方案:试图动员资本耐心,动员政府把 AI 当作基础设施议题,动员产业链为下一波落地做准备。

 

黄仁勋在达沃斯重点推销主权算力与 AI 基础设施议题 | 图片来源:视觉中国

 

「这是人类历史上规模最大的基础设施建设。

黄仁勋把 AI 形容为「一块五层蛋糕」,从下到上依次是「能源」、「芯片与计算基础设施」、「云数据中心」、「AI 模型」,以及最重要的应用层。

按照黄仁勋的介绍,每一层都需要建设、运营、维护、加固安全并持续扩张。每一层都对应各自的瓶颈、供应商和政治难题。每一层也都对应一张账单。

最上层,也就是硬件最终转化为利润的地方,被他称为「最终」会产生经济收益的所在。他描绘的是一个 AI 渗透进金融服务、医疗健康、制造业以及所有仍有低效可压缩领域的世界。

除了这些之外,黄仁勋还在对谈中频频将话题引到创业公司层面,表示 2025 年是风投募资纪录中最强劲的年份之一,大部分资本都流向了「AI 原生公司」,这些资金会成为下游就业创造的起点。资本推动应用层,基础设施与劳动力随之跟进。

具身智能是一代人一次的机会

黄仁勋认为,对拥有强工业基础的国家来讲,「机器人是一次『一代人一遇』的机会」,并表示如果想在 AI 建设浪潮中扮演主角,现实世界中的工厂、机器,以及能够学习的工业系统,仍然是一片存在着巨量机会的蓝海。

AI 不会抹去工作;它会重新分配工作内容

黄仁勋以医疗为例:AI 在他看来已经成为放射科的「关键工具」,但「放射科医生比以往任何时候都多」。他补充说,「如果你从第一性原理推导,这并不令人意外」,并主张 AI 加速了读片任务,让人们能把时间投入到更高价值、更高风险的环节。

黄仁勋称,美国面临「大约 500 万名护士的短缺」,其中一个原因是「护士将近一半的时间花在病历记录和文书工作上」。他提到用 AI 做病历记录与转写,并声称生产率的循环最终会导向更多招聘。「AI 正在提高生产率,因此医院希望雇用更多人。」

这可能就是达沃斯现场听众最想听到的故事版本:AI 扩张服务能力、改善结果,同时也让劳动力叙事保持稳定。

 

04

Demis Hassabis:

AGI 可能还需要 5–10 年

 

作为 Google 系 AI 产品的实际掌门人,DeepMind 联合创始人兼首席执行官 Demis Hassabis 每一次关于 AI 的言论,都会被当做 Google / DeepMind 的立场与信号。尤其是与 Anthropic CEO Dario Amodei 的对谈,在社交媒体上被疯狂转发。

 

哈萨比斯与达利奥的交锋是今年达沃斯最具看点的对谈之一| 图片来源:视觉中国

 

但他同时也处在一个很微妙的位置:既要保持技术领导者的姿态,又要在公共场合避免把时间表讲得过于激进,给政策与社会制造不必要的恐慌。

于是你会看到,他今年最常被引用的金句是一句相对保守的判断:

「AGI 可能还需要 5–10 年。」

这句话不仅与马斯克激进的「年内就有 AGI」的判断产生了直接冲突,也与更早之前 Anthropic 和 OpenAI 的创始人分别表达过、关于 AGI 最早可能在 2026 或 2027 年出现的判断有明显分歧。

哈萨比斯认为,通往达到人类水平的通用人工智能(AGI)的路径正在变得更清晰——但仍然缺少「一些关键要素」。他认为 AGI 还需要 5 到 10 年才能到来。但他并没有说清楚这些关键要素具体是什么。

和达沃斯的不少人一样,哈萨比斯也在对谈中多次表达过 AI 对入门级岗位冲击的担忧:「如果我现在和一班本科生交谈,我会告诉他们要非常熟练地掌握这些工具。」

 

05

Dario Amodei:

只差 6–12 个月,模型就能端到端完成软件

 

如果要选出今年达沃斯火药味最足的 AI 人物,Dario Amodei 极大概率就是那个答案:毕竟 Anthropic 创立的原因就是因为 Dario 担忧 OpenAI 在 AI 开发中没有把安全放在足够优先的位置,而离开公司创立了 Anthropic。他也同时在业内建立起「直言不讳谈论技术风险」的名声

 

达里奥贡献了今年达沃斯火药味最多的金句| 图片来源:视觉中国

 

作为与 DeepMind CEO 直接「对线」的选手,达里奥是今年现场火药味最足的大佬之一:但他之所以「火药味足」,并不全是因为他百无禁忌的言论,而因为他全程在讨论一个最难的问题:社会如何在短时间内承受一次「重写」。

「我现在已经不写代码了……我让模型写,我来编辑。」

除了对自身工作方式改变的吐槽,Dario 的火药味更多来自一种「矛盾感」:他相信 AI 带来的变化会很快,但他也同时悲观地认为社会跟不上。

「我认为人们几乎完全没有意识到即将发生什么,也没有意识到其规模到底有多大,」说。

「每隔三到六个月,就会出现一次极性反转:媒体先是对技术能力兴奋到不行,觉得它会改变一切;然后过段时间又说这全是泡沫,马上要崩,」他说。「我看到的是一条平滑的指数曲线……这条前进的步伐一直很稳定。」

这位 Anthropic 掌门人预计,随着 AI 模型改进,有用的软件将会大幅变便宜,甚至可能免费。谈到就业市场时,他表示,「实体世界的工作岗位可能会更多,而知识工作经济中的岗位会更少。」

Dario 还呼吁以某种形式的监管来保护社会免受即将到来的经济剧烈冲击。他指出,在这种「对宏观经济影响巨大的岗位替代」面前,「政府势必需要扮演一定角色」。

速度与适应能力的错配,是达沃斯最敏感的主题之一。因为达沃斯关心增长,也关心稳定。速度越快,稳定越难。把这句话讲透的人,自然会成为传播中心。

当然达沃斯这个场合,本身就是更适合面向企业高管、政府「喊话」的一个平台,

很多关键问题,即使是在大佬们之间,也并没有标准答案。

这个可能本身就是今年达沃斯给我们的最大收获。

「迄今为止最伟大的 AI 应用」的 Clawdbot,或许并不适合你|AI 上新

2026年1月27日 04:33

在刚刚过去的周末四十八小时,如果你还沉浸在 Claude Code 的各种 Skill 技能中,那你有可能意外地错过了一个现象级的爆款 AI Agent 产品——Clawdbot,无数海外 AI 博主将其称为:

「迄今为止最伟大的 AI 应用」

 

Clawdbot 确实能称得上现象级产品。无数友商大佬纷纷安利,甚至为了它专门购买 Mac mini,其中甚至包括 Google AI Studio 的产品负责人。这款 Clawdbot 从爆火开始,就与 Mac mini 这个硬件高度绑定,成为一套出圈组合。

 

能让 Google AI Studio 产品负责人主动「安利」苹果产品,Clawdbot 魅力可见一斑|图片来源:X

 

但不要误会,这篇文章并不是想向你安利这款产品。恰恰相反,是想帮你缓解一些焦虑:你并没有错过什么,因为现阶段 Clawdbot  还只是一个「极客玩具」


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!  

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例:一键复制 10 年工作经验,Coze 2.0 Skill 实测|AI 上新)向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时,优秀作者还有机会进入极客公园 AI 体验群,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧!投稿、进群请扫描下方二维码添加极客小助手微信

 


 

01

Clawdbot 是什么?
 

Clawdbot 是一个开源的本地 AI 智能体项目,Peter Steinberger 和社区一起做的,吉祥物是只龙虾。

相比于以往的本地开源 AI 项目,Clawdbot 做了两件事:

一是给你一套「能动手」的工具——浏览器控制、Shell、文件读写、定时任务、画布什么的——让模型的输出能直接变成动作。

二是做了个网关,把 WhatsApp、Slack、Discord、Signal、iMessage、Teams 这些聊天渠道接进来。你用任何一个熟悉的聊天窗口,都能远程指挥你的电脑。

 

用对话的方式高权限地控制一台设备,帮你完成几乎所有任务,是 Clawdbot 的主要卖点|图片来源:X

 

Clawdbot 的概念其实并不复杂,但真正关键的需求反而在硬件上:它需要一个地方 7×24 小时运行它能跑在 macOS、Linux 和 Windows(通过 WSL2)上。核心想法很简单:配置和记忆都留在你自己的硬盘,模型调用在需要推理的时候发生。

说白了就是「电脑上常驻的 AI 代理 + 聊天入口的总机」。这也解释了它为什么突然刷屏:大家脑子里的贾维斯幻想,变成了一个能下载、能跑、能折腾的东西。

 

02

它能做什么?
 

笔者也在周末实际体验了一下 Clawdbot,在相对简单的安装过后,真正复杂的环节是如何配置它,让 Clawdbot 变得适合你自己的需求;同时 Clawdbot 对系统权限要得太高的情况也确实存在,这一点直接决定了它不能跟个人数据电脑混用

但如果你给够对应的权限,它确实有能力让使用体验开始变得科幻起来:比如你可以让它全自动帮你改家里路由配置、装同步服务、搭短链接,到把桌面文件夹直接交给它改网站。全程在聊天窗口里完成,体验就像在给一个远程在线的「AI 员工」派活。

高度「放权」也意味着用户要将更多的个人信息与设备权限交付出去|图片来源:X

 

之所以它能做到与以往的 AI Agent 产品体验大相径庭,主要的区别在于:大多数 AI 工具是帮你回答问题,但 Clawdbot 是真的像一个员工一样帮你干活,即便有时候它干得并不完美。

Clawdbot 内置了浏览器控制、Canvas 画布、定时任务等工具。它能帮你浏览网页、填表单、读写文件、跑 Shell 命令。更关键的是多渠道接入——WhatsApp、Slack、Discord、Signal、iMessage、Teams 都能连,你可以通过这些聊天应用远程操控你的电脑。

这种「能动手」的能力一旦被像胶水一样粘合起来,玩法就多了,例如:

发一句「把那份合同里所有日期提出来做成表」,它就会去找文件、读内容、整理好、给你。

发一句「把这段代码跑一下测试,报错就修」,它就能拉代码、开编辑器、跑命令、改代码、再跑一遍。

发一句「把这周周报写好发出去后,在 Todoist 新建一个复盘项目」,它会自动写脚本、配 cron、把流程跑通。

每一步单看都不神秘。但神秘的是它把命令行、浏览器、文件夹、聊天窗口串成了一条管道。你的成本从「操作」变成了「描述」。

你用聊天的方式下指令,它在你电脑里读写文件、开浏览器、跑命令、做自动化。你在手机上发一句话,它就像远程桌面那样替你把事办完,只是中间夹着一个会思考的模型。

 

03

为什么大家都在买 Mac mini?
 

很多人把 Clawdbot 部署在一台专用的 Mac mini 上,当作「永不休息的 AI 助手」。

之所以选择 Mac mini,是因为 Clawdbot 的 GUI 操作,目前还只能在 macOS 上实现。

有人说他通过 Clawdbot 监控 Claude 编码会话,让 Clawdbot 自动拉代码、开 VS Code、跑测试、生成修复、自动提交。还有人说「躺床上看剧的时候,通过对话的方式重建了整个网站」。

 

Clawdbot  让 Mac mini 成为了 AI Agent 领域的新时尚|图片来源:X

 

这背后的逻辑其实也不难理解:这东西需要长久在线,Mac mini 便宜、安静、功耗低,放那儿当家用服务器很顺手。

而且它权限要得非常高。把它和个人日常数据混用风险极大。因此很多大佬单独买一台机器,等于把风险隔离在一个可控的盒子里。

它能自动化几乎所有你在电脑上能做的事。越能做,越需要隔离。

当然也有人走偏:桌上叠几台 Mac mini,到处拉树莓派,搞得像在建数据中心。因此社区里更冷静的建议通常会是:一台闲置电脑、甚至每月几美元的 VPS 都能跑起来。

 

目前也已经有很多用户回过味儿来:租一个服务器,或许才是 Clawdbot 更好的归宿||图片来源:X

 

换言之,Mac mini 并非入场券。买不买机器,取决于你愿意把「最高权限」放在哪个盒子里。

不过说到底,Mac mini 只是社区内各种硬核玩家的主流选择,官方强烈推荐用 Anthropic Pro/Max 订阅配合 Claude Opus 4.5,以获得更好的长上下文能力和提示词注入防护。但 Anthropic 最近改了 Claude Code OAuth tokens 的权限,限制只能在 Claude Code 内部使用,不能用于外部 API 调用,所以现在需要单独配 Anthropic API key 才能正常用。

 

以对话作为主要交互方式,既是主要卖点,同时也暗藏隐患|图片来源:X

 

 

04

能力越大,破坏力越大
 

但更重要的「注意事项」其实写在产品形态里。

Clawdbot 的能力建立在权限之上。它能帮你发邮件、改配置、跑脚本,同样意味着:它一旦误解指令、被提示词诱导、被网页内容带偏,后果不再是答错一句话,而是做错一件事。你很难用一句「我会小心」把这种风险降下来,因为问题来自系统结构:

它需要读取上下文,才能更聪明;上下文越多,潜在敏感信息越多。甚至已经有用户吐槽,Clawdbot 将自己电脑上的关键照片全部删除。

它需要执行工具,才能更有用;工具越强,误操作的破坏面越大。可能会带来包括密码泄露等危险隐患。与此同时它还需要联网,才能工作流闭环;联网越多,被注入和诱导的入口越多。

 

随着越来越多用户深入研究,Clawdbot 的漏洞也随之被发现|图片来源:X

 

这也是为什么即使是尝鲜阶段,「专机部署」「最小权限」「敏感操作二次确认」「把账号密码做成一次性凭证」这些建议,在 Clawdbot 圈子里出现得特别频繁。

因此,如果你最近看到很多人在聊它,我的建议是:不用跟风去装,也不必焦虑错过什么。原因很简单:它确实能带来震撼,它确实把风险摊在台面上。

多数人的真实需求,还没到「把整台电脑交给一个模型」的程度

它确实酷,酷到会让你重新评估「自动化」还能怎么做。但酷的同时也确实危险,危险到我绝对不会建议你在任何生产环境的设备上部署它。

走到这一步理论上接入飞书也不是不可能。当一个系统已经能接 iMessage、Slack、Teams,接入类似飞书这样我们国内用户熟悉的办公通讯工具只是时间问题。真正的问题从来不是「能不能接」,而是「接进来以后谁来背锅」:组织里的权限、合规、审计、数据边界,都会把个人玩具瞬间拉到企业系统的难度上。

你可能觉得这波热潮很突然,但节奏并不陌生。

去年开年,Manus 也在差不多的时间点「异军突起」——演示视频刷屏、「我把工作交给 AI 了」的叙事、教程和群聊一夜暴涨。

不同的是,Clawdbot 把战场从云端产品页搬到了你自己的电脑;

记忆不再只是某个账号的对话历史,更多时候是一堆本地文件、Markdown 日志、可迁移的配置。

执行不再依赖「平台提供的动作」,更多时候依赖你机器上的工具链。

入口不再只在网页里,聊天软件成了遥控器。

成功体验不再来自一次 demo,来自你把生活和工作流程一点点接进它的那一刻。

也正因为如此,Clawdbot 比 Manus 更容易让人上头:它离你的系统更近,离你的数据更近,离你的权限也更近——或许已经太近了。

在 48 小时的体验之后,我认为如果你把它当成「装完立刻提升生产力」的消费级产品,大概率会失望:配置门槛、权限焦虑、模型费用、错误成本,都会把激情迅速磨平。

如果你把它当成一个趋势样本来观察,Clawdbot 的价值毫无疑问:个人 AI 正在从「回答问题」走向「代替执行」,从「偶尔使用」走向「持续在线」,从「应用」走向「系统」。

未来的个人计算设备,可能会越来越像一台随时可被消息唤醒的「家庭服务器」,而你和它的交互界面,可能就是你每天都在用的聊天窗口。

你当然可以等。等安装流程更傻瓜、等权限模型更完善、等安全措施更完善的中间层变成此类应用的标配、等社区把最佳实践写得像操作手册一样清楚。到那时,Clawdbot 才会从极客玩具变成大众工具。

在那之前,把它当成一只很能干、也很爱闯祸的龙虾比较合适:能干活,能惊艳,最好关在你愿意承担后果的那个盒子里

Received yesterday — 2026年1月26日极客公园

AI 没有一夜改变电商,但它正在悄悄改变做生意的人

2026年1月26日 19:30

如果把过去两年 AI 的发展,画成一条曲线,前半段几乎完全由技术指标主导:参数规模、推理能力、榜单排名——那是一场工程师之间的竞赛。但进入 2025 年,这条曲线正在发生明显拐弯:讨论的重心,从「模型能做什么」,转向了「它到底有没有用」。

多份行业报告给出相似信号:全球生成式 AI 的新增投入,正在从基础模型加速流向应用层。AI 正从「技术奇观」,进入「生产力工具」的验证阶段。

这个结构性拐点,在电商行业表现得尤为清晰。一方面,电商天然具备数据闭环——点击、加购、成交、退货,每一次行为都是可被反馈的样本;另一方面,反馈速度极快,A/B 测试往往在短周期内就能验证效果。也正因此,电商成为 AI 商业化最先跑通闭环的实验场。

但几乎同时,行业也走向两个极端:一种是「AI 万能论」,仿佛接入模型就能解决所有经营问题;另一种是「AI 无用论」,认为 AI 只是噱头,难以真正落地。两种声音背后,共同回避了一个更关键的问题:AI 应该以什么方式嵌入经营流程,才能带来可持续、可复制的确定性增长?

实际上,一批务实的商家,已经悄然完成了从观望到实践的跨越。他们很少讨论模型参数、推理架构这些技术名词。他们关心的始终只有一个问题:AI,能不能让我多卖货、少花钱?

在这个问题上,淘宝教育提供的,并不只是零散案例的观察,而是一套可被反复验证的实践机制。作为淘天集团旗下官方商家成长平台,淘宝教育在过去一年里,持续深入真实经营一线,通过 AI 学堂、电商 AI 创新实践大赛以及《电商 AI 经营实践观察报告》,将分散在个体商家中的 AI 应用经验,系统化为可借鉴、可学习的经营路径。

从这个意义上看,淘宝教育的价值,并不止于「教商家如何用 AI」,而是在电商行业内部,承担起 AI 应用的翻译与扩散角色:把复杂的技术能力,转化为可理解、可借鉴的经营方法,并在真实的交流场景中不断沉淀与进化。

毫无疑问,当 AI 成为电商的基础生产要素,真正拉开效率差距的,将不再是「是否使用 AI」,而是 谁更早形成了正确、可复制的使用范式。这,才是 AI 真正开始重塑电商行业的时刻。

 

 

01

从经营痛点出发:AI 正在重塑的六大核心场景

 

那么,在这场从「技术奇观」走向「生产力工具」的迁移中,AI 究竟在哪些环节,真正改变了电商生意?淘宝教育在持续实践中,给出了一个清晰答案。

1 月 22 日,在 AI 电商产业聚集地——阿里巴巴数字生态创新园举办的「向 AI 要增长」超级公开课上,六大电商高价值应用被首次集中呈现——选品与新品创新、广告投放、经营决策、AIGC 内容生成、智能客服、数字人直播。而这些正是 AI 产生确定性价值的「主战场」。

 

 

 

近千名跨行业商家齐聚公开课现场,共赴 8 小时 AI 深度分享会

 

 

在为期 7 个月的电商 AI 实践创新大赛中,淘宝教育累计观察并拆解了 200 余个真实商家案例,并从中提炼出一个共识:AI 在电商中的价值,并非平均分布,而是沿着一条清晰的「价值曲线」展开。

 

第一类:成熟场景中的效率重构

在高度标准化、规则清晰的场景中,AI 首先解决的是效率与成本问题。例如智能客服、AIGC 生文生图等。这类场景的共性在于:问题明确、流程稳定、ROI 易于验证。

在《2025 淘宝教育电商 AI 经营实践观察报告》中,奥康通过「店小蜜 + AI + 自动化工具」重构客服全链路,将售后错误率从 10% 降至 0.3%;巴拉巴拉借助 AI 生图工具,完成 8000 余个在架链接的视觉优化,全店综合点击率同比提升 5%–10%,拍摄成本显著下降。

 

 

 

点击文章下方阅读原文,查看报告全文

 

在这些场景中,AI 并非替代优秀员工,而是补齐长期缺位的基础能力。当 80% 的标准化工作被系统化处理,团队才能将精力集中于更具价值的 20%。

从淘宝教育的长期观察看,这正是 AI 最先跑通闭环、但也最容易被低估的价值区间。

 

第二类:突破中的增长场景

当 AI 进入投放与直播等环节,其价值开始直接作用于收入结构。比如报告中的另一案例,百雀羚借助阿里妈妈 AI 工具进行投放 ,锁定高潜细分人群,实现成交人数显著提升;OPPO 则通过淘宝官方数字人直播工具,承接深夜长尾流量,让原本近乎空白的时段,跑出稳定 GMV。

这些案例指向一个共同变化:竞争优势不再来自更高预算,而来自 用 AI 放大每一分投入的效率。通过更快的测试反馈、更精细化的投放、更低的边际成本,让增长开始具备可复制性。如果说效率场景解决的是「活下去」,那么增长场景决定的,是「能否继续往前走」。

 

第三类:正在形成壁垒的决策场景

选品、新品研发、市场洞察等决策型场景,短期 ROI 并不总是立竿见影,但却决定着长期竞争力。夸克 AI 眼镜在上市前,借助 AI 市场扫描工具完成场景与人群定位,单品 S1 在双 11 早鸟预售期成交额突破 4000 万元;老板电器通过 AI 数据分析,快速验证关键词与组合策略,显著提升新品成功率与客单价。

从淘宝教育的视角看,这类场景的核心意义在于:谁能更早把 AI 引入决策层,谁就更可能构建难以复制的长期壁垒。

把这三条路径放在一起看,会发现一个重要结论:AI 改变生意的方式,并非颠覆某一个环节,而是重塑整条经营链路的运行逻辑——从人力密集型,到流程驱动型,再到数据与智能深度参与决策。

电商的竞争,正在发生结构性迁移。

 

 

02

AI 红利的分水岭:经营逻辑与人的价值再定义

 

在商业史上,每一次生产力的质变,最初带来的往往不是地位的稳固,而是洗牌的开始。

很多人有一个误区:容易将 AI 视为「头部商家的专属工具」,仿佛规模越大,红利越确定。但在淘宝教育持续的实践观察中,一个更值得关注的趋势正在浮现:

AI 带来的优势,并不完全取决于资源多寡,而更取决于商家是否率先完成了经营方式的重构。在这一过程中,AI 的红利,更像是一种对「先行认知」的回馈。

在真实经营中,一些差异正在逐渐显现:有的商家,仍主要将 AI 用于节省人力、提升单点效率;也有商家,开始尝试用 AI 重新组织流程、调整协作方式。当 AI 从单点提效走向系统层面的重构,一种更深层次的能力分化,正在形成。

从更高的维度看,这一轮变化至少发生在两个层面:企业的经营逻辑,和人的价值再定义。

先看企业。传统电商的经营逻辑,本质上是一种高度依赖个人经验的模式:选品、内容、投放、复盘,都围绕「人」的判断展开。

AI 的引入,并没有削弱人的价值,而是改变了经验存在的方式——真正的竞争力,开始取决于企业能否借助 AI,把分散在个体中的经验,转化为组织可共享的智慧体系,并持续反哺日常经营决策。

一种更轻量、更敏捷的「人机共生」组织正在出现:决策节奏从「周级迭代」压缩到「小时级试错」;部门边界被打破,内容开始做数据分析,运营开始参与产品创意。AI 不是优化了流程,而是正在打破「传统工种」的定义,并在组织层面,改变协同关系。

再看人。AI 并没有削弱人的价值,而是把人的角色往上推了一层。过去,人更多的精力在做「执行」:做图、写文案、调投放、盯客服。现在人的核心价值,开始集中在三件事上:定义问题、做出判断、制定策略。未来真正稀缺的,不是操作熟练度,而是能否设计出稳定、高效的人机协同流程。

 

 

03

瞄向确定性:从 AI 经营地图到学习型基础设施

 

一个看似吊诡、却正在行业里反复出现的现实是:几乎所有人都在谈 AI,但真正用起来的人,依然是少数。这也是当下 AI 落地最大的悖论:我们以为门槛在技术,实际上门槛在学习方式。

从行业视角看,AI 并不缺能力,也不缺工具,真正稀缺的,是一套能把技术转化为经营动作的学习路径。而淘宝教育的实践,正是在解决这一问题。

我们可以从三个认知维度,剖析这种深度赋能的价值:

 

第一,降低理解成本。

通过围绕六大经营场景的系统化学习,帮助商家看清 AI 的能力边界——能做什么、不能做什么,为使用建立正确预期。比如淘宝教育的 AI 学堂,在过去 7 个月里,普及了 20 多个工具,产出了 70+门 AI 课程,累计 55 万名商家在线学习。不在于「教得多深」,而在于将最基础的 AI 工具应用,讲清楚并能迈入落地阶段。

 

 

 

第二,降低试错成本。

通过 AI 大赛、特训营、交流沙龙等多种场景化实践,把学习从单向知识输入,转化为基于真实问题的交流与共创。并在实践中,将概念性的框架,转化为可被执行、可被复用的经营路径,真正跑通一条,适合自己的 AI 经营方式。

 

第三,AI 时代的能力迁移与组织进化。

当 AI 真正进入经营核心,问题就不再是「某个人会不会用」,而是「整个组织能不能一起用」。这意味着,AI 的价值开始从个体技能,转向组织能力的构建——人和 AI 如何分工,流程如何被重构,经验如何被沉淀并复制。

当 AI 不再只是一个工具或技能,而逐渐成为一种新的工作方式,将进一步倒逼商家从「会操作」,走向「会设计人机协同」;从依赖个人经验,走向可被验证、可被传承的组织能力。而淘宝教育未来也将在电商 AI 人才培养上,帮助商家完成组织转型。

把这三层放在一起看,会发现淘宝教育真正交付的,从来不是「几门课」,而是一场持续进行的商家「操作系统」升级。

在这个意义上,淘宝教育的价值不在于「教会商家用 AI」,而在于持续减少商家用错 AI 的成本,并为商家指向一条走向确定性的学习路径。

换言之,AI 的竞争,本质上不是技术竞赛,而是一场关于学习方式的竞争。

AI 没有一夜改变电商,但它正在重塑一个更底层的问题:商家是继续靠经验做生意,还是开始用系统经营未来。而那些最早完成「操作系统升级」的商家,正在提前走向下一个时代。

 

*头图来源:淘宝教育

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

AI 没有一夜改变电商,但它正在悄悄改变做生意的人

2026年1月26日 18:42
作者|苏子华
编辑|郑玄

如果把过去两年 AI 的发展,画成一条曲线,前半段几乎完全由技术指标主导:参数规模、推理能力、榜单排名——那是一场工程师之间的竞赛。但进入 2025 年,这条曲线正在发生明显拐弯:讨论的重心,从「模型能做什么」,转向了「它到底有没有用」。

多份行业报告给出相似信号:全球生成式 AI 的新增投入,正在从基础模型加速流向应用层。AI 正从「技术奇观」,进入「生产力工具」的验证阶段。

这个结构性拐点,在电商行业表现得尤为清晰。一方面,电商天然具备数据闭环——点击、加购、成交、退货,每一次行为都是可被反馈的样本;另一方面,反馈速度极快,A/B 测试往往在短周期内就能验证效果。也正因此,电商成为 AI 商业化最先跑通闭环的实验场。

但几乎同时,行业也走向两个极端:一种是「AI 万能论」,仿佛接入模型就能解决所有经营问题;另一种是「AI 无用论」,认为 AI 只是噱头,难以真正落地。两种声音背后,共同回避了一个更关键的问题:AI 应该以什么方式嵌入经营流程,才能带来可持续、可复制的确定性增长?

实际上,一批务实的商家,已经悄然完成了从观望到实践的跨越。他们很少讨论模型参数、推理架构这些技术名词。他们关心的始终只有一个问题:AI,能不能让我多卖货、少花钱?

在这个问题上,淘宝教育提供的,并不只是零散案例的观察,而是一套可被反复验证的实践机制。作为淘天集团旗下官方商家成长平台,淘宝教育在过去一年里,持续深入真实经营一线,通过 AI 学堂、电商 AI 创新实践大赛以及《电商 AI 经营实践观察报告》,将分散在个体商家中的 AI 应用经验,系统化为可借鉴、可学习的经营路径。

从这个意义上看,淘宝教育的价值,并不止于「教商家如何用 AI」,而是在电商行业内部,承担起 AI 应用的翻译与扩散角色:把复杂的技术能力,转化为可理解、可借鉴的经营方法,并在真实的交流场景中不断沉淀与进化。

毫无疑问,当 AI 成为电商的基础生产要素,真正拉开效率差距的,将不再是「是否使用 AI」,而是 谁更早形成了正确、可复制的使用范式。这,才是 AI 真正开始重塑电商行业的时刻。

 

从经营痛点出发:AI 正在重塑的六大核心场景

 

那么,在这场从「技术奇观」走向「生产力工具」的迁移中,AI 究竟在哪些环节,真正改变了电商生意?淘宝教育在持续实践中,给出了一个清晰答案。

1 月 22 日,在 AI 电商产业聚集地——阿里巴巴数字生态创新园举办的「向 AI 要增长」超级公开课上,六大电商高价值应用被首次集中呈现——选品与新品创新、广告投放、经营决策、AIGC 内容生成、智能客服、数字人直播。而这些正是 AI 产生确定性价值的「主战场」。

近千名跨行业商家齐聚公开课现场,共赴 8 小时 AI 深度分享会

 

在为期 7 个月的电商 AI 实践创新大赛中,淘宝教育累计观察并拆解了 200 余个真实商家案例,并从中提炼出一个共识:AI 在电商中的价值,并非平均分布,而是沿着一条清晰的「价值曲线」展开。

第一类:成熟场景中的效率重构

在高度标准化、规则清晰的场景中,AI 首先解决的是效率与成本问题。例如智能客服、AIGC 生文生图等。这类场景的共性在于:问题明确、流程稳定、ROI 易于验证。

在《2025 淘宝教育电商 AI 经营实践观察报告》中,奥康通过「店小蜜 + AI + 自动化工具」重构客服全链路,将售后错误率从 10% 降至 0.3%;巴拉巴拉借助 AI 生图工具,完成 8000 余个在架链接的视觉优化,全店综合点击率同比提升 5%–10%,拍摄成本显著下降。

点击该链接,查看报告全文

 

在这些场景中,AI 并非替代优秀员工,而是补齐长期缺位的基础能力。当 80% 的标准化工作被系统化处理,团队才能将精力集中于更具价值的 20%。

从淘宝教育的长期观察看,这正是 AI 最先跑通闭环、但也最容易被低估的价值区间。

第二类:突破中的增长场景

当 AI 进入投放与直播等环节,其价值开始直接作用于收入结构。比如报告中的另一案例,百雀羚借助阿里妈妈 AI 工具进行投放 ,锁定高潜细分人群,实现成交人数显著提升;OPPO 则通过淘宝官方数字人直播工具,承接深夜长尾流量,让原本近乎空白的时段,跑出稳定 GMV。

这些案例指向一个共同变化:竞争优势不再来自更高预算,而来自 用 AI 放大每一分投入的效率。通过更快的测试反馈、更精细化的投放、更低的边际成本,让增长开始具备可复制性。如果说效率场景解决的是「活下去」,那么增长场景决定的,是「能否继续往前走」。

第三类:正在形成壁垒的决策场景

选品、新品研发、市场洞察等决策型场景,短期 ROI 并不总是立竿见影,但却决定着长期竞争力。夸克 AI 眼镜在上市前,借助 AI 市场扫描工具完成场景与人群定位,单品 S1 在双 11 早鸟预售期成交额突破 4000 万元;老板电器通过 AI 数据分析,快速验证关键词与组合策略,显著提升新品成功率与客单价。

从淘宝教育的视角看,这类场景的核心意义在于:谁能更早把 AI 引入决策层,谁就更可能构建难以复制的长期壁垒。

把这三条路径放在一起看,会发现一个重要结论:AI 改变生意的方式,并非颠覆某一个环节,而是重塑整条经营链路的运行逻辑——从人力密集型,到流程驱动型,再到数据与智能深度参与决策。

电商的竞争,正在发生结构性迁移。

 

AI 红利的分水岭:经营逻辑与人的价值再定义

 

在商业史上,每一次生产力的质变,最初带来的往往不是地位的稳固,而是洗牌的开始。

很多人有一个误区:容易将 AI 视为「头部商家的专属工具」,仿佛规模越大,红利越确定。但在淘宝教育持续的实践观察中,一个更值得关注的趋势正在浮现:

AI 带来的优势,并不完全取决于资源多寡,而更取决于商家是否率先完成了经营方式的重构。在这一过程中,AI 的红利,更像是一种对「先行认知」的回馈。

在真实经营中,一些差异正在逐渐显现:有的商家,仍主要将 AI 用于节省人力、提升单点效率;也有商家,开始尝试用 AI 重新组织流程、调整协作方式。当 AI 从单点提效走向系统层面的重构,一种更深层次的能力分化,正在形成。

从更高的维度看,这一轮变化至少发生在两个层面:企业的经营逻辑,和人的价值再定义。

先看企业。传统电商的经营逻辑,本质上是一种高度依赖个人经验的模式:选品、内容、投放、复盘,都围绕「人」的判断展开。

AI 的引入,并没有削弱人的价值,而是改变了经验存在的方式——真正的竞争力,开始取决于企业能否借助 AI,把分散在个体中的经验,转化为组织可共享的智慧体系,并持续反哺日常经营决策。

一种更轻量、更敏捷的「人机共生」组织正在出现:决策节奏从「周级迭代」压缩到「小时级试错」;部门边界被打破,内容开始做数据分析,运营开始参与产品创意。AI 不是优化了流程,而是正在打破「传统工种」的定义,并在组织层面,改变协同关系。

再看人。AI 并没有削弱人的价值,而是把人的角色往上推了一层。过去,人更多的精力在做「执行」:做图、写文案、调投放、盯客服。现在人的核心价值,开始集中在三件事上:定义问题、做出判断、制定策略。未来真正稀缺的,不是操作熟练度,而是能否设计出稳定、高效的人机协同流程。

 

瞄向确定性:从 AI 经营地图到学习型基础设施

 

一个看似吊诡、却正在行业里反复出现的现实是:几乎所有人都在谈 AI,但真正用起来的人,依然是少数。这也是当下 AI 落地最大的悖论:我们以为门槛在技术,实际上门槛在学习方式。

从行业视角看,AI 并不缺能力,也不缺工具,真正稀缺的,是一套能把技术转化为经营动作的学习路径。而淘宝教育的实践,正是在解决这一问题。

我们可以从三个认知维度,剖析这种深度赋能的价值:

第一,降低理解成本。

通过围绕六大经营场景的系统化学习,帮助商家看清 AI 的能力边界——能做什么、不能做什么,为使用建立正确预期。比如淘宝教育的 AI 学堂,在过去 7 个月里,普及了 20 多个工具,产出了 70+门 AI 课程,累计 55 万名商家在线学习。不在于「教得多深」,而在于将最基础的 AI 工具应用,讲清楚并能迈入落地阶段。

 

第二,降低试错成本。

通过 AI 大赛、特训营、交流沙龙等多种场景化实践,把学习从单向知识输入,转化为基于真实问题的交流与共创。并在实践中,将概念性的框架,转化为可被执行、可被复用的经营路径,真正跑通一条,适合自己的 AI 经营方式。

第三,AI 时代的能力迁移与组织进化。

当 AI 真正进入经营核心,问题就不再是「某个人会不会用」,而是「整个组织能不能一起用」。这意味着,AI 的价值开始从个体技能,转向组织能力的构建——人和 AI 如何分工,流程如何被重构,经验如何被沉淀并复制。

当 AI 不再只是一个工具或技能,而逐渐成为一种新的工作方式,将进一步倒逼商家从「会操作」,走向「会设计人机协同」;从依赖个人经验,走向可被验证、可被传承的组织能力。而淘宝教育未来也将在电商 AI 人才培养上,帮助商家完成组织转型。

把这三层放在一起看,会发现淘宝教育真正交付的,从来不是「几门课」,而是一场持续进行的商家「操作系统」升级。

在这个意义上,淘宝教育的价值不在于「教会商家用 AI」,而在于持续减少商家用错 AI 的成本,并为商家指向一条走向确定性的学习路径。

换言之,AI 的竞争,本质上不是技术竞赛,而是一场关于学习方式的竞争。

AI 没有一夜改变电商,但它正在重塑一个更底层的问题:商家是继续靠经验做生意,还是开始用系统经营未来。而那些最早完成「操作系统升级」的商家,正在提前走向下一个时代。

 

 

*头图来源:淘宝教育
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

MiniMax Agent 开年更新,好的 AI 产品,需要让工具来适应人了

2026年1月26日 18:10

2026 年第一个月在科技圈刷屏的话题,是 Claude Cowork。

这是一个跑在本地的 AI Agent,一个面向大众版的 Claude Code,能帮你点鼠标、帮你整理文件、帮你完成各种操作。

紧接着,开源社区迅速跟进,各种「开源 Cowork」或「Local First」产品接踵而至,或许是感受到了外部的竞争压力,Anthropic 随后将 100 美元 Max 套餐独享的 Cowork 功能下调至 20 美元的 Pro 档。

MiniMax 也在这个节点升级了旗下的 MiniMax Agent,推出了桌面端,提供本地文件处理功能、Browser Use 功能等等,用户只需要一句话,即可快速完成基于本地的任务。同时网页端新增专家(Expert)功能,可以将常用配置保存为可复用模板——指令、模型偏好、Agent 行为,一次配置,反复使用。

「桌面 Agent」突然火了起来,行业内已经似乎突然形成了某种清晰的共识。

当 AI 不再只存在于网页对话框和云端环境里,而是进入你的真实工作环境,这件事究竟改变了什么?

答案很简单:上下文扩容。

以前跟 AI 聊天,它的视野只有对话框里的几行字,以及你上传的附件。但现在不同了,你的硬盘、你的浏览器、你的文件目录、你的屏幕画面,都成了它的视野范围。

与此同时,AI 开始从「咨询顾问」转向「执行者」。它不再只是给建议、提方案,而是可以真正动手:遍历文件夹、调用本地资源、拆解任务并把流程跑完。

也正是在这个意义上,我们开始认真看待 MiniMax Agent Desktop。或许,桌面 Agent 的批量出现和流行,代表着 Agent 正在从概念,面向更大众的群体,进入可以被日常使用、被实际交付的阶段。

MiniMax Agent Desktop 免费体验,还剩一天:https://agent.minimaxi.com/

 

 

 

 

⬆️关注 Founder Park,最及时最干货的创业分享

 

 


 

超 19000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群:

https://applink.feishu.cn/client/chat/chatter/add_by_link?link_token=82eme5a7-6a9d-4858-8a55-8c5f2a5cda87&qr_code=true (二维码自动识别)

进群后,你有机会得到:

  • 最新、最值得关注的 AI 新品资讯;
  • 不定期赠送热门新品的邀请码、会员码;
  • 最精准的AI产品曝光渠道

 


01
从今天起,不用再为整理文件困扰了

先从一件普通的小事开始使用 MiniMax Agent Desktop——整理文件夹,发票和整理桌面有些简单,我们换一种方式。

我有一个堆了很多年的电子书文件夹,里面躺着 400 多本电子书。所谓「买书如病倒,读书如抽丝」,松鼠症患者都是这样。文件名五花八门,有的是 ISBN,有的是作者名加书名,有的干脆是不明意义的编号「127766.The.epub」。

我给 MiniMax Agent Desktop 的任务很简单:

  1. 按主题整理这个文件夹,规范书名;
  2. 不确定的地方可以自行检索;
  3. 最后给我一份 Excel 表格。

Agent 没有立刻动手,而是先请求了访问权限。需要我明确选中目标文件夹,并确认它可以读取和修改内容。

Minimax 请求编辑权限

这一步很重要,它明确了责任边界,让我心里踏实了很多。

确认之后,它也没有马上改文件名,而是先给我了一份整理规划:会有哪些分类,如何判断主题,模糊情况怎么处理。

MiniMax 规划整理计划

接下来,它才进入执行阶段。左边是对话窗口,右边是命令行操作。明确的书直接处理;无法从文件名判断内容的书,它会上网检索,然后再归类。

比如看到「传奇中的大唐」这个文件名,它会去豆瓣查证,确认这是刘勃的历史随笔集,归入「中国历史」。

MiniMax Agent Desktop 的工作窗口: 左边是对话窗口,右边是命令行操作界面

最终结果是两个东西:一个被重新命名、分好类的文件夹;以及一份 Excel 表格,列清楚了文件路径、规范化书名和主题。

老实说,当看着文件夹里的文件名在瞬间自动刷新、归位,这种视觉冲击力远比生成一段文字要来得猛烈。那个飘在云端的 AI,第一次真正把手伸进了我的硬盘,完成了对现实世界的干涉。

整理前(左)vs 整理后(右)

值得一提的是,MiniMax 还找出了重复下载的书籍。

我追问了一句:你是怎么判断重复的?

它的回答是:目前主要基于标题相似度。需要的话我也可以用哈希值再校验一遍。

我当时的感觉仿佛是在玩一个开放世界的游戏——解决问题的路径不止一种,你可以反复尝试、扩展能力的边界,甚至解锁隐藏内容。

 


02
可复用的 SOP,让 70 分的通才变成 95 分的专家

网页端增加的专家功能值得单独介绍下,简单来说,它可以把一个人的方法论封装成一个可以反复调用的执行体,在我的理解中,这其实算是 Claude Skill 的普适版,门槛更低,更好操作,但能力没有打折。

MiniMax 封装了一些专家 Agent,同时用户也可以自己创建专家并发布到社区

这个特性触及到了一个非常有价值的问题:经验到底能不能被复用?

我选择了一个极具挑战性的任务:翻译加西亚·马尔克斯的《百年孤独》开篇。

之所以选《百年孤独》,是因为这段文字集合了时态穿越、魔幻现实主义的基调以及复杂的长句结构。范晔的译本已经是许多人的心中标准,许多人也许没看过原著,但是仍然可以轻松背诵那句著名的开头:

多年以后,面对行刑队,奥雷里亚诺·布恩迪亚上校将会回想起父亲带他去见识冰块的那个遥远的下午。

我先用常规的 Prompt 词调试了一个「翻译助手」,并将范晔的译本作为对照组,试图看看 MiniMax 能达到什么水准。

用户可以通过自然语言对话创建专家,也能把行业经验和 SOP 整合进去

MiniMax 的直出译文在准确性上几乎无可挑剔。它完美解析了原文中关于磁铁吸铁锅、钉子挣扎的复杂逻辑链条,没有出现任何事实性错误。

这大概是一个 75-80 分的水平,优于裸跑、没优化过的通用大模型 70 分的水准。剩下的那 20 分差距,体现在那些微妙的「颗粒度」上。

MiniMax 的翻译风格偏向直译、准确,但没有文学性

例如,形容磁铁的神奇力量时,范晔用了「魔铁」二字,古朴且带有炼金术的神秘感;而 MiniMax 译作「魔法铁块」,虽然意思对了,但少了一分文学的张力。

在描写吉普赛人带来的新发明时,范晔用了「牲口」来指代家畜,贴合农村的语境;MiniMax 则选用了「畜生」,虽然词义相通,但在中文语境下,这个词通常带有骂人的感情色彩,稍显偏差。

这可能就是单纯靠 Prompt 调优的极限。我们确实能通过 Prompt 快速让 AI 做到逻辑正确、语句通顺。但想再往上走,达到 90-95 分的专家水准,光靠几句提示词是做不到的,因为它缺乏特定的「隐性知识」。

于是,我重新配置了 Expert Agent,写入了一套详细的 SOP:

  1. 定义人设:你不是翻译机器,你是一位深谙拉美文学的中文小说家。
  2. 建立约束:禁止使用现代口语,优先使用古朴词汇
  3. 注入知识库:我上传了一份「魔幻现实主义词汇表」和「马尔克斯句式风格指南」

注入 SOP 之后,翻译结果呈现出了一种古朴的风格化特征,明显要比上一版本更好读,但有时会用力过猛。

这一次,MiniMax 呈现出了一种文学特质,要比上一版本好读得多。例如范晔的这一句:

湍急的河水清澈见底,河床里卵石洁白光滑宛如史前巨蛋。

MiniMax 处理成了:

河床上铺着光滑雪白的巨石,大如史前之卵。

「大如史前之卵」明显好于上一版本「鹅卵石」;但「光滑雪白」不如范晔的「洁白光滑」读起来顺口。

但它有时会显得用力过猛,把吉卜赛人和马孔多描绘得有点像中国古代传奇小说(比如「方生方始」、「提及之际须以手指勾勒」),稍微偏离了拉丁美洲的魔幻现实主义基调。

MiniMax 甚至整理了翻译札记

坦白说,即便加了 SOP,AI 依然无法彻底超越范晔的版本。范晔译本中那种「史前巨蛋」的精妙比喻、「魔铁」的炼金术色彩,依然是人类灵性的高地。

但令我感到震撼的是,仅仅在我注入那套 SOP 之后,MiniMax 就达成了肉眼可见的进步。这才是 Expert Agents 真正性感的地方:它让「经验」变成了一种可复用的能力。

同理,如果你是一位资深行业专家,你可以将自己多年的关键词挖掘逻辑、竞品分析框架、SOP 上传到知识库。当你把这个 Agent 分享给 AI 实习生时,他就不再是面对一个只会说车轱辘话的通用 AI,而是在使用你的「数字分身」。这种能力的释放,意味着我们只需要做一次「封包」动作,就能让 AI 站在我们的肩膀上工作。

 


03
Agent 的世界难题:「最后一公里」

第三个实验,我刻意选了一个更容易失败的方向——我想验证,「一人公司」到底是不是一句空话。

于是我设计了一条内容流水线:

  1. 先调研小红书科技类目的对标账号,分析他们的内容策略、爆款特征;
  2. 然后基于调研结果,批量生成选题和内容;
  3. 最后发布到平台上。

第一个任务「深度调研」,MiniMax 调用 Web 搜索工具,检索最近一周的科技要闻、小红书科技博主的对标账号信息。搜索完成后,它自动提取关键信息,生成了一份详细的分析报告,包含账号定位、粉丝量级、内容类型、爆款特点等维度。

MiniMax 生成的深度报告及图表信息

第二个任务「生成内容」。基于调研结果,MiniMax 批量生成了多篇科技类选题,包括封面图、文案、标签建议。

到目前为止,一切都非常丝滑,AI 展现出了惊人的生产力闭环。

说实话,看着它自动打开浏览器,熟练地找到发布入口,试图填入标题和正文,这种从「调研」到「执行」全链路跑通的观感,简直像是在看科幻片。这是我第一次真正意义上目睹 AI 试图独自走完业务的全流程。

但是,当 AI 真正介入到复杂的人类世界时,就会发现到处存在卡点。登录账号、图片上传、页面校验,这些对人来说是肌肉记忆的动作,对 Agent 却是「高摩擦操作」。GUI 本身就是为人类设计的,让 AI 在这种界面里高效操作,本身就违反了 AI 的「天性」;再加上平台严格的风控政策(比如验证码、设备检测),难度就更大了。

MiniMax 生成的小红书帖子,包含小红书标志性的 Emoji 文风,Tag以及增加互动率的引导

整个过程中,MiniMax 提示我需要人工介入的有两个环节,一是登录小红书账号,二是上传 MiniMax 生成的封面图片。

Minimax操作小红书后台

当然,这不妨碍它完成前面 90% 的工作。调研、生成、素材准备,这些原本需要花费数小时甚至数天的任务,它在几分钟内就完成了。

最后那一步的人工介入,与其说是 Agent 的不足,不如说是一个合理的边界划定:涉及账号安全、平台规则的操作,还是需要人类的最终确认。

这可能才是人类和 AI 协作的最理想画面:不要期待 Agent 替你完成一切,而是要理解它的能力边界,然后调整自己的工作流程。让 AI 擅长的事情,让人做人擅长的事情——这可能是一种更健康、更高效的协作模式。

在 MiniMax 操作小红书后台的过程中,用户可以随时暂停、人工介入。

 



04
一切都关乎「上下文」

跳出具体的功能评测,MiniMax Agent Desktop 的出现,其实引发了我对「资产」两个字的重新思考。

很多公司的核心资产是「经验」和「SOP」。但传统的 SOP 是写在文档里的死文字,新员工看了也不一定懂,懂了也不一定照做。

MiniMax 的 Expert Agents 提供了一种新的可能:你可以把个人和团队的方法论「封装」成可执行的程序。比如你的团队有一套成熟的内容生产流程——调研、选题、写作、排版、发布——你可以把这套流程固化下来,让 Agent 按照同样的标准执行。

这样一来,SOP 不再是纸上的条文,而是可交接、可复用、可执行的数字资产。新人不需要从零开始学习,直接调用专家的「方法论」,就能交付质量稳定的成果。

然后是心态转变

以前我们用 AI 的感觉像开脑暴会。你说「帮我写个文案」,它给你十个版本;你说「哪个更好」,它分析一通。整个过程是探索性的、发散式的,AI 是你的思考伙伴。

但用 Agent 的感觉完全不同,像带新人。你想清楚了要干什么,然后给它下达任务,用「验收标准」去沟通。它去执行,你来验收。有问题就调整,没问题就通过。

这种转变意味着,你需要把自己的思维方式从「提问」转向「管理」。不是问 AI「你觉得怎么办」,而是告诉 AI「我要什么结果,你帮我办」。

最后是边界重构

正如开头所说,桌面 Agent 改变的是「上下文」。但这个词背后隐藏着一个更本质的变化:过去是人去适应工具,现在是 Agent 主动进入人的环境。

过去三十年,我们一直在适应软件。鼠标该怎么点、菜单在哪里、快捷键是什么——这些都是人要去学习、去记忆、去适应的。但 Agent 不一样。它不需要你学习它的操作逻辑,而是它来理解你的工作环境、适应你的使用习惯。

这可能才是 MiniMax Agent Desktop 真正的意义:连接「本地资产」与「云端智能」的桥梁。你的知识、你的文件、你的工作成果都在本地;云端的 AI 能力通过 Agent 进入你的环境,为你所用。

有了更多的上下文,Agent 的能力真的可以不一样。



05
总结

三年前,我们还在为 AI 能写出一首打油诗而惊叹;今天,我们已经开始讨论如何让它接管我们的工作流。

Claude Cowork 的推出、MiniMax Agent Desktop 的这次更新,相比 Cloude Code 等 cli 工具,不只是 GUI 界面的更新,更像是一次对未来工作形态的预演。

它并不完美,在 GUI 操作上还有进化的空间,但指明了方向——AI 不应止步于聊天框,它必须深入到我们的硬盘、我们的浏览器、我们的具体业务场景中去。

这可能才是 2026 年真正改变的东西:不是人去适应分散的工具,而是 Agent 主动进入人的环境

也是 Agent 产品真正走向更大众市场的开始。

iPhone Air 再降 2000 元,创苹果史上最高降价纪录;黄仁勋现身上海、北京;腾讯元宝春节分 10 亿元现金

2026年1月26日 09:31

直降 2000 元!iPhone Air 创苹果史上最高降价纪录

苹果官方旗舰店开启了 iPhone Air 优惠活动,官方立减 2000 元,叠加国补到手价 5499 元起。而在第三方电商平台上,iPhone Air 的价格也进一步走低,在增加以旧换新补贴后,到手价为 5099 元左右。

iPhone Air 国行版于 2025 年 10 月 22 日开售,如今刚刚上市三个月整,其官方价格为 7999 元起,这也意味着其全新机的价格三个月下跌了 2900 元。

iPhone Air 是去年 9 月份苹果秋季发布会上全新推出的机型,走的超轻薄路线。采用内置 eSIM 技术,没有实体 SIM 卡槽,重量仅 165 克,厚度仅 5.6 毫米,是苹果迄今最薄 iPhone。

尽管苹果这几年在新机开售后会有小范围促销,但这次新年促销 iPhone Air 降幅最大,打破了新 iPhone 的降价纪录。(来源:21 财经)

古尔曼:苹果计划将由 Gemini 支持的 Siri「深度」整合到多个核心应用中

1 月 25 日消息,苹果自一年多前推出 Apple Intelligence 以来,苹果为其应用新增的人工智能功能寥寥无几。近期上线的功能仅有 Apple Music 的智能混音(AutoMix)和 Apple Watch 的健身搭档(Workout Buddy)。不过,这种局面今年将迎来改变。

据彭博社记者马克・古尔曼在今日发布的《Power On》通讯中透露,苹果计划将即将推出的、由 Gemini 驱动的新版 Siri 深度整合到其核心应用生态中。(来源:IT 之家)

 

Windows BitLocker 安全信任崩塌:微软向 FBI 提供用户密钥

1 月 25 日消息,BitLocker 并不像你想象的那么安全。据《福布斯》报道,2025 年初,美国联邦调查局(FBI)向微软送达搜查令,要求其提供三台涉案笔记本电脑的 BitLocker 加密恢复密钥。微软最终配合了该要求,这是这家科技巨头首次有记录向执法部门交出用户加密密钥,此事随即引发全球隐私保护领域的广泛争议。

据悉,这三台设备关联新冠疫情失业援助项目资金窃取案,当地联邦调查人员认为,设备中存储的加密数据是证明嫌疑人查丽莎·特诺里奥涉案的关键证据。目前,特诺里奥拒不认罪,案件仍在审理中。

BitLocker 是微软内置的驱动器加密系统,广泛应用于现代 Windows 电脑,可加密硬盘全部数据,仅持有密钥者能解码。其支持 U 盘等硬件存储密钥,默认将密钥备份至微软云端,方便用户遗忘密码时解锁设备,但这也为执法部门调取密钥留下了通道。

微软发言人查尔斯·张伯伦证实,公司每年约收到 20 份 BitLocker 密钥调取请求,多数因用户未将密钥存储在云端而无法配合。他坦言,密钥云端恢复虽便捷,但存在未经授权访问风险,强调「客户最了解如何管理自己的密钥」。值得一提的是,2013 年曾有微软工程师称,政府曾要求其为 BitLocker 植入后门,当时遭到拒绝,而此次配合 FBI 调取密钥,是其首次有记录向执法部门妥协。(来源:快科技)

 

腾讯元宝春节分 10 亿元现金,单个红包金额可达万元

1 月 25 日消息,腾讯官方发布《关于春节分 10 亿现金的通知》:将在 2 月 1 日上线春节活动,用户上元宝 App 分 10 亿现金红包,单个红包金额可达万元。

元宝 App 更新到最新的 2.55.0 以上版本,点击主页的预约卡片即可进入春节会场预约页面,提前预约的用户将在 2 月 1 日活动开启当天,额外获得 10 次抽奖次数。

据了解,活动设置了万元小马卡、现金红包和分享红包等红包形态,用户每天上元宝 App 都能领现金红包,通过做任务可抽更多红包,并有几率抽中限量 100 张的价值 1 万元现金小马卡。分享红包支持转发给微信、QQ 好友和社群,让元宝出钱、好友拆红包。

据腾讯内部人士透露,元宝即将上线全新玩法,已启动内测邀约。另外,腾讯公布的产品界面图中已悄然新增一个名为「派」的底 tab 入口。(来源:IT 之家)

 

百度文心助手入局春节 AI 大战,将发放 5 亿元现金

1 月 25 日消息,百度发布文心助手关于春节现金红包活动的通知。自 1 月 26 日至 3 月 12 日,用户在百度 App 使用文心助手,有机会瓜分 5 亿现金红包,最高可获得 1 万元奖励。

此外,百度 App 还将作为首席 AI 合作伙伴合作《2026 北京广播电视台春节联欢晚会》。(来源:IT 之家)

银河通用机器人成总台 2026 春晚指定具身大模型机器人

 1 月 25 日消息,据银河通用机器人官方微信公众号消息,中央广播电视总台正式官宣,银河通用机器人正式成为总台 2026 年春节联欢晚会指定具身大模型机器人。

据银河通用官方介绍,该公司开创性解决了全球机器人干活数据匮乏难题。公司首创合成仿真数据为主,真机采集数据为辅,虚实结合的机器人训练技术管线,构建百亿级机器人干活数据集,是全球具身机器人大模型最强、数据量最大的公司之一。其自主研发 GraspVLA、GroceryVLA、NavFoM 等多个涵盖操作、导航、应用等领域的端到端具身大模型,真正实现了「自主干活」,在落地场景应用中表现出优异的泛化能力、自主决策力和抗干扰性能。

在机器人本体方面,银河通用聚焦「可实用、能干活」的人形硬件研发。其独创的双臂配合折叠腿与全向轮底盘设计,支撑机器人在零售、工业、医疗等多场景实现高可靠规模化部署。(来源:IT 之家)

 

英伟达 CEO 黄仁勋现身北京,继续 2026 访华之旅

 1 月 25 日消息,英伟达创始人黄仁勋 1 月 23 日再度来华,首站到访上海新办公室,与员工见面并回答诸多员工关注的问题,同时回顾了公司 2025 年的主要事件。

在结束上海首站行程后,今日有网友拍到黄仁勋现身北京,并于中午到访王府中环半山腰云南菜用餐。

综合此前报道,黄仁勋过去几年都会在春节期间例行拜访中国,在 2024 年会上,他身着「大花背心」与员工们一起扭秧歌,抽奖环节还有名为「华为」的员工中奖;而在去年年会中,黄仁勋则是发放了多个数额 1 万元、2.5 万元和 4 万元的红包,并表示:「下次来是 10 万块!」。(来源:IT 之家)

 

法国总统马克龙承诺加速立法禁止 15 岁以下未成年人使用社交媒体,目标今年 9 月生效

 1 月 25 日消息,据 Lemonde 报道,法国总统马克龙于当地时间 1 月 24 日承诺,将加快推进针对 15 岁以下青少年的社交媒体禁令相关立法进程,目标是在今年 9 月正式生效。

他在法国新闻电视台(BFM Television)播出的一段自拍视频中表示:「我已要求政府启动快速立法程序,以尽快落实这项政策。」他还提到,希望该禁令能「从下学年伊始(即 9 月)起正式实施」。

此前,澳大利亚于上月成为全球首个禁止 16 岁以下青少年使用 Instagram、TikTok 和 YouTube 等热门且易让人上瘾的社交媒体平台的国家。法国议员们随后便针对这项禁令法案展开了辩论,相关立法草案将于周一提交法国议会审议。

马克龙表示,除了禁止 15 岁以下青少年使用社交媒体外,他还支持在校园内禁止学生携带手机。

据了解,法国国民议会 2023 年通过一项法案,要求社交媒体平台核查 15 岁以下未成年人注册账户前是否获得家长同意,但该法案被认为与欧盟《数字服务法案》相矛盾,最终未能实施。尽管如此,限制未成年人使用社交媒体的主张在法国仍获得广泛民意支持。2025 年 8 月,法国奥多克萨调查公司发布的民调数据显示,79% 的法国家长支持禁止 15 岁以下未成年人使用社交媒体。(来源:IT 之家)

 

贾国龙预计西贝亏损将超 6 亿:承认自己爹味很重!不再打造个人 IP

1 月 26 日消息,去年 9 月,罗永浩公开吐槽西贝「高价预制菜」引爆舆论,甚至近期贾国龙与罗永浩依然展开了线上之争,随着「约架」被双双封号,这场风波已经逐渐熄火。

据国内媒体报道,西贝餐饮集团创始人贾国龙近日接受采访时表示,将回归一线、聚焦主业,不再打造个人 IP。

贾国龙预计,2025 年 9 月至 2026 年 3 月,西贝累计亏损将超 6 亿元。

据悉,在去年的风波开始之后,西贝试图通过降价扩大客群、重建消费者信任,针对 30 余道菜品全国降价,降价幅度接近 20%。

此外,西贝将在今年一季度陆续关闭全国 102 家门店,占门店总数的 30%。(来源:快科技)

荣耀泡泡玛特联名手机正式开售

 1 月 25 日消息,2026 年 1 月 19 日,在荣耀 Magic8 Pro Air 及荣耀联名设计系列新品发布会上,荣耀 500 Pro MOLLY 20 周年限定版正式发布。该产品以泡泡玛特经典 IP MOLLY 的「小画家」形象为灵感,实现了从机身设计到系统交互的全链路深度定制,并配备专属联名礼盒及多款限定周边。

目前,荣耀 500 Pro MOLLY 20 周年限定版已经正式开售,国补后 3999 元。

在外观设计上,限定版选用曜石黑配色,将 MOLLY「小画家」形象呈现于机身背板;系统层面,IP 元素被深度融入交互细节,用户可体验到专属壁纸、主题界面、充电动效,以及可自定义的个性锁屏和定制水印;同步推出的联名礼盒采用「发光旅行箱」设计,内含彩窗透卡、手机壳、定制卡针、手机挂绳、胶片贴纸、红包及冰箱贴等多款限定周边。

 

此外,荣耀 500 全系列将于 1 月 23 日新增「超清模式」,支持一键直出 4K Live 实况,支持小红书无损超清上传与浏览。

硬件配置方面,荣耀 500 Pro MOLLY 20 周年限定版延续了该系列 Pro 级规格,搭载骁龙 8 系列平台,配备 2 亿像素超清主摄、8000mAh 青海湖电池、绿洲护眼屏及 MagicOS 10 操作系统等。(来源:IT 之家)

 

华为眼镜新品「悄悄」适配 HarmonyOS 6.0.0.130,可实时呈现拍摄设备向手机图库导入照片状态进度

1 月 25 日消息,博主 @ 数码闲聊站 此前爆料称,华为 AI 眼镜暂定上半年登场,支持拍照和音频,鸿蒙系统 + 跨端无缝协同,同传翻译,XXXX 新玩法,流光银 / 钛银灰 / 摩登黑。

华为鸿蒙 HarmonyOS 6.0.0.130 版本系统的负一屏透露了华为眼镜新品的部分信息。在「动态管理-服务动态」新增了「设备照片导入」选项,相关页面显示,该功能支持实时呈现拍摄设备向手机图库导入照片的状态和进度。该功能的服务提供方为「华为眼镜」,用户可在服务提供方处设置权限——是否允许华为眼镜访问「服务动态」。(来源:IT 之家)

上海:人工智能训练师成为冉冉升起的新职业,2025 年发放职业证书 1.09 万张

 1 月 25 日消息,据新华社报道,在《中华人民共和国职业分类大典》中面世不过数年,人工智能训练师正在成为冉冉升起的新职业之一。在上海,这一新职业更被列入上海市急需紧缺高技能人才职业(工种)目录。

上海产训融合技能发展中心总经理潘攀介绍,人工智能训练课程分理论和实操部分,其中理论部分约占 30%,操作部分约占 70%,考虑到参加培训的学员大部分是想要加深行业认知的「职场人」,通常在周末开班授课。

在上海理想信息产业(集团)有限公司,经过培训上岗的人工智能训练师不少。在公司总经理李娜看来,人工智能训练师在企业中扮演着「人工智能产品落地最后一公里的守护者」角色,他们不仅负责数据的标注、清洗与质量管理,更参与到模型调优、效果评估和数据校准的全流程中。

报道称,2025 年,上海累计参加人工智能训练师评价 1.63 万人次,通过评价取得职业技能等级证书 1.09 万张。

人工智能训练师是指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。

2020 年 2 月,「人工智能训练师」正式成为新职业并纳入国家职业分类目录,包含数据标注员、人工智能算法测试员两个工种,共设五个等级,分别为五级 / 初级工、四级 / 中级工、三级 / 高级工、二级 / 技师、一级 / 高级技师。(来源:IT 之家)

Received before yesterday极客公园

传 iPhone 17e 配灵动岛不涨价;大疆 Osmo Pocket 4 或春节后发布;中奖规则调整,买彩票成不了亿万富翁

2026年1月25日 08:38

消息称黑石集团正考虑出售徕卡相机公司,估值 10 亿欧元

1 月 24 日消息,据彭博社报道,黑石集团(Blackstone)正考虑出售徕卡相机(Leica Camera AG)的控股权,估值 10 亿欧元。

据报道,徕卡相机股份有限公司目前由黑石集团与考夫曼家族(Kaufmann family)共同持有,其中前者于 2011 年收购了徕卡约 45% 股份,目前希望退出投资,而考夫曼家族也参与了相关讨论,但可能会在交易完成后重新投资并继续持有部分股份。

不过目前该项目仍处于早期讨论阶段,据称两家公司正在与风投公司 HSG(前身为红衫资本)、私募股权公司 Altor Equity Partners 进行洽谈,尚不能保证最终一定会达成交易。

值得注意的是,有关徕卡相机可能被出售的传闻早在 2017 年就开始流传,当时的估值大约是 7 亿欧元。

回顾历史,黑石集团曾于 2011 年投资徕卡,帮助该品牌进行国际扩张,此后徕卡成功从一家小众相机制造商,转变为更具影响力、话题性的高端奢侈品牌。(来源:IT 之家)

比亚迪汽车 2026 年海外出口目标直指 130 万辆,挑战同比增长 25%

1 月 25 日消息,比亚迪公司正致力于将向中国以外市场的交付量提高近 25%。

周六,比亚迪品牌及公关部门总经理李云飞在上海的一次媒体发布会上表示,该公司计划在 2026 年向中国以外地区销售 130 万辆汽车。

据了解,比亚迪 2025 年销售约 460 万辆新能源汽车,其中纯电动汽车约为 226 万辆。其中,比亚迪 2025 年海外交付量超过 104 万辆(包括乘用车和皮卡),远超 2024 年全年海外销量总和。

比亚迪 2025 年在欧洲市场表现亮眼,积极开拓拉美及东南亚市场,出海足迹累计覆盖超 110 个国家和地区,成为出口增长最快的中国车企之一。(来源:IT 之家)

黄仁勋 2026 年首度来华,现身上海陆家嘴锦德菜市场

1 月 24 号下午消息,英伟达创始人黄仁勋再度来华,首站到访上海。黄仁勋现身陆家嘴街道乳山路锦德菜市场,体验上海市井风俗,看来起来挺平易近人。

据悉,黄仁勋此次来华行程与 2025 年初基本一致,主要是参加上海、北京和深圳分公司的新年晚会以及供应商答谢会。2025 年初,黄仁勋年初入华参加公司年会,并现场给员工发红包,引发广泛关注。之后,黄仁勋又两次入华,寻求解决特供中国市场的 H20 产品的销售的方法。(来源:新浪科技)

 

谷歌收购 3D 图像生成初创企业 Common Sense Machines

谷歌发言人证实,公司已收购总部位于美国马萨诸塞州剑桥市的 Common Sense Machines,该企业主攻生成式人工智能模型研发,可将二维图像转化为三维数字资产。

发言人表示,此项交易于本周完成,并未透露收购金额。据职场社交平台领英信息显示,该公司约有 12 名员工;

数据显示,该公司此前在获得安德森・霍洛维茨基金等投资方的 1000 万美元融资后,最新估值达 1500 万美元。

Common Sense Machines 的联合首席执行官之一泰贾斯・库尔卡尼曾任职于 Google DeepMind,担任研究科学家,后于 2020 年联合创立该公司。(来源:环球市场播报)

 

腾讯 QQ 秀全新回归,可代替头像进入聊天场景里

1 月 24 日下午消息,腾讯 QQ 宣布,承载一代用户青春记忆的 QQ 秀全新回归,用户在手机 QQ 搜索「QQ 秀」即可体验。

据悉,此次焕新回归的 QQ 秀,是 QQ 在 AI 时代下对社交场景的一次全新探索,通过 AI 驱动生成虚拟形象,并深度融入核心聊天场景,为用户提供更高效、生动的个性化表达和互动方式。

据悉,QQ 秀在形象创建环节对 AI 技术进行了积极探索,以往用户是手动捏脸、挑选装扮去生成一个理想中的自己,现在只需上传图片,即可通过 AI 驱动生成自己的专属形象,并可在此基础上进行简单的细节调整,这种「AI 驱动+轻度编辑」的方式实现了「千人千面」的个性化表达。此外,QQ 秀首次打破了这一常规,将用户的社交头像从一张静态图片升级为一个动态的形象。用户还可以给形象设置基础动作,如「搬砖」「摇花手」「捧腹大笑」等,则头像会变成做相应动作的动态的形象。(来源:新浪科技)

iPhone17e 或维持原价:A19 芯片、升级灵动岛

消息源 yeux1122 发布博文,爆料称尽管 NAND 闪存和 DRAM 内存成本飙升导致高端机型面临涨价压力,但 iPhone 17e 售价不仅有望与 iPhone 16e 持平(国行售价 4499 元起),甚至可能出现下调。该消息源指出,iPhone 17e 将大量沿用 iPhone 16e 的成熟硬件,其中最关键的是苹果自研的 C1 5G 基带。相较于采购高通的基带芯片,这款曾在 iPhone 16e 上首发的自研基带,预计能为每台设备节省约 10 美元的成本。(来源:36 氪)

 

大疆 Osmo Pocket 4 春节后发布:可旋转屏幕 新增一键变焦键

根据最新爆料,大疆 Osmo Pocket 4 口袋云台相机将于春节后发布,大概 3、4 月份。作为系列迭代新品,其在操控与体验上迎来关键升级,新增了一键变焦键成为核心亮点,还有一枚自定义 C 键。

从曝光信息来看,Osmo Pocket 4 外观延续系列经典设计,核心升级集中在交互与实用性上。其延续了可旋转屏幕设计,旋转即开机,非常快捷。

机身新增物理变焦按键与自定义 C 键,录制启停、变焦调节等高频操作可一键完成,无需依赖屏幕触控,大幅提升拍摄效率。

根据仓库信息显示,目前大疆 Osmo Pocket 4 云台相机已经转入量产备货阶段,甚至部分货品已抵达主要零售商处。

目前 pocket 3 是 2023 年 10 月发布的产品,已经 2 年多未更新产品线。截至 2025 年 10 月,Pocket 3 全球累计销量突破 1000 万台。(来源:快科技)

体彩福彩中奖规则双双调整,买彩票再也成不了亿万富翁

日前,中国福彩与体彩中心同步发布「彩票一等奖亿元封顶政策」,让不少幻想一夜成为亿万富翁的人梦碎。据悉,为防范奖池过高引发的支付风险和舆情风险,避免彩票被视为「可策略化套利的金融工具」;防止大额倍投导致奖池被一次性清空,保障彩票市场长期稳定运行;引导彩民理性购彩,强调彩票本质是公益事业而非投资渠道,相关政策正式出台。

根据规则,2026 年 2 月起(双色球 2 月 1 日,大乐透 1 月 31 日),中国两大主流彩票双色球与超级大乐透实施一等奖奖金总额单期 1 亿元封顶政策。

即当期所有一等奖中奖注数(含追加投注)的奖金总额最高不超过 1 亿元,超出部分转入奖池,按注均分剩余奖金。

这意味着无论奖池多高、中奖注数多少,单期一等奖总奖金都无法突破 1 亿元。

这一调整被业内视为「给彩票兑付端设了风险预算上限」,防范极端财富转移现象。

截至 2025 年底,国内彩市共开出 91 个亿元大奖,其中 2025 年 13 个创纪录,新规实施后这类现象将彻底消失。(来源:快科技)

iPhone Air 暴降 2500 开卖;特斯拉停用 AP,全力推 FSD;网友用 2 吨 SIM 卡练出 191 克黄金

2026年1月24日 08:46

 

特斯拉停用基础驾驶辅助功能 Autopilot,全力推广完全自动驾驶软件

特斯拉已正式停用其基础驾驶辅助系统 Autopilot,此举旨在推动更高级别的完全自动驾驶(监管版) 软件的普及。该决定出台之际,特斯拉正面临其美国最大市场——加利福尼亚州——暂停其生产及经销商牌照 30 天的处罚。

去年 12 月,法院裁定特斯拉多年来存在虚假营销行为,夸大了 Autopilot 与完全自动驾驶功能的实际性能。此案的发起方、同时手握牌照审批权的加州机动车管理局,已将上述处罚决定暂缓 60 天执行,为特斯拉留出整改时间,要求其停用 Autopilot 这一功能名称。

Autopilot 由两大功能组成:一是交通感知巡航控制,可让车辆按设定速度行驶,并与前车保持安全距离;二是自动车道保持,该功能能够辅助车辆沿车道转弯行驶。

就在此项决定发布一周前,特斯拉曾宣布,自 2 月 14 日起,将取消完全自动驾驶软件 8000 美元的一次性买断收费模式。此后,消费者仅能通过每月 99 美元的订阅方式使用该功能。不过,特斯拉首席执行官埃隆・马斯克在本周四的一则帖子中表示,随着软件功能不断升级,订阅价格也将随之上涨。

马斯克称,特斯拉新款车型未来将具备「无监管模式」自动驾驶能力,搭载完全自动驾驶软件后,驾驶者可以「全程玩手机甚至睡觉」。去年 12 月,他还曾表示,最新版本的完全自动驾驶软件已能实现前者,但需要注意的是,在全美几乎所有州,开车时发短信均属于违法行为。

在 Autopilot 功能问世的十余年间,特斯拉始终未能清晰、准确地向公众传达该软件的实际性能边界。公司屡屡夸大其词,让消费者误以为这项技术的能力远超实际水平,进而导致部分驾驶者对该系统过度信任。美国国家公路交通安全管理局的数据显示,由此引发的交通事故多达数百起,至少造成 13 人死亡。(来源:环球市场播报)

OpenAI 靠 API 业务月增超 10 亿美元年化收入

美国人工智能公司 OpenAI 近日迎来又一个重要里程碑:首席执行官萨姆·奥特曼在社交平台 X 上表示,公司在过去一个月里新增了逾 10 亿美元的年度经常性收入,而且这一增量完全来自其 API 业务,而非公众更为熟悉的 ChatGPT 订阅服务。

奥特曼强调,外界往往将 OpenAI 与 ChatGPT 直接画上等号,但真正推动业务高速扩张的,是负责对外接口与基础设施的 API 团队。

OpenAI 首席财务官萨拉·弗赖尔近日在《The OpenAI Podcast》节目中提出「模型授权(licensing models)」设想,希望通过技术授权分享下游产品成功后的收益。弗赖尔举例称,若 OpenAI 授权技术用于药物研发,而合作方依托相关模型取得重大突破、推出畅销新药,那么 OpenAI 将按协议分享该药品销售收入的一部分。她表示,这类「共担风险、共享收益」的结构,可能成为 OpenAI 未来重要的收入支柱之一。

在 API 业务强劲增长、广告测试和授权模式探索的多重推动下,OpenAI 正从单一的面向消费者订阅公司,逐步转型为集基础设施、平台与生态为一体的综合型 AI 服务提供商。(来源:cnbeta)

Meta 暂时屏蔽未成年用户访问 AI 角色

Meta Platforms 将暂时屏蔽青少年用户访问其人工智能角色,该公司正在更新其平台。Meta 周五在一篇博文中称,按照出生日期注册为青少年年龄的 Meta 用户,或被该公司年龄预测技术标记为可能未成年的用户,将无法访问 AI 角色,「直到更新后的体验准备就绪」。

Meta 表示,青少年仍然可以访问 Meta 的 AI 助手,该助手带有默认的、适合年龄的保护措施。

该公告建立在 Meta 于 10 月为未成年 AI 用户推出的保护措施之上,其中包括设置护栏,以防止讨论不当内容或自残、自杀或饮食失调等敏感话题。(来源:环球市场播报)

苹果拟与英特尔重启合作,为未来 iPhone 代工芯片

有分析师最新研报显示,苹果公司可能在本世纪末重新牵手英特尔,为部分 iPhone 芯片提供代工服务,但芯片仍将由苹果自行设计,而非采用英特尔架构。据 GF Securities 分析师 Jeff Pu 在一份研报中预期,英特尔将在其未来的 14A 制程量产后,为苹果代工部分芯片,相关产能预计在 2028 年左右准备就绪。

以时间点推算,英特尔有望为苹果未来的 A21 或 A22 系列处理器承担一部分代工任务,但台积电预计仍将是苹果的主要芯片制造合作伙伴。当前并无迹象表明英特尔会参与 iPhone 芯片的设计工作,其角色预计仅限于代工,这与当年为 Mac 提供 x86 处理器、深度参与架构设计的模式截然不同。

从供应链角度看,引入英特尔有助于苹果在关键制程节点上分散对单一代工厂的依赖。随着英伟达在人工智能服务器领域需求激增,并被指已在台积电的产能占比上超越苹果,业内普遍认为高端制程的产能竞争正在加剧。(来源:网易)

太空殡葬创业公司拟于 2027 年以「平价」方式送千人骨灰入轨

一家名为 Space Beyond 的美国新创公司宣布,将在 2027 年通过搭载在 SpaceX 猎鹰 9 号火箭上的立方体卫星,把多达 1000 名逝者的部分骨灰送入太空,并主打「可负担」的纪念方式,其最低服务价格仅 249 美元。

创始人、曾在 NASA 航天飞机项目与蓝色起源任职的工程师瑞安·米切尔(Ryan Mitchell)希望借此打破传统殡葬行业高价与形式单一的现状,为那些「仰望星空」的人提供一种新的告别仪式。

根据公司最新公布的信息,Space Beyond 已与 Arrow Science & Technology 签署发射服务协议,由后者负责把搭载骨灰的立方体卫星集成到猎鹰 9 号火箭的共乘任务中,计划发射时间为 2027 年 10 月。所谓共乘(rideshare)模式,是指多家客户共同分摊火箭运力,将多颗小卫星集成在同一枚火箭上发射,从而显著降低单一任务的入轨成本,也为小型商业与科研任务打开了太空大门。

不过,这段「太空纪念」并非永久存在。按照设计,Space Beyond 的铝制立方体卫星预计在轨约五年,随后因轨道衰减重返大气层,在再入过程中连同所携骨灰一同烧毁。米切尔认为,这种以一道无形火光完成的终结具有某种象征意味,虽无法保证肉眼可见,却形成了「从地球到太空,再回归大气」的闭环。(来源:网易)

谷歌 Gemini AI 助手免费提供「美国高考」SAT 模拟考试

1 月 23 日消息,据科技媒体 TechCrunch 昨天报道,谷歌 Gemini AI 助手现已提供免费的「美国高考」SAT 模拟考试。

据报道,学生只需要向 Gemini 的聊天框输入「我想参加 SAT 模拟考试」(I want to take a practice SAT test),AI 就会提供一套免费的模拟试题。完成后 Gemini 会批改试卷并分析结果,指出学生的优势科目,并标出需要进一步复习的薄弱环节,同时还会详解所有错误答案。

谷歌表示,公司已经与普林斯顿评论(The Princeton Review)等教育机构合作,确保试题内容经过审核,并且相关题目将与真实 SAT 考试题型高度相似。

据悉,谷歌的这一举措被视为「改变教育行业游戏规则之举」,这家公司试图为更多无法轻易获得 SAT 辅导的学生提供免费备考工具,让更多人站在同一起跑线上竞争。(来源:IT 之家)

上线约 5 年,Meta「元宇宙」VR 会议应用 Horizon Workrooms 将于 2 月 16 日关停

1 月 23 日消息,Meta 宣布将于 2026 年 2 月 16 日正式关停旗下 VR 会议应用 Horizon Workrooms,届时应用将下架,服务器同步关停并删除数据,Meta 建议现有用户转向 Arthur、Microsoft Teams Immersive 等会议软件。

据介绍,Horizon Workrooms 是 Meta 面向 Quest 头显推出的一款协作型生产力「元宇宙」应用,最早于 2021 年上线,目前已运营约 5 年。用户可以 Horizon Workrooms 提供的 3D 会议聊天室中与其他同事共享电脑屏幕、传输文件、利用虚拟白板写字绘画。同时即便没有 Quest 设备的用户,也可通过网页端以摄像头方式加入会议。

近期,Meta 正不断削减 VR 相关投入,将资源进一步转向智能眼镜等方向。(来源:新浪财经)

eBay 禁止 AI 智能体自动购物

eBay 更新了它的用户协议,明确禁止第三方生成式 AI 未经许可与该平台互动代替用户自动购物。

新条款将于 2026 年 2 月 20 日生效。过去一年多家 AI 公司推出了自动购物的 AI 功能:OpenAI 推出 Instant Checkout,允许用户直接在聊天界面从 Etsy 和 Shopify 商家购物;Perplexity 为其付费客户提供了 Buy with Pro 功能,亚马逊提供了 Buy For Me 功能。

eBay 新条款禁止的是第三方自动购物,没有排除它可能会自己提供 AI 购物功能。(来源:奇客)

iPhone Air 暴降 2500 元,到手价 5499 元起

今晚,苹果天猫官方旗舰店开启新年优惠活动,其中 iPhone Air 价格引发大量关注。iPhone Air 国行原价是 7999 元,这次活动官方立减 2000 元,售价只要 5999 元起。在部分地区,这个价格刚好进入国补范围内,叠加 500 元补贴之后,最终到手价只要 5499 元起。

iPhone Air 国行在 10 月 22 日开售,如今刚好是三个月的时间,价格却暴降了 2500 元,打破了新 iPhone 的降价记录。

iPhone Air 搭载 A19 Pro 芯片,配备 6.5 英寸超视网膜 XDR 显示屏,支持 ProMotion 自适应刷新率技术,最高可达 120Hz,后置 4800 万像素单摄。

采用 eSIM 技术,没有实体 SIM 卡槽,重量仅 165 克,厚度仅 5.6 毫米,是苹果迄今最薄 iPhone。(来源:快科技)

自带心率传感器的手柄,Anbernic 安伯尼克 RG G01 亮相

1 月 23 日消息,Anbernic 安伯尼克 RG G01 手柄现已亮相,新品定位高端,内置显示屏、心率传感器,支持三模连接。

这款手柄支持有线、2.4GHz 以及蓝牙连接,其中有线模式以及 2.4G 模式能够实现 1000Hz 轮询率,兼容 Android、iOS、Linux、Steam、Switch 和 Windows 等平台,采用 Xbox 风格按键布局,带有人体工学外形、线性 / 微动双模式扳机键。

同时,这款手柄还在机身上加入了一块小尺寸 IPS 屏,可用于显示状态信息,左右两侧各配有一个心率传感器,可在玩家心率过高时发出预警,这一设计在游戏手柄中相当少见。

此外,这款手柄还带有六轴陀螺仪,拥有紫麒麟电感应电容摇杆,支持宏编程,可设置连发等功能,背面还带有四个自定义背键。(来源:IT 之家)

微星推出「MAG 342CQRF E20」34 英寸带鱼屏显示器:1440P 200Hz、1500R 曲率,1499 元

1 月 23 日消息,微星现已在京东上架一款型号为「MAG 342CQRF E20」的 34 英寸显示器,这款显示器采用 1440P 200Hz 规格,提供 1500R 曲率(此前上市的 345CQRF E20 为 1000R 曲率),定价为 1499 元。

该机配备一块 34 英寸 21:9 比例 3440 x 1440 分辨率 200Hz Rapid VA 面板,显示器亮度 300 尼特,响应速度 0.5ms,覆盖 110% sRGB 色域和 90% DCI-P3 色域。

​该机支架支持升降 / 倾斜 / 旋转,显示器本体支持 VESA 壁挂,提供 2 个 HDMI 2.0、1 个 DP1.4 、1 个 3.5mm 音频接口。(来源:搜狐)

当事人回应用 SIM 卡炼出 191 克黄金:用了接近两顿废料

近日,「男子用 SIM 卡炼出 191 克黄金」受到网友热议,有网友质疑真实性,认为这是在炒作话题。炼金当事人「客家炼金师-桥」对此表示,自己确实是基于电子废料中贵金属回收的实拍记录,但网络上部分数据存在转载和表述不完全准确的情况。

据介绍,他用 SIM 卡确实提炼出了黄金,但并非是单一、完整的普通 SIM 卡,而是来源于通信电子领域中的芯片类镀金废料集合。

当时大概用了 2 吨的废料,而且网络上流传「191.73 克」这一数字只是是某一批次成品的称重数据,在传播过程中被简化成了「用 SIM 卡炼金」,这一说法并不严谨。

同时他强调,这不是个人用生活废卡炼金的故事,而是贵金属回收行业中,对特定电子废料进行合规提炼的过程。

据悉,这种炼金需要经过复杂的提纯过程,涉及强酸溶解、电解还原等步骤,经过清洗、加酸、溶解、过滤、提纯才能获得黄金。

这一系列操作都需要需专业设备与防护措施,个人切勿模仿此类操作。

SIM 卡中除微量金外,还含有铅、镉、溴化阻燃剂等有毒有害物质,而且提炼过程必须使用强腐蚀性化学试剂,非专业环境下处理极易造成环境污染和人身伤害。

除了 SIM 卡芯片,日常生活和工业场景中的银行卡芯片、各类 IC 卡,以及各类电子芯片、封装切片、连接器、触点、引脚等镀金部件等都可以提炼出黄金。(来源:快科技)

 

PolarDB,如何率先赢得通往 AI 时代的半张门票?

2026年1月23日 18:10

作者|Cynthia

编辑| 郑玄

AI 时代的入场券正被一分为二。

一半攥在大模型手里,以一周一迭代、一月一颠覆的速度卷出了新高度:LMArena.ai 数据显示,自 2023 年年中起,SOTA(当前最优模型)的迭代周期被压缩至 35 天,短短 5 个月就可能跌出 Top5,7 个月后连 Top10 的门槛都摸不到。

另一半则藏在数据深处:

与模型侧你方唱罢我登场的热闹不同,AI 时代,数据正变得越来越多元、异构、海量,这也导致数据侧的困境隐秘而庞大:IDC 数据显示,数据总量占比 80% 的非结构化数据仍在沉睡,此外,MIT 报告《2025 年商业 AI 现状》披露,全球 95% 的组织在 GEN AI 转型上获得的回报为零,而数据是影响成败的核心原因。

关于 AI 的发展阶段,阿里巴巴集团 CEO 吴泳铭在 2025 年云栖大会期间,阐述了通往 ASI 的三阶段演进路线:

当前的 AI 已经完成了「学习人」的「智能涌现」第一阶段;当下我们处在「辅助人」的第二阶段,AI 能够自主行动与真实物理世界交互,解决复杂任务;而长期来看,能够自我迭代超越人类的超级智能(ASI)才是我们的终极目标。

即便大模型搞定了通往 AGI 时代的 100 种解法,但随着用户需求从 AGI 向 ASI 的升级,数据的桎梏,也会让人工智能停留在无法解决实际问题、无法与真实世界产生持续互动的无知天才阶段。

那么如何抓住数据,这通往 AI 时代的半张门票?PolarDB 的答案,或许值得所有人参考。

 

01

大一统与碎片化轮回,

Agentic Al 时代需要什么样的数据库

 

数据库行业的发展史,本质上是一部问题倒逼进化的轮回大戏。

1970 年,IBM 研究员埃德加·科德的《大型共享数据库的关系模型》《A Relational Modelof Data for Large Shared Data Banks》一文,为关系型数据库埋下理论的火种;到了 1979 年 Oracle 推出首个商用 SQL 数据库,正式开启结构化数据为王的时代。

彼时的数据库,主打结构化数据管理、强事务一致性与 SQL 语言标准化,完美适配企业级应用对数据完整性的严苛要求。而迄今为止,银行核心交易、航空订票系统等强事务场景,仍离不开 SQL 数据库的加持。市场侧,则是 Oracle、IBM DB2、Microsoft SQL Server 长期垄断市场,开源的 MySQL 则在互联网场景中站稳脚跟,形成稳定的诸侯格局。

但 20 年后,互联网浪潮的到来,直接击碎了这份稳定。

2000-2010 年期间,Web2.0 与云计算的普及,让传统关系型数据库暴露出三大致命短板:分布式扩展成本高企,面对 JSON、图片等非结构化数据束手无策,高并发读写场景下性能直接宕机。

在这一背景下,2009 年 MongoDB 发布、2010 年 Cassandra 开源,NoSQL 运动全面爆发,行业思路从大一统转向专用化,并迅速分化出四大分支:文档型搞定内容管理,键值型撑起缓存会话,列族型承接物联网时序数据,图数据库深耕社交图谱。数据库与数据湖也在此期间分道扬镳:前者侧重写入实时性,后者主打读取时的海量低成本存储。

云计算企业也趁着分布式的浪潮,推出了自己的产品。阿里云正是在这场浪潮中孕育了云原生数据库 PolarDB。这款数据库从诞生起就带着云原生基因,后来逐步从阿里内部走向公开云,服务外部用户。

这种互联网与云服务时期的数据库碎片化革命带来了场景爆发,也制造了新的混乱。 一个中型互联网企业,内部数据库数量动辄几十上百,运维人员每天在不同数据库间搬运数据,同一份数据,既要存在 MySQL 供交易调用,又要同步到 MongoDB 做用户画像,还要导入 HBase 存时序行为,数据冗余率飙升的同时,孤岛问题愈演愈烈。

直至大模型的爆发,彻底改写了数据库的进化逻辑。

向量逐渐成为结构化、半结构化、多模态数据的统一语言,结构化数据用稀疏向量表达,非结构化数据用稠密向量解析,数据库行业迎来第二次轮回: 从专用化向一体化回归。其中, Oracle 最新版本已支持 10+数据类型,MongoDB 实现多存储一体化,PostgreSQL 凭借原生 JSON 与向量引擎成为开源标杆,Not Only SQL 的大一统趋势愈发清晰。

但趋势明朗不代表落地顺畅。不同数据类型对资源、性能的需求天差地别 :交易型数据要低延迟,分析型数据要高吞吐,向量数据要高维检索能力,如何在一个架构里兼顾所有需求?

更关键的是,AI 时代的数据库不再是针对后端开发的隐形工具, 前端、产品、运营都要通过 Agent 或知识库直接调用,那么如何更加适配这种数据库 Agent 前端化的大趋势,如何适配非技术用户,降低使用门槛?

All-in-One、适配 Agent 交互、降低使用门槛,成为横在所有数据库厂商面前的三座大山。

 

02

搬开三座大山,

PolarDB 让大一统的数据库走向前台

 

All-in-One、适配 Agent 交互、降低使用门槛,看似是三个不同问题,但本质上都在回答一个问题,我们要如何打造一个 AI-Ready 的数据库产品。

对于这个问题,在 2026 阿里云 PolarDB 开发者大会上宣布能力大更新的云原生数据库 PolarDB,没有走头痛医头的老路,而是从架构底层重构,给出了 AI-Ready 的系统级解决方案。

针对传统的数据库产品山头林立、数据被多次存储带来的割裂问题,PolarDB 借助 Lakebase 架构,通过湖库一体化存储、泛元数据统一管理、多引擎多模态融合检索,实现了不同类型数据以及数据管理任务的无缝协同。

首先是存储层,引入 Lakebase 概念,通过热-温-冷分层管理,精准解决性能与成本的矛盾。Lakebase 采用 NVMe SSD+OSS 对象存储的混合架构,热数据(高频交易、实时推理数据)存于高性能 SSD 达成高效响应,温数据(高频访问的历史数据)保留在 SSD 缓存层,冷数据(归档数据、低访问频次多模态文件)自动迁移至 OSS,存储成本直降数倍。这种分层不是静态配置,而是基于访问频率动态调整,搭配用户态 I/O 与网络栈设计、RDMA 技术,数据访问延迟较传统架构显著降低,兼顾高并发与高可用。

泛元数据管理则是打破数据孤岛的导航图。与传统元数据仅记录结构信息不同,PolarDB 的泛元数据分为三类:系统元数据定义如何存,明确存储位置、格式与权限;业务元数据定义为何用,关联业务场景与数据用途;事件元数据记录从何来,追溯数据产生、流转的全链路。三者协同,让 AI 模型能快速定位所需数据——比如理想汽车的智驾团队,通过泛元数据可直接关联传感器数据、标注信息与测试场景,无需人工梳理。

多模态检索能力则依赖多引擎协同作战。PolarDB 整合了搜索引擎、向量引擎、时序引擎、Ganos 时空引擎等六大引擎,其中向量引擎支持 HNSW 与 IVFFlat 两种索引——HNSW 适配高维向量的低延迟检索,IVFFlat 适合大规模数据的批量查询,搭配列存引擎的 OLAP 分析能力,可实现文本、图像、音视频、时空数据的跨模态联合检索。比如在哔哩哔哩的营销分析场景中,能同时检索视频内容、弹幕文本与用户行为轨迹,快速识别品牌曝光与用户反馈的关联。

更关键的是格式兼容性设计。Lakebase 支持 Iceberg、Delta Lake、Lance 等主流数据湖格式,兼容 OSS/S3 协议,企业无需重构现有数据架构,就能将历史数据、多模态文件无缝接入,迁移与适配成本大幅降低。

解决了海量异构数据的兼容问题之后,接下来如何让这些数据的使用变得更加 Agent 友好,成了新的困难。

PolarDB 的核心定位之一,是面向 Agent 应用开发的云原生数据库,其整体设计围绕 Agent 的两大核心需求展开:高效记忆管理与低成本开发部署。

过去,大模型的健忘症,一直是 Agent 落地的核心障碍:受上下文窗口限制,跨会话记忆无法留存,导致服务连贯性差。PolarDB 通过 Mem0/MemOS 框架,为 AI Agent 构建了长期记忆层,彻底解决这一问题。

Mem0 框架的核心是记忆分层与多引擎联动:将 Agent 记忆拆解为工作记忆(当前会话信息)、事实记忆(固定知识点)、情景记忆(历史交互场景),通过原生集成的 PGVector 向量引擎与 Apache AGE 图引擎,实现记忆的结构化存储与高效检索。

PolarDB Supabase 则让 Agent 开发从基建工程变成搭积木。过去,开源 Supabase 虽能提供一站式后端能力,但部署时需协调十多个微服务,升级过程中非常容易出现兼容问题,运维成本极高。PolarDB Supabase 则采用托管应用层+数据库核心的分离架构,将控制台、API 网关、身份认证等组件全托管,开发者通过 PolarDB 控制台就能统一配置,无需关心底层组件运维。

同时,PolarDB Supabase 中还加入了企业级增强设计:安全容器隔离防止信息泄露,内置 Realtime 实时数据库让数据变更秒级推送至 Agent,RESTful API 省去重复的增删改查编码,甚至支持通过 SQL 语句直接调用阿里云百炼内置大模型,大幅降低开发门槛。

如果说数据库接入层面的大一统以及 Agent 能力设计,针对的还是传统后端开发,那么 PolarDB 提出的模型算子化,则让非技术人员也能玩转 AI 数据处理。模型算子化(Model as an Operator)的本质是将 AI 能力封装为数据库原生算子,用户无需掌握 Python 或 MLOps 技能,用熟悉的 SQL 语言就能完成模型调用,完成分类、回归、聚类等常见需求。如此一来,数据无需迁出数据库,所有处理与推理都能在库内完成,既避免数据传输中的安全风险,又减少延迟。

 

03

AI-Ready 的企业,

需要 AI-Ready 的数据

 

如果说 PolarDB 的进化,回答了 AI-Ready 数据库如何建设的问题,那么企业如何管好数据、用好数据,也就是做好 AI-Ready 的数据,则是企业选好数据库、做好 AI 转型的前提。

围绕 Agentic Al 时代,如何用好数据,我们可以从道与术两个方面出发去看。

道的层面,Gartner 发布的《Ready Your Data for AI》给出了答案:所谓 AI 就绪的数据不是越多越好,而是要满足「连接性(Connected)、持续性(Continuous)、精选性(Curated)、上下文相关性(Contextual)」四大特性。

这四道标准与 PolarDB 的技术设计高度契合:连接性要求打破数据孤岛,对应 PolarDB 的湖库一体与泛元数据管理;持续性要求数据实时更新流转,依赖 Lakebase 的动态分层与 Realtime 能力;精选性要求数据与业务目标对齐,通过模型算子化让数据处理贴合场景需求;上下文相关性则靠泛元数据与 Agent 记忆层实现,让数据带着场景信息供 AI 调用。

术的层面,不同行业的实践给出了殊途同归的解法。

在汽车行业,理想汽车依托 PolarDB 构建智驾元数据底座,查询性能提升 3 倍、TCO 降低 60%,日推理调用量超百万,支撑智能驾驶快速迭代,并极大简化了企业 AI 转型的技术复杂度;在视频社区,哔哩哔哩通过大模型+小模型协同框架,实现数据不出库的智能营销分析,为广告主提供精准决策依据;在 AI 基座领域,MiniMax 用 PolarDB Limitless 架构解决千亿级表查询瓶颈,支撑 100+实例毫秒级响应。

当然,以上企业并非个例,截至目前,PolarDB 已服务超 2 万客户,部署规模超 300 万核,覆盖全球 86 个可用区, 成为 AI 时代数据底座的主流选择。

 

04

尾声

 

在通往超级人工智能之路的这个过程中,不仅需要模型层面的进步,更需要解决不同格式、不同来源、不同用途的数据,打破 AI 落地最后一公里的核心桎梏。

而伴随 PolarDB 这样的数据库从工具向 AI 基础设施转型:基于向量的多模态数据库让数据之间有了统一的语言,湖库一体让数据有了共同的存储管理方式;模型算子化,让数据能够更低成本的被更多人所利用。

万能的大模型+ A ll - in -O ne 的数据库+丰富的工具生态,让构建 AI 应用的复杂度,变得前所未有的低门槛,AI-Ready 到 AI-Native 成为可能。

而 PolarDB 的探索,不仅给出了 AI 原生数据库的标准,也让无数企业拿到了通往 AI 时代最重要的的半张门票。

一键复制 10 年工作经验,Coze 2.0 Skill 实测|AI 上新

2026年1月23日 18:07

作者| 金光浩

编辑| 靖宇

2025 年 10 月 16 日,Anthropic 推出了 Claude Skills。

3 个月后,打开 GitHub,你会发现 Skill 相关项目的提交增长曲线几乎是垂直向上的。

根据 SkillsMP 社区的统计数据,短短几个月内,Skill 的生态规模已经翻了好几倍,并且在过去的十几天里, Skill 生态正在以数倍的速度持续扩张着。

Skill 的增长趋势|图片来源:skillsmp

 

为什么 Skill 值得关注?因为它让你可以把别人踩过的坑、总结出的方法论,一键装进自己的工作流。不用重新学,直接用。

国内这边,扣子 2.0 率先跟进了这个方向, 在本周 推出了「技能商店」。

技能商店首页|图片来源:扣子

 

但扣子 2.0 做的事情,不只是跟进 Skill 这个概念:

它想要把 Skill 与「扣子编程」深度融合,从而打造一整套「职场 AI」解决方案。

什么意思?

扣子编程已经集成了丰富的 AI 开发能力。你可以用日常语言描述需求,扣子会自动帮你生成智能体、工作流、甚至完整的网页和移动应用。

这次加入了 Skill 能力,扣子生态里就有了「一键复用专家 SOP」的能力。

技能商店就是这个生态里的「能力超市」:你可以从商店里一键加载别人的技能使用,也可以把自己的技能打包上架销售。


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: 一句话让 AI 生成手绘风可编辑图表!这个开源项目让我玩上瘾了|AI 上新 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信


 

 

01

Skill 到底是什么?

 

很多人搞不清楚什么是 Skill,这里简单介绍下。

官方的定义是:Skill 是一种可复用的资源包,把某个领域的专业知识(工作流程、上下文、最佳实践),打包在一起,让通用 AI 变成领域专家。

这个定义听起来有点抽象。简单来说,你可以把 Skill 理解成一个「微型专家系统」:

它是针对某个特定任务,把最佳提示词和工具用法打包在一起,用文件夹的方式保存。

它的好处是可复用、可组合:创建一次之后,每次遇到类似任务就能重复调用;多个 Skill 组合在一起,还能构建更复杂的工作流。

Agent 执行时如何使用 Skill、MCP、Code|图片来源:Anthropic

 

一个典型的 Skill 由三部分组成: 指令、代码和资源。

以一个制作 PPT 的 Skill 为例:指令就是告诉 AI 按什么步骤做,代码负责执行其中的固定生成文件逻辑,资源则包含设计标准——比如什么排版好看、什么结构更清晰。

Skill 由指令、代码和资源三部分组成|图片来源:极客公园

 

扣子 2.0 这次更新,就是把 Skill 这个强大的工具集成到强大的扣子生态里。

职场里,有无数重复的工作,可以用 Skill 来实现。

如果你是一个 SQL 专家,你可以把表描述和创建 SQL 的步骤写到 Skill 里,这样团队里的新人不需要花三个月学 SQL,加载你的 Skill 就能完成 90% 的日常查询。

类似的,一个顶尖的电商客服,可以把你的话术 SOP 写成 Skill,这样团队里每个人都能复用你十年积累的沟通经验。

说白了,你不需要成为专家,你只需要用上专家的 Skill。

除此之外,扣子 2.0 对 Skill 的理解更进一步:

Skill 不应该只是一个文件,它应该能交易、能组合、能持续更新。

所以扣子 2.0 的技能商店,从一开始就内置了交易机制:创作者可以把自己的 Skill 上架销售。

目前看,扣子是全球范围内较早把 Skill 商业化落地的平台之一。

 

02

实测 Skill 能做什么

 

我用扣子 2.0 做了几个测试,看看 Skill 在实际场景中的表现。

 

「测试一:一句话生成工作流」

我想看看它能不能帮我快速生成一个完整的工作流。

于是,我输入一个需求:

一句话创建一个技能|图片来源:扣子

 

扣子接到指令后,自动拆解了任务:

先搜索产品的基本信息,再抓取用户评价,然后做情感分析,最后整合成一份结构化报告。

整个过程不需要我手动配置每一步,它自己把流程串起来了。

技能创建思考过程|图片来源:扣子

 

几分钟后,一个完整的「Coze Skill」就生成了。

技能可以预览、可以下载|图片来源:扣子

 

用它来分析你感兴趣的产品,只需要一句话,很快一个详细的分析报告就可以做出来了。

通过对话直接调用技能|图片来源:扣子

 

如果你经常做这种竞品分析,以前可能需要在工作流编辑器里拖拽十几个节点,现在一句话就能实现。

但这只是最基础的用法。接下来我想试试更细的场景。

 

「测试二:优化搜索关键词」

第二个测试来自一个观察:

大模型做深度研究很强,为什么呢?

我发现,是因为它在搜索的时候,会把模糊需求拆解成精准的搜索关键词。

而我们大多数人,其实并不太懂搜索引擎的高级语法(比如用 site:指定搜索特定网站)。

而这个问题,完全可以用「Coze Skill」来解决。

我做了一个简单的 Skill:输入你想研究的问题,它帮你优化成适合搜索引擎的关键词组合。

搜索引擎技能预览|图片来源:扣子

 

用法也很简单,直接给他输入:「有哪些名人公开讨论过 claude skill」。就会触发它的转换。

搜索引擎技能调用|图片来源:扣子

 

它输出了很多种不同维度的搜索词:有直接拆解关键词的,有聚焦不同数据源的,有用高级搜索语法的。

搜索引擎技能输出|图片来源:扣子

 

比我自己想的要全面得多。

一个文件,封装了搜索引擎的十年使用技巧。

这就是 Skill 的威力。

 

「测试三:定制一键读论文的工作流」

前两个测试都是单点任务,第三个我想试试更完整的工作流:

能不能用它定制一个完整的论文阅读工作流?

阅读学术论文是一件流程很固定的事情。大部分人的流程是:先看摘要判断跟自己的相关性,再了解研究背景,然后看核心结论,接着理解研究方法,最后精读实验结论部分。

我把这个流程拆解出来,告诉扣子:

创建一个自定义步骤的 Skill|图片来源:扣子

 

然后,扣子就会根据这个流程,生成一个对应的 Skill。

读取论文的 Skill 创建结果|图片来源:扣子

 

我用一篇关于大语言心理创伤实验的论文做测试。

它准确地提取了论文的核心框架,生成的笔记条理清晰。

读取论文的 Skill 创建结果|图片来源:扣子

 

我拿另一篇论文又测了一次,输出格式完全一致。

这让我意识到: Skill 的真正价值不是替你做事,而是让 AI 按你的方式做事。

每个人读论文的习惯不一样,关注的重点也不一样。用 Skill,你可以按照自己的阅读逻辑来定制输出。

 

03

如何自己做一个 Skill?

 

看完实测,你可能已经在想:我怎么才能做一个自己的 Skill?

其实,方法有很多种。

如果你想快速用起来,或者只是想快速解决手边的某个问题:

方式一: 直接在扣子编程的「技能」入口描述你的需求 ,类似我们前面第一个测评的例子那样。

如何创建一个技能|图片来源:扣子

 

方式二: 直接使用「扣子技能商店」里现成的 Skill 。商店里已经有很多人分享了自己的技能,覆盖写作、数据分析、办公效率等各个领域。找到一个和你需求相近的,一键加载就能用。

技能商店展示|图片来源:扣子

 

方式三: 用开源社区的 Skill 。GitHub 上有不少开源项目,SkillsMP 这样的网站里也聚集了大量 Skill,X 上也有很多超级个体分享的 Skill。很多都是行业专家分享的,质量相当高。

如果你想沉淀自己的方法论:

方式四: 用 AI 帮你生成 。有一些开源的 Skill-Creator 工具,你用自然语言描述你想要什么工作流,大模型会检索专家的知识库,然后把它写成 Skill 格式。生成完导入扣子就能用。跟方式一的区别是,你可以更好的介入其生成过程。

方式五: 按照协议自己写一个 。主要就是把你工作里的方法论拆解成步骤,写成 Skill 的格式。参考我们刚刚 定制一键读论文的工作流的例子, 如果你有一套独特的工作流程,比如一套做电商运营的选品方法,又或者一套做内容的独特选题思路,都可以变成 Skill。

 

04

技能商店的意义

 

说了这么多用法,是时候回到一个更根本的问题:

Coze 的「技能商店」这件事,为什么值得认真对待?

因为它做的事情很有价值:把少数人头脑中的方法论,变成人人可用的「在线」能力。

过去,一个领域的经验往往只存在于少数人的脑子里。经验靠师徒传承、培训课程、书籍文章传递,再通过实践内化成技能,一个新人要达到专家水平,往往需要三五年甚至更长时间。

但「Coze Skill」改变了这个逻辑。专家的经验可以被结构化地提取出来,变成一个可复用的模块。新人不需要完全理解背后的原理,加载这个模块就能获得类似的输出。

当然,这不意味着新人可以完全替代专家。Skill 解决的是执行层面的问题,决策和创造仍然需要真正的专业积累。

但对于大量标准化、重复性的工作,Skill 确实可以大幅降低门槛。

比如,做内容运营,你可以调用一个写过多篇 10 万+的作者的选题方法论。做产品汇报,你可以用大厂产品总监的 PPT 模板和逻辑结构。你不需要成为所有领域的专家,你只需要知道谁的技能可以帮你。

这是一种全新的能力获取方式:不需要从头学习,直接调用

更重要的是,技能商店从一开始就内置了交易机制。

如果你是一位创作者,有一套独特好用的 Skill,你也可以发布到 Coze 的技能商店,让它帮你赚钱。

GitHub 上的 Skill 是免费共享的。这对用户来说很好,但对创作者来说,缺乏持续贡献的动力。

扣子 2.0 的技能商店,从第一天就想清楚了一件事:好的 Skill 应该有价值,有价值的东西应该能变现。

所以技能商店内置了交易系统,创作者可以给自己的 Skill 定价。

扣子的技能商店才上线几天,就已经出现了通过 Skill 获得收益的创作者。

很多技能作者已经开始赚钱了|图片来源:扣子

 

这说明真正有价值的 Skill,是有人愿意付费的。

如果你有独特的工作方法论,现在是一个值得尝试的最佳窗口期。

 

05

一种新的可能性

 

过去我们说用 AI,其实很多时候是在「教 AI」。

每次对话都要从头开始,花大量时间解释背景、说明需求、反复校准方向。好不容易调教好了,换一个任务又要重来。这种体验和「协作」相去甚远,更像是在训练一个什么都不记得的新员工。

扣子 2.0 改变了这个关系。技能商店是其中一环,配合 Vibe Coding 和一键部署能力,它想做的是一整套「职场 AI」解决方案。

这里的底层假设是:你的精力应该花在决策和创造上。那些可以标准化的执行工作,可以交给沉淀好的技能。这样,你可以把更多时间花在真正需要人来判断的地方。

对于普通用户来说,这意味着 AI 的门槛又降低了一级。你不需要会写提示词,不需要懂工作流配置,你只需要在技能商店里找到合适的 Skill,一键加载,就能拥有专家级的执行力。

而对于有专业积累的人来说,这意味着你的经验有了新的价值出口。你可以把方法论封装成 Skill,分享给更多人使用并且获得一定的收益。你的知识不再只存在于你的脑子里,它可以被规模化地调用。

这大概就是「Coze Skill」真正让人兴奋的地方。

它代表着一种新的可能性:

专家的技能和经验不再是私有财产,而是可以被打包、被调用、被交易的公共资源。

别人的十年积累,可能成为你的一键起点。

曝阿里旗下芯片公司拟独立上市;苹果新 CEO 人选或曝光;比亚迪李云飞:公司是黑水军最大受害者

2026年1月23日 08:27

消息称阿里旗下芯片公司「平头哥」拟独立上市

1 月 22 日,接近市场人士称,阿里巴巴集团已决定支持旗下芯片公司「平头哥」未来独立上市,阿里方面目前对此消息未作评论。

2025 年 9 月,央视《新闻联播》中一帧关于阿里平头哥自研芯片的报道画面引发高度关注,也让外界得以一窥平头哥的实力。报道画面显示,这款名为 PPU 的 GPU 芯片,显存为 96GB 的 HBM2e,片间互联带宽达 700GB/s,接口为 PCIe 5.0×16,功耗仅为 400W,在这些关键参数上已完全超过英伟达 A800 和主流的国产 GPU,整体性能与英伟达 H20 相当。

据外媒报道,平头哥研发的第一代 PPU 性能可匹敌英伟达畅销的 H20,而升级版的 PPU 性能则比英伟达 A100 更强。因性能优异稳定、性价比突出,平头哥 PPU 芯片在业内口碑良好,市场供不应求。(来源:新浪财经)

苹果扩大硬件主管 Ternus 职权,释放 CEO 接班人信号

近日,据外媒报道,苹果公司将设计工作纳入了硬件主管 John Ternus 的职责范围,巩固了他作为未来接任首席执行官蒂姆·库克的热门人选地位。

据悉,自 2011 年起领导苹果公司并在去年 11 月年满 65 岁的库克,在去年年底悄然任命 Ternus 负责管理公司的设计团队。此举扩大了 Ternus 的职责范围,使他接手了公司最关键职能之一。

这些职责在苹果公司具有特殊意义。这个涵盖对硬件和软件设计管理的职位长期以来由资深领导者出任。自乔布斯时代以来,苹果的成功始终与其产品的外观和使用体验密切相关。(来源:财联社)

 

宇树科技公布 2025 年销量数据

1 月 22 日,宇树科技发布了《关于宇树 2025 年销量数据的澄清》,并透露了 2025 年相关销售数据。

数据显示:2025 全年,宇树科技人形机器人实际出货量超 5500 台、本体量产下线超 6500 台。宇树同时强调,这两项数据均为该公司纯人形机器人的数量,不含双臂轮式等其他机器人产品。

宇树科技表示,过去一个月,网上流传着很多关于该公司 2025 年出货数量的不实信息,目前各种机器人形态多样,建议大家请勿把不同类型的机器人数量,直接合并在一起对比。(来源:IT 之家)

 

曝 OpenAI 成立百人团队,训练机械臂做家务

据知情人士向《Business Insider》透露,过去一年,OpenAI 悄然建立了一座人形机器人实验室。该实验室与公司财务团队同处旧金山一栋大楼内,配备了约 100 名数据采集员,正着手训练机械臂完成各类家务任务。

报道称,OpenAI 的数据采集策略,与特斯拉、Figure 等公司的机器人研发模式截然不同。后者的技术路线是,工作人员通过动作捕捉服和虚拟现实头显,记录全身动作并操控全尺寸人形机器人。

知情人士表示,OpenAI 在旧金山的实验室设有数十个工作站,实行三班倒制度,全天候不间断开展数据采集工作。摄像头会同步记录操作员和机器人的作业过程,工作人员的绩效评估标准,正是其产出的有效训练数据时长。

这种依赖外包员工、以绩效指标驱动工作的模式,与包括 OpenAI 在内的人工智能企业,早年为大型语言模型扩张数据标注业务的做法如出一辙。

学术界人士认为,许多企业都寄望于,只要采集到足够多的数据,就能将其转化为机器人的动作指令,从而实现类似 ChatGPT 的规模化效应。但这种设想,至今尚未得到实践验证。(来源:IT 之家)

 

小米集团:启动最高 25 亿港元自动股份回购计划

1 月 22 日,小米集团在港交所公告,表示公司已与一家独立经纪商签订协议,将在香港联合交易所购回不超过 25 亿港元的 B 类普通股。

该自动股份购回计划将于 2026 年 1 月 23 日开始实施,结束日期为以下最早日期:2026 年股东周年大会前一日、回购金额达到 25 亿港元或根据经纪协议条款提前终止。小米集团已申请并获得豁免,允许在限制期内进行股份购回。

公司认为,此计划将展现对业务前景的信心,并符合股东整体最佳利益。(来源:第一财经)

比亚迪李云飞:公司是黑公关黑水军最大受害者

1 月 22 日,比亚迪集团品牌及公关处总经理李云飞发文称,一直以来,比亚迪都是黑公关黑水军的最大受害者。李云飞同时表示,比亚迪公司接受媒体的批评和监督,但对于编造虚假信息、恶意造谣、诋毁攻击的黑公关和黑媒体,公司绝不容忍,将一追到底,绝不姑息。

此前,比亚迪法务部发文称,近期,就比亚迪起诉汽车博主姚*强(抖音账号「大秦军陕团」)一案,我司收到法院一审判决,判决认定被告编造并传播了方程豹汽车的虚假信息,损害了比亚迪及方程豹品牌的商业信誉及商品声誉,构成商业诋毁。判令被告向比亚迪公司赔偿 201 万元。(来源:凤凰网科技)

 

vivo 叫停 AI 眼镜项目

1 月 22 日,据 36 氪《智能涌现》报道,手机厂商 vivo 在近期叫停了 AI 眼镜项目。这一项目此前已秘密筹备半年时间,并已与歌尔、中科创达在内的多家 ODM 厂商合作 demo。

一名知情人士称,音视频、带单绿显示的 AI 眼镜方案都在 vivo 的讨论范围内,但最终尚未确定方向便被叫停。原因是,vivo 执行副总裁胡柏山在内的多位高层判断,其 AI 眼镜「在当下很难做出差异化」。

报道指出,叫停 AI 眼镜项目之后,vivo 将继续聚焦混合现实(MR)方向。(来源:智能涌现)

 

美图向全体员工发放股票奖励

1 月 22 日,美图 2026 年会现场,美图董事长吴欣鸿宣布向全体员工授予每人 1357 股的公司股票奖励。按当日收盘价计算,每名员工可获得超 1 万元的奖励。

内部人士透露,这是美图自 2016 年上市以来,第三次面向全体员工发放股票奖励。此前,美图曾分别于 2021 年和 2023 年向全体员工发放美图公司股票。与前两次不同的是,本次全员发放股票,美图股价已经从前几年的低于 1 港元涨至 8 港元以上。

按美图 2025 年 8 月财报披露的员工数量计算,此次发放的股票总价值超过 2000 万元。

美图董事长吴欣鸿在公司内部年会中表示,通用大模型在特定垂直场景下效率并不高,应用与大模型的竞争壁垒,关键在于能否拿到「这个垂直场景我最专业」的心智,解决最后一公里与长尾需求。他同时透露,美图正致力于成为一个不断产生「优质影像应用」的平台,打造更多垂直场景的影像产品。(来源:证券时报网)

 

现代汽车拟部署类人机器人,工会警告或引发大规模失业

现代汽车集团本月早些时候在 CES 展会上展示了其旗下波士顿动力公司研发的 Atlas 类人机器人,并宣布计划在 2028 年前建成一座年产 3 万台机器人的工厂。按照规划,Atlas 将于 2028 年开始在美国乔治亚州工厂部署,随后扩展到现代在全球的所有生产基地。

消息公布后,资本市场迅速作出正面反应,现代股价创下新高。但与股价大涨形成鲜明对比的是,现代工会对这一自动化计划极度不满,指责公司意在通过机器人提高利润、削减人力。

针对外界对就业影响的忧虑,现代延续了业界的一贯表述,称 Atlas 旨在减轻工人身体负担,承担具有潜在危险的工种。然而工会认为,真正的考量在于长期成本优化:一台类似 Atlas 的机器人年维护费用约 9500 美元,远低于一名普通工人的全年薪酬,而且机器人不需要病假、年假、休息时间或就餐和如厕间隙。工会指责称,这为「从长期视角最大化利润的资本家」提供了绝佳借口。(来源:cnBeta)

博主晒苹果折叠机 3D 打印模型

关于苹果将于 2026 年 9 月推出的首款折叠屏手机,目前该机的详细机身数据、核心配置及外观设计已通过供应链爆料与 3D 打印模型提前揭晓,将采用阔比例内外双屏方案,定位高端旗舰市场。

博主「数码闲聊站」晒出了基于现有爆料数据打造出的 3D 打印模型,让消费者提前直观感受到 iPhone Fold 的设计形态。

外观与尺寸方面,iPhone Fold 采用类似华为 Pura X 的阔折叠比例,折叠态机身外屏约 5.49 英寸,相比现有 iPhone 更宽更矮,单手握持时高度缩短便于操控;展开态内屏尺寸升级至 7.76 英寸,接近 iPad mini 且更为小巧。背部配备横向排列双摄,设计风格贴近 iPhone Air,整体造型简洁大气。

预计这款折叠屏 iPhone 在美国市场起售价预计在 1800-2500 美元之间,换算人民币约 1.3 万 -1.8 万元,有望成为史上最贵 iPhone 机型。(来源:快科技)

 

理想 AD Pro 4.0 升级,128TOPS 实现越级城区 NOA

1 月 21 日,理想推送了 AD Pro 4.0 版本。这个行业内首个基于地平线单征程 6M 芯片的端到端城市 NOA 方案正式交付上车。

据介绍,该方案由理想汽车主导研发,与轻舟智航共同打造,适用于城市出行场景,通过 128TOPS 算力实现越级城市 NOA 体验,搭载于理想 L 系列智能焕新版的 AD Pro 车型。(来源:IT 之家)

黄仁勋:AI 基建才刚刚开始,还要再砸万亿美金

1 月 22 日在达沃斯论坛上,英伟达掌门人黄仁勋与贝莱德掌门人拉里·芬克展开了一场长达半小时的对话。

面对华尔街最关心的「资金黑洞」问题,黄仁勋抛出了一个惊人的论断 ——「我们已经投进去的几千亿美元,只是道开胃菜。要把这套架构真正搭起来,后面还得再砸几万亿美元。」

为了解释这笔钱到底要花在哪,黄仁勋将整个 AI 体系比作一个庞大的「五层蛋糕」:最底层是能源,往上依次是芯片、云服务、AI 模型,而最上面那层才是各行各业的具体应用。要把这块蛋糕每一层都填满,现有的投入确实仅仅是个开始。

黄仁勋认为,几万亿美元正在转化为电网、芯片厂和数据中心。这就好比当年的铁路大基建。基础设施一旦铺好,属于它的时代自然就会到来。(来源:IT 之家)

当 i 人博士入职大厂,让硬核科技连接烟火人间

2026年1月22日 15:15

作者|汤一涛

编辑| 郑玄

深圳的商圈上空,多了一条并不显眼的通道,在城市楼宇间穿行。

无人机起飞、巡航、降落,配送订单。

这是一整套已经跑起来的系统:订单在地面生成,调度在云端完成,飞行器在城市低空穿行,最终把数以万计不同种类的商品,稳定地送到指定位置。

每一次的精准配送都像是物理世界与数字世界的一次精密「握手」。

对于地面上的用户来说,这只是一次「从天而降」的便利。

但对于林航(化名)来说,这些无人机意味着另一件事——作为美团无人机的系统工程师,他是团队中让设计变成实体、让飞行器在风雨中保持稳定的「大脑」。

2025 年 9 月,美团无人机在深圳开通无人机夜间配送服务

 

01

迈入真实世界

 

林航的履历是标准的「学院派」顶尖配置。本科毕业于北京航空航天大学,博士毕业于麦吉尔大学,专业都是飞行器设计。博士阶段,他的一篇论文入选了 ESI 高被引论文。每年,只有该学科被引用次数进入世界前 1% 的论文,才能获得这个称号。

摆在林航面前的路径很清晰:进入高校或研究所,继续在熟悉的学术体系里深耕。但他犹豫了。

在学校里,问题是否值得研究,往往取决于它是否足够新、足够深入。进入到企业,判断标准就变成了「能否被交付」以及「能否在真实环境中长期运行」。前者是科研,后者是应用。

最终,林航通过「北斗计划」进入了美团。

这是一项针对顶尖校园人才的招聘计划,提供完善培养机制和宽容的技术氛围。除了优渥的薪资和领先于同龄人的职级,美团最吸引林航的,是一种「技术落地」的可能性:林航在学校里的研究方向是先进航空材料,可以落地到无人机上。

作为一家使命是「帮大家吃得更好,生活更好」的公司,美团提供了丰富的技术落地场景。「每个搞研究的人,应该都希望自己搞出来的东西能被真实地用起来吧。」林航说。

但很快他发现,事情并不会按照预设路径展开。真正的问题并不是「用不用得上某项研究」,而是整个系统在现实条件下,到底卡在哪里。

后来回看这段经历,他这样概括自己的转变: 以前总觉得博士要「专」,要做细分领域的研究。到了美团才发现,博士更需要「博」,要能理解更多约束,在不同专业之间建立连接。

这种认知上的冲击,成为了他随后几年在美团无人机经历转型与飞速成长的起点。

 

02

睡在工厂里的「杂」家

 

入职初期,林航担任的岗位是力学与振动工程师,这与他的专业方向高度契合。

但随着美团无人机业务的快速发展,团队面临的挑战从「单点突破」变成了「系统统筹」。

在这个复杂的系统里,动力、控制、结构、导航……每一个方向都有足够专业的牛人。但当这些模块组合在一起时,矛盾出现了:结构想做轻,控制想做稳,导航想做准。谁来做那个权衡取舍的人?

林航被推到了台前,成为了一名「系统工程师」。

从关注一个点的「专」,到统筹全局的「广」,这种职能跨越让他一度感到迷茫,甚至觉得自己引以为傲的专业能力「cover 不住」了。

最折磨人往往是交付前夕出现故障的时候,林航形容那段时间像「过山车」:白天测试时看到希望,晚上复盘发现逻辑不通,第二天又要推翻重来。系统越复杂,故障就越难归因于某一个点,必须拆解整条逻辑链。

支撑他走过这段阵痛期的,是团队的「白盒文化」。

遇到问题时,大家并不会先讨论责任归属,而是先把问题摊开,一起把机理弄清楚。 不仅仅把故障修好(黑盒),而是要把导致故障的每一个逻辑链条都拆解得清清楚楚(白盒)。 「无人机技术团队喜欢白盒儿解决问题,从来不喜欢黑盒儿解决问题……在我们这种创新领域,是很好的一个习惯。」林航说。

有人在关键节点帮他补专业,有人愿意花时间讨论方案,也有人在决策后一起承担后果。正是这种极致务实,甚至带着点极客天真的氛围,给了林航转型的底气。他意识到:作为系统工程师,他不需要比各个领域的专家更懂细节,但他需要用博士训练出的强大逻辑与结构化思维,串联起不同的专业。

林航在工厂有自己的「铺盖卷」。2025 年下半年,他每个月有 2/3 的时间都在工厂。在产品进入生产和测试阶段后,他几乎把生活搬进了工厂。

他形容自己在那段时间里更像一个「路由器」——一端连着一线现场不断冒出来的问题,另一端连接着各个专业方向的资源和人。

这样的日子辛苦吗?当被问到这个问题时,林航下意识的反应是:「 如果那段时间我天天坐在办公室,那我肯定不是一个合格的系统工程师。 」他说,「进度推进中,重点落在生产,我就要在生产工厂;重点落在测试,我就要在测试场地。系统工程师一定要在资源投入最多的地方,资源才能高效地运转。」

在深圳龙华的美团无人机制造中心里,工作人员正在做生产测试

不是所有的博士都要去搞专业性的研究,博士也可以利用天生的一些软能力,比如逻辑思维、结构化表达和方法论去横向发展。这是林航花了很长时间想清楚的道理。

 

03

把未来,放进日常里

 

学生时期,林航的人生目标之一是出一本叫《振动与控制》的书。在传统的学科视角里,振动是硬件问题,控制是算法问题,两者往往是有割裂的。他曾希望能把这两个领域真正学通、融合。

现在,林航没有进入学术界,而是站在美团无人机系统工程师的岗位上。但某种程度上说,他已经把这本书「做」出来了。抛开对单一学科壁垒的纠结,在无人机上,他已经把振动、控制、空气动力学等「隔壁专业」熔炼成了一个严密的整体。

每当有朋友来深圳时,林航都会给他们点一单无人机外卖。

有一回,一个外国朋友和林航说,他觉得自己看到了未来。那一瞬间,林航觉得非常自豪。

林航也会去一线「拎包」。当看到医疗航线配送的医学检验样本从天而降,解决了燃眉之急时,他确信自己正在从事一项有温度、有价值的事业。

2025 年 12 月,美团在上海开通首批常态化无人机医疗配送航线

无人机配送是一条典型的「无人区」路径。它横跨技术、监管、城市环境等多个维度,很多问题在一开始就没有标准答案。

在这件事上,美团所提供的,并不仅是资源,更是一种长期有耐心的技术环境。林航反复提到的一点是,美团允许团队在真实场景中反复试错、长周期打磨,给客户提供长期稳定、安全的配送服务。

这让林航感到安心,因为工程判断可以基于真实约束,而不是被迫服务于短期目标。从一代机到四代机,系统逐渐从粗糙走向精密,从实验室走向城市低空航网。

回看从博士到系统工程师的这段经历,林航逐渐把注意力从「我能做什么」,转移到了「系统现在最需要什么」。

在学术环境中,成长往往意味着问题不断收敛,边界越来越清晰。而在真实世界里,问题几乎永远是混杂的、不完整的,甚至彼此冲突的,只能在不断交付、修正中,逼近一个可接受的解。

系统工程师的价值也在此显现:在复杂条件下持续做判断、取舍,为全局负责。

对仍在读博或刚刚走出校园的人来说,这或许提供了一种不同于传统路径的参考:世界并不只有「继续做研究」或「进入企业」的二分法,也不只有「越专越强」这一种成长模型。进入真实系统,在不确定中完成能力的迁移,也是一个解法。

这也是林航后来逐渐意识到的一点: 成长并不总是来自更深的专业壁垒,有时恰恰来自对复杂性的正面迎接,在更大的系统中做判断、做取舍、承担结果。

回过头来看,林航认为「北斗计划」在这一过程中扮演了至关重要的角色。

首先是身份上的确信。对于一个刚毕业的学生来说,「北斗」不仅是一个 title,更是一种被肯定的心理暗示——基于你的能力和潜力,你可以去挑战更难的问题。

更实质性的帮助,在于它打开了一条通往「顶层视角」的通道。林航记得,入职早期,他就有机会与业务负责人和人事负责人进行定期的一对一沟通:「它帮助我很好地用顶层视角来看一些东西,我觉得这个也很重要。」

林航坦言,「北斗」计划使他在职业道路上获得了可贵的成长资源,同时也受到很多人的关注。这种高关注度既是压力,也是一种巨大的激励,将他更快地推向了核心战场。

在林航看来,目前的无人机配送只是一个开始。站在技术的演进节点上,还有更广阔的探索空间:随着大模型以及具身智能的爆发,物理世界与数字世界的「握手」也将变得更加紧密。

对于林航和他的团队而言,愿景始终未变:他们希望通过不断的探索,让无人机从「科技奇观」变成日常生活的一部分。让那个曾经只存在于科幻小说里的未来,降临烟火人间,服务每一个用户的真实需求。

当一个人的生活,完全「跑」在 Claude Code 里,会发生什么?

2026年1月22日 15:12

作者|金光浩

编辑| 靖宇

 

每天早上睁开眼,Molly Cantillon 会先打开电脑,检查 8 个 Claude 实例交上来的「工作汇报」。这些 AI 每天晚上都在跑任务,有的在监控她的订阅账单,有的在分析社交媒体数据,有的在追踪一些人的股票交易记录。

Molly Cantillon 首页|图片来源:X

 

过去一个月, 这套系统自动帮她追回了 2000 美元的订阅费用 。这些钱来自她早就忘了取消的订阅服务,科技公司利用这一点每个月悄悄扣款,而她自己根本没注意到。

Molly 是斯坦福毕业的技术极客,但她形容自己使用 Claude 的思路其实很简单: 「我只是把 Claude 当成了 8 个不用发工资的员工」。

看到这,你一定很好奇,一个人如何同时运转 8 条业务线,还能让 AI 帮你躺着赚钱?

 

01

把生活拆成 8 条业务线

 

Molly 的系统把生活拆成 8 个「业务线」,每条线配一个专属 Claude。

她搭建这一切的思路很直接:每个人的生活都由几个核心模块组成,工作、健康、财务、社交、学习……这些模块各有各的规律,各有各的重复性任务。

Molly 做的,就是给每个模块配一个专职「员工」

Molly Cantillon 的观点分享|图片来源:X

 

她的 8 个实例的分工是这样的:

产品 Claude 负责管理她的 side project 的开发进度,每天汇报哪些功能该推进,哪些 bug 需要修复。增长 Claude 自动监控社交媒体数据,追踪哪些内容表现好,哪些话题值得跟进,还会生成下一步的内容建议。健康 Claude 接入了她的 WHOOP 手环数据,追踪睡眠、运动和恢复状态,每周给出调整建议。

交易 Claude 负责帮她盯着银行账单和订阅服务,一旦发现不合理扣费就自动发起退款申请。写作 Claude 帮她处理日常文字工作,起草邮件、整理笔记、生成周报。还有三个 Claude 分别负责个人事务、指标追踪和每日摘要。

这套系统能自动跑起来之后,产出的效果完全超出了她的预期。

比如开头提到的 Claude 帮她追回 2000 美元的订阅费,这还只是开始。 写作 Claude 把她从邮件里解救出来,能自动帮她处理并回复所有的邮件。

更有趣的是,交易 Claude 干了这样一件事:

它每天凌晨自动抓取有影响力的人的股票交易披露、对冲基金持仓变化。然后结合 Polymarket 赔率、X 上的情绪、她关注的公司财报,生成一份投资简报。

前段时间,交易 Claude 发现投资人在大量买入 Netflix 股票,于是判断这可能意味着流媒体板块有利好,跟进了同赛道的华纳兄弟。三周后,相关交易公布,华纳兄弟股价应声上涨。

Molly Cantillon 用 Claude code 实现时间管理|图片来源:X

 

8 个实例的运行方式也非常有趣:

它们在后台并行运转,各自独立工作,通过文件系统交换信息 。当某个任务需要跨模块协作时,会通过明确的「交接」机制传递上下文。它们读写本地文件,当 API 不可用时,甚至会直接操作桌面,模拟鼠标和键盘来完成任务。

Molly 用命令保持系统不休眠,让她的 AI 团队可以在机场、在她睡觉时持续运行。任务完成后,系统会给她发短信,她直接回复就能继续下一步。

Molly 自己说过一句话,很能概括这套系统的本质: 「 突然之间你能同时出现在数十个地方,用一千个 AI 分身管理自己的生活。 」

Molly Cantillon 的观点分享|图片来源:X

 

情况确实如此,我们可以简单算一下:8 个 AI 实例 24 小时运转,相当于每天 192 个小时的「工作时间」,这便使得一个人可以拥有一个小型团队的处理能力。而这个团队,还可以无限扩张。

你一定会很惊讶:当 AI 开始 24 小时替你工作,「时间管理」这件事,是不是已经不存在了?

 

02

当 AI 比你更懂你

 

是的,当 Claude 比你更清楚你的生活时,「时间管理」这件事,就不再是一个人的战斗了。

传统意义上的时间管理,要求你得自己记住所有事、安排所有事、执行所有事、还要复盘所有事。这套模式对意志力和注意力的消耗极大,对于大多数人而言,往往只能坚持几周。

但 Molly 的模式完全不同。 她只负责做决策,AI 负责记忆、安排、执行和反馈。

她不需要记得自己订阅了哪些服务,交易 Claude 会替她记住。她不需要手动整理健康数据,健康 Claude 会自动汇总成可执行的建议。她甚至不需要盯着市场动态,因为每天早上醒来,电脑里的/trades 目录里已经躺着一份分析简报。

一种新的自我管理方式|图片来源:nanobanana-pro

 

这两种模式有本质的不同: 前者是一个人死磕所有事,后者是一个人指挥一支团队。

这带来一个有点残酷的现实:会用 AI 的人和不会用的人之间,效率差距正在加速拉开。

关键不是你会不会写代码,而是 你愿不愿意把生活当成一个可以系统化运转的东西 来设计, 并愿意信任和放权给 AI

Molly Cantillon 的观点分享|图片来源:X

 

03

普通人能成为 Molly 吗

 

那么问题来了:普通人能复制这套玩法吗?

答案是有可能,但 需要先改变一个我们惯用的思维习惯

大多数人使用 AI 的方式是「我有个问题,让 AI 帮我解决」。这样是把 AI 当成一个更聪明的搜索引擎,或者一个随叫随到的助手。但 Molly 的思路不一样。 她的问题是「我的生活有哪些部分可以被系统化」。

Molly Cantillon 的观点分享|图片来源:google doc

 

这个思维转换很关键。

首先,我们需要梳理出自己的「生活场景」。工作、健康、财务、社交、学习、家庭事务……每个人的生活都由这些模块组成。把它们列出来。

然后,识别这些场景里有哪些「可以被 AI 化」的环节。比如,在每个模块里,哪些事情是你反复在做的?哪些事情有明确的规则可循?哪些事情需要持续监控?这些环节,就是 AI 可以接管的地方。

具体怎么让 Claude 接管呢?

现在的 Claude Code、Cursor、Trae 这类工具,本质上是一个可以调用你本地任意数据和文件的超级 agent。

你可以 把生活的经验变成一个「Claude Skill」 。然后写一个指令,让 AI 学会这套流程,以后自动执行。

举个简单的例子,我们可以让 AI 当我们的日常教练:自动帮我们整理微信和邮件消息,按紧急程度排序,生成「明日待办」清单。我们可以每周汇总执行数据,让 AI 结合上周的目标完成情况,给出我们下周的调整建议。

你不需要一开始就搭建 8 个实例的复杂系统。先从 1 个开始,找到你生活中最「痛」的那个点,让 AI 先解决它。体验到价值之后,再慢慢扩展。

听起来还是有门槛?

其实没有那么复杂。Molly 的父母就是这样开始的。

Molly 在圣诞节期间教他们用命令行,而他们从来没离开过 Microsoft 的舒适区。当然,Molly 一开始没有跟他们说他们需要学一门技术,而只是对他们说:「你用最简单的英语输入想发生的事,然后 AI 就会让一切发生」,她的母亲尝试了下,盯着屏幕,仿佛见证魔术。几天后,他们已经在用这套系统管理她父亲的应收账款了。

二十年来,软件让他们觉得自己很笨。但现在,他们第一次觉得电脑在听自己说话。

如果你完全不懂技术,可以从这三步开始:

1、 先找到一件你每周都要重复做的事

2、下载安装 Claude Code 或者国产版的 Trae,你把这件事的完整流程写清楚,让它们帮你生成一个 Skill。

一个用 AI 实现的自动化项目举例|图片来源:极客公园

 

3、 每次需要做这件事时,把材料丢给你的 AI agent,让它按指南执行 。更进阶的,可以研究如何让它完全自动化运行,这样你也可以拥有一个 24 小时帮你执行任务的 AI 团队。

总之还是那句话:先跑通一件事,再考虑自动化。

 

04

正在发生的趋势

 

Molly 这套玩法听起来像一个有趣的个人实验。但有意思的是,她的思路正在被行业验证。

就在最近,Anthropic 官方发布了一个几乎一样逻辑的系统:Cowork。

简单来说,Cowork 是能管理个人电脑的个人助手,一句话就能帮你整理电脑上所有的文件。

它的设计逻辑正是让多个 Claude 实例协同工作,像一个团队一样运转。

这说明 Anthropic 似乎也在押注这个方向: 个人用户可以拥有自己的 AI 团队,7×24 小时替自己处理生活和工作中的琐事。

一句话通过 Cowork 整理文件的视频|视频来源:X

当然,Molly 也提到了这套系统的风险。

当你的整个生活都运行在一个 Claude Code 目录里时,你会感受到一种矛盾的变化:

「让 AI 帮你在夜里打工」的诱惑是巨大的,但代价是隐蔽的。AI 将接管你的所有隐私,你不得不交出那些只属于自己的东西。

这是一种微妙的平衡: 你把越多事情交给 AI,效率越高,但对 AI 的依赖也越深。

对此,她的建议是鼓励大家尽早熟悉 AI,但要小心别被 AI 掌控。

 

05

一种新的生活方式

 

过去,我们谈论「时间管理」。 现在,或许该谈论「AI 管理」了。

当你的 AI 比你更了解你的账单、日程、健康指标、投资目标时,你要做的已经改变了。 传统的时间管理本质是一种「精力管理」,把高质量精力放在高价值的任务上,把低谷时段留给娱乐和休息来恢复能量。

但现在,一切都正在变成 「AI 管理」 ,把该丢给 AI 做的任务丢给 AI,把剩下的任务、多余的时间留给自己。

这不是说精力管理不重要,而是说精力管理的形态在变化。你的精力可能不再用于亲自完成每一项任务上,而是拿出部分的精力来,学会给 AI 设计系统、分配任务,以及审核结果。

我们的角色也发生了变化,不再是执行者,而变成了 AI 的管理者, 我们来到一个「人人都是 AI 的管理者」的年代。

Molly 的故事听起来很超前,但它正在变成越来越多人的日常:

Anthropic 前两天发布的《人类经济指数报告》显示,人们对 Claude 的使用,正在从对话转向自我的任务管理。

用户更倾向于让 Claude 持续跟进同一个任务(Task Iteration),而不是单次问答。

2025 年 8 月(V3)和 11 月(V4)用户使用意图变化|图片来源:Anthropic

 

几年后回头看,今天可能就是那个分水岭:一部分人开始用 AI 运营自己的生活,另一部分人还在用传统办法跟时间管理较劲。

差距不会一夜拉开,但它每天都在累积。

每天早上醒来,AI 已经替你做了多少事?

这个数字,可能比你的努力程度更能决定你的未来。

在 WAIC UP!2026 上,我看到了 AI 的当下与未来

2026年1月22日 14:56

作者| Moonshot

编辑| 郑玄

上周末的香港,当香港特首李家超的视频致辞出现在 2026 WAIC UP!全球年终盛会的现场屏幕上,当创新科技及工业局局长孙东等政府高层悉数到场时,信号已经足够清晰:AI 早已超越了创投圈的热词范畴,它被抬升到了城市战略与公共基础设施的高度。

香港特首李家超为大会开幕致辞|图源:WAIC UP!

 

从地缘战略的尺度看,这场盛会也是内地与香港在 AI 版图上的一次「历史性握手」。

对于内地而言,这是 WAIC 这一顶级产业 IP 首次「南下」,标志着长三角成熟的 AI 产业实践正在借道香港,与大湾区的产业链完成深度咬合,将内地积累的技术红利,通过香港这个放大器,转化为实打实的国际影响力。

而对于香港,2026 WAIC UP! 是对国家「十五五」规划最生动的回应。

在「十五五」规划明确支持香港建设国际创新科技中心及国际高水平人才枢纽的背景下,香港正在重新定义自己:不仅是资本的港湾,亦是内地技术出海的「出海口」,更是未来构建数据主权与公共 AI 基建的试验田。

与此同时,会场里弥漫的情绪也发生了微妙的变化。大家不再追问「你的模型有多大」,而在盘算「推理成本降了多少」和「落地良率有几成」。

硅谷人工智能研究院创始人皮埃罗·斯加鲁菲(Piero Scaruffi)在开场时用了一个精准的历史类比:我们正处在一个「技术融合」的前夜。就像当年的印刷术诞生,代表的不仅仅是某项单一技术的突破,而是造纸、冶金、机械等多种技术在特定历史节点的交汇。

2026 年,大众对生成式 AI 已经「祛魅」,大家更期待 AI 能从「单一模型」向「复杂系统」进化,正式进入技术的深水区。

本文将基于 WAIC UP!2026 一天的精彩演讲,从工作流重构、科研范式跃迁、物理世界突围、AI 的控制权之争与底层逻辑五个维度,站在 2026 年,审视当下和未来的 AI。

 

01

工作流的「权力让渡」

 

「未来五年,人类的角色将发生根本性位移:从执行者(Doer),变成管理者。」

这是硅谷创投教父史蒂夫·霍夫曼(Steve Hoffman)在 WAIC UP! 上抛出的第一个论断。

霍夫曼敏锐地指出,Anthropic 等巨头之所以死磕 Coding(编程)能力,并非为了让程序员少写两行代码,而是为了一个更具颠覆性的目标:让 AI 具备自我进化的能力。

未来的 APP 将不再是静态的死物。当你需要一个新功能,AI 会当场为你写出代码并部署。

在这个逻辑下,软件的定义被改写,人类不再是功能的「使用者」,而是需求的「提出者」。

硅谷创投教父 Steve Hoffman 在场分享,图中为他已出版的著作|图源:WAIC UP!

 

霍夫曼还展示了一款 AI 营销 Agent,只要给它一个亚马逊产品链接,它就能自动搞定从文案撰写、海报设计到多平台投放、效果优化的全流程。

更夸张的是销售领域,一款 AI 应用可以实时监听销售电话,通话结束后立刻给出话术建议,使用它的销售人员收入直接增长了 70%。

这种权力的让渡甚至发生在招聘环节。硅谷初创公司 Gecko 开发的 AI 面试官,已经接管了招聘的第一道关卡。它通过分析候选人的微表情、语调和回答逻辑,直接给出「通过」或「淘汰」的建议。

很多求职者可能还没见到真人 HR,就已经被算法决定了命运。

图源:WAIC UP!

 

更有意思的是随之而来的「信任悖论」。

在 Google 的一项测试中,病人竟然觉得 AI 医生比真人医生更「诚实」,甚至更「在乎」自己。这听起来很讽刺,在极度追求效率的人类社会,AI 能够提供的「稳定情绪」和「秒回关注」,竟然成了一种稀缺的温情。

无论是专业技能,还是情绪服务,AI 都在以一种「超级雇员」的姿态重塑劳动力标准。

2026 年之后,劳动力的定义将被彻底重写。未来的核心竞争力,不再是你掌握了多少技能,而是你是否具备「判断力」。在这个新体系下,你不需要知道怎么把墙砌得平整,但你必须精准地指出墙该砌在哪里。

职场的护城河,从「手艺」变成了「决策」。

 

02

当科学发现被加速 100 万倍

 

在香港城市大学首席人工智能总监马维英教授的演讲中,我们看到了科研领域的「摩尔定律」时刻:我们正从「数据密集型科研」跨越到「智能体科学(Agentic Science)」时代。

过去十年,科学家们忙着把实验数据数字化,这就是所谓的「第四范式」。但 2026 年的科研现场已经变了,AI 不再仅仅是处理数据的工具,它开始像科学家一样思考、假设、实验和反思,这既是被称之为科学智能的「第五范式」。

在药物研发领域,马维英团队发表在《Science》上的 DrugCLIP 技术,将药物筛选的速度提升了整整 100 万倍。这 100 万倍是实打实的数学事实,不是修辞手法。

AI 正在成为「科学家」|图源:WAIC UP!

 

以前做药物筛选可能要数月甚至数年,现在就像在谷歌搜索一样快。在蛋白质设计中,AI 设计的 6 种突变体,其性能全部优于自然界原本的野生型(Wild Type)。

而在基因分析领域,上海 AI 实验室与南京大学合作的项目,能将原本数小时的工作压缩到 100 秒。

马维英在现场说了一句极具极客感的话:「你还没来得及喝完一杯咖啡,AI 已经把报告写好了。」

这种加速的本质,是 AI 拥有了「经验」。

AI 已经有了「前向学习」的能力|图源:WAIC UP!

 

现在的 AI 科学家不再是每次从零开始计算的机器,它们具备了「经验回放(Experience Replay)」和「前向学习(Forward Learning)」的能力。

就像一位经验丰富的老专家,AI 能够记住过去的成功与失败,形成一种可被调用的「直觉」。

更可怕的是,这种「直觉」是可以共享的:一个模型学到的经验,可以直接继承给另一个模型,实现了知识的指数级积累。

目前,港城大的 3000 名博士生已经开始全面使用 SciencePal 这样的 AI 科研助手来完成作业和研究。这也预示着一种全新的科研物种正在诞生:未来的科学家将是「人类+AI」的共生体。

在第五范式里,AI 负责在 100 万倍的加速中寻找答案,人类负责决定去哪里寻找,去定义那个「值得解决的问题」。

科研也将从人类顶级大脑之间的智力博弈,变成对算力和 AI 智能体的调度游戏。

 

03

AI 的物理突围:具身智能

 

当数字世界的「大脑」进化到极致,AI 开始渴望一副「身体」。这是 AI 下半场最大的增量,也是最难啃的硬骨头。

在穹彻智能联合创始人卢策吾教授的演讲中,具身智能的困境显而易见。

最大的拦路虎是数据。互联网上虽然有数万亿的文本和图片,但物理世界的数据无法像文本那样自然流淌。对于一个需要在复杂环境中行动的机器人来说,物理世界的复杂度远超数字世界,学术上定义的环境不确定性甚至高达 80% 以上。

这意味着,仅靠「喂数据」是喂不出一个能帮你在厨房做饭的机器人的。破局的关键,在于构建一个真正的「世界模型」。

卢策吾指出,传统的模仿学习往往停留在像素级,不仅成本高昂,而且泛化能力极差。2026 年的具身智能,正在转向基于「概念基因(Concept Genes)」的理解路径。

卢策吾教授认为,具身智能的发展还需要更多物理世界的信息|图源:WAIC UP!

 

这就好比人类教孩子认门,不是让他死记硬背全世界所有门的图片,而是让他理解「门把手」的功能结构和操作逻辑。一旦掌握了这种底层的物理规律,机器人就能举一反三。

为了补齐数据拼图,「口袋采集(Pocket Collection)」应运而生。就像当年爆火的 Pokémon Go,利用分布式智能终端,让全社会参与到物理数据的采集中来。

而当 AI 的「大脑」开始觉醒,它需要一副足够便宜且强壮的「身体」。

史蒂夫·霍夫曼在现场给出了一个极具商业穿透力的判断:中国之所以能引领机器人浪潮,核心在于「无可匹敌的供应链」。当世界模型的认知能力遇上中国制造的成本优势,人形机器人将有机会像家电一样普及。

在 WAIC UP! 的现场也能看到这种进化的结果:在演示视频中,机器人能精准运控一个 30 多厘米的球体,甚至能拿着锋利的刮胡刀给自己刮胡子。这些动作背后,是 AI 具备了类似生物的「下意识」和「手感」。

具身智能的觉醒,标志着 AI 终于走出了屏幕,走进了现实世界。

 

04

AI 的控制权战争

 

商业竞争的逻辑变了。巨头们争夺的不再是 App Store 排行榜上的位置,而是「AI 时代的运营商资格」。

史蒂夫·霍夫曼将这场战争形容为「控制权之战(Battle for Supremacy)」。

先看 OpenAI 的野心和布局:通过 Groups 功能切入社交,试图重构人与人的连接;通过直购功能切入电商,意图成为新的流量分发中枢;挖角苹果团队布局可穿戴设备,试图接管硬件入口。

它的目标是成为互联网的「网关」,控制你的社交、购物乃至所有对话。

这解释了为什么亚马逊要封锁数据,甚至考虑起诉;也解释了为什么腾讯和阿里要联手阻击 AI 手机的发展。因为一旦 AI 接管了用户意图的解释权,传统 APP 将失去入口,沦为底层的「内容供应商」。

AI 公司之间的「军备竞赛」|图源:WAIC UP!

 

但在硅谷的宏大叙事之外,商业与产业圆桌展示了另一番景象。在大而难倒的巨头之外,对于大多数企业而言,活在当下比仰望星空更重要。

AI 商业化的「最后一公里」,在于「工程化稳定性」和「推理成本」。换言之,只有技术是不够的,还要算得过账。

根据圆桌讨论的共识,2026 年后的赢家将呈现两极分化: 一类是构建最深层生态系统的企业,它们连接开发者、行业与消费者,做厚底座。

另一类则是像西井科技、海尔卡奥斯这样的垂直领域专家,它们不讲大模型的故事,而是把 AI 嵌入到港口、工厂的每一个具体流程中,把工程化做到极致。

然而,商业巨头的垄断是 AI 的唯一终局吗?香港科技大学首席副校长郭毅可院士提出了另一种可能:「主权 AI(Sovereign AI)」。

郭毅可院士分享香港政府如何用 AI 普惠于民|图源:WAIC UP!

 

AI 不一定非要掌握在商业巨头手里,它完全可以像电力、道路一样,成为一种公共基础设施。在香港,政府正在尝试建设统一的数据主权、模型主权和算力主权。

这不仅仅是一种假设,它已经在悄悄落地。像像郭毅可院士团队推出的「港话通」就是一个典型的非商业化 AI 实践。它直接接入城市数据底座,为市民提供公共法律咨询,甚至辅助处理公务。

这种「主权 AI」的实践,打破了商业资本对数据的绝对垄断,也让技术回归到公共价值的本位。

这或许是 2026 年,除了商业战争之外,最值得我们关注的文明变量。

 

05

AI 发展的底层逻辑:物理学

 

近年来,科技圈有个很有意思的现象:各大巨头卷大模型、卷芯片,卷到最后猛然发现,限制 AI 上限的竟然是电力。当数据中心像吞金兽一样吞噬电网时,我们才意识到,哪怕最科幻的智能,最终也要撞上最基础的物理墙。

同样的逻辑,正在 AI 的底层进化中发生。

在喧嚣的应用层和商战之外,硅谷人工智能研究院创始人皮埃罗·斯加鲁菲(Piero Scaruffi)给出了一个极为冷峻的判断:别再执着于让 AI 模仿人脑了,AI 的未来属于物理学。

这听起来有点抽象,但其实很好理解。很多年来,我们都以为 AI 是在模拟神经元,是在造一个「硅基大脑」。但皮埃罗指出,这是一个美丽的误会。现在主流的 AI 模型,本质上是在用数学和物理公式来暴力破解智能。

比如让我们惊艳的文生图、文生视频模型,它们背后的扩散模型,其数学原理其实源自物理学中的「扩散过程」(就像一滴墨水在水里散开 )。

所以 AI 不是在「想象」画面,它是在用物理方程计算,如何把一堆毫无意义的噪点(墨水),逆向还原成一张清晰的照片。

皮埃罗认为,AI 并没有遵循神经科学去模仿生物大脑,它是在用微分方程和概率密度函数,以数学的方式「逼近」智能这个结果。

既然软件逻辑是物理学的,那么硬件底座也必须升级。

当摩尔定律撞上物理极限,传统芯片即使堆得再多,面对指数级增长的计算需求也显得力不从心。

而在「前沿科技圆桌」上,科学家们给出了 2030 年后的解法:量子计算。

前沿科技圆桌上,AI 行业领军者们在讨论 AI 的未来|图源:WAIC UP!

 

如果说经典计算是在用算盘的速度跑马拉松,量子计算就是直接坐上了火箭。它提供的指数级算力,将是 AI 继续突破物理墙的唯一梯子。

所以,2026 年以后的 AI 竞争,表面看是拼模型,底子里拼的其实是电力、物理学和量子力学的储备。

 

06

最后的护城河:

人类主体性的再觉醒

 

当科研被加速 100 万倍,当执行工作被 AI 代理全面接管,一个终极问题摆在了所有人面前:人类还剩下什么?

在大会特设的「青年观察家」圆桌中,宇宙学者、艺术家与教育者们给出了一份不同于技术视角的答案。

当我们将视线投向星际尺度,会发现 AI 再强大,也只是处理信息的工具,而人类拥有仰望星空的冲动;当讨论回归艺术本质,AI 可以通过概率生成无数张完美的画作,但只有人类能赋予作品以「痛苦」与「爱」的意义。

而在「校长圆桌」的讨论中,嘉宾们给出了一个关于未来的答案:要做 AI Native(原生),不要做 AI Dependent(依赖)。

图源:WAIC UP!

 

人类最后的护城河,不在于比拼「执行」的效率,因为在物理学定义的智能面前,碳基生物的计算能力不值一提。我们的价值,在于那些机器无法计算的领域:「审美能力」与「提问能力」。

正如圆桌嘉宾所言:「AI 可以生成无数种方案,但只有人类能判断什么是『好的』。」

这种对优劣、美丑、善恶的判断力,是机器无法通过概率计算得出的。同样,AI 擅长回答问题,但定义「什么问题值得解决」,依然是人类独有的特权。未来的核心竞争力,是管理 AI 的能力。

2026 年的香港,WAIC UP! 大会主题定为「WAKE UP MORE」,除了对技术的呼唤,更是一次关于文明方向的深省。

而特首李家超在致辞中的一句话,或许是对这一主题最好的注脚:

「我们必须善用 AI 的力量,不仅为了创新,更要致力于构建更具包容性的经济体系、更有韧性的社会共同体,以及为全人类创造更可持续的未来。」

这正是我们面对技术洪流时应有的姿态:AI 越强大,越倒逼着我们去寻找作为「人」的意义,越要「WAKE UP MORE」,完成人类主体性的集体再觉醒。

一句话让 AI 生成手绘风可编辑图表!这个开源项目让我玩上瘾了|AI 上新

2026年1月22日 14:52

作者| 金光浩

编辑| 靖宇

最近在社群里看到一张图,我足足盯着看了半分钟。

那是一张课程总结图,第一眼看着就很喜欢,有种淡淡的真人手绘的「松弛感」:

线条微微颤抖,字体像随手涂鸦,看着就是极其舒服,像老朋友在草稿纸上给我讲逻辑。

我当时立马私信问他用的什么工具,他说是 Excalidraw。

朋友用 excalidraw 画的图|图片来源:excalidraw

 

这个产品我听说过,是一款开源白板工具,在 cursor 里就能用这个插件。

但问题来了:工具有了,我并不知道怎么画出那种效果,甚至连这种图叫什么都不知道。

一个念头瞬间击中我: 既然 AI 能画画,能不能动动嘴,让它把这种「草图」也给画了?

我立刻打开 Deepseek,给他搜索关键词:「AI + Excalidraw」。

没想到,还真被我挖到了一个 github 的开源项目:smart-draw。

它的核心逻辑简单粗暴: 你只管说话,它负责画画,而且画出来的,是可编辑的 Excalidraw 源文件。

试用了一周,我发现自己上瘾了: 我几乎每天都用它画点什么。


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: AI 时代的「4399」!我只用十五分钟做出了《技能五子棋》|AI 上新 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信


 

 

01

它到底解决了什么问题?

 

在聊这个项目之前,我想先说说我之前用过的几个「AI 生图」方案,以及它们各自的痛点。

第一类是 AI 生图大模型,比如最近爆火的 Nanobanana-pro。

不得不说,Nanobanana-pro 这类顶尖大模型生成的图确实美,配色专业、排版讲究。

但它们有一个致命的死穴: 生成的图是「尸体」。

简单来说,他们生成的图,就是一张压平的 JPG/PNG。如果你想微调一个节点位置?想改错一个字?抱歉,做不到。你只能像抽盲盒一样重新生成,祈祷下一次 AI 能听懂人话。把原图给到他能增加成功率,但还是需要花很长的时间抽卡。

这就是 AI 生图模型最大的问题:可控性和完成率比较差,用户往往 90% 都挺满意,就差 10% 想微调,结果改不了,只能重新生成,带来用户时间和使用成本的上升。

比如下面这张图,结构挺好,但如果我想调整某个分支的位置,抱歉,做不到。

nanobanana-pro 生成的决策流程图|图片来源:nanobanana-pro

 

第二类是大模型生成的 mermaid 流程图。

以豆包、Deepseek 为代表的 AI 助手,它们现在都支持生成 mermaid 格式的流程图。

它们生成的图可以导出成 SVG 或者 Mermaid 代码,是可以放到专业的工具里二次编辑的。

deepseek 生成的决策流程图|图片来源:deepseek

 

但问题是,它们生成的图,怎么说呢,「工业味」太重了。

豆包生成的决策流程图|图片来源:豆包

 

字体线条横平竖直,节点大小一模一样,配色永远是蓝紫灰三件套。

这种图拿来做内部文档可以,但如果你想发到社交媒体上、或者放到演讲 PPT 里,总觉得差点意思。

而这个项目,刚好补上了这两类问题的缺口。

它生成的是 Excalidraw 格式的图表,手绘风格、视觉友好;同时因为是 Excalidraw 原生格式,你可以直接在 Excalidraw 里打开,随意拖动、修改、增删任何元素。

换句话说, AI 帮你完成了 95% 的工作,剩下 5% 的微调你可以自己动手。

这个项目的本质是什么呢?说白了,它就是封装了一套专门针对「绘图」的提示词工程。

你只需要会用自然语言表达你的想法,它会把这些想法翻译成 Excalidraw 能理解的结构化指令,然后渲染成图。

smart-draw 生成的决策流程图|图片来源:smart-draw

 

 

02

玩法一:问一句话,让 AI 给你画出来

 

我第一次真正感受到这工具的好用,是在琢磨一个概念的时候。

当时我在想: 都说 AI 时代「审美」最重要,但到底什么是审美?

这个问题说起来很虚,你让我写一段文字解释,我可能能写个几百字,但总觉得不够直观。

于是我试着把这个问题丢给这个项目:「什么是审美」

大概等了十几秒,一张图就生成出来了。

smart-draw 生成的图|图片来源:smart-draw

 

可以看到,它生成的是一张手绘风格的思维导图,顶部是「审美」两个字,下面延伸出四五个分支,每个分支下面还有下一级节点。配色是偏暖的奶油色调,看着很舒服。

最关键的是,这张图我可以直接在 smart-draw 里打开编辑,如果我觉得「审美客体」这个节点的位置不太对,直接拖一下就调好了。

这不就是「思考可视化」最低门槛的方式吗?

以前我们说「画图帮助思考」,但前提是你得会画图。

现在有了 AI,你只需要把脑子里模糊的想法说出来,AI 帮你画出来,然后你再根据这张图继续思考、继续迭代。

思考和表达之间的门槛,一下子低了很多。

 

03

玩法二:输入技术描述,生成架构图

 

第二个让我惊艳的场景是画技术架构图。

正好有个朋友问我:「你说的 smart-draw 那个项目,它自己是怎么实现的?能帮我画一张架构图吗?」

我把 Cursor 分析出的项目架构直接喂给它,它生成的图,比我自己画的图强太多了。

smart-draw 生成的图|图片来源:smart-draw

 

四个主模块用不同颜色的矩形框出来,模块之间用带箭头的连线标注了数据流向,每个箭头旁边还贴心地写了「用户指令」「发起 fetch」「SSE 响应」这样的标签。

最妙的是,整张图的布局非常均衡,不会出现那种「左边挤成一坨、右边空荡荡」的尴尬情况。

我特意问了一个做技术的朋友,他看了之后说:「这图拿来做技术分享完全够用了,而且这种手绘风格反而不会让非技术人员感到有距离感。」

后来我又试了几次,发现只要你把技术描述写清楚,它生成的架构图基本都能达到「可以直接用」的水平。

当然,如果有些细节不满意,直接在 Excalidraw 里改就是了。

 

04

玩法三:输入一篇文章,秒变知识卡片

 

第三个玩法是我现在用得最多的:把文章/博客转成知识卡片。

做自媒体的朋友都知道:图不美,文白写。

但很多时候我们写完文章,还得花大量时间去做一张配图。

这个项目给我提供了一个新思路:

直接把文章内容粘贴进去,让 AI 帮我提炼核心观点,然后生成一张知识卡片。

我试过把一篇 3000 字的小宇宙播客内容丢进去,然后它很快帮我生成了一张核心思想图。

这张图直接发到即刻或小红书,阅读量不会差。

更关键的是,因为是可编辑的格式,如果我觉得某个观点提炼得不够准确,直接改就行,不用重新生成。

smart-draw 生成的图|图片来源:smart-draw

 

 

05

玩法四:和 Nanobanana 工具组合

 

如果你觉得这已经够用了,下面这个进阶玩法可能会让你更兴奋:

1、先用这个项目生成一张 Excalidraw 草图,把核心结构定下来。

2、然后把这张图导出成 SVG。

3、再丢到 Nanobanana-pro 里,让它做一次「美颜」。

这样出来的图,既有整体元素立体的结构感,又有专业设计工具的精致感,简直是两全其美。

smart-draw 生成的图|图片来源:smart-draw

nanobanana-pro 优化后的图|图片来源:nanobanana-pro

 

说白了,这个项目用 AI 解决的是「想法到图形」这一步的效率问题。

至于图形之后你想怎么用,完全可以自由发挥。

以上四种玩法,基本覆盖了我日常最常见的画图场景。

 

06

这个项目给我的启示

 

玩了几天之后,我开始琢磨:这个项目为什么能打动我?

说实话,从技术实现来看,这个项目并不复杂。它没有训练什么惊天动地的模型,也没有发明什么新的算法。

它本质上是一个 Wrapper(套壳)。

在很多人眼里,「套壳」是个贬义词,意味着没有核心技术壁垒。

但在这个项目上,我看到了「套壳」的真正价值: 它解决的不是「能力」问题,而是「接口」问题。

画图的能力,Excalidraw 早就有了;理解语言的能力,GPT-4 早就有了。但普通人想把这两者连起来,中间还差一个翻译层。

普通人要想跨越这道鸿沟,要么得去学复杂的 Prompt 让 GPT 生成代码,要么得去学 Excalidraw 的快捷键一点点画。

而这个项目的开发者,他把这些粘合在了一起。

当粘合之后,一些神奇的玩法,随产品的创造「涌现」了出来。

比如,这个项目通过对架构提示词的封装,让许多不懂技术的普通人,一下子都拥有了创造架构图的能力。

 

07

回到用户,找到痛点

 

不得不说,这个项目的作者确实解决了一个真实的痛点。

而这个痛点,正好是很多人每天都在面对的。

这给我一个很大的启发:

我们总是盯着「造大模型」或者「做超级 Agent」这种宏大的叙事。

但实际上,用户最真实的痛点,往往隐藏在那些「断裂」的工作流之间。

写完文章想配图,这就是一个断裂点。

看完长文想总结,这就是一个断裂点。

脑子里有想法想变成 PPT,这也是一个断裂点。

谁能用最顺滑的方式把这些断裂点接上,谁就能赢得用户。

哪怕你只是一个「套壳」,只要你套得足够优雅,足够懂用户,你就是不可替代的。

AI 时代的创业,不是比谁的技术更厉害,而是比谁能更快地找到一个痛点、然后用现有的工具把它解决掉。

smart-draw 生成的本段的总结图|图片来源:smart-draw

 

 

08

AI 带来的小确幸

 

在这个 AI 项目层出不穷的时代,我们很容易产生审美疲劳。

我们每天都在看新模型刷榜,但真正能让我们愿意留在电脑前,玩上一整天,并且真的想把它加入工作流的东西,其实并不多。

这个小项目之所以打动我,是因为它很懂用户在用 AI 画图这个场景,真正需要什么:

它知道我懒得学画图,但又想对结果有掌控感,还对审美有点小要求。

如果你也苦于画图,不妨去试试。

有时候,这种解决具体小问题的工具,比那些改变世界的大模型,更能提升我们的幸福感。

而这种幸福感,往往不是等来的,是自己 「主动」 找来的。

我找到这个项目的过程,不就是始于一份想要用上好工具的好奇心吗?

smart-draw 生成的图|图片来源:smart-draw

 

沿着好奇心走下去,你会发现很多类似的小项目。

它们可能只是某个创业者周末随手 vibe coding 的产物,却切实地解决了一个真实的问题。 用户是愿意为解决真实需求的产品买单的,可能是付费,也可能是自发推广(像我一样)。

如果没有找到你想要的那座桥?

那就借助 AI,自己动手造一座吧。

毕竟,在 AI 时代,想象力是唯一的门槛。

传苹果研发「AI 胸针」,带摄像头麦克风;微信上线 15 周年,用户超 14 亿;京东推黄金手机壳,11299 元起

2026年1月22日 08:27

DeepSeek 新模型「Model 1」曝光,疑似「高效推理模型」

1 月 21 日下午消息,DeepSeek 于官方 GitHub 仓库更新了一系列 FlashMLA 代码,在这些更新中,一个名为「Model 1」的模型引起了广泛关注。

据悉,目前这个还很神秘的 Model1 不仅出现在了代码与注释中,甚至还有与 DeepSeek-V3.2 并驾齐驱的文件。这也不禁引发广大网友猜测,认为 Model 1 很可能就是传闻中 DeepSeek 将于春节前后发布的新模型代号。

最新消息显示,Model1 是 DeepSeek FlashMLA 中支持的两个主要模型架构之一,另一个是 DeepSeek-V3.2。这很可能是一个高效推理模型,相比 V3.2 内存占用更低,适合边缘设备或成本敏感场景。此外,它也可能是一个长序列专家,针对 16K+序列优化,适合文档理解、代码分析等长上下文任务。(来源:新浪科技)

OpenAI 拟启动超 500 亿美元融资计划,估值有望升至 7500~8300 亿美元

1 月 22 日消息,据彭博社报道称,OpenAI CEO 萨姆 · 奥尔特曼(Sam Altman)近期一直在与中东地区投资者展开接触,试图为公司新一轮融资铺路。

消息人士表示,此次融资规模可能达到或超过 500 亿美元。该轮融资若顺利完成,OpenAI 的整体估值或将升至约 7500 亿至 8300 亿美元。

消息人士称,奥尔特曼近日与包括阿布扎比国家支持基金在内的多家重要投资机构进行了会谈。相关谈判仍处于早期阶段,具体融资金额和条件尚未最终确定,后续仍可能出现调整。除中东投资者外,OpenAI 近期也与亚马逊就至少 100 亿美元的融资展开过讨论。(来源:IT 之家)

 

Meta CTO:新 AI 团队本月在内部交付了首批关键模型

Meta 首席技术官周三表示,该公司新成立的人工智能实验室本月在内部交付了首批备受瞩目的人工智能模型。

在达沃斯世界经济论坛年会期间举行的新闻发布会上,首席技术官安德鲁-博斯沃思(Andrew Bosworth)说,去年成立的 Meta 超级智能实验室团队建立的模型显示出很大的前景。

博斯沃思说,「他们的工作基本上已经进行了六个月,还没有完全结束,」他补充说,该团队的人工智能模型「非常好」。

媒体在 12 月报道称,Meta 正在开发一个代号为「鳄梨」(Avocado)的文本人工智能模型,计划在第一季度推出,同时还有一个代号为「芒果」(Mango)的图像和视频模型。博斯沃思没有说明哪些模型是内部交付的。

自首席执行官马克-扎克伯格(Mark Zuckerberg)对其人工智能领导层进行调整、组建新实验室并高薪挖角人才,希望公司能在竞争激烈的技术前沿领域胜出以来,Meta 的努力一直受到密切关注。(来源:环球市场播报)

黄仁勋称 AI 时代蓝领更吃香,水管工、电工能拿六位数薪水

随着人工智能可能颠覆全球各地的就业市场,英伟达首席执行官黄仁勋淡化了外界对较长期前景的忧虑,强调眼下对职业技工的需求正在上升。黄仁勋周三在瑞士达沃斯世界经济论坛表示,由于运行和训练人工智能需要建设数据中心,水管工、电工和建筑工人将能拿到「六位数薪资」。他说,这项技术将带来史上最大规模的基建建设潮之一,带动数万亿美元的新增投资。(来源:新浪财经)

微信正式上线 15 周年,合并 WeChat 月活跃用户超 14 亿

1 月 21 日消息,据「微信派」公众号,微信自 2011 年 1 月 21 日正式上线,现在迎来上线 15 周年纪念。

参考腾讯 2025 年第三季度财报,截至 2025 年 11 月 13 日,微信及 WeChat 合并月活跃用户数为 14.14 亿,是中国大陆使用人数最多的社交软件。

微信上线后部分节点:

  • 2011 年,微信正式上线。

  • 2012 年,微信朋友圈上线,上线仅 433 天,微信用户数量突破一亿。

  • 2014 年,微信支付上线,微信年度盛会微信公开课 PRO 第一次在北京举行。

  • 2015 年,微信群视频聊天上线。微信春晚「摇一摇」发放 5 亿现金红包。

  • 2017 年,微信小程序正式上线。

  • 2018 年,微信 7.0 UI 大改版,微信小游戏上线,春节期间全民开启「跳一跳」。

  • 2020 年,微信视频号上线。

  • 2025 年,微信送礼物功能上线。(来源:IT 之家)

 

智谱:将暂时限量发售 GLM Coding Plan

1 月 21 日消息,智谱发布公告称,随着 GLM-4.7 上线,GLM Coding Plan 用户数迎来高速增长,使得公司的算力资源出现阶段性紧张问题。

公司关注到,近期部分用户在模型调用高峰期遇到了不同程度的并发限流报错、模型速度变慢等问题。为了进一步保障用户体验,公司将暂时限量发售 GLM Coding Plan,限售后每日可销售量降为当前的 20%,从而为智谱的「老朋友」们腾出更多算力资源,提供更流畅的编程体验。

限售将从 1 月 23 日 10:00 开启,后续每日 10:00 刷新额度。已有的自动续订将不受影响。停止限售的时间将另行通知。(来源:证券时报)

 

抖音正开发 App「抖省省」?知情人士:或主打超值省钱

1 月 21 日消息,有市场消息称,抖音正在开发一款名为「抖省省」的 App,产品或已初步开发完成,具体上线时间未知。

据知情人士透露,抖省省可能是抖音在团购业务上推出的一款助力线下到店消费、主打超值省钱的 App。(来源:新浪科技)

 

可灵 AI MAU 突破 1200 万 日均收入较 12 月提升约 30%

1 月 21 日下午消息,快手旗下视频生成大模型可灵 AI 月活跃用户数(MAU)已突破 1200 万。受 12 月以来产品密集迭代及「动作控制」等功能破圈带动,今年 1 月截至目前,可灵 AI App 端付费用户规模较去年 12 月增长约 350%,日均收入水平较 12 月日均提升约 30%。Sensor Tower 最新数据显示,可灵 AI 在 Google Play 与 Apple Store 的艺术/设计类目中,已在 40 余个国家和地区下载量排名第一。(来源:新浪科技)

 

文心 App 要做社交了?百度内部人士:没考虑要做一个微信

1 月 21 日下午消息,文心 App 近期将启动交互界面改版,新增「多人、多 Agent 群聊」功能,以更加社交化、活人感的方式进行用户交互。目前,文心 App 群聊功能已在内测阶段。

据悉,文心 App 即将上线的群聊功能将支持用户在同一群聊中调动多个 AI 角色,适用职场创意脑暴、办公协作、家庭成员间生活协同、趣味互动等场景。AI 能理解群聊上下文、识别成员意图,并根据讨论氛围精准判断介入时机,主动应答。

在与媒体沟通中,百度内部人士表示:「我们其实没有考虑过要做一个微信或者取代微信,目前没有考虑,我相信大家也都感觉这个不现实,我们都是从需求和任务本身去出发的,大家如果真的有特定的任务,比如说家庭健康的任务、小组作业的任务、旅游规划的任务,或者是一些特别复杂的决策,我们希望提供一个平台给大家,大家可以尝试在这里面跟你的一些同事朋友去借助 AI 的能力,更好地完成你们的任务。」(来源:新浪科技)

苹果首款 AI 穿戴设备曝光:AirTag 尺寸胸针,双摄、三麦克风

1 月 22 日消息,科技媒体 The Information 发布博文,报道称苹果正在研发一款尺寸类似 AirTag 的「AI 佩戴式胸针」,计划最早于 2027 年发布。

这款设备目前的开发代号尚未公开,但其形态被描述为「类似 AirTag 大小的圆形圆盘」。项目仍处于早期阶段且存在取消风险,不过消息称苹果工程师正全力推进,目标定于 2027 年推向市场。

在硬件规格方面,这款 AI 胸针混合铝合金与玻璃外壳材质,厚度略高于 AirTag。为了实现环境感知,该设备正面集成了两颗摄像头(标准镜头与广角镜头),不仅能拍摄照片,还能实时捕捉用户周边的视频信息。

设备内置了三个麦克风用于精准收音,配备了一个扬声器进行语音反馈,并在边缘设置了一枚实体按键,背部采用了与 Apple Watch 相似的磁吸感应充电接口。(来源:IT 之家)

沃尔沃全新 EX60 纯电 SUV 发布:644km 家族迄今最强续航,预计 6 万美元起

1 月 22 日消息,沃尔沃正式推出了全新纯电 SUV EX60,新车是品牌纯电战略中的关键车型。无论是续航、补能能力还是平台技术,EX60 都代表了沃尔沃当前最完整、也最激进的一次纯电布局。

在美国 EPA 工况下,EX60 的最高续航里程达到 644km,这也是沃尔沃家族史上最长的续航,并支持最高 400kW 直流快充,同时原生接入特斯拉超级充电网络。产品序列中还将加入一款 Cross Country 版本,进一步拓展使用场景。

在理想条件下,EX60 可在 10 分钟内补充约 278km 续航。动力配置方面,EX60 提供三种动力、七个配置版本。P6 后驱版续航 499km,P10 四驱版续航 515km,P12 四驱版则达到 644km。

售价方面,沃尔沃预计配置较高的 EX60 价格约为 60000 美元。(来源:IT 之家)

京东京造推出 Au99.99 黄金手机壳:自带投资金条 11299 元起

1 月 21 日消息,京东京造自营投资金旗舰店上架了一款 Au99.99 黄金手机壳产品,定价 11299 起。目前仅适配苹果 iPhone 17 Pro Max 机型,官方号称「是高颜值守护壳,更是随身资产」。

这款手机壳通体黄金配色,但并不是整体采用黄金打造,而是分为两部分:手机壳、金片。

其中背部的金片可以自由选择,目前共提供五种,对应的克数和价格如下:

金启 10g:11299 元

金储 20g:22499 元

金丰 30g:33699 元

金鼎 50g:56199 元

金玺 100g:112299 元

页面显示,该店不支持七天无理由退换货,因国际金价会随市场变化而有浮动,店内金价也根据市场因素及运营情况的调整。(来源:快科技)

谷歌:DeepSeek 靠「精神分裂」变强;传 iPhone18 全系 12GB 运存;淘宝闪购 20 亿补贴春节骑手|极客早知道

2026年1月21日 08:17

X 平台正式开源推荐算法,马斯克:没有其他社交媒体这么做

1 月 20 日,马斯克宣布正式开源新的 X 平台算法,该算法由与 xAI 的 Grok 模型相同的 Transformer 架构驱动。

马斯克坦言,我们知道这种算法很笨拙,还需要大幅改进。但至少可以看到 X 平台在实时、透明的情况下努力让它变得更好,没有其他社交媒体公司这样做。

据悉,该算法与当前运行的生产系统相同,并由 xAI 的 Grok 提供支持。完整代码已发布在 GitHub 上,并将每 4 周更新一次。

用户的推荐内容会结合关注账号的帖子与 X 上发现的帖子,然后使用基于 Grok 的转换器进行排序。该转换器预测用户可能喜欢、回复、转发、点击或观看的几率。

模型不仅预测单一分数,而是预测多种行为并综合它们,以实现更细致的排序。所有内容均直接从用户行为中学习。(来源:新浪科技)

分析师:到 2030 年 OpenAI 广告年收入有望达 250 亿美元,对谷歌构成威胁

1 月 20 日,据 BusinessInsider 报道,一位顶尖科技分析师预测,广告业务有望为 OpenAI 带来 250 亿美元(现汇率约合 1744.17 亿元人民币)的年收入规模,并对谷歌构成威胁。

投行 Evercore ISI 分析师马克 · 马哈尼(Mark Mahaney)指出,若这家初创企业能顺利推进这项新业务,到 2030 年其广告年收入有望达到这一水平。

马哈尼在一份投资者报告中写道:「若发展顺利,OpenAI 有望在 2026 年实现数十亿美元的广告收入,并在 2030 年突破 250 亿美元,这一目标具有合理性。」

这位分析师补充称,这一预测基于三个核心因素:到 2030 年 ChatGPT 的潜在用户规模、高意向效果营销平台已被验证的变现能力,以及当前该市场的整体体量。

目前,OpenAI 的营收已处于高速增长阶段。广告业务或将成为 OpenAI 拉动营收和利润增长的重要抓手。马哈尼指出,2025 年谷歌的搜索和 YouTube 广告业务营收合计接近 3000 亿美元,脸书母公司 Meta 的广告营收也达到 1800 亿美元。他表示,这两项业务均具备高盈利性,营业利润率高达 40%。(来源:IT之家)

 

亚马逊 CEO:特朗普关税已开始「逐步渗透」至商品价格

1 月 20 日,亚马逊首席执行官安迪・贾西表示,随着卖家们权衡如何消化新增成本,特朗普政府大范围加征的关祱,已开始体现在部分商品的售价上。

贾西于周二在瑞士达沃斯世界经济论坛接受美国消费者新闻与商业频道(CNBC)记者贝姬・奎克采访时透露,亚马逊及其旗下众多第三方卖家曾通过提前采购库存的方式,规避关祱影响,从而为消费者维持低价,但这批库存已于去年秋季基本耗尽。

贾西表示:「因此,大家开始看到关祱的影响逐步渗透到部分商品的价格中。部分卖家选择通过涨价的方式,将新增成本转嫁给消费者;部分卖家则选择自行承担成本以拉动需求;还有一部分卖家采取了折中的办法。我认为,关祱带来的影响正日益显现。」(来源:新浪科技)

 

Anthropic CEO:AI 发展未来可能导致 10% 失业率,政府必须有所作为

1 月 21 日,AnthropicCEO 达里奥·阿莫代预测,人工智能将推动显著的经济增长,但同时可能引发大规模失业与社会不平等。

阿莫代在周二达沃斯世界经济论坛表示,他对 AI 的影响既「兴奋又担忧」,并指出:「人们对即将到来的变化以及其影响的规模,几乎没有任何意识。」阿莫代表示,政府需要在应对 AI 带来的大规模岗位流失中发挥作用。他预测,未来可能出现 GDP 增长 5% 至 10% 的同时伴随 10% 失业率的局面。他指出:「这是我们几乎前所未见的组合,这种宏观经济规模的岗位流失,政府必须有所作为。」他表示:「现在更需要关注的,不是阻碍增长,而是确保每个人都能分享增长的成果。」(来源:广角观察)

 

淘宝闪购宣布投入近 20 亿补贴春节跑单骑手

1 月 20 日,为提高 2026 年春节期间城市骑士的收入,奖励城市骑士的坚守岗位,从 2 月 4 日至 3 月 3 日,淘宝闪购投入近 20 亿,补贴春节跑单的城市骑士。

补贴面向全国直营城市骑士推出全周期跑单奖励,包括节前冲单奖、节中单单奖、节后返岗奖,春节跑单段位升级更快,享受更高段位权益。以上海为例,持续跑单的城市骑士预计可比平日多收入数千至上万元。(来源:鸟哥笔记)

抖音直播 2025 年无限期回收 37 万个违规账号

​1 月 20 日,抖音发布的《2025 抖音直播治理白皮书》(以下简称「白皮书」)显示,抖音直播"主播健康分"机制覆盖主播量级同比提升 60%;AI 大模型将违规处置效率提升 31%,全年无限期回收 37 万个违规直播账号;同时通过线上线下协同,抖音直播年内协助警方捣毁诈骗、色情、赌博等黑产团伙 39 个。

根据《白皮书》,共有超过 47 万名主播因违规诱导打赏被扣除健康分,其中 13 万余名被限制收益提现、关闭礼物收入功能,1.8 万余个账号被无限期回收直播权限,违规内容识别准确率超过 90%,相较于 2025 年初,AI 审核效率提升 31%,整体违规曝光量减少 37%。(来源:网易科技)

 

微信:2025 年全球跨境与境外用户使用小程序次数达 50 亿次

1 月 20 日,微信官方发布消息称,2025 年全球跨境与境外用户使用小程序次数突破 50 亿次;微信小程序服务已覆盖全球 100 个国家和地区;微信跨境支付已覆盖 78 个国家和地区,支持 36 个币种;2025 下半年通过小程序完成的交易金额同比增长超 7 成。(来源:财联社)

 

TCL 与索尼达成合作,拟成立合资公司,承接索尼家庭娱乐业务

1 月 20 日,Sony 与 TCL 宣布签署合作谅解备忘录(MOU),将推进成立家庭娱乐领域合资公司:TCL 持股 51%,Sony 持股 49%。
新公司拟承接索尼家庭娱乐业务,覆盖从产品研发设计、制造到销售、物流、客服的全流程,并面向全球运营,产品预计继续使用「Sony」与「BRAVIA」品牌。

双方计划在 2026 年 3 月底前推进签署最终协议,若获监管审批等条件满足,新公司预计于 2027 年 4 月开始运营。

在新闻稿中,索尼表示大屏电视市场在增长,驱动因素包括 OTT 流媒体/视频平台兴起、智能功能进化、更高分辨率与更大屏幕普及。新公司希望在此环境下推出创新产品、提升运营效率并实现增长。

从股权上来看,拥有 51% 股权的 TCL 应该会成为新公司的控股方、拥有经营控制权;而拥有 49% 股权的索尼,仍然持有「Sony」和「BRAVIA™」的商标。而之后的索尼电视产品,应该就是由这家合资公司来完成设计、生产和销售。(来源:爱范儿)

特斯拉发布第二代人形机器人摆件:199 元,1:10 打造 20 关节灵活可动

1 月 20 日,特斯拉中国官网发布 Tesla Bot 摆件(生肖盲盒版),售价 199 元,将于 1 月 21 日 10:00 开售。

据介绍,Tesla Bot 系列摆件是以 1:10 比例打造的可动收藏玩偶,由 40 多个独立零件组成,配备 20 个关节点。

产品尺寸为 5.5cm x 18.2cm,净重约 25 克。无论是外观细节还是动作表现,均高度还原第二代人形机器人。用户可以自由调整摆件姿势,如双手抱拳的拜年造型、手持节日道具的俏皮模样。

据了解,盲盒内还有神秘嘉宾,将以 10% 的概率随机出现,可能是身穿新年限定服饰的 Tesla Bot(马年生肖特别版),也可能是 Tesla Bot 的神秘好友。(来源:快科技)

 

苹果 iPhone 18 有望全系 12GB 运行内存,标准款也将配备

1 月 20 日,据外媒报道,苹果去年 9 月份推出的 iPhone 17 系列和 iPhone Air,运行内存并不相同,有 3 款是 12GB,标准款的 iPhone 17 则是 8GB。

但从外媒最新的报道来看,在 iPhone 18 系列上,标准款的运行内存与其他几款可能不会有差距。有外媒在报道中表示,iPhone 18、iPhone 18 Pro、iPhone 18 Pro Max 和 iPhone Fold,运行内存都将是 12GB。

在苹果目前在售的 iPhone 中,除了标准款的 iPhone 18,还有 iPhone 16e 是 8GB 运行内存,有消息称今年春季将推出的 iPhone 17e 也是 8GB,如果他们明年推出的 iPhone 18e,升级到 12GB,那届时 iPhone 18 全系都将是 12GB 运行内存。(来源:新浪科技)

 

阿里推出 AIGC 设计应用「呜哩 (Wuli)」,集成通义千问图像模型

1 月 20 日,阿里巴巴推出了一款名为「呜哩」的 AIGC 创意设计生产力平台,并已正式开启测试。该平台旨在为内容创作者、设计师及营销人员提供一套高效多元的 AI 创意生成解决方案。

平台深度整合了通义千问团队研发的多款图像大模型,形成一个模型全家桶。其中包括主打高质量的 Qwen Image25.12 生成模型、追求极致响应速度的 Qwen Image Turbo 模型,以及专注于细节调整的 Qwen Image25.11 编辑模型。用户可根据不同创作需求,在生成质量、速度与可控性之间灵活选择。

在功能层面,呜哩平台提供了从图片生成、视频生成到灵感联想、翻译辅助及资源库支持的完整具集,可帮助用户跨越创意瓶颈。用户通过输入简单的描述,即可快速生成如 3D 艺术字体、电影风格海报、电商场景图在内的丰富内容。(来源:开源中国)

 

谷歌重磅发现:DeepSeek 靠「精神分裂」变强,脑内互搏让智商翻倍

1 月 20 日,谷歌最新研究揭示了 AI 变聪明的惊人真相:DeepSeek-R1 等顶尖推理模型在解题时,会自发「分裂」出多重虚拟人格。

研究团队通过稀疏自编码器(SAE)解码发现,面对高难度科学或数学问题,模型内部会上演精彩的「脑内群聊」。创意型、批判型等不同人格相互辩论、验证,这种激烈的「左右脑互搏」显著提升了推理能力。更有趣的是,实验显示若人为放大模型「哦!」等表示惊讶的转折语气,能将其在算术任务中的准确率从 27.1% 直接翻倍至 54.8%。

这一现象并非人工刻意设计,而是模型为求正解自发演化形成的,这恰好印证了「社会脑假说」:AI 正在通过模拟复杂的内部社交互动来进化大脑。(来源:量子位)

字节扣子 2.0 发布,我们深挖了它这两年的生长真相

2026年1月20日 17:12

作者| 张鹏

编辑| 苏子华

最近,字节的「扣子」完成了一次大版本更新,发布了扣子 2.0,推出了技能商店、长期计划等一系列新功能,定位为「职场 AI,就用扣子」。

其实,在前不久 12 月的火山引擎 FORCE 大会上,扣子的负责人宣布过一个大的改变:「扣子开发平台」升级为「扣子编程」。简单来说,就是扣子要从一个帮用户搭建应用的工具平台,明确迈向一种新形态的 Vibe Coding 了。

扣子 2.0 的用户主界面,左侧包含了技能商店、扣子编程、长期计划的入口,右侧是对话框|图片来源:产品截图

 

而现在,在扣子编程里,用户可以开发自己的技能(skills)。看来之前都是在为扣子 2.0 的发布做铺垫。

扣子编程用户界面,可以直接对话开发智能体、工作流、网页应用、移动应用、技能等|图片来源:产品截图

 

我很好奇,这是否代表了扣子对这个 2025 年开始火爆的赛道的认可,和是否体现了某种战略决心?以及,强化「职场 AI」的品牌心智究竟是源自哪些验证和判断?

毕竟扣子 2 年前出发的起点是对话 Bot,后来工作流又成了带来最大用户量的产品亮点,现在又迈向「职场 AI+Vibe Coding」,感觉短短两年经历了几次「辗转腾挪」,这背后肯定会有故事。

于是,我和团队认真挖掘了下扣子团队的故事,最大的收获,是基本上复原了扣子究竟是如何在字节内部一步步生长出来的真实过程。而且发现,扣子升级 2.0 的变化和原因,与之前我猜测的大相径庭。

简单来说,扣子从诞生到今天走向「职场 AI + Vibe Coding」,都不是在字节某种技术路线或产品战略之下,被「规划」出来的结果。说它是个在字节跳动内部,拿到了内部「投资」的「早期创业团队」可能都更贴切些。扣子在字节内部是如此的「野生」,以至于过去两年时间里,根本没有什么「大厂的稳健」,反而是早期 AI 产品团队身上看到的「走一步再看下一步」,「两三个月就经历一次迷茫」啥的,在扣子身上也是一模一样。

所以抛掉字节跳动的光环,研究下扣子从 0 到 1 的发芽、成长、到最终定义自己过程里,其实也能看出在 AI 时代创造新产品,应该遵循的一些规律,这值得分享给更多做产品创新的人。

 

01

拿 Bot Studio 「抢跑」,

却在工作流上找到存在价值

 

据我搜集到的信息,扣子大概在 2023 年下半年正式启动。当时,这更像是扣子团队结合字节内部对探索 AI 原生产品的支持氛围,形成了类似大厂的「内部产品孵化」。

有意思的是,团队最初的想法就是想打造一个让每个人都能通过 AI 能力获得编程能力的平台,很像今天的 Vibe Coding。不过,很显然扣子团队对这个目标兴奋了不到一周就觉得「没法干」——2023 年的大模型在 Coding 上的能力大家都懂的,更别提围绕大模型的脚手架、插件、部署等工程环节还不成熟这些问题了。

所以想来想去,最终似乎只有从一个「无代码的聊天机器人构建平台」切入显得更具可行性:用户只需要写 Prompt,其余复杂部分由平台完成。

于是,这个内部项目代号是 Bot Studio 的项目,在 2023 年底率先在海外上线,名为 Coze。而后,在 2024 年初在国内上线,中文名「扣子」,随后在当年火山引擎春季的 Force 大会上正式发布。上线至今,刚好两年。

值得注意的是,Coze 在启动初期是零市场预算,但用户增长迅速。回过头来看,其早期的用户增长,带有明显的新鲜感红利。大量从未接触过编程的用户,第一次通过 Prompt 实现了「类编程」的效果,这种即时反馈给用户带来了强烈的成就感。

但问题也随之浮现:新鲜感无法构成长期价值。

彼时,扣子曾设想成为 UGC / PGC Bot 的平台。但他们很快就发现,真正持续被使用的 Bot 数量非常有限,留存显然不够理想。这就意味着虽然用户制造了很多 Bot,但它们并没有真正帮用户有效地解决问题。这种依靠「新鲜感」在带来用户的层级上虽然很高效,但基本上属于「抢跑」的优势,如果再不能赶紧转化为真正带来用户价值的东西,路将会越走越窄。

这曾将让扣子团队很焦虑和迷茫。但「抢跑」也有很现实的好处,比别人更早地看到了用户的行为,而这里面有一个信号让团队振奋:工作流(Workflow)的调用量持续攀升,而且用户高度稳定。

其实引入工作流曾经是扣子团队不太乐意的。因为觉得这不是很 AI Native。这个并不性感的解决方案,原本是团队为了解决 2024 年大模型在复杂任务中的不稳定性而被迫设计的。只是为了通过人工可配置的流程编排,让大模型在受控结构中完成复杂任务。没想到,它某种程度上,决定了扣子下一个阶段的「腾挪」方向。

做产品的人都知道,如果你迷茫了,就去挖掘用户行为和找用户交流。扣子团队应该也是很认真地分析和调研了用户行为,发现那些高频的用户使用场景几乎全部来自企业内部——数据处理、客服自动化、文档整理、流程协同等等。

于是,扣子团队内部开始统一思想,然后他们就真的放下了之前的「嫌弃」,开始猛干工作流(Workflow),这显然是有效的的一个决定,因为我们看到他们后续甚至推出了更明确的付费路径,并且来自字节内部的消息也印证,这个团队 2025 年初的目标,半年时间就达成了。这一切都说明扣子对用户交付的价值到位了,「抢跑」变成了「领先」。

其实最近我和很多创业者交流,都聊到了「辗转腾挪」的重要性。由于技术环境每年都在快速变化,产品的定义和用户价值,必然是一样在快速建立和快速崩塌。

如果我们把 AI 时代做产品看作打篮球,篮筐是你最终要交付的「最大用户价值」,那么对绝大多数团队来说,「中场投三分球」虽然很酷,但可能「三步上篮」才是真正有效的得分路径。多个题外话,我一直觉得「三步上篮」被叫做「平民射球」的说法即有趣又贴切。

扣子这个团队在字节内部也绝对算得上「平民」,所以 2023 末到 2025 上半年这段时间,从 Bot studio 到工作流平台的腾挪,基本上就是在「三步上篮」的第一步。

 

02

扣子空间:找到「严肃开发者」

和办公 Agent

 

极客公园团队发现扣子团队内部有一个很有意思的用户洞察视角,他们不用 ToB 或是 ToC 去看待自己的核心用户,而是创造了一个新词:「严肃开发者」。

大概意思是指那些有有商业化目的的开发者:要么靠它赚钱,要么用它解决自己工作里的问题、提升效率。这些用户有一个行为特征就是会在日常生活工作中持续使用,持续调用 token,而不是用一次就走。

客观来看,扣子团队最早其实希望面向 C 端,曾经希望是像剪映那样全民可用的,但到后来聚焦到「严肃开发者」,这实际上是一个战略转向。可以说,Workflow 的成功,对这个团队有非常重要的思考转向意义。

但是,工作流有意义和需求的背后,还是大量工程工作的而非真正的 AI Native。换句话说,模型越不行,工作流越有意义,但是模型不断进步,工作流的意义就会不断被稀释。那么一个产品如果不能进入利用模型进步来「水涨船高」的状态,而是等着「水漫金山」,那扣子这个产品还有什么意义呢?

我估计扣子团队在靠工作流找到「存在价值」后,可能很快就开始经历我说的这些焦虑了。这个焦虑通向了另一个关键节点——2025 年 4 月,「扣子空间」的发布。那是一个中国 Agent 赛道集体爆发的节点,在此不久前,定位为通用 Agent 的 Manus 上线,引爆全网。

而扣子空间则更加聚焦,主攻办公 Agent,覆盖 AI 写作、AI PPT、AI 设计、AI Excel、AI 网页、AI 播客等场景。我听说,扣子空间上线后,扣子团队对于大模型的进步变得如饥似渴:这是源于他们在扣子空间找到了一个依托大模型进步而「水涨船高」的产品形态。比如扣子团队内部的消息显示,豆包大模型后来发了 1.6 版本时,扣子空间在没做其他动作的情况下,留存直接涨了 10 个百分点。

我和很多 AI 创业者聊过,他们都给过我一个共同反馈:几乎只有做 Agent,才能够更微观、更敏锐地感知模型能力的变化。所以,怎么确保你正在随着模型的进步而「水涨船高」,答案就是——你是否天天渴望模型再强一点。

反过来,做 Agent 也暴露了新的焦虑:如果没有机制推动模型进步,Agent 可能会因模型的快速进步而被吞噬。

扣子团队的办法是做 Agent RL(强化学习),参与到推动模型变强的进程里。Agent 用户提出的问题本身,就是极高质量的训练素材——复杂、真实、不可预设。

以扣子空间的王牌场景,做 PPT 为例,纯 Workflow 无法生成很有 PPT 质感的好东西。于是,扣子团队基于豆包大模型做后训练,自己标注 PPT 数据,使得 PPT 组件第一次成为一个依赖模型能力跃迁而成立的产品。这样的尝试带来的不只是一个组件的成功,也是一套方法论的验证:扣子不再仅仅「雕琢工程」,同时也会「雕琢模型」,两头一起抓。

扣子这里也印证了我一直坚信的一个观点:今天的产品其实只是个容器。这个容器有两个作用:一是构建数据飞轮——在特定人群、特定场景中拿到高价值数据;二是把这些数据沉淀为领域资产,未来用于优化自己的能力引擎——模型。最终,所有的有力量的产品,必然也要有自己的模型,产品和模型最终必然是是一体的。

到了这一步,扣子终于从工作流这种「确实有价值但不多」的事情上,又向前走了一步,开始回到了 AI Native 团队的频谱上,与模型的绑定变得越来越深,也和字节体系内的火山引擎走得越来越近。

如今,扣子空间 App 更是直接更名为扣子,占据了主入口。也就是,未来只有一个 all-in one 的「扣子」,将扣子空间、扣子编程、技能商店等能力包含其中。

 

03

Vibe 不变,Coding 升维,

要做「白领用户的技术伙伴」

 

如果说之前两年扣子团队一直在「三步上篮」的进程里,那么现在我觉得扣子的第一个真正的「投篮动作」在 2025 年底已经开始做出了——通过一种更高维度的 Vibe Coding,以及能形成长期资产的 Skills、能持续帮助用户完成任务的「长期计划」等能力,来建立与白领用户的「伙伴关系」。

这件事情很有意思的地方在于,首先,扣子提出的 Vibe Coding 实际上还包含了 Vibe Agent、Vibe Workflow 和 Vibe App 三层。此外,他们还配套推出了 Vibe Infra。

简单概括一下,过去我们开发一个应用需要学习编程语言、拖拽组件、调整参数等等,而现在只需要用日常语言描述你的需求,剩下的由扣子编程自动生成。

扣子眼里的这一系列工作,特别是 Vibe Infra 这件事,其实证明了他们要做的已经不是我们 2025 年看到的 Vibe Coding 了。

你可以想象,对于代码和工程认知积累很弱的大部分用户来说,Vibe Coding 出他需要的应用之后,可以通过 Vibe Infra 一键完成在火山引擎的开户,在云端的发布、域名的注册和应用或网站的上线、运维等等。这些都是一键自动搞定。

所以,Vibe Infra 的意义在于,通过与火山引擎的紧密结合,扣子将复杂的云基础设施(如运维、计费、发布)改造成 Agent 易于调用的形式,提供了生产级的一站式体验。

如果这项业务推进顺利,那就会出现一个有意思的现象:火山引擎会因为扣子出现一大群 C 端用户!毕竟小白用户的第一个自己开发的 AI 应用、第一个云服务账户,必然来自于火山引擎。而对于企业来讲,他们可以直接利用扣子的企业版本,完成组织的全面 AI 化——因为扣子的门槛足够低,上限又足够高。

扣子 2.0 的技能商店里,有用户上传的大量技能包|图片来源:产品截图

 

另外,技能(Skills)是当下行业正火的一项 Agent 新能力,它将人的「经验」变为可被大模型反复调用的能力,沉淀为长期资产。而且扣子也推出了 Coze Skill,在它的技能商店中,用户可以下载其他用户的「技能」,可以上传自己的「技能」。这样在 Vibe Coding 的时候,可以调用相应的 Skills。而企业,则可以利用这些能力,沉淀自己公司的「Skill 资产」

未来,真正可规模化的办公 Agent 产品,会同时站在 Vibe Coding 和 Skills 这两块地基之上。

其实如果把时间拨回一年前,扣子仍像是一个尚在寻找自我定位的 AI 产品,也一度被外界当作又一个 AI 工具平台来理解。而扣子最近的一系列变化,无论是扣子空间、还是 Vibe Coding、skills、长期计划(帮用户长期完成某项任务。比如,每天早上 7 点汇总重点科技新闻发到我的邮箱),它都在强化自己是个「伙伴」的定位。扣子编程的官网主页已经非常直接写明「扣子编程,你的开发伙伴」。

点击「长期计划」,会出现这个界面,可以直接输入想要执行的计划|图片来源:产品截图

 

至此,无论是在职场 AI、还是企业 AI 场景,都可以打包用扣子 2.0 完成日常个人、团队、业务对 AI 的需求。

 

04

AI 产品演进:

从造工具,到建关系

 

我其实挺认同扣子的进化方向:从「做工具」,转向「造伙伴」。

我在 2025 年中旬极客公园的 AGI 大会上演讲时,就提出过一个观点:今天 AI 创业特别重要的一点,不是用 AI 为用户造工具,而是帮 AI 建立与用户的新关系。

这并不是一句营销层面的口号变化,而是关乎到产品目标、产品能力结构、商业模式的根本变化。

过去,移动互联网时期的创业,或者 AI 产品早期阶段,做「工具」几乎是一个默认选项。但是,用户有需求,就来用一下;需求结束,产品随即被关闭。

这种模式的问题很明显:低频、低粘性、难以建立长期信任。工具的商业化天花板清晰可见,尤其是在中国市场,单纯为订阅付费的逻辑极具挑战,用户的 LTV(用户生命周期价值)天花板也极低。

因此,一旦被当作工具,产品的天花板几乎是注定的。但如果被视为工作伙伴,专业顾问等,情况就完全不同了。这背后其实是一个更大的判断:AI 不只是效率工具,而是在与人建立一种新的协作关系。在这个关系里,AI 不再只是完成单点任务,而是逐渐理解你的目标、背景和工作方式,与你一起推进长期事务。

只有当用户不再把 AI 视为工具,而是将其看作工作伙伴、同事或私人顾问时,价值才能真正放大。这可能是如今的 AI 应用超越上一代移动互联网 App 的机会所在。

如今的扣子,就在这条路上。本质上是在 Vibe Coding 的简单轻松的氛围下,给用户更高维度的 Coding 能力,甚至是创造与用户目标相关的复杂工程上足够无感的体验。

这一切的最终目标,就在意图建立一种类似「白领们的私人技术伙伴」般的信任基础,与持续「履约能力」的不断循环。

所以我判断扣子的下一步会越来越坚决地瞄向了带着明确目标、想构建自己工作 Agent,却长期没有被好好服务,天天被媒体创造的 AI 焦虑,和老板脑子里的「降本增效」围绕着的,那批「可能要被被 AI 替代」的人,以及期待利用 AI 增效的老板们。

让更多普通白领,不要只是去玩一下 Coding,而是第一次拥有像「全栈技术团队」一样构建工作流程与工具的可能。帮助这群人跨过门槛,从「消费现成工具」,走向「为自己的目标构建系统」。

这会是一件有用户需求,也有意义的事情。至此,扣子手里的「三步上篮」完成,球已经开始飞向篮框。字节跳动里这个极其低调的「平民团队」,是不是能在 2026 拿下这个进球,极客公园后续将继续跟踪报道。

中国互联网大厂的AI时代船票争夺战已经开始了

2026年1月20日 15:16

 

头图来源:视觉中国

 

最近这段时间,科技圈的节奏变得密集且躁动了起来。

先是字节跳动旗下的豆包宣布日活过亿,并且即将跟随火山云一起登陆春晚;又是阿里千问发布重磅更新,全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等业务。

这些信号并列在一起,会发现一个清晰的事实:大厂们正在开启一场关于“入口”的新一轮疯狂争夺。

过去我们回顾科技史,从 PC 时代向移动互联网迁移的过程中,「船票」往往意味着一个决定性的入口——谁拿到了它,谁就有资格参与下一轮的流量与财富分配,例如移动互联网时代的微信之于腾讯。

那么,什么是AI时代的船票?一个新的国民级的应用?还是它背后意味着更多的东西?

从极客公园的视角去看,这张通往 AI 时代的船票,其形态已经发生了根本性的变化。

这不再是一个关于「谁拥有超级 App」的单维度问题,而是一场关于「模型大脑(Model)、基础设施(Infrastructure)与交互入口(Entrance)」的复合验证。

真正的 AI 船票,至少由三部分构成:

  • 模型能力:是否拥有可持续进化、能支撑复杂任务的基础模型;
  • 基础设施 / 云:是否具备承载模型规模化训练、推理和商业化的工程能力;
  • 新时代入口:是否踩中新的交互范式与用户习惯,而不是简单复用旧入口。

这些是一个必须形成闭环的系统。如果从这三层视角来看今天的巨头:字节看起来已经将整个船票的结构拿在手里,阿里还差一块拼图,至于腾讯手里的「旧」船票,在未来是否依旧有效,现在还得打一个问号。

字节跳动:已经跑在前面的「进攻态势」

如果从这三层结构来看,字节跳动是目前最明确理解了「新船票形态」并率先跑通的公司。它几乎复刻了自己在移动互联网时代的激进与精准,成为了 AI 时代的「First Mover」。

模型能力,可能是字节被外界低估的一层。外界对字节模型能力的低估,本质来自两个误差:字节不强调模型品牌,也几乎不走开源刷存在感的路径;它的模型主要用于自家产品和火山体系内部,无论是图像生成的 Seedream 还是视频生成的 Seedance,都在抖音等庞大的内容生态中经过了数亿次验证。数据显示,字节跳动的模型日均处理 Tokens 数已突破 50 万亿。

恰恰是这种「只对结果负责」的策略,使字节的模型能力直接接受真实用户和真实业务的压力测试。

图片来源:视觉中国

 

从豆包到火山引擎的多模态模型可以看到一个清晰信号:每补齐一个多模态能力,火山客户规模和算力消耗都会显著上升。

同时,不同于部分厂商采用「外挂」多模态模块的路径,字节坚持「All-in-One」的基础模型策略。其内部将文本(LLM)、视觉(VLM)等能力整合在同一个基座模型中进行训练,而非简单的拼凑。这种策略虽然研发周期长,但能实现更深度的跨模态理解能力。

如果从是否真的解决问题、创造价值维度看,字节的模型能力不弱,甚至非常扎实。

这两年,字节在 MaaS 维度也实现了快速爬坡。如果用传统 IaaS 云市场去对比,火山和阿里确实有差距;但在 Model as a Service(MaaS) 这条 AI 新主线上,火山引擎的上升趋势非常明显。

按照大模型调用量的市场份额来看,火山引擎的大模型调用量市占率已达 46.4%,甚至超过了阿里云与百度智能云的总和。更重要的是,字节已经在战略上完成转向:火山不再只是「字节能力对外输出的销售部门」,而是被明确要求成为最好的 AI 基础设施。

模型带动 MaaS,客户消耗带来数据反馈,反哺模型进化的飞轮已经高速转动。

据极客公园了解,虽然字节的 Token 消耗量巨大,但其内部也清醒地意识到,C 端娱乐产生的「情绪价值 Token」与 B 端解决复杂问题的「严谨 Token」在商业价值上存在差异。因此,火山引擎正在加速将这种流量优势转化为解决复杂商业问题的能力。

豆包则是一个更加明确的信号。上个月,豆包DAU已过亿,且营销成本远低于同类产品;同时,其豆包也将配合火山引擎在春晚上线多种互动玩法。

豆包的表现验证了一个事实:在 Agent(智能体)时代,Chat 依然是通往超级应用的最佳入口。豆包已经初步实现了AI 原生入口的心智占位。从春晚露出到硬件延展,它的意义在于,字节已经公开、明确地押注——AI 需要新的入口,而不是寄生在旧入口里

三者叠加会发现,字节不是「刚开始上船」,而是已经理解了这张船票的三层结构,并且正在加速。

阿里巴巴:船票还差最后一张拼图

阿里的优势和短板都非常清晰。

在「模型+云」的底座层面,阿里拥有没有争议的强项。

从「底座能力」来看,阿里没有问题。类比自来水厂,阿里提供三种形态的服务:一是像「原水」一样的底层智算算力(AI Infra);二是像「净化水」一样的模型 API 服务;三是支持企业将「水」加工成「饮料」的私有化模型部署能力。数据显示,在阿里云上调用 API 的客户与使用 GPU 算力的客户重合度高达 70%,这证明了「云+AI」的深度绑定正在形成新的业务飞轮。

阿里云在 2025 年依然稳坐中国 AI 云服务市场的头把交椅,拥有超过 35% 的市场份额。通义千问的模型能力,通过开源已经被业界充分感知;阿里云在算力、履约、工程化上的能力,更是现实世界级别的。

图片来源:视觉中国

 

然而,阿里的「船票」之所以尚未完整,还缺失的最后一块拼图,就在于C 端入口,在于新的交互时代里怎么实现更强的用户价值。

尽管钉钉在 B 端办公场景构建了坚固的堡垒,夸克在搜索领域表现尚可,但阿里始终缺乏一个像「豆包」那样具有国民级统治力、能够占据用户全天候时长的超级 AI 触点。千问 App 虽然增长迅速,但更多仍停留在工具属性,难以形成高粘性的社区氛围。

据极客公园了解,阿里内部已经明确了一个激进的目标:占据未来 AI 增量市场的 80% 。这 80% 不仅来自传统企业转型,更瞄准了 AI 原生(AI Native)企业、智能硬件和 Agent 等新物种。

外界有人用「阿里做了太多 C 端 App」来看待它的困境,但这只是一个表层解释。

真正的问题不是 App 多不多,而是AI 时代的入口,本质是一种新的交互习惯。

在「对话式交互」替代搜索的阶段,豆包跑在了前面;但下一阶段,很可能不是「聊」,而是 Agent 的行动能力更重要,要能端到端地完成任务,而不是问完再自己去点。

就在上周,阿里千问进入AI Agent时代,打通了饿了么、飞猪等生态,用户可直接对话点外卖、订票。这种基于 API 的深度连接,会比通过「视觉读屏」操作 App 的方式更加流畅。

这正是阿里的潜在优势,它拥有中国最完整的现实世界履约网络:淘宝闪购的外卖、淘宝的电商、支付宝的支付、高德的本地生活。这些是可以被 AI 直接调用的、真实可执行的系统接口,一旦被深度整合,将构建起极高的竞争壁垒。

更多的挑战在于,如何打破原有商业模式的惯性。阿里现有的每一个业务体系,都有其既定的商业逻辑。未来的关键,在于能否克服这种传统模式的惯性,在「模型基础设施」和「用户价值交付」这两大新基座之上,将各个板块真正打通,形成一个全新的、完整的大循环商业模式。这意味着要去实现更强的用户价值交付。

而在这一点上,目前的业界尚无成功先例,这完全是阿里亲自需要去探索的。

对于阿里而言,它拥有最强壮的躯干(云)和最聪明的大脑(模型),但真正的挑战在于如何重构与用户的新关系。

这条路比单纯做一个 Chatbot 要复杂得多,也难得多,但 Chatbot 本身从来也不是终点。所以阿里没有再造一个「豆包」,而是选择了一条更难、但更符合自身禀赋的路。而这恰恰是一条更通向「终局」的路。如今,他们已经摸到了最后一张拼图,现在的关键,就是看能不能把它有效地拼进去了。

腾讯:旧船票要登上新客船,面临考验

腾讯在这场战役中的姿态更为复杂。它手里移动互联网时代最显赫的那张船票——微信,是否还能直接兑换 AI 时代的座次,是一个存疑的问题。

在模型层,腾讯处于相对追赶的位置。 早期「够用就好」的策略看起来并没有使得腾讯的AI走到前列。在今天,一个趋势已经越来越清晰:AI 是新一代产品的发动机,给产品加一个AI组件已经不够了。

前OpenAI研究员姚顺雨的加入,本身就说明腾讯已经意识到,如果没有足够强的基础模型,谈不上 AI 时代的核心竞争力。

姚顺雨在大屏幕里|图片来源:AGI-Next

 

而无论是云规模还是 AI 专用基础设施,腾讯目前都处在一个相对追赶的位置。这决定了它在模型和 Agent 执行层面的自由度,天然受限。

至于被外界和腾讯自己都寄予厚望的微信,它是最大的资产,也可能是最大的约束。微信看似是 AI 入口的理想形态——它对用户意图、关系链、上下文的理解最完整。

但问题恰恰在这里:微信不具备无边界提取和使用用户意图的正当性;它的熟人社交与隐私的产品定位与用户预期,决定了它不能「直接截胡用户人生」,不能如外界所期待的一般打通数据,这和苹果高度重视隐私的逻辑是相通的:越靠近用户核心数据,越不能随意调用。

因此,微信很难彻底变成一个 AI-native 的新入口。腾讯也很清楚这一点,所以它的一些动作更多是「试探式接入」,而非全面押注。

在「模型+基建+入口」的新三位一体中,腾讯尚未亮出与之匹配的、具有代际颠覆性的新组合。

它的混元模型采用了务实的 MoE 架构,主打降本增效,这虽然符合腾讯一贯的「后发制人」风格,但在技术信仰者眼中显得过于保守。更关键的是,当用户习惯了在「豆包」或未来的 AI 眼镜中直接与 AI 对话时,微信这种基于「手指+屏幕」的交互形态是否会被改变?

微信固然具有社交关系链的不可替代性,但在 AI 这种能重塑人机关系的底层技术面前,旧时代的护城河是否依然宽阔,仍需时间验证。

新的时代里,谁在上船,谁又会下船?

如果要给当下一个判断:字节已经在新船票所要求的三层结构上跑在了前面;阿里有着完整的结构,但入口仍在验证;腾讯则是手握旧船票,但尚未解锁新船规则。

更重要的是,这场竞争已经从「有没有大模型」,升级为谁真正理解了 AI 时代用户价值的交付方式。

根据阿里云的内部预判,AI 带来的市场空间不是简单的线性增长,而是原有 IT 预算的 10 倍以上。因为它创造了过去不存在的数字员工和全天候工作的智能体,这将是一场对社会生产力预算的重新分配。

单一App 的战争已经没有那么重要,更重要的是交互范式、履约能力和系统整合能力的战争。

事实上,每个时代都在上演着「上船」与「下船」的更替。旧时代的巨头未必都能驶入新的航道,这个世界也从未只属于巨头。

尽管巨头在新时代的觉醒让争夺「船票」的门槛变高、压力倍增,但是其中也依旧存在着新的可能性。而这可能才是除了巨头之外,更令人期待的新看点。

 

深度解读|为什么飞书和安克要联合发布一个随身录音设备?

2026年1月20日 15:13
作者|连冉
编辑|张鹏

1 月 19 日消息,飞书与安克创新联合发布了智能录音硬件产品「安克 AI 录音豆」。

这款产品,本质上是飞书与安克创新的深度合作成果。研发分工上,硬件由安克创新负责,飞书不参与具体硬件研发;飞书的角色在于提供软件与 AI 能力支持,以及开放接口,使设备录音可直接接入飞书体系。

具体而言,录音数据通过硬件采集后,自动导入飞书生态,由飞书完成 AI 总结与内容结构化,并最终沉淀为飞书文档,纳入其文档管理与内部协同系统。

安克创新是飞书的重要标杆用户,且属于深度共创与规模化应用的大用户类型。2020 年 8 月起,安克创新就开始与飞书项目共创,2021 年全面引入飞书构建学习型组织,到目前已集成绝大多数业务系统,覆盖 OKR、绩效、招聘、项目管理、AI 助手等全场景,还将管理流程嵌入飞书生态。

这款产品的诞生,实际上是飞书在寻找 AI 时代更高效的「输入方式」。安克作为深度共创伙伴,提供了成熟的硬件拾音方案,而飞书则负责将这些声音转化为可流动的信息与知识。

这种分工可能预示着,飞书正在尝试把协作的边界从软件屏幕延伸到物理空间——通过更专业的硬件触点捕捉全量的「组织上下文」,从而让 AI 能够真正基于真实场景,为团队协作提供增量价值。

 

01

克制的硬件设计:
随身记录的物理 Input
 

目前来看,这款设备的硬件设计走的是「朴素且实用」的工业风。

它的形态并不像传统意义上的录音笔,更像是一枚可以随身佩戴的小扣子——机身直径仅 23.2 毫米、单体重量约 10 克。

无论是夹在领口、挂在脖子上,还是磁吸在背板上,它都在刻意弱化「使用门槛」这件事本身:不需要掏出手机,也不需要打开 App,记录这件事变成了一种随身存在的默认状态。 

在硬件能力上,这枚「小扣子」内置双麦克风阵列,支持约 5 米范围的收音,单体可连续录音约 8 小时,配合充电仓可实现 32 小时续航。录音数据通过蓝牙与 Wi-Fi 双通道传输,最终自动导入飞书体系,由飞书完成语音转文字、发言人识别、AI 可视化总结,并在会后生成结构化的智能纪要文档。 

相比于手机或电脑,这款设备是一款更「专用」的随身语音输入设备。它不占用手机电量,也不需要繁琐操作,旨在为会议、采访以及日常临时沟通等移动场景,提供一个极简的输入入口。

在定价策略与收费模式上,这款产品采用了「硬件一次性购买 + 软件服务订阅」的组合方式。硬件在800元左右;订阅上,前期赠送6个月会员, 含1500 分钟、25 篇 (次)总结,赠送期结束后订阅制会员费约为 69 元/月,含 3,000 分钟录音及 50 篇/次总结),虽然初期体感价格偏高,但其商业模式已初显闭环 。

据极客公园实测体验,在使用中最直观的感受是便捷。相比于在手机上需要点开 APP,这种一键启动录音的物理操作,在会议、采访以及一些日常临时沟通等突发场景下优势明显。得益于充电仓设计,录音模块被做得极度小巧,且碎片化充电的方式基本解决了「电量焦虑」问题。

在收音表现上,这款设备呈现出较强的针对性。相比手机录音,它的音场表现略显局促。在会议场景中发现,当说话人距离较远或所处方位不同时,收音质量会出现小幅波动。但如果仅仅作为语音转文字的「记录」工具,它已经完全够用了。

而在软件侧,它完全依托于飞书的AI录音能力,功能与在飞书中直接启动「AI录音」并无区别。不过,它的智能纪要属于录音结束后「全自动」生成。由于缺乏人工即时补充说话人身份、主题背景等关键要素,直出的纪要不可避免地会存在一些偏差和错误。

使用下来能感受到目前的阶段,这套系统更像是一个个人的「高效备忘录」,如果想直接用于团队间的正式分享和同步,仍然需要人工进行额外的干预和校对。

 

02

构建 AI 时代的「上下文工程」

 

硬件层面的便捷只是入口,真正让这款设备区别于普通录音笔的,并不是它服务了多少对话,而是它是否能够成为一个持续采集组织与个人上下文的随身传感器。

这就回到了飞书为什么要出这个设备的问题。

如果仅仅将其归结为「跟风之举」,可能会低估其背后的深层逻辑。从协同办公的演进视角看,飞书此时切入录音硬件领域,非但不早,甚至其实已经有些迟了。

原因不在于「硬件形态」,而在于AI 时代对组织协同的底层需求已经发生了变化

过往以来,飞书的核心价值始终在于「协同」。在传统的协同模式下,组织内部每天产生海量会议录音、的妙记和文档,这些无限丰富的「上下文」(Context)往往因人类处理能力的「带宽」限制而成为信息孤岛——没有哪个管理者有精力复盘每天的大大小小每一场会议。

但在 AI 时代,逻辑发生了改变。AI 最擅长的正是处理海量、非结构化的上下文。飞书需要这款硬件,本质上是在构建一套「以协作为目标」的上下文工程。

只有当前端的传感器(硬件)足够 Ready,AI 才能获得充足的养料,进而去链接不同部门的信息碎片、辅助决策,真正成为组织中的「数字生产力」。

从这个角度看,录音硬件的意义并不在于「录得多清楚」,而在于它是不是一个足够低门槛、足够稳定的上下文采集入口

它越随手、越可靠,组织能够交给 AI 的真实素材就越多;而上下文越丰富,AI 在协同、决策辅助上的潜力就越大。

所以,这类产品并不是「可有可无」,而是 AI 介入组织协同过程中,一个必然会出现的前端形态

这也是为什么,对飞书这样以「协同」为核心定位的产品来说,这件事在本质上是有意义、也是必要的。

对于飞书而言,这次硬件合作或许只是第一步。在未来,飞书完全可以扮演更「Bold」的角色,比如把接口与能力开放出来。

如果任何第三方设备,只要符合标准,就可以直接接入飞书,把录音转化为结构化内容,并进入飞书的文档与协同体系——那么对飞书而言,它获得的是更多高质量上下文,AI 能力被更高频调用,商业上也可以通过订阅、调用等方式获得合理收益。

在这种模式下,前端是谁的硬件并不重要。重要的是,所有数据最终都汇入一个以协作为目标的「上下文工程」中。这也是飞书在 AI 时代必须面对的一次转型。

飞书诞生于「人和人协作」的时代,但它现在面对的,是一个更复杂的新环境,这其中有人与人、人与 AI 以及 AI 与 AI,多重协作关系正在同时发生。工具的竞争之外,更是组织形态重塑的要求。 只有通过更丰富的硬件触点捕捉更全量的上下文,飞书才能在 AI 时代依旧保持其作为「最佳协同工具」的领先地位。

从这个角度看,飞书如果想继续成为「最好的协同工具」,它需要做的不是保守收敛,而是更大胆、更开放——鼓励更多设备、更多入口,进入它的协同上下文体系中。

这或许正是飞书从「人的协同工具」,迈向「人 + AI」混合协同平台过程中,那个关键一步。

*头图来源:极客公园

*蒙苏对本文亦有贡献。

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
 
❌