普通视图

Received before yesterdayTechWeb

从阿里云最年轻副总裁到钉钉CEO,陈宇森凭什么?

作者果青
2026年6月11日 16:58

【TechWeb】6月11日消息,6月11日,阿里巴巴宣布钉钉管理层调整。陈航卸任钉钉CEO,1992年出生的技术极客陈宇森接棒。

陈宇森此前的头衔是阿里云智能集团副总裁、MuleRun(骡子快跑)负责人。

在互联网领域,这堪称一场“极限人事变动”。前一天,阿里巴巴合伙人委员会刚刚在公司内网发布《有情有义有成长,才是阿里文化》,直接批评钉钉团队管理方式“不是阿里文化该有的样子”,第二天便官宣了新CEO。

这是钉钉时隔一年多再次换帅。此前,陈航于2025年3月回归钉钉出任CEO,期间推动了钉钉8.0的发布,主推旗舰AI产品“ONE”。然而这一项目在上线后经历了定位迷失、底层基因冲突、设计逻辑脱节等多重矛盾,最终收缩。6月,离职产品经理的万字长文《置身钉内》,更是将钉钉内部的强压节奏、向上管理争议推到了台前。

业内人士评论,换帅不只是换一个人,它宣告着,钉钉过去赖以成功的组织方式正被彻底打破。

2026阿里云峰会上的陈宇森

现在回过头来看,陈宇森在今年5月阿里云峰会上喊出“AI Native团队效率是Copilot团队10倍”时,可能就预告了这场交接。

谁是陈宇森?

用一个词来概括陈宇森,就是“少年成名”。

陈宇森1992年出生,免试保送进入浙江大学竺可桢学院求是科学班,大学期间加入国内顶尖的网络安全战队“蓝莲花”,是核心成员之一。他曾多次在国内外顶级计算机赛事中夺冠。

2014年,22岁的陈宇森和几位队友联合创办网络安全公司长亭科技。2017年,他因公司在应用层安全领域的技术突破入选福布斯中国“30位30岁以下精英”榜单。2019年,长亭科技被阿里云全资收购,陈宇森自此正式进入阿里体系。

加入阿里后,陈宇森主导了阿里云南美大区从0到1的建设,从基础设施铺设到客户拓展全链路布局,南美大区如今已是阿里云全球增长最快的区域之一。此后,他升至阿里云智能集团副总裁,成为阿里体系内最年轻的副总裁之一,并统筹与SAP、Salesforce等全球领先企业的战略合作。

2024年底到2025年,陈宇森在阿里云内部启动了AI Agent产品MuleRun(骡子快跑)。

2026年6月,接任钉钉CEO后,陈宇森正式成为阿里巴巴最年轻的事业部CEO。

MuleRun,陈宇森的“子弹

要理解为什么是陈宇森接掌钉钉,就必须先理解MuleRun。

MuleRun于2025年9月16日正式上线,定位为全球首个AI Agent交易市场。用户可随租随用、按需付费,创作者则将自己的技能封装为Agent在平台上变现。上线10天,注册用户突破21万,近5000名创作者申请入驻,超过500人通过审核。

其商业表现令人瞩目。截至今年5月,MuleRun已服务中国、日本、巴西、墨西哥等全球43个国家的企业和用户,单月消费超200美金的付费用户占比达34%,付费用户每周完成13个端到端工作任务的交付。全球客户从自由职业者到拉美大型数据中心运营商、世界泳联等国际组织广泛覆盖。对一款成立不到两年的AI产品来说,这样的用户黏性与国际化程度相当罕见。

MuleRun的核心逻辑是务实而非炫技。“我们并不想做一个万能的聊天机器人,Agent要能稳定解决具体问题,才有价值”,陈宇森在2025年云栖大会上这样说。他提出80%的SOP流程加20%大模型能力这一核心假设,与依赖大模型自由对话的通用型Agent形成了鲜明分野。即便AI大模型本身在不断进化,陈宇森始终相信确定性才是商用AI的根本前提。

MuleRun也用实际数据支撑了他的判断。在今年5月20日的阿里云峰会上,陈宇森展示了更关键的发现:AI Native团队和Copilot团队之间的效率差高达10倍。前者AI承担80%的工作,后者AI只承担20%。而企业实现AI Native转型的窗口期,通常仅有18个月。

钉钉的困局

钉钉作为阿里to B的重要产品之一,其组织定位多次变动。

2020年,“云钉一体”战略启动,钉钉与阿里云深度融合。当时阿里希望复制“微软Office+Azure”战略,通过企业上云来拉动钉钉使用,再用钉钉带动更多的云资源消耗。

但是,到2023年8月,钉钉从阿里云独立,成为阿里集团直属的独立业务,纳入“1+6+N”架构中的“N”。这一调整允许钉钉更独立地布局商业化,也开启了它探索AI转型的独立路线。

2025年组织进一步重构。“1+6+N”架构被终结,阿里巴巴将电商、云和AI确立为核心业务,钉钉被划入“其他”板块。

但此后不久,钉钉反而成为承载AI野心的关键角色。今年3月,阿里成立了CEO吴泳铭亲自挂帅的ATH事业群,钉钉以“悟空事业部”的子品牌归入其中。

在AI时代到来之际,钉钉不再只是阿里云的“流量入口”,而成了阿里集团“ALL-IN AI”战略的B端主阵地。它正在试图从一个企业协同工具进化为AI工作入口,用自身积累的庞大企业客户与组织能力赋能AI Native体系。

钉钉面临的问题同样清晰,体量庞大但AI化艰难。是在旧有基础上+AI,打造Copilot团队,还是选择用AI重构一切,打造AI Native团队?这是一个决定未来的重大抉择。

从MuleRun 到钉钉,一场AI转型豪赌

据媒体报道,陈宇森在阿里内部以偏执于“AI Native”著称。MuleRun之所以受阿里高度重视,不只是因为产品和用户数据,更是因为它在实践中证明了两件事:

第一,AI Native不再只是“概念”。 当MuleRun团队发现上千家企业用户中约95%仍停留在Copilot阶段(人类承担80%工作),便开始致力于构建AI真正融入工作流的系统。在接入层、生产层和协同层上,MuleRun分别搭建了Connectors、Pages、Drive、MuleTeam等AI原生套件,使Agent可以在工作流中承担80%工作,人仅完成20%的决策、把关与交付。而在钉钉,这也是全新的产品逻辑。

第二,Agent必须可调用、可定价、可协同。 6月2日,MuleRun上线Enterprise版AI协作IM应用“Messages”,核心设计是让人力员工与AI Agent在同一个工作空间被@、被拉群、持续协作。在钉钉语境下,这让人联想到类似的“AI原生化”前景,未来的钉钉可能不再是一个App,而是一个Agent应用市场。

MuleRun是陈宇森向阿里展示的“样品”,一套经过全球43个国家用户验证的AI Native方法论。他出任钉钉CEO,阿里是要把这套方法论带入7亿用户的战场。

MuleRun是钉钉未来AI战略的“原型机”和“试验田”。

但MuleRun的用户量级是数十万规模,钉钉的用户量级则是7亿(截至2023年底公开数据)。

一位曾经的黑客、连续创业者、AI产品推手,能否将一款跑在阿里云内部的高端小众产品模式,规模化地嫁接到覆盖国民经济全行业的国民级办公平台?

这是陈宇森的赌注,也是钉钉在AI时代最重要的转折点。

文章

2026年高考志愿怎么填报?百度用“AI+真人专家”助你选对未来

作者果青
2026年6月10日 18:05

【TechWeb】6月10日消息,百度正式宣布对其高考服务进行全面升级,核心举措是推出全新的“AI志愿报告”,并引入行业内首创的“真人专家背书”机制。这项服务继续向全国所有考生免费开放,旨在利用技术与数据深度结合,系统性解决长期困扰考生及家长的志愿填报难题。

此外,百度平台现已汇聚全国2200余所高校的20余万名在读及刚毕业学长学姐,提供答疑响应服务,5分钟快速响应率高达90%,覆盖从志愿填报到校园生活的全场景信息需求。

高考服务入口:百度搜索框输入“高考”

点击高考志愿填报

11个维度细化志愿填报

不止上好大学,更要选对未来

今年全国高考报名人数达1290万,然而与庞大考生规模形成对比的,是志愿填报领域长期存在的信息鸿沟。调研数据显示,即便在信息资源更为丰富的一二线城市,也仅有32.6%的家庭能做到科学合理的高考规划;而今年57.27%的考生来自县域高中,普遍面临严重的信息不对称。

百度给出的解决方案是依托其二十年的服务和技术沉淀,提出将通过AI技术弥合上述鸿沟。今年,其高考服务进行了系统性升级,核心依托于两类独一无二的大数据。

一是用户搜索行为大数据。

汇聚了千万考生真实的搜索、关注和选择数据,反映报考的真实趋势、热度及选择偏好。

区别于市面上零散、宏观、晦涩的统计数据,百度的AI系统将这些数据具象化为“报考工具”。

例如,考生可以在“热度榜单”上查看院校和专业的实时热度与关注度,通过“院校专业对比”工具,对不同院校的强势专业、差异计划进行清晰比较,从而直观辅助决策。

二是行业全景就业大数据。

百度联合权威机构,打造了覆盖30+专业门类、170个专业大类、2000+细分专业的专属就业数据库。

该数据库的采样对象全部为应届毕业生及毕业1-2年的职场新人,跳出了传统行业报告统计滞后的局限,能实时反映一线职场最新情况。考生不仅可以查看投档分数线,还能一键了解专业的对口职位、热门就业城市、学历门槛要求、主要企业类型以及未来晋升路径等完整“就业全貌”,从而将当下的专业选择与长远的职业发展精准“锚定”。

这两套数据相互补充、互相支撑,构成了百度高考产品“看懂当下热度”和“预判未来前景”的双核心能力,让专业选择看见未来出路。

核心亮点:“真人专家背书机制”与AI定制化报告

百度的AI志愿报告生成路径被总结为四步:

第一步:全方位“认识你”。

突破传统表单填写,用户可通过“文心助手”进行自然语言对话,系统全方位了解考生的个人喜好(如城市、职业倾向)、学习情况、家庭背景、未来规划等多元化信息,并生成“多维精准的用户画像”。

第二步:个性化“给你推荐”。

AI基于专属用户画像,并结合高考大数据与就业大数据,生成个性化的“冲稳保”梯度志愿方案。

第三步:将未来“讲深讲透”。

报告跳出单纯罗列院校名单的模式,不仅给出结果,还详细拆解“为何如此推荐”的底层逻辑,同时结合国家“十四五”规划等宏观趋势,深度分析专业所学、行业前景、市场需求与城市产业聚集情况,贯通志愿选择与长期发展。

第四步:由真人专家“最后兜底”。

百度强调,这是业内首创的真人背书机制,为确保报告的可靠性与可信度,每份由AI生成的志愿报告,都将由百度合作的资深志愿咨询师进行专业审核和认证。这套“算法精准测算+专家经验兜底”的模式,力求让每一位使用者对报告内容感到安心、信服。

百度表示,已连续第20年推出高考服务,累计服务用户数量超9亿。在今年的全面升级中,其核心目标是以权威数据为基石,打造“懂人”且“可信”的AI志愿报告,并最终通过技术与专业服务,尽可能地抹平信息差、助力科学决策。

文章

DeepSeek招人 建GW级算力基础设施

作者果青
2026年6月9日 14:00

【TechWeb】6月9日消息,DeepSeek社会招聘职位列表显示,其正在招聘“IDC 设计规划工程师”,这一职位直接指向数据中心规划、机房基础设施架构设计、电力系统、制冷系统、网络基础设施以及容量规划等底层工程能力。

岗位职责对数据中心设计能力提出要求,研究并评估新型技术路线,包括液冷、高密度供配电、模块化建设、智能运维等方向;输出设计规范、技术标准、设备选型策略及容量规划方案;与设计院、设备厂商、建设团队及运营团队协同推进项目交付。

DeepSeek认为,今天的数据中心已经从传统机房演进为支撑AI训练与推理的大型工业系统。一旦入职,你将有机会参与从MW到GW级基础设施的规划与建设。你设计的每一个系统、每一个参数、每一个决策,都可能影响未来数万张GPU、数十万台服务器的运行效率与可靠性。
 

文章

Arm高管解读下一代PC:智能体专用硬件平台兴起,PC市场50%目标渐近

作者果青
2026年6月9日 10:23

【TechWeb】6月9日消息,在刚刚过去的COMPUTEX上,AI再度成为绝对的主角。与往年略有不同的是,今年的聚光灯下,PC正在以“智能体计算平台”的形态,重新回到产业讨论的中心。在这一轮由大模型和智能体驱动的变革中,芯片架构及AI计算平台提供商Arm正试图重新定义个人计算的边界。

近日,结束COMPUTEX之行的Arm边缘AI事业部执行副总裁Chris Bergey在北京接受了媒体的采访。他不仅分享了Arm在PC市场的最新进展,更首次深度解读了NVIDIA、Arm、联发科三方联合研发的RTX Spark平台。

Arm边缘AI事业部执行副总裁Chris Bergey

在Chris看来,未来PC市场将一分为二:一类是传统的个人电脑,另一类则是专为AI智能体设计的“全天候运行”的全新硬件品类。

从“工具”到“智能体载体”,PC形态面临分化

“人们对PC的期待已经不一样了。”Chris指出,过去PC行业遵循的是“从入门到高端”的线性升级逻辑,依靠提升主频、增加核心数来区分产品档次。但现在,用户希望PC具备全天电池续航、本地AI助手、轻薄便携且随时在线等特性。

然而,这只是变化的第一层。Chris指出,一个更深层次的分化正在发生:传统PC之外,智能体专用硬件平台正在兴起。

这类设备的用户需求非常明确:PC需要能够7×24小时不间断运行智能体,即使人不在设备前,智能体也能持续执行任务;能够本地运行大模型,且不产生云端服务费;用户的隐私数据完全保留在本地。

“步入智能体时代,新一代硬件成为本地词元生成引擎,”Chris解释道,“产品架构专为智能体应用量身打造。相比之下,传统PC的使用模式在一天中只占很小一部分时间。”他进一步预测,未来的PC将分化为两大品类:一类是轻薄便携、主打日常办公的传统迭代产品;另一类则可能更接近“家庭算力节点”,即便用户外出,也能留在家中全天候不间断运行AI任务。

RTX Spark:下一代PC的技术标杆

要实现上述愿景,硬件平台必须同时满足高算力、大内存、低功耗三大看似矛盾的指标。而NVIDIA在COMPUTEX上发布的RTX Spark,被Chris视为一个“具有突破性意义”的答案。

这款由NVIDIA、Arm、联发科三方联合研发的产品,搭载了20颗Arm处理器内核,结合NVIDIA新一代Blackwell RTX GPU与高性能内存子系统,并原生适配Windows操作系统。

Chris特别强调了RTX Spark中的“统一内存架构”。他详细解释:“统一内存能够让CPU和GPU完整调用全部DRAM以及带宽资源。设备运行各类应用时,可按需灵活调整内存分配比例。这项技术能充分释放AI的性能潜力。”

相比于传统PC中CPU和GPU各自为政、通过PCIe接口传输数据的模式,统一内存架构从根本上突破了带宽瓶颈。Chris以NVIDIA的数据中心Grace CPU为例,指出转向Arm架构是NVIDIA实现CPU与GPU共享同一片内存空间的关键。“Arm计算架构、GPU与统一内存的紧密耦合,已经从根本上改变了云端算力格局,目前也在推动边缘计算实现革新,NVIDIA Vera Rubin就是最新的案例。”

对于外界担心的成本问题,Chris回应称,RTX Spark实际采用的是LPDDR5X而非更昂贵的GDDR6。他指出,产品选型本质是在内存容量与带宽之间做取舍,而大容量统一内存配置反而可以释放更高的整机性能,无论对游戏玩家还是AI工作负载,都具备更强的吸引力。

市场格局重塑:Arm的50%市场份额目标并非空谈

早在2024年COMPUTEX上,Chris与Arm首席执行官Rene Haas就曾预测,Arm有望在较短时间内占据PC市场约50%的份额。Chris表示,现在再看,这个目标正逐步成为现实。

在传统便携PC市场,苹果MacBook Neo系列已将高端体验下探至6000元以内,谷歌发布Googlebook重新定义笔记本互联体验,而宏碁、微软等品牌的Windows on Arm设备也已全面落地。

但更值得关注的是智能体计算平台的崛起。除了MacBook 凭借统一内存成为本地AI开发者的首选,中国本土厂商也在发力。此芯科技推出的Claw Station,就是与Arm紧密合作的成果,已获得联想、MetaComputing等十余家合作伙伴的支持。

Chris认为,Arm在PC市场的核心优势来自两点:一是领先的能效与算力密度,让芯片在同等面积内集成更多核心,从而控制成本或延长续航;二是Arm CPU能够与高性能GPU如NVIDIA Blackwell实现紧密耦合,并发挥统一内存架构的全部潜力。

预告与腾讯游戏的更多合作进展

另外,Chris Bergey还透露,AI对游戏与图形领域的重塑同样令人期待:5月底,腾讯游戏发布了全球首个跨平台神经动态全局光照方案MagicDawn NDGI,已与Arm达成战略合作,深度适配2026 最新一代Arm GPU及其内置的AI加速器。Chris表示:“近期我们将发布更多AI图形技术在游戏领域的新进展。此外,在今年下半年还将带来令人兴奋的重磅产品,搭载移动端AI游戏、AI图形技术的终端产品也会陆续上市,整体进展值得期待。”

“每次来华,亲眼见证中国如火如荼的AI创新发展都令人欣喜。”Chris表示,“Arm十分荣幸能够深度融入中国本土产业生态,与本土企业共同推进芯片研发与产业创新。”

 

文章

OpenAI秘密提交IPO申请 CEO披露三大主攻方向

作者果青
2026年6月9日 09:13

【TechWeb】6月9日消息,继主要竞争对手Anthropic上周率先递交IPO申请之后,OpenAI在8日连续发布多项重磅信息,涵盖上市筹备、公司未来三年战略规划以及外部经济研究合作。

这一系列密集披露,意味着全球两大AI领军企业的上市竞速正式拉开帷幕。

IPO竞速:OpenAI紧随Anthropic提交S-1文件

OpenAI宣布已向美国证券交易委员会(SEC)秘密提交了S-1注册声明草案。公司坦言:“我们预料到这份文件可能会泄露,因此直接予以公布。”

OpenAI尚未确定上市的具体时间,并表示可能还需要一段时间,因为有些想做的事情作为私营公司更容易完成。但提交S-1文件为OpenAI保留了“如果尽早上市是最优选择,就可以这么做”的灵活性。

值得注意的是,就在不到一周前的6月1日,OpenAI的主要竞争对手Anthropic已率先向SEC秘密递交了IPO申请。这家由前OpenAI员工于2021年创立的AI公司,在递交上市材料前刚刚完成650亿美元的H轮融资,投后估值攀升至9650亿美元,历史上首次超过OpenAI(最新估值约7300亿美元),成为全球估值最高的独角兽企业。Anthropic方面表示,公司当前年化营收已突破470亿美元,远高于2025年末的90亿美元,并有望在二季度首次实现调整后运营盈利。

业内普遍预期,如果进展顺利,Anthropic最快可能在2026年秋季挂牌上市。与此同时,SpaceX也在推进其史上最大规模的IPO计划,目标估值约2万亿美元,计划募资超750亿美元。SpaceX、Anthropic和OpenAI三家科技巨头的IPO预计合计融资规模将达到数千亿美元,这将是自互联网泡沫以来最引人注目的科技IPO浪潮之一。

在获悉Anthropic率先递表后,OpenAI CEO萨姆·奥尔特曼(Sam Altman)在CNBC访谈中表示:“OpenAI会在我们认为时机成熟时上市。上市属于一种融资行为,我不觉得我们目前会把重点放在决定上市的具体时间上。”

不过,据外媒报道,OpenAI内部正围绕上市时间展开争论,高管团队存在明显立场分歧,CFO认为公司在2026年前尚不具备上市条件,而CEO则希望最快在今年第四季度推动上市。

CEO公开信公布“造福所有人”的三阶段计划

在IPO消息之外,OpenAI CEO萨姆·奥尔特曼(Sam Altman)与研究负责人雅各布·帕乔基(Jakub Pachocki)联合发表了长篇计划《为造福所有人而生:我们的计划》。

公开信回顾了电力等通用技术的历史轨迹,并提出AI应当像电力一样,成为人人都能获取并用以改善生活的基础设施。

该文明确提出OpenAI已进入“第三阶段”:随着经济开始围绕AI重塑,核心任务不再是证明前沿能力,而是让先进AI变得充裕、可负担、安全、易用,使每个人和组织都能受益。

为实现这一目标,OpenAI确立了三大主攻方向:

1、构建自动化的AI研究员:预计到2028年3月,大部分AI研究将由AI系统与人类研究员协同完成,以加速AI对齐(alignment)等关键难题的突破。

2、加速经济发展:通过提升科学进步、生产力和经济增长,同时确保收益广泛共享,让每个人都能获得AI创造繁荣中有意义的一份。

3、赋予地球每个人一个专属AGI:使所有人能够以自己选择的方式,从这项最具变革性的技术中受益。

公开信同时强调,完全自动化不是OpenAI想要的未来,“那会让人感到不满足,而且是危险的”。人的判断、价值观和责任感将变得更加重要,“人的一个关键长期角色将是决定什么事情值得去做”。

OpenAI还呼吁建立国际协调组织,以应对前沿AI可能带来的灾难性风险,并在必要时减缓开发速度以保障社会韧性。文中还特别提出了“AI韧性”的概念,就像汽车带来安全带、交通法规一样,社会需要为AI建立类似的系统性防护措施。

推出经济研究交流平台,推动AI影响实证研究

在战略愿景之外,OpenAI还同步宣布启动“OpenAI经济研究交流平台”(OpenAI Economic Research Exchange)。该平台旨在支持关于人工智能经济影响的高质量外部研究,通过与研究人员开展结构化、项目化的合作,产出可信的实证证据,揭示AI如何改变劳动者、企业、机构及整个经济体系。

OpenAI表示,将向入选的研究人员提供其工具和数据集的受控访问权限,并严格保障用户隐私与数据使用的责任边界。研究主题可涵盖劳动经济学、生产率、企业动态、教育、创业、不平等等多个领域。

申请截止日期为2026年7月5日,入选结果将于7月31日前公布。这一平台是OpenAI此前“OpenAI Signals”等经济衡量项目的延续,意在为政策制定者与公众应对快速技术变革提供更扎实的证据基础。

以上三则消息共同勾勒出OpenAI当前的核心张力:一方面,它以“造福全人类”为使命,强调权力广泛分布、安全对齐和社会韧性,并主动邀请外部研究力量共同衡量AI的经济影响;另一方面,它又在紧锣密鼓地为上市做准备,试图通过资本市场获得更充裕的资金来支撑其雄心勃勃的AGI研发计划。

正如奥尔特曼在公开信中所言,上市决策面临“一系列复杂的权衡”。如何在资本压力与使命约束之间保持平衡,将成为OpenAI未来数月乃至数年内最受关注的看点。

文章

5月DeepSeek网站月访问量突破5亿,百度系全面回暖

作者果青
2026年6月8日 16:40

【TechWeb】6月8日消息,AI产品榜·网站榜(Web)(2026年05月榜)发布。

国内总榜方面,DeepSeek月访问 5.41亿(上个月4.86 亿),环比 +11.22%,排名国内总榜第1、全球总榜第5。紧随其后的是纳米AI搜索(1.98亿)、豆包(1.64亿,+0.46%)、Kimi(4608 万,+5.45%)、千问(4428 万,0.1%)组成的国内第二梯队。

增速榜方面,国内增速榜第一名是字节的扣子,月访问 773万,环比 +20.84%。紧随其后的是百度系多款产品:百度AI 搜索 3943万、+20.65% 排第二,百度橙篇 778万、+16.01% 排第五,文心一言 +14.53%。百度在搜索、长文创作、对话助手三条线上同时回暖。


 

文章

MiniMax计费模式突然调整引发用户集体维权

作者果青
2026年6月5日 14:24

【TechWeb】6月5日消息,此前国内人工智能大模型公司MiniMax宣布,自2025年6月1日起,其API服务的计费模式将由原有的“按次计费”全面调整为“按Token计费”。这一变动迅速在开发者及企业用户群体中引发强烈反响,大量用户通过官方社群、投诉平台及社交媒体表达不满,形成集中投诉潮。

据多位用户反映,MiniMax此次计费调整存在两大争议焦点:

一是用户普遍表示,公司在变更前未通过邮件、站内信或公告等形式进行明确、提前的通知,也未就新旧计费模式的转换方案与用户进行任何形式的协商。部分用户称,直到6月1日实际调用接口时才发现计费规则已改变,导致项目预算突然失控。

二是采用Token计费后,用户发现完成同等规模的文本生成或对话任务,Token消耗量显著高于行业主流水平(例如相比OpenAI的GPT系列或国内其他头部模型)。有开发者举例称,此前按次调用可完成数百轮交互的月度套餐额度,在Token计费下仅数日便耗尽,且难以从后台日志中追溯具体Token计算明细。用户认为MiniMax在Token定义、分词逻辑或计费系数上缺乏透明度,存在“隐性涨价”嫌疑。

连夜致歉,承诺老用户权益保留并提升额度

面对舆论压力,MiniMax母公司稀宇科技于6月2日晚间通过官方渠道发布致歉公告。公告核心内容包括:

承认此次计费模式调整过程中存在“沟通不充分、过渡方案考虑不周”的问题,并向受影响用户正式道歉。

承诺对原无周限额(即每周调用次数不设上限)的老用户,继续保留该权益,不会强制切换至新的Token计费体系。

推出临时补偿措施:对所有在调整前已产生有效付费记录的用户,额外赠送一定额度的免费Token包,并上调基础套餐的Token总量上限。

表示将尽快上线更透明的Token用量查询与预警工具,并开放为期两周的意见反馈通道,供用户对计费细则提出建议。

并非孤例,月之暗面Kimi此前因类似调整陷入投诉风波

MiniMax并非首个因计费模式调整引发用户维权的大模型厂商。就在此前不久,另一知名AI公司月之暗面旗下的Kimi大模型,同样尝试从按次或周期计费转向更精细化的Token计费模式,过程中也因通知不到位、过渡期短以及Token消耗与实际产出不匹配等问题,招致大量开发者和企业客户的集中投诉。尽管月之暗面后续也推出了部分澄清与优惠措施,但该事件已暴露出整个行业在商业化计费标准从粗放走向精细化过程中,普遍存在的用户沟通短板。

业内人士分析认为,随着大模型API从“抢用户”阶段进入“拼成本”阶段,厂商极易引发“价格不透明”的质疑,建立清晰、可验证且用户可理解的计费体系,才是维持长期信任的基础。

 

 

文章

便宜好用真香!美国企业把DeepSeek买上了趋势榜第一

作者果青
2026年6月5日 07:56

【TechWeb】6月5日消息,近日,美国企业支出管理平台Ramp发布2026年6月热门软件供应商榜单,中国AI公司DeepSeek登上趋势榜首位,超越活动管理平台PheedLoop和开源AI基础设施公司Fireworks AI。

在这份基于Ramp平台5万多家企业信用卡交易数据的月度榜单中,DeepSeek的企业采用率为0.1%,该采用率在美国企业中虽仍属较低水平,同期Anthropic和OpenAI的采用率分别为34.4%和32.3%。

但这是DeepSeek在经历2025年1月达到0.3%峰值后回落以来的首次重返增长,被Ramp经济学家Ara Kharazian判定为美国企业“正在用真金白银投票”的关键信号。

Ramp的报告还揭示了一个商业现实:美国企业并未选择在本地服务器上运行DeepSeek的开源版本,而是直接在向DeepSeek官方付款,数据通过DeepSeek官方服务发送和接收。

推动美国企业向DeepSeek付款的根本动力来自成本。

根据DeepSeek官方定价数据,V4 Pro模型输入成本为每百万Token 0.435美元,输出成本为每百万Token 0.87美元,输入成本比Anthropic的Claude Sonnet或OpenAI的GPT-5.5-Med便宜7倍,输出成本便宜17倍;其轻量版V4 Flash对比Claude Haiku等入门级替代方案的价差达到10至25倍。

更为关键的是,DeepSeek在本周进一步宣布将V4 Pro的API定价永久性地调整为原价的四分之一,即从每百万输出Token 3.48美元降至0.87美元。

成本差距已开始影响企业AI支出的结构性分配。

无独有偶,6月4日,美国AI Agent初创公司Lindy的创始人兼CEO Flo Crivello在X平台宣布,公司已将100%的用户端流量从Anthropic模型切换至DeepSeek V4,在多个核心任务中看到性能提升,同时节省了数百万美元的模型推理成本。不过,Crivello也同时承认,这次切换的实际工作量远超预期,团队花了大量时间搭建配套基础设施,“实际工作量比最初预想高出100倍”。

更值得长期关注的趋势超越DeepSeek本身。

在Ramp 6月趋势榜上,除DeepSeek外,Fireworks AI、fal AI和DeepInfra等提供开源模型API调用的推理服务平台也纷纷进入快速增长名单。Ramp报告指出,美国企业正在系统性地将最复杂的任务保留给OpenAI或Anthropic的旗舰模型,而将大量日常常规任务转移到更经济的替代方案,这种“按任务分流”的智能路由策略正成为主流企业的AI支出范式。

据AI.cc《2026年AI API基础设施报告》分析,开源和开放权重模型在2026年第一季度企业Token用量中的份额已达到38%,较上年同期的11%大幅上升。同时,根据Andreessen Horowitz的基础设施分析,企业生产环境现在中位数同时部署14个模型,以按价格路由工作负载并避免单一供应商锁定。

这种结构性变化正在从创始人端的直觉判断,转化成企业侧采购数据和财务支出的可验证事实。CFO们正在将AI成本问题从技术团队的风险掌控,重新归入财务规划和成本中心的逻辑体系中。企业对“降低AI支出”的需求仍然具有足够的市场动力这种动力的牵引方向,正在悄然重塑企业AI基础设施的结构版图。


 

文章

大模型企业扎堆IPO:智谱MiniMax冲刺A股,Anthropic抢先OpenAI递表

作者果青
2026年6月2日 21:01

【TechWeb】6月2日消息,2026年6月的第一天,全球人工智能资本市场的战鼓接连敲响。大洋两岸,一场史无前例的大模型上市竞赛同步升温。中国“大模型双雄”智谱与MiniMax先后启动A股征程,美国AI新贵Anthropic则抢先OpenAI向SEC秘密提交IPO申请。

Anthropic向SEC秘密提交IPO申请

全球最具影响力的AI头部企业,正以前所未有的步伐扎堆冲向公开资本市场。

中国“大模型双雄”加速回A

6月1日晚间,港股市值逼近7000亿港元的“全球大模型第一股”智谱发布公告,宣布公司董事会已全票通过建议发行A股并在上海证券交易所科创板上市的决议案。这是智谱自今年1月登陆港交所以来的又一重大资本动作。

根据公告,智谱拟发行不少于909.88万股且不超过3876.90万股新A股,占发行后总股本的2%至8%,募集资金净额预计不超过150亿元人民币。募资将主要投向三大方向:120亿元用于“人工智能通用基座大模型”项目,20亿元用于“大模型MaaS一站式服务平台”,剩余10亿元补充流动资金。

150亿元的募资规模远超智谱今年1月在港交所上市时的融资额,当时其全球发售净筹资仅约41.73亿港元,约合人民币36亿元。此番回A,智谱拟构建“A+H”双重上市平台,拓宽融资渠道,以推进大模型研发与商业化。

就在智谱宣布回A的两天前,与它并称“国产大模型双雄”的MiniMax已于5月29日与中信证券签署上市辅导协议,正式启动A股IPO进程,同样剑指科创板。

这意味着,今年1月前后脚登陆港股的两家AI头部企业,有望在A股科创板再度会师,共同打造A股市场首批纯正的大模型核心资产标的。

两家公司自港股上市以来股价表现惊人。截至6月2日,智谱股价报1412港元/股,较1月116.2港元的发行价涨幅超过12倍,总市值近6300亿港元。

MiniMax上市首日即以109%涨幅打破纪录,截至6月2日报收667.5港元,较发行价165港元累计涨幅超过300%,总市值稳定在2000亿港元左右。

不过在靓丽的股价背后,财务数据依然折射出大模型赛道的“烧钱”现实。2025年,智谱实现营业收入7.24亿元,同比增长131.9%,但经调整净亏损31.82亿元;MiniMax全年总收入7903.8万美元,同比增长158.9%,经调整净亏损2.51亿美元。营收翻倍,亏损扩大,这是大模型公司当前面临的普遍困境。

大洋彼岸:Anthropic抢先OpenAI递表

太平洋的另一端,竞争同样激烈。

就在智谱发布回A公告的同一天,美国AI巨头Anthropic正式宣布已向美国证券交易委员会秘密提交IPO注册声明草案,成为首家正式启动上市流程的AI超级独角兽。

根据披露,其最新投后估值已达9650亿美元,超过OpenAI约8520亿美元的估值,逼近万亿美元大关。最快可能于今年秋季登陆资本市场。

Anthropic成立于2021年,由前OpenAI研究人员创立,核心产品Claude系列大模型以自动编程工具Claude Code为支点实现了惊人的增长。公司5月年化收入运行率已突破470亿美元,较2025年底的90亿美元在短短半年内暴涨5倍。

此次抢先递交IPO申请,将Anthropic与OpenAI的竞争从模型能力、估值规模,推向了公开市场定价权的深层博弈。DA Davidson分析师Gil Luria指出,率先上市者将率先定义行业财务披露逻辑,从而获得先发的话语权优势。

值得关注的是,SpaceX也正以1.75万亿至2万亿美元的估值推进IPO,最快可能在6月中旬开始交易。

Dealogic数据显示,截至5月26日全球IPO融资额已达875亿美元,为2021年以来同期最高水平。但三家超大体量的IPO若在同一窗口密集登场,将对资本市场资金面形成极限压力测试。

扎堆上市背后:融资跑步机无人敢停

全球大模型企业为何在这一时间窗口扎堆上市?原因可概括为三个关键词:缺钱、抢跑、卡位。

首先是缺钱的现实。大模型研发堪称“吞金兽”。智谱每月研发支出高达2.66亿元。Anthropic同样因算力需求激增,不得不向亚马逊、谷歌等巨头持续采购计算资源。港股融资所得有限,智谱A股150亿元的募资计划恰印证了其对资本的迫切需求。

其次是窗口的紧迫性。当前全球IPO市场处于近五年来最活跃的窗口,但市场共识正在形成:SpaceX、Anthropic、OpenAI三家的合计资本需求将非常庞大,很可能扰动市场,早一点上市将是巨大优势。正如IPO研究机构IPOX副总裁所言,“在SpaceX之后不久递表,使Anthropic能够趁窗口仍然有利”。

第三是定价权之争。上市时点不仅关乎融资,更关乎定义行业估值范式的“先发优势”。谁先上市,谁就有权定义“AI公司应该如何被定价”。在美国,这场定价权的争夺已在Anthropic与OpenAI之间全面展开;在中国,智谱与MiniMax同样在A+H的双平台上竞速。

与此同时,追赶者的脚步从未停歇。Kimi即将完成20亿美元新融资,阶跃星辰25亿美元Pre-IPO融资传闻沸沸扬扬,DeepSeek的融资消息震动投资圈。资本的盛宴仍在继续,没有人敢在这场“融资跑步机”上停下来。

大模型的资本竞赛已从一级市场的融资狂欢,全面升级为二级市场的IPO攻防战。在这场没有硝烟的竞速中,谁能率先撞线?答案或许将在今年秋季揭晓。

但无论结果如何,2026年注定将以“大模型IPO元年”的称号,被写进全球科技史。

文章

❌