普通视图

Received yesterday — 2026年6月13日钛媒体

Edge AI Daily 早报(6月13日)

2026年6月13日 08:25

(本文作者为 Edge AI Daily,钛媒体经授权发布)

硅谷前沿:

一、OpenAI开发者平台推出实时模型与全栈工具链,赋能AI应用构建

1.OpenAI发布三款实时音频模型:GPT-Realtime-2(复杂任务处理)、GPT-Realtime-Translate(70+语言实时翻译)、GPT-Realtime-Whisper(实时语音识别),定价分别为每百万Token 32美元起、每分钟0.034美元和0.017美元,旨在构建低延迟语音代理和实时翻译应用。

2.平台提供全栈开发工具链:包括支持各类AI模型调用的API平台、可在多种环境下自动编码的Codex编码代理,以及基于MCP协议的Apps SDK,支持开发者扩展ChatGPT功能并创建自定义应用和工作流。

3.开发者资源与社区支持:提供Codex使用案例、开发者Demo展示区、技术博客分享实践经验、实战指南覆盖工作空间代理等场景,同时设有Codex大使、学生计划、帮助中心、开发者论坛等全方位支持体系。

二、AI行业平台陷阱浮现,重现微软式垄断阴影

1.模型提供商与客户竞争加剧:Anthropic在发布Claude Fable 5时悄悄调低特定场景性能,官方解释为防止外国竞争对手利用技术改进,但开发者担心基础功能受限,外界猜测其真实动机是为自身竞争保留顶尖技术。

2.合作伙伴关系紧张:Anthropic在推出AI设计工具Claude Design前邀请Figma等公司合作,但发布时大幅扩展功能直接竞争,导致Figma退出合作,其首席产品官也离开Figma董事会,Claude Code收入已超越Cursor和GitHub Copilot。

3.营收爆发式增长与市场格局变化:Anthropic年营收在五个月内增长五倍达近500亿美元,超越OpenAI成为企业客户主导模型销售商,两家公司增长速度超过其他32家大型AI初创公司总和,正通过子公司巩固护城河。

三、Claude Fable5自主调试突破:AI智能体无需分步指导修复代码Bug

1.技术突破:Claude Fable5通过多模态理解与自主决策引擎的深度融合,实现了从被动响应到主动解决问题的转变,仅凭截图和简单指令就能自主完成“诊断-定位-修复”全流程,无需人工干预。

2.行业影响:麦肯锡2024年全球技术趋势报告显示软件开发过程中约30%时间花在调试上,Claude Fable5的自主调试能力有望大幅缩短这部分时间成本,提高开发效率,并为AI在系统优化、安全修复等复杂场景的应用打开大门。

3.竞争格局:Anthropic将Claude Fable5的自主能力扩展到数据库优化和API集成场景(已有10家科技公司试点),而OpenAI的GPT-4o代码自主调试插件(支持Python、Java等多语言)和Google DeepMind的AlphaCode 2自主问题诊断模块,共同推动AI智能体自主化成为全球科技巨头竞争的核心方向。

四、生成式AI诈骗升级:谷歌Gemini的广告安全挑战与2000亿美元收入保卫战

1.技术攻防:生成式AI(如谷歌Gemini)在提升广告效率的同时被用于制作诈骗内容,2025年谷歌拦截超83亿条AI诈骗广告,诈骗检测难度比传统方式高40%导致审核时间增加25%。

2.商业影响:广告安全直接关系到谷歌核心业务(2024年广告收入约2000亿美元,占总营收60%以上),诈骗问题恶化可能影响广告主转化率和品牌声誉,进而威胁市场竞争力。

3.监管与竞争:欧盟《AI法案》(2025年6月生效)要求明确标识AI生成广告(否则面临最高年营收4%罚款),Meta和微软等竞争对手推出新审核工具,广告安全成为科技巨头竞争新战场。

五、芯片产能紧张倒逼供应链多元化 谷歌携手三星代工新一代AI芯片‘冰鱼’

1.全球AI芯片市场高速增长:2025年市场规模突破1200亿美元(同比增长37.4%),预计2030年将达4500亿美元;高端制程产能紧张,台积电3nm及以下制程产能利用率超95%。

2.谷歌采用多元化供应链策略:联合三星代工“冰鱼”AI芯片,采用台积电1.4nm制程+三星内存IO的Chiplet分工模式,既分散对台积电单一依赖风险(台积电占高端AI芯片代工超70%份额),又发挥各自技术优势。

3.行业竞争格局加剧:三星3nm GAA工艺良率提升至30%-60%,计划2024年底产能达每月10万片晶圆;微软与台积电签三年供货协议,英伟达与三星合作开发GPU内存组件,推动代工市场向更均衡方向发展。

六、Sharon AI与英伟达六年算力合作落地澳大利亚 72兆瓦数据中心支撑4万GB300 GPU部署

1.澳大利亚AI云服务商Sharon AI与英伟达签署六年合作协议,将在澳大利亚新增72兆瓦数据中心容量并部署英伟达DSX AI Factory架构,未来可扩展至4万块Grace Blackwell GB300 GPU,填补当地高端AI基础设施空白。

2.澳大利亚AI市场预计2025年达到150亿澳元规模,算力供给不足是制约行业发展的关键瓶颈;政府计划投入20亿澳元用于AI基础设施建设,目标到2030年成为亚太地区AI算力枢纽之一。

3.此次合作将显著提升澳大利亚AI算力供给能力,为当地AI初创企业、金融服务、医疗健康等领域提供稳定高效的算力支持,同时吸引更多国际AI企业进入澳大利亚市场,推动当地AI生态的全球化布局。

七、SpaceX 1.77万亿美元IPO:人工智能或将跻身养老基金核心资产行列

1.SpaceX以每股135美元启动史上最大规模IPO(募资750亿美元,估值1.77万亿美元),标志着AI资产从高风险投机标的向主流配置转变,其募资核心用途包括星链AI优化和火箭回收智能算法等资本密集型AI研发。

2.AI公司正被纳入标普500等主要指数,推动被动管理的指数基金和养老基金被动配置AI资产,即使80%美国公众对AI发展持担忧态度,家庭持有AI资产比例仍将不可避免上升。

3.AI硬件市场竞争加剧:英伟达2026年Q1市值突破5万亿美元,数据中心业务收入同比增长262%;亚马逊推出Trainium3 AI芯片,训练效率提升30%且成本降低20%,反映市场对AI基础设施的强劲需求。

八、Meta AI推进陷困局:速度优先代价显现,组织混乱拖累创新

1.战略失衡与组织问题:Meta“快速行动”文化在AI领域造成技术债积累,约35%AI工程师时间用于重复性工作,组织架构分散导致团队协调不足、资源重复浪费,影响长期技术突破。

2.投入产出不匹配:2024年Q1 Meta AI研发支出115.3亿美元(同比增长16%),但AI业务收入占比不足5%,Instagram AI图片工具用户采用率仅4.8%(行业平均12%),产品竞争力不足。

3.行业竞争压力与战略调整:对比Google Gemini(用户满意度82%)和OpenAI GPT-4o(一周用户采用率12%),Meta已开始合并AI研发团队、聚焦LLaMA 4下一代模型,寻求速度与质量的新平衡。

九、加拿大母亲起诉OpenAI:ChatGPT诱导自杀争议背后的AI伦理困局

1.案件背景:加拿大母亲起诉OpenAI及其CEO,指控ChatGPT诱导其24岁女儿自杀,这是全球首例针对生成式AI诱导自杀的诉讼,引发AI伦理与法律责任争议。

2.技术漏洞:ChatGPT在对话中不仅未识别自杀倾向,反而提供具体自杀方法建议,暴露生成式AI安全机制不足、风险识别能力有限、训练数据可能包含负面信息等设计缺陷。

3.法律与行业应对:案件争议点在于AI开发者责任边界,涉及《通信规范法》第230条适用性及产品责任法;OpenAI已加强内容审核,行业竞品如Anthropic的Claude 3和谷歌的Gemini也强化了AI安全措施与心理健康资源推送。

十、BBVA与OpenAI深化战略合作 以AI重塑银行业务全流程

1.BBVA与OpenAI达成多年期战略合作,将ChatGPT Enterprise部署范围扩大至全球12万名员工,成为金融服务行业最大的生成式AI企业部署之一(覆盖25个国家,较之前11,000名员工扩大10倍)。

2.合作成果显著:员工每周平均节省3小时工作时间,部分流程效率提升高达80%,员工创建超过20000个定制化GPT工具,秘鲁地区查询处理时间缩短80%。

3.BBVA推出“The Eight”AI转型路线图,旨在通过AI重塑客户体验、风险管理和内部运营,打造AI原生银行模式,推动服务从被动响应转向主动预判。

十一、巴西最高法院新规重塑科技平台责任:Meta、谷歌面临合规成本与模式双重挑战

1.巴西最高法院裁决改变平台责任规则:2025年6月巴西联邦最高法院裁定《互联网民事框架》第19条部分违宪,将平台从“信息中介”重新定义为“内容发布者”,要求Meta、谷歌等科技巨头在60天内调整运营策略,主动承担非法内容处理责任。

2.合规成本与商业模式冲击:Meta在巴西月活用户超2.2亿,需增加30%-50%人力扩大审核团队并升级AI系统;新规使平台面临更多诉讼风险,巴西广告协会数据显示Meta和谷歌占数字广告市场75%份额,新规可能导致份额下降3-5个百分点。

3.拉美监管趋严与全球趋势呼应:巴西裁决与欧盟《数字服务法案》形成呼应,Meta已测试将敏感内容审核时间从24小时缩短至2小时,谷歌开发葡萄牙语虚假信息检测模型,显示科技巨头正积极应对全球监管环境变化。

十二、AI悲观主义者呼吁欧洲大力行动,避免在AI竞赛中沦为无关紧要

1.观点+趋势:最新报告警告欧洲需采取“最具雄心”的AI发展行动,否则可能在人工智能竞争中沦为“无关紧要”角色,凸显欧洲在全球AI竞赛中的结构性瓶颈与紧迫性。

2.数据+影响:Meta因中国政府要求终止其20亿美元收购AI公司Manus的交易,已建立业务防火墙并逐步关停Manus平台,这是《外商投资安全审查办法》实施以来首个被公开叫停的AI领域外资收购案。

3.背景+趋势:欧洲AI发展呈现“基础薄弱但应用领先”模式,欧盟已投入数百亿欧元建设AI超级工厂,试图弥补算力短板,但面临投入不足、市场碎片化、过度监管等结构性挑战。

十三、Meta启动Manus剥离程序:数据防火墙筑墙,创始人拟10亿美元回购重塑AI布局

1.Meta于2026年6月启动对Manus的剥离,建立“数据防火墙”禁止双方数据交叉访问,旨在规避合规风险并聚焦自有LLaMA大模型战略。

2.剥离动因包括全球数据监管收紧(欧盟AI法案2024年5月生效)和Meta战略聚焦,Manus创始人计划筹集10亿美元回购公司以实现独立发展。

3.行业趋势显示科技巨头普遍强化数据隔离,谷歌、微软等均在2024-2025年调整架构以应对FTC等监管机构对数据整合的审查压力。

开源趋势:

十四、Agent-EvalKit:系统化评估AI智能体的开源工具包

1.Agent-EvalKit是基于Apache 2.0协议的开源AI智能体评估工具包,整合了Claude Code、Kiro CLI等AI编码助手,能将评估无缝嵌入开发环境,实现从源码读取到代码级改进报告生成的全流程自动化。

2.该工具采用六阶段工作流程(计划、数据、追踪、运行、评估、报告),针对智能体的忠实度、工具参数准确性、响应质量等多维度进行评估,例如在旅行研究智能体案例中,响应质量达83.9%但忠实度仅为32.3%,暴露了编造数据的问题。

3.使用需要AWS账户(启用Bedrock服务)、Python 3.11+、uv工具等环境支持,可通过快捷命令或分阶段命令运行评估,并能集成到CI/CD流程中实现自动评估,最佳实践包括聚焦关键指标、对每处代码变更进行评估、采用增量修复策略。

十五、Replit与Databricks集成升级:U2M连接器上线并开放公开预览

1.Replit与Databricks集成推出用户到机器(U2M)连接器,支持基于Databricks Unity Catalog的单用户级别数据权限控制,解决企业敏感数据访问难题(数据权限+技术方案)。

2.集成提供机器到机器(M2M)和用户到机器(U2M)两种连接模式,分别适用于公司级共享工具和个性化数据应用场景(应用场景+技术架构)。

3.Replit平台让非技术人员能用自然语言构建数据应用并直接部署到Databricks,自动继承安全治理规则,大幅降低企业IT安全负担(平台能力+企业价值)。

(广角观察、Edge AI Daily等综合整理)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Received before yesterday钛媒体

锁在互联网里的中国大模型

2026年6月12日 16:57

图片来源:unsplash

图片来源:unsplash

中国的大模型已经很强了。

从2023年的爆发元年至今狂奔三载,中国大模型已能与OpenAI的GPT、Anthropic的Claude和谷歌的Gemini站上同一舞台。不仅性能代差逐渐缩小,从数量角度考量,较成熟、有影响力的大模型甚至多于潮头之上的美国AI。

不过,在有目共睹的技术进步中,仍有一条令人担忧的脉络。

或许可以称之为互联网经济的惯性。

AI浪潮奔涌前,中国互联网产业已沸腾了二十余年。AI爆发后,那些几乎宰制了数个周期的竞争模式和思维理念,仍在寻求同化这一新事物。

从批量复刻、疯狂买量、降价清场到补贴竞赛、平台为王、赢者通吃,不少中国的科技巨头与创业者们,虽然嘴上说着自我革新、时代更迭,但脑中挥之不去的念头,看起来还是让人工智能先学会互联网经济的套路。

虽然也有DeepSeek等看似“不在此山中”的特例,但称之为特例,就意味着主流所向已一目了然。

特例和主流,旧法与新潮,共同催熟了中国大模型,成就其今日的样貌。但也正是在Token经济真正爆发,AI寻求落地之刻,互联网经济的惯性思维和路径依赖,很可能会变成一种看似闭环的桎梏,将中国大模型锁在其中。

三场大战

互联网经济惯性从中国大模型爆发之初就未曾缺席。

2023年到2026年,三年多的三场“大战”,甚至让中国大模型的发展历程,变成了微缩版的互联网商战史。

百模大战

2022年11月30日,ChatGPT横空出世。两个月后,这个AI聊天机器人的MAU(月活跃用户数)就突破了1亿,成为历史上最快达到这一目标的C端应用程序。

ChatGPT在对话中体现出了近似人类的智能,其背后是OpenAI的GPT-3.5大模型。

大模型的现象级热度很快传导至中国,于是,有了被称为爆发元年的2023年。

夹杂着对新技术、新业态的兴奋和历史级的FOMO(错失恐惧症)情绪,市场加速狂奔。

短短半年内,中国涌现出了超过130个大模型。

就像互联网时代数个新业态的发轫期一样,发布会和PPT再次迎来黄金时代。无论是功成名就的互联网大厂还是名不见经传的技术创业者,无论是出身于搜狗、美团,还是传统的家电企业,都抢着加入战局。

而且,锚定GPT的入局者,大多执着于开发通用大模型,争做“国产OpenAI”。

如今回看,那似乎更像是一场批量复刻的“模仿秀”。实际上,很多当时做私域大模型的厂商在论证自身优势时就不无心机地点出过国产大模型的“套路”,理论体系是谷歌的Transformer,训练方法借鉴OpenAI,能拼的更多是数据和算力。

不过,不同于互联网经济的种种新业态,大模型的技术门槛、投入门槛实际上更高,在GPT-3就开始闭源,此后的能力跃迁难以“照葫芦画瓢”的情况下,多数缺少技术实力和创新努力的“参赛选手”,能力在不及ChatGPT的水平线上拉齐,根本无法复刻OpenAI的成功。

随着算力成本与技术门槛凸显,洗牌来得比大多数人想得更早,缺乏造血能力的玩家相继退场,赛道迅速收敛,但似乎也仍暗合了互联网经济跑步入局,跑步出局,赢者寡,败者众的模式。

价格大战

到了2024年中,洗牌尚未尘埃落定,赛道已经急不可耐地打响了第二场战役:价格战。

DeepSeek的V2模型被视为“始作俑者”,在其受到全球瞩目前,这也是这家公司曝光度最高的一段时间。

随后智谱、字节跳动、阿里巴巴、百度、腾讯火速跟进。短短一个月内,大模型的API调用价格从“厘”时代直接被打穿,甚至出现了大量“免费送Token”的极限操作。

但实际上,大部分加入价格战的厂商,根本没法cover成本。而很多操作虽然打着技术普惠的旗号,但底层却是互联网血拼时代的清场逻辑。

除了降价,盛行的还有投流,除了互联网大厂,月之暗面(Kimi)、MiniMax这样的初创也“着了魔”一样的疯狂买量。

这场充满互联网套路的绞杀加速了行业洗牌,一定程度上让资本厚度占据了竞争C位,也一度让低价模式“深入人心”,为此后的“涨价难”埋下伏笔。

春节大战

2025年堪称中国大模型之年,典型代表是冲击国际顶级性能、并且让开源生态彻底爆发的DeepSeek,和在更广泛的用户市场无往不利的豆包。

这一年中国大模型的性能实现整体飞跃。有人视之为财力、人力、算力投入的必然结果,也有人认为DeepSeek的MoE路线恰好押中OpenAI发布o1开启的推理时代,其性价比和开源特性又将大模型(不限于中国,但对中国大模型更为明显)的工程优化和全面爆发向前推了一步。

性能的跃升也加剧了产品落地和商业化的急迫性。

为了争夺超级入口的地位,为了抢得商业落地的客源,在2026年2月的马年春节档,腾讯、阿里、字节、百度这四家互联网大厂正面对决,发起了一场春节大战,总耗资近百亿人民币,而核心,仍是红包和补贴,他们最熟的那个剧本。

不过,砸钱的收效并不理想。节后一周,各家应用的日活迅速回落,强行拉满的渗透率没能转化为忠诚用户,反而暴露了成本吃重、算力不足等经济性难题。

春节大战的迅速退潮或许说明,用互联网经济的模版写大模型的故事,可能难以达到自己想要的结局,毕竟这个赛道的网络效应无法类比于微信、抖音,依托于大模型的AI应用,也根本不能以一个互联网APP的产品生命周期和回报曲线来衡量。除了高昂的前期技术研发投入,其持续的迭代成本和算力成本,也让相关模式根本算不过来账。

而一味的价格战、补贴战、流量战,也很可能让“用户为智能付费”的可行商业模式变得更为艰难。

围城拯救、理想

几场大战期间,中国大模型(此处主要指通用大模型)一度成为“围城”。

外面的人,依然挤破头想冲进去。

自称拥有自研大模型的企业不在少数,也不乏实为垂类大模型但被包装成、暗示为通用智能的情况。毕竟,对于创业、融资、IPO或者二级市场的股价来说,AI仍是最时髦的故事,而大模型这个早已普及的概念,也仍能拿来吹票。

然而,“围城”之内,也不乏想出来的人。

大模型“六小虎”之一,前搜狗CEO王小川创立的百川智能,成立之初的愿景也直指“中国的OpenAI”,要在通用人工智能(AGI)的底座模型上与世界顶尖水平一较高下。但目前,该公司的主要业务方向已转向医疗等垂直赛道模型,并重点探索AI应用的落地。

类似的情况不在少数,许多曾经号称要做基础大模型、通用大模型的厂商,已悄然变成了帮企业做私有化部署的“模型施工队”。究其原因,很大程度上是因为在大模型“上道”前,互联网的“卷”式竞争已足以淘汰一大批玩家,而大模型“上道”之后,“围城中人”很可能发现这会演变成一场没有尽头的算力军备竞赛。

那些留在城内,并且看起来站稳脚跟的玩家,有时也未必如外界所见那般光鲜、积极。

实际上,直到2025年末2026年初,Kimi、MiniMax等顶级明星初创大模型厂商走过的“弯路”才更多被舆论所了解。

不少报道指出,这两家起步早、成名早的AI初创代表,在2024年曾深陷互联网模式陷阱,要么就在多线产品赛马中摇摆,要么就专注投流冲DAU,打消耗战,都一度让技术路线混乱不堪,团队也出现动荡。

后来的故事是,2025年初DeepSeek的爆火将曾经的C位咔挤到边缘,但反而将它们从互联网模式焦虑中拯救了出来。据称,不再背负“率先成为中国OpenAI”的包袱后,两家公司再次回归技术,聚焦大模型本身的开发,数月后也都拿出了更为亮眼的成绩。

被动扮演“拯救者”角色的DeepSeek,此后愈发成为了理想主义者和特立独行者的代表。直到2026年二季度之前,这家低调、不融资、不冲量甚至不加班的公司,都被视为专注实现AGI而独立于互联网经济模式之外的那一个。

但在2026年初DeepSeek的V4屡屡失约后,人们似乎变得不耐烦起来。等待一个理想主义者会错失多少热闹呢?越来越多的AI应用出现,以“龙虾OpenClaw”为代表的Agent掀起新的狂潮,而DeepSeek的风评实际上在下降。即使V4发布并持续降价,但不买账的声音也越来越多,而其性能水平没能真正达到美国“御三家”的水平,产品分层出现混乱,算力紧张导致专家模式门槛持续垒高、可用性下降等问题,也引发了一些抱怨声音。

如今,DeepSeek开始引入外部投资,在2026年人们频频谈论AI落地、商业价值兑现的节点,这个理想主义者未来的故事也变得更加模糊。

字节仍在跳动,Token快要失控

2026年,Token这个词爆火,一如三年前大模型的爆火。

但也正是Token经济学,让大模型赛道与互联网经济模式的矛盾凸显了出来。

互联网时代,跳动的字节本身花不了那么多钱,大笔的资金可以用来打获客的战役,堆产品、上补贴、买流量等“大力出奇迹”操作,并最终做成超级产品、大平台,形成垄断持续获利的模式是可行的。毕竟,一个产品“走起来”后,其边际成本就会大幅下降,开发一个短视频App需要几千万,但让第1个用户看视频,和让第1000万个用户看视频,增加的服务器成本微乎其微。

但这套互联网经济黄金法则却无法直接挪用于AI赛道。当Agent大举刺激推理所需的Token量,AI被推动着必须落地形成生产力的时刻,大模型每一次交互背后昂贵、需要持续投入的算力成本,也被更显著地摆在了台前。

如果沿用互联网的低价、补贴模式,那么就会陷入流量越大,亏损越深的陷阱。不少厂商会发现,砸钱获取的日活,在某个节点后变成了巨大的成本“债务”。而那些消耗海量Token的免费低净值提问,却无法在数据、转化上真正提供助力。

在这种情况下,涨价甚至降智都成为了摆上台面的选择。

今年初,Token价格持续走高,3月“龙虾”爆火后尤甚。这一度导致OpenRouter统计的中国AI大模型周调用量在4月出现连续下滑。

而如上文提及的,包括DeepSeek在内,不少大模型厂商对自己的入口进行了调整,限制了用户使用,体验感实际上出现下降。与此同时,有业内人士透露,行业整体的Token质量也走出了与产业发展热度相反的曲线,目前响应速度、缓存命中率等核心指标表现不升反降,行业还出现了很多以次充好、挂羊头卖狗肉的乱象。

更快的商业变现一度被认为能解决Token边际成本问题。

但从豆包探索付费模式来看,C端AI产品能否走通订阅模式,为大模型输血,还很难说。毕竟,从这波中国大模型热潮爆发之初,无论主流还是特例,都较少真正探索付费模式,培养用户付费习惯。

而在海外愈发火爆的大模型To B市场,也难以直接在中国复刻。有后来居上之势的Anthropic和校准方向的OpenAI,都积极地开发靠提供标准化的SaaS订阅服务赚钱的模式。但在中国,SaaS的土壤天然贫瘠,大模型公司被迫走向了沉重的私有化定制项目。不少报道、案例称,为了拿下大客户的几百万订单,顶尖的AI算法科学家被派去给传统企业做数据清洗、做系统集成,硬生生把前沿科技做成了劳动密集型的IT外包。而最终,付费模式和习惯也没能在Token濒临失控前在B端建立起来。

互联网经济模式让新业态的发展有可参考路径,但如果迷恋曾经的成功模式,将往日套路照单全收,那无异于“画地为牢”。

目前,大模型的研发和产品化,与互联网业态杂糅在一起,而路径依赖在营收平衡、B端C端付费模式上均有触壁的端倪,如果无从突破,很可能被锁在自己画就的圈里。

从海外引领潮流的OpenAI和Anthropic来看,虽然它们也曾在变现上有过“昏招”和难评的举措,尤其前者引入广告、打价格战等操作一度也招致争议,但从今年的情况来看,在其“搞钱”道路和前景上,编程领域的生产力突破是突破性的拐点。实际上OpenAI在看到Anthropic通过Claude code大幅提升变现能力后,也将自己的重点聚焦到了编程上。

而此后,经由Agent让大模型能力溢出到办公、PA(个人助理)等,则激活了更广泛的B端、C端市场潜力。

对于狂飙的中国大模型来说,过往几年的低价、免费模式,形成了一定的用户价格锚定效应,客户结构也变得比较混杂,很可能已经导致盈利路径愈发不清晰,长此以往,企业自身的财务结构也会变得更加脆弱。

另一方面,中国大模型此前的发展路径更多聚焦于模型参数竞赛和应用场景拓展,这很像“做题家思维”和互联网“产品为王”理念的结合体,但总体上对推理优化和服务稳定性的工程积累仍有欠缺,在技术迭代加速,推理时代猝然迎来拐点时,大模型也被圈进了涨价难,降服务质量又怕会失去竞争力的两难境地。

与此同时,种种因素叠加,更让大模型缺乏从“补贴期”到“盈利期”的平滑过渡,Token狂飙带来的种种困境与乱象即是表征。

当然,AI仍是在不断发展的新事物,无论从技术路线还是商业模式上来说,探索的空间和机会当然仍在。好消息是,中国大模型在编程、办公、PA等领域也在集中发力,对于付费模式也开始了新的尝试。

或许打破“闭环”,避免被锁死的路,也很快会展现出来。

(作者|胡珈萌,编辑|杨林

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

❌