2026,存储革命来了:AI的瓶颈,不只是光
上周黄仁勋在台北的GTC大会演讲,我反复听了几遍。我的结论是:到了 2026 年,AI 产业正在进入一个更深层的阶段:
AI 的核心瓶颈,正在从有没有足够算力,升级为有没有足够高效的记忆系统。
换句话说,下一阶段的 AI 革命,不只是算力革命,更是存储革命。
这里的存储革命,不是简单说 DRAM、NAND 又进入一轮涨价周期,也不是传统意义上的存储周期反转。
真正的变化是:
存储不再只是 GPU 的配套件,不再只是数据中心后台的硬盘,而是 AI 系统能否扩展上下文、降低 token 成本、支撑智能体、进入物理世界的核心基础设施。
一、2023 年以后,英伟达最早意识到:推理才是更大的长期市场
ChatGPT 爆发后,市场最先看到的是训练大模型。
训练需要 GPU,需要 HBM,需要大规模集群,所以 2023—2024 年的 AI 投资主线非常清晰:谁能提供算力,谁就是王者。
但黄仁勋真正厉害的地方,是他很早就把 AI 从训练一次模型看成了持续运行的 AI 工厂。
训练是一次性的,推理才是每天发生的。
一个模型训练完成之后,要面对的是全球用户、企业、代码、文件、视频、机器人、汽车、AI PC 的无数次调用。
尤其是智能体时代,AI 不再是你问一句,它答一句,而是要连续规划、调用工具、读取文件、修改代码、检索资料、执行任务、再反馈、再推理。
这时候,AI 系统最贵的不只是算力,而是每一次推理背后的上下文管理。
因为 AI 要记住:
你刚刚说过什么;
你过去做过什么;
你的文件在哪里;
企业知识库里有什么;
机器人刚才看到了什么;
自动驾驶刚刚经过了什么路况;
AI agent 前十步执行了哪些任务,下一步应该怎么做。
这就是 AI 从 chatbot 走向 agentic AI 之后,存储地位发生根本变化的原因。
二、2024 年 Blackwell 证明:AI 不是单卡竞争,而是系统竞争
Blackwell 发布之后,一个非常重要的信号是:
英伟达已经不再把 GPU 当成单颗芯片卖,而是在卖一整台 AI 计算机。
GB200 NVL72,本质上就是把 72 个 GPU 通过 NVLink 组织成一个巨大的统一计算域。
这说明什么?
说明 AI 的瓶颈已经不是单颗 GPU 的峰值 FLOPS,而是:
多个 GPU 之间如何通信;
HBM 如何供给数据;
CPU 内存如何配合;
网络如何降低延迟;
SSD 如何支撑数据和上下文;
整个系统如何像一台大计算机一样工作。
所以,AI 数据中心的核心架构正在从过去的“服务器堆叠”,变成黄仁勋反复讲的:
数据中心就是一台计算机。
如果数据中心是一台计算机,那么 GPU 是它的大脑,网络是神经系统,电力和液冷是血液循环,而存储就是它的记忆系统。
没有记忆,智能无法持续。
没有高效记忆,token 成本无法下降。
没有长期记忆,智能体无法真正工作。
三、2025 年以后,长上下文和智能体让 KV cache 成为新的存储需求中心
很多人低估了 KV cache。
在传统投资叙事里,大家更熟悉 HBM,因为 HBM 直接绑定 GPU,价格高,供给紧,确定性强。
但到了长上下文和智能体时代,KV cache 变成了一个绕不开的问题。
模型每多看一段上下文,每多进行一轮对话,每多执行一步 agent task,都需要保留中间状态。
上下文越长,并发用户越多,模型越大,KV cache 膨胀得越快。
过去我们以为推理主要消耗 GPU 算力。
现在看,推理同时消耗三样东西:
算力、内存、上下文存储。
这也是为什么 AI 推理系统正在形成新的存储分层:
最热的数据放在 HBM;
较温的数据放在 DDR5 / LPDDR / CPU 内存;
更大规模的上下文、RAG、向量库、历史记忆、冷温 KV cache,要放到企业级 SSD。
这不是普通的存储容量需求增加。
这是 AI 系统架构本身的变化。
四、2026 年最关键的信号:企业级 SSD 开始进入 AI 推理内存层级
我认为,2026 年存储产业最重要的变化,不只是 HBM 继续紧缺,而是企业级 SSD 的角色被重定义了。
过去,SSD 在 AI 里的作用主要是:
存训练数据;
存 checkpoint;
存模型版本;
存数据湖;
存向量数据库。
这些当然重要,但还停留在“后台存储”的逻辑。
真正的变化是 NVIDIA CMX / BlueField-4 / STX 这条路线。
英伟达已经开始把 NVMe SSD 放进 AI 推理的上下文记忆层,让 SSD 服务于长上下文、多轮对话、agentic AI 和 KV cache offload。
这意味着什么?
意味着企业级 SSD 不再只是 AI 数据中心的仓库,而开始成为 AI 推理系统的一部分。
过去 SSD 是存东西的。
现在 SSD 要参与 AI 的记忆、召回、上下文扩展和 token 成本优化。
这就是企业级 SSD 估值逻辑最可能发生变化的地方。
市场以前给 NAND 的估值,是周期品估值。
但如果企业级 SSD 进入 AI 推理架构,进入上下文记忆系统,它就不再只是普通存储,而是 AI 基础设施的一层。
这也是我认为企业级 SSD 可能存在最大预期差的原因。
五、Physical AI 会把存储需求从数据中心推向机器人、汽车和 AI PC
黄仁勋这两年反复讲 physical AI。
什么是 physical AI?
就是 AI 不再只是在屏幕里回答问题,而是进入真实世界,控制机器人、汽车、工厂、仓库、无人机、家庭终端。
这对存储的拉动,和云端大模型还不一样。
云端大模型主要处理文本、代码、图像、企业知识库和用户会话。
但 physical AI 面对的是连续的真实世界数据:
摄像头视频;
激光雷达点云;
动作轨迹;
地图;
边缘场景;
失败案例;
仿真数据;
真实世界反馈。
自动驾驶要记住路况。
机器人要记住环境。
家用 AI 终端要记住用户习惯。
AI PC 要记住文件、偏好、工作流和历史交互。
这会形成三类新的存储需求:
第一,云端训练和仿真数据,对企业级 SSD、对象存储、数据中心 NAND 的需求暴增。
第二,边缘端实时感知和规划,对 LPDDR、GDDR、统一内存、低延迟存储提出更高要求。
第三,个人长期记忆,对本地 SSD、安全存储、端云同步系统提出新需求。
所以,physical AI 的本质不是简单多卖几台机器人。
它意味着 AI 从无记忆的工具,变成有经验的智能体。
而经验,必须被存下来。
六、AI PC 也不是传统 PC 升级,而是个人记忆节点
很多人看 AI PC,只看 NPU 算力。
但我认为,AI PC 真正的变化,不只是本地跑模型,而是 PC 从文件工具变成个人 AI 代理。
未来的 AI PC 要做什么?
它要理解你的文件;
记住你的偏好;
索引你的邮件、图片、会议、文档;
保存你的历史任务;
在本地运行 agent;
在保护隐私的前提下完成长期个性化。
这时候,本地 SSD 和统一内存的重要性会明显上升。
过去 PC 里的 SSD 主要解决开机快、游戏加载快、文件传输快。
未来 AI PC 的 SSD,要承载个人知识库、向量索引、历史会话、多模态记录和本地 agent 记忆。
所以 AI PC 对存储产业的影响,不是每台电脑多加一点容量这么简单。
它的本质是:
个人电脑正在变成个人记忆节点。
七、未来 AI 系统会形成五级“记忆金字塔”
如果站在黄仁勋的工程视角看,未来 AI factory 和 physical AI 的存储体系,大概率会形成五层结构:
第一层,SRAM / Cache / Register。
这是最靠近计算核心的极热数据,用于 Tensor Core 运算和底层计算调度。
第二层,HBM。
这是 AI 时代最稀缺、最高价值的存储形态,承载模型权重、激活、最热 KV cache 和实时推理。
第三层,DDR5 / LPDDR / SOCAMM / CPU Memory。
这是系统内存层,承接 CPU-GPU 协同、agent 调度、较温上下文、数据预处理和统一内存需求。
第四层,NVMe 企业级 SSD / CMX / STX。
这是未来最值得重估的一层,承接 KV cache offload、RAG、向量数据库、长期上下文和企业知识库。
第五层,数据湖 /冷存储。
这是多模态训练数据、机器人日志、自动驾驶数据、仿真数据和历史数据的长期存储层。
这就是我理解的存储革命:
AI 的记忆被分层了。存储从静态保存数据,变成动态参与智能生成。
八、投资含义:HBM 是确定性,企业级 SSD 是预期差,DDR5/LPDDR 是中间层
从投资角度看,我会把 AI 存储分成三类机会。
1、HBM:确定性最强
HBM 直接绑定 GPU,是 AI 加速器的一部分。
Blackwell、Rubin、Rubin Ultra 继续提高单 GPU、单机架、单 NVLink 域的 HBM 容量和带宽。
HBM 的瓶颈不只是 DRAM 晶圆,还包括先进封装、良率、平台认证和与 GPU 的协同设计。
所以 HBM 不是普通 DRAM,而是 AI 算力系统的近身燃料。
这条线确定性最强,但市场认知也最充分。
2、DDR5 / LPDDR / SOCAMM:重要性被低估
市场经常只盯着 HBM,但 AI 系统不可能把所有数据都放在 HBM。
HBM 太贵、太稀缺,也太靠近 GPU。
大量 agent 调度、系统上下文、CPU-GPU 协同、数据预处理、较温缓存,都需要 DDR5、LPDDR 和新型系统内存承接。
AI PC、Grace/Vera CPU、统一内存、端侧 AI,也都会提高这一层的价值。
这条线不一定最性感,但会越来越重要。
3、企业级 SSD / NAND:最大预期差
我最关注的是企业级 SSD。
因为它的逻辑正在从容量周期变成上下文记忆。
如果 SSD 只是存数据,那它还是周期品。
但如果 SSD 进入 NVIDIA CMX / BlueField-4 / STX 这样的 AI 推理架构,开始服务 KV cache、RAG、长期上下文和企业知识库,那么它的估值逻辑就应该发生变化。
未来真正有价值的企业级 SSD,不只是容量大、价格低,而是要具备:
低延迟;
高 IOPS;
高耐久;
低功耗;
主控和固件能力;
DPU/GPU direct 能力;
进入云厂商和 NVIDIA 生态的认证能力。
所以,企业级 SSD 不是简单的 NAND 涨价逻辑,而是 AI 推理架构重构带来的新逻辑。
九、不是所有存储都同等受益
这里也要强调一点:
存储革命不等于所有存储公司一起涨。
普通消费级 NAND、低端 DRAM、普通模组厂,不一定能吃到最高质量的 AI 红利。
AI 存储需求不是单纯容量需求,而是对带宽、延迟、功耗、耐久、软件栈、主控、固件、认证能力的系统性要求。
未来最有价值的存储公司,应该具备几个特征:
能进入 AI 数据中心;
能服务企业级 SSD;
有主控和固件能力;
能通过云厂商认证;
能适配 GPU / DPU / CXL / NVMe 新架构;
最好还能在供应链中绑定晶圆、主控、模组和客户资源。
这类公司,才有机会从传统周期品,变成 AI 基础设施供应商。
十、最终判断:AI 正从 compute-centric 进入 memory/context-centric 阶段
我对 2026 年存储产业的判断可以总结成一句话:
AI 的下一阶段,不是存储取代算力,而是算力越来越依赖存储。
GPU 越强,越需要 HBM;
上下文越长,越需要 DDR5 / LPDDR;
智能体越复杂,越需要企业级 SSD;
物理 AI 越普及,越需要端侧和云端同时扩容;
AI PC 越个人化,越需要本地长期记忆。
所以,未来 AI 基础设施不是简单堆 GPU,而是 GPU、HBM、DDR5、LPDDR、企业级 SSD、DPU、网络和软件栈共同构成一台巨大的记忆型计算机。
谁能控制更高效的记忆层级,谁就能降低 token 成本,扩展上下文长度,支撑 agentic AI,并把 AI 带入机器人、自动驾驶和个人 PC。
这就是我认为 2026 年真正值得重视的产业变化:
AI 革命上半场看算力。
AI 革命下半场,看记忆。
$大普微-UW(SZ301666)$ $中韩半导体ETF华泰柏瑞(SH513310)$ $闪迪(SNDK)$
本话题在雪球有61条讨论,点击查看。
雪球是一个投资者的社交网络,聪明的投资者都在这里。
点击下载雪球手机客户端 http://xueqiu.com/xz]]>