根据陆媒援引多位知情人士报道,DeepSeek创办人梁文锋已明确指出,新一代旗舰大模型DeepSeek V4将于2026年4月下旬正式亮相。 这款备受期待的模型不仅在技术参数上大幅跃进,更因其与国产芯片的深度适配,被视为中国人工智能产业突破美系硬件依赖的关键里程碑。
万亿参数与百万上下文
DeepSeek V4 延续了该公司一贯的「精算师」风格,采用优化的 Mixture-of-Experts (MoE) 混合专家架构。 泄露信息显示,V4的总参数规模逼近1万亿(1 Trillion),但在实际推理过程中,每次仅会启动约320亿至370亿个参数,确保了极高的算力效率与低廉的API定价。
在处理能力方面,V4 将支持高达 100 万 tokens 的超长上下文窗口。 为了实现这一点,DeepSeek 引入了全新的Engram条件记忆机制,将静态知识储存与动态推理计算分离,让模型能以O(1)的复杂度快速检索长文本信息,有效减轻显存负担。
此外,新开发的mHC(流形约束超连接)技术解决了超大规模训练中的梯度不稳问题,使训练效率提升约30%。
完全跑在华为升腾芯片上
相较于技术参数,V4 最具震撼力的讯号在于其硬件策略的彻底转向。 官方透露,V4 将完全执行于华为升腾 (Ascend)950 PR 芯片上,不再依赖英伟达 (Nvidia) 的 GPU 或 CUDA 生态。
这一决策已引发连锁反应。 据报导,阿里巴巴、字节跳动、腾讯等科技巨头已提前向华为采购数十万片新一代升腾芯片,计划透过云端服务整合 DeepSeek V4。 这象征着国产算力已能支撑顶级旗舰模型的训练与推理需求,成为中国 AI 自主生态系成熟的催化剂。
分层模式与测试数据曝光
目前,DeepSeek 网页端已悄然上线「快速模式」与「专家模式」,被视为 V4 发布前的灰度测试。 测试数据显示,V4-Lite变体在API节点的推理速度较前代提升30%,而在HumanEval代码测试中,V4的得分高达90%,性能直逼当前全球顶尖模型。













