正值DeepSeek-R1模型发布一周年之际,国产AI巨头DeepSeek在全球AI圈引发震动——其FlashMLA代码库更新时,一款名为Model1的神秘新模型意外曝光,被业界推测为其蓄势已久的“王炸”产品,或将成为挑战OpenAI GPT-5的关键选手。
据悉,Model1不仅出现在代码及注释中,还拥有与DeepSeek-V3.2并列的独立文件,这意味着其未沿用V3系列的参数配置与基础架构,大概率采用一条全新技术路径。作为DeepSeek独创的GPU优化工具,FlashMLA是其模型实现低成本、高性能的关键,Model1作为该工具支持的两大核心架构之一,硬件适配广泛,更针对英伟达新一代B200显卡专项优化,内存占用与推理效率有望大幅提升。
值得注意的是,截至目前,DeepSeek官方尚未披露任何关于Model1的相关信息,其最新公开动态仍停留在2025年12月发布的DeepSeek-V3.2正式版公告。但多条线索显示,该公司下一代新模型已箭在弦上。
外媒报道称,DeepSeek预计将于2月中旬推出下一代模型V4,内部测试显示其编码能力已能超越Anthropic Claude及OpenAI GPT系列。此外,2025年底至2026年初,DeepSeek团队发表两篇核心论文,提出mHC流形约束超连接框架和Engram条件记忆模块,分别攻克模型训练稳定性与知识检索效率两大瓶颈,为新模型性能突破奠定基础。
业界推测,Model1或为V4的内部开发代号,也可能是独立于V、R系列的新谱系,主打高效推理或长序列处理等特定场景。其曝光与相关技术突破,标志着DeepSeek正从“参数竞赛”转向“架构与效率优化”,即便短期内难以全面超越生态成熟的GPT-5,也有望在编程、长文档分析等垂直领域形成差异化优势,引发AI行业新一轮竞争。