打出呼吸权 JDG鏖战五局拿下WB继续领跑S组 JDG 3-2 WB
主持泱泱看F1:这个排位赛!!!太刺激了啊啊啊 潘子你是受苦了
极品男子为打赏女主播贷款126万 每日只有50生活费 然而女主播早已结婚
TES王者发布选手线下动态:拥挤的沙发2.0
上单文波也没了!粉丝私信BLG二队上单是否加入iG:乱传,别信
压力麻了!老蔡评审zard和鲷哥互爆苏科大退赛,zhou鱼吧向zard和苏科大道歉

体育资讯3月14日讯 据《白鲸实验室》爆料,DeepSeek V4 和姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026 年 4 月)发布。
值得一提的是,回顾今年以来的多次爆料,无论是春节还是3月首周,DeepSeek V4的发布日期传闻均一一落空。
3 月 11 日,OpenRouter 新上线了两个神秘模型——Healer Alpha 与 Hunter Alpha。OpenRouter 页面显示,Healer Alpha 被描述为具备视觉、听觉、推理与行动能力的前沿全模态模型;社区因此迅速将其与尚未发布的新一代国产模型联系起来,据称捕捉到了「系统提示词中要求严格遵守中国法律法规」。
据悉,DeepSeek V4 将于 4 月正式上线。作为梁文锋打磨已久的多模态大模型,DeepSeek V4 除了代码能力跃升,还会在长期记忆上取得突破。这一方向与 DeepSeek 团队近几个月的公开研究脉络基本一致。
2026 年 1 月,梁文锋署名论文《Conditional Memory via Scalable Lookup》提出「条件记忆」机制;2025 年 12 月的《mHC: Manifold-Constrained Hyper-Connections》则继续指向底层架构优化。
两篇论文都在尝试处理 Transformer 在记忆、训练稳定性和长上下文上的瓶颈。梁文锋过去半年的主要工作,是补齐 DeepSeek 在视觉内容处理和 AI 搜索上的短板。为强化 AI 搜索能力,DeepSeek 早在去年就已与百度展开合作。
梁文锋这次为 DeepSeek V4 设定的关键迭代方向,正是长期记忆能力。DeepSeek V4 还将深度适配国产芯片,并有望成为首个完全跑在国产算力生态上的大模型。