搜吧 - 智能搜索
  • DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

    在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了11倍。更厉害的是,性能...

  • 新年伊始,DeepSeek送上一份重磅贺礼,CEO梁文锋亲自挂帅,发布新论文《Manifold-Constrained Hyper-Connections》,直指AI用了10年的承重墙。 当业界都在卷应用卷智能体,DeepSeek却回头修补AI的地基,mHC方案无需引入任何新的超参数,用极小的额外训练开销,就换来性能和稳定性提升。
  • 梁文锋新论文!DeepSeek降本秘籍公开!

    5月14日下午,DeepSeek团队发布新论文,以DeepSeek-V3为代表,深入解读DeepSeek在硬件架构和模型设计方面的关键创新,为实现具有成本效益的大规模训练和推理提供思路。 DeepSeek创始人兼CEO梁文锋这次同样出现在了合著名单之中,在作者列表中处于倒数第五的位置。论文署名通讯...