DeepSeek“开源周”收官

新闻资讯

ZAKER 科技 2 月 28 日消息,国内 AI 明星公司 DeepSeek 为期五天的 " 开源周 " 今日结束,其于 2 月 24 日正式启动,计划开源 5 个代码库,旨在与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。

在这五天里,DeepSeek 先后开源了 FlashMLA、DeepEP、DeepGEMM、优化并行策略(DualPipe 和 EPLB)以及面向全数据访问的推进器 3FS(Fire-Flyer 文件系统)多个项目。

FlashMLA 是专为英伟达 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列设计;DeepEP 是首个用于 MoE(混合专家模型)训练和推理的开源 EP 通信库;而 DeepGEMM 则提供支持给 V3/R1 的训练和推理;DualPipe 是一种用于 V3/R1 训练中计算与通信重叠的双向管道并行算法。

这些代码库将提供给全球开发者二次开发和改进,并有望促进 AI 技术在更广泛领域应用上取得突破。

喜欢的

也许您对下面的内容还感兴趣:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50