刚刚,DeepSeek开源周第一场盛宴 FlashMLA来了!
发布时间:
2025-10-10
北京时间2月24日,DeepSeek宣布正式启动“开源周”。 首个开源的代码库为Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。 刚刚,重磅发布:DeepSeek开源周第一天重磅更新来了,开源首个代码库——FlashMLA,发布一小时GitHub Star数冲上1700。

这是一篇去年八月就公开在ArXiv上的论文,如今终于开源。
开源内容如下:

用1万张PCIe A100实现媲美DGX集群的算力,成本直降50%,能耗减少40%。

使用CUDA 12.6,在H800 SXM5上,其性能指标是:
3000 GB/s内存带宽(内存限制性能),支持快速数据访问和传输。580 TFLOPS计算性能(计算约束性能),为AI工作负载提供高计算吞吐量。这种优化可以确保FlashMLA在高性能硬件上有效地处理大语言模型和其他AI应用程序的密集计算需求。快速启动安装:
该项目发布后,外网也收获一致好评!

不到一小时,就已经吸引了超10万人关注,上百条评论。

已有海外开发者第一时间研究起了FlashMLA的代码库,他感叹道:“真是纯粹的工程,太爱了!”

有一位英伟达股民跑到DeepSeek的评论区祈祷,希望DeepSeek能在不影响英伟达股价的前提下,让GPU更为高效。
GitHub地址:
https://github.com/deepseek-ai/FlashMLA
使用方式:
内容来自网络,仅作参考
安装
python setup.py install
性能测试
python tests/test_flash_mla.py
在H800 SXM5(CUDA 12.6环境)上实现内存受限配置下3000GB/s的带宽吞吐,计算受限配置下580 TFLOPS的算力表现。
使用方法
from flash_mla import get_mla_metadata, flash_mla_with_kvcache
tile_scheduler_metadata, num_splits = get_mla_metadata(cache_seqlens, s_q * h_q // h_kv, h_kv)
for i in range(num_layers):
...
o_i, lse_i = flash_mla_with_kvcache(
q_i, kvcache_i, block_table, cache_seqlens, dv,
tile_scheduler_metadata, num_splits, causal=True,
)
...环境要求
Hopper架构GPU
CUDA 12.3及以上版本
PyTorch 2.0及以上版本
DeepSeek开源周,首日开源项目FlashMLA强势登陆,发布即引爆全球AI社区,未来四天,我们将以每日一重磅的节奏持续释放开源力量:四大代码库将依次亮相,向开源者们致以崇高的敬意。请持续关注我们,为您带来最新、最全的动态!
如果你想了解职场人如在AI时代赋能个人,在996工作浪潮开启高效之路,在学习之中将人生还给自己。我们向您推荐这门“职场AI核武器”

广东省干部培训讲师何俊稼,携“DEEPSEEK职场AI实操训练”课程解锁你的终身核心竞争力。四万人AI破局行动发起人,深入各行痛点,解密AI如何将他人“痛点”转为你的“发力点”
线下课程名额有限,线上网课同步直播,永久回放保存,享终身学习
课程时间:3月1日14:00~17:30
培训地点:深圳市南山区国人通信大厦1F深圳市虚拟现实产业联合会AI算力中心201教室
原价199元,限时早鸟价:99元
名额有限,扫码预约报名,一场争先,终身收益。



深圳市社会组织交流服务展示点项目是一项旨在展示深圳市社会组织在服务社会、推动经济发展、促进社会和谐等方面所做贡献的创新举措。
通过遴选党建引领突出、代表性强、公信力高、枢纽功能发挥明显和对深圳“双区”建设具有重大贡献的相关领域社会组织成为交流服务展示点,搭建全市社会组织交流展示与服务平台,多维度、多领域展示我市社会组织在不同领域对深圳经济社会发展和“双区”建设的突出贡献,涵盖了社会组织在党建引领、内部治理、诚信建设、人才建设、社区治理、科创信息、国际交流、乡村振兴、生态环保、文教卫体等多个领域的服务和成果。充分发挥展示点对同类别社会组织的示范引领作用,鼓励社会组织之间的交流与合作,推动社会组织高质量发展。


| 联合会会员部 | 18211567364 |
| 联合会商务部 | 18823495433 |
| 职业技能培训学校 | 13802218854 |
| 湾区AI算力中心 | 18688993899 |
| VR实训基地 | 13657272435 |
| 前沿研究院 | 18188615433 |
| 低空经济专委会实训基地 | 18823495433 |
编 辑 | 陈泽砚
责 编 | 梁锦滢
校 对 | 谭斐
审 校 | 付孟姣
值班编委 | 梁锦滢



