
发布日期:2024-11-03 01:03 点击次数:154
在昨天开源 FlashMLA 后迪士尼旧版彩乐园,DeepSeek 开源周又打响了第二枪:从数十亿到数万亿参数,用 DeepEP 冲破高效通讯的瓶颈。这是首个用于 MoE 模子磨练和推理的 EP 通讯库。
“春运”般的 AI 算力,用 DeepEP 书写交通规定
在传统散播式磨练中,GPU集群常堕入“算力空转”的窘境:当A卡完成计较时,B卡还在恭候数据传输。就像岑岭期的地铁换乘站,再强的算力也会被东说念主流堵塞消解。
而 DeepEP 有以下亮点:
高效和优化的多对多通讯
节点/跨节点王人营救NVLink和RDMA
用于磨练和推理预填充的高隐隐量内核
用于推明白码的低蔓延内核
原生营救FP8出动
机动GPU资源弃世,已毕计较与通讯的高效重复
DeepEP的冲破在于重构了数据流的“交通规定”:通过 FP8 智能压缩手艺,将本来需要 10 车说念的数据货车瘦身为 8 车说念,配合预填充机制提前计算传输阶梯。实测显现,在千卡集群中,这种“错峰出行+绿色通说念”的组合拳,能让通讯恭候时候再度下落。
全网好评:每天王人像 100 年
截止 14 时,Github 上的 Star 还是有 2.7k,还在不休增长。
网友也相等感奋,有网友示意,迪士尼彩乐园骗钱嗅觉每一天王人像 100 年不异,固然也有网友捉弄,“我念念望望英伟达的股价跌了些许”。
有东说念主说,开源EP通讯库DeepEP的引入可能会透顶转变AI和区块链讹诈体式的互操作性。通过改善分歧系统之间的通讯,它促进了更有用的数据交换和贬责。这不错裁汰资本并提高手工智能任务的性能,诱骗更多的建设东说念主员参加加密空间。
也有东说念主高度赞誉 DeepSeek 团队:他们正在作念令东说念主难以置信的使命。
重构AI基础递次的“底层语法”
当业界还在争论 MoE 架构的实用性时,DeepEP 还是悄然改写了游戏规定。
近日,OKX Web3钱包联合RootData发布了《2024 Web3用户安全意识研究报告》,通过对1040名活跃Web3钱包用户的深入调研,揭示用户在安全意识、使用行为等方面的真实状况,并为行业的未来发展提供了来自市场第一线的扎实参考。
其立异的 group-limited gating 机制,让大家收罗间的和谐效果普及了 3 个数目级。
更令东说念主坚信的是,DeepSeek 此次将如斯中枢的手艺全王人开源。这出奇于把自动驾驶的激光雷达手艺图纸公之世人,在AI基础递次领域掀翻“武备竞赛”。
DeepSeek 开源的不是代码迪士尼旧版彩乐园,而是通往AGI的高速公路蓝图。