DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。
第一天,DeepSeek就放大招。#DeepSeek榨干显卡性能潜力震惊网友#等话题引发关注!文章源自玩技e族-https://www.playezu.com/905832.html
DeepSeek开源周的第一个项目为FlashMLA,可以理解为专门为高性能显卡(Hopper GPU)设计的“AI加速工具”。例如,当AI同时处理长句子和短句子时,FlashMLA能动态调整资源分配,避免浪费算力。文章源自玩技e族-https://www.playezu.com/905832.html
网友们纷纷点赞,向DeepSeek工程团队致敬。有人表示,“DeepSeek王炸开局”“‘源’神启动!”有人称赞说,“DeepSeek是真正的Open AI”。文章源自玩技e族-https://www.playezu.com/905832.html
文章源自玩技e族-https://www.playezu.com/905832.html
鲸鱼正在掀起波浪="center">文章源自玩技e族-https://www.playezu.com/905832.html
2月25日,DeepSeek再度官宣,今日开源代码库为DeepEP,它是首个用于MoE模型训练和推理的开源EP通信库。文章源自玩技e族-https://www.playezu.com/905832.html
特点有:高效的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。文章源自玩技e族-https://www.playezu.com/905832.html
文章源自玩技e族-https://www.playezu.com/905832.html
DeepSeek选择了先在GitHub上线,然后再在官方账号发上新通知。不出所料,底下一片叫好:文章源自玩技e族-https://www.playezu.com/905832.html
文章源自玩技e族-https://www.playezu.com/905832.html
DeepSeek开源列车永不停止="center">
据介绍,DeepSeek的目标是通过开源透明化团队在通用人工智能(AGI)领域的探索进展,推动技术共享与行业应用加速。这个“开源周”已经吸引了全球开发者极大关注。
AI大模型发展路径之争带来哪些巨变
中青报·中青网记者注意到,DeepSeek的横空出世及开源策略正在牵动大模型赛道的分化,以及各国不同的AI发展路径之争。
最初,开源指“开放源代码”,在人工智能和数字时代,开源更指的是“开放资源”。有业内人士告诉记者,其实在DeepSeek-R1发布之前,o1模型已经具备了深度思考的能力,只是OpenAI秉持闭源策略,并未公布o1的技术方案,而DeepSeek则是自主探索出了背后的技术,并对此进行了全面开源,引发全球热潮。
《AI大模型发展路径之争将带来哪些巨变》="center">
(中国青年报2023年2月25日05版)="center">
今年,在DeepSeek的带动下,越来越多的AI厂商开始拥抱开源。
天使投资人、资深人工智能专家郭涛表示,越来越多AI企业选择开源,一方面将促使各企业更加注重打造差异化的生态体系,围绕开源模型衍生出不同的服务、插件、工具等产品;另一方面,为了在生态竞争中胜出,企业会联合起来制定统一的接口规范、数据格式等标准,提高整个行业的协同效率和兼容性。
“AI这个领域本身就是由开源推动的。”清华大学计算机科学与技术系长聘副教授、面壁智能创始人刘知远认为,开源不仅是一种技术选择,更是一种信任机制。当一个项目开源,意味着它向全世界证明自身的可信度——我说它能做到什么,任何人都可以去验证,这种机制将极大地提升现代社会的运作效率。“未来,开源会得到更深入、更广泛的应用,它是一种不可逆的趋势。”
刘知远也表示,不能简单地将开源视作一种无条件的共享,而是要注重如何在开源的基础上,构建更深层次的技术优势,“真正的竞争力,不在于某一个具体的开源模型,而在于如何高效、稳定、可持续地生产更先进的模型。这才是决定一家AI公司能否保持领先的关键。”
中国青年报综合:中国青年报客户端(中青报·中青网 记者 贾骥业)、扬子晚报、“量子位”公众号、网友评论等
致敬读者:当下新闻存在多种误导手段需警惕。像断章取义,截取部分歪曲原意;标题党以夸张标题吸睛;还有来源不明、拼凑嫁接、带偏立场等情况。这些易让大家误读,难以触及真相。若您发现本博客新闻内容有不实之处,请及时通过留言/邮箱/举报反馈,我们核实后会尽快下架处理,确保为大家呈现真实可靠的资讯,感谢支持。