来源:星火智游网 责编:网络 时间:2025-04-04 12:40:01
近日,华为技术有限公司携手北京大学高性能计算校级公共平台,正式揭晓了DeepSeek全栈开源推理方案,这一发布标志着双方在人工智能推理领域的深度合作迈出了重要一步。
DeepSeek方案依托北京大学自主研发的SCOW算力平台系统与鹤思调度系统,并巧妙融合了DeepSeek、openEuler、MindSpore及vLLM/RAY等多个开源社区组件。该方案专为华为昇腾系列硬件设计,旨在实现高效推理,并支持大规模算力集群的训推一体化部署。尤为所有开发者均可自由获取源码,并根据实际需求进行二次开发,其性能表现已接近市面上的闭源方案。
相较于传统的闭源方案,DeepSeek在硬件配置上展现出了显著优势。以DeepSeek-R1-w8a8配置为例,在2台Atlas 800I A2服务器的支持下,输入长度为4096时,输出长度可达1024,系统吞吐量高达1198,而在用户并发测试中,同样达到了128的并发处理能力。
目前,DeepSeek方案已成功部署于北京大学未名卓越一号集群。该集群由北京大学计算中心负责运维,是北大鲲鹏昇腾科教创新卓越中心的重要算力支撑。作为国内首个基于高校自研基础软件的国产智算平台,未名卓越一号集群自2024年11月18日上线以来,已集成了20台昇腾AI服务器与10台鲲鹏通用服务器,其AI算力规模达到了30.64PFlops(半精度),为科研与教学提供了强大的算力保障。
DeepSeek推理方案的核心优势在于其全栈开源组件的构建与深度优化。在openEuler开源操作系统层面,方案进行了全面优化,通过异构调度负载感知MoE冷热专家,实现了更精细的任务调度。同时,方案还采用了异构融合技术,有效管理内存,大幅减少了系统内存碎片。毕昇编译器的进一步优化,更是显著减少了算子下发耗时,从而提升了推理的整体性能。
上图展示了算力集群全栈开源推理方案的架构图,从中不难看出,DeepSeek方案在设计与实施上均体现出了高度的专业性与创新性。此次合作不仅展示了华为与北京大学在人工智能领域的深厚积累,更为国内AI推理技术的发展注入了新的活力。
在当今这个信息爆炸的时代,网上的娱乐内容琳琅满目,其中漫画作为一种轻松、幽默的艺术形式,受到了众多年轻人的喜爱。尤其是歪歪㊙️羞羞
日产不断在汽车技术的创新上探索,2023年的无人区一线、二线和三线标志着无人驾驶技术的新阶段。在全球倡导绿色出行和智能交通的大背景下,
现代生活节奏的加快,让很多人不得不忍受肩颈疼痛的困扰。久坐的办公室、缠绕不休的手机,都成了导致这类疼痛的罪魁祸首。肩颈疼痛不仅影响
在网络影视不断发展的今天,越来越多的观众希望能够享受便捷而又高质量的观看体验。jinricp第一季以其新颖的剧情和精良的制作吸引了大量影
北大与华为共同推出DeepSeek:开创全栈开源推理方案铸就AI发展的新篇章
苹果智能显示屏推迟发布,Siri升级是否成了发展的主要障碍?
腾讯第四季度营收同比增长11%,AI投资热潮推动资本支出激增近四倍
苹果智能手表或将新增摄像头功能,古尔曼透露最新进展动态
稚晖君智元机器人推出全新GO-1大模型:开启具身智能发展的新纪元
腾讯加速推进AI战略,全球竞争中能否重新获得行业领先地位?
东南大学首推阿里QwQ-32B模型,科研AI推理能力显著提升!
梦幻模拟战神乐实战指南:玩转神乐特色玩法攻略详解
大华股份合作伙伴大会隆重开幕,共同探索数智化新生态,携手创造行业崭新未来
英伟达黄仁勋:全球一半AI研究人员来自中国,其贡献不可忽视