来源:星火智游网 责编:网络 时间:2025-04-25 10:59:09
联想今日宣布,旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B(满血版) DeepSeek 大模型时,实现了高达6708token/s 的极限吞吐量,再次刷新了单台服务器运行超大规模模型性能的纪录。
据介绍,此次性能突破得益于联想万全异构智算平台的强大支持。联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段,对大模型从预训练、后训练到推理的全流程进行了持续优化。实测结果显示,在单台部署 DeepSeek671B 大模型的联想问天 WA7785a G3服务器上,最高吞吐量达到了惊人的6708token/s。
图源备注:图片由AI生成,图片授权服务商Midjourney
在模拟问题对话场景(上下文序列长度128/1K)时,该服务器最高可支持158的并发数,TPOT(Time Per Output Token)为93毫秒,TTFT(Time To First Token)为2.01秒;而在模拟代码生成场景(上下文序列长度512/4K)时,并发数可达140,TPOT 为100毫秒,TTFT 为5.53秒。联想方面表示,这一性能表现意味着单台联想问天 WA7785a G3服务器即可支撑1500人规模企业的正常使用,是继联想问天 WA7780G3服务器单机部署满血版 DeepSeek 大模型总吞吐量突破2500token/s 之后,在单机部署该大模型推理性能上的又一次重大飞跃。
联想方面强调,此次技术突破是联想中国基础设施业务群、联想研究院 ICI 实验室和 AMD 联合设计、协同调优、共同实现的成果。同时,这并非最终结果,联想与 AMD 仍在持续探索深度调优的新方法,以期实现更高的性能突破。
随着移动互联网的迅速发展,各类应用程序不断涌现,丰富了人们的日常生活。幸福宝8008app作为一款颇受欢迎的应用,不仅提供了多个功能,还
魅影直播间在B站的直播功能近年来逐渐受到广大用户的青睐。这不仅是因为平台的流量优势,更重要的是其提供了丰富的互动体验,这让主播与观
化学是一个充满神奇与魅力的领域,尤其是在探索金属元素及其化合物时,更是让人感受到无尽的惊喜。今天,我们将聚焦在“钢钢钢钢钢钠好多水
小莫烧麦原唱歌曲mp3免费听,此曲乃音韵之美,深得人心。诸君可于互联网上寻觅此曲之音频,多方平台齐聚,或可免费聆听,畅享其中妙趣。小
联想问天WA7785a G3服务器再创佳绩! 单机运行671B DeepSeek大模型实现惊人吞吐量达6708token/s!
鸣潮深梦历程活动的详细玩法解析,帮助你全面掌握游戏挑战策略
小米大模型团队在音频推理技术上实现突破,国际评测榜单居首
深入探索仙剑水月宫任务全攻略,分享详细步骤与心得
李开复携手万智推出企业级大模型平台,突出大模型竞赛的新路线与愿景
腾讯混元3D开源日活动即将来临,探讨3D技术与创新的无限可能!
人工智能技术发展中的版权挑战:在保护创作者权益与满足AI训练需求之间寻找平衡点
天龙八部大票解析与研究,深入探讨天龙八部大票的价值与意义
震撼发现!人工智能撰写的研究论文成功通过人类评审专家的审查,令人瞩目
苍雾世界花语技能全解析-获取最强战斗技巧的秘籍与攻略