来源:星火智游网 责编:网络 时间:2025-02-21 17:00:01
安谋科技近日宣布,其新一代“周易”NPU处理器已成功在端侧部署并运行DeepSeek-R1系列模型,不仅性能表现出色,而且成本效益显著。
这款“周易”NPU专为AI大模型设计,架构上进行了深度优化。据悉,其Beta测试版本已在2024年末向部分早期用户开放,预计今年上半年将正式面世。
DeepSeek-R1系列中的1.5B和7B蒸馏版本推出后,“周易”NPU迅速在Emulation平台上完成了部署与优化,并在FPGA平台上成功演示了端到端应用。测试结果显示,在标准测试环境下,“周易”NPU在首字计算阶段的算力利用率超过40%,解码阶段的有效带宽利用率更是高达80%以上。
该NPU的带宽利用率展现出高线性特性,能够灵活适应从16GB/s到256GB/s的系统带宽需求。在7B版本、上下文长度为1024的场景下,“周易”NPU的最高处理速度可达每秒40 tokens,并支持动态长度的模型推理输入。
安谋科技的软件栈对大模型的支持和优化也达到了成熟水平,通过动态推理优化和硬件算力潜力的挖掘,显著提升了推理速度和吞吐量。目前,该软件栈已支持Llama、Qwen、DeepSeek、ChatGLM、MiniCPM等多种主流大模型,并提供了与Hugging Face模型库的对接工具链,方便用户直接部署主流模型。
在硬件层面,“周易”NPU采用先进的7nm工艺制造,单Cluster算力最高可达80 TOPS,能够轻松应对超过16K上下文长度的大模型部署需求。同时,其对外带宽提升至256GB/s,有效解决了大模型计算的带宽瓶颈问题。
“周易”NPU还支持FP16数据精度计算,完整支持INT4软硬量化加速,并具备多核算力扩展能力,满足端侧模型的低首字延迟需求。它还拥有强大的多任务并行处理能力,通过细粒度的任务调度和优先级资源分配,实现了多任务灵活切换,确保了传统语音、视觉业务与大模型应用的高效协同。
随着移动互联网的迅速发展,各类应用程序不断涌现,丰富了人们的日常生活。幸福宝8008app作为一款颇受欢迎的应用,不仅提供了多个功能,还
魅影直播间在B站的直播功能近年来逐渐受到广大用户的青睐。这不仅是因为平台的流量优势,更重要的是其提供了丰富的互动体验,这让主播与观
化学是一个充满神奇与魅力的领域,尤其是在探索金属元素及其化合物时,更是让人感受到无尽的惊喜。今天,我们将聚焦在“钢钢钢钢钢钠好多水
小莫烧麦原唱歌曲mp3免费听,此曲乃音韵之美,深得人心。诸君可于互联网上寻觅此曲之音频,多方平台齐聚,或可免费聆听,畅享其中妙趣。小
2021最新一二三四乱码:游戏行业的新趋势与发展(深度解析各大平台的游戏变革与未来方向)
麻豆精品秘一区二区三区:沉浸式游戏体验与策略提升引发热议(探索多样玩法与角色成长)
成免费CRM伯乐:游戏行业如何利用免费CRM提高用户黏性与客户管理效率
国精产品一一二二菠萝蜜:让你的游戏体验轻松升级,享受无与伦比的快乐和新鲜感!
歪歪漫画无删减版官方入口:精彩游戏剧情漫画的视觉盛宴,带你体验别样的游戏世界
女生越说疼男生就愉快:电竞游戏中不为人知的心理游戏
9-幺:探秘游戏中的神秘符号与丰富的文化内涵
嘛逗传禖在线观看:让你沉浸在虚拟世界的游戏体验,畅享无与伦比的娱乐盛宴
金银梅1-5普通话双人版免费:探索古典文化的游戏乐趣与策略挑战
一产区与二产区的产品区别:游戏产业如何影响玩家体验与市场趋势