来源:星火智游网 责编:网络 时间:2024-12-09 19:00:01
在近期公布的LLM基准测试项目LiveBench的官方榜单上,中国大模型“六小虎”成员之一——阶跃星辰的大语言模型step-2-16k-202411,以卓越表现夺得全球第五、国产第一的佳绩。这一成就不仅标志着中国AI技术的飞速进步,也彰显了阶跃星辰在AI领域的深厚底蕴。
▲LiveBench榜单总评分前15名
LiveBench项目,由Abacus.AI主导,并吸引了图灵奖得主、meta首席AI科学家杨立昆的参与,因其严格的评测标准和每月更新的题库,被誉为“最难糊弄的LLMs基准测试”。这一项目不仅要求大模型具备全面的能力,还强调测试的公正性和真实性,有效避免了测试集污染等问题。
阶跃星辰的step-2-16k-202411,在LiveBench的六类别任务中,尤其在指令跟随(IF Average)方面,以86.57的高分力压群雄,甚至超过了OpenAI的o1-preview-2024-09-12。这一成绩不仅体现了step-2-16k-202411在语言生成上的精准控制力,更展示了其强大的理解和遵循人类指令的能力。
▲LiveBench官网博客
阶跃星辰的step-2-16k-202411,是该公司自研的万亿参数MoE大语言模型。在设计过程中,阶跃星辰放弃了upcycle(向上复用)路径,选择了从头开始训练的艰难道路。通过部分专家共享参数、异构化专家设计等创新手段,阶跃星辰成功构建了Step-2 MoE架构,不仅提升了模型的性能,还确保了每个“专家模型”都能得到充分训练。
今年3月,Step-2预览版发布,成为国内首个由创业公司发布的万亿参数MoE大语言模型。随后,在7月的世界人工智能大会上,Step-2正式发布,其出色的数理逻辑、编程、世界知识、指令跟随等能力,全面逼近GPT-4,引发了业界的广泛关注。
阶跃星辰的Step系列模型,除了万亿MoE大语言模型Step-2外,还包括多模态理解大模型Step-1.5V、图像生成模型Step-1X等,形成了全面的模型矩阵。同时,阶跃星辰还推出了C端应用“跃问”和“冒泡鸭”,将AI技术应用于实际生活中,为用户提供了更加便捷、智能的服务。
阶跃星辰的成立时间虽短,但其在AI领域的深耕细作,使其在短时间内取得了显著的成果。此次在LiveBench榜单上的优异表现,不仅是对阶跃星辰技术实力的肯定,更是对中国AI产业发展的鼓舞。在全球AI赛场上,国产大模型正逐渐崭露头角,展现出强大的竞争力和发展潜力。
随着移动互联网的迅速发展,各类应用程序不断涌现,丰富了人们的日常生活。幸福宝8008app作为一款颇受欢迎的应用,不仅提供了多个功能,还
魅影直播间在B站的直播功能近年来逐渐受到广大用户的青睐。这不仅是因为平台的流量优势,更重要的是其提供了丰富的互动体验,这让主播与观
化学是一个充满神奇与魅力的领域,尤其是在探索金属元素及其化合物时,更是让人感受到无尽的惊喜。今天,我们将聚焦在“钢钢钢钢钢钠好多水
小莫烧麦原唱歌曲mp3免费听,此曲乃音韵之美,深得人心。诸君可于互联网上寻觅此曲之音频,多方平台齐聚,或可免费聆听,畅享其中妙趣。小
2021最新一二三四乱码:游戏行业的新趋势与发展(深度解析各大平台的游戏变革与未来方向)
麻豆精品秘一区二区三区:沉浸式游戏体验与策略提升引发热议(探索多样玩法与角色成长)
成免费CRM伯乐:游戏行业如何利用免费CRM提高用户黏性与客户管理效率
国精产品一一二二菠萝蜜:让你的游戏体验轻松升级,享受无与伦比的快乐和新鲜感!
歪歪漫画无删减版官方入口:精彩游戏剧情漫画的视觉盛宴,带你体验别样的游戏世界
女生越说疼男生就愉快:电竞游戏中不为人知的心理游戏
9-幺:探秘游戏中的神秘符号与丰富的文化内涵
嘛逗传禖在线观看:让你沉浸在虚拟世界的游戏体验,畅享无与伦比的娱乐盛宴
金银梅1-5普通话双人版免费:探索古典文化的游戏乐趣与策略挑战
一产区与二产区的产品区别:游戏产业如何影响玩家体验与市场趋势