来源:星火智游网 责编:网络 时间:2025-04-19 19:39:54
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强大的 AI 工具。
Step-Video 模型的全名为 Step-Video-T2V,这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频,并在指令遵循、运动平滑性、物理合理性以及美感等方面,表现超越了市场上现有的顶尖开源视频模型。另一方面,Step-Audio 则是业内首款能够生成多种情感、方言、语言、唱腔和个性化风格的语音的大模型。这一技术的发布,标志着 AI 语音交互领域的一次重要突破。
图源备注:图片由AI生成,图片授权服务商Midjourney
值得一提的是,这些模型是基于华为昇腾 CANN 异构计算架构和昇腾服务器进行适配的。开发者和企业用户可以在魔乐社区中便捷地下载和体验这些模型。为了进一步降低使用门槛,魔乐社区还提供免费算力支持,让用户可以在线进行模型推理,而无需复杂的环境搭建,快速验证他们的 AI 方案。
此外,阶跃星辰的开源模型受到了多个行业标杆企业的关注,包括天数智芯、阿里云、火山引擎、TCL 等各行各业的厂商已纷纷接入这一开源生态。未来,阶跃星辰计划在3月份推出新的图生视频模型,进一步丰富其产品线。
华为昇腾与阶跃星辰的这一合作不仅拓展了多模态 AI 模型的应用场景,也为开发者提供了更为强大的工具,推动了整个行业的技术进步。
随着移动互联网的迅速发展,各类应用程序不断涌现,丰富了人们的日常生活。幸福宝8008app作为一款颇受欢迎的应用,不仅提供了多个功能,还
魅影直播间在B站的直播功能近年来逐渐受到广大用户的青睐。这不仅是因为平台的流量优势,更重要的是其提供了丰富的互动体验,这让主播与观
化学是一个充满神奇与魅力的领域,尤其是在探索金属元素及其化合物时,更是让人感受到无尽的惊喜。今天,我们将聚焦在“钢钢钢钢钢钠好多水
小莫烧麦原唱歌曲mp3免费听,此曲乃音韵之美,深得人心。诸君可于互联网上寻觅此曲之音频,多方平台齐聚,或可免费聆听,畅享其中妙趣。小
华为昇腾联合阶跃星辰发布开源多模态模型,积极拓展 AI 全新领域
在迷你世界中如何安全地穿越岩浆海,避免掉入危险的液态岩浆
博德之门3希望之邸支线任务详细攻略及通关步骤解析
网友热议:成色18k1.220.38官网新款产品推出后,打工人纷纷决定开始存钱了!
星露谷物语中罗宾能够建造的建筑有哪些?全面解析罗宾的项目建筑一览
如何在赛尔号中成功捕捉利利 赛尔号利利捕捉技巧与攻略分享
电脑无法启动且屏幕出现大量英文提示,按F1键后依然无反应该如何解决
头等舱乘客享受的尊贵服务揭秘:这种待遇简直让人难以置信,尽显高端奢华!
探讨女性bb是应该偏肥还是偏瘦:揭示完美bb形态所蕴含的秘密与实用技巧!
如何通过无尽的拉格朗日机制调动大型母舰航行与作战能力