来源:星火智游网 责编:网络 时间:2025-04-24 03:51:11
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强大的 AI 工具。
Step-Video 模型的全名为 Step-Video-T2V,这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频,并在指令遵循、运动平滑性、物理合理性以及美感等方面,表现超越了市场上现有的顶尖开源视频模型。另一方面,Step-Audio 则是业内首款能够生成多种情感、方言、语言、唱腔和个性化风格的语音的大模型。这一技术的发布,标志着 AI 语音交互领域的一次重要突破。
图源备注:图片由AI生成,图片授权服务商Midjourney
值得一提的是,这些模型是基于华为昇腾 CANN 异构计算架构和昇腾服务器进行适配的。开发者和企业用户可以在魔乐社区中便捷地下载和体验这些模型。为了进一步降低使用门槛,魔乐社区还提供免费算力支持,让用户可以在线进行模型推理,而无需复杂的环境搭建,快速验证他们的 AI 方案。
此外,阶跃星辰的开源模型受到了多个行业标杆企业的关注,包括天数智芯、阿里云、火山引擎、TCL 等各行各业的厂商已纷纷接入这一开源生态。未来,阶跃星辰计划在3月份推出新的图生视频模型,进一步丰富其产品线。
华为昇腾与阶跃星辰的这一合作不仅拓展了多模态 AI 模型的应用场景,也为开发者提供了更为强大的工具,推动了整个行业的技术进步。
自来也和纲手拔萝卜配音声音以其独特之韵味,令众人潜心于二者之互动。二者之声,乃是共鸣之道,情感之流,使人宛如置身于其境。二人虽在不
在当今这个信息爆炸的时代,网上的娱乐内容琳琅满目,其中漫画作为一种轻松、幽默的艺术形式,受到了众多年轻人的喜爱。尤其是歪歪㊙️羞羞
秋蝉漫画入口页面弹窗下拉式者,乃近来网络之新兴形式,旨在为众多漫画爱好者提供更加便捷之浏览体验。此一设计,非但省却繁杂之操作,且以
日产不断在汽车技术的创新上探索,2023年的无人区一线、二线和三线标志着无人驾驶技术的新阶段。在全球倡导绿色出行和智能交通的大背景下,
华为昇腾联合阶跃星辰发布开源多模态模型,共同拓展人工智能新领域
索尼音乐采取维权措施,强制下架超过7.5万条由AI生成的音乐作品
剑与骑士团珂薇特的技能解析与实战应用详解
警惕!抖音加强打击AI炒股诈骗行为,AI选股软件及相关课程内容成为重点整治目标
在荒野国度中,如何有效地对家园进行迁移与重建,确保生存与发展
宇树科技正式启动跨境电商业务,阿里速卖通旗舰店盛大开业,众多产品享受“百亿补贴”优惠政策
摆脱复杂建模烦恼!手绘草图瞬间转化为精致3D模型,MeshPad助力设计师完美释放创造力!
崩坏星穹铁道缇宝及其专属武器所需材料获取攻略详解
百度AI创作工具橙篇成功融合DeepSeek-R1全面升级版,开启全新创作体验
加州新法案实施:确保人类重新掌控职场决策,告别机器老板的时代