来源:星火智游网 责编:网络 时间:2025-04-15 20:58:53
近日,HPC-AI Tech 宣布推出 Open-Sora2.0,这是一款突破性的视频 AI 系统,仅需约十分之一的典型训练成本即可实现商业级质量。这一进展标志着在资源密集型的视频 AI 领域可能出现范式转变,堪比语言模型中出现的效率提升。
虽然像 Movie Gen 和 Step-Video-T2V 这样现有的高质量视频生成系统可能需要数百万美元的训练费用,但 Open-Sora2.0的训练支出仅约为20万美元。尽管成本大幅降低,但测试表明,其输出质量可与 Runway Gen-3Alpha 和 HunyuanVideo 等已建立的商业系统相媲美。该系统使用了224个 Nvidia H200GPU 进行训练。
提示:“两个女人坐在米色沙发上,房间温馨舒适,背景是砖墙。她们愉快地交谈,面带微笑,在亲密的中景镜头中举杯庆祝红酒。”| 视频:HPC-AI Tech
Open-Sora2.0通过一种新颖的三阶段训练过程实现其效率,首先从低分辨率视频开始,逐步细化到更高分辨率。集成像 Flux 这样的预训练图像模型进一步优化了资源利用。其核心是视频 DC-AE 自动编码器,与传统方法相比,它提供了卓越的压缩率。这一创新转化为令人瞩目的5.2倍更快的训练速度和超过十倍更快的视频生成速度。虽然更高的压缩率导致输出细节略有减少,但它极大地加快了视频创建过程。
提示:“一颗番茄在一片生菜上冲浪,顺着牧场酱汁瀑布而下,夸张的冲浪动作和柔滑的波浪效果凸显了3D 动画的乐趣。”| 视频:HPC-AI Tech
这款开源系统可以从文本描述和单张图像生成视频,并通过运动评分功能让用户控制生成片段中的运动强度。HPC-AI Tech 提供的示例展示了各种场景,包括逼真的对话和异想天开的动画。
然而,Open-Sora2.0目前在分辨率(768x768像素)和最长视频时长(5秒或128帧)方面存在限制,逊于 OpenAI 的 Sora 等领先模型的功能。尽管如此,其在视觉质量、提示准确性和运动处理等关键领域的表现正逼近商业标准。值得注意的是,Open-Sora2.0的 VBench 得分现在仅落后 OpenAI 的 Sora0.69%,与之前版本4.52% 的差距相比有了显著改进。
提示:“一群拟人化的蘑菇在一片黑暗的魔法森林中举行迪斯科派对,伴随着闪烁的霓虹灯和夸张的舞步,它们光滑的纹理和反光的表面强调了滑稽的3D 外观。”| 视频:HPC-AI Tech
Open-Sora2.0的成本效益策略与语言模型中的“Deepseek 时刻”相呼应,当时改进的训练方法使开源系统能够以远低于商业系统的成本实现商业级性能。这一发展可能会对视频 AI 领域的价格产生下行压力,该领域目前由于计算需求高昂,服务按秒收费。

培训成本比较:Open-Sora2.0需要大约20万美元,而 Movie Gen 需要250万美元,Step-Video-T2V 需要100万美元。| 图片:HPC-AI Tech
尽管取得了这一进展,但开源和商业视频 AI 之间的性能差距仍然大于语言模型,这突显了该领域持续存在的技术挑战。Open-Sora2.0现在已在 GitHub 上作为开源项目提供。
在当今数字化的时代,互联网提供了丰富多样的资源和娱乐选择。其中,成人视频网站成为了一部分用户寻求刺激和娱乐的途径。对于这些网站的使
在这个信息爆炸的时代,漫画作为一种受欢迎的娱乐形式,已经成为了许多人生活中不可或缺的一部分。而对于漫画爱好者来说,找到一个丰富多样
三年片在线观看大全哔哩哔哩,乃现今网络视听之盛宴,诸多影视资源汇聚于此,诚为观众提供多元化之选择。无论古今中外,各类影片悉皆应有尽
在这个信息爆炸的时代,人们对于娱乐的需求越来越高。而影视、剧集和综艺节目无疑是人们最喜爱的娱乐方式之一。麻斗传媒官方网站作为一个专
成本仅为原来的十分之一!全新 Open-Sora 2.0 开源视频 AI 技术带来突破性的商业级画质体验
怪物猎人荒野中最强灭龙瓶斩斧配装全解析与技巧分享
怪物猎人荒野大回复中蜜虫的具体位置在哪里能找到
OpenAI重磅消息:GPT-5即将发布,CPO预计今年AI代码自动化水平将达到99%!
如何在我的世界中制作铁傀儡的详细步骤与技巧分享
刺客信条影一直提示检查附加内容的问题该如何解决与处理
香港人工智能领域岗位缺口日益扩大,现急需超2000名专业人才填补空缺
洛克王国圆眼蜘蛛的首次上线时间是什么时候?
全面提升生命质量!全国首个出生健康管理大模型CHANGE重磅发布,科技赋能健康未来
金铲铲之战中的监察老鼠角色玩法详解以及策略分享