来源:星火智游网 责编:网络 时间:2025-04-16 09:34:14
上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的Step-Video-T2V训练而成,能够生成102帧、5秒、540P分辨率的视频,具有运动幅度可控和镜头运动可控两大核心特点,尤其在动漫效果方面表现出色。与现有的开源图生视频模型相比,Step-Video-TI2V不仅在参数规模上提供了更高的上限,其运动幅度可控能力还能平衡视频生成结果的动态性和稳定性,为创作者提供了更灵活的选择。

Step-Video-TI2V的开发过程中,团队进行了两大关键优化。首先,引入图像条件以提高生成视频与原图的一致性。与传统的cross-attention方法不同,该模型采用了更直接的方式,将图像对应的向量表示与DiT第一帧对应的向量表示直接进行channel维度的拼接,从而确保生成的视频与输入图片高度一致。其次,通过AdaLN模块引入视频动态性打分信息,使用户在生成视频时可以指定不同的运动级别,精准控制视频的动态幅度,从而平衡动态性、稳定性和一致性。此外,团队还对主体动作和镜头运动进行了专项精准标注,进一步提升了模型在主体动态性和运镜效果上的表现。
Step-Video-TI2V的核心特点包括运动幅度可控、多种运镜控制、动漫效果优异以及支持多尺寸生成。用户可以根据创作需求自由切换动态与稳定画面,生成从基本的推拉摇移、升降到复杂电影级运镜效果的视频。该模型在动漫类任务上的表现尤为突出,非常适合动画创作和短视频制作等应用场景。同时,它支持多种尺寸的图生视频,无论是横屏、竖屏还是方屏,都能满足不同平台的需求。
体验地址:
https://yuewen.cn/videos
GitHub:
https://github.com/stepfun-ai/Step-Video-TI2V
Github-ComfyUI:
https://github.com/stepfun-ai/ComfyUI-StepVideo
在当今数字化的时代,互联网提供了丰富多样的资源和娱乐选择。其中,成人视频网站成为了一部分用户寻求刺激和娱乐的途径。对于这些网站的使
在这个信息爆炸的时代,漫画作为一种受欢迎的娱乐形式,已经成为了许多人生活中不可或缺的一部分。而对于漫画爱好者来说,找到一个丰富多样
三年片在线观看大全哔哩哔哩,乃现今网络视听之盛宴,诸多影视资源汇聚于此,诚为观众提供多元化之选择。无论古今中外,各类影片悉皆应有尽
在这个信息爆炸的时代,人们对于娱乐的需求越来越高。而影视、剧集和综艺节目无疑是人们最喜爱的娱乐方式之一。麻斗传媒官方网站作为一个专
可控运动新时代!阶跃星辰 Step-Video-TI2V 图生视频模型正式开源发布,赋能创作更多可能
剑侠情缘独孤剑重生:领略武侠世界中的英雄传奇之旅
鬼谷八荒三灵共生机制解析及如何在游戏中获取三灵共生的详细攻略
Meta积极研发自有AI训练晶片,旨在降低对NVIDIA的依赖程度
Pruna AI 发布开放源码的 AI 模型优化工具框架,推动高效压缩技术的应用
侠盗猎车手5有哪些有效的赚钱方法和技巧,帮助你在游戏中快速致富
OpenAI 向美国行政机关递交关于人工智能发展与管理的行动计划建议
2022年Intel集成显卡性能天梯图全面解析与详细分析
新赛季平衡调整遭到玩家广泛批评《流放之路2》团队公开承认改动失误
理想汽车AI助手升级上线:网页版理想同学接入DeepSeek R1满血版,性能大幅提升