来源:星火智游网 责编:网络 时间:2025-04-26 02:12:07
上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的Step-Video-T2V训练而成,能够生成102帧、5秒、540P分辨率的视频,具有运动幅度可控和镜头运动可控两大核心特点,尤其在动漫效果方面表现出色。与现有的开源图生视频模型相比,Step-Video-TI2V不仅在参数规模上提供了更高的上限,其运动幅度可控能力还能平衡视频生成结果的动态性和稳定性,为创作者提供了更灵活的选择。
Step-Video-TI2V的开发过程中,团队进行了两大关键优化。首先,引入图像条件以提高生成视频与原图的一致性。与传统的cross-attention方法不同,该模型采用了更直接的方式,将图像对应的向量表示与DiT第一帧对应的向量表示直接进行channel维度的拼接,从而确保生成的视频与输入图片高度一致。其次,通过AdaLN模块引入视频动态性打分信息,使用户在生成视频时可以指定不同的运动级别,精准控制视频的动态幅度,从而平衡动态性、稳定性和一致性。此外,团队还对主体动作和镜头运动进行了专项精准标注,进一步提升了模型在主体动态性和运镜效果上的表现。
Step-Video-TI2V的核心特点包括运动幅度可控、多种运镜控制、动漫效果优异以及支持多尺寸生成。用户可以根据创作需求自由切换动态与稳定画面,生成从基本的推拉摇移、升降到复杂电影级运镜效果的视频。该模型在动漫类任务上的表现尤为突出,非常适合动画创作和短视频制作等应用场景。同时,它支持多种尺寸的图生视频,无论是横屏、竖屏还是方屏,都能满足不同平台的需求。
体验地址:
https://yuewen.cn/videos
GitHub:
https://github.com/stepfun-ai/Step-Video-TI2V
Github-ComfyUI:
https://github.com/stepfun-ai/ComfyUI-StepVideo
随着移动互联网的迅速发展,各类应用程序不断涌现,丰富了人们的日常生活。幸福宝8008app作为一款颇受欢迎的应用,不仅提供了多个功能,还
魅影直播间在B站的直播功能近年来逐渐受到广大用户的青睐。这不仅是因为平台的流量优势,更重要的是其提供了丰富的互动体验,这让主播与观
化学是一个充满神奇与魅力的领域,尤其是在探索金属元素及其化合物时,更是让人感受到无尽的惊喜。今天,我们将聚焦在“钢钢钢钢钢钠好多水
小莫烧麦原唱歌曲mp3免费听,此曲乃音韵之美,深得人心。诸君可于互联网上寻觅此曲之音频,多方平台齐聚,或可免费聆听,畅享其中妙趣。小
运动掌控新时代!阶跃星辰 Step-Video-TI2V 图生视频模型现已开源,助力创意无限
东莞建立中国首个专注于制造业的城市级人工智能大模型中心,推动产业智能化转型
高阶用户的理想选择?OpenAI推出O1-Pro推理模型,百万Token售价高达600美元令人瞩目
腾讯混元再度发力,全新推理模型T1将于3月21日晚正式发布,敬请期待新科技盛宴!
Adobe推出“Project Slide Wow”项目,让数据瞬间变换为引人注目的精彩PPT演示文稿
仙剑五前传详细攻略及玩法解析 全面解读仙剑五前传各大任务与角色攻略
微软与贝莱德伙伴关系携手马斯克xAI,共同推动300亿美元人工智能基础设施合作联盟
Adobe全新“Project Slide Wow”发布,助你轻松一键制作专业PowerPoint,完全无需编程技能!
OpenAI 向美国当局提出关于人工智能发展与监管的综合行动计划建议
深入解析不断上升的黑暗商业现象:其实际目的及对社会的潜在影响研究