Vidu Q2重磅升级:AI视频生成迈入“演技时代”,支持5分钟长视频创作
近日,生数科技推出的图生视频大模型Vidu Q2完成重要更新,其“参考生”功能正式面向全球用户开放。这一突破性技术使AI视频生成从单纯的动态流畅迈向真正的情感表达,标志着AI视频创作进入结构化复杂叙事新阶段。
从“形似”到“神似”的技术跨越
Vidu Q2的核心突破在于其能够理解并生成细腻的面部微表情。此前,AI生成视频中的角色常被诟病为“面瘫”,而Vidu Q2现已可以捕捉嘴角不经意的抽动、眼神中一闪而过的犹豫、眉头微蹙表达的疑虑等微妙表情变化。

生数科技首席执行官骆怡航表示:“Vidu Q2的突破在于我们首次让AI角色拥有了‘有趣的灵魂’。我们让AI学会了‘演戏’,这不仅是技术的里程碑,更是通向更高级别人工智能不可或缺的一步。
这一突破得益于深度情感文本理解、图文解析,并结合对人体面部动作单元的精细解构与物理模拟,使AI能在视频中驱动角色面部肌肉、肢体肌肉产生符合情感逻辑的细微运动。
三大升级:高一致性、速度快3倍、价格更优
Vidu Q2参考生功能聚焦三项核心能力提升:
高一致性:在语义理解、镜头控制、内容可控性和多主体一致性方面均有大幅提升。Vidu Q2支持最多7个主体同时输入,并在动态场景中始终保持角色、服装、场景高度一致,满足短剧、动漫等多主体复杂叙事需求。
速度提升3倍:通过模型能力提升和产品工程优化,Vidu Q2的实际推理速度比Vidu Q1提升近3倍,同时价格更加优惠,实现“加量不加价”。
专业镜头控制:Vidu Q2在训练过程中加强了镜头素材的训练,能理解并执行复杂的运镜指令,如推拉摇移等专业摄影手法,使叙事节奏更加自然流畅。
视频延长功能:从碎片镜头到完整故事
Vidu首次推出的视频延长功能,突破了AI视频时长限制,允许创作者将短片扩展至最长5分钟。该功能支持用户在原视频基础上任意截取片段,并自由选择延长1-7秒,最终生成更长的视频内容。根据不同用户等级,视频时长上限分别为:免费用户30秒、标准版用户1分钟、专业版用户3分钟、旗舰版用户5分钟。这一功能使得创作者能够利用Vidu讲述高潮迭起的完整故事,而非仅仅生成碎片化的镜头。
多平台覆盖与API开放
Vidu Q2现已实现多渠道覆盖,用户可通过网页端(www.vidu.cn)、APP端及API使用最新功能。全新改版的Vidu APP将创作流程简化为“@主体+一句话描述”,大幅降低使用门槛,让普通用户也能轻松创作AI视频。APP内置海量主体库,并引入合拍互动机制,用户可直接在Feed流中浏览、创作与互动,实现从内容生产到消费的完整闭环。同时,Vidu Q2参考生API已全面开放接入,为开发者和企业用户提供更灵活的集成方案。
应用前景:从广告电商到影视动漫
Vidu Q2的“超一致”特性为广告、电商、动漫等领域带来全新可能。随着Vidu Q2参考生功能的全面开放,AI视频创作正迎来全新的发展阶段。从精准还原到情感表达,从工具使用到生态共建,Vidu Q2正在重新定义AI视频的商用价值,为数字内容创作开启更多可能。