Vidu Q2重磅升级：AI视频生成迈入“演技时代”，支持5分钟长视频创作

资讯 2025-10-26 22:50

近日，生数科技推出的图生视频大模型Vidu Q2完成重要更新，其“参考生”功能正式面向全球用户开放。这一突破性技术使AI视频生成从单纯的动态流畅迈向真正的情感表达，标志着AI视频创作进入结构化复杂叙事新阶段。

从“形似”到“神似”的技术跨越

Vidu Q2的核心突破在于其能够理解并生成细腻的面部微表情。此前，AI生成视频中的角色常被诟病为“面瘫”，而Vidu Q2现已可以捕捉嘴角不经意的抽动、眼神中一闪而过的犹豫、眉头微蹙表达的疑虑等微妙表情变化。

生数科技首席执行官骆怡航表示：“Vidu Q2的突破在于我们首次让AI角色拥有了‘有趣的灵魂’。我们让AI学会了‘演戏’，这不仅是技术的里程碑，更是通向更高级别人工智能不可或缺的一步。

这一突破得益于深度情感文本理解、图文解析，并结合对人体面部动作单元的精细解构与物理模拟，使AI能在视频中驱动角色面部肌肉、肢体肌肉产生符合情感逻辑的细微运动。

三大升级：高一致性、速度快3倍、价格更优

Vidu Q2参考生功能聚焦三项核心能力提升：

高一致性：在语义理解、镜头控制、内容可控性和多主体一致性方面均有大幅提升。Vidu Q2支持最多7个主体同时输入，并在动态场景中始终保持角色、服装、场景高度一致，满足短剧、动漫等多主体复杂叙事需求。

速度提升3倍：通过模型能力提升和产品工程优化，Vidu Q2的实际推理速度比Vidu Q1提升近3倍，同时价格更加优惠，实现“加量不加价”。

专业镜头控制：Vidu Q2在训练过程中加强了镜头素材的训练，能理解并执行复杂的运镜指令，如推拉摇移等专业摄影手法，使叙事节奏更加自然流畅。

视频延长功能：从碎片镜头到完整故事

Vidu首次推出的视频延长功能，突破了AI视频时长限制，允许创作者将短片扩展至最长5分钟。该功能支持用户在原视频基础上任意截取片段，并自由选择延长1-7秒，最终生成更长的视频内容。根据不同用户等级，视频时长上限分别为：免费用户30秒、标准版用户1分钟、专业版用户3分钟、旗舰版用户5分钟。这一功能使得创作者能够利用Vidu讲述高潮迭起的完整故事，而非仅仅生成碎片化的镜头。

多平台覆盖与API开放

Vidu Q2现已实现多渠道覆盖，用户可通过网页端（www.vidu.cn）、APP端及API使用最新功能。全新改版的Vidu APP将创作流程简化为“@主体+一句话描述”，大幅降低使用门槛，让普通用户也能轻松创作AI视频。APP内置海量主体库，并引入合拍互动机制，用户可直接在Feed流中浏览、创作与互动，实现从内容生产到消费的完整闭环。同时，Vidu Q2参考生API已全面开放接入，为开发者和企业用户提供更灵活的集成方案。

应用前景：从广告电商到影视动漫

Vidu Q2的“超一致”特性为广告、电商、动漫等领域带来全新可能。随着Vidu Q2参考生功能的全面开放，AI视频创作正迎来全新的发展阶段。从精准还原到情感表达，从工具使用到生态共建，Vidu Q2正在重新定义AI视频的商用价值，为数字内容创作开启更多可能。