viduq1是什么 - 今日头条

整理自 | 生数ShengShu、宝藏同学阿真、大狐AI

订、阅 | 010-86092062

如今，多模态技术正以前所未有的速度改变着世界。而在这场科技浪潮中，国产视频大模型正悄然走在前列，成为全球科技创新的重要力量。

3月29日，在全球科技创新交流合作的国家级平台——中关村论坛上，清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授，发布了高可控视频大模型Vidu Q1成为焦点，这一关键科技成果的发布标志着国产视频大模型迈向了新的高度，为AI视频生成走向“高可控”时代指明路径。

4月21日，ViduQ1再次走在行业前沿，推出了四大核心能力的全面升级，为创作者们带来了前所未有的沉浸式体验。

Vidu官网 https://www.vidu.cn

01 全面大升级，极“质”体验震撼来袭！

Vidu Q1 作为业内首个高可控AI视频大模型，其在多主体细节可控（特别是动作、布局可控）、音效同步可控、画质增强等方面均取得显著成效，这使得它在众多视频大模型中脱颖而出。

以多主体细节可控为例，在语义指令的基础上，通过融入参考图的视觉指令，Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控，对所有动作行为（出场、退场、坐立姿态、行动路线）进行精准调整。用户能够明显体验到用更低的抽卡率实现更高质量的可控生成。

音效同步可控功能则确保了随着视频环境与画面转场，Vidu Q1能够输出生成相应音效，并可精准控制每段音效的长短区间，精准设置每段音频出现的时间点，如0-2s风声、3-5s雨声等，节省时间的同时，也大大增强了视频的沉浸感与感染力。Vidu Q1模型通过进一步增强画质，则能够为用户带去更加清晰、细腻、逼真的视觉体验。

此次更新推出了四大核心能力的全面升级。

1 极“质"高清：画质细节全面提升

ViduQ1 在画质方面进行了革命性的升级。通过细节的全面提升，用户可以享受到更加清晰、质感更强的出片效果。每一帧画面都如同艺术品般精致，使作品更具视觉冲击力。

2 极“质"转场：首尾帧衔接更顺滑

转场效果的提升让ViduQ1 在镜头语言上更具电影感。首尾帧的衔接更加顺滑自然，赋予作品更流畅的节奏和更深刻的情感表达。这一改进让创作者能够轻松实现专业级的视觉效果。

3 极“质"音效：一句话生专属音效

音效是作品情感表达的重要组成部分。ViduQ1 的音效功能支持一句话生成专属音效，并允许时段自定义和音效加成。

4 极“质”风格：动漫风格再度升级

动漫风格一直是Vidu的一大特色，此次升级让其风格更加稳定流畅、更具表现力。二次元世界的梦幻场景、奇妙冒险，都能生动呈现，每一个动作、每一抹色彩都充满生命力。

02 可接入飞书多维表格，批量生成AI视频

Vidu与飞书达成官方合作，快捷字段上线后，@宝藏同学阿真制作了一组飞书多维表格适用的Vidu插件，可以实现文生视频、图生视频、首尾帧视频等功能。提示词和表格功能列大家都可以按照自己的需要进行修改，得到更符合自己要求的效果。

预览如下：

下面是模板链接的分享：

📝

https://a80cyp5nki.feishu.cn/base/LDtFb87JZa31k4sTLvDcs16pnXf?from=from_copylink

1 如何接入Vidu到飞书多维表格

首先新建飞书多维表格，点击右列的【+】，选择【附件】，将鼠标移动到下方的探索字段捷径，出现搜索框后，输入vidu就可以看见字段捷径。

1 极简的文生视频表格

最简单的文生视频表格，1列表格就能跑起来：新建一列【Vidu AI生视频】，其他操作如下：

点击视频，视频放大后，右上角可以选择下载或者批量下载。

2 图生视频的多维表格制作思路与流程

表格逻辑思路

插件表格中的电商视频、创意视频和短剧视频的结构，除了提示词上的不同，其他都是差不多的。

📝

每个列的功能：

1. 场景编号

（这一列是个固定列，后续也不可以移动，所以会有点不便，不如用于编号序号）

2. 上传图片（这一列上传图片）

3. 运镜方式

（这一列设置了多个运镜方式，它可以根据图片自己选择运镜，也可以我们自行手动选择修改）

4. 自动提示词（这一列用于根据图片去生成图片的提示词）

5. 其他要求（这一列用于自己加入其他的要求，比如镜头角度的要求、转场要求等）

6. 完整提示词

（这一列是汇总了前面的运镜方式、自动提示词、其他要求三项内容，然后加入了适合该方向的图生视频的提示词引导，最终进行提示词输出，也就是这个就是最终的图生视频的提示词）

7. 准备好了！生成视频

（这个按钮是为了避免前面每一列任意内容更新后导致其他列遵循顺序进行更新消耗Token的，更新完前面的所有要求后才点击，就可以稳定生成视频）

8. Vidu AI生视频（生成的最终视频会在这一列中）

这里采用了一些自动化功能，当你点击使用模板后，发现【准备好了！生成视频】那一列的按钮不是彩色的而是灰色的，就需要激活原本表格模板自带的自动化功能。

运镜方式

填写标题时，字段类型选择【多选】，标签采用【智能标签】。

这里的智能标签可以选择【AI生成选项】快速获得更多选项。

自动提示词

【自动提示词】这一列的作用是分析图片内容，然后反推图片内容，并输出提示词。有这一步的原因是最终输出提示词的是DeepSeek，而它不能识别图片，所以我们需要一个工具来梳理图片内容给到它，以便它能根据图片内容描述，给到更适合图片的视频提示词。案例选择的快捷字段是Kimi图片理解。

这一列是自己运行的，不需要自行填写。也不需要填写关联账号（目前不需要）。

其他要求

这一列的功能是加入自己的想法，直接输入内容就可以，所以字段类型我们选择【文本】。

按钮字段

案例中可以使用按钮字段来控制【完整提示词】。设置的时候【执行操作】不用设置，因为后面的步骤会自动出现。

完整提示词

打开【完整提示词】这一列，新建一个最简单的文本列就可以了，因为它只是一个简单的装我们最终输出提示词的容器。

输出Vidu AI视频

这一步就是最开始提到的，字段类型选择【附件】搜索【Vidu AI生视频】，官方有赠送了免费额度，如果上面出现黄色的小感叹号图标就是代表额度用完了，就需要关联Vidu的账号了，点击【关联账号】关联自己的API。

生成案例

3 首尾帧视频的多维表格制作

首尾帧视频在其他方面都和图生视频的内容是差不多的，可以参考图生视频的做法，主要区别在于提示词的指令（这个可以打开分享的多维表格参考），图片上传部分，你需要上传2张图片，以及【Vidu AI生成视频】列的提示词部分。

在提示词中加上“画面从图一到图二”即可。

4 文生视频的多维表格制作

文生视频的多维表格就更简单了，这里使用的也是比较简单的方式制作的，一列输入关键词，然后加一列对关键词进行AI优化。其他的和之前的几个是一样的。如果对自己的提示词很自信，也可以删掉优化的这一列，但是要记得需要按照逻辑改动连接按钮的那个自动化流程。

——·——

Vidu Q1的发布以及升级，不仅为视频内容创作领域带来了革命性的变革，也为众多行业的AI重构提供了全新的思路与解决方案。我们也期待，中国的AI视频生成赛道玩家能够持续在世界舞台上舞出风采，在百家争鸣中，实现中国多模态技术的极大发展和人人可感知到的现实应用。

为此,生数科技发布了业内首个高可控视频大模型ViduQ1,通过技术手段引入多元素控制,其在多主体细节可控、音效同步...

生数科技发布了业内首个高可控视频大模型ViduQ1,通过技术手段引入多元素控制,其在多主体细节可控、音效同步可控...

而对于几乎是每个创作者都经历过的“抽卡”难题,相比 Vidu 1.5,Q1的文生视频功能在理解提示词的语义和镜头逻辑方...

四大核心能力的全面升级！ViduQ1为创作者们带来了前所未有的沉浸式体验

猜你喜欢

头条热榜

精彩视频

四大核心能力的全面升级！ViduQ1为创作者们带来了前所未有的沉浸式体验

猜你喜欢

相关推荐

头条热榜

精彩视频