金晨 ai换脸 通讯巨头入局视频生成,平直霸榜巨擘评测:东说念主物跳动多场景依然一致

发布日期:2024-12-06 13:04    点击次数:73

金晨 ai换脸 通讯巨头入局视频生成,平直霸榜巨擘评测:东说念主物跳动多场景依然一致

视频生成模子评测巨擘榜单 VBench金晨 ai换脸,突遭"屠榜"。

这个倏得杀出来的模子,即是中国电信东说念主工智能磋议院(TeleAI)刚刚发布的视频大模子(VBench 上的代号为 TeleAI-VAST)。

况且 16 项子主见有 9 项都是第一,大幅首先第二名。

其中更是有 5 项得分卓越 99%,并在物体分类和东说念主体行动两项拿了满分 100%。

来看一段样片:

这段短片中,四位女主角为寻找相持,分别踏上了各自的冒险之旅。

具体细节不张开太多,但关节之处在于,每个东说念主物在各自的分镜中,形象都和开始的合影保抓了一致。

要知说念关于视频生成来说,保抓单个东说念主物的前后一致就仍是不是一件容易的事,TeleAI 视频生成大模子却一下科罚了四个。

东说念主物行动精确截止,还有音画同步

除了开始三分钟的宣传片,TeleAI 展示了另外几段作品。

第一段视频中,女主角先后出当前公交车、马路、酒吧吧台和座位四个不同的场景。

在这四个场景中,东说念主物的外貌、发型、衣服皆备保抓了一致,画面合座的颜色作风也很协调。

这施展,TeleAI 视频生成大模子仍是已毕了不同的场景变化下主体的时空一致性。

接下来的这段画面里,两只猴王张开了一场近距离对战,时辰的东说念主物行动、镜头奴才,都仍是呈现出了电影级的水准。

淌若细节再不绝打磨优化,拿来拍电影计日奏功。

东说念主物特征、时空一致性和行动精确性都有了,还能再作念些什么呢?

当前的视频生成模子大多生成的都是默片,这次 TeleAI 把声息也加进来了。

先看视频:

从视频中不错看到,TeleAI 视频生成大模子生成的声息,不是单纯地来上一段音乐那么通俗。

仔细听会发现,舰船的鸣笛声、飞机腾飞的轰鸣声、潜水艇的水声,以及终末火箭冲出水面的声息,都与画面中看到的内容作念到了同步。

也即是说,TeleAI 视频生成大模子作品中体现的一致性,仍是跳动模态了。

开创两阶段生成架构

不仅遵守和收成优秀,TeleAI 视频生成大模子的技艺架构也终点私有。

它莫得选择传统的旅途,而是全自研了一个"二阶段视频生成技艺"——VAST(Video As Storyboard from Text)。

TeleAI 团队莫得聘请一步到位,而是将视频的生身领会成了两个历程。

在第一阶段,选择多模态大型模子字据文本输入生成中间素材,包括姿势、分割图和深度信息。

TeleAI 团队把这些中间暗意称作"故事板",是模子或者体现场景语义和结构本色的关节。

第二阶段,才是真确的视频生成。

运用基于 DiT 架构的扩散模子,TeleAI 以这些暗意为条款,连续方向对象的文本描画和外不雅信息,生成最终的视频。

这种分段式的阵势,使得生成视频时或者精确截止主体的位置、畅通和视觉外不雅。

况且,TeleAI 视频生成大模子不仅能在模子上分"阶段",还不错把视频按场景分红"片断"。

当创作家念念要生成一段长视频时,视频生成器具不错先蓄意具体的分镜头,开始 3 分钟的视频即是用这种次序创作出来的。

针对每一个分镜,生成具有一致性的生成中间素材,这些中间素材不仅作用于模子里面,对创作家亦然可见的,致使还能进行诊疗修改。

因为对片断进行了分散,是以,唯有在每个片断中都能保抓东说念主物一致性,不错生成的视频长度将是无尽长。

中国电信先容,本次发布的视频生成大模子将于来岁开启公测,不错期待一波簇新的 AI 大片了。

多样模态皆备有,还要作念智能体

这次亮相的视频生成大模子,是 TeleAI 统统这个词大模子布局中的一个智商。

此前,TeleAI 仍是自主了研发遮蔽语义、语音、视觉、多模态的"星辰"大模子才智体系。

星辰大模子在央企中惟一开源,还完成首个寰球产化万卡万参大模子锻练,并打造业界首个解救 40 种方言摆脱混说的语音识别大模子。

美妙人妻

基础模子以外,TeleAI 还面向工业、锻练等限制推出 50 多个场景大模子,并构建了"星海"数据智能中台,酿成了 9 万亿 Tokens 高质地数据集。

在使用阵势上也别具肺肠,致使推出了发短信和大模子对话的功能。

除了模态、场景、数据和使用阵势,TeleAI 也全新推出了大模子智能体平台,与视频生成大模子一同登上 TeleAI 设备者大会。

不错期待一下 TeleAI 下一波的 AI 居品了金晨 ai换脸。



热点资讯

相关资讯

Powered by 黑人巨屌 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024