ViduAI离电影最近的一次

ViduAI离电影最近的一次-3

自OpenAI推出Sora以来,文生视频领域的发展可谓日新月异。如果说去年是大模型的较量,那么今年无疑成为了文生视频技术的竞技场。

备受瞩目的Sora尚未对公众开放,但Runway 3和Luma凭借其卓越的文生视频与图生视频能力,已经在网络世界迅速走红。中国企业也不甘落后,继快手、智谱推出各自的文生视频产品后,被誉为"中国版Sora"的Vidu也正式发布。Vidu的表现究竟如何?让我们一探究竟。

多个独特功能:AI第一次离电影创作这么近

大多数文生视频产品都配备了文生视频和图生视频两大核心功能,Vidu自然也不例外。然而,Vidu的独特之处在于它新增了一项关键功能——" 角色到视频 "。简而言之,这一功能允许在多个不同场景中保持同一角色的连贯性,而这个角色正是由你上传的图片所定义。例如,以下示例所示。

这一功能至关重要,目前大多数文生视频产品尚未具备。正是有了这项功能,我们才得以真正实现短片的生成,而非仅仅是一系列毫无联系的镜头。

此外,Vidu在写实风格的基础上,还增加了 动画风格 选项,意味着用户现在可以直接通过Vidu生成类似宫崎骏动画风格的视频。这一功能无疑将受到动漫爱好者的热烈欢迎,且目前大多数文生视频产品尚未提供。

Vidu的另一大亮点是,它能够在 一个生成的视频内包含多个镜头 ,这在当前所有文生视频产品中尚属首创,功能之强大不言而喻。

在其他方面,Vidu默认支持4秒和8秒两种视频时长,不同于其他工具可以通过延长功能来增加视频时长。虽然在某些情况下可能存在局限,但这种时长设置足以应对大多数场景。

技术与美学的完美结合

无论是文生视频还是图生视频,我们都需通过"提示词"向AI下达指令。因此,对提示词的理解能力成为衡量工具性能的重要标准。Vidu在这一点上表现出色,它能够真正理解自然语言,例如复杂的提示词:"两个人举起茶杯轻轻抿了一口。左侧的人轻抿双唇后露出微笑,右侧的人则全神贯注于他们的茶,营造出一种静谧而微妙的互动场景。精致的布景、淡雅的色彩、花卉装饰和古典家具共同强化了这一优雅氛围。"

提示词 : 两个人举起茶杯轻轻抿了一口。 左侧的人轻抿双唇后露出微笑,右侧的人则全神贯注于他们的茶,营造出一种静谧而微妙的互动场景。 精致的布景、淡雅的色彩、花卉装饰和古典家具共同强化了这一优雅氛围。

审美同样重要 。一些产品,如快手的可灵,虽然能生成高清画质视频,但默认生成的人物形象偏向西方,除非特别指定"亚洲人"或"中国人"。而Vidu默认的人物形象就是东方的,具有电影质感,审美上更为舒适。与快手的可灵相比,Vidu的视频更接近专业摄影机的拍摄效果。

提示词: 生成一个展示人物内心喜悦的镜头,使用特写镜头捕捉他们的表情。

提示词: 用一个过肩镜头展示两个人物在咖啡馆深入交谈的场景,背景模 糊以突出主体。

速度:迅速而高效

大多数文生视频产品生成几秒视频需要数分钟,用户量激增时,甚至可能需要数小时,如快手的可灵和Luma。然而,Vidu生成视频仅需十几秒,这不仅因为用户量尚少,更得益于其在画质和并发处理上的优化。

Vidu的局限

尽管Vidu表现出色,但它也存在一些不足。画质是其最明显的短板。默认画质甚至未达到720p标准(这都啥年代了?),而高清模式仅支持到1080p,且升级到高清需要重新生成视频,意味着用户需再次支付费用。

Vidu的并发支持也相对有限,免费版不支持并发,即便是最昂贵的版本也只支持4个任务并发。与快手等不限制并发的产品相比,这无疑是Vidu的一个短板。

ViduAI离电影最近的一次-4

低画质和有限的并发能力在一定程度上减轻了后端服务器的压力,这也是Vidu能够快速生成视频的原因之一。虽然这限制了用户的使用体验,但与长时间等待相比,Vidu的快速生成更值得称道。

此外,Vidu目前 只能生成横版视频 ,不支持竖版或正方形格式,这在短视频盛行的今天无疑是一大限制。

还有一点,Vidu的图生视频效果与快手的可灵相比有所不及,似乎在这一模块上对提示词的理解能力有所下降。应该说,可灵 图生视频完全是碾压Vidu的。

总结

总体来看,Vidu是一款非常出色的文生视频产品,在世界范围内都处于领先地位。尽管存在一些不足,但其创新功能和快速生成能力使其成为市场上的一股清流。

THE END
分享
二维码
< <上一篇
下一篇>>