用AI生成了一部偶像剧我发现了以下问题

用AI生成了一部偶像剧我发现了以下问题-3

快手的可灵AI视频生成工具以其快速生成和逼真效果领先市场,但面临提示词理解、镜头语言和角色一致性等技术挑战,预示着AI视频生成技术的巨大潜力与成长空间。

随着人工智能技术的飞速发展,文生视频这一领域也迎来了前所未有的繁荣。从简单的动画制作到复杂的电影级场景生成,AI正逐渐改变着视频内容创作的生态。在这个背景下,快手推出的快影AI视频生成工具——可灵,以其出色的生成速度和逼真的视频效果,成为了业界关注的焦点。

传统的文生视频测试方法往往局限于对提示词的响应,这种方法虽然直观,但难以全面评估AI生成视频的多样性和复杂性。为了更贴近实际应用场景,我采用了一种更为全面的测试策略,模拟电影、短剧以及短视频的制作过程,考察AI在不同场景下的表现。

快手可灵的测试体验

在对快手可灵进行测试时,我尝试生成了一段约1分钟的连续短片,以此来评估其在生成连贯视频内容方面以及不同类型镜头的能力。测试结果显示,可灵在视频生成速度上表现出色,尽管官方宣称每个视频需要4分钟生成时间,实际等待时间却低于此,这在当前市场上的同类产品中是相当罕见的。

更令人印象深刻的是,可灵生成的视频质量极高,逼真度接近实拍,这得益于其先进的图像处理和渲染技术。在视觉呈现上,可灵几乎能够与专业影视制作相媲美,这无疑为文生视频的商业应用打开了大门。

用AI生成了一部偶像剧我发现了以下问题-4 图片:来自可灵文生视频剧照

当前产品的局限性

尽管可灵在速度和质量上表现出色,但作为一款处于初级阶段的AI产品,它仍然面临着一些挑战和局限。

首先,对提示词的理解能力尚显不足。理解提示词就是理解用户意图,这是AI对自然语言的理解和处理是其核心能力之一,而可灵目前还无法完全理解一段完整的自然语言描述,更多地依赖于关键词式的指令。这限制了其在复杂场景下的创作能力。

其次,可灵在理解基本镜头语言方面存在局限,如推拉、环绕、平移等镜头运动,以及全景、中景、近景等景别的概念。这些基本元素对于构建动态丰富的视觉叙事至关重要。

用AI生成了一部偶像剧我发现了以下问题-5 图片:来自可灵文生视频剧照

此外,对于抽象概念的理解也是可灵需要提升的方面。例如,表达情感状态的词汇如“惊喜”、“迷茫”等,以及描述动作的词汇如“四处张望”、“左看右看”等,目前还难以被准确理解和表现。当然这些太难了,一般演员都很难表现,拿这个来说AI是有点吹毛求疵了。但既然要生成电影,这些都是必须要的部分。

还有一点很奇怪的是它似乎无法理解多个动作,比如转身离开、挥手转身等等。

角色一致性的挑战

在影视剧制作中,角色的一致性是基本要求。一部影视剧都是由固定演员来演绎的,所以这些演员会在每个镜头中都保持一致性。毫无疑问,这个功能在目前所有的文生视频产品中都是一个巨大的难题,A镜头出现的人物,怎么保持在B镜头是同一个人,这个是目前这类产品都存在的一个问题,可灵也不例外。

也就是说,目前想要通过这类产品来生成一部完整的哪篇是短剧,那是完全不可能的。有些产品会通过加入图片参考或者生成ID来保持角色的一致性,这能起到一定作用,但也存在诸多瑕疵。当然,我相信可灵后续的版本一定会加入类似功能,但目前是没有的。

未来展望

尽管存在上述问题,但我认为快手的可灵仍不失为目前市场上表现最佳的文生视频,可灵后续的迭代非常值得我们期待。随着技术的不断进步和算法的优化,我相信可灵在未来版本中会加入更多高级功能,如角色一致性保持、更复杂的镜头语言理解等,以满足更广泛的创作需求。

结语

文生视频技术的发展,不仅仅是技术层面的突破,更是对传统视频制作流程的一次深刻变革。快手的可灵作为这一变革的先行者,虽然还有很长的路要走,但其展现出的潜力和前景,无疑为视频内容创作者提供了全新的工具和可能性。随着AI技术的不断成熟,我们有理由相信,文生视频将在未来的视频内容产业中扮演越来越重要的角色。

通过这次测试,我们不仅看到了可灵在文生视频领域的潜力,也对AI视频生成技术的未来充满了期待。随着技术的不断进步,我们相信,不久的将来,AI将能够创作出更加丰富、多元、高质量的视频内容,为观众带来前所未有的视觉体验。

THE END
分享
二维码
< <上一篇
下一篇>>