谷歌神秘的图像模型NanoBanana正式上线功能强大到逆天
期待已久的 Nano Banana 终于揭开了它神秘的面纱,正式发布了!
它有个正式的名字叫做:Gemini-25-flash-image,之前很多人的猜想得到了验证,这个强大的图像生成模型来自于 Google。
不出所料,它立马跻身图片编辑模型第一:

上周阿里发布的 Qwen-Image-Edit 已经让人震惊,它很好的解决了图像一致性以及文字的问题,仅仅一周又被 Google 颠覆了,不仅如此,它势必开启一个新的时代。
且听我慢慢道来。
Gemini-25-flash-image最为人称道的强大之处就在于:保持图像的一致性。
也就是说,通过这个模型编辑之后的图片仍然和原图片形象保持一致,比如你只是换个发型、换件衣服、戴个墨镜甚至换个角度、换个场景,不管怎么换,你还是你,不会变成一个其他人。
比如一张原图如下:(素材来自网络)
现在我让她穿上一件羽绒服:

会得到一张非常完美的图, 原图的人物形象、姿势、背景完全一致:

做为对比gpt-img 和 Qwen-image-Edit 都不够完美:


↑
按住图片可左右滑动
这就把试穿这个事情完美的解决了

提示词: THE WOMAN IS HOLDING THE PINK NIKE PUFFER JACKET FROM THE REFERENCE IMAGE. POSITION THE JACKET IN FRONT OF HER
再比如戴上一个指定的太阳镜,看看效果:


形象是非常一致了,但仔细看仍然有些瑕疵,是不是以后商家都不用找模特、不用找图片设计师了?
有了这样的能力,我们可以非常方便的把自己打扮成不同年代、不同风格的形象:(分别为中国风、运动、80s 风格)



↑
按住图片可左右滑动
类似的换个发型啥的就不用提了,太 easy 了。有人甚至已经用这个功能来做公司的胸牌了:(下图来自官方案例)

可以说,有了这种高度的一致性保持,换风格、虚拟试穿已经发挥到淋漓尽致了,就连 Google 大佬都出来玩梗了。(下图来自 X)

但,就这?那就太小看这个逆天的模型了,真正硬核的还在后面。
Gemini-25-flash-image另一个强大功能是:多图像的完美融合。

更绝的是,即便是很多张,甚至指定场景也能完美合成:


好的,真的非常逆天,你就说吧,PS 学多久才能有这种技能??
可以说,如果之前的 AI 图片工具还停留在简单的图片生成、图片修改,那么 Gemini-25-flash-image真正打开了图像合成的潘多拉盒子。


不得不说,这效果令人惊叹❗️
但真正惊掉下巴的是下面这个功能,它能直接生成一个完整的故事!

图:来自官方案例
我试了试,如下:(多图左右滚动)




↑
按住图片可左右滑动
不过,不知道为什么 Gemini 里面不能使用这个功能:

在 Google AI Studio 里面却可以使用,但它是一次一张的进行生成,可以不断的继续,直到所有的(比如 12 张)都完成。
可以想象,在保持完美一致性的同时,还能生成多张不同场景的、甚至是故事片,如果在将这些图片转成视频,那么真正的 AI 电影时刻即将来临!
之前AI 视频之所以只能做点搞笑片,最大的一个卡点之一就是没法保持很好的一致性,镜头和镜头之间不能连贯,现在这个卡点似乎撤掉给消除了。
除了保持图像的一致性以及神奇的图像合成功能这些很宏观的操作,新的模型也支持非常细微的局部编辑。
比如让这个狗子把嘴巴闭上:

得到……

提示词:the dog's mouth is closed,no laugh
它甚至可以直接给黑白照片上色哟

只需要说:把这照片变成彩色的

当然,这个模型也不是完美的,在文字方面就很拉跨,比如我想给照片右侧加上小的竖体文字:摄影 1901 年 8 月 10 日,会得到:
汉字完全是乱的,这方面 Qwen 仍然是王者。
总体来说, Gemini-25-flash-image非常强大,它强大的一致性功能不仅彻底解锁了 AI图像合成,而且势必打开 AI 视频的全新局面。
还等什么,赶紧去试试。
【注:本文中所有图片除注明来自官方案例等,均由笔者生成,原素材均来自网络】
📮


共有 0 条评论