这个开源文生图只需要在笔记本上运行但效果超过了Midjourney

“
摘要:Flux AI图像生成模型由Black Forest Labs推出,开源且性能优越,与市场领导者Midjourney竞争,支持多平台使用,提供专业版、Dev和Schnell三个版本,正在开发开源的文本到视频模型。
新推出的人工智能产品与服务通常有两种现身方式:一种是突如其来,如同闪电一般让人措手不及;另一种则是在数月的热烈炒作后才粉墨登场。由Black Forest Labs这家初创公司推出的Flux,就属于前者。
这款人工智能图像生成模型,被誉为Stable Diffusion的正统继承者,自发布以来迅速走红,并与市场上的领头羊Midjourney进行了直接比较。
与Midjourney相比,Flux的优势在于它是开源的,并且可以在一台性能不错的笔记本电脑上运行。 这意味着Flux将会出现在许多与Stable Diffusion相同的多模型平台上,例如Poe、Nightcafe和FreePik。
亲自体验了Flux,我的初步感受是,在某些方面,它甚至超越了Midjourney,特别是在人物渲染方面,尽管它的皮肤纹理处理还略逊于Midjourney的6.1版本。
那么,Flux究竟是什么,又源自何处呢?

Flux诞生于AI创业公司Black Forest Labs。这家新兴企业是由一批对现代AI图像生成技术发展有重大贡献的人士创立的。
这家以德国为基地的公司由Robin Rombach、Andreas Blattmann和Dominik Lorenz领导,他们都是Stability AI的前工程师,以及在发展基于扩散模型的AI技术方面有重要影响的其他领军人物。这种技术同样也是许多AI视频工具的基础。
目前,Flux.01有三个版本可供使用,都是文本到图像的模型。首先是专业版,配备商业许可证,主要被像FreePik这样的公司采用,为订阅者提供可生成AI图像的技术。
接下来的两个版本是Dev和Schnell,它们分别是中端和快速模型,根据我的测试——在一台配备RTX 4090的笔记本上——它们在遵循指令、图像质量和图像上的文字渲染方面,都超过了Midjourney、DALL-E,甚至是Ideogram。
Black Forest Labs还在开发一种文本到视频的模型,并承诺将提供高质量的输出,并且会开源。他们将其命名为:“为所有人提供的最先进的文本到视频技术。”
那么,今天我在哪里可以使用Flux呢?
如果您拥有一台设备齐全的笔记本电脑,您可以下载并本地运行Flux.01( https://blackforestlabs.ai/#get-flux )。这可以通过使用Pinokio启动器等简单方法实现,它可以使安装和运行AI模型变得非常简单,仅需几次点击,而且是免费的。尽管它是一个较大的文件。
但是,如果您的设备不足以应对这项任务,已经有几家网站开始提供Flux.01的使用,并且某些情况下,这包括最大的商业专业版。
NightCafe( https://creator.nightcafe.studio/flux-image-generator ),我最喜欢的AI图像平台之一,已经可以访问该模型,您可以快速将其与其他工具如Ideogram和Stable Diffusion 3生成的图像进行比较。
Poe( https://huggingface.co/black-forest-labs/FLUX.1-schnell ),这个AI模型平台,也支持Flux.01,让您以聊天机器人的格式生成图像,这种体验类似于使用ChatGPT和DALL-E等工具来创造图片。
您还可以通过更多面向开发者的平台,如Based Labs( https://www.basedlabs.ai/tools/flux1 )、Hugging Face( https://huggingface.co/black-forest-labs/FLUX.1-schnell )和Fal.ai( http://fal.ai/ )来获取访问权限。FreePik,市场上最大的AI图像平台之一,也宣布正在努力将Flux集成到其网站上。


共有 0 条评论