展开全部内容 ▾

Midjourney 也得「站着敬酒」，AI 图片生成新王 Flux 怎么这么强？

作者：AI日报时间：2025-04-16 阅读数：99 +人阅读

江山代有模型出，一代更比一代强。

就当人们以为 AI 图片生成领域战争已经基本结束时，又有一个新的模型团队出现，用自家产品将、DALL-E 挑落马下。

8 月初，初创公司 Black Labs 横空出世，发布了拥有 120 亿参数的文本生成图像模型 Flux，随后迅速走红，被誉为的继承者，并与直接对打。

从网上曝光的图片能看出，Flux 在生成人物、尤其是真实人物的场景中，图像已经非常接近真人实拍的效果。无论是人物的表情、皮肤光泽、发型、人物配饰等细节方面，都做到了接近完美。

更重要的是，Flux 开源其系列的一些模型，可以在一台配置不错的笔记本电脑上运行，这也意味着它会像一样，可以在多模型平台上找到并使用。

Black Labs 宣称，其模型在图像质量和对文本提示的遵循度等方面，超过了现有的主流选择，如和 DALL-E。

过去两年中，在 AI 图像生成市场，、DALL-E 和和 Adobe 等一直在激烈竞争，Flux 凭什么一出来就能抢走风头，甚至被认为可能击败现有的其他模型？

Flux，横空出世即走红

Flux 来自 AI 初创公司 Black Labs，这家新公司由一些开发了背后技术并发明了潜在扩散技术的研究人员创立，总部位于德国。

今年 8 月 1 日，Black Labs 才对外正式宣布成立，就迅速打响名声。「我们深深植根于生成式 AI 研究社区，致力于开发和推进用于图像和视频等媒体的最先进的生成式深度学习模型。」

Black Labs 称，其公司「决心建立生成式媒体行业的标准」，作为实现这一目标的第一步，他们发布了 Flux.1 文本生成图像模型套件，称在图像细节、提示响应、风格多样性和场景复杂性方面定义了文本生成图像的新前沿。

Midjourney 也得「站着敬酒」，AI 图片生成新王 Flux 怎么这么强？

Flux 模型生成的图像｜图片来源：Black Labs

Midjourney 也得「站着敬酒」，AI 图片生成新王 Flux 怎么这么强？

网友用 Flux 模型生成的图像｜图片来源：

为了在可及性和模型能力之间取得平衡，Flux.1 目前提供了三个版本：Pro、Dev 和，都是文本生成图像模型，大小依次递减。

其中，Flux.1 Pro 版是通过 API 提供的闭源版本，也是最强大的版本，提供最先进的图像生成性能。可以通过 API 注册访问，适用于商业应用，为订阅用户提供生成式 AI 图像技术的访问权限。

Flux.1 Dev 版是开源版本，具有非商业许可，供社区开发，直接从 Pro 版本「蒸馏」而来，据称有类似的质量和提示响应能力，同时比同尺寸的标准模型更高效，可在上获取，并可直接在或 Fal.ai 上试用。

最后一个 Flux.1 版，是速度最快的版本（在德语中意为快速），也是精简版本，据称运行速度最高可提高十倍，开放源代码，采用 2 许可，适用于本地开发和个人使用，与 Dev 版本类似，也可以在 Face 上获取。

Midjourney 也得「站着敬酒」，AI 图片生成新王 Flux 怎么这么强？

Flux 部分模型可在 AI 开源社区获取｜图片来源： Face

有科技博主测评后认为，两个高端 Flux.1 模型的输出在提示忠实度上与的 DALL-E 3 相当，且在真实感上接近 6。

他们还发现，Flux.1 在生成手部图像方面似乎表现相当出色，这在早期的图像合成模型（如 1.5）中是一个薄弱点。尽管自那时起，像这样的 AI 图像生成器也掌握了手部生成，但 Flux.1 的公开权重模型在各种姿势下能够相对准确地渲染手部图像，仍然值得注意。

理论上说，Flux.1 两个较小的版本可以在性能较好的硬件上运行，例如高性能笔记本电脑，这使得它更容易被更广泛的用户使用，包括业余爱好者、开发人员和小型企业，这也意味着不必依赖互联网或云来运行 Flux.1。

不过，硬件性能较弱的用户可能会遇到困难。Flux.1 的开源模型大小约为 23GB，这意味着它可能需要接近 24GB 的 VRAM 才能运行，直到出现可能更轻量化的版本。

已经有科技网站在测评中称，在配有 RTX 4090 的笔记本电脑上运行——它们在对提示的遵从度、图像质量和图像中文字渲染方面都优于、DALL-E 甚至。

据 Black Labs 称，Flux.1 模型采用了 Black Labs 称之为「多模态和平行扩散块的混合架构」，参数规模达 120 亿，比之前的扩散模型更进一步，融合了流匹配和其他优化技术。

在基准测试中，Flux 表示其模型在图像合成方面设立了新标准，称在视觉质量、提示跟随度、大小/长宽比多样性、排版和输出多样性方面表现出色，超越了 v6.0、Dall-E 3（HD）和 SD3 Ultra 等模型。

Black Labs 的图表显示，其 Pro 和 Dev 模型是迄今为止最好的图像生成器，而其相对较弱的版本虽然未超越 SD3-Ultra 和，但也超越了 v6.0 和 DALL·E 3（HD）。Black Labs 称，「Flux.1 [] 是迄今为止最先进的少步模型，不仅在其类别中表现出色，还超越了强大的非蒸馏模型。」

Midjourney 也得「站着敬酒」，AI 图片生成新王 Flux 怎么这么强？