画像生成 AI 的新探索：FLUX.1 的试用与分析

2024年12月8日修改

在当今的科技领域，图像生成 AI 技术正迅速发展，成为了人们关注的焦点。其中，“Midjourney”、“Stable Diffusion”和“DALL-E 3”这三款图像生成 AI 以各自独特的方式吸引着用户。而近期，由“Stable Diffusion”的共同开发者们所创立的“Black Forest Labs（BFL）”推出了最新的图像生成 AI 模型“FLUX.1”，引起了广泛的关注。

“Midjourney”以其直观的界面和优美的艺术输出而闻名，深受创意专业人士和艺术家的喜爱。“Stable Diffusion”则凭借其开源的灵活性和强大的自定义能力，在技术人员和开发者社区中获得了支持。然而，“Stable Diffusion 3”在发布时，其许可证的变更引发了较大的争议。“DALL-E 3”则通过与“ChatGPT”的整合，以其能够准确地将复杂的语言指令视觉化的能力而备受瞩目。

“FLUX.1”拥有 120 亿的巨大参数数，且其权重也已公开，任何人都可以在本地下载并使用，这使得它备受关注。公开的样本图像质量也很高，因此有人认为，如果它在本地环境中能够稳定运行，那么它有可能成为需要付费的“Midjourney”和在许可证方面存在担忧的“Stable Diffusion”的替代品。

“FLUX.1”根据性能和用途，提供了 FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell]三种模型。FLUX.1 [pro]是通过 API 提供的，可用于商业用途，具有最高性能，在提示的跟随性、视觉质量、图像细节和输出多样性等方面，都具备先进的性能表现。API 可以通过“Replicate”和“fal.ai”这两个机器学习平台进行访问，价格为每生成一张图像 0.055 美元（约合 8 日元），同时也提供了免费额度，可通过链接进行试用。

为了进行比较，在“Replicate”的演示画面中，使用了本系列过去文章中提到的一个提示：“A photorealistic portrait of a young woman with dyed pastel pink hair and subtle makeup, wearing trendy streetwear, standing in a bustling urban crossing with neon signs in the background”（一个有着染成淡粉色头发、妆容淡雅、穿着时尚街头服饰的年轻女性的真实感肖像，她站在一个繁华的城市十字路口，背景中有霓虹灯招牌）。结果生成的图像具有与“Midjourney”不相上下的真实感，生成时间为 14.7 秒。不过，由于“Replicate”使用的是面向服务器的 NVIDIA A40，因此对于本地环境的参考价值有限。

总的来说，“FLUX.1”的出现为图像生成 AI 领域带来了新的可能性。它的公开性和可在本地使用的特点，为用户提供了更多的选择。然而，其在实际应用中的表现还需要进一步的测试和验证。随着技术的不断发展，我们期待图像生成 AI 能够为我们带来更多的惊喜和便利，为各个领域的创作和发展提供更强大的支持。

以上内容仅供参考，具体信息请以官方发布为准。图像生成 AI 技术的发展日新月异，我们需要持续关注和学习，以更好地适应这个不断变化的科技世界。

画像生成 AI 的新探索：FLUX.1 的试用与分析​

画像生成 AI 的新探索：FLUX.1 的试用与分析