输入“/”快速插入内容

画像生成 AI 的新探索:FLUX.1 的试用与分析

2024年12月8日修改
在当今的科技领域,图像生成 AI 技术正迅速发展,成为了人们关注的焦点。其中,“Midjourney”、“Stable Diffusion”和“DALL-E 3”这三款图像生成 AI 以各自独特的方式吸引着用户。而近期,由“Stable Diffusion”的共同开发者们所创立的“Black Forest Labs(BFL)”推出了最新的图像生成 AI 模型“FLUX.1”,引起了广泛的关注。
“Midjourney”以其直观的界面和优美的艺术输出而闻名,深受创意专业人士和艺术家的喜爱。“Stable Diffusion”则凭借其开源的灵活性和强大的自定义能力,在技术人员和开发者社区中获得了支持。然而,“Stable Diffusion 3”在发布时,其许可证的变更引发了较大的争议。“DALL-E 3”则通过与“ChatGPT”的整合,以其能够准确地将复杂的语言指令视觉化的能力而备受瞩目。
“FLUX.1”拥有 120 亿的巨大参数数,且其权重也已公开,任何人都可以在本地下载并使用,这使得它备受关注。公开的样本图像质量也很高,因此有人认为,如果它在本地环境中能够稳定运行,那么它有可能成为需要付费的“Midjourney”和在许可证方面存在担忧的“Stable Diffusion”的替代品。
“FLUX.1”根据性能和用途,提供了 FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell]三种模型。FLUX.1 [pro]是通过 API 提供的,可用于商业用途,具有最高性能,在提示的跟随性、视觉质量、图像细节和输出多样性等方面,都具备先进的性能表现。API 可以通过“Replicate”和“fal.ai”这两个机器学习平台进行访问,价格为每生成一张图像 0.055 美元(约合 8 日元),同时也提供了免费额度,可通过链接进行试用。
为了进行比较,在“Replicate”的演示画面中,使用了本系列过去文章中提到的一个提示:“A photorealistic portrait of a young woman with dyed pastel pink hair and subtle makeup, wearing trendy streetwear, standing in a bustling urban crossing with neon signs in the background”(一个有着染成淡粉色头发、妆容淡雅、穿着时尚街头服饰的年轻女性的真实感肖像,她站在一个繁华的城市十字路口,背景中有霓虹灯招牌)。结果生成的图像具有与“Midjourney”不相上下的真实感,生成时间为 14.7 秒。不过,由于“Replicate”使用的是面向服务器的 NVIDIA A40,因此对于本地环境的参考价值有限。
总的来说,“FLUX.1”的出现为图像生成 AI 领域带来了新的可能性。它的公开性和可在本地使用的特点,为用户提供了更多的选择。然而,其在实际应用中的表现还需要进一步的测试和验证。随着技术的不断发展,我们期待图像生成 AI 能够为我们带来更多的惊喜和便利,为各个领域的创作和发展提供更强大的支持。
以上内容仅供参考,具体信息请以官方发布为准。图像生成 AI 技术的发展日新月异,我们需要持续关注和学习,以更好地适应这个不断变化的科技世界。