目前最火、最知名的 AI 文生图「Stable Diffusion」其中的一位开发者独立创业新公司 Black Forest Lab 黑森林实验室,开发了一款新的文生图模型项目「FLUX.1」并且支持中文输入,拥有超强的语言理解和文本控制能力,共 3 款图片生成模型,其中有 2 个开源。
FLUX.1 [pro]:闭源版本,只能通过API调用。
FLUX.1 [dev]:开发板模型,以非商业许可的方式开源,适合开发者,个人玩家。
FLUX.1 [schnell]:基础模型的精简版本,运行速度快,采用 Apache 2 许可证,可以商用。
模型对比
用 Midjourney 最新的 v6.1 模型与 FLUX.1 Pro 进行了出图对比。虽然 FLUX.1 在艺术性和风格多样性上不及 Midjourney 丰富,但在清晰度、细节逼真度,复杂场景生成等方面与最新的 v6.1 模型不相上下,甚至在一些方面的表现超过了 v6.1。对比来源:优设 @夏花生。
尤其是在复杂英文文本生成、多人场景、提示词理解遵循等方面,FLUX.1 Pro 的表现会明显比 v6.1 好。Pro 可以准确处理多人场景,面部、手部细节不会扭曲崩坏;生成超长文本的时候,无论是内容还是排版都非常标准到位;还能有效防止提示词泄露的情况发生,准确生成画面内容。
一键整合包
一键整合包「FLUX.1」的 WebUI 就是基于 Stable Difussion WebUI forge,模型是 nf4 量化版轻量模型,nf4 比 nf8 在更小的体积下,实现了比 nf8 更好的生成效果,实测 6G 显存可玩,20 步出图大概在 30 秒左右。
下载好后解压出来,然后运行"启动webui.bat",等待自动跳转到 webui 界面,然后 Checkpoint 选择 FLUX.1 的 nf4 模型。
在线体验
如果你的电脑配置跑不动「FLUX.1」模型,也可以通过在线的方式来体验文生图,提供了三个版本 pro、dev、schnell,你可以输入文本内容、设置图像比例来生成图片。
整合包(夸克):https://pan.quark.cn/s/067938714eea
在线体验:https://replicate.com/black-forest-labs
版权声明
本站名称:资源百科
本站永久网址:https://ziyuanbaike.com/
本站的文章部分内容可能来源于网络,如有侵权,请联系站长heytool@126.com进行删除处理。
本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
发表评论