只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。
在它横空出世之前,大伙儿要想顺利跑Stable Diffusion最新的XL模型,怎么也得上16G显存的4060ti(12G显存的原生3060跑起来非常勉强)。
与其他开源AI工具不同,Fooocus“聚焦于生成本身”,不仅硬件要求低,而且上手简单,十分小白友好——
跟手动调参说再见吧!离线、开源且免费,只需提示词和图片,就能让魔法涌现!
还有网友感叹:即使是小白,也能很好地发挥出Stable Diffusion XL模型的效果呢。
至于效率,Fooocus出图也是非常快。在Colab中,速度优先模式下每画一张图大概只需半分钟:
日志显示的时间是绘制时间,不过之前还有个文本解析的过程,总共耗时大约是40秒:
那就先让它画个漫画试试,来看看AI视角下的“马扎大战”会是什么样子。(可不是这个马扎哈)
由于用AI直接生成人像,手部的处理还是存在一些问题,所以我们干脆让马斯克和扎克伯格都戴上了手套:
最终两人“握手言和”,这一珍贵画面也被摄影师记录了下来,整体画面是不是有那味了?
其实Fooocus的每个内置风格都很有趣,所以不妨再来看看这些不同风格的整活图片:
在模仿著名作品方面,有赛博朋克版、塞尔达版、Minecraft版,甚至是宝可梦版本的马斯克可供观赏。
至于其他的艺术形式,还有像素和Lowpoly风格,以及黏土人和剪纸版本……
各位大画家是不是已经按耐不住想要试试了?我们马上就来介绍Fooocus的玩法!
因为作者已经把很多复杂技巧内化到了程序当中,调参这些操作不再需要手动完成。
如果需要高级设置,就把左下角的Advanced勾上,配置信息会出现在页面右侧,分为三个标签:
对于相同的内容,下面这张动图展示了锐利度从2到10再到20的变化。可以看出,随着锐利度增大,画面的细节也越来越丰富:
不过,对于Fooocus是否支持中文,我们也试了一下,很遗憾现在还不行。
如果你有带英伟达显卡的Windows设备,那么可以用开箱即用的版本。(大概这已经是老黄第114514次赢麻了)
解压好之后,双击run.bat运行,系统会自动下载模型并部署,等配置完成就可以用了。
不过,还是要吐槽的是,Colab版本会时不时宕几次机,不是自动停止就是内存溢出……
如果想在Mac或A卡电脑上更丝滑地运行Fooocus,可以再等等作者的更新。
整体来看,Fooocus的出图效果不错,如果提示词选择好的话,甚至可以当Stable Diffusion来用,关键是硬件配置要求也不高。
这是也目前Stable Diffusion最好用的版本之一,生成效果相比之前的1.5版本有不少改进。
不过,虽然Fooocus的模型和UI设计都有参考现成Stable Diffusion开源项目,但作者在制作时,融入了不少自己的优化设计,使得模型跑起来更加丝滑。
例如,作者仔细在Fooocus中采用了自己设计的k扩散采样(advanced k-diffusion sampling)方法,能提升采样连续性,减少性能损失、提升采样效率;
此外,作者还仔细调整了采样器(Sampler)的参数,并在原版基础上修改增加了一些包括电影风格在内的新设定。
之所以给Fooocus加上LoRA选项,是因为作者测试发现,加上LoRA(权重设置小于0.5)的SDXL模型,效果几乎总是比不加LoRA的SDXL模型更好。
开发出Fooocus这个项目的作者名叫Lvmin Zhang,2021年本科毕业于东吴大学,目前在斯坦福大学读博。
他做过的几个项目,包括ControlNet和style2paints在内,几乎个个都爆火:
pg模拟器
在社交媒体上,已经有网友自发整出了Fooocus版不同风格的提示词合集Excel。
原标题:《4G显存低配畅玩AIGC!ControlNet作者新作登顶GitHub热榜,小白点3次就出图》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。