本文主要介绍如何利用Google Colab平台的计算能力简单且免费地生成图像。
本教程的依赖项:Scientific Internet 有一个Google 帐户。以下是生成动漫风格的示例图像。
(相关资料图)
一般来说,AI生成图片的过程包括以下步骤:
数据收集:收集大量图像数据并构建数据集。训练模型:利用机器学习方法,训练神经网络模型,让计算机学习如何生成图像。生成图片:输入一些关键词或者画一些草图,让计算机根据训练好的模型生成图片。上述步骤1和2对于大多数新手来说太高了。我们可以利用Google Colab平台,使用别人训练好的、公开的stable_diffusion类模型来编写提示文本(咒语)来生成图像。
脚步
1.stable-diffusion-webui-colab
访问https://github.com/camenduru/stable-diffusion-webui-colab 页面,找到Colab 支持的模型列表,点击左侧的【在Colab 中打开】链接跳转到Colab 平台。
2.Colab
在Colab(默认登录账户)页面,点击【代码执行器】【更改运行时类型】,选择【硬件加速器】【GPU】(可以付费添加算力^_^),【保存】。
点击【代码执行程序】【全部运行】,稍等片刻,依赖软件包下载完毕,平台启动。直到出现“Running on local URL”、“Running on public URL”等信息。
点击“公共URL”对应的公共WebUI,即可进行图片生成操作。
3.stable-diffusion-webui CivitAi
CivitAI(https://civitai.com/)主要是一个模型分享和社区。用户会回复别人的模型,并附上该模型生成的样本,以及生成时的参数和种子,方便我们调试。
webui中有CivitAi操作页面,支持自动抓取CivitAi平台信息和模型下载。
我们选择Checkpoint类型的内容,配置下载次数最多的模型(描述火)的爬取规则,点击【获取列表】按钮,让信息加载。
点击【模型】下拉列表,选择“DreamShaper”模型(动漫风格)。
点击【第四次下载模型】按钮即可下载模型,也可以切换到Colab平台查看下载进度。直到模型下载完毕(3G+文件需要一段时间)。
4.稳定扩散-webui txt2img
点击左上角的【稳定扩散检查点】,切换到“DreamShaper”模型。
接下来,我们将使用文本转图像(txt2img)函数来测试生成图像。
我们使用的参数配置(可以访问https://civitai.com/参考别人的示例参数)如下,一次性生成7张动漫风格的少女图:
提示:动漫截图、1girl、独奏、连帽衫、微笑、中等头发、眼镜、((小胸))、乳沟、部分解压、脸部、完美、杰作、((杰作、肖像、pixiv))、artstation、在花园负提示: bad anatomy、水印、文字、签名、模糊、凌乱、低质量、bad-artist 草图、bad-image-v2-39000、necklaceSteps: 50Method: Euler aBatch size: 7Scale: 8Seed: 47552431点击[Generate] 按钮等待进行图片生成(GPU钳位比用普通计算机构建要快得多),生成的图片如下。
以上就是全部操作步骤。即使是新手也能轻松上手。更强大的功能自己探索一下(下一篇会教你如何用一台小电脑在本地搭建一个服务来生成图片)。