正在进行的生成式AI风暴中,三种文本到图像模型脱颖而出:Stable Diffusion、Midjourney和DALL-E-2。
我们看看哪一个最适合您。
Midjourney
Midjourney非常神奇,它生成的图像质量甚至可以超过部分艺术家所创造的作品。
如何开始
1,加入MJ Discord社区
2,找到一个#newbies频道
3,在底部的聊天文本框中输入/imagine,然后输入提示。
按下键盘上的Enter键,然后看着你的提示符变成现实!
这相当于一个“免费版本”。你可以用它来测试一下Middroute风格是否适合你的口味。您还可以翻看社区中其他人的一些令人难以置信的作品。
学习使用Midjourney的最好方法是不断的尝试,看看如何微调图像以获得您想要的效果。
总而言之,Midjourney对于初学者来说非常棒,因为即使是最高级的功能也非常容易使用。Discord服务器附带了大量易于访问和理解的说明、支持和设置。产品的价格也非常实惠(起价为8美元/月)。
Dall-E-2
与Midjourney一样,Dall-E-2也不是开源的,你需要到labs.openai.com注册一个账号。然后尝试输入prompt,生成图像。
Stable Diffusion
如果你正在寻找一个开源的图像生成AI,Stable Diffusion是目前这三个中唯一的选择。
因为它是开源的,所以出现了很多工具/公司,提供了从Web浏览器访问Stable Diffusion。lexica.art,replicate,等等。
你可以在电脑上本地运行SD,这意味着你有更多的控制权、更好的定制,甚至可以训练构建自己的模型。
也可以在云上安装,毕竟本地跑起来对显卡内存要求比较高。
!apt -y update -qq
!apt -y install -qq aria2
!pip install -q torch==1.13.1+cu117 torchvision==0.14.1+cu117 -f https://download.pytorch.org/whl/torch_stable.html
!pip install -q https://github.com/camenduru/stable-diffusion-webui-colab/releases/download/0.0.16/xformers-0.0.16+814314d.d20230118-cp38-cp38-linux_x86_64.whl
!pip install -q huggingface-hub==0.11.0-U
!gitclone -b v2.0https://github.com/camenduru/stable-diffusion-webui
!wget https://raw.githubusercontent.com/camenduru/stable-diffusion-webui-scripts/main/run_n_times.py -O /kaggle/working/stable-diffusion-webui/scripts/run_n_times.py
!gitclonehttps://github.com/AlUlkesh/stable-diffusion-webui-images-browser /kaggle/working/stable-diffusion-webui/extensions/stable-diffusion-webui-images-browser
!gitclonehttps://github.com/camenduru/stable-diffusion-webui-huggingface /kaggle/working/stable-diffusion-webui/extensions/stable-diffusion-webui-huggingface
!gitclone -b v2.0https://github.com/camenduru/sd-civitai-browser /kaggle/working/stable-diffusion-webui/extensions/sd-civitai-browser
!gitclonehttps://github.com/Mikubill/sd-webui-controlnet /kaggle/working/stable-diffusion-webui/extensions/sd-webui-controlnet
!gitclonehttps://github.com/camenduru/openpose-editor /kaggle/working/stable-diffusion-webui/extensions/openpose-editor
!gitclonehttps://github.com/kohya-ss/sd-webui-additional-networks /kaggle/working/stable-diffusion-webui/extensions/sd-webui-additional-networks
%cd /kaggle/working/stable-diffusion-webui
!npminstall -g localtunnel
import subprocess
import threading
import time
import socket
def iframe_thread(port):
while True:
time.sleep(0.5)
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)result = sock.connect_ex((127.0.0.1, port))
if result == 0:
break
sock.close()
p = subprocess.Popen([“lt”, “–port”, “{}”.format(port)], stdout=subprocess.PIPE)for line in p.stdout:
print(line.decode(), end=)
threading.Thread(target=iframe_thread, daemon=True, args=(7860,)).start()
!python launch.py –share –xformers –enable-insecure-extension-access –theme dark –gradio-queue
执行启动后,生成一个公网地址
然后你就可以尽情的发挥创造力了!
关于StableDiffusion如何微调,可以参考这篇文章SD调校