Stable SR图片高清放大器-AI资源库

免费下载

夸克：https://pan.quark.cn/s/ea90ac7afed6

迅雷：https://pan.xunlei.com/s/VNxctTss3o7MZYRUP46ndjt8A1?pwd=4uf6#

来源github作者：IceClear

StableSR是由新加坡南洋理工大学，王建义、岳宗生、周尚辰、陈志强、陈娥娟等人

最初提出的一种竞争性超分辨率方法

github作者：IceClear

Stable SR插件

Stable SR 512版本大模型（页面右侧下载）

Stable SR512脚本内置小模型（页面右侧下载）

Stable SR768版本大模型下载：点我过去（需要魔法）

Stable SR768版本内置小模型下载：点我过去（需要魔法）

512版本页面右侧下载（包含插件+大小模型）

目前提供两个版本大模型，它们产生的细节相似。

768版本（边缘更自然）

512版本（更锐利，但黑边白边现象更明显）这两个大模型（各约5.21GB）

然后，再下载对应版本的StableSR 模块（脚本内置小模型约400MB）

在 WebUI 的顶部，切换至你下载的 v2-1_512-ema-pruned 大模型。
选择图生图，页面底部找到StableSR 脚本
点击刷新按钮，选择你已下载的 StableSR 小模块（内置小模型）
上传一张需要处理的图片（无需提示词也可以）
- 尽管StableSR不需要提示词也能工作，但是渲染的时候发现，负面提示词能显著增强细节。比如使用3d, cartoon, anime, sketches, (worst quality:2), (low quality:2)，点击查看有/没有prompt的对比
推荐使用 Euler a 采样器，CFG值=7，步数 >= 20
如果生成图像尺寸 > 512，推荐使用 Tiled Diffusion & VAE，否则，图像质量可能不理想，VRAM 使用量也会很大
这里是官方推荐的 Tiled Diffusion 设置。
- 方法 = Mixture of Diffusers
- 隐空间Tile大小 = 64，隐空间Tile重叠 = 32
- Tile批大小尽可能大，直到差一点点就炸显存为止。
- Upscaler必须选择None。
下图是24GB显存的推荐设置。
- 对于4GB的设备，只需将Tiled Diffusion Latent tile批处理大小改为1，Tiled VAE编码器Tile大小改为1024，解码器Tile大小改为128。
- SDP注意力优化可能会导致OOM（内存不足），因此推荐使用xformers。
- 除非你有深入的理解，否则你不要改变Tiled Diffusion & Tiled VAE中的其他设置。这些参数对于StableSR基本上是最优解

什么是 “Pure Noise”？
- Pure Noise也就是纯噪声，指的是从完全随机的噪声张量开始，而不是从你的图像开始。这是 StableSR 论文中的默认做法。
- 启用这个选项时，脚本会忽略你的重绘幅度设置。产出将会是更详细的图像，但也会显著改变颜色和锐度。
- 禁用这个选项时，脚本会开始添加一些噪声到你的图像。即使你将去噪强度设为1，结果也不会那么的细节（但可能更和谐好看）。参见对比图。
- 如果禁用Pure Noise，推荐重绘幅度设置为1
什么是”颜色修正”？
- 这是为了缓解来自StableSR和Tile处理过程中的颜色偏移问题。
- AdaIN简单地匹配原图和结果图的颜色统计信息。这是StableSR官方算法，但常常效果不佳。
- Wavelet将原图和结果图分解为低频和高频，然后用原图的低频信息（颜色）替换掉结果图的低频信息。该算法对于不均匀的颜色偏移非常强力。算法来自GIMP和Krita，对每张图像需要几秒钟的时间。
- 启用颜色修正时，原图也会出现在您的预览窗口中，但不会被自动保存。

为什么我的结果和官方示例不同？

这不是你或我们的错。
- 如果正确安装，这个扩展有与 StableSR 相同的 UNet 模型权重。
- 如果你安装了可选的 VQVAE，整个模型权重将与融合权重为 0 的官方模型相同。
但是，你的结果将不如官方结果，因为：
- 采样器差异：
  - 官方仓库进行 100 或 200 步的 legacy DDPM 采样，并使用自定义的时间步调度器，采样时不使用负提示。
  - 然而，WebUI 不提供这样的采样器，必须带有负提示进行采样。这是主要的差异。
- VQVAE 解码器差异：
  - 官方 VQVAE 解码器将一些编码器特征作为输入。
  - 然而，在实践中，我发现这些特征对于大图像来说非常大。 (>10G 用于 4k 图像，即使是在 float16！)
  - 因此，我移除了 VAE 解码器中的 CFW 组件。由于这导致了对细节的较低保真度，我将尝试将它作为一个选项添加回去。

2024.02.29 : 支持带有SD-Turbo 的StableSR 。感谢安德雷的发现！

现在StableSR的ComfyUI 也可用了。感谢gameltb和WSJUSA的实施！
2023.11.30：代码更新。
- 支持DDIM和负面提示
- 添加CFW训练脚本
- 添加 FaceSR 训练和测试脚本
2023.10.08 ：我们与论文结果相关的测试集现已在 [ HuggingFace ] 和 [ OpenXLab ] 上提供。您现在可以轻松地与 StableSR 进行比较。
2023.08.19 : 整合到🤗抱脸。尝试在线演示！。
2023.08.19 : 集成到 🐼 OpenXLab。尝试在线演示！。
2023.07.31 : 集成到 🚀 Replicate。尝试在线演示！感谢晨曦的实施！
2023.07.16 ：您可以使用LDM-SRtuning 重现我们论文中使用的 LDM 基线。
2023.07.14 : 🐳 ModelScope for StableSR 发布！
2023.06.30 : 🐳在SD-2.1-768v上训练的新模型发布！更少的伪影，更好的性能！
2023年6月28日：支持SD-2.1-768v培训。
2023.05.22 : 🐳 改进代码以节省更多 GPU 内存，现在 128 --> 512 需要 8.9G。启用从中间步骤开始。
2023.05.20 : 🐳 StableSR WebUI 上线。感谢李毅的实施！
2023.05.13 : 添加 StableSR 的 Colab 演示。
2023.05.11：Repo 发布。