免费下载

夸克:https://pan.quark.cn/s/ea90ac7afed6

迅雷:https://pan.xunlei.com/s/VNxctTss3o7MZYRUP46ndjt8A1?pwd=4uf6#

来源github作者:IceClear

StableSR是由新加坡南洋理工大学,王建义、岳宗生、 周尚辰、 陈志强、 陈娥娟等人

最初提出的一种竞争性超分辨率方法

项目页面

官方资料库

官方论文

github作者:IceClear

模型下载

Stable SR插件

  • 存放路径:stable-diffusion-webui\extensions

Stable SR 512版本大模型(页面右侧下载)

  • 存放路径:stable-diffusion-webui\models\Stable-diffusion

Stable SR512脚本内置小模型(页面右侧下载)

  • 存放路径:stable-diffusion-webui\extensions\sd-webui-stablesr\models

Stable SR768版本大模型下载点我过去(需要魔法)

  • 存放路径:stable-diffusion-webui\models\Stable-diffusion

Stable SR768版本内置小模型下载:点我过去(需要魔法)

  • 存放路径:stable-diffusion-webui\extensions\sd-webui-stablesr\models

512版本页面右侧下载(包含插件+大小模型)

说明

目前提供两个版本大模型,它们产生的细节相似。

768版本(边缘更自然)

512版本(更锐利,但黑边白边现象更明显)这两个大模型(各约5.21GB)

  • 将其放入 stable-diffusion-webui/models/Stable-Diffusion/ 文件夹中

然后,再下载对应版本的StableSR 模块(脚本内置小模型约400MB)

  • 将其放入stable-diffusion-webui/extensions/sd-webui-stablesr/models/ 文件夹中

使用方法

  • 在 WebUI 的顶部,切换至你下载的 v2-1_512-ema-pruned 大模型。
  • 选择图生图,页面底部找到StableSR 脚本
  • 点击刷新按钮,选择你已下载的 StableSR 小模块(内置小模型)
  • 上传一张需要处理的图片(无需提示词也可以)
    • 尽管StableSR不需要提示词也能工作,但是渲染的时候发现,负面提示词能显著增强细节。比如使用3d, cartoon, anime, sketches, (worst quality:2), (low quality:2),点击查看有/没有prompt的对比
  • 推荐使用 Euler a 采样器,CFG值=7,步数 >= 20
  • 如果生成图像尺寸 > 512,推荐使用 Tiled Diffusion & VAE,否则,图像质量可能不理想,VRAM 使用量也会很大
  • 这里是官方推荐的 Tiled Diffusion 设置。
    • 方法 = Mixture of Diffusers
    • 隐空间Tile大小 = 64,隐空间Tile重叠 = 32
    • Tile批大小尽可能大,直到差一点点就炸显存为止。
    • Upscaler必须选择None。
  • 下图是24GB显存的推荐设置。
    • 对于4GB的设备,只需将Tiled Diffusion Latent tile批处理大小改为1,Tiled VAE编码器Tile大小改为1024,解码器Tile大小改为128。
    • SDP注意力优化可能会导致OOM(内存不足),因此推荐使用xformers。
    • 除非你有深入的理解,否则你不要改变Tiled Diffusion & Tiled VAE中的其他设置。这些参数对于StableSR基本上是最优解

参数解释

  • 什么是 “Pure Noise”?
    • Pure Noise也就是纯噪声,指的是从完全随机的噪声张量开始,而不是从你的图像开始。这是 StableSR 论文中的默认做法。
    • 启用这个选项时,脚本会忽略你的重绘幅度设置。产出将会是更详细的图像,但也会显著改变颜色和锐度。
    • 禁用这个选项时,脚本会开始添加一些噪声到你的图像。即使你将去噪强度设为1,结果也不会那么的细节(但可能更和谐好看)。参见 对比图
    • 如果禁用Pure Noise,推荐重绘幅度设置为1
  • 什么是”颜色修正”?
    • 这是为了缓解来自StableSR和Tile处理过程中的颜色偏移问题。
    • AdaIN简单地匹配原图和结果图的颜色统计信息。这是StableSR官方算法,但常常效果不佳。
    • Wavelet将原图和结果图分解为低频和高频,然后用原图的低频信息(颜色)替换掉结果图的低频信息。该算法对于不均匀的颜色偏移非常强力。算法来自GIMP和Krita,对每张图像需要几秒钟的时间。
    • 启用颜色修正时,原图也会出现在您的预览窗口中,但不会被自动保存。

6. 重要问题

为什么我的结果和官方示例不同?

  • 这不是你或我们的错。
    • 如果正确安装,这个扩展有与 StableSR 相同的 UNet 模型权重。
    • 如果你安装了可选的 VQVAE,整个模型权重将与融合权重为 0 的官方模型相同。
  • 但是,你的结果将不如官方结果,因为:
    • 采样器差异:
      • 官方仓库进行 100 或 200 步的 legacy DDPM 采样,并使用自定义的时间步调度器,采样时不使用负提示。
      • 然而,WebUI 不提供这样的采样器,必须带有负提示进行采样。这是主要的差异。
    • VQVAE 解码器差异:
      • 官方 VQVAE 解码器将一些编码器特征作为输入。
      • 然而,在实践中,我发现这些特征对于大图像来说非常大。 (>10G 用于 4k 图像,即使是在 float16!)
      • 因此,我移除了 VAE 解码器中的 CFW 组件。由于这导致了对细节的较低保真度,我将尝试将它作为一个选项添加回去。

更新

  • 2024.02.29 : 支持带有SD-Turbo 的StableSR 。感谢安德雷的发现!

    现在StableSR的ComfyUI GitHub 之星也可用了。感谢gameltb和WSJUSA的实施!

  • 2023.11.30:代码更新。

    • 支持DDIM和负面提示
    • 添加CFW训练脚本
    • 添加 FaceSR 训练和测试脚本
  • 2023.10.08 :我们与论文结果相关的测试集现已在 [ HuggingFace ] 和 [ OpenXLab ] 上提供。您现在可以轻松地与 StableSR 进行比较。

  • 2023.08.19 : 整合到🤗抱脸。尝试在线演示!抱脸

  • 2023.08.19 : 集成到 🐼 OpenXLab。尝试在线演示!开放X实验室

  • 2023.07.31 : 集成到 🚀 Replicate。尝试在线演示!复制感谢晨曦的实施!

  • 2023.07.16 :您可以使用LDM-SRtuning 重现我们论文中使用的 LDM 基线GitHub 之星

  • 2023.07.14 : 🐳 ModelScope for StableSR 发布!

  • 2023.06.30 : 🐳在SD-2.1-768v上训练的新模型发布!更少的伪影,更好的性能!

  • 2023年6月28日:支持SD-2.1-768v培训。

  • 2023.05.22 : 🐳 改进代码以节省更多 GPU 内存,现在 128 --> 512 需要 8.9G。启用从中间步骤开始。

  • 2023.05.20 : 🐳 StableSR WebUI GitHub 之星上线。感谢李毅的实施!

  • 2023.05.13 : 添加 StableSR 的 Colab 演示。谷歌 Colab 徽标

  • 2023.05.11:Repo 发布。

特征

  • 高保真细节图像放大:非常详细,同时保持角色的面部身份,适用于大多数图像(逼真或动漫、摄影或 AIGC、SD 1.5 或 Midjourney 图像……官方示例
  • 减少 VRAM 消耗
  • 我在官方实现中删除了 VRAM 昂贵的模块。
  • 其余型号比 ControlNet Tile 型号小得多,并且需要更少的 VRAM。
  • 当与 Tiled Diffusion 和 VAE 结合使用时,您可以在有限的 VRAM(例如,< 12 GB)下实现 4k 图像超分辨率。

请注意,由于某些未知原因,sdp 可能会导致 OOM。您可以改用 xformers。

  • 小波颜色修复
  • 官方 StableSR 将显着改变生成图像的颜色。在瓷砖中升级时,问题将更加突出。
  • 我实现了一种强大的后处理技术,可以有效地将放大图像的颜色与原始图像相匹配。请参阅小波颜色修复示例

传送门

(如遇失效,请加v:xkd2310备注SD)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。