Stability AI 推出文字生成图片模型 SDXL 0.9,硬件要求下探至消费级 GPU 水平
作者 | IT之家2023-06-25

Stability AI 近日宣布,旗下文字生成图片模型 SDXL 0.9 已经正式推出。该版本在图像内容与构图细节方面做了大幅改进,并可以在消费级 GPU 上运行。

据悉,SDXL 0.9 在所有开源图像模型中参数数量位居前茅,其具备一个 35 亿参数的基础模型和一个 66 亿参数的附加模型。围绕这两个模型,SDXL 的工作原理即,使用基础模型创建粗略的细节,再使用附加模型精细化生成的图片,如果IT之家的小伙伴们有使用过 Stable Diffusion 的话,应该可以注意到这一渐进式的工作过程。

▲ 图源 SDXL 团队

Stability AI 表示,SDXL0.9 中使用了两个 CLIP 模型,其中包括 OpenCLIP vitg /14,这是迄今为止体积最大的 OpenCLIP 模型。凭借该模型,Stable Diffusion 可以创建深度更广、分辨率更高的逼真图像。

Stability AI 同时表示,SDXL 团队将发布一篇研究博客,详细介绍 SDXL 0.9 的模规范和更多参数细节,预计该模型将在 7 月迎来 1.0 正式版本,并将在 GitHub 开源。

热门文章
如果微软成功收购动视暴雪,索尼将不会与动视暴雪分享任何有关下一代 PS 主机(暂命名为 PS6)的细节信息。
2023-06-25
X