par nunchaku-ai
Open source · 8k downloads · 257 likes
Nunchaku Qwen Image est un modèle de génération d'images à partir de texte, optimisé pour transformer des descriptions en visuels de haute qualité. Il se distingue par sa capacité à rendre avec précision des textes complexes intégrés dans les images, tout en restant performant grâce à des techniques de quantification avancées. Ses versions allégées, disponibles en 4 ou 8 étapes de génération, offrent un équilibre entre rapidité et qualité, adaptées aussi bien aux usages grand public qu'aux applications professionnelles. Le modèle se démarque par son efficacité énergétique et sa compatibilité avec les dernières architectures GPU, le rendant accessible même sur des configurations matérielles limitées. Idéal pour les créateurs de contenu, les développeurs ou les entreprises cherchant à automatiser la production d'images à partir de prompts textuels.

This repository contains Nunchaku-quantized versions of Qwen-Image, designed to generate high-quality images from text prompts, advances in complex text rendering. It is optimized for efficient inference while maintaining minimal loss in performance.
Data Type: INT4 for non-Blackwell GPUs (pre-50-series), NVFP4 for Blackwell GPUs (50-series).
Rank: r32 for faster inference, r128 for better quality but slower inference.
Standard inference speed models for general use
| Data Type | Rank | Model Name | Comment |
|---|---|---|---|
| INT4 | r32 | svdq-int4_r32-qwen-image.safetensors | |
| r128 | svdq-int4_r128-qwen-image.safetensors | ||
| NVFP4 | r32 | svdq-fp4_r32-qwen-image.safetensors | |
| r128 | svdq-fp4_r128-qwen-image.safetensors |
4-step distilled models fused with Qwen-Image-Lightning-4steps-V1.0 LoRA using LoRA strength = 1.0
| Data Type | Rank | Model Name | Comment |
|---|---|---|---|
| INT4 | r32 | svdq-int4_r32-qwen-image-lightningv1.0-4steps.safetensors | Fused with Qwen-Image-Lightning-4steps-V1.0 LoRA |
| r128 | svdq-int4_r128-qwen-image-lightningv1.0-4steps.safetensors | Fused with Qwen-Image-Lightning-4steps-V1.0 LoRA. Better quality, slower inference | |
| NVFP4 | r32 | svdq-fp4_r32-qwen-image-lightningv1.0-4steps.safetensors | Fused with Qwen-Image-Lightning-4steps-V1.0 LoRA |
| r128 | svdq-fp4_r128-qwen-image-lightningv1.0-4steps.safetensors | Fused with Qwen-Image-Lightning-4steps-V1.0 LoRA. Better quality, slower inference |
8-step distilled models fused with Qwen-Image-Lightning-8steps-V1.1 LoRA using LoRA strength = 1.0
| Data Type | Rank | Model Name | Comment |
|---|---|---|---|
| INT4 | r32 | svdq-int4_r32-qwen-image-lightningv1.1-8steps.safetensors | Fused with Qwen-Image-Lightning-8steps-V1.1 LoRA |
| r128 | svdq-int4_r128-qwen-image-lightningv1.1-8steps.safetensors | Fused with Qwen-Image-Lightning-8steps-V1.1 LoRA. Better quality, slower inference | |
| NVFP4 | r32 | svdq-fp4_r32-qwen-image-lightningv1.1-8steps.safetensors | Fused with Qwen-Image-Lightning-8steps-V1.1 LoRA |
| r128 | svdq-fp4_r128-qwen-image-lightningv1.1-8steps.safetensors | Fused with Qwen-Image-Lightning-8steps-V1.1 LoRA. Better quality, slower inference |

@inproceedings{
li2024svdquant,
title={SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models},
author={Li*, Muyang and Lin*, Yujun and Zhang*, Zhekai and Cai, Tianle and Li, Xiuyu and Guo, Junxian and Xie, Enze and Meng, Chenlin and Zhu, Jun-Yan and Han, Song},
booktitle={The Thirteenth International Conference on Learning Representations},
year={2025}
}