AI/EXPLORER
OutilsCatégoriesSitesLLMsComparerQuiz IAAlternativesPremium
—Outils IA
—Sites & Blogs
—LLMs & Modèles
—Catégories
AI Explorer

Trouvez et comparez les meilleurs outils d'intelligence artificielle pour vos projets.

Fait avecen France

Explorer

  • ›Tous les outils
  • ›Sites & Blogs
  • ›LLMs & Modèles
  • ›Comparer
  • ›Chatbots
  • ›Images IA
  • ›Code & Dev

Entreprise

  • ›Premium
  • ›À propos
  • ›Contact
  • ›Blog

Légal

  • ›Mentions légales
  • ›Confidentialité
  • ›CGV

© 2026 AI Explorer·Tous droits réservés.

AccueilLLMsZ Image Turbo SDNQ uint4 svd r32

Z Image Turbo SDNQ uint4 svd r32

par Disty0

Open source · 11k downloads · 54 likes

2.2
(54 avis)ImageAPI & Local
À propos

Ce modèle, "Z Image Turbo SDNQ uint4 svd r32", est une version optimisée et quantifiée du modèle Z-Image-Turbo, utilisant une quantification 4 bits (UINT4) avec une décomposition en valeurs singulières (SVD) de rang 32. Il offre des performances comparables à la version originale en BF16 tout en réduisant significativement la taille et les besoins en mémoire, ce qui le rend plus accessible pour des déploiements sur des appareils aux ressources limitées. Ses capacités principales incluent la génération et l'édition d'images à partir de prompts textuels, avec une qualité visuelle préservée malgré la compression. Idéal pour les applications nécessitant un équilibre entre performance et efficacité, comme les outils créatifs sur mobile ou les solutions embarquées, il se distingue par sa légèreté et sa rapidité d'exécution.

Documentation

4 bit (UINT4 with SVD rank 32) quantization of Tongyi-MAI/Z-Image-Turbo using SDNQ.

Usage:

Code
pip install sdnq
Py
import torch
import diffusers
from sdnq import SDNQConfig # import sdnq to register it into diffusers and transformers
from sdnq.common import use_torch_compile as triton_is_available
from sdnq.loader import apply_sdnq_options_to_model

pipe = diffusers.ZImagePipeline.from_pretrained("Disty0/Z-Image-Turbo-SDNQ-uint4-svd-r32", torch_dtype=torch.bfloat16)

# Enable INT8 MatMul for AMD, Intel ARC and Nvidia GPUs:
if triton_is_available and (torch.cuda.is_available() or torch.xpu.is_available()):
    pipe.transformer = apply_sdnq_options_to_model(pipe.transformer, use_quantized_matmul=True)
    pipe.text_encoder = apply_sdnq_options_to_model(pipe.text_encoder, use_quantized_matmul=True)
    pipe.transformer = torch.compile(pipe.transformer) # optional for faster speeds

pipe.enable_model_cpu_offload()

prompt = "Young Chinese woman in red Hanfu, intricate embroidery. Impeccable makeup, red floral forehead pattern. Elaborate high bun, golden phoenix headdress, red flowers, beads. Holds round folding fan with lady, trees, bird. Neon lightning-bolt lamp (⚡️), bright yellow glow, above extended left palm. Soft-lit outdoor night background, silhouetted tiered pagoda (西安大雁塔), blurred colorful distant lights."
image = pipe(
    prompt=prompt,
    height=1024,
    width=1024,
    num_inference_steps=9,
    guidance_scale=0.0,
    generator=torch.manual_seed(42),
).images[0]
image.save("z-image-turbo-sdnq-uint4-svd-r32.png")

Original BF16 vs SDNQ quantization comparison:

QuantizationModel SizeVisualization
Original BF1612.3 GBOriginal BF16
SDNQ UINT43.5 GBSDNQ UINT4
Liens & Ressources
Spécifications
CatégorieImage
AccèsAPI & Local
LicenceOpen Source
TarificationOpen Source
Note
2.2

Essayer Z Image Turbo SDNQ uint4 svd r32

Accédez directement au modèle