par Bedovyy
Open source · 2k downloads · 20 likes
Anima FP8 est un modèle d'IA quantifié optimisé pour générer des images avec un excellent compromis entre vitesse et qualité. Il existe en deux versions : FP8, recommandée pour maximiser la rapidité de génération tout en conservant une qualité élevée, et NVFP4Mixed, légèrement plus légère mais avec une qualité légèrement inférieure. Ce modèle est particulièrement adapté aux utilisateurs recherchant des performances optimisées sur des configurations matérielles modernes, comme les cartes graphiques RTX 5090. Ses cas d'usage incluent la création d'images artistiques, la génération rapide de visuels pour des projets créatifs ou des prototypes. Ce qui le distingue est sa capacité à offrir des temps de génération réduits sans sacrifier excessivement la qualité visuelle, grâce à des techniques de quantification avancées.
There are two models - FP8 and NVFP4Mixed.
To use torch.compile, use the TorchCompileModelAdvanced node from KJNodes, set the mode to max-autotune-no-cudagraphs, and make sure dynamic is set to false.
Tested on
--fast option, torch2.10.0+cu130| quant | none | sage+torch.compile |
|---|---|---|
| bf16 | 7.13s/4.21it/s | 5.16s/5.81it/s (+38%) |
| fp8 | 6.66s/4.50it/s (+11%) | 4.52s/6.64it/s (+58%) |
| nvfp4mix | 6.37s/4.71it/s (+12%) | 4.99s/6.01it/s (+43%) |


| quant | sample |
|---|---|
| bf16 | ![]() |
| fp8 | ![]() |
| nvfp4mixed | ![]() |
{
"format": "comfy_quant",
"block_names": ["net.blocks."],
"rules": [
{ "policy": "keep", "match": ["blocks.0", "blocks.1."] },
{ "policy": "float8_e4m3fn", "match": ["q_proj", "k_proj", "v_proj", "o_proj", "output_proj", ".mlp"] },
{ "policy": "nvfp4", "match": [] }
]
}
{
"format": "comfy_quant",
"block_names": ["net.blocks."],
"rules": [
{ "policy": "keep", "match": ["blocks.0."] },
{ "policy": "float8_e4m3fn", "match": ["v_proj", "adaln_modulation", ".mlp"] },
{ "policy": "nvfp4", "match": ["k_proj", "q_proj", "output_proj"] }
]
}