par lovis93
Open source · 37k downloads · 8 likes
FLUX.1 [dev] est un modèle de langage avancé spécialisé dans la génération d'images à partir de descriptions textuelles, doté de 12 milliards de paramètres. Grâce à une architecture de type *rectified flow transformer* et à un entraînement par distillation de guidance, il produit des résultats de haute qualité, rivalisant avec les solutions propriétaires tout en restant accessible pour la recherche et les usages créatifs. Le modèle se distingue par son efficacité, sa capacité à suivre précisément les consignes et son ouverture, permettant aux artistes et développeurs d'explorer de nouvelles méthodes de création. Il peut être utilisé à des fins personnelles, scientifiques ou commerciales, sous réserve de respecter les restrictions éthiques et légales définies par sa licence non commerciale. FLUX.1 [dev] s'intègre facilement dans divers environnements, des API cloud aux outils locaux comme ComfyUI, offrant ainsi une flexibilité adaptée aux besoins des utilisateurs.
![FLUX.1 [dev] Grid](./dev_grid.jpg)
FLUX.1 [dev] is a 12 billion parameter rectified flow transformer capable of generating images from text descriptions.
For more information, please read our blog post.
FLUX.1 [pro].FLUX.1 [dev] more efficient.FLUX.1 [dev] Non-Commercial License.We provide a reference implementation of FLUX.1 [dev], as well as sampling code, in a dedicated github repository.
Developers and creatives looking to build on top of FLUX.1 [dev] are encouraged to use this as a starting point.
The FLUX.1 models are also available via API from the following sources
FLUX.1 [pro])FLUX.1 [dev] is also available in Comfy UI for local inference with a node-based workflow.
To use FLUX.1 [dev] with the 🧨 diffusers python library, first install or upgrade diffusers
pip install -U diffusers
Then you can use FluxPipeline to run the model
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power
prompt = "A cat holding a sign that says hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
To learn more check out the diffusers documentation
The model and its derivatives may not be used
This model falls under the FLUX.1 [dev] Non-Commercial License.