AI ExplorerAI Explorer
OutilsCatégoriesSitesLLMsComparerQuiz IAAlternativesPremium

—

Outils IA

—

Sites & Blogs

—

LLMs & Modèles

—

Catégories

AI Explorer

Trouvez et comparez les meilleurs outils d'intelligence artificielle pour vos projets.

Fait avecen France

Explorer

  • Tous les outils
  • Sites & Blogs
  • LLMs & Modèles
  • Comparer
  • Chatbots
  • Images IA
  • Code & Dev

Entreprise

  • Premium
  • À propos
  • Contact
  • Blog

Légal

  • Mentions légales
  • Confidentialité
  • CGV

© 2026 AI Explorer. Tous droits réservés.

AccueilLLMsPhotoMaker V2

PhotoMaker V2

par TencentARC

Open source · 5k downloads · 154 likes

2.7
(154 avis)ImageAPI & Local
À propos

PhotoMaker V2 est un modèle d'IA spécialisé dans la personnalisation d'images à partir d'une ou plusieurs photos de visage et d'une description textuelle. Il génère rapidement des portraits réalistes ou stylisés, adaptables à différents styles artistiques ou photographiques, sans nécessiter d'entraînement supplémentaire. Le modèle se distingue par sa capacité à s'intégrer facilement aux architectures basées sur SDXL ou à fonctionner avec d'autres modules LoRA, offrant ainsi une grande flexibilité d'utilisation. Ses cas d'usage incluent la création de contenus personnalisés, la retouche d'images ou la génération artistique, bien que ses performances puissent varier selon certains types de visages ou de détails anatomiques. PhotoMaker V2 se positionne comme un outil puissant pour les créateurs souhaitant transformer des portraits avec précision et créativité.

Documentation

PhotoMaker V2 Model Card

Project Page | Paper (ArXiv) | Code

🤗 Gradio demo

Introduction

Users can input one or a few face photos, along with a text prompt, to receive a customized photo or painting within seconds (no training required!). Additionally, this model can be adapted to any base model based on SDXL or used in conjunction with other LoRA modules.

Realistic results

image/jpeg

image/jpeg

Stylization results

image/jpeg

image/jpeg

More results can be found in our project page

Model Details

It mainly contains two parts corresponding to two keys in loaded state dict:

  1. id_encoder includes finetuned OpenCLIP-ViT-H-14 and a few fuse layers.

  2. lora_weights applies to all attention layers in the UNet, and the rank is set to 64.

Usage

You can directly download the model in this repository. You also can download the model in python script:

Python
from huggingface_hub import hf_hub_download
photomaker_ckpt = hf_hub_download(repo_id="TencentARC/PhotoMaker-V2", filename="photomaker-v2.bin", repo_type="model")

Then, please follow the instructions in our GitHub repository.

Limitations

  • The model's customization performance degrades on Asian male faces.
  • The model still struggles with accurately rendering human hands.

Bias

While the capabilities of image generation models are impressive, they can also reinforce or exacerbate social biases.

Citation

BibTeX:

Bibtex
@inproceedings{li2023photomaker,
  title={PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding},
  author={Li, Zhen and Cao, Mingdeng and Wang, Xintao and Qi, Zhongang and Cheng, Ming-Ming and Shan, Ying},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2024}
}
Liens & Ressources
Spécifications
CatégorieImage
AccèsAPI & Local
LicenceOpen Source
TarificationOpen Source
Note
2.7

Essayer PhotoMaker V2

Accédez directement au modèle