par zooeyy
Open source · 4k downloads · 15 likes
Le modèle *Style Transfer* est un outil d'IA spécialisé dans la transformation artistique d'images, permettant d'appliquer le style visuel d'une référence (comme un dessin, une illustration ou une œuvre d'art) à une source photographique tout en conservant sa structure et sa composition. Grâce à une technique de fine-tuning LoRA, il excelle dans la conversion de photos réalistes en styles variés, allant du minimalisme cartoon aux estampes pop-art ou aux croquis stylisés, avec une simplicité d'utilisation en quelques clics. Ses cas d'usage couvrent la création artistique, la personnalisation de visuels pour les réseaux sociaux, ou encore la production de contenus visuels uniques pour des projets créatifs. Ce qui le distingue, c'est sa capacité à générer des résultats cohérents et esthétiques, bien qu'encore en phase expérimentale, avec une approche accessible via des interfaces comme ComfyUI ou SD WebUI. Son potentiel, couplé à des améliorations continues, en fait un outil prometteur pour les artistes et les créateurs numériques.
🎨 Qwen-Image-Edit 风格模仿 LoRA 模型 v0.1(Alpha)
这是一个基于 Qwen-Image-Edit-2511 的实验性LoRA微调模型,专注于风格转换与艺术变换。使用400多组图像训练了22000步,rank为32,学习率为0.0001,训练分辨率为1024,并在NVIDIA RTX 4090上实现了约每迭代15秒的速度。
🎨 Qwen-Image-Edit Style Mimic LoRA — v0.1 (Alpha)
An experimental LoRA fine-tuned model based on Qwen-Image-Edit-2511, designed for style transfer and artistic transformation. Trained with over 400 image pairs for 22,000 steps at rank 32, using a learning rate of 0.0001 and training resolution of 1024, achieving approximately 15 seconds per iteration on an NVIDIA RTX 4090. 🔍 工作原理
给定: 一张源图像(例如,一个人的照片) 一张参考图像(例如,卡通、线稿、插画等)

模型将参考图像的视觉风格应用于源图像,同时保留其结构和构图。虽然它仍处于早期阶段,但在ComfyUI中已经能够对部分风格产生良好的效果。 ✅ 示例:将cosplay照片转化为Lacoste鳄鱼素描风格、色彩斑斓的波普艺术狗或极简主义冬季卡通——只需一键。 🔍 How It Works
Given: A source image (e.g., a photo of a person) A reference image (e.g., cartoon, line art, illustration, etc.)
The model applies the visual style of the reference image to the source image while preserving its structure and composition. Although still in its early stages, it has shown promising results for certain styles in ComfyUI. ✅ Example: Turn a cosplay photo into a Lacoste-style crocodile sketch, a colorful pop-art dog, or a minimalist winter cartoon — all with one click. 🛠️ 使用指南 在 ComfyUI 中:
尽管该模型在某些风格上表现良好,但它仍在开发中,可能会遇到一些局限性。 In SD WebUI: Load the LoRA via "Load LoRA" tab. Set LoRA weight to 0.7–1.0. Use with img2img mode and a reference image as input. 💡 Tip: For best results, use references with similar aspect ratios and compositions. 🧪 训练详情 基础模型: Qwen-Image-Edit-2511 训练方法: LoRA 微调(Rank=32, Alpha=16) 数据集: 自定义精选的艺术风格数据集(线稿、卡通、波普艺术、超现实主义等),包含超过400组图像 Epochs: 22000 步 Batch Size: 1 学习率: 1e-4 优化器: AdamW 训练硬件: NVIDIA RTX 4090,大约每迭代15秒 ⚠️ 局限性与未来工作
尽管前景看好,但该模型仍处于早期发展阶段。当前的局限性包括: 转换过程中面部特征可能会有些模糊 色彩一致性在不同风格间可能有所不同 复杂纹理可能无法完全转移
📌 未来改进: 使用遮罩增强面部保护 添加色彩校正损失 支持更多样化的参考风格 在更高分辨率的图像上进行训练 🔄 版本控制 v0.1(Alpha): 初始发布——实验性但功能正常 v0.2+: 预计很快推出,具有改进的稳定性和准确性 📂 License
该模型根据MIT许可证发布。您可以在任何目的下自由使用、修改和分发它,包括商业应用,只需注明原作者即可。 📣 反馈与贡献
我正在积极改进这个模型!如果您有任何建议、发现错误或想要提供示例,请打开一个问题或留下评论。
让我们一起让风格转换更加强大吧!🌟 📝 Created by @zooeyy Still training... stay tuned!
You should use 图1变为图2风格 to trigger the image generation.
Download them in the Files & versions tab.