par forkjoin-ai
Open source · 342 downloads · 0 likes
Le modèle Qwen3 TTS 12Hz 0.6B Customvoice est une version optimisée pour le déploiement en périphérie (edge) du modèle de synthèse vocale Qwen3-TTS, converti au format GGUF pour une exécution efficace sur des appareils locaux. Il permet de générer une voix naturelle à partir de texte avec une latence réduite, idéale pour des applications nécessitant une interaction en temps réel. Ses principaux cas d'usage incluent les assistants vocaux embarqués, les outils d'accessibilité ou les systèmes interactifs où la confidentialité et l'autonomie sont essentielles. Ce modèle se distingue par sa légèreté (0,6 milliard de paramètres) et sa capacité à fonctionner hors ligne, tout en conservant une qualité vocale proche des solutions cloud.
Forkjoin.ai conversion of Qwen/Qwen3-TTS-12Hz-0.6B-CustomVoice to GGUF format for edge deployment.
./llama-cli -m qwen3-tts-12hz-0.6b-customvoice-gguf.gguf -p "Your prompt here" -n 256
Create a Modelfile:
FROM ./qwen3-tts-12hz-0.6b-customvoice-gguf.gguf
ollama create qwen3-tts-12hz-0.6b-customvoice-gguf -f Modelfile
ollama run qwen3-tts-12hz-0.6b-customvoice-gguf
Forkjoin.ai runs AI models at the edge -- in-browser, on-device, zero cloud cost. These converted models power real-time inference, speech recognition, and natural language capabilities.
All conversions are optimized for edge deployment within browser and mobile memory constraints.
Apache 2.0 (follows upstream model license)