par forkjoin-ai
Open source · 164 downloads · 0 likes
Le modèle Qwen3 TTS 12Hz 0.6B Base est une version optimisée pour le déploiement en périphérie (edge) du modèle de synthèse vocale Qwen3, converti au format GGUF pour une utilisation efficace sur des appareils locaux. Il permet de générer une voix naturelle à partir de texte avec une latence réduite, idéale pour des applications embarquées ou des environnements sans accès au cloud. Ses principaux cas d'usage incluent les assistants vocaux, les interfaces utilisateur parlantes ou les outils d'accessibilité, tout en garantissant une confidentialité accrue grâce au traitement local. Ce modèle se distingue par sa légèreté (0,6 milliard de paramètres) et sa capacité à fonctionner à 12 Hz, offrant un bon compromis entre performance et ressources nécessaires. Il s'appuie sur une licence Apache 2.0, compatible avec les usages commerciaux et open source.
Forkjoin.ai conversion of Qwen/Qwen3-TTS-12Hz-0.6B-Base to GGUF format for edge deployment.
./llama-cli -m qwen3-tts-12hz-0.6b-base-gguf.gguf -p "Your prompt here" -n 256
Create a Modelfile:
FROM ./qwen3-tts-12hz-0.6b-base-gguf.gguf
ollama create qwen3-tts-12hz-0.6b-base-gguf -f Modelfile
ollama run qwen3-tts-12hz-0.6b-base-gguf
Forkjoin.ai runs AI models at the edge -- in-browser, on-device, zero cloud cost. These converted models power real-time inference, speech recognition, and natural language capabilities.
All conversions are optimized for edge deployment within browser and mobile memory constraints.
Apache 2.0 (follows upstream model license)