par forkjoin-ai
Open source · 587 downloads · 0 likes
Le modèle Qwen3 TTS 12Hz 1.7B Voicedesign est une version optimisée pour le déploiement en périphérie (edge) du modèle de synthèse vocale Qwen3-TTS-12Hz-1.7B-VoiceDesign. Il permet de générer une voix naturelle à partir de texte, avec une latence réduite grâce à sa fréquence d'échantillonnage de 12 Hz, idéale pour des applications en temps réel. Ses principaux cas d'usage incluent la création de voix off, l'assistance vocale ou l'accessibilité, notamment sur des appareils mobiles ou embarqués où les ressources sont limitées. Ce modèle se distingue par sa légèreté (1,7 milliard de paramètres) et sa compatibilité avec des environnements edge, offrant une alternative performante aux solutions cloud tout en préservant la qualité vocale.
Forkjoin.ai conversion of Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign to GGUF format for edge deployment.
./llama-cli -m qwen3-tts-12hz-1.7b-voicedesign-gguf.gguf -p "Your prompt here" -n 256
Create a Modelfile:
FROM ./qwen3-tts-12hz-1.7b-voicedesign-gguf.gguf
ollama create qwen3-tts-12hz-1.7b-voicedesign-gguf -f Modelfile
ollama run qwen3-tts-12hz-1.7b-voicedesign-gguf
Forkjoin.ai runs AI models at the edge -- in-browser, on-device, zero cloud cost. These converted models power real-time inference, speech recognition, and natural language capabilities.
All conversions are optimized for edge deployment within browser and mobile memory constraints.
Apache 2.0 (follows upstream model license)