qwen3 tts 12hz 1.7b voicedesign

par forkjoin-ai

Open source · 587 downloads · 0 likes

0.0

(0 avis)AudioAPI & Local

À propos

Le modèle Qwen3 TTS 12Hz 1.7B Voicedesign est une version optimisée pour le déploiement en périphérie (edge) du modèle de synthèse vocale Qwen3-TTS-12Hz-1.7B-VoiceDesign. Il permet de générer une voix naturelle à partir de texte, avec une latence réduite grâce à sa fréquence d'échantillonnage de 12 Hz, idéale pour des applications en temps réel. Ses principaux cas d'usage incluent la création de voix off, l'assistance vocale ou l'accessibilité, notamment sur des appareils mobiles ou embarqués où les ressources sont limitées. Ce modèle se distingue par sa légèreté (1,7 milliard de paramètres) et sa compatibilité avec des environnements edge, offrant une alternative performante aux solutions cloud tout en préservant la qualité vocale.

Documentation

Qwen3 Tts 12Hz 1.7B Voicedesign

Forkjoin.ai conversion of Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign to GGUF format for edge deployment.

Model Details

Source Model: Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign
Format: GGUF
Converted by: Forkjoin.ai

Usage

With llama.cpp

Bash

./llama-cli -m qwen3-tts-12hz-1.7b-voicedesign-gguf.gguf -p "Your prompt here" -n 256

With Ollama

Create a Modelfile:

Bash

FROM ./qwen3-tts-12hz-1.7b-voicedesign-gguf.gguf

Bash

ollama create qwen3-tts-12hz-1.7b-voicedesign-gguf -f Modelfile
ollama run qwen3-tts-12hz-1.7b-voicedesign-gguf

About Forkjoin.ai

Forkjoin.ai runs AI models at the edge -- in-browser, on-device, zero cloud cost. These converted models power real-time inference, speech recognition, and natural language capabilities.

All conversions are optimized for edge deployment within browser and mobile memory constraints.

License

Apache 2.0 (follows upstream model license)

Liens & Ressources

qwen3 tts 12hz 1.7b voicedesign

par forkjoin-ai

Open source · 587 downloads · 0 likes

0.0

(0 avis)AudioAPI & Local

À propos

Documentation

Qwen3 Tts 12Hz 1.7B Voicedesign

Forkjoin.ai conversion of Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign to GGUF format for edge deployment.

Model Details

Source Model: Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign
Format: GGUF
Converted by: Forkjoin.ai

Usage

With llama.cpp

Bash

./llama-cli -m qwen3-tts-12hz-1.7b-voicedesign-gguf.gguf -p "Your prompt here" -n 256

With Ollama

Create a Modelfile:

Bash

FROM ./qwen3-tts-12hz-1.7b-voicedesign-gguf.gguf

Bash

ollama create qwen3-tts-12hz-1.7b-voicedesign-gguf -f Modelfile
ollama run qwen3-tts-12hz-1.7b-voicedesign-gguf

About Forkjoin.ai

Forkjoin.ai runs AI models at the edge -- in-browser, on-device, zero cloud cost. These converted models power real-time inference, speech recognition, and natural language capabilities.

All conversions are optimized for edge deployment within browser and mobile memory constraints.

License

Apache 2.0 (follows upstream model license)

Liens & Ressources