par forkjoin-ai
Open source · 418 downloads · 0 likes
VibeVoice Realtime 0.5B est un modèle de langage optimisé pour fonctionner en temps réel sur des appareils edge, comme les navigateurs ou les appareils mobiles. Il permet des interactions vocales naturelles grâce à sa capacité à traiter la parole en continu avec une latence minimale. Ce modèle excelle dans les applications nécessitant une reconnaissance et une génération de texte rapides, comme les assistants vocaux ou les outils de transcription instantanée. Sa conversion en format GGUF le rend particulièrement adapté aux environnements contraints en ressources, tout en conservant les performances de la version originale. Ce qui le distingue, c'est son équilibre entre efficacité et réactivité, idéal pour des déploiements sans dépendance au cloud.
Forkjoin.ai conversion of VibeVoice/VibeVoice-Realtime-0.5B to GGUF format for edge deployment.
./llama-cli -m vibevoice-realtime-0.5b-gguf.gguf -p "Your prompt here" -n 256
Create a Modelfile:
FROM ./vibevoice-realtime-0.5b-gguf.gguf
ollama create vibevoice-realtime-0.5b-gguf -f Modelfile
ollama run vibevoice-realtime-0.5b-gguf
Forkjoin.ai runs AI models at the edge -- in-browser, on-device, zero cloud cost. These converted models power real-time inference, speech recognition, and natural language capabilities.
All conversions are optimized for edge deployment within browser and mobile memory constraints.
Apache 2.0 (follows upstream model license)