AI ExplorerAI Explorer
OutilsCatégoriesSitesLLMsComparerQuiz IAAlternativesPremium

—

Outils IA

—

Sites & Blogs

—

LLMs & Modèles

—

Catégories

AI Explorer

Trouvez et comparez les meilleurs outils d'intelligence artificielle pour vos projets.

Fait avecen France

Explorer

  • Tous les outils
  • Sites & Blogs
  • LLMs & Modèles
  • Comparer
  • Chatbots
  • Images IA
  • Code & Dev

Entreprise

  • Premium
  • À propos
  • Contact
  • Blog

Légal

  • Mentions légales
  • Confidentialité
  • CGV

© 2026 AI Explorer. Tous droits réservés.

AccueilLLMsmusicgen medium onnx

musicgen medium onnx

par chinedudave06

Open source · 273 downloads · 0 likes

0.0
(0 avis)AudioAPI & Local
À propos

MusicGen Medium ONNX est une version optimisée du modèle de génération musicale MusicGen, spécialement conçue pour fonctionner efficacement sur des appareils mobiles ou embarqués. Il permet de créer de la musique à partir de descriptions textuelles en quelques secondes, en générant des mélodies cohérentes et adaptées aux prompts fournis. Grâce à son architecture optimisée avec un cache KV et une précision FP16, il réduit significativement la taille du modèle tout en maintenant une qualité sonore élevée, idéal pour des applications mobiles comme l'application DJNed. Ce modèle se distingue par sa capacité à produire des morceaux de musique variés, allant de styles classiques à des créations plus expérimentales, tout en restant accessible sur des terminaux aux ressources limitées. Son utilisation est particulièrement adaptée aux créateurs de contenu, aux musiciens amateurs ou aux développeurs souhaitant intégrer une génération musicale rapide et intuitive dans leurs projets.

Documentation

MusicGen Medium — ONNX FP16 (KV-Cache)

ONNX export of facebook/musicgen-medium with KV-cache decoder in FP16 precision for efficient on-device generation.

Model Details

PropertyValue
Base Modelfacebook/musicgen-medium
PrecisionFP16
AudioMono (1 channel)
Codebooks4
Hidden Size1536
Sample Rate32 kHz
Max Length1500 steps (~30s)
Total Size~6.8 GB

Files

FileDescriptionSize
decoder_model.onnxStep-0 decoder proto1.7 MB
decoder_model.onnx.dataStep-0 FP16 weights3.5 GB
decoder_with_past_model.onnxKV-cache decoder proto1.4 MB
decoder_with_past_model.onnx.dataKV-cache FP16 weights3.1 GB
text_encoder.onnxT5 text encoder210 MB
encodec_decode.onnxEnCodec audio decoder57 MB
tokenizer.jsonT5 tokenizer vocabulary2.4 MB
config.jsonModel architecture config<1 KB
generation_config.jsonGeneration parameters<1 KB

FP16 Notes

The decoder weights are stored in FP16 precision using ONNX external data format (.onnx.data files). This halves the model size compared to FP32 (~7 GB → ~3.5 GB per decoder) with minimal quality loss. The text encoder and EnCodec remain in FP32.

Usage

These models are designed for the DJNed Android app using ONNX Runtime.

Pipeline

  1. Text encoding: text_encoder.onnx encodes the text prompt
  2. Step 0: decoder_model.onnx + .data generates the first token + initial KV-cache
  3. Steps 1+: decoder_with_past_model.onnx + .data generates subsequent tokens
  4. Audio decode: encodec_decode.onnx converts codebook tokens to audio waveform

License

This model is derived from Meta's MusicGen under the CC-BY-NC-4.0 license.

Liens & Ressources
Spécifications
CatégorieAudio
AccèsAPI & Local
LicenceOpen Source
TarificationOpen Source
Note
0.0

Essayer musicgen medium onnx

Accédez directement au modèle