par tencent
Open source · 1k downloads · 332 likes
SongGeneration est un modèle de génération musicale avancé, conçu pour produire des chansons de qualité professionnelle à partir de descriptions textuelles ou d’instructions audio. Grâce à une architecture optimisée et à un entraînement sur des datasets massifs comme le Million Song Dataset, il excelle dans la création de morceaux dotés d’une mélodie riche, d’une structure cohérente et d’un arrangement soigné. Ce qui le distingue particulièrement, c’est sa précision exceptionnelle dans la génération des paroles, avec un taux d’erreur phonétique remarquablement bas, résolvant ainsi les problèmes d’hallucinations lyriques courants dans les modèles concurrents. Il offre également une grande contrôlabilité, permettant aux utilisateurs d’affiner les résultats via des consignes multimodales pour adapter le style, l’ambiance ou les instruments. Évalué par des experts du secteur, SongGeneration rivalise avec les meilleurs systèmes commerciaux fermés, tout en restant accessible en open source.

Demo | Paper | Code | Space Demo
This repository is the official weight repository for LeVo: High-Quality Song Generation with Multi-Preference Alignment. In this repository, we provide the SongGeneration model, inference scripts, and the checkpoint that has been trained on the Million Song Dataset.
| Model | Max Length | Language | GPU Memory | RTF(H20) | Download Link |
|---|---|---|---|---|---|
| SongGeneration-base | 2m30s | zh | 10G/16G | 0.67 | Huggingface |
| SongGeneration-base-new | 2m30s | zh, en | 10G/16G | 0.67 | Huggingface |
| SongGeneration-base-full | 4m30s | zh, en | 12G/18G | 0.69 | Huggingface |
| SongGeneration-large | 4m30s | zh, en | 22G/28G | 0.82 | Huggingface |
| SongGeneration-v2-large | 4m30s | zh, en, es, ja, etc. | 22G/28G | 0.82 | Huggingface |
| SongGeneration-v2-medium | 4m30s | zh, en, es, ja, etc. | 12G/18G | 0.69 | Coming soon |
| SongGeneration-v2-fast | 4m30s | zh, en, es, ja, etc. | - | - | Coming soon |
🚀 We introduce LeVo 2 (SongGeneration 2), an open-source music foundation model designed to shatter the ceiling of open-source AI music by achieving true commercial-grade generation.
Through a large-scale, rigorous expert evaluation (20 industry professionals, 6 core dimensions, 100 songs per model), LeVo 2 has proven its superiority:
📊 For detailed experimental setups and comprehensive metrics, please refer to the Evaluation Performance section below or our upcoming technical report.
The code and weights in this repository is released in the LICENSE file.