AI/EXPLORER
OutilsCatégoriesSitesLLMsComparerQuiz IAAlternativesPremium
—Outils IA
—Sites & Blogs
—LLMs & Modèles
—Catégories
AI Explorer

Trouvez et comparez les meilleurs outils d'intelligence artificielle pour vos projets.

Fait avecen France

Explorer

  • ›Tous les outils
  • ›Sites & Blogs
  • ›LLMs & Modèles
  • ›Comparer
  • ›Chatbots
  • ›Images IA
  • ›Code & Dev

Entreprise

  • ›Premium
  • ›À propos
  • ›Contact
  • ›Blog

Légal

  • ›Mentions légales
  • ›Confidentialité
  • ›CGV

© 2026 AI Explorer·Tous droits réservés.

AccueilLLMsAudiostable audio open models

stable audio open models

par AEmotionStudio

Open source · 161 downloads · 0 likes

0.0
(0 avis)AudioAPI & Local
À propos

Stable Audio Open est un modèle de génération audio qui transforme des descriptions textuelles en effets sonores et textures ambiantes stéréo, d'une durée maximale de 47 secondes à 44,1 kHz. Il excelle particulièrement dans la création de sons réalistes comme des bruits de pas, des impacts, des ambiances (pluie, vent) ou des paysages sonores complexes, tout en produisant des textures musicales atmosphériques comme des nappes ou des drones. Contrairement à d'autres modèles, il ne génère ni chansons complètes avec voix, ni instruments musicaux de haute fidélité, ni synthèse vocale, se concentrant sur des usages créatifs et immersifs. Accessible sous licence communautaire, il est idéal pour les artistes, développeurs ou créateurs de contenu cherchant à enrichir leurs projets avec des sons uniques et variés. Son intégration simplifiée via des outils comme Mæstræa le rend particulièrement pratique pour une utilisation immédiate.

Documentation

Stable Audio Open 1.0 (Mæstræa Mirror)

Text-to-Audio SFX & Ambient Textures — Up to 47s Stereo @ 44.1kHz

Original Model by Stability AI · Stability AI Community License

This is an ungated mirror of the Stable Audio Open 1.0 model weights for use with Mæstræa AI Workstation. Only safetensors-format weights are included (legacy .ckpt files stripped). All credits go to the original authors.

What's in This Repo

PathDescriptionSize
model.safetensorsMain model checkpoint~3 GB
transformer/diffusion_pytorch_model.safetensorsDiT transformer~1.5 GB
text_encoder/model.safetensorsT5 text encoder~1.2 GB
vae/diffusion_pytorch_model.safetensorsVAE decoder~150 MB
projection_model/diffusion_pytorch_model.safetensorsProjection model~50 MB
tokenizer/T5 tokenizer files< 10 MB
model_config.jsonModel architecture config< 1 KB
model_index.jsonDiffusers pipeline index< 1 KB
scheduler/Scheduler config< 1 KB

What Stable Audio Open Does

Stable Audio Open generates stereo audio at 44.1kHz from text prompts. It excels at:

  • Sound effects — Foley, impacts, transitions
  • Ambient textures — Rain, wind, crowds, environments
  • Musical textures — Pads, drones, atmospheric sounds
  • Audio scenes — Complex layered soundscapes

Up to 47 seconds of stereo audio per generation.

What It's NOT Good At

  • Full songs with vocals
  • High-fidelity musical instruments (use Foundation-1 for that)
  • Speech synthesis

VRAM Requirements

  • Minimum: ~4 GB (FP16)
  • Recommended: ~7 GB (FP16, longer durations)

Usage with Mæstræa

These models are automatically downloaded by the Mæstræa AI Workstation backend.

Direct Usage (diffusers)

Python
from diffusers import StableAudioPipeline
import torch

pipe = StableAudioPipeline.from_pretrained(
    "AEmotionStudio/stable-audio-open-models",
    torch_dtype=torch.float16,
).to("cuda")

audio = pipe(
    prompt="Thunderstorm with heavy rain and distant rolling thunder",
    negative_prompt="low quality, distorted",
    audio_end_in_s=10.0,
    num_inference_steps=100,
).audios[0]

Using stable-audio-tools

Python
from stable_audio_tools import get_pretrained_model
model, model_config = get_pretrained_model("AEmotionStudio/stable-audio-open-models")

License

Stability AI Community License — see LICENSE.md for full terms.

Key points:

  • Free for research and non-commercial use
  • Commercial use requires revenue < $1M/year or a separate license from Stability AI
  • Model outputs cannot be used to train competing models

Credits

  • Model: Stability AI
  • Paper: Stable Audio Open
  • Training Data: FreeSound + Free Music Archive (see attribution CSVs)
  • Mirror by: AEmotionStudio
Liens & Ressources
Spécifications
CatégorieAudio
AccèsAPI & Local
LicenceOpen Source
TarificationOpen Source
Note
0.0

Essayer stable audio open models

Accédez directement au modèle