AI/EXPLORER
OutilsCatégoriesSitesLLMsComparerQuiz IAAlternativesPremium
—Outils IA
—Sites & Blogs
—LLMs & Modèles
—Catégories
AI Explorer

Trouvez et comparez les meilleurs outils d'intelligence artificielle pour vos projets.

Fait avecen France

Explorer

  • ›Tous les outils
  • ›Sites & Blogs
  • ›LLMs & Modèles
  • ›Comparer
  • ›Chatbots
  • ›Images IA
  • ›Code & Dev

Entreprise

  • ›Premium
  • ›À propos
  • ›Contact
  • ›Blog

Légal

  • ›Mentions légales
  • ›Confidentialité
  • ›CGV

© 2026 AI Explorer·Tous droits réservés.

AccueilLLMsBengali finetuned speecht5 tts

Bengali finetuned speecht5 tts

par DeepDiveDev

Open source · 150 downloads · 0 likes

0.0
(0 avis)AudioAPI & Local
À propos

Ce modèle est une version adaptée de SpeechT5, spécialement fine-tunée pour la synthèse vocale en bengali. Il permet de transformer du texte en parole avec une voix naturelle et fluide, en s'appuyant sur les capacités de génération vocale du modèle de base. Ses principaux cas d'usage incluent la création de contenus audio pour des applications éducatives, des assistants vocaux ou des services de lecture pour malvoyants. Ce qui le distingue est sa spécialisation sur le bengali, une langue peu représentée dans les modèles de TTS, offrant ainsi une solution adaptée aux besoins linguistiques spécifiques de cette région.

Documentation

Bengali_finetuned_speecht5_tts

This model is a fine-tuned version of microsoft/speecht5_tts on an unknown dataset. It achieves the following results on the evaluation set:

  • Loss: 0.6190

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • learning_rate: 0.0001
  • train_batch_size: 4
  • eval_batch_size: 2
  • seed: 42
  • gradient_accumulation_steps: 8
  • total_train_batch_size: 32
  • optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_steps: 100
  • training_steps: 600
  • mixed_precision_training: Native AMP

Training results

Training LossEpochStepValidation Loss
6.14411.94221000.7127
5.58763.89882000.6550
5.24515.85543000.6514
5.15147.81204000.6227
4.97279.76875000.6220
4.979711.72536000.6190

Framework versions

  • Transformers 4.46.0.dev0
  • Pytorch 2.5.0+cu121
  • Datasets 3.0.2
  • Tokenizers 0.20.1
Liens & Ressources
Spécifications
CatégorieAudio
AccèsAPI & Local
LicenceOpen Source
TarificationOpen Source
Note
0.0

Essayer Bengali finetuned speecht5 tts

Accédez directement au modèle