AI/EXPLORER
OutilsCatégoriesSitesLLMsAlternativesGuides outilsComparatifsQuiz IAPremium
—Outils IA
—Sites & Blogs
—LLMs & Modèles
—Catégories
AI Explorer

Trouvez et comparez les meilleurs outils d'intelligence artificielle pour vos projets.

Fait avecen France

Explorer

  • ›Tous les outils
  • ›Sites & Blogs
  • ›LLMs & Modèles
  • ›Comparer
  • ›Chatbots
  • ›Images IA
  • ›Code & Dev

Entreprise

  • ›Premium
  • ›À propos
  • ›Contact
  • ›Blog

Légal

  • ›Mentions légales
  • ›Confidentialité
  • ›CGV

© 2026 AI Explorer·Tous droits réservés.

AccueilLLMsAudiourdu tts phonemes finetuned

urdu tts phonemes finetuned

par ahmedjaved812

Open source · 619 downloads · 0 likes

0.0
(0 avis)AudioAPI & Local
À propos

Ce modèle est un système de synthèse vocale (TTS) spécialisé dans la génération de parole en ourdou à partir de phonèmes. Il convertit des séquences de sons linguistiques en audio naturel, permettant de produire une voix claire et intelligible dans cette langue. Conçu pour des applications nécessitant une prononciation précise, il est particulièrement utile pour les assistants vocaux, les livres audio ou les outils d'accessibilité en ourdou. Ce qui le distingue, c'est sa fine adaptation aux particularités phonétiques de l'ourdou, offrant une qualité de synthèse supérieure aux modèles génériques. Son entraînement sur des données spécifiques lui confère une meilleure compréhension des nuances tonales et des règles de prononciation propres à cette langue.

Documentation

urdu-tts-phonemes-finetuned

This model was trained from scratch on an unknown dataset. It achieves the following results on the evaluation set:

  • Loss: 0.8902

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • learning_rate: 1e-05
  • train_batch_size: 6
  • eval_batch_size: 2
  • seed: 42
  • distributed_type: multi-GPU
  • num_devices: 2
  • gradient_accumulation_steps: 4
  • total_train_batch_size: 48
  • total_eval_batch_size: 4
  • optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_steps: 500
  • num_epochs: 70
  • mixed_precision_training: Native AMP

Training results

Training LossEpochStepValidation Loss
5.47481.51635001.0756
4.42863.030410001.0000
4.28994.546715000.9708
4.16166.060720000.9536
4.07167.577125000.9420
4.01219.091130000.9242
3.963710.607435000.9217
3.915212.121540000.9091
3.896713.637845000.9034
3.879415.151950000.9066
3.858016.668255000.9018
3.819518.182260000.8976
3.803419.698665000.8946
3.787021.212670000.8929
3.769122.728975000.8952
3.751724.243080000.8890
3.729925.759385000.8941
3.729327.273390000.8908
3.730928.789795000.8911
3.705130.3037100000.8860
3.696231.8200105000.8879
3.679433.3341110000.8842
3.674034.8504115000.8866
3.669336.3645120000.8834
3.679337.8808125000.8885
3.657239.3948130000.8844
3.663640.9112135000.8826
3.641042.4252140000.8840
3.661643.9415145000.8921
3.640845.4556150000.8882
3.651346.9719155000.8869
3.622348.4860160000.8887
3.625150.0165000.8921
3.628451.5163170000.8865
3.626453.0304175000.8910
3.611254.5467180000.8881
3.610956.0607185000.8929
3.617557.5771190000.8859
3.626659.0911195000.8897
3.603560.6074200000.8870
3.599062.1215205000.8916
3.600563.6378210000.8894
3.614365.1519215000.8857
3.604466.6682220000.8916
3.602168.1822225000.8911
3.611069.6986230000.8902

Framework versions

  • Transformers 5.0.0
  • Pytorch 2.10.0+cu128
  • Datasets 4.8.3
  • Tokenizers 0.22.2
Liens & Ressources
Spécifications
CatégorieAudio
AccèsAPI & Local
LicenceOpen Source
TarificationOpen Source
Note
0.0

Essayer urdu tts phonemes finetuned

Accédez directement au modèle