AI/EXPLORER
OutilsCatégoriesSitesLLMsAlternativesGuides outilsComparatifsQuiz IAPremium
—Outils IA
—Sites & Blogs
—LLMs & Modèles
—Catégories
AI Explorer

Trouvez et comparez les meilleurs outils d'intelligence artificielle pour vos projets.

Fait avecen France

Explorer

  • ›Tous les outils
  • ›Sites & Blogs
  • ›LLMs & Modèles
  • ›Comparer
  • ›Chatbots
  • ›Images IA
  • ›Code & Dev

Entreprise

  • ›Premium
  • ›À propos
  • ›Contact
  • ›Blog

Légal

  • ›Mentions légales
  • ›Confidentialité
  • ›CGV

© 2026 AI Explorer·Tous droits réservés.

AccueilLLMsAudiourdu tts phonemes finetuned extended

urdu tts phonemes finetuned extended

par ahmedjaved812

Open source · 775 downloads · 0 likes

0.0
(0 avis)AudioAPI & Local
À propos

Ce modèle est une version fine-tunée et étendue d'un système de synthèse vocale (TTS) spécialisé dans la langue ourdou, capable de générer une parole naturelle à partir de texte en utilisant des phonèmes. Il transforme des entrées textuelles en séquences sonores fluides et intelligibles, adaptées à des applications nécessitant une prononciation précise de l'ourdou. Ses principaux cas d'usage incluent la création de voix off, l'assistance aux personnes malvoyantes ou la production de contenus audio automatisés pour des plateformes numériques. Ce qui le distingue est sa capacité à gérer des nuances phonétiques spécifiques à l'ourdou, offrant une qualité vocale plus naturelle que les solutions génériques.

Documentation

urdu-tts-phonemes-finetuned-extended

This model was trained from scratch on an unknown dataset. It achieves the following results on the evaluation set:

  • Loss: 0.8014

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • learning_rate: 5e-06
  • train_batch_size: 6
  • eval_batch_size: 2
  • seed: 42
  • distributed_type: multi-GPU
  • num_devices: 2
  • gradient_accumulation_steps: 4
  • total_train_batch_size: 48
  • total_eval_batch_size: 4
  • optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_steps: 500
  • num_epochs: 50
  • mixed_precision_training: Native AMP

Training results

Training LossEpochStepValidation Loss
4.60380.91495000.9382
3.97231.828910000.8982
3.87962.742915000.8837
3.76553.656920000.8691
3.72794.570925000.8611
3.68745.484930000.8507
3.62536.398935000.8450
3.57477.312940000.8403
3.57328.226945000.8419
3.55959.140950000.8367
3.552010.054955000.8339
3.529710.969860000.8357
3.530311.883865000.8333
3.506012.797870000.8260
3.496713.711875000.8256
3.502814.625880000.8239
3.478615.539885000.8211
3.491816.453890000.8209
3.490117.367895000.8193
3.481518.2818100000.8204
3.468819.1958105000.8163
3.442620.1098110000.8160
3.451921.0238115000.8157
3.451421.9387120000.8138
3.434122.8527125000.8148
3.434123.7667130000.8114
3.426124.6807135000.8129
3.427625.5947140000.8111
3.423426.5087145000.8086
3.437927.4227150000.8083
3.417128.3367155000.8055
3.408329.2507160000.8067
3.422730.1647165000.8090
3.405031.0787170000.8063
3.414431.9936175000.8072
3.396832.9076180000.8028
3.400133.8216185000.8056
3.387334.7356190000.8032
3.403235.6496195000.8057
3.393636.5636200000.8040
3.382937.4776205000.8036
3.392738.3916210000.8034
3.389539.3056215000.8037
3.378940.2196220000.8027
3.393841.1336225000.8020
3.390742.0476230000.8018
3.375242.9625235000.8004
3.375943.8765240000.8009
3.380744.7905245000.8015
3.380845.7045250000.8030
3.372046.6185255000.8016
3.385147.5325260000.8018
3.373348.4465265000.8007
3.370349.3605270000.8014

Framework versions

  • Transformers 5.0.0
  • Pytorch 2.10.0+cu128
  • Datasets 4.8.3
  • Tokenizers 0.22.2
Liens & Ressources
Spécifications
CatégorieAudio
AccèsAPI & Local
LicenceOpen Source
TarificationOpen Source
Note
0.0

Essayer urdu tts phonemes finetuned extended

Accédez directement au modèle