par danielheinz
Open source · 160k downloads · 17 likes
Ce modèle, nommé "e5 base sts en de", est une version spécialisée du modèle multilingue *multilingual-e5-base*, optimisée pour évaluer la similarité sémantique entre des textes en anglais et en allemand. Il a été affiné sur des corpus de paraphrases et de similarité textuelle en allemand, ce qui lui permet de comprendre et de comparer finement les nuances entre les deux langues. Ses principales capacités résident dans l'analyse de la proximité sémantique, utile pour des tâches comme la recherche d'informations multilingues, la détection de paraphrases ou l'évaluation de la cohérence textuelle. Il se distingue par sa précision élevée, comme en témoignent ses scores dépassant 0,9 sur des jeux de données de référence, et par son adaptabilité à des contextes bilingues. Ce modèle est particulièrement adapté aux applications nécessitant une compréhension fine des relations entre textes dans ces deux langues.
INFO: The model is being continuously updated.
The model is a multilingual-e5-base model fine-tuned with the task of semantic textual similarity in mind.
The model has been fine-tuned on the German subsets of the following datasets:
The training procedure can be divided into two stages:
The model achieves the following results: