par Xenova
Open source · 40k downloads · 10 likes
Le modèle *multilingual-e5-small* est une version compacte et optimisée du modèle E5, conçue pour traiter et comprendre le texte dans de nombreuses langues. Il excelle dans des tâches comme la recherche d'informations, la classification ou la comparaison de textes multilingues, grâce à sa capacité à générer des embeddings (représentations vectorielles) de haute qualité. Ses principaux cas d'usage incluent l'analyse de similarité sémantique entre documents, l'extraction d'informations multilingues ou encore l'amélioration des systèmes de recommandation. Ce qui le distingue, c'est son efficacité sur des appareils légers, notamment via une intégration avec Transformers.js et des poids ONNX pour une exécution optimisée dans des environnements web ou mobiles.
https://huggingface.co/intfloat/multilingual-e5-small with ONNX weights to be compatible with Transformers.js.
If you haven't already, you can install the Transformers.js JavaScript library from NPM using:
npm i @huggingface/transformers
Example: Run feature extraction.
import { pipeline } from '@huggingface/transformers';
const extractor = await pipeline('feature-extraction', 'Xenova/multilingual-e5-small');
const output = await extractor('This is a simple test.');
Note: Having a separate repo for ONNX weights is intended to be a temporary solution until WebML gains more traction. If you would like to make your models web-ready, we recommend converting to ONNX using 🤗 Optimum and structuring your repo like this one (with ONNX weights located in a subfolder named onnx).