par Xenova
Open source · 111k downloads · 16 likes
Ce modèle, *paraphrase multilingual MiniLM L12 v2*, est conçu pour générer des représentations vectorielles (embeddings) de textes dans plusieurs langues, facilitant ainsi la comparaison sémantique entre phrases ou documents. Il excelle dans la détection de paraphrases et la recherche d'informations multilingues, offrant une alternative légère et performante aux modèles plus lourds. Ses principaux cas d'usage incluent l'analyse de similarité textuelle, la classification de documents ou la recommandation de contenus multilingues. Ce qui le distingue, c'est son équilibre entre efficacité et précision, grâce à une architecture optimisée pour des tâches de compréhension sémantique à grande échelle.
https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 with ONNX weights to be compatible with Transformers.js.
If you haven't already, you can install the Transformers.js JavaScript library from NPM using:
npm i @huggingface/transformers
Example: Run feature extraction.
import { pipeline } from '@huggingface/transformers';
const extractor = await pipeline('feature-extraction', 'Xenova/paraphrase-multilingual-MiniLM-L12-v2');
const output = await extractor('This is a simple test.');
Note: Having a separate repo for ONNX weights is intended to be a temporary solution until WebML gains more traction. If you would like to make your models web-ready, we recommend converting to ONNX using 🤗 Optimum and structuring your repo like this one (with ONNX weights located in a subfolder named onnx).