kobert

par monologg

Open source · 30k downloads · 20 likes

1.7

(20 avis)EmbeddingAPI & Local

À propos

KoBERT est un modèle de langage spécialisé dans le traitement du coréen, basé sur l'architecture BERT. Il excelle dans la compréhension et la génération de texte en coréen, offrant des performances optimisées pour cette langue. Ses capacités principales incluent l'analyse sémantique, la classification de texte, la réponse aux questions et la génération de contenu. Ce modèle est particulièrement utile pour les applications nécessitant une maîtrise fine du coréen, comme les chatbots, les outils d'analyse de sentiments ou les systèmes de traduction automatique. Ce qui le distingue, c'est son entraînement spécifique sur des corpus en coréen, lui permettant de surpasser les modèles multilingues génériques sur cette langue.

Documentation

KoBERT

How to use

If you want to import KoBERT tokenizer with AutoTokenizer, you should give trust_remote_code=True.

Python

from transformers import AutoModel, AutoTokenizer

model = AutoModel.from_pretrained("monologg/kobert")
tokenizer = AutoTokenizer.from_pretrained("monologg/kobert", trust_remote_code=True)

Reference

https://github.com/SKTBrain/KoBERT

Liens & Ressources