par monologg
Open source · 30k downloads · 20 likes
KoBERT est un modèle de langage spécialisé dans le traitement du coréen, basé sur l'architecture BERT. Il excelle dans la compréhension et la génération de texte en coréen, offrant des performances optimisées pour cette langue. Ses capacités principales incluent l'analyse sémantique, la classification de texte, la réponse aux questions et la génération de contenu. Ce modèle est particulièrement utile pour les applications nécessitant une maîtrise fine du coréen, comme les chatbots, les outils d'analyse de sentiments ou les systèmes de traduction automatique. Ce qui le distingue, c'est son entraînement spécifique sur des corpus en coréen, lui permettant de surpasser les modèles multilingues génériques sur cette langue.
If you want to import KoBERT tokenizer with
AutoTokenizer, you should givetrust_remote_code=True.
from transformers import AutoModel, AutoTokenizer
model = AutoModel.from_pretrained("monologg/kobert")
tokenizer = AutoTokenizer.from_pretrained("monologg/kobert", trust_remote_code=True)