par naver-clova-ocr
Open source · 32k downloads · 19 likes
BROS (BERT Relying On Spatiality) est un modèle de langage pré-entraîné conçu pour extraire des informations clés à partir de documents en combinant le texte et sa disposition spatiale. Grâce à l'analyse des résultats d'OCR (reconnaissance optique de caractères) incluant les coordonnées des mots, il excelle dans des tâches comme l'extraction de listes structurées ou de données spécifiques dans des reçus, factures ou formulaires. Son approche unique, qui intègre la position des éléments textuels, améliore significativement la précision par rapport aux modèles traditionnels basés uniquement sur le texte. Idéal pour automatiser le traitement de documents complexes, il s'adapte particulièrement aux environnements où la mise en page est essentielle à la compréhension. Ce modèle se distingue par sa capacité à comprendre la hiérarchie et les relations spatiales entre les informations, offrant une solution robuste pour l'extraction de données structurées.
GitHub: https://github.com/clovaai/bros
BROS (BERT Relying On Spatiality) is a pre-trained language model focusing on text and layout for better key information extraction from documents.
Given the OCR results of the document image, which are text and bounding box pairs, it can perform various key information extraction tasks, such as extracting an ordered item list from receipts.
For more details, please refer to our paper:
BROS: A Pre-trained Language Model Focusing on Text and Layout for Better Key Information Extraction from Documents
Teakgyu Hong, Donghyun Kim, Mingi Ji, Wonseok Hwang, Daehyun Nam, Sungrae Park
AAAI 2022 - Main Technical Track
| name | # params | Hugging Face - Models |
|---|---|---|
| bros-base-uncased (this) | < 110M | naver-clova-ocr/bros-base-uncased |
| bros-large-uncased | < 340M | naver-clova-ocr/bros-large-uncased |