Je vais extraire des données de n'importe quel document en utilisant OCR

Certaines informations ont été traduites automatiquement.

Bangladesh

Je parle Bengali, Anglais, Hindi

Ingénieur senior en apprentissage automatique

Je suis ingénieur en apprentissage automatique senior avec 5 ans d'expérience en production dans la création de pipelines NLP, de chatbots alimentés par des LLM, de systèmes de recommandation et de so...
À propos de ce service

Je conçois des systèmes OCR prêts pour la production et de traitement intelligent de documents (IDP) qui extraient des informations structurées à partir de documents scannés, d'images, de PDFs, de factures, de reçus, de formulaires et de documents manuscrits.

Avec plus de 5 ans d'expérience en ingénierie de Machine Learning, je crée des pipelines OCR en utilisant des modèles d'IA modernes plutôt que de me limiter aux méthodes OCR traditionnelles.


Ce que je peux construire

OCR pour factures

OCR pour reçus

Extraction de passeports / cartes d'identité

OCR pour cartes de visite

Extraction de relevés bancaires

PDF vers JSON

PDF vers Excel

Image vers texte

Extraction de texte manuscrit

Extraction de données de formulaires

Extraction de tableaux

Parser de documents personnalisé


Technologies

  • Python
  • PaddleOCR
  • Tesseract OCR
  • EasyOCR
  • Donut Transformer
  • TrOCR
  • OpenCV
  • FastAPI
  • Hugging Face
  • LayoutLM
  • AWS Textract (optionnel)
  • Google Document AI (optionnel)


Formats de sortie

  • JSON
  • CSV
  • Excel
  • XML
  • Base de données SQL
  • API REST


Pourquoi travailler avec moi ?

Code prêt pour la production

Architecture propre

Communication rapide

Documentation API

Soutien au déploiement

Soutien Docker


Veuillez me contacter avant de commander si votre projet comporte des mises en page de documents personnalisées.

Expertise:

Traitement d'images

Classification

Langage de programmation:

Python

Amazon SageMaker

Outils:

opencv

tensorflow

PyTorch

Autres services de Data science et machine learning I Offre

Balises associées