Il semble que ce service ait été suspendu

J'extraurai des données de PDFs vers Excel en utilisant python

Certaines informations ont été traduites automatiquement.

Pays-Bas

Je parle Néerlandais, Anglais

Automatisation Python, Web Scraping, Bots

Je suis un analyste de données expérimenté et spécialiste en automatisation. Je crée des automatisations Python pour des clients qui ont besoin d’extraire, nettoyer ou transférer des données entre dif...
À propos de ce service

Vous avez une pile de PDFs avec des données enfermées dans des tableaux ? Factures, rapports, formulaires, relevés. Je vais tout transférer dans un fichier Excel propre.


J’utilise pdfplumber et tabula pour l’extraction des tableaux, ainsi que des logiques de parsing personnalisées pour les mises en page complexes. Tableaux sur plusieurs pages, colonnes de largeur variable, cellules fusionnées. J’ai déjà géré tout cela. Si vos PDFs sont des images scannées plutôt que du texte, je peux aussi faire de l’OCR.


Vous envoyez les PDFs, me dites quels champs vous souhaitez, et je m’occupe du reste. Je ferai d’abord un test sur 2-3 fichiers pour que vous puissiez vérifier le résultat avant que je traite l’ensemble.


Outils : Python, pdfplumber, tabula, openpyxl, Pandas, OCR (Tesseract)