Il semble que ce service ait été suspendu
J'extraurai des données de PDFs vers Excel en utilisant python
Pays-Bas
Automatisation Python, Web Scraping, Bots
À propos de ce service
Vous avez une pile de PDFs avec des données enfermées dans des tableaux ? Factures, rapports, formulaires, relevés. Je vais tout transférer dans un fichier Excel propre.
J’utilise pdfplumber et tabula pour l’extraction des tableaux, ainsi que des logiques de parsing personnalisées pour les mises en page complexes. Tableaux sur plusieurs pages, colonnes de largeur variable, cellules fusionnées. J’ai déjà géré tout cela. Si vos PDFs sont des images scannées plutôt que du texte, je peux aussi faire de l’OCR.
Vous envoyez les PDFs, me dites quels champs vous souhaitez, et je m’occupe du reste. Je ferai d’abord un test sur 2-3 fichiers pour que vous puissiez vérifier le résultat avant que je traite l’ensemble.
Outils : Python, pdfplumber, tabula, openpyxl, Pandas, OCR (Tesseract)
