Je vais automatiser votre extraction de données et le nettoyage CSV avec python
Ingénieur de données
À propos de ce service
Bonjour, je suis César. Je suis ingénieur avec plus de 3 ans d’expérience dans la création de systèmes de données et l’automatisation de flux de travail pour des clients du secteur public et des infrastructures.
Je ne me contente pas d’utiliser des outils de scraping basiques ; j’écris des scripts Python personnalisés pour résoudre des problèmes de données désordonnées. Par exemple, dans un projet récent, j’ai écrit un script qui a extrait des données de contact cartographiées à partir de plus de 1 000 PDFs juridiques non structurés en moins de 4 minutes, une tâche qui prenait auparavant plus de 60 heures à une équipe.
Voici ce que je peux réaliser pour vous :
- Extraction de données personnalisée : Récupérer des données propres à partir de sites web, même s’ils nécessitent des identifiants, comportent de la pagination ou utilisent du JavaScript dynamique.
- Nettoyage et mise en forme des données : Prendre vos CSV, fichiers Excel ou PDFs désordonnés et utiliser Pandas pour filtrer, dédupliquer et formater selon vos besoins.
- Pipeline ETL : Transférer des données brutes de n’importe quelle source vers des sorties propres et structurées (CSV, JSON, SQL).
- Scripts automatisés : Je peux fournir le code source Python entièrement documenté pour que vous puissiez effectuer l’extraction vous-même quand vous le souhaitez.
Chaque script que je fournis est modulaire, fortement commenté et conçu pour gérer les erreurs sans planter.
Important : Veuillez m’envoyer un message rapide avec votre URL cible ou un fichier d’exemple avant de passer commande. J’aime bien définir précisément le périmètre du projet.
Technologie:
Excel
•
Google Sheets
•
Python
•
Zapier
FAQ
Traduction automatique
Avec quels formats de fichiers pouvez-vous travailler ?
Je peux traiter des fichiers CSV, Excel (.xlsx/.xls), JSON, PDF, Word (.docx), ainsi que des données provenant de sites web ou d'APIs. Si vous avez un autre format, envoyez-moi un message — je vous dirai si je peux le gérer.
Est-ce que je reçois le script Python ou seulement les données nettoyées ?
Le package Basic fournit uniquement le résultat nettoyé. Les packages Standard et Premium incluent le code source documenté pour que vous puissiez relancer l'automatisation vous-même à tout moment.
Quelle est la taille maximale de mon jeu de données ?
Basic gère jusqu'à 500 lignes. Standard jusqu'à 5 000 lignes. Pour des ensembles de données de plus de 5 000 lignes ou nécessitant une intégration à une base de données, choisissez Premium ou contactez-moi pour un devis personnalisé.

