Je vais créer et automatiser des pipelines ETL avec Python
À propos de ce service
Avez-vous des données dispersées dans différents systèmes qui ne communiquent jamais entre eux ? Vos rapports sont-ils encore construits manuellement chaque semaine ?
Je conçois et automatise des pipelines ETL avec Python pour que vos données circulent là où elles doivent aller, selon le calendrier, sans effort manuel.
J'ai construit des pipelines en production chez Carrefour (PySpark + Airflow sur GCP) et Cognizant (pipelines BI pour des clients mondiaux). Je sais ce qui peut casser dans des données réelles et comment l'éviter.
Ce que je construis
- pipelines ETL : extraction via API, bases de données, Excel, CSV
- Transformation et nettoyage des données avec Python & Pandas
- Chargement vers BigQuery, MySQL, Google Sheets
- Automatisation planifiée avec Airflow
- Rapports automatisés livrés selon le calendrier, sans travail manuel
Pile technologique
Python · SQL · Pandas · PySpark · Apache Airflow · BigQuery
Google Cloud (GCP) · PostgreSQL · REST APIs · Excel / Google Sheets
Pour qui cela s'adresse
Équipes finance ou opérations submergées par des rapports manuels
Startups ayant besoin d'un pipeline de données sans ingénieur à temps plein
Entreprises passant d'Excel à une infrastructure de données appropriée
Contactez-moi avant de commander, je vous dirai honnêtement si votre cas d'usage correspond.
Mon portfolio
FAQ
Traduction automatique
De quelles informations avez-vous besoin pour commencer ?
J'ai besoin de comprendre vos sources de données (où elles résident), à quoi doit ressembler la sortie, et à quelle fréquence elle doit s'exécuter. Une brève explication de votre processus manuel actuel est très utile — plus vous partagez de contexte, plus je pourrai rapidement créer quelque chose qui correspond réellement.
Le pipeline continuera-t-il à fonctionner après la livraison ou ai-je besoin d'un développeur pour le maintenir ?
Les pipelines que je livre sont conçus pour fonctionner selon un calendrier sans intervention manuelle. Je fournis la documentation et une présentation pour que votre équipe puisse le maintenir et le mettre à jour. Pour les solutions déployées dans le cloud, je mets en place une surveillance et des alertes pour que vous sachiez immédiatement si quelque chose échoue.
À quelles sources de données pouvez-vous vous connecter ?
Excel, CSV, Google Sheets, REST APIs, bases de données SQL (PostgreSQL, MySQL, BigQuery, SQL Server), exports SAP, et la plupart des systèmes de stockage cloud (GCP, AWS S3). Si vous avez une source spécifique, contactez-moi et je confirmerai avant votre commande.
Travaillez-vous avec des données commerciales confidentielles ?
Oui. Je gère régulièrement des données financières et opérationnelles sensibles dans mon travail en entreprise. Je suis à l'aise pour signer des NDA et je peux travailler avec des données anonymisées lors du développement si nécessaire.

