Je vais concevoir un pipeline de données ETL en python pour votre entreprise
Ingénieur de données
À propos de ce service
Vous avez du mal avec des pipelines de données lents ou peu fiables ? Je vais construire
un pipeline ETL propre, prêt pour la production en utilisant Python, PySpark
et Databricks, prêt à déployer dès le premier jour.
J'ai plus de 3 ans d'expérience en production traitant plus de 50 millions
d'enregistrements quotidiennement sur AWS et Azure.
CE QUE JE VAIS CONSTRUIRE :
pipelines ETL/ELT (extraire, transformer, charger)
streaming en temps réel avec Apache Kafka
architecture Medallion (Bronze/Silver/Gold)
pipelines AWS (S3, EMR, Lambda, Boto3)
notebooks Databricks et jobs PySpark
contrôles de qualité des données et validation
TECH STACK :
Python, SQL, PySpark, Apache Spark, Databricks,
AWS, Kafka, Docker, Flask, FastAPI, Git
VOUS RECEVREZ :
un code propre, bien commenté
une documentation complète et README
un pipeline prêt pour le déploiement
support après livraison
POURQUOI MOI :
une expérience réelle en production, pas seulement des tutoriels
certifié AWS, Azure et Databricks
livraison à temps, communication claire
Contactez-moi avant de commander pour que je puisse confirmer
vos besoins et vous livrer exactement ce que vous souhaitez !

