Je vais concevoir et optimiser des pipelines databricks delta lake évolutifs
Ingénierie des données, Azure, AWS, Databricks, Lakehouse, Spark, Fabric
À propos de ce service
Ingénieur de données senior certifié Microsoft & Databricks (plus de 9 ans d’expérience)
Arrêtez de lutter avec des données désordonnées. Construisez un Lakehouse de niveau entreprise qui évolue. En tant qu’expert certifié double, je conçois et optimise des plateformes de données prêtes pour la production sur AWS, Azure et Databricks.
Ce que je propose :
- Architecture Medallion : Mise en œuvre complète des couches Bronze, Silver et Gold pour assurer l’intégrité des données.
- Pipeline évolutif : ETL/ELT batch et streaming haute performance avec PySpark et Spark SQL.
- Écosystème Databricks : Maîtrise de Unity Catalog (Gouvernance), Delta Live Tables (DLT) et Asset Bundles (DABs).
- Intégration Cloud : Configuration experte pour AWS (S3, Glue, EMR, Athena) et Azure (Fabric, ADF, Synapse, OneLake).
- Optimisation des coûts : Réglages avancés (Z-Order, Liquid Clustering) pour réduire vos dépenses en cloud computing.
- Données prêtes pour l’IA : Préparation spécialisée pour GenAI, chatbots RAG et Mosaic AI.
Pourquoi travailler avec moi ?
- Plus de 9 ans d’expérience : Expérience approfondie dans des environnements de données complexes à l’échelle enterprise.
- Prêt pour la production : Code propre, bien documenté et facile à maintenir.
- Orientation performance : Systèmes optimisés pour des requêtes en moins d’une seconde et une efficacité maximale.
- Transformez vos données brutes en un atout stratégique. Contactez-moi dès aujourd’hui
Mon portfolio
FAQ
Traduction automatique
Quel type de projets gérez-vous ?
Je gère les pipelines ETL, l'architecture lake/lakehouse, la migration vers le cloud, l'optimisation des données et les pipelines d'analytique.
Avec quelles plateformes cloud travaillez-vous ?
AWS, Azure et Databricks.
Travaillez-vous avec des données batch et streaming ?
Oui, je travaille avec des pipelines de données batch, quasi en temps réel et streaming.
Quels outils et technologies utilisez-vous ?
PySpark, Spark SQL, Azure Data Factory, AWS Glue, Databricks, EMR, Synapse, et plus encore.
Pouvez-vous optimiser les pipelines existants ?
Oui, je me spécialise dans l'optimisation des performances et la réduction des coûts.
Fournissez-vous une documentation ?
Oui, une documentation technique claire est incluse.
Pouvez-vous intégrer plusieurs sources de données ?
Absolument — APIs, bases de données, stockage cloud et fichiers plats.
Supportez-vous des projets à long terme ?
Oui, je suis ouvert à des engagements de support à long terme et continus.
Mes données seront-elles sécurisées ?
Oui. Je suis les meilleures pratiques de l'industrie en matière de sécurité des données et de contrôle d'accès.
Travaillez-vous avec de grands ensembles de données ?
Oui, je gère régulièrement des millions à des milliards d'enregistrements.

