Je vais construire des pipelines ETL sur Databricks avec Spark

Certaines informations ont été traduites automatiquement.

Pakistan

Je parle Ourdou, Anglais

Ingénieur de données spécialisé en pipelines ETL, Databricks, Azure et Power BI

Ingénieur de données avec plus de 5 ans d'expérience dans la livraison de pipelines ETL/ELT évolutifs, workflows Databricks, plateformes de données Azure, solutions Microsoft Fabric et tableaux de bor...

Plus d’infos

À propos de ce service

Bonjour, je suis un consultant en ingénierie des données avec plus de 5 ans d'expérience dans la création de pipelines de données en production sur Databricks.

J'ai conçu de véritables charges de travail Databricks en production, notamment une plateforme de données client traitant de grands ensembles de données avec PySpark, Delta Live Tables et une architecture medallion. Je travaille quotidiennement sur Databricks, pas seulement comme un mot à la mode.

Ce que je vais réaliser pour vous :

Des pipelines ETL de bout en bout (batch ou streaming)
Architecture medallion bronze, silver, gold
Delta Lake avec ACID, évolution du schéma, voyage dans le temps
Transformations PySpark optimisées
Ingestion depuis APIs, SQL Server, MySQL, Postgres, ADLS, S3, GCS, CSV, JSON, Parquet
Chargements incrémentiels avec MERGE INTO et CDC
Autoloader, planification de tâches, orchestration de workflow
Code propre, modulaire, versionné

Pourquoi travailler avec moi :