Je vais construire des pipelines ETL sur Databricks avec Spark

Certaines informations ont été traduites automatiquement.

Pakistan

Je parle Ourdou, Anglais

Ingénieur de données spécialisé en pipelines ETL, Databricks, Azure et Power BI

Ingénieur de données avec plus de 5 ans d'expérience dans la livraison de pipelines ETL/ELT évolutifs, workflows Databricks, plateformes de données Azure, solutions Microsoft Fabric et tableaux de bor...
À propos de ce service

Bonjour, je suis un consultant en ingénierie des données avec plus de 5 ans d'expérience dans la création de pipelines de données en production sur Databricks.


J'ai conçu de véritables charges de travail Databricks en production, notamment une plateforme de données client traitant de grands ensembles de données avec PySpark, Delta Live Tables et une architecture medallion. Je travaille quotidiennement sur Databricks, pas seulement comme un mot à la mode.


Ce que je vais réaliser pour vous :

  • Des pipelines ETL de bout en bout (batch ou streaming)
  • Architecture medallion bronze, silver, gold
  • Delta Lake avec ACID, évolution du schéma, voyage dans le temps
  • Transformations PySpark optimisées
  • Ingestion depuis APIs, SQL Server, MySQL, Postgres, ADLS, S3, GCS, CSV, JSON, Parquet
  • Chargements incrémentiels avec MERGE INTO et CDC
  • Autoloader, planification de tâches, orchestration de workflow
  • Code propre, modulaire, versionné


Pourquoi travailler avec moi :

  • Expérience réelle en production, pas des tutoriels
  • 5 ans d’expérience sur Databricks, Fabric, dbt, BigQuery, Synapse
  • Code paramétré, testable, réutilisable
  • Documentation avec chaque livraison
  • Anglais courant et mises à jour détaillées


Pile technologique :

  • Databricks
  • PySpark
  • Delta Lake
  • DLT
  • Unity Catalog
  • ADLS
  • S3
  • SQL Server
  • Python
  • Git


Avant de commander :

Contactez-moi avec vos exigences complètes.

Destination Platform:

Databricks Lakehouse

Outils et plateformes:

Autres

Mon portfolio