Je vais configurer le Unity catalog de databricks, les couches medallion et les pipelines ETL pyspark

Certaines informations ont été traduites automatiquement.

Vetted Pro

Pakistan

Je parle Ourdou, Anglais, Hindi, Polonais

7 commandes terminées

Ingénieur data, développeur Python, automatisation IA et agents IA

Lead Data Architect et Senior Data Engineer avec plus de 6 ans d'expérience dans l'aide aux entreprises pour concevoir, faire évoluer et stabiliser leurs plateformes de données. Je collabore avec des...
Certifié par Fiverr Pro

Hamza Anwar a été sélectionné par l'équipe Fiverr Pro pour son expertise.

Certifié pour

  • Data engineering

À propos de ce service

Vetted Pro

La plupart des projets de data lake échouent au niveau Silver. Les données brutes arrivent en Bronze et restent là, désordonnées, non fiables, inutilisables. Je construis l'ensemble du pipeline, de l'ingestion brute à une couche Gold que vos outils BI peuvent réellement interroger.


Je suis un ingénieur en données Python avec une expérience pratique de Databricks couvrant toute la stack lakehouse, l'architecture medallion, les pipelines PySpark, Delta Lake, Unity Catalog et Databricks Workflows. Je possède également un Master en Business Intelligence, ce qui me permet de comprendre à quoi doit ressembler la couche Gold pour que le reporting fonctionne réellement.


Ce que je vais réaliser pour vous :

  1. Architecture medallion (Bronze / Silver / Gold) conçue autour de vos sources de données et de votre logique métier
  2. Notebooks PySpark documentés, testés, prêts pour la production
  3. Tables Delta avec partitionnement approprié, Z-ordering et vacuuming
  4. Configuration du Unity Catalog avec schémas, catalogues et politiques d'accès
  5. Databricks Workflows pour planifier, surveiller et réessayer automatiquement vos pipelines
  6. Une couche Gold prête pour le BI que votre équipe peut interroger dès le premier jour


Vous n'êtes pas sûr de ce dont vous avez besoin ? Envoyez-moi vos sources de données et votre objectif final, je vous dirai exactement ce qui a du sens à construire.

Plateforme de stockage:

Databricks

Type de projet:

New Build

Clients avec lesquels j’ai travaillé
Acuity Healthcare

Acuity Healthcare

Built an automated healthcare executive leads pipeline in Python that scrapes Indeed, enriches contacts via Apollo, anymailfinder, verifies emails through Million Verifier, and delivers 2,000 job-matched leads per batch to Excel.

mars 2026-mai 2026

Mon portfolio

Autres services de Data engineering I Offre

Balises associées