Je vais construire un data lake AWS et un pipeline ETL avec pyspark

Certaines informations ont été traduites automatiquement.

Pakistan

Je parle Anglais

Ingénieur Data cloud construisant des pipelines ETL évolutifs

Bonjour, je suis un ingénieur data indépendant spécialisé dans la construction de pipelines ETL évolutifs et d’architectures cloud robustes. J’aide les entreprises à transformer des logs désordonnés e...
À propos de ce service

En tant qu'ingénieur data, je conçois des architectures cloud-native robustes et des pipelines ETL évolutifs. Que ce soit pour traiter des logs à volume élevé ou pour construire des data lakes Medallion, je fournis des solutions propres et optimisées.

Ce que je propose :

  • Pipeline ETL de bout en bout : Extraction, transformation et chargement automatisés des données avec Python et PySpark.
  • Data lakes cloud : Architecture de data lakes Medallion sans serveur (Bronze, Silver, Gold) sur AWS (S3, Glue, Athena).
  • Architecture de bases de données : Conception de bases relationnelles (3NF) et optimisation de requêtes SQL complexes (CTEs, fonctions de fenêtrage) dans PostgreSQL.
  • Optimisation des performances : Réduction des temps de traitement et des coûts de stockage en utilisant des formats comme Apache Parquet.

Pile technologique : AWS (S3, Glue, Athena) | PySpark | Python | PostgreSQL | SQL avancé | Git/GitHub

Pourquoi me choisir ? Je rédige du code prêt pour la production, garantis des designs évolutifs, et respecte strictement les meilleures pratiques en ingénierie des données.

Veuillez m’envoyer un message avant de commander pour discuter de votre projet précis !

Langue:

Anglais

Ourdou

Expertise technique:

dbt (Data Build Tool)

Apache Airflow

Expertise:

Pipelines de data

Développement ETL

Secteur:

Analyse de données

Mon portfolio