Je vais construire une pipeline ETL prête pour la production en utilisant AWS, airflow et pyspark

Certaines informations ont été traduites automatiquement.

Pakistan

Je parle Anglais

Ingénieur Data, AWS, Apache Airflow, Spark, PostgreSQL, ETL

Je suis ingénieur data et étudiant en dernière année d'informatique avec une expérience pratique dans la construction de pipelines ETL évolutifs et d'architectures de données. J'ai travaillé chez Cogn...
À propos de ce service

Vous êtes submergé par des données brutes sans moyen fiable de les traiter ?

Je crée des pipelines de données de niveau production qui s'exécutent automatiquement, évoluent avec vos données et ne se cassent jamais silencieusement. Pas de scripts spaghetti. Pas d'étapes manuelles. Juste des données propres et fiables exactement où vous en avez besoin.


Ce que je construis

  • pipelines ETL utilisant Python et PySpark pour extraire, transformer, charger, c'est tout
  • DAGs Apache Airflow pour des workflows entièrement automatisés et planifiés
  • pipelines d'architecture Medallion (Bronze, Silver, Gold) avec qualité des données à chaque couche
  • plateformes de données AWS S3 data lake, Glue, EMR sur EKS, IAM, Terraform
  • pipelines d'ingestion cloud depuis n'importe quelle source vers PostgreSQL, MySQL, ClickHouse ou Supabase
  • configurations entièrement conteneurisées avec Docker et Docker Compose
  • déploiements en une seule commande avec CI/CD, sans SSH manuel ni runbooks

Expertise:

Big data

Extraction des données

Flux de données

Technologie:

Amazon Redshift

Apache Kafka

Apache Spark

Python

SQL

Mon portfolio