Il semble que ce service ait été suspendu

Je vais construire des pipelines ETL évolutifs avec Python ou PySpark

Certaines informations ont été traduites automatiquement.

Inde

Je parle Hindi, Anglais

Du chaos des données à la clarté, fait correctement dès la première fois

Bonjour ! Je suis un ingénieur en données avec plus de 5 ans d'expérience dans la création de pipelines ETL évolutifs et automatisés en utilisant Python, PySpark et des outils natifs du cloud. Je me s...
À propos de ce service

Vous avez du mal avec des données désordonnées ou vous avez du mal à transférer des données entre différents systèmes ?

Laissez-moi vous aider avec un pipeline ETL propre, efficace et évolutif utilisant Python ou PySpark.

Je suis ingénieur data avec plus de 5 ans d’expérience dans la création de pipelines de données robustes, le nettoyage de millions d’enregistrements et l’automatisation de workflows pour des startups, des entreprises et des produits SaaS.

Ce que je propose :

  • Extraction depuis CSV, Excel, APIs, PostgreSQL, MySQL, etc.
  • Nettoyage des données (gestion des nulls, doublons, conversion de types, etc.)
  • Logique métier et transformation
  • Chargement vers PostgreSQL, Snowflake, BigQuery, S3, etc.
  • Journalisation, gestion des erreurs et surveillance
  • Planification avec cron ou Airflow

Outils & Technologies :

  • Python
  • PySpark
  • Pandas
  • SQLAlchemy
  • psycopg2
  • Apache Airflow
  • PostgreSQL
  • Docker

Destination Platform:

Google BigQuery

Databricks Lakehouse

Outils et plateformes:

Airbyte

AWS Glue DataBrew

Kafka Connect