Je vais construire des pipelines de données GCP de bout en bout en utilisant pubsub, kafka et dataform

Certaines informations ont été traduites automatiquement.

Inde

Je parle Anglais, Hindi
Je suis Arpit, diplômé en M.Tech de l'IIT et ingénieur en données certifié GCP, spécialisé dans la conception de solutions à fort impact et évolutives. Avec plus de 4 ans d’expérience en ingénierie de...
À propos de ce service

Une plateforme de données moderne nécessite une ingestion robuste et une modélisation analytique précise. En tant qu'ingénieur de données certifié Google Cloud, je conçois des systèmes de bout en bout garantissant l'intégrité des données depuis la source jusqu'au tableau de bord.


Je développe des pipelines événementiels à haut volume avec une livraison stricte au moins une fois, tout en architecturant des modèles BigQuery centralisés unifiant des tables disparates provenant de plus de 19 unités commerciales.


Ce que je peux faire pour vous :

  • Ingestion en temps réel : Concevoir des systèmes sécurisés utilisant Apache Kafka et GCP Pub/Sub en Java Spring Boot.
  • Traitement sans serveur : Concevoir des microservices découplés via Cloud Run pour transformer de grands ensembles de données.
  • Modélisation dimensionnelle : Transformer les données brutes de BigQuery en schémas en étoile avec Dataform, en appliquant SCD Type 2 et 4.
  • Orchestration : Orchestrer des workflows ELT multi-étapes via Cloud Composer (Airflow) pour automatiser les jobs Dataform.


Technologies que j'utilise : Pub/Sub GCP, Kafka, BigQuery, Dataform, Java (Spring Boot), Cloud Run, Airflow et Terraform.


Pourquoi me choisir ? Vous bénéficiez d’un expert cloud certifié qui met en œuvre des cadres de qualité des données robustes, en enregistrant les échecs d’assertion dans des tables d’erreur persistantes pour que vos analyses restent fiables.


Discutons avant votre commande pour définir ensemble le périmètre !

Destination Platform:

Google BigQuery

Databricks Lakehouse

Outils et plateformes:

Fivetran

Airbyte

Google Cloud Dataflow