Je vais construire des pipelines de streaming en temps réel avec Apache Kafka

Certaines informations ont été traduites automatiquement.

États-Unis

Je parle Anglais

Ingénieur de données senior, certifié AWS, développeur Spark Cloudera

Je construis des pipelines de données de niveau production, des entrepôts cloud et des stacks de données modernes pour startups et entreprises en croissance. 9 ans d'expérience dans la banque, la fin...
À propos de ce service

Vous avez besoin d’un pipeline de données en temps réel qui déplace de manière fiable les événements depuis vos bases de données ou API vers votre plateforme d’analyse ?



Je crée des pipelines de streaming prêts pour la production en utilisant Apache Kafka, Kafka Connect, Spark Structured Streaming, AWS Kinesis, Glue, Databricks et des entrepôts de données cloud.



Ce que je peux livrer :


- Architecture de topic Kafka et de producteur/consommateur


- ETL en streaming avec Spark Structured Streaming ou Python


- Connecteurs source Kafka Connect ou Debezium


- Vérifications de la qualité des données et validation du schéma


- Livraison dans Snowflake, BigQuery, Redshift, S3 ou Databricks


- Documentation de surveillance et conseils pour le déploiement



Pourquoi travailler avec moi :


- 9 ans en tant que Data Engineer senior


- Expérience solide en architecture batch et streaming


- Expérience avec AWS, Databricks, Snowflake et plateformes de données d’entreprise


- Livraison claire avec documentation du code et notes d’architecture



Veuillez m’envoyer un message avant de commander pour que je puisse confirmer la source de l’événement, la plateforme cible et le débit attendu.

Destination Platform:

Snowflake

Google BigQuery

Amazon Redshift

Outils et plateformes:

AWS Glue DataBrew

Google Cloud Dataflow

Autres services de Data engineering I Offre