Je vais créer des pipelines de données évolutifs en utilisant azure data factory et databricks
Ingénieur Big Data
À propos de ce service
Je me spécialise dans la conception et le développement de pipelines ETL/ELT de bout en bout utilisant Azure Data Factory (ADF) et Databricks (PySpark). J’intègre des données provenant de multiples sources API, bases de données SQL, stockage cloud, fichiers, et plus encore dans des pipelines propres, structurés et prêts pour la production.
Fort d’une expertise en orchestration ADF, pipelines Delta Databricks, et transformations PySpark, je peux vous aider à construire des workflows robustes, faciles à maintenir et optimisés pour la performance. Que vous ayez besoin d’un pipeline d’ingestion simple ou d’une solution de données multi-sources complète, je fournis des résultats évolutifs, sécurisés et bien documentés.
Ce que je propose :
Ingestion de données depuis plusieurs sources
pipelines ADF, déclencheurs, orchestration
pipelines ETL/ELT Delta Databricks
Transformations PySpark
Contrôles de qualité et validation des données
pipelines en streaming ou batch
Documentation et meilleures pratiques
Construisons un pipeline qui fournit des données précises, fiables et prêtes pour la production pour votre entreprise !
Outils et plateformes:
AWS Glue DataBrew
•
Azure Data Factory
