Il semble que ce service ait été suspendu
Je vais développer des pipelines ETL Azure avec Databricks
États-Unis
54 commandes terminées
Corriger les bugs, réparer, répéter
À propos de ce service
Je propose le développement de pipelines ETL de base avec Azure Databricks et Apache Spark. Ce service convient pour des charges de travail de données petites à moyennes ainsi que pour des implémentations d'apprentissage ou de prototype.
Ce que je fais :
- Construire des pipelines ETL avec PySpark / Spark SQL
- Lire des données depuis Azure Data Lake, Blob Storage ou sources SQL
- Appliquer des transformations (filtrage, jointures, agrégations, nettoyage des données)
- Charger les données traitées dans Delta Lake ou Azure SQL
- Créer des notebooks Databricks propres et bien structurés
- Validation de base et code Spark optimisé pour la performance
Pile technologique :
- Azure Databricks
- Apache Spark (PySpark, Spark SQL)
- Azure Data Lake / Blob Storage
- Delta Lake
Idéal pour les workflows ETL de base, la préparation de données et les projets pratiques sur Databricks.
Contactez-moi avant de commander pour confirmer les sources de données et les exigences.
Technologie:
Python
•
Databricks
FAQ
Traduction automatique
Fournissez-vous des ressources Azure ?
Non. L'acheteur doit fournir l'accès à Azure Databricks, au stockage et aux sources de données nécessaires.
Quelles sources de données prenez-vous en charge ?
Azure Data Lake, Azure Blob Storage, Azure SQL Database, et fichiers plats (CSV, Parquet, JSON).
Quel langage de programmation utilisez-vous ?
Principalement PySpark et Spark SQL dans Azure Databricks.
Vais-je obtenir les notebooks Databricks ?
Oui. Tous les notebooks créés durant le projet seront partagés.
Dois-je vous contacter avant de commander ?
Oui. Veuillez me contacter d'abord pour confirmer les exigences, sources de données et accès.

