Je vais construire des pipelines ETL automatisés utilisant Apache Airflow pour consolider les données
scientifique des données
À propos de ce service
Je crée des pipelines ETL (Extract, Transform, Load) de qualité production avec Apache Airflow pour automatiser votre flux de données et consolider celles provenant de plusieurs sources dans votre entrepôt cloud.
CE QUE VOUS OBTENEZ
Configuration et mise en place d'Apache Airflow
- DAGs Airflow prêts pour la production
- Planification des tâches et automatisation
- Gestion des erreurs et logique de nouvelle tentative
Intégration des sources de données
- Connexion à toute API ou base de données
- Support : Shopify, Stripe, HubSpot, Google Analytics, etc.
- Connecteurs personnalisés si nécessaire
Transformations de données
- Nettoyage et validation des données brutes
- Modélisation de données avec dbt
- Mise en œuvre de la logique métier
Configuration de l'entrepôt cloud
- BigQuery, Snowflake ou Redshift
- Schémas optimisés
- Stratégies de partitionnement
Qualité et validation des données
- Contrôles de qualité automatisés
- Détection d'anomalies
- Alertes Slack/Email
Documentation et support
- Diagrammes d'architecture
- Instructions de configuration
- Assistance après livraison
Outils et plateformes:
Autres

