Je vais créer une plateforme de données et de ml open source basée sur Kubernetes
À propos de ce service
De nombreuses organisations sont confrontées au coût élevé des environnements Snowflake, Redshift et Databricks. Ces plateformes sont efficaces mais leur coût dépasse souvent les bénéfices qu'elles apportent. Pour résoudre ce problème, j'aide les organisations à construire et maintenir leur propre plateforme de données et de ML avec un CICD de bout en bout, peu coûteux et totalement indépendant du cloud. Que vous soyez sur AWS, GCP ou Azure, grâce à Kubernetes, nous pouvons maintenir une plateforme entièrement fonctionnelle capable de gérer des pipelines de données en production et des modèles. J'utiliserai des technologies établies de la Apache Software Foundation, Linux & AI Foundation et CNCF pour créer une plateforme économique, efficace, facile à utiliser, très adaptable et flexible. Vos développeurs pourront y ajouter des fonctionnalités selon leurs besoins sans dépendre d'un fournisseur pour le support. Ce ne sera pas une boîte noire incompréhensible. Vous pourrez simplement utiliser Spark ou DBT pour construire vos pipelines, les planifier via Airflow et les surveiller avec Grafana, tout cela fonctionnant sur votre propre cloud et Kubernetes. Je réalise cela depuis 5 ans et ai déjà déployé dans 4 grandes multinationales.
Expertise:
Big data
•
etl
•
Transformation
•
SQL
•
Autres
Technologie:
Apache Hadoop
•
Apache Kafka
•
Apache Spark
•
Python
•
Autres
FAQ
Traduction automatique
Puis-je la déployer sur n'importe quel cloud ou sur site ?
Oui. J'ai déjà déployé cette solution sur AWS, Azure et des serveurs bare metal sur site.
Vais-je être aidé pour la mise en place des pipelines de données et des modèles initiaux ?
Oui

