Je serai ingénieur big data pour hadoop, spark, pyspark, java, scala, machine learning
Ingénieur Data senior et Data Scientist
À propos de ce service
Vous avez besoin d’un ingénieur Big Data expérimenté pour gérer des pipelines de données complexes, de l’analyse ou de la modélisation prédictive ? Vous êtes au bon endroit !
Fort de plus de 15 ans d’expérience en ingénierie des données, analyse et développement logiciel, je possède une expertise approfondie des technologies Big Data, du Machine Learning et des plateformes cloud (AWS, Azure, GCP).
Services que je propose :
- Solutions Big Data utilisant Hadoop, Spark, PySpark, Hive, Pig, HBase
- Pipeline ETL avec SSIS, Talend, Airflow
- Streaming de données en temps réel avec Kafka, Flume, Logstash
- Développement d’entrepôts de données (schéma Star/Snowflake, SSAS, SSRS)
- Machine Learning & Deep Learning (Scikit-learn, TensorFlow, Keras, NLP, CNNs)
- Modèles prédictifs (classification, régression, systèmes de recommandation)
- Ingénierie des données cloud (Azure Data Factory, AWS EMR, GCP BigQuery)
- Visualisation avec Power BI, Tableau
Outils & Technologies :
Spark, Hadoop, Hive, Pig, Kafka, Flume, PySpark, Java, Scala, Python, SSIS, SQL Server, Azure, AWS, GCP, Power BI, Tableau, TensorFlow, Keras
Pourquoi me choisir ?
- Certifié Microsoft & Oracle (MCSE, OCP, MCSD)
- Plus de 8 ans dans l’écosystème Hadoop
- Plus de 25 projets réels en big data/ML livrés
- Communication et livraison fiables et rapides
Mon portfolio
FAQ
Traduction automatique
De quelles informations avez-vous besoin de moi pour commencer ?
Pour commencer, j’aurai besoin d’accéder à vos sources de données (ou à un échantillon), d’une brève description de vos objectifs commerciaux et de toute exigence spécifique comme le format de sortie attendu (par exemple, tableaux de bord, rapports CSV, API). Pour les grands projets, une courte réunion de découverte est recommandée.
Travaillez-vous avec des données en direct/en production ?
Oui, j’ai une vaste expérience dans la construction et la gestion de pipelines de données en environnement de production. Cependant, je recommande toujours de commencer par un environnement de staging ou d’échantillonnage pour valider la logique avant de passer à un déploiement complet en production.

