Je suis ingénieur en Deep Learning spécialisé dans la compression de modèles et le déploiement en edge. Je transformerai vos modèles de recherche à haute précision en actifs prêts pour la production, optimisés pour les appareils mobiles, web et IoT.
Ce que je propose :
- Conversion de modèles : Conversion fluide entre frameworks, notamment PyTorch vers ONNX, Keras vers TFLite ou TensorFlow vers CoreML.
- Optimisation de l'inférence : Accélérez votre modèle avec TensorRT, OpenVINO ou ONNX Runtime.
- Compression de modèles : Réduisez la taille grâce à la quantification post-formation (INT8/Float16) et l'élagage des poids sans perte significative de précision.
- Déploiement en edge : Optimisation pour du matériel comme Raspberry Pi, Android (TFLite), iOS (CoreML) ou NVIDIA Jetson.
- Affinement de l'architecture : Mise en œuvre de la distillation de connaissances pour créer des modèles "étudiants" efficaces.
Pourquoi choisir ce service ?
- Expertise en architectures SOTA : Expérience avec YOLO (v8-v11), Transformers (ViT), MobileNet et EfficientNet.
- Benchmarking des performances : Vous recevez un rapport détaillé montrant la latence, le débit et l'utilisation de la mémoire avant et après optimisation.
- Implémentation propre : Scripts d'intégration Python ou C++ entièrement documentés.
Outils & Frameworks :
PyTorch | TensorFlow | Keras | ONNX | TFLite