Je vais affiner les LLM et construire des pipelines rag pour votre application AI


À propos de ce service
Traduction automatique
Vous développez une application AI qui nécessite un modèle de langage personnalisé ou un chatbot basé sur la connaissance ? Vous êtes au bon endroit. Je suis Yash, ingénieur ML avec plus de 6 ans d’expérience et une expérience pratique dans la production de LLM chez Fidelity National Financial, où j’ai affiné LayoutLMv3 (un transformeur/LLM multimodal) pour l’intelligence documentaire sur des données d’entreprise réelles.
Ce que je vais réaliser pour vous :
- Affiner des LLM open-source (LLaMA 3, Mistral, Falcon, BERT, LayoutLM) sur votre jeu de données personnalisé en utilisant LoRA / QLoRA / fine-tuning complet
- Les pipelines RAG connectent votre LLM à votre base de connaissances via des bases de données vectorielles (Pinecone, ChromaDB, FAISS, Weaviate)
- Chatbots personnalisés qui répondent aux questions à partir de vos documents, PDFs, bases de données ou API
- Évaluation et benchmarking des LLM pour mesurer la précision, le taux d’hallucination et la latence
- Ingénierie de prompt et optimisation du prompt système pour des résultats cohérents et fiables
Pourquoi me choisir ?
- Expérience réelle de fine-tuning de LLM en production (pas seulement des tutoriels)
- Diplôme double de IIT Kharagpur (B.Tech + M.Tech)
- Code propre, documenté et prêt pour la production en Python
- Expérience de déploiement sur Azure pour une inférence évolutive
Découvrez Yash Bhardwaj
I build GenAI apps, LLM pipelines and NLP systems that ship to production
- DeInde
- Membre depuisavr. 2026
- Temps de réponse moy.1 heure
Langues
Hindi, Anglais
Traduction automatique
FAQ
Traduction automatique
Avez-vous besoin que mes données soient étiquetées ?
Pour le fine-tuning, oui — je peux aussi vous aider à structurer et annoter votre jeu de données en option. Pour RAG, les documents bruts (PDF, TXT, DOCX) conviennent parfaitement.
Avec quels LLM travaillez-vous ?
Modèles open-source — LLaMA 3, Mistral, Phi-3, BERT et la famille LayoutLM — affiné via LoRA/QLoRA avec HuggingFace. Je supporte également l’API de fine-tuning d’OpenAI pour les modèles GPT.
Pouvez-vous aussi déployer le modèle ?
Oui — je déploie sur toute plateforme cloud : AWS SageMaker, Google Cloud Vertex AI, Azure ML ou Hugging Face Spaces. Je crée aussi des endpoints d’inférence FastAPI encapsulés dans Docker, déployables partout. Pour les cas d’usage mobile/edge, TensorFlow Lite et export ONNX sont supportés. Le déploiement inclut une API fonctionnelle.

