J'auditerai et optimiserai la performance de votre recherche vectorielle rag

V
valhallasoft
V
valhallasoft
Martin Poli
Certaines informations ont été traduites automatiquement.

À propos de ce service

Traduction automatique

Votre RAG est en production mais donne de mauvais résultats. La latence est lente. Les coûts augmentent. Des hallucinations passent inaperçues. Cela vous semble familier ?


J'audite et corrige les pipelines RAG qui semblent corrects sur le papier mais échouent dans la réalité. Plus de 10 ans d'expérience dans le développement backend en production, je dirige actuellement la migration de la recherche IA pour l'un des plus grands détaillants d'Amérique latine (plus de 50 000 produits, plus d'un million d'utilisateurs quotidiens).


Ce que j'audite :

  • Adaptation du modèle d'embedding à votre domaine
  • - Stratégie de découpage et chevauchement
  • - Rappel et précision de la récupération (avec ensemble d'évaluation)
  • - Efficacité du reranking
  • - Poids de recherche hybride (mot-clé vs sémantique)
  • - Latence à chaque étape et coût par requête
  • - Modèles d'hallucinations

Ce que vous obtenez :

  • Diagnostic écrit avec corrections prioritaires
  • - Modifications de code pour les principaux problèmes (Standard / Premium)
  • - Ensemble d'évaluation pour mesurer les progrès
  • - Configuration de surveillance (Premium)

Stack : Python, OpenAI, Anthropic, Pinecone, Weaviate, Qdrant, pgvector, LangChain.


Envoyez-moi votre stack et un exemple de requête qui échoue. Je vous dirai ce qui est probablement cassé avant que vous ne payiez.

Découvrez Martin Poli

Martin Poli

Senior RAG and AI Search Engineer for Backend at Scale

  • DeUruguay
  • Membre depuismars 2020
  • Langues

    Anglais
Senior Platform Engineer with 10+ years building production systems at scale. Currently leading platform infra and AI search for Argentina's largest retail chain (200+ stores, 1M+ users/day), replacing Google Search API with RAG-based semantic search across 50K+ products. What I do best: - RAG, embeddings, OpenAI/Anthropic/Bedrock - Vector DBs: Pinecone, Weaviate, Qdrant, pgvector - Backend at scale: Python, Go, Node.js, PHP 8 - AWS EKS, Karpenter, Terraform, multi-account IaC Have a search problem or an LLM pipeline that won't ship? Send me your stack.

Traduction automatique

Mon portfolio