Je vais construire une pipeline RAG sur AWS Bedrock pour vos documents et données

I
iloomnex
I
iloomnex
Iloomnex
Certaines informations ont été traduites automatiquement.

À propos de ce service

Traduction automatique

RAG est facile à démontrer mais difficile à déployer. La plupart des projets "chat avec vos documents" échouent dès que de vrais utilisateurs les utilisent. La récupération renvoie des morceaux non pertinents. Les citations ne renvoient pas aux documents sources. Les fenêtres de contexte explosent le coût par requête. Les réponses hallucinent car la couche de récupération n’a jamais été réellement optimisée. La démo fonctionnait. La production pas encore.

Je construis RAG comme les ingénieurs backend construisent tout système de production. Commencez par un découpage réel des documents, pas par des séparateurs par défaut. Utilisez des embeddings dans pgvector ou OpenSearch avec une couche de récupération que vous pouvez réellement déboguer. Génération sur AWS Bedrock avec Claude ou Titan. Suivi des citations pour que les réponses renvoient aux sources. Filtrage par métadonnées pour que les utilisateurs ne récupèrent que ce qu’ils sont autorisés à voir.

J’ai une expérience pratique de Bedrock grâce au programme AWS AI and ML Scholars, ainsi qu’une expérience en backend de production de plus de 4 ans dans la gestion de systèmes avec un vrai trafic. La partie intéressante est le code de récupération et de génération. L’infrastructure qui l’entoure est celle qui détermine si votre RAG fonctionne réellement en production.

Contactez-moi pour me dire ce que vous souhaitez rendre interrogeable.

Découvrez Iloomnex

Iloomnex

Senior backend engineer

5,0(11)
  • DePakistan
  • Membre depuisnov. 2023
  • Temps de réponse moy.1 heure
  • Dernière commande1 an
  • Langues

    Anglais
Senior backend engineer, 4+ years shipping production systems. I build Node.js and NestJS backends on AWS serverless. Lambda, SQS, EventBridge, Step Functions. I handle the integrations most devs avoid: Amazon SP-API, Shopify, QuickBooks, Xero, and LLMs via Bedrock, OpenAI, and Claude. Day job is a multi-tenant HRIS and payroll platform running real traffic. On Fiverr as iLoomNex, I take on backend builds, API integrations, and AI features that need to work in production, not just in a demo. Always online. Reply in under an hour. Any timezone.

Traduction automatique

Mon portfolio