Je vais construire une pipeline RAG sur AWS Bedrock pour vos documents et données


À propos de ce service
Traduction automatique
RAG est facile à démontrer mais difficile à déployer. La plupart des projets "chat avec vos documents" échouent dès que de vrais utilisateurs les utilisent. La récupération renvoie des morceaux non pertinents. Les citations ne renvoient pas aux documents sources. Les fenêtres de contexte explosent le coût par requête. Les réponses hallucinent car la couche de récupération n’a jamais été réellement optimisée. La démo fonctionnait. La production pas encore.
Je construis RAG comme les ingénieurs backend construisent tout système de production. Commencez par un découpage réel des documents, pas par des séparateurs par défaut. Utilisez des embeddings dans pgvector ou OpenSearch avec une couche de récupération que vous pouvez réellement déboguer. Génération sur AWS Bedrock avec Claude ou Titan. Suivi des citations pour que les réponses renvoient aux sources. Filtrage par métadonnées pour que les utilisateurs ne récupèrent que ce qu’ils sont autorisés à voir.
J’ai une expérience pratique de Bedrock grâce au programme AWS AI and ML Scholars, ainsi qu’une expérience en backend de production de plus de 4 ans dans la gestion de systèmes avec un vrai trafic. La partie intéressante est le code de récupération et de génération. L’infrastructure qui l’entoure est celle qui détermine si votre RAG fonctionne réellement en production.
Contactez-moi pour me dire ce que vous souhaitez rendre interrogeable.
Découvrez Iloomnex
Senior backend engineer
- DePakistan
- Membre depuisnov. 2023
- Temps de réponse moy.1 heure
- Dernière commande1 an
Langues
Anglais
Traduction automatique
Mon portfolio
FAQ
Traduction automatique
Avec quels types de documents pouvez-vous travailler ?
PDF, documents Word, markdown, texte brut, HTML, et données structurées comme CSV ou JSON. J’ai travaillé avec des ensembles de documents mixtes comprenant de la documentation technique, des contrats juridiques, des bases de connaissances internes et des archives de tickets de support.
Pourquoi AWS Bedrock plutôt qu’OpenAI ?
Bedrock est pertinent si vous utilisez déjà AWS, si vous avez besoin que les modèles tournent dans votre VPC pour respecter la conformité, si vous souhaitez accéder à plusieurs familles de modèles via une seule API (Anthropic Claude, Amazon Titan, Meta Llama, Cohere, etc.), ou si votre processus d’achat d’entreprise privilégie AWS.
