Je vais tester des modèles d'IA chatbot llm et NLP pour la précision, les biais, la QA et la performance
Ingénieur assurance qualité
À propos de ce service
80 % des LLM hallucinent, le vôtre ne doit pas.
Je suis ingénieur QA spécialisé dans le stress-testing des chatbots IA et des applications LLM pour détecter hallucinations, lacunes logiques, risques de jailbreak et problèmes de sécurité. Je fournis un rapport médico-légal en 48 heures pour garantir que vos utilisateurs ne voient jamais de résultats imprévisibles.
CE QUE VOUS RECEVEZ :
Matriciel d’hallucinations (plus de 200 prompts adverses)
Score de cohérence logique dans les domaines clés
Tentatives d’injection de prompt/jailbreak (basées sur OWASP)
Étapes de reproduction, gravité, corrections et preuve vidéo
Parcours vocal en option
POURQUOI MOI :
Plus de 6 ans d’expérience en automatisation QA, certifié ISTQB, publié sur l’ingénierie des prompts, plus de 400 gigs QA 5 étoiles sur Fiverr.
PROCESSUS :
Partagez l’URL/API. Je crée des tests adverses spécifiques au domaine, réalise des probes automatisés et manuels, et livre un tableau de bord Notion + PDF + liste de corrections. Révision Zoom en option.
FORMULES :
BASIQUE 75 $ (2 jours)
- 50 prompts
- Rapport d’erreur de 5 pages
- 1 révision
STANDARD 165 $ (3 jours)
- 150 prompts + continuité
- Rapport de 10 pages + carte thermique
- 5 tests d’injection
- Vidéo des principales défaillances
- 2 révisions
PREMIUM 325 $ (5 jours)
- Plus de 300 tests multi-turns/code/math/sécurité
- Audit complet OWASP
- Benchmark contre 2 modèles
- Consultation de 30 minutes + support de 14 jours
- Révisions illimitées
OPTIONS :
- Même jour +50 $
- Test de charge API (1k) +75 $
Test d'applications:
Site Internet
Technologie de développement:
Django
•
JavaScript
•
Python
•
React
•
SQL
Appareil:
PC
•
Mac
•
iPhone
•
iPad
•
Téléphone mobile Android
Mon portfolio
FAQ
Traduction automatique
Avez-vous besoin du code source ?
Non. Test uniquement en boîte noire. Si vous souhaitez un test en boîte blanche, commandez l'option Premium extra.
Pouvez-vous tester les GPT d'OpenAI, Claude, Llama, les pipelines RAG ?
C’est—n’importe quel modèle ou couche d’orchestration.
Et si aucun bug n’est trouvé ?
Vous recevez toujours un journal d’audit complet prouvant la robustesse—un excellent atout marketing.
Mes données sont-elles en sécurité ?
Absolument. Je signe des NDA et je supprime tous les logs de conversation après 14 jours, sauf si vous demandez une suppression plus tôt.
