DeepEval
Framework open-source pour évaluer, tester et fiabiliser des applications LLM, agents et pipelines RAG.
Framework open-source permettant de tester, comparer et évaluer prompts, modèles et pipelines LLM.
Promptfoo est un outil très pragmatique qui apporte des pratiques de test logiciel classiques au monde des LLM. Sa force est la reproductibilité et la simplicité d’intégration. Il est particulièrement adapté aux équipes techniques cherchant à éviter des régressions coûteuses. En revanche, il nécessite un investissement initial pour définir de bons cas de test et des critères de qualité pertinents.
Framework open-source pour évaluer, tester et fiabiliser des applications LLM, agents et pipelines RAG.
Plateforme de monitoring, d’évaluation et d’amélioration continue de la qualité des applications basées sur des LLM.
Créateur de pipelines IA & LLM via interface drag-and-drop.
NeuraForge AI est une plateforme d’automatisation intelligente conçue pour créer des workflows IA avancés, coordonner des agents autonome…
Outil open-source pour tester, comparer et évaluer des prompts et configurations LLM de manière systématique.
Plateforme open-source de tests, d’évaluation et de sécurisation des modèles IA et applications LLM.
Ce hub relie Promptfoo aux alternatives, comparatifs, catégories et intentions proches afin d’aider les utilisateurs et les moteurs IA à comprendre son contexte, ses concurrents et ses cas d’usage.