ConvoProbe permet de concevoir des scénarios de conversation multi-tours et de les exécuter automatiquement sur votre chatbot Dify pour évaluer la qualité des réponses. Les outils d'évaluation existants (LangSmith, Langfuse, Opik) excellent pour le traçage et l'évaluation mono-tour, mais ne supportent pas la conception et l'exécution de scénarios multi-tours de bout en bout. ConvoProbe comble cette lacune.
agents-ia