Arize Phoenix
Par Arize AI • Lancé en 2023
Plateforme open-source d’observabilité et d’évaluation LLM (traces, évaluations, datasets, playground) pour optimiser des apps GenAI.
À propos de Arize Phoenix
Arize Phoenix est une plateforme open-source d’observabilité et d’évaluation pour applications et produits IA, particulièrement adaptée aux systèmes LLM (ex. RAG, agents). Elle aide les équipes à comprendre le comportement réel en production (ou en test), à diagnostiquer les erreurs et à itérer plus vite grâce à une vue structurée des exécutions (traces/spans) et des résultats.
Phoenix s’appuie sur OpenTelemetry et propose le traçage, des évaluations (dont des approches « LLM-as-judge »), la gestion de jeux de données versionnés et des expériences pour comparer prompts, modèles et configurations. Un playground interactif permet de rejouer des appels, ajuster les paramètres et comparer des variantes afin d’optimiser la qualité. L’outil est agnostique (fournisseurs, langages, frameworks) et peut être auto-hébergé (local, notebook, conteneur, cloud) ou utilisé via Phoenix Cloud.
Il s’adresse aux AI engineers, équipes produit, data/ML et MLOps qui veulent fiabiliser, mesurer et améliorer des applications GenAI avec un workflow d’analyse, d’itération et de gouvernance des changements.
Fonctionnalités
Connaissez-vous un outil IA qui devrait figurer ici ?
Aidez-nous à enrichir notre annuaire en soumettant gratuitement un nouvel outil.