Lanza una llamada para ver la sesion en vivo. Los transcripts, tool calls y estado del agente apareceran aqui.
Campaña: — elegí arriba —
Casos de la batería
Editá los casos que testeás. Los oficiales son el set compartido de la campaña; los personales son tus borradores y no pisan a nadie. Se validan antes de guardar.
Elegí una campaña.
Testeador / juez de la batería
El prompt del GPT que improvisa como cliente y después juzga. Es uno por batería (depende fuertemente de los casos). Si lo dejás vacío, se usa el del repo. Plantilla Jinja: tenés disponible {{ case }}.
Rendimiento de la campaña
Rendimiento de las corridas de esta campaña. Clic en una corrida para ver su detalle (métricas, por caso, audio, transcript, tools, errores). Cada batería se guarda 14 días (las fijadas no expiran).