Agent Tune Kit
异常案例审阅 ·
vN
0 行
0 列
单版本
角色映射
报告摘录
警告
总览
跨版本
Case 浏览
失败原因 Top-N
--
主要分类分布
--
期望 vs 实际 · 行数差分布
正值 = Agent 输出更长,负值 = 过短
cross-version trend · 执行 / 失败 / 失败率
--
失败原因按版本演化(堆叠)
--
previous-tuning-target hit rate · 上一轮调优目标命中率
--
persistent failure cases · 顽固 case
--
__ATK_AUDIT_MARKERS__