返回 Runs
Historical Compare
这里专门用来看 experiment / 多次 run 的历史对比,不打断主流程。
Experiments
选择一个 experiment,查看它里面多次 runs 的整体表现。
Experiment Summary
请选择一个 experiment
Overall Progress
0.0%
0/0
Running
0
Completed
0
Failed
0
Run Count
0
Model Ranking
按 variant / model 聚合 experiment 内的历史表现。
暂无 ranking 数据。
Compare Matrix
查看这个 experiment 里不同 benchmark 或不同模型的聚合对比。