返回 Runs

Historical Compare

这里专门用来看 experiment / 多次 run 的历史对比,不打断主流程。

Experiments

选择一个 experiment,查看它里面多次 runs 的整体表现。

Experiment Summary

请选择一个 experiment

Overall Progress
0.0%
0/0
Running
0
Completed
0
Failed
0
Run Count
0

Model Ranking

按 variant / model 聚合 experiment 内的历史表现。

暂无 ranking 数据。

Compare Matrix

查看这个 experiment 里不同 benchmark 或不同模型的聚合对比。