glossar:benchmark
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen RevisionVorhergehende Überarbeitung | |||
| glossar:benchmark [2025/05/20 08:47] – gelöscht 20.171.207.105 | glossar:benchmark [Unbekanntes Datum] (aktuell) – Externe Bearbeitung (Unbekanntes Datum) 127.0.0.1 | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| + | ====== Benchmark ====== | ||
| + | Benchmarks sind standardisierte Tests, mit denen [[glossar: | ||
| + | |||
| + | ==== Beispiel ==== | ||
| + | MMLU, BigBench, HumanEval (für GPTs) | ||
| + | |||
| + | {{tag> | ||
glossar/benchmark.txt · Zuletzt geändert: 2025/05/11 13:22 (Externe Bearbeitung)
