glossar:benchmark
Benchmark
Benchmarks sind standardisierte Tests, mit denen KI-Modelle verglichen werden können.
Beispiel
MMLU, BigBench, HumanEval (für GPTs)
glossar benchmark vergleich
glossar/benchmark.txt · Zuletzt geändert: 2025/05/11 13:22 (Externe Bearbeitung)
