glossar:benchmark
Dies ist eine alte Version des Dokuments!
Benchmark
Benchmarks sind standardisierte Tests, mit denen KI-Modelle verglichen werden können.
Beispiel
MMLU, BigBench, HumanEval (für GPTs)
glossar benchmark vergleich
glossar/benchmark.1747723628.txt.gz · Zuletzt geändert: 2025/05/20 08:47 von 20.171.207.105
