glossar:benchmark
Dies ist eine alte Version des Dokuments!
Benchmark
Benchmarks sind standardisierte Tests, mit denen KI-Modelle verglichen werden können.
Beispiel
MMLU, BigBench, HumanEval (für GPTs)
glossar benchmark vergleich
glossar/benchmark.1746967621.txt.gz · Zuletzt geändert: 2025/05/11 14:47 von 127.0.0.1
