Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- glossar:benchmark [2025/05/20 08:47] – gelöscht 20.171.207.105
+++ glossar:benchmark [Unbekanntes Datum] (aktuell) – Externe Bearbeitung (Unbekanntes Datum) 127.0.0.1
@@ Zeile 1: / Zeile 1: @@
+====== Benchmark ======
+Benchmarks sind standardisierte Tests, mit denen [[glossar:model|KI-Modelle]] verglichen werden können.
+==== Beispiel ====
+MMLU, BigBench, HumanEval (für GPTs)
+{{tag>glossar benchmark vergleich}}