ThinkWi-KI

Künstliche Intelligenz erklärt – verständlich und praxisnah

Zuletzt angesehen: • Benchmark

glossar:benchmark

Benchmark

Benchmarks sind standardisierte Tests, mit denen KI-Modelle verglichen werden können.

Beispiel

MMLU, BigBench, HumanEval (für GPTs)

glossar benchmark vergleich

glossar/benchmark.txt · Zuletzt geändert: 2025/05/11 13:22 (Externe Bearbeitung)