ThinkWi-KI

Künstliche Intelligenz erklärt – verständlich und praxisnah

Zuletzt angesehen: • Benchmark

glossar:benchmark

Dies ist eine alte Version des Dokuments!

Benchmark

Benchmarks sind standardisierte Tests, mit denen KI-Modelle verglichen werden können.

Beispiel

MMLU, BigBench, HumanEval (für GPTs)

glossar benchmark vergleich

glossar/benchmark.1746967621.txt.gz · Zuletzt geändert: 2025/05/11 14:47 von 127.0.0.1