Inference Time

Inference Time ist die Zeit, die ein KI-Modell benötigt, um auf eine Eingabe eine Antwort zu generieren.

Wichtig

Kritisch bei Echtzeitanwendungen (z. B. Chatbots, Bilderkennung)

glossar inference zeit