Inhaltsverzeichnis

05. Transformer-Architektur

Siehe auch: Transformer-Architektur

Transformer sind die Architektur-Grundlage moderner Sprachmodelle wie GPT. Sie wurden 2017 in dem Paper „Attention is All You Need“ vorgestellt.

Hauptkonzepte

Beispiel

Ein Transformer kann den Zusammenhang zwischen Wörtern wie „Bank“ und „Fluss“ erkennen – abhängig vom Kontext.

Weiterführende Seiten

methoden transformer architektur