methoden:transformer
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen RevisionVorhergehende Überarbeitung | |||
| methoden:transformer [2025/05/20 07:39] – gelöscht 20.171.207.105 | methoden:transformer [Unbekanntes Datum] (aktuell) – Externe Bearbeitung (Unbekanntes Datum) 127.0.0.1 | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| + | ====== 05. Transformer-Architektur ====== | ||
| + | Siehe auch: [[theorie: | ||
| + | Transformer sind die Architektur-Grundlage moderner Sprachmodelle wie GPT. Sie wurden 2017 in dem Paper „Attention is All You Need“ vorgestellt. | ||
| + | |||
| + | ==== Hauptkonzepte ==== | ||
| + | * **[[glossar: | ||
| + | * **Encoder-Decoder-Struktur**: | ||
| + | * **Skalierbarkeit**: | ||
| + | |||
| + | ==== Beispiel ==== | ||
| + | Ein Transformer kann den Zusammenhang zwischen Wörtern wie „Bank“ und „Fluss“ erkennen – abhängig vom Kontext. | ||
| + | |||
| + | ==== Weiterführende Seiten ==== | ||
| + | * [[methoden: | ||
| + | * [[glossar: | ||
| + | |||
| + | {{tag> | ||
methoden/transformer.1747719559.txt.gz · Zuletzt geändert: 2025/05/20 07:39 von 20.171.207.105
