Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- methoden:transformer [2025/05/11 14:47] – Externe Bearbeitung 127.0.0.1
+++ methoden:transformer [Unbekanntes Datum] (aktuell) – Externe Bearbeitung (Unbekanntes Datum) 127.0.0.1
@@ Zeile 1: / Zeile 1: @@
 ====== 05. Transformer-Architektur ======
+Siehe auch: [[theorie:begriffe|Transformer-Architektur]]\\ \\
 Transformer sind die Architektur-Grundlage moderner Sprachmodelle wie GPT. Sie wurden 2017 in dem Paper „Attention is All You Need“ vorgestellt.
 ==== Hauptkonzepte ====
-  * **Self-Attention**: Das Modell bezieht sich auf alle Eingabewörter gleichzeitig, nicht sequentiell.
+  * **[[glossar:self-attention|Self-Attention]]**: Das Modell bezieht sich auf alle Eingabewörter gleichzeitig, nicht sequentiell.
   * **Encoder-Decoder-Struktur**: Ursprünglich für Übersetzungsaufgaben, später weiterentwickelt.
   * **Skalierbarkeit**: Ermöglicht paralleles Training riesiger Modelle.
@@ Zeile 12: / Zeile 13: @@
 ==== Weiterführende Seiten ====
-  * [[methoden:llm|Large Language Models]]
+  * [[methoden:llm|[[methoden:llm|Large Language Models]]]]
   * [[glossar:transformer|Glossar: Transformer]]
 {{tag>methoden transformer architektur}}