Transformer
Transformermodelle sind im Wesentlichen eine spezielle Art von Deep-Learning-Modellen, die auf dem Attention-Mechanismus (insbesondere der Self-Attention) basieren. Dadurch können sie Zusammenhänge über die gesamte Eingabesequenz hinweg gleichzeitig (parallel) betrachten, statt…