Künstliche Intelligenz

Transformer

Transformermodelle sind im Wesentlichen eine spezielle Art von Deep-Learning-Modellen, die auf dem Attention-Mechanismus (insbesondere der Self-Attention) basieren. Dadurch können sie Zusammenhänge über die gesamte Eingabesequenz hinweg gleichzeitig (parallel) betrachten, statt…

WeiterlesenTransformer

Attention-Mechanismus

Der Attention-Mechanismus (wörtlich „Aufmerksamkeits-Mechanismus“) ist eine Methode in neuronalen Netzen, bei der das Modell gezielt die wichtigsten Teile einer Eingabe hervorhebt, anstatt alle Information gleich zu behandeln. Das funktioniert so:…

WeiterlesenAttention-Mechanismus

KI: Open Source als Europas Strategie zur Stärkung der digitalen Souveränität

Dominanz von US-amerikanischen und chinesischen Entwicklungen In der aktuellen Diskussion um Künstliche Intelligenz (KI) dominieren oft US-amerikanische und chinesische Entwicklungen wie ChatGPT oder Google Gemini. Doch Europa verfolgt eine eigene…

WeiterlesenKI: Open Source als Europas Strategie zur Stärkung der digitalen Souveränität

ChatGPT-Operator: Potenzial und aktuelle Herausforderungen

Der kürzlich vorgestellte ChatGPT-Operator von OpenAI ermöglicht es Nutzer:innen, mit natürlicher Sprache durch das Web zu navigieren. Erste Tests zeigen vielversprechende Anwendungen, aber auch bestehende Herausforderungen. In einem Beispiel nutzte…

WeiterlesenChatGPT-Operator: Potenzial und aktuelle Herausforderungen

OpenAI aktualisiert ChatGPT mit neuer „Think“-Schaltfläche und führt das „o3 mini“-Modell ein

OpenAI hat kürzlich bedeutende Updates für seine ChatGPT-Plattform angekündigt. Eine der herausragenden Neuerungen ist die Einführung der „Think“-Schaltfläche, die als Modellumschalter fungiert und das O1-Argumentationsmodell aktiviert. Diese Funktion zielt darauf…

WeiterlesenOpenAI aktualisiert ChatGPT mit neuer „Think“-Schaltfläche und führt das „o3 mini“-Modell ein

DeepSeek R1

  • Beitrags-Autor:
  • Beitrags-Kategorie:DeepSeekKI

DeepSeek R1 ist ein fortschrittliches Open-Source-Sprachmodell, entwickelt von dem chinesischen KI-Unternehmen DeepSeek. Es wurde am 20. Januar 2025 veröffentlicht und zeichnet sich durch seine herausragenden Fähigkeiten in den Bereichen logisches…

WeiterlesenDeepSeek R1