Next‑Gen‑Modelle & agentische Workflows: GPT‑5, Claude Sonnet 4.5 & was Autonomie in KI jetzt bedeutet

Wir erleben gerade eine Verschiebung: KI‑Modelle entwickeln sich von Assistenten hin zu Agenten. Modelle wie GPT‑5 und Claude Sonnet 4.5 zeigen, wie stärkeres Reasoning, Tool‑Integration und längere Autonomie neue Workflows ermöglichen…

WeiterlesenNext‑Gen‑Modelle & agentische Workflows: GPT‑5, Claude Sonnet 4.5 & was Autonomie in KI jetzt bedeutet

Titel: Google AI Studio – KI-Entwicklung direkt im Browser (2025)

Google AI Studio ist eine browserbasierte Entwicklungsumgebung für Künstliche Intelligenz, die es ermöglicht, eigene KI-Modelle zu erstellen, zu testen und in Anwendungen zu integrieren – ganz ohne lokale Installation. Das…

WeiterlesenTitel: Google AI Studio – KI-Entwicklung direkt im Browser (2025)

GDPval: OpenAI bewertet KI-Leistung in wirtschaftlich relevanten Aufgaben

GDPval ist ein neues Benchmark-System von OpenAI, das die Leistungsfähigkeit moderner KI-Modelle bei realen, wirtschaftlich wertvollen Aufgaben misst. Der Datensatz deckt 44 Berufe in den neun größten Wirtschaftssektoren der USA…

WeiterlesenGDPval: OpenAI bewertet KI-Leistung in wirtschaftlich relevanten Aufgaben

Dario Amodei: Machines of Loving Grace – Wie KI die Welt zum Besseren verändern könnte

Dario Amodei, CEO des KI-Unternehmens Anthropic, ist bekannt für seine Forschung zu den Risiken leistungsfähiger KI. In seinem Essay „Machines of Loving Grace“ (Oktober 2024) beschreibt er jedoch, wie Künstliche…

WeiterlesenDario Amodei: Machines of Loving Grace – Wie KI die Welt zum Besseren verändern könnte

Wenn KI erkennt, dass sie getestet wird: Anthropic Claude Sonnet 4.5 zeigt Eval Awareness

Anthropic hat kürzlich das neue Modell Claude Sonnet 4.5 vorgestellt und mit einem öffentlichen System Card versehen. Laut dieser Dokumentation und ergänzender Berichterstattung zeigt das Modell etwas Unerwartetes: Es scheint…

WeiterlesenWenn KI erkennt, dass sie getestet wird: Anthropic Claude Sonnet 4.5 zeigt Eval Awareness

Warum heutige KI Modelle wahrscheinlich keine wissenschaftlichen Durchbrüche autonom leisten

In einem aktuellen Kommentar Oktober 2025 äußerte Thomas Wolf Mitgründer von Hugging Face deutliche Skepsis gegenüber der Idee dass gegenwärtige KI Modelle in absehbarer Zukunft eigenständig wissenschaftliche Durchbrüche erzielen könnten.…

WeiterlesenWarum heutige KI Modelle wahrscheinlich keine wissenschaftlichen Durchbrüche autonom leisten

Warum KI‑Modelle in der Medizin besonders verletzlich sind – neue Studien belegen Risiken

## Top‑KI‑Modelle versagen spektakulär bei leicht abgewandelten medizinischen Fragen **Einleitung**KI-Modelle erreichen häufig beeindruckende Testergebnisse bei medizinischen Prüfungen – traut man dem Erfolgserlebnis jedoch blind, kann das gefährlich sein. Eine neue…

WeiterlesenWarum KI‑Modelle in der Medizin besonders verletzlich sind – neue Studien belegen Risiken

Übersicht – Prompt-Techniken, die für aktuelle Chatbots funktionieren

KategorieTechnikKurzbeschreibung (deutsch)Evidenzbasierte TechnikenSelf-ConsistencySelbstbeständigkeitMehrere Antworten (z. B. 5 Varianten) erzeugen lassen und das Modell die Ergebnisse gegenseitig prüfen lassen.Program of ThoughtProgramm des DenkensDas Modell ausdrücklich auffordern, Mathematik / Code oder externe…

WeiterlesenÜbersicht – Prompt-Techniken, die für aktuelle Chatbots funktionieren

Wachablösung: Anthropic neuer KI‑Marktführer bei US‑Unternehmen

Wachablösung: Anthropic neuer KI‑Marktführer bei US‑Unternehmen Veröffentlicht am 01.08.2025 – von Moritz Förster bei iX Magazin / heise online Große US‑Unternehmen und Start-ups setzen im Einsatz von KI zunehmend auf Modelle…

WeiterlesenWachablösung: Anthropic neuer KI‑Marktführer bei US‑Unternehmen