Wenn KI erkennt, dass sie getestet wird: Anthropic Claude Sonnet 4.5 zeigt Eval Awareness

Anthropic hat kürzlich das neue Modell Claude Sonnet 4.5 vorgestellt und mit einem öffentlichen System Card versehen. Laut dieser Dokumentation und ergänzender Berichterstattung zeigt das Modell etwas Unerwartetes: Es scheint…

WeiterlesenWenn KI erkennt, dass sie getestet wird: Anthropic Claude Sonnet 4.5 zeigt Eval Awareness

Was ist zu tum um die KI -Sicherheit zu verbessern?

KI-Security: Nein, wir werden nicht alle sterben. Aber zu tun gibt's genug! | heise online www.heise.de/meinung/KI-Security-Nein-wir-werden-nicht-alle-sterben-Aber-zu-tun-gibt-s-genug-9293875.html Der Artikel listet die verschiedenen Bereiche auf  in dennen Die sicherheit vom Ki anwendungen…

WeiterlesenWas ist zu tum um die KI -Sicherheit zu verbessern?