Generative KI-Modelle spielen eine transformative Rolle in den Medien, da sie in der Lage sind, neue Inhalte wie Texte, Bilder und Musik zu erzeugen.
- Bild- und Video-Generierung:
- Text-to-Image-Modelle wie DALL·E oder Stable Diffusion generieren Bilder aus Textbeschreibungen, was in den Bereichen Design, Kunst und Werbung Anwendung findet.
- Text-to-Video-Modelle wie Sora können Videos aus Textvorgaben erstellen, was für die Filmproduktion, Werbung und Simulationen nützlich ist.
- Multimodale Modelle können auch beim Storyboarding für Filme unterstützen.
- Musikgenerierung und die Musikindustrie:
- KI-Musikgeneratoren wie Suno und Udio generieren Pop- und Rock-Songs mit Gesang aus kurzen Prompts. Boomy konzentriert sich auf elektronische Instrumentalstücke. Aiva generiert Arrangements aus MIDI-Noten.
- Diese Dienste ermöglichen die Erstellung von Musikstücken basierend auf Textbeschreibungen und Stilvorgaben.
- Upload-Dienste für KI-generierte Musik (z. B. auf Spotify) sind bereits etabliert.
- Textproduktion und Übersetzung: LLMs ermöglichen die Textgenerierung (Fließtext, Artikel), die Zusammenfassung langer Dokumente, die automatische Übersetzung und das Sprachverständnis in mehreren Sprachen.
- Foto- und Videoverwaltung: Es existieren Tests für Foto- und Videoverwaltungstools, die KI-Funktionen nutzen.