Deep Learning (DL) - Helmut Hahn Datenschutz und IT-Seminare

Definition und Abgrenzung: Deep Learning (DL) ist ein Teilgebiet des Maschinellen Lernens. Es zeichnet sich durch den Einsatz von mehrschichtigen künstlichen neuronalen Netzen aus. Diese Modelle bestehen aus vielen Schichten von Neuronen, die hintereinander geschaltet sind, woraus sich der Begriff „Deep“ Learning ableitet.

Funktionsweise: DL-Modelle benötigen weniger manuelle Vorverarbeitung als klassische ML-Algorithmen. Sie lernen Merkmalsrepräsentationen direkt aus Rohdaten (wie Pixeln, Audiosignalen oder Text). Die Tiefe des Netzes (Anzahl der verborgenen Schichten) ermöglicht es, komplexe Merkmale in Stufen zu extrahieren: Niedrige Schichten erkennen einfache Muster, während höhere Schichten diese zu immer abstrakteren Merkmalen kombinieren.

Wichtige Architekturen (Spezialisierte NN-Typen): Tiefen Netze gibt es in verschiedenen spezialisierten Varianten:

Convolutional Neural Networks (CNN): Diese sind oft die Grundlage für autonome Systeme wie selbstfahrende Autos oder Drohnen zur Umfeldwahrnehmung und Objekterkennung (z.B. Fußgänger oder Fahrbahnmarkierungen).
Rekurrente neuronale Netze (RNN): Verfügen über Rückkopplungen und besitzen ein Kurzzeitgedächtnis, wodurch sie sich für sequenzielle Daten (Ton, Text, Zeitreihen) eignen, da Informationen aus früheren Eingaben die aktuelle Verarbeitung beeinflussen.
Transformer: Eine moderne, tiefschichtige Architektur, die auf dem Selbstaufmerksamkeits-Mechanismus (Self-Attention) basiert. Transformer sind sehr effizient für Sprach- und Textaufgaben und bilden die Grundlage großer Sprachmodelle (LLMs).