Künstliche Intelligenz mit Java
Maschinelles Lernen mit Neuronalen Netzwerken

2.3. Verstärkendes Lernen (Reinforcement Learning)

Verstärkendes Lernen (Reinforcement Learning), auch bestärkendes Lernen genannt, ist vielleicht vergleichbar mit der Hundeerziehung: gewünschtes Verhalten wird belohnt (z. B. durch ein „Leckerli“), unerwünschtes Verhalten entweder ignoriert oder sanktioniert.

Diese Methode des Maschinellen Lernens erlernt eigenständig eine Strategie, um die erhaltene Belohnung anhand einer oder mehrerer Belohnungs-Funktionen zu maximieren.

Das verstärkende Lernen benötigt keine vorhandenen Datenbestände, sondern generiert Lösungen und Strategien auf Basis von erhaltenen Belohnungen im Trial-and-Error-Verfahren. Das Wissen und die „Intelligenz“ entstehen während vieler verschiedener Simulationsdurchläufe. Die verwendeten Algorithmen haben das Ziel, die erhaltenen Belohnungen zu maximieren. Die einzelnen Aktionen sind nicht vorgegeben, sondern werden durch den (durch die erhaltenen Belohnungen generierten) Nutzen bestimmt (Vgl.  *Q12).

Abbildung 8 (*Q13): Flugstabilisierung durch verstärkendes Lernen

- 7 -