Künstliche Intelligenz mit Java
Maschinelles Lernen mit Neuronalen Netzwerken

Im Oktober 2017 publizierten die Entwickler der Firma DeepMind die Ergebnisse der jüngsten Entwicklungsstufe von AlphaGo, das weiterentwickelte System AlphaGo Zero. Die Forscher berichteten, dass dieses KI-System ganz ohne vorab gespeichertes Expertenwissen auskommt. AlphaGo Zero kennt nur die Spielregeln, mit denen es die Go-Steine auf dem Brett setzen und bewegen kann. Danach spielt das System gegen sich selbst beziehungsweise gegen einen Klon und es werden Punkte für gewonnene Spiele vergeben. Das KI-System hat die Vorgabe, die Zahl dieser Punkte zu maximieren (Verstärkendes Lernen, engl. Reinforcement Learning). Auf diese Weise bringt sich der Selbstlerner AlphaGo Zero in kürzester Zeit auf Weltklasseniveau. Das System ist schon nach 3 Tagen stärker als die AlphaGo-Version, die Lee Sedol besiegen konnte. Nach 40 Tagen Training schlug es auch die jüngste und vormals stärkste Ausbaustufe des Programms, AlphaGo Master (s. Abbildung 3).

 

Abbildung 3 (*Q4): Lernkurve vom Selbstlerner AlphaGo Zero

 

- 2 -