Wenn die Qualität von Maschinellem Lernen für Klassifizierungsmodelle definiert werden soll, dann gibt es u.a. die folgenden 4 statistischen Werte bzw. Metriken: Accuracy, Precision, Recall und der sog. F1-Score.
Der wahrscheinlich anschaulichste Wert ist die sog. „Richtigkeit“ der Output-Daten, die wie folgt definiert ist:
Accuracy = richtig erzeugter Output / Anzahl der Datensätze
Jetzt sollen anhand eines Beispiels zur Klassifikation, nämlich der Beurteilung, ob jemand schwanger ist oder nicht, die einzelnen Metriken genauer erläutert werden (*Q33). Hierfür wird die sog. Confusion-Matrix verwendet (s. Abbildung 41).
Abbildung 41 (*Q33): Die Confusion-Matrix für eine Schwangerschafts-Klassifikation
Die linke Spalte zeigt folgendes: die Frau oben wird zurecht als nicht schwanger bewertet (TRUE NEGATIV = TN), die Frau unten wird fälschlicherweise als nicht schwanger eingestuft (FALSE NEGATIV = FN).
Die rechte Spalte zeigt folgendes: der dicke Man oben wird fälschlicherweise als schwanger eingestuft (FALSE POSITIV = FP), die Frau unten zurecht als schwanger bewertet (TRUE POSITIV = TP).
- 57 -