Maschinenlernen zählt zum Studienfeld der künstlichen Intelligenz. Es ist auf die Erstellung eines Programms ausgerichtet, mit dem stufenweise Verbesserungen in einer bestimmten, auf Daten basierenden Aktivität erzielt werden können. Je mehr Daten zur Verfügung gestellt werden können, desto besser kann das Programm lernen. Der ganze Nutzen des Maschinenlernens ist, dass die Maschine lernen kann, ohne von jemandem unterrichtet zu werden. Was können wir uns darunter vorstellen, wenn davon die Rede ist, ein Programm zu „unterrichten“?

Die klassische Programmierung funktioniert so, dass ein bestimmter auf dem „Wenn-Dann“-Prinzip basierender Satz von Regeln eingegeben wird, den das Programm befolgen soll. Falls das Programm auf etwas stößt, das es nicht erkennt (oder das es vergisst), stockt die Programmierung.

Das Maschinenlernen hingegen unterscheidet sich hiervon. Hierbei werden alle Daten durchgegangen und Similaritäten oder Vorlagen entdeckt, die das Speichern und Lernen der Daten vereinfachen. Dies ist ein immenser Vorteil gegenüber der klassischen Programmierung. Wenn es viele Variablen gibt, kann man nicht jede Variable berücksichtigen und das Programm darauf einstellen, jeden Aspekt in Erwägung zu ziehen. Je mehr Variablen es gibt, desto robuster wird das Programm und desto anspruchsvoller gestaltet es sich für Hardware-Anforderungen oder für die Hardware-Wartung.

Was sind die Methoden des Maschinenlernens?

Es gibt viele Methoden, doch ich werde nur wenige ausgewählte Methoden beschreiben, um diesen Trend im Maschinenlernen besser verständlich zu machen.

1. Beaufsichtigtes vs. Unbeaufsichtigtes Lernen
Der Unterschied zwischen beiden Lernmethoden lässt sich durch folgendes Beispiel schön veranschaulichen. Stellen Sie sich vor, Sie hätten einen jüngeren Bruder und möchten Ihm das Alphabet beibringen. Sie zeigen Ihm den Buchstaben D und sagen Ihm, dass er das „D“ an seiner speziellen „bauchigen“ Form erkennen kann. Falls er dann auf einen anderen Buchstaben wie z. B. „P“ zeigt, und versucht, die gelernte Regel anzuwenden (der Buchstabe ist bauchförmig, also handelt es sich um D), muss die Lehrkraft einschreiten und ihn korrigieren.

Aber was bedeutet dies im Maschinenlernen? Beim beaufsichtigten Lernen wird dem Programm ein Datensatz vorgegeben, bei dem die Eingabe- und Ausgabedaten bekannt sind. Ausgabedaten bezeichnen historische Daten (was, warum und was war das Ergebnis) und da das Programm auf dem Similaritätsprinzip basiert, kann es Vorhersagen dazu machen, was passieren wird. Diese Vorhersage kann mit den Prognosen eines menschlichen Experten verglichen werden, der seit vielen Jahren in einem bestimmten Gebiet tätig ist und der auf Grundlage seiner Erfahrung weiß, was passieren wird.

Eine weitere Frage, die sich sofort im Anschluss an diese Frage stellte, war: Ist der Unterricht mit einer Lehrkraft dann nicht stets besser? Nicht ganz. Manchmal stehen uns die Ausgabedaten nicht zur Verfügung; manchmal stellt sich ein zu weit gefasstes und abstraktes Problem dar, als dass die Vorhersage eines Ergebnisses möglich wäre.


2. Lernen durch Verstärkung
Dies ist die Lernmethode, mit der ich mich im Rahmen meiner Bachelorarbeit beschäftige und der ich deswegen nahe stehe. Es geht darum, dass eine gute Entscheidung verstärkt (belohnt) und eine schlechte Entscheidung bestraft wird. Einfach gesagt, haben wir mehrere verschiedene Optionen, die uns zur Verfügung stehen (bis zu 100 Optionen).

Viele Entscheidungen basieren auf dem Lernen durch Verstärkung und durchlaufen alle der Optionen (sogenannte Iterationen / Epochen). Dank zahlreicher Experimente, die darauf basieren, dass eine Verstärkung oder Bestrafung von Verhaltensweisen erfolgte, wird die bestmögliche Kombination und Schrittsequenz erlernt oder gefunden.

Welche Anwendungsmöglichkeiten bietet das Maschinenlernen?

Hiervon gibt es zahllose. Das einzige Limit, das mir einfällt, ist möglicherweise unser Vorstellungsvermögen.

Wenn wir die Stärken und Schwächen des Maschinenlernens erkennen, ist das Finden des richtigen Fokusbereichs bloß ein Kinderspiel. Ich werde nur auf ein paar dieser Fokusbereiche eingehen, die tatsächlich Anwendung finden oder die aus informativer oder finanzieller Hinsicht von Interesse sind.

Personalisierung von Personen im Internet
Das Sammeln von Daten über Kunden, darüber, welche Produkte sie sich ansehen, welche Artikel sie interessieren – all das kann genutzt werden, um abzuleiten, welche Herausforderung gelöst werden soll, welches Problem besteht. Und basierend auf den Daten von anderen Nutzern mit vergleichbaren Problemen kann das Programm Produkte empfehlen und vorschlagen, die hilfreich sein könnten.

Google oder Facebook funktionieren nach dem gleichen Prinzip. Auf der Basis sogenannter Cookies werden Daten über Personen gesammelt, und die relevantesten Ergebnisse angezeigt.

Online-Kunden-Hotline
Menschen haben diesen Service schon immer in Anspruch genommen. Viele Unternehmen bieten telefonischen Kontakt über einen Kunden-Hotline-Dienst an. Eine hohe Nutzung durch den Menschen und häufige Wiederholungen der gleichen Fragen führten zum Einsatz von maschinellen Lernprogrammen mit sogenannten Chatbots (ein Programm, das in Echtzeit auf menschliche Fragen antwortet). Vielleicht sind Sie der Meinung, dass Sie kein Computer richtig beraten kann oder dass Sie, als Mensch, den Unterschied sofort erkennen würden. Doch der bekannte Turing-Test hat uns bereits des Öfteren davon überzeugt, dass die künstliche Intelligenz von der menschliche Intelligenz nicht zu unterscheiden sein kann.

Dies waren nur ein paar von vielen Anwendungsmöglichkeiten des Maschinenlernens und das entsprechende Funktionsprinzip.


Tomáš Lichanec
Student

Technische Universität von Košice
Fachbereich für Elektrotechnik und Informatik, Maschinenlernen intelligenter Systeme