Kategorien: Digitalisierung, RPA|

Maschinelles Lernen (engl. Machine Learning) ist ein Begriff, der bereits seit Jahrzehnten existiert. Aber er gewinnt in der aktuellen Zeit immer mehr an Bedeutung, da es sich um eine Reihe von Technologien handelt, die in immer mehr Gebieten Einzug und Relevanz findet. Doch was genau ist maschinelles Lernen? Diese Frage wollen wir in diesem Blogbeitrag beantworten.

Maschinelles Lernen Definition

Maschinelles Lernen ist ein Teilbereich der künstlichen Intelligenz. Hier wird versucht ein statistisches Modell aus Daten aufzubauen, um somit Wissen zur Lösung eines expliziten Problems zu generieren, ohne, dass es explizit dahingehend programmiert werden muss. Dieses Wissen wird letztendlich aus Erfahrungen gewonnen, die entstehen, indem immer mehr Daten verwendet werden. Das große Ziel des maschinellen Lernens ist letztendlich jedoch, ein Modell mit Wissen zu erhalten, welches nicht nur mit den bereits bekannten Daten arbeiten, sondern das Wissen auch verallgemeinert mit unbekannten Daten verwenden kann, um das gleiche Problem für diese Daten zu lösen.

Maschinelles Lernen ist die Entwicklung eines Modells, welches auf Basis von gemachten Erfahrungen, die aus den bekannten Daten bestehen, lernt und auch für neue oder unbekannte Daten eine bestimmte Aufgabe lösen kann.

Machine Learning

Zur Entwicklung eines solchen Modells stehen euch verschiedene Methoden zur Verfügung, die ihr verwenden könnt. Diese beschränken sich nicht nur auf neuronale Netze, die wohl die bekannteste Methode des maschinellen Lernens darstellen und insbesondere für das Deep Learning verwendet werden. Stattdessen könnt ihr auch Methoden wie Evolutionäre und Genetische Algorithmen, Lineare Regression, Support Vector Machine und weitere deterministische Verfahren verwenden. Eine ausführliche Liste von Methoden und Algorithmen findet ihr hier.

Wie funktioniert maschinelles Lernen?

Startpunkt des maschinellen Lernens ist eine Datenmenge, aus der ein statistisches Modell, bzw. Wissen generiert werden soll, um ein bestimmtes Problem zu lösen. Das ist jedoch eine sehr verallgemeinerte Darstellung des maschinellen Lernens. Es existiert nicht nur eine Art von maschinellem Lernen. Somit können wir auch nicht genau sagen: So funktioniert maschinelles Lernen. Stattdessen müssen wir zwischen 5 unterschiedlichen Arten unterscheiden, alle diese Arten bringen spezifische Anwendungsfälle mit sich:

Das nachfolgende Bild soll euch nochmal einen einfachen Überblick über die vorhandenen Arten des maschinellen Lernens verschaffen und einige Anwendungsfälle aufzeigen, die zu den jeweiligen Arten zugeordnet werden können.

  • Überwachtes Lernen

    Das Überwachte Lernen (engl. Supervised Learning) ist zusammen mit dem unüberwachten und dem bestärkenden Lernen eine der drei häufigsten Arten des maschinellen Lernens. Hierbei erhält das Modell alle Daten bereits so vorbereitet, dass Kategorien und Label den Datensätzen zugeordnet wurden. Dadurch weiß das Modell welche Ergebnisse jeweils für die Daten erwartet werden. Nehmen wir zur Veranschaulichung das Beispiel der Objekterkennung: Der*die Modellentwickler*in bereitet die Trainingsbilder so auf, dass er*sie bereits zu jedem Bild das zu erkennende Objekt zuordnet hat. Dadurch wird dem Modell während des Lernprozesses ermöglicht, das eigene Ergebnis direkt nach der Vorhersage zu überprüfen. Soll ein Modell beispielsweise, den Unterschied zwischen Katzen- und Hundebildern lernen, dann müsst ihr beim überwachten Lernen, dem Modell zu jedem Bild sagen, ob ein Hund oder eine Katze abgebildet ist.

  • Unüberwachtes Lernen

    Anders als beim überwachten Lernen, wird beim unüberwachten Lernen (engl. Unsupervised Learning) den Daten das erwartete Ergebnis nicht bereits am Anfang zu geordnet. Stattdessen bekommt das Modell eine Aufgabe und soll anhand der vorhanden Daten eigenständig versuchen eine Lösung zu finden, die auch auf unbekannte Daten anwendbar ist. Diese Art wird häufig genau dann verwendet, wenn der*die Entwickler*in das Ergebnis selber nicht kennt. Wie gut das Modell das gestellte Problem gelöst hat, wird dann anhand von vorher definierten Parametern bestimmt. Unüberwachtes Lernen wird unter anderem bei der Datenkompression verwendet, wenn beispielsweise eine Bilddatei möglichst klein gehalten werden soll, ohne dass das Bild an Qualität verliert.

  • Teilüberwachtes Lernen

    Das teilüberwachte Lernen (engl. Semi-supervised Learning) bildet eine Mischung aus den beiden vorherigen Arten. Dabei gibt der*die Modellentwickler*in einem Teil der Daten bereits das Ergebnis vor und dem anderen nicht. Das Modell muss nun selbstständig für die Daten ohne Ergebnis die Lösung für die gestellte Aufgabe finden. Diese Art wird häufig genau dann verwendet, wenn die Ergebnisse des überwachten Lernens keine ausreichende Qualität besitzen oder das Modell, welches aus dem überwachten Lernen entstanden ist, nicht verallgemeinert werden kann.

  • Bestärkendes Lernen

    Beim bestärkenden Lernen (engl. Reinforcement Learning) werden Algorithmen wie das Q-Learning verwendet. Diese sind dem natürlichen Lernverhalten des Menschen ähnlich. Dabei wird nicht mit einem vorhandenen Datensatz gelernt. Das Modell versucht vielmehr Aktionen durchzuführen, um ein bestimmtes Ziel oder Verhalten zu erreichen. Ein gutes Beispiel hierfür sind autonome Fahrzeuge, die Lernen sollen geradeaus zu fahren, statt immer wieder im Rückwärtsgang. Ein anderes Beispiel sind Humanoide Roboter, die Lernen sollen zu gehen, indem sie ein Bein vor das andere Bein setzen.

    Um das gewünschte Verhalten zu erlernen wird mit Belohnungen und teilweise auch mit Bestrafungen gearbeitet. Dabei verändert sich das Modell dahingehend, dass es möglichst häufig belohnt und möglichst wenig bestraft werden möchte, um am Ende der Aufgabe eine möglichst hohe Punktzahl zu erreichen. Da ein statistisches Modell natürlich nicht das gleiche Konzept von Belohnungen wie wir Menschen besitzt, werden hierbei häufig stellvertretend Punkte verwendet. Wenn das Modell eine Aktion durchführt, die gewünscht ist oder dem Ziel dient, dann bekommt es positive Punkte und als Bestrafung negative Punkte.

  • Ensemble Learning

    Das Ensemble Learning ist nicht direkt eine Art des maschinellen Lernens, sondern eher eine Möglichkeit im Bereich des maschinellen Lernens verschiedene schwächere Modell zu einem stärkeren Modell zu kombinieren.

    Das ist besonders dann hilfreich, wenn mehrere Modelle existieren, die alle das gleiche Problem lösen sollen, jedoch unterschiedliche Ergebnisse liefern. Das kann unter anderem dann auftreten, wenn ein Modell überangepasst und ein anderes unterangepasst ist. (Eine gute Erklärung zu Über- und Unteranpassung findet ihr hier). Mit Ensemble Learning ist es nun möglich eine Art Mittelwert aus den Ergebnissen beider Modelle zu bilden. So erzielt man letztendlich ein besseres Ergebnis als in der Einzelbetrachtung der Modelle nebeneinander. Es handelt es sich hier nicht um den „klassischen“ arithmetischen Mittelwert. Vielmehr ist mit Mittelwert eine Kombination beider Ergebnisse gemeint. Zur Bestimmung dieses Mittelwerts existieren im Rahmen des Ensemble Learning verschiedene Methoden, wie das Boosting oder der Value Classifier. Eine Übersicht über gängige Methoden und wie sie funktionieren findet ihr hier.

Unterschied zwischen maschinellem Lernen und Deep Learning

Tatsächlich haben Deep Learning und maschinelles Lernen mehr Gemeinsamkeiten, als Unterschiede. Deep Learning ist ein Teilbereich des maschinellen Lernens. Dennoch lassen sich zwei signifikante Unterschiede zwischen Deep Learning und den sonstigen Methoden des maschinellen Lernen identifizieren.

Der erste große Unterschied besteht darin, dass bei maschinellem Lernen der Mensch in den Lernprozess eingreift und die benötigten Eigenschaften der Daten definiert. Beim Deep Learning bestimmt der Algorithmus diese Parameter selber. Außerdem verwendet Deep Learning nur tiefe neuronale Netze, also neuronale Netze mit vielen verdeckten Schichten. Im Vergleich dazu umfasst maschinelles Lernen noch weitere Methoden.

Wenn ihr noch mehr über Unterschiede zwischen Deep Learning und den anderen Methoden des maschinellen Lernens erfahren wollt, dann können wir euch unseren Blogbeitrag zu Deep Learning empfehlen. Da haben wir euch die Unterschiede nochmal detailliert aufgeschlüsselt.

Anwendungsmöglichkeiten für maschinelles Lernen

Aufgrund der unterschiedlichen Methoden oder Arten die maschinelles Lernen tatsächlich umfassen, gibt es auch sehr viele unterschiedliche Anwendungsmöglichkeiten. Das reicht von Computergegnern in Spielen über autonome Fahrzeuge bis hin zu industriellen Anwendungen, wie Predictive Maintenance und neue Videokompressionsmethoden. Letzteres nutzt unter anderem Netflix, um auch bei schlechter Internetverbindung eine gute Videoqualität bereitstellen zu können.

Aber auch im Rahmen von Robotic Process Automation (RPA) kommt mittlerweile immer mehr maschinelles Lernen zum Einsatz. Beispielsweise, um Dokumente auszulesen und die ausgelesenen Felder automatisch zu erkennen und später ein Eingabeform zu füllen. Das wird auch als Document Understanding bezeichnet. Auch im Bereich Process Mining wird maschinelles Lernen eingesetzt, um potentielle zu automatisierende Prozesse identifizieren zu können.

Was maschinelles Lernen für die Zukunft bedeutet

Maschinelles Lernen ist ein Thema, dass uns noch sehr lange begleiten wird, da es immer mehr Anwendung in diversen Gebieten gibt. Dies liegt unter anderem daran, dass der Zugang  zu maschinellem Lernen immer einfacher wird. Mittlerweile bieten viele Anbieter bereits fertige Modelle und nutzbare Infrastruktur an, ohne dass Spezialist*innen für maschinelles Lernen notwendig sind. Ein gutes Beispiel hierfür sind die ML Skills von UiPath, mit denen Texte in verschiedene Sprachen übersetzt werden können. Ein anderes Beispiel ist der Microsoft AI Builder und die Verwendung mit der Power Platform, der beispielsweise bereits integrierte Modelle zur Objekterkennung besitzt. Häufig ist es bei solchen Angeboten auch möglich die Modelle für eure eigenen Zwecke anzupassen, wodurch sich nochmal weitere Anwendungsmöglichkeiten bieten.

Letztendlich können wir gespannt sein, wie maschinelles Lernen unser Leben in Zukunft beeinflussen wird und welche weiteren Anwendungsmöglichkeiten sich ergeben.

Array
  1. Jana 6. September 2022 at 21:42 - Reply

    Hallo, könnten Sie bitte auch das Veröffentlichkeitsdatum nennen? Das würde ein sauberes Zitieren ermöglichen. Danke und VG

    • Artem Dontsov 12. September 2022 at 08:57 - Reply

      Hallo Jana,

      das Veröffentlichungsdatum ist der 12. Oktober 2021.

      Viele Grüße
      Artem