Kategorien: Digitalisierung|

Sie begegnen uns jeden Tag. Portraits von fremden Menschen, die Emotionen übermitteln. Auf Werbeplakaten, Zeitschriften oder Produktverpackungen finden sich Gesichter. Jedes davon ist individuell und sehen sie sich manchmal ähnlich, sind sie doch voneinander zu unterscheiden.

Die Einzigartigkeit der Natur spiegelt sich vor allem im menschlichen Gesicht wider. Es scheint unmöglich zu kopieren oder realitätsnah zu generieren, ohne dass Grafiker einen erheblichen Aufwand leisten, dies realitätsgetreu abzubilden.

Auf der Website thispersondoesnotexist.com findet man jedoch eben dies – künstlich erzeugte Gesichter. Auch wenn diese Menschen aussehen, als könnten sie uns auf der Straße begegnen, diese Personen existieren nicht.
Die Website geht zurück auf Tero Karras, Principal Research Scientis bei dem US-Amerikanischen Unternehmen nvidia. Beim Besuch der Website wird bei jeder Aktualisierung der Seite ein neues Bild erstellt. Die abgebildeten Personen haben unterschiedliche Geschlechter, visuelle Merkmale wie Frisuren oder Gesichtsformen und gehören unterschiedlichen Ethnien an. Weiterhin unterscheiden sich die Hintergründe und die Kleidung der jeweils abgebildeten Personen.

Die Funktionsweise von thispersondoesnotexist

Thispersondoesnotexist basiert auf der relativ neuen Technologie von „Generative Adversarial Networks (GAN)“ (Deutsch: Erzeugende generische Netzwerke‘). Generative Adversarial Networks bestehen aus zwei verschiedenen künstlichen neuronalen Netzwerken, dem Generator und dem Discriminator. Der Generator erstellt in diesem konkreten Fall ein Bild, welches vom Discriminator bewertet wird. Der Discriminator entscheidet anhand der Ähnlichkeit zu realen Portraitbildern, ob das erstellte Bild des Generators eine angemessene Ähnlichkeit zu einer echten Person darstellt und gibt dem Generator eben dieses Feedback zurück. Mit diesem Feedback wird das unterliegende Modell des Generators und des Discriminators nachjustiert. Das Feedback ist dabei qualitativ und misst gewissermaßen eine Art Abstand zwischen dem generierten Bild und den echten. Ist die Lösung schlechter, ist der Abstand und somit das Maß der Nachjustierung größer und vice versa. Über eine hohe Anzahl an Wiederholungen steigt so die Qualität der generierten Portraits. Dieses Vorgehen entspricht in Grundzügen dem Lernen im Bereich Neuronaler Netze.

Quelle:  https://www.lyrn.ai/2018/12/26/a-style-based-generator-architecture-for-generative-adversarial-networks/

Die Komplexität der erstellten Bilder nimmt dabei mit der Auflösung drastisch zu, weshalb ein progressiver Trainingsalgorithmus gewählt wurde, welcher zunächst sehr niedrig aufgelöste Bilder erstellt und bewertet (z.B. 4×4 Pixel). Im Anschluss jedoch kontinuierlich höhere Auflösungen bis zu 1024×1024 Pixel trainiert.

Anwendungsfälle

Stockphotos ohne Model

Welche Anwendungsbereiche diese Technologie für uns bereithält, zeigt das Projekt Generated Photos. Hier können bereits 100.000 Fotos dieser nicht realen Portraits frei heruntergeladen werden. Generated Photos funktioniert dabei als eine Art kostenlose Stock-Photo Datenbank für Portraits. Man sieht also, KI-erstellte Bilder  von Menschen sind kein Testsystem oder wissenschaftliches Experiment mehr, sondern eine Bilddatenbank, die bei Quellennennung kostenfrei kommerziell nutzbar ist.

Konfigurierbare Gesichter

Doch auch dieses innovative Projekt ist nur ein Teilschritt auf der Reise hin zu immer komplexeren visuellen Anwendungen künstlicher Intelligenz. Weitere Projekte arbeiten zurzeit daran, über APIs die generierten Gesichter konfigurierbar zu machen, um beispielhaft Anforderungen zu erfüllen wie: „Ich benötige Portraits einer Gruppe von 10 Männern unterschiedlicher Ethnien zwischen 45-50 Jahren mit freundlich-kompetentem Lächeln und Business Outfit vor dem Hintergrund moderner Architektur“. Dies wird in Zukunft ohne Models und ohne große Stock-Photo Datenbanken individuell realisierbar sein.

Weitere Informationen

SourceCode der StyleGAN Entwicklung (https://github.com/NVlabs/stylegan)

Erläuterung von Style Based GAN im Video (https://www.youtube.com/watch?v=kSLJriaOumA)

Array
  1. Thurgood Jenkins 25. Januar 2021 at 22:47 - Reply

    Das erstaunt und beängstigend mich zugleich

    • Björn Mestemacher 28. Januar 2021 at 09:01 - Reply

      Absolut. Auch ich empfinde dies als ein Teil einer sehr spannenden Technologie, die mit Sicherheit kontrovers diskutiert werden kann.

  2. Dr. J Dredd 30. Januar 2021 at 11:42 - Reply

    Damit könnte man eventuell das Prinzip der maschinellen Überlegenheit gegenüber der menschlichen verdeutlichen. So könnten z.B. zwei Komponenten derartig trainiert werden das menschliche Verhalten nachzuahmen und sich ständig dabei zu optimieren. Natürlich ein weit komplexer Vorgang als nur Bilder zu konstruieren. Faszinierend!

    • Björn Mestemacher 1. Februar 2021 at 09:52 - Reply

      Definitiv deutlich komplexer. Man müsste es natürlich schaffen das Verhalten z.B. über Videosequenzen zu rationalisieren aber im Prinzip durch die ständige Bewertung und Verbesserung der Entwürfe des Generators möglich und wie du schon sagst – Faszinierend.

  3. Niffler 9. Februar 2021 at 14:37 - Reply

    Ist schon irgend wie beängstigend. Aber auch sehr beeindruckend das man sowas schon machen kann.

    • Björn Mestemacher 11. Februar 2021 at 17:09 - Reply

      Auf jeden Fall. Gerade bei der Individualität von menschlichen Gesichtern sieht man das Potenzial dieser Technologie.

  4. Luce 11. Juli 2021 at 19:05 - Reply

    Das ist sehr faszinierend, und gruselig. ich mag es sehr.
    Ich kann mir gut vorstellen das es vielleicht so sein könnte: auf einmal wird eine person geboren irgendwann die im späteren leben so aussieht wie in eins der bilder

  5. Luce 11. Juli 2021 at 19:05 - Reply

    Das ist sehr faszinierend, und gruselig. ich mag es sehr.
    Ich kann mir gut vorstellen das es vielleicht so sein könnte: auf einmal wird eine person geboren irgendwann die im späteren leben so aussieht wie in eins der bildern