AI lernt zu “Malen” - Künstlich erzeugte Fotos werden immer realistischer

Gesichter malen kennen wir noch aus der Kindheit oder aus dem Tatort, wenn es wieder mal heißt: “Wie sah denn der Täter aus?” Wie bei vielen Themen, sind uns Computer mit Hilfe von künstlicher Intelligenz ganz dicht auf den Fersen. Bereits Ende April stellte NVIDIA ein KI-Modell vor, mit dem sich künstliche Potraitfotos generieren lassen: pg-GAN.

Hier ein sehr gelungenes und ein nicht ganz so realistisches Ergebnis des Modells:

Weibliches Portraits generiert mit pg-GAN

Das schlechtere Bild entlarvt sich durch einen auffälligen Ohrring, dem Verlauf im Hintergrund, den seltsamen Schulterpartien und dem Augenreflex im linken Auge. Beide Bilder stammen aus dieser großen Sammlung, in die NVIDIA zum Stöbern einlädt - die besten davon tauchen sicher auch bald auf Dating-Webseiten auf. Ebenso enthalten sind auch andere generative Beispiele wie Schlafzimmer oder Flugzeuge - beide noch mit vielen Schwierigkeiten, wie man an den Beispielen unten sehen kann.

Schlafzimmer und Flugzeige generiert mit pg-GAN

Warum ist das wichtig?

  • Die AI Methoden machen große Fortschritte, von perfekten fotorealistischen Bildern sind wir aber noch entfernt: Wenn man die Bilder anschaut, kann man bis auf wenige Ausnahmen sofort erkennen, dass diese nicht echt sind. Von daher sind die Bilder eine Momentaufnahme in der Entwicklung von künstlicher Intelligenz. Allerdings braucht man nicht viel Vorstellungskraft, um zu sehen, wohin die Reise geht. Fotorealistische Bilder aus der Maschine sind nur noch eine Frage der Zeit.
  • Die Trainingsdaten spielen eine große Rolle: Wie bei jedem KI Modell wurden die Bilder hier basierend auf Trainingsbildern erzeugt. Interessant wäre es daher noch gewesen die generierten Bilder mit den Trainingsset zu vergleichen. Vielleicht generiert das Modell nur zufällige ganz leicht veränderte Quellbilder, die dann eben realistisch aussehen.
  • Die öffentlich verfügbaren KI Bibliotheken machen AI sehr zugänglich: Den Source Code zum Trainieren des Modells hat NVIDIA damals gleich mitveröffentlicht. Mit einem 0,3 MB zip-Archiv ist er auch recht überschaubar. Zum Vergleich, ein iPhone-Foto ist ungefähr 3-4 MB groß. Das liegt daran, dass das Modell auf starken Schultern wie z.B. der öffentlichen Google Bibliothek TensorFlow steht.

Call to Action: Sags weiter auf twitter!

Du findest die Newsletter gut? Dann erwähne das auf twitter! Wir freuen uns :-) oder Toot

Schreib uns an: info@achtungtechnik.de