KI-Anwendungen machen aus Wörtern Bilder

Stand: 20.06.2022, 17:13 Uhr

Ein KI-System erzeugt auf Knopfdruck skurrile Motive: Es reicht, ein paar Begriffe einzugeben - schon präsentiert die KI ein Bild. WDR-Digitalexperte Jörg Schieb erklärt, wieso die KI nur von wenigen Menschen genutzt werden darf - und wie das genau funktioniert.

Ein Koalabär, der einen "Dunking" hinlegt – also hochspringt und einen Basketball im Korb versenkt. Ein Waschbär im Weltraum, die umgebenden Sterne reflektieren effektvoll im gläsernen Kopfschutz. Und dann auch noch Römer aus der Zeit von Christus' Geburt, die Gladiatorenkämpfe mit ihrem Smartphone fotografieren... Man kommt aus dem Staunen gar nicht mehr heraus.

Die Profiversion der KI erzeugt Aufnahmen, die eine dramatisch bessere Bildqualität haben

Soziale Netzwerke werden mit KI-Bildern geflutet

Derzeit geistern auffallend viele absurd wirkende Aufnahmen und Bilder durch Soziale Netzwerke wie Twitter oder Instagram. Die Bilder haben keine Kunststudenten für ein Projekt erstellt - sondern eine Maschine. Eine Künstliche Intelligenz (KI), die auf Knopfdruck solche Bilder erzeugt. Der Benutzer lässt ein paar Begriffe fallen - etwa: "Jesus im Sportwagen" -, und die KI erschafft Bilder, die im weitesten Sinn den Begriffen entsprechen.

Viele Aufnahmen, die derzeit auf Twitter kursieren, sehen artifiziell und verrückt aus, aber auch irgendwie interessant. Wer mag, kann solche Aufnahmen selbst erstellen lassen. Denn es gibt seit kurzem eine KI-Version, die sich kostenlos im Browser von jedem aufrufen und nutzen lässt: Einfach zwei, drei Begriffe eingeben (in englischer Sprache) – und los geht’s.

Jeder kann kostenlos KI-Bilder erzeugen lassen

Je nach aktueller Auslastung erscheint nach wenigen Sekunden, spätestens nach einigen Minuten eine Bilder-Kachel mit mehreren Bildern, die zu den eingegebenen Begriffen passen. Ich habe "Giraffe plays football" eingegeben - und ja: Im weitesten Sinn ist die Aufgabe erfüllt. Allerdings sind die Aufnahmen meilenweit davon entfernt, perfekt zu sein – oder technisch derart brillant, dass man sich als Betrachter täuschen lassen könnte.

Test: Nach Eingabe von “Giraffe Football“ erzeugt die Miniversion der KI Bilder mit Giraffen, die irgendwie Fußball spielen

Doch das ist nur einem Sicherheitsmechanismus zu verdanken. Denn die im Netz frei zugängliche Mini-Version von "Dall-E" - das sich "Dali" spricht, wie der berühmte Maler -, ist eine Miniversion mit abgespecktem Funktionsumfang einer viel leistungsfähigeren KI, die durchaus bemerkenswerte Aufnahmen erzeugen kann: Dall-E2 ist das eigentliche von Wissenschaftlern entwickeltes KI-System, das man mit Begriffen füttert - und Bilder zu erzeugen vermag.

OpenAI entwickelt leistungsfähiges KI-System

Dall-E ist ein im Vergleich zur Miniversion im Web 27 mal leistungsfähigeres KI-Modell von Open AI, einer von Microsoft und Elon Musk finanzierten Forschungseinrichtung, die die Möglichkeiten Künstlicher Intelligenz auslotet.

Diese technisch viel ausgereiftere und interessantere Software dürfen bislang allerdings nur wenige ausgewählte Forscher und Künstler ausprobieren und benutzen. Es geht darum zu ergründen, was KI "versteht" – und welche Bilder KI erzeugen kann. Mit dem großen Dall-E2 mit vollem Funktionsumfang lassen sich beeindruckende Fake-Aufnahmen herstellen, etwa Avocados, die sich sonnen, Tiere in Raumanzügen, selbst künstlerische Stilrichtungen lassen sich damit imitieren.

Dall-E2 erzeugt hochwertige Aufnahmen

Was Dall-E2 erzeugt, sieht nicht nach KI-Müll aus – sondern nach kunstvoll und auch technisch durchaus respektablen Aufnahmen. Die KI ist sogar in der Lage, auf Anweisung ein Hund in einem Bild durch eine Katze zu ersetzen oder überhaupt Fotos zu manipulieren – schnell, effektiv und mit beeindruckender Qualität.

Das ist auch der Grund, wieso Dall-E2 nur ausgewählten Nutzern zur Verfügung steht: Mit einem solchen System lassen sich zweifellos Aufnahmen anfertigen - der Phantasie sind keine Grenzen gesetzt -, die so echt wirken, dass sie Verwirrung stiften könnten. Schlimmstenfalls auch Verwerfungen.

Schon jetzt experimentieren User mit Motiven, die verstörend sein können (etwa einen ans Kreuz genagelten Ronald McDonald). Aber genau das ist die Aufgabe von OpenAI: Herauszufinden, was technisch heute möglich ist – und wo wir Schranken und Regeln brauchen, was mit KI eigentlich gemacht werden darf.

Auch Google hat eine vergleichbare KI am Start namens Imagen: Der schwimmende Teddybär wurde von KI erzeugt

Auch Google entwickelt an einem Text-zu-Bild-System namens "Imagen": Auch dieses KI-System erzeugt nach Eingabe von Begriffen eigenständige Bilder. Nach Ansicht von Googles Ingenieuren sogar weiterentwickelt und besser.

Über den Autor

Jörg Schieb, WDR-Digitalexperte.

WDR-Digitalexperte Jörg Schieb

Jörg Schieb, Jahrgang 1964, ist WDR-Digitalexperte und Autor von 130 Fachbüchern und Ratgebern. Er beschäftigt sich seit vielen Jahren mit der Digitalisierung und deren Auswirkungen auf unseren Alltag.