Kunst · 02. Dezember 2022

Rechenmaschinenkunst. Teil 2: Digitalbilder, Kunst und KI-Effekte

Ein aus DALL-E generiertes Bild, das ein Fabrikgebäude mit Kunstwerken zeigt. — DALL-E-Prompt: A big factory, creating paintings and art works, view from outside, in the style of Salvador Dalí

Im ersten Teil dieser Artikelserie wurden anhand von Tweets zahlreiche Argumente für oder gegen Bildgeneratoren zitiert. Ein wichtiger Aspekt fehlte bei den meisten, der Aspekt des rein digitalen Charakters der Bildergebnisse. Bildgeneratoren erzeugen keine Digitalisate von physischen Artefakten wie Fotos von Gemälden oder Zeichnungen, aber sie werden so wahrgenommen. Selbst die Berichte zu dem Siegerbild des Kunstwettbewerbs in den USA verwenden gelegentlich den Begriff Gemälde, obwohl es sich um den Ausdruck eines digital geschaffenen Werkes handelte.

Diese Hervorhebung des digitalen Bildcharakters erscheint vielleicht etwas zu fein gestrickt und eine Unschärfe des Begriffs Gemälde stört im Jahr 2022 kaum noch, sind digitale Bilder heute doch ein selbstverständlicher Bestandteil unseres beruflichen und privaten Alltags, dass oft nur eine Legende, ein hinterlegter Alternativtext oder ein Hashtag darüber aufklärt, ob es sich bei einem gezeigten Werk um ein Digitalfoto oder eine Werk der Computerkunst handelt, um das Digitalisat einer Zeichnung oder einer Malerei, oder eben um das Ergebnis eines Text-zu-Bild-Generators.

Bildphänomene auf rein digitalem Wege wurden schon früh geschaffen, aber sie entfernten sich immer weiter von den eindeutig artifiziellen Computerbildern der Anfangszeiten. Das gilt nicht nur für Spiele, sondern auch für CGI-Techniken in der Fotografie, in Filmen und Serien. Was in der Wahrnehmung zunehmend verschwindet, ist der Übergang von der Realität zur artifiziellen Realität. Diese Entwicklung ist zunächst nicht zu bewerten, wohl aber im konkreten Einzelfall zu beachten, wenn beispielsweise heute noch ein Wahrheits- oder Evidenzcharakter der Fotografie beschworen wird, obwohl vielleicht nicht einmal klar ist, ob es sich bei einem Artefakt wirklich um ein fotografisches Bild handelt oder nur um ein wahrgenommenes fotografisches Phänomen unbekannter Quelle und Bildgenese.

Ein Paradigmenwechsel für digitale Bilder fand mit dem Siegeszug der Smartphones statt. In der Kombination mit Apps und Sozialen Netzwerken wurde weit mehr als durch Digitalkameras eine allgegenwärtige Verfügbarkeit der Bilder geschaffen. Diese Verfügbarkeit beinhaltete nicht nur einen unaufhörlichen Datenstrom an Fotografien in ihrer Verbreitung und Sichtbarkeit, sondern auch die kreative Aneignung, Verwertung und Paraphrasierung mittels Filter, Apps oder Mem-Generatoren. Mit der Smartphone-Fotografie verloren digitale Bilder den ausschließlichen Charakter singulärer Werke der bildenden Kunst oder Fotografie, sie wurden dafür zusätzlich zu einer Grundlage, ja zum Rohmaterial in einem neuen Datenstrom weiterer digitaler Bildphänomene.

Dass KI-generierte Bilder überhaupt mit dem Kunstbegriff in Verbindung gebracht werden und als Objekte mit Werkcharakter gefeiert oder abgelehnt werden, beruht also in erster Linie auf der Allgegenwart solcher mehrfach verarbeiteten digitalen Bildphänomene, die nicht mehr mit klaren Abgrenzungen von Original, Kopie, Pastiche oder Plagiat zu fassen sind und bei denen längst eine dem KI-Effekt ähnliche Rezeption greift, dass die wiederholte Destillierung Teil des normativen Zustands digitaler Bildphänomene geworden ist.

Bildrezeptionen finden heute in der Regel nicht mehr über physisch wahrnehmbare Artefakte in physischen Räumen statt, sondern weitgehend über ein digitales Display. Deshalb wird es auch nicht als merk- oder gar kritikwürdig empfunden, dass die von den KI-Tools geschaffenen Bilder in der Regel ca. 1.000 bis 1.600 Pixel im Quadrat haben. Für physische Drucke ungeeignet, sind sie für die Präsentation auf dem Smartphone oder bei Instagram völlig ausreichend, ja geradezu prädestiniert.

Können digitale Bilder aus Rechenmaschinen also genau so Kunst sein wie Digitalisate von Gemälden, Grafiken oder Erzeugnisse der Computerkunst? Oder stehen Prozesse digitaler Rechenoperationen im Vordergrund, die den Menschen zur reinen Marionette als Bediener einer Rechenmaschine degradiert, nur dass er dort keine Lochkarten hineinschiebt, sondern eine Prompt-Zeile formuliert? Ließe sich der notwendige Anteil des Faktors Mensch bestimmen, um von Kunst, ja überhaupt noch von Artefakten zu sprechen? Wäre es legitim, bewertungsrelevante Abstufungen des Kunstbegriffs abhängig von diesem Anteil festzulegen?

Auch wenn Beuys es anders meinte: ist mit den Tools nicht sogar ein Zustand erreicht, in dem jeder Mensch Künstler*in sein kann? Oder würde man eher der Aussage eines Tweets „Ai art is art but Ai artists are not artists” zustimmen? Wäre es also denkbar, dass Kunst zukünftig auch ohne den Menschen entstehen kann?

Natürlich erscheint die Diskussion müßig, ob, in welchem Maße oder unter welchen Voraussetzungen die Ergebnisse aus Bildgeneratoren Kunst sind oder nicht. Diese Diskussionen werden aber geführt. Sie wurden auch in der Vergangenheit immer geführt, sobald technische Neuerung die Bildgenese veränderten.

Der Kunstbegriff selbst wird seit der Moderne vor allem mit Kunstautonomie und Kunstfreiheit in Zusammenhang gebracht. Das logische Ende einer Entwicklung, die in den Theorien der Moderne zu Beginn des 19. Jahrhunderts begann. Wenn Kunst heute aber all das sein kann, was sich Kunst nennt, ist es schwierig geworden zu beurteilen, was Kunst nicht ist.

Dieser ebenso entfesselte wie entleerte Kunstbegriff kommt dem Selbstverständnis der Evangelisten aller Bildgeneratoren zugute. Es fällt auf, dass in der Debatte nicht differenziert wird, welche KI-Bilder Kunst sind oder sein könnten, und welche KI-Bilder eher anderen Bildtypen zuzuordnen wären. Die begeisterten Nutzer definieren sich fast ausnahmslos als „AI Artists“. Unabhängig von der Aneignung des Kunstbegriffs entspricht aber nur ein geringer Prozentsatz der KI-Bilder dem, was man in Galerien, Kunstsammlungen oder Museen allgemein als Kunst zu sehen bekommt. Die Portfolios von DALL-E-, Midjourney- und Stable Diffusion-Künstler beschränken sich zum größten Teil auf Teilbereiche der bildenden Kunst und zeigen Tendenzen des Surrealismus, des Realismus und populärer Bildkulturen als Illustration, Fotorealismus, Pop Art und Anime.

Den KI-Bildern wird der Kunstcharakter in erster Linie nicht über geistig-konzeptuelle Qualitäten zugesprochen, sondern anhand möglichst perfekter Umsetzung einer Mimesis als Imitate von ästhetischen Idealbildern: perfekte Illustrationen, überraschende Bildwelten, wirklichkeitsnahe Effekte, fotorealistische Umsetzungen. Diese Assoziation entspricht aber einer längst überwunden geglaubten, vormodernen Kunstauffassung. Was man den Vertretern der französischen Salonmalerei in ihrer Tradition eines idealisierten Klassizismus vorgeworfen hatte, lässt sich auch auf viele KI-Bilder übertragen: manieristische Perfektion als ein Kunsthandwerksspektakel, das konzeptuelle Defizite überdeckt.

Dass sich die meisten Kritiker*innen nicht an diesen Defiziten stören, liegt daran, dass auch sie sich vorwiegend mit Digital Art befassen und somit der surrealistischen Ästhetik oder Anime-Illustrationen grundsätzlich positiv gegenüberstehen. Viele von ihnen sind selbst als Künstler*innen tätig, nur mit klassischen Werkzeugen wie Bleistift oder digitalem Grafiktablett. Bildende Künstler jenseits dieser Sujets beginnen gerade erst, sich mit den neuen Tools zu befassen, sofern sie nicht angesichts der Ergebnisse abgeschreckt werden oder weil die Genese über einen Bildgenerator ihren Vorstellungen von menschlich-autonomer Kunst entgegensteht.

Geheimnisvolle Magie oder simple Rechenleistung?

Es erscheint mir wichtig, auf die Begriffe „KI-Tools“, „KI-Kunst“ und „KI-Bilder“ für mehrere Seiten zu verzichten oder sie nur noch in Anführungsstrichen zu verwenden. Ein guter Grund ist der sogenannte KI-Effekt, den die britische Autorin Pamela McCorduck prägte. Demnach wird das als Künstliche Intelligenz definiert, was noch nicht existiert bzw. noch den Charakter des absolut Neuartigen besitzt. Zusammengefasst wird das mit dem Satz „KI ist alles, was noch nicht getan wurde“.

Sobald sich KI-Phänomene durchgesetzt haben und als schlichte Fähigkeit von Computertechnik akzeptiert wird, gilt es nicht mehr als eine Form der Intelligenz, sondern nur noch als reine Rechenoperation. Das Unbekannte wird im Vorfeld überbewertet, um nach der Etablierung als Bekanntes unterbewertet zu werden. Je nach Auslegung und Bewertung impliziert das Kürzel KI somit jene Dichotomie aus Versprechen und Bedrohung, die sich auch in den Debatten um KI-Kunst zeigt.

Aktuell werden die Bildgeneratoren noch als „KI-Tools“ bezeichnet. Das Kürzel wird spätestens dann verschwinden, wenn diese Tools endgültig in Bildbearbeitungsprogrammen oder als Smartphone-Apps zur Verfügung stehen und durch neue KI-Phänomene ersetzt werden.

Auswirkungen hat der KI-Effekt vor allem auf das Marketing jener Unternehmen, die stark auf solche komplexen Rechenoperationen und Deep learning setzen. Das Tool „Luminar AI“ setzt beispielsweise klar auf das positiv konnotierte Versprechen, Fotos mit Hilfe von KI optimieren zu können. Adobe implementiert ebenfalls immer mehr Funktionen, die man bei Luminar eindeutig als AI bewerben würde. Adobe war mit der Verwendung des Kürzels bislang aber sehr vorsichtig, gehören doch auch ältere Generationen zur Nutzergruppe, die darauf Wert legen, dass Fotografie von Fotograf*innen gemacht werden und nicht von Apparaten oder Computern. Diese zurückhaltende Einstellung scheint sich langsam zu ändern, Adobe bewirbt seine neuen Versionen des Bildverwaltungstool Lightroom nun mit AI-Funktionen.

KI scheint somit den Schrecken als Bedrohung langsam zu verlieren, zumindest auf dem Gebiet der Fotografie. Während ich diese Zeilen schreibe, hat Sony eine neue, hochauflösende Profikamera mit einem „TOTALLY New Autofocus system with AI deep learning“ auf den Markt gebracht. Auch hier wird KI als Marketingaspekt in Verbindung mit völlig neuen und unerwarteten Entwicklungen definiert, die noch unbekannt sind.

Ein Beleg für die Evidenz des KI-Effekts sind die Kamerafähigkeiten von Smartphones, die hauptsächlich auf den Softwarelösungen beruhen und nicht auf den optischen Leistungen der verbauten Mini-Kameras und Objektiven in der Größe von Kissenbezugsknöpfen aus der Puppenstube. Sobald Sie das Auslösesymbol drücken, macht Ihr Smartphone in der Regel nicht ein, sondern drei Fotos hintereinander, berechnet daraus in Sekundenbruchteilen ein geschärftes HDR-Bild, erhöht Kontrast und Farbsättigung und präsentiert es dann auf Ihrem Display.

In einem Podcast spekulierte ich, dass Smartphones vermutlich bald eine Retuschierfunktion integrieren würden, mit denen man ungewünschte Bildteile ohne ein Zeichen dieses Eingriffs entfernen oder ersetzen könnte. Wenige Monate später führte Google mit dem neuesten Pixel-Smartphone genau diese Funktion ein. Sie möchten Teile auf Bildern am Rechner ganz simpel wegretuschieren? Das Tool magiceraser.io kann das, auf der Website werden Sie das Kürzel AI aber vergebens suchen. Auch Google vermeidet es und nennt die Retuschierfunktion ebenfalls „magischer Radierer“.

Ist das nur ein Zufall? Oder sind die Begriffe Magie und KI vielleicht sogar ähnlich in ihrer Funktion und Rezeption? Das Bildbearbeitungsprogramm Photoshop kennt schon lange den Zauberstab und den magischen Radierer. Tatsächlich lassen sich diese Werkzeuge mit magischen Phänomenen des Verschwindens und Erscheinens in Verbindung bringen. Je anspruchsvoller diese Tools funktionieren, umso unvorhersehbarer und überraschender erscheinen die Ergebnisse. In diesen nicht antizipierbaren Ergebnissen, die auch die Bildgeneratoren auszeichnen, liegt der magische Aspekt, weniger in den Fähigkeiten der Rechenleistung selbst. Das nicht Vorhersehbare erscheint als unbekannte, unheimliche und zugleich faszinierende Macht außerhalb der Kontrolle der Anwender*innen.

Mögen die Fotos moderner Kameras und Smartphones weitgehend softwareseitig optimierte Ergebnisse sein, so sorgt auch hier der KI-Effektes dafür, dass die Bilder immer noch mit dem Fotografiebegriff aus analogen Zeiten in Verbindung gebracht und auch so bewertet werden. Als Vilém Flusser den Fotografen vor rund 40 Jahren als Funktionär im Sinne eines nachindustriellen Homo Ludens beschrieb, gab es vollautomatische Kameras, aber keine softwareoptimierten Digitalkameras oder gar Smartphones. Aus Flussers Perspektive müsste man heutige Fotograf*innen als Hilfskräfte bezeichnen, voller Unwissenheit über die kamerainternen Vorgänge, deren einzige Handlung nur noch darin besteht, ihr Smartphone in Richtung des Motivs zu halten. Für perfekte Fotos sind schließlich nicht einmal mehr rudimentäre fotografische Kenntnisse zu ISO, Blende und Belichtungszeit notwendig, von Foto-AGs in Schulen oder VHS-Kursen über mehrere Wochen ganz zu schweigen. Diese Entwicklung kulturpessimistisch zu bedauern würde aber bedeuten, eine egalitäre, für alle zugängliche Technik zu beklagen, die auch als Mittel für die Sichtbarkeit politischer und emanzipatorischer Kämpfe weltweit unverzichtbar geworden ist.

Während man der Fotografie nach 40 Jahren vollautomatischer Kameras, 25 Jahren Digitalfotografie und einer Dekade Smartphones längst den Einsatz umfangreicher KI-Funktionen zubilligt, sind diese Funktionen im Bereich der bildenden Kunst jedoch völlig neu und für viele Kunstschaffenden beängstigend. Bezogen auf die Bildgeneratoren Midjourney, DALL-E, Stable Diffusion, Google Imagen und zukünftiger Systeme wird sich vermutlich ein „KI Kunst-Effekt“ einstellen. Es ist wahrscheinlich, dass die Bilder nach Akzeptanz der Modelle als weiteres digitales Bildphänomen wahrgenommen werden. Es ist aber ebenso wahrscheinlich, dass das nicht so schnell gehen wird. Unvorhersehbar bleibt nämlich, wie sich die verschiedenen Modelle weiterentwickeln und aus sich selbst heraus wieder neue, überraschende, faszinierende und vielleicht auch bedenkliche Anwendungsmöglichkeiten generieren.

Droht angesichts der technischen Überlegenheit von Bildgeneratoren der bildenden Kunst nach Jahrhunderten unbehelligter Tradition nun also doch das immer wieder prophezeite Ende? Oder ist das ein unbegründetes Katastrophenszenario, weil große technische Innovationen, ja einschneidende Pradigmenwechsel schon vorher die bildende Kunst beeinflusst, verändert und revolutioniert haben und die Geschichte von unbehelligter Tradition vielleicht auch nicht ganz stimmt? Diesen Fragen soll im dritten Teil nachgegangen werden.

Teil 1 der Artikelserie

Teil 2 der Artikelserie

Teil 3 der Artikelserie

Teil 4 der Artikelserie

Teil 5 der Artikelserie