Durch die aktuellen Image-Generatoren fühle ich mich wie in den Film "Karate Kid" versetzt. Sie vermitteln eine essentielle Lektion: Geduld ("Auftragen und Polieren").
Die Geduld ist in mehrere Richtungen notwendig:
1.
Immer wieder wird die Generation mit Fehlermeldungen abgebrochen:
Gemini: "Tut mir leid, ich kann keine Bilder für unsichere Anfragen generieren." Oder auch: "Ich lerne noch, bestimmte Arten von Bildern zu erstellen, deshalb kann ich möglicherweise noch nicht genau das bereitstellen, wonach du suchst. Manche Anfragen verstoßen eventuell auch gegen meine Richtlinien." Öffnet man einen neuen Chat und startet die gleiche Anfrage, ist die Chance hoch, dass die dann durchläuft und nicht abgebrochen wird.
ChatGPT: "Deine Anfrage verstößt gegen unsere Inhaltsrichtlinien, daher kann ich das Bild in der gewünschten Form leider nicht erstellen." Im Gegensatz zu Gemini ist man hier sehr viel restriktiver, eine Chance auf Umsetzung gibt es auch mit Neustarts nicht.
Immerhin kann man beide fragen, was denn so verwerflich war. Die Antwort von ChatGPT ist dabei erstaunlich präzise: "Damit ein Prompt unseren Inhaltsrichtlinien entspricht, muss sichergestellt sein, dass die dargestellte Figur **nicht wie ein Kind in aufreizender oder unangemessener Weise** erscheint – selbst wenn es sich um Fantasiefiguren wie Feen oder Chibi-Charaktere handelt. Kombiniert man z. B. kindlich wirkende Figuren mit Badekleidung, wird das schnell problematisch, auch wenn es künstlerisch gemeint ist." --> Anlage 1: ChatGPT sollte das Bild, generiert von Gemini, auf ein goldene Rose setzen. Nicht mehr und nicht weniger: "Die Figur aus dem Bild soll auf einer goldenen Rose stehen. Ein Hintergrund ist nicht notwendig."
2.
Wer auch immer von KI bei den Generatoren spricht, die Generatoren sind NICHT intelligent, nicht einmal ansatzweise. Denn sie VERSTEHEN nicht, was man wirklich will.
Klassisches Beispiel: der Hintergrund soll weiß sein. Oft ist er es, aber oft wird irgend ein Muster hineingelegt oder ein Farbverlauf oder oder oder. Für einen menschlichen Künstler ist völlig klar: "Mein Auftraggeber will keinen Hintergrund, Yay, spart Arbeit."
Oder die Augenfarbe. Es passt sehr oft, aber insbesondere bei Grau glaubt er, dass GRÜN das neue Grau ist.
Oder: ich möchte, dass die Figur frontal vor mir steht und den Betrachter direkt zum Betrachter schaut. Einem Menschen ist klar, der Körper kann leicht seitlich sein, der Kopf muss aber direkt zum Betrachter gedreht sein. Die Generatoren haben massive Schwierigkeiten damit.
3.
Sehr oft haben die Generatoren mit den (für uns Menschen) simpelsten Dingen Probleme. Meine Figur sollte auf einem Pilz sitzen. Aber Gemini generierte ununterbrochen nur Sitzkissen. Das es geht, seh ich an anderen mit dem Google-Generator erzeugten Bildern. Dann entstanden so lustige Dialoge wie: "Du hast ein Sitzkissen generiert, ich möchte aber einen Pilz" Antwort: "In Ordnung, ich habe einen Pilz generiert", es war aber eine Gewehrpatrone, ein Teppich, ein Sitzkissen, gar nichts, ein Block, eine Kugel...
Auch hier sieht man: die Generatoren können nicht denken, nicht mitdenken, nicht interpretieren etc.
4.
Vermeintlich simple Kleidung, z.B. ein übergroßes Schlabber-T-Shirt, dass immer mal über die Schulter rutscht, keine Chance, gibt's nicht und wenn doch, ist es ein Zufallstreffer. Oder Alltagssituation: Ein Bahnsteig mit einfahrendem Zug: Gleise? ja, 2 oder drei Schienen, oder statt auf dem Bahnsteig stehen die Menschen auf den Gleisen. Oder der Zug fährt auf dem Bahnsteig.
5.
Die Generatoren merken sich zwar grundsätzlich, was man ein zwei Sätze vorher gesagt hat, aber sie merken sich nicht, was sie selbst generiert haben. Das neue Bild wird also komplett neu generiert. Natürlich können dann alle Fehler erneut auftreten. ChatGPT ist hier eine Ausnahme, das behält tatsächlich generierte Ergebnisse bei und man kann durch Prompt-Ergänzungen Punktuelle Korrekturen vornehmen, es sei denn, es kommt nach der dritten oder vierten Korrektur "Deine Anfrage verstößt gegen unsere Inhaltsrichtlinien, daher kann ich das Bild in der gewünschten Form leider nicht erstellen." Dann ist Schluss.
Fazit: Die Generierung ist ein Kraftakt. Unzählige Versuche, Try and Error. Und zwischendurch immer mal wieder solche Meldungen: "Du hast am Prompt keine Änderungen vorgenommen, hier ist das Bild noch mal"
Mittlerweile habe ich es mir so angewöhnt: ich versuche noch zwei, maximal drei Prompts lang eine Korrektur und wenn es dann immer noch nichts ist, starte ich einen neuen Chat. Bei Bildern scheint es beim Bezahltarif keine Begrenzungen zu geben.
Aber: Warum erstellen die Generatoren nicht erst ein grobe Skize, oder einen niedrig aufgelösten Entwurf? und wenn der OK ist rendern sie die Finale Version?
Antwort: Weil es keine KI ist. So würde ein Mensch vorgehen. Und erst wenn die KI auch so vorgehen kann, sind wir der intelligenten Maschine ein großes Stück näher gekommen. Ob wir das am Ende nicht bereuen werden, steht aber auf einem anderen Papier (welches hoffentlich keine KI generiert hat)
Aber was mich richtig ankotzt: Die moralische Gängelei. Dadurch, dass die Generatoren nicht wissen (!!) was sie machen, lehnen sie viele Anfragen schon beim Hauch einer Andeutung einer Vermutung einer Ahnung ab, dass Bild könnte für prüde Amerikaner schwer verdaulich sein, eine Generation ab.
Aktuell kostet es richtig Zeit, Ideen umzusetzen. Klar, kann man jetzt sagen, engagiere einen Künstler, der macht das dann viel schneller für dich. Jaaaahaaaaaa, aber *ich* muss mich selbst nicht bezahlen, mit mir kann ich Selbstausbeutung betreiben, mit einem externen Künstler geht das, zurecht nicht.
Aber weil es richtig aufwendig ist, muss der Gesetzgeber einschreiten und generierte Bilder mit einem Urheberrechtschutz versehen. Bei Künstlern ist es doch auch egal, welches Werkzeug sie für ihre Werke verwenden: Kreide, Tusche, Computer. Und Computer haben mittlerweile Funktionen, für die früher ein Künstler unzählige Stunden und Versuche benötigte. Und nur, weil das Ergebnis beim Generieren nicht vorhersehbar ist, sollen die Ergebnisse keinen Schutz bekommen? Hallo? Die Bilder unten haben STUNDEN benötigt, eher ich zufrieden war. Was also unterscheidet einen Photoshop-Künstler von einem KI-Künstler? NICHTS, GAR NICHTS!
#gemini #chatgpt #ki #bildgenerator #prompt #urheberrecht #copyright #Kreative #google #openai