#bildgenerator

Durch die aktuellen Image-Generatoren fühle ich mich wie in den Film "Karate Kid" versetzt. Sie vermitteln eine essentielle Lektion: Geduld ("Auftragen und Polieren").

Die Geduld ist in mehrere Richtungen notwendig:

1.
Immer wieder wird die Generation mit Fehlermeldungen abgebrochen:
Gemini: "Tut mir leid, ich kann keine Bilder für unsichere Anfragen generieren." Oder auch: "Ich lerne noch, bestimmte Arten von Bildern zu erstellen, deshalb kann ich möglicherweise noch nicht genau das bereitstellen, wonach du suchst. Manche Anfragen verstoßen eventuell auch gegen meine Richtlinien." Öffnet man einen neuen Chat und startet die gleiche Anfrage, ist die Chance hoch, dass die dann durchläuft und nicht abgebrochen wird.
ChatGPT: "Deine Anfrage verstößt gegen unsere Inhaltsrichtlinien, daher kann ich das Bild in der gewünschten Form leider nicht erstellen." Im Gegensatz zu Gemini ist man hier sehr viel restriktiver, eine Chance auf Umsetzung gibt es auch mit Neustarts nicht.

Immerhin kann man beide fragen, was denn so verwerflich war. Die Antwort von ChatGPT ist dabei erstaunlich präzise: "Damit ein Prompt unseren Inhaltsrichtlinien entspricht, muss sichergestellt sein, dass die dargestellte Figur **nicht wie ein Kind in aufreizender oder unangemessener Weise** erscheint – selbst wenn es sich um Fantasiefiguren wie Feen oder Chibi-Charaktere handelt. Kombiniert man z. B. kindlich wirkende Figuren mit Badekleidung, wird das schnell problematisch, auch wenn es künstlerisch gemeint ist." --> Anlage 1: ChatGPT sollte das Bild, generiert von Gemini, auf ein goldene Rose setzen. Nicht mehr und nicht weniger: "Die Figur aus dem Bild soll auf einer goldenen Rose stehen. Ein Hintergrund ist nicht notwendig."

2.
Wer auch immer von KI bei den Generatoren spricht, die Generatoren sind NICHT intelligent, nicht einmal ansatzweise. Denn sie VERSTEHEN nicht, was man wirklich will.
Klassisches Beispiel: der Hintergrund soll weiß sein. Oft ist er es, aber oft wird irgend ein Muster hineingelegt oder ein Farbverlauf oder oder oder. Für einen menschlichen Künstler ist völlig klar: "Mein Auftraggeber will keinen Hintergrund, Yay, spart Arbeit."
Oder die Augenfarbe. Es passt sehr oft, aber insbesondere bei Grau glaubt er, dass GRÜN das neue Grau ist.
Oder: ich möchte, dass die Figur frontal vor mir steht und direkt zum Betrachter schaut. Einem Menschen ist klar, der Körper kann leicht seitlich sein, der Kopf muss aber direkt zum Betrachter gedreht sein. Die Generatoren haben massive Schwierigkeiten damit.

3.
Sehr oft haben die Generatoren mit den (für uns Menschen) simpelsten Dingen Probleme. Meine Figur sollte auf einem Pilz sitzen. Aber Gemini generierte ununterbrochen nur Sitzkissen. Das es geht, seh ich an anderen mit dem Google-Generator erzeugten Bildern. Dann entstanden so lustige Dialoge wie: "Du hast ein Sitzkissen generiert, ich möchte aber einen Pilz" Antwort: "In Ordnung, ich habe einen Pilz generiert", es war aber eine Gewehrpatrone, ein Teppich, ein Sitzkissen, gar nichts, ein Block, eine Kugel...
Auch hier sieht man: die Generatoren können nicht denken, nicht mitdenken, nicht interpretieren etc.

4.
Vermeintlich simple Kleidung, z.B. ein übergroßes Schlabber-T-Shirt, dass immer mal über die Schulter rutscht, keine Chance, gibt's nicht und wenn doch, ist es ein Zufallstreffer. Oder Alltagssituation: Ein Bahnsteig mit einfahrendem Zug: Gleise? ja, 2 oder drei Schienen, oder statt auf dem Bahnsteig stehen die Menschen auf den Gleisen. Oder der Zug fährt auf dem Bahnsteig.

5.
Die Generatoren merken sich zwar grundsätzlich, was man ein zwei Sätze vorher gesagt hat, aber sie merken sich nicht, was sie selbst generiert haben. Das neue Bild wird also komplett neu generiert. Natürlich können dann alle Fehler erneut auftreten. ChatGPT ist hier eine Ausnahme, das behält tatsächlich generierte Ergebnisse bei und man kann durch Prompt-Ergänzungen Punktuelle Korrekturen vornehmen, es sei denn, es kommt nach der dritten oder vierten Korrektur "Deine Anfrage verstößt gegen unsere Inhaltsrichtlinien, daher kann ich das Bild in der gewünschten Form leider nicht erstellen." Dann ist Schluss.

Fazit: Die Generierung ist ein Kraftakt. Unzählige Versuche, Try and Error. Und zwischendurch immer mal wieder solche Meldungen: "Du hast am Prompt keine Änderungen vorgenommen, hier ist das Bild noch mal"
Mittlerweile habe ich es mir so angewöhnt: ich versuche noch zwei, maximal drei Prompts lang eine Korrektur und wenn es dann immer noch nichts ist, starte ich einen neuen Chat. Bei Bildern scheint es beim Bezahltarif keine Begrenzungen zu geben.
Aber: Warum erstellen die Generatoren nicht erst ein grobe Skize, oder einen niedrig aufgelösten Entwurf? und wenn der OK ist rendern sie die Finale Version?
Antwort: Weil es keine KI ist. So würde ein Mensch vorgehen. Und erst wenn die KI auch so vorgehen kann, sind wir der intelligenten Maschine ein großes Stück näher gekommen. Ob wir das am Ende nicht bereuen werden, steht aber auf einem anderen Papier (welches hoffentlich keine KI generiert hat)

Aber was mich richtig ankotzt: Die moralische Gängelei. Dadurch, dass die Generatoren nicht wissen (!!) was sie machen, lehnen sie viele Anfragen schon beim Hauch einer Andeutung einer Vermutung einer Ahnung ab, dass Bild könnte für prüde Amerikaner schwer verdaulich sein, eine Generation ab.

Aktuell kostet es richtig Zeit, Ideen umzusetzen. Klar, kann man jetzt sagen, engagiere einen Künstler, der macht das dann viel schneller für dich. Jaaaahaaaaaa, aber *ich* muss mich selbst nicht bezahlen, mit mir kann ich Selbstausbeutung betreiben, mit einem externen Künstler geht das, zurecht nicht.

Aber weil es richtig aufwendig ist, muss der Gesetzgeber einschreiten und generierte Bilder mit einem Urheberrechtschutz versehen. Bei Künstlern ist es doch auch egal, welches Werkzeug sie für ihre Werke verwenden: Kreide, Tusche, Computer. Und Computer haben mittlerweile Funktionen, für die früher ein Künstler unzählige Stunden und Versuche benötigte. Und nur, weil das Ergebnis beim Generieren nicht vorhersehbar ist, sollen die Ergebnisse keinen Schutz bekommen? Hallo? Die Bilder unten haben STUNDEN benötigt, eher ich zufrieden war. Was also unterscheidet einen Photoshop-Künstler von einem KI-Künstler? NICHTS, GAR NICHTS!

#gemini #chatgpt #ki #bildgenerator #prompt #urheberrecht #copyright #Kreative #google #openai

Anlage 1: ChatGPT weigert sich, die Figur auf einen Rose zu stellen.Die Figur sollte auf einer Rose sitzen, der Hintergrund sollte Weiß sein und sie sollte eher ernst schauen.
Aber niedlich ist das Bild trotzdem :-)Was auch nur selten funktioniert: Größenverhältnisse
Die Rothaarige sollte etwas größer als der Junge sein und die Blauhaarige sollte etwas kleiner sein.
Oft landet man dann so, dass die kleineren einfach Kindsgröße haben.
Und auch die Vorgaben bei der Kleidung klappen nur selten einheitlich. Der blaue Bikini soll einfach sein. Schreibt man aber dass man einen einfachen blauen Bikini möchte, bekommt das Mädel einen blauen Badeanzug. Bis ich darauf kam, dass das Einfach Schuld war, sind dutzende Generationen vergangen...Es ist ein Krampf, zu erreichen, dass das Mädel einem in die Augen schaut! Keine Ahnung, warum diese seitliche Perspektive für die Generatoren soviel naheliegender sind. Denn dass es geht, kam auch oft genug vor.
2025-04-05

Frosty Pen and Paper: KI und ChatGPT fürs Rollenspiel

Künstliche Intelligenz im Rollenspiel – Fluch, Segen oder einfach nützliches Werkzeug? Vor zwei Jahren habe ich mir bereits Gedanken gemacht,

Der Beitrag KI und ChatGPT fürs Rollenspiel erschien zuerst auf Frosty Pen and Paper.

#Pnpde #Bildgenerator #Blog #ChatGPT #KI

apfeltalk :verified:apfeltalk@creators.social
2025-04-04

Neuer Bildgenerator für ChatGPT jetzt auch für Free-Abonnenten verfügbar
OpenAI ermöglicht nun allen Nutzer:innen den Zugriff auf einen neuen Bildgenerator. Auch Nutzer:innen des ChatGPT Free-Tarifs können die Funktio
apfeltalk.de/magazin/news/neue
#News #Tellerrand #Bildgenerator #chatGPT #DALLE #FreeAbonnement #GPT4o #Infografiken #KreativeProjekte #KnstlicheIntelligenz #OpenAI #TechnischeZeichnungen

KINEWS24KiNews
2025-03-25

Reve AI: Neuen Gratis KI-Bildgenerator entdecken!

Bilder in Sekunden erstellt
Ein Tool, unendliche Styles
Ideal für Content-Creator

Jetzt lesen und folgen!

kinews24.de/reve-ai/

2024-12-09

Viele Einhörner und eine Frau mit falschen Haaren

Stable Diffusion ist ein freies KI-Modell zur Bildgenerierung. Hier gibt es nützliche Anleitungen zur Nutzung des Bildgenerators.

#KI #stable_diffusion #Python #Bildgenerator #Linux

gnulinux.ch/viele-einhoerner-m

2024-12-09

Viele Einhörner und eine Frau mit falschen Haaren

Stable Diffusion ist ein freies KI-Modell zur Bildgenerierung. Hier gibt es nützliche Anleitungen zur Nutzung des Bildgenerators.

#KI #stable_diffusion #Python #Bildgenerator #Linux

gnulinux.ch/viele-einhoerner-m

Jörg Kantelkantel
2024-11-15
Jörg Kantelkantel
2024-11-15
Jörg Kantelkantel
2024-11-07
💚 ((**Tiefenkultur**)) 💚kassiopeia_v7
2024-11-04

-:

Falsche Bilder für den echten US-Wahlkampf

Wie ein KI- aus dem die in den beeinflusst – auch nach der .

Eine Analyse von

golem.de/news/ki-fakes-falsche

Jörg Kantelkantel
2024-11-01
KINEWS24KiNews
2024-10-30

Red Panda AI: Ein neuer Star unter den KI-Bildgeneratoren! 🐼✨

- Beeindruckend realistische Bilder

- Rätselhafte Entwickler-Infos

- Konkurrenz für bekannte KI-Tools

Was steckt wirklich hinter Red Panda AI?

, , , ,

kinews24.de/red-panda-ai-der-n

Jörg Kantelkantel
2024-10-23
Jörg Kantelkantel
2024-10-03
Jörg Kantelkantel
2024-09-25
DGI e.V., Frankfurt am MainDGIInfo@openbiblio.social
2024-09-15

Wir sind seit langem nicht nur #Follower der neuen #KI-Entwicklungen, sondern bieten selbst zahlreiche #Seminare und #Vorträge zu #ChatGPT & Co. an und schauen uns auch bei KollegInnen und deren Arbeit um.

„KI für alle. #OpenSourceModelle demokratisieren #KünstlicheIntelligenz", so der Titel des heutigen #DLF-#Feature von #MoritzMetz und #FriederikeWalchNasseri.

t1p.de/tfdo8

#dgiinfo #AI #artificialintelligence #LLM #LargeLanguageModels #Bildgenerator #Chatbot #Transkriptionstool

RHET AI Centerrhetai@mstdn.social
2024-08-26

🕵️‍♀️ In unserer #DeusExMachina #KITool Testreihe haben wir einen Neuzugang: unsere Studentische Redaktion hat den
#Bildgenerator #Ideogram AI näher unter die Lupe genommen

Wie Ideogram auf #Prompts reagiert und was das mit #Wisskomm zu tun hat, erfahrt ihr hier:
👉 rhet.ai/2024/08/26/ki-tools-im

Alle weiteren Tool-Tests im Überblick und weitere Infos zur Reihe gibt es hier: rhet.ai/2023/09/05/deus-ex-mac

2024-08-04

StockDreams.ai

StockDreams.ai ist ein kostenpflichtiges Online-Tool zur Bildgenerierung. Der Preis von USD 135,- netto ist nur einmal zu bezahlen, dann kann man das Tool ein Leben lang verwenden. Der Einstiegspreis ist meistens reduziert, derzeit (Stand 4. August 2024) auf USD 37,- netto.

Außer Fotos kann das Tool auch Doodles, 3D-Charaktere und Illustrationen erstellen sowie Hintergründe von Fotos entfernen. Das Tool ist übrigens auch agenturfähig.

Auf der Startseite wird zwar erwähnt, dass man [...]

waskanndas.at/stockdreams-ai/

Jörg Kantelkantel
2024-07-12
Ulrich Berensinfoleck@uli.pub
2024-06-27
Ich habe eine KI mal angewiesen, ein Handyselfie in eine klassische Ikone umzuwandeln.
Herausgekommen ist ein Bild, das mich kurz nach der Amtseinführung als Patriarch von Konstantinopel zeigt.

#ki #ai #bildgenerator #fun

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst