Diskussion KI - aus der Sicht einer Oma

Großers Kino. Ich hatte den obigen Beitrag gestern schon geschrieben, aber vergessen abzuschicken. :rolleyes:

Aber mit diesem Prompt bringt Bing tatsächlich wesentlich bessere Ergebnisse. Ich habe noch ein weiteres Bild bekommen, das fast identisch ist mit dem von Dir, Duftie.
 
Ich habe es mal mit SD.Next und Juggernaut probiert und Juggernaut weigert sich beharrlich das Dreirad darzustellen, auch wenn ich den Prompt variiere.
Mit Stable Diffusion 3.5 funktioniert es zwar besser, aber das Dreirad ist fast immer eher ein normales Kinderfahrrad mit teilweise seltsamen Proportionen.
 
Zuletzt bearbeitet:
Ich empfehle interessierten Usern mal SD.Next auszuprobieren.
Seit dem letzten Update unterstützt es auch Flux (installiere ich gerade) und es wird vor allen Dingen aktiv gepflegt.

Wenn man sich bei Hugging Face registriert, sich einen DL-Token generieren lässt und den in SD.Next hinterlegt wird das benötigte KI-Modell automatisch herunter geladen sobald man es im Hauptmenü
Test -> Model
anwählt.

Was natürlich bei einer VDSL50-Leitung (wie ich sie habe) etwas dauern kann, manche Modelle müssen noch weitere Dateien nachladen und da können das (wie im Falle von Black Forest Labs FLUX.1 Dev qint8) >20 GB für nur ein einziges Model werden.

Ich habe derzeit incl. Flux 7 Models installiert und benötige alleine für diese >100 GB Speicherplatz.
Was bei den heutigen Mediengrößen aber auch kein Problem darstellen sollte.

Tatsächlich besitzt SD.Next nach Fooocus imho die beste Benutzeroberfläche, bietet aber viel mehr Optionen (was die UI natürlich umfangreicher und komplexer macht).
 
Zuletzt bearbeitet:
Wir haben es fast geschafft, die Liste mit den Arbeitsdiensten für den Weihnachtsmarkt wird demnächst komplett sein. Ich will das - sobald es soweit ist - auf den Online-Kanälen unseres Fußballclubs melden. Dazu wollte ich mir vom MS Image Creator ein Bild eines jubelnden Weihnachtsmannes generieren lassen. Vorbild ist ein Fußballspieler, der nach dem Tor rauf den Knien Richtung Eckfahne rutscht.

Das erste Bild ist auf Basis meines Prompts erstellt worden. Dass der Weihnachtsmann sitzt und nicht auf den Knien rutscht kann ich akzeptieren. Auch, dass der arme Kerl zwei unterschiedlich lange Beine hat. Aber das dritte Bein stört doch ein bisschen.

Danach habe ich dem MS Copiloten erklärt, welches Bild ich haben will und mir von ihm einen Prompt schreiben lassen. Das sieht schon wesentlich besser aus. Die Position der "Eck"fahne und die merkwürdige Linie irriert zwar ein wenig, aber darüber kann ich hinwegsehen.

Der dritte Versuch ist auch nicht so toll, weil die Position der Fahne falsch und die Linien sehr kreativ sind ...

Ich werde wohl Nummer vier nehmen. Der Weihnachtsmann sitzt zwar wieder auf dem Hintern und die Linie des 16ers (?) ist auch sehr nah, aber irgendwas ist ja immer ...
 

Anhänge

  • _0b3cc741-b3bc-4363-813e-c61ef5230305.jpg
    _0b3cc741-b3bc-4363-813e-c61ef5230305.jpg
    181,3 KB · Aufrufe: 113
  • _9c02cb07-1e72-4007-a06b-f4aee9831f18.jpg
    _9c02cb07-1e72-4007-a06b-f4aee9831f18.jpg
    212,4 KB · Aufrufe: 118
  • _37f51218-35bc-42c5-9fe8-6e1ea53f3e83.jpg
    _37f51218-35bc-42c5-9fe8-6e1ea53f3e83.jpg
    243,7 KB · Aufrufe: 117
  • _101991dd-cc11-4d35-963e-5d4581155e18.jpg
    _101991dd-cc11-4d35-963e-5d4581155e18.jpg
    224,5 KB · Aufrufe: 127
bei 4 mußt Du aber auch radieren, da sind die Tore b.z.w. das hintere Tor nicht da, wo es auf dem grünen Geläuf der Millionäre zu finden sein sollte, wohl aber mit den krummen Haxen da des öfteren vergeblich gesucht wird. Kurz und gut, die Perspektive ist falsch und das um 90°. Es gehört hinter den Clown und nicht davor. Und währe in dieser Perspektive sowiso out of sight.
 
Auf LinkedIn wird gerade immer wieder darauf hingewiesen, wie einfach mit den einschlägig bekannten Programmen zum Beispiel "gefälschte" Bewirtungsbelege erstellt werden können. Knitterfalten und Kaffeeflecken inklusive. Das ist für mich irrelevant. Die Tatsache, dass man ChatGPT dafür verwenden kann, weil der inzwischen Texte bzw. Worte besser verarbeitet, war allerdings sehr interessant.

Und tatsächlich, mein erster Versuch war von Erfolg gekrönt. ChatGPT hat "Super Samstag" und "VfB" korrekt wiedergegeben. Der Bing Image Creator konnte mit "VfB" in der Regel gar nichts anfangen und aus "Super Samstag" wurde meist "SPER SAMMSTAG" oder so ähnlich.

Um mit ChatGPT Bilder zu generieren, muss man sich aber registrieren.

Die kostenlosen Bilder sind allerdings begrenzt. Ich habe sechs oder sieben Bilder generieren können, dann werde ich aufgefordert bis morgen (24h) zu warten oder eine Bezahlversion zu nutzen.

Während ChatGPT mit "VfB" klarkommt, scheint er einen Prompt mit den Buchstaben "V" "f" und "B" nicht hinzubekommen (siehe Anhang 3).
 

Anhänge

  • ChatGPT Image 8. Apr. 2025, 11_23_19.png
    ChatGPT Image 8. Apr. 2025, 11_23_19.png
    2,5 MB · Aufrufe: 94
  • ChatGPT Image 8. Apr. 2025, 12_15_02.png
    ChatGPT Image 8. Apr. 2025, 12_15_02.png
    2,1 MB · Aufrufe: 98
  • ChatGPT Image 8. Apr. 2025, 12_25_13.png
    ChatGPT Image 8. Apr. 2025, 12_25_13.png
    3,2 MB · Aufrufe: 90
Zuletzt bearbeitet:
Als Vergleich noch die Version des Bing Image Creators mit demselben Prompt wie beim ersten Bild oben. Da ist ChatGPT deutlich besser.
 

Anhänge

  • _ebfcd619-98e9-49b1-931a-c3b5e832e249.jpg
    _ebfcd619-98e9-49b1-931a-c3b5e832e249.jpg
    350,2 KB · Aufrufe: 97
Ich habe mal wieder ein bisschen mit SD.next herum gespielt.
Im Netz fand ich dieses Bild:

1749939623276556.jpg


War leider nicht in einer besseren Qualität oder höherer Auflösung zu finden.
Aber grundsätzlich gefiel mir das Motiv und ich hätte es gerne als Wallpaper gehabt.
Also das Bild in SD.next geladen und "Image2Image" gewählt, mit dem Prompt musste ich (wie immer) etwas experimentieren.

Nach ca. 10 Versuchen ist dann das dabei heraus gekommen:
Elven Maid.png


Ich habe das noch ein wenig in Affinity Photo nachbearbeitet (hauptsächlich Kontrast und einen Vignette-Filter an den äußeren Bildrändern).
Bin eigentlich ganz zufrieden mit dem Resultat.
 
Kennen diese Cat Programme denn keine lebensnotwendige Details an Menschen, z.B. ordentliche Möpse? :p
Ich finde es echt erschreckend, was so im Netz an Bilder, Nachrichten und Filmchen rumgeistert. Selbst mit dem aller gesündesten Menschenverstand ist kaum noch möglich, Wahrheit, Lüge, Verarschung oder Witz auseinanderzuhalten. Auch in der eigenen Wohnung kann man seinen Augen nicht mehr trauen, z.B. Badezimmerspiegel sind schon hinterhältig infiziert! Neee, also was da beim Rasieren heute Morgen für ein Scheiß rausgeguckt hat - grausam, grausam, 💫 zum Rausrennen!!!!!!
 
Lolly, in deinem Alter schaut man doch nicht mehr in den Spiegel! :eek::ROFLMAO:
Und Männer sind ohnehin von Natur aus schön. 😁
 
Oben