- Master AI
- Posts
- 012 - Die KI Bilder-Revolution
012 - Die KI Bilder-Revolution
Wir sind meiner Meinung nach mit Thema Bildgenerierung mit AI mittlerweile auf einem Niveau angekommen, das in vielen Szenarien aufwändige Fotoshootings ersetzen kann
Nach dieser Ausgabe hast du einen Überblick zum Thema AI Bild-Generierung
Dein AI Business-Newsletter (alle Bilder dieser Ausgabe sind mit AI erstellt)
Hallo AI-Fan,
als die erste Version des AI-Bild-Generators Midjourney im März 2022 über die Chat-Anwendung Discord zum ersten mal für Nutzer verfügbar war, war dies keine große Meldung für die Masse.
Die Ergebnisse waren - naja - ok.
Was sind Bild-Generatoren? Wir geben einen Prompt ein, der das Bild (Grafik, Foto, Comic, …) beschreibt und erhalten als Ergebnis ein Bild, welches im besten aller Fälle unser im Prompt beschriebenes Motiv optimal trifft.
Kurz: Text to Image.
Im Dezember 2023 wurde Version 6 des Bild-Generierungs-Anbieters veröffentlich. Da standen schon sehr viele Münder offen – staunend was in so kurzer Zeit an Fortschritt erreicht worden war.
Die Experten waren sich überwiegend einig - bis relevante Ergebnisse im Video-Bereich (Text to Video) akzeptable Ergebnisse erreichen werden, würden noch 12 bis 24 Monate ins Land ziehen.
Letzte Woche hat OpenAI mit seinem neuen Text to Video-Tool “Sora” uns eines besseren belehrt. Unglaublich, wie schnell die Entwicklung voranschreitet. Schneller, als selbst die Bullen im AI-Segment es prophezeit haben.
In der heutigen Ausgabe nehmen wir uns dem Thema Bild-Generierung an.
Warum?
Wir sind meiner Meinung nach mittlerweile auf einem Niveau angekommen, das in vielen Szenarien aufwändige Fotoshootings ersetzen kann und auch kleineren Brands mit wenig Budget neue Möglichkeiten eröffnet, wenn es um Brand-Fotografie für Kommunikation und Marketing geht.
Los geht’s! 🚀
PS: Alle Links und Tool-Tipps aus dieser Ausgabe findet ihr am Ende des Newsletters.
Die Entwicklung der Foto-Qualität bei Midjourney
Um dir bildlich vor Augen zu führen, wie sich die Qualität der Bilder in den letzten 12 Monaten entwickelt hat, möchte ich mit einem kleinen Test beginnen. Ich habe den gleichen Prompt in drei unterschiedlichen Versionen von Midjourney angewendet.
Einmal in Version 3, einmal in Version 5.1 und dann in der Version 6:
haggard elderly Louisiannan old man. magazin photo. --s 650 --style raw --ar 16:9 --v 3 // --v 5.1 // ---v 6.0
Version 3: Nicht zu gebrauchen
Version 3: 3 Arme, kein Magazin-Foto, schlechte Bild-Qualität
Version 5.1: Klar als AI-Bild zu identifizieren
Version 5.1: Gutes Ergebnis - aber klar als AI-Bild zu identifizieren
Version 6.0: Magazin-Qualität erreicht
Version 6: Fotografiert oder mit AI-erzeugt. Nicht mehr klar zu sagen - oder?
Du siehst die Weiterentwicklung innerhalb von einem Jahr. Unglaublich, was hier erreicht wurde.
Ich finde dieses Beispiel visualisiert sehr gut, wie schnell die Entwicklung in diesem AI-Segment vorangeschritten ist und welch hohe Qualität wir schon erreicht haben.
Was hat das mit “AI im Business” zu tun?
Bilder spielen in unserer Unternehmens-Kommunikation eine sehr wichtige Rolle. Denken wir nur an Anzeigen, Online-Ads, Social-Media-Kommunikation, Präsentationen, Broschüren, … .
Die Möglichkeiten in sehr kurzer Zeit, sehr hochwertige Bilder für unser Unternehmen zu generieren und nicht mehr zwangsweise auf aufwändige Fotoshootings zurückgreifen zu müssen ermöglichst es jedem Unternehmen jetzt auf einem ganz anderen Niveau zu agieren. Das betrifft sowohl das benötigte Budget, als auch die Zeit die es braucht, verwertbare Arbeitsergebnisse zu erreichen.
Ist einmal an Brand-Style für Fotos definiert (z.B. über bestimmte Parameter im Midjourney-Prompt), können sehr schnell, sehr gute Ergebnisse erreicht werden.
5 AI-Tools für unterschiedliche Einsatzzwecke
Es gibt huderte von AI-Bild-Generatoren. Nachfolgend habe ich euch die zusammengestellt, die ich im Einsatz im Unternehmens-Umfeld für sinnvoll und ausgereift genug halte.
DALL-E 3: Schnell mal ne Grafik für die Präsentation erstellen
Wenn das Arbeits-Ergebnis nicht fotorealistisch werden muss und es schnell und einfach gehen soll: Bleib einfach in ChatGPT und generiere dein Bild mit dem dort integrierten DALL-E Bild-Generator. Für Präsentation gut geeignet.
Übrigens: Ich rechne sehr stark damit, dass DALL-E in den nächsten Wochen auch bei fotorealistischen Bildern einen großen Sprung nach vorne machen wird. Das Text to Video-Tool “Sora” ist so gut bei der Video-Generierung - ich sehe keinen Grund, warum das nicht für Bilder in Kürze deutlich besser funktionieren sollte.
Anwendung: Sehr einfach!
Midjourney 6: Hochwertige Fotos erzeugen
Wie in unserem Beispiel vorher zu sehen - Aktuell produziert kein AI-Tool bessere fotorealistische Bilder. Wir können sehr nah an die Ergebnisse eines hochwertigen Fotoshootings kommen. Mit einem Promille der Kosten und in kürzester Zeit.
Hier das Ergebnis einer meiner aktuellen Tests in diesem Bereich:
Foto aus einem meiner Tests: “AI-Foto-Shooting” für den imaginären Regelmantel-Brand “Octopus”. Wie viel hätte vor zwei Jahren dieses Foto-Shooting wohl gekostet? Für dieses Bild habe ich in Midjourney ca. 20 Minuten benötigt.
Anwendung: Komplexer - aber die Basics sind innerhalb von ein paar Stunden erlernbar.
Stable Diffusion: Konstant mit einer Charaktere arbeiten
Wenn es darum geht ein spezielles Gesicht bzw. eine spezielle Person in unterschiedlichen Einstellungen und Szenen zu zeigen ist Stable Diffusion aktuell die erste Wahl. Allerdings ist die Erreichung überzeugender Ergebnisse nicht trivial und erfordert eine deutlich längere Lernphase und mehr technisches Verständnis.
Anwendung: Komplex und sehr technisch. Beste Ergebnisse bei konstanten Charakteren.
Qreates: Physische Produkte ins rechte Licht rücken
Wenn es darum geht bestehende physische Produkte für Marketing und Kommunikation ins rechte Licht zu rücken, kommen wir an den Fotoshootings für das Produkt selbst nicht immer vorbei. Doch das neutrale, freigestellt Produktfoto kann die Basis sein, dieses in vielen hochwertigen Szenen und mit diversen Hintergründen mit Hilfe der AI zu präsentieren. Mit dem Tool “Qreates.com” kann man Beleuchtung, Schatten, Konturen und viele weitere Dinge einstellen und so mit einem eher “langweiligen” Produktfoto sehr coole Ergebnisse erreichen.
Anwendung: Relativ teuer – aber sein Geld wert.
Avatare erstellen mit artflow
Ein großer Spaß - aber auch praktisch für eine kreative Social Media-Produktion. Mit Artflow kann man einen Charakter “trainieren”, in dem man ca. 20 Bilder von ihm hochlegt und diesen trainierten Charakter dann via Text-Prompt in unterschiedlichen Themen und Szenen (inkl. “Kostüm”) zeigen.
Ein großer Spaß: Würde ich so als “Rockstar” aussehen? 😂
Anwendung: Einfach, wenn genügend Bilder vorliegen.
Alle Links findet ihr am Ende der Ausgabe!
Wie hat dir die Ausgabe gefallen? |
Login oder Abonnieren um an umfragen teilzunehmen. |
Interessieren dich Themen wie Bild-Generierung, Video-Generierung, Präsentationen mit AI erstellen oder Musik mit AI generieren? Lass mich gerne wissen, ob du mehr zu solchen Themen erfahren möchtest.
Möchtest du mehr Themen wie dieses sehen? |
Login oder Abonnieren um an umfragen teilzunehmen. |
Links aus dieser Ausgabe
Hier, wie versprochen, alle Links, die in dieser Ausgabe genannt wurden:
Sora: neues Text to Image Tool von OpenAI
Midjourney: Perfekte Fotos - der aktuelle Gold-Standard
Stablediffusion: Konstante Charaktere erzeugen.
Qreates: Physische Produkte ins rechte Licht rücken
DALL-E: Schnell und einfach Grafiken erstellen
Artflow: Verwandele dich und andere in Avatare oder Charaktere deiner Wahl
Wenn das, was wir uns heute angeschaut haben, das Ergebnis der Entwicklung eines Jahres ist – mit was werden wir uns im Jahr 2025 oder gar 2030 beschäftigen?
Es ist immer wieder beeindruckend, wie schnell alles geht, seitdem der AI-Zug im November 2022 richtig angerollt ist.
Schritt zu halten und die wichtigsten Entwicklungen zu erfahren und zu verstehen ist hier das oberste Gebot. Dabei möchte ich dich mit diesem Newsletter unterstützen.
In diesem Sinne - bis zur nächsten Ausgabe.
Danke für deine Treue als Leser, AI-Fan.
✌🏼Kai Michael Schäfer
Reply