Starfotograf und kleiner DaVinci – Bilder erstellen und manipulieren mit GenAI

Teil 2 unserer Serie über GenAI-Werkzeuge, die Lars und ich einsetzen:
Diesmal geht es um das Erstellen von Bildern vom Comic über das Gemälde
bis zum Foto, aber auch um das Nachbearbeiten und „Manipulieren“
vorhandener Fotos. Für die einen ist es privater Spaß, Bilder schöner zu
machen. Die anderen manipulieren sie damit. Mehr in unserem Video- und
Podcast.

Will nur mal schnell ein Bild malen …

Die frei verfügbare Version von Dall-E und Ideogram.ai sind die beiden Tools, mit denen ich seit einigen Monaten die Titelbilder und Grafiken hier im Blog erstelle. Ideogram.ai wurde mir vor geraumer Zeit von Klaus Eck empfohlen, weil man damit (manchmal) auch Texte und Banner generieren kann – etwas, an dem sehr viele KI-Werkzeuge überraschenderweise noch scheitern. Doch scheitert Ideogram.ai selbst des Öfteren an der Aufgabe.

Zudem ist Ideogram.ai nicht so scharf in der Zensur von Inhalten. Bei Dall-E ist es beispielsweise nicht möglich, einen Cartoon oder eine Verfremdung eines Prominenten wie zum Beispiel Elon Musk erstellen zu erlassen. Ideogram.ai hat dies ohne Murren erledigt und eine Joker-alike Elon produziert. Weiterhin spricht für das Tool, dass verschiedene Grafikformate von 10:16 über 1:1 bis 16:10 erstellt werden können, etwas an dem manch anderes Tool scheitert.

Auch das Hintergrundbild für den Videocast hat Ideogram auf Basis des (englischsprachigen) Prompts „Erstelle das Gemälde eines künstlichen Intelligenz-Roboters, der vor einer Staffelei steht und ein Porträt von Taylor Swift im Stil von Leonardo da Vinci“ kreiert. Bemerkenswert ist übrigens, dass nahezu alle Tools englische Prompts besser zu verstehen scheinen als deutsche Befehle. Auch andere „Deutschkenntnisse“ haben Verbesserungspotenzial. So scheiterte Ideogram.ai an dem Befehl, ein Bild der Bremer Stadtmusikanten zu produzieren. Der in Microsoft Bing integrierte Image Creator hatte damit keine Probleme.

Noch häufiger als Ideogram.ai setze ich Dall-E ein. Dall-E produziert erst einmal auch nur quadratische Bilder. Jedoch kann man ein Bild dann mit der Edit-Funktion erweitern und so produziere ich oft die Banner für den Blog. Für diese Erweiterung sind auch eigene Prompts möglich, so dass ein solcher Banner durchaus mit zwei oder drei Befehlen erstellt werden kann.

Hier erweitere ich ein Bild des Busses von Borussia Mönchengladbach in Dall-E.

Dall-E, Firefly und Image Creator: Politisch „voll korrekt“

Dall-E ist – wie auch der darauf basierende Image Creator von Bing – politisch höchst korrekt. Oft erscheint selbst bei mir erst einmal harmlos erscheinenden Befehlen wie „Erstelle das Bild eines Kraftwerks“ die Meldung, dass der Prompt nicht den Richtlinien von OpenAI entspreche.

Daneben sind der Kreativität auch jetzt schon wenig Grenzen gesetzt. Wer Prompts beherrscht, kann vom lustigen Comic über ein Gemälde bis zu Fotos viele verschiedene Formate erzeugen. Ja, meist sieht man den Bildern an, dass sie mit einer KI produziert wurden, aber mir sind sie gerade hier im Blog lieber als die oft zu braven und wenig kreativen Stockfotos. Man muss sich jedoch darüber im Klaren sein, dass es schon einmal eine Weile dauern kann, bis das Ergebnis den eigenen Vorstellungen entspricht. Das mag am Prompt liegen – auch da muss man lernen und seine Erfahrungen sammeln -, manchmal scheint aber auch die GenAI einem etwas ärgern zu wollen …

Lars spricht in unserem Gespräch korrekterweise die Urheberrechtsfrage an. Mit welchen Daten, Fotos, Grafiken oder Gemälden darf eine KI trainiert werden und wann wird das Copyright oder das Recht an geistigem Eigentum verletzt? Sicher gibt es hier Grenzen, an die man sich halten sollte.

Fotos: Verbessern und manipulieren

Neben den Tools zum Erstellen von Bildern stellen wir Werkzeuge zum Bearbeiten, Verbessern und Manipulieren von Fotos vor. Ich setze beispielsweise den Photo-mat-or auf meinem Mac ein, um Unterwasserbilder, die ich im Urlaub geschossen habe, in Schärfe, Farbe und Tiefe zu überarbeiten. Das habe ich in der Vergangenheit nicht getan, auch wenn ich natürlich hätte „photoshopen“ können. Die neuen Werkzeuge sind wesentlich einfacher zu bedienen und selbst eine Verarbeitung im Batch ist möglich. Ich empfinde das als echten Fortschritt.

Kennt Ihr das? Ihr wollt ein Foto machen und jemand läuft ins Bild, den ihr eigentlich nicht darauf haben wolltet. Genau das ist mir beispielsweise vor Jahren auf einem Boot vor der Freiheitsstatur passiert. Mit BeFunky (aber auch Photomator und anderen Tools) ist es nun möglich, diese Person aus dem Foto zu retuschieren. Und schwupp habe ich nun das Motiv, das ich haben wollte.

Und hier wird deutlich, dass die Grenze von Verbessern zu Manipulieren fließend ist. Das, was ich im Spaß privat retuschiere, wird von vielen auch zur Manipulation von Fotos benutzt. Wir erleben dies gerade im Krieg im Gazastreifen und Israel, wo massenhafte gefälschte Bilder produziert und verteilt werden. Durch die Presse ging beispielsweise die Nachricht, dass ein Motiv aus einem Videospiel als echte Kriegsszene verkauft wurde. Genau wie es Fake News gibt, sind nun auch viele Fake Photos und Videos im Umlauf und vielleicht sind die emotional sogar wesentlich gefährlicher.

Auch Bilder und Videos auf Echtheit prüfen

Das, was ich und viele andere privat nutzen, um mehr Spaß zu haben, Artikel zu illustrieren oder Freunden „besser“ Fotos zeigen zu können, wird ebenso bewusst zur Fälschung und Manipulation genutzt. Darüber müssen wir uns klar sein. Auch hier gilt das, was wir schon in unserer Folge über GenAI zur Texterstellung gesagt haben: Echtheit und Fakten immer zweifach und dreifach prüfen!

Im neuen Jahr werden wir in auf weitere Einsatzmöglichkeiten von KI eingehen. Vor ziemlich genau einem Jahr haben wir im Dezember 2022 erstmals bei über ChatGPT und Generative AI gesprochen. Seitdem ist viel passiert und die Entwicklung geht rasant weiter, in der Text- und Bilderstellung durch GenAI und auf vielen anderen Gebieten. Wir werden das ganz sicher verfolgen.

Und auch hier sei nochmals erwähnt, dass wir für Tipps und Tricks, Kommentare und Informationen sowie Hinweise auf weitere Tools immer sehr dankbar sind!

127 – KI Tools, Teil 2: Bild #9vor9 – Die Digitalthemen der Woche

Auch die letzte Episode im Jahr 2023 widmen wir DEM Tech Thema dieses Jahres: der Künstlichen Intelligenz. Nach der Textgenerierung in der Episode 126 geht es diesmal um die Generierung und auch die Manipulation von Bildern. Und auch diese Woche ist Lars der eher Skeptische und hofft, von Stefan etwas zu lernen, der sich in Sachen Bild-KI regelmäßig austobt. Hört selbst.

Bilder, Grafiken, Fotos – Übersicht der bei erwähnten GenAI-Werkzeuge

ToolHerstellerDiskutierte Einsatzmöglichkeiten
Dall-E (3.5)Open AIErstellen von Bildern, Fotos, Grafiken und „Gemälden“ in verschiedensten Stilen
Das quadratische Ursprungsbild kann erweitert werden
Dall-E ist politisch „voll korrekt“
Bing Image CreatorMicrosoftIn Bing Chat integrierter Image Creator.
Derzeit wohl nur quadratische Formate möglich
Vergleichsweise gute Kenntnis deutscher Fakten
Ideogram.aiIdeogram AI IncFreier Bildgenerator, der verschiedene Formate von 10:16 über 1:1 bis 16:10 anbietet Fotos und Grafiken auch von Prominenten sind (noch) möglich
FireflyAdobeBildgenerator von Adobe
Ebenfalls „politisch voll korrekt“ (€€)
PhotomatorPixelmatorPhoto Editor für Mac, iPhone und iPad
App des Jahres 2023 bei Apple für den Mac (€€, Abo)
BeFunkyBeFunky Inc.Photo editieren, erstellen von Collagen und Grafikdesign
Browser-basiert, iOS- und Android App (€€)

Comments

Kommentar verfassen

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden..

Regelmäßig informiert bleiben?
StefanPfeiffer.Blog

Jetzt abonnieren, um informiert zu bleiben und alle Beiträge im Zugriff zu haben.

Fortfahren