Du brauchst dringend ein neues LinkedIn Foto, hast aber keine Zeit zum Fotografen zu gehen? Oder du möchtest dich als Abenteurer auf der Jagd nach verloreren Schätzen ablichten lassen? Mit der Bild-KI Flux wird das Realität. Egal, ob du dein eigenes Gesicht in epischen Szenen sehen möchtest oder einen kreativen Avatar für soziale Medien suchst – eine neue Trainingsmethode macht es möglich, deine Vorstellungskraft in atemberaubende Bilder zu verwandeln und in sekundenschnelle Bilder mit deinem Antlitz zu erzeugen.
Wir zeigen dir wie du selbst innerhalb weniger Minuten eine Bild-KI mit deinen Fotos trainierst und dann solche Bilder erzeugst!
Die LoRA-Methode (Low-Rank Adaptation of Large Language Models) stellt eine moderne, effiziente Trainingsmethode für KI-Modelle dar. Mit dieser Methode kann wir eine Bild-KI wie Flux in kurzer Zeit auf unsere Anforderung “Eigener KI-Avatar erstellen” anpassen.
Um dein Gesicht in einen KI-Avatar zu bekommen sind nur wenige Schritte nötig:
Voraussetzungen: Ein Account bei fal.ai mit Guthaben oder Credits (5 $ für das Training und etwa 1 $ für die Erstellung von 13 Bildern). Schritt-für-Schritt Anleitung um eigene KI-Avatare zu erzeugen: Anmeldung und Guthaben aufladen : Melde dich bei fal.ai an und lade dein Guthaben mit einer Kreditkarte auf.Modellwahl : Navigiere auf das öffentliche Modell zum Training der Flux KI .Bilder hochladen : Lade Bilder von dir hoch. Achte darauf, dass diese folgende Kriterien erfüllen:Hohe Auflösung Nur dein Gesicht und Oberkörper, ohne andere Personen Ideal ohne Brille Verschiedene Posen und Gesichtsausdrücke Mindestens 15 Bilder für gute Resultate Training starten : In der Trainingsmaske lädst du deine Bilder hoch. Definiere ein „Trigger Word“, das später bei der Erstellung der Bilder verwendet wird, und klicke auf „Start“. Wir haben hier z.B. “Fabian” gewählt, wobei dieses Wort dann später wieder in den Prompts enthalten sein muss. Das Training kann einige Minuten dauern.Inference ausführen : Sobald das Training abgeschlossen ist, wird der Status in der Trainingshistorie als „Completed“ angezeigt. Klicke auf „Run inference“, um Bilder zu erstellen.Bilder generieren :Um Bilder zu erstellen, musst du das Flux-Modell instruieren was genau auf dem Foto zu sehen sein soll. (s. Beispiele unten für Inspiration) In diesen Bild-Prompts muss das Triggerwort, das wir in 4. vergeben haben, enthalten sein. So greifen wir auf unsere Trainingsdaten zu.Nach einem Klick auf „Run“ erstellt das Modell innerhalb weniger Sekunden Bilder mit deinem Gesicht.Benutzeroberfläche von fal.ai Traingsscreen Nach abgeschlossenem Training kann über "Run Inference" die Bilderzeugung gestartet werden. Durch gezielte Instruktionen (Prompts) können alle denkbaren Szenerien erzeugt werden Wie kann ich bessere Bilder zu erzeugen? Um präzise und ansprechende Bilder zu erhalten, ist es hilfreich, ein Sprachmodell wie ChatGPT oder Gemini zur Generierung der Bild-Prompts zu verwenden. Ein möglicher Ansatz ist, das Sprachmodell zu instruieren, dir durch gezielte Fragen zu helfen, den optimalen Bild-Prompt zu erstellen.
Beispiel-Prompt für ChatGPT
„Du bist mein persönlicher Prompt Creator und unterstützt mich dabei, Prompts für die Eingabe in die Flux KI-Bildmodelle zu erstellen. Dein Ziel ist es, durch gezielte Fragen den bestmöglichen Prompt für meine Aufgabe und Bedürfnisse zu entwickeln. Deine Ausgabe enthält immer den ursprünglichen Prompt bis zu dieser Stelle und den verbesserten Prompt mit einer Erläuterung der Verbesserungen. Stelle anschließend eine relevante Frage zur weiteren Optimierung des Prompts. Wiederhole diesen Prozess, bis du der Meinung bist, dass der Prompt einsatzbereit ist. Der Prompt soll im aktiv formuliert sein. Beschreibe die Szene maximal präzise.“
Beispiele Prompt: "Erstelle ein professionelles Foto von einem Mann namens Fabian, der auf einer Dachterrasse steht. Er hat einen neutralen Gesichtsausdruck, trägt eine Brille und ist in einem dunkelblauen Hemd gekleidet. Der Hintergrund zeigt eine moderne Stadtlandschaft bei Tageslicht, wobei das natürliche Licht eine entspannte, aber professionelle Atmosphäre schafft" Prompt: "Fabian, gekleidet in einen eleganten, klassischen Anzug mit schwarzer Krawatte und glänzenden Lederschuhen, sitzt entspannt in einem großen, antiken Sessel mitten in einem dichten, mystischen Wald. Um ihn herum fliegen leuchtende Glühwürmchen, die die Szene in ein magisches, schimmerndes Licht tauchen. Im Hintergrund ist ein schwebender Wasserfall zu sehen, der scheinbar gegen die Schwerkraft nach oben fließt. Der Himmel ist in tiefen Violett- und Blautönen gehalten, während der Boden mit großen, leuchtenden Pilzen bedeckt ist. Fabian hält in der rechten Hand ein altmodisches Buch, während seine linke Hand eine Tasse dampfenden Kaffee balanciert. Trotz der unüblichen Umgebung strahlt er eine ruhige, souveräne Ausstrahlung aus, als würde er perfekt in diese surreale Welt passen." Prompt: "Fabian trägt ein klassisches Indiana-Jones-Outfit: ein braunes Lederjackett, ein beigefarbenes Hemd, braune Hosen und robuste Stiefel. Auf seinem Kopf sitzt der ikonische Fedora-Hut, und um seine Hüfte ist eine Peitsche befestigt. Er befindet sich in einer alten, verlassenen Tempelanlage tief im Dschungel, umgeben von überwucherten Pflanzen und zerbrochenen Statuen. Vor ihm steht ein antiker Altar, auf dem ein mysteriöses Artefakt aus purem Gold ruht, das in einem schwachen, magischen Licht leuchtet. Der Tempel ist düster, nur durch schmale Lichtstrahlen, die durch die Decke brechen, beleuchtet. Fabian sieht entschlossen aus, bereit, das Artefakt zu bergen, während im Hintergrund eine versteckte Falle aktiviert wird." Prompt: "Erstelle ein dramatisches Foto einer Kampfszene in einer antiken Arena, inspiriert von Game of Thrones. Die Arena hat einen sandigen Boden und steinerne Tribünen, voll mit Zuschauern. Zeige Fabian, einen schlanken, leicht muskulösen Mann, in der Mitte der Szene, in bunter Kampfausrüstung mit roten und goldenen Details. Er ist mitten im Kampf, schwingt entschlossen einen Speer und wirkt sehr fokussiert. Nutze das harte Sonnenlicht für tiefe Schatten und betone den fliegenden Staub und Sand. Die Menge im Hintergrund sollte aufgeregt reagieren, und der größere, schwer gepanzerte Gegner sollte ebenfalls zu sehen sein." Fazit Die Ergebnisse der KI-Bildgenerierung sind teilweise beeindruckend gut. Auch wenn Flux hin und wieder Fehler macht, wie ungenau proportionierte Hände oder eine nicht ganz passende Körpergröße oder Körperform, sind die erzeugten Bilder meistens erstaunlich nah an echten Fotos der Person, die als Trainingsdaten verwendet wurde. Manchmal ist es schwer zu erkennen, ob ein Bild tatsächlich eine Person zeigt oder nur von der KI erstellt wurde.
Wegen der überwiegend hervorragenden Qualität der Bilder gibt es ernsthafte Bedenken bezüglich des Missbrauchs. Die beeindruckende Detailgenauigkeit der KI-Bilder kann zu problematischen Situationen führen, insbesondere wenn diese Technologie für unethische Zwecke genutzt wird. Während die Sicherheitsfunktionalität von Flux bereits einige Missbräuche einschränkt, bleibt die allgemeine Problematik bestehen, dass erzeugte Bilder immer schwieriger von echten Fotos zu unterscheiden sind. Dies wirft dringende gesellschaftliche und regulatorische Fragen auf, wie mit diesen technologischen Fortschritten verantwortungsvoll umzugehen ist.
Dennoch machte es in unserem Test wahnsinnigen Spaß hier mit dem Modell herumzuspielen. Viel Freude beim selbst ausprobieren!