Transkripte
1. Einführung in den Kurs: In den letzten Jahren hat sich
im KI-Bereich viel verändert . Als es
herauskam, betrachteten die meisten von uns, mich eingeschlossen,
es als Neuheit Im Laufe der Zeit
haben sich die KI-Modelle so weit entwickelt, dass sie menschliche
Kreative fast replizieren oder sie zumindest
vorübergehend täuschen
können Kreative fast replizieren oder sie zumindest
vorübergehend täuschen Fast jedes große
Technologieunternehmen hat Milliarden
in den KI-Bereich
investiert, und das hat zu besseren
KI-Modellen, Ausbildung
und Forschung geführt KI-Modellen, Ausbildung
und Forschung Es besteht die Befürchtung, dass KI den Job einer kreativen
Person
übernehmen wird . Diese Angst ist sehr real,
und Fotografen, Grafikdesigner
und Illustratoren dürfen sich ein bisschen Sorgen machen Ich habe beschlossen,
einen KI-Theoriekurs zu veranstalten , der diese Angst lindert Ich habe Hunderte von Stunden damit verbracht die neuesten
KI-Tools und -Modelle zu
verwenden, und ich bin sehr
zuversichtlich, dass KI zusammen
mit unseren eigenen
kreativen Fähigkeiten
eine wunderbare Ergänzung
sein wird zusammen
mit unseren eigenen
kreativen Fähigkeiten
eine wunderbare Ergänzung mit unseren eigenen
kreativen Fähigkeiten Dieser Kurs ist ein guter
Ausgangspunkt für jeden Kreativen oder Designer etwas
über KI-Grundlagen lernen
möchte, z. B. hinter die Kulissen
der Funktionsweise mehrerer KI-Modelle, wie
Tools zur Bilderzeugung und Chat-KI-Modelle, Tools zur Bilderzeugung und Chat-KI-Modelle, Grundlagen des Schreibens von
Prompts und wie
man effektive Aufforderungen schreibt, nuancierte
Designbegriffe
erlernen möchte, die uns
das richtige Vokabular für die Erstellung
hyperdetaillierter Bilder vermitteln . Wir werden auch die rechtlichen
Fragen und mehr besprechen. Aufforderungen schreiben zu lernen ist, als würde man als Kind
wieder von vorne schreiben Wir beginnen mit einfachen Eingabeaufforderungen die leicht beschreiben,
was wir wollen, und schließlich sind
wir durch Übung in der Lage, mit Worten, an die wir vielleicht
nie gedacht haben,
richtig und
sehr detailliert zu beschreiben , was unsere Vision ist Dieser Kurs kann
fast jeden ansprechen , der von KI eingeschüchtert
oder überwältigt
wurde von KI eingeschüchtert
oder überwältigt und nicht wusste, wo er
anfangen sollte, die Grundlagen zu Dieser Kurs richtet sich
speziell Kreative und Designer,
um Sie
durch die Grundlagen der KI zu führen, sodass Sie anfangen können, darüber
nachzudenken, wie diese großartigen Tools
nutzen um sich die zukünftigen Entwicklungen in der Ich hoffe, dass dieser Kurs ein Sprungbrett für
zukünftige Kurse sein
wird , in denen praktische
Designprojekte
mit Aber zuerst müssen wir die Grundlagen
verstehen, wie es funktioniert, und dieser Kurs
zielt darauf ab, genau das zu tun Wir sehen uns in
der ersten Lektion. Mein Name ist Lindsey Marsh, und
Designtheorie zu unterrichten ist mein Ding Ich bin seit über 20 Jahren Grafikdesigner und
Dozent
für Design für über 350.000 Grafikdesign-Studenten Ich freue mich, Ihnen diesen
Kurs heute anbieten zu können.
2. Wie LLMs funktionieren: Lassen Sie uns einen roten
Kardinal auf einem Ast erzeugen. Woher wusste dieser Bildgenerator
, dass er einen Vogel zeigt? Woher wusste er, dass der Vogel
rot war und sich auf einem Ast befand? Woher wusste es überhaupt, wie
ein Ast aussieht? Dies ist ein komplexes System, das Abermillionen präziser Matrixberechnungen durchführt, um etwas zu
erzeugen, das wie Magie aussieht. Um wirklich eine gute Vorstellung
davon zu bekommen, wie das passiert, müssen
wir zunächst verstehen, wie KI-Modelle die
menschliche Sprache verstehen, um dann zu verstehen, wie sie
Bilder erzeugt Was ist also ein LLM? Ein LLM oder ein großes
Sprachmodell ist eine Art
künstlicher Intelligenz, die
darauf trainiert ist,
menschliche Sprache zu verstehen und zu erzeugen Tools wie Chat GPT, Claude und Google Gemini sind
Beispiele für LLMs, und Google Gemini sind
Beispiele für LLMs,
also große Sprachmodelle. Ich werde
während des gesamten Kurses Chat-GPT verwenden,
was auch eines der beliebtesten LLMs auf dem Markt ist Sie werden als groß bezeichnet
, weil sie riesigen
Textmengen vertraut sind, von
Büchern, Artikeln und
Websites bis
hin zu
Online-Konversationen und mehr Das Ziel ist es, zu lernen, wie
Menschen kommunizieren, unseren Satzbau, unsere Grammatik, Tonfall, unseren Stil und sogar unsere Absicht. So kann die KI auf eine
Weise reagieren, die sich natürlich und nützlich anfühlt. Sue, warum sind LLMs
für Designer wie uns
und andere Kreative wichtig für Designer wie uns
und andere Kreative Weil LLMs mehr sind als
nur Schreibassistenten. Im Folgenden finden Sie einige Möglichkeiten, wie sie Workflows unterstützen oder
gestalten können Zuallererst die Ideengenerierung. Benötigen Sie ein Konzept, einen Slogan
oder eine Kampagnenrichtung. Fragen Sie einfach. Copywriting LLMs können beim Verfassen von Beiträgen,
Slogans, Produktbeschreibungen und mehr in
sozialen Medien Slogans, Produktbeschreibungen helfen.
Kreative Schriftsätze Sie können Hilfe bei der Strukturierung oder Bearbeitung von Dokumenten für Kunden Benennungen generieren Sie
Markennamen, Produktnamen, Projekttitel, alles
basierend auf Ton und Schlüsselwörtern. Aber mehr als nur
das: Wenn wir mehr
darüber erfahren, wie LLMs funktionieren
, können wir das äußerst
wichtige Tool
für Designer in
den nächsten zehn Jahren verstehen für Designer in
den nächsten zehn Jahren Die Tools zur Bild- und
Videogenerierung wir
während des gesamten Kurses verwenden werden Im Kurs werden wir uns also
auf zwei Arten von KI-Modellen konzentrieren. Das erste ist das, das
wir gerade erwähnt haben, das Large Language Model oder LLM, und das wird schließlich in ein anderes System
eingespeist,
das als
Bilddiffusionsmodell bezeichnet wird Und das
Bilddiffusionsmodell hilft
uns dabei, Bilder aus Text zu generieren Es kann zum Beispiel
erkennen, dass Apple etwas mit Obst
zu tun hat, ohne dass ihm dieser Zusammenhang explizit
beigebracht wird. Diese Fähigkeit, Sprache zu
interpretieren ist für Tools zur
Bilderzeugung unerlässlich, die wir
im Laufe des Kurses untersuchen werden. Bevor eine KI ein
Bild von einem bellenden Hund erstellen kann, muss
sie zunächst verstehen, was ein Hund ist und was
es bedeutet, zu bellen Das große Sprachmodell
lernt und versteht
und generiert
menschliche Sprache, indem es lernt und versteht
und generiert riesige
Textmengen
analysiert und
Verbindungspunkte zwischen ihnen findet Und dann werden
Eingabeaufforderungen in ein
Bild-zu-Fusion-Modell eingespeist , das
Bilder generiert, die sich an Mustern orientieren
, die während des Trainings gelernt Oft ist es darauf angewiesen, dass ein LLM
zuerst die Textaufforderung versteht und
interpretiert und sie
dann in
aussagekräftige Tokens umwandelt, sie
dann in
aussagekräftige Tokens umwandelt die den Prozess der visuellen
Generierung leiten Lassen Sie uns nun darüber sprechen,
wie LLMs funktionieren. Stellen Sie sich das wie eine leistungsstarke
Autovervollständigung , die nicht nur Ihre Sätze
beendet,
sondern auch Aufsätze schreiben, Fragen
beantworten, Aufforderungen
entwerfen
und sogar beim Branding und Copywriting helfen kann Fragen
beantworten, Aufforderungen
entwerfen
und sogar beim Branding und Copywriting helfen Im Kern sind LLMs Wahrscheinlichkeitsmaschinen. Wenn Sie eine Frage stellen,
berechnen sie auf der
Grundlage all dessen, was
sie gelernt haben, welche Wörter am
wahrscheinlichsten als Nächstes kommen am Es ist zum Beispiel wie
ein erfahrener Designer
, der so sehr an Trends,
Kundenbedürfnisse und Layouts gewöhnt ist ,
dass er fast erraten kann, was
der Kunde als Nächstes will, noch bevor der Kunde es ihm
überhaupt sagt, weil er es immer
und immer wieder getan Der nächste Schritt ist das Generieren von
Tokens und Kontext. LLMs sehen also
keinen ganzen Satz. Sie zerlegen sie in kleine
Stücke, sogenannte Tokens. Wörter, ein Teil der Wörter
oder sogar die Zeichensetzung oder sogar Sogar die Reinheit am Ende
ist ihr individuelles Kennzeichen. Dann schauen sie sich den Kontext an, den Text, der ihn umgibt, um
herauszufinden , was wahrscheinlich als Nächstes kommen wird. Und dann gibt es
mehrere Ebenen und Prozesse, die es durchläuft. LLMs haben Millionen oder
sogar Milliarden von Neuronen, mathematische Einheiten, die Sprache schichtweise
verarbeiten Jede Ebene verfeinert das
Verständnis der Bedeutung, genau wie bei einem kreativen
Überprüfungsprozess Lassen Sie uns diesen
Prozess also genauer durchgehen. Lassen Sie uns also eine Beispielaufforderung haben. Und dieses Beispiel ist,
ein Bild von einem pelzigen Hund zu erstellen. Es ist also gut,
jedes Wort in Zeichen zu unterteilen. Create wäre also ein
eigenes Symbol
und das Bild eines bellenden Hundes Gelegentlich
trennt es ein Wort. Bellen könnte also Bellen
sein und dann, und auch Perioden zählen
als Zeichen Jedem Wort oder Zeichen wird also
ein Vektorpunkt zugewiesen. LLMs verstehen
Wörter nicht so wie Menschen. Stattdessen stellen sie
Wörter als Vektoren dar, die wie lange
Zahlenlisten sind , manchmal 12.000 Diese Zahlen erfassen die
Position eines Wortes in
einem riesigen unsichtbaren Raum der
als Einbettungsraum oder
Vektorraum bezeichnet wird Jedes Wort wird zu einem Punkt im Raum, an dem ähnliche Wörter nahe beieinander
stehen In unserem Prompt-Beispiel das Wort Hund und Bellen würden
das Wort Hund und Bellen
in dieser Karte nahe beieinander liegen, da sie während des
Trainings aufgrund der Daten häufig
miteinander verknüpft
dargestellt wurden während des
Trainings aufgrund der Daten häufig
miteinander In diesem Beispiel wird ein Leerzeichen mit zwei D verwendet, aber KI-Modelle müssen
50.000 Wörter zugeordnet werden Es gibt also nicht viel Platz. Es bildet also alles in einem Drei-D-Vektorraum
ab. diesem Grund wird jedem Token oder Wort
eine lange Liste von
Zahlen zugewiesen , da diese
die genaue Position auf
einer Drei-D-Vektorkarte angeben Diese Zahlenspalten sind Koordinaten, die
es Wörtern ermöglichen,
einander zu finden und so Assoziationen und menschliche
Sprache miteinander zu
entwickeln Stellen Sie sich eine riesige Wolke mit drei D
vor, nur dass sie
in diesem Raum tatsächlich Tausende
von Dimensionen groß ist . Ähnliche Bedeutungen
liegen näher beieinander. King steht der Königin also nahe, und Paris ist Frankreich nahe. Und Designer ist in der Nähe von anderen Wörtern wie kreativ,
visuell und künstlerisch. Verschiedene Bedeutungen
liegen weiter auseinander. King ist also weit von
Apple entfernt, weil King und Apple in menschlichen
Texten und Sprachen
kaum zusammen vorkommen in menschlichen
Texten und Sprachen
kaum Die Helligkeit
von Licht ist
je nach Kontext
ein anderer Bereich als die Lichtstärke. Diese Bedeutungskarte
wird während des
Trainings erstellt , wenn das Modell lernt,
wie Wörter im Kontext erscheinen. LLMs verstehen
Wörter nicht isoliert. Stattdessen betrachten sie
die Tokens um sie herum. So
verwendete der Designer beispielsweise helle Farben im Layout. Hier wird Licht aufgrund der in der Nähe befindlichen
Zeichen, der Farbe und des Layouts als
Helligkeit interpretiert . Aber der Rucksack ist sehr
leicht und einfach zu tragen. Leicht bedeutet jetzt
dank der Kontextwörter
wie Rucksack und Tragen
nicht schwer . Das Modell passt das
Verständnis dynamisch an den Kontext an, und zwar mithilfe eines
Mechanismus, der Aufmerksamkeit genannt wird Lassen Sie uns also über Aufmerksamkeit sprechen. Im Gegensatz zu älteren Modellen, die
jedes Wort unabhängig verarbeiten , ist
Aufmerksamkeit, die Teil
einer größeren Transformationsebene ist, zu der wir kommen werden,
ein weiterer Prozess
, der ausgeführt wird , bei dem das Modell
alle anderen Wörter im
Satz betrachtet und sich fragt, welche davon
ich achten
sollte um zu verstehen,
was dieses Wort bedeutet? Es gibt dem Modell die Möglichkeit
, Wörter
je nach ihrer Relevanz für das Wort,
das es generiert
oder analysiert, unterschiedlich zu gewichten. Es ist, als würde ein Designer
ein ganzes Moodboard überprüfen , bevor er eine Entscheidung für
ein einzelnes Layoutelement trifft. Weil die Bedeutung oft
vom Kontext abhängt. Zum Beispiel
kann das Wort Bank sehr unterschiedliche Dinge bedeuten. Sie saß am
Ufer des Flusses. Die Aufmerksamkeitsfunktion
hebt das Wort Fluss hervor. Er hat eine Einzahlung bei der Bank getätigt. Aufmerksamkeit hebt jetzt
das Wort Einzahlung hervor. Das Modell konzentriert sich mit
Aufmerksamkeit auf die Wörter, die verdeutlichen
, welche Bedeutung richtig ist. Und dann durchlaufen die Daten
nach der Aufmerksamkeit viele andere
verschiedene Verarbeitungsebenen. Und viele davon sind verschiedene mathematische
Matrizenberechnungen, die Sie alle hinter
den Kulissen sehen und die millionenfach
passieren Das nächste Ding ist also das neuronale
Feedforward Network. Also, aufgepasst, der aktualisierte Vektor jedes
Tokens auf der kleinen Drei-D-Map
, die ich
Ihnen jetzt gezeigt habe , ist
mit mehr Kontext angereichert Es durchläuft ein
kleines neuronales Netzwerk das
als Feedforward Layer bezeichnet wird Dieses Netzwerk wendet eine mathematische Transformation
auf den Vektor an Es mischt keine Tokens
miteinander. Jedes Token wird hier
unabhängig verarbeitet. Stellen Sie sich das als einen
Verfeinerungsschritt vor, der dabei hilft, aussagekräftigere Muster aus
den zugehörigen Informationen herauszufiltern. Es geht darum, es aufzupolieren,
es anzupassen, zu
verfeinern und zu verbessern, bevor
es weitergegeben wird Ich wollte mir einen
Moment Zeit nehmen und eine Pause einlegen. Das ist ein sehr komplizierter
mathematischer Prozess mit vielen Schichten,
die Daten
immer wieder verarbeiten. Man muss kein Mathematiker sein
, um zu
verstehen, wie sie funktionieren Ich wollte
Ihnen nur eine kleine detaillierte Anleitung zeigen , wie sie die Prozesse
durchlaufen,
aber Sie müssen sich das auf keinen Fall
merken oder es von vorne bis hinten wissen Es hilft uns später einfach, wenn wir Eingabeaufforderungen schreiben, um zu erfahren, was hinter den Kulissen
wirklich vor sich geht es
darum geht, wie unsere Worte
verarbeitet Der nächste Schritt sind
Restverbindungen, Verbindungen überspringen. Dadurch soll sichergestellt werden, dass das Modell die Originalinformationen
nicht vergisst. Es verwendet Restverbindungen. Diese sind wie kleine
Abkürzungen, die
den ursprünglichen Eingabevektor
wieder in die Ausgabe
jeder Ebene einfügen den ursprünglichen Eingabevektor . Es verhindert, dass das Modell
nützliche Informationen durch
zu viele Transformationen überschreibt nützliche Informationen durch
zu viele Transformationen Es ist also so, als würde man ein Design
bearbeiten, aber die Originalversion
als Backup-Ebene in Photoshop beibehalten als Backup-Ebene in Auch hier müssen Sie
nicht die Mathematik hinter all dem
kennen, wissen, dass dies ein sehr
komplexer Prozess ist
und warum KI manchmal wie Magie
erscheint. Es gibt viele Kontrollen und
Abwägungen, um
sicherzustellen , dass das, was
herauskommt, geprüft und überprüft wird. Eine weitere Ebene wird als
Ebenennormalisierung bezeichnet Dabei handelt es sich um einen Bereinigungsschritt Dies trägt zur Stabilisierung
des Trainings bei und
sorgt dafür, dass die Daten auf allen Ebenen konsistent Es stellt sicher, dass das Modell bei extremen Werten nicht zu voreingenommen wird Es ist zum Beispiel so, als würden Sie die Lichtstärke auf einem Foto
anpassen , um die Beleuchtung auszugleichen,
bevor Sie mit der nächsten Bearbeitung fortfahren Wir stapeln also immer mehr Verarbeitungsebenen. Und Transformatoren machen das nicht
einfach auf einmal. Sie wiederholen diesen gesamten
Vorgang
je nach Modellgröße mehrmals 12, 24 oder sogar 96 Mal. Es wird
durch die Aufmerksamkeit gehen. Es wird den
Feed für neuronale Netzwerke,
die verbleibenden Verbindungen,
die Layer-Normalisierung durchgehen die verbleibenden Verbindungen,
die Layer-Normalisierung und es wiederholt sich immer wieder So entwickelt jede Schicht
ein differenzierteres Verständnis
der Also die unteren Schichten, das
Verständnis von Strukturen wie Grammatik und Zeichensetzung,
die mittleren Ebenen, Erkennen von Bedeutung
und Beziehungen
und einige der
höheren
Verarbeitungsebenen, die später hinzukommen, helfen
beim Argumentieren,
Planen und Erledigen von die später hinzukommen, helfen
beim Argumentieren,
Planen und Erledigen Planen Es ist also zum Beispiel so,
als würde man von der Skizze zur
raffinierten Illustration zur
vollständigen Markenidentität übergehen raffinierten Illustration zur
vollständigen Markenidentität übergehen Und wir haben eine endgültige Ausgabe. Nachdem wir
alle Ebenen durchgegangen sind, wird
der endgültige Vektor verwendet, um
das nächste Token für die
Textgenerierung vorherzusagen , das Wort bedeutet,
etwas wie eine
Stimmung oder ein Thema zu klassifizieren oder Bilderzeugung anzuleiten, wie in einem Diffusionsmodell, über das
wir als Nächstes sprechen werden Wir kratzen nur an der Oberfläche
der Funktionsweise von LL-Modellen. Aber wenn Sie wirklich viel
technischer werden und
in die Mathematik eintauchen
wollen , für diesen Kurs
natürlich
überhaupt nicht erforderlich. Du kannst dir drei
blaue und eine braune auf YouTube ansehen. So habe ich zum ersten Mal
die Details von KI-Modellen gelernt
und fand, dass er ein wirklich,
wirklich guter Lehrer war. Wir haben also dieses komplexe
Geflecht der Verarbeitung gesehen. Die Vektoren, die Wörter darstellen durchlaufen viele Ebenen
der Datenverarbeitung Schließlich erreichen sie eine
Wahrscheinlichkeitsmatrix, in der das Modell bestimmt,
welches Wort als nächstes am wahrscheinlichsten herauskommt. Die zugrundeliegende
Mathematik ist zwar komplex, was Sie wirklich verstehen
müssen, ist wie vielschichtig
dieser Prozess ist. Jedes Wort wird
anhand mehrerer interner
Kontrollen
aufgeschlüsselt, analysiert und miteinander verglichen. Das Ergebnis fühlt sich
fast magisch an, als ob die Maschine die menschliche Sprache wirklich versteht und interpretiert Dieselbe Art von mehrschichtiger
Intelligenz ist es, die auch die
Bilderzeugung
durch einen Prozess
namens Diffusion ermöglicht auch die
Bilderzeugung , den wir
in der nächsten Lektion untersuchen werden Stellen Sie sicher, dass Sie
die PDF-Ressource herunterladen , die alles beschreibt,
worüber wir in dieser Lektion gesprochen haben.
3. Funktionsweise der Bildverbreitung: KI-Bild- und Videogeneratoren
haben das Internet in
den letzten Jahren
mit ihrer Fähigkeit, Objekte und
Themen miteinander
zu verbinden und soziale Normen in Frage zu
stellen, begeistert den letzten Jahren
mit ihrer Fähigkeit , Objekte und
Themen miteinander
zu verbinden und soziale Normen in Frage zu
stellen, Die Negativität, die
diese KI-Tools
umgibt langsam nach,
da Kreative erkennen, wie
wichtig sie sein können, um mit der sich wandelnden Branche Schritt zu
halten mit der sich wandelnden Branche Schritt zu
halten Heute lernen wir Schritt für Schritt,
wie Bildgeneratoren funktionieren, sodass wir die Magie
hinter dem Vorhang sehen können Wie funktionieren diese KI-Tools
zur Bilderzeugung? Von der Sprache bis hin zu Bildern:
Wie das Verständnis von LLMs
Ihnen hilft, Diffusionsmodelle zu erlernen In der letzten Lektion haben wir also gut 12 Minuten damit verbracht
, etwas über
LLMs und deren
Verarbeitung von Token zu lernen LLMs und deren
Verarbeitung von Token Sie schaffen Kontext,
sie lenken Aufmerksamkeit auf sich und sie generieren Vorhersagen das gelernt haben, haben
Sie bereits
den Grundstein gelegt , um zu verstehen wie Diffusionsmodelle funktionieren. Während LLMs Wörter erzeugen, erzeugen
Diffusionsmodelle Bilder, und sie basieren auf vielen
der gleichen Kernideen wie
schichtweiser Verarbeitung, hochdimensionalen Vektorräumen, symbolähnlichen Repräsentationen und wahrscheinlichkeitsbasierten Ausgaben Die wichtigste Verbindung ist die
Vorhersage als zentraler Mechanismus. Im Mittelpunkt sowohl von LLMs Diffusionsmodellen steht eine
einfache, aber leistungsstarke Idee Lernen,
etwas anhand des Kontextes vorherzusagen. Bei LLMs sagt das Modell das nächste
Wort voraus. In Diffusionsmodellen
lernt das Modell, Schritt für Schritt eine
sauberere Version
des Bildes vorherzusagen ,
vom Rauschen bis zur Klarheit Beide Systeme verfeinern die Vermutungen auf der
Grundlage dessen, was sie
aus riesigen Datensätzen gelernt haben eine arbeitet im Sprachraum, das andere im Pixelraum Schritt eins, der Trainingsphase, lernt
es also , indem es Bilder zerstört. Nehmen wir also ein echtes Beispiel
für ein Bild von einer Katze. Lassen Sie uns nach und
nach zufälliges Rauschen hinzufügen, über Hunderte von Schritten. Als Designer kommt Ihnen
dieser Prozess vielleicht bekannt vor,
weil es sich dabei um die Gaußschen Weichzeichnungs - und Kornfilter Irgendwann wird es
statisch, wie TV-Fuzz. Das Modell lernt, wie sich jeder einzelne
Rauschschritt auf das Bild auswirkt Das sind Tausende
verschiedener Hinzufügungen
und Entfernungen winziger kleiner Pixel Dadurch wird dem Modell beigebracht,
wie Bilder auseinanderfallen. Im zweiten Schritt lernt es, das Rauschen oder die Körnung
rückgängig zu machen. Das Modell ist darauf trainiert,
aus einem
verrauschten Bild das saubere Bild vorherzusagen aus einem
verrauschten Bild das saubere Bild Bei jedem Schritt wird eine Vermutung vorgenommen. Wenn die laute
Version so
aussieht, wie könnte das
Original gewesen sein? Es wird besser, wenn
man seine Vermutungen mit echten Bildern vergleicht und
die Gewichtung
anpasst Stellen Sie sich also einen Bildhauer der vor einem
großen Steinblock
steht Zuerst ist es nur Lärm, eine feste chaotische Masse
ohne erkennbare Form,
ein großer Steinblock Der Bildhauer beginnt nach und
nach wegzumeißeln, geleitet von Intuition,
Ausbildung und Referenzen Jeder Schlag beseitigt Unsicherheit. Langsam tauchen Formen auf, hier
eine Kurve, dort eine
Silhouette. Zeit wird das Geräusch zur Form und Form zur
Zufälligkeit des Blocks Eine detailreiche und wunderschöne
Statue wird enthüllt. Dies wird als
umgekehrte Diffusion bezeichnet. Man beginnt mit
Rauschen und verfeinert es Schritt
zu
einem kohärenten Bild. Schritt drei, die Generierung beginnt. Es ist die Probenahmephase. Jetzt, wo es trainiert ist
und
diesen Diffusionsprozess millionenfach
durchgeführt hat, können
wir mit reinem Rauschen beginnen, einer leeren Leinwand voller statischer Energie, und wir können
ihm eine Textaufforderung geben, zum Beispiel ein Golden
Retriever-Welpe mit Sonnenbrille Nun Schritt vier, Schritt für
Schritt die Entrauschung. Das Modell entfernt jeweils nur einen
kleinen Teil des Rauschens und
orientiert sich dabei an dem, was es gelernt Nach jedem Schritt ist das
Bild etwas weniger verschwommen und etwas
detaillierter Der letzte Schritt, das endgültige Bild, und es ist eine einzigartige Kreation Dies setzt sich in 50
bis 1.000 verschiedenen Schritten fort, je nachdem, wie
fein das Modell abgestimmt ist. Nach genügend Schritten wird das
Bild vollständig klar. Sie haben jetzt ein
fotorealistisches Bild , das es noch nie zuvor gegeben Es wurde ausschließlich aus Rauschen erzeugt
und von Sprache geprägt. Und die große Frage, die
sich alle stellt, ist, auf welchen Daten werden
Diffusionsmodelle trainiert? Diffusionsmodelle werden auf
riesigen Bilddatensätzen trainiert , und normalerweise müssen sie mit Textbeschreibungen,
auch
Bildtextpaaren genannt, kombiniert werden mit Textbeschreibungen,
auch
Bildtextpaaren genannt, kombiniert auch
Bildtextpaaren genannt Diese Datensätze vermitteln dem Modell nicht nur, wie die Dinge aussehen,
sondern auch, wie man
Eingabeaufforderungen visuell interpretiert Trainingsdaten
gehören häufig ein Bild, ein Foto eines Hundes mit
Sonnenbrille,
eine Bildunterschrift oder Beschreibung wie einem Golden Retriever mit
Sonnenbrille Durch diese Kombination kann das Modell
lernen, wenn jemand das sagt.
Das Bild
sieht wahrscheinlich so aus Das Modell betrachtet dann
Bildtextpaare für Millionen und Abermillionen von Bildern in der gesamten
Bildbibliothek, die es verwendet Woher hat es also diese Millionen und
Abermillionen von Bildern? Das ist eine
weitere wichtige Frage, die viele
urheberrechtliche Probleme
aufwirft, die wir später noch eingehen werden. Aber lassen Sie uns über
einige dieser Datensätze sprechen, und verschiedene Modelle
verwenden unterschiedliche Datensätze Da ist also der Leon Five B, und das sind 5 Milliarden Bild-Text-Paare, die aus dem Internet stammen Also, irgendwo im Internet
schnappt sich alles, was es kann. Ein Bild, das eine
Textbeschreibung hat, wird es holen. Open Images, das sind 9
Millionen Bilder mit Beschriftungen,
Begrenzungsfeldern und Bildunterschriften Da sind Coco, 330.000
beschriftete Bilder mit detaillierten Bildunterschriften Es sind 100.000 Millionen flackernde Bilder mit Metadaten. Aus diesen Trainingsdaten
lernt
das Diffusionsmodell, wie verschiedene
Objekte und Konzepte aussehen, welche Stile es gibt. Handelt es sich um einen Cartoon Ist es realistisch oder
visuell dargestellt, wie Sprache visuellen Elementen wie
Furry, Glowing oder Bow House zugeordnet wird Und weil einige
dieser Diffusionsmodelle Trainingsdaten
verwenden, die
überall im Internet verfügbar sind, gibt es enorme ethische und rechtliche Überlegungen, über die
man nachdenken muss Und ich werde
eine spezielle Lektion haben der alle
rechtlichen Probleme im Zusammenhang mit Tools
zur
Bilderzeugung
und Möglichkeiten zur Umgehung dieser Probleme behandelt werden, um sicherzustellen, dass die von
Ihnen verwendeten Dinge sicher zu verwenden sind. Einige Trainingsdaten können also urheberrechtlich geschützte oder
von Künstlern geschaffene Werke
beinhalten, und viele Künstler
haben
Bedenken geäußert , dass ihr Stil ohne Zustimmung
nachgeahmt wird diesem Grund werden Modelle mit ethischen Grundsätzen
wie Adobe Firefly nur mit lizenzierten oder
gemeinfreien Inhalten entwickelt Wir werden die rechtlichen Probleme mit
Bildgeneratoren in
den
kommenden Lektionen ausführlich erörtern rechtlichen Probleme mit
Bildgeneratoren in
den kommenden Da jeder Datensatz
einzigartig ist und jedes Modell einen anderen Datensatz
verwendet, gibt es unterschiedliche Stile, Eigenschaften
und Persönlichkeiten, die verschiedene Tools zur
Bilderzeugung verwenden. Zum Beispiel
war Mid Journey sehr beliebt, als die Tools zur
Bilderzeugung ein
paar Jahren auf den Markt kamen, und sie tendieren dazu Künstlerarbeiten
überall im Internet zu testen, nicht so sehr nur allgemeine
Google-Bildarbeit Sie
nehmen also mehr von Künstlern und Künstlerarbeiten Sie werden also sehr künstlerisch, fantasievoll,
surreal Sie priorisiert Stil gegenüber Realismus
. Und es sieht oft aus wie
digitale Gemälde, Konzeptkunst und stilisierte
Zeitschriftenbilder Wenn Sie also nach etwas
Hochtechnischem und Wissenschaftlichem
suchen , Md Journey
möglicherweise nicht das richtige Tool für Wenn Sie jedoch nach einem
wirklich groben Charakterkonzept suchen wirklich groben Charakterkonzept um sich dann zu personalisieren, dann ist dies möglicherweise
das richtige Tool für Sie Aber es hat auch die meisten
rechtlichen Probleme, und es war das, das am häufigsten verklagt
und von der
Künstlergemeinschaft am meisten angegriffen wurde und von der
Künstlergemeinschaft am meisten angegriffen Und wir werden
darüber sprechen, wie verhindert werden kann, dass die Werke von Originalkünstlern
gestohlen werden, indem Sie diese Tools verwenden Es gibt viele verschiedene
Dinge, die wir tun können, um dem, was wir
generieren,
unsere eigene Persönlichkeit hinzuzufügen was wir
generieren,
unsere eigene Persönlichkeit , um es
einzigartig und zu unserem eigenen zu machen Und ein anderes Beispiel ist Dali, das Tool zur Generierung von
Hat-GPT-Bildern Und ich werde es während des gesamten Kurses
am häufigsten verwenden , weil ich damit viele
großartige Ergebnisse erzielt habe damit viele
großartige Ergebnisse erzielt Und es ist hervorragend darin,
komplexen Textanweisungen exakt zu folgen, und es liefert klare,
kohärente und anschauliche Es eignet sich also gut für
Storytelling, Cartoons und
redaktionelle Stile, und ich fand es wirklich gut für
Logo-Ideen Eonardo ist ein weiteres
Tool, das großartig ist, weil es einige kostenlose
Optionen bietet, die Sie Es ist nicht so hochwertig wie das kostenpflichtige
GPT-Bilderzeugungstool Dolly Open AI Chat, das ich verwende, aber es ist eine großartige
Alternative, die kostenlos ist, und wir werden später
darüber sprechen, welche Optionen kostenlos und welche
kostenpflichtig sind Aber es eignet sich hervorragend für Filme,
Fantasy-Spiele oder
Konzeptkunst und wird
häufig für Produktmodelle, RPG-Assets und UI-Spieldesignelemente verwendet RPG-Assets Es ist stilisiert und dennoch originalgetreu. Firefly von Adobe ist das zugänglichste, das ich gerne verwende, da die
meisten Designstudenten ein Adobe-Abonnement
haben Sie können
also innerhalb von Photoshop auf
Firefly zugreifen,
aber auch außerhalb von Photoshop mit
ihrem eigenständigen
KI-Bilderzeugungstool ihrem eigenständigen
KI-Bilderzeugungstool Ich habe mit Firefly gemischte
Ergebnisse erzielt. Es könnte etwas schwierig sein, es dazu zu
bringen,
Ihre Aufforderung wirklich zu verstehen . Manchmal ist es
großartig und manchmal nicht Und ich werde
Firefly als Beispiel verwenden, aber es
hat zu gemischten Ergebnissen geführt Ich finde, es gibt bessere Tools, aber dieses ist für
Designer am leichtesten
zugänglich , weil ihr
bereits Adobe-Tools verwendet Hoffentlich werden sie immer
besser,
und es gibt einen Grund, warum es im Vergleich
zu anderen Modellen Probleme hat. Es hat einen der sichersten
Datensätze, auf denen es trainiert. Es verwendet Bilder, die
alle urheberrechtlich frei sind. Ihnen allen wurde die
Erlaubnis erteilt , im KI-Tool
verwendet zu werden. Sie können also alles
, was auf
Firefly generiert wurde , für Kundenarbeiten
oder für kommerzielle Zwecke Ich kann nicht dasselbe für
einige der anderen KI-Modelle sagen. Das ist es also, was es einzigartig macht, aber es schränkt auch seine Bibliothek ein. Sie hat eine viel kleinere Bibliothek , in der sie sich weiterbilden
kann, weil sie nur lizenzierte Werke verwenden kann bereits eine
Genehmigung erteilt wurde. Aber mit wirklich guten Fähigkeiten im
schnellen Schreiben können
Sie dieses Problem
umgehen. Wie Sie sehen, stehen so viele
Tools zur Bilderzeugung zur Auswahl. Ich werde mich nur auf eine Handvoll
konzentrieren, aber ich hoffe, diesen
Kurs so zu unterrichten, dass er zeitlos ist. Ich werde dir beibringen, wie man Stichwörter und
Eingabeaufforderungen schreibt. Und wir werden uns alle möglichen
tollen kreativen Wörter einfallen lassen, die
wirklich dazu beitragen, dass unsere Eingabeaufforderungen und unsere
Arbeit hervorstechen CT. C..
4. Sofortiges Schreiben: KI ist nicht magisch. Sie erreicht Ihren Verstand
nicht und leitet auch keine vagen Ideen ab. Es interpretiert das, was Sie sagen wörtlich Aus diesem Grund
machen der Wortlaut, die Struktur und die Details Ihrer Aufforderung
den Unterschied aus Eine aussagekräftige Aufforderung kann
den Unterschied zwischen
einem generischen Ergebnis und einem stilisierten
Meisterwerk Cloud-Output versus etwas mit Emotionen, Textur oder Geschichte M. gegen Wow. T. Schnelles Schreiben ist
kreative Richtung. Stellen Sie sich schnelles Schreiben
so vor, als würden Sie
einem hochqualifizierten, aber
buchstäblichen Assistenten Anweisungen geben einem hochqualifizierten, aber
buchstäblichen Assistenten Je klarer und kreativer Sie das Thema,
die Atmosphäre, den Stil
und den Inhalt kommunizieren die Atmosphäre, den Stil
und den , desto näher kommt das Ergebnis Ihrer
Vision Beim schnellen Schreiben geht es nicht
darum, die KI zu hacken. Es geht darum,
wie ein Designer zu kommunizieren. Prompt Engineering
ist der Prozess präzise
und detaillierte Anweisungen
zusammengestellt Genau wie bei der Auswahl von Schriften oder der
Anordnung einer Komposition ist das Schreiben von
Eingabeaufforderungen nuanciert Die Reihenfolge der
Wörter kann von Bedeutung sein, und wir wissen das, weil wir
verstehen, wie LLMs funktionieren, um
das nächste Wort auf der Grundlage
der Wörter davor vorherzusagen das nächste Wort auf der Grundlage
der Der Ton Ihrer Formulierung
beeinflusst die Stimmung. Modifikatoren wie filmisch,
hyperreal oder traumhaft Wir werden uns später mit
einigen sehr spezifischen
Modifikatorwörtern befassen einigen sehr spezifischen
Modifikatorwörtern Gute Prompt-Autoren wiederholen, optimieren und lernen die visuelle
Sprache des Modells, ähnlich wie Designer
Farbtheorie oder Rastersysteme lernen Greg Brockman, Präsident von OpenAI, stellte
ein präzises vierstufiges Framework für das Schreiben ein präzises vierstufiges effektiver KI-Eingabeaufforderungen vor. Dieser Ansatz legt Wert auf
Klarheit und Struktur KI-generierten Antworten
zu verbessern Geben Sie Ihr Ziel klar an. zunächst genau an, was Sie zunächst genau an, was die KI erreichen soll. Erstellen Sie beispielsweise
drei unterschiedliche
Logo-Konzeptideen für eine
nachhaltige Kaffeemarke namens Green Brew, die sich an
umweltbewusste junge
Berufstätige im Alter von 25 bis 35 Jahren richtet . Geben Sie das gewünschte
Ausgabeformat an. Definieren Sie, wie die
Informationen dargestellt werden sollen. Präsentieren Sie beispielsweise jede Logo-Idee mit einem kurzen
beschreibenden Namen,
einer kurzen Begründung, vielleicht
zwei oder drei Sätzen, und schlagen Sie geeignete
Farbpaletten
und Typografiestile und Als Nächstes legen Sie Einschränkungen und Leitplanken fest. Geben Sie alle Einschränkungen oder spezifischen Anforderungen an, die als
Richtschnur für die Reaktion der EI dienen sollen Vermeiden Sie beispielsweise zu komplexe oder
illustrative Designs Halten Sie sich an eine minimalistische, moderne Ästhetik, die für
Digital First Branding geeignet ist, und
stellen Sie sicher, dass die vorgeschlagenen Schriften über Google
Fonts oder Adobe Fonts
verfügbar sind über Google
Fonts oder Adobe Fonts
verfügbar Stellen Sie kontextbezogene
Informationen bereit, teilen Sie zusätzliche Hintergrundinformationen
oder Präferenzen der KI
zu helfen, ihre Reaktion
darauf anzupassen Zum Beispiel
legt die Marke Wert auf ethische Beschaffung, Umweltverantwortung und eine anspruchsvolle, aber aufgeschlossene Persönlichkeit
. Das Design sollte bei
jungen Berufstätigen Anklang finden , die
Wert auf Nachhaltigkeit, aber auch auf Stil und Komfort Auf diese Weise erhalten Sie viel
spezifischere Ergebnisse , aus denen Sie viele Erkenntnisse
gewinnen können Natürlich sind Details ein großer
Teil des schnellen Schreibens. Wir haben bereits früher gelernt, wie
wichtig der Kontext für LLMs ist. Im letzten Teil
unserer vierteiligen Aufforderung erhielten
wir
kontextbezogene Informationen gehen Bei der Erklärung
des Markenethos, der demografischen
Zielgruppe
und des gewünschten Aussehens können wir viele, viele Schritte
tiefer demografischen
Zielgruppe
und Wir müssen immer noch alle
Recherchen für das Markendesign durchführen, aber KI gibt uns ein
Sprungbrett für Ideen und ermöglicht es uns, Bereiche zu erkunden wir vielleicht nicht selbst erforscht haben
. Das Interessante an
KI ist, wie sehr man
gleichermaßen mit ihr zusammenarbeiten muss, um etwas
Wertvolles und Einzigartiges zu schaffen Denken Sie daran, dass sie auf einem Datensatz
trainiert wird der auf menschlichen neuronalen Netzwerken
und Denkprozessen
basiert, sodass sie Kreativität nachahmen kann, aber sie weiß nicht, wie sie
alleine kreativ sein kann Es braucht deine Anleitung als ausgebildeter
Designexperte und Wegweiser Aus diesem Grund freue ich mich, Ihnen mitteilen zu können,
dass all unsere Bemühungen, das
Erlernen von Designtheorie, Farbe, Layout, Typografie, Fotografie, Zuschnitt, Farbkorrektur,
Hierarchie, Designgeschichte
und Stilen, absolut notwendig
sein werden, um
etwas von brauchbarem Wert herzustellen Wir sind die Art Directors. Wir müssen uns KI als
neues Softwaretool
vorstellen , das uns hilft, aber wir haben immer noch das Sagen. Lassen Sie uns für einen Moment aufhören,
für LLMs zu schreiben. bevorstehenden Markendesign-Projekt können wir mithilfe von LLMs mehr
Ideen entwickeln und Brainstorming betreiben In einem bevorstehenden Markendesign-Projekt können wir mithilfe von LLMs mehr
Ideen entwickeln und
Brainstorming betreiben
. Aber lassen Sie uns vorerst dazu übergehen,
effektive Aufforderungen für
die Bild- und Videoerstellung zu schreiben effektive Aufforderungen für Ich möchte Ihnen die
Entwicklung einer Schuhaufforderung zeigen. Was sind also die
Bausteine
einer starken Aufforderung? Also
hier ist ein Beispiel. Ein futuristischer Sneaker
und der Stil von Bau House treffen auf
Streetwear-Mode mit neonfarbenen Farbverläufen, reflektierenden Oberflächen
und dramatischen Schatten, als Modell einer Produktpräsentation
für Instagram
gerendert wurden Lass es uns aufschlüsseln.
Also, was ist das Thema? Es ist ein
futuristischer Sneaker Wir können sehr detailliert angeben, um
welche Art von Sneaker es sich handelt. Zweitens legen wir
einen Stil oder Einfluss fest. Welchen Kunststil oder welche
Referenz wünschen Sie sich? Also habe ich über Bau House
meets Streetwear Fashion gesprochen. Zwei verschiedene Stile
verschmelzen miteinander. Und wir brechen es
weiter auf, wir fügen Details hinzu. Wie sollte es aussehen und
sich anfühlen? Dazu gehören Texturen, Farben, Beleuchtung und Stimmung. Für dieses Modell
haben wir Neonverläufe, reflektierende Oberflächen
und dramatische Schatten verwendet Wir haben nicht nur Schatten gesagt. Wir sagten dramatische Schatten.
Wir haben nicht Oberflächen gesagt. Wir haben wirklich darauf geachtet, dass
wir detailliert sind. Schließlich das Format Medium. Welches Format ist das? Ein Poster, ein Logo, eine Illustration, ein Beitrag in den
sozialen Medien. Was wir gesagt haben, ist,
dass wir es
als
Modell für Produktpräsentationen für Instagram rendern wollten als
Modell für Produktpräsentationen für Wir waren sehr spezifisch in Bezug auf die
Art der Ausgabe und das Format, in dem
wir sein wollten Also beginnen wir mit der
einfachen Aufforderung eines Schuhs. Ich habe ihm nichts erzählt sondern nur
ein Bild von einem Schuh generiert. Es gab keine Details,
es gab keinen Kontext, einen Schuh. Also was es tun wird, es
wird sich auf der Grundlage all der Trainingsdaten etwas
einfallen lassen, was es für einen Schuh
hält. Es ist nur ein weißer Schuh. Es ist nicht charakteristisch. Es ist kein bestimmter
Schuhtyp. Lassen Sie uns also unsere
Eingabeaufforderung ein wenig bearbeiten. Lassen Sie uns einige weitere Details hinzufügen. Ein moderner Sneaker mit von
Bohuse inspirierten Formen. Jetzt
kommen also ein bisschen
Formen und Farben in Okay, lassen Sie uns ein
bisschen genauer gehen. Ein moderner Sneaker mit von Bau House inspirierten Formen und
neonleuchtenden Rändern Lege es auf einen schwarzen Hintergrund. Jetzt legen wir den
Hintergrund und die Szene fest. Das haben wir noch nie gemacht. Und jetzt legen wir
sehr genau fest ,
wie die Linien aussehen müssen. Sie werden Neonfarben leuchten, und es wird trotzdem die Bauhaus-Form
beibehalten Lassen Sie uns tiefer graben. Lassen Sie uns einen modernen Sneaker
mit von Buhuse inspirierten Formen neonleuchtenden Rändern machen,
ihn auf einen schwarzen Hintergrund legen.
Der Sneaker ruht auf
einem glänzenden, Der Sneaker ruht auf dreidimensional
gerenderten Wasser mit
zusätzlichen von Bohuse inspirierten zusätzlichen von Bohuse Ich erzähle also mehr
Details über den Hintergrund
und sage auch, und sage auch Er wird
auf etwas Wasser ruhen. Also werden wir
das noch weiter vorantreiben. Ich sage ihm, dass ich einen
bestimmten fotografischen Blickwinkel haben möchte. Anstatt nur einen Schuh zu haben, bei dem
man die ganze Seite sieht, möchte
ich einen Winkel von drei Vierteln haben, also füge ich
das der Aufforderung hinzu. Ich möchte mehr Details hinzufügen. Ich möchte, dass es
regnet, und ich möchte, die Regentropfen auf
das Wasser treffen dass
die Regentropfen auf
das Wasser treffen, auf dem es ruht und
auf den Schuh
, damit er reagiert Ich sage dir, lass es nicht
einfach regnen,
sondern ich will, dass die Regentropfen herunterkommen und
darauf Lassen Sie uns mehr und
mehr Details damit überlagern. Ich möchte, dass ein Teil des Wassers
über
die Schuhsohle steigt und wie eine Welle im Sturm
darauf spritzt. Ich möchte, dass die
Lichteffekte von hinten
beleuchtet werden und holographische Lassen Sie uns also zwei weitere Überarbeitungen hinzufügen. Also habe ich die gleiche
Aufforderung wie zuvor gemacht,
aber ich füge hinzu, dass
alles gleich bleibt,
aber die Schnürsenkel so geändert werden, dass
sie goldfarben Mach das Gold glänzend und hell. Aber machen Sie es auch so, dass die Perspektive
leicht verzerrt ist. Machen Sie die goldenen
Schnürsenkel reflektierender, fügen Sie mehr Wasserspritzer und
Blitze dahinter Ich sage im Grunde
dramatischer. Schließlich möchte ich, dass mehr Wasser aus dem Wasser
spritzt Ich möchte,
dass das Neon
des Schuhs im Wasser stärker reflektiert wird Ich möchte, dass im Hintergrund ein
Blitz zu sehen ist. Ich möchte, dass dieser Schuh immer
noch die ausgefallenen Formen hat. Ich will das Neonlicht. Ich will, dass der Schuh dezenter
ist. Ich, mehr, mehr Ich füge mehr Details hinzu
, übereinander
und mache das Ganze noch
einzigartiger, und mache das Ganze noch als es ursprünglich war Der beste Weg, detaillierte
Eingabeaufforderungen zu schreiben und zu lernen, wie das geht, besteht darin, andere Beispiele zu studieren Es gibt so viele
fantastische Beispiele für das
Schreiben von Aufforderungen , die Sie online finden
können Im Moment besteht kreativer
Wert für diejenigen, die
sehr detaillierte, effektive Aufforderungen
für visuelle Bilder und Videos schreiben können sehr detaillierte, effektive Aufforderungen , sodass die
Leute für
bestimmte Aufforderungen Gebühren erheben können , um
ganz bestimmte Bilder zu produzieren Es wird heute eher
als Kunst für sich angesehen, genauso kreativ wie das Skizzieren
eines Bildes oder das Erstellen eines Logos Warum? Weil es enormen Aufwand erfordert, effektive Aufforderungen zu
schreiben Die verwendeten Wörter, die Art und Weise, wie wir den Hintergrund
einrahmen, die Umgebung ist so, als würde man
eine neue kreative Sprache sprechen,
und diejenigen, die wissen, wie man die Sprache
spricht Deshalb habe ich einige
wirklich coole Ressourcen für Sie zusammengestellt . Bevor wir uns mit
dieser Ressource befassen, werde
ich Ihnen einige Beispiele für das Prompt-Schreiben aus
der Praxis zeigen . Lassen Sie uns sie aufschlüsseln.
5. Beispiele aus der Praxis: Ich habe diesen auf Instagram gefunden. Das hat also diesen
wirklich tollen Faser-, Stickerei- und Garnlook. Und sie haben Logos genommen
und konnten diese spezielle Aufforderung
auf viele verschiedene
anwenden. Schauen wir uns also eine
Eingabeaufforderung an. Und Sie werden feststellen, dass die
Aufforderungen, die wirklich, wirklich gut sind, diese großen, langen,
klobigen, detaillierten Absätze sind.
Lassen Sie uns das also aufschlüsseln Erstellen Sie ein sehr
detailliertes strukturiertes Logo für einen Markennamen aus
dickem Garn oder Wolle Sie legen also
das
Thema fest und beschreiben es Jeder Abschnitt des
Logos sollte eine andere lebendige Farbe die dem bereitgestellten
Referenzbild
entspricht, und Referenzbilder sind ebenfalls
sehr wichtig. Mit diesen können wir praktische
Projekte durchführen. Das Garn sollte eine
Strickstruktur mit
deutlich sichtbaren Fasern haben , die
ein weiches , dynamisches
Drei-D-Aussehen ergeben. Und natürlich hat das Logo einen
dreidimensionalen Effekt mit Schattierung, die es
wie ein gestricktes Stück Stoff aussehen lässt wie ein gestricktes Stück Stoff Wir sprechen also speziell
darüber, welche Art von Garn, welche Farbe und wie es aussieht Und jetzt werden wir
die Szene und den Hintergrund festlegen. Der Hintergrund sollte also
neutral oder hell sein,
damit die lebendige
Garnstruktur zur
Geltung kommt und gleichzeitig die einzigartige Identität der
Marke zur Geltung Wenn wir also diese Aufforderung
aufschlüsseln, besteht
sie aus den
vier verschiedenen Ebenen ,
über
die wir zuvor gesprochen haben Sie legen
das Thema fest, Sie geben ihm Kontext, Sie geben ihm
Hintergrundinformationen
und Sie geben es in
dem Format an, und Sie geben es in in dem Sie es haben
möchten Das nächste
hätte ich wirklich in
meiner
Masterclass für Grafikdesign für Fortgeschrittene verwenden können, in der ich euch
beigebracht habe , wie man ein Fast-Food-Poster
erstellt, und ich musste zu pexels.com gehen,
um ein kostenloses Foto zu finden. Aber es war sehr begrenzt. Am Ende habe ich
etwas gefunden, das funktioniert. Aber was ist, wenn ich etwas
kreieren kann, das perfekt zu meiner kreativen
Vision für das Poster passt? Und das wäre
wirklich toll für jede Art von Fast-Food-Poster oder Lebensmittelartikel
oder jedes Poster, das Sie erstellen
möchten. Jetzt können Sie mit dieser Fotografie alles erstellen
, was Sie möchten. Sie können also auch Tacos, verschiedene Arten von Lebensmitteln, zubereiten. Prompt ist nicht so lang, aber ich
denke, es ist trotzdem effektiv. Sagt, rendert ein dramatisches hyperrealistisches
Bild von, du weißt schon,
irgendwelchen Lebensmitteln, die
in der Luft schweben, mit Krümeln,
Spritzern, in Bewegung gefrorenen Partikeln Verwenden Sie kräftige Randbeleuchtung,
Makrofokus und einen hellen
Hintergrund in beliebiger Farbe, um Energie und Kontrast hinzuzufügen Sie stellen also fest
, dass einige
dieser kreativen Keywords , wenn sie weggelassen werden, der KI wirklich ein
Stilgefühl geben , nach dem sie
in ihren Referenzen suchen müssen. In diesem Fall also
Felgenbeleuchtung, Makrofokus. Und in der Luft schwebend
und hyperrealistisch. Sie kennen vielleicht nicht
viele dieser Wörter, aber wir
werden
einige wirklich nuancierte
Wörter durchgehen, um uns zu helfen ,
diese wirklich seltsamen Wörter zu finden
, von denen wir vielleicht nicht wissen,
was Felgenbeleuchtung Aber das
alles werden wir hier bald untersuchen. Und ich liebe es zu sehen, wie diese hyperrealistischen
Texturen verwendet werden, besonders dieses aufblasbare aufgeblasene Objekt hier
, das man machen kann Schauen wir uns also diese Aufforderung
an. Wir können es in Aktion sehen.
Es ist sehr konsistent. Sobald Sie diese Aufforderung entwickelt
haben, können Sie einfach das Thema ändern
, und der gleiche
Stil wird ziemlich konsistent bleiben. Also, wie werden wir
das schaffen? So
haben sie es gemacht. Schauen wir uns also die
letzte Eingabeaufforderung an. Wow. Ich werde das alles nicht lesen, aber ich wollte
dieses Beispiel zeigen , wie
aufwändig das geschrieben ist und dass es wahrscheinlich
ein paar Stunden gedauert hat ein paar Stunden , die Aufforderung
zu schreiben.
Sehen Sie sich die Ergebnisse Es ist nicht das, was du wolltest.
Du musst es anpassen, die Eingabeaufforderung
ändern,
genau wie wir es
mit dem Schuhbeispiel gemacht haben mit dem Schuhbeispiel Wir mussten zurückgehen, Sachen hinzufügen, Sachen hinzufügen, Sachen hinzufügen, die Details
hinzufügen Das sind Stunden, und
deshalb ist das Schreiben Aufforderungen eine kreative
Kunst für sich Lassen Sie uns hier also vielleicht einige
der wirklich nuancierten spezifischen
Keywords hervorheben der wirklich nuancierten spezifischen , die
sie verwenden Sie verwenden also aufblasbare
transparente Objekte. Sanft im Wasser schwimmen, damit es nicht in rauem Wasser ist, also bildet es quasi
den Hintergrund Es hat also glatte,
gewölbte Oberflächen und
dicke, sichtbare,
heißversiegelte Nähte Also lass mich dir sagen,
wie spezifisch das ist. Sie
müssen also fast nachforschen, wie Kunststoffgegenstände hergestellt werden
und welche Begriffe über Kunststoff bestehen. Manchmal muss man also
zu HachPT gehen, nach aufblasbarem Kunststoff
suchen, sich über den Prozess
informieren, um sogar zu wissen, wie man eine Aufforderung schreibt, wie man Plastik
nachahmt So detailliert
wird das Zeug also. Also gibt es Turbulenzen,
Luftblasen, schwache Wellen, weiche Wir werden gleich etwas über Ätzmittel lernen, aber hier dreht sich alles um etwas über Ätzmittel lernen, aber hier dreht sich alles Ich wusste davon nichts,
bis ich anfing, mich eingehend mit Schlüsselwörtern
für das Schreiben von Eingabeaufforderungen zu befassen Hier ist ein weiteres gutes
Beispiel für das Schreiben von Eingabeaufforderungen. Dies ist in einem
vakuumverpackten, versiegelten Beutel. Schauen wir uns also an,
wie man diesen Effekt erzielt. Erstellen Sie also ein
hyperalistisches Bild mit hoher Auflösung und Sie werden
immer wieder dieselben Schlüsselwörter sehen, hyperrealistisch, hochauflösend, denn das
sind diese kleinen
Schlüsselwörter, die plötzlich im Gehirn des KI-Modells klicken und sagen:
Okay, das ist die Art von
Fotos, nach denen ich suchen muss Aber ich wollte
in diesen kleinen Bereich gehen und Kondensation
oder kleine Falten
um die
Druckpunkte herum
einbauen, Kondensation
oder kleine Falten
um die
Druckpunkte herum
einbauen um den Realismus zu Wie schön ist das geschrieben? Am Ende können Sie
diese visuellen Details also
mit einem Doppelpunkt sehen . Es wird also viele
visuelle Details auflisten , mehr als
das, was es bereits getan hat. Also zerkleinerter, transparenter oder
metallischer Vakuumplastik, Objektsilhouette, sichtbare
und extreme Details, grelles Licht zur
Betonung von Textur und Form, typografische Überlagerungen, Codes und stimmungsvolles Branding, Stil der
Produktdarstellung, Stil der
Produktdarstellung Es sorgt also für die
Hintergrundstimmung, experimentelle, ausgefallene,
helle, natürliche Beleuchtung als
Sammlerstück, und verstärkt die
lebendigen Farben und sorgt für ein sauberes, filmisches und realistisches Aussehen Wunderschön geschrieben
und die Aufforderung sieht natürlich fantastisch aus Ich musste diese Aufforderung ausprobieren. Das habe ich bekommen. Dieses
Tastaturbeispiel war wirklich toll, weil ich dachte
, dass sie
mit diesen zusätzlichen Schlüsselwörtern wirklich beschrieben haben, was sie wollten. In diesem Fall sagten
sie also, sie wollen ein
enges Zwei-mal-Zwei-Raster. Sie sagten einfach nicht,
zeig mir eine Tastatur. Sie sagten, ich will
ein Zwei-mal-Zwei-Raster. Also zwei Schlüssel oben,
zwei Schlüssel unten. Und noch etwas anderes ist, dass sie über isometrische Winkel
gesprochen haben Das ist also die
Kameraansicht und der Fokus. Es hat diesen isometrischen Winkel. Falls ihr studiert habt, habe
ich euch schon einmal
isometrisches Design beigebracht Also das ist ziemlich
beliebt, was die Aussicht angeht. Das Hochladen von
Referenzbildern ist also wirklich toll. Also luden sie
ein Referenzbild eines Fotos hoch, das sie
von einer Coca-Cola-Dose aufgenommen hatten, und fügten als Aufforderung ein
hochauflösendes Bild dieses Objekts hinzu, das in ein paar weißen Wolken schwebt ein paar weißen Wolken Schatten in
einen strahlend blauen Himmel
wirft Das leicht
zerkratzte, verbeulte, aber stark reflektierende,
helle, energetische Licht mit einer surrealen Und Sie können sehen, wie Sie
mit Ihren eigenen Produkten oder
Markendesign-Arbeiten, an denen Sie gerade arbeiten, viele wirklich nette Modelle erstellen
können , viele wirklich nette Modelle mit Ihren eigenen Produkten oder Markendesign-Arbeiten, an denen Sie gerade arbeiten Für dieses letzte Beispiel hat
es mich wirklich dazu inspiriert, es mich wirklich dazu inspiriert einige Stichwortsuchen nach ähnlichen Lichtern,
Texturen und Das hat also dieses schillernde
Aussehen, ein wirklich,
wirklich cooler Effekt, bei dem man fast dieses Regenbogenprisma, die
Spiegelung und Und wenn Sie nicht
wissen, ob Ihre Aufforderung,
Ihr Weg, gut genug ist, Sie Ihrer Aufforderung einen zusätzlichen
Schub hinzufügen möchten, fragen Sie
einfach Chat ChPT Es eignet sich hervorragend, um
Ihre Eingabeaufforderungen ein wenig
weiter zu verfeinern , da es weiß Arten von Eingabeaufforderungen es benötigt, um die Art von
Inhalten zu generieren, nach denen Sie suchen Obskure Beschreibungen sorgen für Einzigartigkeit und
Stilüberlagerung . Die meisten von uns Designern bleiben
dabei,
dieselben zehn oder 15
visuellen Stichwörter zu verwenden ,
vielleicht fett, dick, hell,
geometrisch, rund, um nur einige zu nennen Aber was wäre, wenn es
eine völlig neue Welt mit Tausenden
verschiedener beschreibender
kreativer Wörter , die wir noch nie zuvor
erforscht haben Alles begann, als ich
die schillernde Aufforderung sah , die ich Ihnen vorhin gezeigt habe,
und ich fand,
dass der Effekt wirklich cool
aussah Ich habe es schon einmal gesehen. Ich wusste einfach nicht, wie ich es
in Worte fassen sollte. Ich werde
ehrlich sein. kannte den Unterschied
zwischen Ieszenz,
Luminanz, Biolumineszenz
und all diesen
anderen Varianten nicht, bevor ich diese Klasse erforscht Ich
kannte den Unterschied
zwischen Ieszenz,
Luminanz, Biolumineszenz
und all diesen
anderen Varianten nicht, bevor ich diese Klasse erforscht habe. Das Unglaubliche ist, dass ich in den Chat GPT oder
ein ähnliches AILLM eingeben und
es nach ähnlichen Wörtern für Idescent fragen
kann ein ähnliches AILLM eingeben und
es nach ähnlichen Wörtern . Es hat sich eine größere
Vielfalt ähnlicher Wörter ausgedacht. Ich konnte sie bitten, visuelle Beispiele für
diese besondere Beleuchtung
auf demselben Objekt zu
erstellen , damit ich ein Gefühl für
die nuancierten Unterschiede zwischen
den verschiedenen Lichteffekten bekommen kann die nuancierten Unterschiede zwischen
den verschiedenen Lichteffekten Wow. Ich wäre noch nie so tief in so
spezifische Wörter eingetaucht, und jetzt fühle ich mich wie
ein besserer Designer Ich kann jetzt
verschiedene
Lichtsituationen ausführlich beschreiben verschiedene
Lichtsituationen wenn ich meine Eingabeaufforderungen schreibe Und frage Cha GPT auch nach ganz
bestimmten, nuancierten Kunststilen, Texturen und Stimmungen, damit ich den Wortschatz meines
Designers erweitern kann Ich konnte anhand dieser
Liste intensiv
nach so vielen neuen Arten
von Texturen und so vielen neuen Arten von Texturen Ich fühle mich wie ein brandneuer Designer , der die ganze Welt zur
Hand hat Von allem, was ich für KI verwendet habe, dies das, das mich nachts wach
gehalten hat Aber auf eine gute Art möchte ich, dass
Sie persönlich in
das Kaninchenloch gehen und sich mit Begriffen des Nuance-Designs befassen, von denen Sie vielleicht noch nie zuvor gehört
haben Auf diese Weise können
Sie beim Schreiben von Eingabeaufforderungen wahnsinnig spezifisch sein nächsten Lektion gehen wir auf viele
Beispiele für Begriffe
aus dem
Nuance-Design Machen Sie sich also bereit.
6. Nuancierte Designbegriffe: Eine biometrische Skulptur
und eine vermutete Textur unter düsterem Licht mit Wabi-Sabi-Empfindlichkeit Wie um alles in der Welt können wir lernen, was das alles ist? Ich kenne
bis jetzt nicht einmal die
Hälfte dieser Begriffe , bis wir
wirklich anfangen, einige dieser
nuancierten Keywords zu untersuchen, die unsere Eingabeaufforderungen
wirklich professionell
machen können unsere Eingabeaufforderungen
wirklich professionell
machen Ich habe also diese
herunterladbare Ressource. Das
werde ich mir zusammen mit Ihnen
in diesem Kurs ansehen. Wenn Sie also Aufforderungen schreiben oder kreative Briefings
entwickeln, spiegeln
diese Wörter unsere nuancierten
Stile, Texturen
und Ästhetiken wider, die Ihre Designsprache
verbessern können, die weniger bekannt und Ästhetiken wider, die Ihre Designsprache
verbessern können, die Lassen Sie uns also daran arbeiten, unsere Designsprache zu erweitern
. Das sind also einige
und natürlich
chatten GPT und ich arbeiten
wirklich zusammen, chatten GPT und ich arbeiten
wirklich zusammen um einige dieser
sehr unterschiedlichen Stile zu verfeinern Also möchte ich
über den ersten sprechen. Dies sind einige verschiedene
ästhetische Stile und Bewegungen. Ein paar davon
möchte ich Ihnen zeigen, das biomorphe, das ist das Beispiel
am Anfang der Lektion,
eine Art organische,
klecksartige Flüssigkeit, die sich in der Natur bildet
. Und ich konnte tief
eintauchen, ich habe es gegoogelt, recherchiert und jetzt kenne ich
biomorphes Design,
das heißt, hey, ich kann drei
biomorphe D-Elemente entwickeln, um ein Markendesign-Projekt zu verwenden und
sie zu optimieren , weil mir wirklich
gefällt, wie das jetzt aussieht, besonders in einem Drei-D-Modell. Und es gibt Y2K-Kern. Ich habe also
die frühen 2000er Jahre erlebt, also wusste ich sehr viel
über den Y2K-Kern Es ist eine
Retro-Futurismus-Form der frühen 2000er,
Chrome-Farbverläufe, Chunky-Tech Chrome-Farbverläufe, Chunky-Tech Denken Sie also an Web Two Point Oh mit diesem glänzenden Look vortizistisch Es ist eckige dynamische Abstraktion,
industrielle Modernität. Das war also ein
beliebter Malstil, und ich wollte mir auf Wikipedia viele
Dinge
über diesen Stil
ansehen auf Wikipedia viele
Dinge
über diesen Wirklich cool. Wusste nicht
, dass es das gibt. Dynamik Ich habe
eine Weile gebraucht , um herauszufinden,
wie man dieses Wort sagt Es sind hochenergetische Kompositionen. Gehen wir also zu
verschiedenen Texturen und Materialbeschreibungen Also hier ist das schillernde. Es ist eine schimmernde
Regenbogen-Oberfläche, eine Farbverschiebung Ich fand das viel
besser, als nur Neon zu sagen. Ich hatte das Gefühl, dass ich ein leuchtendes
Licht nur mit Neon
beschreiben könnte ein leuchtendes
Licht nur mit Neon
beschreiben Aber jetzt habe ich Duft. Sie haben also oxidiert, und
das heißt, wenn Sie Eisen
haben, das rostet Es ist also eine verrostete chemische
Patina mit verwitterten Metallen. Das kann Ihnen den abgenutzten
metallischen Look verleihen, nach dem
Sie vielleicht gesucht haben Es gibt auch Flecken, bei
denen es sich um verstreute
Partikel oder eine glitzernde Textur handelt Partikel oder eine glitzernde Textur Und dann ist da noch De Collage. D-Collage ist also die
abgerissenen Schichten, die eine visuelle
Geschichte enthüllen Und ich habe das oft bei
Designs gesehen, bei denen
man diesen zerrissenen Look hat
und die Schichten sieht,
und
ich fand es wirklich toll, wie das aussah Ich wusste nur nicht,
dass es eine Name-D-Collage gibt. Wenn Sie also nicht viele
Kurse in Kunstgeschichte am College besucht haben, kennen
Sie
einige davon vielleicht nicht, kennen
Sie
einige davon vielleicht nicht,
aber Sie können sich jetzt von Chat
GPT helfen Dann ist da noch das
Gruselige, Groteske,
absichtlich Unangenehmes, Verzerrtes und Unbehagen Das war irgendwie
gruselig, aber hey, wir haben alle unterschiedliche
Dinge, die
wir für unsere Designstücke kreieren . Einer meiner Favoriten sind also Begriffe wie
Licht und Stimmung. Kaustik ist eigentlich
ein sehr beliebter Begriff beim Rendern von Videos und
Drei-D-Modellen,
wenn es darum geht, wie Licht mit
Wasser interagiert Und manchmal auch Glas. Es sind also gebrochene
Lichtmuster, oft unter Wasser oder Glas Ich liebe diesen Effekt immer. Ich habe einiges davon
von Hand gemalt, als ich noch digital malen
konnte,
und ich habe Wasser gemalt. Ich malte dieses reflektierte,
wackelige Gitter, und das Das ist die Untersuchung von Licht und
Brechung in Glas und Wasser Also müssen wir
das herausfinden und dem einen Namen
geben können Lassen Sie uns zu Begriffen im Kultur
- und Nischenstil übergehen. Retro-Futurismus,
eine Vintage-Science-Fiction-Grafik, die Zukunft
aus der
Vergangenheit vorstellt Da ist Wabi Sabi,
ein japanisches Konzept von Unvollkommenheit und Vergänglichkeit ein japanisches Deshalb
sieht man manchmal, dass das Gold zerbrochen ist und dass es Platten gibt
, weil sie die Unvollkommenheit würdigen wollen,
und es ist eine sehr kulturelle Sache, diese Ehre zu erweisen und es ist eine Und ich habe diesen Wabi Sabi
in letzter Zeit in vielen Prompts
gesehen ,
also muss er ein ziemlich beliebter Stil sein Es gibt also auch ästhetische
und visuelle Kompositionen. Orpismus ist also eine
lebendige Abstraktion Farbe
verwendet, um musikalische Rhythmen auszudrücken Rainismus ist also, wenn sich
Lichtstrahlen überschneiden ,
halbabstrakter Futurismus und sogar Fraktalismus. Sie haben von mathematischen Fraktalen gehört, die sich einfach bis ins Unendliche
erstrecken, rekursive Geometrien
, sich selbst ähnliche Formen und Komplexität und sogar Fraktalismus. Sie haben von mathematischen Fraktalen gehört,
die sich einfach bis ins Unendliche
erstrecken, rekursive Geometrien
, sich selbst ähnliche Formen und Komplexität sind. und sogar Fraktalismus. Sie haben von mathematischen Fraktalen gehört,
die sich einfach bis ins Unendliche
erstrecken, rekursive Geometrien
, sich selbst ähnliche Formen und Komplexität sind. Einer meiner Favoriten sind also Oberflächen, Muster und Medientechniken. Einer meiner Favoriten sind also Oberflächen, Muster und Medientechniken. Hier ist ein Vertigris
, das aus oxidiertem Kupfer besteht und uns eine
wirklich coole grüne Patina verleiht Und dann sind da noch Farbverhalten und Effekte Es ist so, als ob
man das Prisma hat, was im Grunde
der ganze Regenbogen aus
Licht ist , der
in einem engen Bereich gebrochen wird Sie haben also eine Regenbogenbrechung
mit scharfem Übergang. Sie haben also keine lockeren
Übergänge wie
lose Farbverläufe Sie sind sehr eng und man sieht sehr schnelle
Farbübergänge Diese rasende Beleuchtung,
und ich hoffe, ich spreche das
alles richtig aus, ich kann immer einen Aber Frenzl-Beleuchtung ist an Es hat also diesen coolen
Farbverlauf direkt an
den Rändern , während
alles andere
irgendwie dunkel und unreflektierend irgendwie dunkel und unreflektierend Und dann haben wir die Soap-Kultur
und den globalen Einfluss. Wir haben also den Wüstenmodernismus, Architektur aus
der Mitte des Jahrhunderts, die an trockene
Klimazonen angepasst ist trockene
Klimazonen angepasst Wenn Sie also jemals eine
Eingabeaufforderung für irgendein
Gebäude oder ein Gebäude
in einer Hintergrundszene machen , müssen
Sie ihnen sagen, dass sie den Chat GPT
oder den
Bildgenerator, den Sie verwenden Stellen Sie sicher, dass Sie angeben, in welcher Art von Gebäude
sich alles im Hintergrund befindet Seien Sie sehr genau, um welchen
Baustil es sich handelt. Und dann ist Neo Tokyo ein weiteres
sehr, sehr verbreitetes Schlüsselwort, das ich
überall sehe. Und Neo Tokyo ist diese düstere,
farbenfrohe, von Anime
beeinflusste Zersiedelung Und ich sehe das oft, wenn man futuristische Roboter hat Sie neigen dazu, dass die Leute das einfach in eine
Neo-Tokyo-Umgebung bringen
wollen .
Sie kennen mich also. Ich gehe gerne immer weiter und
weiter in das Kaninchenloch, weil ich
so eine intellektuelle Neugier
für alles Kreative habe . Also habe ich ChaHPT gefragt, was noch nuanciertere,
selten bekannte Begriffe
in Design und Kunst
sind selten bekannte Begriffe
in Design Wenn du also einen Stil findest
, der dir gefällt, was um alles in der Welt ist das, kannst
du ein
Referenzfoto für
ein LLM hochladen und es bitten, diesen Stil
mit passenden Worten zu beschreiben,
und es ist gut, dir zu helfen Ein paar meiner
seltenen Lieblingsausdrücke waren also Flocked Velvet. Ich habe einfach das Gefühl, dass ich die Hand
ausstrecken und das anfassen kann. Leucit-Kunststoff
, ein Retro-Kunststoff, eine
Art dicker,
klobiger Kunststoff, der sehr beliebt
war,
bevor sie anfingen, die wirklich dünnen Kunststoffe auf den Markt
zu bringen, die wir heute sehen Aber ich kann das oft
in Retro-Produkten sehen. Textur in Luftpolsterfolie. Ich liebe es, wie das auf Sachen aussieht. Unterirdisches Leuchten, das
Sie sich vorstellen können, wie ein Magmablock, und nur ein bisschen Magma
von innen kommt heraus,
aber es ist nicht Es ist sehr unterirdisch. Und Eisenflüssigkeit schimmert. Und haben Sie schon einmal
Öl auf einer Straße verschüttet und Sie haben eine
Art Regenbogenreflexion gesehen? Das ist genau das, was das ist. Es ist diese Reflexion
, die Öl abgibt, wo es
einen kleinen Teil
des Farbspektrums auf Sie reflektiert , aber immer noch dieses
dunkle, flüssige Aussehen hat Gehen wir noch verrückter in die Tiefe. Das sind also wahrscheinlich diejenigen, von denen
Sie noch nie gehört haben. Und wenn Sie von ihnen gehört haben, herzlichen Glückwunsch, denn
ich habe noch nichts von ihnen gehört Das sind also die
obskuresten Eingabeaufforderungen ich im Internet finden konnte,
und die Menge, die ich
gefunden habe Dies ist nur eine sehr
kleine Auswahl, die mir
persönlich gefallen hat, und ich dachte,
Sie würden sie nützlich finden, aber es gibt Tausende,
die ich nicht verwendet habe Da ist also die
Brechung des Mondscheins, ein weiches,
silbernes Licht, das sich durch
den Nebel krümmt. Sehr, sehr spezifisch Da ist eine kaleidoskopische Blüte. Wenn Sie also schon einmal
durch ein Kaleidoskop geschaut haben, ist
es chaotische zerbrochene
Lichtstreuung, photonisches Bluten, also überlappende Lichtquellen photonisches Bluten mit einer verrauschten Überlappung. Da ist magmapolierter Stein, der glatt und verbrannt ist, Obsidian gekühlte Lava trifft auf
Obsidian. Glasrinde. Ich glaube, das sage ich. Ich glaube, es ist von Vitae, was Leben bedeutet. Vitrios-Rinde ist Baumrinde mit halbtransparentem Und es gibt diese ultramodernen
konzeptionellen Themen, über die wir auch sprechen
können, den
archetypischen Glitch-Kern, also eine kaputte, symbolische Sprache. Vergessene Utopiefragmente, zerbrochene Bruchstücke gescheiterter perfekter Gesellschaften. Ich meine, wie nuanciert kann man werden? Und dann ruiniert Solar-Punk, was eine Echo-Utopie ist, die
bereits Wenn Sie also versuchen,
ein dystopisches Moodboard zu malen, dann sind dies definitiv einige Wörter, die Sie
vielleicht Als sekundäre Herausforderung für
Schüler möchte
ich, dass du die
nuanciertesten Kunststile findest Wählen Sie vier verschiedene
nuancierte Kunststile, Texturen oder Beschreibungen aus,
und ich möchte, dass Sie sich intensiv damit
auseinandersetzen Wenn es also Iudeszenz ist,
suchen Sie nach Schillern, finden Sie
heraus, was das ist, und erfahren Sie mehr darüber Und ich möchte, dass du das
mit vier verschiedenen machst. Und wenn du während
der gesamten Zeit, in der du
KI lernst oder diesen Kurs machst, jeden Tag zwei machen willst , wäre
das toll, weil du auf diese Weise wirklich anfangen
kannst,
deinen Wortschatz und dein
Designwissen zu erweitern . Jetzt verstehen wir also das Grundgerüst dessen, was man braucht, um eine solide Aufforderung zu erstellen. Und finde auch einige
dieser nuancierten Keywords heraus. Ix, es bleibt nur
noch eine Sache übrig, um die rechtlichen
Probleme beim Einsatz von KI zu erörtern Darüber muss gesprochen werden,
bevor wir weitermachen.
7. Urheberrecht und rechtliche Fragen: Woher bezieht KI also
ihre Fotos , um
solche Meisterwerke zu schaffen Es ist schwer, nicht über
den Elefanten im Raum zu sprechen. Wie wir bereits besprochen haben, Mid Journey Dali und andere KI-Tools zur
Fotogenerierung
eine riesige Menge an Fotos aus
dem gesamten Internet aufgenommen eine riesige Menge an Fotos aus
dem , um ihre KI-Bots
darin zu
schulen, ihre KI-Bots
darin zu
schulen Das bedeutet, dass urheberrechtlich geschützte
Fotos, Illustrationen
und Grafiken
zusammengestellt wurden, und Grafiken
zusammengestellt wurden um dem Bot beizubringen,
was der Benutzer möglicherweise sehen möchte Es gibt einen interessanten
Artikel, in dem behauptet wird , dass einer der Gründer
von MD Journey wusste, dass dies der Fall war, und zugab, nicht zu wissen,
was er tun sollte, um den Künstlern
das
richtige
Urheberrecht an den Bildern, die dieser AIBT Wenn du KI-Kunst
erstellst, kannst du auch
Referenzbilder hinzufügen , damit der Bot genauer beschreiben kann,
wonach du suchst Und es gibt keine Möglichkeit, Nutzer
daran zu hindern, urheberrechtlich geschützte Werke aus der
Google-Suche in die Eingabeaufforderungen
hochzuladen Google-Suche in Das heißt, wenn Sie
Bilder verwenden, die nicht über
eine Creative Commons Zero-Lizenz
oder eine Public-Domain-Lizenz verfügen eine Creative Commons Zero-Lizenz
oder eine , könnten
Sie sich der Gefahr aussetzen, verklagt
zu werden , weil Sie Kunstwerke
aus urheberrechtlich geschützten Bildern entfernen Bedeutet das also, dass KI-Tools Urhebern verletzt
haben Das würde
sich irgendwann zuspitzen. Mehrere Künstler haben sich
zusammengeschlossen , um Mid Journey auf
anderen
Kunstportfolio-Websites wie
Deviant Art zu verklagen anderen
Kunstportfolio-Websites wie , weil
es erlaubt hat, urheberrechtlich geschützte, abgeleitete KI-Werke zu veröffentlichen ohne die Autoren angemessen zu nennen
. Und es wird ein
sehr kniffliges Gerichtsverfahren werden. Einerseits
wurden KI-Tools trainiert, indem sie Daten aus dem
Großteil des Internets
, einer gigantischen
Datenquelle Es könnte schwierig sein,
einzelne
Urheberrechtsverletzungen anhand von
Bildern nachzuweisen einzelne
Urheberrechtsverletzungen anhand von , die aus einem
so großen Datensatz stammen Auf der anderen Seite
gab es
Fälle, in denen einzelne
Künstler
den Namen einer
KI-Aufforderung eingeben und klar
erkennen konnten , wie ihr Kunstwerk
zur Formulierung der Ergebnisse verwendet wurde Es ist zwar
nie eine exakte Kopie, aber man kann die Inspiration sehen Wem gehören die Werke, die
von KI-Bildgeneratoren erstellt wurden? Wenn ich eine Aufforderung in einen
KI-Text- oder Bildgenerator
einfüge, gehört mir dann die Aufforderung,
das Bild zu erstellen , oder das Bild selbst? Es ist ein komplexes Rechtsproblem, aber es lohnt sich immer, mehr darüber zu
lesen. Ein menschliches Element
muss vorhanden
sein, damit Urheberrechtsanspruch geltend gemacht werden kann. Das bedeutet, dass AI Tech nicht das Eigentum an Bildern
beanspruchen kann. KI-Kunstwerke haben
nach den
geltenden Urheberrechtsgesetzen eigentlich keinen Eigentümer, aber gemäß den
Nutzungsbedingungen einiger Programme überträgt
sie das
Eigentum an einem Bild
dem Urheber oder dem Autor, überträgt
sie das
Eigentum an einem Bild
dem der sie dazu auffordert. Aber ob Sie diesen
Urheberrechtsanspruch vor Gericht
geltend machen können Urheberrechtsanspruch vor Gericht wäre
die nächste Frage, da nichts
Drittanbieter
davon abhalten kann , Sie
vor Gericht zu bringen, weil Sie ihr Markenimage
in Ihrem KI-generierten Foto verwenden . Wir leben wirklich in einem
neuen digitalen Wilden Westen. Was tun Sie also,
wenn Sie auf Nummer sicher gehen und
das Werk
eines echten Künstlers schützen und
sicherstellen wollen Nummer sicher gehen und
das Werk
eines echten Künstlers schützen und Werk
eines echten Künstlers schützen und , dass er
die richtigen Credits erhält? Nun, zuallererst
würde ich vermeiden, bestimmte
Künstlernamen in KI-Eingabeaufforderungen einzugeben Es ist in Ordnung, historische
Namen wie Leonardo Da Vinci zu verwenden. Er ist seit vielen Jahren tot, aber ich würde keine neuen
Künstler einsetzen, die noch
am Leben sind und noch ein Vermächtnis aufzubauen haben Sie können auch sicherstellen,
dass Sie
KI-Bildgenerator-Tools von offiziellen Unternehmen verwenden ,
die sicherstellen
, dass die
Fotobibliothek, die sie zum
Trainieren ihrer Bots und zum
Generieren von Bildern verwenden , von den
Personen, denen sie gehören ,
genehmigt wird. Neben der Verwendung von KI-Tools
wie Adobe Firefly finden Sie
hier einige persönliche Best
Practices, um
diese Komplexität zu minimieren und
sicherzustellen, dass Ihre Zuallererst hat jedes KI-Tool
unterschiedliche Lizenzbedingungen,
daher ist es gut, jedes einzelne zu überprüfen Machen Sie ein LLM und teilen Sie
es für Sie auf, damit Sie die verschiedenen Begriffe verdauen und
vergleichen können Dokumentieren Sie Ihren kreativen Input
und Ihre iterativen Schritte klar und deutlich. Nehmen wir an, du machst
ein Charakterdesign. Vielleicht behältst du eine Kopie
deiner Originalskizze, die
du in ein KI-Modell hochgeladen hast. Behalte den Überblick über die
verschiedenen Eingabeaufforderungen du verwendest, um deinen Charakter zu bearbeiten und zu
ändern Seien Sie vorsichtig, wenn Sie
KI mit urheberrechtlich geschützten Charakteren,
bekannten Marken oder Ähnlichkeiten mit Prominenten auffordern KI mit urheberrechtlich geschützten Charakteren, bekannten Marken Hier können Sie in die meisten Schwierigkeiten geraten und haben
die höchste Vermeiden Sie die Verwendung von Firmennamen
, wenn Sie Ihre Eingabeaufforderungen eingeben. Vermeiden Sie es, das Nike-Logo zu verwenden, um Ideen für ein Logo zu
generieren. Vermeiden Sie es,
beim Erstellen von Bildern den Animationsstil Pixar oder Disney Ein prominentes Beispiel
dafür ist, als jemand
anfing,
den berühmten Ghibli-Stil des berühmten Animators Hao Miyazaki zu kopieren den berühmten Ghibli-Stil des berühmten Animators Hao Miyazaki Sein Stil benötigt
Hunderte von Stunden nur für ein paar
Sekunden Animation,
und die Leute gaben seinen Namen und
Stil
in Eingabeaufforderungen ein, und die Leute gaben seinen Namen und
Stil
in Stil In einem Interview
bezeichnete Miyazaki KI als Beleidigung des Lebens
an sich. Er ist der Meinung, dass
Animationen auf
menschlichen Emotionen
und Erfahrungen basieren sollten und nicht auf Algorithmen also beim Schreiben Ihrer Eingabeaufforderungen
darüber nach, Ihren eigenen
Stilmix zu kreieren, der für Sie einzigartig
sein wird Sie können sich von der Arbeit
anderer Kreativer inspirieren lassen. Wir als Kreative machen das
ständig. Wir suchen auf Instagram und
Behance nach Inspiration. Dann
kreieren wir etwas,
und wir stellen fest, dass wir einige dieser Stile
unbewusst
emulieren dieser Stile
unbewusst Das gleiche Problem
besteht bei der Verwendung von KI. Originalität zu finden
kann schwierig sein, aber das war bei uns Designern schon immer
der Fall diesem Grund studieren wir Hunderte
von Stilen, damit wir kombinieren und unseren eigenen
einzigartigen Geschmack und Faktor kreieren Du kannst
deinen eigenen Stil festlegen eine Grundskizze deiner Idee,
deines Logos
oder deines Charakters hochlädst . Verfassen sehr aufwändiger Eingabeaufforderungen , die nur von Ihnen
selbst geschrieben werden konnten Behalten Sie
bei dem, was Sie generieren, einen bestimmten Stil bei, sodass Sie die
Verantwortung für diesen Stil übernehmen Mithilfe künstlicher Intelligenz generierter Ideen
wurden diese
außerhalb von KI-Programmen und
Designprogrammen wie
Photoshop und Illustrator stark modifiziert außerhalb von KI-Programmen und
Designprogrammen wie
Photoshop und Illustrator Ich empfehle,
Kreativität in Ihrem
Arbeitsablauf hin und her Das heißt, Sie könnten
eine grobe Skizze in AI hochladen. Es hilft dir, dein Bild zu verfeinern. Sie bringen das zurück
in Adobe Illustrator oder ein anderes Vektorprogramm
und vektorisieren Dann können Sie es weiter optimieren. Sie bringen es zurück in die KI, um
zusätzliche Details hinzuzufügen oder die Ideen zu verfeinern Sie können die KI anschließend sogar um
Rat fragen , wie
Ihr Logo aussehen soll. Das wirft das
Problem auf, verklagt zu werden. Wie wahrscheinlich ist es, dass wir beispielsweise
für die Verwendung von
KI-generierten Bildern in
unseren Marketingkampagnen verklagt
werden KI-generierten Bildern in ? Das ist möglich, aber
nicht sehr wahrscheinlich. Die Person oder Firma, die die Klage
erhebt, muss zweifelsfrei
nachweisen , dass die von Ihnen
verwendeten Bilder ihren Stil genau kopieren Da
KI-Generatoren auf
Millionen und Abermillionen
von Text-Bild-Paaren trainiert wurden , bedeutet
das, dass es unmöglich ist ein Fotograf oder Designer Eigentum beansprucht, wenn Ihre
Aufforderung einzigartig genug ist Aber man könnte eine
Aufforderung schreiben, die den Stil
eines berühmten Fotografen bis ins kleinste
Detail beschreibt Stil
eines berühmten Fotografen bis ins kleinste , und sie
so generieren , dass sie diesem Stil so nahe kommt
, dass sie den Stil
dieser Person verletzt .
Das ist wirklich knifflig Es wird immer eine Grauzone
bleiben wie es immer noch
beim Logo-Design der Fall ist. Eine Sache, die Sie
tun können, ist, KI-generierte Assets regelmäßig mithilfe der
umgekehrten Bildsuche zu
überprüfen , um
potenzielle Ähnlichkeiten oder
Verstöße zu erkennen . Sie können die
KI-generierte Ausgabe
erheblich ändern , anstatt sie direkt zu
verwenden. Wenn Sie also nach einer Idee für eine
Logo-Aufforderung fragen, ändern Sie diese Aufforderung nur ein
wenig, um sie zu Ihrer eigenen zu machen. Nach der Bearbeitung können Sie KI-generierte Bilder
mit Tools wie
Photoshop oder Illustrator umfangreich mit Tools wie
Photoshop oder Illustrator Am Ende ist die große Erkenntnis, je mehr von Menschen
gesteuerte Interaktion
zwischen
den KI-generierten Inhalten stattfindet,
desto besser können Sie sich
schützen, und kurze, klare Eigentumsrechte
hängen wesentlich davon ab wie viel origineller
kreativer menschlicher Input Sie zu den
KI-generierten Bildern hinzufügen Verbessern und passen Sie Bilder immer kreativ an, um Ihr Urheberrecht eindeutig
festzulegen Stellen Sie sicher, dass Ihre endgültigen
Designs
aussagekräftige kreative
menschliche Änderungen enthalten aussagekräftige kreative
menschliche Änderungen und dass keine Bedenken
gegen Rechtsverletzungen bestehen
8. Kursteilnehmer:innen-Projekt: Ich habe also Ihr erstes
Studentenprojekt,
und das ist, ein Foto mithilfe von Eingabeaufforderungen zurückzuentwickeln Ich möchte also, dass Sie
die Referenzfotos so
genau wie
möglich nachstellen die Referenzfotos so
genau wie und sie als
Teil der Ressourcen
herunterladen können, indem Sie als
Teil der Ressourcen
herunterladen nur
KI-Tools zur Bilderzeugung und schriftliche Anweisungen
verwenden Keine manuelle Bildbearbeitung erlaubt. Auf diese Weise können Sie
üben, mithilfe von Eingabeaufforderungen ganz bestimmte
Objekte und Details zu erstellen Also hier ist die erste,
die aus drei D-Formen besteht. Ich möchte, dass du das
so nah wie möglich nachstellst. Es wird nicht exakt sein, aber Sie werden in der
Lage sein, die Eingabeaufforderungen kontinuierlich zu bearbeiten , sodass Sie langsam die Ergebnisse
erhalten, die Sie benötigen Und das zweite ist
ein amerikanisches Frühstück. Man könnte also mit zwei Eiern
beginnen und alles
im Hintergrund beschreiben,
beschreiben, dass es ein Fenster gibt,
beschreiben, dass es
fotorealistisch ist Verwenden Sie zunächst einige der Schlüsselwörter, von denen
wir gelernt haben
, um dieses
Bild beschreiben und nachahmen zu können Wählen Sie also einen beliebigen
KI-Generator Ihrer Wahl. Es könnte Adobe Firefly,
Dolly, Leonardo, hat Verwenden Sie nur Textanfragen und
versuchen Sie, das Bild zu replizieren, sodass Sie keine Referenzbilder erstellen können Und ich möchte, dass Sie sich der Komposition, der Beleuchtung,
dem Motiv, der Farbpalette,
der
Textur und dem Stil
annähern Beleuchtung,
dem Motiv, der Farbpalette, der
Textur und dem Stil Und Sie können so
oft wiederholen, wie Sie benötigen, und Ihre besten
Prompt-Versionen im Auge
behalten , wenn Sie mit einer Geldstrafe belegt wurden
9. BONUS! Nano Banana Pro - Können Sie Real oder KI erraten?: Google Nano Banana
Pro ist gerade herausgekommen und die Ergebnisse sind verrückt Die Art und Weise, wie KI Beweise dafür
hinterlässt, dass sie KI ist,
wird langsam schwieriger zu erkennen Es macht es viel einfacher zu betrügen, die Vergangenheit zu
ändern, Menschen zu betrügen und zum Narren zu halten. Natürlich hat es seine Vorteile
für diejenigen, die wissen, wie
man Für Photoshop 2026 kündigte
Adobe eine
Partnerschaft mit Google an, um Nano Banana
als Drittanbieteroption in
sein generatives Füllwerkzeug
aufzunehmen als Drittanbieteroption in
sein generatives Füllwerkzeug Jetzt ist eine neue Option
in Nano Banana Pro verfügbar. Dies ist eine kostenpflichtige
Option, wenn Sie sie in Google Gemini verwenden würden . Adobe hat sie
jedoch derzeit für die Verwendung von Adobe
Photoshop
zur Verfügung gestellt derzeit für die Verwendung von Adobe
Photoshop
zur Ich habe noch nie so
tolle Ergebnisse
mit dieser Option gesehen , viel besser als mit dem bereits ziemlich
guten Nano Banana der ersten Generation Da es sich um eine
Premium-Option außerhalb von Adobe handelt, bestraft
Adobe Sie ein wenig für die Verwendung dieses
Dano Banana Pro Es kostet zehn Credits
pro Generation für eine Auflösung von einer bis 2000 und 16 Credits für eine Auflösung von 4.000 Creative Cloud Pro bietet Ihnen
4.000 Generationen pro Monat. Adobe Creative Pro kostet in meiner Gegend
70$ pro Monat, Sie
zahlen
also definitiv dafür Sie können also genauso gut einige
dieser Credits verwenden und mit diesem Tool
experimentieren Also möchte ich ein
kleines Spiel mit dir spielen. Ich habe die meisten dieser Bilder
mit Google Nano Banana Pro generiert mit Google Nano Banana Pro mit Ausnahme
von ein oder zwei. Ich möchte sehen, ob Sie
mir sagen können, welches
mit KI generiert wurde und welches ein echtes Foto
ist. Ich habe das mit meinem Mann gemacht, und er ist kläglich gescheitert.
Lass uns sehen, wie es dir geht Bitte schreibe in die Kommentare,
wie viele du richtig verstanden hast. Ich werde Sie nach jedem einzelnen wissen lassen, wie Sie
den Unterschied zwischen
real und KI erkennen können. Jetzt werden wir
mit einer der einfacheren beginnen . Dies ist eine der wenigen,
die mein Mann richtig verstanden hat. tut mir leid, Schatz. Also
, welche ist deiner
Meinung nach echt und welche
ist deiner Meinung nach KI? Gib dir einfach ein paar
Sekunden, um darüber nachzudenken. Und es geht nur ums Heranzoomen. Wenn Sie also nicht hineinzoomen
können, ist
es sehr schwierig zu
sagen, ob es sich um KI handelt oder nicht den ersten Blick würde ich
denken, vielleicht die auf
der rechten Seite. Es sieht fast zu gut aus, aber die Beleuchtung,
die ist wirklich nett. Und ich bin keine Astronautin, also weiß ich nicht, ob ihre
Ausrüstung stimmt oder Vorne scheint es ziemlich
kompliziert zu sein. Aber andererseits scheint der auf
der linken Seite sehr überzeugend zu sein. Aber lassen Sie uns heranzoomen und
herausfinden , welcher echt ist
und welcher nicht. Wenn wir also das Bild vergrößern
, das aussieht, als ob es aus den 80ern
stammt, ist das sehr glaubwürdig,
weil
es in
den frühen 80ern Frauen gab , die anfingen im
Astronautenprogramm
zu trainieren Aber schauen Sie sich dieses Abzeichen an. Typografie in Texas, wo
KI immer noch Probleme hat, selbst mit Nano Banana Pro Das einzige, was ich jemals mit
hundertprozentiger Genauigkeit erfassen
kann , ist, wenn
es um Typografie geht Es ist nicht absolut
klar und deutlich. Das merkt man an einem NASA-Abzeichen. Auch hier oben
konnte man sehen, dass es kleine Löcher hat, fast
so, als wäre es abgenutzt, aber ich kann sehen, dass es einfach mit der Typografie zu
kämpfen hatte, und das ist nicht das
offizielle Logo Außerdem, wenn du dir das Gesicht dieses Typen
ansiehst,
müssen es Zwillinge sein, weil
es genau derselbe Typ ist Also, wenn Sie genau
denselben Kerl haben, hoch sind die Chancen,
Zwillinge im Weltraumprogramm zu haben? Wahrscheinlich sehr minimal.
Aber es ist sehr beeindruckend. Schau an die Decke.
Schau dir die Holzverkleidung Die Details sind ziemlich gut. Und auf den ersten Blick würde
ich denken,
dass dies ein echtes dokumentiertes Foto ist. Das rechte
ist ein echtes Foto und das linke ist
KI. Warst du überrascht? Gehen wir zum
nächsten. Lasst
uns mit diesem etwas härter werden. Hier haben Sie also zwei
Standard-Filmsets, eines mit Tom Cruise auf der linken Seite und das andere
mit Pedro Pascal und einigen anderen berühmten Schauspielern Welches Filmset ist echt
und welches ist falsch? Und das könnte
eine Trickfrage sein. Also ich möchte, dass du sie
dir ansiehst, und sie sehen wirklich überzeugend aus. Also lass uns einen Blick darauf werfen. Die einzige Möglichkeit, das
wirklich herauszufinden, besteht darin, heranzuzoomen und sich die Texturen
anzusehen. Dieser ist also super überzeugend. Schau dir die Kameraarbeit an, sieh dir den grünen
Bildschirm an, sieh in den Himmel. Man kann es nicht wirklich sagen. Schau dir dieses Gebäude an. Es ist nicht verzogen Es ist nicht verzerrt. Das
sieht überraschend gut Schauen Sie sich diesen Bodenbelag an. Es gibt keine Fehler
im Bodenbelag. Wenn man sich die Schuhe anschaut, kann
man bis zu einem ha nicht wirklich
viele Fehler erkennen. Schau dir diesen Rand hier an. Das ist ein komplett von KI
generiertes Bild. Je weiter Sie hineinzoomen, desto mehr können
Sie diese
sich wiederholende Textur sehen, fast wie eine rechnerische
Textur genau hier. Wenn Sie die gesamte
Kachel vergrößern . Das
ist nicht natürlich. Das ist keine natürliche Textur. Also plötzlich,
wenn man hineinzoomt, fängt
man an, all
die kleinen Fehler zu sehen. Vielleicht fehlt ihm ein Finger, aber du könntest einfach sagen:
Nun, er beugt sich in eine Richtung. Wenn man herauszoomt, kann man es nicht wirklich erkennen, aber wenn
man hineinzoomt, schon. Es gibt auch tatsächlich ein Foto, das auf Red it gepostet
wurde, wie ein echtes oder künstliches Red-it-Formular. Und es gab eine Menge
professioneller Kameraleute , die auf tonnenweise
Probleme mit dieser Kamera hingewiesen haben. Wenn Sie also Filme machen, können
Sie tonnenweise Fehler feststellen. Außerdem wies jemand darauf hin, dass dieser grüne Bildschirm nicht genau den gleichen Winkel hat, der
hier erscheint , wie er
tatsächlich angezeigt wird. Und das größte Werbegeschenk für mich, oder das, was die meisten Leute sehen
könnten
, ist hier oben
im Gerüst Es gibt eine wirklich
seltsame Verkabelung und Biegung Das war also ein totes Werbegeschenk. Aber wenn man rauszoomt, ist
das so überzeugend. Aber wenn man hineinzoomt, kann
man es immer erkennen. Was ist mit dem auf der linken Seite? Dieser ist ziemlich überzeugend. Ich meine, er
sieht ungefähr in seinem Alter aus. Vielleicht ist das ein
7 Jahre altes Foto oder ein 10 Jahre altes Foto, auf dem er etwas für
Mission
Impossible filmt Nun, wow. Das
sieht ziemlich gut aus. Die kleinen Details sind noch übrig. Siehst du diesen Mann, der das Foto hält. Wir haben die Kabel, eine Menge natürlicher, menschenähnlicher Details übrig. Man kann sie sogar am Set
beim Naschen mit Keksen
und Kaffee sehen und sogar
dieses kleine Logo auf seiner
Jacke und sogar eine Stecknadel haben dieses kleine Logo auf seiner
Jacke und sogar Es scheint alles sehr überzeugend bis Sie erkennen, dass es sich auch um KI
handelt Noch einmal, die Kamera , diese Kamera
gibt es im wirklichen Leben nicht. Sie könnten eine
umgekehrte Bildsuche durchführen und
versuchen, diese Kamera zu finden, und Sie werden sie nicht finden können weil sie überhaupt
nicht existiert. Aber dieser war wahrscheinlich
einer der schwierigeren. Es gibt nicht diese
Omega-offensichtliche Art, dass es KI ist, aber wie Sie sehen können
, hat Google Nana,
Banana das wirklich auf fast sehr beängstigende Weise
auf den Kopf Also ja, sie sind beide KI. Aber die auf der linken Seite ist tatsächlich viel überzeugender,
wenn Sie hineinzoomen. Also wirklich gruselig. Also gut, all ihr
kreativen Leute. Lass uns eine machen, die auf dich
zutrifft. Eine davon ist eine echte Skizze und eine davon ist KI. Welcher ist welcher? Ich gebe dir einen Moment
, um darüber nachzudenken. Schau dir alle Details an und ich werde einige
davon vergrößern, damit sie es sehen können. Nun, sie
sehen beide aus wie Skizzen. Schauen wir uns das auf der
linken Seite an. Es könnte KI sein, aber
es ist schwer zu sagen. Das sieht ziemlich echt aus. Wenn es KI
wäre, hätte ich wirklich Angst. Es gibt viele führende Linien. Es gibt viele menschliche
Experimente, wenn es darum die Formen
der Typografie
herauszufinden Ich weiß es nicht. Es ist ziemlich
nah dran. Wie wäre es mit dem anderen? Das sieht wirklich
überzeugend aus mit dem
abgenutzten, zerkauten Stift Aber ist es zu zerkaut? Ich meine, wer hat eigentlich
einen Stift, der so schlecht ist? Was ist mit dem, das
sieht aus wie ein wirklich, wirklich, wirklich
seltsam geformter Aber die Skizzen selbst
sind etwas zu scharf. Ich sehe diese führenden Linien, was
mich dazu bringt, zu denken: Nun, vielleicht ist das real, denn diese führenden Linien,
wie kann eine KI das machen? Weißt du, das ist nur
etwas, was ein Zeichner tut, um zu versuchen, die Symmetrie
herauszufinden Entweder ist er ein wirklich
talentierter Zeichner
oder er ist zu symmetrisch. Sogar der kleine Staub, kleine Bleistiftstaub
oder Radiergummistaub
hinterlässt , ist wirklich
überzeugend den der kleine Bleistiftstaub
oder Radiergummistaub
hinterlässt, ist wirklich
überzeugend. Also
welcher ist welcher? Okay, also die auf der linken Seite ist eigentlich eine Studentin von mir, Amber Axelton, sie hat
das im Rahmen eines
Branding-Projekts gemacht das im Rahmen eines
Branding-Projekts Also der auf der linken Seite ist echt und der auf der
rechten Seite ist absolut KI Die Skizzen haben einen ziemlich
dunklen Ton. Normalerweise
hat der Bleistift also nicht diese dunkle Farbe, und nur
jemand, der
in seinem Leben viel skizziert hat, wird das irgendwie
erkennen können Und das wird
das Problem mit KI sein wenn nur Branchenexperten in dem, was Sie sich ansehen, in der
Lage sein können, wissen Sie was? Ich denke, das ist falsch. Für mich sieht es einfach ein bisschen
zu ausgefeilt aus. Wer mag kein
gutes Schachspiel? Eines davon ist echt, und eines davon wird von
Google Nano Banana
Pro generiert . Welcher? Ich gebe dir ein paar
Sekunden, um es herauszufinden. Ja. Okay, also auf den ersten Blick scheint
dieser auf der rechten Seite sehr KI-generiert zu sein. Es ist super ausgefeilt und
hat diese Hyperreflexion, fast so, als wäre es mit
einem wirklich guten
Drei-D-Programm wie Blender
generiert worden einem wirklich guten
Drei-D-Programm wie Blender Und wenn ich hineinzoome, kann ich
einige Details des Pferdes erkennen ,
das sehr seltsam aussieht und mich an KI erinnert Und schauen wir uns das andere
an. Der andere scheint
irgendwie natürlich zu sein. Ich sehe ein
paar Holzstücke , die irgendwie abgeplatzt sind Es hat einfach eine
Menge natürlicher Textur. Und wenn man sieht, wie
das Licht darauf trifft und reflektiert, wirkt
es sehr,
sehr, sehr natürlich. Und die Stücke scheinen eine organische natürliche Textur zu haben. Es gibt sogar einen Hintergrund , der
mit einigen Untersetzern,
einigen gestapelten Büchern
und einer Kaffeetasse überzeugend aussieht einigen gestapelten Büchern
und einer Kaffeetasse Also welcher ist echt
und welcher ist ahi? Dieser hat
jeden getäuscht, den ich versucht habe. Das Bild auf der
linken Seite ist also eine
KI, die von Google
Nano Banana Pro generiert wurde, und das Bild auf der
rechten Seite ist ein Foto Es wurde in Photoshop
etwas aufgehellt, aber es ist größtenteils ein
intaktes Originalbild Überrascht dich das? Schockiert dich
das in irgendeiner Weise? Wurdest du getäuscht?
Also hier haben wir zwei scheinbar normale
Bilder von Obst, aber eines davon ist gefälschte KI, und eines davon ist
ein echtes Foto Nun, welches ist
Ihrer Meinung nach KI und welches
ist Ihrer Meinung nach ein echtes Foto? Ich verspreche, sie sind nicht beide KI. Sie sehen beide aus wie KI. Aber schauen wir uns
diesen auf der rechten Seite an. Es scheint super glänzend, fast ein bisschen zu glänzend. Es fühlt sich fast so an, als wäre es ohne Grund
glänzend. Es hat einfach diesen zusätzlichen Glanz , der sich ein
bisschen künstlich anfühlt. Der Tisch selbst und die Textur
sehen ziemlich überzeugend aus. Die Schale, sonst nichts
ist wirklich unförmig. Das könnte echtes Obst sein. KI tut sich schwer mit Stängeln und herauszufinden, wo
diese Dinge auf Früchten landen. Es ist irgendwie überzeugend, aber dieser Glanz bringt
mich ab Okay, was ist mit dem auf
der linken Seite? Ich meine, ich glaube, so wie
es vielleicht in
den 80ern oder späten
90ern aufgenommen wurde oder so. Er hat einen sehr
überzeugenden Kühlschrank. Es hat Medikamente
auf der Arbeitsplatte. Es gibt viele Dinge, die man
einfach in einer zufälligen Küche sehen würde. Sogar die Magnete sind intakt. Da ist ein Stück
Papier drauf. Es sieht alles überzeugend aus. Der Schatten ist richtig,
weil das Licht von
oben kommt und nach unten scheint. Und es hat sogar diesen 14.
August, den 96. Es würde wirklich zu
einer Küche nach Art von 96 passen. Lassen Sie mich also heranzoomen und sehen ob ich sehen kann, ob
das KI oder echt ist. Oh, ich glaube, ich habe es gefunden. Schau, siehst du diesen kleinen Aufkleber? Ohne diesen Aufkleber würde es
mir
schwer fallen
herauszufinden, würde es
mir
schwer fallen
herauszufinden ob das KI ist oder nicht Aber auch hier ist es für KI wirklich
schwierig,
Aufkleber, Logos, Abzeichen und Typografie Das sieht also nicht natürlich aus. Aber alles andere tut es, und das ist wirklich schwierig. Das rechte
ist also ein echtes Foto, das ich auf Wikipedia gefunden habe, und das
linke wurde
mit Google Nano Banana generiert . Also, welches dieser Fotos
ist echt und welches ist KI? Beide scheinen in den 50ern oder 60ern
aufgenommen worden zu sein. Sie sind in einem Auto. Die auf der linken Seite scheint für ein Foto übersättigt zu sein, aber sie
hätte Der auf der rechten Seite
scheint ziemlich überzeugend zu sein. Aber welche ist KI
und welche ist real? Okay, das Bild auf der rechten Seite wurde mit
Google Nano Banana generiert. Es ist also KI und das
linke Foto ist das echte Foto.
Bist du überrascht? Hat dich irgendwas
an den Gesichtszügen zu
der
Annahme verleitet, dass es sich um KI handelt? Also, dieser ist ein
bisschen anders. Das ist ein echtes
Geburtstagsfoto von einer Torte, die ich gemacht habe, und es zeigt den Geburtstag
meines Sohnes und meiner Nichte Sind sie neun und sieben geworden, oder sind sie acht und sechs geworden? Das wäre die große Frage. Eines davon wurde
mithilfe von Google na Banana geändert, wobei nur ein
Element geändert wurde, nämlich die
Geburtstagskerzen. Welches ist nun
überzeugender? Ich denke, der knifflige
Teil an diesem ist , dass
wir uns das auf
der linken Seite ansehen. ist also so ein
komisch aussehendes Ding mit
den Neun passiert, fast so, als wäre es kaputt und es wirkt nicht übernatürlich Mein erster Instinkt
wäre also zu sagen:
Okay, das ist das von der
KI generierte Bild Und lass uns
zum anderen übergehen. Das sieht also
fast zu poliert aus. Wenn du es dir ansiehst, gibt es
fast keine Fehler. Nicht einmal ein bisschen Textur
vom Wachs der Kerze. Das lässt mich denken, dass dies
definitiv das von der KI
generierte Foto ist. Und wenn das der
ist, den Sie vermutet
haben, dass sie
neun und sieben geworden sind, haben Sie recht.
Das ist das echte Foto Und das falsche und das modifizierte sind
die Acht und Sechs. Es ist beängstigend, wie wir
Fotos aus der Vergangenheit ändern und den
Menschen eine völlig
andere Geschichte darüber vermitteln können Fotos aus der Vergangenheit ändern und den
Menschen eine völlig
andere Geschichte darüber vermitteln , was passiert ist. Das könnte wirklich beängstigend
sein. Wir können sagen, dass wir uns mit
Leuten verabredet haben, mit denen wir uns nie verabredet haben, oder wir haben eine Quittung für ein
Produkt, das wir nie gekauft haben. Das ist das Gruselige an KI. Noch eine
Bonusrunde nur zum Spaß. Ist das ein echtes Foto
oder ist es eine KI, die
von Nano Banana generiert wurde? Auf den ersten Blick eine sehr
überzeugende Reflexion. Schau dir an, wie
sich alles widerspiegelt. Das wirkt sehr
authentisch und real. Schau dir an, wie es draußen
regnet, und du kannst den
Regen auf den Straßen sehen Die Autos sehen
ziemlich normal aus, aber ist das dasselbe Auto
Rücken an Rücken? Ich weiß es nicht. Ich fange an zu zweifeln
, ob es echt ist oder nicht. Ihr Haar scheint überzeugend zu sein. Die Beleuchtung, alles
scheint wirklich natürlich. Schau dir auch die Details
der Ausrüstung an. Ich kann keinen Fehler
beim Stricken finden. Aber lassen Sie uns wie immer
jede Art von Typografie,
Schrift oder Text finden , die wir finden können Was ist es, süßes Gras zu beschimpfen? Ich weiß nicht, was das
ist, aber diese Typografie sieht nicht natürlich Alles andere daran ist
zu klein, als dass ich es lesen könnte, aber das ist das Werbegeschenk Das ist ehrlich gesagt das einzige
Werbegeschenk auf dem gesamten Foto. Sie können hineinzoomen und sich
umschauen, aber es ist schwer, einen anderen Grund zu
finden Wenn sie also kein Buch in der Hand hätte, wenn sie
etwas ohne Text in der Hand hätte, wäre es sehr schwer
herauszufinden, ob es echt oder künstlich ist. Aber ja, das ist KI. Ich hoffe, Ihnen hat dieser
kleine Einblick in den
Versuch gefallen , herauszufinden, was
echt und was falsch ist. Es wird also immer
schwieriger und Google Nano Banana,
das Zeug, das ich daraus mit
sehr einfachen Eingabeaufforderungen in einem Satz generiert
habe sehr einfachen Eingabeaufforderungen in einem Satz war ziemlich unglaublich
und ziemlich überzeugend Und ich könnte mir vorstellen, dass
wir in
ein oder zwei Jahren all
diese kleinen KI-Artefakte löschen werden, und das wird sehr schwierig
sein,
ohne ein
super geschultes Auge zu ohne ein
super geschultes Auge Trainiere also weiterhin dein Auge, zoome auf 800% heran und sieh dir diese feinen Details,
Texturen, Muster und
Konsistenzen Definitiv Typografie. Bitte hinterlasse unten einen
Kommentar, ob dir das
gefallen hat und wie
viele du bekommen hast, oder? Oder wenn Sie etwas falsch verstanden haben, sind Sie
über einen von ihnen überrascht? Wir sehen uns im nächsten Video.