Transcription
1. Introduction du cours: Beaucoup de choses ont changé dans le domaine de l'IA au
cours des dernières années. Quand il est
sorti, la plupart d'entre nous, moi y compris, l'
avons vu comme une nouveauté. Jusqu'à
présent, les modèles d'IA ont évolué
au point qu' peuvent presque reproduire un
créateur humain ils
peuvent presque reproduire un
créateur humain ou du moins le tromper
temporairement Presque toutes les grandes entreprises
technologiques
ont investi des milliards
dans le domaine de l'IA, ce qui a permis d'améliorer modèles, la formation
et la recherche en matière d'
IA. On craint que l'IA ne prenne le relais du travail d'une
personne créative. Cette crainte est bien réelle,
et les photographes, les graphistes
et les illustrateurs ont le droit de s'inquiéter un peu J'ai décidé de créer
un cours de théorie de l'IA qui atténue cette peur J'ai passé des centaines
d'heures à utiliser les derniers outils
et modèles d'
IA, et j'ai bon
espoir que l'IA sera un merveilleux complément
à nos propres compétences
créatives. Ce cours constitue un bon point de
départ pour tout créateur ou designer qui souhaite en savoir plus
sur les bases de l'IA, coulisses du fonctionnement
de plusieurs modèles d'IA, tels que les
outils de génération d'images et les modèles d'IA de chat, les bases de l'écriture
rapide et la rédaction d'instructions efficaces, apprentissage de
termes de conception nuancés qui nous fournissent le vocabulaire approprié pour créer des images
hyper détaillées Nous discuterons également
des questions juridiques, et plus encore. Apprendre à écrire
des instructions, c'est comme
réapprendre à écrire quand on était enfant Nous commençons par des instructions de base qui décrivent légèrement
ce que nous voulons, et finalement, grâce à la pratique, nous sommes en mesure de décrire
correctement et
en détail notre vision
en utilisant des mots que nous
n'aurions peut-être jamais pensé à utiliser Ce cours peut plaire à presque tous ceux qui ont
été intimidés ou dépassés par l'IA et qui ne savaient pas par où
commencer pour apprendre les bases Ce cours est
spécialement conçu pour les créatifs et les concepteurs afin de vous
aider à comprendre
les bases de l'IA, afin que vous puissiez commencer à
réfléchir à la manière utiliser ces outils incroyables aider
à vous adapter aux évolutions futures de
l'industrie créative J'espère que ce cours
sera un tremplin pour les prochains cours qui porteront sur des
projets de conception pratique utilisant l'IA Mais d'abord, nous devons
comprendre les bases de son fonctionnement et c'est exactement ce que ce cours
vise à faire. Je vous verrai lors
de la première leçon. Je m'appelle Lindsey Marsh, et mon métier est d'enseigner
la théorie du design. Je suis
graphiste depuis plus de 20 ans et design à plus de 350 000 étudiants en graphisme Je suis ravie de pouvoir vous
présenter ce cours aujourd'hui.
2. Comment fonctionnent les LLM Work: Générons un
cardinal rouge sur une branche. Comment ce générateur d'images a-t-il
su montrer un oiseau ? Comment savait-il que l'oiseau était
rouge et qu'il était accroché à une branche ? Comment savait-il à quoi ressemble
une succursale ? agit d'un système complexe qui exécute des millions et des millions de calculs matriciels
précis pour produire ce qui semble magique. Pour vraiment avoir une bonne idée
de la façon dont cela se produit, nous devons d'abord comprendre comment modèles d'
IA comprennent le langage
humain, pour ensuite comprendre comment il
générera des images. Alors, qu'est-ce qu'un LLM ? Un LLM ou un grand
modèle de langage est un type d' intelligence
artificielle
formé pour comprendre et générer le langage
humain Des outils tels que le chat GPT, Claude et Google Gemini sont des
exemples de LLM sont de grands modèles linguistiques J'utiliserai le chat GPT
tout au long du cours, qui est également l'un des LLM les
plus populaires du marché. On dit qu'ils sont volumineux
parce qu'ils sont formés à d'énormes
quantités de texte, agisse de
livres, d'articles, sites Web, de
conversations en ligne, etc. L'objectif est d'apprendre comment
les humains communiquent, la structure de
nos phrases, la grammaire, le ton, le style et même l'intention. L'IA peut donc réagir d'une
manière qui semble naturelle et utile. Sue, pourquoi les LLM sont-ils importants
pour des designers comme nous
et pour d'autres créatifs ? pour des designers comme nous
et pour d'autres créatifs Parce que les LLM sont bien plus que de
simples assistants d'écriture. Voici quelques façons dont ils peuvent vous aider ou
concevoir des flux de travail. Tout d'abord, la génération d'idées. Vous avez besoin d'un concept, d'un slogan
ou d'une orientation de campagne. Il suffit de demander. Rédaction. Les LLM peuvent aider à rédiger
des publications sur les réseaux sociaux, des slogans, des descriptions de produits, etc. Slips créatifs Vous pouvez obtenir de l'aide pour structurer ou modifier des documents destinés aux clients Naming : générez des
noms de marque, des noms de produits, des titres de
projets, tout
en vous basant sur le ton et les mots clés. Mais plus
que cela, l'apprentissage fonctionnement des LLM nous permet comprendre l'outil essentiel
pour
les concepteurs au cours de
la prochaine décennie Les outils de
génération d'images et de vidéos que nous utiliserons
tout au long du cours. Dans le cours, nous allons donc nous concentrer
sur deux types de modèles d'IA. Le premier est celui que nous venons de mentionner, le modèle de langage large ou LLM, qui est finalement intégré
à un autre système, appelé modèle de diffusion
d'image Et le
modèle de diffusion d'images est ce qui
nous aide à générer des images à partir de texte. Par exemple, il peut
reconnaître qu'Apple est lié aux fruits sans qu'on
lui ait explicitement enseigné ce lien. Cette capacité à
interpréter le langage est essentielle pour les outils de
génération d'images, que nous explorerons
tout au long du cours. Avant qu'une IA puisse créer l'image
d'un chien qui aboie, elle doit d'abord comprendre ce qu' est
un chien et ce que
cela signifie d'aboyer Ainsi, le grand modèle linguistique apprend, comprend
et génère langage
humain en
analysant d'énormes quantités de texte et en trouvant des
points de connexion entre eux. Ensuite, des
instructions sont introduites dans un modèle d'image à fusionner qui génère des images guidées par des modèles
appris pendant l'entraînement Il s'appuie souvent sur un LLM pour d' abord comprendre et
interpréter l'invite textuelle, en la
convertissant en jetons
significatifs qui guideront le processus de
génération visuelle Parlons maintenant du
fonctionnement des LLM. Imaginez-le comme une saisie semi-automatique
surpuissante
qui non seulement
termine vos phrases,
mais peut également vous aider à rédiger des essais, à
répondre à des questions, à
concevoir des instructions et même à vous aider à créer une image de
marque et à rédiger des articles À la base, les LLM sont des machines
probabilistes. Lorsque vous posez une question, ils
calculent les mots les plus susceptibles de venir ensuite fonction de tout ce
qu'ils ont appris. Par exemple, c'est comme un designer
chevronné tellement habitué aux tendances, aux besoins des
clients et aux mises qu'il peut presque deviner ce que
le client veut ensuite, avant
même qu'il ne le lui dise, parce qu'il l'a fait encore
et encore La prochaine étape consiste à générer
des jetons et du contexte. Les LLM ne voient donc pas
une phrase complète. Ils les cassent en petits
morceaux appelés jetons. Les mots, une partie des mots ou même la ponctuation sont importants. Même la pureté à la fin en
est le gage individuel. Ils examinent ensuite le contexte, le texte qui l'entoure pour
déterminer ce qui est susceptible de se produire ensuite. Ensuite, il passe par
plusieurs couches et processus. LLM possèdent des millions,
voire des milliards de neurones, unités
mathématiques qui
traitent le langage en couches Chaque couche affine la
compréhension du sens, tout comme un processus de
révision créative Passons donc en revue ce
processus plus en détail. Prenons donc un exemple d'invite. Et cet exemple est créer
une image d'un chien à fourrure. Il est donc bon de diviser
chaque mot en jetons. Créez donc son
propre jeton distinct et l'image d'un chien qui aboie De temps en temps, cela
divise un mot. aboiements peuvent donc
être des aboiements, puis, et les points peuvent également être
considérés comme des jetons Ainsi, chaque mot ou jeton
reçoit un point vectoriel. Les LLM ne comprennent pas
les mots comme les humains. Ils représentent plutôt les
mots sous forme de vecteurs, qui sont comme de longues listes de nombres, parfois longues de 12 000. Ces nombres capturent la
position d'un mot dans un immense espace invisible
appelé espace d'intégration ou
espace vectoriel Chaque mot devient un point dans l'espace où des mots similaires
sont placés à proximité les uns des autres. Dans notre exemple rapide, les mots chien et aboiement seraient proches l'un de l'autre
sur cette carte, car indiquaient fréquemment
qu'ils étaient associés données
indiquaient fréquemment
qu'ils étaient associés
ensemble pendant l'
entraînement Cet exemple utilise un espace à deux D, mais les modèles d'IA ont
50 000 mots à cartographier. Il n'y a donc pas beaucoup de place. Donc,
il cartographie tout dans un espace vectoriel en trois D. C'est pourquoi chaque jeton ou mot
se voit attribuer une longue liste de chiffres, qui indiquent l'emplacement exact sur
une carte vectorielle en trois D. Ces colonnes de chiffres sont des coordonnées qui
permettent aux mots de
se retrouver et donc développer des associations et un
langage humain entre eux. Imaginez un nuage tridimensionnel géant, sauf qu'il a en fait
des milliers de dimensions
dans cet espace. Des significations similaires sont
plus proches les unes des autres. King est donc proche de Queen, et Paris est proche de la France. Et designer est proche d'autres termes tels que créatif,
visuel et artistique. Les différentes significations
sont plus éloignées les unes des autres. King est donc loin d'
Apple parce que King et Apple n'apparaissent pas
beaucoup ensemble dans le
texte et le langage humains. La luminosité de la lumière est
un domaine
différent de celui de la légèreté,
selon le contexte. Cette carte de signification
est construite pendant l'
entraînement au fur et à mesure que le modèle apprend
comment les mots apparaissent dans leur contexte. Les LLM ne comprennent pas les
mots isolément. Ils considèrent plutôt
les jetons qui les entourent. Ainsi, par exemple, le concepteur a utilisé des couleurs claires dans la mise en page. Ici, la lumière est interprétée comme une
luminosité en raison de la proximité des
jetons, de la couleur et de la disposition. Mais le sac à dos est très
léger et facile à transporter. Maintenant, léger signifie
pas lourd, grâce à des termes contextuels
tels que sac à dos et transport. Le modèle ajuste dynamiquement la compréhension en fonction du contexte, grâce à un
mécanisme appelé attention Parlons donc de l'attention. Contrairement aux anciens modèles qui traitaient
chaque mot indépendamment, l'
attention, qui fait partie d'
une couche de transformation plus vaste, à
laquelle nous allons accéder, est
un autre processus
qui permet au modèle d'examiner tous les autres mots de
la phrase et de se demander, lequel d'entre eux
dois-je
faire attention pour comprendre
ce que signifie ce mot ? Cela permet au modèle de peser
les mots différemment en fonction de leur pertinence par rapport
au mot qu'il génère
ou analyse. C'est comme si un designer examinait l'intégralité
d'un moodboard avant prendre une
décision concernant
un seul élément de mise en page. Parce que le sens
dépend souvent du contexte. Par exemple, le mot « banque » peut avoir des significations très différentes. Elle s'est assise au bord de la rivière. La fonction d'attention
met en évidence le mot rivière. Il a effectué un dépôt à la banque. Attention,
le mot « dépôt » est maintenant mis en évidence. Le modèle utilise
l'attention pour se concentrer sur les mots
qui précisent le sens correct. Ensuite, les données, une
fois prises en
compte, passent par de nombreuses autres couches de traitement
différentes. Et bon nombre de ces
calculs de matrices
mathématiques que vous pouvez voir en arrière-plan
se
produisent des millions et des
millions de fois. La prochaine étape est donc le réseau neuronal à
transmission directe. Donc, après attention, le vecteur mis à jour de chaque
jeton sur cette petite carte en trois D que je
vous ai montrée maintenant est enrichi
avec plus de contexte. Il passe par un
petit réseau neuronal appelé couche feedforward Ce réseau applique une transformation mathématique
au vecteur. Il ne mélange pas
les jetons entre eux. Chaque jeton est traité ici
de manière indépendante. Considérez-le comme une
étape de raffinement qui permet de distiller des modèles
plus significatifs à partir
des informations associées Il s'agit de le peaufiner,
de l'ajuster peaufiner et de l'améliorer avant qu'
il ne soit transmis. Je voulais prendre un
moment pour faire une pause. Il s'agit d'un processus
mathématique très complexe comportant de nombreuses couches qui traitent les données
à plusieurs reprises. Il n'est pas nécessaire
d'être mathématicien pour
comprendre leur fonctionnement Je voulais juste
vous montrer un petit guide détaillé sur la façon dont ils
suivent les processus, mais vous n'avez en aucun cas besoin de le
mémoriser ou de le connaître
de fond en comble. Cela nous aide simplement plus tard lorsque nous écrivons des instructions pour savoir ce qui se passe
réellement dans les
coulisses comment nos mots sont
traités L'étape suivante est celle des
connexions résiduelles, sautez les connexions. Cela permet de s'assurer que le modèle n'oublie pas les informations
d'origine. Il utilise des connexions résiduelles. Il s'agit de petits
raccourcis qui
réintroduisent le vecteur d'entrée d'origine dans la sortie
de chaque couche. Cela empêche le modèle
de remplacer des informations
utiles par un
trop grand nombre de transformations C'est donc un peu comme
modifier un dessin, mais en conservant la version originale comme couche de sauvegarde dans Photoshop. Encore une fois, vous
n'avez pas besoin de connaître les mathématiques sous-jacentes à tout cela, savoir qu'il s'agit d'un processus très
complexe qui se produit et pourquoi l'IA
semble parfois magique. De nombreux
freins et contrepoids sont mis
en place pour
s'assurer que le produit est vérifié et revu. Une autre couche est appelée normalisation des
couches, et il s'agit d'une étape de nettoyage Cela permet de stabiliser
l'entraînement et maintenir la
cohérence des données entre les couches. Cela garantit que le modèle ne
soit pas trop biaisé avec des valeurs extrêmes. Par exemple, cela revient à
ajuster les niveaux d'une photo pour uniformiser l'éclairage avant passer à la retouche suivante. Nous empilons donc de plus en
plus de couches de traitement. Et les transformateurs ne le
font pas en une seule fois. Ils répètent tout ce
processus plusieurs fois 12, 24 ou même 96 fois
selon la taille du modèle. Cela va passer
par l'attention. Il va passer par le
flux du réseau neuronal, les connexions résiduelles,
la normalisation des couches, et il se répète encore et encore Ainsi, chaque couche permet une compréhension plus nuancée
du langage humain Ainsi, les couches inférieures, la
compréhension de structures telles que la grammaire et
la ponctuation, les couches intermédiaires, reconnaissance du sens
et de la relation, et certaines de ces couches
supérieures de traitement qui sont ensuite utilisées pour
le raisonnement, planification et l'exécution des tâches Ainsi, par exemple, c'est
comme passer d'un croquis à illustration
raffinée, puis à
une identité de marque complète. Et nous avons un résultat final. Après avoir parcouru
toutes les couches,
le vecteur final
est utilisé pour prédire le prochain jeton pour la génération de
texte, jeton signifiant un mot, pour classer quelque chose comme un
sentiment ou un sujet, ou pour guider la génération d'images, comme dans un modèle de diffusion, dont
nous parlerons ensuite. Nous ne faisons qu'esquisser la surface
du fonctionnement des modèles LL. Mais si vous
voulez vraiment devenir beaucoup plus technique et vous
plonger dans les mathématiques, bien
sûr, ce cours n'est pas du
tout obligatoire. Vous pouvez voir trois
bleus et un brun sur YouTube. C'est ainsi que j'ai appris
les détails des modèles d'IA pour la première fois, et j'ai trouvé en lui un
très bon professeur. Nous avons donc assisté à cette
combinaison complexe de traitements. Les vecteurs représentant les mots passent par de nombreuses couches
de traitement des données. Finalement, ils atteignent une matrice de
probabilité dans laquelle le modèle détermine quel mot est le plus susceptible de sortir ensuite. Bien que les
mathématiques sous-jacentes soient complexes, ce que vous
devez vraiment comprendre, c'est quel point
ce processus est complexe. Chaque mot est
décomposé, analysé,
recoupé uns par rapport aux autres par le biais de multiples
freins et contrepoids internes. Le résultat est
presque magique, comme si la machine comprenait
et interprétait réellement le langage humain Ce même type d'
intelligence en couches est également à l' origine de la génération d'
images biais d'un processus
appelé diffusion, que nous explorerons
dans la prochaine leçon. Assurez-vous de télécharger
la ressource PDF qui passe en revue tout ce
dont nous avons parlé dans cette leçon.
3. Comment fonctionne la diffusion d'images: Les générateurs d'images et de vidéos basés sur l'intelligence artificielle
ont séduit Internet ces dernières années
grâce à leur capacité à fusionner des objets, des sujets et à
remettre en question les normes sociales La négativité qui entoure
ces outils
d'IA se dissipe lentement à
mesure que les créatifs commencent à réaliser à quel point ils peuvent être
essentiels pour suivre rythme de l'évolution
du secteur Aujourd'hui, nous apprenons
comment
fonctionnent les générateurs d'images étape par étape, afin de pouvoir voir la magie
qui se cache derrière le rideau. Alors, comment fonctionnent ces outils de
génération d'images basés sur l'IA ? Ainsi, du langage aux images, comment la compréhension des LLM
vous aide à apprendre les modèles de diffusion Dans la dernière leçon, nous avons donc passé 12 bonnes
minutes à découvrir LLM et la façon dont ils
traitent les jetons Ils créent un contexte,
ils attirent l'attention et ils génèrent des prédictions. En apprenant cela,
vous avez déjà jeté les bases pour comprendre fonctionnement des modèles de diffusion. Alors que les LLM génèrent des mots, modèles de
diffusion
génèrent des images
et reposent sur bon nombre des mêmes idées fondamentales, et reposent sur bon nombre des telles que
le traitement
en couches, espaces vectoriels de
grande dimension, les représentations sous forme de
jetons et les résultats basés sur les probabilités Le lien clé est la
prédiction en tant que mécanisme de base. Au cœur des LLM et modèles de
diffusion se trouve une idée
simple mais puissante Apprendre à prédire
quelque chose en fonction du contexte. Dans les LLM, le modèle
prédit le mot suivant. Dans les modèles de diffusion, le modèle apprend à prédire une version
plus nette de l'image étape par étape,
du bruit à la clarté. Les deux systèmes affinent leurs suppositions en fonction de ce qu'ils ont appris
de vastes ensembles de L'un fonctionne dans l'espace du langage, l'autre dans l'espace des pixels. Donc, la première étape, la phase d'entraînement, apprend
en détruisant des images. Prenons donc un exemple réel
de photo d'un chat. Ajoutons-y petit
à petit du bruit aléatoire, sur des centaines d'étapes. En tant que designer, vous trouverez peut-être
ce processus familier,
car il s'agit des filtres de flou
et de grain gaussiens filtres de flou
et de grain Finalement, il devient
statique, comme le bruit de la télévision. Le modèle apprend comment chaque niveau de bruit affecte l'image. Il s'agit
de milliers d'ajouts
et de suppressions de
petits pixels différents ajouts
et de suppressions de
petits pixels Cela permet d'apprendre au modèle
comment les images se décomposent. Deuxième étape, il apprend à
annuler le bruit ou le grain. Le modèle est entraîné pour prédire l'image nette à
partir d'une image bruyante. À chaque étape, il devine. Si c'est à cela que ressemble la
version bruyante, quelle aurait pu être la version
originale ? Il s'améliore en
comparant ses suppositions
à des images réelles et en
ajustant ses poids Imaginez donc un sculpteur debout devant un
gros bloc de pierre. Au début, ce n'est que du bruit, une masse chaotique solide
sans forme reconnaissable,
un gros bloc de pierre. Le sculpteur commence
à ciseler petit à petit, guidé par son intuition, son
entraînement et ses références Chaque frappe élimine l'incertitude. Lentement, des formes commencent à émerger, une courbe par ci, une
silhouette par là. Au fil du temps, le bruit prend forme et forme le
caractère aléatoire du bloc. Une
statue détaillée et magnifique est dévoilée. C'est ce qu'on appelle la diffusion
inverse. Vous commencez par
le bruit, vous l'
affinez pour une image cohérente étape par étape. Troisième étape, la génération commence. C'est la phase d'échantillonnage. Maintenant qu'il est entraîné
et qu'il a effectué ce processus de diffusion des millions
et des millions de fois, nous pouvons commencer par du bruit pur, une toile vierge d'électricité statique, et nous pouvons
lui envoyer un message texte, par
exemple un
chiot golden retriever portant des lunettes Maintenant, étape quatre,
débruitage étape par étape. Le modèle élimine un tout
petit peu de bruit à la fois, en
fonction de ce qu'il a appris. Après chaque étape, l'
image est légèrement moins floue, légèrement
plus détaillée La dernière étape, l'image finale, et c'est une création unique. Cela continue pendant 50
à 1 000
étapes différentes en fonction
de la précision du modèle. Après suffisamment d'étapes, l'
image devient parfaitement claire. Vous avez maintenant une image
photoréaliste qui n'a jamais existé auparavant, créée uniquement à partir du bruit
et façonnée par le langage. Et la grande question qui
préoccupe tout le monde est de savoir sur quelles données les
modèles de diffusion sont-ils entraînés ? Les modèles de diffusion sont entraînés sur énormes ensembles de données d'images, et ils doivent généralement être
associés à des descriptions de texte, également appelées paires de texte d'image Ces ensembles de données enseignent au modèle non seulement à quoi ressemblent les éléments, mais également comment interpréter les instructions
textuelles en Les données d'entraînement
incluent souvent une image, une photo d'un chien
portant des lunettes de soleil, une légende ou une description comme un golden retriever portant des
lunettes de soleil sur la plage Cette association permet au modèle d'
apprendre que lorsque quelqu'un dit ceci, l'image
ressemble probablement à cela Le modèle examine ensuite les paires de texte
d'image pour des millions et des millions d'images dans la
bibliothèque d'images qu'il utilise. Alors, d'où proviennent ces millions et
millions d'images ? C'est une autre question
importante qui soulève de nombreux problèmes de
droits d'auteur, que nous aborderons
un peu plus tard. Mais parlons de
certains de ces ensembles de données,
car différents modèles
utilisent différents ensembles Il y a donc le Leon Five B, soit 5 milliards de paires
images/textes extraites
d' Ainsi, n'importe où sur Internet
saisit tout ce qu'il peut. Une image qui a une
description textuelle, c'est parti pour la récupérer. Open Images, c'est 9
millions d'images avec des étiquettes, des encadrés et des légendes Il y a Coco, 330 000 images
étiquetées avec des légendes
détaillées et YF Il s'agit de 100 000 millions d'
images scintillantes avec métadonnées. À partir de ces données d'entraînement,
le modèle de diffusion apprend à quoi ressemblent
les différents objets et concepts, quels styles. S'agit-il d'un dessin animé ? Est-ce réaliste ou représenté
visuellement comment le langage correspond à des éléments
visuels tels que
Furry, Glowing, Bow house ? Et comme certains de
ces modèles de diffusion utilisent des données de formation disponibles sur Internet, il faut tenir compte d'
importantes considérations
éthiques et juridiques. Et je vais suivre
une leçon dédiée pour aborder tous les problèmes
juridiques liés aux outils de génération d'
images
et les moyens de les contourner
afin de garantir que le contenu que vous utilisez est sûr à utiliser. Certaines données de formation peuvent donc inclure des œuvres protégées par des droits d'auteur ou créées par des
artistes, et de nombreux artistes
se sont dits
préoccupés par le fait que leurs styles soient
imités sans leur consentement. Par conséquent, les modèles
issus de sources éthiques tels qu' Adobe Firefly sont
développés en utilisant uniquement du contenu sous licence
ou relevant du domaine public Nous aborderons en détail les problèmes juridiques liés aux
générateurs d'images dans les
prochaines leçons. Comme chaque jeu de données est unique et que chaque modèle
utilise un jeu de données différent
, les différents outils de génération d'
images utilisent des styles, des propriétés
et des
personnalités différents. Par exemple, Mid Journey
était très populaire
lorsque les outils de génération d'images sont apparus pour la
première fois il y a
quelques années, et ils ont tendance à échantillonner œuvres d'
artistes
sur Internet, pas autant uniquement des œuvres d'images générales de
Google Ils s'inspirent donc en quelque
sorte davantage des artistes et du travail des artistes. Ils vont donc être très artistiques, imaginatifs,
surréalistes, oniriques Il privilégie le
style par rapport au réalisme. Et cela ressemble souvent à des peintures
numériques, concept art et à des visuels de
magazines stylisés Donc, si vous
recherchez quelque chose de hautement technique et scientifique, Md Journey n'est
peut-être pas l'outil qu'il vous faut. Mais si vous recherchez un concept de personnage
vraiment approximatif pour ensuite vous personnaliser, cet outil est peut-être
fait pour vous. Mais c'est aussi celui qui pose le plus de problèmes
juridiques, et c'est celui
qui a été le plus poursuivi et qui a été le plus attaqué par la communauté des
artistes. Et nous verrons
comment éviter de voler le
travail des créateurs originaux en utilisant ces outils. Nous pouvons faire de nombreuses
choses différentes pour ajouter notre propre personnalité à ce que nous
générons afin de le rendre
unique et propre. Et un autre exemple est Dali, qui sera l'outil de génération d'images Hat
GPT Et je vais l'utiliser
le plus souvent tout
au long du cours, car j'
ai obtenu d'excellents résultats. Et il est excellent pour suivre à la lettre des instructions textuelles
complexes et produit des résultats clairs,
cohérents et illustratifs. C'est donc bon pour la
narration, les dessins animés, les styles
éditoriaux, et je l'ai trouvé
vraiment bon pour les
idées et la génération de logos. Leonardo est un autre
outil formidable car il propose des
options gratuites à utiliser Il n'est pas de
la même qualité que l'outil payant de
génération d'images GPT Dolly Open AI chat que j'utilise, mais c'est une excellente
alternative gratuite, et nous
parlerons des options gratuites et de celles qui sont
payantes un peu Mais il est fort en matière de cinématique, style de jeu
fantastique ou d'art
conceptuel,
souvent utilisé pour les maquettes de produits, souvent utilisé pour les maquettes de produits actifs de
RPG et les éléments de conception de jeux d'interface utilisateur Il est à la fois stylisé et très fidèle. Firefly by Adobe est
la solution la plus accessible que j' aime utiliser, car la
plupart des étudiants en design ont un abonnement Adobe Il vous permet
donc d'accéder à
Firefly dans Photoshop,
mais également en dehors de Photoshop sur
leur outil autonome de génération d'images leur outil autonome J'ai obtenu des
résultats mitigés avec Firefly. Il peut être un peu difficile de le
faire vraiment comprendre votre message, c'est parfois
génial et parfois non. Et je vais utiliser
Firefly comme exemple, mais les résultats sont plutôt
mitigés Je trouve qu'il existe de meilleurs outils, mais celui-ci est le plus
accessible aux concepteurs, car vous utilisez
déjà les outils Adobe. J'espère donc qu'ils
s'amélioreront de plus en plus, et il y a une raison pour laquelle sont difficiles par rapport
aux autres modèles. Il possède l'un des
ensembles de données les plus sûrs sur lesquels il s'entraîne. Il utilise des images qui sont
toutes libres de droits d'auteur. Ils ont tous été
autorisés à être
utilisés sur l'outil d'IA. Vous pouvez donc utiliser tout ce
qui est généré sur Firefly pour le travail client
ou pour le travail commercial Je ne peux pas en dire autant de
certains autres modèles d'IA. C'est ce qui le rend unique, mais cela limite également sa bibliothèque. Elle dispose d'une bibliothèque beaucoup plus petite sur laquelle s' entraîner, car elle ne peut utiliser que des œuvres sous licence pour
lesquelles une
autorisation d'utilisation a déjà été accordée. Mais avec de très bonnes compétences en rédaction
rapide, vous pouvez
contourner ce problème. Comme vous pouvez le constater, il existe de nombreux
outils de génération d'images parmi lesquels choisir. Je vais me
concentrer sur une poignée d'entre eux, mais j'espère donner ce
cours de manière à ce qu'il soit intemporel. Je vais vous apprendre à écrire des
mots clés et à écrire
rapidement. Et nous trouverons toutes sortes de mots créatifs incroyables qui aideront
vraiment à faire
ressortir nos suggestions et à faire ressortir notre
travail CT.
4. Rédaction de thèmes: L'IA n'est pas magique. Cela ne vous atteint pas l'esprit et ne
déduit pas de vagues idées. Il interprète ce que vous dites littérale et probabiliste C'est pourquoi le
libellé, la structure et les détails de votre message
font toute la différence. Un message fort peut faire
la différence entre un résultat générique et
un chef-d'œuvre stylisé. Une sortie dans le cloud par rapport à un produit contenant de l'émotion, de la texture ou une histoire. M. contre Waouh. T. L'écriture rapide est une direction
créative. Pensez à la rédaction rapide
comme donnant des directives à un assistant hautement qualifié mais
littéral Plus
vous communiquerez le sujet, l'ambiance,
le style et le contenu de manière claire
et créative vous communiquerez le sujet, l'ambiance, , plus le résultat se
rapprochera de votre vision L'écriture rapide ne
consiste pas à pirater l'IA. Il s'agit de communiquer
comme un designer. ingénierie rapide
est le processus qui à élaborer des instructions précises
et détaillées Tout comme le choix des polices ou
l'organisation d'une composition, instructions d'
écriture comportent des nuances L'ordre des
mots peut être important,
et nous le savons en
comprenant comment LLM fonctionnent pour prédire le mot suivant en fonction des mots qui
le précèdent Le ton de votre phrasé
influence l'humeur. Des modificateurs tels que cinematic,
hyperreal ou dream
like agissent comme Nous aborderons
quelques mots
modificateurs très spécifiques plus tard. bons rédacteurs révisent,
peaufinent et apprennent le
langage visuel du modèle, tout comme les concepteurs apprennent
la théorie des
couleurs ou les systèmes de grilles Le président d'OpenAI,
Greg Brockman, a partagé un cadre concis en quatre étapes pour rédiger des instructions d'IA efficaces Cette approche met l'accent sur la
clarté et la structure afin d'améliorer la qualité des réponses générées par l'
IA. Énoncez clairement votre objectif. Commencez par spécifier exactement ce que vous voulez que l'IA accomplisse. Par exemple, créez
trois idées de logo
distinctes pour une marque de café
durable nommée Green Brew, destinées aux jeunes
professionnels
soucieux de l'environnement âgés de 25 à 35 ans. Spécifiez le format
de sortie souhaité. Définissez la manière dont vous souhaitez que les
informations soient présentées. Par exemple, présentez chaque idée de
logo avec un nom
descriptif court, une brève justification, peut-être
deux ou trois phrases, et suggérez des palettes de
couleurs
et des styles de typographie appropriés et des styles de typographie Ensuite, définissez les contraintes
et les rambardes. Incluez toutes les limites ou exigences
spécifiques pour
guider la réponse de l'IE. Par exemple, évitez les dessins
trop complexes ou
illustratifs Optez pour une
esthétique minimaliste et moderne adaptée à l'image de marque axée sur le
numérique, assurez-vous que les polices suggérées sont disponibles via Google
Fonts ou Adobe Fonts. Fournissez des
informations contextuelles, partagez des informations complémentaires
ou des préférences pour aider l'IA à
adapter sa réponse Par exemple, la marque
met l'accent sur l'approvisionnement éthique, la responsabilité
environnementale et une personnalité sophistiquée mais
accessible Le design doit trouver un écho auprès des jeunes professionnels qui
attachent de l'importance à la durabilité, mais aussi au style et à la commodité Grâce à cela, vous obtiendrez des résultats beaucoup
plus spécifiques dont vous pourrez
tirer de nombreuses informations. Bien entendu, le détail joue un
rôle important dans la rédaction rapide. Nous avons appris plus tôt à quel point le contexte est
important pour les LLM. Dans la dernière partie de
notre message en quatre parties, informations
contextuelles
nous ont été fournies Nous pouvons
approfondir de nombreuses étapes dans notre explication
de la philosophie de marque, démographie
cible
et de l'apparence souhaitée. Nous devons encore faire toutes les
recherches nécessaires au design de marque, mais l'IA nous donne un
tremplin d'idéation et nous permet d'explorer des domaines
que nous n'aurions peut-être pas explorés
nous-mêmes. intéressant à propos de l'
IA, c'est de savoir à quel point
il faut s'associer à elle pour produire quelque chose d'unique et d'
intéressant. N'oubliez pas qu'il est
entraîné sur un ensemble de données basé sur des réseaux de neurones humains
et des processus de pensée, sorte qu'il peut imiter la créativité, mais il ne sait pas comment
être créatif par lui-même Il a besoin de vos conseils en
tant qu' expert qualifié du
design et de vous guider dans son cheminement. C'est pourquoi je suis heureuse d'annoncer
que tous nos efforts pour
apprendre la théorie du design, la couleur, la
mise en page, la typographie, la photographie, recadrage, l'étalonnage des couleurs, la
hiérarchie, l'histoire du design et les styles seront absolument nécessaires pour produire
tout ce Nous sommes les directeurs artistiques. Nous devons considérer l'IA comme un nouvel outil logiciel destiné
à nous aider, mais nous sommes toujours
aux commandes. Passons un instant à
l'écriture pour les LLM. Nous pouvons créer davantage d'
idées et réfléchir à l'aide de LLM dans le un prochain projet de design de marque Mais pour l'instant,
passons à la rédaction d' instructions
efficaces pour la création
d'images et de vidéos Je veux vous montrer l'
évolution d'une montre à chaussures. Quels sont donc les
éléments de base d' un prompt fort ?
Voici donc un exemple. Une basket futuriste alliant
le style de Bau House à la
mode streetwear avec des dégradés de néons, des surfaces
réfléchissantes
et des ombres spectaculaires, le tout sous forme de maquette de présentation de
produit Décomposons-le. Quel est donc le sujet ? C'est une basket
futuriste Nous pouvons être très détaillés sur le
type de basket dont il s'agit. Ensuite, nous établissons
un style ou une influence. Quel style artistique ou quelle
référence recherchez-vous ? J'ai donc parlé de la
rencontre entre Bau house et la mode streetwear. Deux styles différents
fusionnent. Et nous le décomposons
davantage, nous ajoutons des détails. À quoi cela devrait-il ressembler et à quoi cela devrait
ressembler, notamment les textures, les couleurs, l'éclairage et l'ambiance. Pour celui-ci, nous
avons donc créé des dégradés de néons, des surfaces
réfléchissantes
et des ombres spectaculaires Nous n'avons pas simplement parlé d'ombres. Nous avons parlé d'ombres dramatiques.
Nous n'avons pas parlé de surfaces. Nous nous sommes vraiment assurés
d'être détaillés. Enfin, le format medium. De quel format s'agit-il ? Une affiche, logo, une illustration, une publication
sur les réseaux sociaux. Ce que nous avons dit, c'est que nous
voulions le rendre sous
forme de
maquette de présentation de produit pour Instagram Nous avons été très précis
quant au type de sortie et au format dans lesquels
nous voulions être. Nous commençons donc par une
simple demande de chaussure. Je ne lui ai rien dit mais j'ai juste généré
l'image d'une chaussure. Il n'y avait aucun détail,
aucun contexte, une chaussure. Donc, ce qu'il va faire, c'est
créer ce qu'il pense être une chaussure en se basant sur
toutes les données d'entraînement. Ce n'est qu'une chaussure blanche. Il n'y a aucune caractéristique à cela. Il ne s'agit pas d'un
type de chaussure spécifique. Modifions donc un peu notre
invite. Ajoutons quelques détails supplémentaires. Une basket moderne aux formes inspirées de
Bohuse. Maintenant, nous avons un peu de formes et de couleurs
qui entrent dans notre chaussure. OK, allons-y un
peu plus en détail. Une basket moderne aux formes
inspirées de la maison Bau et aux bordures lumineuses au néon Mets-le sur un fond noir. Nous allons maintenant définir l'
arrière-plan et la scène. Nous ne l'avons jamais fait auparavant. Et maintenant, nous sommes
très précis quant
aux lignes à tracer, qui
seront lumineuses au néon, conservant la forme du Bauhaus Allons creuser plus profondément. Créons une basket moderne
aux formes inspirées de Buhuse, aux bordures lumineuses au
néon.
Mettez-la sur un fond noir La chaussure repose sur une eau brillante en trois D avec des formes
supplémentaires inspirées
de Bohuse Je donne donc plus de
détails sur l'arrière-plan, et je précise également sur quoi repose
la chaussure Il va reposer
sur de l'eau. Nous allons donc aller
encore plus loin. Je lui dis que je veux un angle de photographie
spécifique. Au lieu d'une simple chaussure dont
on voit le côté entier, je veux un angle de trois quarts, donc je vais ajouter
cela à l'invite. Je voudrais ajouter plus de détails. Je veux qu'il
pleuve, que les gouttelettes de pluie atteignent
l' eau
sur laquelle elle repose et la chaussure
et qu'elles réagissent Je vous le dis, non
seulement il pleut, mais je veux que les gouttelettes
de pluie tombent et réagissent Ajoutons-y de
plus en plus de détails. Je veux qu'une partie de l'eau
s'élève au-dessus de la semelle de la chaussure et éclabousse
dessus, comme une vague dans une tempête. Je souhaite que les
effets d'éclairage soient
rétroéclairés avec des propriétés holographiques Ajoutons donc deux autres révisions. J'ai donc suivi la même
demande qu'avant, mais j'ai ajouté « gardez
tout pareil », mais remplacez les lacets par des lacets
à fil doré. Rendez l'or brillant et brillant. Mais faites également en sorte que la perspective soit
légèrement déformée. Rendez les
lacets dorés plus réfléchissants, ajoutez plus d'éclaboussures d'eau, un
éclair derrière eux Je dis essentiellement
plus dramatique. Enfin, je veux que plus d'eau
jaillisse de l'eau Je veux que l'eau reflète
davantage le néon de la chaussure Je veux qu'il y ait un
éclair en arrière-plan. Je veux que cette chaussure ait toujours
les formes boohus. Je veux que le néon brille. Je veux que la chaussure soit plus
décente. Moi, encore et encore. J'ajoute plus de détails, de
couches et de couches, et je rends cette méthode plus unique qu'elle ne l'était au départ. La meilleure façon de rédiger des
instructions détaillées et d'apprendre à le faire est
d'étudier d'autres exemples Il existe de nombreux exemples
fantastiques de
rédaction rapide que vous
pouvez trouver en ligne. heure actuelle, ceux qui peuvent rédiger des instructions efficaces et
très détaillées
pour des images visuelles et des vidéos présentent une
valeur créative ceux qui peuvent rédiger des instructions efficaces et
très détaillées
pour des images visuelles et des vidéos présentent une
valeur instructions efficaces et
très détaillées , tel point que
les utilisateurs peuvent facturer
des instructions spécifiques pour produire des images
très spécifiques Il est désormais davantage considéré
comme un art en soi, tout aussi créatif que le fait de dessiner
une image ou de créer un logo Pourquoi ? Parce qu'il faut un effort colossal pour
rédiger des instructions efficaces Les mots utilisés, la façon dont nous
encadrons le contexte, le cadre, c'est comme parler
une nouvelle langue créative, et ceux qui savent comment parler cette langue s'épanouiront. C'est pourquoi j'ai rassemblé des ressources
vraiment intéressantes pour vous. Avant de passer à
cette ressource, je vais vous montrer quelques exemples de rédaction rapide
du monde réel . Décomposons-les.
5. Exemples d'invites réels: J'ai trouvé celui-ci sur Instagram. Cela a donc un aspect de fibre, de
broderie et de fil
vraiment soigné . Et ils ont pris
des logos et ils ont pu
appliquer cette invite particulière
à de nombreux logos différents. Jetons donc un coup d'
œil à une invite. Et vous remarquerez que les
instructions qui sont vraiment très bonnes sont ces gros, longs gros paragraphes détaillés.
Alors décomposons-le. Créez un logo texturé très
détaillé
pour le nom de la marque en fil
épais ou en laine Vous établissez donc
le
sujet et le décrivez. Chaque section du
logo doit être d'une couleur vive différente correspondant à l'
image de référence fournie, et les images de référence sont également
très importantes. Nous pouvons réaliser des
projets pratiques en les utilisant. Le fil doit avoir une texture
tricotée avec des fibres
clairement visibles donnant un aspect doux et dynamique en
trois D. Et bien sûr, le logo a un effet
tridimensionnel avec des ombres qui le font
ressembler à un morceau de tissu tricoté Nous parlons donc spécifiquement
du type de fil, couleur et de l'apparence. Et maintenant, nous allons définir
le décor et le contexte. L'arrière-plan doit donc être de couleur
neutre ou claire, permettre à la texture éclatante du
fil de
ressortir tout en mettant en valeur l'identité unique de la
marque Ainsi, lorsque nous
décomposons cette invite, elle comporte en quelque sorte les
quatre couches
distinctes dont nous avons parlé plus tôt, dans
lesquelles
vous établissez
le sujet ,
vous lui donnez un
contexte , vous lui donnez des informations générales et vous le donnez dans le format dans lequel vous
souhaitez l'avoir. J'
aurais vraiment pu l'utiliser ensuite dans mon
master class de graphisme intermédiaire où je vous ai appris à
créer une affiche de restauration rapide, et j'ai dû me rendre sur pexels.com
pour trouver une Mais c'était très limité. J'ai fini par trouver
quelque chose qui fonctionne. Mais que se passerait-il si je pouvais
créer quelque chose qui correspond
parfaitement à ma
vision créative pour l'affiche ? Et ce serait
vraiment intéressant à faire pour tout type d'affiche
de restauration rapide tout article lié à l'alimentation ou pour toute affiche
que vous souhaitez générer. Vous pouvez désormais créer ce que vous voulez en termes d'utilisation de
cette photographie. Vous pouvez donc également faire des tacos, différents types d'objets alimentaires Prompt n'est pas aussi long, mais je
pense qu'il est toujours efficace. : créez une
image
hyperréaliste spectaculaire de
n'importe quel aliment
en suspension dans les airs avec des miettes, des
éclaboussures, des particules
gelées en mouvement Utilisez un éclairage de jante audacieux, une mise au point
macro et un
arrière-plan lumineux, quelle que soit la couleur , pour ajouter de
l'énergie et du contraste. Vous remarquerez donc
que certains de
ces mots clés créatifs , lorsqu'ils sont supprimés, donnent
vraiment à l'IA le sens du style à rechercher
dans ses références. Donc, dans ce cas,
éclairage de jante, mise au point macro. Et suspendu dans les airs
et hyper réaliste. Vous ne connaissez peut-être pas
beaucoup de ces mots, mais nous allons passer des
mots très nuancés pour nous
aider à trouver
ces mots vraiment étranges selon nous ne savons peut-être pas
ce
qu'est l'éclairage de jante Mais nous allons bientôt explorer
tout cela ici. Et j'adore voir ces textures
hyperréalistes utilisées, en particulier ce type d'objet
gonflable gonflable que vous pouvez faire ici Jetons donc un coup d'
œil à cette invite. Nous pouvons le voir en action.
C'est très constant. Une fois que
vous aurez développé cette invite, vous pouvez simplement changer
de sujet, et le
style restera assez cohérent. Alors, comment allons-nous
créer cela ? C'est ainsi qu'ils
l'ont fait. Jetons donc un
coup d'œil à l'invite
finale. Waouh. Je ne vais pas lire tout
cela, mais je voulais montrer
cet exemple qui montre à quel
point c'est écrit
avec soin et comment il a probablement fallu quelques heures pour écrire l'invite et
voir les résultats Ce n'est pas ce que tu voulais.
Vous devez le modifier, modifier le message,
comme nous l'avons fait avec l'exemple de la chaussure Nous avons dû revenir en arrière, ajouter des choses, ajouter des choses,
ajouter des détails. Cela prend des heures, et
c'est pourquoi la rédaction d' instructions est un
art créatif en soi. Soulignons donc peut-être certains
des mots clés spécifiques vraiment nuancés qu'
ils utilisent ici Ils utilisent donc un objet
transparent gonflable. Flottant doucement dans l'eau, pour éviter que l'eau ne
soit agitée, cela crée en quelque sorte
l'arrière-plan. Il présente donc des surfaces lisses et
bombées, des joints
épais, visibles et
thermosoudés Permettez-moi donc de vous dire à
quel point c'est précis. Il faut donc presque
faire des recherches sur la façon dont les objets
en plastique sont fabriqués
et sur les termes relatifs au plastique. Il faut donc parfois
aller sur HachPT, faire recherches sur le plastique gonflable, renseigner sur le processus pour même savoir comment écrire une invite
sur la façon de l'émuler Voilà à quel point tout
cela devient détaillé. Vous avez donc des turbulences, des bulles
d'air, légères ondulations, Nous en apprendrons donc
un peu plus sur les caustiques , mais
tout tourne autour de l'éclairage Je ne le savais pas
avant de commencer à vraiment approfondir les mots clés
pour rédiger des instructions. Voici un autre bel
exemple de rédaction rapide. Ceci est dans un sac scellé
emballé sous vide. Voyons donc en quelque sorte
comment obtenir cet effet. Créez donc une image
hyperaliste en haute résolution, et vous verrez que
ces mêmes mots clés sont
hyperréalistes, haute résolution, parce que ce
sont ces petits
mots clés qui, haute résolution, parce que ce
sont ces tout d' un coup, cliquent dans le cerveau du
modèle d'IA et disent : «
OK, c'est le type de
photos que je dois rechercher Mais je voulais m'attarder
sur cette petite zone, inclure de la condensation
ou de petits plis
autour des points de pression pour plus de réalisme Est-ce que c'est magnifiquement écrit ? Donc, à la fin, vous pouvez voir ces détails visuels
avec deux points. Il va donc répertorier de nombreux détails
visuels, plus que
ce qu'il a déjà fait. agit donc de plastique sous vide écrasé, transparent ou
métallique, silhouette d'
objet, de détails visibles
et
extrêmes, d'éclairage intense pour
mettre en valeur la texture et la forme, de superpositions typographiques, codes
biaisés et d'ambiance de marque, de style de présentation
du produit, d'ambiance style de présentation
du produit Il crée donc une
ambiance de fond, un éclairage naturel
vif expérimental, avant-gardiste, à
collectionner après consommation, met en valeur les couleurs
vives et donne un aspect épuré,
cinématographique Magnifiquement écrit
et le message, bien
sûr, est fantastique. J'ai dû essayer cette invite. C'est ce que j'ai obtenu. Cet exemple de
clavier était donc vraiment intéressant car je pensais
qu'ils
décrivaient vraiment ce qu'ils voulaient
avec ces mots clés supplémentaires. Donc, dans ce cas, ils ont dit qu'ils voulaient une grille
étroite deux par deux. Ils n'ont tout simplement pas dit de me
montrer un clavier. Ils ont dit : « Je veux
une grille deux par deux ». Donc deux touches en haut,
deux clés en bas. Et une autre chose est qu'ils ont parlé d'angle isométrique Il s'agit donc de la
vue et de la mise au point de la caméra. Il a cet angle isométrique. Donc, si vous avez étudié, je vous ai déjà enseigné le design
isométrique C'est donc très
populaire en termes de vue. Le téléchargement d'
images de référence est donc vraiment chouette. Ils ont donc téléchargé
une image
de référence d'une photo qu'ils ont prise
d'une canette de Coca Cola, et ils ont ajouté à l'invite une image en haute résolution
de cet objet flottant à l'intérieur de quelques nuages blancs projetant des ombres dans
un ciel bleu vif Le chrome est légèrement
rayé, bosselé, mais hautement réfléchissant,
lumineux et énergique, une
atmosphère surréaliste Et vous pouvez voir comment vous pouvez créer de nombreuses maquettes vraiment intéressantes avec vos propres produits ou travaux de conception de
marque sur lesquels
vous travaillez Pour ce dernier exemple, cela m'a vraiment inspiré pour effectuer des recherches par mots clés pour des éclairages,
des textures et des termes
similaires. Cela a donc un
aspect irisé, un effet
vraiment cool
où vous avez presque ce prisme arc-en-ciel, ce
reflet et Et si vous ne
savez pas si votre message est suffisant, si vous avez besoin d'un petit coup de
pouce supplémentaire,
il vous suffit de demander à Chat ChPT Il est excellent pour affiner un peu
plus
vos invites, car il connaît les types d'invites dont il a besoin pour générer le type de
contenu que vous recherchez Des descriptions obscures
révèlent l'unicité
et la superposition de styles La plupart d'entre nous, designers
, utilisons les mêmes dix ou 15 mots clés
visuels, peut-être gras, épais, lumineux,
géométriques, ronds, pour n'en nommer que quelques-uns. Mais que se passerait-il s'il
existait un monde entièrement nouveau composé de milliers de mots
créatifs descriptifs
différents que nous n'avions jamais
explorés auparavant ? Tout a commencé lorsque j'ai vu ce message irisé
que je vous ai montré plus tôt, et j'ai trouvé l'effet
vraiment cool Je l'ai déjà vu. Je ne savais tout simplement pas comment le
dire avec des mots. Je vais être
honnête. Je ne connaissais pas la différence
entre l'idescent, la
luminance, la bioluminescence et toutes ces autres
différences
avant de faire des recherches sur ce cours. avant Ce qui est incroyable, c'est que je
peux taper dans le chat GPT ou un AILLM similaire et lui demander des
mots similaires pour Il a proposé une plus grande
variété de mots similaires. J'ai pu lui demander de
créer des exemples visuels de cet éclairage particulier
sur le même objet, afin de me faire une idée des différences nuancées entre
les différents effets d'éclairage Waouh. Je n'aurais jamais approfondi des mots
aussi
précis auparavant, et maintenant j'ai l'impression
d'être un meilleur designer Je peux maintenant décrire en profondeur différentes situations
d'éclairage lorsque j'écris mes instructions. Et demandez également à Cha GPT des styles artistiques, des
textures et des ambiances très nuancés très
spécifiques , afin que je
puisse élargir le vocabulaire de mon
designer J'ai pu prendre cette
liste et faire des
recherches approfondies sur de nombreuses nouvelles variétés de textures et de styles artistiques J'ai l'impression d'être un nouveau designer qui a le monde entier
à portée de main. De tout ce que j'ai utilisé pour l'IA, c'est celui qui m'
a empêché de dormir la nuit. Mais dans le bon sens, je veux que
vous vous lanciez personnellement le terrier du lapin en explorant des termes
de design nuancés dont vous n'
avez peut-être jamais entendu parler auparavant. Ainsi, lorsque vous rédigez des instructions, vous pouvez être incroyablement précis Nous passerons en revue
de nombreux exemples de termes
de design nuancé
dans la prochaine leçon. Alors prépare-toi.
6. Termes de conception nuancés Terms: Une sculpture biométrique
et une texture devinée sous une lumière éclatante avec une sensibilité
wabi Comment pouvons-nous
apprendre ce que c'est que tout cela ? Je ne connais même pas
la moitié de ces termes jusqu'à présent, jusqu'à ce que nous commencions
vraiment à explorer certains de ces mots clés
nuancés qui peuvent rendre nos instructions
vraiment professionnelles J'ai donc cette ressource
téléchargeable. C'est ce que je
vais
examiner avec vous
dans ce cours. Ainsi, lorsque vous rédigez des instructions ou que vous
développez des briefs créatifs, ces mots reflètent nos
styles, textures
et esthétiques nuancés moins connus qui peuvent
améliorer votre langage de conception. Travaillons donc à l'extension de
notre langage de conception. Voici donc quelques-uns
et, bien sûr, discutez avec GPT et je travaille
vraiment ensemble pour peaufiner certains de ces styles
très différents Je voudrais donc
parler de la première. Ce sont des styles et des mouvements
esthétiques différents. J'aimerais donc vous en
montrer deux sur le plan biomorphique, vu au
début de la leçon, une
sorte de goutte organique, semblable à un fluide,
qui se forme
dans sorte de goutte organique, semblable à un fluide, qui se forme J'ai pu approfondir, je l'ai cherché sur Google, j'ai fait des
recherches, et maintenant je connais le design
biomorphique, c' est-à-dire je peux développer des éléments
biomorphiques en trois dimensions pour les intégrer à
un projet de design de marque et
les modifier parce que j'
aime vraiment ce à quoi cela ressemble maintenant, en particulier dans un modèle en trois D. un projet de design de marque et
les modifier parce que j'
aime vraiment ce à quoi cela ressemble que
je peux développer des éléments
biomorphiques en trois dimensions pour les intégrer à
un projet de design de marque et
les modifier parce que j'
aime vraiment ce à quoi cela ressemble maintenant, en particulier dans un modèle en trois D. Et il y a le cœur du passage à l'an 2000. J'ai donc vécu jusqu'
au début des années 2000, donc j'en savais beaucoup
sur Y2K Core C'est une
forme rétro-futuriste du début des années 2000, avec des dégradés de
chrome et une technologie sophistiquée. Pensez donc au Web à deux points, avec ce genre
de vorticiste au look brillant C'est de l'abstraction dynamique angulaire, de la modernité
industrielle. C'était donc un style de peinture assez
populaire, et j'allais
regarder beaucoup de choses sur Wikipédia à ce
sujet. C'est vraiment cool. Je ne
savais pas que ça existait. Dynamisme Le dynamisme m'a pris un certain temps pour comprendre
comment prononcer ce mot. Ce sont des compositions à haute énergie. Passons donc aux
différentes textures et descripteurs de matériaux Voici donc ça irisé. C'est une surface
arc-en-ciel scintillante, un changement de couleur dû à J'ai trouvé que c'était bien
mieux que de simplement dire néon. J'ai eu l'impression que la seule façon de
décrire une
lumière incandescente était le néon Mais maintenant j'ai une descendance. Vous êtes donc oxydé, c'
est-à-dire lorsque vous
avez du fer qui rouille Il s'agit donc d'une
patine chimique rouillée avec des métaux altérés. Cela peut donc vous donner l'aspect
métallique usé que
vous recherchiez peut-être. Il y a aussi des taches,
qui sont des
particules dispersées ou une texture scintillante. Et puis il y a le collage. collage en D consiste donc en des couches
arrachées révélant une histoire visuelle. Et je l'ai souvent vu dans
des designs où
vous avez cet aspect déchiré
et où vous voyez les couches, et j'ai vraiment adoré
leur apparence. Je ne savais juste pas qu'il
portait le nom de collage D. Donc, à moins que vous n'ayez suivi beaucoup de
cours d'histoire de l'art à l'université, vous ne connaissez peut-être pas
certains d'entre eux, mais vous pouvez demander à Chat
GPT de vous aider maintenant Ensuite, il y a ce qui est
effrayant, grotesque, intentionnellement maladroit,
déformé et inquiet Celui-ci était un peu
effrayant, mais bon, nous avons tous des
choses différentes que nous
créons pour nos pièces de design L'un de mes termes préférés est donc celui de
l'éclairage et de l'ambiance. caustique est en fait
un terme très populaire dans les vidéos et le rendu de modèles en trois
dimensions,
qui façon dont la lumière
interagit avec Et parfois aussi du verre. Il s'agit donc de motifs
lumineux réfractés, souvent sous l'eau ou sous le verre J'adore toujours cet effet. J'en peignais une
partie à la main quand j'étais capable de faire de la peinture numérique
et je peignais de l'eau. Je peindrais ce genre de réseau
bancal réfléchi,
et ce sont des et C'est l'étude de la lumière et de la réfraction dans le verre et dans l'eau Il faut donc
le découvrir et pouvoir
y mettre un nom. Passons aux termes culturels
et de style de niche. rétrofuturisme, qui est
un visuel de science-fiction vintage, imaginant le futur à
partir du passé Il y a le Wabi Sabi,
un concept japonais d' imperfection et d'éphémère. C'est pourquoi vous
verrez parfois l'or
craquelé réparé ou plaqué, car ils veulent honorer
l'imperfection, et c'est une
chose très culturelle d'honorer Et j'ai
vu ce Wabi Sabi dans de nombreuses instructions récemment, donc ce doit être un style
assez populaire Il y a donc aussi des compositions esthétiques
et visuelles. L'orpisme est donc une abstraction
vibrante utilise la couleur pour exprimer des rythmes
musicaux Le rainisme croise donc des
rayons de lumière, un futurisme
semi-abstrait et même un fractalisme. Vous avez entendu parler des fractales mathématiques, qui se prolongent à
l'infini, sont des géométries récursives, des sont des géométries récursives des
rayons de lumière, un futurisme
semi-abstrait
et même un fractalisme. Vous avez entendu parler des fractales mathématiques,
qui se prolongent à
l'infini,
sont des géométries récursives, des formes et une complexité similaires. L'une de mes
préférées concerne donc les surfaces, les motifs et les techniques médiatiques. Voici un vertigris en cuivre oxydé,
qui nous donne une patine verte
vraiment cool Et puis il y a le comportement
et les effets des couleurs , la couleur prismatique C'est un peu comme lorsque
vous avez le prisme, qui est en fait
l'ensemble de l'arc-en-ciel de
lumière réfractée
dans une zone étroite Vous avez donc une réfraction arc-en-ciel
avec une transition nette. Ils n'ont donc pas ces
transitions lâches comme les dégradés
lâches Ils sont très serrés et vous pouvez
assister à une
transition de couleur très rapide. Cet éclairage frénétique, et j'espère que je prononce
tout cela correctement, je peux toujours discuter Mais l'éclairage frénétique est un gradient réfléchissant à
haute énergie sur les bords Il y a donc ce joli
dégradé juste sur
les bords ,
tout le reste étant un peu sombre et irréfléchissant Et puis il y a la culture du savon
et l'influence mondiale. Vous avez donc le modernisme du désert
, une
architecture du milieu du siècle adaptée aux climats arides Donc, si vous faites une
demande pour un type de bâtiment ou un bâtiment
dans une scène d'arrière-plan, vous devez le faire savoir au chat GPT ou au
générateur d'images que vous utilisez Assurez-vous de mettre dans quel type de bâtiment tout
se trouve en arrière-plan. Soyez très précis quant au
style de bâtiment. Et puis un autre mot clé
très courant que je vois
partout est Neo Tokyo. Et Neo Tokyo, c'est cet étalement urbain graveleux, coloré et
influencé par l'anime Et je le constate souvent lorsque vous avez des robots futuristes Ils ont tendance à
vouloir simplement mettre ça dans un décor
néo-tokyoïte.
Donc tu me connais. J'aime aller de plus en
plus loin dans le terrier du lapin parce que j'ai une
telle curiosité intellectuelle
pour tout ce qui est créatif. J'ai donc demandé à ChahPT Quels
sont les termes encore plus nuancés et
rarement connus
dans le design Donc, si vous trouvez un style
qui vous ressemble, What on Earth is that, vous pouvez télécharger une photo de
référence pour un LLM et lui demander décrire ce style
avec des mots rapides, et cela
vous aidera à le comprendre Donc, l'un de mes termes
rares préférés était le velours floqué. J'ai juste l'impression de pouvoir
tendre la main et toucher ça. plastique leucite, qui est un plastique rétro, une
sorte de plastique épais et épais qui
était très populaire
avant que l'on ne commence à produire les
plastiques très fins que nous voyons aujourd'hui Mais je le vois souvent
dans les produits rétro. Texture de film à bulles. J'adore l'apparence que ça donne aux choses. lueur souterraine, que
vous pouvez imaginer, ressemble à un bloc de magma et juste une petite partie du magma
provenant de l'intérieur en sort,
mais elle n'est pas C'est très souterrain. Et le ferro fluid scintille. Avez-vous déjà vu du
pétrole se répandre sur une route, et vous avez vu cette sorte
d'arc-en-ciel se refléter sur cette route ? C'est exactement ce dont il s'agit. C'est ce reflet
que dégage l'huile qui reflète
une petite partie du spectre de couleurs sur vous, conservant cet aspect
sombre et liquide Allons encore plus loin. Ce sont donc probablement ceux dont
vous n'avez jamais entendu parler. Et si vous en avez entendu parler, félicitations, car
je n'en ai pas entendu parler. Ce sont donc les mots rapides les plus
obscurs que j'ai pu trouver sur Internet, et la quantité que j'ai
trouvée était infinie. Ce n'est qu'une toute
petite sélection que j'ai personnellement appréciée et que j'ai pensé que
vous trouveriez utile, mais il y en a des milliers
que je n'ai pas utilisées. Il y a donc une
réfraction de la lueur de la lune, une lumière douce et argentée qui traverse
la brume. Très, très précis. Il y a une floraison kaléidoscopique. Donc, si vous avez déjà regardé
à travers un kaléidoscope, il s'agit d'une dispersion chaotique de la
lumière fracturée, d'une hémorragie
photonique, qui se
superpose à des sources lumineuses et à un chevauchement bruyant Il y a la pierre polie au magma, élégante et brûlée, où lave
refroidie rencontre Écorce de vitréos. Je crois que c'est ce que je dis. Je pense que cela vient de Vitae qui signifie « vie ». vitrios est une écorce d'arbre aux
reflets vitreux semi-transparents Et il y a ces thèmes
conceptuels ultra tendances dont nous
pouvons également parler, Archetypal Glitch Core, qui est un langage symbolique cassé Des fragments d'utopie
oubliés, des pièces brisées de sociétés
parfaites en faillite Je veux dire, dans quelle mesure pouvez-vous être nuancé ? Et puis les ruines du punk solaire, qui font écho à une utopie
déjà délabrée Donc, si vous essayez de peindre
un mood board dystopique, ce sont certainement
des mots que vous voudrez
peut-être utiliser En tant que défi pour les
élèves du secondaire, je veux que vous trouviez les styles artistiques
les plus nuancés Choisissez quatre styles artistiques,
textures ou descriptions
nuancés différents , et je veux que vous les
exploriez intensément Donc, si c'est de l'iudescence, recherchez l'iridescence, découvrez ce que c'est, apprenez-en plus à ce sujet Et je veux que tu le fasses
avec quatre modèles différents. Et si vous voulez en
faire deux par jour pendant tout
le temps que vous étudiez l'
IA ou
que vous suivez ce cours, ce serait formidable, car vous
pouvez vraiment commencer à élargir votre vocabulaire et vos
connaissances en design de cette façon. Nous comprenons maintenant le cadre de base de ce qu' il faut pour créer une invite solide. Et déterminez également certains
de ces mots clés nuancés. Il ne reste
plus qu'une chose à
aborder pour discuter des problèmes juridiques liés à l'utilisation de l'IA. Il faut en parler
avant d'aller de l'avant.
7. Copyright et questions juridiques: Alors, d'où provient
l'intelligence artificielle pour créer de
tels chefs-d'œuvre ? Difficile de ne pas parler de
l'éléphant dans la pièce. Comme nous en avons discuté précédemment, Mid Journey Dali et d'autres outils de
photogénération basés sur l'IA ont utilisé
une énorme quantité de photos provenant de l'ensemble d'Internet pour
entraîner ses robots
intelligents à entraîner ses robots
intelligents Cela signifie que les
photos, illustrations
et graphiques protégés par des droits d'auteur ont été compilés ensemble pour indiquer au bot ce que l'utilisateur pourrait vouloir voir Un
article intéressant affirme
que l' un des fondateurs
de MD Journey savait c'était le cas et admis ne pas savoir
quoi faire pour donner propriété des
droits d'auteur aux artistes
des images utilisées par cette AIBt Lorsque vous créez des œuvres d'art basées sur l'IA, vous pouvez également ajouter des images de
référence pour aider le bot à détailler davantage
ce que vous recherchez. Et il n'existe aucun moyen d'
empêcher les utilisateurs de
télécharger des œuvres protégées par des droits d'auteur depuis Google Search dans Cela signifie que si vous utilisez
des images qui n'ont
pas Creative Commons zéro
ou de licence de domaine public,
vous pourriez vous exposer à des
poursuites pour avoir
créé des œuvres d'art à partir d'images protégées par des droits d'auteur Cela signifie-t-il donc que les outils d'intelligence artificielle ont porté atteinte aux droits des
créateurs Cela allait atteindre son
paroxysme à un moment donné. Plusieurs artistes se sont
regroupés pour poursuivre Mid Journey d'autres
sites Web de portfolio artistique, comme Deviant Art, pour avoir
autorisé la publication d'œuvres d'IA
dérivées de l'IA protégées par le droit d'auteur publication d'œuvres d'IA
dérivées de l'IA protégées par le droit d' sans donner les
crédits appropriés aux Et ce sera une affaire judiciaire
très délicate. D'une part, les outils d'intelligence artificielle
ont été formés en absorbant des données provenant de la
majeure partie d'Internet, qui constitue une gigantesque
source de données. Il peut être difficile de prouver une violation
individuelle du droit d'auteur à partir d' images dérivées d'un ensemble de données
aussi volumineux. D'autre part,
il est arrivé que des
artistes individuels puissent taper le nom d'une
invite d'IA et
voir clairement comment leur œuvre a été utilisée
pour formuler les résultats. Bien que ce ne soit
jamais une copie exacte, vous pouvez en voir l'inspiration. À qui appartient l'œuvre créée
par les générateurs d'images basés sur l'IA ? Si j'insère une invite dans un générateur de texte ou d'image basé sur l'
IA, suis-je propriétaire de l'invite pour créer l'image ou l'image elle-même ? Il s'agit d'une question juridique complexe, mais il vaut toujours la peine d'
en savoir plus à ce sujet. Un élément humain
doit être présent pour qu'une
réclamation de droit d'auteur puisse avoir lieu. Cela signifie qu'AI Tech ne peut pas
revendiquer la propriété des images. œuvres d'art basées sur l'IA n'ont
pas vraiment de propriétaire selon les lois
actuelles sur le droit
d'auteur, mais selon les conditions d'utilisation de certains programmes, elles attribuent la
propriété d'une image au créateur ou à l'auteur invité. Mais pouvez-vous soutenir que droit
d'auteur devant les tribunaux serait
la prochaine question, car rien ne peut empêcher des entreprises
tierces de vous poursuivre en
justice pour avoir utilisé
leur image
de marque votre photo générée par l'IA. Nous vivons véritablement dans un
nouveau Far West numérique. Alors, que faites-vous
si vous voulez prendre la
voie de la sécurité et protéger travail
d'un véritable artiste et vous
assurer qu'il obtient
les crédits appropriés ? Eh bien, tout d'abord, j'
éviterais de saisir le nom
d'un artiste spécifique dans les instructions de l'IA Il est normal d'utiliser des
noms historiques comme Léonard de Vinci. Il est mort depuis de nombreuses années, mais je ne proposerais aucun nouvel
artiste encore vivant et ayant encore
un héritage à construire. Une autre chose que vous pouvez faire
est de vous assurer d'utiliser outils de génération d'images basés sur l'
IA
qui proviennent de sociétés officielles qui s'assurent que la bibliothèque photos qu'ils utilisent pour
entraîner leurs robots et générer des
images est
autorisée par leurs propriétaires. Outre l'utilisation d'outils d'intelligence artificielle
tels qu'Adobe Firefly, voici quelques
bonnes pratiques personnelles pour atténuer
ces complexités et
garantir que votre travail Tout d'abord, chaque outil d'intelligence artificielle a des conditions de licence
différentes, il est
donc bon de passer en revue chacune d'elles. Détenez un LLM,
décomposez-le pour
que vous puissiez digérer et
comparer les différents termes Documentez clairement votre contribution créative
et vos étapes itératives. Disons que vous êtes en train de
créer un personnage. Vous conservez peut-être une copie de votre croquis original que
vous avez téléchargé sur un modèle d'IA. Suivez les
différentes instructions que vous utilisez pour modifier et
changer votre personnage Soyez prudent lorsque vous proposez à l'
IA des personnages protégés par des droits d'auteur, des marques
célèbres ou
des personnages marques
célèbres ou C'est là que vous pouvez avoir le plus de problèmes et avoir le plus
de chances d'être poursuivi en justice. Évitez d'utiliser le nom de l'entreprise
lorsque vous tapez dans vos instructions. Évitez d'utiliser le logo Nike pour
générer des idées de logo. Évitez d'utiliser le style d'animation Pixar ou Disney
lorsque vous créez des images Un exemple frappant
est celui où quelqu'un
a commencé à copier le célèbre style Ghibli du
célèbre animateur Hao Son style prend
des centaines d'heures juste pour quelques
secondes d'animation, et les gens saisissaient son
nom et son style dans les invites pour
imiter cette Dans une interview, Miyazaki a qualifié l'IA d'insulte
à la vie elle-même, et il pense que l'
animation doit être ancrée dans les émotions et les expériences
humaines et non dans émotions et les expériences
humaines et non Ainsi, lorsque vous rédigez vos instructions, pensez à créer
votre propre mélange de styles qui vous
sera propre Vous pouvez vous inspirer d'
autres œuvres créatives. C'est ce que nous faisons tout le
temps en tant que créatifs. Nous parcourons Instagram ou
Behance pour trouver l'inspiration. Nous
créons ensuite quelque chose, et nous nous retrouvons à
imiter certains de ces styles inconsciemment Le même problème
existe pour l'utilisation de l'IA. Trouver de l'originalité
peut être difficile, mais cela a toujours été
le cas pour nous, designers. C'est pourquoi nous étudions des centaines
de styles afin de pouvoir les mélanger, assortir et créer notre
propre saveur et notre propre facteur. Pour établir
votre propre style, vous pouvez
télécharger une esquisse
de base de votre idée, de votre logo
ou de votre personnage. Rédaction d'instructions très élaborées qui ne peuvent être
rédigées que par vous Conservez un style spécifique
dans ce que vous générez, ce qui vous permet de vous
approprier ce style. Prendre les idées générées par l'IA
et les modifier considérablement en dehors des programmes d'IA et des programmes conception tels que
Photoshop et Illustrator. Je recommande de laisser libre
cours à la
créativité dans votre flux de Cela signifie que vous pouvez télécharger
un croquis approximatif dans AI. Cela vous aide à affiner votre image. Vous le réintroduisez
dans Adobe Illustrator ou un autre programme vectoriel,
et vous le vectorisez Ensuite, vous pouvez le modifier davantage. Vous le réintroduisez dans l'IA pour ajouter des détails supplémentaires
ou affiner les idées. Vous pouvez même demander à l'IA des conseils sur l'orientation de
votre logo par la suite. Cela soulève la
question des poursuites judiciaires. Quelle est la probabilité que nous soyons poursuivis pour
avoir utilisé des images générées par l' IA dans nos campagnes marketing, par
exemple ? C'est possible mais
peu probable. La personne ou l'entreprise qui poursuit
doit prouver sans aucun doute que les images que vous
utilisez reproduisent exactement leur style Étant donné
que
les générateurs d'IA sont entraînés sur des
millions et des millions de paires d'images textuelles, des
millions et des millions de paires d'images textuelles, il est impossible pour un photographe ou un designer revendiquer la propriété si
votre message est suffisamment unique. Mais on pourrait écrire un
message décrivant style
d'un photographe célèbre jusqu'à un T et le faire en
sorte qu'il soit si proche de ce style
qu'il empiète sur le style de
cette personne.
C'est vraiment délicat. Cela
restera toujours une zone grise comme c'est toujours le cas pour
le design du logo. Vous pouvez notamment
vérifier régulièrement les actifs générés par l'IA à l'aide recherche d'images
inversée pour détecter d' éventuels problèmes de similitude ou de
violation. Vous pouvez modifier les résultats
générés par l'IA de manière significative plutôt que de les
utiliser directement. Donc, si vous demandez une idée de
logo, modifiez légèrement
cette invite pour la personnaliser. Après le traitement, vous pouvez modifier manière approfondie les images générées par l'
IA à l'aide d'outils tels que
Photoshop ou Illustrator. En fin de compte, le principal point à retenir est plus
il y a d'interaction
guidée par l'homme entre le contenu généré par
l'
IA, mieux vous pouvez vous
protéger. En bref, la propriété claire
dépend grande partie de l'apport humain
créatif original que vous ajoutez à l'imagerie
générée par l'IA Améliorez et adaptez toujours les images manière créative pour
établir clairement vos droits d'auteur Assurez-vous que vos
conceptions finales contiennent des modifications
humaines créatives
significatives et qu'elles ne soulèvent aucun problème de
contrefaçon.
8. Projet d'apprenant: J'ai donc votre premier projet
étudiant, qui
consiste à rétroconcevoir
une photo à l'aide d'instructions. Je souhaite donc que vous recréiez les photos de référence aussi
précisément que possible et que vous puissiez les
télécharger dans le
cadre des ressources en
utilisant uniquement des outils de génération d'images basés sur l'IA et des instructions écrites Aucune retouche d'image manuelle n'est autorisée. Cela vous permettra de vous
entraîner à utiliser les instructions pour créer des
objets et des détails très spécifiques Voici donc la première,
qui est composée de trois formes en D. Je veux que vous le recréiez
le plus fidèlement possible. Ce ne sera pas exact, mais vous
pourrez continuellement modifier les instructions afin d'
obtenir lentement les résultats dont vous avez besoin Et le second est
un petit-déjeuner américain. Vous pourriez donc
commencer avec deux œufs et décrire tout ce qui se
trouve en arrière-plan, décrire qu'il y a une fenêtre, décrire que c'est
photoréaliste Commencez à utiliser
certains des mots clés que
nous avons appris pour décrire cette
image et l'imiter Choisissez donc le
générateur d'IA de votre choix. Il peut s'agir d'Adobe Firefly, Dolly, Leonardo ou GPT Utilisez uniquement des instructions textuelles et
essayez de reproduire l'image Vous ne pouvez
donc pas créer d'images de
référence Et je veux que vous vous
rapprochiez de la composition, l'éclairage, du sujet, la palette de couleurs, de la
texture et du style. Et vous pouvez effectuer des itérations autant de
fois que nécessaire et suivre les
versions les plus rapides au fur et à mesure que vous avez reçu une amende
9. BONUS !Nano Banana Pro - pouvez-vous deviner la réalité ou l'IA ?: Google Nano Banana
Pro vient de sortir et les résultats sont insensés La manière dont l'IA
laisse des preuves qu' il s'agit d'une IA
devient progressivement de plus en plus difficile à repérer. Cela permet de tricher, de
changer le passé, arnaquer et de tromper les
gens Bien sûr, il a ses avantages pour ceux qui savent l'
utiliser correctement. Pour Photoshop 2026, Adobe a annoncé son
partenariat avec Google pour ajouter Nano Banana en
tant qu' option tierce dans
son outil de remplissage génératif Une nouvelle option est désormais disponible
dans son Nano Banana Pro. agit d'une
option payante si vous
deviez l'utiliser dans Google Gemini, mais Adobe l'a mise
à disposition pour utiliser Adobe
Photoshop dès maintenant Je n'ai jamais vu de résultats aussi
étonnants avec cette option, bien meilleurs que ceux de la Nano Banana de première génération, déjà très
bonne. Comme il s'agit d'une
option premium en dehors d'Adobe, Adobe vous pénalise
un peu si vous utilisez ce
Dano Banana Pro Il coûte dix crédits
par génération pour une résolution allant jusqu'à 2000 et 16 crédits pour une résolution de 4 000. Creative Cloud Pro vous permet de créer
4 000 générations par mois. Adobe Creative Pro coûte
70$ par mois dans ma région, donc vous le
payez certainement Vous pourriez donc tout aussi bien utiliser certains de ces crédits et
expérimenter cet outil. J'ai donc envie de jouer à un
petit jeu avec toi. J'ai généré la plupart de ces images à l'aide de Google Nano Banana Pro à l'
exception
d'une ou deux. Je veux voir si vous pouvez
me dire laquelle est générée
par l' IA et laquelle
est une vraie photo. Je l'ai fait avec mon mari, et il a lamentablement échoué.
Voyons comment tu t'en sors. Merci d'écrire dans les commentaires
combien vous avez bien compris. Je vais vous dire comment faire la différence entre le
réel et l'IA après chacune d'elles. Maintenant, nous allons commencer par l'une des plus simples. C'est l'une des
seules que mon mari a bien comprises. Désolée, chérie. Alors
, selon vous, laquelle est réelle et
laquelle est basée sur l'IA ? Donne-toi juste quelques
secondes pour y réfléchir. Et tout tourne autour du zoom avant. Donc, si vous n'
arrivez pas à zoomer, il est très difficile de
savoir s'il s'agit d'une IA ou non. À première vue, je pense que c'est peut-être
celui de droite. Ça a l'air presque trop beau, mais l'éclairage est vraiment sympa. Et je ne suis pas astronaute, donc je ne sais pas si son
équipement est correct ou non Cela semble un peu
compliqué à première vue. Mais là encore, celui
de gauche semble très convaincant. Mais zoomons et
découvrons laquelle est vraie
et laquelle ne l'est pas. Donc, si nous zoomons sur celle
qui semble dater des années 1980,
elle est très crédible, car au début des années 1980, certaines femmes commençaient
à s' entraîner dans le cadre du programme d'
astronautes Mais jetez un œil à ce badge. Typographie au Texas où l'
IA peine encore, même avec Nano Banana Pro C'est la seule chose que je
puisse saisir avec une précision de
100 %, c'est quand
il s'agit de typographie Ce n'est pas absolument
net et clair. Vous pouvez le savoir avec un badge de la NASA. De plus, ici, on
peut voir qu'il y a de petits trous, presque
comme s'il était usé, mais je peux dire qu'il
avait juste du mal à saisir la typographie, et ce n'est pas le logo
officiel De plus, si vous
regardez le visage de ce type, ils doivent être jumeaux parce que
c'est exactement le même homme. Donc, si vous avez exactement le
même gars, quelles sont les chances d'avoir des
jumeaux dans le programme spatial ? Probablement très minime.
Mais c'est très impressionnant. Regarde le plafond.
Regardez les lambris Les détails sont plutôt bons. Et à première vue,
j'aurais cru que c' était une vraie photo documentée. Celle de droite
est une vraie photo, et celle de gauche est une
IA. Tu as été surpris ? Passons à la
suivante. Allons-y un peu plus fort
avec celui-ci. Vous avez donc ici deux plateaux de tournage
classiques, l'un avec Tom Cruise sur la gauche, et l'autre
avec Pedro Pascal et d'autres acteurs célèbres. Quel décor de film est réel
et lequel est faux ? Et c'est peut-être
une question piège. Alors je veux que vous y
jetiez un œil,
ils ont l' air vraiment convaincants. Jetons donc un coup d'œil. La seule façon de
vraiment le savoir est de zoomer et de
regarder les textures. Celui-ci est donc super convaincant. Regardez cette caméra, regardez l'
écran vert, regardez le ciel. Tu ne peux pas vraiment le dire. ce bâtiment. Il n'est pas déformé. Il n'est pas déformé. Cela
semble étonnamment bon. Jetez un œil à ce revêtement de sol. Il n'y a aucune erreur
dans le revêtement de sol. Si vous regardez les chaussures, vous ne pouvez pas vraiment voir
trop d'erreurs avant un ha. Regardez ce bord ici. C'est une image totale
générée par l'IA. De plus, plus vous
zoomez, plus vous pouvez voir cette texture
répétée, presque comme une
texture informatique ici Lorsque vous zoomez sur l'ensemble de la vignette. Cela n'
est pas naturel. Ce n'est pas une texture naturelle. Donc, tout d'un coup,
lorsque vous
zoomez, vous commencez à voir toutes
les petites erreurs. Il lui manque peut-être un doigt, mais vous pourriez simplement dire : «
Eh bien, il se courbe dans un sens ». Ainsi, lorsque vous effectuez un zoom arrière, vous ne pouvez pas vraiment le savoir, mais lorsque
vous zoomez, vous le pouvez. Il y a aussi, en fait
, une photo publiée sur Red it, comme une vraie forme ou une forme rouge artificielle. Et de nombreux
professionnels de la photographie ont signalé des tonnes de
problèmes avec cet appareil photo. Ainsi, lorsque vous travaillez dans le
domaine de la réalisation de films, vous pouvez voir des tonnes d'erreurs. De plus, quelqu'un a fait remarquer que cet écran vert n'a pas exactement le même angle qui apparaît ici qu'il apparaît
réellement. Et le plus gros cadeau pour moi, ou ce que la plupart des gens
pourraient voir c'est
ici, sur
l'échafaudage Il y a un câblage
et une flexion vraiment
étranges des fils. C'était donc une mince affaire. Mais lorsque vous effectuez un zoom arrière,
c'est tellement convaincant. Mais lorsque vous zoomez,
vous pouvez toujours le constater. Qu'en est-il de celui de gauche ? Celui-ci est plutôt convaincant. Je veux dire, il a
l'air de son âge. Peut-être s'agit-il d'une photographie
vieille de 7 ans ou
d'une photographie de 10 ans de lui en train de filmer quelque chose pour
Mission Impossible Eh bien, ouah. Ça
a l'air plutôt bien. Les petits détails sont restés. Regarde cet homme qui tient la photo. Nous avons les câbles, il nous reste encore beaucoup de détails
naturels semblables à ceux de l'homme. Vous pouvez même les voir
grignoter sur le plateau avec des biscuits et du café et même avoir ce petit logo sur sa
veste et même une épinglette Tout cela semble super convaincant jusqu'à ce que vous réalisiez que
celui-ci est aussi une IA. Encore une fois,
cet appareil photo n'
existe pas dans la vraie vie. Vous pouvez faire une recherche d'image
inversée, essayer de trouver cet appareil photo, mais vous ne pourrez pas le trouver
car il n'existe
pas du tout. Mais celui-ci était probablement l'
un des plus difficiles. Il n'y a pas cette façon
évidente d'utiliser Omega comme l'IA, mais comme vous pouvez le
constater, Google Nana,
Banana a vraiment fait vibrer les choses d'une
manière presque très effrayante Donc oui, ils sont tous les deux des IA. Mais celui de gauche est en fait beaucoup plus convaincant
lorsque vous zoomez. C'est vraiment effrayant. Très bien, vous tous
créatifs. Faisons-en une qui
s'applique à vous. L'un d'eux est un vrai sketch, et l'un d'eux est l'IA. Lequel est lequel ? Je vais vous donner un moment
pour y réfléchir. Regardez tous les détails, et je vais zoomer sur certains d'entre
eux pour qu'ils puissent les voir. Eh bien, ils
ressemblent tous les deux à des croquis. Jetons un coup d'œil à
celui-ci sur la gauche. C'est peut-être de l'IA, mais
c'est difficile à dire. Cela a l'air plutôt authentique. Si c'est de l'IA, j'aurais vraiment
peur. Il y a de nombreuses lignes directrices. Il existe de nombreuses
expérimentations humaines pour essayer de comprendre les formes
de la typographie Je ne sais pas C'est assez
proche. Qu'en est-il de l'autre ? Cela semble vraiment
convaincant avec ce crayon à mâcher
usé Mais est-ce trop mâché ? Je veux dire, qui a vraiment
un crayon aussi mauvais ? Qu'en est-il de ça qui
ressemble à une gomme de forme
vraiment, vraiment, vraiment
étrange Mais les croquis eux-mêmes
sont un peu trop nets. Je vois ces lignes directrices, ce qui me fait penser : Eh bien, peut-être que c'est vrai, parce que ces lignes directrices,
comment une IA peut-elle faire cela ? Vous savez, c'est juste
quelque chose qu'un
dessinateur fait pour essayer de
comprendre la symétrie. Soit c'est un croquis vraiment
talentueux,
soit il est trop symétrique. Même la petite poussière
laissée par la poussière de crayon ou de gomme à effacer est vraiment convaincante. Alors
, lequel est lequel ? OK, donc celle de gauche est en fait une de mes étudiantes,
Amber Axelton, elle l'a fait cadre d'un projet de
marque Celui de gauche est donc réel, et celui de
droite est absolument une IA. Les croquis ont un ton très
foncé. Donc, en général, le crayon
n'a pas cette couleur foncée, et seule une personne
qui a beaucoup dessiné dans sa vie sera en mesure de
l'identifier Et c'est
le problème avec l'IA, c'est que seuls les experts du secteur dans ce que vous recherchez peuvent être
en mesure de le faire, vous savez quoi ? Je pense que c'est faux. Il me semble juste un peu
trop raffiné. Qui n'aime pas une
bonne partie d'échecs ? L'un d'entre eux est réel, et l'autre est généré par Google Nano Banana
Pro. Lequel ? Je vais vous donner quelques
secondes pour le comprendre. Ouais. OK, donc à première vue, celui-ci sur la droite
semble très généré par l'IA. Il est super poli et
possède cette hyperréflexion, presque comme s'il avait été
généré avec un très bon
programme en trois dimensions comme Blender Et quand je zoome, je peux voir certains détails du cheval
qui ont l'air très étranges et qui me font penser à l'IA. Et jetons un coup d'
œil à l'autre. L'autre semble
plutôt naturel. Je vois des morceaux de
bois qui sont un peu ébréchés. Il a juste beaucoup
de texture naturelle. Et si vous voyez comment la lumière l' atteint et
se reflète, cela semble
très, très naturel. Et les pièces semblent
avoir une texture naturelle organique. Il y a même un arrière-plan qui semble convaincant
avec des dessous de verre, des livres empilés
et une tasse à café Alors, lequel est réel
et lequel est ahi ? Celui-ci a trompé
tous ceux que j'ai essayés. Celui de
gauche est donc en fait IA générée par Google
Nano Banana Pro, et celui de
droite est une photo. Elle a été
légèrement éclaircie dans Photoshop, mais il s'agit principalement d'une image originale
intacte Cela vous surprend-il ? Cela vous
choque-t-il d'une façon ou d'une autre ? Tu t'es fait avoir ?
Nous avons donc ici deux
photos apparemment normales de fruits, mais l'une d'elles est une fausse IA, et l'autre est
une vraie photographie. Maintenant, selon
vous, laquelle est une IA et laquelle
est une vraie photographie selon vous ? Je te le promets, ils ne sont pas tous les deux des IA. Ils ressemblent tous les deux à de l'IA. Mais jetons un coup d'œil à
celui-ci sur la droite. Il semble super brillant, presque un peu trop brillant. On dirait presque que c'est
brillant sans aucune raison. Il a juste une brillance supplémentaire
qui semble un
peu artificielle. La table elle-même et la texture
semblent assez convaincantes. Le bol, rien d'autre n'
est vraiment déformé. Cela pourrait être un vrai fruit. L'IA a du mal à comprendre les tiges et à savoir où
ces substances se trouvent sur les fruits. C'est assez convaincant, mais cette brillance m'
embête. OK, qu'en est-il de
celui-ci sur la gauche ? Je veux dire, je pense que la façon dont
cela a été pris dans
les années 80 ou à la fin des
années 90 ou quelque chose comme ça. Son réfrigérateur est très
convaincant. Il y a des médicaments
sur le comptoir. Beaucoup de choses que vous
pourriez voir dans une cuisine au hasard. Même les aimants sont intacts. Il y a un bout de
papier dessus. Tout cela semble convaincant. La bonne
cause de l'ombre
est que la lumière vient du
haut et brille vers le bas. Et il l'a même
le 14 août 1996. Cela correspondrait vraiment à
un type de cuisine sur 96. Alors laissez-moi zoomer et voir si je peux voir s'il s'
agit d'une IA ou d'une réalité. Oh, je crois que je l'ai trouvée. Regarde, tu vois ce petit autocollant ? Sans cet autocollant, j'aurais du
mal à savoir s'il s'agit d'IA ou non Mais encore une fois, les
autocollants, les logos, les badges et la typographie sont très
difficiles à générer pour l'IA Cela ne semble donc pas naturel. Mais tout le reste fonctionne, et c'est vraiment difficile. de droite
est donc une vraie photo, que j'ai trouvée sur Wikipédia, et celle de
gauche a été générée avec Google Nano Banana. Alors, laquelle de ces photos
est réelle et laquelle est une IA ? Elles semblent toutes les deux avoir été
prises dans les années 50 ou 60. Ils sont dans une voiture. Celui de gauche semble très saturé pour une photo, mais il aurait
pu être corrigé Celui de droite
semble assez convaincant. Mais laquelle est l'IA
et laquelle est réelle ? D'accord, celui de droite est généré avec
Google Nano Banana. C'est donc de l'IA, et
celle de gauche est la vraie photo.
Es-tu surpris ? Est-ce que quelque chose
dans les traits
des visages vous a fait
croire qu'il s'agissait d'une IA ? Donc, celui-ci est un
peu différent. Voici une vraie
photo d'anniversaire d'un gâteau que j'ai pris, et c'est l'anniversaire de mon fils et de
ma nièce Ont-ils eu neuf et sept ans, ou ont-ils eu huit et six ans ? Ce serait la grande question. L'un d'eux est modifié
à l'aide de Google na banana, où un seul
élément a été modifié
, à savoir les bougies
d'anniversaire. Maintenant, lequel est le
plus convaincant ? Je pense que la
partie la plus délicate de
celle-ci est de zoomer sur
celle-ci sur la gauche. Vous avez donc ce genre de truc
bizarre avec
le neuf qui se produit, presque comme s'il était cassé, et cela ne semble pas surnaturel. Donc, mon premier instinct
serait de dire :
OK, c'est l'image générée par l'
IA. Passons
à l'autre. Cela commence donc à avoir l'air
presque trop poli. Si vous y regardez bien, il n'y a
presque aucune erreur. de la bougie ne donne même pas un peu de texture cire de la bougie ne donne même pas un peu de texture
. Cela me fait penser que c'est définitivement la photo
générée par l'IA. Et si c'est
celui que vous avez deviné, ils avaient
neuf et sept ans, vous avez raison.
C'est la vraie photo. Et le faux et le modifié sont
le huit et le six. Il est effrayant de voir comment nous pouvons changer des photos du passé et donner aux gens un récit complètement
différent de ce qui s'est passé. Cela peut
être vraiment effrayant. Nous pouvons dire que nous sommes sortis avec
des personnes avec lesquelles nous ne sommes jamais sorties, ou que nous avons un reçu pour un
produit que nous n'avons jamais acheté. C'est ce qui fait peur à propos de l'IA. Encore un
tour de bonus juste pour le fun. S'agit-il d'une vraie photo ou s'agit-il d'une IA générée
par Nano Banana ? À première vue, une réflexion très
convaincante. Regardez comment tout
se reflète. Cela semble très
authentique et réel. Regardez comme il
pleut dehors, et vous pourrez voir la
pluie dans les rues Les voitures ont l'air
plutôt normales, mais est-ce que c'est la même voiture
dos à dos ? Je ne sais pas Je commence à me demander
si c'est vrai ou non. Ses cheveux semblent convaincants. L'éclairage, tout
semble vraiment naturel. Regardez également les détails
du kit. Je ne trouve aucune erreur
dans le tricot. Mais comme toujours, trouvons n' importe quel type de typographie, de
police ou de texte possible Qu'est-ce que réprimander l'herbe douce ? Je ne sais pas ce que
c'est, mais cette typographie n'
a pas l'air naturelle Tout le reste est
trop petit pour que je puisse le lire, mais c'est le cadeau. C'est honnêtement le seul
cadeau de toute cette photo. Vous pouvez zoomer et
regarder autour de vous, mais il est difficile de
trouver une autre raison. Donc, si elle ne tenait pas de livre, si elle tenait
quelque chose sans texte, serait très difficile de
savoir s'il s'agit d'un vrai livre ou d'une IA. Mais oui, c'est de l'IA. J'espère que vous avez apprécié ce
petit examen approfondi pour
essayer de comprendre ce qui
est vrai et ce qui est faux. Cela devient donc de plus en plus
difficile et Google Nano Banana, le contenu que j'ai généré
à partir de là avec instructions
très simples d'une phrase était incroyable
et très convaincant Et je pense que
dans un an ou deux, nous allons effacer tous
ces petits artefacts liés à l'IA, et ce
sera très difficile sans un œil
très averti. Continuez donc à entraîner votre œil, zoomer à 800 %
et à observer les détails, les
textures, les motifs et les
consistances Définitivement de la typographie. Veuillez laisser un
commentaire ci-dessous si cela vous a plu et
combien vous en avez obtenu, n'est-ce pas ? Ou si vous vous êtes trompé, êtes-vous surpris par
l'un d'entre eux ? Rendez-vous dans la prochaine vidéo.