Transcription
1. Introduction: Ton Buzzy et je comprends. L'IA peut sembler compliquée et vous souhaitez l'apprendre le plus
rapidement possible. Avec un horaire chargé
et un emploi à temps plein, vous n'avez pas le temps de
suivre un cours de 50 heures. Vous avez juste besoin de compétences
pratiques en intelligence artificielle pour améliorer l'efficacité des graphiques, du texte, des e-mails, du code, etc. Si c'est votre cas, alors
ce cours est parfait. Imaginez impressionner tout le monde
grâce à ses connaissances en matière d'IA , au moment où cela compte Tu es apparu comme un vrai pro. Dans ce cours, vous aurez
une compréhension claire IA,
des LLM
et des modèles de diffusion, de la manière d'utiliser des
LLM tels que Chachi BT,
grâce à une ingénierie rapide, en
explorant la multimodalité
et les modèles les plus performants, en proposant des techniques pour
des modèles de diffusion tels que
Dai AdObviaFly, techniques pour tels que
Dai AdObviaFly de l'IA,
des LLM
et des modèles de diffusion, de la manière d'utiliser des
LLM tels que Chachi BT,
grâce à une ingénierie rapide, en
explorant la multimodalité
et les modèles les plus performants, en proposant des techniques pour
des modèles de diffusion tels que
Dai AdObviaFly,
la diffusion stable à moyen chourney, le flux, etc. Des informations sur les vidéos, les
voix et même la
création musicale basées sur l'IA sont abordées. Et d'ailleurs, si vous vous
demandez qui je suis, je m'appelle Arnie, et je donne cours d'
IA avant
même que ChIPT n'existe Je suis donc relativement
long dans le jeu. J'ai également une petite chaîne YouTube en
allemand, et c'est ce que je fais.
2. Qu'est-ce que l'IA ?: Nous pouvons
approfondir le monde de l'IA, nous devons définir
ce qu'est réellement l'IA. L'IA n'est donc qu'un terme utilisé
en informatique. L'objectif est de créer des machines
dotées d' une intelligence semblable à celle de l'homme. Par exemple,
la reconnaissance de formes, la prise de décision basée sur les données
et également l'exécution de tâches. Et ne pense pas à Terminator. Ce sont des tâches simples. Il peut également s'agir d'écrire du
texte comme le fait Chachi Pit. Quel est le but ultime ? Le but ultime est l'AGI, donc l'
intelligence générale artificielle. Et cela signifie simplement apprendre, comprendre, résoudre des problèmes et créer aussi
bien ou mieux que les humains. intelligence
générale artificielle
est donc plus intelligente que la plupart des humains, et c'est un objectif
et personne ne sait exactement quand il
sera atteint. Et le but ultime, et personne ne sait si cela se produira un
jour, est l'ASI. Super intelligence artificielle. Cette IA serait plus intelligente
que tous les humains réunis. Et comme je l'ai dit, ne pensez
pas à Terminator pour le moment. Qu'est-ce que l'IA n'est pas ? L'IA ne sait pas tout, n'a pas confiance en
elle, n'a aucune émotion, et
l'objectif actuel est simplement d'atteindre un objectif fixé. Vous dites à l'IA : « Hé, écrivez-moi un texte ou faites-moi une photo » et l'
IA s'en chargera. C'est pour le moment, mais nous
avons aussi la robotique, etc., mais ce n'est pas le
sujet principal de ce cours. Faisons juste quelques
exemples ici, et je peux aussi écrire ceci. Voici quelques exemples : nous
avons un assistant vocal, et la plupart d'entre vous connaissent l'assistant
vocal. CiRia est donc un
assistant Google mais aussi voix
GPS et ils
comprennent simplement les commandes vocales et y répondent La voix GPT ou l'
API WISPA sont vraiment cool. Nous y reviendrons également
plus tard dans le cours. Ensuite, nous avons
des systèmes de recommandation, qui sont anciens. Il suffit de penser à Netflix,
Spotify ou même YouTube. Vous regardez une vidéo, et
en fonction de votre comportement, les algorithmes
trouveront des vidéos similaires. Et puis il y a aussi la conduite
autonome. Les voitures autonomes utilisent donc l'IA pour comprendre où elles se trouvent
, puis elles roulent dans
cette direction. Et il s'agit tout simplement d'une véritable IA. Comme le FSD de
Tesla, par exemple, est une véritable IA, ils
ne sont donc pas programmés pour
conduire sur cette route Ils regardent la route
puis ajustent leur comportement. Et bien sûr, nous avons des
LLM et des modèles de diffusion. Donc de grands modèles linguistiques
et de diffusion. grands modèles linguistiques produisent du texte et les
modèles de diffusion des images. C'est le cœur. Et comme c'est l'essentiel, nous commençons par les LLM Donc, dans la prochaine vidéo, je vous verrai et nous verrons de plus près ce que sont les LLM
3. Que sont les LLM tels que ChatGPT, Claude, Gemini, etc: Parmi les gens qui connaissent HachBD. JacPT est un LLM, et ici vous pouvez faire
beaucoup de choses et nous allons approfondir le
HachPT Mais laissez-moi vous dire que nous
avons beaucoup plus de LLM. En gros, si vous
allez sur ce site Web, l'arène des chatbots, vous verrez que nous avons beaucoup
de LLM différents Ils viennent d'Opie, donc HaChipt vient d'OPeIE Ensuite, nous avons les Gémeaux.
Cela vient de Google. Nous avons Grock. Cela
vient de XI, donc ELN Mask. Nous avons un nuage, le nuage
vient du tropique. Je veux juste vous dire que nous
avons beaucoup de LLM différents Et dans cette vidéo, je
veux vous montrer comment fonctionne
un LLM, car
vous devez comprendre les concepts des jetons, etc. pour
les utiliser correctement, car les jetons et la structure
d'un LLM sont importants que vous
puissiez les utiliser
correctement le plus rapidement possible En gros, il
ne s'agit que de deux fichiers. Et nous ne donnons qu'un
exemple simple avec Lama 2. Pour tous ceux qui savent déjà exactement ce qu'
est un LLM et comment il fonctionne, vous pouvez bien
sûr
sauter le cours. En gros, un LLM
se compose de deux fichiers. Nous avons un fichier, et ce fichier est essentiellement
le fichier de paramètres, et je le crée simplement ici sous la forme P. Cela signifie paramètre. Et nous avons un deuxième fichier, et le second fichier sert simplement
à exécuter ces paramètres. Je l'appelle simplement run file. Ce fichier d'exécution est écrit la plupart
du temps en C. C est un
langage de programmation ou en PyTon Les deux peuvent donc
éventuellement fonctionner. Nous avons donc ici le fichier
de paramètres
et le fichier d'exécution. Et le fichier d'exécution se compose la
plupart du temps 500 lignes de code. Nous utilisons donc 500 lignes de
code pour exécuter ce fichier. Et c'est dans ce dossier que la magie
opère car ce
fichier est gigantesque. Prenons l'exemple d'un
LAM open source, appelé ama two. Donc ama est, bien sûr, le LLM de Meta, et ils ont des modèles différents Et ce Lama, là aussi, où
nous prenons cet exemple, c'est le modèle 70 B. Cela signifie donc simplement que nous
avons 70 milliards de paramètres. Vous savez donc qu'il s'agit d'un dossier relativement volumineux
que nous avons ici. Ce fichier de paramètres contient donc
70 milliards de paramètres, et comment obtenir tous
ces paramètres ? Nous devons entraîner ce fichier et nous l'entraînons
sur une grande quantité de texte. Nous utilisons 10 téraoctets de texte pour
entraîner ce fichier. Nous utilisons donc dix textes Theraby. Il s'agit d'un texte provenant
de partout sur Internet. Il peut donc s'agir d'articles de
Wikipédia , de
sites Web et bien plus encore. Et ce fichier, nous pouvons simplement le
compresser,
et ce fichier ne fait que
140 gigaoctets. Ce fichier
ne fait donc que 140 gigaoctets et nous
l'entraînons sur
10 téraoctets Tu sais, on peut le
compresser beaucoup. Ce fichier de paramètres,
vous pouvez simplement le considérer comme un fichier zip. Il compresse
simplement toutes ces données. Pour compresser ces données, nous avons besoin d'une grande puissance GPU. Nous avons donc besoin de beaucoup de puissance
GPU pour
compresser ces données. C'est aussi pour cela que NVDA a connu un
tel succès
ces dernières années Si vous regardez, par exemple, l'action NVIDIA, vous voyez que nous avons une course gigantesque, essentiellement
parce que tout le monde a besoin d'un GPU. Vous voyez donc que nous avons
une course gigantesque, mais il ne s'agit pas d'
actions pour le moment. Donc, en gros, nous
utilisons beaucoup de GPU. Je fais en sorte que ce soit très simple. J'ai également des explications plus
détaillées, mais je ne pense pas que nous en
ayons besoin dans ce cours. Nous compressons donc simplement le texte de
dix Trabte dans
un fichier de 140 gigaoctets, puis nous avons
le second Le deuxième fichier est le fichier Run. Ce ne sont que quelques lignes de code. Et si nous avons un logiciel libre, à une heure du matin, comme
Lama deux, voire Lama trois, ou n'importe quel logiciel
libre que vous souhaitez, nous
pouvons télécharger ce fichier et exécuter ces fichiers
localement sur notre PC. Et cela nous apporte une sécurité
maximale des données car rien ne passe
sur Internet. Avec ces deux fichiers, c'est un peu
magique car c'est ici que fonctionne l'
architecture du transformateur en arrière-plan. Vous pouvez simplement
penser au réseau neuronal. Nous n'avons pas besoin de plonger aussi profondément. Mais en gros, le
réseau neuronal voit les mots et prédit le
mot suivant le plus probable Cela fonctionne donc essentiellement comme ça. Nous nous entraînons sur tous les textes, de sorte que le LLM apprend simplement
comment le texte est structuré Si nous demandons, par exemple, ce que je dois manger aujourd'hui, le LLM prédira simplement quels mots un humain
est le plus susceptible d'entendre heure actuelle, cela s'
appelle simplement le pré-entraînement avec
le pré-entraînement, nous hallucinons simplement des
choses à partir de ce fichier Mais ensuite vient la deuxième chose. La deuxième chose
est le peaufinage et avec le peaufinage, nous donnons au LLM de nombreux
exemples de la façon dont les humains
veulent avoir leur réponse Nous soumettrions,
par exemple, une question. Que dois-je manger aujourd'hui, et ensuite nous donnerons une
réponse qui plaira aux humains. Par exemple, vous pourriez
manger du steak aujourd'hui. Si nous le répétons encore
et encore, le LLM apprend comment les humains
veulent leurs réponses C'est ce qu'on appelle le réglage divin, et c'est la deuxième
partie pour exécuter les LLM Ensuite, la dernière partie est ce que
l'on appelle l'apprentissage par
renforcement, et nous pouvons le décomposer de manière
très simple. Après le pré-entraînement
et le réglage divin, nous allons simplement faire cet apprentissage
par renforcement. Cela signifie essentiellement
que nous posons une question, nous obtenons une réponse,
puis que nous disons au LLM si c'est bon ou non Il s'agit essentiellement de l'apprentissage
par renforcement. Nous avons donc trois
phases de formation. Avant l'entraînement, nous utilisons
simplement beaucoup de GPU pour compresser une grande partie de
texte dans un fichier plus petit, appelé ZIP,
et nous pouvons en
faire des hallucinations
. Afin d'améliorer ces
hallucinations, nous les peaufinons. Nous alimentons donc
de nombreuses questions avec des réponses structurées d'une
manière qui plaît aux humains. Et dans cette phase, le D LLM apprend comment les humains veulent leurs réponses Enfin, en ce qui concerne l'apprentissage par
renforcement, nous examinons simplement : « Hé, est-ce
logique ou non, oui,
pouce levé, pouce vers le bas », et le LLM apprendra simplement comment nous voulons
obtenir Maintenant, la prochaine chose
qui est vraiment très importante, c'est que vous l'
avez déjà apprise. Dans cette
architecture de transformateur, il existe des réseaux neuronaux, et des réseaux neuronaux
fonctionnent avec des poids. En gros, ils
fonctionnent avec des chiffres. Et pour donner
un sens au réseau neuronal, nous avons bien
sûr besoin
de chiffres. Donc, la première chose à faire
est, bien sûr, que
si nous introduisons une question
dans un LLM, le LLM fabriquera des numéros à
partir de ces questions, que
l'on appelle Ces jetons sont des nombres, et avec ces chiffres, le réseau neuronal peut
effectuer ses calculs. Quel mot viendra
probablement comme mot suivant ? Je veux simplement vous montrer comment ces doçons sont structurés Si nous utilisons ce
tokenizer, nous pouvons le voir. Nous pouvons simplement taper Que
puis-je manger aujourd'hui par exemple, et maintenant vous voyez que nous
avons cinq jetons, 20 caractères, et les jetons
sont structurés de cette façon. Si nous appuyons ici sur les identifiants de jetons, c'est essentiellement
ce que font les LLMC Le LMC est constitué de nombres, et avec ces chiffres, le réseau neuronal peut effectuer ses calculs et nous
donner une bonne réponse Si j'appuie ici, par
exemple, sur Effacer, encore
une fois, puis que je
passe à montrer l'exemple, vous verrez un exemple plus grand. Et ici, vous voyez également que tous les
mots
ne sont pas un signe unique. Cela est divisé un
peu différemment. Ici, vous voyez,
deux jetons invisibles
, par exemple , et ici ce
point est également un jeton distinct. Nous avons donc beaucoup de jetons
différents, et si nous appuyons sur ceux-ci, vous voyez, c'est essentiellement
ce que voit le LLM et le LLM fait ses calculs à
partir des Mais je vous montre
cela parce que c'est important parce que nous
avons une limite symbolique. Chaque LLM a
toujours une limite quant au
nombre de jetons qu'il peut
comprendre à l'heure actuelle Si nous lisons cet article
ici, que sont les jetons ? Omei nous dit qu'un jeton est composé d'environ quatre
caractères en anglais Cela signifie que 1 500 mots
correspondent à environ 2 048 jetons. Et c'est important car chaque LAM a une limite de jetons
différente. Vous pouvez le voir ici. À l'heure actuelle, PIB pour Turbo et
aussi pour Omni,
et bien d'autres modèles, ils ont une limite de stock d'environ 128 000 jetons Nous avons également des modèles qui ont une limite de
2 millions d'endocènes. Nous avons également un modèle
open source plus petit qui n'a qu'une limite de 4 000
docenestocen, et l'important
est que vous compreniez que dès que la limite
dtcen sera atteinte, LLM ne comprendra plus choses dont vous avez parlé
précédemment avec
le Je veux juste vous montrer
un exemple de chat PIB. Je raconte simplement au LLM d'
écrire une histoire sur un renard, et maintenant nos premiers
jetons sont générés Et dès que nous serons
proches de la limite de jetons, donc dès que je
parlerai,
par exemple , d'autres sujets, supposons
que je veuille avoir des histoires
différentes
ici même dans ce chat. Par exemple, raconte-moi
l'histoire d'une grenouille. À l'heure actuelle, bien sûr, de nouveaux
jetons sont générés. Et dès que nous
atteindrons notre limite de jetons, le LLM ne connaîtra plus
notre question précédente la réponse,
car le LLM ne connaît
toujours que
les derniers Dans ce cas de JCEPT, la fenêtre de contexte
est relativement grande, elle
contient donc 128 000 jetons Ce sont environ 100 000
mots, comme je l'ai dit. Et après cela, il n'obtiendra plus ce
dont nous avons parlé précédemment. Alors s'il vous
plaît, s'il vous plaît, souvenez-vous les
derniers jetons comptent
toujours, et que tout ce qui
est terminé
ne sera plus
connu du LLM Tu peux l'appeler ainsi. Bien sûr, nous avons beaucoup de techniques pour approfondir
ces connaissances, par
exemple,
la technologie directe, etc.,
nous en reparlerons plus tard. Mais pour l'instant, vous
devez comprendre que chaque LLM a
une limite de jetons Cela finira par disparaître. terme, la
limite de jetons sera si grande que nous n'aurons plus
besoin d'y penser,
mais pour le moment, nous avons ces limites et
nous devons le savoir. En gros, si vous vous
demandez pourquoi le LLM ne sait plus de quoi
vous avez parlé précédemment, c'est simplement parce que la limite de
docen est atteinte Dans cette vidéo, vous avez
appris comment fonctionne un LLM. En gros, nous
n'avons que deux fichiers. Nous avons un
fichier de paramètres et un fichier d'exécution. Le fichier d'exécution est juste un code
pour exécuter le fichier de paramètres, et le fichier de paramètres est simplement un grand nombre de textes
provenant d'Internet, mais il est compressé dans un petit fichier similaire
à un fichier CIP Nous avons besoin de beaucoup de GPU pour cela. C'était la pré-formation. Après le pré-entraînement,
vient le réglage divin. Ici, nous alimentons les questions et
réponses du
LLM afin que le LLM puisse savoir
comment nous voulons obtenir nos Et après le réglage divin, la dernière étape est l'apprentissage
par renforcement. Nous posons simplement des questions, obtenons des réponses et évaluons les réponses pour savoir si elles
sont bonnes ou non. Et avec cette dernière phase, le LLM s'
améliorera dans ces tâches Vous avez également vu qu'en arrière-plan fonctionne, l'architecture du
transformateur. Ce sont des réseaux neuronaux et des réseaux
neuronaux, ils font
des calculs avec des nombres. C'est pourquoi nous devons
diviser nos mots en jetons. Avec ces jetons, nous pouvons
effectuer les calculs et calculer quel mot est le
plus probable comme
mot suivant ce que nous voulons avoir. Vous devez comprendre
ces jetons, car chaque LLM a ce que l'on
appelle une limite de jetons Dès que la
limite de jetons sera atteinte, le LLM ne saura plus ce que
vous chiez auparavant Il tient toujours compte
des derniers jetons
et, bien entendu, les
limites des jetons dépendent du modèle. Parfois, il s'agit de 4 000 jetons, mais cela peut aller
jusqu'à 2 millions. Et une dernière chose, bien sûr, questions
que nous
posons au LLM sont très importantes , car avec de
bonnes questions, nous obtenons de bonnes réponses C'est ce qu'on appelle l'ingénierie
rapide, mais nous y reviendrons, bien
sûr, plus tard. Je vous vois dans la vidéo suivante, je sais que nous l'avons fait
un peu vite, mais je pense que pour ce qui est des
détails techniques, tout le monde devrait simplement le comprendre
. Nous l'avons donc fait rapidement. Nous ne l'avons pas fait
dans les moindres détails, mais c'est largement suffisant
pour fonctionner avec ce modèle. Vous avez besoin de ces détails
techniques pour comprendre
que vous
n'avez pas un nombre illimité de questions avant que JGBT n'oublie les choses, et vous devez également les
comprendre, car une ingénierie rapide est vraiment importante pour obtenir de bons résultats,
et vous n'obtenez de bons résultats que
si vous donnez de bonnes C'est ce qu'on appelle l'ingénierie rapide. Je voudrais parler de l'ingénierie
rapide dans la section suivante.
4. Les interfaces des LLM: Cette vidéo vise à vous
montrer certains des LLM
les plus importants et, bien
sûr, leur interface Maintenant, vous avez déjà vu que nous
avons beaucoup de LLM différents, et nous pouvons en trouver d'innombrables sur ces arènes
de chatbots Les plus importants sont, du
moins, la façon dont je vois JetPT d' Opmei, Clade d'Anthropic, Gemini de Google, et éventuellement
aussi les modèles open source, et nous pouvons les utiliser soit sur
Grock, soit nous pouvons également les utiliser Grock Maintenant, nous voulons commencer par le HPT parce que je pense que c'est au
moins le meilleur pour le moment Oui, certaines personnes adorent les caillots parce que Clot est également
très doué pour coder Donc, en gros, oui,
ils peuvent aussi coder. Je veux vous montrer
l'interface en détail du JCPT car si
vous comprenez le JCPT , vous
comprenez également toutes les Voici la barre dans laquelle vous pouvez taper
vos questions. Et ces questions,
nous les appelons des suggestions. Et bien entendu, l'
ingénierie rapide est l'art de rédiger
les bonnes questions. Si vous souhaitez télécharger du contenu dans HAThipt, vous l'avez
ici Vous pouvez joindre des fichiers. Vous pouvez télécharger des photos ou des PDF, etc., et
vous pouvez les analyser Voici la
recherche, le bouton Web. Si vous appuyez dessus,
Hatchipt effectuera une recherche sur le Web. Testons cela
une seule fois. Si nous appuyons sur la recherche, nous pouvons saisir le prix
du Bitcoin aujourd'hui. Donc, ici, vous pouvez
voir que nous récupérons le texte et que nous obtenons également des liens sur lesquels nous
pouvons cliquer si nous le voulons. Voici donc les sources, et si vous appuyez dessus, nous pouvons voir que le doctorat a fait des recherches sur le Web Nous utilisons la capitalisation
boursière des pièces, etc. Maintenant, si vous utilisez une nouvelle
discussion dans le coin gauche, elle est à nouveau vide et vos anciennes discussions
se trouvent ici. La prochaine chose que vous
pouvez faire est, bien sûr, d' appuyer sur HatPd et
d'utiliser différents modèles Nous avons le PIB normal pour
Omni, idéal pour la plupart des tâches. Faites du GPS quatre oh avec du canevas. Si vous appuyez dessus, le
canvas est également très intéressant, car
disons simplement que vous souhaitez
générer du code. Donne-moi le
code pour mordre un serpent. Chet PIB va
ouvrir ce canevas, et dans ce canevas, nous pouvons
modifier un peu ce code C'est vraiment sympa. Donc, ici sur le côté droit,
vous pouvez cliquer. Vous pouvez soit revoir le code, porter dans d'
autres langages tels que JavaScript
ou autre. Vous pouvez également corriger des bogues. Vous pouvez ajouter des journaux et des commentaires si vous le souhaitez. Pour tous ceux qui codent, j'espère que vous comprenez ce que je veux dire. Si nous générons
du texte normal avec ce canevas, c'est également intéressant car nous pouvons également modifier notre texte
dans ce canevas. Nous pouvons soit suggérer des modifications, ajuster la longueur,
afin de la raccourcir, par
exemple,
si vous le souhaitez, et si nous l'envoyons, elle sera
réécrite mais Et voilà, nous avons essentiellement le même texte,
mais beaucoup plus court. Ensuite, nous pouvons ajuster
le niveau de lecture. Ainsi, par exemple, pour les
études supérieures ou pour la maternelle. Ensuite, nous
pouvons ajouter le vernis final. Si nous appuyons dessus, JetPT fera de manière complètement
automatique Il va simplement le réécrire et le
restructurer un peu. Peut-être que quelque chose ne va pas
ou que quelque chose est un peu trop court, et vous obtenez de
meilleurs résultats. Et enfin, bien sûr, nous pouvons également ajouter
des images si nous le souhaitons. Et là, nous avons de
jolies petites images. Outre ce canevas, nous
avons également un aperçu 01. L'aperçu ouvert est le
modèle qui pense. Si nous donnons une tâche difficile au JCPT, JCPD est capable de réfléchir un
peu avant
de donner peu avant Est-ce un bon titre YouTube ? J'aime bien vivre sur Mars ?
Pensez aux mots clés, au taux de clics, etc. Et le JCPT va commencer à réfléchir. Vous voyez donc que HHIPT réfléchit. Il génère lui-même un jeton. Ici, vous pouvez voir le processus de
réflexion, puis il peut obtenir de
meilleures réponses, car JCIPT se
donne toujours de
nouvelles pistes de réflexion, et voici notre résultat Outre l'aperçu 01, nous avons également le 01 Mini. Cela fait essentiellement la même
chose, mais c'est plus rapide. Et si vous optez pour d'
autres modèles,
nous avons actuellement le PIB pour le modèle O Mini
et le PIB pour le modèle Legacy Si vous souhaitez simplement
avoir des discussions temporaires, vous pouvez également les inclure. Si vous cliquez sur ce point d'interrogation, vous voyez que vous pouvez signaler contenu
illégal en utilisant des raccourcis. Vous avez des conditions
générales, des notes de publication , un guide d'
aide, etc. Ce critère est
simplement votre nom. Dans le coin gauche,
ils vous *****. Donc, si vous appuyez dessus, vous pouvez améliorer votre plan. Je paie actuellement
20 dollars par mois, mais vous pouvez également commencer gratuitement. Si vous utilisez le plan d'affaires, vous devez payer
25 dollars par mois. En gros, vous obtenez
la même chose. Mais le plus
important est que vos données soient
automatiquement
exclues de l'entraînement. C'est donc un peu plus sûr. Sur le côté gauche,
vous pouvez également fermer la barre latérale et
lui redonner vie. Vous pouvez appuyer sur Rechercher des chats. Et ici, vous pouvez
rechercher les discussions que vous avez déjà
eues avec hat PIB Et si vous appuyez dessus
ici, discuter
comme si vous aviez un NuCat Alors vous avez ces
choses ici. Ils sont appelés GPD et je voudrais vous en montrer
plus sur les CPD plus Mais si vous appuyez sur Explore PIB, vous pouvez
essentiellement
rechercher des GPD spécifiques créés par d'
autres personnes Si vous souhaitez,
par exemple, programmer, vous pouvez cliquer sur
Programmation et trouver des GPD spécifiques
adaptés à la programmation Il s'agit d'un PIB pour PyTon et
si vous appuyez sur Sarchat, vous pouvez simplement discuter
avec ce PIB,
et c'est, comme je l'ai dit, spécifiquement Il s'agit essentiellement de l'interface
JAhipt. Si nous passons au Cloud, vous verrez en gros que l'interface est
relativement similaire. Vous pouvez saisir ici
ce que vous voulez faire. Vous pouvez également effectuer une mise à niveau vers Cloud. Cette interface est un
peu plus simple, mais en gros elle fait
la même chose que JAhipt mais plus simple,
comme je vous l'ai dit Mon code serpent, et aussi Clot me
donneront le code serpent, et Clot ajoutera
quelque chose comme Voici Gemini. heure actuelle, Gemini est
en allemand pour moi, Gemini est également un LLM normal, et il peut aussi faire près
la même chose que
Chachi Voici
Grock et sur Grock, vous pouvez essentiellement utiliser des LLM
open source Et l'interface
est minimaliste. Vous pouvez taper vos informations
ici ou vous pouvez également leur
parler. Et d'ailleurs, vous pouvez également installer hat chIPT sur votre PC, et vous l'avez sous forme d'application, et vous pouvez également l'installer sur votre smartphone et vous
pouvez parler à Hatchipt Voici
l'application Hatchipit,
et si nous parlons à l'application Hatchipit, elle répondra Hé, Chat Chi Pit, raconte-moi
une petite histoire à propos d'un renard. Il était une fois,
dans une forêt luxuriante, une
renarde intelligente nommée Fiona Reconnue pour sa vivacité d'esprit, Fiona aimait explorer
et découvrir tout ce qui l'entourait Un jour, elle est
tombée sur un piège
tendu par des chasseurs
utilisant sa ruse Il s'agit essentiellement du mode vocal
avancé. Je pense que c'est
actuellement une fonctionnalité payante. Donc, si vous payez pour ChatBD et installez
simplement l'
application sur votre PC local, vous pouvez utiliser ce mode vocal
avancé Et la dernière chose que je
veux te montrer, c'est Olama. Si vous téléchargez Oma, celui-ci s'exécutera
localement sur votre PC. Ne vous inquiétez pas si vous
ne voulez pas le faire. Je veux juste
vous montrer comment cela fonctionne. Il vous suffit d'appuyer sur
Télécharger ici, puis vous pouvez accéder aux modèles et rechercher les
modèles que vous souhaitez. Et la prochaine chose
que vous devez faire est d'accéder à votre terminal, et cela
fonctionnera localement. Dans votre terminal, vous pouvez rechercher les modèles
que vous souhaitez utiliser. Par exemple, Lama 3.2, vous pouvez simplement appuyer sur
O Lama run Lama 3.2. Si vous les copiez et
les insérez dans votre terminal, vous pouvez télécharger ces
modèles de Lama ou les exécuter. S'ils sont déjà
installés, vous pouvez les exécuter. Je l'ai donc installé, et maintenant vous pouvez également le
faire ici. Raconte-moi une histoire sur le rock, puis Lama me racontera
une histoire sur le rocher. Ici, c'est particulièrement
intéressant pour la confidentialité des données, mais bien sûr, il n'y a pas
d'interface agréable dans OLAM Vous pouvez le lier, par
exemple, à tout ce qui concerne le LLM, mais c'est trop important
pour ce cours car nous devons
apprendre ces choses rapidement Donc, en gros, si vous voulez exécuter les choses localement, vous
pouvez totalement le faire. Mais dans la plupart des
cas, si vous débutez, utilisez
simplement HaChipt dans l'interface
standard Dans cette vidéo, vous avez donc vu toutes
les interfaces importantes. Si vous souhaitez exécuter les LLM
le plus rapidement possible. Dans la vidéo suivante, je veux vous
montrer ce que les LLM peuvent faire.
5. Que peuvent faire les LLM ?: Cette vidéo vise à vous donner un aperçu rapide de
ce que les LLM peuvent faire, peu importe
le type de LLM que vous En gros, la plupart des
modèles de pointe peuvent faire la même chose, et les
modèles open source apparaîtront également au fil du temps. Chaque LLM peut
agrandir le texte ou le coder et réduire le texte
ou le code. Vous pouvez donc résumer
le texte ou le développer. Faisons simplement un exemple. Vous pouvez taper quelques mots et obtenir beaucoup de mots. Donnez-moi un texte marketing pour
mon site Web, AI with Arnie. Non, je n'ai pas vraiment
ce texte marketing. heure actuelle, j'utilise le modèle d'aperçu
OO simplement parce qu'il était actif. Maintenant, le CHGPT réfléchit un peu texte marketing
qu'
il doit écrire, puis j'aurai ma réponse Vous voyez donc que nous transformons un petit bout de texte
en beaucoup de texte. J'espère que tu comprends ce que je veux dire. Ensuite, nous pouvons résumer le texte. Voici un article
sur Medium à propos des LLM. Vous pouvez simplement
copier un petit bout de texte. Vous pouvez le lancer dans JTCPD
et dire « résumer sous forme de puces ». Donc, en gros, vous
pouvez résumer le texte. Et
voilà. Nous avons maintenant quelques points à propos de ce
texte. Même chose avec le code. Vous pouvez générer du code. En gros, nous pouvons faire
quelque chose comme ça. Nous pouvons créer beaucoup
de code très rapidement. Donnez-moi le code
de la page Web HDML qui comporte trois boutons Je ne peux activer que deux
boutons en même temps. Cela devrait montrer qu'il n'
est pas possible d'être à la fois fauché, intelligent et occupé
. Maintenant, il va générer
du code HDML. Maintenant, il y a le code. Voyons juste si cela fonctionne.
Je copie le code. Je crée un nouveau fichier texte. Je jette le code dans le fichier
texte et je l'enregistre. Maintenant, je l'enregistre au format HDML HDML Oui. Et j'ouvre la page web
cassée, intelligente, occupée. Cela ne fonctionne pas parce
que, par exemple, pensez par vous-même, vous pouvez être intelligent et occupé, mais alors vous n'êtes pas fauché parce que vous travaillez sur
les bonnes choses. Si vous êtes fauché,
vous ne pouvez pas être intelligent et occupé, car si vous
étiez intelligent et occupé, vous ne seriez pas fauché, mais vous pouvez, bien
sûr, être fauché. Et occupé mais pas malin. Si vous êtes fauché et intelligent, vous n'êtes pas occupé parce que vous
ne faites rien parce que cela
ne fonctionne tout simplement pas de cette façon. Et bien sûr, si vous avez
beaucoup de code, par exemple sur une page Web, vous pouvez également
essayer de le réduire. Donc oui, vous pouvez également
résumer le code s'il fonctionne. Vous pouvez également générer
des tables si vous le souhaitez. Il s'agit donc, par exemple, d'un tableau sur les
macros d'une banane. Le texte peut donc être,
bien entendu, également des tableaux. Et maintenant vient la partie amusante ,
car les LLM peuvent également utiliser des outils tels qu'une calculatrice, un interpréteur
Biton ou un modèle de diffusion Un modèle de diffusion
produit des images. Je veux te montrer. Combien font
trois fois 98 fois 98 ? Si nous l'envoyons, vous
verrez que nous sommes en train d'analyser. Donc, en gros, nous utilisons des outils. Je pense que JAhipt va simplement nous
écrire plus de
script PTN pour ce faire Si vous appuyez sur Afficher l'analyse, vous voyez que ChaChipt utilise interpréteur
Python
pour nous donner le résultat Prenez une photo de la banane, et HCBT utilisera un modèle de diffusion tel que Dali
pour créer cette Et voilà la banane. Bien entendu, nous pouvons
également analyser des choses. Permettez-moi de vous montrer le contenu
de l'ensemble de données. En gros,
laissez-moi vous montrer un ensemble de données contenant des informations
sur les réseaux sociaux. Il s'agit essentiellement de
l'utilisation des gens, alors où ils
sont, sont-ils sur Snapchat ,
****, dock, pin
arrest, etc. Et vous voyez, c'est une
très grande table, et nous
pouvons analyser tout cela. Ici, ça me donne une table. Excusez-moi, pour l'
instant, c'est en allemand, mais nous voulons parler
en anglais maintenant. Et c'est aussi la prochaine chose que je
voulais vous montrer parce que, bien
sûr, les LLM peuvent
également traduire des choses. Voici donc des trucs en allemand. Vous pouvez simplement dire à HathPT, traduisez ceci en anglais Et vous pouvez le faire
aussi, et vice versa. Le jeu de données contient 1 000 lignes avec les colonnes suivantes. Nom d'utilisateur, application,
minutes quotidiennes passées, publications par jour, likes par
jour, abonnés par jour. Et ici, vous avez tout. Vous voyez donc Pinterest, Facebook, Insta, **** Doc et LinkedIn Minutes quotidiennes dépensées,
publications par jour, likes par jour, suivis par jour. Faites-en un tableau
parce que nous pouvons utiliser
des outils, vous savez. JGBT utilisera un graphique BTN pour
créer un joli graphique pour nous. Et nous l'avons ici, Facebook, puis
Installink,
Pinterest, et ainsi de suite Et bien sûr, si
vous appuyez dessus, nous pouvons passer à un graphique
interactif. Nous pouvons également utiliser, par exemple, différentes couleurs si
vous aimez d'autres couleurs. Et ensuite, si vous l'aimez, vous pouvez d'
abord l'agrandir. Mais si vous l'aimez, comme je l'ai dit, vous pouvez également le
télécharger par ce bouton. Et HGPT comprend également
le contexte de ce chat. Créez un cochon qui
illustre l'ensemble de données. Le JCPT comprendra simplement qu'il s'agit de réseaux sociaux et il est fort probable que
certaines personnes utiliseront un téléphone
ou quelque chose comme ça Du moins, c'est comme ça
que je le devine. Et voilà. Il s'
agit d'une page de réseau social. Et bien sûr, avec certaines données,
car il s'agit d'un ensemble de données. D'ailleurs, c'est ce qu'
on appelle un appel de fonction. Nous n'avons pas assez de temps pour approfondir ces questions. Pensez-y de cette
façon : chaque fois que le ChEBT ou un LLM ne
sont pas assez intelligents, ils utiliseront différents
outils pour le faire Andrew Karpathy aime également nous
dire que le LLM est notre nouveau système d'exploitation, comme un ordinateur qui peut
utiliser différents outils Et en ce qui concerne l'utilisation de l'outil, n'
oubliez pas non plus qu'
ils peuvent utiliser Internet. Ils peuvent également utiliser Internet pour rechercher des informations en direct. Je vous
l'ai déjà montré dans la dernière vidéo. Et ce qui est également important, avant parler de la formation
de nos LLM, c'est bien sûr qu'ils sont
également multimodèles Cela signifie qu'ils peuvent
entendre, parler et voir. À propos du fait d'entendre et de parler, vous l'avez déjà vu.
Dans la dernière vidéo. Je veux juste vous montrer
qu'ils peuvent également voir. Si vous êtes dans ChaChipt, vous pouvez télécharger Par exemple,
voici une photo de Hugging Face sur l'apprentissage par
renforcement, et oui, cela semble compliqué Qu'est-ce qu'il y a sur le Big ? Explique-le comme si j'avais cinq ans. Et d'ailleurs, oui,
la qualité est terrible. Voyons si
JAhipt peut l'obtenir. Oui, il comprend. Commencez
par le modèle de langage. Imaginez que l'ordinateur
ressemble à un enfant qui connaît
déjà
des mots, des phrases, etc. Donnez-lui ensuite une récompense, faites-lui pratiquer ces étapes d'apprentissage
combinées Il s'agit de
l'apprentissage par renforcement de Hugging Face. Il s'agit essentiellement de cette
photo de Hugging Face C'est actuellement de
la bonne qualité. Dans HHIBT, j'ai
volontairement téléchargé la mauvaise qualité,
mais même avec la mauvaise qualité, ChaChipD peut la voir et
l'expliquer comme cinq Ainsi, les LLM peuvent également
voir, parler et entendre. Vous pouvez également former
différents LLM. Nous pouvons former différents
LLM avec des instructions. C'est ce que l'on appelle
l'ingénierie rapide. Nous pouvons également utiliser
la technologie directe ou le réglage fin. Je souhaite approfondir l'ingénierie rapide dans
la vidéo suivante, car
l'
ingénierie rapide est vraiment importante. Dans cette vidéo, vous
avez appris que les LLM peuvent faire beaucoup de choses Tout d'abord, ils peuvent générer du texte. Ensuite, ils peuvent résumer le texte. Troisièmement, ils peuvent créer du code, également le réduire, et ils peuvent utiliser de nombreux outils
différents
pour analyser des données, créer des images,
utiliser une calculatrice et faire plein de choses intéressantes. Pensez par vous-même à ce qui
est le plus important pour vous. Vous pouvez effectuer
des tâches complètes avec un LLM. Pensez-y de cette façon. Vous pouvez écrire un article sur une entreprise qui fait le
bien, par exemple. Ensuite, vous pouvez faire
quelques calculs savoir comment ils se comporteront à l'avenir. Ensuite, vous pouvez créer des
tableaux, voir comment ils se comportent. Enfin, vous pouvez faire le
portrait d'un investisseur heureux. Il s'agit d'une présentation complète. Donc, JGBT et LLMs peuvent vraiment vous aider beaucoup
6. Ingénierie rapide: Parlons d'ingénierie
rapide. Ce guide provient
directement d'Opie. Donc, l'entreprise à l'origine du JCPD. Et oui, les modèles JATCPT ou
Op MI sont également inclus dans
le Pour le moment, c'est en
allemand, mais bien sûr, nous pouvons également utiliser copilot
dans la version anglaise, et oui, nous pouvons également l'
utiliser sur fond blanc C'est tout simplement le
thème que j'utilise. Plus tard, nous l'utiliserons avec
le fond blanc. Revenons simplement
à l'ingénierie rapide. Une ingénierie rapide est importante car si vous ne
fournissez pas de bonnes entrées, vous n'obtiendrez pas de bons résultats. Et je veux vous montrer
l'ingénierie
rapide Microsoft Copilot, mais cela fonctionne
complètement de la Bien entendu, cela vaut également pour Jet CCDP et pour
tous
les modèles proposés, car ces
concepts sont toujours les mêmes Cette ressource, vous pouvez la lire
vous-même si vous le souhaitez, mais nous voulons le faire
le plus rapidement possible. Nous n'avons pas le temps de recourir à toutes les techniques
d'ingénierie rapides, nous les faisons
donc rapidement. Ici, c'est l'exemple d'une très,
très mauvaise invite. Donnez-moi un article
sur les smartphones. Pourquoi cette invite est-elle mauvaise ? Cette invite est incorrecte car
nous ne donnons aucun contexte. Donc, si nous l'envoyons et que nous utilisons, par
exemple, l'équilibre ici, nous obtiendrons
très probablement une réponse, mais la réponse n'est pas précise car nous ne donnons pas de données
spécifiques. Et boum, nous
avons notre production. Voici donc un article
du Guardian. Et nous n'avons qu'un article. Nous avons un lien sur lequel
nous pouvons cliquer. Maintenant, c'est une mauvaise invite, et nous devons nous attendre
à obtenir un mauvais résultat. Pourquoi cette sortie est-elle mauvaise ? Je ne dirais pas nécessairement que c'est vraiment
un mauvais résultat. Il s'agit simplement de produire
ce que nous avons demandé. Nous demandons un article, et nous avons un article
qui n'est pas précis. Peut-être aviez-vous quelque chose en tête que vous
voudriez publier sur votre blog. Mais vous ne pouvez pas le faire
avec cet article. Ce résultat est tout simplement mauvais car nous ne
donnons aucun contexte. Maintenant, je vais vous
dire qu'il est vraiment très facile de donner un contexte. Et pour donner un contexte, il
suffit de comprendre
un principe clé. Ce principe clé est appelé association
sémantique. Que signifie
association sémantique ? Supposons
que je vous dise un mot, deux
ou dix mots. Supposons simplement
que je vous dise, par
exemple, dieu grec. Avec ces deux mots, vous avez immédiatement 100
autres mots dans votre cerveau. 100 autres images sont peut-être
aussi dans votre cerveau. Vous avez différents
dieux grecs en tête. Vous avez peut-être aussi des images
différentes
des dieux grecs dans votre tête. Vous avez peut-être aussi
la vieille Rome en tête. Tu as des choses comme un
bon corps dans la tête. Tu as des
choses différentes en tête. Et c'est essentiellement
le concept même de l'ingénierie rapide. Nous devons donner un contexte. Nous devons utiliser l' association
sémantique car tous ces
grands modèles de langage, donc les copilotes qui utilisent HHIPT, tous associatifs. Donc, si nous ne disons
qu'un ou deux mots à ces LLM, ils auront tous les autres
mots en arrière-plan Ils ont cela à
leur connaissance. Si nous disons, par exemple,
smartphone, ils ont
beaucoup de mots différents qui ressemblent à des smartphones.
Pourquoi ils ont ça ? Parce qu'ils sont formés
au texte, comme vous le savez. Ils
recherchent simplement le texte où ils trouvent le mot
smartphone à plusieurs reprises. Si nous leur donnons un
peu plus de mots, tout cela
deviendra plus précis. Nous pouvons leur donner, par exemple, mots comme Apple ou Android ou article de
blog si vous souhaitez créer un article de blog et
bien plus encore. Le concept clé est qu'
en quelques mots, vous donnerez beaucoup de contexte aux LLM, car ils
sont associatifs Donnons juste un exemple. Nous abordons un nouveau sujet et
nous partons de zéro. Nous utilisons une sortie symétrique et je dis au copilote
quelque chose comme ça Ce serait une invite
tout à fait logique. Nous commençons par
quelque chose comme ça. Vous êtes un expert des
smartphones. Pourquoi faisons-nous cela ? Ici, c'est ce qu'
on appelle l'invite à jouer un rôle. Nous donnons donc le grand modèle
linguistique. Dans ce cas, copilote
ou HeChipt un rôle. Il est donc un expert
des smartphones. Ensuite, nous donnons un
peu plus de contexte. Vous savez, le Google Pixel
Eight Pro en détail. Pourquoi est-ce important ? Parce que si nous lui disons
qu'il est un expert des smartphones et qu'il connaît le
Google BXeleDP en détail,
il recherchera dans les articles
où tout cela est inclus Nous obtenons donc de très bons résultats pour smartphones et le LLM
recherchera des articles sur
le Google BixeleDP Ensuite, nous disons au LLM
exactement ce dont nous avons besoin. Nous avons besoin d'un article de 600 mots expliquant pourquoi le Pixel Eight Pro est bon. Nous voulons avoir un article
positif. C'est également essentiel. Voici association
sémantique dont
j'ai parlé Bien sûr, tout cela est lié à l'association
sémantique,
mais ceci particulièrement J'inclus juste trois
mots : Gemini nano, LLM et on device Ce sont simplement des mots libres, et si nous utilisons ces mots libres, le LLM recherchera
des articles où tout cela est inclus, car
pour moi, c'est important C'est l'une des principales caractéristiques Du moins, à mon avis, Google Pixel Eight P. si bon parce que nous
avons Gemini nano, un grand modèle de langage, un petit, grand modèle de langage
qui fonctionne sur un appareil Nous pouvons également inclure des éléments
tels que l'absence de latence si nous le voulons. Donc, ne vous inquiétez pas si
vous ne l'obtenez pas maintenant, car nous
recevrons un article. Donc, si vous êtes un expert
dans ce domaine, vous pouvez simplement dire au LLM que le
LLM est également un Nous lui disons simplement qu'il est un
expert des smartphones. Il connaît le Google
Pixel Eight P, puis nous lui donnons
quelques mots
dont nous avons besoin ou que nous voulons
inclure dans notre article, et le LLM recherchera
les bons mots pour nous Nous l'avons donc envoyé, et je suis relativement sûr que nous obtenons un
résultat bien meilleur. Bien entendu, vous pouvez également
inclure des éléments tels que
la rédaction d'un article pour un 10 ans si vous
voulez le rendre vraiment très simple,
car, bien entendu, l'Association sémantique
peut également le faire Nous rechercherons donc
des articles vraiment très faciles à comprendre. Mais pour le moment, je ne
veux pas faire ça. Je l'ai simplement envoyé et
nous obtiendrons un bon article. Nous pouvons peut-être
également inclure cela dans un site Web. Et voici notre article
et j'espère que vous verrez que le résultat est complètement
différent du précédent. En tant qu'expert des smartphones, je peux vous dire que
le Google BixeleightP est un excellent
appareil qui offre une gamme de fonctionnalités et de capacités qui le distinguent de la
foule Voici quelques raisons et ainsi de suite,
notamment la conception et la qualité de fabrication, l'appareil photo, le logiciel, le Gemini nano et l'ALM Le BixeleightP est donc alimenté par Google Dancers G. Bien entendu, vous pouvez
également être plus précis. Par exemple, créer cet article pour
mon site Web ou créer cet article sous forme de
fil Twitter ou quelque chose comme ça. Créez l'article pour
un fil Twitter. Les lecteurs sont des étudiants en
technologie, alors incluez des détails. Et nous obtiendrons tous
les détails et le format sera correct
pour un fil Twitter. Maintenant, vous voyez, nous
avons beaucoup de détails. Nous parlons donc du logiciel. Nous parlons du nombre
de mégapixels et capteurs de notre appareil photo
et bien plus encore Et nous pouvons également le simplifier. Disons simplement que vous voulez avoir cet article pour les enfants de 12 ans Fabriquez l'article
pour un enfant de 12 ans. Nous exclurons très probablement les mots un peu
durs pour nos plus jeunes. Vous le voyez immédiatement. L'un des meilleurs atouts de Google est l'
appareil photo, etc. Nous n'utilisons pas tous ces mots durs et
nous obtenons des résultats plus faciles. Et c'est essentiellement tout
ce que vous devez comprendre si vous voulez commencer immédiatement
à rédiger vos instructions. Vous devez créer des instructions
structurées. Il s'agit ici, par exemple, d'une invite de structure car
nous commençons par un rôle. C'est ce que l'on appelle également «
roll prompting ». Dans la vidéo suivante,
je vais vous
donner d'autres exemples rapides. Nous commençons par le rôle. Vous êtes
donc un expert en
X, Y et Z et vous connaissez
peut-être certains détails Ensuite, nous utilisons notre invite de structure pour indiquer au LLM ce dont
nous avons exactement besoin Je veux avoir un article d' environ 600 mots sur
la sonde Pixel Eight, et nous devons savoir
pourquoi elle est bonne. Ensuite, nous déclenchons l'association
sémantique juste avec quelques mots Vous n'êtes donc pas
obligé d'utiliser ces mots. Il est simplement important que vous
incluiez certains de ces mots. Cette vidéo portait donc sur l'ingénierie
rapide. Je tiens simplement à vous
dire que les LLM sont relativement
simples à comprendre car ils ne peuvent
faire que deux choses si nous les décomposons selon
les principes clés Ils peuvent agrandir le texte et
le réduire, et nous devons utiliser bonnes instructions
pour obtenir de bons résultats Nous devons déclencher l'association
sémantique. Nous pouvons le faire avec des instructions
structurées. Nous pouvons donner, par exemple, un rôle dont nous avons besoin pour dire
au LLM ce que nous
voulons avoir exactement, et nous devons nous
assurer que nous utilisons quelques mots similaires
à des choses que nous aimons Bien sûr, nous avons
différents concepts d'incitation de Cillian. Nous avons la chaîne de pensée, l'arbre de la pensée,
et bien plus encore. J'ai d'autres cours qui
abordent ce sujet en détail. Mais dans ce cours,
je veux que vous puissiez l'utiliser le plus rapidement et le
plus efficacement possible. Dans la vidéo suivante,
je vais vous montrer une ou deux autres astuces importantes pour une ingénierie
rapide, puis vous serez prêt à
démarrer le plus vite possible. N'oubliez pas de donner le contexte
afin d'obtenir un bon résultat.
7. Plus de conseils d'ingénierie rapides: Dans cette vidéo, je veux vous donner
quelques conseils et astuces
supplémentaires pour créer des instructions efficaces pour le CIDP ou, dans cet exemple, bien
sûr, pour Voyons donc quelles astuces j'ai pour que tu travailles rapidement. Bien entendu, vous avez déjà
vu l'invite à jouer un rôle. Il suffit donc de donner un rôle au LLM. Vous êtes un expert en XYZ. Nous en avons parlé dans
la dernière vidéo. Mais ici,
c'est complètement nouveau. L'invite à prendre la photo. Dans l'invite de prise de vue, vous donnez simplement des exemples Maintenant, qu'est-ce que cela signifie ? Vous pouvez dire, par exemple, vous êtes un expert en rédaction, et voici une copie que j'aime bien, puis vous collez simplement
une copie et vous dites au LLM de faire une
copie similaire pour X, Y et Z. Et ces deux choses ici, elles sont vraiment très cool Respirez profondément et
réfléchissez étape par étape. Pourquoi ces deux choses
fonctionnent ? Je voudrais m'expliquer. Respirez profondément et
réfléchissez étape par étape. Vous pouvez également
les assembler. Cela fonctionne simplement parce que
le LLM réfléchira également étape par étape C'est non seulement mieux pour
vous, mais aussi pour le LLM. Donnons juste
un exemple rapide. Supposons que vous
souhaitiez installer BTn, par
exemple, mais que vous ne
sachiez rien de PyTon Si vous tapez simplement
comment installer BTN, il est
relativement probable que vous obteniez une sortie commençant par un point que vous
ne comprenez pas Peut-être qu'ils
commencent par une étape que vous ne comprenez pas encore. Ce n'est pas seulement
problématique pour vous, mais peut-être aussi pour le
grand modèle linguistique. Si le LLM n'est pas formé
sur le texte parfait, il est toujours judicieux de lui
demander de réfléchir
étape par étape, car le LLM commencera par des choses comme « ouvrons simplement
le navigateur Web Chrome Il s'agit donc de la première étape. Si vous demandez au LLM de
réfléchir étape par étape, ou peut-être aussi de
respirer profondément, le LLM
commencera simplement par la première étape, et la première étape sera
probablement d'ouvrir un navigateur Web Ensuite, vous devez taper dans Google,
par exemple Python. Et si vous voyez tout cela, vous obtenez
tout d'abord un meilleur résultat, et le LLM peut toujours associer plus de choses parce que
le LLM a également de nouveaux mots Le LLM commence à
taper des éléments comme Google Chrome, comme la
recherche de PyTon, etc. Et dans ce cas, le LLM a plus de choses dans sa
propre fenêtre contextuelle C'est vraiment
très pratique. C'est donc un conseil sur lequel je
ne saurais trop insister. Respirez profondément
et réfléchissez étape par étape. Et au fait, je
n'invente rien. Il existe des études qui montrent que ces deux mots, ces deux phrases
améliorent le résultat, et en voici une amusante. Quelque chose comme ça
fonctionne également très, très bien. Je te donne 20
dollars, par exemple. Nous donnons donc à Chachi PT, nous donnons au copilote, nous donnons un petit conseil
sympa au LLM Nous lui donnons de l'argent ou du
moins nous lui en offrons. De plus, cette
phrase montre que le LLM produit de meilleurs résultats si nous disons que nous donnons
simplement de l'argent Maintenant, ne me demandez pas
exactement pourquoi cela fonctionne. Je sais simplement que cela fonctionne, et je sais qu'il
existe des études qui indiquent également
que cela fonctionne. Vous devez donc
simplement comprendre en ajoutant des phrases comme
respirez profondément, réfléchissez étape par étape, et je vous donne 20 dollars. Vous obtiendrez de meilleurs
résultats avec le copilote. Alors écris ça. C'est important pour moi. Et vous comprenez déjà le rôle qui
vous y invite. Pour ce qui est de l'invite à prendre des photos, je voudrais vous donner un
exemple dès maintenant Nous prenons votre nouveau sujet, et supposons simplement que je veuille
vraiment en avoir une
copie. Nous pouvons commencer par
quelque chose comme ça. Vous êtes un expert en rédaction. J'aime bien cet exemplaire. Nous commençons donc simplement
par notre rôle. Nous lui confions le rôle
d'expert en rédaction. J'aime bien cet exemplaire. Et maintenant, nous incluons une
copie qui nous plaît, et nous procédons de cette façon. Donc,
ce que j'inclus
ici est simplement la copie ou au
moins une partie de la copie
de mon cours sur l'IA. Nous avons donc simplement un
exemplaire que j'aime
vraiment, parce que je l'
ai écrit moi-même, et nous pouvons ensuite raconter au LLM plein
de choses différentes Je vais le raccourcir un
peu pour vous montrer de quoi il s'
agit. En ce moment, je
vous montre également un petit truc sympa. Répondez, uniquement avec OK. Vous pouvez toujours le faire
pour économiser des jetons. Nous pouvons donc l'envoyer et
nous obtiendrons un accord de retour. Et après l'accord, nous pouvons simplement dire plus de choses
au LLM Donc, vous voyez, nous avons retrouvé le feu vert, et maintenant je peux dire au LLM ce
que nous voulons maintenant Le LLM possède la copie ou au
moins une partie de la copie. N'oubliez pas que les LLM sont associatifs, ils comprennent
donc comment
la copie est structurée Nous récupérons notre argent pour
économiser quelques jetons, et maintenant nous disons au LLM ce que
nous voulons avoir dès maintenant Donnez-moi une copie similaire, sauf pour un cours intitulé
Microsoft Co Pilot. C'est important
parce que je m'en sers beaucoup juste pour avoir plus d'
idées pour mes copies. C'est vraiment
très pratique. Donc, d'abord, vous avez
écrit une copie vous-même ou vous en avez trouvé une
sur Internet ou autre. Vous donnez cela à titre d'exemple, et vous dites au LLM de
répondre uniquement par OK. Récupérez votre accord, et maintenant vous pouvez demander la tâche suivante. Par exemple,
donnez-moi une copie similaire, mais pour le cours intitulé
Microsoft copilot Et nous avons ici une copie similaire. Bienvenue dans le cours d'introduction à Microsoft Copilot, votre voyage dans le monde de la complétion de code basée sur l' IA Si nous faisons défiler la page vers le haut, cela commence de la
même manière que ma copie originale. Bienvenue dans l'ensemble de l'IA. Fusion
de Sabi et développement d'applications en milieu de tournoi avec le GPD. Vous voyagez dans le monde
de l'intelligence artificielle. Cette master class est parfaite
pour tout le monde et ainsi de suite. Et c'est également
vrai ici. Ce cours est
parfait pour tout le monde. Vous voyez donc que nous utilisons
un style similaire, mais pas exactement les mêmes mots. Maintenant, c'est vraiment très cool, et c'est la
caractéristique la plus importante de l'invite à prendre des photos. Revenons-en à cette
jolie petite chose ici. Vous avez donc déjà vu comment fonctionne
l'invite à prendre des photos. Nous donnons simplement des exemples
et nous obtiendrons résultat
similaire mais
pas le même. Si vous utilisez l'invite à prendre des
photos, vous n'avez pas besoin
de respirer profondément Vous n'avez pas besoin d'utiliser
les choses étape par étape. Et vous n'avez pas non plus besoin de dire que vous donnez de l'argent
parce que vous avez un bon exemple et que
le LLM peut être suffisamment
associatif pour
comprendre ce dont vous avez Cela est probablement vrai
si vous n'utilisez pas d'exemples. Si vous utilisez les instructions de
rôle normales, il serait tout à fait logique
d' inclure
« respirez profondément », réfléchissez étape par étape ou « je vous donne 20 dollars »
à la fin de votre texte Le concept clé est qu'il
faut toujours donner du contexte. le moment, je ne sais pas
comment écrire ceci en anglais, peut-être que c'est un peu mieux. Et vous
devez toujours comprendre que les jetons ne
sont pas illimités. Pour cette raison,
vous avez déjà vu dans ce joli petit exemple que nous utilisons quelque chose
comme le OK, alors répondez uniquement par o. C'est juste pour
économiser quelques jetons. Vous ne voulez donc pas à la
fois des exemples infinis et des choses sans fin qui
n'ont pas beaucoup de sens. Vous devez toujours comprendre que ces LLM sont
associatifs et que vous obtiendrez des réponses précises ou des réponses courtes si vous
répondez uniquement par OK Ensuite, vous pouvez poser
votre question suivante, et c'est tout. Dans cette vidéo, vous avez donc
appris beaucoup de trucs sympas. Vous devez inclure,
réfléchissons étape par étape. Respirons profondément, et vous pourrez également
offrir de l'argent. Vous obtiendrez de meilleurs résultats
si vous le faites comme ça. Si vous avez l'occasion de donner des
exemples de choses que vous aimez,
vous devriez absolument le faire,
et c'est ce que l'on appelle simplement
l'invite à prendre des Le concept clé est toujours de déclencher l'
association sémantique Vous devez donc donner un contexte, mais vous devez garder à l'esprit que vos jetons ne
sont pas illimités, et pour cette raison, vous avez
également l'astuce de simplement
demander une
réponse rapide au copilote Parce que n'oubliez pas que la limite de
jetons
compte toujours , elle
compte ce que vous investissez, mais aussi ce que le LLM recrache Tout cela sera pris en compte
dans votre limite de jetons, et tôt ou tard, votre limite de jetons
sera atteinte et le LLM ne comprendra plus de quoi vous
parlez Beaucoup de
trucs et astuces en une seule couverture, mais je
vous recommande vraiment d'essayer tout cela.
8. Personnaliser les LLM avec les invites système et le RAG (récupération de génération augmentée): Parlez de la formation de LLM.
Deux options s'offrent à nous. Nous pouvons les former soit à l'aide d' instructions, soit à l'aide d'une technologie
directe Tout d'abord, je veux vous montrer
ce qu'est la technologie directe. Ensuite, nous commençons par les instructions, puis nous utiliserons la technologie
directe Vous savez déjà que
nous avons le chat GPT, nous l'appelons simplement GPT Et ce GPT peut
répondre aux questions. Parfois, ce n'est pas assez intelligent, alors GPT peut continuer à
utiliser différents outils Tu le sais déjà. Internet,
par exemple. Je peux aller sur Internet
et faire des recherches sur différentes choses. Mais disons simplement que
vous souhaitez entraîner un GPT sur vos propres données Disons simplement qu'il s'agit
de données provenant de votre propre entreprise votre propre
texte marketing ou autre. Vous avez maintenant deux options. Vous pouvez le
faire soit à l'aide d'instructions, soit aide d'
une base de données vectorielle Nous n'expliquerons pas
une base de données vectorielle car vous
apprendrez simplement à utiliser ce matériel rapidement. En gros, ce que vous pouvez faire est télécharger beaucoup de
contexte dans un fichier, puis HatchPd parcourra votre fichier et disposera de
toutes ces connaissances Je veux vous montrer
une ou deux astuces abord dans les instructions,
puis dans une base de données vectorielle La chose la plus simple si vous souhaitez personnaliser jachPd est
l'invite du système. Si vous appuyez sur ce
bouton ici, vous pouvez passer au GBD personnalisé, et voici l'invite
du système Et vous pouvez simplement
le remplir. Qu'aimeriez-vous que le JCPT sache à votre
sujet pour apporter de
meilleures réponses ? Et si vous appuyez
dessus, l'op Mey vous
aidera. Où êtes-vous basé ? Que faites-vous pour le travail ?
Quels sont tes loisirs ? Quels sont les sujets dont tu peux parler pendant des heures et quels sont
tes objectifs ? Il suffit donc de taper ceci et JCPT vous donnera d'autres
sorties, de meilleures sorties Faisons simplement un exemple. J'habite en Italie
mais je parle allemand. Je suis éducateur en IA. Mes centres d'intérêt sont le
LLM et la diffusion. J'aime bien parler de l'IA. Mon objectif est de faire
un bon parcours. Et puis la prochaine étape
est encore plus importante. Comment aimeriez-vous que
HHipt réagisse ? Si vous appuyez dessus, dans quelle mesure HeChipt devrait-il être formel ou décontracté Quelle
doit être la longueur ou la durée des réponses ? Comment souhaitez-vous que l'on s'adresse à vous ? Le HGPS devrait-il avoir des opinions sur
des sujets ou rester neutre ? Tu restes neutre.
Appelle-moi Arnie Vos réponses sont brèves et,
si possible, sous forme de puces. Maintenant, nous faisons preuve de prudence et
notre modèle est désormais entraîné
en fonction de nos données spécifiques. Le modèle réagit simplement
un peu différemment. Faisons donc un test rapide. HDP, pouvez-vous me donner des
informations sur les élections ? Nous utilisons également la recherche sur le Web ? Parce que nous avons eu des élections en ce moment même au moment où j'
enregistre ce cours. Nous sommes en train
de faire des recherches et ChaChipt me
dit que le
5 novembre c'était l'élection Donc, vous voyez, c'est vraiment très court et concis et
nous avons quelques liens. Maintenant ChaChipt ne m'appelle
pas Arnie. Pourquoi est-ce le cas maintenant ?
Je vais te montrer. Si nous entamons une nouvelle
discussion, que nous le faisons sans recherche et que
nous faisons autre chose, prenons simplement un autre
exemple, car cela ne fonctionne pas très bien
si nous utilisons la recherche sur le Web. Hey, GBD, je veux
commercialiser un cours. Donnez-moi quelques exemples de
la façon de le faire. J'imagine que Jet GBD me
dit tout de suite : « Hé, Arnie, tu peux essayer,
puis quelques points comme Boost sur les réseaux
sociaux, etc. Hé, Arnie, c'est
bon. Plongeons-nous dans un
marketing puissant et ainsi de suite. Utilisez des aperçus captivants sur
les réseaux sociaux, organisez un webinaire gratuit, tirez parti du marketing par e-mail,
créez un pôle d'attraction, collaborez avec
des influenceurs, etc. Donc, vous voyez, c'est court, c'est concis, et Jet
GBD appelle M Arnie Il s'agit essentiellement
de l'invite du système, et avec l'invite du système, vous pouvez personnaliser le HHIDP Bien sûr, vous pouvez également
utiliser l'invite de prise de vue, mais je vous ai déjà expliqué
comment fonctionne l'invite de prise de vue. Donnez simplement un exemple. Maintenant, je veux vous montrer comment fonctionne
la technologie RC car c'est l'outil le
plus puissant si vous souhaitez former un LLM Maintenant, dans HachipD en ce moment, je pense qu'il s'agit d'une fonctionnalité Bit Vous pouvez appuyer sur Explorer PIB et rechercher le PIB.
Tu le sais déjà. Mais vous pouvez également appuyer sur
Creator PIB ou vous pouvez accéder à mon PIB si
vous avez déjà GBD Je veux juste vous montrer un PIB. Par exemple, cette invite de
diffusion PIB est spécifiquement entraînée pour écrire des instructions pour les modèles de
diffusion Les modèles de diffusion produisent des images. Si j'appuie ici sur CAT, je recevrai un message pour un
CAT et le message sera spécialement
adapté à la mi-trajet et comprendra également des
objectifs d'appareil photo, etc. Donc, vous voyez, c'
est une invite parfaite, et avec cette invite parfaite, je peux l'utiliser pour faire de bonnes photos dans
un modèle de diffusion. Maintenant, je veux
vous montrer comment cela fonctionne, comment nous pouvons entraîner ces choses. Si nous revenons
encore une fois sur Explorer PIB,
mon PIB, nous allons sur
ces invites de diffusion
et appuyons sur ces invites de diffusion
et appuyons Vous voyez que nous pouvons donner
un nom, une description, puis des instructions,
ainsi que le comportement du RGPD Enfin, nous pouvons également télécharger des documents
contenant des exemples. Nous allons le faire
maintenant à partir de zéro. Nous donnons l'exemple. Disons
simplement que nous sommes une entreprise et que dans cette entreprise, nous voulons avoir un GPD qui s'occupe l'intégration à
notre place. Alors créez. Nous ne passons pas à la création,
mais à la configuration. C'est ce que nous appelons l'onboarding. Pour intégrer les nouveaux membres, je
veux le faire très simplement. Vous êtes le PDG de la
société AI With Arnie. Votre objectif est d'intégrer des personnes. S'ils ont des questions, vous recherchez vos connaissances
et vous leur donnez des informations. Il s'agit donc essentiellement d'une invite système
très simple que nous pouvons donner ici. Nous pouvons maintenant donner, par exemple, démarreurs de conversation
Zone si nous le voulons Toutes les personnes qui
essaient de travailler dans mon entreprise me posent simplement
ces deux questions. Où sont les toilettes
et à quelle heure est le déjeuner ? Voici donc quelques questions de
démarrage, comme, allez, vous pouvez y
réfléchir vous-même, ce que vous voulez inclure. Ensuite, la connaissance,
nous pouvons maintenant télécharger des fichiers. Et maintenant, nous créons un fichier simple. Il peut s'agir d'un PDF. Il peut s'agir d'un
fichier texte ou autre. Nous le faisons simplement avec un simple fichier texte que
je suis en train de créer en ce moment, et j'écris ici quelques informations, mais cela peut aussi être un gros PDF 50 pages ou quelque chose comme ça. Et voici les informations que
les gens doivent connaître. Les toilettes ne sont pas là. Nous n'avons pas besoin d'
être dans notre entreprise. Nous déjeunons une fois le travail terminé. Nous travaillons sept jours par semaine. Nous n'avons pas de vacances. Si vous voulez plus d'informations, allez ici, et ici nous pouvons
également donner un lien si nous le voulons. Je le fais juste avec ma communauté scolaire
gratuite, mais c'est en allemand. Faisons donc simplement un exemple. Nous l'incluons ici. Maintenant que nous l'enregistrons,
nous revenons dans Jet PIB et nous téléchargeons
nos connaissances Alors téléchargez des fichiers. Il
s'agit essentiellement du fichier. Maintenant, nous pouvons également utiliser d'autres outils. Nous n'avons pas besoin de la
recherche sur le Web et nous n'avons pas besoin Dali pour
générer des images pour ce PIB Mais
supposons simplement que vous souhaitiez inclure l'analyse des données. Mais je pense également que cela
n'est pas vraiment nécessaire. Ce que vous pouvez également faire si vous êtes programmeur, c'est
créer de nouvelles actions, mais je pense que ce n'est pas vraiment le but de ce petit cours
rapide. Si vous appuyez et
créez de nouvelles actions, vous pouvez simplement saisir peichm et inclure
les différentes URL Vous pouvez également appeler
différentes API et démarrer à partir de. Mais comme je l'ai dit, ce
n'est pas le problème pour le moment. Nous appuyons sur Créer, nous donnons quiconque possède un lien,
et nous appuyons sur « Safe ». C'est le lien que
nous pouvons partager avec les personnes qui travaillent
dans notre entreprise, et nous appuyons sur View GBD Ensuite, nous pouvons simplement demander,
alors, où sont les toilettes ? Et si je le demande, le
PIB répondra
très probablement que l'entreprise
n'a pas de toilettes Donc, en gros, vous
pouvez le voir ici. Il semble que notre entreprise ne dispose pas de toilettes conçues. J'ai commencé, les
toilettes ne sont pas là. Nous n'avons pas besoin de faire
pipi dans notre entreprise. Et si vous voulez plus d'informations, vous pouvez appuyer sur ce lien, et en gros, vous êtes ici. Ensuite, la
question suivante,
disons simplement quand avons-nous des vacances ? Nous travaillons sept jours
par semaine et sommes toujours en
lien avec notre entreprise. Maintenant, disons simplement que vous ne voulez plus avoir ce lien. Vous pouvez également le
faire ici. Vous pouvez toujours
personnaliser le GPT. Explorez GPT, mon GPT, puis ici sur Modifier GPT,
et ici sur Configurer, et ici sur Configurer, vous ne donnez le lien que si les gens demandent plus d'
informations et mettent Consultez le PIB lorsque nous avons des vacances, nous n'en avons pas dans notre entreprise et nous travaillons
sept jours par semaine C'est essentiellement ainsi
que vous pouvez former un LLM. Vous pouvez utiliser
les instructions du système et vous pouvez saisir le comportement de ChtGBD. Vous pouvez ensuite utiliser les instructions
normales dans l'interface avec l'invite de prise
de vue Tu le sais déjà. Enfin, vous pouvez également utiliser la technologie
directe et
entraîner votre propre PIB Et ce PIB, vous
pouvez également le partager avec d'autres personnes afin de leur envoyer le lien C'est ce que l'on appelle la technologie
directe. Ici fonctionne une base de données vectorielle. Nous n'avons pas besoin de les
approfondir, mais il suffit de vous faire comprendre. Vous pouvez donner des instructions
et vous pouvez télécharger des fichiers, afin que le chat PIB puisse
parcourir ces fichiers et avoir des informations spécifiques sur
vous ou votre entreprise Et oui, travailler dans mon
entreprise n'est pas amusant.
9. Perplexité et Huggingchat: Si vous souhaitez explorer d'autres
outils où vous pouvez utiliser des LLM, vous pouvez
regarder de plus près le chat Hugging Le chat par câlins est
vraiment facile à utiliser. Ici, vous pouvez sélectionner le LLM open
source que vous souhaitez utiliser. Par exemple, Lama 3.1, le modèle 70 B,
un modèle Quin, certains modèles de MNVdia ou certains modèles
de Microsoft Cliquez simplement sur le modèle
que vous souhaitez utiliser. Vous pouvez saisir une
invite système si vous le souhaitez, puis appuyer sur Nouveau CAT. Et ici, vous avez également des outils. Alors oui, ils peuvent également utiliser
différents outils, comme le HGBD. Ils peuvent utiliser un
modèle de diffusion pour générer une image. Vous pouvez inclure des éditeurs d'images. Ils peuvent obtenir RL. Vous
disposez d'un document, lecteur de barres, d'une calculatrice
et d'une recherche sur le Web. Cela ressemble donc
en quelque sorte un HIPT open source gratuit pour
toujours Et puis nous sommes perplexes. Perplexity est similaire
à la recherche HHIBT. Tu peux jouer un peu avec
ça. Je n'utilise plus beaucoup cet
outil car HHIBT est également relativement bon en ce
moment
avec cet outil de recherche, mais vous pouvez essayer
Perplexity si vous Vous pouvez également commencer gratuitement. Vous n'êtes pas obligé de
créer un compte. Commencez gratuitement,
voyez ce que vous aimez, et peut-être que vous vous en tiendrez
à quelque chose.
10. Les développeurs peuvent utiliser les LLM via l'API OpenAI: Vous êtes développeur,
vous pouvez également inclure le HCBT dans vos propres applications Vous pouvez l'utiliser dans
l'OPMIPlayground. C'est peut-être aussi
intéressant pour vous si vous souhaitez utiliser les
derniers modèles HHIBT, mais vous ne voulez pas
payer 20 dollars Sur ce terrain de jeu, vous
pouvez simplement payer au fur et à mesure, vous payez par jeton. Et je veux vous montrer
combien vous devez payer, comment cela fonctionne et comment vous
pouvez passer des appels ABI à HGBT La première chose à faire est que vous
alliez sur cette plateforme. Donc, la plateforme domi.com supprime
Playground et ici vous pouvez
jouer avec tous leurs modèles Sur le chat, vous pouvez jouer
avec les modèles de chat. Vous pouvez utiliser les plus récents. Donc,
vous pouvez sélectionner ce que vous
voulez avec le
PIB four mini , le PIB 40 et ainsi vous pouvez sélectionner ce que vous
voulez Vous pouvez également importer des fonctions. Donc oui, vous pouvez également faire appels de
fonctions si
vous êtes codeur. Je veux juste que ça soit
rapide. Excusez-moi, s'il vous plaît. Ensuite, le format de réponse,
c'est pour le moment du texte, mais vous pouvez également utiliser
JasNFmat et ainsi de suite Ici, nous avons la température
et la longueur maximale. Vous pouvez simplement
le lire vous-même. En gros, si vous
diminuez la température, JGIDP sera plus précis, mais il peut être un
peu répétitif,
en particulier pour les
tâches mathématiques, c'est Et la longueur du contexte
est simplement la sortie. Alors, combien de temps peut vous donner la sortie
que ChaChipD peut vous donner ? Voici les
paramètres les plus importants ici. Ensuite, au
milieu, vous voyez que
vous avez les
instructions système. Il s'agit
donc essentiellement de
la promotion du système, tout comme les instructions personnalisées que je vous ai
montrées dans la dernière vidéo. Vous êtes donc un
assistant utile, par exemple, et vous pouvez taper
votre texte ici comme d'habitude. Raconte-moi l'histoire d'une
tortue dans le désert. Vous appuyez sur Exécuter, puis
ChatBT vous parlera Vous pourrez toujours utiliser modèles
les plus récents
sans limite, et vous payez toujours au fur Je veux te montrer
combien ça coûte. Si nous allons dans cette section de
tarification, voyons que nous pouvons utiliser le
PIB 40, par exemple, et que nous devons payer 2,50$ pour 1 million de jetons d'entrée
et 10$ en jetons de sortie Et chaque modèle a ses
propres prix. Si vous faites défiler l'écran vers le bas, par exemple, vous pouvez également appeler
les autres modèles. Vous pouvez utiliser le mini-modèle
GPD 40. C'est vraiment très bon marché. Vous pouvez utiliser l'aperçu d'Obo. Cela devient un
peu plus cher. Vous pouvez utiliser l'API en temps réel. C'est vraiment cher. Ici, cela peut aller jusqu'à 200$ pour 1 million de jetons
de sortie. C'est simplement si HHIBT veut
vous parler, donc au format audio, et vous pouvez également
générer des photos avec Dali si vous
appelez les terminaux,
et vous payez Si nous revenons ici,
je voudrais vous montrer dans le coin gauche que
vous êtes ici en temps réel. Vous pouvez donc appuyer
sur le temps réel, et vous pouvez également parler
ici avec ces modèles. Fais-moi une petite
blague, j'ai envie de rire. Bien sûr. Voici une
petite blague pour toi. Pourquoi ne peux-tu pas donner
un ballon à Elsa ? Parce
qu'elle va lâcher prise. Donc, en gros, c'est tout, et ici nous devons
payer pour la réédition. Ensuite, nous avons l'assistance. Cette assistance, c'est essentiellement exactement la même
chose que ces CPD, donc nous pouvons inclure le Ruck
et tout Et nous pouvons également créer nos propres
applications avec ceux-ci. Si nous passons à la synthèse vocale, vous pouvez taper du texte et
vous récupérerez la parole. Donc, hé hais le PIB, gros, je
veux le générer Chapeau GBT, je t'aime bien. Et là, vous pouvez l'entendre. Alloway nous dit ces
choses que nous saisissons ici. Hey hat GBT, je t'aime bien. Et puis nous avons également le mode de
complétion ici. Si vous souhaitez l'utiliser, vous devez appuyer sur votre compte. Vous devez appuyer
sur votre profil, passer à la facturation, et ici vous devez
insérer votre carte de crédit. suffit donc d'appuyer sur les modes de
paiement, et vous devez
inclure ici votre carte de crédit. Ensuite, vous devez donner
un peu d'équilibre à Hatchipt, et ce truc
fonctionnera pour Bien entendu, vous pouvez
également définir certaines limites. Si vous optez pour des limites, vous pouvez fixer certaines limites
à HachPT. À l'heure actuelle, j'ai 500
dollars par mois comme limite. Si vous appuyez sur l'utilisation, vous pouvez toujours voir
combien cela vous coûte par jour. C'était donc un jour
où j'ai dû payer cinq dollars parce que j'
ai aussi des chatbots, et ici un chatbot parlait beaucoup Et puis si nous y allons en octobre, c'est aussi la
consommation à partir d'octobre, donc pour l'instant c'est 28 dollars. Ce sont des chatbots que j'ai inclus dans certains sites Web et les
gens utilisent ces chatbots et c'est pourquoi je
dois payer un peu Si vous jouez un peu avec
ce truc, je pense que vous ne
jouerez que quelques centimes. Ici, vous pouvez voir qu'avec 0,13$, vous pouvez jouer
avec ces modèles Vous revenez ici
sur votre tableau de bord, vous pouvez également voir que vous pouvez
faire beaucoup plus de choses ici. Vous pouvez continuer à peaufiner, et ici vous pouvez peaufiner
votre propre modèle si vous le souhaitez. Ce n'est pas vraiment le
but de ce cours. Mais si vous utilisez des clés d'API, vous pouvez également
appeler l'API. Il vous suffit donc de
créer une nouvelle clé secrète. Vous lui donnez un nom,
puis vous pouvez copier votre clé d'API et l'appeler
dans vos propres applications. Si vous êtes développeur, il vous suffit de consulter la documentation. Vous pouvez passer au démarrage rapide, et ils vous indiquent ici
ce que vous devez faire Vous devez créer une clé d'API. Ensuite, vous pouvez appeler ces
points de terminaison, par exemple, dans PyTNPP install Opmei,
c'est Et ici, vous pouvez
voir, par exemple, si vous souhaitez générer du texte
dans votre propre application, vous pouvez utiliser Ashima comme ceci Si vous souhaitez
générer une image, vous pouvez utiliser quelque chose comme ça. Nous appellerons Dali par exemple, et si vous souhaitez créer des intégrations
vectorielles, vous pouvez C'est vraiment facile avec
ce démarrage rapide. Donc, si vous êtes développeur, l'API Opmeei est
vraiment facile à utiliser, et vous pouvez l'appeler en
JavaScript avec Piton ou avec Curl Si vous n'êtes pas développeur, cette plateforme n'est probablement pas
adaptée , mais en général,
elle est relativement simple. J'aime, par exemple, le flow wise et j'utilise l'API OMI
pour créer des agents d'intelligence artificielle. Mais comme je l'ai dit, il
ne s'agit pas d'une plongée complète. Si vous voulez simplement apprendre
cela le plus rapidement possible, cette plateforme est peut-être
une option pour vous
si vous ne voulez pas
payer ces 20 dollars par mois pour l'
interface HGPTplus, car ici vous pouvez travailler avec les
modèles les plus récents et vous ne payez que pour les jetons
que vous Et les jetons sont relativement peu
coûteux à générer. Vous pouvez donc jouer un peu
avec cette
plateforme et voir si
c'est pour vous ou non. Et bien sûr,
tous les autres LLM
ont également leurs propres API Google dispose donc également de l'API
pour les modèles Gemini. Andthropic dispose de l'API
pour les modèles Cloud. Et si vous souhaitez travailler
avec un LLM open source, vous pouvez utiliser,
par exemple, l'API Grock, ou vous pouvez également créer
votre propre serveur avec, par
exemple, ALM
Studio ou Vous avez donc une infinité d'options. Vous pouvez soit créer vos propres points de terminaison si vous les utilisez localement sur votre PC, soit
utiliser différents appels d'API Comme je l'ai dit, il s'agit plutôt d'un guide général
pour les développeurs si vous souhaitez développer avec ces éléments et si ce n'est
pas le cas, sautez cette vidéo.
11. Récapitulation des LLM: Dans cette section, vous avez beaucoup
appris et nous l'avons fait le plus rapidement
possible. Nous avons commencé avec
toutes les interfaces de ces différents LLM, et vous savez qu'il y en a beaucoup Cha ChipD Clot, Gemini, vous pouvez également utiliser Oma,
vous pouvez utiliser Vous pouvez utiliser de nombreuses interfaces
différentes, même le chat câlin
et bien plus encore Ils fonctionnent tous de manière
relativement similaire. Vous avez toujours une jolie
petite interface de chat. Les LLM ne peuvent essentiellement
faire que deux choses. Ils peuvent agrandir le texte ou
le réduire. Mais c'est énorme.
Vous pouvez utiliser du code, vous pouvez utiliser du texte normal. Vous pouvez créer des tableaux, et les
LLM peuvent également appeler des outils. Et les outils peuvent être, par exemple, un interpréteur de bits,
un modèle
de diffusion , Internet, et vous
pouvez analyser des données, créer des graphiques et faire plein de choses intéressantes
avec ces outils. Peut-être qu'à l'avenir, ils deviendront un tout nouveau système d'exploitation, et d'ailleurs, les LLM pourront
également communiquer entre eux, puis nous les appellerons agents. Et vous avez également appris que les
LLM sont multimodèles. Ils peuvent essentiellement
voir, parler et entendre. N'obtenez un bon résultat
que si vous donnez une bonne entrée. Et je vous ai montré les bases
de l'ingénierie rapide. N'oubliez pas l'association
sémantique. Vous devez donner le contexte. Vous pouvez le faire par le biais de
l'invite à tirer ou à lancer. Vous devez structurer
vos instructions, et il existe quelques astuces, comme, par
exemple, réfléchir étape par étape En plus de cela, nous avons également
la chaîne de pensée, l'arbre de pensée, l'
ingénierie inversée et bien d'autres choses encore. Mais je pense que pour la plupart des
gens, c'est exagéré. Ce n'est pas vraiment nécessaire. Si vous souhaitez personnaliser le royaume, vous pouvez totalement le faire. Le moyen le plus simple est probablement
l'invite du système. Vous pouvez simplement donner
quelques instructions. Ensuite, nous avons la technologie directe, nous pouvons simplement télécharger
des données, puis le CPD ou tout autre
LLM peut parcourir ces données et simplement
réagir d'une manière spécifique Bien entendu, si vous
êtes développeur, vous pouvez
également faire tout cela via l'API. Vous pouvez développer vos
propres applications et vous pouvez également
faire tout cela dans
vos propres applications. Vous pouvez effectuer des appels de fonctions
dans vos propres applications. Vous pouvez créer des agents
complets avec vos propres applications grâce à des
outils tels que Flow Wise. Vous pouvez créer des images dans
vos propres applications. Vous pouvez utiliser la vision dans vos propres applications,
vous pouvez tout faire. Vous avez appris les
bases de ces LLM. Ils peuvent faire beaucoup de choses, et je pense que vous devriez commencer. Utilisez-les simplement,
car n'oubliez pas que
vous n'avez appris que si vous
modifiez votre comportement. Gagner de l'argent signifie les mêmes circonstances
mais un comportement différent. Peut-être que vous ne saviez pas comment
utiliser les LLM, maintenant vous le savez. Tu n'apprends que si tu le fais. Si vous voulez être
un cookie intelligent,
vous pouvez simplement partager ce cours, vous pouvez simplement partager ce cours car de plus en plus de personnes en savent
toujours plus sur les points de vue, afin que tout le monde puisse apprendre ensemble. Merci pour cela,
et je vous revois dans la prochaine vidéo
car c'était pour Llams. Maintenant, nous commençons à créer des images avec des modèles de
diffusion
12. Explication du modèle de diffusion: La section porte sur les modèles de
diffusion, et il existe de nombreux modèles de
diffusion. Nous avons Dali, nous avons Imagen, nous avons une diffusion stable
. Nous avons Sra Ra fait des vidéos. Nous avons des modèles Mid Journey
et les modèles de diffusion peuvent également créer
de la musique et, bien sûr, du son. Donc, en gros, je veux vous montrer le
processus de diffusion dans cette vidéo, puis nous
approfondirons certains des meilleurs modèles de
diffusion. Tout d'abord, comment fonctionnent les modèles de
diffusion, et nous le faisons très
facilement et rapidement. J'ai donc trouvé un
très bel article pour Medium. Tout ce dont j'ai besoin, c'est de cette
photo ici. Supposons que nous ayons un très
gros ordinateur et que nous entraînions notre ordinateur sur des images
sur des images comme celle-ci. Nous donnons donc à l'ordinateur
des images, par exemple, de cette plage et nous la
décrivons avec un texte. Nous donnons l'image à l'ordinateur, et nous disons peut-être une plage avec
un océan bleu, un ciel bleu. Il y a de
la verdure dans les montagnes et ainsi de suite. Nous sommes vraiment très précis. Ensuite, nous ajoutons
du bruit à l'image,
comme vous le voyez ici, mais nous décrivons
tout de même ce qu'il y a
sur la photo. Donc une plage, un océan
bleu, un ciel bleu, etc. Plus de bruit, même texte, plus de bruit, même texte,
plus de bruit, même texte
jusqu'à ce que vous n'obteniez que du bruit. Au cours de ce processus, l'ordinateur apprend à quoi ressemblent ces
images. Ce processus, il comprend
simplement que les mots que vous avez donnés l'ordinateur cèdent le pas
à cette image. Nous pouvons donc inverser cette tendance. Si nous n'avons que du bruit et que nous indiquons à l'
ordinateur une plage, ciel
bleu, un océan bleu. Il y a de
la verdure dans les montagnes et ainsi de suite. L'ordinateur peut inverser cette tendance et transformer le
bruit en image. Bien entendu, nous ne le faisons pas
avec une seule photo. Nous essayons de donner à l'ordinateur toutes les photos que nous pouvons trouver. Et il existe bien sûr
différents modèles de diffusion. Par exemple, il y a
aussi Adobe Firefly. Adobe Firefly est formé à partir de
photos d'Adobe Stock. La diffusion stable est open
source et gratuite. Tout le monde peut l'utiliser. Et la diffusion stable a été entraînée à
partir d'images provenant d'Internet. Et grâce à cela, nous pouvons également créer presque tout ce
qui se trouve sur Internet. Nous pouvons même créer des célébrités. Nous pouvons créer des éléments de
travail NSafef, etc. La diffusion stable n'
est pas limitée. Presque tout ce qui
se trouve sur Internet peut être créé avec une diffusion
stable si nous
donnons les bonnes instructions. Les instructions sont les
descriptions que nous donnons à l'ordinateur pour
prendre notre photo Et dans ce cas,
il est vraiment très important de créer de
bonnes instructions, important de créer de car
nous avons besoin de bonnes photos Si nous ne sommes pas précis, nous pouvons créer une image
qui ressemble à ceci. Si nous indiquons simplement une plage, nous obtiendrons une plage aléatoire. Si nous lui indiquons une plage, océan
bleu,
un ciel bleu , etc., nous obtiendrons
exactement cette image. Une brève illustration de
ce processus car certaines personnes aiment cette
illustration, je l'utilise beaucoup. Imaginez que vous vous allongez sur le sol et
que vous regardez le ciel. À côté de vous se trouve votre petite amie ou votre petit ami
ou qui vous voulez. Et elle te dit Tu
vois ce nuage ? Cela ressemble un peu une pomme, mais vous ne comprenez pas. Tu ne vois pas la pomme. Mais ensuite, elle
vous dit, bien sûr, regardez, voici la pomme, puis vous commencez à
comprendre que vous voyez le nuage, et maintenant vos yeux voient une pomme parce que votre cerveau
est entraîné sur des pommes. Votre cerveau
sait probablement à quoi ressemble une pomme, puis vous voyez la
pomme dans le cloud. Même s'il n'y a pas de pomme là-bas. Et si votre petite amie ne dit pas que c'est
peut-être une pomme verte, vous pensez
peut-être à une pomme rouge, et c'est exactement pourquoi nous devons utiliser une bonne ingénierie
rapide. Parce que si nous ne
sommes pas précis, nous obtiendrons des photos aléatoires. Si vous voulez avoir
une pomme verte, vous devez indiquer à l'ordinateur que vous
voulez avoir une pomme verte. Tout comme ta
copine doit te dire que la pomme
dans les nuages est verte. Si elle ne vous le dit pas, vous
penserez
peut-être à une pomme rouge, peut-être à une pomme verte, peut-être même à une
pomme jaune que vous ne connaissez pas Vous devez
donc être précis. Dans cette vidéo, nous avons donc jeté un rapide coup d'œil au modèle de
diffusion. Le modèle de diffusion
fonctionne de manière simple. Il est formé sur
des photos et sur du texte. Ensuite, le bruit s'ajoute. Au cours de
ce processus, l'ordinateur apprend à quoi ressemble cette
image. Et si nous donnons du texte à l'
ordinateur par la suite, il peut créer ces
images car il sélectionnera au hasard les pixels qui correspondent à notre image. J'espère que cela a du sens pour toi.
13. Ingénierie rapide pour les modèles de diffusion : commencer par DALL E: Dans cette vidéo, nous commençons à utiliser
notre premier modèle de diffusion, et nous voulons commencer par Dali car Dali est le
plus simple à utiliser Dali fonctionne dans
JathPT, nous connaissons donc déjà l'interface et les
instructions sont vraiment
faciles à écrire car
HatchPT faciles à écrire car Le LLM vous aidera donc à
créer de meilleures instructions. La première chose
que vous pouvez faire est, bien
sûr, de simplement
entrer dans JathPT Vous pouvez travailler avec le JathPto multimodèle
normal vous pouvez explorer GPT et Si vous continuez à acheter HatchPT, vous pouvez appuyer sur Dali et
ici vous pouvez démarrer Et ici, tu peux
créer tes photos. Vous pouvez soit ajouter ici des éléments pour vos instructions, soit
utiliser un rapport hauteur/largeur différent Utilisons simplement un écran large. Et maintenant, je veux juste
commencer par un message très simple. Je veux juste taper CAT. Nous laissons le
rapport hauteur/largeur des blancs, nous l'envoyons, puis nous récupérerons
notre première photo . Et voilà. Voici nos deux premières photos. Maintenant, si vous appuyez
sur cette image, vous pouvez voir exactement quelle
invite a donné ce résultat Donc, si vous appuyez dessus
ici, c'est l'invite. Une image
blanche magnifiquement détaillée montre
un chat de pluie assis près d' une fenêtre avec une douce
lumière du soleil, etc. Vous voyez donc que l'invite
est très détaillée, et je veux
vous montrer comment nous devons écrire des instructions pour
ce modèle de diffusion N'oubliez pas qu'à Dali,
c'est si facile parce que Chachi BT vous aide à écrire de
si belles instructions, et puis ce n'est pas vraiment magique de
créer Dali n'est pas le meilleur modèle de
diffusion, mais c'est le plus simple à utiliser Si vous voulez écrire vous-même de bonnes
instructions, vous devriez y jeter un œil. Vous devez inclure le
sujet, le support, l'environnement, l'éclairage,
la couleur, l'ambiance et la composition. Ce que tout cela signifie. Ainsi, vous pouvez prendre des
photos
de personnes, d'animaux, de personnages, de
lieux, d'objets, etc. Le support peut être une photo et une illustration
ou autre chose. L'environnement peut être à l'extérieur, sur la lune
ou ailleurs. Les éclairs peuvent
être des lampes de studio, des néons ou autre chose. Les couleurs peuvent être vives, colorées, en noir et
blanc, etc. L'humeur du chat peut être, par
exemple, calme ou paisible
ou quelque chose comme ça. Et la composition pourrait être, par
exemple, une vue complète du corps. Assurez-vous donc d'
inclure ces éléments. Vous n'êtes pas obligé d'
inclure ces éléments, mais si vous ne les incluez pas, les photos
seront plus aléatoires. Vous pouvez donc obtenir une photo
ou une illustration. Si vous ne le voyez pas spécifiquement,
tout peut arriver. Il existe également de plus grands guides
d'incitation. Et vous pouvez inclure des
éléments tels que le sujet, les actions, les
options d'environnement, la couleur, le style, l'humeur , les textures de
foudre, de perspective ou de point de vue, la
période ,
les éléments
culturels, les émotions, le support , les
vêtements, le texte, etc. Il s'agit d'un gigantesque guide
d'instructions. Je veux juste te les laisser pour que tu puisses
les
lire toi-même. Mais si vous voulez le faire rapidement, pensez
simplement aux choses,
car ce sont elles
qui comptent le plus. Voici un exemple qui pourrait fonctionner
. Illustration d'un chat détendu dans une ville
aux couleurs vives, vue de
tout son corps à l'heure dorée
avec un ratio de 16 pour ninpec Donc, si nous les copions simplement, nous pouvons les jeter dans l'Ali. Donc, revenons à l'Ali, nous l'incluons, puis
nous obtenons un résultat spécifique. Et même dans ce cas, ChatBT vous
aidera à créer des instructions
encore meilleures Mais il s'agit d'une invite qui fonctionne dans tous les modèles de diffusion. Les techniques d'incitation
fonctionnent toujours de la même manière. Et vous voyez maintenant que nous
avons une image vraiment précise. Nous avons exactement la photo
que nous voulions avoir. Et si vous cliquez dessus
et que vous accédez à l'invite, vous verrez le JetPd rendre
votre invite encore meilleure Vous pouvez améliorer encore les instructions en incluant des mots magiques Par exemple, grain de film
cinématographique, ultra réaliste, éclairs
spectaculaires Vous pouvez utiliser différents plans et objectifs d'
appareil photo si vous
voulez le point de vue, la prise de vue par drone, etc. Peut utiliser des caméras au look
cinématographique. Vous pouvez utiliser différents
cinéastes. Vous pouvez utiliser les genres. Vous pouvez utiliser des mots clés
pour les mouvements, par
exemple, les scènes d'action. Vous pouvez utiliser différents
photographes, par
exemple des
photographes sportifs. Vous pouvez utiliser
des appareils photo avec des scènes d'action , par
exemple le Canon EOS, un D X, le Mark Two. Vous pouvez utiliser tous ces différents types d'éclairage,
qu'il s'agisse de lumières vives ,
chaudes
, froides, légères, etc. Vous pouvez utiliser le gold ener, et vous pouvez utiliser toutes
ces différentes émotions. Assurez-vous donc d'inclure
ce que vous voulez voir. C'est le plus
important car tous
ces
modèles de diffusion sont entraînés sur des photos avec
des descriptions détaillées, et si vous faites une description
détaillée, vous obtenez également ce que vous voulez. Si vous tapez simplement chat, le chat peut être aléatoire. Et maintenant, je veux vous montrer une fois de plus ces instructions
de diffusion J'espère que vous savez
comment nous y parvenons. Cela permet une ingénierie
rapide. Si nous tapons une mise ici, nous recevrons une
demande détaillée pour une mise, et vous savez déjà
comment cela fonctionne. Si je
les copie simplement, bien sûr, je peux les insérer dans
l'interface Dali, puis je récupérerai
une photo à l'école Alors,
mettons-les ici. Le rapport des spécifications est
actuellement un par un. Il s'agit des paramètres de dévolution, et cette invite
fonctionnera très bien car nous avons
entraîné un tel GPT Vous savez déjà comment
entraîner un tel GPT, et maintenant je veux
vous montrer les données d'entraînement Mais d'abord, jetons un
coup d'œil à l'enjeu. La scène est vraiment
bonne car nous incluons également des appareils
photo avec des objectifs, etc. Si nous passons aux instructions de
diffusion, j'indique simplement dans
les instructions que ce PIB a besoin
pour créer de bonnes Ensuite, je télécharge ce document, et ce document est
une structure complète, façon dont le LLM doit
structurer ces instructions Mes données d'entraînement ressemblent à
ceci. L'invite structure un
sujet dont
les caractéristiques sont liées à l' arrière-plan, puis à l'arrière-plan, détails de l'arrière-plan, aux
interactions avec la
couleur et la lumière, puis adopte ou dessine avec
des traits de style spécifiques. Je donne quelques descriptions, puis quelques exemples qui me plaisent. Enfin, bien sûr, j'inclus tous les jolis petits mots clés qui améliorent ces photos. Vous pouvez simplement utiliser mon GPT si vous n'avez pas le temps
d'entraîner votre propre PIB, et je vais simplement
lier ce GPT Vous pouvez donc créer de très
bonnes instructions très rapidement. Dans cette vidéo,
vous avez donc appris à utiliser n'importe quel modèle de diffusion. Il est important de
rédiger une bonne invite, et une bonne invite doit
être spécifique au thème, au
support, au décor, à l'
éclairage, à la couleur, à l'ambiance, la composition et,
éventuellement, au rapport hauteur/largeur. Et si vous ne voulez pas
écrire ces instructions vous-même,
vous pouvez utiliser ALE, et HechPT vous
aidera automatiquement Et si vous souhaitez
également écrire de
très bonnes instructions pour tous les
autres modèles de diffusion, vous pouvez simplement utiliser MGPU
et obtenir de meilleurs Et dans la vidéo suivante, je veux vous
montrer les bases de Maturne ALE est le plus simple à utiliser, et Mahoney peut faire
beaucoup plus de choses. Et je vous
recommande vivement de faire votre première photo dans DLI dès maintenant, car c'est par la pratique que vous
apprenez le plus
14. Les bases de Midjourney: Dans cette vidéo, je veux
parler de Mi hourney. À mon avis, Mi Journey est l'un des meilleurs modèles de
diffusion, surtout si vous souhaitez
réaliser des photos réalistes. La première chose que vous devez
faire est d'aller sur leur page Web. En ce moment, sur This Minish, vous pouvez l'essayer
complètement gratuitement. Je pense que vous pouvez faire
environ 30 photos gratuitement sur leur page Web. Vous devez vous rendre sur
mimichourny.com, puis créer
votre compte Il vous suffit de
vous connecter vous-même avec Google. Dès que vous aurez
créé vos 30 photos, vous devrez
probablement mettre
à jour votre plan. Cela vous coûte, je crois,
neuf dollars par mois. Si vous êtes sur Explore, vous pouvez voir ce que
font les autres, et vous voyez les photos,
elles sont vraiment belles. Vous pouvez également lancer la recherche
et rechercher, par
exemple, des chiens, puis vous pouvez
trouver des photos de chiens. Ensuite, vous pouvez rechercher « hot for top » tous les jours et « j'aime », puis vous pouvez simplement trouver
vous-même ce que vous aimez. Si vous voulez créer quelque chose, vous devez passer à créer. Voici les photos que
vous avez déjà créées. Il est fort probable que vous n'en ayez aucune. Et si vous souhaitez
créer de nouvelles photos, vous devez saisir
votre invite ici. Il vous suffit donc de saisir
ce que vous voulez voir. Je veux juste courir
avec cette invite ici. Tête de cerf de Noël avec rose, nœud et couronne de Noël Aquarelle pastel
sur fond blanc dans le style et ainsi de suite La prochaine chose que vous
pouvez faire est d'appuyer ici, et vous avez ici quelques paramètres. Vous pouvez donc le faire dans le rapport
hauteur/largeur que vous souhaitez. Disons un par un ou 16 par neuf, car nous pouvons le
voir un peu
mieux dans un cours. Ensuite, vous avez le mode. Vous pouvez utiliser le mode standard
ou le mode brut. Le mode brut est meilleur
pour les choses réalistes. Vous pouvez utiliser différentes versions. Normalement, nous
utilisons toujours les plus récents, par exemple 6.1
pour le
moment. C'est personnalisé, donc si vous avez
déjà créé
de nombreuses photos, vous pouvez adapter votre style. Ensuite, vous avez la stylisation, et si vous ne
savez pas ce que cela signifie, passez
simplement la souris dessus Mid Churney peut ajouter un style
spécifique en milieu de trajet, et si vous l'augmentez,
vous aurez plus de style Wildness peut vous permettre de générer des résultats
inattendus et
de diversifier votre grille Vous créez donc quatre images, et si vous optez pour
cette variété, ces images varieront
légèrement dans votre grille. Ensuite, vous avez Fast et Durbo le
laissez agir rapidement, puis nous créons
notre première photo Si nous l'envoyons,
nous pouvons le créer. Et pendant que je suis en train de créer, je tiens à vous montrer le
siège, car le décor est toujours le premier
point de départ de chaque photo. Si nous appuyons dessus
et que nous saisissons le siège du tableau de bord. Nous pouvons utiliser un siège aléatoire, par
exemple, ici même. Et maintenant, nous allons avoir deux photos
différentes. Cette photo ne sera pas complètement
identique à celle-ci,
mais si je le fais encore une fois et utilise à nouveau
le même siège, nous recréerons exactement la
même image une fois Permettez-moi de vous montrer un
petit moment, car le siège est important si vous voulez
créer de la cohérence entre les personnages. Donc, si vous allez ici,
voici les
quatre premières photos. Ce Noël, les cerfs sont adorables. sont maintenant les quatre autres, et vous voyez qu'ils ne sont pas complètement les
mêmes que les premiers. Vous voyez donc que nous sommes un
peu plus proches. En général, ils sont similaires
mais pas identiques. Mais maintenant, si nous montons ici, vous verrez que nous avons exactement
les mêmes photos qu'ici. C'est donc la même image que cette photo car nous
avons utilisé la même graine. Donc, si vous voulez avoir de la cohérence dans les
personnages, vous pouvez travailler avec les graines, puis vous pouvez peut-être modifier légèrement
l'invite, et vous aurez toujours des styles
vraiment similaires N'oubliez donc pas que la
graine est importante. C'est essentiellement la première
chose que vous pouvez faire. Et si l'
une de ces photos ne vous plaît pas, vous pouvez également la retoucher. Si vous appuyez sur ces images, vous verrez que vous avez beaucoup d' options
différentes
que vous pouvez faire ici. Ici, vous pouvez faire de petites
ou fortes variations. En appuyant dessus, il
se met automatiquement en marche. Ensuite, vous pouvez effectuer une mise à l'échelle. Vous pouvez créer un cadran zippé ou une mise à l'échelle créative pour augmenter
la résolution. Alors, appuyons simplement sur le haut de gamme. Ensuite, vous pouvez également le remixer. Et si vous ne le comprenez pas, passez
simplement la souris dessus. Si vous appuyez sur subdile ou fort, vous pouvez simplement modifier votre invite et la rendre
un peu différente Mais pour le moment, je
ne veux pas le faire. La prochaine étape est le panoramique, zoom, et ici vous en
avez encore plus. Mais avant de vous montrer ça, je
veux vous montrer que c'est haut de gamme. Si je
le ferme et que je reviens à création, vous verrez que voici
les premières variantes. Vous voyez, nous avons cette image, et maintenant nous avons quatre variantes
différentes de cette image qui sont
vraiment très similaires,
mais légèrement différentes. Parfois un peu
plus de ces objets rouges, parfois un peu moins. Vous voyez donc que ce
ne sont que de petites variations. Et voilà, en ce
moment, c'est la montée en gamme. Nous avons donc fait une petite photo
en plus grande résolution. Si vous appuyez dessus ou
si vous voulez le télécharger, résolution sera simplement la
plus élevée si vous zoomez beaucoup. Vous voyez donc que la résolution
ici est vraiment très bonne. Comparé au premier, c'est beaucoup mieux, donc vous
voyez que c'est plus clair. Cela augmente donc simplement un peu la
résolution. Ensuite, nous avons le panoramique et le zoom. ne me plaît
plus parce qu'en ce moment nous n'avons plus
de rédacteur en chef. Et si vous appuyez sur cet éditeur, vous pouvez modifier cette image. Et ici, vous pouvez
faire la même chose qu'avec le Pan et le Zoom. Vous pouvez simplement le
faire ici, par
exemple, puis
appuyer sur Soumettre, et maintenant Mick Cherney va peindre et y peindre
également de nouveaux pixels Mais vous pouvez également faire davantage. Vous pouvez également modifier
avec l'inpainting. Disons simplement que vous n'aimez
pas cet endroit. Vous pouvez simplement le supprimer
, puis modifier
légèrement votre invite. Nous ne voulons donc pas
avoir le Pink Pow. Nous appuyons donc sur Soumettre, puis nous obtiendrons une
peinture sans le Pink Pow. Passons simplement à la création et vous
verrez ce qui se passe. Voici donc les
quatre premières générations Vous voyez
donc que nous avons simplement
généré quelques nouveaux pixels. Ce n'était pas parfait non plus, mais oui, allez. Au moins, le tableau s'est agrandi. Au fait, je crois que
j'aime bien celui-ci. Ce n'est pas génial. Oui, ils vont bien. Et voici les prochains
sans le Pink Pal. Voici donc comment vous pouvez
retoucher vos photos. Si vous continuez à être organisé, vous avez de nombreux dossiers
différents que vous pouvez créer pour le rendre
un peu plus clair. Si vous optez pour la personnalisation,
comme je l'ai dit, vous pouvez aimer différentes photos, puis adapter
votre style spécifique. Si vous passez à l'édition, je pense que tout le monde ne l'
a pas en ce moment. Je pense que vous
devez passer beaucoup de temps sur cette page Web
pour l'obtenir. Peut-être que dès que vous verrez le
cours, vous l'aurez également. Vous pouvez simplement
télécharger une image depuis votre ordinateur et vous pouvez faire la même chose
en peignant. Donc, il suffit d'appuyer dessus, et maintenant je veux juste télécharger
cette photo ici, et disons simplement que je
veux avoir un chapeau vert. Si je le supprime, je peux
taper dans l'invite
ce que je veux voir, le
gars avec du vert , puis nous l'envoyons et nous aurons probablement la
tête verte. Nous allons également créer
ici l'arrière-plan, moins tel que je le vois
car cette photo n'en
avait pas. Vous pouvez donc modifier vos propres
photos très, très rapidement. Et voilà, c'est
le bordel. Mais peut-être que le suivant
est meilleur. Oui, c'est bien mieux. De plus, cela fonctionne. Oui,
allez. Ces trucs sont cool. Le premier est un peu
en désordre, mais le deuxième, le troisième et le quatrième vont relativement bien. Ainsi, vous pouvez également modifier
vos propres photos, et ici aussi, vous pouvez
faire la peinture à l'extérieur. Disons simplement que vous voulez
avoir une résolution différente. Vous pouvez simplement
appuyer sur Soumettre, modifier, puis vous obtiendrez
votre nouvelle photo, et vous recréerez les
pixels ici Et boum, voilà
quatre photos totalement inédites. Certains d'entre eux sont bons, d'
autres ne sont pas vraiment géniaux. Et d'ailleurs, si vous n'
aimez pas trop une image,
bien sûr, vous pouvez simplement y aller et la
modifier avec le inpainting Disons donc que
ce n'était pas parfait, et peut-être aussi que ce n'était pas
parfait, vous pouvez le modifier. Je pense que tu comprends ce que je veux dire. La prochaine chose que vous pouvez faire
dès que vous avez créé une
telle image ou
dès que vous l'avez modifiée avec les
tableaux ou autre, c' est que vous pouvez
également retexturer Si vous appuyez sur re texture ici, il ne s'agit donc
plus pour le moment de l'édition,
mais de la nouvelle texture. Tu peux modifier un peu cette
image. Vous pouvez faire des photos similaires. Cela fonctionne de la même
manière qu'une diffusion stable. La diffusion stable appelle
cela des réseaux de contrôle. Et ici, Matron vous
explique également ce qui se passe. Re texture modifiera
le contenu de l'image d'entrée tout en
essayant de préserver la structure
d'origine. Pour de bons résultats, évitez
d'utiliser des instructions
incompatibles avec la
structure générale de l'image Donc, ce que nous pourrions faire ici en ce
moment, c'est, par exemple, un type à tête
verte ou simplement
un gars avec de la chaleur, et nous tapons également cyberpunk Ensuite, nous appuyons simplement sur
Submit re texture, puis nous obtiendrons quelque chose qui ressemble un peu à la même. Nous aurons donc une pose similaire, des compositions
similaires, mais
dans un style cyberpunk J'espère que vous pouvez voir
comment cela fonctionne. C'est vraiment une fonctionnalité intéressante. Jusqu'à présent, cette diffusion était probablement stable avec
les réseaux dits de contrôle. Et maintenant, nous pouvons également le
faire en cours de route. N'oubliez donc pas qu'avec la retouche, vous pouvez simplement modifier
toutes vos photos, et qu'avec la redexture, vous pouvez les retoucher Vous pouvez également utiliser ce que l'on appelle un réseau de
contrôle et une
diffusion stable en cours de trajet. Ici, vous n'avez
pas beaucoup de contrôle, mais c'est aussi une fonctionnalité intéressante. C'est essentiellement tout ce
que vous devez savoir dans M journey si vous
voulez créer très rapidement. Oui, l'outil est beaucoup plus volumineux, mais si vous voulez simplement
démarrer le plus rapidement possible, voici tout ce
que vous devez savoir. Vous pouvez créer des photos, vous pouvez les modifier. Vous pouvez utiliser différentes graines pour recréer le même style
encore et encore. Amusez-vous bien dans Mjourney
comme je l'ai dit, le plus vite possible.
15. Ideogram et Adobe Firefly: Dans cette vidéo, je veux vous donner un aperçu de deux modèles de
division Nous avons Ideogram, et
nous avons Adobe Vrefly. Il s'agit également de deux modèles de division complètement
distincts. Adobe Firefly vient de, comme Adobe, et il est également intégré à
Photoshop, etc. Je pense qu'Adobe est spécial à cet égard, car vous
pouvez créer des images, et Adobe ne s'entraîne qu'à partir d'
images provenant d'Adobe Stock. Vous n'avez donc pas à vous
soucier des droits d'auteur, etc. C'est spécial parce que
Money, etc., ils peuvent créer des images à partir de bips ou d'entreprises, et parfois vous pouvez
obtenir des réclamations pour droits d'auteur Mais si vous utilisez Adobe Firefly,
ce n'est pas le cas. Et l'idéogramme est spécial parce qu'il est très
bon avec Donc, dès que vous accédez à
l'une de ces pages Web, voici un idéogramme, je suis dans le plan gratuit Donc non, je ne paie pas non plus pour tous les
modèles sous le soleil. Et ici, vous avez une interface
vraiment propre. Vous avez une maison, et vous
pouvez taper ici ce que
vous voulez voir. L'ingénierie rapide fonctionne
toujours de la même manière. Ici, vous avez tout un
design réaliste, trois D et un anime, et vous pouvez simplement rechercher par vous-même ce que
vous aimez. Si vous utilisez l'idéogramme, je
vous recommande vivement de créer des images, par
exemple, comme celles-ci Des photos où le texte est
inclus car ici, l' idéogramme est vraiment bon Faisons juste un test. Un renard qui tient une
pancarte avec les lettres, attrape-moi si tu peux et ensuite on pourra simplement
faire quelques ajustements. Donc, la question magique savoir si
nous voulons l'
activer ou le désactiver. Si vous le laissez
activé, votre invite est automatiquement améliorée. Ensuite, le ratio des spécifications,
la visibilité, vous ne pouvez passer au
privé que si vous payez, puis le modèle et la palette de
couleurs si vous le souhaitez. Mais pour le moment, je
veux juste envoyer ceci. Voilà nos quatre photos. Si j'appuie sur eux, oui, cela prend un peu de
temps en ce moment car ils ne peuvent générer de la lenteur que
si vous n'avez pas de plan. Mais vous voyez que le texte est vraiment
bon. Attrape-moi si tu peux. Le texte est parfait. Car
le renard est plutôt bon. Alors
voyons le suivant. C'est où ? C'est ici, attrape-moi si tu peux. Le renard est vraiment sympa. J'aime donc beaucoup cette
invite ou cette photo. Celui-ci est également
relativement bon, mais ce panneau flotte
un peu partout, donc j'aime
un peu plus celui-ci. Et c'est le dernier,
attrape-moi si tu peux. De plus, c'est vraiment bien. Donc, en gros, lancez-vous dans ce programme et jouez un
peu par vous-même, surtout si vous
voulez afficher du texte. C'est vraiment génial. Voici
également quelque chose que j'aime bien. Les logos, etc. sont
tout à fait parfaits. Il y a une photo que j'aime
bien, alors joue un peu avec elle. Si vous continuez à créer, vous pouvez voir ce que
vous avez créé. Donc, en gros, il y a quelques
photos que j'ai prises. Et si vous utilisez Canvas, vous pouvez également modifier vos contenus de la
même manière que dans Murne C'est essentiellement tout ce
que vous devez savoir sur Ideogram Idogram est
vraiment très facile à utiliser La prochaine étape est Adobe Firefly. Adobe Firefly fonctionne de la même manière. Ici, vous avez également le film
génératif, le texte en image, l'
étendue générative et la génération de vidéos. Les vidéos ne fonctionnent pas pour le
moment. Ici, vous devez vous
inscrire sur la liste d'attente. Mais vous pouvez tout à fait créer
et modifier avec Firefly. Si vous appuyez dessus
ici, vous êtes sur leur page Web
Firefly. Et si tu y retournes encore une fois, tu verras ce
que tu peux faire. Vous pouvez convertir du texte en image, générer un film, générer un
modèle, générer un vecteur. Ainsi, si vous utilisez Adobe Illustrator, vous pouvez également générer des vecteurs, des
recolorations génératives
et des effets de texte Vous pouvez jouer avec toutes
ces choses. L'interface est vraiment simple. Si vous appuyez sur le texte pour afficher l'image ici, vous pouvez simplement l'essayer. Vous pouvez également utiliser les photos
prises par d'autres personnes. Disons que vous
aimez celui-ci, si vous appuyez dessus, il est
automatiquement copié. Ici, vous pouvez taper votre invite et vous
pouvez essayer cette invite, et sur le côté gauche, vous
pouvez utiliser ce que vous voulez. Utilisons donc simplement Firefly Three. Je veux avoir le mode rapide, il devrait être,
par exemple, quatre par trois. Quel est alors le type de contenu ? Est-ce de l'art ou de la photo ? Par exemple, l'art, puis
les compositions, vous pouvez également télécharger les images de
référence. Si vous souhaitez télécharger des images de
référence, vous pouvez télécharger,
par exemple, des styles de référence. Supposons donc que vous vouliez
avoir cette image de référence, oui, mais pour cette invite, elle n'est vraiment pas parfaite. Cela ne marcherait donc pas
très bien. J'ai donc
réduit la force à zéro, puis je veux avoir,
par exemple, une référence de style. Disons simplement que je veux
avoir un peu plus de néon, alors j'inclus la référence de
style Ensuite, nous pouvons également inclure
d'autres effets populaires. Par exemple, l'effet
hyperréaliste, puis la couleur et le ton.
Disons juste chaleureux. Ensuite, la foudre, les
lumières du studio, l'angle de la caméra, disons simplement l'angle blanc, puis vous pouvez
appuyer sur le bouton d'essai. Et oui, cette invite est en ce
moment un véritable gâchis, mais j'espère que vous comprenez ce que je veux dire. Ces paramètres sont
vraiment faciles à utiliser, et nous avons quand même
des photos impressionnantes. Oui, allez. J'aime beaucoup ce tigre ici, donc tu peux absolument jouer un peu avec ces choses. Si vous aimez votre photo, vous pouvez
bien sûr la télécharger. Et la prochaine chose
est, bien sûr, que vous pouvez également
modifier vos photos. Vous pouvez soit modifier
ces photos ici en
appuyant simplement ici pour modifier, soit vous pouvez également modifier
vos propres photos. Si nous revenons en arrière et que nous
appuyons sur le remplissage génératif, vous
pouvez télécharger vos
photos ici ou modifier
les photos déjà incluses. Supposons simplement que vous
souhaitiez modifier cette image. Si vous appuyez dessus, vous
pouvez modifier comme vous le souhaitez. Vous pouvez insérer,
supprimer ou développer. Si vous appuyez sur Expand, vous pouvez agrandir ces
images. Si vous appuyez simplement sur Generate, le biv light se contentera de peindre et
inclura quelque chose ici Ensuite, vous devez voir
ce qui fonctionne pour vous. Disons simplement que je veux l'
avoir et que j'appuie sur Continuer. Ensuite, je veux
supprimer quelque chose, par exemple. Disons simplement que je ne veux
pas avoir ce truc drôle ici parce que je n'ai aucune
idée de ce que c'est. Je peux simplement le retirer, puis il devrait disparaître. Et, bam, ça y est. Je veux le garder parce que
je le trouve sympa. La prochaine chose est d'insérer. Insérons simplement
quelque chose ici. Disons simplement que je veux
insérer le tigre, par exemple. Donc, tigre, nous appuyons sur Générer, puis nous pouvons insérer
différentes choses ici. Si vous souhaitez modifier, par
exemple, Bebor,
cela fonctionne Tu peux changer de vêtements. Vous pouvez changer la couleur des cheveux. Tu peux changer
ce que tu veux. Oui, ce tigre est un gâchis. Allez, gardons-le. Je veux te montrer
encore une chose avec un humain. Disons donc que je veux l'
ajouter ici. Je veux faire l'encart, et je veux que le fromage porte, par
exemple,
des vêtements différents Je peux simplement copier ces
vêtements ici, puis je peux taper
ce que je veux vraiment voir. Tapons simplement, par
exemple, Jacket. Et voilà, et je pense que
tout s'est bien passé. Gardons juste le premier. Rien de tout cela n'est
totalement parfait. Adobe Firefly, c'est un
outil que je n'utilise pas beaucoup, mais certaines personnes l'apprécient vraiment Il est particulièrement puissant
si vous travaillez déjà avec Adobe Photoshop, car il est inclus
ici. Si vous travaillez avec Illustrator
et Photoshop, etc., vous devriez totalement travailler
avec Adobe Firefly Il s'agissait donc essentiellement d'un idéogramme. Utilisez l'idéogramme si vous souhaitez
générer du texte à l'intérieur des images Personnellement, je
dirais qu'il faut utiliser Adobe Firefly si vous
utilisez déjà
le produit Adobe, c'est-à-dire Illustrator et
Adobe Photoshop, Illustrator et
Adobe Photoshop, ou si vous voulez être
certain à 100 % de ne
jamais enfreindre le droit d'auteur parce que jamais enfreindre le droit d'auteur parce Firefly est Essayez donc ces deux outils. Et, bien entendu, l'
ingénierie rapide est toujours la même. Rendez-vous dans la prochaine vidéo.
16. Modèles open source: Parlez des modèles de
diffusion open source. Il s'agit principalement d'une
diffusion et d'un flux stables, mais il existe également
d'autres modèles comme recraft et Omnigen
et Ce sujet est gigantesque
et vous avez le
plus de flexibilité. Vous pouvez soit télécharger
ces modèles et les exécuter localement sur votre propre machine soit
les exécuter dans le Cloud. Le moyen le plus simple et le plus rapide
est de les exécuter dans le cloud. Néanmoins, je
veux vous montrer quelques options gratuites afin que
vous puissiez également les exécuter entièrement gratuitement et ne pas payer pour chaque
fonctionnalité sous le soleil. La première option
serait donc CFY. Maintenant, en science, vous n'avez pas beaucoup de temps dans ce cours, ce n'est peut-être pas la meilleure option. La courbe d'apprentissage est
vraiment abrupte. C'est CFI J'ai un cours qui
couvre ce sujet en détail, mais CFY n'est pas
ce qui fonctionne très vite La deuxième option est,
par exemple, Web UI Forge. Cela fonctionne relativement facilement, relativement rapidement, mais ici aussi, vous devez télécharger
beaucoup de choses. Ce n'est donc pas génial non plus. Avec Forge, vous pouvez également gérer un flux de diffusion stable
et bien plus encore Ce que je veux vous
montrer maintenant c'est focus, car avec focus, vous pouvez exécuter stable difusion, et stable difusion
est open source, et vous pouvez l'exécuter gratuitement Soit dans un bloc-notes CLP, soit
vous pouvez l'installer localement. Si vous souhaitez l'
installer localement, il vous suffit de le
faire via ce lien. Donc, c'est ici, et ensuite
vous pouvez l'exécuter localement. Mais ce que je veux vous montrer
maintenant, c'est le moyen le plus rapide, et il s'agit simplement de
ce bloc-notes CLP Donc, en ouvrant C
, vous pouvez exécuter ce qu'on appelle notebook en appuyant
simplement sur Play, puis nous obtiendrons un
lien radio avec une interface agréable, et ici nous pourrons exécuter une ifusion
stable Je veux vous montrer
comment cela fonctionne. Ensuite, je veux te
montrer Leonardo, puis je veux
te montrer le laxisme. Nous le faisons rapidement. Au bout d'un moment, vous obtenez ce lien, lancez-le sur une URL publique, et nous appuyons sur ce
lien ici. Ensuite, une phase de grado s'ouvrira. Et ici, vous avez
beaucoup d'options. La première chose est que
vous pouvez appuyer sur Avancé, et ici vous avez
beaucoup de paramètres. Si vous voulez démarrer rapidement, laissez
simplement ici
initial, utilisez la vitesse. Nombre d'images,
disons juste une. Ici, nous avons
une sauce spéciale et diffusion
stable qui nous
donnent également un signal négatif. Vous pouvez saisir ce que
vous ne voulez pas voir. Par exemple, des couleurs laides et
floues ou aussi des couleurs, disons simplement le rouge Nous ne voulons pas que notre message soit
rouge, puis nous tapons
ce que nous voulons voir. Disons simplement le modèle Instagram. Et si nous appuyons sur Générer, nous créerons notre
première photo, et nous aurons un modèle
Instagram, et ce ne sera pas
une image moche. Il s'agit donc de la qualité de l'
image et non du
modèle Instagram que nous créons. Il ne sera ni flou
ni rouge,
donc le rouge n' est
probablement pas inclus. Et voilà,
comme des cheveux bruns normaux. Nous avons une belle image, et la génération va bien
aussi d'une manière ou d'une autre. Allez. Nous utilisons notre bloc-notes refroidi
gratuitement. Nous pouvons l'utiliser gratuitement pour
toujours, et je pense que c'est cool. Voilà notre photo. La qualité est vraiment bonne. Ensuite, vous
pouvez appuyer sur les styles. Vous pouvez saisir ici les
styles que vous souhaitez voir. Par exemple, un modèle à
trois dimensions. Si vous appuyez dessus
et si vous tapez CAT, par
exemple, disons simplement CAT. Vous allez créer un CAT et il
ressemblera d'une manière ou d'une autre à ceci. J'ai également inclus une version deux de Sharp
and Focus. Nous allons donc également y ajouter un
peu de photoalismes. Si nous diminuons ces poids ici et que nous n'utilisons que le modèle
si trois D, il y en aura un
peu plus. Alors pourquoi arrêter cela, par exemple, et je crée une
fois de plus uniquement avec ce modèle en trois D et
cela devrait mieux fonctionner. Pour les photos suivantes,
je peux par
exemple inclure à nouveau les autres
styles. Et j'arrête ça tout de suite. Ensuite, ce sont les modèles. Vous pouvez également utiliser différents
modèles et différentes auras, mais il est fort probable que si vous
souhaitez simplement les utiliser rapidement, vous n'avez pas besoin de vous
plonger dans les modèles et les Las. Et les paramètres avancés, très
probablement, vous
n'en avez pas besoin. Mais ce dont vous avez
besoin en fin de compte, c'est de l'améliorer. Si vous appuyez sur Améliorer, vous pouvez apporter de petites variations, et vous pouvez également effectuer des upscalings la même manière
qu'en cours de trajet. Et ce que vous pouvez également faire est
d'appuyer sur l'image d'entrée. Ici, vous pouvez télécharger des images, et également ici, vous
pouvez effectuer des mises à l'échelle Faisons
encore une fois un chat réaliste. Tapons simplement chat ici. Oui, je donne un très mauvais exemple ici avec la
rapidité de l'ingénierie. Je veux juste créer un chat, puis je veux te montrer
ce que nous pouvons faire ici. Et voilà, en ce
moment, nous avons notre chat. Et si nous le rejetons, nous pouvons faire des variations. Donc, subtil ou fort,
et si vous appuyez sur le cadran Zu, vous pouvez également taper
, par exemple, heureux, et vous obtenez un chat heureux. Vous pouvez simplement appuyer sur Créer, puis tout
changera un tout petit peu, et peut-être que le chat
essaiera de sourire. Oui, voyons juste
comment cela fonctionne. Cela fonctionne un peu mieux avec les gens si vous l'incluez. Oui, allez, peut-être qu'il a l'air
un peu plus content. Cela fonctionne mieux si
vous le faites avec des humains et si vous tapez un sourire, par
exemple, ou avec des couleurs, avec ce chat, vous pourriez changer les couleurs un tout petit peu. Donc, avec ces variantes,
vous pouvez jouer avec elles. Vous pouvez également effectuer une mise à l'échelle, sorte que vous pouvez effectuer une
mise à l'échelle en deux semaines, la résolution, appuyer dessus puis appuyer
sur Générer. Voyons voir. Oui, allez, ça a l'air
un peu plus content, du moins comme je le vois. Ensuite, vous avez
un message d'image, et c'est particulièrement intéressant car vous pouvez
appuyer sur Avancé, puis vous pouvez télécharger ici
vos informations et vous
pouvez utiliser Image prompt,
Ba Kenney, CPDS et Face Laissez-moi vous expliquer
comment cela fonctionne. Si vous l'incluez ici
et que vous utilisez Image prompt, vous pouvez également taper
, par exemple, faire et si vous appuyez sur Créer, les premières images seront complètement les mêmes
que celles ici, afin que nous puissions utiliser le
style de cette image. Alors voyez par vous-même que
le style est vraiment très similaire à celui de
la génération précédente, similaire à celui de
la car nous utilisons l'image d'entrée avec
le message d'image. Nous avons donc un
style vraiment similaire à celui de cette photo. J'espère que tu peux déjà
le voir. Et voilà. Nous avons un style très similaire, vous pouvez
donc voir le fond vert, des éclairs similaires,
des couleurs similaires, etc. La prochaine chose que vous pouvez
faire est Piracani ou CPD. Ces deux éléments sont
appelés réseaux de contrôle, comme dans la vidéo précédente à
mi-parcours. Si nous tapons, par exemple,
Dier en ce moment, nous
utiliserons un Pyraky Nous utiliserons un
filet de contrôle qui contrôle la profondeur ou les poses
de ces images. En gros, nous allons
créer un message qui se trouve dans un article similaire
à celui de ce chaton ici Il sera probablement assis d'une manière ou d'une autre, et ce sera un article vraiment, vraiment similaire ici. De plus, la queue
sera complètement similaire. De plus, les oreilles
seront très similaires, mais nous devrions avoir un tigre. Voyez par vous-même, nous avons les mêmes compositions, mais vous voyez que nous créons
un tigre en ce moment. Oui, ça va
devenir mignon, je crois. Un petit tigre dont le siège est complètement similaire à
celui de notre chaton, mais dont les cadres seront
recréés avec un Et après 50 %, les cadres peuvent également prendre le
dessus un peu plus, et cela a également
un peu changé. Donc en ce moment, vous voyez qu'il ressemble de
plus en plus un tigre et de moins en
moins à notre chaton Et si vous
voulez avoir encore plus chatons dedans ou même
une pose plus similaire, vous devez jouer un
peu avec ces filets de contrôle Tu vois, comme si la
pose n'était pas parfaite. C'est similaire, mais
ce n'est pas parfait. Ce que vous pouvez faire, c'est augmenter un peu
le poids
et arrêter le pari. Si nous augmentons le stop bet, par
exemple, à 0,8, nous utiliserons 80 %
des étapes de la génération
afin de recréer ce chaton Il devrait
donc être
beaucoup plus similaire Vous le voyez en ce moment, c'est
vraiment comme le chaton, mais un peu de
couleurs différentes pour le tigre Et cela se poursuivra
actuellement jusqu'à 80 % des images, et seules les dernières images prendront le dessus un
peu plus. Voyons si
cela fonctionne ou non. Comme je l'ai dit, tu
dois jouer avec ça. Je pense donc que cette
image est
foirée parce que nous
ajoutons également ce truc ici Oui, ce n'est pas parfait. Nous devons jouer
avec ces choses. Je l'ai essayé encore une fois, et je pense que c'
est un peu mieux pour le moment. Nous avons une pose très
similaire en ce moment. Ces filets de contrôle vous
permettent donc d'utiliser la pose. Ceci est particulièrement
puissant si vous avez, par
exemple,
des humains dans une pose spécifique. Si vous avez une ballerine
qui fait quelque chose de chic, vous pouvez recréer avec cette Bacani quelque chose qui La prochaine étape est l'échange de visages. Vous pouvez télécharger, par exemple, une photo de votre visage
et simplement l'échanger. Et vous pouvez également combiner
plusieurs de ces éléments. Vous pouvez utiliser, par exemple, le
bakani d'une ballerine, puis le visage
d'un autre humain puis peut-être
autre chose comme référence de Vous pouvez donc jouer
un peu avec ça. La prochaine étape est
la peinture intérieure. Vous savez déjà comment cela fonctionne. Vous pouvez simplement le jeter par terre, et disons simplement que nous ne voulons
pas avoir cette queue ici. Nous pouvons simplement
le faire en peinture. Maintenant, la peinture nette avec une
diffusion stable est vraiment grande. Ici, nous pouvons faire beaucoup de choses. Mais d'une manière générale, si
vous voulez simplement travailler vite, travaillez comme au milieu du trajet. Il s'agit d'un outil gigantesque. Nous ne pouvons pas passer en revue
tous les détails. La prochaine étape est de décrire. Si vous utilisez « describe »,
par exemple, pour cette invite
et que vous appuyez sur « Décrire cette image » dans l'invite,
nous recevrons l'invite. Vous pouvez également télécharger des images que vous avez sur votre ordinateur, par
exemple, puis vous pouvez voir à quoi
pourrait ressembler une invite ici. C'est ce que suggère
le modèle de diffusion Z. Une pelle orange se
trouve sur des rochers Alors, allez, ça y est.
Alors nous avons un coup de main. Vous savez déjà que nous
pouvons effectuer des upscalings, etc.,
ainsi que les métadonnées Si vous incluez cette image, par
exemple, vous pouvez
également appliquer des métadonnées Ces métadonnées sont
particulièrement puissantes si vous les incluez ou si d'autres
personnes les incluent, vous pouvez utiliser leurs paramètres. La prochaine chose que je veux vous
montrer, ce sont les journaux. Si vous appuyez sur les paramètres, vous pouvez accéder
aux journaux d'historique. Et ici, vous pouvez voir ce que
vous avez créé précédemment. Vous pouvez voir toutes vos
créations, voir
quelle résolution vous a été demandée et quels paramètres
vous ont permis d'obtenir ce résultat. C'est essentiellement le
moyen le plus rapide d'expliquer votre objectif. La concentration est donc un outil gigantesque. La diffusion stable fonctionne
en arrière-plan, vous pouvez l'utiliser gratuitement pour toujours. Si vous souhaitez utiliser une
interface Web pour une diffusion stable, vous pouvez utiliser leonardo.ai. Leonardo.ai est également l'un de mes outils préférés si vous
souhaitez travailler dans une interface Web. Et ici, vous avez essentiellement
les mêmes choses que dans Focus. Il est également un
peu plus facile à utiliser, mais ne vous inquiétez pas pour
chaque outil disponible dans Leonardo AI, vous devez également payer
relativement rapidement. Ici, vous avez également, par
exemple, Canvas. Vous avez les
générations en temps réel, vous avez le mouvement,
vous avez la création d'images, vous avez des upscalers,
vous avez Vous pouvez entraîner vos propres modèles et vous pouvez générer trois
textures en D. Donc beaucoup de contrôle
dans LeonardoEI, ils ont également quelques petits tutoriels façon d'utiliser tous leurs outils Alors jetez-y un
coup d'œil si vous voulez
approfondir et dites-moi si je dois inclure une conférence
séparée. Mais normalement, nous voulons le
faire le plus rapidement possible, et je pense que vous devriez
travailler avec focus si vous voulez utiliser une diffusion stable le plus rapidement
possible. Maintenant, si vous souhaitez utiliser le flux et les différents
autres modèles de diffusion, vous devez continuer à répliquer Replicate n'est pas gratuit. Ici, vous devez vous
connecter avec Github. Donc oui, ces outils open source peuvent être un
peu accablants pour Diverse Glen, mais
dès que vous les obtenez, ils fonctionnent également très rapidement. Ici, vous pouvez utiliser les modèles Lux, vous pouvez utiliser Recraft. Vous pouvez utiliser tous les
modèles sous le soleil. Diffusion stable de 3,5 pouces. Il y a beaucoup de
très bons modèles. Si vous appuyez sur ces modèles, ils sont vraiment faciles à utiliser. Vous pouvez simplement taper à
gauche ce que vous voulez voir, et sur le côté droit,
vous obtenez votre sortie. Cela semble donc vraiment réaliste. Quelque chose qui fonctionne vraiment
bien dans le flux est également le texte. Disons qu'une femme tient
une pancarte avec les lettres, je ne suis pas réelle. Ensuite, nous appuyons sur
Exécuter mais attention, cela vous coûte, je crois, 0,06$ Oui, 0,06$ par génération et vous devez connecter
votre profil Geta Vous pouvez voir ici quelques photos créées
avec ce modèle. Ce modèle fonctionne donc très
bien et attendez simplement cette sortie car le texte
est
également incroyablement bien rendu Je ne suis pas réel, et c'est une photo parfaite. Dans cette vidéo, nous avons examiné les modèles de
diffusion open source. Nous avons une diffusion stable. Nous avons du flux, nous avons du recraft. Nous avons beaucoup de choses
différentes. Nous pouvons également l'exécuter avec de
nombreuses options différentes. Nous pouvons les télécharger et les
exécuter localement avec, par
exemple, CFI ou Forge L'un des moyens les plus simples de vous
concentrer sur Google Colab car vous pouvez appuyer sur Play sur un bouton et l'
utiliser gratuitement pour toujours. Et si vous voulez travailler
sur une API, utilisez Replicate. Ici, vous pouvez
utiliser tous les
modèles de diffusion open
source dotés d'une API, mais ici, vous devez
payer un peu Vous pouvez donc jouer avec ça
juste un tout petit moment. J'imagine que vous
devriez rester concentré si vous voulez créer rapidement.
On se voit dans le prochain.
17. Récapitulation de la génération d'images avec des modèles de diffusion: Dans cette section, nous avons
appris comment utiliser modèles de division standard
normaux pour générer des images Vous avez appris comment
ils fonctionnent, vous avez
appris à utiliser un ordinateur sur le texte et l'image. Au cours de ce processus, l'ordinateur apprend à générer
cette image, puis vous pouvez la recréer, et vous devez disposer de bons
messages pour obtenir de bons résultats Tu dois être précis. Nous avons de nombreux modèles de
division différents : Dali, McTerny, ID gramatob Viavly,
table diffusion,
flux, re Mais ils fonctionnent tous de manière
relativement similaire. Vous avez toujours besoin de bonnes instructions, et vous avez
appris à les écrire, et vous aussi pour pouvoir
retoucher vos photos en
peignant et en peignant Pour le moment, nous voulons vous le dire. L'apprentissage se fait dans les mêmes circonstances
mais dans un nouveau comportement. Donc, en gros, jusqu'à
présent, vous ne
saviez peut-être pas comment utiliser
ces modèles de diffusion, maintenant vous le savez, vous
devriez donc les utiliser totalement. Créez des photos
pour votre marketing, pour les vignettes YouTube, pour les présentations,
pour les publicités, pour tout ce que vous voulez Ce n'est qu'alors que tu as appris. Ou vous vous amusez simplement à
créer ces images. Je tiens également à vous dire quels sont les
bons apprenants qu'ils apprennent ensemble, car un plus grand nombre de personnes savent
toujours plus que d'autres. Donc, si vous pouviez
partager ce cours, cela
signifierait vraiment quelque chose pour moi. Peut-être que cela signifie aussi le
mot pour l'autre personne, et si l'autre
personne obtient de la valeur, elle vous la
décrit parce que
vous le lui avez dit. Alors
merci pour ça. Et je vous vois dans
la section suivante car les modèles de diffusion
peuvent faire bien plus. Ils peuvent créer du son. Ils peuvent créer des chansons entières, et ils peuvent créer des vidéos. Rendez-vous donc dans la section suivante.
18. Vidéos d'IA avec Kling AI: Oui, l'IA peut également créer des vidéos, et nous disposons d'un milliard d'outils
différents Nous avons des laboratoires BCA, nous avons un défilé, nous avons Hotshot Nous avons une machine à rêves
de Lumaabs. Nous avons SRA d'Open AI. Oui, le SRA ne
fonctionne pas pour le moment, et nous avons Kling AI Bien sûr, il y en a beaucoup plus, et tous ces outils
fonctionnent de manière relativement similaire. Si vous utilisez des PCab, ils ont quelque chose de
spécial ici Vous pouvez
donc également créer ces vidéos que vous avez vues
devenir virales parfois Ces vidéos ici
où tout est en train de fondre. Ils sont donc devenus viraux sur
les réseaux sociaux de temps en temps, et le BCA, vous
pouvez les créer. D'une certaine manière, vous disposez également
d'une grande flexibilité. Vous pouvez simplement vous
connecter et créer toutes
ces vidéos, et vous pouvez également voir
leurs propres didacticiels. Hot Shot fonctionne très facilement. Il vous suffit de taper du texte
et vous obtenez la vidéo en retour. Dans la machine à rêves
d'Uma Labs, vous avez à peu près
la même chose. Nous commençons
et terminons toujours le cadre de
la plupart de ces outils. Et je pense qu'en
ce moment , Kling est également
l'une des meilleures choses ici. Vous avez des images d'IA, des vidéos , un éditeur
vidéo,
etc. C'est pourquoi je
veux juste vous montrer Ling AI parce que, comme je l'ai dit ce
moment, King AI vous
donne de très bons résultats, et vous pouvez commencer
totalement gratuitement. C'est du moins ce qu'il y a
de plus cool dans mon esprit . La plupart de ces trucs
fonctionnent gratuitement. La plupart de ces générateurs
vidéo basés sur l'IA fonctionnent de manière relativement similaire, donc je veux juste vous
montrer Kling AI, et si vous le souhaitez vraiment, vous pouvez jouer avec les autres
outils par vous-même. La première chose que
vous devez faire est, bien sûr, de vous rendre sur cling.com Ceci est notre page Web en chinois, mais ils ont aussi
leur version anglaise, et ici vous pouvez faire beaucoup de choses. Si vous rentrez chez vous, bien sûr, vous pouvez voir la vue d'ensemble. Vous pouvez voir les meilleurs
clichés des vidéos. Ici, ils ont des générations où ils ont également inclus le son. Suis-je en train de rêver ? Je suis tellement fatiguée. Donc, si vous prenez
votre temps, vous pouvez vraiment créer des générations cool. Ce sont tous des courts métrages. Vous pouvez simplement les
regarder par vous-même. Ils sont magnifiques. Ensuite, vous
verrez les meilleurs créatifs. Ce ne sont que des photos. Vous pouvez voir qu'ils font également de très belles photos ici. C'est également quelque chose
que j'aime bien, par exemple. Ainsi, vous pouvez créer des vidéos, faire des courts métrages, si vous assemblez des éléments vous pouvez vraiment bien
travailler. Vous pouvez créer des
images et des vidéos d'IA. Si vous appuyez sur les images AI, vous pouvez simplement créer des images. Je dois vous dire que je
n'aime pas cette fonctionnalité lien, car
pour les images basées sur
l'IA, je pense que la diffusion
stable à mi-ton je pense que la diffusion
stable à mi-ton,
etc., vaut un peu
mieux que le collage. Ne perdez donc pas votre temps avec des images d'
IA dans Kling. Mais ce que vous devez
faire, c'est appuyer sur les vidéos d'
IA, car
avec les vidéos d'IA, vous pouvez vraiment faire beaucoup de choses. Vous pouvez saisir une invite. Vous pouvez augmenter ou
diminuer la créativité. Vous pouvez ensuite utiliser le mode
que vous souhaitez utiliser. Si vous utilisez le mode
professionnel, vous devez passer
à la fonctionnalité premium. Vous voyez simplement que la qualité
s'améliore un peu. J'avais ici le plan premium, mais pour le moment je ne l'ai pas. Ensuite, vous pouvez utiliser cinq ou
dix secondes générations. Vous pouvez utiliser différents rapports
hauteur/largeur et le nombre de générations. Enfin, vous pouvez également
utiliser les commandes de la caméra et le message négatif,
comme dans le cas d'une diffusion stable. Mais l'invite négative
est également facultative. Alors essayons simplement ceci. Utilisons simplement une invite ici. Et bien entendu, ils appliquent les
meilleures pratiques si vous
souhaitez approfondir l'ingénierie rapide
spécifiquement pour ling. Mais d'une manière générale,
vous devez toujours utiliser les mêmes
techniques d'incitation que
vous connaissez déjà Donc sujet aux
mouvements, à la scène, à la description
de la scène,
au langage de la caméra et à l'atmosphère fulgurante. Et ici, ils vous donnent
une description détaillée façon dont vous pouvez écrire une telle invite. Ils vous donnent ici
quelques exemples. Il s'agit d'une invite classique, puis d'une invite que
vous avez beaucoup améliorée, et ici, ils ont une invite
vraiment très descriptive. Et ici, vous pouvez voir ce qui
change dans ces vidéos. Si vous appuyez dessus, vous
voyez que, d'une manière générale, vous obtenez une bonne vidéo,
mais bien sûr, meilleure invite donne des résultats
encore meilleurs Regardons-les simplement. Vous voyez que vous avez
quelques effets supplémentaires, et je pense que la vidéo est
généralement un peu meilleure. Et si vous avez une invite vraiment
descriptive, vous verrez qu'elle devient encore un
peu plus impressionnante. Ce que vous pouvez faire, c'est, bien sûr, simplement copier cette invite,
puis l'insérer dans votre application et voir
par vous-même comment
tout cela fonctionne. Ici, ils vous montrent de nombreux exemples
différents avec de
nombreuses instructions différentes Par exemple, il ne sert à rien que je vous montre toutes
les instructions ici. Vous pouvez simplement
regarder cela par vous-même. C'est vraiment facile à utiliser. Ensuite, si vous revenez à
Kling, vous pouvez bien sûr utiliser Kling
1.0 ou Kling 1.5. Si nous optons pour la version 1.5, nous avons, en
général, une qualité légèrement meilleure, mais certaines fonctionnalités ne sont pas
incluses, mais elles le seront. Travaillons simplement avec Kling 1.5. Incluez une bonne invite, la créativité à moyen terme, le mode standard, 5 secondes, 16 x 9, une vidéo. Je ne veux pas inclure de commandes de caméra
spécifiques, mais vous pouvez le faire
si vous voulez avoir zoom vertical
horizontal ou un peu, allez, utilisons
simplement le zoom. Et je veux juste avoir
un petit zoom ici. Et puis une invite négative, utilisons simplement le logo, le filigrane,
flou, laid, puis nous
appuyons sur Générer et nous payons dix crédits ici Au total, je pense que nous obtenons environ 100 crédits par jour, puis vous pouvez
créer ce genre de choses. Et pendant la création, vous pouvez également quitter la page et faire des choses similaires
en attendant. Alors faisons-le.
Si vous optez pour Cling 1.5, vous pouvez faire essentiellement
les mêmes choses ici. Mais si vous êtes en 1.5, certaines fonctionnalités n'y sont pas. Si vous faites défiler la page vers
le bas, les mouvements de caméra sont désactivés dans la version 1.5, mais je suis sûr qu'ils
reviendront. Si vous passez à nouveau l'
aspirateur dans Cling 1.0, ils sont inclus une
fois de plus, bien sûr. Ensuite, si vous passez de l'
image à la vidéo, c'est du texte à la vidéo. Si vous passez d'une image à une vidéo, vous pouvez afficher vos images, puis
les mixer à l'aide d'un message. Et vous pouvez également utiliser
ce pinceau de mouvement. Je veux vous montrer ce pinceau de
mouvement immédiatement. Vous avez également ici la créativité, mode
standard, la
longueur, etc., ainsi que les mouvements de caméra, mais ils sont actuellement désactivés et vous recevez un message négatif. Donc, si vous utilisez, revanche, la touche 1,5 en ce
moment, vous n'avez pas inclus les
mouvements de caméra pour le moment, et vous n'
avez pas non plus le pinceau de mouvement. Utilisons donc simplement la version 1.0, puis nous téléchargeons l'image. Peu importe la photo
que vous utilisez. Utilisons simplement quelque chose
de ma génération. Je veux juste
le télécharger ici. Nous pouvons donc simplement
animer ce gars, et je veux le
faire très simplement Allez. Un gars qui s'amarrait. Ensuite, bien sûr, vous pouvez utiliser mouvements de
dessin avec
le pinceau de mouvement. Si vous ne l'utilisez pas, il s'agira que
d'une création aléatoire. Par contre, si vous utilisez le
mouvement de dessin, vous pouvez simplement indiquer au modèle de diffusion
comment il doit se comporter, et il vous donnera également
quelques instructions. Vous pouvez utiliser,
par exemple, la zone 1, utiliser Shrek, puis appuyer sur les éléments spécifiques
que vous souhaitez utiliser Vous pouvez soit
le marquer vous-même, avec une zone statique. Vous pouvez également
utiliser, par exemple, la segmentation automatique et appuyer sur les éléments que
vous souhaitez animer Si vous souhaitez supprimer un
élément, vous pouvez également le supprimer. Vous pouvez donc le faire comme
bon vous semble. Il est important que vous
marquiez simplement les éléments que
vous souhaitez automatiser, et non pas automatiser l'animation, bien sûr Ce que je veux faire pour le
moment, c'est bien sûr ajouter des mouvements, et pour cela, je n'utilise pas de statique, mais j'utilise la zone 1, la segmentation par
outdo, et j'appuie simplement sur
tout ce qui ne devrait pas être
immobile cette fois-ci Dès que vous aurez découvert
ce que vous voulez animer, disons simplement que
je veux animer tout ce gars tout de
suite,
comme vous pouvez le voir Ce que nous pouvons faire, c'est
poursuivre sur la bonne voie, et nous pouvons maintenant dessiner
ce que ce type doit faire. Disons donc que
ce type devrait aller dans cette direction et peut-être un petit peu dans
cette direction. Nous pouvons donc simplement
dessiner ici quelque chose, puis vous verrez comment
cela fonctionne. Si vous appuyez sur Confirmer,
tout va bien. Si vous ne le confirmez pas, recommencez un
peu différemment. Disons que vous
voulez l'avoir comme ça. Je pense que
cela fonctionne pour le moment, alors nous appuyons sur Confirmer dès maintenant. Ensuite, nous allons animer
ce type et
il ira simplement dans cette direction dès que nous appuierons sur
Générer, bien sûr Entre-temps, nous avons diffusé notre autre vidéo avec le banda
qui boit du café lisait un livre avec
des lunettes pour vous montrer que vous
pouvez créer des générations cool Alors ce type s'en sort et
il s'en prend à lui. Ensuite, si vous descendez,
votre trajectoire de mouvement est incluse. Bien entendu, vous avez également de la créativité,
etc. Appuyez sur Générer. Et puis vous
verrez que nous pouvons animer cette image en toute simplicité. D'ailleurs, vous avez également
un guide d'utilisation du motion brush. Si vous appuyez
dessus, ils vous montrent exactement comment vous
pouvez utiliser cet outil, et ils vous donnent également
de nombreux exemples que vous
pouvez consulter. Ici, ils ont
animé ce vaisseau. Regardons-y de plus près. Ce navire a ensuite été marqué où ces
objets devaient se déplacer. Ici, ils ont donc utilisé la
brosse pour déplacer le navire dans cette direction et l'
eau dans cette direction. Et voici la vidéo. Donc, vous voyez, cela fonctionne
vraiment très bien. L'animation est géniale car le navire se déplace dans une
direction différente de celle de l'eau. Obtenez cet effet rafraîchissant qu'il y
aurait du vent sur l'eau. L'eau se déplace dans
cette direction, mais le navire peut toujours se déplacer
dans l'autre sens. Il en va de
même pour ces chiens. Ils ont simplement
marqué les chiens, puis ils leur ont indiqué dans quelle direction
ils devaient regarder. Et si vous appuyez ici, jouez, vous verrez que le disque
s'est également avéré parfait. Faisons en sorte qu'il soit grand. Les chiens regardent exactement dans la direction
où vous les brossez. Ce truc avec la
pomme est également excellent. Ils ont simplement
marqué la pomme, comme vous pouvez le voir ici, et ils ont utilisé le pinceau
pour déplacer la pomme vers le bas Vous pouvez voir le résultat ici. Cela a très bien fonctionné. Et vous voyez, nous avons aussi de l'eau
qui éclabousse. Faisons en sorte que ce soit grand. Si vous regardez bien, elle n'est pas précise à 100 %, pas parfaite à 100 %, mais
c'est une belle vidéo. Vous pouvez même faire des publicités
avec ces vidéos. Et ici ils ont
le chat et le chat saute par-dessus ce truc. Jetons juste un coup d'œil. Ici, vous voyez que le chat saute. Cela s'est également
avéré très agréable. Oui, l'atterrissage n'
a pas été parfait. Elle n'est pas à la hauteur, mais cela peut arriver à un
chat de temps en temps. Ici, vous avez également de nombreux
exemples que vous pouvez utiliser. Comme si vous pouviez créer des animations vraiment
époustouflantes. Vous pouvez brosser les dents
ici comme bon vous semble. La prochaine chose que je
veux vous montrer, c'est, bien sûr, que vous pouvez faire encore
plus dans l'intervalle. Donc, si vous passez d'une image à une
vidéo, vous pouvez, par exemple, supprimer ce type ici, puis vous pouvez également appuyer sur la
fin de l'image à la fin. Faisons donc quelque chose de
vraiment cool maintenant. Je souhaite télécharger cette photo. C'est une photo à mi-parcours. Ensuite, j'appuie sur la fin de l'image, puis je télécharge
la photo suivante. Si vous voyez ces deux photos, laissez-moi simplement les ouvrir. Voici une fille,
et j'ai recréé une fille avec le même siège
qui est un peu plus âgée Vous savez déjà comment cela fonctionne dans le
jeu. Donc c'est elle un
peu plus âgée, et c'est elle un
peu plus jeune. Et maintenant, nous voulons la
transformer avec une vidéo. Ces vidéos sont devenues
virales de temps en temps. Et ici, nous pouvons simplement
taper une femme vieillissante, par
exemple, nous avons le cadre de départ, nous
avons le cadre final. Ensuite, nous ne pouvons pas utiliser le pinceau de mouvement pour le
moment. Mais nous avons ici toutes les autres options
dans les paramètres par défaut, puis nous pouvons simplement
appuyer à nouveau sur Générer et nous allons recréer quelque chose de
vraiment très cool Ici, vous pouvez créer
de nombreuses générations les unes
après les autres. En attendant, je vais vous montrer quelques générations que j'
ai créées par le passé. Donc, vous voyez, c'était
une demande très simple. Je pense que le message était qu'un
petit chien était allongé sur un chat. Ici, vous voyez un béret qui
danse dans la jungle. Ici, j'ai utilisé, par exemple, une photo de Flux, et j'ai simplement créé son chien. Vous voyez, cela fonctionne
vraiment très bien. Il y a beaucoup d'
articles sur les œufs
devenus viraux qui ont fait
quelque chose comme ça. Ici, j'ai fait la même chose, et la deuxième génération
s'est révélée encore meilleure. Cela ressemble vraiment à de
vraies générations. La seule chose qui cloche un peu
ici, c'est cette main Dans la première génération, la main est
également un peu
bousillée Ici, j'ai fait
quelque chose avec un paysage, puis nous
passons à une autre photo. Il s'agit du cadre de début et de fin. Donc, vous voyez, en gros, nous
pouvons nous déplacer ici. Alors voici notre panda
que j'ai généré. En ce
moment, ce panda ne fait que lire, puis nous avons nos
nouvelles générations, et je vous les montrerai
dès qu'elles auront fini, car cela se fait en
quelques secondes pour le moment. L'une des générations est terminée, et étonnamment, c'est celle-ci,
celle que nous avons commencée plus tard. Et ici, vous pouvez voir comment
elle vieillit. Vous voyez que cela fonctionne
vraiment très bien. Elle commence jeune, puis elle
passe à cette ancienne version. Ce sont ces vidéos qui parfois
devenues virales sur Twitter, et vous pouvez les recréer
dès maintenant si vous le souhaitez Oui, parfois cela ne s'
avère pas parfait. Mais si vous jouez un
peu avec ceux-ci, vous pouvez totalement les essayer. Et c'est essentiellement tout ce que
vous pouvez créer. Je vais intégrer la prochaine chose dès qu'elle sera générée. Donc, en gros, voici comment
vous pouvez travailler avec Kling AI. Vous pouvez simplement créer un compte, puis vous pouvez commencer
gratuitement, au moins dès maintenant. Vous pouvez saisir du
texte et obtenir une vidéo, et vous avez beaucoup de contrôle, et ils vous indiquent également comment
vous pouvez rédiger vos instructions La prochaine chose est, bien sûr, que vous pouvez également transformer
des images en vidéos. Vous pouvez simplement télécharger une image, et vous pouvez également la transformer avec
ce pinceau animé. Vous pouvez le marquer
et vous pouvez simplement indiquer à l'IA où
il doit aller. Et la prochaine chose
est que vous pouvez également inclure les cadres de début
et de fin. Et avec les cadres de début et de fin, quelque chose comme les transformations
est vraiment très cool. Alors, s'il vous plaît, essayez
cet outil. Je suis convaincue que
tu trouveras ça cool.
19. Texte pour parler avec ElevenLabs et plus: Cette IA peut faire des voix. Oui, j'aime bien ça
aussi. Voici donc Aloy. Il s'agit d'une synthèse vocale issue de l'OPMIPlayground, et
vous le savez déjà Nous disposons de nombreux outils qui
permettent de transformer du texte en voix, et nous pouvons faire bien plus encore. C'est l'un des outils les
plus simples. Ainsi, sur l'OpmeiPlayground, vous pouvez simplement taper
ce que vous voulez entendre, puis Opmeai Il existe également des alternatives open
source, par
exemple F five TTS, peuvent l'installer localement, et si vous
souhaitez le tester rapidement, vous pouvez également le faire fonctionner gratuitement sur cet espace de phase de
câlin Il vous suffit de télécharger un fichier audio,
puis de taper le texte que vous
souhaitez générer et vous clonerez votre voix. Mais je pense que l'un des outils les plus
puissants est constitué de 11 laboratoires. Parce que dans 11 laboratoires, vous disposez d'une grande flexibilité. Vous pouvez également commencer
gratuitement et vous maîtrisez de nombreuses langues.
Laissez-moi juste vous montrer ceci. Le
générateur vocal de 11 laboratoires peut fournir un
discours humain de haute qualité en 32 langues. Parfait pour les livres audio, voix off
vidéo,
les publicités, etc. Donc, vous entendez que les
voix sont
vraiment très bonnes et que vous
pouvez faire beaucoup de choses. C'est pourquoi je veux vous
montrer le plus rapidement
possible ce que vous pouvez
faire dans 11 Labs. Je pense que si vous
voulez commencer rapidement, 11 laboratoires sont la solution, par exemple parce que vous
pouvez commencer gratuitement, et plus tard, si vous
voulez créer beaucoup de choses, vous devez payer. Mais c'est rapide. La première chose à
faire est d'aller sur cette page Web
, puis d'appuyer sur GTA Ensuite, vous serez dans
l'application et, bien sûr, vous devrez vous inscrire. Créez simplement un compte avec
Google avec ce que vous voulez. L'interface est vraiment simple. Vous avez ici sur le
côté droit des solutions simples et avancées. Tout d'abord, nous commençons par
l'interface simple. La première chose que vous voyez
ici est que vous pouvez taper ce que vous voulez
, puis je peux utiliser différentes voix. C'est une
voix masculine grave d'Arnie. J'ai créé
cette voix moi-même. Si j'appuie sur Générer du discours, je pense que j'aime cet outil. Vous voyez alors que nous pouvons
générer ce discours, et cela va
vraiment très vite. Et si vous aimez le résultat, vous pouvez le télécharger en
appuyant sur ce bouton. Et puis, si vous vous intéressez à l'histoire, vous voyez les générations
que vous avez créées, et vous pouvez également simplement les
télécharger. Oui, j'ai créé beaucoup de choses, donc vous voyez qu'il y a des pages, des pages et des pages de générations. Et vous pouvez aussi revenir en arrière très, très vite et vous pouvez recréer ces
choses très rapidement Si vous revenez à
générer, il fort probable que
vous n'ayez aucune voix que vous ayez
générée vous-même. Si vous faites défiler un peu la page vers le bas, vous verrez que j'ai
une grande bibliothèque vocale. J'ai cloné des voix
d'Elan Mask provenant de moi mais aussi
de moi-même et d'Angela
Merkel Et nous avons également
ici quelques voix
générées que j'ai créées, puis nous avons
les voix par défaut. À l'heure actuelle,
vous n'avez probablement que
ces voix par défaut. Mais bien sûr, je veux
vous montrer comment vous pouvez
cloner ces voix, même les voix de vous-même. C'est donc une voix qui me
ressemble d' une manière ou d'une autre. Je pense que j'aime cet outil, alors
générons-le simplement avec ma voix. Je pense que j'aime bien cet outil. Oui, tu vois, même l'
anglais est meilleur que le mien. Je devrais peut-être
me remplacer par un I. Je suis sûr que nous en
arriverons là. C'est le but de tout ça. Ensuite, vous pouvez également appuyer sur Avancé, et si vous optez pour Avancé, vous pouvez utiliser ici
différents modèles. Ici, dans les paramètres, vous trouverez 11 versions
2 multilingues, notre mode le plus réaliste et le plus riche en
émotions, disponible
en 29 langues,
idéal pour les voix off, les livres audio, post-production ou tout autre Nous avons l'anglais, le
japonais, le chinois, ici aussi l'allemand
et beaucoup de voix, donc cela fonctionne vraiment très bien. En plus de cela, vous pouvez également utiliser différents modèles si
vous le souhaitez vraiment. Vous pouvez simplement passer
ici à différents modèles. Par exemple, la version 2.5 de
Turbo, la version 2 de
Di,
la version 1 de D, etc. Ces choses ne font
qu'empirer. La seule chose que
vous pourrez éventuellement faire, ce sont les voix Turbo. Notre modèle de haute qualité
à faible latence est
donc un peu plus rapide, mais je travaille simplement avec
le modèle normal. Ensuite, vous avez la stabilité, la similitude et l'exagération du
style Vous pouvez jouer avec ces éléments, mais d'une manière générale, les paramètres
standard
fonctionnent très bien. Ensuite, vous pouvez également inclure l'
amplificateur vocal si vous le souhaitez. Si vous les manipulez
trop et que vous appuyez simplement, par
exemple, sur les paramètres
par défaut , vous retrouverez bien entendu
vos paramètres par défaut. Je dois vous dire que d'habitude, je ne joue pas trop avec ces
paramètres avancés, car
les paramètres par défaut fonctionnent très bien. Ensuite, sur le côté gauche,
vous voyez que vous pouvez non seulement transformer
du texte
en parole, d'ailleurs, ici, vous pouvez simplement ajouter ce que vous voulez. Vous pouvez ajouter des livres
presque entiers et créer des
livres audio à partir de ceux-ci. T devrait également fonctionner entièrement gratuitement. C'est
vraiment génial. Nous examinerons les prix plus tard car vous pouvez commencer gratuitement. La prochaine chose
que vous pouvez faire est passer au changeur de voix, et le changeur de voix
est vraiment génial. Ici, vous pouvez télécharger un discours
et le récupérer, mais d'une voix différente. Vous pouvez utiliser, par exemple, disons une voix
masculine grave d'Arnie Maintenant, je peux
m'enregistrer ou télécharger
un fichier audio et je peux simplement
recréer cette voix Alors essayons simplement ceci. Je veux enregistrer
ici cet audio. Si j'appuie ici, je vais commencer. Il s'agira d'un test pour savoir
si les selles de 11 Labs fonctionnent
en temps réel ou non. J'espère que tu ne me décevras pas. Ensuite, il suffit d'appuyer sur
Générer le discours. Il s'agira d'un test pour savoir
si cet outil de 11 Labs fonctionne
en temps réel ou non. J'espère que tu ne me décevras pas. Et vous entendez dire que
même mon stupide accent sera dupliqué. Mais voyez-vous, nous avons
une voix différente. Je peux également créer ici,
comme d'autres voix comme Adam,
l'une des voix traditionnelles qui
fonctionne vraiment très bien. On pourrait aussi me faire
parler comme une femme, faire des bêtises avec ça et
ajouter d'autres accents. La prochaine chose que nous pouvons
faire est d'appuyer sur les voix. Et en ce qui concerne les voix,
nous pouvons faire beaucoup de choses. Vous pouvez tout activer en mode personnel, en communauté et par défaut. À l'heure actuelle, vous n'aurez probablement que
les voix par défaut, et vous pourrez toujours écouter son de ces voix
si vous appuyez sur Play. Ayez confiance en vous, alors vous
connaîtrez le gouvernement du
peuple par le peuple. Le monde est rond, tout
comme le lieu. Il n'y a pas de plus grand mal. Vous entendez donc qu'il
y a de belles voix. Si vous appuyez sur une communauté, vous entendez les voix que
la communauté aime et les
voix qu'elle a
créées. Par exemple, ceci. Nous avons inscrit la règle
d'or dans la mémoire. Engageons-nous maintenant
à exister, c'est changer, changer c'est mûrir. Mûrir, c'est continuer à créer. On ne peut pas reprocher
à la gravité de tomber amoureux. C'est une bonne chose pour toi. Ensuite, vous pouvez passer à une activité personnelle. Voici les voix
que vous avez créées si vous avez
créé des voix. Si vous n'avez pas
créé de voix, vous pouvez appuyer sur Ajouter une nouvelle voix. Et ici, vous avez
soit le design vocal, clonage vocal
instantané, la bibliothèque vocale, soit le clonage vocal
professionnel Si vous appuyez sur le design vocal, vous pouvez simplement taper
ce que vous voulez voir. Disons que vous êtes une
femme, jeune, avec un accent américain
fort. Oui, c'est bon. Et puis vous avez un exemple de ce à
quoi cela ressemblerait. Ensuite, vous pouvez appuyer sur
Utiliser la voix ou sur
Générer d'abord pour
entendre son Tout d'abord, nous avons pensé que le
PC était une calculatrice. Ensuite, nous avons découvert
comment transformer les chiffres en lettres et nous avons pensé que
c'était une machine à écrire C'est bon, mais disons simplement que vous voulez avoir un accent
différent. Disons britannique et vous
voulez avoir un fort accent. Tout d'abord, nous avons pensé que le
PC était une calculatrice. Ensuite, nous avons découvert comment
transformer les chiffres en lettres, et nous avons pensé que c'
était une machine à écrire Vous voyez que vous pouvez faire en sorte que cela
fonctionne comme vous le souhaitez. Vous pouvez aussi faire du vieux mâle, australien, à faible
accent, une dernière fois. Tout d'abord, nous avons pensé que le
PC était une calculatrice. Ensuite, nous avons découvert
comment transformer les chiffres en lettres et nous avons pensé que
c'était une machine à écrire Et si vous le souhaitez,
vous appuyez sur Utiliser les voix, et cela se trouvera dans
votre bibliothèque vocale. Si vous ne les aimez pas, vous pouvez appuyer à nouveau ici et effectuer un clonage
vocal instantané Si vous appuyez dessus, vous
pouvez lui donner un nom comme moi, par
exemple, puis vous
téléchargerez quelques exemples, et ils vous indiqueront ici
ce que vous pouvez télécharger. Aucun article n'a encore été chargé. Téléchargez des échantillons audio de la voix que vous
souhaitez cloner. La qualité des échantillons est plus
importante que la quantité. Les échantillons bruyants peuvent
donner de mauvais résultats. Fournir plus de 5 minutes d' audio au total
n'apporte que peu d'améliorations. Donc, ce que je dis à la plupart
des gens, c'est d'
utiliser environ quatre à
huit minutes d' audio
vraiment très bonne et de
haute qualité. Vous pouvez l'étaler
sur un maximum de 25 échantillons. La seule chose importante
est que les échantillons ne dépassent pas
dix mégaoctets Ainsi, vous pouvez télécharger, par exemple, trois pistes, chaque
piste peut durer, par
exemple, deux ou trois minutes
avec une bonne qualité audio, puis vous obtenez votre voix. Ensuite, vous pouvez simplement donner
quelques étiquettes si vous le souhaitez, ajouter une petite description, puis vous devez, bien sûr, accepter de ne
pas faire de bêtises
avec ces voix. Ensuite, vous appuyez sur cette
voix et vous avez terminé. Je l'ai fait avec ma voix E et mon masque et avec bien d'autres choses encore. La prochaine chose que
vous pouvez faire est, bien
sûr, la bibliothèque vocale. Tu connais déjà la bibliothèque. Donc, ici, vous trouvez simplement
des choses provenant d'autres personnes. Et la dernière chose que
vous pouvez faire est, bien sûr, si vous appuyez à nouveau sur Ajouter nouvelles voix, le clonage
vocal professionnel Pour cela, vous devez
payer un peu plus et vous pouvez simplement
parler à 11 laboratoires. Vous pouvez envoyer des échantillons de voix, puis ils créent une voix vraiment
très nette. La plupart des gens le font s' ils veulent cloner
leur propre voix et en faire des livres
audio complets . Cela fonctionne très bien. Un de mes amis l'a fait, et il reçoit plus de streams avec sa voix clonée qu'
avec sa voix d'origine Donc, tu peux faire des trucs
sympas avec ça. Alors, bien sûr,
vous trouverez également ici cette bibliothèque, et ici vous pouvez trouver
beaucoup de choses. Disons simplement que vous voulez
créer des contenus pour les réseaux sociaux. Vous pouvez utiliser un grand nombre de voix
différentes. Des vidéos avec des yeux,
YouTube, des courts métrages, des systèmes d'exploitation, des
haies et, bien sûr, ce sont aussi des langues
différentes Tu peux faire plein
de trucs sympas ici. En plus de cela, vous
avez également des effets sonores. Ainsi, vous pouvez créer des
effets sonores pour ce que vous voulez. Faisons juste aboyer le chien. Vous trouverez ici quelques exemples. Ça a l'air génial. Mon chien
n'est pas là pour le moment. Normalement, il est toujours là, mais ça lui
ressemble presque. Vous pouvez donc simplement taper
ce que vous voulez créer, appuyer dessus et, oui, vous pouvez utiliser ce
contenu à des fins commerciales. Ensuite, si vous partez
explorer, vous trouverez, bien sûr, des voix que
d'autres personnes ont faites entendre. Vous pouvez donc trouver
beaucoup de choses ici. Vous trouverez ici les sujets de la semaine. C'est quelque chose de
cool, par exemple. Et vous pouvez également entendre
ce que vous voulez entendre, et ils ont également des catégories. Si vous appuyez sur les animaux, vous trouverez beaucoup
d'animaux qui miaulent, oiseaux qui chantent, des grenouilles, etc. Et vous pouvez toujours
utiliser simplement l'invite ou télécharger ce
contenu si vous le souhaitez. Ensuite, vous pouvez également les utiliser comme des flèches
ou des brams ou faire
ce que vous voulez Vous pouvez créer de très bons effets
sonores avec
ceux-ci et, comme je l'ai dit, vous pouvez les utiliser commercialement. La prochaine chose que je
veux vous montrer est projet, car vous pouvez
créer un projet entier. Pour vous expliquer cela
très, très rapidement, je voudrais vous montrer cette
vidéo car il s'agit d'une fonctionnalité où vous
devez payer un peu plus cher. J'ai le plan de base, mais si vous voulez faire beaucoup de choses ici dans cet outil, vous devez avoir un abonnement
plus solide. Je veux vous montrer l'abonnement à
la fin de la vidéo. Présentation de Project, votre flux de travail d'entrée en
bout pour créer des
livres audio en quelques minutes Que vous partiez de
zéro, que vous
extrayiez une URL
ou que vous téléchargiez des fichiers EPUB, PDF ou TXT, Projects a ce qu'il vous faut. fois votre texte en place, vous pouvez tout convertir en
audio en un seul
clic. Si vous souhaitez mélanger des
voix dans votre audio, vous pouvez désormais facilement attribuer haut-parleurs
particuliers à
différents fragments de texte. Chapitre 1, l'arrêt de bus. Hey, tu sais quand part le
prochain bus ? Matteo a demandé Je pense qu'il devrait être là maintenant. Si vous devez corriger une section, Projects vous permet de la régénérer
en toute simplicité Donc, en gros, vous pouvez réaliser des projets
entiers avec différents haut-parleurs
et faire bien plus encore. Si vous êtes plus intéressé, vous pouvez regarder cette
vidéo vous-même. Mais alors vous avez besoin, bien sûr, d'un meilleur plan pour cela. Je tiens à vous le montrer
tout de suite parce que je reçois des questions
de temps en temps. Vous avez de nombreux plans
différents. Je suis actuellement dans ce plan de démarrage
actuel, et c'est bon marché. Je paie, je crois, environ
cinq dollars par mois, mais tu peux en utiliser plus. Donc, avec le plan gratuit, vous
pouvez jouer un peu. Avec le forfait de 5$ par mois, vous pouvez jouer un peu plus. Et puis, avec le plan créateur, c'est le plan le plus populaire. Vous pouvez commencer avec
11 dollars par mois, mais ensuite, je crois,
jusqu'à 22 dollars. Je suis également sûr que cela
va changer un peu. Et vous pouvez également voir
ce que vous obtenez ici. Donc, pour ces 11 dollars par mois au départ,
vous pouvez bénéficier d'
un clonage
vocal professionnel Vous avez des projets, vous
avez un son natif et vous avez une meilleure qualité. Et avec ce forfait pro, vous en aurez encore un peu plus. Ce sont donc
essentiellement les plans, et vous pouvez également
commencer deux mois gratuitement si vous utilisez l'abonnement
annuel. Vous pouvez donc jouer
un peu avec cela pour
vous-même si vous le souhaitez. Mais la prochaine chose
que je veux
vous montrer , c'est le studio VoiceOver Le studio VoiceOver est
également vraiment très cool. Pour le moment, c'est mieux. Et ici aussi, vous devez
mettre à jour votre plan. Et ce gars vous
explique tout ce que le studio de
voix off peut faire En gros, ici aussi, vous
pouvez créer des projets complets, télécharger des vidéos et créer voix off en mode natif
avec Cela fonctionne également très bien. Je l'ai
testé plusieurs fois. Vous pouvez générer des effets vocaux et
sonores dans un seul éditeur. Vous pouvez importer des vidéos directement, superposer vos pistes audio et
les éditer avec précision. Il s'agit donc essentiellement
d'un montage vidéo avec du son qui provient nativement de 11
laboratoires. Cela fonctionne très bien. Ensuite, vous avez le studio d'
écoute. Ici, ils ont également
des ressources, donc je ne veux pas y passer
trop de temps. J'ai également généré
quelques éléments ici. Si vous appuyez simplement sur
Create NU Dup, vous pouvez simplement donner un nom à
votre projet. Ensuite, vous indiquez la langue
source et la langue dans laquelle vous
souhaitez le traduire, puis vous pouvez télécharger
votre morceau depuis YouTube TikTok ou d'autres éléments
que vous pouvez également faire manuellement, puis vous pouvez
créer ces éléments Cela vous coûtera
3 000 crédits. Il me reste actuellement
55 000 crédits
pour ce mois-ci, donc je pourrais le
faire de nombreuses fois C'est aussi quelque chose
que j'aime
vraiment, car vous pouvez traduire vos
vidéos très rapidement. Et bien sûr, ils peuvent vous en dire un peu plus en
détail si vous le souhaitez. Parce que je pense qu'il ne sert vous montrer
chaque étape, les mêmes étapes qu'ils vous montrent. En gros, créez une nouvelle étape, téléchargez vos contenus et
vous êtes prêt à vous lancer. Vous pouvez recréer vos
contenus dans d'autres langues. Et le plus cool,
c'est que vous pouvez le faire également
dans ces plans de base, afin de pouvoir traduire facilement
des vidéos Ensuite, vous avez l'audio natif. Et l'audio native
est également vraiment cool. Et ici aussi, vous avez
besoin d'un plan plus solide. En gros, vous
pouvez simplement
utiliser un extrait de code,
copier l'extrait de code
sur votre page Web,
puis vous aurez sur
votre page Web une telle barre,
et cette barre lira
l'intégralité de votre page et cette barre lira Pour ma part, je n'ai
pas de page Web, mais si j'en avais une, je pense que je l'inclurais. Si je publiais
des articles tout le temps, vous pouvez utiliser ces
éléments, puis les personnes qui consultent
votre page Web peuvent simplement appuyer sur ce bouton
et 11 laboratoires
liront l'article à
haute voix devant eux. La logique vous mènera d'un point A à un
point B. L'imagination
suffira, ils ont cette barre, et cette barre lira l'
intégralité de votre site Web à leur place. Même le New York Times a inclus cette page et
de nombreuses autres pages Web. Si vous lisez un article
du New York Times, vous le
voyez ici. Écoutez cet article. Vous pouvez simplement appuyer dessus, puis 11 laboratoires
liront cet article
à votre insu. Je ne suis pas sûre de pouvoir le jouer
ici parce que c'est comme si c'était
le New York Times. Et la dernière chose
ici, c'est l'isolateur vocal. Si vous appuyez sur l'isolateur
vocal, vous pouvez simplement
glisser-déposer un fichier audio qui n'est pas de bonne qualité et vous
pouvez l'améliorer considérablement La vidéo de démonstration vous montre
parfaitement comment cela fonctionne. Et ces fichiers audio
peuvent atteindre 500 mégaoctets. Mmm d'action. Vous devez supprimer le
bruit de fond de votre vidéo. Utilisez notre nouveau modèle d'isolateur vocal pour un
son cristallin à chaque fois. Vous voyez donc que cela fonctionne parfaitement. Si vous avez des voix bruyantes, si vous avez beaucoup de choses en
arrière-plan, vous pouvez télécharger vos générations
audio, et cela ne fera que s'améliorer. Et ces choses peuvent être très
volumineuses avec 500 mégaoctets, et vous obtiendrez des résultats parfaitement
clairs ici Ici, vous voyez toujours
ce que vous pouvez créer. Au total, j'ai 60 000
crédits par mois. À l'heure actuelle, il me reste
55 000 crédits. Ensuite, vous avez des
notifications. S'il se passe quelque chose de
spécial. Ensuite, la prochaine chose que
vous pouvez faire est, bien sûr, appuyer sur votre nom, et vous avez beaucoup d'
autres choses ici. Vous avez votre profil, et si vous appuyez dessus pour
voir certaines informations, vous pouvez appuyer sur les clés API. Si vous êtes développeur, vous pouvez générer des clés d'API et créer des applications
avec 11 laboratoires. Ensuite, l'abonnement, ici vous pouvez gérer
votre abonnement. Les paiements, si vous
êtes affilié, et si vous n'êtes pas affilié, vous pouvez continuer à
devenir affilié Ici, vous pouvez obtenir jusqu'
à 22 % de commissions, et
je dois vous dire que
oui, je suis affilié ce programme parce que je l'utilise
moi-même et que je l'adore. Et je pense que j'ai gagné
environ 100 dollars avec ça environ 100 dollars avec ça parce que j'ai publié une
ou deux vidéos à ce sujet. Ensuite, l'analyse de l'utilisation, si vous souhaitez approfondir , contient une documentation complète. Si vous êtes développeur, vous pouvez simplement le constater par vous-même. Donc, la documentation, puis le verrou de modification,
le centre d'aide, le programme d'affiliation, donc
un peu plus sur ce programme et le classificateur vocal
AI Et enfin, bien sûr,
les conditions de confidentialité. Oui, vous pouvez l'
utiliser à des fins commerciales, mais vous n'êtes peut-être pas en mesure de
créer des voix de différentes personnes
si vous n'avez pas l'accord d'
utiliser leurs voix. Enfin, bien entendu,
vous pouvez vous déconnecter. Si vous voulez
devenir affilié, parce que c'est ce que je vois tout le
temps, les gens me le demandent. Il vous suffit de contacter
l'équipe d'affiliation, appuyer ici,
de saisir vos informations, puis vous obtenez un lien
que vous pouvez promouvoir. Vous obtiendrez un tel lien. Je pense que je l'ai fait
sur Partner Stack, donc ce serait mon lien. Je l'ai peut-être inclus
dans la dernière conférence. Et si vous souhaitez vous
abonner à 11 Labs, pouvez également inclure ce lien, puis vous pourrez me soutenir. Et bien entendu, vous pouvez
également faire la même chose. Vous pouvez simplement vous créer un
tel lien plat. Vous pouvez le placer dans des vidéos
sur les réseaux sociaux ou n'importe où, et peut-être que vous pouvez gagner le
même montant que
vous payez pour cet étudiant, et c'est pratiquement gratuit. Dans cette vidéo, vous avez donc
appris comment fonctionne 11 Labs. manière générale, c'est
l'un des meilleurs outils d'
IA, du moins à mon avis, si vous souhaitez générer de la
parole à partir de texte. Et tu devrais
totalement essayer ça.
20. Transcrire avec Whisper: Parlons du chuchotement. Whisper est l'outil
open source gratuit d'Openi et vous pouvez
même l'exécuter localement Vous pouvez transformer un discours en texte. Vous pouvez faire des transcriptions. Si vous faites défiler la page vers le bas, vous voyez comment fonctionne la technologie, vous pouvez approfondir si vous le souhaitez. Et voici
l'ensemble de la configuration. Donc, si vous souhaitez
l'installer localement, vous
trouverez ici cette configuration complète. Vous devez installer
Open May Whisper par bip. Ensuite, vous devez l'
installer par bip ici. Ensuite, les mises à niveau et ainsi de suite. Et puis vous pouvez
essentiellement l'utiliser. Maintenant, si vous ne
voulez pas le faire, vous avez beaucoup d'autres options. L'option la plus simple
est probablement l'inochio. Et si vous téléchargez simplement ce fichier et
le décompressez sur votre PC, vous obtiendrez une interface qui
ressemble à ceci Et ici, vous pouvez également
taper, par exemple, chuchoter, et si vous appuyez dessus, vous pouvez simplement télécharger Pinocchio rend les choses
vraiment très faciles, et si les choses ne sont pas installées, vous pouvez simplement appuyer sur Installer, et tout cela
fonctionnera de manière complètement automatique, avez
donc pas à vous
soucier de quoi que ce Ce truc va
fonctionner automatiquement. Si vous accédez à la plateforme
depuis OPMeAI, bien sûr, vous pouvez également utiliser Wisper dans Pyton afin de pouvoir effectuer des appels d'API Et il est également
très facile à utiliser. Vous pouvez simplement l'utiliser
ici, et nous effectuerons des appels d'API. À voix basse, vous pouvez donc soit
l'utiliser localement gratuitement, soit l'intégrer dans
vos propres projets avec PyTN Et WiSPA est également très
bon marché par rapport à l'API. Si nous faisons défiler
à nouveau cet article vers le bas, vous verrez que WiSPA vous
coûte 0,006 Oh, oui, c'est vraiment bon marché. Si vous mettez en ligne quelques minutes, c'est presque gratuit. Entre-temps, Wisper a
également été installé localement, et vous obtenez ici votre interface Web
Gradio Ici, sur Open WebUI, vous pouvez simplement utiliser Wisper et
c'est vraiment très Tu peux utiliser ce que tu veux. Vous pouvez appuyer dessus. Normalement, la version
Large 2 fonctionne bien. Ensuite, vous passez à la détection
automatique, ou vous pouvez également utiliser la
langue de votre choix. Vous pouvez taper en anglais
ou quoi que ce soit d'autre. Ensuite, vous pouvez simplement
glisser-déposer ici votre fichier. Je veux juste donner un exemple avec un extrait de ce cours. J'ai donc téléchargé mon fichier, puis j'appuie sur
Générer un fichier de sous-titres Ici, nous initialisons le modèle, puis nous obtiendrons cette sortie Et c'est aussi
essentiellement une vidéo. Vous voyez donc qu'il s'agit
d'une vidéo MP 44 Aflx, et cela devrait également fonctionner Si vous utilisez MP 3, bien sûr, cela va plus vite.
Et voilà. Tu vois ça, fais ça
maintenant 3 minutes. Bien sûr, cela
tournait localement, et il s'agit d'une vidéo, et la vidéo est également
relativement longue. Maintenant, je peux simplement appuyer
dessus et je peux
télécharger mon fichier. Et maintenant j'ai ouvert
ici mon fichier texte, et vous voyez ici que j'
ai mon fichier texte, et j'ai aussi les horodatages Donc, ce que je dis
avec quel horodatage. C'est complètement génial, et vous pouvez travailler avec eux. Dans cette vidéo, vous avez
donc montré comment utiliser le chuchotement. Vous pouvez transcrire ce que vous voulez en un rien de temps. Et c'est vraiment très bon marché. Et si vous souhaitez l'exécuter localement
gratuitement, vous pouvez également le faire. C'est vraiment aussi simple que cela.
21. Générer de la musique par IA avec Udio: Ensuite, bien sûr,
nous pouvons même faire de la musique. Parce que vous pouvez créer du texte, vous pouvez créer des effets sonores. Vous pouvez également faire de la musique. J'espère que vous comprenez que ces modèles de
diffusion sont importants. L'un des meilleurs outils du
moment est Udio
et Udio a également
introduit la version 1.5 Si vous appuyez simplement dessus, vous pouvez également voir comment cela fonctionne, et ici je peux simplement vous montrer une ou deux générations
que j'ai créées. Si vous appuyez simplement sur
Play ici, les moustiques s'agitent. Grand. Vous entendez dire que ce
truc fonctionne. Vous pouvez également toujours entendre ce
qui est sélectionné. Ils pensent donc que
cette musique est cool. Jouons à
celui-ci pendant un bref instant. Site de partenariat Vous êtes de l'
est à l'ouest, du nord au sud. Donc, vous voyez, ça sonne
vraiment très bien, du moins pour le moment. Ce truc fonctionne vraiment bien. Bien sûr, vous pouvez également améliorer votre plan si vous appuyez dessus, mais vous pouvez également commencer gratuitement, mais vous êtes limité. Et si vous voulez en utiliser davantage, vous devez bien sûr
payer un peu. Et vous pouvez économiser un
peu si vous payez chaque année. Toujours les mêmes trucs. Mais vous pouvez commencer
totalement gratuitement, et c'est vraiment facile à utiliser
si vous appuyez simplement sur Créer. Ici, vous obtenez une interface. Cette interface
change toujours un tout petit peu, et vous aurez toujours de
nouvelles options, etc. En gros, vous pouvez saisir
ce que vous voulez voir. Vous pouvez obtenir des suggestions. Vous pouvez l'allonger jusqu'à 130 secondes en
une seule génération. Vous pouvez ajouter vos propres paroles. Tu peux faire plein de choses ici. Maintenant, je veux
vous montrer le moyen le plus simple de créer une chanson avec ceux-ci. Nous pouvons simplement taper
ce que nous voulons avoir, et bien sûr, nous
devons nous connecter. Il vous suffit donc de vous connecter avec Google
avec Discard ou avec Twitter. Je vais continuer avec Google. J'ai déjà créé quelques
chansons dans cet outil. Et maintenant, nous
tapons simplement ce que nous voulons avoir, par
exemple, une chanson
sur un lapin. Et puis nous pouvons également faire
plein de choses différentes. Nous pouvons utiliser le mode manuel. Si vous débutez,
utilisez simplement les paramètres par défaut. Je ne suis pas non plus un expert en musique. Donc, si vous utilisez le mode manuel, bien
sûr, vous pouvez
faire beaucoup de choses. Vous pouvez créer différents tags. Donc, que ce soit du
rock, de l'électronique, de la pop, échecs ou quelque chose comme ça, je pense que électronique serait cool
avec notre chanson de lapin. Ensuite, les paroles,
voulez-vous avoir des paroles personnalisées ? Donc, si vous appuyez sur
des paroles personnalisées, vous pouvez les saisir ou
elles seront automatiques. Bien sûr, si vous incluez
ce manuel, vous pouvez toujours taper ce que vous voulez. Alors, comment
devrait être l'instrumental ? Voulez-vous inclure quelque
chose ou non ? Et puis la génération automatique, si vous voulez
tout faire automatiquement. Pour l'instant, je l'exclus
ici, et nous utilisons simplement ici, par
exemple, electronic
et Electro comme texte Et nous appuyons simplement sur Créer, puis nous attendrons une ou deux minutes pour obtenir notre chanson. La chanson dure 1 minute, et après cela, nous pouvons
également la remixer Attendons d'avoir notre chanson. Et voilà. Nous avons nos deux chansons. Il a fallu environ 7 minutes
pour les créer, et voyons comment ils sont. Nous sommes à Midnight House.
Allons-y Allons-y Va. clair de lune brille. Premier match. Voici de retour. Regarde
le lapin s'écouler Sautez et sautez, Acrobat. Regardez le lapin couler,
puis les perles du lapin. Bonjour avec ces pattes de lapin. Ronde, saute, tourne, saute
h avec ces pattes de lapin. C'est génial, vous
pouvez donc jouer toute la
journée avec cet outil. Nous pouvons maintenant faire les trois choses
suivantes. Nous pouvons les remixer. Nous pouvons les étendre ou
les publier. Si vous appuyez sur Mix, vous pouvez faire ici plein
de choses différentes. Bien sûr, vous pouvez modifier
le texte, par exemple, vous pouvez changer l'instrumental, vous pouvez modifier
les éléments générés
et, bien sûr,
également les variantes. Vous pouvez le rendre plus
ou moins différent. Vous pouvez remixer comme bon vous semble. Si vous pensez que c'est cool, mais que vous voulez l'avoir plus longtemps, il vous suffit d'appuyer sur étendre. Si vous appuyez sur Publier, vous pouvez le partager avec
tout le monde sur cette plateforme. Si vous appuyez sur ces points libres, vous pouvez remixer, étendre,
comme vous le savez Vous pouvez voir le morceau, vous
pouvez l'ajouter à une playlist. Vous pouvez le partager, le télécharger, le supprimer ou le signaler
si quelque chose ne va pas. Je crois que j'appuie sur Extend
parce que j'aime beaucoup cette chanson, mais il n'est pas nécessaire d'
écouter la chanson en entier. Je pense que la meilleure
chose à faire est de jouer un
peu avec cet outil. Udio est, à l'heure actuelle, du moins dans mon esprit,
de loin le meilleur outil Udio propose une musique que
nous pouvons vraiment écouter. Nous pouvons créer et
écouter de la musique en quelques minutes. Cela n'a jamais été possible. Réfléchissez simplement à ce que
vous devez faire pour créer une chanson de cette
qualité sans A. Vous devez apprendre à
jouer des instruments. Tu dois apprendre à chanter, ou tu dois trouver
les bonnes personnes. Tu dois aller dans un studio. Tu dois l'enregistrer, tu dois le modifier.
C'est énorme. Nous pouvons désormais créer notre propre musique en quelques clics et la musique, moins dans mon esprit, est presque aussi bonne que
celle des professionnels. N'oubliez pas
que c'est
la pire version avec laquelle vous pourrez jouer. son s'améliorera également de plus en
plus et peut-être qu'un nouvel outil sera
bientôt
disponible,
aussi performant que les meilleurs artistes de la
planète. L'IA est tout simplement géniale. Jouez simplement avec le tabouret et dites-moi si
vous allez l'adorer. Je sais que tu le feras.
22. Récapitulatif et MERCI !: Félicitations. Tu l'as fait. Et tout d'abord, merci. Vous avez appris l'IA
le plus rapidement possible. Nous avons commencé par les bases. Alors, qu'est-ce que je suis et que sont les LLM, comment sont-ils formés
et comment fonctionnent-ils ? C'était un peu théorique, mais vous devez le comprendre
, car vous devez comprendre que pour
obtenir de bons résultats, vous avez besoin de bonnes entrées et vous devez
comprendre les jetons pour. Nous avons commencé à connaître les LLM disponibles et à savoir comment nous pouvons
les utiliser. Nous en avons beaucoup. Nous avons des
Lams à source fermée comme HachPd,
Clot, Gemini Mais en gros, ce
sont les trois grands, et puis nous avons des
applications open source. Et les applications open source LL, nous pouvons les utiliser
soit sur Olama dans LM Studio, soit également
sur un chat câlin Alors vous avez appris
ce que sont ces LLM. Vous pouvez
agrandir ou réduire le texte volumineux. Et avec tout cela, vous pouvez faire beaucoup de choses, car vous
pouvez également créer du code. Vous pouvez créer du texte pour le marketing. Tu peux écrire des livres antires. Vous pouvez écrire des e-mails, et vous pouvez faire bien plus encore. Ensuite, nous avons parlé d'ingénierie
rapide. Nous avons les suggestions de rôles,
les instructions brèves, les instructions structurées et quelques conseils tels
que la réflexion étape par étape Le plus important
est l'association sémantique, vous devez
donc donner un contexte Vous pouvez également personnaliser
votre LLM soit aide de l'invite du système, soit à l'
aide de la technologie directe Et bien sûr, vous pouvez utiliser
tous ces LLM via une API et vous pouvez les intégrer dans vos propres projets si
vous êtes développeur Bien sûr, il y en a bien d'autres. Il existe une infinité
d'outils d'IA comme Perplexity, quelque chose qui fonctionne bien pour certains,
et si vous voulez jouer aussi,
le chat câlin est
cool et si vous voulez jouer aussi,
le chat câlin Ensuite, nous avons parlé des modèles de
division. Nous avons commencé par la génération d'
images. Les modèles de division sont des modèles
entraînés sur du texte et des images, et ils peuvent recréer
des images si vous tapez Ici aussi, vous devez être précis pour obtenir
des sorties spécifiques. Une ingénierie rapide
est donc importante, et elle fonctionne de la même manière dans tous les modèles de
diffusion. Pense juste à ce qui compte. Vous avez découvert tout ce qui est le plus
important propos de Mid-Journey, d'un Dogram, AdobVafly et même des modèles
open source, tels que la diffusion
stable en focus ou en flux Vous avez ensuite appris
que les modèles de fusion peuvent faire plus, car vous pouvez également créer du son, de la
vidéo et des voix. Certains des outils les plus
populaires pour les vidéos sont ling,
Runway et Beca Si vous voulez générer du texte, 11 labos ou cinq DDS et que
l'API OMI est géniale, si vous voulez créer des chansons, je pense que dio
est actuellement le meilleur outil fonctionne également plus tôt et éventuellement 11
laboratoires dans le futur. En outre, vous pouvez également utiliser l' open source
WiSPR
pour les transcriptions Installez simplement Binochio
et vous pourrez faire des transcriptions très
facilement et gratuitement Donc, en gros, vous
avez beaucoup appris, et je tiens à vous dire
encore une fois ce qu'est l'apprentissage. L'apprentissage se fait dans les mêmes circonstances,
mais avec un comportement différent. Peut-être ne saviez-vous pas que l'
IA peut faire tant de choses. Pour le moment, tu le sais, donc
tu devrais absolument le faire. C'est le plus
important. N'utilisez les outils d'IA que
si vous les avez appris. Et je tiens à vous dire ce que font
vraiment les bons apprenants. Ils apprennent ensemble
parce qu'un plus grand nombre de personnes savent
toujours plus que d'autres. Donc, si vous pouviez
partager ce cours, cela
signifierait vraiment beaucoup pour moi. Peut-être que cela signifie aussi le
mot pour l'autre personne, et si l'autre personne obtient de
la valeur dans ce cours, elle vous la décrira parce que
vous le lui avez dit. Merci pour cela, et
je vous reverrai, bien entendu
, dans ce cours
ou dans un autre. Et une dernière fois, merci
du fond du cœur car vous m'avez donné votre bien le plus
précieux, votre temps. Tout le monde sur cette terre
n'a que peu de temps et tu as décidé de passer
ton temps avec moi. Merci donc pour
cela, et vous avez appris l'IA le plus rapidement possible.