Transcription
1. Introduction: La formation de votre propre modèle est lente, coûteuse et excessive
pour la plupart des projets Le vrai problème est de
savoir par où commencer, comment obtenir des résultats fiables sans perdre de temps ni d'argent. Bonjour, je suis Alvin,
chercheur dans une grande entreprise technologique J'ai enseigné à plus de 60 000
étudiants sur Skillshare et j'ai obtenu mon doctorat en
IA à l'université de Berkeley Dans ce cours, je vais vous donner un
manuel simple et reproductible pour créer
un ChaChipt
personnalisé pour votre un ChaChipt
personnalisé Nous allons procéder en trois étapes. Étape numéro un, définissez le
périmètre de votre projet. Déterminez comment utiliser l'IA le plus efficacement possible
pour votre cas d'utilisation. Deuxième étape,
évaluer les modèles. Je vais vous montrer comment
naviguer parmi les nombreux modèles propriétaires et
open source Étape numéro trois,
affinez la qualité. Assurez-vous que le modèle renvoie exactement ce dont vous avez besoin à
chaque fois. À la fin de ce
cours, vous aurez un processus en trois étapes à
utiliser pour toute idée basée sur l'IA. Ce cours
suppose que vous avez suivi mon cours sur l'IA pour débutants, fonctionnement de Chat Tippit Mais au-delà de cela, aucune
formation technique n'est requise. Tout ce dont vous avez besoin, c'est d'un ordinateur portable , d'
Internet et d'une
heure. Commençons.
2. Projet de portée : Texte en texte: Bienvenue dans l'IA pour débutants. Construisez un Chachi
BT personnalisé en trois étapes. Avant de commencer,
examinons un peu la terminologie. Je vais simplifier considérablement ces définitions pour
transmettre l'idée principale LLM ou modèle de langage large est un modèle qui génère du texte Vous lui donnez Tex en entrée, et le LLM produit une sortie
Texas L'IA ou intelligence artificielle est généralement un produit
qui utilise un LLM HHIBT est spécifiquement le produit d'IA d'
Open AI. Donc, l'IA contre le CIBT, c'est comme
les mouchoirs contre le Kleenex. Les mouchoirs sont le produit général, et Kleenex est un nom de produit
spécifique Si vous avez trouvé cela
confus, c'est bon. J'en parle plus en
détail dans AI for beginners, comment fonctionne HachBT, que
vous pouvez trouver sur ce lien Puisque vous êtes déjà inscrit, vous bénéficierez de ce cours
sans frais supplémentaires. Je recommande également vivement d'utiliser mes outils d'IA pour débutants
pour apprendre l'apprentissage automatique, où je discute d'un cadre
pour intégrer l'IA et le ML. Vous pouvez trouver ce
cours sur ce lien. Il n'est pas nécessaire de
noter ces liens, car vous trouverez tous les liens
de cette leçon à cette adresse URL. Construisons maintenant votre
Chachi BT personnalisé en trois étapes. Ces étapes sont à la portée de
tous, même si vous êtes un professionnel, même si vous avez
un budget énorme. Toute personne qui crée une IA personnalisée
doit suivre ces trois étapes. Première étape : définissez le périmètre de votre projet, déterminez ce que fera votre IA et comment vous évaluerez
ses capacités. Deuxième étape, évaluez les modèles. Il existe des directives sur
les types
de modèles à utiliser et à quel moment. Troisième étape, affinez la qualité. Aucune formation n'est nécessaire, et nous allons vous montrer deux
méthodes pour améliorer la qualité. Commençons maintenant par la première étape, qui
consiste à définir le périmètre de votre projet. La première étape consiste à
vous concentrer uniquement sur les tâches
de texte par texte. Cela signifie que vous donnez
l'AI Tex en entrée et que vous obtenez du texte en sortie.
Laissez-moi vous expliquer pourquoi. d'abord, par expérience,
nous savons que IA peut assimiler bien
plus que du texte. Nous pouvons fournir des images AI, des PDF, des sites Web,
des vidéos, etc. Il peut également produire
plus que du texte. L'IA peut produire des images, du code ,
des graphiques, du son et
bien plus encore. Il s'agit de nombreux médias différents. Cependant, souvenez-vous de
ce que nous avons dit tout à l'heure. L'IA est un produit
qui utilise un LLM, et un LLM est un
modèle qui prend en entrées
du Texas et génère du
texte en sortie Revenons donc à notre schéma.
Zoomons. Le produit AI et
examinez le LLM sous-jacent. Notez que le LLM
ne prend en compte que du texte. Toutes les autres entrées sont d'abord
converties en texte. Sachant cela, le cas
idéal est de donner directement
du texte à l'IA et d'ignorer complètement ce
processus de conversion. C'est parce que le texte transmet le plus
d'informations par mot. Laissez-moi vous expliquer par un exemple. Supposons qu'il existe une page Web contenant les résultats d'un match de football
récent. Combien de mots contient cette page ? IC un, deux, trois, quatre, cinq, six, 789, dix, 11, 12 Donc un total de 12 mots. Je pourrais donner
ce texte directement à l'IA, 12 mots seulement, ou je pourrais prendre une capture d'écran de cette page Web et donner
cette image à l'IA. L'IA
traduirait ensuite cette image en un nombre impressionnant de 2030 mots visuels Cela représente plus de 170 fois plus de mots pour la même quantité
d'informations. En conclusion, Tex
est plus efficace pour communiquer des informations
que des images de texte. Par conséquent, pour
simplifier votre projet,
limitez-vous aux tâches de texte
et de TextOut Voici un autre exemple. Vous souhaitez donc demander à HattBT
des commentaires sur vos diapositives. Plusieurs options s'offrent à vous
pour les formats de téléchargement. ne téléchargez pas le
diaporama au format PDF Cependant, ne téléchargez pas le
diaporama au format PDF et
ne le téléchargez certainement pas sous forme d'images. Téléchargez plutôt les diapositives
au format texte brut. Ce format de texte brut contient
uniquement le texte brut
de toutes mes diapositives,
sans mise en forme supplémentaire ni informations
inutiles. Je peux maintenant télécharger ce fichier et demander à HattPT de fournir des
commentaires sur mes diapositives Heureusement, mes diapositives sont
uniquement fournies sous forme de texte brut, ce qui permet un traitement efficace du
chat TPT En bref, si vous souhaitez introduire un
fichier dans HachBT,
exportez-le au format
texte brut dans la mesure du possible Prenons un autre exemple. Supposons que je veuille interroger HattBT à propos d'un article de blog que je lis Ne faites pas de capture d'écran de la page Web. Au lieu de cela, fournissez directement
à HattBT l'URL de la page Web, et vous constaterez que
HTHBT
accèdera réellement à cette page Web pour nous, en
résumant ce Nous pouvons vérifier que le protocole HTTP accède à la bonne URL
en cliquant sur les sources Et sur le
côté droit, nous verrons la page Web d'origine
répertoriée sous forme de citation. Cela signifie que HatchBT
a pu accéder au texte brut
de la
page Web et, comme auparavant,
ingérer des informations
efficacement, ingérer des informations
efficacement En bref, donnez
directement les URL des pages Web afin que HachPT puisse accéder à la page Web et extraire son contenu sous forme de
texte brut par lui-même Pour résumer cette
leçon en un seul point à retenir, concentrez-vous sur les tâches de texte à texte Cela signifie que nous devons
fournir des données en texte brut dans possible
pour notre projet. Ainsi s'achève la première sous-étape
de la première étape Nous avons réduit la portée de notre projet en nous
concentrant sur les tâches de synthèse texte Dans la leçon suivante,
nous parlerons certaines tâches texte-texte pour
lesquelles l'IA est la mieux adaptée. Et si vous souhaitez
obtenir une copie de ces diapositives et consulter
des ressources supplémentaires, vous pouvez accéder à cette URL.
3. Portée du projet : capacités: Dans cette leçon, nous allons continuer à discuter de la manière de définir le
périmètre de votre projet. Maintenant, pour récapituler, nous
en sommes à la première étape d'
un processus en trois étapes Mon objectif dans cette première
étape est de
vous aider à réduire la portée de votre
projet. Dans la
leçon précédente, nous avons concentré votre attention sur les tâches de synthèse
texte Dans cette leçon, je vais vous concentrer
davantage des fonctionnalités spécifiques de texte
à texte. Tout d'abord, nous nous concentrons sur la création d'une IA
personnalisée fiable et précise pour la production. Nous pouvons donc nous
demander : que peut
faire l'IA de manière
suffisamment fiable et précise pour la production ? Il existe de nombreuses tâches de ce type, mais je ne me concentrerai que
sur trois d'entre elles. Notre première catégorie
est celle des résumés. Par exemple, Amazon utilise l'IA pour
résumer les avis sur les produits
dans une section réservée aux clients. Slack utilise l'IA pour
résumer les chaînes, et Noon utilise l'IA pour résumer les réunions
Zoom pour vous Il existe de nombreux exemples
commerciaux de simple résumé. Maintenant, essayons-le nous-mêmes. Imaginons que vous gérez une boulangerie
avec des centaines d'avis. Vous aimeriez tirer parti de
ces avis pour aider
votre boulangerie à se développer. Dans votre navigateur,
rendez-vous sur chattbt.com. Vous verrez une page comme celle-ci. Collons quelques
critiques et demandons à HatchiBT de résumer
ces Voici notre résumé. HatTibt affirme que les opinions sur le
croissant aux amandes sont partagées, ce qui semble être une évaluation
juste Vous pouvez consulter vous-même les
avis sur cette URL pour déterminer si vous êtes d'accord
ou non. Bref, l'IA est plutôt
douée pour résumer. L'IA est également prête à être utilisée en production
pour structurer les données. structuration des données est une
façon sophistiquée de dire que l'IA peut traduire des globes de texte en tableaux de données
bien organisés Et à première vue,
ça a l'air cool. Mais permettez-moi de souligner que cool
est un euphémisme. Être capable de prendre des données
non structurées et d'extraire des données structurées
propres est en fait une superpuissance de l'IA extrêmement
utile Laissez-moi vous expliquer par un exemple. Retournons à notre boulangerie. D'après nos 671 avis, nous aimerions savoir
ce que nos clients pensent de nos produits de boulangerie Par exemple, les clients ont-ils
aimé le croissant aux amandes ? En fait, demandons-nous d'abord quels clients ont même essayé
le croissant aux amandes ? Idéalement, nous aurions un tableau
de données
bien organisé comme celui-ci, une liste de vrais pour
ceux qui l'ont
aimé et de faux pour
ceux qui ne l'ont pas aimé, nous n'avons pas un tel tableau. Nous avons des tonnes et des tonnes
de critiques comme celle-ci. Nous devons maintenant parcourir
et lire chaque critique, puis déterminer quelles critiques mentionnaient
même les croissants
aux amandes. Il existe de nombreuses façons de
mentionner les croissants aux amandes. La critique pourrait dire croissant
aux amandes avec pâte aux amandes ou aux amandes. Alors vous pourriez dire,
cherchons simplement le mot amande. Mais cela inclurait également
d'autres croissants, car la boulangerie vend également des croissants
au chocolat et aux amandes et aux
myrtilles et aux amandes Bref, il est difficile de détecter les mentions de
croissants aux amandes,
et c'est parce que le
texte non structuré est très flexible Heureusement, l'IA
est parfaite pour cela. Laissez-moi vous montrer que vous allez sur
chattbt.com. Accédez à cette URL pour
copier l'invite. Collez ensuite l'invite ici. Le message donne à
ChachiBt une liste de critiques de boulangeries et
lui demande d'identifier les amateurs de croissants Alman Appuyez sur Exécuter, et vous obtenez un
joli tableau des résultats. Au lieu de lire
les avis, nous pouvons facilement voir quels clients ont essayé le Croissant
Amend. Il existe trois critiques de ce type, et
deux d'entre eux l'ont aimé Par conséquent, nous concluons que 67 % des clients qui ont essayé
l'Amen Croissant l'ont apprécié. Cela nous permet d'
analyser facilement de grandes quantités
de texte de cette façon,
tout cela parce que l'IA peut convertir du texte
non structuré en formats
structurés Vous devriez maintenant être en mesure de
voir à quel point les données
structurantes sont précieuses C'est un super pouvoir d'analyse
des données. La troisième tâche pour laquelle l'
IA est
prête à être produite est le codage
et les petites étapes. Il existe de nombreuses
réussites dans ce domaine. Cursor améliore la productivité des
développeurs en proposant un éditeur de code
basé sur l'IA
, capable d'écrire et d'
exécuter du code pour vous. Lovable permet
à quiconque de générer des applications à partir de zéro
sans écrire de code lui-même. Cependant, pour votre premier projet, ne demandez pas à l'IA de créer des bases de code
complètes. Traitez l'IA comme un ingénieur junior, des tâches
simples et
des étapes individuelles. L'IA est très douée pour générer des
extraits de code de démarrage, détecter et
corriger de petits bogues et pour ajouter une fonctionnalité
qui
n'implique que quelques fichiers.
Voyons cela en action. Accédez à chattbt.com. Demandons à HattBT de
tracer un graphique circulaire des overs d' Alman Croissant en utilisant
les données précédentes Comme demandé, ChachiBT commence à
écrire et à écrire du code, ce qui nous donne maintenant un diagramme circulaire ChachiBT nous donne également
le code de l'intrigue, que nous pourrions exécuter nous-mêmes Bref, l'IA est très capable d'écrire du
code par petites étapes. En résumé, l'IA est
prête pour la production pour la synthèse, la structuration des données et le codage La synthèse est
intégrée aux produits Amazon, Slack et La structuration des
informations d'entreprise dans un format consultable est dominée
par Glean Le codage est dominé par
le curseur et adorable. Bien entendu, l'IA peut être appliquée de
nombreuses autres manières. Mais ici, nous nous concentrons sur les capacités qui ont déjà
connu un succès commercial. Vous avez maintenant découvert les fonctionnalités
que
Tipts de chat personnalisé peut offrir avec une qualité
de production Nous avons maintenant discuté de plusieurs capacités d'
IA qui ont déjà été éprouvées
commercialement et à plusieurs reprises.
Il est donc raisonnable de
s'appuyer sur ces
capacités pour notre
premier projet. Vous pouvez accéder à cette URL pour
toutes les instructions que j'ai utilisées, liées aux exemples complets
de conversations
et à d'autres ressources
4. Projet de portée : tâche et métrique: Au cours de la dernière leçon, nous avons examiné les capacités générales dans
lesquelles l'IA est la meilleure. À présent, traduisons
les capacités générales en un projet spécifique. Pour la première partie, nous nous sommes concentrés sur le texte
général de la tâche de texte Dans la dernière leçon, nous nous concentrons
davantage sur trois fonctionnalités
spécifiques, à savoir la
synthèse, la structuration
des données et le codage Dans cette leçon, nous allons
enfin définir votre projet. Pour votre projet, vous
devez d'abord définir la tâche. Qu'est-ce que l'IA va faire pour vous ? Définissez ensuite ce que le LLM
prendra en entrée. Sera-t-il pris en compte les critiques, les courriels, essais et, enfin, définira-t-il le texte que le LLM
produira en sortie ? Produira-t-il des résumés, des
tableaux, des puces ? Voyons un exemple. R Je
cherche un endroit où manger. café Yummy a une faible note, et je veux savoir pourquoi Ma première réaction est de demander à l'
IA de résumer mes avis. Remplissons le modèle de
projet. Notre tâche consiste à
résumer les avis. Nos contributions seront des évaluations, et notre sortie
sera un résumé. Cela ne semble pas être
une définition utile. Soyons donc plus précis. Sur la
page Web du restaurant, je fais
défiler les avis avec des notes
très faibles. Une personne a confondu cet endroit avec son restaurant jumeau. Quelqu'un d'autre
s'est plaint de l' ordre dans lequel les plats
étaient servis, et le dernier commentaire n'a pas apprécié l'attitude
du personnel de service. Ce sont toutes des préoccupations valables, mais personnellement, je ne m'
intéresse qu'à la nourriture. Je veux donc
filtrer les critiques non alimentaires. Sachant que c'est mon
objectif,
traduisons-le maintenant en
un projet concret. Vers notre modèle. J'aimerais détecter les critiques non alimentaires. L'entrée est une critique de
restaurant, et la sortie est vraie ou fausse. Si l'
évaluation déduit ou non des étoiles pour des raisons
non alimentaires. Maintenant,
nous sommes en affaires. C'est à ce point que doit être précise la définition de votre
projet. Cependant, nous avons un autre
élément, la métrique. À un niveau élevé,
la métrique
vous indique si les résultats de l'IA sont bons. Pour commencer, votre premier
indicateur sera est-ce que je trouve les résultats de l'IA raisonnables ? Évaluez
d'abord à la main. Voici une critique qui se
plaint de l'ordre dans lequel les plats
ont été servis Nous demandons à l'IA si
cette évaluation permet de déduire des étoiles
pour des raisons non alimentaires L'IA fait une prédiction. Oui Maintenant, est-ce que je trouve raisonnable ? Je le sais. L'évaluation déduit des étoiles pour le
service, pas pour la nourriture L'IA passe cette première vérification. Voici une autre critique
qui se
plaint de la fraîcheur du poisson Nous demandons à l'IA si
cette évaluation permet de déduire des étoiles
pour des raisons non alimentaires L'IA fait une prédiction. Non Est-ce que je ne trouve rien de raisonnable ? Je le sais. Cette critique a déduit des étoiles précisément
pour des raisons alimentaires L'IA passe cette deuxième vérification. Voici une critique qui montre une confusion quant
au nom du restaurant. Nous demandons à l'IA cette évaluation
déduit-elle des
étoiles pour des raisons non alimentaires ? L'IA fait une prédiction. Non Est-ce que je ne trouve rien de raisonnable ? Cette fois, je ne le sais pas. La critique a déduit des étoiles pour le
nom du restaurant, et non pour la nourriture L'IA échoue à cette troisième vérification. Voici le tableau de bord de l'IA. Nous trouvons les résultats raisonnables
deux fois sur trois. En conclusion, votre première évaluation est que les résultats de l'IA sont
généralement raisonnables. Cependant, les meilleurs indicateurs
quantifieront la qualité. Soyons donc plus précis. Pour en revenir à notre tableau de bord, nous avons trouvé l'IA correcte deux
fois sur trois Nous disons donc que l'IA a
atteint une précision de 67 %. Votre indicateur est désormais
le pourcentage d' avis que l'IA
classe correctement. Plus succinctement,
notre indicateur est précision
du modèle sur les avis que nous avons qualifiés de vrais ou
de C'est vrai de la critique, des
étoiles déductives pour des raisons non alimentaires. Nous pouvons maintenant prendre n'importe quelle IA et calculer sa
précision pour notre tâche. Voici maintenant notre définition de
projet idiot. Nous avons ajouté la précision
métrique qui permet à l'IA de
prédire le vrai ou le faux, par rapport à vos propres étiquettes
sur les avis des restaurants Prenons un autre exemple. Supposons que vous organisiez
un hackathon
et que, après la fermeture du
portail de soumission en ligne à la date limite, des dizaines de personnes vous envoient des inscriptions
tardives par e-mail Votre objectif général est d'
organiser les inscriptions tardives
envoyées par e-mail. Plus concrètement, votre tâche consiste
à détecter si un e-mail
est une entrée dans le Hackathon L'entrée est un e-mail. Le résultat, que
l'e-mail soit ou non une soumission au
Hackathon La métrique est également la précision, nombre d'e-mails correctement classés comme entrées ou non. Maintenant, grâce à l'IA, nous pouvons générer
une table de données et le tour est joué. Il est désormais beaucoup
plus facile de
déterminer les soumissions tardives
à accepter à grande échelle sans avoir à lire les 100 e-mails pour trouver les inscriptions
au Hackathon En résumé, définissez la
tâche, l'entrée de votre IA, la sortie de votre
IA et la métrique qui détermine la qualité des sorties de
votre modèle. Cela met fin à cette leçon. Dans cette leçon, nous avons finalement défini votre projet
après l'avoir défini, ce qui
conclut également la première
des trois étapes Vous avez maintenant défini la portée de votre projet et nous sommes prêts à le
démarrer Vous pouvez accéder à la CRL pour obtenir une copie de ces diapositives
et des ressources supplémentaires
5. Évaluez les modèles : Tester le meilleur: Bon retour. Dans les leçons
précédentes, nous nous sommes concentrés sur
les tâches de synthèse texte Ensuite, des capacités spécifiques,
puis définissez la métrique de tâche. Cela a permis de terminer notre première
tâche, à savoir définir le cadre du projet. un deuxième temps, nous évaluerons les modèles afin de choisir le meilleur modèle
pour notre cas d'utilisation. Pour choisir un modèle, vous allez évaluer capacité de
plusieurs modèles à accomplir votre tâche. Nous allons commencer par les meilleures options, car nous voulons savoir. N'importe quelle IA peut-elle même
accomplir notre tâche ? Si la meilleure IA ne peut pas
résoudre votre tâche, IA moins intelligentes ne le feront
certainement pas non plus. Commencez donc par l'IA la
plus intelligente. Selon le site Web d'Open EI, si vous optez pour un forfait
gratuit ou un forfait plus, la pensée selon le
PIB Five est votre modèle
le plus intelligent Si vous êtes abonné au forfait Pro, PIB five Pro est votre modèle
le plus intelligent Commençons nos
tests via des chatbots, une interface simple
pour un test rapide Accédez à chatbt.com. Vous verrez un écran comme celui-ci. En haut à gauche,
développez le menu déroulant. Dans cette liste déroulante, vous verrez rapidement le modèle le plus rapide mais le
moins intelligent. Penser, un modèle plus
intelligent. Utilisez-le si vous utilisez
le forfait gratuit ou plus. Et enfin, P, le modèle le
plus intelligent. Utilisez-le si vous êtes
abonné au forfait Pro. J'utiliserai la méthode de pensée GPT 5 pour que tout le monde puisse
reproduire mes résultats Nous avons maintenant sélectionné un LLM. Alors, que devons-nous demander à Chat GBT ? Utilisons le projet
de la dernière leçon. Rappelez-vous que notre objectif est de
filtrer les critiques non alimentaires. Les entrées sont des critiques de
restaurants, et les résultats
sont vrais ou faux, vrais si les étoiles sont déduites
pour des raisons autres que alimentaires Donc, pour notre rapidité, d'accord, compte tenu des
critiques de restaurants, le résultat est vrai si un avis déduit des étoiles
pour des raisons non alimentaires Ensuite, j'inclus trois critiques. Le premier critique
se plaint du service, second se plaint de la saveur et le troisième aime la nourriture, mais trouve que le service était lent Nous nous attendons à ce que l'IA redevienne alors vraie parce que le premier avis
déduit des étoiles pour le service, faux, parce que le second
avis déduit que l'étoile est précisément pour la nourriture et Le dernier avis ne
déduit aucune étoile. Essayons cette invite maintenant. Tout d'abord, accédez à cette UOL
et copiez l'invite. Retournez ensuite sur chattbt.com. Collez l'invite. Appuyez sur Run. ChattBTTS pendant quelques secondes, puis lui donne une réponse, qui est correcte,
vraie, fausse, fausse Par conséquent, nous concluons que IA peut accomplir correctement notre
tâche. Plus précisément, GPT five
complète notre tâche. Tester le chatbot ne
suffit pas car les chatbots ne
sont pas Cela signifie qu'ils ne renvoient pas
les mêmes résultats à chaque fois. Par exemple, demandons à
HathBT de raconter une blague sur papa. Chat TBT fait une blague
sur les épouvantails. Faisons-le encore une fois, exactement à
la même invite. HatchiBt fait une blague
sur l'alphabet. Fais-le encore une fois. Discutez des blagues sur
le TBT sur les squelettes Ainsi, la même invite a donné des
réponses différentes à chaque fois. Cela montre notre point précédent
selon lequel les chatbots
ne sont pas déterministes Par conséquent, nous devons passer du test du chatbot au test
de l'API Par défaut, l'API est beaucoup
moins aléatoire injectée. Donc, si l'IA termine
la tâche une fois, nous pouvons être sûrs qu'elle l'
exécutera à plusieurs reprises. Accédez à la plateforme dotopen.com. Votre page Web
ressemblera à ceci. Assurez-vous de cliquer sur Se connecter en haut à droite
si ce n'est pas déjà fait. Cliquez ensuite sur le tableau de bord
en haut à droite. Notre page
ressemblera désormais à ceci. Cliquez sur Créer au
centre de la page. Votre écran devrait
maintenant ressembler à ceci. En bas à droite,
cliquez sur Effacer automatiquement. Cela garantit que chaque
fois que nous appuyons sur Soumettre, nous imitons le même comportement que l'
envoi d'appels d'API distincts Maintenant, demandez une blague à votre père, mais avant d'appuyer sur Entrée, notez que cet exemple spécifique peut coûter jusqu'à deux
dixièmes de cent Une fois que vous avez cliqué sur Run, JTBT fait
une blague sur l'alphabet. Demandons à nouveau une blague à papa. Assurez-vous que l'option Auto Clear
en bas à droite est sélectionnée et soumettez. JTBT fait exactement la
même blague à propos l'alphabet avec un léger changement de
ponctuation Et nous essayons encore une fois d'obtenir
exactement la même blague alphabétique. Les résultats sont
presque tous identiques. C'est bien mieux
que le chatbot, qui renvoie des réponses complètement
différentes à chaque fois. Nous pouvons donc en conclure que les appels d'
API sont principalement
déterministes, certainement bien plus
que le Réessayons donc notre exemple d'invite de
projet via l'API. N'oubliez pas que c'est
notre message d'avant. Nous nous attendons à ce que l'IA renvoie le
vrai, le faux et le faux. Accédez à cette URL pour copier à nouveau l'invite d'
exemple de projet. Puis de retour sur la plateforme
openai.com , collez
cette invite Avant de cliquer sur Exécuter, notez que cet exemple coûtera
quatre dixièmes de cent L'API PIB five renvoie d' abord
des jetons de réflexion pendant quelques secondes. Puis renvoie enfin la réponse finale
correcte, vrai, faux, faux. Essayons encore une fois. Et encore une fois, PIB 5 renvoie la bonne réponse,
vrai, faux, faux Et encore une fois. Et encore une fois, la bonne réponse,
vraie, fausse, fausse. Donc, comme auparavant, le PIB 5 complète
correctement notre tâche. Plus important encore, GPT
five le fait à plusieurs reprises. C'est une grande victoire. Cela signifie que notre projet
peut désormais
effectuer notre tâche à plusieurs reprises à l'aide de l'API de PIB five En résumé, testez d'abord l'IA la meilleure et
la plus intelligente. D'abord via des chatbots
pour plus de simplicité, puis via l'API pour la
reproductibilité, et c'est la fin de nos
tests via l' En général, nous avons
fini de tester la meilleure IA. Et dans la prochaine leçon,
nous optimiserons les coûts en testant des modèles plus rapides et
moins chers. Au cas où vous vous demanderiez
comment j'ai calculé le coût d'un appel d'API, je vais vous l'expliquer et inclure plus de ressources sur le site Web du
cours à cette URL.
6. Évaluer les modèles : Optimiser les coûts: Bon retour. En résumé, vous êtes à l'étape deux sur trois Mais jusqu'à présent, vous n'avez
testé que la meilleure IA. Nous avons testé la meilleure IA par chat, puis nous l'avons testée via une API. Il est maintenant temps d'
optimiser les coûts et de trouver le modèle le moins cher
qui puisse encore accomplir notre tâche à plusieurs reprises. Souvenez-vous d'avant que
PIB Five avait terminé notre exemple de tâche de projet
avec succès et à plusieurs reprises, et que cela coûtait environ
quatre dixièmes de cent J'inclurai tous les calculs de
coûts sur le site Web de notre cours
si cela vous intéresse. Voici le
coût du PIB 5 pour notre exemple, ainsi que ses coûts par jeton, selon la page de tarification des
API d'OpenAI Essayons le prochain modèle le
moins cher de notre liste, le GPT five Mini votre sélecteur de modèle, sélectionnez PIB five Mini Votre écran devrait
maintenant ressembler au mien. Collez l'invite de
projet d'exemple, et PIB five Mini répond
vrai faux faux, complétant ainsi
correctement la tâche Regardons le
coût. Cet exemple a coûté 700 centimes Et une fois
que nous l'avons ajouté à notre tableau, nous pouvons constater que nous avons
réduit le coût de réalisation de notre
tâche de cinq fois. Nous allons maintenant tester notre
modèle le moins cher, le GPT five Nano. Dans le sélecteur de modèle, sélectionnez GPT five Nano Votre écran devrait
maintenant ressembler au mien. Collez l'
invite du projet d'exemple, et une fois de plus, nous obtenons true false, la bonne réponse.
Regardez à nouveau le coût. Le coût de notre exemple est maintenant trois centièmes de Et dans notre tableau, nous pouvons
voir que nous avons maintenant réduit de deux fois
le coût de réalisation de notre
tâche. Mais réduisons encore les
coûts. Jusqu'à présent, nous avons maintenu notre raisonnement
au niveau moyen par défaut. Nous voulons maintenant limiter le raisonnement
au minimum. Laissez-moi vous montrer comment procéder. De retour sur cette page Web, à
côté du nom du modèle, cliquez sur l'icône des paramètres. Dans le menu, sélectionnez l'effort de
raisonnement. Cela vous donnera
une autre liste déroulante. Sélectionnez minimal, qui
ressemblera alors à ceci. Cliquez en dehors de la fenêtre contextuelle. Collez ensuite l'invite de votre
exemple de projet. Et assez fou, GPT
five Nana répond toujours, sans raisonnement,
vrai faux faux, complétant ainsi parfaitement la tâche.
Regardez le coût maintenant. Le coût de notre exemple
est maintenant de 4 000e de cent, qui nous donne ce
tableau final des résultats Nous réduisons encore
les coûts de sept fois. C'est une réduction incroyable des coûts. Compte tenu de ces résultats, nous déclarons que GPT five Nano est notre gagnant sans pour autant donner de
raison Maintenant, les
trois parties de la deuxième étape testez via un chatbot,
testez via l'API
et, enfin, trouvez le
modèle le moins cher qui fonctionne toujours Cela a produit le modèle
Open EI le moins cher qui pourrait résoudre
avec succès notre
tâche GPT five Nano En résumé, testez d'abord l'IA la meilleure et
la plus intelligente. D'abord via des chatbots
pour plus de simplicité, puis via l'API pour la
reproductibilité, puis testez de manière itérative une IA plus rapide et
moins coûteuse Nous avons désormais optimisé les
coûts avec succès, les
réduisant de plus de 88 fois, et c'est tout pour
évaluer les modèles. Cela conclut principalement la deuxième étape. Nous en avons fini avec les modèles
propriétaires, mais nous devons maintenant
répéter ce processus pour une autre vaste catégorie de modèles open source d'
options. Comme d'habitude, vous pouvez trouver
tous les calculs, les instructions et d'autres
ressources sur cette URL
7. Évaluer les modèles : Open-Source: Explorons une autre catégorie de modèles, les modèles open source. Nous en sommes actuellement à la
deuxième des trois étapes où nous évaluons les modèles afin de
déterminer lequel utiliser. Heureusement, il existe un hub
standardisé pour tous les modèles open source
sur huggingface.co Visitez cette URL et vous verrez une tonne d'
options. C'est bouleversant. Voici cependant quelques
heuristiques pour naviguer dans ce vaste
référentiel de modèles Règle numéro un, utilisez des modèles adaptés aux
instructions. Habituellement, les modèles
dotés d'instructions ont une instruction dans
le nom quelque part La raison de cette règle est que les LLM sont formés
en trois étapes Dans la première étape
appelée pré-formation, LLM prédisent simplement
le mot suivant Au cours de la deuxième étape, appelée SFT
ou réglage fin supervisé, les modèles apprennent à
répondre aux questions Au cours de la dernière étape, appelée apprentissage par
renforcement avec rétroaction
humaine ou RLHF, modèles apprennent à aligner les réponses
sur les préférences humaines, en étant utiles,
honnêtes et inoffensifs Techniquement parlant,
seule la deuxième étape est appelée réglage des instructions, mais dans la pratique, les modèles
open source adaptés aux
instructions sont passés
à la fois par le SFT et le RLHF Dans tous les cas, vous ne voulez pas d'un modèle uniquement soumis
à un entraînement préalable car ces modèles répondent automatiquement aux questions, et
non aux questions. Donc, en résumé, règle numéro un, utilisez des modèles adaptés aux instructions. Pour la règle numéro deux,
utilisez de petits modèles. s'agit évidemment pas
d'une règle absolue, mais je la recommande vivement. Maintenant, disons que tu m'ignores. Et si vous vouliez utiliser des modèles open source
massifs, les plus grands et les meilleurs ? Eh bien, voyons quel modèle open
source est le meilleur. Voici l'arène des chatbots. Les modèles Gemini Open AI et Grock
Four sont tous propriétaires. Le modèle open
source le mieux classé est donc Kimik. Allons sur le site de Kimi K. Selon cette page Web, Kimi K représente 1 billion de paramètres Donc, en réalité, nous aurions besoin 16 GPU H 100 pour exécuter ce modèle Tout d'abord, c'est cher. 16 GPU H 100 coûtent 64$
pour seulement 1 heure d'utilisation. Ensuite, il est compliqué de faire des inférences pour
un modèle de cette taille Tout cela pour dire que si vous souhaitez utiliser des modèles
open source de pointe, vous devez utiliser des API
proposant des modèles open source car leurs prix
bénéficient d'économies d'échelle. Il est moins coûteux pour vous
d'appeler une API que d'exécuter vous-même
ces énormes modèles. Pour plus de détails, vous pouvez
consulter ce billet de blog, que je publierai sur le site Web de
notre cours. Pour utiliser des modèles
open source de pointe, suivons les trois
mêmes sous-étapes Testez via un chatbot, testez via une
API et optimisez les coûts. À partir de la première sous-étape, testons via un chatbot Accédez à gpthss.com. N'oubliez pas que c'était
notre message d'avant. Nous nous attendons à ce que l'IA renvoie le
vrai, le faux et le faux. Accédez d'abord à cette URL
et copiez l'invite. Vous verrez alors une page
Web comme celle-ci. J'ai choisi de continuer
avec un raisonnement visible, mais vous pouvez choisir l'une ou l'autre option. Aucune des deux options ne modifie la
qualité des réponses de l'IA. Collez votre invite et appuyez sur Exécuter. Vous verrez alors vrai faux
faux, la bonne réponse. Dans la barre de gauche, cliquez
maintenant sur GBTOSS 20 milliards, le plus petit des deux modèles open
source d'Open AI Ensuite, en haut à droite, cliquez sur Nouveau chat. Votre écran ressemblera
alors à ceci, collez à
nouveau l'invite et appuyez sur Exécuter. Encore une fois, vous verrez « vrai », « faux », « faux », la bonne réponse. Nous avons constaté que le meilleur
de l'
IA open source pouvait accomplir notre tâche. Maintenant, retestons via l'API. Sur huggingface.co, de nombreux modèles open source
ont une section en bas à droite où
vous pouvez envoyer des messages
uniques au LLM pour le
tester Ce n'est pas non plus
gratuit techniquement, mais vous pouvez envoyer des demandes sans ajouter d'informations
de facturation. Collez votre message et
Deep Seek R One passe. Il produit un vrai faux faux. Cela signifie que l'IA open source, comme Deepsk, peut également
résoudre notre problème. Deepsek R one aurait coûté
un tiers de cent pour
exécuter cet exemple Comme précédemment,
trouvons maintenant le modèle le moins cher
capable de mener à bien notre tâche. Essayons le prochain modèle le
moins cher. Deep Seek R One Lama 7 milliards. Ce modèle obtient également la
bonne réponse , le vrai faux faux. Deep Seek Lama
lui a coûté un sixième de cent, nous avons
donc réduit
notre coût de moitié. Essayons maintenant le troisième Deep Seek V le
moins cher. Techniquement, Deep Seek V Three a répondu « vrai,
faux », « faux » correctement. Il l'a simplement fait avec
beaucoup de texte supplémentaire. Malheureusement, si Deep Seek produit des
formats différents à chaque fois, code de
notre projet ne
sera pas en mesure d'
analyser la sortie LLM Heureusement, nous avons un
moyen de résoudre ce problème, que je vous montrerai plus tard. Mais pour l'instant, Deep Seek
V Three ne passe pas. Il a l'intelligence
mais pas le formatage. Essayons le deuxième moins cher de notre liste, Lama 370 milliards. Hugging Face
continue malheureusement de me donner des erreurs. J'ai donc trouvé un
autre site Web au hasard. Je ne suis pas nécessairement d'accord,
mais n'importe quel site Web fera l'affaire. Et il semblerait que 370
milliards répondent correctement en faisant de
vraies fausses chutes. Lama passe donc 370 milliards. Essayons le prochain modèle le
moins cher de notre liste. Deep cherche Quin. plus petit modèle
distillé de Deep Seek RO ne fait que cracher une chaîne infiniment
longue Il s'agit donc d'un échec cuisant. Quin a échoué de
façon catastrophique, comme nous l'avons vu. Cela dit, nous avons maintenant terminé notre tableau des résultats. Nous pouvons réinscrire tous les
prix et les centimes, puis comparer les prix de l'Open
AI avec ceux de l'open source pour comparer
l'intelligence par dollar. Voici les gagnants
de chaque catégorie. Notez la différence de coût. Certes, j'aurais pu tester modèles open source
plus petits,
moins chers que 70 milliards mais
plus performants que Quinn, mais tous plus petits, et ils
peuvent faire fonctionner votre propre
machine gratuitement Il ne sert
donc à rien de
tester leurs API L'API Open EI est
15 fois moins chère pour cette tâche spécifique qui consiste à détecter correctement les critiques
non alimentaires sur la
base de nos résultats précédents. En général, qu'il s'agisse de modèles de pointe ou de
pointe, les modèles propriétaires surpassent les modèles
open source en termes d'intelligence par dollar Donc, si nous envisageons l'
open source, éloignons-nous
de la pointe et restons-en à de petits modèles
open source. Ces modèles peuvent en fait être très économiques
à utiliser seuls. Donc, en résumé, je recommande d'utiliser de petits modèles open source. Au moins pour l'instant, pour les grands modèles open source de
pointe, nous avons terminé nos
trois sous-étapes Ceci complète l'évaluation pour les
grands modèles open source. Dans la leçon suivante, nous
examinerons les petits modèles open
source, suffisamment
petits pour fonctionner gratuitement. Comme d'habitude, vous pouvez
trouver tous les liens, carnets de notes et autres ressources
sur le site Web du cours
8. Démonstration : exécuter un modèle open source: Exécutons maintenant des modèles open
source gratuitement. Nous en sommes actuellement à la
deuxième des trois étapes. Nous essayons actuellement de petits modèles
open source. Pour l'instant, considérons Lama
3,28 milliards comme notre valeur par défaut. Il s'agit d'un petit modèle de langage qui devrait s'adapter à votre ordinateur portable. Bien entendu, il existe de nombreux
autres modèles open source. Mais avant d'en parler,
les prochaines diapositives feront référence
à quelques termes tels que GPU, nœud, RAM et précision. Si vous ne connaissez pas
ces termes, vous pouvez ignorer
mon explication en toute sécurité et vous
concentrer sur le point à retenir. J'inclurai également les définitions sur le
site Web du cours à cette adresse URL. Maintenant, revenons à la règle numéro deux, nous avons déjà dit
d'utiliser de petits modèles. Mais soyons plus précis
quant à ce que signifie « petit ». Par petit, j'entends les modèles à GPU
unique, qui sont bien plus simples que multi-GPU et en particulier les modèles
multi-nœuds pour l'inférence Maintenant que nous nous sommes limités aux open source à GPU
unique,
quels modèles open source
conviennent à un seul GPU ? Eh bien, cela
dépend de deux facteurs la RAM de votre GPU et la
précision de votre modèle. Je mettrai l'explication complète
sur le site Web du cours. Mais pour l'instant, nous allons
dire que les LLM avec 16 milliards de paramètres ou moins
peuvent être installés sur un seul GPU Utilisons-le pour trouver un modèle
open source à utiliser. De retour sur le site Web de Hugging face, sur le côté gauche,
filtrez par taille de modèle Nous voulons 16 milliards de paramètres
ou moins, mais 12 milliards est la valeur la
plus proche que nous puissions utiliser. Ensuite, en haut à droite,
triez les modèles par j'aime. Après les deux modifications,
vous verrez une page comme celle-ci. En ce qui concerne le
nombre de téléchargements, nous voyons un gagnant :
Lama 3,18 milliards de dollars, Instruct, qui a enregistré plus de 9
millions de téléchargements
le mois dernier .
Utilisons ce modèle. Pour nos expériences open source, nous utiliserons un modèle de 8
milliards de paramètres issu de la famille de LLM Lama C'est l'un des modèles
les plus téléchargés le mois
dernier
sur Hugging Face Et surtout, nous avons déterminé que ce modèle est
adapté aux GPU que nous utilisons Accédez à cette URL pour ouvrir le code de démarrage que
j'ai écrit pour vous. Vous devriez voir un
carnet comme celui-ci. Maintenant, en haut du fichier, cliquez sur Tout exécuter. Il
se peut qu'un message d'erreur s'affiche. Si une erreur de ce type s'affiche, vous devrez exécuter
chaque étape manuellement. Pour exécuter manuellement, déplacez le
curseur de manière à ce qu'il passe
au-dessus de la première étape Un bouton Exécuter apparaît. Cliquez sur ce bouton Exécuter. Ensuite, même si la
première étape est toujours en cours, vous pouvez immédiatement
survoler l'étape deux et cliquer sur le bouton Exécuter Ensuite, vous devriez
voir des lignes pointillées comme
celle-ci indiquant que la
deuxième étape est en file d'attente. Que vous appuyiez sur Exécuter tout
ou que vous exécutiez les premières étapes manuellement, votre ordinateur portable installe désormais les prérequis et
télécharge les poids Cela prendra de cinq
à dix minutes. Alors pendant ce temps, continuez regarder
cette vidéo. Après quelques minutes, la
première étape sera terminée. Si vous voyez une coche verte, cela signifie que la première étape s'est
terminée avec succès Au bout de quelques minutes, la deuxième
étape devrait également se terminer. Encore une fois, vous devriez voir une coche verte
indiquant le succès. Maintenant, que vous ayez
déjà exécuté l'étape 3 ou non, à
côté de l'étape 3, cliquez sur Exécuter. Après quelques secondes, nous verrons les œuvres de Lama
abordant le sens de la vie. Vous devriez maintenant voir le message. Vous devez maintenant
modifier l'invite comme vous
le souhaitez et appuyer une fois
de plus sur le bouton Exécuter. Traitez-le comme un robot de discussion
personnel. Vous pouvez demander ou dire ce que vous pourriez normalement dire à Chat GBT Par exemple, nous pouvons demander à
Lama de nous expliquer certaines mathématiques ou de
nous demander à Lama de nous
parler de notre plateforme
d'apprentissage en ligne préférée. Il s'agit en fait de votre
propre IA fonctionnant dans le cloud. Personne d'autre que vous n'utilise
ce LLM dédié. Il est maintenant temps de tester Lama
sur notre exemple de projet. Appuyez sur Exécuter dans la dernière
cellule pour tester la capacité de
Lama à identifier les critiques
non alimentaires. Mais malheureusement,
Lama se trompe disant que les première
et troisième critiques sont vraies et qu'il s'agit toutes deux de critiques
non alimentaires. En d'autres termes,
Lama prédit le vrai faux vrai au lieu
du vrai faux faux Nous allons résoudre ce problème dans
la prochaine leçon sans entraîner le
modèle. C'est ça. Nous avons maintenant lancé notre tout
premier LLM open source, et nous avons enfin terminé
la deuxième des trois étapes Comme je l'ai
déjà mentionné, notre prochaine étape
consiste à améliorer la qualité. Nous allons notamment
améliorer la capacité de ce
LLM open source à mener à bien
notre exemple de projet
9. Affiner la qualité : Entrées de l'ingénieur: Dans cette leçon, nous
allons améliorer nos capacités LLM
en modifiant nos entrées C'est ce qu'on appelle généralement
l'ingénierie rapide. Nous en sommes à la
troisième des trois étapes, et nous affinons actuellement la qualité. Il y a deux sous-étapes ici. La première consiste
à concevoir nos intrants. Si ce n'est pas déjà fait, rendez-vous sur cette URL pour ouvrir le code de démarrage que
j'ai écrit pour vous. Si votre
bloc-notes de la dernière leçon est toujours ouvert, utilisez-le. Si vous ouvrez ce
bloc-notes pour la première fois, en
haut du
fichier, cliquez sur Tout exécuter. Les deux premières étapes dureront
environ cinq à dix minutes, vous pouvez
donc continuer à regarder cette promenade
en attendant. Souvenez-vous de notre leçon précédente : 8 milliards de
lamas n'ont pas réussi
à accomplir notre tâche. Le format et la
précision des sorties étaient tous deux incorrects. Notre première approche pour résoudre
ce problème consiste à être précis. Cela semble être une astuce stupide, mais il suffit de spécifier le
format Par exemple, fournissez trois
lignes de sortie pour chaque ligne, indiquez vrai ou faux, aucun texte supplémentaire, aucun formatage Je l'ai
déjà ajouté à votre bloc-notes sous une cellule
intitulée Astuce 1. Dans votre bloc-notes, faites défiler la page jusqu'à la
section de démonstration des entrées de structure, comme illustré ici. Passez la souris sur la cellule
contenant le premier conseil, puis cliquez sur le
bouton Exécuter qui apparaît Après quelques secondes,
vous devriez voir le résultat suivant :
vrai, faux, vrai. Les sorties sont toujours incorrectes. Nous nous attendons à ce que ce soit vrai, faux ou faux, mais nous corrigeons le format
en ajoutant simplement quelques instructions
à l'invite. Notre prochaine approche consiste
à fournir des exemples. Ajoutons-en quelques-uns. Ajoutons maintenant
trois exemples de critiques. Cinq sur cinq, le
poulet était salé, mais bon, trois sur cinq, le marinero était trop aigre, trois sur cinq, le
serveur n'était pas patient Et enfin, ajoutons
les sorties souhaitées. Les deux premières critiques
concernent des critiques alimentaires, et la dernière critique concerne
une critique non alimentaire. Nous nous attendons donc à du faux, du faux, du vrai. Je l'ai
déjà ajouté à votre carnet dans une cellule
intitulée Astuce 2. Faites défiler la page vers le bas et passez votre souris sur cette cellule intitulée Astuce 2 Cliquez sur le
bouton Run to peer, et au bout de quelques secondes, vous verrez « vrai », « faux », « vrai ». Malheureusement, les
résultats sont toujours erronés, mais nous avons encore une astuce. Pour la troisième approche, nous demanderons une
chaîne de pensée. En bref, demandez
à Lama de montrer son travail. Dans notre invite au modèle, nous demanderons simplement la première
raison étape par étape. Ensuite, nous indiquons très précisément le
format de sortie. Comme d'habitude, je l'ai déjà ajouté
à ton carnet. Faites défiler la page vers le bas, passez la souris sur le titre de
cette cellule. Conseil 3, puis cliquez sur le
bouton Exécuter qui apparaît Après quelques secondes, Lama prédit
enfin correctement. Nous voyons un bloc de
pensées que nous avons demandé et le résultat correct est
vrai faux faux. Nous pouvons donc maintenant dire que 3,18
milliards de lamas peuvent mener à bien
notre tâche Récapitulatif, nous avons appliqué trois conseils. Soyez précis, donnez des exemples et demandez une chaîne de pensée. Ensemble, ces trois éléments
ont permis à notre modèle Lama d'identifier avec succès les critiques
non alimentaires. Et si nous utilisions cette nouvelle invite
améliorée sur nos
modèles par le passé ? On dirait que Deep Seek V Three répond désormais avec
succès à la
question par du vrai faux, mais Quin 1,5 milliard de dollars
produit toujours des déchets inutiles En conséquence, nos résultats en matière d'
open source désormais comme on compare prix de l'IA
ouverte à ceux de l'
open source, Pei propose
toujours informations bien supérieures par dollar, bien que nous ayons aujourd'hui un
Lama de 8 milliards de dollars en activité capable de produire des
réponses correctes de
manière fiable sur du matériel gratuit,
encore moins cher que
tout ce produire des
réponses correctes de
manière fiable sur du matériel gratuit, qui précède. En résumé, soyez précis, donnez des exemples et
demandez une chaîne de réflexion. C'est tout pour la première sous-étape d'ingénierie des entrées de nos modèles En résumé,
nous avons
amélioré avec succès la capacité de Lama à
terminer notre exemple de tâche. Dans la leçon suivante, nous allons apporter une dernière série d'
améliorations pour que notre modèle open source fonctionne manière robuste sur de grandes
quantités de données Comme d'habitude, vous pouvez
trouver toutes les instructions et le code de démarrage que j'ai
utilisé sur cette URL
10. Affiner la qualité : sorties contraintes: Dans cette leçon, nous
allons améliorer nos capacités LLM en
structurant nos résultats Un mot d'avertissement. Cette leçon
contient beaucoup de code. Si vous n'êtes pas à l'aise
avec le code, concentrez-vous
simplement sur les
points à retenir dont je parle
plutôt que sur
le code lui-même Il s'agit
de la troisième de nos trois étapes. Dans la dernière leçon,
nous avons conçu nos entrées pour améliorer la qualité des réponses du
modèle. Dans cette leçon, nous allons
plutôt
améliorer la qualité en limitant
nos résultats Si ce n'est pas déjà fait, rendez-vous sur ce L pour ouvrir le code de
démarrage que
j'ai écrit pour vous. Si votre bloc-notes de la dernière leçon est toujours ouvert, utilisez le même bloc-notes. Si vous ouvrez ce
bloc-notes pour la première fois en
haut du
fichier, cliquez sur Tout exécuter. Les deux premières étapes dureront
environ cinq à dix minutes, vous pouvez
donc continuer à regarder cette promenade
en attendant. Souvenez-vous de notre démo
open source, Lama 8 milliards de personnes n'a pas réussi
à terminer notre tâche. Le format et la
précision des sorties étaient tous deux incorrects. Reproduisons à nouveau
ce résultat. Dans votre bloc-notes, faites défiler la page vers le bas jusqu' à la démonstration des sorties de structure. Passez la souris sur l'exemple
A, puis cliquez sur Exécuter. Vous allez recevoir ce blob de texte. Il est à la fois incorrect et
mal formaté. Nous voulons une liste du vrai ou du faux. Corrigez ce problème. Dans la leçon
précédente, nous avons appliqué trois conseils. Soyez précis, donnez des exemples et demandez une chaîne de pensée. Après avoir appliqué ces conseils, Lama a produit les bons
résultats : vrai faux faux. Cependant, l'exactitude
a eu un coût. L'invite initiale
comportait 288 caractères. Cependant, la nouvelle invite
prend 1 312 caractères. C'est une saisie 4,5
fois plus longue. Cela représente beaucoup de contributions. Pouvons-nous donc améliorer le format
de sortie et l'exactitude sans augmenter le nombre
de jetons d'entrée ? Et la réponse est, bien sûr, oui, laissez-moi vous expliquer.
Voici le LLM. Il prend du texte en entrée et
produit du texte en sortie. Dans ce cas, nos produits de
base sont nos bananes. Et malheureusement,
les résultats du LLM. Ce n'est même pas une
réponse valable à la question. Pour résoudre ce problème, nous forçons le LLM
à n'afficher que oui ou non. Ainsi, même si
le résultat est erroné, au moins le résultat est valide. Pour ce faire, nous devons
modifier cette étape à la fin, à
savoir comment les LLM traduisent
les résultats en mots Zoomons. En fait, le LLM produit d'abord
une liste de numéros. Ces nombres sont
en fait des probabilités qui correspondent
à certains mots Dans notre exemple, la
première probabilité
est la probabilité d'un « oui ». La seconde, la
probabilité d'un non, la troisième de R et la dernière de est. La probabilité la plus élevée est de 60 %, et le
mot correspondant est R. Nous obtenons
donc finalement R. C'est ainsi que le
LLM prédit normalement, mais notre objectif est de n'obtenir
que oui ou Apportons donc quelques modifications. Tout d'abord, ne tenez pas compte de
tous les autres mots. Ne considérez que oui ou non. Et nous prenons maintenant la probabilité la
plus élevée, 10 %, ce qui correspond à « oui ». Enfin, nous indiquons « oui ». Grâce à cela, nous avons
réussi à limiter notre LLM à
ne produire que des réponses « oui » ou « non »,
en utilisant le mot valide ayant la plus forte
probabilité Dans cet exemple, nous voulions
uniquement un oui ou un non. Nous utilisons donc les probabilités de ces deux mots et nous avons simplement choisi le plus
probable des deux Maintenant, notre LLM est obligé
de fournir un résultat par oui ou par non, et surtout, nous l'avons
fait sans modifier le
nombre de jetons d'entrée Retournez à
votre bloc-notes et faites défiler l'écran vers le bas jusqu'à la configuration de l'étape zéro. Passez la souris sur la cellule
et cliquez sur Exécuter. Vous ne verrez aucune sortie pour
cette étape. Vous êtes maintenant configuré. Pour notre premier exemple, nous allons forcer le vrai ou le faux. De manière équivalente, nous pouvons dire
que nous allons forcer un booléen. Un booléen est un vrai ou un faux. Par exemple,
nous demandons que le M correspond aux bananes et à la
production forcée soit vrai ou faux. Passez maintenant le curseur sur le
premier exemple et cliquez sur Exécuter. Cela produira un
seul booléen vrai. Cela est correct.
Les bananes sont des fruits. Pour notre prochain exemple, nous allons forcer trois booléens
au lieu d'un seul Maintenant, nous vérifions si les bananes, les amandes et les
pommes de terre sont des fruits. Déplacez votre souris sur le deuxième
exemple et appuyez sur Exécuter. Vous verrez maintenant les résultats «
vrai », « faux ». Cela est correct.
Voyons maintenant si nous pouvons l'utiliser pour restreindre le format
de sortie de nos critiques non alimentaires Passez la souris sur l'exemple
B, puis cliquez sur Exécuter. Et cette sortie est composée de
trois booléens. Le format de sortie est valide. Malheureusement, le résultat
est toujours erroné. Cela doit être vrai,
faux, faux, faux, faux. Continuons donc.
Pour notre troisième exemple, nous allons forcer le modèle
à raisonner pas à pas. Pour cette étape, nous allons d'abord demander
au modèle de raisonner. Forcez ensuite le modèle à afficher
du texte entre les think tags. Vous pouvez choisir le
format que vous souhaitez pour réfléchir. C'est exactement le format que j'ai choisi. Comme auparavant, l'invite consiste
à vérifier si les bananes, les amandes et les
pommes de terre sont des fruits. Déplacez votre souris sur le
troisième exemple, puis cliquez sur Exécuter. Cela prendra un certain temps pour
s'exécuter environ 45 secondes. Ensuite, vous verrez le résultat final avec le bon raisonnement et mieux
encore, les bons
résultats vrai, faux, faux. Appliquons maintenant les
mêmes résultats structurés à notre exemple de projet
pour les critiques non alimentaires. Passez la souris sur l'exemple
C et cliquez sur Exécuter. Vous verrez le raisonnement ainsi que la bonne
réponse à la fin. Maintenant, en structurant nos sorties, nous avons amélioré la qualité
de notre modèle et forcé les sorties à correspondre à un
format spécifique. C'est une situation gagnant-gagnant. Nous avons également considérablement
réduit la durée des messages. L'invite initiale
comportait 288 caractères. Lors de la dernière leçon, nous
avions besoin de 1 312 caractères. Dans cette leçon, nous n'avons
eu besoin que de 386 caractères, ainsi que de sorties structurées pour obtenir la bonne réponse. Grâce à une ingénierie rapide,
nous avions besoin d'un délai
4,5 fois plus long pour
produire les bons résultats. Avec les sorties structurées, nous
avons une invite beaucoup plus
courte, 1,3 fois plus longue. Et nous avons la garantie que le
résultat sera toujours valide. Cela ne veut pas dire que l'un
est meilleur que l'autre, mais je tiens à souligner qu' ingénierie
rapide et des résultats
contraignants seront en fait le
plus souvent utilisés ensemble pour optimiser la qualité
du modèle Essayons maintenant de contraindre les
sorties pour un modèle propriétaire, à savoir également les modèles d'IA ouverte Accédez à platform.openi.com. Votre page Web
ressemblera à ceci. Assurez-vous de cliquer sur Se connecter en haut
à droite si ce
n'est pas déjà fait. Cliquez ensuite sur le tableau de bord
en haut à droite. Cliquez sur Créer au
centre de la page, et vous devriez voir
une page comme celle-ci. Cliquez sur le sélecteur de modèles. le menu déroulant,
sélectionnez GPT five Nano et votre écran devrait
maintenant ressembler à ceci En bas à droite,
assurez-vous de sélectionner Effacer automatiquement. Ensuite, à côté du nom du modèle, cliquez sur l'icône Paramètres. Cela fera apparaître
un menu de paramètres. Cliquez sur le
menu déroulant du format de texte, puis dans le menu déroulant, vous pouvez cliquer sur
Sélectionner le schéma JSON Vous pouvez donc configurer des sorties
contraintes. Assurez-vous qu'il s'agit d'un schéma JSON
et non d'un objet JSON. Cela ouvrira une
boîte de dialogue comme celle-ci. Collez
ce qui suit, que vous
obtiendrez réellement à partir de cette URL. Copiez le schéma JSON
de sortie contraint. Collez ensuite le schéma
JSON ici. Faites défiler la boîte de
dialogue vers le bas et cliquez sur Enregistrer. Nous verrons le schéma JSON
reflété dans le menu ici. Cliquez ensuite en dehors du menu. À partir de cette URL, copiez l'
invite d'exemple de projet précédente. Collez l'
invite d'exemple de projet ici et appuyez sur Exécuter. Et maintenant, nous avons la
sortie au format JSON. Essayez les modifications aléatoires que
vous souhaitez apporter à l'invite, l'EPI renverra toujours
les sorties dans ce format Et avec cela, vous avez réussi à limiter les
sorties pour ce GPT En résumé, la structuration des sorties force la sortie à être valide Nous pouvons forcer le oui ou le non,
nous pouvons forcer les chiffres, nous pouvons imposer le
format que nous voulons pour les modèles open source et
propriétaires. Nous avons discuté de son fonctionnement, d'un exemple simple pour
identifier les fruits et d'une amélioration de notre détection
des critiques autres que les fruits. C'est maintenant la fin
de notre troisième étape. Nous avons vu deux manières d'améliorer la qualité de
notre modèle sans aucune
formation, ce qui conclut notre leçon
sur la structuration des résultats Et en fait, c'est la fin de
notre troisième des trois étapes. Et maintenant, vous
n'avez terminé que le début de votre
aventure de création avec l'IA. Ce sont les premières
étapes que tout le monde devrait suivre pour un
projet impliquant l'IA. Vous pouvez accéder à cette URL pour obtenir
une copie du code de démarrage, d'autres instructions et d'
autres ressources Dans la prochaine leçon,
nous terminerons le cours.
11. Conclusion: Vous avez atteint la
toute fin du cours. Terminons par un bref
résumé de ce que vous avez appris. Tout d'abord, définissez le périmètre de votre projet. Pour ce faire, nous l'avons
décomposé en trois sous-étapes. Concentrez-vous sur la tâche
générale de texte à texte. Concentrez-vous ensuite sur
les capacités de synthèse, de structuration des
données et de codage de texte
à texte éprouvées sur le
plan commercial synthèse, de structuration des
données et de codage de texte
à texte synthèse, de structuration des
données et Enfin, définissez vos entrées, sorties, votre tâche
et votre métrique. À titre d'exemple, il s'agissait de la description du projet pour
détecter les critiques non alimentaires. Pour notre deuxième étape, évaluez les modèles afin que nous
puissions en choisir un à utiliser. Pour ce faire, nous
avons à nouveau trois sous-étapes. À un niveau élevé, commencez par l' IA
la meilleure et la plus intelligente. Testez les modèles via le chat bot, l'interface la plus simple et la plus
conviviale, puis testez les modèles
via une API afin que vos résultats soient plus
répétables et reproductibles Enfin, optimisez
les coûts en testant des modèles
moins chers et plus rapides pour voir s'ils mènent à bien
votre tâche. Une fois que nous avons choisi un modèle, nous affinons la qualité. Pour ce faire, nous avons suivi deux sous-étapes. Commencez à améliorer la qualité
en affinant vos intrants. C'est ce que nous appelons l'ingénierie rapide. Limitez ensuite les sorties. Cela peut encore améliorer la fiabilité et
la qualité de votre modèle. Cela complète notre processus en
trois étapes, vous pouvez désormais utiliser pour créer
n'importe quel projet impliquant l'IA. Ce n'est qu'un début, mais
c'est une base solide pour comprendre dans quelle mesure l'IA
peut accomplir votre tâche. Maintenant, en utilisant le
processus ci-dessus comme guide, appliquez-le à votre
propre projet et publiez le résultat dans l'onglet Projet du
cours. N'hésitez pas à utiliser l'un de mes exemples de projets ou à
créer le vôtre. Je suis très impatiente de
voir ce que vous allez créer. Si vous souhaitez en savoir plus
sur les cours de suivi, suivez-moi sur Skillshare et
consultez mes autres Félicitations. J'arrive à la toute fin du cours.