Intelligence artificielle pour débutants : créer gratuitement un ChatGPT personnalisé en 3 étapes

Alvin Wan, Research Scientist

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

- 1.
  
  Introduction
  
  1:14
- 2.
  
  Projet de portée : Texte en texte
  
  5:52
- 3.
  
  Portée du projet : capacités
  
  5:57
- 4.
  
  Projet de portée : tâche et métrique
  
  5:32
- 5.
  
  Évaluez les modèles : Tester le meilleur
  
  6:22
- 6.
  
  Évaluer les modèles : Optimiser les coûts
  
  3:40
- 7.
  
  Évaluer les modèles : Open-Source
  
  7:03
- 8.
  
  Démonstration : exécuter un modèle open source
  
  4:32
- 9.
  
  Affiner la qualité : Entrées de l'ingénieur
  
  4:25
- 10.
  
  Affiner la qualité : sorties contraintes
  
  9:18
- 11.
  
  Conclusion
  
  2:00

Niveau débutant

Niveau intermédiaire

Niveau avancé

Tous niveaux

1 097

apprenants

projets

À propos de ce cours

Vous avez envie d'utiliser l'IA dans votre produit, mais vous êtes intimidé par tout le jargon et la complexité du sujet ? La multitude de produits tiers ? ? Coupons la tête au sujet de tout le faux : je vais vous montrer comment personnaliser une IA à partir de zéro en 3 étapes rapides.

Ce cours s'adresse aux entrepreneurs, aux développeurs, aux gestionnaires de produit et aux apprenants curieux qui souhaitent créer des applications d'IA puissantes et personnalisées sans API coûteuses ni abonnements tiers. Vous découvrirez les étapes fondamentales pour créer des solutions d'IA pratiques et personnalisées à l'aide d'outils libres et gratuits. Et surtout, nous allons améliorer vos capacités LLM sans aucune formation.

Ce que vous apprendrez

Voici ce que nous allons faire, rapidement :

Choisissez un véritable problème de texte in/texte sorti qui vous tient à cœur.
Définissez les entrées, les sorties et une mesure rapide afin de juger la qualité.
Essayez le modèle en tête, puis l'API pour obtenir des résultats répétables et vérifier les coûts.
Passez au modèle le moins cher qui surpasse toujours vos paramètres
Rendre sa base fiable avec une structure de prompts et des sorties contraintes (pour qu'elle renvoie toujours le format auquel votre application s'attend).
Réalisez un petit modèle open source sur des GPU gratuits et connectez-le pour éviter de vous limiter par votre budget.

Aucune formation coûteuse n'est requise et nous allons plus loin que la simple "requête ChatGPT".

À qui s'adresse ce cours ?

Aucune expérience préalable en IA ou en codage n'est requise. Juste la curiosité et le désir d'apprendre. Que vous soyez débutant ou que vous ayez des connaissances techniques, vous repartirez avec des connaissances pratiques et la confiance nécessaire pour créer des solutions d'IA personnalisées. Cela dit, vous tirerez davantage parti du cours si vous suivez d'abord mes cours Intelligence artificielle pour débutants : comment apprendre le machine learning et Intelligence artificielle pour débutants : comment fonctionne ChatGPT.

Ressources nécessaires : ;

Ordinateur (Windows, macOS ou Linux)
Le navigateur Google Chrome
Compte Google
Pas d'API payantes ou de services tiers

Prêt à aller plus en profondeur ?

Vous êtes intéressé par l'apprentissage automatique avancé ? (e) ? ? Essayez mon cours Computer Vision 101 (Applied ML).
Vous voulez coder ? Consultez Coding 101 (Python) ou OOP 101 (Python).
Vous êtes intéressé par les données ? Découvrir SQL 101 (conception de bases de données) ou Data 101 (analyse).

Rencontrez votre enseignant·e

Alvin Wan

Research Scientist

Top Teacher

Hi, I'm Alvin. I was formerly a computer science lecturer at UC Berkeley, where I served on various course staffs for 5 years. I'm now a research scientist at a large tech company, working on cutting edge AI. I've got courses to get you started -- not just to teach the basics, but also to get you excited to learn more. For more, see my Guide to Coding or YouTube.

Welcoming Guest Teacher Derek! I was formerly an instructor for the largest computer science course at UC Berkeley, where I taught for several years and won the Distinguished GSI (graduate student instructor) award. I am now a software engineer working on experimentation platforms at a large tech company. 4.45 / 5.00 average rating (943 reviews) at UC Berkeley. For more, see my Skillshare or Webs... Voir le profil complet

Compétences associées

IA et innovation IA pour le développement Bases de l'IA Prompts

Level: Intermediate

Projet de cours pratique

Créer votre ChatGPT personnalisé ! ! Suivez les étapes de ce cours pour définir votre projet et construire votre toute première IA personnalisée :

Projet de portée
Évaluez des modèles els
Affiner la qualité

Analyse and tally 17 Reviews for a reginal hairdresser

Maria Charlton 9 j'aime

2 commentaires

Blake Acosta 8 j'aime

1 commentaire

Lakshya Soni 6 j'aime

1 commentaire

Ifeoluwa Oladeni 6 j'aime

1 commentaire

Notes attribuées au cours

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Introduction: La formation de votre propre modèle est lente, coûteuse et excessive pour la plupart des projets Le vrai problème est de savoir par où commencer, comment obtenir des résultats fiables sans perdre de temps ni d'argent. Bonjour, je suis Alvin, chercheur dans une grande entreprise technologique J'ai enseigné à plus de 60 000 étudiants sur Skillshare et j'ai obtenu mon doctorat en IA à l'université de Berkeley Dans ce cours, je vais vous donner un manuel simple et reproductible pour créer un ChaChipt personnalisé pour votre un ChaChipt personnalisé Nous allons procéder en trois étapes. Étape numéro un, définissez le périmètre de votre projet. Déterminez comment utiliser l'IA le plus efficacement possible pour votre cas d'utilisation. Deuxième étape, évaluer les modèles. Je vais vous montrer comment naviguer parmi les nombreux modèles propriétaires et open source Étape numéro trois, affinez la qualité. Assurez-vous que le modèle renvoie exactement ce dont vous avez besoin à chaque fois. À la fin de ce cours, vous aurez un processus en trois étapes à utiliser pour toute idée basée sur l'IA. Ce cours suppose que vous avez suivi mon cours sur l'IA pour débutants, fonctionnement de Chat Tippit Mais au-delà de cela, aucune formation technique n'est requise. Tout ce dont vous avez besoin, c'est d'un ordinateur portable , d' Internet et d'une heure. Commençons. 2. Projet de portée : Texte en texte: Bienvenue dans l'IA pour débutants. Construisez un Chachi BT personnalisé en trois étapes. Avant de commencer, examinons un peu la terminologie. Je vais simplifier considérablement ces définitions pour transmettre l'idée principale LLM ou modèle de langage large est un modèle qui génère du texte Vous lui donnez Tex en entrée, et le LLM produit une sortie Texas L'IA ou intelligence artificielle est généralement un produit qui utilise un LLM HHIBT est spécifiquement le produit d'IA d' Open AI. Donc, l'IA contre le CIBT, c'est comme les mouchoirs contre le Kleenex. Les mouchoirs sont le produit général, et Kleenex est un nom de produit spécifique Si vous avez trouvé cela confus, c'est bon. J'en parle plus en détail dans AI for beginners, comment fonctionne HachBT, que vous pouvez trouver sur ce lien Puisque vous êtes déjà inscrit, vous bénéficierez de ce cours sans frais supplémentaires. Je recommande également vivement d'utiliser mes outils d'IA pour débutants pour apprendre l'apprentissage automatique, où je discute d'un cadre pour intégrer l'IA et le ML. Vous pouvez trouver ce cours sur ce lien. Il n'est pas nécessaire de noter ces liens, car vous trouverez tous les liens de cette leçon à cette adresse URL. Construisons maintenant votre Chachi BT personnalisé en trois étapes. Ces étapes sont à la portée de tous, même si vous êtes un professionnel, même si vous avez un budget énorme. Toute personne qui crée une IA personnalisée doit suivre ces trois étapes. Première étape : définissez le périmètre de votre projet, déterminez ce que fera votre IA et comment vous évaluerez ses capacités. Deuxième étape, évaluez les modèles. Il existe des directives sur les types de modèles à utiliser et à quel moment. Troisième étape, affinez la qualité. Aucune formation n'est nécessaire, et nous allons vous montrer deux méthodes pour améliorer la qualité. Commençons maintenant par la première étape, qui consiste à définir le périmètre de votre projet. La première étape consiste à vous concentrer uniquement sur les tâches de texte par texte. Cela signifie que vous donnez l'AI Tex en entrée et que vous obtenez du texte en sortie. Laissez-moi vous expliquer pourquoi. d'abord, par expérience, nous savons que IA peut assimiler bien plus que du texte. Nous pouvons fournir des images AI, des PDF, des sites Web, des vidéos, etc. Il peut également produire plus que du texte. L'IA peut produire des images, du code , des graphiques, du son et bien plus encore. Il s'agit de nombreux médias différents. Cependant, souvenez-vous de ce que nous avons dit tout à l'heure. L'IA est un produit qui utilise un LLM, et un LLM est un modèle qui prend en entrées du Texas et génère du texte en sortie Revenons donc à notre schéma. Zoomons. Le produit AI et examinez le LLM sous-jacent. Notez que le LLM ne prend en compte que du texte. Toutes les autres entrées sont d'abord converties en texte. Sachant cela, le cas idéal est de donner directement du texte à l'IA et d'ignorer complètement ce processus de conversion. C'est parce que le texte transmet le plus d'informations par mot. Laissez-moi vous expliquer par un exemple. Supposons qu'il existe une page Web contenant les résultats d'un match de football récent. Combien de mots contient cette page ? IC un, deux, trois, quatre, cinq, six, 789, dix, 11, 12 Donc un total de 12 mots. Je pourrais donner ce texte directement à l'IA, 12 mots seulement, ou je pourrais prendre une capture d'écran de cette page Web et donner cette image à l'IA. L'IA traduirait ensuite cette image en un nombre impressionnant de 2030 mots visuels Cela représente plus de 170 fois plus de mots pour la même quantité d'informations. En conclusion, Tex est plus efficace pour communiquer des informations que des images de texte. Par conséquent, pour simplifier votre projet, limitez-vous aux tâches de texte et de TextOut Voici un autre exemple. Vous souhaitez donc demander à HattBT des commentaires sur vos diapositives. Plusieurs options s'offrent à vous pour les formats de téléchargement. ne téléchargez pas le diaporama au format PDF Cependant, ne téléchargez pas le diaporama au format PDF et ne le téléchargez certainement pas sous forme d'images. Téléchargez plutôt les diapositives au format texte brut. Ce format de texte brut contient uniquement le texte brut de toutes mes diapositives, sans mise en forme supplémentaire ni informations inutiles. Je peux maintenant télécharger ce fichier et demander à HattPT de fournir des commentaires sur mes diapositives Heureusement, mes diapositives sont uniquement fournies sous forme de texte brut, ce qui permet un traitement efficace du chat TPT En bref, si vous souhaitez introduire un fichier dans HachBT, exportez-le au format texte brut dans la mesure du possible Prenons un autre exemple. Supposons que je veuille interroger HattBT à propos d'un article de blog que je lis Ne faites pas de capture d'écran de la page Web. Au lieu de cela, fournissez directement à HattBT l'URL de la page Web, et vous constaterez que HTHBT accèdera réellement à cette page Web pour nous, en résumant ce Nous pouvons vérifier que le protocole HTTP accède à la bonne URL en cliquant sur les sources Et sur le côté droit, nous verrons la page Web d'origine répertoriée sous forme de citation. Cela signifie que HatchBT a pu accéder au texte brut de la page Web et, comme auparavant, ingérer des informations efficacement, ingérer des informations efficacement En bref, donnez directement les URL des pages Web afin que HachPT puisse accéder à la page Web et extraire son contenu sous forme de texte brut par lui-même Pour résumer cette leçon en un seul point à retenir, concentrez-vous sur les tâches de texte à texte Cela signifie que nous devons fournir des données en texte brut dans possible pour notre projet. Ainsi s'achève la première sous-étape de la première étape Nous avons réduit la portée de notre projet en nous concentrant sur les tâches de synthèse texte Dans la leçon suivante, nous parlerons certaines tâches texte-texte pour lesquelles l'IA est la mieux adaptée. Et si vous souhaitez obtenir une copie de ces diapositives et consulter des ressources supplémentaires, vous pouvez accéder à cette URL. 3. Portée du projet : capacités: Dans cette leçon, nous allons continuer à discuter de la manière de définir le périmètre de votre projet. Maintenant, pour récapituler, nous en sommes à la première étape d' un processus en trois étapes Mon objectif dans cette première étape est de vous aider à réduire la portée de votre projet. Dans la leçon précédente, nous avons concentré votre attention sur les tâches de synthèse texte Dans cette leçon, je vais vous concentrer davantage des fonctionnalités spécifiques de texte à texte. Tout d'abord, nous nous concentrons sur la création d'une IA personnalisée fiable et précise pour la production. Nous pouvons donc nous demander : que peut faire l'IA de manière suffisamment fiable et précise pour la production ? Il existe de nombreuses tâches de ce type, mais je ne me concentrerai que sur trois d'entre elles. Notre première catégorie est celle des résumés. Par exemple, Amazon utilise l'IA pour résumer les avis sur les produits dans une section réservée aux clients. Slack utilise l'IA pour résumer les chaînes, et Noon utilise l'IA pour résumer les réunions Zoom pour vous Il existe de nombreux exemples commerciaux de simple résumé. Maintenant, essayons-le nous-mêmes. Imaginons que vous gérez une boulangerie avec des centaines d'avis. Vous aimeriez tirer parti de ces avis pour aider votre boulangerie à se développer. Dans votre navigateur, rendez-vous sur chattbt.com. Vous verrez une page comme celle-ci. Collons quelques critiques et demandons à HatchiBT de résumer ces Voici notre résumé. HatTibt affirme que les opinions sur le croissant aux amandes sont partagées, ce qui semble être une évaluation juste Vous pouvez consulter vous-même les avis sur cette URL pour déterminer si vous êtes d'accord ou non. Bref, l'IA est plutôt douée pour résumer. L'IA est également prête à être utilisée en production pour structurer les données. structuration des données est une façon sophistiquée de dire que l'IA peut traduire des globes de texte en tableaux de données bien organisés Et à première vue, ça a l'air cool. Mais permettez-moi de souligner que cool est un euphémisme. Être capable de prendre des données non structurées et d'extraire des données structurées propres est en fait une superpuissance de l'IA extrêmement utile Laissez-moi vous expliquer par un exemple. Retournons à notre boulangerie. D'après nos 671 avis, nous aimerions savoir ce que nos clients pensent de nos produits de boulangerie Par exemple, les clients ont-ils aimé le croissant aux amandes ? En fait, demandons-nous d'abord quels clients ont même essayé le croissant aux amandes ? Idéalement, nous aurions un tableau de données bien organisé comme celui-ci, une liste de vrais pour ceux qui l'ont aimé et de faux pour ceux qui ne l'ont pas aimé, nous n'avons pas un tel tableau. Nous avons des tonnes et des tonnes de critiques comme celle-ci. Nous devons maintenant parcourir et lire chaque critique, puis déterminer quelles critiques mentionnaient même les croissants aux amandes. Il existe de nombreuses façons de mentionner les croissants aux amandes. La critique pourrait dire croissant aux amandes avec pâte aux amandes ou aux amandes. Alors vous pourriez dire, cherchons simplement le mot amande. Mais cela inclurait également d'autres croissants, car la boulangerie vend également des croissants au chocolat et aux amandes et aux myrtilles et aux amandes Bref, il est difficile de détecter les mentions de croissants aux amandes, et c'est parce que le texte non structuré est très flexible Heureusement, l'IA est parfaite pour cela. Laissez-moi vous montrer que vous allez sur chattbt.com. Accédez à cette URL pour copier l'invite. Collez ensuite l'invite ici. Le message donne à ChachiBt une liste de critiques de boulangeries et lui demande d'identifier les amateurs de croissants Alman Appuyez sur Exécuter, et vous obtenez un joli tableau des résultats. Au lieu de lire les avis, nous pouvons facilement voir quels clients ont essayé le Croissant Amend. Il existe trois critiques de ce type, et deux d'entre eux l'ont aimé Par conséquent, nous concluons que 67 % des clients qui ont essayé l'Amen Croissant l'ont apprécié. Cela nous permet d' analyser facilement de grandes quantités de texte de cette façon, tout cela parce que l'IA peut convertir du texte non structuré en formats structurés Vous devriez maintenant être en mesure de voir à quel point les données structurantes sont précieuses C'est un super pouvoir d'analyse des données. La troisième tâche pour laquelle l' IA est prête à être produite est le codage et les petites étapes. Il existe de nombreuses réussites dans ce domaine. Cursor améliore la productivité des développeurs en proposant un éditeur de code basé sur l'IA , capable d'écrire et d' exécuter du code pour vous. Lovable permet à quiconque de générer des applications à partir de zéro sans écrire de code lui-même. Cependant, pour votre premier projet, ne demandez pas à l'IA de créer des bases de code complètes. Traitez l'IA comme un ingénieur junior, des tâches simples et des étapes individuelles. L'IA est très douée pour générer des extraits de code de démarrage, détecter et corriger de petits bogues et pour ajouter une fonctionnalité qui n'implique que quelques fichiers. Voyons cela en action. Accédez à chattbt.com. Demandons à HattBT de tracer un graphique circulaire des overs d' Alman Croissant en utilisant les données précédentes Comme demandé, ChachiBT commence à écrire et à écrire du code, ce qui nous donne maintenant un diagramme circulaire ChachiBT nous donne également le code de l'intrigue, que nous pourrions exécuter nous-mêmes Bref, l'IA est très capable d'écrire du code par petites étapes. En résumé, l'IA est prête pour la production pour la synthèse, la structuration des données et le codage La synthèse est intégrée aux produits Amazon, Slack et La structuration des informations d'entreprise dans un format consultable est dominée par Glean Le codage est dominé par le curseur et adorable. Bien entendu, l'IA peut être appliquée de nombreuses autres manières. Mais ici, nous nous concentrons sur les capacités qui ont déjà connu un succès commercial. Vous avez maintenant découvert les fonctionnalités que Tipts de chat personnalisé peut offrir avec une qualité de production Nous avons maintenant discuté de plusieurs capacités d' IA qui ont déjà été éprouvées commercialement et à plusieurs reprises. Il est donc raisonnable de s'appuyer sur ces capacités pour notre premier projet. Vous pouvez accéder à cette URL pour toutes les instructions que j'ai utilisées, liées aux exemples complets de conversations et à d'autres ressources 4. Projet de portée : tâche et métrique: Au cours de la dernière leçon, nous avons examiné les capacités générales dans lesquelles l'IA est la meilleure. À présent, traduisons les capacités générales en un projet spécifique. Pour la première partie, nous nous sommes concentrés sur le texte général de la tâche de texte Dans la dernière leçon, nous nous concentrons davantage sur trois fonctionnalités spécifiques, à savoir la synthèse, la structuration des données et le codage Dans cette leçon, nous allons enfin définir votre projet. Pour votre projet, vous devez d'abord définir la tâche. Qu'est-ce que l'IA va faire pour vous ? Définissez ensuite ce que le LLM prendra en entrée. Sera-t-il pris en compte les critiques, les courriels, essais et, enfin, définira-t-il le texte que le LLM produira en sortie ? Produira-t-il des résumés, des tableaux, des puces ? Voyons un exemple. R Je cherche un endroit où manger. café Yummy a une faible note, et je veux savoir pourquoi Ma première réaction est de demander à l' IA de résumer mes avis. Remplissons le modèle de projet. Notre tâche consiste à résumer les avis. Nos contributions seront des évaluations, et notre sortie sera un résumé. Cela ne semble pas être une définition utile. Soyons donc plus précis. Sur la page Web du restaurant, je fais défiler les avis avec des notes très faibles. Une personne a confondu cet endroit avec son restaurant jumeau. Quelqu'un d'autre s'est plaint de l' ordre dans lequel les plats étaient servis, et le dernier commentaire n'a pas apprécié l'attitude du personnel de service. Ce sont toutes des préoccupations valables, mais personnellement, je ne m' intéresse qu'à la nourriture. Je veux donc filtrer les critiques non alimentaires. Sachant que c'est mon objectif, traduisons-le maintenant en un projet concret. Vers notre modèle. J'aimerais détecter les critiques non alimentaires. L'entrée est une critique de restaurant, et la sortie est vraie ou fausse. Si l' évaluation déduit ou non des étoiles pour des raisons non alimentaires. Maintenant, nous sommes en affaires. C'est à ce point que doit être précise la définition de votre projet. Cependant, nous avons un autre élément, la métrique. À un niveau élevé, la métrique vous indique si les résultats de l'IA sont bons. Pour commencer, votre premier indicateur sera est-ce que je trouve les résultats de l'IA raisonnables ? Évaluez d'abord à la main. Voici une critique qui se plaint de l'ordre dans lequel les plats ont été servis Nous demandons à l'IA si cette évaluation permet de déduire des étoiles pour des raisons non alimentaires L'IA fait une prédiction. Oui Maintenant, est-ce que je trouve raisonnable ? Je le sais. L'évaluation déduit des étoiles pour le service, pas pour la nourriture L'IA passe cette première vérification. Voici une autre critique qui se plaint de la fraîcheur du poisson Nous demandons à l'IA si cette évaluation permet de déduire des étoiles pour des raisons non alimentaires L'IA fait une prédiction. Non Est-ce que je ne trouve rien de raisonnable ? Je le sais. Cette critique a déduit des étoiles précisément pour des raisons alimentaires L'IA passe cette deuxième vérification. Voici une critique qui montre une confusion quant au nom du restaurant. Nous demandons à l'IA cette évaluation déduit-elle des étoiles pour des raisons non alimentaires ? L'IA fait une prédiction. Non Est-ce que je ne trouve rien de raisonnable ? Cette fois, je ne le sais pas. La critique a déduit des étoiles pour le nom du restaurant, et non pour la nourriture L'IA échoue à cette troisième vérification. Voici le tableau de bord de l'IA. Nous trouvons les résultats raisonnables deux fois sur trois. En conclusion, votre première évaluation est que les résultats de l'IA sont généralement raisonnables. Cependant, les meilleurs indicateurs quantifieront la qualité. Soyons donc plus précis. Pour en revenir à notre tableau de bord, nous avons trouvé l'IA correcte deux fois sur trois Nous disons donc que l'IA a atteint une précision de 67 %. Votre indicateur est désormais le pourcentage d' avis que l'IA classe correctement. Plus succinctement, notre indicateur est précision du modèle sur les avis que nous avons qualifiés de vrais ou de C'est vrai de la critique, des étoiles déductives pour des raisons non alimentaires. Nous pouvons maintenant prendre n'importe quelle IA et calculer sa précision pour notre tâche. Voici maintenant notre définition de projet idiot. Nous avons ajouté la précision métrique qui permet à l'IA de prédire le vrai ou le faux, par rapport à vos propres étiquettes sur les avis des restaurants Prenons un autre exemple. Supposons que vous organisiez un hackathon et que, après la fermeture du portail de soumission en ligne à la date limite, des dizaines de personnes vous envoient des inscriptions tardives par e-mail Votre objectif général est d' organiser les inscriptions tardives envoyées par e-mail. Plus concrètement, votre tâche consiste à détecter si un e-mail est une entrée dans le Hackathon L'entrée est un e-mail. Le résultat, que l'e-mail soit ou non une soumission au Hackathon La métrique est également la précision, nombre d'e-mails correctement classés comme entrées ou non. Maintenant, grâce à l'IA, nous pouvons générer une table de données et le tour est joué. Il est désormais beaucoup plus facile de déterminer les soumissions tardives à accepter à grande échelle sans avoir à lire les 100 e-mails pour trouver les inscriptions au Hackathon En résumé, définissez la tâche, l'entrée de votre IA, la sortie de votre IA et la métrique qui détermine la qualité des sorties de votre modèle. Cela met fin à cette leçon. Dans cette leçon, nous avons finalement défini votre projet après l'avoir défini, ce qui conclut également la première des trois étapes Vous avez maintenant défini la portée de votre projet et nous sommes prêts à le démarrer Vous pouvez accéder à la CRL pour obtenir une copie de ces diapositives et des ressources supplémentaires 5. Évaluez les modèles : Tester le meilleur: Bon retour. Dans les leçons précédentes, nous nous sommes concentrés sur les tâches de synthèse texte Ensuite, des capacités spécifiques, puis définissez la métrique de tâche. Cela a permis de terminer notre première tâche, à savoir définir le cadre du projet. un deuxième temps, nous évaluerons les modèles afin de choisir le meilleur modèle pour notre cas d'utilisation. Pour choisir un modèle, vous allez évaluer capacité de plusieurs modèles à accomplir votre tâche. Nous allons commencer par les meilleures options, car nous voulons savoir. N'importe quelle IA peut-elle même accomplir notre tâche ? Si la meilleure IA ne peut pas résoudre votre tâche, IA moins intelligentes ne le feront certainement pas non plus. Commencez donc par l'IA la plus intelligente. Selon le site Web d'Open EI, si vous optez pour un forfait gratuit ou un forfait plus, la pensée selon le PIB Five est votre modèle le plus intelligent Si vous êtes abonné au forfait Pro, PIB five Pro est votre modèle le plus intelligent Commençons nos tests via des chatbots, une interface simple pour un test rapide Accédez à chatbt.com. Vous verrez un écran comme celui-ci. En haut à gauche, développez le menu déroulant. Dans cette liste déroulante, vous verrez rapidement le modèle le plus rapide mais le moins intelligent. Penser, un modèle plus intelligent. Utilisez-le si vous utilisez le forfait gratuit ou plus. Et enfin, P, le modèle le plus intelligent. Utilisez-le si vous êtes abonné au forfait Pro. J'utiliserai la méthode de pensée GPT 5 pour que tout le monde puisse reproduire mes résultats Nous avons maintenant sélectionné un LLM. Alors, que devons-nous demander à Chat GBT ? Utilisons le projet de la dernière leçon. Rappelez-vous que notre objectif est de filtrer les critiques non alimentaires. Les entrées sont des critiques de restaurants, et les résultats sont vrais ou faux, vrais si les étoiles sont déduites pour des raisons autres que alimentaires Donc, pour notre rapidité, d'accord, compte tenu des critiques de restaurants, le résultat est vrai si un avis déduit des étoiles pour des raisons non alimentaires Ensuite, j'inclus trois critiques. Le premier critique se plaint du service, second se plaint de la saveur et le troisième aime la nourriture, mais trouve que le service était lent Nous nous attendons à ce que l'IA redevienne alors vraie parce que le premier avis déduit des étoiles pour le service, faux, parce que le second avis déduit que l'étoile est précisément pour la nourriture et Le dernier avis ne déduit aucune étoile. Essayons cette invite maintenant. Tout d'abord, accédez à cette UOL et copiez l'invite. Retournez ensuite sur chattbt.com. Collez l'invite. Appuyez sur Run. ChattBTTS pendant quelques secondes, puis lui donne une réponse, qui est correcte, vraie, fausse, fausse Par conséquent, nous concluons que IA peut accomplir correctement notre tâche. Plus précisément, GPT five complète notre tâche. Tester le chatbot ne suffit pas car les chatbots ne sont pas Cela signifie qu'ils ne renvoient pas les mêmes résultats à chaque fois. Par exemple, demandons à HathBT de raconter une blague sur papa. Chat TBT fait une blague sur les épouvantails. Faisons-le encore une fois, exactement à la même invite. HatchiBt fait une blague sur l'alphabet. Fais-le encore une fois. Discutez des blagues sur le TBT sur les squelettes Ainsi, la même invite a donné des réponses différentes à chaque fois. Cela montre notre point précédent selon lequel les chatbots ne sont pas déterministes Par conséquent, nous devons passer du test du chatbot au test de l'API Par défaut, l'API est beaucoup moins aléatoire injectée. Donc, si l'IA termine la tâche une fois, nous pouvons être sûrs qu'elle l' exécutera à plusieurs reprises. Accédez à la plateforme dotopen.com. Votre page Web ressemblera à ceci. Assurez-vous de cliquer sur Se connecter en haut à droite si ce n'est pas déjà fait. Cliquez ensuite sur le tableau de bord en haut à droite. Notre page ressemblera désormais à ceci. Cliquez sur Créer au centre de la page. Votre écran devrait maintenant ressembler à ceci. En bas à droite, cliquez sur Effacer automatiquement. Cela garantit que chaque fois que nous appuyons sur Soumettre, nous imitons le même comportement que l' envoi d'appels d'API distincts Maintenant, demandez une blague à votre père, mais avant d'appuyer sur Entrée, notez que cet exemple spécifique peut coûter jusqu'à deux dixièmes de cent Une fois que vous avez cliqué sur Run, JTBT fait une blague sur l'alphabet. Demandons à nouveau une blague à papa. Assurez-vous que l'option Auto Clear en bas à droite est sélectionnée et soumettez. JTBT fait exactement la même blague à propos l'alphabet avec un léger changement de ponctuation Et nous essayons encore une fois d'obtenir exactement la même blague alphabétique. Les résultats sont presque tous identiques. C'est bien mieux que le chatbot, qui renvoie des réponses complètement différentes à chaque fois. Nous pouvons donc en conclure que les appels d' API sont principalement déterministes, certainement bien plus que le Réessayons donc notre exemple d'invite de projet via l'API. N'oubliez pas que c'est notre message d'avant. Nous nous attendons à ce que l'IA renvoie le vrai, le faux et le faux. Accédez à cette URL pour copier à nouveau l'invite d' exemple de projet. Puis de retour sur la plateforme openai.com , collez cette invite Avant de cliquer sur Exécuter, notez que cet exemple coûtera quatre dixièmes de cent L'API PIB five renvoie d' abord des jetons de réflexion pendant quelques secondes. Puis renvoie enfin la réponse finale correcte, vrai, faux, faux. Essayons encore une fois. Et encore une fois, PIB 5 renvoie la bonne réponse, vrai, faux, faux Et encore une fois. Et encore une fois, la bonne réponse, vraie, fausse, fausse. Donc, comme auparavant, le PIB 5 complète correctement notre tâche. Plus important encore, GPT five le fait à plusieurs reprises. C'est une grande victoire. Cela signifie que notre projet peut désormais effectuer notre tâche à plusieurs reprises à l'aide de l'API de PIB five En résumé, testez d'abord l'IA la meilleure et la plus intelligente. D'abord via des chatbots pour plus de simplicité, puis via l'API pour la reproductibilité, et c'est la fin de nos tests via l' En général, nous avons fini de tester la meilleure IA. Et dans la prochaine leçon, nous optimiserons les coûts en testant des modèles plus rapides et moins chers. Au cas où vous vous demanderiez comment j'ai calculé le coût d'un appel d'API, je vais vous l'expliquer et inclure plus de ressources sur le site Web du cours à cette URL. 6. Évaluer les modèles : Optimiser les coûts: Bon retour. En résumé, vous êtes à l'étape deux sur trois Mais jusqu'à présent, vous n'avez testé que la meilleure IA. Nous avons testé la meilleure IA par chat, puis nous l'avons testée via une API. Il est maintenant temps d' optimiser les coûts et de trouver le modèle le moins cher qui puisse encore accomplir notre tâche à plusieurs reprises. Souvenez-vous d'avant que PIB Five avait terminé notre exemple de tâche de projet avec succès et à plusieurs reprises, et que cela coûtait environ quatre dixièmes de cent J'inclurai tous les calculs de coûts sur le site Web de notre cours si cela vous intéresse. Voici le coût du PIB 5 pour notre exemple, ainsi que ses coûts par jeton, selon la page de tarification des API d'OpenAI Essayons le prochain modèle le moins cher de notre liste, le GPT five Mini votre sélecteur de modèle, sélectionnez PIB five Mini Votre écran devrait maintenant ressembler au mien. Collez l'invite de projet d'exemple, et PIB five Mini répond vrai faux faux, complétant ainsi correctement la tâche Regardons le coût. Cet exemple a coûté 700 centimes Et une fois que nous l'avons ajouté à notre tableau, nous pouvons constater que nous avons réduit le coût de réalisation de notre tâche de cinq fois. Nous allons maintenant tester notre modèle le moins cher, le GPT five Nano. Dans le sélecteur de modèle, sélectionnez GPT five Nano Votre écran devrait maintenant ressembler au mien. Collez l' invite du projet d'exemple, et une fois de plus, nous obtenons true false, la bonne réponse. Regardez à nouveau le coût. Le coût de notre exemple est maintenant trois centièmes de Et dans notre tableau, nous pouvons voir que nous avons maintenant réduit de deux fois le coût de réalisation de notre tâche. Mais réduisons encore les coûts. Jusqu'à présent, nous avons maintenu notre raisonnement au niveau moyen par défaut. Nous voulons maintenant limiter le raisonnement au minimum. Laissez-moi vous montrer comment procéder. De retour sur cette page Web, à côté du nom du modèle, cliquez sur l'icône des paramètres. Dans le menu, sélectionnez l'effort de raisonnement. Cela vous donnera une autre liste déroulante. Sélectionnez minimal, qui ressemblera alors à ceci. Cliquez en dehors de la fenêtre contextuelle. Collez ensuite l'invite de votre exemple de projet. Et assez fou, GPT five Nana répond toujours, sans raisonnement, vrai faux faux, complétant ainsi parfaitement la tâche. Regardez le coût maintenant. Le coût de notre exemple est maintenant de 4 000e de cent, qui nous donne ce tableau final des résultats Nous réduisons encore les coûts de sept fois. C'est une réduction incroyable des coûts. Compte tenu de ces résultats, nous déclarons que GPT five Nano est notre gagnant sans pour autant donner de raison Maintenant, les trois parties de la deuxième étape testez via un chatbot, testez via l'API et, enfin, trouvez le modèle le moins cher qui fonctionne toujours Cela a produit le modèle Open EI le moins cher qui pourrait résoudre avec succès notre tâche GPT five Nano En résumé, testez d'abord l'IA la meilleure et la plus intelligente. D'abord via des chatbots pour plus de simplicité, puis via l'API pour la reproductibilité, puis testez de manière itérative une IA plus rapide et moins coûteuse Nous avons désormais optimisé les coûts avec succès, les réduisant de plus de 88 fois, et c'est tout pour évaluer les modèles. Cela conclut principalement la deuxième étape. Nous en avons fini avec les modèles propriétaires, mais nous devons maintenant répéter ce processus pour une autre vaste catégorie de modèles open source d' options. Comme d'habitude, vous pouvez trouver tous les calculs, les instructions et d'autres ressources sur cette URL 7. Évaluer les modèles : Open-Source: Explorons une autre catégorie de modèles, les modèles open source. Nous en sommes actuellement à la deuxième des trois étapes où nous évaluons les modèles afin de déterminer lequel utiliser. Heureusement, il existe un hub standardisé pour tous les modèles open source sur huggingface.co Visitez cette URL et vous verrez une tonne d' options. C'est bouleversant. Voici cependant quelques heuristiques pour naviguer dans ce vaste référentiel de modèles Règle numéro un, utilisez des modèles adaptés aux instructions. Habituellement, les modèles dotés d'instructions ont une instruction dans le nom quelque part La raison de cette règle est que les LLM sont formés en trois étapes Dans la première étape appelée pré-formation, LLM prédisent simplement le mot suivant Au cours de la deuxième étape, appelée SFT ou réglage fin supervisé, les modèles apprennent à répondre aux questions Au cours de la dernière étape, appelée apprentissage par renforcement avec rétroaction humaine ou RLHF, modèles apprennent à aligner les réponses sur les préférences humaines, en étant utiles, honnêtes et inoffensifs Techniquement parlant, seule la deuxième étape est appelée réglage des instructions, mais dans la pratique, les modèles open source adaptés aux instructions sont passés à la fois par le SFT et le RLHF Dans tous les cas, vous ne voulez pas d'un modèle uniquement soumis à un entraînement préalable car ces modèles répondent automatiquement aux questions, et non aux questions. Donc, en résumé, règle numéro un, utilisez des modèles adaptés aux instructions. Pour la règle numéro deux, utilisez de petits modèles. s'agit évidemment pas d'une règle absolue, mais je la recommande vivement. Maintenant, disons que tu m'ignores. Et si vous vouliez utiliser des modèles open source massifs, les plus grands et les meilleurs ? Eh bien, voyons quel modèle open source est le meilleur. Voici l'arène des chatbots. Les modèles Gemini Open AI et Grock Four sont tous propriétaires. Le modèle open source le mieux classé est donc Kimik. Allons sur le site de Kimi K. Selon cette page Web, Kimi K représente 1 billion de paramètres Donc, en réalité, nous aurions besoin 16 GPU H 100 pour exécuter ce modèle Tout d'abord, c'est cher. 16 GPU H 100 coûtent 64$ pour seulement 1 heure d'utilisation. Ensuite, il est compliqué de faire des inférences pour un modèle de cette taille Tout cela pour dire que si vous souhaitez utiliser des modèles open source de pointe, vous devez utiliser des API proposant des modèles open source car leurs prix bénéficient d'économies d'échelle. Il est moins coûteux pour vous d'appeler une API que d'exécuter vous-même ces énormes modèles. Pour plus de détails, vous pouvez consulter ce billet de blog, que je publierai sur le site Web de notre cours. Pour utiliser des modèles open source de pointe, suivons les trois mêmes sous-étapes Testez via un chatbot, testez via une API et optimisez les coûts. À partir de la première sous-étape, testons via un chatbot Accédez à gpthss.com. N'oubliez pas que c'était notre message d'avant. Nous nous attendons à ce que l'IA renvoie le vrai, le faux et le faux. Accédez d'abord à cette URL et copiez l'invite. Vous verrez alors une page Web comme celle-ci. J'ai choisi de continuer avec un raisonnement visible, mais vous pouvez choisir l'une ou l'autre option. Aucune des deux options ne modifie la qualité des réponses de l'IA. Collez votre invite et appuyez sur Exécuter. Vous verrez alors vrai faux faux, la bonne réponse. Dans la barre de gauche, cliquez maintenant sur GBTOSS 20 milliards, le plus petit des deux modèles open source d'Open AI Ensuite, en haut à droite, cliquez sur Nouveau chat. Votre écran ressemblera alors à ceci, collez à nouveau l'invite et appuyez sur Exécuter. Encore une fois, vous verrez « vrai », « faux », « faux », la bonne réponse. Nous avons constaté que le meilleur de l' IA open source pouvait accomplir notre tâche. Maintenant, retestons via l'API. Sur huggingface.co, de nombreux modèles open source ont une section en bas à droite où vous pouvez envoyer des messages uniques au LLM pour le tester Ce n'est pas non plus gratuit techniquement, mais vous pouvez envoyer des demandes sans ajouter d'informations de facturation. Collez votre message et Deep Seek R One passe. Il produit un vrai faux faux. Cela signifie que l'IA open source, comme Deepsk, peut également résoudre notre problème. Deepsek R one aurait coûté un tiers de cent pour exécuter cet exemple Comme précédemment, trouvons maintenant le modèle le moins cher capable de mener à bien notre tâche. Essayons le prochain modèle le moins cher. Deep Seek R One Lama 7 milliards. Ce modèle obtient également la bonne réponse , le vrai faux faux. Deep Seek Lama lui a coûté un sixième de cent, nous avons donc réduit notre coût de moitié. Essayons maintenant le troisième Deep Seek V le moins cher. Techniquement, Deep Seek V Three a répondu « vrai, faux », « faux » correctement. Il l'a simplement fait avec beaucoup de texte supplémentaire. Malheureusement, si Deep Seek produit des formats différents à chaque fois, code de notre projet ne sera pas en mesure d' analyser la sortie LLM Heureusement, nous avons un moyen de résoudre ce problème, que je vous montrerai plus tard. Mais pour l'instant, Deep Seek V Three ne passe pas. Il a l'intelligence mais pas le formatage. Essayons le deuxième moins cher de notre liste, Lama 370 milliards. Hugging Face continue malheureusement de me donner des erreurs. J'ai donc trouvé un autre site Web au hasard. Je ne suis pas nécessairement d'accord, mais n'importe quel site Web fera l'affaire. Et il semblerait que 370 milliards répondent correctement en faisant de vraies fausses chutes. Lama passe donc 370 milliards. Essayons le prochain modèle le moins cher de notre liste. Deep cherche Quin. plus petit modèle distillé de Deep Seek RO ne fait que cracher une chaîne infiniment longue Il s'agit donc d'un échec cuisant. Quin a échoué de façon catastrophique, comme nous l'avons vu. Cela dit, nous avons maintenant terminé notre tableau des résultats. Nous pouvons réinscrire tous les prix et les centimes, puis comparer les prix de l'Open AI avec ceux de l'open source pour comparer l'intelligence par dollar. Voici les gagnants de chaque catégorie. Notez la différence de coût. Certes, j'aurais pu tester modèles open source plus petits, moins chers que 70 milliards mais plus performants que Quinn, mais tous plus petits, et ils peuvent faire fonctionner votre propre machine gratuitement Il ne sert donc à rien de tester leurs API L'API Open EI est 15 fois moins chère pour cette tâche spécifique qui consiste à détecter correctement les critiques non alimentaires sur la base de nos résultats précédents. En général, qu'il s'agisse de modèles de pointe ou de pointe, les modèles propriétaires surpassent les modèles open source en termes d'intelligence par dollar Donc, si nous envisageons l' open source, éloignons-nous de la pointe et restons-en à de petits modèles open source. Ces modèles peuvent en fait être très économiques à utiliser seuls. Donc, en résumé, je recommande d'utiliser de petits modèles open source. Au moins pour l'instant, pour les grands modèles open source de pointe, nous avons terminé nos trois sous-étapes Ceci complète l'évaluation pour les grands modèles open source. Dans la leçon suivante, nous examinerons les petits modèles open source, suffisamment petits pour fonctionner gratuitement. Comme d'habitude, vous pouvez trouver tous les liens, carnets de notes et autres ressources sur le site Web du cours 8. Démonstration : exécuter un modèle open source: Exécutons maintenant des modèles open source gratuitement. Nous en sommes actuellement à la deuxième des trois étapes. Nous essayons actuellement de petits modèles open source. Pour l'instant, considérons Lama 3,28 milliards comme notre valeur par défaut. Il s'agit d'un petit modèle de langage qui devrait s'adapter à votre ordinateur portable. Bien entendu, il existe de nombreux autres modèles open source. Mais avant d'en parler, les prochaines diapositives feront référence à quelques termes tels que GPU, nœud, RAM et précision. Si vous ne connaissez pas ces termes, vous pouvez ignorer mon explication en toute sécurité et vous concentrer sur le point à retenir. J'inclurai également les définitions sur le site Web du cours à cette adresse URL. Maintenant, revenons à la règle numéro deux, nous avons déjà dit d'utiliser de petits modèles. Mais soyons plus précis quant à ce que signifie « petit ». Par petit, j'entends les modèles à GPU unique, qui sont bien plus simples que multi-GPU et en particulier les modèles multi-nœuds pour l'inférence Maintenant que nous nous sommes limités aux open source à GPU unique, quels modèles open source conviennent à un seul GPU ? Eh bien, cela dépend de deux facteurs la RAM de votre GPU et la précision de votre modèle. Je mettrai l'explication complète sur le site Web du cours. Mais pour l'instant, nous allons dire que les LLM avec 16 milliards de paramètres ou moins peuvent être installés sur un seul GPU Utilisons-le pour trouver un modèle open source à utiliser. De retour sur le site Web de Hugging face, sur le côté gauche, filtrez par taille de modèle Nous voulons 16 milliards de paramètres ou moins, mais 12 milliards est la valeur la plus proche que nous puissions utiliser. Ensuite, en haut à droite, triez les modèles par j'aime. Après les deux modifications, vous verrez une page comme celle-ci. En ce qui concerne le nombre de téléchargements, nous voyons un gagnant : Lama 3,18 milliards de dollars, Instruct, qui a enregistré plus de 9 millions de téléchargements le mois dernier . Utilisons ce modèle. Pour nos expériences open source, nous utiliserons un modèle de 8 milliards de paramètres issu de la famille de LLM Lama C'est l'un des modèles les plus téléchargés le mois dernier sur Hugging Face Et surtout, nous avons déterminé que ce modèle est adapté aux GPU que nous utilisons Accédez à cette URL pour ouvrir le code de démarrage que j'ai écrit pour vous. Vous devriez voir un carnet comme celui-ci. Maintenant, en haut du fichier, cliquez sur Tout exécuter. Il se peut qu'un message d'erreur s'affiche. Si une erreur de ce type s'affiche, vous devrez exécuter chaque étape manuellement. Pour exécuter manuellement, déplacez le curseur de manière à ce qu'il passe au-dessus de la première étape Un bouton Exécuter apparaît. Cliquez sur ce bouton Exécuter. Ensuite, même si la première étape est toujours en cours, vous pouvez immédiatement survoler l'étape deux et cliquer sur le bouton Exécuter Ensuite, vous devriez voir des lignes pointillées comme celle-ci indiquant que la deuxième étape est en file d'attente. Que vous appuyiez sur Exécuter tout ou que vous exécutiez les premières étapes manuellement, votre ordinateur portable installe désormais les prérequis et télécharge les poids Cela prendra de cinq à dix minutes. Alors pendant ce temps, continuez regarder cette vidéo. Après quelques minutes, la première étape sera terminée. Si vous voyez une coche verte, cela signifie que la première étape s'est terminée avec succès Au bout de quelques minutes, la deuxième étape devrait également se terminer. Encore une fois, vous devriez voir une coche verte indiquant le succès. Maintenant, que vous ayez déjà exécuté l'étape 3 ou non, à côté de l'étape 3, cliquez sur Exécuter. Après quelques secondes, nous verrons les œuvres de Lama abordant le sens de la vie. Vous devriez maintenant voir le message. Vous devez maintenant modifier l'invite comme vous le souhaitez et appuyer une fois de plus sur le bouton Exécuter. Traitez-le comme un robot de discussion personnel. Vous pouvez demander ou dire ce que vous pourriez normalement dire à Chat GBT Par exemple, nous pouvons demander à Lama de nous expliquer certaines mathématiques ou de nous demander à Lama de nous parler de notre plateforme d'apprentissage en ligne préférée. Il s'agit en fait de votre propre IA fonctionnant dans le cloud. Personne d'autre que vous n'utilise ce LLM dédié. Il est maintenant temps de tester Lama sur notre exemple de projet. Appuyez sur Exécuter dans la dernière cellule pour tester la capacité de Lama à identifier les critiques non alimentaires. Mais malheureusement, Lama se trompe disant que les première et troisième critiques sont vraies et qu'il s'agit toutes deux de critiques non alimentaires. En d'autres termes, Lama prédit le vrai faux vrai au lieu du vrai faux faux Nous allons résoudre ce problème dans la prochaine leçon sans entraîner le modèle. C'est ça. Nous avons maintenant lancé notre tout premier LLM open source, et nous avons enfin terminé la deuxième des trois étapes Comme je l'ai déjà mentionné, notre prochaine étape consiste à améliorer la qualité. Nous allons notamment améliorer la capacité de ce LLM open source à mener à bien notre exemple de projet 9. Affiner la qualité : Entrées de l'ingénieur: Dans cette leçon, nous allons améliorer nos capacités LLM en modifiant nos entrées C'est ce qu'on appelle généralement l'ingénierie rapide. Nous en sommes à la troisième des trois étapes, et nous affinons actuellement la qualité. Il y a deux sous-étapes ici. La première consiste à concevoir nos intrants. Si ce n'est pas déjà fait, rendez-vous sur cette URL pour ouvrir le code de démarrage que j'ai écrit pour vous. Si votre bloc-notes de la dernière leçon est toujours ouvert, utilisez-le. Si vous ouvrez ce bloc-notes pour la première fois, en haut du fichier, cliquez sur Tout exécuter. Les deux premières étapes dureront environ cinq à dix minutes, vous pouvez donc continuer à regarder cette promenade en attendant. Souvenez-vous de notre leçon précédente : 8 milliards de lamas n'ont pas réussi à accomplir notre tâche. Le format et la précision des sorties étaient tous deux incorrects. Notre première approche pour résoudre ce problème consiste à être précis. Cela semble être une astuce stupide, mais il suffit de spécifier le format Par exemple, fournissez trois lignes de sortie pour chaque ligne, indiquez vrai ou faux, aucun texte supplémentaire, aucun formatage Je l'ai déjà ajouté à votre bloc-notes sous une cellule intitulée Astuce 1. Dans votre bloc-notes, faites défiler la page jusqu'à la section de démonstration des entrées de structure, comme illustré ici. Passez la souris sur la cellule contenant le premier conseil, puis cliquez sur le bouton Exécuter qui apparaît Après quelques secondes, vous devriez voir le résultat suivant : vrai, faux, vrai. Les sorties sont toujours incorrectes. Nous nous attendons à ce que ce soit vrai, faux ou faux, mais nous corrigeons le format en ajoutant simplement quelques instructions à l'invite. Notre prochaine approche consiste à fournir des exemples. Ajoutons-en quelques-uns. Ajoutons maintenant trois exemples de critiques. Cinq sur cinq, le poulet était salé, mais bon, trois sur cinq, le marinero était trop aigre, trois sur cinq, le serveur n'était pas patient Et enfin, ajoutons les sorties souhaitées. Les deux premières critiques concernent des critiques alimentaires, et la dernière critique concerne une critique non alimentaire. Nous nous attendons donc à du faux, du faux, du vrai. Je l'ai déjà ajouté à votre carnet dans une cellule intitulée Astuce 2. Faites défiler la page vers le bas et passez votre souris sur cette cellule intitulée Astuce 2 Cliquez sur le bouton Run to peer, et au bout de quelques secondes, vous verrez « vrai », « faux », « vrai ». Malheureusement, les résultats sont toujours erronés, mais nous avons encore une astuce. Pour la troisième approche, nous demanderons une chaîne de pensée. En bref, demandez à Lama de montrer son travail. Dans notre invite au modèle, nous demanderons simplement la première raison étape par étape. Ensuite, nous indiquons très précisément le format de sortie. Comme d'habitude, je l'ai déjà ajouté à ton carnet. Faites défiler la page vers le bas, passez la souris sur le titre de cette cellule. Conseil 3, puis cliquez sur le bouton Exécuter qui apparaît Après quelques secondes, Lama prédit enfin correctement. Nous voyons un bloc de pensées que nous avons demandé et le résultat correct est vrai faux faux. Nous pouvons donc maintenant dire que 3,18 milliards de lamas peuvent mener à bien notre tâche Récapitulatif, nous avons appliqué trois conseils. Soyez précis, donnez des exemples et demandez une chaîne de pensée. Ensemble, ces trois éléments ont permis à notre modèle Lama d'identifier avec succès les critiques non alimentaires. Et si nous utilisions cette nouvelle invite améliorée sur nos modèles par le passé ? On dirait que Deep Seek V Three répond désormais avec succès à la question par du vrai faux, mais Quin 1,5 milliard de dollars produit toujours des déchets inutiles En conséquence, nos résultats en matière d' open source désormais comme on compare prix de l'IA ouverte à ceux de l' open source, Pei propose toujours informations bien supérieures par dollar, bien que nous ayons aujourd'hui un Lama de 8 milliards de dollars en activité capable de produire des réponses correctes de manière fiable sur du matériel gratuit, encore moins cher que tout ce produire des réponses correctes de manière fiable sur du matériel gratuit, qui précède. En résumé, soyez précis, donnez des exemples et demandez une chaîne de réflexion. C'est tout pour la première sous-étape d'ingénierie des entrées de nos modèles En résumé, nous avons amélioré avec succès la capacité de Lama à terminer notre exemple de tâche. Dans la leçon suivante, nous allons apporter une dernière série d' améliorations pour que notre modèle open source fonctionne manière robuste sur de grandes quantités de données Comme d'habitude, vous pouvez trouver toutes les instructions et le code de démarrage que j'ai utilisé sur cette URL 10. Affiner la qualité : sorties contraintes: Dans cette leçon, nous allons améliorer nos capacités LLM en structurant nos résultats Un mot d'avertissement. Cette leçon contient beaucoup de code. Si vous n'êtes pas à l'aise avec le code, concentrez-vous simplement sur les points à retenir dont je parle plutôt que sur le code lui-même Il s'agit de la troisième de nos trois étapes. Dans la dernière leçon, nous avons conçu nos entrées pour améliorer la qualité des réponses du modèle. Dans cette leçon, nous allons plutôt améliorer la qualité en limitant nos résultats Si ce n'est pas déjà fait, rendez-vous sur ce L pour ouvrir le code de démarrage que j'ai écrit pour vous. Si votre bloc-notes de la dernière leçon est toujours ouvert, utilisez le même bloc-notes. Si vous ouvrez ce bloc-notes pour la première fois en haut du fichier, cliquez sur Tout exécuter. Les deux premières étapes dureront environ cinq à dix minutes, vous pouvez donc continuer à regarder cette promenade en attendant. Souvenez-vous de notre démo open source, Lama 8 milliards de personnes n'a pas réussi à terminer notre tâche. Le format et la précision des sorties étaient tous deux incorrects. Reproduisons à nouveau ce résultat. Dans votre bloc-notes, faites défiler la page vers le bas jusqu' à la démonstration des sorties de structure. Passez la souris sur l'exemple A, puis cliquez sur Exécuter. Vous allez recevoir ce blob de texte. Il est à la fois incorrect et mal formaté. Nous voulons une liste du vrai ou du faux. Corrigez ce problème. Dans la leçon précédente, nous avons appliqué trois conseils. Soyez précis, donnez des exemples et demandez une chaîne de pensée. Après avoir appliqué ces conseils, Lama a produit les bons résultats : vrai faux faux. Cependant, l'exactitude a eu un coût. L'invite initiale comportait 288 caractères. Cependant, la nouvelle invite prend 1 312 caractères. C'est une saisie 4,5 fois plus longue. Cela représente beaucoup de contributions. Pouvons-nous donc améliorer le format de sortie et l'exactitude sans augmenter le nombre de jetons d'entrée ? Et la réponse est, bien sûr, oui, laissez-moi vous expliquer. Voici le LLM. Il prend du texte en entrée et produit du texte en sortie. Dans ce cas, nos produits de base sont nos bananes. Et malheureusement, les résultats du LLM. Ce n'est même pas une réponse valable à la question. Pour résoudre ce problème, nous forçons le LLM à n'afficher que oui ou non. Ainsi, même si le résultat est erroné, au moins le résultat est valide. Pour ce faire, nous devons modifier cette étape à la fin, à savoir comment les LLM traduisent les résultats en mots Zoomons. En fait, le LLM produit d'abord une liste de numéros. Ces nombres sont en fait des probabilités qui correspondent à certains mots Dans notre exemple, la première probabilité est la probabilité d'un « oui ». La seconde, la probabilité d'un non, la troisième de R et la dernière de est. La probabilité la plus élevée est de 60 %, et le mot correspondant est R. Nous obtenons donc finalement R. C'est ainsi que le LLM prédit normalement, mais notre objectif est de n'obtenir que oui ou Apportons donc quelques modifications. Tout d'abord, ne tenez pas compte de tous les autres mots. Ne considérez que oui ou non. Et nous prenons maintenant la probabilité la plus élevée, 10 %, ce qui correspond à « oui ». Enfin, nous indiquons « oui ». Grâce à cela, nous avons réussi à limiter notre LLM à ne produire que des réponses « oui » ou « non », en utilisant le mot valide ayant la plus forte probabilité Dans cet exemple, nous voulions uniquement un oui ou un non. Nous utilisons donc les probabilités de ces deux mots et nous avons simplement choisi le plus probable des deux Maintenant, notre LLM est obligé de fournir un résultat par oui ou par non, et surtout, nous l'avons fait sans modifier le nombre de jetons d'entrée Retournez à votre bloc-notes et faites défiler l'écran vers le bas jusqu'à la configuration de l'étape zéro. Passez la souris sur la cellule et cliquez sur Exécuter. Vous ne verrez aucune sortie pour cette étape. Vous êtes maintenant configuré. Pour notre premier exemple, nous allons forcer le vrai ou le faux. De manière équivalente, nous pouvons dire que nous allons forcer un booléen. Un booléen est un vrai ou un faux. Par exemple, nous demandons que le M correspond aux bananes et à la production forcée soit vrai ou faux. Passez maintenant le curseur sur le premier exemple et cliquez sur Exécuter. Cela produira un seul booléen vrai. Cela est correct. Les bananes sont des fruits. Pour notre prochain exemple, nous allons forcer trois booléens au lieu d'un seul Maintenant, nous vérifions si les bananes, les amandes et les pommes de terre sont des fruits. Déplacez votre souris sur le deuxième exemple et appuyez sur Exécuter. Vous verrez maintenant les résultats « vrai », « faux ». Cela est correct. Voyons maintenant si nous pouvons l'utiliser pour restreindre le format de sortie de nos critiques non alimentaires Passez la souris sur l'exemple B, puis cliquez sur Exécuter. Et cette sortie est composée de trois booléens. Le format de sortie est valide. Malheureusement, le résultat est toujours erroné. Cela doit être vrai, faux, faux, faux, faux. Continuons donc. Pour notre troisième exemple, nous allons forcer le modèle à raisonner pas à pas. Pour cette étape, nous allons d'abord demander au modèle de raisonner. Forcez ensuite le modèle à afficher du texte entre les think tags. Vous pouvez choisir le format que vous souhaitez pour réfléchir. C'est exactement le format que j'ai choisi. Comme auparavant, l'invite consiste à vérifier si les bananes, les amandes et les pommes de terre sont des fruits. Déplacez votre souris sur le troisième exemple, puis cliquez sur Exécuter. Cela prendra un certain temps pour s'exécuter environ 45 secondes. Ensuite, vous verrez le résultat final avec le bon raisonnement et mieux encore, les bons résultats vrai, faux, faux. Appliquons maintenant les mêmes résultats structurés à notre exemple de projet pour les critiques non alimentaires. Passez la souris sur l'exemple C et cliquez sur Exécuter. Vous verrez le raisonnement ainsi que la bonne réponse à la fin. Maintenant, en structurant nos sorties, nous avons amélioré la qualité de notre modèle et forcé les sorties à correspondre à un format spécifique. C'est une situation gagnant-gagnant. Nous avons également considérablement réduit la durée des messages. L'invite initiale comportait 288 caractères. Lors de la dernière leçon, nous avions besoin de 1 312 caractères. Dans cette leçon, nous n'avons eu besoin que de 386 caractères, ainsi que de sorties structurées pour obtenir la bonne réponse. Grâce à une ingénierie rapide, nous avions besoin d'un délai 4,5 fois plus long pour produire les bons résultats. Avec les sorties structurées, nous avons une invite beaucoup plus courte, 1,3 fois plus longue. Et nous avons la garantie que le résultat sera toujours valide. Cela ne veut pas dire que l'un est meilleur que l'autre, mais je tiens à souligner qu' ingénierie rapide et des résultats contraignants seront en fait le plus souvent utilisés ensemble pour optimiser la qualité du modèle Essayons maintenant de contraindre les sorties pour un modèle propriétaire, à savoir également les modèles d'IA ouverte Accédez à platform.openi.com. Votre page Web ressemblera à ceci. Assurez-vous de cliquer sur Se connecter en haut à droite si ce n'est pas déjà fait. Cliquez ensuite sur le tableau de bord en haut à droite. Cliquez sur Créer au centre de la page, et vous devriez voir une page comme celle-ci. Cliquez sur le sélecteur de modèles. le menu déroulant, sélectionnez GPT five Nano et votre écran devrait maintenant ressembler à ceci En bas à droite, assurez-vous de sélectionner Effacer automatiquement. Ensuite, à côté du nom du modèle, cliquez sur l'icône Paramètres. Cela fera apparaître un menu de paramètres. Cliquez sur le menu déroulant du format de texte, puis dans le menu déroulant, vous pouvez cliquer sur Sélectionner le schéma JSON Vous pouvez donc configurer des sorties contraintes. Assurez-vous qu'il s'agit d'un schéma JSON et non d'un objet JSON. Cela ouvrira une boîte de dialogue comme celle-ci. Collez ce qui suit, que vous obtiendrez réellement à partir de cette URL. Copiez le schéma JSON de sortie contraint. Collez ensuite le schéma JSON ici. Faites défiler la boîte de dialogue vers le bas et cliquez sur Enregistrer. Nous verrons le schéma JSON reflété dans le menu ici. Cliquez ensuite en dehors du menu. À partir de cette URL, copiez l' invite d'exemple de projet précédente. Collez l' invite d'exemple de projet ici et appuyez sur Exécuter. Et maintenant, nous avons la sortie au format JSON. Essayez les modifications aléatoires que vous souhaitez apporter à l'invite, l'EPI renverra toujours les sorties dans ce format Et avec cela, vous avez réussi à limiter les sorties pour ce GPT En résumé, la structuration des sorties force la sortie à être valide Nous pouvons forcer le oui ou le non, nous pouvons forcer les chiffres, nous pouvons imposer le format que nous voulons pour les modèles open source et propriétaires. Nous avons discuté de son fonctionnement, d'un exemple simple pour identifier les fruits et d'une amélioration de notre détection des critiques autres que les fruits. C'est maintenant la fin de notre troisième étape. Nous avons vu deux manières d'améliorer la qualité de notre modèle sans aucune formation, ce qui conclut notre leçon sur la structuration des résultats Et en fait, c'est la fin de notre troisième des trois étapes. Et maintenant, vous n'avez terminé que le début de votre aventure de création avec l'IA. Ce sont les premières étapes que tout le monde devrait suivre pour un projet impliquant l'IA. Vous pouvez accéder à cette URL pour obtenir une copie du code de démarrage, d'autres instructions et d' autres ressources Dans la prochaine leçon, nous terminerons le cours. 11. Conclusion: Vous avez atteint la toute fin du cours. Terminons par un bref résumé de ce que vous avez appris. Tout d'abord, définissez le périmètre de votre projet. Pour ce faire, nous l'avons décomposé en trois sous-étapes. Concentrez-vous sur la tâche générale de texte à texte. Concentrez-vous ensuite sur les capacités de synthèse, de structuration des données et de codage de texte à texte éprouvées sur le plan commercial synthèse, de structuration des données et de codage de texte à texte synthèse, de structuration des données et Enfin, définissez vos entrées, sorties, votre tâche et votre métrique. À titre d'exemple, il s'agissait de la description du projet pour détecter les critiques non alimentaires. Pour notre deuxième étape, évaluez les modèles afin que nous puissions en choisir un à utiliser. Pour ce faire, nous avons à nouveau trois sous-étapes. À un niveau élevé, commencez par l' IA la meilleure et la plus intelligente. Testez les modèles via le chat bot, l'interface la plus simple et la plus conviviale, puis testez les modèles via une API afin que vos résultats soient plus répétables et reproductibles Enfin, optimisez les coûts en testant des modèles moins chers et plus rapides pour voir s'ils mènent à bien votre tâche. Une fois que nous avons choisi un modèle, nous affinons la qualité. Pour ce faire, nous avons suivi deux sous-étapes. Commencez à améliorer la qualité en affinant vos intrants. C'est ce que nous appelons l'ingénierie rapide. Limitez ensuite les sorties. Cela peut encore améliorer la fiabilité et la qualité de votre modèle. Cela complète notre processus en trois étapes, vous pouvez désormais utiliser pour créer n'importe quel projet impliquant l'IA. Ce n'est qu'un début, mais c'est une base solide pour comprendre dans quelle mesure l'IA peut accomplir votre tâche. Maintenant, en utilisant le processus ci-dessus comme guide, appliquez-le à votre propre projet et publiez le résultat dans l'onglet Projet du cours. N'hésitez pas à utiliser l'un de mes exemples de projets ou à créer le vôtre. Je suis très impatiente de voir ce que vous allez créer. Si vous souhaitez en savoir plus sur les cours de suivi, suivez-moi sur Skillshare et consultez mes autres Félicitations. J'arrive à la toute fin du cours.

Intelligence artificielle pour débutants : créer gratuitement un ChatGPT personnalisé en 3 étapes

Alvin Wan, Research Scientist

Regardez ce cours et des milliers d'autres

Regardez ce cours et des milliers d'autres

Leçons de ce cours

1.

Introduction

1:14

2.

Projet de portée : Texte en texte

5:52

3.

Portée du projet : capacités

5:57

4.

Projet de portée : tâche et métrique

5:32

5.

Évaluez les modèles : Tester le meilleur

6:22

6.

Évaluer les modèles : Optimiser les coûts

3:40

7.

Évaluer les modèles : Open-Source

7:03

8.

Démonstration : exécuter un modèle open source

4:32

9.

Affiner la qualité : Entrées de l'ingénieur

4:25

10.

Affiner la qualité : sorties contraintes

9:18

11.

Conclusion

2:00

À propos de ce cours

Rencontrez votre enseignant·e

Alvin Wan

Compétences associées

Projet de cours pratique

Notes attribuées au cours

Pourquoi s'inscrire à Skillshare ?

Apprenez, où que vous soyez

Cours apparentés

Transcription