GPT-3 pour les Chatbots: : créer une IA Conversational avec le réglage fin

Mariam Omar, Skilled in AI, Chatbots, Robotics

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

- 1.
  
  Introduction au cours de finalisation
  
  1:11
- 2.
  
  Comprendre les modèles de GPT et le réglage fin pour des domaines spécifiques
  
  1:59
- 3.
  
  Maîtriser les Fine-tuning pour les applications NLP
  
  1:55
- 4.
  
  Introduction au terrain de jeu OpenAI
  
  5:09
- 5.
  
  Maximiser l'exactitude des modèles à l'aide de la préparation des données et de la mise en forme
  
  2:09
- 6.
  
  Affiner le modèle GPT : comprendre les formats de données
  
  9:46
- 7.
  
  Le nettoyage de données avec Python : supprimer les valeurs manquantes et les doubler
  
  9:40
- 8.
  
  Générer des questions et des réponses à partir de textes pour les modèles d'IA en perfectionnement finis
  
  7:27
- 9.
  
  Utiliser ChatGPT pour générer du code Python pour la manipulation des données
  
  5:05
- 10.
  
  Exécuter et exécuter le code Python sur Google Colaboratory
  
  8:11
- 11.
  
  Créer un répertoire de projets bien structuré
  
  3:37
- 12.
  
  Comment choisir un modèle pré-formé pour le réglage fin
  
  3:13
- 13.
  
  Introduction au processus de réglage fin dans Python
  
  3:09
- 14.
  
  Parler d'un modèle pré-entraîné : un processus en trois étapes
  
  11:49
- 15.
  
  Tester votre modèle parfaitement réglé sur OpenAI Playground
  
  3:54

Niveau débutant

Niveau intermédiaire

Niveau avancé

Tous niveaux

133

apprenants

projets

À propos de ce cours

Dans ce cours, vous découvrirez le pouvoir de GPT-3 dans la création de solutions d'IA conversationnelles.

Nous commencerons par une introduction aux chatbots et à leurs cas d'utilisation, puis nous plongerons dans le GPT-3 et ses fonctionnalités. Vous apprendrez à affiner le modèle pour des tâches spécifiques, telles que le service à la clientèle, la génération de leads ou le divertissement. Nous aborderons les techniques pour améliorer la précision et la fluidité des réponses du chatbot's ainsi que les stratégies de gestion des entrées des utilisateurs et des flux de conversation.

Ensuite, nous explorerons différentes façons d'intégrer les chatbots GPT-3 à différentes plateformes et canaux, telles que les applications de messagerie, les assistants vocaux et les médias sociaux. Vous apprendrez à utiliser des API et des SDK pour connecter votre chatbot à ces plateformes et exploiter leurs fonctionnalités, telles que le traitement du langage naturel, la reconnaissance vocale ou le support multimédia riches. Nous aborderons également les meilleures pratiques de conception des interfaces utilisateurs de chatbot et les tests et le déploiement de votre chatbot dans la production.

À la fin de ce cours, vous aurez une compréhension approfondie du fonctionnement du GPT-3 et de la façon de l'utiliser pour créer des chatbots puissants et attrayants pour votre entreprise ou vos projets personnels. Vous aurez une expérience pratique dans le monde des affinés des modèles GPT-3 et les intégrera à diverses plateformes et canaux. Vous serez prêt à appliquer ces compétences dans des scénarios réels.

vous pouvez trouver toutes les ressources de cours ICI

Rencontrez votre enseignant·e

Mariam Omar

Skilled in AI, Chatbots, Robotics

Enseignant·e

Hello, I'm Mariam Omar, and I'm thrilled to be sharing my passion for AI, Chatbots, and Robotics with you on Skillshare. I've spent the last 8 years working in this exciting and dynamic field, and I've had the opportunity to work on a wide range of projects, from designing autonomous drones to creating virtual assistants for healthcare.

One of my favorite things about AI, Chatbots, and Robotics is that they have the power to transform the way we live and work. With the rapid advances we're seeing in these technologies, there's never been a more exciting time to be involved in this field.

As an instructor on Skillshare, I'm committed to providing you with the knowledge and skills you need to succeed in this rapidly evolving industry.

My courses will be designed ... Voir le profil complet

Compétences associées

Développement Plus en développement Science des données

Level: Intermediate

Projet de cours pratique

Créer un modèle de réponses aux questions à l'aide du GPT-3 pour le processus d'application des instructeurs Skillshare

Description du projet :

dans ce projet, vous élaborerez un modèle de questions basé sur le GPT-3 pour répondre aux questions liées à la project, d'instructeurs sur Skillshare. Vous commencerez par collecter des données à partir du centre d'aide de Skillshare et les transformer en invitations et complications. Vous convertirez ensuite les données collectées dans le format requis pour affiner le modèle GPT-3.

Ensuite, vous affinerez le modèle GPT-3 à l'aide des données collectées et évaluerez ses performances en le testant sur de nouvelles questions. Une fois que vous serez satisfait des performances du modèle, vous partagerez le résultat en prenant une capture d'écran de la réponse du modèle sur le terrain de jeux GPT-3 ou en créant une vidéo présentant la capacité du modèle à répondre à des questions liées à la formation d'instructeurs sur Skillshare.

À la fin de ce projet, vous aurez acquis de l'expérience dans la collecte et la mise en forme de données pour la formation d'un modèle NLP, l'affinage d'un modèle GPT-3 pré-formé et la création d'un système de questions-réponses. En outre, vous trouverez un exemple pratique sur la façon dont les modèles NLP peuvent être utilisés pour automatiser les questions de service client.

Skillshare Member

Notes attribuées au cours

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Introduction au cours de finetuning: Nous savons tous que touch of beauty est un chatbot intelligent artificiel impressionnant, puissant et artificiel. Mais vous êtes-vous déjà demandé si vous pouviez utiliser des APT de jonction, des capacités impressionnantes pour créer votre propre projet qui peut vous aider dans votre Rick en fonction de vos données, exemple pour créer un chocolat qui aidera votre service client ? Si vous l'avez déjà fait, vous êtes au bon endroit. Je suis de l'argent, je suis sans abri. Et spécialiste de l'intelligence artificielle. Dans ce cours, je vais vous expliquer en quoi consiste le réglage précis pour effectuer l'ensemble du processus jusqu'à ce que vous puissiez créer vos propres types. Dans le premier module, nous allons apprendre ce qu'est le réglage précis, pourquoi est-ce important ? Et quels types de projets les gens utilisent-ils pour peaufiner ? Dans ce deuxième module, nous travaillerons sur la préparation des données. Comment préparer nos données dans un format qui peut réellement être donné à un modèle préentraîné et travailler dessus pour affiner notre propre modèle dans notre domaine spécifique. Dans le troisième modèle, nous allons configurer le processus de réglage précis et atteindre un niveau qui nous permettra de tester et d'évaluer les performances de notre modèle. À la fin de ce cours, vous aurez acquis de précieuses compétences en matière réglage précis et vous serez prêt à mettre en œuvre votre propre projet. Alors allons-y. 2. Comprendre les modèles de GPT et le réglage fin pour des domaines spécifiques: Bienvenue à la première leçon de ce cours. Dans notre leçon d'aujourd'hui, nous parlerons des modèles GPT. Quels sont-ils et quelles sont leurs limites ? Et pourquoi penserions-nous à peaufiner nos propres modèles, ce qui nous permettra de comprendre le réglage précis Qu'est-ce que cela signifie et où est-il réellement conservé ? Les modèles Gpt-3 sont une vaste et puissante famille de modèles linguistiques. Ils peuvent tous traiter du texte, des instructions, questions et toute information en fonction de ce pour quoi ils ont été formés. Ils appliquent le traitement du langage naturel, un sous-domaine de l' intelligence artificielle qui concerne les ordinateurs. Comment traitent-ils, interprétent-ils et génèrent-ils le langage humain ? Ces modèles pré-entraînés, préalablement formés par open here, ont appris à gérer le langage humain, ce qui en fait un excellent départ pour de nombreuses applications. Mais nous devons nous adapter et faire face aux nôtres. Bien qu'ils soient très puissants et impressionnants, ils ont des limites. Et ce sont ces limites qui nous inciteront à peaufiner les nôtres. L'une de leurs limites est qu'ils ont une limite supérieure en termes de qualité et qu'une personne doit effectuer de nombreuses tâches d'ingénierie rapides pour obtenir une réponse rapide. Une autre limitation est qu'il existe une taille maximale pour la face avant. Vous devez donc travailler rapidement et correctement. Et vous ne pouvez pas fournir beaucoup d'exemples au modèle pour obtenir une bonne réponse. Les autres limites dont nous pouvons parler sont la côte et l'alphabétisation. Nous savons que GPT facture la tokenisation. Ce n'est donc pas un choix judicieux de penser à dépendre d'eux pour toujours et à les garder. Cela nous amène donc à réfléchir à la mise au point. Et pourquoi peaufinerions-nous nos propres modèles et les forçerions-nous à fonctionner et à nos domaines spécifiques Mais qu'est-ce que le réglage précis ? Le réglage précis est une technique qui permet d'utiliser des modèles préentraînés, de les adapter à nos tâches de commande. Mais d'abord, nous devons nous fier à l'automobile en supprimant la dernière couche alimentant le moteur avec nos propres ensembles de données préparés, ce qui créera en fait un modèle qui sait exactement quelles sorties il doit fournir. 3. Mastering Fine-tuning pour les applications NLP: Le réglage précis est une technique puissante qui permet d'adapter modèles préentraînés à des applications NLP spécifiques. Dans cette leçon, nous aborderons les concepts clés, les étapes à suivre pour être prêt à les ajuster avant de décider d' affiner votre modèle. Et vous devez comprendre le problème sur lequel vous travaillez. Quelle est la tâche à accomplir et quelles sont les exigences de cette tâche, telles que la rapidité, la précision. Vous devez également connaître les caractéristiques du jeu de données que vous utilisez, telles que la taille, le domaine et le type de données que vous utilisez ? En répondant à ces questions, vous êtes tout à fait prêt à déterminer si réglage précis est la solution à votre problème ou non. Une fois que vous avez décidé de trouver et de régler un modèle, vous devez choisir le modèle pré-entraîné sur lequel vous souhaitez vous fier. Il existe de nombreux types de modèles préentraînés, chacun ayant ses points forts et reconsidérez-le. Certains d'entre eux ont été formés à la génération de données ou de textes. D'autres sont parfaits pour le codage. Vous devez donc choisir le modèle qui a été entraîné sur des données similaires à celles que vous utilisez. Ou dans ce domaine précis. Cela rendra le réglage précis ou efficace. Oxford, vous choisissez le modèle préentraîné que vous devez commencer à modifier lors de la préparation de vos données. La préparation des données implique de modifier le format des données pour qu'il adopte un format compréhensible par le modèle préentraîné, tel que la tokenisation et le codage. Si vos données sont prêtes, c'est la clé pour commencer à peaufiner les réglages. Cela signifie qu'il faut continuer à entraîner le modèle pré-entraîné sur le jeu de données que vous avez préparé. Une fois que vous avez affiné votre modèle, vous devez évaluer ses performances. Vous devez essayer le modèle, lui donner des données, voir quelles sorties il vous donne. Cela vous aidera à effectuer une analyse des erreurs pour identifier les vos modèles et comment améliorer leurs performances. Donc, après avoir compris votre problème, préparé vos données, choisi le modèle pré-entraîné, ajusté le modèle et l'avoir évalué. Vous serez sur le point de maîtriser le réglage précis des applications de PNL. 4. Introduction à OpenAI Playground: Bonjour et bienvenue à une nouvelle leçon. Dans notre leçon d'aujourd'hui, nous allons présenter un aperçu des IA ouvertes. Cliquez dessus. Playground est une interface en ligne facile à utiliser qui permet aux utilisateurs d'expérimenter et de tester les fonctionnalités des API des modèles de chat qu'ils ont créés. Le fait est que chaque fois que nous voulons réduire les données, vous n'avez pas besoin de connaissances préalables en programmation. Tout utilisateur ou toute personne qui ne connaît rien à la programmation peut réellement utiliser le Play-Doh. Parce que le terrain de jeu est une interface qui permet de tester les modèles déjà pré-entraînés réalisés par OpenAI. Vous pouvez également l'utiliser pour tester vos propres modèles affinés. Donc, pour vérifier quel est ce terrain de jeu, allons-y. Nous allons aller sur un site Web appelé OpenAI Playground. Une fois que vous avez tapé opening the grounds, il vous faudra ouvrir une belle page où vous pourrez générer vos clés d'API. Ici, vous pouvez présenter vos clés API ou créer un nouveau secret, le cas échéant N'oubliez pas que ces clés API sont celles que nous utilisons pour affiner nos propres modèles, créer nos propres chatbots, etc. Et chaque fois que vous en générez une nouvelle, vous devez la copier et en conserver une copie car c'est une clé secrète qui ne vous apparaît plus ici. C'est donc la page où nous pouvons réellement créer des clés d'API et les récupérer. Mais dans cette page, nous voulons aller au terrain de jeu situé dans la partie supérieure. Une fois que j'ai cliqué sur le terrain de jeu en haut, c'est le terrain de jeu, celui dont nous avons un aperçu de ses fonctionnalités aujourd'hui. Tout d'abord, le Brigham est un outil de test pour les modèles. Ainsi, sur le côté droit, vous pouvez choisir dans cette liste déroulante, quel modèle utilisez-vous ? J'ai ici les différents modèles d' Open AI, Da Vinci Query, Babbage et Adele, et ils ont des spécifications différentes. Nous en reparlerons plus tard. Je peux savoir lequel d'entre eux je dois tester. Une fois que vous avez choisi le modèle, vous avez cette boîte ici. Il s'agit des livres d'entrée et de sortie. C'est l'endroit où vous pouvez poser une question telle que votre invite, telle que les noms des voitures effacées, et envoyer l'invite. Et au même endroit, vous pouvez recevoir les obligations à risque en provenance de Copenhague. Il s'agit donc d'une zone d'entrée et de sortie où votre invite apparaît lorsque la réponse à apparaît lorsque la réponse à cette invite apparaît telle quelle Il existe d'autres paramètres sur lesquels vous pouvez travailler afin de contrôler cette liaison. Parlons par exemple du paramètre de température. La température est un paramètre qui varie de 0 à 1. Si vous le mettez à zéro, cela signifie que vous ne souhaitez pas que le modèle fasse preuve de créativité en vous répondant. Si vous le mettez en un, cela signifie que vous voulez que le modèle soit très créatif et qu'il vous donne des réponses différentes chaque fois que j'essaie de donner des réponses créatives également. Si vous voulez parler du paramètre de longueur maximale, nous parlons en fait de la tokenisation. Et il s'agit d'un chiffre qui peut en fait être le montant précis auquel vous souhaitez que le modèle vous réponde. Il ne s'agit pas seulement de la réponse, mais aussi de l'invite. Remplaçons donc ce paramètre sur true. Par exemple, actualiser. Vous envoyer à nouveau un message. Et la réponse que vous recevrez est très courte car cela représente au total environ deux jetons. Mais donnez-lui plus, disons bronzez et vous soumettez et vous obtiendrez une réponse plus longue, car cette réponse ici avec l'invite est environ dix jetons. La séquence d'arrêt est une variable qui nous permet de faire comprendre à notre modèle étranger une variable qui nous permet de faire comprendre à notre modèle étranger quand il faut arrêter de répondre à une invite. C'est un personnage que nous déciderons ou que nous utiliserons chaque fois que nous testerons nos modaux affinés. Voici donc les paramètres que je peux modifier ici. Il existe également d'autres fonctionnalités sur le terrain de jeu et je peux les désactiver, par exemple toute invite générée peut être enregistrée. Il est également partageable, donc c'est bien. Vous pouvez le partager avec d'autres personnes. Vous pouvez le copier, prendre une copie et le conserver où vous le souhaitez, par exemple sur vos documents, etc. Une autre chose dont je voudrais parler est la barre ci-dessus. Vous aurez différents onglets ici. Et ceux-ci sont très utiles car vous pouvez trouver de nombreuses informations sur la documentation. Et cela lui a ouvert les yeux sur le blog et sur d'autres exemples d' instructions que vous pouvez utiliser pour tester les GP T-Mobile. Si vous allez dans la section documentation, nous quitterons le terrain cette invite disparaîtra. Mais vous trouverez de nombreux dossiers descriptifs, fichiers sur tout ce dont vous pourriez avoir besoin d' autres didacticiels sur la tokenisation, la tarification ajustements et tout autre document dont vous pourriez avoir besoin pour vous aider gérer Open AI to be team. Voilà pour le terrain de jeu. C'est notre terrain de jeu. Encore une fois, il s'agit d'une interface simple qui permet aux utilisateurs ou aux développeurs de tester les capacités des modèles GPT. 5. Maximiser l'exactitude du modèle avec la préparation et la mise en forme des données: Bonjour et bienvenue à une autre leçon. Dans notre leçon d'aujourd'hui, nous allons parler des avantages de la préparation des données et de leur mise en forme avant de les utiliser pour affiner un modèle. Tout d'abord, nous devons savoir que préparation des données est cruciale pour un réglage précis. Pourquoi ? Parce que cela affecte la précision et l'efficacité du modèle. Tout d'abord, les données formatées sont utilisées à bon escient. Cela permet au modèle généraliser les modèles de manière satisfaisante, qui signifie que nos données doivent être étiquetées codées non structurée avant d'être transmises au modèle préentraîné données bien formatées constituent en fait un bon point de départ car elles réduisent les erreurs et garantissent que le modèle n' apprend pas d'informations biaisées. Ce jeu de données bien formaté réduit également le temps et les efforts nécessaires au traitement et au nettoyage des données. Les données se présentent en fait sous différents textes ou formats. L'utilisation de différents formats signifie que vous devez vous assurer que ces données sont préparées de manière à pouvoir être transmises aux personnes préformées. Les données se présentent donc sous différents formats. Et différents formats peuvent être utilisés pour les projets d'apprentissage automatique ou de traitement du langage naturel. Mais d'abord, en fonction des données dont vous disposez, vous devez connaître le nombre d'étapes à suivre pour le formater. Si vous avez un texte de ligne, vous devez savoir que pour cette ligne, les textes ne peuvent pas être transmis au modèle, mais nous pouvons néanmoins suivre quelques conseils de préparation pour le préparer à être transmis à un modèle pré-entraîné. fichiers CSV, connus pour les feuilles de calcul, constituent un autre type de données . Cela doit également être préparé de manière à ce que le modèle puisse le comprendre. Le dernier format dont je vais parler concerne les goûts et l'intrigue. Et il s'agit du lot Final Four que nous allons analyser et préparer sur n'importe quel type de données afin d'être prêts à fournir les données directement à utiliser pour affiner un modèle préentraîné. Dans cette leçon, nous avons donc parlé des avantages du formatage et de la préparation des données avant de peaufiner un modèle Nous avons également parlé des types de formats de données qui peuvent être utilisés pour affiner un modèle. Et dans la prochaine liste de leçons, nous parlerons de techniques et d' idées permettant de préparer les données de la meilleure façon possible. 6. Définir un modèle de GPT : comprendre les formats de données: Bonjour et bienvenue dans une nouvelle essence. Dans notre leçon d'aujourd'hui, nous allons parler du format des données que nous utiliserons pour affiner le mode TP, T. Tout d'abord, nous parlerons préparation de nos différentes données. Nous allons prévisualiser les différents ensembles de données gagnés. Nous discuterons de leurs forces et de leurs faiblesses. Alors ? Nous allons également mentionner des conseils sur la façon de disposer de données fiables, prêtes à être façon de disposer de données fiables, prêtes à utilisées pour peaufiner un modèle. Enfin, il y a quelque chose que je souhaite expliquer à la fin de cette leçon, à savoir l' ajout de suffixes aux données. Je vais aller sur mon Google Drive. J'ai ici un ensemble ou un groupe de jeux de données que j'ai préparés pour vous. Je veux les prévisualiser en les examinant et voir quelles sont les forces et les faiblesses d'un tel ensemble de données. Par exemple, j' ai ce premier fichier qui s'appelle Arduino. Arduino est un composant spécifique, un microcontrôleur. Imaginons ou créons un mode graphique. Ce chatbot est là pour répondre à toute question concernant Arduino. Donc, le truc, c'est que je dois regarder mes données. Tout d'abord, comme vous pouvez le constater, j'ai une série de questions à vous poser. Sur la gauche. J'ai les réponses à ces questions. Et ce sont là des questions différentes. Qu'est-ce qu'Arduino, quel type de licence possède le matériel Arduino ? Hughes et Soma, je veux vous montrer que c'est parfois un étudiant qui a une approche différente, par exemple, que sont les projets Arduino ? Alors, qu'est-ce qu'Arduino ? Qu' est-ce que le projet Arduino ? Ces deux réponses peuvent avoir la même réponse ou une réponse proche qui soit acceptable. Mais si vous regardez ici, quand a débuté le projet Arduino ? Le projet Arduino a débuté en 2005. C'est une perte de temps pour le modèle de lire chacune des données. J'ai donc un doublon ici. Donc, tout d'abord, je devrais supprimer cette ligne. Vous devez donc prévisualiser vos données et vous assurer d'avoir seule question à laquelle il existe une réponse connexe, une réponse unique. Parfois, j'utilise la même réponse, mais je dois certainement alimenter mon modal avec des structures de questions différentes. Il est donc acceptable d'utiliser deux phrases ayant le même sens , mais écrites différemment. Mais choisir la même réponse ou donner la même réponse à deux questions différentes n'est pas accepté. OK, prévisualisons un autre jeu de données. Je vais passer à celui-ci. Celui-ci parle de tremblements de terre. Il s'agit également d'un groupe de questions sur les tremblements de terre. Cet ensemble de données peut être utilisé, par exemple si vous êtes enseignant ou instructeur et que vous créez un outil pour aider vos élèves à poser questions sur cette unité ou quelque chose comme ça. J'ai donc différents groupes de questions qui ont chacune une réponse différente. Et comme vous pouvez le constater, il est acceptable d'avoir une réponse très longue liée à une question acceptable. Mais encore une fois, comme vous pouvez le voir, je n'ai ici, par exemple , que 25 valeurs et c'est la prochaine étape dont je vais parler. Nous ne devons pas entraîner ou affiner un modèle en fonction de seulement 25 entrées différentes. Et les résultats sont des instructions et des complétions. Nous devrions en fait donner au modèle au moins 200 instructions et complétions différentes afin de nous assurer que la phase finale ou les étapes de réglage se déroulent correctement. Bien. Il s'agit donc d'un bon ensemble de données mais il ne contient pas beaucoup d'informations. Prévisualisons-en un autre. Je vais m'en tenir à celui-ci, les données sur les troubles mentaux. s'agit également d'une initiative de questions-réponses, et elle est en fait créée d'une manière intelligente que je vais partager avec vous lors des prochains cours. Tout d'abord, qu'est-ce que le trouble mental ? Et voici la réponse ici. Il s'agit donc d'une série de questions posées à un groupe d'officiers. D'accord. C'est une bonne chose. Mais si je descends, j'ai des lignes vides et je ne devrais pas réellement avoir d' intégrales dans mon jeu Ces intégrales doivent donc être supprimées. Une autre question est la suivante : quelles sont les causes des troubles mentaux ? C'est une question. Et quelles sont les causes des troubles mentaux ? Comme je l'ai dit, ces deux questions sont rédigées différemment, mais elles donnent toutes deux la même réponse. Ce n'est pas grave parce qu'ils prennent en fait la même réponse. Bien, parce que j'ai différentes questions à propos de ces e-mails ou cela peut aider le modal à comprendre et à établir un lien entre les deux. Parfois, la question peut être posée de différentes manières. Bien. Je tiens également à faire attention au fait que, si vous pouvez le voir ici, sont des séries de questions qui se répètent en fait. J'ai une série de questions ici. Et je me pose peut-être mêmes questions, mais avec des manières différentes de taper. Ils doivent en fait être lus correctement, car ils ont été préparés à l'aide d'un outil en ligne qui génère des questions et des réponses. Ces lacs de données disparaissent donc. Si je fais défiler la page vers le bas, je peux voir que j'ai environ 138 lignes supprimant la ligne vide. Donc 150, je peux dire que c'est acceptable. Un tel ensemble de données peut donc être utilisé pour affiner et modéliser. Maintenant, nous allons prévisualiser le dernier que je vous ai préparé, qui est celui que vous trouverez ici. C'est différent. Pourquoi ? Parce que ce n'est pas sous forme de questions-réponses. Il est en fait construit sous forme d'instructions, de sujets, de sujets différents. Et ici, sur le côté droit des tweets de la personne, d'une personne en particulier. Désormais, ces données peuvent être utilisées, par exemple pour imiter la façon dont une personne répond aux gens. Si vous le pouvez, faites attention à l'importance de rester hydraté pendant l'exercice. Et sur le côté droit, j'ai son commentaire ou son tweet. Je viens de terminer une longue course et c'est génial N'oubliez pas de rester hydraté au réveil. De bons conseils pour améliorer vos habitudes de sommeil. J'ai aussi du mal à m'endormir, essayer de lire un livre auparavant, etc. Ce sont donc des tweets différents sur différents sujets. Et ces données peuvent être utilisées pour créer un robot de discussion capable de parler comme des personnes physiques de manière amicale. Vous pouvez voir ici qu'il est dit : « Les gars, je l'ai vivement recommandé » et il prononce quelques phrases exclamatoires. Parfois, il commence par vous poser une question, puis à donner son opinion à ce sujet. Tellement bon. Maintenant, comme vous l'avez vu dans les ensembles de données précédents, il y avait quelque chose auquel je n'ai pas vraiment prêté attention ou dont je n'ai pas vraiment parlé. En regardant chaque phrase de mon ensemble de données, j' ai dit que nous avions une invite. C'est l'invite ou la question que j'attends de mon utilisateur, celui qui va utiliser mon application pour saisir du texte dans le modèle. Et c'est la réponse que je m' attends à ce que mon Moodle leur donne. Comme vous pouvez le voir ici, à la fin de chaque invite, nous avons inclus une barre oblique inverse qui finit par s'effacer, et il s'agit d'un suffixe. suffixes sont censés être ajoutés à mes données avant de transmettre mes données au modèle. Cela permettra au modèle pré-entraîné comprendre que c'est là que la phrase ou l'invite et que c'est là que la fin ou la mienne répondent à la phrase commence. Et la complétion doit également inclure un suffixe. Deux suffixes différents. suffixes peuvent être une barre oblique inverse n Cela peut aussi être un mot tel que l'écriture de la fin du mot, par exemple en majuscule ou quoi Cela doit être répété dans chaque subvention, que ce soit d'autre. Cela doit être répété dans chaque subvention, et je dois m'assurer que cette spécificité des œufs n'est incluse dans mon ensemble de données nulle part dans les données. Mais maintenant, pour en revenir aux données des tweets, réfléchissons à la manière d'ajouter les suffixes et les préfixes en un clic. Je peux opter pour ce qui suit. Je peux le prendre, le coller dans la deuxième colonne. en revenir à la première colonne, c'est la première invite que j'ai. Je peux opter pour cela égal à. Nous appliquons donc en quelque sorte une fonction, cette cellule. Et je veux que vous y ajoutiez entre guillemets doubles car j'ajoute des chaînes, par exemple une barre oblique inverse. Et je peux terminer et m'envoyer n'importe quel n majuscule ou minuscule. C'est en fonction du suffixe que nous voulons utiliser, alors vous pouvez l'envoyer. Et comme vous pouvez le constater, il suggère en fait de remplir automatiquement les autres. Voulez-vous que j'ajoute également cette barre oblique inverse à chaque fois, je peux répondre par oui, non, en créant ensemble de bronze avec le suffixe dont j'ai besoin. Je vais donc copier cette loi. Je vais revenir à la première, mais je vais la coller uniquement sous forme de valeurs. Ensuite, je peux supprimer cette colonne d'ici. Maintenant, j'ai préparé mon ensemble de données avec le même suffixe ajouté à chacun d'eux, earn. Je peux également faire cette scène sur cet ensemble de données ici. C'est tout pour aujourd'hui. Pour conclure, nous avons simplement prévisualisé un groupe de jeux de données. Nous avons discuté de la manière d'utiliser ces ensembles de données pour différentes applications à l'aide de modèles GPT ou de réglages précis. Nous avons vu qu'il fallait supprimer les doublons dans Curios, ajouter des suffixes. C'est donc ce que nous avons dit ou ce dont nous avons parlé dans les leçons précédentes. Nous avons dit que chaque fois que je souhaite utiliser des données pour affiner, ces données doivent être étiquetées, structurées et codées. Et voici la forme finale des données que je vais utiliser pour mon point de vue de ce soir. Mais le fait est qu'avant de l'utiliser comme fichier Excel, je dois modifier ses deux anciens tuyaux adjacents. Et c'est ce que nous allons expliquer dans les prochaines leçons. Restez donc à l'affût et merci de m'avoir écouté. 7. Nettoyage des données avec Python : supprimer les valeurs manquantes et les duplicats: Bonjour et bienvenue à une autre leçon. Dans notre leçon d'aujourd'hui, nous allons travailler sur nos données. Nous voulons nous assurer de disposer données propres à être utilisées pour affiner les réglages. Le fait est qu'aujourd'hui, c'est l'une des techniques permettant d'utiliser code Python pour la préparation des données. Nous travaillons donc sur un fichier CSV, qui est un ensemble de données, et nous allons lire cette diapositive. Ensuite, nous voulons supprimer toutes les valeurs manquantes ou les doublons, car lors du réglage, les doublons sont réellement achetés. Ensuite, nous voulons enregistrer le nouvel ensemble de données dans un nouveau fichier. Voici donc notre plan pour la leçon d'aujourd'hui. Je vais donc d'abord accéder à un nouveau navigateur Web, et je vais accéder à quelque chose qui s'appelle Google Colab. Google Colab est un outil en ligne qui vous permet d'exécuter et d'exécuter facilement votre code Python. C'est donc ici que nous allons travailler. C'est la page principale qui chaque fois que vous accédez à Google Colab Vous devez vous assurer que vous êtes connecté à votre propre adresse e-mail, celle qui est liée à votre lecteur, parce que c'est là que nous allons conserver nos informations et les utiliser pour le lecteur gagné. Lorsque nous voulons appuyer pour tomber et démarrer un New York, nous devons nous assurer que les données que vous souhaitez l'enregistrement est sur votre lecteur. Je vais donc accéder à mon lecteur, à mon Google Drive, et m'assurer d'avoir préparé mes ensembles de données. Donc, en accédant au lecteur, je vous montre que j'ai créé un fichier appelé ensemble de données. À l'intérieur de cette ligne, j'ai collé ou téléchargé mes données. Et si je veux prévisualiser les données dont je dispose, vous pouvez voir que j'ai un ensemble de données sous forme de feuille Excel, vous pouvez voir que j'ai un ensemble de données sous forme de feuille Excel, un fichier CSV contenant des informations sur les ordinateurs et leur vitesse ou d'autres informations dont j'ai besoin, telles que le prix et l' endroit où je peux les trouver, le pays, la ville et d'autres informations. Je voudrais peut-être créer un modèle qui utilise ces informations afin de protéger le prix d'un ordinateur en fonction de la mémoire interne, de la vitesse et de la capacité protéger le prix d'un ordinateur en fonction de du processeur, et de tout autre détail que j'ai besoin de connaître sur l'ordinateur. Bien. Voici donc mon ensemble de données sur lequel nous allons travailler. Je l'ai mis dans mon lecteur, dans un fichier, dans un dossier appelé ensemble de données à l'intérieur d'un fichier appelé logiciel matériel. Maintenant, je suis un peu nouveau. Remarque, renseignez Google Colab. Maintenant, tout d'abord, vous devez vous assurer que le Colab est connecté à votre. Je vais aller à gauche, en cliquant sur cette icône, pour prévisualiser mes fichiers. Vous pouvez voir qu'il se connecte à quelque chose, mais il n'est pas réellement connecté à mon droïde. Donc, en cliquant sur le troisième bouton, je peux monter Molly Drive sur la couleur globale. Je vais donc demander Mountain avec Google Drive. Parfois, il peut s'agir d'une mise à l'échelle automatique, d'autorisations complètes, etc. Connectez-vous à Google Drive. Si vous ne vous êtes pas connecté auparavant, vous pouvez peut-être vous connecter. Vous pouvez donc réellement obtenir une pierre d'accès. Il est censé apparaître ici. Et comme vous pouvez le voir, c'est ici. Nous sommes prêts à partir. Nous allons maintenant commencer à taper du code Python afin de pouvoir lire le fichier et l'enregistrer. Tout d'abord, nous devons importer le package pandas. Nous allons donc travailler sur l'importation de pandas au format pdf. Le fait est que nous essayons d'importer le package pandas, celui qui nous permettra de traiter les fichiers CSV. Sur le groupe, je clique sur Trunk et j'attends que les partenaires soient importés. Bien. Maintenant, je suis prête à utiliser Pandas quand je le souhaite. Le faible. Et la prochaine étape est de commencer par ajouter une deuxième ligne de code. Et maintenant, nous voulons décider du chemin de notre fichier. La partie du CSP trouvée que nous avons ajoutée à notre sec. Je vais cliquer sur le menu déroulant. Ensuite, je vais prendre mon voiture. Ensuite, je vais chercher le dossier que j'appelle dataset dans lequel se trouve mon fichier. Ça y est. Et une fois que je l'ai ouvert, nous pouvons voir que mon fichier est là. Je vais cliquer dessus et demander le chemin de copie. Il s'agit du chemin du fichier. Donc je vais y aller et dire que le chemin est égal à l'état, j'espère. Collez votre chemin ici et assurez-vous de l'avoir collé correctement, car cela m' a donné ce signe de fille. Donc deux signifie que mon fichier est prêt à être écrit. Que voulons-nous faire ? Nous allons ajouter une autre ligne de code maintenant nous allons commencer à essayer de lire nos quatre lignes de code. Donc, le fait est que nous allons commencer par définir une fonction qui est égale à DP point read underscore csv, très bien. Et ce fichier CSP se trouve King. Le chemin que j'ai déjà écrit plus haut. Je suis prête à m'intégrer et à courir comme si j'étais cuit. Bien. Non, je peux réellement lire mes données pour m'assurer de pouvoir lire mon Anita, allons-y avec ce qui suit. Dr., chef. Et je peux utiliser cette fonction pour présenter ou pour afficher les cinq premières lignes de mon jeu de données ou de mon futur. Réexécutons-le. Et comme vous pouvez le voir, j'ai accès à un jeu de données sur les jouets et je vais y présenter les cinq premières valeurs ou lignes. Je peux donc voir que c'est un ordinateur qui est impliqué, qu'il s'agit de la vitesse et toute autre information que j'ai besoin de connaître. Nan. Quelle vantardise ne le fera pas. Le fait est que nous voulons maintenant commencer à suivre les étapes sur lesquelles nous nous sommes mis d'accord. Tout d'abord, vous devez commencer par supprimer les valeurs manquantes. Pour en revenir à notre appel, nous voulons commencer un nouveau code. Maintenant, que voulons-nous qu'il fasse ? Nous voulons commencer par supprimer les valeurs manquantes. Nous allons donc opter pour le point UDF, drop. Tout ce qui a été entendu. Nous allons ouvrir un support. Nous pouvons donner une variable qui est refroidie sur place. True in place signifie que vous souhaitez remplacer les valeurs de l' ensemble de données que vous avez lu et que vous le chargez ici par les nouvelles valeurs. Oui, je le sais. Je vais donc opter pour ce qui suit. Sur place, c'est vrai. Ou je saurai que je vais m' occuper de ma cuisine. Bien. Maintenant, ce code spécifique supprime toutes les valeurs manquantes de mon ensemble de données. Donc, s'il y avait une valeur manquante susceptible d' affecter le fonctionnement de mon modèle entraîné, je souhaite la supprimer afin pouvoir utiliser cette fonction pour les supprimer. Maintenant, l'étape suivante consiste à ajouter une autre couche. Que voulons-nous faire ? Nous voulons réellement supprimer les doublons. Comme nous l'avons dit, l'entraînement d'un modèle avec des données dupliquées affecte en fait les performances du modal. Éclairez-moi. Bien. Nous allons donc recommencer avec DF Dot Drop sur ses doublons de soins. Ici, il est dit que vous pouvez simplement collecter dessus. Gagné. Encore une fois, nous allons opter pour le principe « sur place » égal à vrai. Nous avons un État de double obligation ici. Et je vais exécuter mon code. Bien. Donc, la deuxième déclaration, juste pour supprimer les doublons de l'ensemble de données que nous utilisions ? Non. La prochaine étape consiste à enregistrer notre nouvel ensemble de données dans un nouveau fichier. Je vais donc ouvrir un nouveau code. Maintenant. Sauvegardons cet ensemble de données à deux heures de route. Je vais donc suivre ce qui suit, la fonction dopée sur vos scores, CSP, la fonction que j'ai créée, je vais l'enregistrer sous forme de fichier CSV qu'elle a ouvert. Les kits de rock seront associés à la dénomination des nouveaux fichiers. Je vais donc ouvrir une seule mutation. Et pour réduire au silence, Fisher optera un ensemble de données de soulignement de date formaté. Et c'est le nom de ce qui est sans faute qui est en train de créer. Et ce sera sous forme de fichier CSV. Et je dois également ajouter un index pour m' assurer que la variable d'index est fausse. Les cheveux et, sur ma déclaration, sont prêts. Je vais le lancer et c'est parti. Alors, qu'est-ce que ce CO2 ? Il y a du code qui a réellement importé le colis des pandas. Le package Pandas m'aide à traiter les détails. J'ai identifié la partie du fichier que j'ai conservée sur mon lecteur après l'avoir monté sur My Drive. Puis j'ai commencé par lire un fichier, présentant certaines des valeurs et sa biographie, j'ai supprimé les valeurs indésirables ou manquantes. Je supprime les doublons et j'ai finalement enregistré. ailleurs, pour vous montrer cette infirmière à l' unisson, je vais aller sur mon Drive ci-dessous, et je peux découvrir qu' il y a un vol au-dessus d'ici appelé ensemble de données formaté. Voici donc le nouvel ensemble de données que je peux distinguer chargé plutôt que de parfumer les données et de m'assurer que tout ne fait qu'un. C'était donc en fait l'une des idées que les gens peuvent utiliser pour préparer leurs ensembles avant de les utiliser pour les affiner. Merci d'avoir regardé. 8. Générer des questions et des réponses à partir du texte pour les modèles d'IA: Bonjour et bienvenue à une nouvelle leçon. Dans notre leçon d'aujourd'hui, nous allons parler de la préparation des questions et des réponses à partir d'un point fixe. Comme nous l'avons déjà dit dans les leçons précédentes, nous avons dit que nous pouvons parfois avoir besoin d'utiliser du texte, simplement de lancer du texte pour peaufiner un modèle. Mais nous ne pouvons pas réellement envoyer le texte de cette ligne au modèle comme vous le testez Nous devons le faire pour le traçage Le format est qu'il peut être divisé en deux étapes. Principe : préparation des données sous forme d' instructions et de compléments avec les suffixes inclus dans les données. Et la seconde consiste à modifier ces données de deux points adjacents par lot. Ensuite, nous pouvons commencer à peaufiner le processus. Donc, pour aujourd'hui, nous allons parler de cette étape. Comment puis-je préparer les questions et les réponses, le texte ? En fait, je vais partager avec vous un bon outil que vous pouvez utiliser. Donc, comme vous pouvez le voir ici, j' ai un essai sur les animaux. Cela représente environ 500 mots. Et comme vous pouvez le constater, cet essai est divisé en différents paragraphes ou éléments. Je peux en fait copier l'ensemble des analyses et les intégrer à un outil en ligne où je peux utiliser ce texte pour générer des questions et des réponses afin de pouvoir entraîner mon modèle en fonction de ces questions et réponses sous forme d'instructions et de compléments. Donc, le truc, c'est que nous allons accéder à la largeur du navigateur et taper drain Pali et QA generated. C'est notre outil, celui que je vais partager avec vous aujourd'hui. Il s'agit donc d'un outil créé par OpenAI. Et même vous pouvez utiliser cet outil sans rien. Nous allons juste payer pour la tokenisation, celle qui est déjà utilisée, GPT ou TBT facturent en fait. Alors regardez ici avant de commencer, nous devons saisir notre clé API. Parce que nous utilisons en fait un module ATI pour le faire. Nous sommes, allons-y, réveillés extrêmement égaux à deux nœuds, ce qui est un locataire. Et cela peut réellement vous aider en vous inscrivant pour vous connecter si vous avez un compte. Mais disons que je n' ai pas de compte. Je peux me contenter d' apporter ma clé API. Et simplement en ajoutant une clé API supplémentaire ici et en vérifiant la clé, je peux réellement commencer à utiliser l'outil. Je n'ai donc préparé que ce qui se passe ici. Je vais le copier. Je vais retourner sur mon site Web. Je vais le coller. Je vais essayer de vérifier ma clé. Et cela indique que Q UK a été vérifié et stocké localement dans votre navigateur. Bien. Je vais y aller, d'accord, et ne disons pas VB Vicky. Maintenant, je suis prêt à partir. Regarde ça. C'est tellement simple et fluide et c'est vraiment utile. Ça dit : « Entrez les bâtons ». Vous souhaitez générer deux questions et réponses ici. Je vais donc revenir au texte que j'ai préparé. Je vais copier mon texte. Quelle est la longueur de la nouvelle échelle ? Une fois que j'ai perdu, c'est prêt. Je vais y retourner et le coller. Par ici. Vous devez donner au modal ou au programme une idée de la façon dont mes paragraphes étaient séparés. Il est donc demandé quel est le paragraphe séparé par un seul retour ? Ou disons un espace vide ou quelque chose comme ça. Donc je vais dire que je vais m'en tenir à un seul tour. Ou peut-être que je peux simplement suivre ce qui suit, en laissant un espace vide au début ou à la fin de chaque paragraphe. Cela permettra en fait de rendre les données sur le vin plus claires et de les préparer à être utilisées. Bien. Alors c'est ça, Good. Maintenant, je vais passer en revue mon paragraphe. Et ici, l'outil a simplement divisé mes paragraphes en différents groupes. D'accord ? Maintenant, il y a quelque chose que je dois expliquer ici. Générez trois séries de cinq questions au maximum pour chaque paragraphe. Donc, si je demande à l'outil de le faire pour moi, je lui demande en fait de créer trois séries différentes de cinq questions pour chaque paragraphe. Donc, en multipliant, je peux savoir que , pour chaque paragraphe trois séries de lunes mes questions seront répétées, mais peut-être d'une manière différente, mais elles recevront en fait la même réponse. Essayons donc de poser deux séries de cinq questions pour chaque paragraphe. Maintenant, j'ai de petits paragraphes, donc je vais poser, par exemple trois questions pour chaque paragraphe. Bien. J'ai maintenant ici le coût estimé. Et c'est bien sûr la côte qui va me être facturée par OpenAI. Je peux consulter le solde de mon compte API. En fait, au début, chaque fois que vous commencez à utiliser les services API, vous avez environ 18$ gratuitement. Ce sera donc suffisant pour l'utiliser pendant longtemps car ils ne chargent qu'une très faible quantité. Bien. Je vais donc opter pour modifier le texte. Si je voulais supprimer ce texte, je peux modifier le texte ou commencer à le générer. Cela va prendre du temps, mais croyez-moi, cela en vaut la peine, et comme vous pouvez le constater, cela m'apporte. Il s'agit de la première série trois questions concernant le premier paragraphe. Et ceci est une autre série du premier paragraphe, mais avec des questions différentes. Quels sont les avantages des animaux pour les humains ? Que proposent les animaux ? Ces deux questions se ressemblent en fait et ils peuvent avoir les mêmes symptômes ou, d'une manière ou d'une autre, certains ulcères peuvent être inclus. C'est donc une bonne chose. Cela me donne en fait des structures différentes pour la même question, phrases différentes, qui est intelligent car cela peut permettre au modal mieux comprendre comment je peux poser une question et de déterminer exactement si je dois répondre si la question ressemblait à ceci ? Le modèle apprend donc et s'appuie sur des modèles généralisants de manière efficace. Maintenant, il ne me reste plus qu'à copier mes réponses et mes questions de cette façon, en prendre une copie, par exemple pour créer une nouvelle feuille Google. Et je peux simplement coller mes questions là-bas dans une nouvelle feuille. Je vais donc utiliser la première ligne maintenant et je vais la coller. Et comme vous pouvez le voir, laissons un peu de place ici. J'ai des groupes de questions et leurs réponses. La seule chose que je dois faire, comme nous en avons discuté précédemment dans d'autres leçons, c'est de supprimer les rouleaux indésirables en rangées. Je peux également lire mes données pour m'assurer qu'elles ne contiennent pas moins de deux doublons. Et je peux également ajouter des suffixes comme nous l'avons expliqué dans les leçons précédentes. Bien. J'ai donc maintenant une liste de questions et de réponses sur mon sujet. Certaines questions sont répétées mais d'une manière différente, ce qui est un modèle plus formel. Et c'était un outil très agréable et facile à utiliser. Maintenant que vous avez préparé vos données ou vos suffixes et que tout va bien, vous pouvez télécharger cette feuille Excel puis nous apprendrons dans les prochaines leçons comment utiliser cette feuille Excel pour modifier son format par rapport au Vermont voisin, où nous allons en fait utiliser ces données dans ce format pour affiner notre modèle. Et c'est tout pour aujourd'hui. Merci d'avoir regardé. 9. Utilisation de ChatGPT pour générer du code Python pour la manipulation des données: Bonjour et bienvenue à une nouvelle leçon. Dans notre leçon d'aujourd'hui, nous allons apprendre à utiliser nos données de manière intelligente en suivant l'une des étapes dont j'ai parlé précédemment. Cette étape consiste à utiliser GPT pour générer pour nous un code Python. Ce code Python sera utilisé pour travailler avec un grand ensemble de données et modifier cet ensemble de données dans le format des marques et des complétions, dont vous devrez utiliser ces pompes et la complétion pour affiner votre modèle. Donc, ce que nous allons faire, c'est discuter de GPT, nous allons faire de l'ingénierie rapide. Nous devons décrire correctement les fonctionnalités et les exigences de nos projets et notre ensemble de données afin d'obtenir un bon code Python capable de transformer tout cet ensemble de données sous la forme d'invites et de compléments, le tout en un seul clic. Je suis donc allée discuter avec TBT et j'ai écrit à ce qui suit. Tout d'abord, je veux utiliser un code Python. Et ce code Python doit servir à convertir un ensemble de données préparé à graver sous la forme de complétions de Bronson. Je vous ai donc dit que GPT besoin d'un code Python pour ce qui suit J'ai inscrit tous les conseils que je devais mentionner pour le toucher avant qu'il ne génère Michael, comme les données, où seront-elles faibles par défaut, quel fichier ? Et peut-être une querelle importante importez certaines bibliothèques nécessaires. Il prendra la première valeur de chaque ligne. Il inclura cette première valeur dans une invite, qui est le nom du film. Le reste des données de chaque ligne, c' est-à-dire le reste des détails mentionnés dans mon fichier CSV sur chaque film, sera préparé de manière appropriée. Et je n'inclus que certaines données et pas toutes les données de l'ensemble de données, par exemple, chaque film contient des informations publiées sur le réalisateur, l' acteur et le général. Ce sont les informations que je dois inclure dans mes instructions et mes informations de complétion. Je veux également juger quiconque en ajoute moins. Par exemple, de nouvelles colonnes dans l'ensemble de données d'origine. Ces colonnes incluront des instructions générées, des complétions détestées par l' ingénierie et deux nouvelles colonnes qui seront ajoutées par le code Python. Ensuite, je dois enregistrer mes données ou le nouveau DataFrame. Et un autre fichier, ce fichier est celui que je vais prendre et utiliser pour effectuer le processus d' affacturage. J'ai également dû mentionner des détails subtils concernant mes données. Par exemple, quelles sont mes coordonnées concernant, par exemple, un groupe d'obèses ? Voici les caractéristiques des films que j'ai inclus dans mon jeu de données. Je fais donc pivoter chaque fonctionnalité incluse dans mon jeu de données pour le film. J'ai également donné des exemples, le nom du film, les autres fonctionnalités de la description de Ruby. Ainsi, chaque fois que j'envoie ceci au chat GPT, vous pourrez généralement très bien comprendre mon ensemble de données. Il saura exactement ce que mon code Python doit faire. Une fois que je l'ai envoyé à not GPT, j'ai reçu ce qui suit. Faisons un aperçu du code. Tout d'abord, il importe le package Pandas. Ce package nous aide à gérer les données et les fichiers CSV. En Python. Il va également importer OpenAI. Il va vous demander la clé d'API. Cela peut m'aider à communiquer et à terminer le processus de réglage, comme envoyer des demandes et recevoir des réponses d'OpenAI. Bien. Maintenant, la première chose à faire est de créer un nouveau DataFrame. C'est comme ce bloc de données. Il va récupérer plus de données pour tous mes fichiers CSV. Mais souvenez-vous, c'est le nom du fichier que vous devez placer en deux parties ici. Comment avez-vous nommé la police que vous avez insérée dans votre lecteur ? Ou peut-être plutôt que d'écrire le nom du fichier, nous pouvons écrire le chemin du fichier. Où ai-je réellement sauvegardé celui-ci plus tard ? Ensuite, il crée les deux listes que j'ai demandées, les instructions et la complétion. Ces deux listes doivent être ajoutées chaque fois que le code lit mes données, il en prendra le nom. Il sera ajouté à la section d'invite. Les autres fonctionnalités seront vers la section d'achèvement. Voici donc le nouvel ensemble de données, moins qui seront ajoutés à mon DataFrame d'ailleurs, tant mieux. Maintenant, dans cette boucle, il va lire chaque ligne, créer les instructions et les complétions. Et dans ces deux lignes, il ajoutera toute nouvelle invite générée à la liste des invites. Et il ajoutera également toutes les nouvelles concrétions qu'il a créées à la liste des réalisations. Enfin, lorsque ces deux listes seront prêtes à être mises en ligne, le DataFrame leur sera envoyé. Et il va enregistrer le DataFrame modifié, ce nouveau fichier CSV mon lecteur sous le nom de données réparées, et c'est le fichier CSP. Et une fois que nous aurons exécuté ce code dans la prochaine leçon, nous pourrons voir le nouveau DataFrame généré par mon code. Alors c'est tout. Je trouve donc cela utile Demander à Shut UP Teacher Generate de trouver les obstacles qui fonctionneront le mieux avec notre code est vraiment très utile. 10. Exécuter et exécuter le code Python sur Google Colaboratory: Bonjour, bienvenue à une autre leçon. Dans la leçon précédente, nous avons présenté un aperçu du code Python. Ce code a été conçu pour que nous puissions l'utiliser pour préparer des instructions et des complétions à partir d'un gros fichier de données CSV. Dans cette leçon, nous allons exécuter ce code étape par étape jusqu'à ce que nous obtenions des synchronisations rapides prêtes à être utilisées pour affiner notre modèle. Il s'agit du code Python préparé par tattoo PT. Selon les instructions d' ingénierie que Selon les instructions nous avons effectuées dans la leçon précédente, nous avons prévisualisé le code que nous avons créé, ses termes et les éléments que nous devons modifier pour nous assurer que ce code répond aux exigences de notre ensemble de données. Dans cette leçon, nous allons maintenant exécuter le code. Je vais donc copier le code tel qu'il est. Je vais accéder à l'environnement qui me permet d'exécuter un code Python. Pour la leçon d'aujourd'hui, nous allons utiliser outil appelé Google Colab. Nous en avons parlé dans nos leçons précédentes, mais rappelons ce qu'est Google Colab. Maintenant, une fois sur Google Colab, c'est la loterie par appel qui vous permet d'exécuter votre éditeur de code Python. Et cela a été fait par Google. Une fois dans le Colab, il me proposera projets précédents ou mes carnets de notes précédents. C'est ce que nous appelons les fichiers sur Google Colab. Une autre chose est que je peux simplement créer un nouveau bloc-notes pour travailler dessus. Il s'agit donc de l'interface ou la forme du bloc-notes chaque fois que vous l'ouvrez. Et comme vous pouvez le constater, nous pouvons faire certaines choses . Nous pouvons changer le nom du carnet en fonction de ce que nous allons faire. Nous pouvons également ajouter des codes ou des textes à ce notable avant de lancer et d'exécuter le code. Alors, qu'y a-t-il au bas de notre Google Drive ? Pourquoi ? Parce que nous voulons lire le fichier CSV comme sur notre. Donc, comme vous pouvez le voir, c'est mon Drive ici. Et dans mon lecteur, j'ai créé un dossier appelé ensemble de données, et j'ai inclus les ensembles de données que je pourrais avoir besoin d'utiliser. Et c'est sur celui-ci que nous allons travailler. Nous allons avoir un aperçu de l'ensemble de données ici. Laisse-moi l'ouvrir. Et si Google Sheets avait un truc, c'est que, comme vous pouvez le voir dans la première colonne, nous avions le nom du film, puis les revenus mondiaux, le général du réalisateur et la date de sortie, les acteurs et d'autres détails sur le film. C'est le Z à régler sur lequel je vais travailler, je vais revenir à ma mise en couleur. Je n'aurai pas besoin de ce dossier ici, celui que j'ai ouvert sous forme de fichier Excel. Je vais donc simplement le supprimer. J'ai besoin d'un fichier CSV pour pouvoir le lire en deux minutes. Tout d'abord, je dois m'assurer de pouvoir y accéder en utilisant Google Colab. Je vais donc accéder aux fichiers sur la gauche, comme vous pouvez le voir, en me connectant à l'environnement d'exécution pour activer les feux. Donc, une fois qu'il sera activé, je devrai faire quelque chose appelé Montage. Je dois monter le jouet Colab. Et c'est en cliquant sur l'icône ici. Une fois que vous aurez cliqué dessus, il sera monté. Et il arrive parfois qu'il vous demande des autorisations pour vos journées. C'est Martina sur mon Google Drive. Une fois que tout est appris et que tout fonctionne, vous verrez que mon fichier Google Drive apparaît ici. Donc c'est écrit ici, là, ça dit, et je peux réellement entrer dans mon lecteur, trouver cet endroit. Et Chico, pour profiter du plaisir que j'ai ajouté en accédant au dossier intitulé Ensemble de données, je peux trouver un nouvel ensemble de données que j'ai inclus dans ce lien. Et il s'agit en fait du fichier CSV sur lequel nous allons travailler. Le code Python ici, copiez-le et apportez-le à notre Google Colab, ajoutez-le sous forme de texte. Donc, tout d'abord, je vais garder ce texte à en haut parce que je veux ce texte soit là pour moi chaque fois que j'en ai besoin. Bien. Nous y voilà. Alors ça y est, c'est le texte que j'ai préparé. Pourquoi l'ai-je emmenée ici ? Parce que je veux suivre les étapes une par une. Cela peut donc être mon idée ou cela peut réellement m'aider si je ne suis pas habitué à utiliser correctement le code Python, d' accord. Maintenant, tout d'abord, je dois ajouter une partie du code qui s' appelle le chemin. Il s'agit du chemin du fichier que je souhaite lire. Je vais donc commencer par créer une variable , puis voici le chemin et quel est le chemin du fichier que je veux lire ? Je vais accéder à mon fichier ici, cliquer dessus, copier le chemin, et le coller ici entre guillemets doubles. Nous y voilà. Ensuite, je peux courir pour m'assurer qu'il n'y a pas d'erreur dans cette phrase. C'est très bien. Nous allons donc avoir un aperçu de ce sur quoi nous allons travailler. Tout d'abord, nous devons importer le package pandas et nous devons également importer le bucket OpenAI. Nous devons également clarifier notre clé d'API, etc. Commençons maintenant à exécuter notre code. Tout d'abord, le naturel va de pair avec l'installation avec la bibliothèque d'API ouverte. Je voulais l'utiliser, et les versements vont prendre un certain temps. Passons donc à la deuxième partie, qui consiste à importer le package pandas depuis Python. Je vais donc procéder à l' importation de ces chemins PDF. Et je suis en train de créer une fonction appelée bd. Chaque fois que je veux utiliser le package pandas, j'utiliserai le p.ball tant que j'exécuterai ce code. Maintenant, la deuxième chose à faire est de lire mon dossier ici. Pour lire mon fichier ici, je devrais m'en tenir à celui-ci et créer un nouveau DataFrame en lisant le DataFrame précédent. Je dois donc inclure le nom du fichier ou le chemin du fichier où je peux le trouver. Ajoutons donc un autre statut de rémunération des manteaux. Et plutôt que d'écrire le nom du fichier ici, je vais utiliser des chemins. Le chemin que j'ai déclaré ci-dessus ici, qui est le chemin du fichier. Et nous allons exécuter ce code maintenant. Je peux donc lire les données du fichier CSV ici. Bien. Maintenant, après avoir lu mon fichier, je vais commencer à prendre les données et à les ajouter à de nouveaux fichiers. Maintenant, je vais créer les deux listes ici, la police générée et la liste de coefficients générée. Donc, dans ces deux déclarations, je vais générer deux listes afin de les ajouter chaque fois que cela sera durable, créera une nouvelle invite ou sera presque terminé. Passons donc à un autre code et suivons le suivant. J'ai maintenant deux listes. Le premier modèle s'appelait prompt and completions, et ils sont prêts à prendre des valeurs. Nous avons maintenant la boucle à quatre sur cette petite boucle qui va accéder à l'ensemble de données, créer des marques et créer des complétions en conséquence. Je vais donc emmener tout le groupe ici. Prenons également le reste du code. Va l'exécuter. Donc, comme vous pouvez le voir, for loop va récupérer les données du fichier CSV. Il va également ajouter ces données aux listes que j'ai créées ci-dessus. Et ces deux listes doivent être ajoutées au fichier CSV d'origine. Et tout cela doit être enregistré dans un nouveau fichier CSV appelé CSV de données préparées. Je vais donc exécuter le code. Et une fois que j'ai exécuté le code et qu'il est volé, je peux dire que la plupart des VC sont le fichier appelé CSV de données préparées qui y est appelé CSV de données préparées lancé jusqu'à ce que j'en profite ici. Passons donc aux dossiers. Je vais juste fermer et ouvrir pour rafraîchir. Il fait froid aujourd'hui. Et comme vous pouvez le voir, voici mon pied une fois que j'ai cliqué dessus. Comme vous pouvez le voir, c'est le titre du film. Ce sont les revenus que le général, le directeur, quelles que soient les données que j'ai incluses précédemment, sont là. Sur le côté gauche, j'ai quelque chose appelé brun généré. Cela a été ajouté par le code Python, complétion générée. Et ces deux colonnes sont les seules dont j'aurai besoin pour les utiliser à des fins de réglage ou de bimodalité. Voilà, il est ajusté car il décode mes données et est prêt à être utilisé. Merci d'avoir regardé. 11. Créer un répertoire de projets bien structuré: Bonjour, bienvenue à une autre leçon. Dans notre leçon d'aujourd'hui, nous allons apprendre à créer un bon répertoire de projets, à structurer et à gérer les données qu'il contient. Il s'agit d'une compétence essentielle pour tout projet de conception ou car elle nous permet de revenir aux données et à Rick et de les comprendre correctement. La mise en place d'une bonne structure de projet présente donc de nombreux avantages . L'un de ces avantages est que si vous travailliez en équipe, cela permettra à chaque membre de l'équipe de revenir aux données, de les compléter et de travailler dessus. Cela les supprimera en tant que consommations. Cela éliminera également les chevauchements, ce qui nous permettra de gagner du temps et d'améliorer nos professions. Une autre chose est qu' une bonne structure pour un projet me permet d'y revenir, réutiliser à nouveau, par exemple. peux prendre ces fichiers de données , les ajuster et les inclure dans vos projets. Je vais partager certains des types que vous pouvez utiliser afin de créer un bon répertoire de projets. Tout d'abord, n'oubliez pas de toujours conserver vos données dans des dossiers. À l'intérieur de ces dossiers, vous pouvez inclure des sous-dossiers, puis les déplacer pour utiliser des noms descriptifs. N'oubliez pas d'utiliser des noms compréhensibles Chaque fois que vous souhaitez rechercher un fichier spécifique, vous pouvez revenir à sa recherche, à sa reliure. Une autre chose est que vous devez toujours conserver un fichier Read Me dans le fichier Read Me et vous pouvez conserver des données sur la façon dont vous avez réalisé le projet, comment l'utiliser ? Quels ensembles de données utiliser, utilisez des codes Python pour utiliser l'urne, etc. Comme vous pouvez le voir ici, j'ai préparé ici un exemple de répertoire de projets ou à quoi ressemblerait la structure des produits ? Donc, tout d'abord, vous pouvez inclure différents dossiers. Certains d'entre eux concernent peut-être les codes, le script des codes. Imaginons que vous puissiez utiliser différents codes pour préparer les données. Vous devez en conserver une copie si vous utilisez un code pour analyse des données et le code utilisé pour l' entraînement du modèle. Je garde des particules ici. Vous pouvez également conserver des carnets de notes. Dans les blocs-notes, vous pouvez conserver les fichiers de données que vous utilisez, les fichiers d'origine. Il s'agit donc d'un fichier CSV, et si vous utilisez le suivant, vous pouvez également l'inclure. J'ai également ici d'autres polices, plus détaillées, mais ce sont celles qui ont été traitées. C'est ce qu'on appelle des données préparées, et ce sont les données préparées à partir du texte. Et il est en fait recommandé de les ajuster à l' aide de chiffres. Par exemple, si vous avez préparé les données à plusieurs états, vous devez inclure Préparer les données un, les données deux, etc. plus, vous pouvez conserver les résultats du processus que vous avez effectué ou du projet, par exemple conserver des copies des modaux ou conserver des fichiers Read Me. Dans le fichier Readez-moi, vous pouvez inclure toutes les données dont vous avez besoin, des sous-sections du sondage, quels sont les suffixes que vous avez utilisés dans les données avant pointer du doigt et quel était le modèle utilisé ? Quel était l'identifiant du modal ? Quelle clé d'API avez-vous utilisée pour créer et affiner ce modèle ? Vous pouvez également écrire des oiseaux rouges à propos de ces faibles doses et les conserver. Cela vous permettra , à vous ou à tout membre de l'équipe ou à toute autre personne, de vous référer plus facilement tout membre de l'équipe au projet, voir ce qui s'est passé, d'utiliser ces données , de les traiter à un autre stade, peaufiner les produits, etc. C'était donc un bref exemple de la façon de créer un bon répertoire de projets, manière d'y configurer une organisation en haut de celui-ci. Comme nous l'avons vu, nous avons donné un petit exemple à ce sujet. Ce projet peut en fait être téléchargé sur votre GitHub. Il peut être conservé dans des fichiers spécifiques sur votre lecteur ou sur votre ordinateur. Mais ce sera en fait la clé pour réussir à utiliser ce projet, à en tirer des leçons et à réaliser d'autres projets à l'avenir. 12. Comment choisir un modèle pré-formé pour le réglage fin: Bonjour et bon retour. Dans notre leçon d'aujourd'hui, nous allons apprendre à choisir un modèle pré-entraîné qui répond réellement aux exigences de notre propre projet. Nous savons que le GPT-3 est un ensemble de modèles volumineux et puissants, mais nous souhaitons utiliser l'un d'entre eux pour créer notre propre réglage. Dans cette leçon, nous allons prévisualiser les spécifications de ces modèles. Et nous apprendrons lequel d' entre eux répondrait à nos exigences afin de connaître ces modèles et de réfléchir à celui d' entre eux à choisir. Nous devrions les prévisualiser à partir de leur source, qui est le site Web d'Open AI. Alors je vais le faire ouvertement. Je vais spécifiquement au terrain de jeu. Pourquoi ? Parce que je veux dessiner leur section de documentation. Ici, il est dit qu'en haut, cela ira à la section documentation. En faisant défiler l'écran vers le bas sur la gauche, nous pouvons accéder à la section Modules. Comme vous pouvez le constater, il s' agit d'un aperçu de chaque modèle GPT créé par OpenAI. Ils ont généralement atteint un, pour l' instant, il doit y en avoir 3,5. Il y a cette Dolly plutôt qu' une autre qui peut générer des images et il existe d'autres modaux. Le fait est que nous allons dépendre du GPT-3. Gpt-3 est l' ensemble de base des modèles TBT, ceux que nous pouvons réellement utiliser pour le réglage précis. Je vais descendre, en faisant défiler la page jusqu'à GPT-3 en particulier, nous pouvons vous prouver que vous êtes GPT-3. Maintenant, nous voulons voir les modèles GPT-3 de base. Ce sont les Léonard de Vinci, les Curie qu'ils sont aujourd'hui et les Babbage. Et ce sont les seuls modèles que les gens peuvent réellement utiliser pour voler. Aucun autre modèle ne peut être utilisé pour réglage fin, à l'exception de ces trois. Le fait est que leur dernier modèle est également généré ici, mais lorsque nous effectuerons deux réglages, nous ne dépendrons que de ces quatre réglages de base. Et vous devez savoir lequel d'entre eux peut emporter le plus de jetons, lequel d'entre eux peut regarder la côte de chacun d'entre eux. Quelles sont leurs capacités et leurs aptitudes ? Et c'est ce que vous devez considérer comme rénal chaque fois que vous choisissez entre eux. Le truc, c'est que Da Vinci est le plus grand, le plus compétent. C'est incroyable, mais la côte est plus haute que l'on peut réduire par badge et ADA. Curie est doué pour l'analyse des sentiments. De plus, si vous travailliez sur un projet qui doit classer les données en q0 positif et négatif ne serait pas une bonne suggestion pour cela. Ada est la plus rapide, c'est la plus rapide. Donc, si vos données vous obligent à travailler sur un bouton de modèle rapide et réactif, des réponses peu impressionnantes, disons des réponses très directes à faux. Vous pouvez compter sur ADA et ainsi de suite. Voici donc les quatre modèles de base. Prenez-les en compte, vous devez réfléchir aux types de données utilisés, aux exigences de votre projet ? Pensez à la rapidité, aux ressources dont vous disposez. Combien dois-je payer ou quelle est ma capacité à effectuer ce processus de réglage précis Et c'est à ce moment-là que vous pouvez savoir lequel choisir. Et nous utiliserons le nom du modèle pour effectuer le processus de réglage en utilisant cet ordre spécifique. 13. Introduction au processus de réglage fin en Python: Pour avoir une vue d'ensemble des étapes du processus de réglage, du début à la fin. Je l'ai préparé pour que vous puissiez le peaufiner. Tout d'abord, nous devons télécharger Python. Comment télécharger Python ? Nous allons sur Internet. Nous pouvons rechercher Python, télécharger de l'héroïne ou Veritas. Vous devez juste vous assurer de télécharger la dernière version de Python pour pouvoir excuser vos codes Python. Nous y voilà. Donc, sur mon ordinateur portable, je vais chercher Python. Et comme vous pouvez le voir, j'ai la version 3.11, qui est la dernière version. C'est donc la première étape et je suis prête. La deuxième chose à faire est d'ouvrir notre C et D. Qu'est-ce que le C ? Becky ? C et D sont le processeur de commandes Windows. Lorsque vous accédez à la barre de recherche et votre ordinateur portable Windows 10 ou 11, lorsque vous utilisez C et D, vous pouvez trouver quelqu'un appelé Command Prompt. Qu'est-ce que c'est ? Il s'agit d'une interface où vous pouvez exécuter des commandes ici. Ces commandes peuvent fonctionner ou fonctionner sur vos programmes ou vos systèmes d'exploitation. Et cela peut également vous aider à relier votre ordinateur portable à Internet, demander, à envoyer des demandes, à recevoir des réponses. C'est donc là que tout le processus de réglage peut avoir lieu sur notre CMD ou notre processeur Commons. Je l'ai fait. Une autre chose que nous allons faire aujourd'hui est de localiser notre plaisir sur le CMT. L'ensemble des processus se déroulera dans un fichier que nous avons préparé précédemment. Dans le prochain cours. Je vais partager cette diapositive avec vous sous la forme d'un lien dans la description de la leçon. Ensuite, après avoir localisé notre fichier, nous devons télécharger les bibliothèques et les packages nécessaires. Ces bibliothèques, telles que l'ouverture sur Library Pandas, et d' autres bibliothèques dont nous aurons besoin pour travailler sur nos données et effectuer le processus de réglage précis. Ensuite, nous allons exécuter codes Python et des mines de charbon afin d' accéder aux outils de l'US Open AI et de préparer nos données pour les peaufiner. Ensuite, nous allons exécuter le code Python pour terminer le processus de réglage. Une fois cela fait, il nous fournira un identifiant de modèle. Nous utiliserons cet identifiant pour savoir ce qu'il est advenu du processus de mise au point afin de suivre notre modèle, celui que nous trouvons, pour trouver le chemin à suivre jusqu'à nous assurer qu' il crée des changements et que tout va bien. Il s'agit donc d'une brève explication, d'une très courte explication des étapes. Encore une fois, pour peaufiner les réglages, nous devons télécharger des bibliothèques créées en Python, exécuter du code Python, des commandes pour communiquer avec OpenAI, pour effectuer des réglages précis. Et enfin, pour vérifier si notre modèle était bien ajusté à Séoul. Il s'agit donc d'un aperçu rapide. Dans la prochaine leçon, nous allons exécuter certaines de ces étapes, par exemple en préparant nos données de la meilleure façon qui soit. Ensuite, peaufinez-le, puis testez notre affinement sur toutes ces choses que vous 14. Ajuster un modèle pré-entraîné : un processus en trois étapes: Bonjour et bon retour. Dans la leçon d'aujourd'hui, nous allons commencer à exécuter le processus de mise au point. Et je peux diviser cela en trois étapes principales. La première étape consiste à modifier le format des données que nous avons préparées au format adjacent. Nous en avons parlé dans les leçons précédentes. Nous avons dit que toute police que vous souhaitez obtenir un modèle préentraîné doit avoir le format adjacent. Et nous verrons comment changer cela à l'aide d'un code Python. La deuxième étape consiste à prendre ces données et à les transmettre à un modèle préentraîné pour effectuer les réglages, tandis que la troisième étape consiste à tester notre affinement du modèle. À titre de révision, aujourd'hui, nous allons travailler sur les points suivants. Nous allons d'abord m' assurer que nous avons téléchargé Python et que nous allons travailler sur notre CMD comme nous l'avons expliqué dans la leçon précédente, nous allons ouvrir notre fichier et commencer à travailler sur notre code Python. Le premier code Python est destiné à nous aider à modifier le fichier de données CSV pour obtenir une certaine utilité. Une fois que nous aurons terminé, nous sommes certains que nos données seront prêtes à être communiquées à tous les modèles préentraînés à réaliser le dessin animé. Alors allons-y et commençons à exécuter nos tests. Tout d'abord, nous allons passer à l' EMT vocal de nos théoriciens du CMD. N'oubliez pas que nous devons ouvrir notre dossier. Je vais donc utiliser le CD et ouvrir la police que j'ai appelée. Testez. Cette amende est incluse dans la description sous le nid. Et il inclut les deux codes Python que je vais utiliser. La première consiste à changer le format des données format adjacent, tandis que la seconde consiste à communiquer avec open EI et à demander le réglage précis à l'aide de notre clé API. Et voici l'explication de toutes les étapes que nous avons suivies. Ici. J'ai inclus ici ma clé API parce que je vais en avoir besoin pour relier mon modèle pré-entraîné sur mon téléphone à une onde unimodale à partir de ma clé API afin de pouvoir l' utiliser pour d'autres applications. Et ce sont les données que nous utilisons à bon escient : le flux de données. Prévisualisons nos données. Comme vous pouvez le voir, j'ai le côté gauche, ici, la médaille de bronze, et sur la droite, la deuxième colonne contient les confessions. Dans les pages explicatives, j'ai une question, après laquelle j'ai ajouté un espacement et, après ce visage, j'ai inclus un suffixe. Cela les aidera à comprendre. Ensuite, c'est là qu'ils se terminent rapidement. Sur le côté droit, j' ai les complétions, ces complétions aussi. Cela commence par un espace vide ou un espace 1D ici avant la fin. Et cet espace permet au modèle de comprendre que c'est là que la collision commence et pourquoi il innove. J'ai ajouté un suffixe. Ce suffixe m' aidera ou les aidera à comprendre que c'est là que la réponse à la première invite se termine invendue. Mes données sont donc prêtes, je les ai téléchargées, assure d'avoir un thé propre, une bonne quantité de détails. Assurez-vous que tout est réglé. Assurez-vous de ne pas avoir d'informations supplémentaires dans d'autres cellules ou dans d'autres feuilles, etc. Une fois que vous êtes prêt, une fois que vos données sont prêtes, tout va bien. A pris. Pour en revenir à notre C et D, commençons par exécuter notre premier code Python. Avant d'exécuter le code, laissez-moi le prévisualiser. Ça y est. Je vais l'ouvrir sous forme de notes. Je vais utiliser un fichier texte et voir à quoi ça sert. Tout d'abord, importez certaines bibliothèques nécessaires. Ensuite, il crée un classeur. Dans ce classeur, il va charger les données du fichier de test du vent. N'oubliez pas si vous avez nommé votre fichier de données sous un autre nom. Comme vous pouvez le voir, j'ai nommé le zeste. Donc, si vous avez un nom différent, vous devez écrire le nom de votre fichier ici. Bien. Ensuite, cela commence à se répercuter sur les draps de la vie, c'est pourquoi nous n'avons qu'une seule feuille. Ensuite, en utilisant cela pour la boucle, il va commencer à créer les invites et à supprimer Nicole dans ce format pour les enregistrer dans un fichier au format JSON appelé data test point json. Ensuite, la nouvelle erreur qui va être créée par ce code s'appelle dates test. Et à l'intérieur de ce fichier, vous trouverez nos données, tout ce que nous avons inclus dans ce fichier Excel dans une amende mais avec des annexes par mois. C'est ainsi que je prépare mes données pour les transmettre à un modèle préentraîné afin de les affiner. Bien. Donc, une fois que je me suis assuré que mon code est prêt et que tout a été modifié, le nom des fichiers et tout nécessaire vont dans notre C et D pour exécuter ce code. Nous allons donc prendre le nom de ce fichier ici, d' Excel en JSON. Alors renommons, copions le nom. Nous allons placer le nom du fichier et cliquer sur point pi sin pour l'exécuter. Une fois qu'il a été exécuté, comme vous pouvez le voir ici, regardez notre dossier et nous nous amusons encore plus regardez notre dossier . C'est ce qu'on appelle un test de données. Prévisualisons notre nouveau fichier. Les Afghans peuvent donc voir que voici le bal de fin d'année, à côté. Et tout cela est préparé dans un format décent. Bien, mes données sont maintenant prêtes pour la fonte. La prochaine étape consiste à prendre ces données et à les envoyer pour qu'elles soient peaufinées ou pour peaufiner un modèle. Je vais donc passer à l' étape suivante dans mon C et D. À savoir exécuter le code Python qui m'aide à trouver deux de mes modèles, qui se trouve ici. Prévisualisons notre code. Je vais revenir en arrière pour ouvrir ce code sous forme de fichier texte. Jetons-y un coup d'œil. C'est aussi des importations, ils avaient besoin de bibliothèques. Il change de clé d'API et une fois qu'il a terminé ma clé d'API, il commence à communiquer avec OpenAI afin créer un nouveau modèle entraîné ou un nouveau modèle affiné. Et il va demander la liste des demandes des modèles préentraînés précédents et d'autres données. Ce qui m'intéresse dans ce code, c'est la dernière partie, car c'est là que je peux décider du nom du fichier que je veux créer ou du nom du modèle que je voulais créer. Et quel est le nom du modèle de groupe sur lequel tu veux que je me fie ? Donc, en regardant ces données ici, tout d' abord, que vais-je charger ? Celui que je vais utiliser pour peaufiner les réglages. Vous devez le récupérer à partir d'un fichier appelé digitalis Jason. C'est ma F1. Et quel est le nom du nouveau modèle pré-entraîné ? Tout d'abord, je peux nommer mon modèle comme je le souhaite. Je l'ai appelé Mary Disorder and Model. Et quel est le modèle pré-entraîné sur lequel je vais m' appuyer, pour différencier. Donc, quel que soit le nom de ce fichier ici, vous devez l'inclure ici. N'oubliez pas que ce sont les dents et le L5, vous devez choisir le nom de votre modèle et vous devez également choisir le modèle pré-entraîné. Maintenant, quand je m'assure que mon code est prêt, je peux commencer par cette cuticule. Le fait est que je voulais également partager quelque chose avec vous Pour pouvoir communiquer avec OpenAI et recevoir des demandes, vous devez ajouter votre clé API aux variables d'environnement d'un ordinateur portable. Qu'est-ce que cela signifie ? Si vous descendez dans la barre de recherche et parcourez les variables d' environnement. Une case de réglage d'ouverture du site ci-dessous, nous avons entendu dire que vous avez ces principales variables d'environnement. Une fois que vous avez cliqué dessus, vous devez ajouter la clé API ouverte. Dans les variables relatives au feu. Les variables permettent à mon système de communiquer à l'aide de cette clé d'API avec OpenAI. Elles incluent mon EBIT. Donc, si vous ne l' aviez pas ici, vous allez simplement opter pour ce qui suit. Ouvrez, nommez-le, OpenAI à partir du trait de soulignement de l'API de partition G. Et il faut l'écrire en majuscules de cette façon. Ensuite, vous pouvez accéder au terrain de jeu de touchy P t et accéder à OpenAI, obtenir OpenAI, obtenir votre clé d'API, l' inclure et l'enregistrer. Donc, si cela a été enregistré correctement ici, cela vous permettra de communiquer de manière durable avec OpenAI et Syndrome afin communiquer de manière durable avec OpenAI et de peaufiner et recevoir des réponses une fois que l' étranger à moi plus sera bon. Donc, pour exécuter ce code, le code de réglage précis, je vais retourner à mon Cmd. Je vais commencer à taper le nom du pointeur. OK, reprenons son nom. Accédez à notre CMD et notez haut, car il s'agit d'un code Python. En d'autres termes, il envoie des requêtes à l'API. Il doit répondre d'un seul bit. La réponse à cette question est revenue d'OpenAI. Cela me montre ce qui s'est passé et cela me donne en fait un élément très important, savoir l'identification de ceux qui ont affiné pour modéliser le nouveau modèle. Voici donc toute l'histoire des modèles un-à-plusieurs que j'ai créés auparavant. Et la plupart de ces cas ont été couronnés de succès, réussis, mérités. Je vais vous les montrer dans ma prochaine leçon lorsque je vous montrerai comment tester notre modèle pré-entraîné. en revenir à la fin de cette réponse que j'ai reçue, je veux voir ce qui s'est passé ici. Comme vous pouvez le voir, regardez, c'est l'identifiant du modèle que j' essaie de vous indiquer aujourd'hui. Je vais donc avoir besoin de cet identifiant pour changer le statut de ce modèle, celui que nous sommes en le statut de ce modèle, train de peaufiner Da Vinci est le modèle préentraîné que nous utilisons et nous allons nous contenter du processus de réglage. Et le nom du nouveau modèle est Narrow Disorder et ainsi de suite. Ce sont donc les informations importantes dont nous avons besoin. Et comme vous pouvez le voir ici, il est dit que c'est toujours en attente. En attente signifie qu'il utilise toujours le modèle de réglage précis parce que ce n'était pas Il n'est toujours pas affiné. C'est en train de le faire. Si vous regardez ici la dernière fois, j'ai essayé d'en trouver deux unimodaux, mais j'ai échoué. Il y a eu un problème. Si vous revenez ci-dessus, vous verrez l' historique de tous les modèles amusants à modéliser et chacun d'entre eux avec son identifiant. Cela peut donc m'aider à me souvenir de ce que j'ai fait auparavant si j'avais besoin d'un identifiant ou pour un modèle préformé, etc. Donc, afin de vérifier ce qui s'est passé avec le mien et le processus de réglage, je peux utiliser une commande Open AI incluse pour vous dans ce fichier. Cela peut être la dernière étape. Cette commande est préparée par OpenAI. Et cette commande est en fait deux fois pour suivre l'état du modèle affiné, mais vous devez inclure l' ID du modal ici. Revenez donc à votre CMD, copiez l'identifiant, l'idée du modèle affiné. Ici. Je vais le recopier deux fois, je vais revenir ici, coller l'identifiant après la lettre. Prenez cette réponse ou cette commande comme elle l'a fait. Retournez à votre sable, collez-le et amusez-vous. OK, bien. Il indique qu'open IE n'est pas reconnu comme une commande interne ou externe. C'est tellement bien que nous avons ce problème ici. Afin de résoudre ce problème, je vais installer la bibliothèque d'ouverture. Alors j'opte pour pip, j' installe Open AI. Une fois que je l'aurai fait, je pourrai ouvrir. J'ai installé. Bien. Il est prêt à être utilisé. OK, réessayons. Collez notre commande avec l' idée de notre modèle et envoyez-la pour l'ouvrir et voir ce qu'il est advenu de notre modèle affiné. Et c'est à nous. Comme vous pouvez le voir, ouvrez EBI foreign pour suivre. Une fois qu'il a suivi, il est dit que notre modèle a été bien créé. Cela a donc créé notre modèle affiné. Et c'est l'idée du nouveau fine-tune. Alors c'est ça. Il s'agit de l'ensemble du processus de mise au point d'un nouveau modèle. Et dans le prochain cours, nous allons vous montrer comment tester notre outil de pointage. 15. Tester votre modèle réglé sur OpenAI Playground: Bonjour et bon retour. Dans notre leçon d'aujourd'hui, nous allons tester notre modèle Fine Tune. Où le testons-nous ? We're Fine Tune Global a été retesté sur le terrain de jeu. C'est le premier endroit où nous avons apporté nos clés d'API. Et c'est l'endroit où les développeurs ou les utilisateurs peuvent réellement tester si leur compte et l'IA ouverte fonctionnent et où la clé de notre API est activée. Alors, qu'allons-nous passer à un nouveau navigateur Web ? Accédez à Open AI Playground. Et une fois qu'on l'aura ouvert , d' accord, voilà. Je vais cliquer sur Plaguing Old en haut. J'adore. C'est le polygonal et c'est là que je passe à la décimale et que j' affine le modèle. Comme nous l'avons dit à plusieurs reprises, sur le côté droit se trouve l'endroit où vous pouvez choisir celui avec lequel vous souhaitez traiter, le modèle auquel vous souhaitez répondre. Une fois que vous avez cliqué dessus, vous pouvez prévisualiser les modèles GPT is. Vous avez ces modèles de base et vers le bas, vous pouvez trouver votre ajustement. Pour notre modèle, celui que nous avons créé ensemble et Visa Sense, il s'agissait de Married Disorder Mobile. Alors voilà. Maintenant, une fois que j'ai choisi mon modèle, je peux également modifier la température pour m'assurer que le modèle n' utilise pas réellement d' informations supplémentaires ou n'essaie pas de faire créativité en ajoutant des informations supplémentaires, référant au modèle dimensionnel Je peux également décider si je veux que mes réponses soient plus courtes qu'une limite spécifique de tokenisation. Et je dois également utiliser cette séquence supérieure, les sujets que j'ai ajoutés à mes données avant de les peaufiner. Donc, la première chose à faire est que je vais écrire mon invite ici. Puisque ce modèle porte sur le trouble, je vais commencer par écrire qu'est-ce qu'un trouble mental ? Et je me souviens que ce suffixe ou le séparateur que j'ai ajouté à la fin de chaque invite était une barre oblique inverse et une barre oblique inverse. Je vais donc l' ajouter ici. Je dois également ajouter une séquence d'arrêt, le suffixe que j'ai ajouté à mes complétions dans mes données, qui était un triple hashtag. Une fois que vous avez écrit le caractère de séquence d'arrêt que vous avez utilisé, vous cliquez en haut. Vous l'avez donc ajouté. Vous pouvez maintenant soumettre votre demande et voir quelle réponse vous obtenez. Comme vous le voyez, j'obtiens une réponse précise et une réponse courte, même si je n'ai pas réellement modifié la limite ici. Imaginons que j'ai oublié d'ajouter ces suffixes ici et ici. Voyons ce qui va se passer. Supprimez donc simplement le suffixe Y ici. Et je vais supprimer cette séquence supérieure. Et je vais mettre , par exemple , la longueur maximale de la tokenisation et ils se soumettront, j'obtiendrai en fait une réponse très courte. Et si j'ajoute 50 libérations supplémentaires, je vais le soumettre à nouveau. Et comme vous pouvez le voir, j'obtiens une réponse plus longue et elle est indiquée par ce numéro. Donc, cette séquence supérieure est en fait quelque chose qui m'aide. Ici, comme vous pouvez le voir, ça s'est arrêté ici. Et il a tout de même ajouté quelques jetons supplémentaires ici afin d'utiliser la totalité des 50 tokenisations. Le fait est que ces suffixes sont là parce qu'ils nous aident à faire comprendre à notre modal que vous devez vous arrêter là où chaque fin que vous avez lue lorsque vous avez été entraîné se terminait par ces trois hashtags ? C'est ainsi que j'obtiens une réponse précise et fixe à ma question ici. C'est ça. C'est ainsi que nous testons notre modèle. Nous arrivons en fait du bon côté. Nous choisissons le modèle que nous testons. Devons-nous écrire notre approche ici, puis définir les suffixes des complétions sur le processus Et c'est tout.

GPT-3 pour les Chatbots: : créer une IA Conversational avec le réglage fin

Mariam Omar, Skilled in AI, Chatbots, Robotics

Regardez ce cours et des milliers d'autres

Regardez ce cours et des milliers d'autres

Leçons de ce cours

1.

Introduction au cours de finalisation

1:11

2.

Comprendre les modèles de GPT et le réglage fin pour des domaines spécifiques

1:59

3.

Maîtriser les Fine-tuning pour les applications NLP

1:55

4.

Introduction au terrain de jeu OpenAI

5:09

5.

Maximiser l'exactitude des modèles à l'aide de la préparation des données et de la mise en forme

2:09

6.

Affiner le modèle GPT : comprendre les formats de données

9:46

7.

Le nettoyage de données avec Python : supprimer les valeurs manquantes et les doubler

9:40

8.

Générer des questions et des réponses à partir de textes pour les modèles d'IA en perfectionnement finis

7:27

9.

Utiliser ChatGPT pour générer du code Python pour la manipulation des données

5:05

10.

Exécuter et exécuter le code Python sur Google Colaboratory

8:11

11.

Créer un répertoire de projets bien structuré

3:37

12.

Comment choisir un modèle pré-formé pour le réglage fin

3:13

13.

Introduction au processus de réglage fin dans Python

3:09

14.

Parler d'un modèle pré-entraîné : un processus en trois étapes

11:49

15.

Tester votre modèle parfaitement réglé sur OpenAI Playground

3:54