Transcription
1. Introduction au cours de finetuning: Nous savons tous que touch of
beauty est un chatbot
intelligent artificiel impressionnant, puissant et artificiel. Mais vous êtes-vous déjà demandé si
vous pouviez utiliser des APT de jonction, des capacités
impressionnantes pour créer votre propre projet
qui peut vous aider dans votre Rick en fonction de vos données, exemple pour créer
un chocolat qui aidera votre
service client ? Si vous l'avez déjà fait, vous
êtes au bon endroit. Je suis de l'argent, je suis sans abri. Et spécialiste de
l'intelligence artificielle. Dans ce cours, je vais vous
expliquer en quoi
consiste le réglage précis pour effectuer l'ensemble du processus jusqu'à ce que vous puissiez créer
vos propres types. Dans le premier module, nous allons
apprendre ce qu'est le réglage précis, pourquoi est-ce important ? Et quels types de projets les gens
utilisent-ils pour peaufiner ? Dans ce deuxième module, nous travaillerons
sur la préparation des données. Comment préparer nos données dans un format qui
peut réellement être donné à un modèle préentraîné
et travailler dessus pour affiner notre propre modèle
dans notre domaine spécifique. Dans le troisième modèle,
nous allons configurer le processus de réglage précis
et
atteindre un niveau qui
nous permettra de tester et d'évaluer les performances
de notre modèle. À la fin de ce cours, vous aurez acquis de
précieuses compétences en matière réglage précis et vous serez prêt à mettre en œuvre
votre propre projet. Alors allons-y.
2. Comprendre les modèles de GPT et le réglage fin pour des domaines spécifiques: Bienvenue à la première
leçon de ce cours. Dans notre leçon d'aujourd'hui, nous
parlerons des modèles GPT. Quels sont-ils et quelles
sont leurs limites ? Et pourquoi penserions-nous à
peaufiner nos propres modèles, ce qui nous permettra de
comprendre le réglage précis Qu'est-ce que cela signifie et où
est-il réellement conservé ? Les modèles Gpt-3 sont une vaste et puissante famille
de modèles linguistiques. Ils peuvent tous
traiter du texte, des instructions, questions et toute
information en fonction de ce pour quoi ils ont été formés. Ils appliquent le traitement du
langage naturel, un sous-domaine de l' intelligence
artificielle
qui concerne les ordinateurs. Comment traitent-ils, interprétent-ils
et génèrent-ils le langage humain ? Ces modèles pré-entraînés,
préalablement formés par open here, ont appris à
gérer le langage humain, ce qui en fait un excellent départ pour de nombreuses applications. Mais nous devons nous adapter
et faire face aux nôtres. Bien qu'ils soient très
puissants et impressionnants, ils ont des limites. Et ce
sont ces limites qui nous
inciteront à
peaufiner les nôtres. L'une de leurs limites
est qu'ils ont une limite supérieure en termes de qualité et qu'une personne
doit effectuer de nombreuses tâches d'ingénierie
rapides
pour obtenir une réponse rapide. Une autre limitation
est qu'il existe une taille maximale pour la face avant. Vous devez donc travailler
rapidement et correctement. Et vous ne pouvez pas fournir
beaucoup d'exemples au modèle pour
obtenir une bonne réponse. Les autres limites
dont nous pouvons
parler sont la côte et l'alphabétisation. Nous savons que GPT facture
la tokenisation. Ce n'est donc pas un
choix judicieux de penser à dépendre d'eux pour toujours
et à les garder. Cela nous amène donc à
réfléchir à la mise au point. Et pourquoi
peaufinerions-nous nos propres modèles et les
forçerions-nous à fonctionner et à
nos domaines spécifiques Mais qu'est-ce que le réglage précis ? Le réglage précis est une technique
qui permet d'utiliser des modèles préentraînés, de les
adapter à
nos tâches de commande. Mais d'abord, nous devons nous fier à l'automobile en supprimant
la dernière couche alimentant le moteur avec nos
propres ensembles de données préparés, ce qui
créera en fait un modèle qui sait exactement quelles
sorties il doit fournir.
3. Mastering Fine-tuning pour les applications NLP: Le réglage précis est une
technique puissante qui permet d'adapter modèles
préentraînés à
des applications NLP spécifiques. Dans cette leçon, nous
aborderons
les concepts clés, les étapes
à suivre pour être
prêt à les ajuster avant de décider d'
affiner votre modèle. Et vous devez comprendre le
problème sur lequel vous travaillez. Quelle est la tâche à
accomplir et quelles sont les exigences
de cette tâche, telles que la rapidité, la précision. Vous devez également connaître
les caractéristiques du jeu de données
que vous utilisez, telles que la taille, le domaine et le type de
données que vous utilisez ? En répondant à ces questions, vous êtes tout à fait prêt
à déterminer si réglage précis est la solution
à votre problème ou non. Une fois que vous avez
décidé de trouver et de régler un modèle, vous devez choisir
le
modèle pré-entraîné sur lequel vous souhaitez vous fier. Il existe de nombreux types
de modèles préentraînés, chacun ayant ses points forts
et reconsidérez-le. Certains d'entre eux ont été formés
à la génération de données ou de textes. D'autres sont parfaits pour le codage. Vous devez donc choisir le
modèle qui a été entraîné sur des données similaires
à celles que vous utilisez. Ou dans ce domaine précis. Cela rendra le
réglage précis ou efficace. Oxford, vous choisissez le modèle
préentraîné que vous
devez commencer à modifier
lors de la préparation de vos données. La préparation des données implique de
modifier le format des données pour qu'il adopte un format compréhensible par
le modèle
préentraîné, tel que la tokenisation
et le codage. Si vos données sont prêtes, c'est la clé pour
commencer à peaufiner les réglages. Cela signifie qu'il faut
continuer à entraîner le modèle pré-entraîné sur le
jeu de données que vous avez préparé. Une fois que
vous avez affiné votre modèle, vous devez évaluer
ses performances. Vous devez essayer le modèle, lui donner des données, voir quelles
sorties il vous donne. Cela vous aidera à effectuer une analyse des erreurs pour identifier les vos modèles et comment améliorer leurs performances. Donc, après avoir compris votre
problème, préparé vos données, choisi le modèle pré-entraîné, ajusté le modèle
et l'avoir évalué. Vous serez sur le point
de maîtriser le réglage précis des applications de
PNL.
4. Introduction à OpenAI Playground: Bonjour et bienvenue
à une nouvelle leçon. Dans notre leçon d'aujourd'hui,
nous allons présenter un aperçu des
IA ouvertes. Cliquez dessus. Playground est une interface en ligne facile à utiliser qui
permet aux utilisateurs d'expérimenter et de tester les fonctionnalités
des API des modèles de chat qu'ils ont créés. Le fait est que chaque fois que nous
voulons réduire les données, vous n'avez pas besoin de
connaissances préalables en programmation. Tout utilisateur ou toute personne
qui ne connaît rien à la programmation peut
réellement utiliser le Play-Doh. Parce que le terrain de jeu
est une interface qui permet de tester les
modèles déjà pré-entraînés réalisés par OpenAI. Vous pouvez également l'utiliser pour tester vos propres modèles affinés. Donc, pour vérifier quel est
ce terrain de jeu, allons-y. Nous allons aller sur un site Web
appelé OpenAI Playground. Une fois que vous avez tapé
opening the grounds, il vous faudra
ouvrir une belle page où vous pourrez
générer vos clés d'API. Ici, vous pouvez présenter
vos clés API ou créer un nouveau
secret, le cas échéant N'oubliez pas que ces
clés API sont celles que nous utilisons pour
affiner nos propres modèles, créer nos propres
chatbots, etc. Et chaque fois que vous en
générez une nouvelle, vous devez la copier et en conserver
une copie car c'est une clé secrète qui ne vous apparaît plus ici. C'est donc la page où nous pouvons réellement créer des
clés d'API et les récupérer. Mais dans cette page, nous voulons aller au terrain de jeu situé dans la partie supérieure. Une fois que j'ai cliqué sur le
terrain de jeu en haut, c'est le terrain de jeu, celui dont nous avons un
aperçu de ses fonctionnalités aujourd'hui. Tout d'abord, le Brigham
est un outil de test pour les
modèles. Ainsi, sur le côté
droit, vous pouvez choisir dans
cette liste déroulante, quel modèle utilisez-vous ? J'ai ici les différents modèles d'
Open AI,
Da Vinci Query, Babbage et Adele, et ils ont des
spécifications différentes. Nous en
reparlerons plus tard. Je peux savoir lequel
d'entre eux je dois tester. Une fois que vous avez choisi le modèle, vous avez cette boîte ici. Il s'agit des livres d'entrée
et de sortie. C'est l'endroit
où vous pouvez poser une question telle que votre invite, telle que les noms des voitures effacées, et envoyer l'invite. Et au même endroit, vous pouvez
recevoir les obligations à risque
en provenance de Copenhague. Il s'agit donc d'une zone d'entrée et de
sortie où votre invite apparaît lorsque la réponse à apparaît lorsque la réponse à
cette invite apparaît
telle quelle Il existe d'autres
paramètres sur lesquels vous pouvez travailler
afin de contrôler cette liaison. Parlons par exemple du paramètre
de température. La température est un
paramètre qui varie de 0 à 1. Si vous le mettez à zéro, cela signifie que vous ne souhaitez pas que
le modèle fasse preuve de créativité
en vous répondant. Si vous le mettez en un, cela signifie que vous
voulez que le modèle soit très créatif et qu'il
vous donne des réponses différentes chaque fois que
j'essaie de donner
des réponses créatives également. Si vous voulez parler du paramètre de longueur
maximale, nous
parlons en fait de la tokenisation. Et il s'agit d'un chiffre
qui peut en fait être le montant précis
auquel vous souhaitez que le modèle vous
réponde. Il ne s'agit pas seulement
de la réponse, mais aussi de l'invite. Remplaçons donc ce
paramètre sur true. Par exemple, actualiser. Vous envoyer à nouveau un message. Et la réponse que vous recevrez
est très courte car cela représente
au total environ deux jetons. Mais donnez-lui plus,
disons
bronzez et vous soumettez et vous obtiendrez
une réponse plus longue, car cette réponse ici
avec l'invite est environ dix jetons.
La séquence d'arrêt est une variable qui nous permet de
faire
comprendre à notre modèle étranger une variable qui nous permet de
faire
comprendre à notre modèle étranger quand il faut arrêter de
répondre à une invite. C'est un personnage que
nous déciderons ou que nous
utiliserons chaque fois que nous testerons
nos modaux affinés. Voici donc les paramètres que je peux modifier
ici. Il existe également d'autres
fonctionnalités sur le terrain de jeu et
je peux les désactiver, par exemple toute invite générée
peut être enregistrée. Il est également partageable,
donc c'est bien. Vous pouvez le partager avec d'autres personnes. Vous pouvez le copier, prendre une copie et le
conserver où vous le souhaitez, par exemple sur vos documents, etc. Une autre chose dont je
voudrais parler est la barre ci-dessus. Vous aurez différents
onglets ici. Et ceux-ci sont très
utiles car vous pouvez trouver de nombreuses
informations sur la documentation. Et cela lui a ouvert les yeux
sur le blog et sur d'autres exemples
d' instructions que vous pouvez
utiliser pour tester les GP T-Mobile. Si vous allez dans la section
documentation, nous quitterons le terrain cette invite disparaîtra. Mais vous trouverez
de nombreux dossiers descriptifs, fichiers sur tout ce dont
vous pourriez avoir besoin d'
autres didacticiels sur
la tokenisation, la tarification ajustements et tout
autre document dont vous pourriez avoir besoin pour vous aider gérer Open
AI to be team. Voilà pour le terrain de jeu. C'est notre terrain de jeu. Encore une fois, il s'agit d'une interface simple
qui permet aux utilisateurs ou aux
développeurs de tester les
capacités des modèles GPT.
5. Maximiser l'exactitude du modèle avec la préparation et la mise en forme des données: Bonjour et bienvenue
à une autre leçon. Dans notre leçon d'aujourd'hui,
nous allons
parler des avantages de la
préparation des données et de leur mise en forme avant de les utiliser pour
affiner un modèle. Tout d'abord, nous
devons savoir que préparation des données est cruciale
pour un réglage précis. Pourquoi ? Parce que cela affecte la précision et l'efficacité du modèle. Tout d'abord, les données formatées
sont utilisées à bon escient. Cela permet au modèle généraliser les
modèles de manière satisfaisante, qui signifie que nos données doivent être étiquetées codées non structurée avant d'être transmises
au modèle préentraîné données
bien formatées constituent
en fait un bon point de départ car elles réduisent les
erreurs et garantissent que le modèle n'
apprend pas d'informations biaisées. Ce jeu de
données bien formaté réduit également le temps et les efforts nécessaires
au traitement et au nettoyage des données. Les données se présentent en fait sous
différents textes ou formats. L'utilisation de différents formats signifie que vous devez vous assurer que ces données sont préparées
de
manière à pouvoir être
transmises aux personnes préformées. Les données se présentent donc sous
différents formats. Et différents formats
peuvent être utilisés pour les projets d'apprentissage
automatique ou de traitement du
langage naturel. Mais d'abord,
en fonction des données dont vous disposez, vous devez connaître le nombre d'étapes à suivre pour le formater. Si vous avez un texte de ligne, vous devez savoir que
pour cette ligne, les textes ne peuvent pas être transmis au modèle, mais nous
pouvons néanmoins suivre quelques conseils de
préparation pour le préparer à être
transmis à un modèle pré-entraîné. fichiers CSV, connus pour les feuilles de calcul,
constituent un autre type de
données . Cela doit également être préparé de manière à ce que le modèle
puisse le comprendre. Le dernier format dont
je vais
parler concerne les goûts et l'intrigue. Et il s'agit du
lot Final Four que nous allons analyser
et préparer sur n'importe quel
type de données
afin d'être prêts
à fournir les données directement à utiliser pour
affiner un modèle préentraîné. Dans cette leçon,
nous avons donc parlé des
avantages du formatage
et de la préparation des données avant de
peaufiner un modèle Nous avons également parlé des
types de formats de données qui peuvent être utilisés pour
affiner un modèle. Et dans la prochaine
liste de leçons, nous
parlerons de techniques et d'
idées permettant de préparer les
données de la meilleure façon possible.
6. Définir un modèle de GPT : comprendre les formats de données: Bonjour et
bienvenue dans une nouvelle essence. Dans notre leçon d'aujourd'hui,
nous allons
parler du format des données que nous utiliserons pour affiner le mode TP, T. Tout d'abord, nous
parlerons préparation de nos différentes données. Nous allons prévisualiser les
différents ensembles de données gagnés. Nous discuterons de leurs forces et de leurs
faiblesses. Alors ? Nous allons également
mentionner des conseils sur la
façon de disposer de données fiables, prêtes à être façon de disposer de données fiables, prêtes à utilisées pour
peaufiner un modèle. Enfin, il y a quelque chose
que je souhaite expliquer à
la fin de cette leçon, à savoir l'
ajout de suffixes aux données. Je vais aller sur mon Google Drive. J'ai ici un ensemble ou un groupe de jeux de données
que j'ai préparés pour vous. Je veux les prévisualiser en les
examinant et voir quelles sont les forces et
les
faiblesses d'un tel ensemble de données. Par exemple, j' ai ce premier fichier
qui s'appelle Arduino. Arduino est un
composant spécifique, un microcontrôleur. Imaginons ou
créons un mode graphique. Ce chatbot est là pour répondre à
toute question concernant Arduino. Donc, le truc, c'est que je
dois regarder mes données. Tout d'abord, comme vous pouvez le constater, j'ai une série de
questions à vous poser. Sur la gauche. J'ai les réponses à
ces questions. Et ce sont là
des questions différentes. Qu'est-ce qu'Arduino, quel type de licence possède le
matériel Arduino ? Hughes et Soma, je
veux vous montrer que c'est parfois un étudiant qui a
une approche différente, par
exemple, que sont les projets
Arduino ? Alors, qu'est-ce qu'Arduino ? Qu'
est-ce que le projet Arduino ? Ces deux réponses peuvent avoir la même réponse ou une
réponse proche qui soit acceptable. Mais si vous regardez ici, quand a débuté le
projet Arduino ? Le projet Arduino a débuté en 2005. C'est une perte de temps pour le modèle de lire
chacune des données. J'ai donc un doublon ici. Donc, tout d'abord, je
devrais supprimer cette ligne. Vous devez donc prévisualiser vos données et vous
assurer d'avoir seule question à laquelle il existe une
réponse connexe, une réponse unique. Parfois, j'utilise
la même réponse, mais je dois certainement alimenter mon modal avec
des structures de questions différentes. Il est donc acceptable d'utiliser deux phrases
ayant le même sens ,
mais écrites
différemment. Mais choisir la même réponse ou donner la même réponse à deux questions
différentes n'est pas accepté. OK, prévisualisons
un autre jeu de données. Je vais passer à celui-ci. Celui-ci parle de tremblements de terre. Il s'agit également d'un groupe de
questions sur les tremblements de terre. Cet ensemble de données peut être utilisé, par exemple si vous êtes enseignant ou instructeur et que vous
créez un outil pour aider vos élèves à poser questions sur cette
unité ou quelque chose comme ça. J'ai donc différents groupes de questions qui
ont chacune une réponse différente. Et comme vous pouvez le constater, il
est acceptable d'avoir une réponse très longue liée à
une question acceptable. Mais encore une fois, comme vous pouvez le voir, je
n'ai ici, par exemple , que 25 valeurs et c'est la prochaine étape dont je
vais parler. Nous ne devons pas entraîner ou affiner un modèle en fonction de seulement
25 entrées différentes. Et les résultats sont des instructions
et des complétions. Nous devrions en fait donner
au modèle
au moins 200 instructions et
complétions différentes afin de nous assurer que la phase finale ou les étapes de réglage
se déroulent correctement. Bien. Il s'agit donc d'un bon ensemble de données mais il ne contient pas
beaucoup d'informations. Prévisualisons-en un autre. Je vais m'en tenir à celui-ci,
les données sur les troubles mentaux. s'agit également d'une initiative
de questions-réponses, et elle est en fait créée d'une manière intelligente que je
vais partager avec vous lors des
prochains cours. Tout d'abord, qu'est-ce que
le trouble mental ? Et voici la
réponse ici. Il s'agit donc d'une série de questions posées à un groupe d'officiers.
D'accord. C'est une bonne chose. Mais si je descends,
j'ai des lignes vides et je ne devrais pas réellement avoir d'
intégrales dans mon jeu Ces intégrales
doivent
donc être supprimées. Une autre question est la suivante : quelles sont les
causes des troubles mentaux ? C'est une question. Et quelles sont les causes des troubles mentaux ? Comme je l'ai dit, ces deux questions sont rédigées différemment, mais elles donnent toutes deux
la même réponse. Ce n'est pas grave parce
qu'ils
prennent en fait la même réponse. Bien, parce que j'ai différentes questions à propos de
ces e-mails ou cela peut aider le modal à comprendre
et à établir un lien entre les deux. Parfois, la question peut
être posée de différentes manières. Bien. Je tiens également
à faire attention au fait que, si vous pouvez le voir ici, sont des séries de questions
qui se répètent en fait. J'ai une série de
questions ici. Et je me pose peut-être mêmes questions, mais avec des manières
différentes de taper. Ils doivent en fait être lus correctement,
car ils ont été préparés à l'aide d'un outil en ligne qui génère
des questions et des réponses. Ces lacs de données disparaissent donc. Si je fais défiler la page vers le bas, je peux
voir que j'ai environ 138 lignes supprimant la ligne vide. Donc 150, je peux dire que
c'est acceptable. Un tel ensemble de
données peut donc être utilisé pour affiner et modéliser. Maintenant, nous allons prévisualiser le
dernier que je vous ai préparé, qui est celui que vous trouverez ici. C'est différent. Pourquoi ? Parce que ce n'est pas sous forme
de questions-réponses. Il est en fait construit sous forme d'instructions, de
sujets, de sujets différents. Et ici, sur le côté droit
des tweets de la personne, d'une personne en particulier. Désormais, ces données peuvent être utilisées, par exemple pour imiter la façon dont
une personne répond aux gens. Si vous le pouvez, faites attention à
l'importance de rester hydraté
pendant l'exercice. Et sur le côté droit, j'ai
son commentaire ou son tweet. Je viens de terminer une longue
course et c'est génial N'oubliez pas de rester
hydraté au réveil. De bons conseils pour améliorer
vos habitudes de sommeil. J'ai aussi
du mal à m'endormir, essayer de lire un livre
auparavant, etc. Ce sont donc des
tweets différents sur différents sujets. Et ces données
peuvent être utilisées pour créer un robot de discussion
capable de parler comme des personnes
physiques de manière amicale. Vous pouvez voir ici qu'il est dit : « Les gars, je l'ai vivement recommandé » et
il prononce quelques phrases
exclamatoires. Parfois, il commence
par vous poser une question, puis à donner
son opinion à ce sujet. Tellement bon. Maintenant, comme vous l'avez vu dans les
ensembles de données précédents, il
y avait quelque chose auquel je
n'ai pas vraiment prêté attention
ou dont je n'ai pas vraiment parlé. En regardant chaque phrase
de mon ensemble de données,
j' ai dit que nous avions une invite. C'est l'invite ou la
question que j'attends de mon utilisateur, celui qui va utiliser mon application
pour saisir du texte dans le modèle. Et c'est la réponse que je m' attends à ce que mon Moodle leur
donne. Comme vous pouvez le voir ici, à
la fin de chaque invite, nous avons inclus une barre oblique inverse qui
finit par s'effacer, et il s'agit d'un suffixe. suffixes sont
censés être ajoutés à mes données avant de
transmettre mes données au modèle. Cela permettra au modèle
pré-entraîné comprendre que c'est
là que la phrase ou l'invite et que c'est là que la fin ou la mienne
répondent à la phrase commence. Et la complétion doit également inclure
un suffixe. Deux suffixes différents. suffixes peuvent être une barre oblique inverse n Cela peut aussi être un mot
tel que l'écriture de la fin du mot, par exemple en
majuscule ou quoi Cela doit être répété
dans chaque subvention, que ce soit d'autre.
Cela doit être répété
dans chaque subvention, et je
dois m'assurer que cette spécificité des œufs
n'est incluse dans mon ensemble de données
nulle part dans les données. Mais maintenant, pour en revenir aux
données des tweets, réfléchissons à la manière d'ajouter les suffixes et les
préfixes en un clic. Je peux opter pour ce qui suit. Je peux le prendre, le
coller dans la deuxième colonne. en revenir à
la première colonne, c'est la première
invite que j'ai. Je peux opter pour cela égal à. Nous appliquons donc en quelque sorte
une fonction, cette cellule. Et je veux que vous y ajoutiez
entre guillemets doubles car j'ajoute des
chaînes, par exemple une barre oblique inverse. Et je peux terminer et m'envoyer
n'importe quel n majuscule ou minuscule. C'est en fonction du
suffixe que nous voulons utiliser, alors vous pouvez l'envoyer. Et comme vous pouvez
le constater, il
suggère en fait de remplir automatiquement
les autres. Voulez-vous que j'ajoute également
cette barre oblique inverse à chaque fois, je peux répondre par oui,
non, en créant ensemble de bronze avec
le suffixe dont j'ai besoin. Je vais donc
copier cette loi. Je vais revenir
à la première, mais je vais la
coller uniquement sous forme de valeurs. Ensuite, je peux supprimer cette
colonne d'ici. Maintenant, j'ai préparé mon
ensemble de données avec le même suffixe ajouté à
chacun d'eux, earn. Je peux également faire cette scène sur
cet ensemble de données ici. C'est tout pour aujourd'hui. Pour conclure, nous avons simplement prévisualisé un
groupe de jeux de données. Nous avons discuté de la manière
d'utiliser ces ensembles de données pour différentes applications à l'aide de modèles
GPT ou de réglages précis. Nous avons vu qu'il fallait supprimer
les doublons dans Curios, ajouter des suffixes. C'est donc ce que nous avons dit ou ce dont nous avons parlé
dans les leçons précédentes. Nous avons dit que chaque fois que je
souhaite utiliser des données pour affiner, ces données doivent être
étiquetées, structurées et codées. Et voici la forme finale
des données que je vais
utiliser pour mon point de vue de ce soir. Mais le fait est qu'avant de
l'utiliser comme fichier Excel, je dois modifier ses deux
anciens tuyaux adjacents. Et c'est
ce que nous allons
expliquer dans les prochaines leçons. Restez donc à l'affût et
merci de m'avoir écouté.
7. Nettoyage des données avec Python : supprimer les valeurs manquantes et les duplicats: Bonjour et bienvenue
à une autre leçon. Dans notre leçon d'aujourd'hui, nous
allons travailler sur nos données. Nous voulons nous assurer de disposer données
propres à être utilisées
pour affiner les réglages. Le fait est qu'aujourd'hui, c'est
l'une des techniques permettant d'utiliser code
Python pour la préparation
des données. Nous travaillons donc sur
un fichier CSV,
qui est un ensemble de données, et nous allons
lire cette diapositive. Ensuite, nous voulons supprimer
toutes les valeurs manquantes ou les doublons,
car lors du réglage, les doublons sont réellement achetés. Ensuite, nous voulons enregistrer le nouvel
ensemble de données dans un nouveau fichier. Voici donc notre plan
pour la leçon d'aujourd'hui. Je vais donc d'abord accéder
à un nouveau navigateur Web, et je vais accéder à
quelque chose qui s'appelle Google Colab. Google Colab est un
outil en ligne qui vous permet d'exécuter et d'exécuter facilement votre code
Python. C'est donc ici que nous
allons travailler. C'est la
page principale qui chaque fois que vous accédez à Google Colab Vous devez vous assurer que vous êtes
connecté à votre propre adresse e-mail, celle qui est
liée à votre lecteur, parce que c'est là que
nous allons conserver nos informations et les utiliser pour le lecteur gagné.
Lorsque nous voulons appuyer pour tomber et
démarrer un New York, nous devons nous assurer que
les données que vous souhaitez l'enregistrement est sur votre lecteur. Je vais donc accéder à mon
lecteur, à mon Google Drive, et m'assurer d'avoir
préparé mes ensembles de données. Donc, en accédant au lecteur, je vous montre que j'ai créé un
fichier appelé ensemble de données. À l'intérieur de cette ligne, j'ai collé
ou téléchargé mes données. Et si je veux prévisualiser
les données dont je dispose, vous pouvez voir que j'ai un
ensemble de données sous forme de feuille Excel, vous pouvez voir que j'ai un
ensemble de données sous forme de feuille Excel,
un fichier CSV contenant des
informations sur les ordinateurs et leur vitesse ou
d'autres informations dont j'ai besoin,
telles que le prix et l'
endroit où je peux les trouver, le pays, la ville et d'autres informations. Je voudrais peut-être créer
un modèle qui utilise ces informations
afin de
protéger le
prix d'un ordinateur en fonction de la mémoire interne, de
la
vitesse et de la capacité protéger le
prix d'un ordinateur en fonction de du processeur, et de tout autre détail que j'ai besoin de connaître
sur l'ordinateur. Bien. Voici donc mon ensemble de données sur
lequel nous allons travailler. Je l'ai mis dans mon lecteur, dans un fichier, dans un dossier appelé ensemble de données à l'intérieur d'un fichier
appelé logiciel matériel. Maintenant, je suis un peu nouveau. Remarque, renseignez Google Colab. Maintenant, tout d'abord, vous devez vous assurer que le Colab est connecté à votre. Je vais aller à
gauche, en cliquant sur cette icône, pour prévisualiser
mes fichiers. Vous pouvez voir qu'il se
connecte à quelque chose, mais il n'est pas réellement
connecté à mon droïde. Donc, en cliquant sur le
troisième bouton, je peux monter Molly
Drive sur la couleur globale. Je vais donc demander
Mountain avec Google Drive. Parfois, il peut s'agir d'une mise à l'échelle automatique, d'autorisations
complètes, etc. Connectez-vous à Google Drive. Si vous ne vous êtes pas connecté auparavant, vous pouvez
peut-être vous connecter. Vous pouvez donc réellement
obtenir une pierre d'accès. Il est censé
apparaître ici. Et comme vous pouvez le
voir, c'est ici. Nous sommes prêts à partir.
Nous allons maintenant commencer à taper du code Python
afin de pouvoir lire
le fichier et l'enregistrer. Tout d'abord, nous
devons importer le package pandas. Nous allons donc travailler
sur l'importation de pandas au format pdf. Le fait est que nous
essayons d'importer le package pandas, celui qui
nous permettra de traiter les fichiers CSV. Sur le groupe, je clique sur Trunk et j'attends que les
partenaires soient importés. Bien. Maintenant, je suis prête à utiliser
Pandas quand je le souhaite. Le faible. Et la prochaine étape est de commencer par ajouter une
deuxième ligne de code. Et maintenant, nous voulons
décider du chemin de notre fichier. La partie du CSP trouvée
que nous avons ajoutée à notre sec. Je vais cliquer sur
le menu déroulant. Ensuite, je
vais prendre mon voiture. Ensuite, je vais
chercher le dossier que j'appelle dataset dans lequel se trouve
mon fichier. Ça y est. Et une fois que je l'ai ouvert, nous pouvons voir que mon fichier est là. Je vais cliquer dessus et
demander le chemin de copie. Il s'agit du chemin du fichier. Donc je vais y aller
et dire que le chemin est égal à l'état, j'espère. Collez votre chemin ici
et assurez-vous de l'avoir collé correctement, car cela m'
a donné ce signe de fille. Donc deux signifie que mon fichier
est prêt à être écrit. Que voulons-nous faire ? Nous
allons ajouter une autre ligne de code maintenant nous allons commencer
à essayer de lire nos quatre lignes de code. Donc, le fait est que
nous allons
commencer par définir une
fonction qui est égale à DP point read
underscore csv, très bien. Et ce fichier CSP
se trouve King. Le chemin que j'ai
déjà écrit plus haut. Je suis prête à m'intégrer et
à courir comme si j'étais cuit. Bien. Non, je peux réellement lire mes données pour
m'assurer de pouvoir lire mon Anita, allons-y avec ce qui suit. Dr., chef. Et je peux utiliser cette fonction
pour présenter ou pour afficher les cinq premières lignes de
mon jeu de données ou de mon futur. Réexécutons-le. Et comme vous pouvez le voir, j'ai accès à un jeu de données sur
les jouets
et je vais y présenter les cinq premières valeurs
ou lignes. Je peux donc voir que c'est un
ordinateur qui est impliqué, qu'il s'agit de la vitesse et toute autre information
que j'ai besoin de connaître. Nan. Quelle vantardise ne le fera pas. Le
fait est que nous voulons maintenant commencer à suivre les étapes sur lesquelles nous nous sommes mis d'accord. Tout d'abord,
vous devez commencer par supprimer les valeurs manquantes. Pour en revenir à notre appel, nous voulons commencer un nouveau code. Maintenant, que voulons-nous qu'il fasse ? Nous voulons commencer par supprimer
les valeurs manquantes. Nous allons donc opter pour
le point UDF, drop. Tout ce qui a été entendu. Nous allons ouvrir
un support. Nous pouvons donner une variable
qui est refroidie sur place. True in place signifie que
vous souhaitez remplacer les valeurs de l'
ensemble de données que vous avez lu et que vous le chargez ici
par les nouvelles valeurs. Oui, je le sais. Je vais donc
opter pour ce qui suit. Sur place, c'est vrai. Ou je saurai que je vais m'
occuper de ma cuisine. Bien. Maintenant, ce code spécifique supprime toutes les
valeurs manquantes de mon ensemble de données. Donc, s'il y avait une valeur
manquante susceptible d'
affecter le fonctionnement de mon modèle entraîné, je souhaite la supprimer afin pouvoir utiliser cette fonction
pour les supprimer. Maintenant, l'étape suivante consiste à ajouter une autre couche.
Que voulons-nous faire ? Nous voulons réellement
supprimer les doublons. Comme nous l'avons dit, l'entraînement
d'un modèle avec des données
dupliquées affecte en fait les performances du modal. Éclairez-moi. Bien. Nous allons donc recommencer avec DF Dot Drop sur ses doublons de
soins. Ici, il est dit que
vous pouvez simplement collecter dessus. Gagné. Encore une fois, nous allons opter pour le principe
« sur place » égal à vrai. Nous avons un
État de double obligation ici. Et je vais exécuter mon code. Bien. Donc, la deuxième
déclaration, juste pour supprimer les
doublons de
l'ensemble de données que nous utilisions ? Non. La prochaine étape consiste
à enregistrer notre nouvel ensemble de données dans un nouveau fichier. Je vais donc ouvrir un nouveau code. Maintenant. Sauvegardons cet ensemble de données à
deux heures de route. Je vais
donc suivre ce qui suit, la fonction dopée sur vos scores, CSP, la fonction que j'ai créée, je vais l'enregistrer sous forme de fichier
CSV qu'elle a ouvert. Les kits de rock seront
associés à la dénomination des nouveaux fichiers. Je vais donc ouvrir
une seule mutation. Et pour réduire au silence,
Fisher optera un ensemble de données de soulignement de
date formaté. Et c'est le nom de ce qui est
sans faute qui est en train de créer. Et ce
sera sous forme de fichier CSV. Et je dois également
ajouter un index pour m'
assurer que la
variable d'index est fausse. Les cheveux et, sur ma
déclaration, sont prêts. Je vais le lancer
et c'est parti. Alors, qu'est-ce que ce CO2 ? Il y a du code qui a réellement
importé le colis des pandas. Le package Pandas
m'aide à traiter les détails. J'ai identifié la partie
du fichier que j'ai conservée sur mon lecteur après
l'avoir monté sur My Drive. Puis j'ai commencé
par lire un fichier, présentant certaines des
valeurs et sa biographie, j'ai supprimé les valeurs indésirables
ou manquantes. Je supprime les doublons
et j'ai finalement enregistré. ailleurs,
pour vous montrer cette
infirmière à l' unisson, je vais aller sur mon
Drive ci-dessous, et je peux découvrir qu'
il y a un vol au-dessus d'ici appelé ensemble de données
formaté. Voici donc le nouvel
ensemble de données que je peux distinguer chargé plutôt que de parfumer les données et de m'assurer que
tout ne fait qu'un. C'était donc en fait
l'une des idées que les gens
peuvent utiliser
pour préparer leurs ensembles avant de les utiliser
pour les affiner. Merci d'avoir regardé.
8. Générer des questions et des réponses à partir du texte pour les modèles d'IA: Bonjour et bienvenue
à une nouvelle leçon. Dans notre leçon d'aujourd'hui, nous allons
parler de la préparation des questions et des réponses
à partir d'un point fixe. Comme nous l'avons déjà dit
dans les leçons précédentes, nous avons dit que
nous pouvons parfois avoir besoin d'utiliser du texte, simplement de lancer du texte
pour peaufiner un modèle. Mais nous ne pouvons pas réellement envoyer le texte de
cette ligne au modèle comme
vous le testez Nous devons le faire pour le traçage Le format est qu'il peut être
divisé en deux étapes. Principe : préparation
des données sous forme d'
instructions et de compléments avec les suffixes
inclus dans les données. Et la seconde consiste à modifier ces données de deux points adjacents par lot. Ensuite, nous pouvons commencer à peaufiner
le processus. Donc, pour aujourd'hui, nous allons
parler de cette étape. Comment puis-je préparer les questions
et les réponses, le texte ? En fait, je vais
partager avec
vous un bon outil que vous pouvez utiliser. Donc, comme vous pouvez le voir ici, j'
ai un essai sur les animaux. Cela représente environ 500
mots. Et comme vous pouvez le constater, cet essai est divisé en différents paragraphes ou éléments. Je peux en fait copier l'ensemble des
analyses et les intégrer à un outil
en ligne où je peux utiliser ce texte pour générer des questions et
des réponses afin de pouvoir entraîner mon modèle en fonction
de ces questions et réponses sous forme d'instructions
et de compléments. Donc, le truc, c'est que
nous allons accéder à la largeur du navigateur et
taper drain Pali et QA generated. C'est notre outil, celui que je vais
partager avec vous aujourd'hui. Il s'agit donc d'un outil
créé par OpenAI. Et même vous pouvez utiliser cet
outil sans rien. Nous allons juste payer
pour la tokenisation, celle qui est déjà utilisée, GPT ou TBT
facturent en fait. Alors regardez ici avant de commencer, nous devons saisir notre clé API. Parce que nous utilisons en fait un module ATI pour
le faire. Nous sommes, allons-y, réveillés extrêmement
égaux à deux nœuds, ce qui est un locataire. Et cela peut réellement vous aider en vous
inscrivant pour vous connecter
si vous avez un compte. Mais disons que je n'
ai pas de compte. Je peux me contenter d'
apporter ma clé API. Et simplement en ajoutant une clé API
supplémentaire ici et en
vérifiant la clé, je peux réellement commencer à
utiliser l'outil. Je n'ai donc préparé que ce qui
se passe ici. Je vais le copier. Je vais
retourner sur mon site Web. Je vais le coller. Je vais essayer de
vérifier ma clé. Et cela indique que
Q UK a été vérifié et stocké
localement dans votre navigateur. Bien. Je vais y aller, d'accord, et ne disons pas VB Vicky. Maintenant, je suis prêt à
partir. Regarde ça. C'est tellement simple et fluide
et c'est vraiment utile. Ça dit : « Entrez les bâtons ». Vous souhaitez générer deux questions
et réponses ici. Je vais donc revenir au texte
que j'ai préparé. Je vais copier mon texte. Quelle est la longueur de la nouvelle échelle ? Une fois que j'ai perdu, c'est prêt. Je vais y
retourner et le coller. Par ici. Vous devez donner au modal ou au programme une idée de
la façon dont mes
paragraphes étaient séparés. Il est donc demandé quel est le paragraphe séparé par un seul retour ? Ou disons un
espace vide ou quelque chose comme ça. Donc je vais dire que je vais m'en tenir
à un seul tour. Ou peut-être que je peux simplement suivre
ce qui suit, en laissant un espace vide
au début ou à la fin de chaque paragraphe. Cela permettra en fait de rendre les données sur le
vin plus claires et de les
préparer à être utilisées. Bien. Alors c'est ça, Good. Maintenant, je vais passer en
revue mon paragraphe. Et ici, l'outil a simplement divisé mes paragraphes
en différents groupes. D'accord ? Maintenant, il y a quelque chose que je
dois expliquer ici. Générez trois séries de cinq questions
au
maximum pour chaque paragraphe. Donc, si je demande
à l'outil de le faire pour moi, je
lui demande en fait de
créer trois séries différentes de cinq
questions pour chaque paragraphe. Donc, en multipliant,
je peux savoir que , pour chaque paragraphe trois séries de lunes mes questions seront répétées, mais peut-être d'une manière différente, mais elles recevront en fait la même réponse. Essayons donc de poser deux séries de cinq questions
pour chaque paragraphe. Maintenant, j'ai de petits paragraphes, donc je vais poser, par exemple trois questions pour
chaque paragraphe. Bien. J'ai maintenant ici le coût
estimé. Et c'est bien sûr
la côte qui va me être
facturée par OpenAI. Je peux consulter le solde
de mon compte API. En fait, au début, chaque fois que vous commencez à
utiliser les services API, vous avez environ 18$ gratuitement. Ce sera donc suffisant pour
l'utiliser pendant longtemps car ils ne chargent qu'une
très faible quantité. Bien. Je vais donc
opter pour modifier le texte. Si je voulais supprimer ce texte, je peux modifier le texte
ou commencer à le générer. Cela va prendre du
temps, mais croyez-moi, cela en vaut la peine, et comme vous
pouvez le constater, cela m'apporte. Il s'agit de la première série trois questions concernant
le premier paragraphe. Et ceci est une autre
série du premier paragraphe, mais avec des questions différentes. Quels sont les avantages
des animaux pour les humains ? Que proposent les animaux ? Ces deux questions se
ressemblent en fait et ils peuvent avoir les mêmes symptômes ou,
d'une manière ou d'une autre, certains
ulcères peuvent être inclus. C'est donc une bonne chose. Cela me donne
en fait des structures
différentes
pour la même question, phrases
différentes, qui est intelligent car cela peut permettre au modal mieux comprendre
comment je peux poser une question et de déterminer exactement si je
dois répondre si la question
ressemblait à ceci ? Le modèle apprend donc
et s'appuie sur des modèles
généralisants de
manière efficace. Maintenant,
il ne me reste plus qu'à copier mes réponses et mes
questions de cette façon, en prendre une copie, par exemple pour créer une
nouvelle feuille Google. Et je peux simplement coller mes questions
là-bas dans une nouvelle feuille. Je vais donc utiliser
la première ligne maintenant et je vais la coller. Et comme vous pouvez le voir, laissons un peu de place ici. J'ai des groupes de questions
et leurs réponses. La seule chose que
je dois faire, comme nous en avons discuté précédemment
dans d'autres leçons, c'est de supprimer les rouleaux
indésirables en rangées. Je peux également lire mes données
pour m'assurer qu'elles ne contiennent pas moins de deux
doublons. Et je peux également ajouter des suffixes comme nous l'avons expliqué
dans les leçons précédentes. Bien. J'ai donc maintenant une liste de questions et de
réponses sur mon sujet. Certaines questions sont répétées
mais d'une manière différente, ce qui est un modèle plus formel. Et c'était un outil très agréable
et facile à utiliser. Maintenant que vous avez préparé vos données ou vos suffixes et que
tout va bien, vous pouvez télécharger
cette feuille Excel puis nous apprendrons dans les prochaines leçons comment utiliser cette feuille Excel pour modifier son format par rapport au Vermont voisin, où nous
allons en fait utiliser ces données dans
ce format
pour affiner notre modèle. Et c'est tout pour aujourd'hui.
Merci d'avoir regardé.
9. Utilisation de ChatGPT pour générer du code Python pour la manipulation des données: Bonjour et bienvenue
à une nouvelle leçon. Dans notre leçon d'aujourd'hui,
nous allons
apprendre à utiliser nos données de manière intelligente
en suivant l'une des étapes dont j'ai
parlé précédemment. Cette étape consiste à utiliser GPT pour générer pour
nous un code Python. Ce code Python sera utilisé
pour travailler avec
un grand ensemble de données et modifier cet ensemble de données dans
le format des marques et des complétions, dont
vous devrez
utiliser ces pompes et la complétion
pour affiner votre modèle. Donc, ce
que nous allons faire, c'est discuter de GPT, nous allons faire de l'ingénierie
rapide. Nous devons décrire correctement
les fonctionnalités et les exigences de
nos projets et notre ensemble de données afin d'obtenir un bon code
Python capable de transformer tout cet ensemble de données sous
la forme d'invites
et de
compléments, le tout en un seul clic. Je suis donc allée discuter avec TBT et
j'ai écrit à ce qui suit. Tout d'abord, je
veux utiliser un code Python. Et ce code Python doit servir
à convertir un ensemble de données préparé à graver sous la forme
de complétions de Bronson. Je vous ai donc dit que GPT besoin d'un code Python
pour ce qui suit J'ai inscrit tous les
conseils que je devais mentionner pour le toucher avant
qu'il ne génère Michael, comme les données, où seront-elles
faibles par défaut, quel fichier ? Et peut-être une querelle importante importez certaines bibliothèques nécessaires. Il prendra la première
valeur de chaque ligne. Il inclura cette première
valeur dans une invite, qui est le nom du film. Le reste des
données de chaque ligne, c'
est-à-dire le reste des détails mentionnés dans mon fichier CSV sur chaque film, sera préparé de manière
appropriée. Et je n'inclus que certaines données et pas toutes
les données
de l'ensemble de données, par exemple, chaque film contient
des informations publiées sur le réalisateur, l'
acteur et le général. Ce sont les informations
que je dois inclure dans mes instructions
et mes informations de complétion. Je veux également juger
quiconque en ajoute moins. Par exemple, de nouvelles colonnes
dans l'ensemble de données d'origine. Ces colonnes
incluront des instructions générées, des complétions détestées par l'
ingénierie et deux nouvelles colonnes qui seront
ajoutées par le code Python. Ensuite, je dois enregistrer mes
données ou le nouveau DataFrame. Et un autre fichier, ce fichier
est celui que je vais
prendre et utiliser pour effectuer le processus d'
affacturage. J'ai également dû mentionner des
détails subtils concernant mes données. Par exemple, quelles sont mes
coordonnées concernant, par exemple, un groupe d'obèses ? Voici les caractéristiques des films
que j'ai inclus dans mon jeu de données. Je fais donc pivoter chaque fonctionnalité incluse dans mon
jeu de données pour le film. J'ai également donné des exemples, le nom du film, les autres fonctionnalités de
la description de Ruby. Ainsi, chaque fois que j'envoie
ceci au chat GPT, vous
pourrez
généralement très bien comprendre mon ensemble de données. Il saura exactement ce que
mon code Python doit faire. Une fois que je l'ai envoyé à not GPT,
j'ai reçu ce qui suit. Faisons un aperçu
du code. Tout d'abord, il importe
le package Pandas. Ce package nous aide à gérer
les données et les fichiers CSV. En Python. Il va également
importer OpenAI. Il va vous
demander la clé d'API. Cela peut m'aider à communiquer et à terminer le processus de
réglage, comme envoyer des demandes et recevoir
des réponses d'OpenAI. Bien. Maintenant, la première chose à
faire est de créer un nouveau DataFrame. C'est comme ce bloc de données. Il va récupérer plus de
données pour tous mes fichiers CSV. Mais souvenez-vous, c'est le nom du fichier que
vous devez placer en deux parties ici. Comment avez-vous nommé la police que vous avez insérée dans votre lecteur ? Ou peut-être plutôt que d'écrire
le nom du fichier, nous pouvons écrire le
chemin du fichier. Où ai-je réellement
sauvegardé celui-ci plus tard ? Ensuite, il crée les
deux listes que j'ai demandées, les instructions et la complétion. Ces deux listes doivent être ajoutées chaque fois que
le code lit mes données, il en prendra
le nom. Il sera ajouté à
la section d'invite. Les autres fonctionnalités seront vers la section
d'achèvement. Voici donc le nouvel ensemble de données, moins qui seront ajoutés à mon
DataFrame d'ailleurs, tant mieux. Maintenant, dans cette boucle, il va lire chaque ligne, créer les instructions
et les complétions. Et dans ces deux
lignes, il ajoutera
toute nouvelle invite générée à la liste des invites. Et il ajoutera également toutes les
nouvelles concrétions qu'il a créées à la
liste des réalisations. Enfin, lorsque ces
deux listes seront prêtes à être mises en ligne, le DataFrame leur sera envoyé. Et il va enregistrer
le DataFrame modifié, ce nouveau fichier CSV mon lecteur sous le
nom de données réparées, et c'est le fichier CSP. Et une fois que nous aurons exécuté ce
code dans la prochaine leçon, nous pourrons voir le nouveau DataFrame généré par mon code. Alors c'est tout. Je
trouve donc cela utile Demander à Shut UP Teacher
Generate de trouver les obstacles qui
fonctionneront le mieux avec notre code
est vraiment très utile.
10. Exécuter et exécuter le code Python sur Google Colaboratory: Bonjour, bienvenue à
une autre leçon. Dans la leçon précédente, nous avons
présenté un aperçu du code Python. Ce code a été conçu pour que
nous puissions l'utiliser pour préparer des instructions et des complétions
à partir d'un gros fichier de données CSV. Dans cette leçon, nous
allons exécuter ce code étape par étape
jusqu'à ce
que nous obtenions des synchronisations
rapides prêtes à être utilisées pour
affiner notre modèle. Il s'agit du code Python préparé par tattoo PT.
Selon les instructions d'
ingénierie que Selon les instructions nous avons effectuées dans
la leçon précédente, nous avons prévisualisé le code
que nous avons créé, ses termes et
les éléments que nous devons
modifier
pour nous assurer que ce code répond aux
exigences de notre ensemble de données. Dans cette leçon, nous
allons maintenant exécuter le code. Je vais donc copier le
code tel qu'il est. Je vais accéder à
l'environnement qui me
permet d'exécuter
un code Python. Pour la leçon d'aujourd'hui,
nous allons utiliser outil appelé Google Colab. Nous en avons parlé dans
nos leçons précédentes, mais rappelons
ce qu'est Google Colab. Maintenant, une fois sur Google Colab,
c'est
la loterie par appel qui vous permet d'exécuter
votre éditeur de code Python. Et cela a été fait par Google. Une fois dans le Colab, il me proposera projets précédents
ou
mes carnets de notes précédents. C'est ce que nous appelons les
fichiers sur Google Colab. Une autre chose est que je peux simplement créer un nouveau bloc-notes
pour travailler dessus. Il s'agit donc de l'interface ou la forme du bloc-notes
chaque fois que vous l'ouvrez. Et comme vous pouvez le
constater, nous pouvons faire certaines choses
. Nous pouvons changer le nom
du carnet en fonction de
ce que nous allons faire. Nous pouvons également ajouter des codes ou des textes à ce notable avant de lancer et
d'exécuter le code. Alors, qu'y a-t-il
au bas de notre Google Drive ? Pourquoi ? Parce que nous voulons lire
le fichier CSV comme sur notre. Donc, comme vous pouvez le voir, c'est mon Drive ici. Et dans mon lecteur, j'ai créé
un dossier appelé ensemble de données, et j'ai inclus les ensembles de données
que je pourrais avoir besoin d'utiliser. Et c'est sur celui-ci que nous
allons travailler. Nous allons avoir un aperçu de
l'ensemble de données ici. Laisse-moi l'ouvrir. Et si Google Sheets avait
un truc, c'est
que, comme vous pouvez
le voir dans la première colonne, nous avions le nom du film,
puis les revenus mondiaux, le général du réalisateur
et la date de sortie, les acteurs et d'autres
détails sur le film. C'est le Z à régler sur lequel je
vais travailler, je vais revenir
à ma mise en couleur. Je n'aurai pas besoin de
ce dossier ici, celui que j'ai
ouvert sous forme de fichier Excel. Je vais donc simplement le supprimer. J'ai besoin d'un fichier CSV pour pouvoir le
lire
en deux minutes. Tout d'abord, je
dois m'assurer de pouvoir y accéder en
utilisant Google Colab. Je vais donc accéder
aux fichiers sur la gauche,
comme vous pouvez le voir, en me connectant à l'environnement d'exécution pour activer les feux. Donc, une fois qu'il sera activé, je devrai faire quelque chose
appelé Montage. Je dois monter le jouet Colab. Et c'est en cliquant
sur l'icône ici. Une fois que vous aurez
cliqué dessus, il sera monté. Et il arrive parfois qu'il vous demande
des autorisations pour vos journées. C'est Martina sur mon Google Drive. Une fois que tout est appris
et que tout fonctionne, vous verrez que mon fichier
Google Drive
apparaît ici. Donc c'est écrit ici, là, ça dit, et je peux réellement entrer dans mon
lecteur, trouver cet endroit. Et Chico, pour profiter du
plaisir que j'ai ajouté en accédant au
dossier intitulé Ensemble de données, je peux trouver un nouvel ensemble de données que
j'ai inclus dans ce lien. Et il s'agit en fait du fichier CSV sur lequel nous
allons travailler. Le code Python ici, copiez-le et apportez-le
à notre Google Colab, ajoutez-le sous forme de texte. Donc, tout d'abord, je
vais garder ce
texte à en haut parce que je veux ce texte soit là pour
moi chaque fois que j'en ai besoin. Bien. Nous y voilà. Alors ça y est, c'est
le texte que j'ai préparé. Pourquoi l'ai-je emmenée ici ? Parce que je veux suivre
les étapes une par une. Cela peut donc être mon idée
ou cela peut réellement
m'aider si je ne suis pas habitué à utiliser correctement le
code Python, d' accord. Maintenant, tout d'abord, je dois ajouter une partie du code qui s'
appelle le chemin. Il s'agit du chemin du
fichier que je souhaite lire. Je vais donc commencer
par créer une variable ,
puis voici
le chemin et quel est le chemin du fichier
que je veux lire ? Je vais accéder à mon fichier ici,
cliquer dessus, copier le chemin, et le coller ici
entre guillemets doubles. Nous y voilà. Ensuite, je peux courir pour m'assurer qu'il n'y a pas d'erreur
dans cette phrase. C'est très bien. Nous allons donc avoir un aperçu de ce sur quoi
nous allons travailler. Tout d'abord, nous devons importer
le package pandas et nous devons également importer le bucket
OpenAI. Nous devons également clarifier
notre clé d'API, etc. Commençons maintenant à
exécuter notre code. Tout d'abord, le naturel va de pair avec l'installation avec la bibliothèque d'API
ouverte. Je voulais l'utiliser, et les versements vont prendre un certain
temps. Passons donc à
la deuxième partie, qui consiste à importer le package
pandas depuis Python. Je vais donc procéder à l'
importation de ces chemins PDF. Et je suis en train de créer
une fonction appelée bd. Chaque fois que je veux utiliser
le package pandas, j'utiliserai le p.ball
tant que j'exécuterai ce code. Maintenant, la deuxième chose
à faire est de lire mon dossier ici. Pour lire mon fichier ici, je devrais m'en tenir à
celui-ci et créer un nouveau DataFrame en lisant
le DataFrame précédent. Je dois donc inclure
le nom du fichier ou le chemin du fichier
où je peux le trouver. Ajoutons donc un autre statut de rémunération des
manteaux. Et plutôt que d'écrire le
nom du fichier ici, je vais utiliser des chemins. Le chemin que j'ai déclaré
ci-dessus ici, qui est le chemin du fichier. Et nous allons
exécuter ce code maintenant. Je peux donc lire les données du
fichier CSV ici. Bien. Maintenant, après avoir lu mon fichier, je vais commencer à prendre les données et à les
ajouter à de nouveaux fichiers. Maintenant, je vais créer
les deux listes ici, la police générée et la liste de coefficients
générée. Donc, dans ces deux déclarations, je vais générer
deux listes
afin de les ajouter chaque fois que
cela sera durable, créera une nouvelle invite
ou sera presque terminé. Passons donc à un autre code
et suivons le suivant. J'ai maintenant deux listes. Le premier modèle s'appelait
prompt and completions, et ils sont prêts à
prendre des valeurs. Nous avons maintenant la boucle à quatre sur cette petite boucle qui va accéder
à l'ensemble de données, créer des marques et créer
des complétions en conséquence. Je vais donc emmener tout
le groupe ici. Prenons également le reste
du code. Va l'exécuter. Donc, comme vous pouvez le voir, for loop va récupérer
les données du fichier CSV. Il va également ajouter
ces données aux listes que
j'ai créées ci-dessus. Et ces deux listes doivent être ajoutées au fichier CSV d'origine. Et tout cela doit être enregistré dans un nouveau fichier CSV appelé CSV de données
préparées. Je vais donc exécuter le code. Et une fois que j'ai exécuté le
code et qu'il est volé, je peux dire que la
plupart des VC sont le fichier
appelé CSV de données préparées qui y est appelé CSV de données préparées lancé jusqu'à ce que j'en
profite ici. Passons donc aux dossiers. Je vais juste fermer
et ouvrir pour rafraîchir. Il fait froid aujourd'hui. Et comme vous pouvez le voir, voici mon pied une fois que
j'ai cliqué dessus. Comme vous pouvez le voir, c'est le titre du film. Ce sont les revenus que le
général, le directeur, quelles que soient les données que j'ai incluses
précédemment, sont là. Sur le côté gauche, j'ai quelque chose
appelé brun généré. Cela a été ajouté par le
code Python, complétion générée. Et ces deux colonnes sont les
seules dont j'aurai
besoin pour les utiliser à des
fins de réglage ou de bimodalité. Voilà, il est ajusté car il
décode mes données et est prêt à être utilisé. Merci d'avoir regardé.
11. Créer un répertoire de projets bien structuré: Bonjour, bienvenue à
une autre leçon. Dans notre leçon d'aujourd'hui,
nous allons apprendre
à créer un bon répertoire de
projets, à
structurer et à
gérer les données qu'il contient. Il s'agit d'une compétence essentielle pour tout projet de
conception ou car elle
nous permet de revenir
aux données et à Rick et de les
comprendre correctement. La mise en
place d'une bonne structure de
projet présente donc de nombreux avantages . L'un de ces avantages est que si vous travailliez en équipe, cela permettra à chaque membre de
l'équipe de
revenir aux données, de les
compléter et de travailler dessus. Cela les supprimera
en tant que consommations. Cela éliminera également les chevauchements, ce qui nous permettra de gagner du temps et d'améliorer nos professions. Une autre chose est qu' une bonne structure pour un projet me permet d'y
revenir, réutiliser
à nouveau, par exemple. peux prendre ces fichiers de données , les
ajuster et
les inclure dans vos projets. Je vais partager certains
des types que vous
pouvez utiliser
afin de créer un bon répertoire de
projets. Tout d'abord, n'oubliez pas
de toujours conserver vos données dans des dossiers. À l'intérieur de ces dossiers, vous
pouvez inclure des sous-dossiers, puis les déplacer pour utiliser des noms
descriptifs. N'oubliez pas d'utiliser des
noms
compréhensibles Chaque fois que vous souhaitez
rechercher un fichier spécifique, vous pouvez revenir à sa
recherche, à sa reliure. Une autre chose est que vous devez toujours conserver un fichier Read
Me dans le fichier
Read Me et vous pouvez conserver des données sur la façon dont
vous avez réalisé le projet, comment l'utiliser ? Quels ensembles de données
utiliser, utilisez des codes Python pour
utiliser l'urne, etc. Comme vous pouvez le voir ici, j'ai préparé ici
un exemple de répertoire de projets ou à quoi ressemblerait la
structure des produits ? Donc, tout d'abord, vous pouvez
inclure différents dossiers. Certains d'entre eux concernent peut-être les codes, le script des codes. Imaginons que vous puissiez utiliser différents codes pour
préparer les données. Vous devez en conserver une copie
si vous utilisez un code pour analyse
des données et le code utilisé pour l'
entraînement du modèle. Je garde des particules ici. Vous pouvez également conserver des carnets de notes. Dans les blocs-notes, vous
pouvez conserver les fichiers de données que vous utilisez,
les fichiers d'origine. Il s'agit donc d'un fichier CSV, et si vous utilisez le suivant, vous pouvez également l'inclure. J'ai également ici d'autres polices, plus détaillées, mais ce
sont celles qui ont été traitées. C'est ce qu'on appelle des données préparées, et ce sont les
données préparées à partir du texte. Et il est en fait recommandé de les ajuster à l'
aide de chiffres. Par exemple, si vous avez préparé les données à
plusieurs états, vous devez inclure
Préparer les
données un, les données deux, etc. plus, vous pouvez
conserver les résultats
du processus que vous avez
effectué ou du projet, par exemple conserver des copies
des modaux ou conserver
des fichiers Read Me. Dans le fichier Readez-moi,
vous pouvez inclure toutes les données dont vous
avez besoin, des sous-sections du sondage, quels sont les suffixes que vous avez utilisés dans les données avant pointer du doigt et quel était
le modèle utilisé ? Quel était l'identifiant du modal ? Quelle clé d'API
avez-vous utilisée
pour créer et
affiner ce modèle ? Vous pouvez également écrire des oiseaux rouges à propos de ces faibles
doses et les conserver. Cela vous permettra
, à vous ou à
tout membre de l'équipe ou à
toute autre personne, de vous
référer plus facilement tout membre de l'équipe au projet, voir ce qui s'est passé,
d'utiliser ces données
, de les traiter à un autre stade, peaufiner les produits, etc. C'était donc un bref
exemple de la façon de créer un bon répertoire de
projets, manière d'y configurer une organisation
en haut de celui-ci. Comme nous l'avons vu, nous avons donné un petit
exemple à ce sujet. Ce projet peut en fait
être téléchargé sur votre GitHub. Il peut être conservé dans
des fichiers spécifiques sur votre lecteur ou sur votre ordinateur. Mais ce sera en fait la
clé pour réussir à utiliser
ce projet, à en tirer des leçons
et à
réaliser d'autres projets à l'avenir.
12. Comment choisir un modèle pré-formé pour le réglage fin: Bonjour et bon retour. Dans notre leçon d'aujourd'hui, nous allons apprendre à choisir
un modèle pré-entraîné qui répond
réellement aux exigences
de notre propre projet. Nous savons que le GPT-3 est un ensemble
de modèles volumineux et puissants, mais nous souhaitons utiliser l'un d'entre eux pour créer
notre propre réglage. Dans cette leçon, nous
allons prévisualiser
les spécifications
de ces modèles. Et nous apprendrons lequel d' entre eux répondrait à nos
exigences afin de connaître
ces modèles et de
réfléchir à celui d'
entre eux à choisir. Nous devrions
les prévisualiser à partir de leur source, qui est le site Web d'Open AI. Alors je vais le faire ouvertement. Je vais spécifiquement
au terrain de jeu. Pourquoi ? Parce que je veux dessiner
leur section de documentation. Ici, il est dit qu'en haut, cela ira à la section
documentation. En faisant défiler l'écran vers le
bas sur la gauche, nous pouvons accéder à la section Modules. Comme vous pouvez le constater, il s'
agit d'un aperçu de chaque modèle
GPT créé par OpenAI. Ils ont généralement atteint un, pour l'
instant, il doit y en avoir 3,5. Il y a cette Dolly plutôt qu'
une autre qui peut générer des images et il
existe d'autres modaux. Le fait est que nous
allons dépendre du GPT-3. Gpt-3 est l'
ensemble de base des modèles TBT, ceux que nous pouvons réellement
utiliser pour le réglage précis. Je vais descendre, en faisant défiler la page jusqu'à
GPT-3 en particulier, nous pouvons vous prouver que vous êtes GPT-3. Maintenant, nous voulons voir les modèles GPT-3 de
base. Ce sont les Léonard de Vinci, les Curie qu'ils sont
aujourd'hui et les Babbage. Et ce sont les
seuls modèles que les gens peuvent réellement
utiliser pour voler. Aucun autre modèle ne peut être utilisé pour réglage fin, à l'exception de ces trois. Le fait est que
leur dernier modèle est également
généré ici, mais lorsque nous effectuerons deux réglages,
nous ne dépendrons que de
ces quatre réglages de base. Et vous devez savoir lequel d'entre eux peut
emporter le plus de jetons, lequel d'entre eux peut regarder la côte de chacun d'entre eux. Quelles sont leurs capacités
et leurs aptitudes ? Et c'est ce que vous
devez considérer comme rénal chaque fois que vous
choisissez entre eux. Le truc, c'est que Da Vinci
est le plus grand, le plus compétent. C'est incroyable, mais la côte est plus haute que l'on
peut réduire par badge et ADA. Curie est doué pour l'analyse des
sentiments. De plus, si vous travailliez
sur un projet qui doit
classer les données en q0
positif et négatif ne
serait pas une bonne
suggestion pour cela. Ada est la plus rapide, c'est la plus rapide. Donc, si vos données
vous obligent à travailler sur un bouton de modèle rapide et
réactif, des réponses
peu impressionnantes, disons des
réponses très directes à faux. Vous pouvez compter sur ADA et ainsi de suite. Voici donc les quatre modèles
de base. Prenez-les en compte, vous devez
réfléchir aux types de données utilisés, aux exigences
de votre projet ? Pensez à la rapidité, aux
ressources dont vous disposez. Combien dois-je payer
ou quelle est ma capacité à effectuer ce processus de
réglage précis Et c'est à ce moment-là que
vous pouvez savoir lequel
choisir. Et nous utiliserons le nom
du modèle pour effectuer le processus de réglage
en utilisant cet ordre spécifique.
13. Introduction au processus de réglage fin en Python: Pour avoir une
vue d'ensemble des étapes
du processus de réglage,
du début à la fin. Je l'ai préparé
pour que vous puissiez le peaufiner. Tout d'abord, nous
devons télécharger Python. Comment télécharger Python ? Nous allons sur Internet. Nous pouvons rechercher Python, télécharger de l'héroïne ou Veritas. Vous devez juste vous
assurer de télécharger la dernière version de Python pour pouvoir
excuser vos codes Python. Nous y voilà. Donc, sur mon ordinateur portable, je vais chercher Python. Et comme vous pouvez le voir, j'ai la version 3.11, qui est la dernière version. C'est donc la première étape
et je suis prête. La deuxième chose à
faire est d'ouvrir notre C et D. Qu'est-ce que le C ? Becky ? C et D sont le processeur de
commandes Windows. Lorsque vous accédez à la barre
de recherche et votre ordinateur portable Windows 10 ou 11, lorsque vous utilisez C et D, vous pouvez trouver quelqu'un
appelé Command Prompt. Qu'est-ce que c'est ? Il s'agit d'une interface où vous pouvez exécuter des commandes ici. Ces commandes peuvent
fonctionner ou fonctionner sur vos programmes ou vos systèmes
d'exploitation. Et cela peut également vous aider à relier votre
ordinateur portable à Internet, demander, à envoyer des demandes, à
recevoir des réponses. C'est donc là que tout le processus de
réglage peut avoir lieu sur notre CMD ou notre processeur
Commons. Je l'ai fait. Une autre chose que nous allons
faire aujourd'hui est de localiser notre
plaisir sur le CMT. L'ensemble des processus
se déroulera dans un fichier que nous avons
préparé précédemment. Dans le prochain cours.
Je vais partager cette diapositive avec vous sous la forme d'un lien dans la description
de la leçon. Ensuite, après avoir localisé notre fichier, nous devons télécharger les bibliothèques et les packages
nécessaires. Ces bibliothèques,
telles que l'ouverture sur Library Pandas, et d'
autres bibliothèques dont nous aurons besoin
pour travailler sur nos données et effectuer le processus de
réglage précis. Ensuite, nous
allons exécuter codes
Python et des mines de charbon
afin
d' accéder aux outils de l'US
Open AI
et de préparer nos
données pour les peaufiner. Ensuite, nous allons exécuter le code Python pour terminer
le processus de réglage. Une fois cela fait, il nous
fournira un identifiant de modèle. Nous utiliserons cet identifiant
pour savoir ce qu'il
est advenu du
processus de mise au point afin de suivre notre modèle, celui que nous trouvons,
pour trouver
le chemin à suivre jusqu'à nous assurer qu'
il crée des changements et que
tout va bien. Il s'agit donc d'une brève explication, d'une très courte explication
des étapes. Encore une fois, pour peaufiner les réglages, nous devons télécharger des
bibliothèques créées en Python, exécuter du code Python, des commandes pour
communiquer avec OpenAI, pour effectuer des réglages précis. Et enfin, pour vérifier si notre modèle était bien
ajusté à Séoul. Il s'agit donc d'un aperçu rapide. Dans la prochaine leçon, nous allons exécuter
certaines de ces étapes, par exemple
en préparant nos
données de la meilleure façon qui soit. Ensuite, peaufinez-le, puis testez notre affinement
sur toutes ces choses que vous
14. Ajuster un modèle pré-entraîné : un processus en trois étapes: Bonjour et bon retour. Dans la leçon d'aujourd'hui,
nous allons commencer à exécuter le processus de
mise au point. Et je peux
diviser cela en trois étapes principales. La première étape consiste à
modifier le format des données que nous avons préparées
au format adjacent. Nous en avons parlé
dans les leçons précédentes. Nous avons dit que toute police
que vous souhaitez obtenir un modèle préentraîné doit
avoir le format adjacent. Et nous verrons comment changer
cela à l'aide d'un code Python. La deuxième étape consiste à prendre ces données et à les transmettre à
un modèle préentraîné pour effectuer les réglages, tandis que
la troisième étape consiste à tester notre
affinement du modèle. À titre de révision, aujourd'hui, nous allons travailler
sur les points suivants. Nous allons d'abord m'
assurer que nous avons téléchargé Python
et que nous allons travailler sur notre CMD comme nous l'avons expliqué dans la leçon
précédente, nous allons ouvrir notre
fichier et commencer à travailler sur notre code Python. Le premier code Python
est destiné à nous aider à modifier le fichier de données CSV
pour obtenir une certaine utilité. Une fois que nous aurons terminé, nous sommes certains que
nos données seront prêtes à être communiquées à tous
les
modèles préentraînés à réaliser le dessin animé. Alors allons-y et commençons à
exécuter nos tests. Tout d'abord, nous allons passer à l' EMT vocal de
nos théoriciens du CMD. N'oubliez pas que nous
devons ouvrir notre dossier. Je vais donc utiliser le CD et ouvrir la
police que j'ai appelée. Testez. Cette amende est incluse dans la description
sous le nid. Et il inclut les deux codes
Python que je vais utiliser. La première consiste à changer
le format des données format adjacent, tandis que la
seconde consiste à communiquer avec
open EI et à
demander le réglage précis à
l'aide de notre clé API. Et voici l'explication de toutes les étapes que nous avons suivies. Ici. J'ai inclus ici ma clé API
parce que je vais
en avoir besoin pour relier mon modèle
pré-entraîné sur mon téléphone à une onde
unimodale à partir de ma clé API afin de pouvoir l'
utiliser pour d'autres applications. Et ce sont les données que
nous utilisons à bon escient : le flux de données. Prévisualisons nos données. Comme vous pouvez le voir, j'ai le côté gauche, ici, la médaille de bronze, et sur la droite, la deuxième colonne
contient les confessions. Dans les pages explicatives, j'ai une question, après laquelle
j'ai ajouté un espacement et, après ce
visage, j'ai inclus un suffixe. Cela les aidera à comprendre. Ensuite, c'est là
qu'ils se terminent rapidement. Sur le côté droit, j'
ai les complétions, ces complétions aussi. Cela commence par un espace vide ou un espace 1D ici
avant la fin. Et cet espace permet au
modèle de comprendre que c'est là que la collision commence
et pourquoi il innove. J'ai ajouté un suffixe. Ce suffixe m'
aidera ou les aidera à comprendre que c'est
là que la réponse
à la première invite se termine invendue. Mes données sont donc prêtes,
je les ai téléchargées, assure d'avoir un thé propre, une bonne quantité de détails. Assurez-vous que tout est réglé. Assurez-vous de ne pas avoir
d'informations supplémentaires dans d'autres cellules ou dans
d'autres feuilles, etc. Une fois que vous êtes prêt, une fois que vos
données sont prêtes, tout va bien. A pris. Pour en revenir à notre C et D, commençons par exécuter
notre premier code Python. Avant d'exécuter le code, laissez-moi le prévisualiser. Ça y est. Je vais l'ouvrir sous forme de notes. Je vais utiliser un fichier texte et
voir à quoi ça sert. Tout d'abord, importez
certaines bibliothèques nécessaires. Ensuite, il crée un classeur. Dans ce classeur,
il va charger les données du fichier de test du vent. N'oubliez pas si vous avez nommé votre fichier de données sous
un autre nom. Comme vous pouvez le voir,
j'ai nommé le zeste. Donc, si vous avez un nom différent, vous devez écrire le
nom de votre fichier ici. Bien. Ensuite, cela commence à se
répercuter sur les draps de la vie, c'est pourquoi nous n'avons qu'une seule feuille. Ensuite,
en utilisant cela pour la boucle, il va commencer à créer les invites et à
supprimer Nicole dans ce format pour les
enregistrer dans un fichier
au format JSON appelé data
test point json. Ensuite, la nouvelle erreur qui
va être créée par ce code s'appelle dates test. Et à l'intérieur de ce fichier,
vous trouverez nos données, tout ce que nous avons inclus
dans ce fichier Excel dans une amende mais avec
des annexes par mois. C'est ainsi que je prépare
mes données pour les transmettre à un modèle préentraîné
afin de les affiner. Bien. Donc, une fois que je me suis assuré que mon code est prêt et que
tout a été modifié, le nom des
fichiers et tout nécessaire vont dans notre C et
D pour exécuter ce code. Nous allons donc
prendre le nom de ce fichier ici, d'
Excel en JSON. Alors renommons,
copions le nom. Nous allons placer le nom
du fichier et cliquer sur point pi
sin pour l'exécuter. Une fois qu'il a été exécuté, comme vous pouvez le voir ici,
regardez notre dossier
et nous nous
amusons encore plus regardez notre dossier . C'est ce qu'on appelle un test de données. Prévisualisons notre nouveau fichier. Les Afghans peuvent donc voir que
voici le bal de fin d'année, à
côté. Et tout cela est préparé
dans un format décent. Bien, mes données sont maintenant
prêtes pour la fonte. La prochaine étape consiste
à prendre ces données
et à les envoyer pour qu'elles soient peaufinées
ou pour peaufiner un modèle. Je vais donc passer à l'
étape suivante dans mon C
et D. À savoir exécuter le code Python qui
m'aide à trouver deux de mes modèles, qui se trouve ici. Prévisualisons notre code. Je vais revenir en arrière pour ouvrir
ce code sous forme de fichier texte. Jetons-y un coup d'œil. C'est aussi des importations,
ils avaient besoin de bibliothèques. Il change de clé d'API et une fois
qu'il a terminé ma clé d'API, il commence à communiquer
avec OpenAI afin créer un nouveau modèle entraîné
ou un nouveau modèle affiné. Et il va
demander la
liste des demandes des
modèles préentraînés précédents et d'autres données. Ce qui m'intéresse
dans ce code, c'est la dernière partie, car c'est là que je
peux décider
du nom du fichier que je veux créer ou du nom du
modèle que je voulais créer. Et quel est le nom
du modèle de groupe sur lequel tu
veux que je me fie ? Donc, en regardant ces
données ici, tout d'
abord, que
vais-je charger ? Celui que je vais utiliser
pour peaufiner les réglages. Vous devez le récupérer à
partir d'un fichier appelé digitalis Jason. C'est ma F1. Et quel est le nom
du nouveau modèle pré-entraîné ? Tout d'abord, je peux nommer
mon modèle comme je le souhaite. Je l'ai appelé Mary
Disorder and Model. Et quel est le modèle
pré-entraîné sur
lequel je vais m'
appuyer, pour différencier. Donc, quel que soit le nom
de ce fichier ici, vous devez
l'inclure ici. N'oubliez pas que ce sont les dents et le L5, vous devez choisir le nom de votre modèle et vous devez
également choisir
le modèle pré-entraîné. Maintenant, quand je m'assure
que mon code est prêt, je peux commencer par cette cuticule. Le fait est que je
voulais également partager quelque chose avec vous Pour pouvoir
communiquer avec OpenAI et recevoir des demandes, vous devez ajouter votre clé API
aux variables d'environnement d'un ordinateur portable. Qu'est-ce que cela signifie ? Si vous descendez dans la barre
de recherche et
parcourez les variables d'
environnement. Une case de
réglage d'ouverture du site ci-dessous, nous avons entendu dire que vous avez ces
principales variables d'environnement. Une fois que vous avez cliqué dessus, vous devez ajouter
la clé API ouverte. Dans les variables relatives au feu. Les variables permettent à mon
système de communiquer à l'aide de cette clé d'API avec
OpenAI. Elles incluent mon EBIT. Donc, si vous ne l'
aviez pas ici, vous allez simplement
opter pour ce qui suit. Ouvrez, nommez-le, OpenAI à partir
du trait de soulignement de l'API de partition G. Et il faut l'écrire en
majuscules de cette façon. Ensuite, vous pouvez accéder
au terrain
de jeu de touchy P t et accéder à OpenAI, obtenir OpenAI, obtenir votre clé d'API, l'
inclure et l'enregistrer. Donc, si cela a été enregistré
correctement ici, cela vous permettra de
communiquer de
manière durable avec OpenAI et
Syndrome afin communiquer de
manière durable avec OpenAI et de
peaufiner et recevoir des réponses une fois que l'
étranger à moi plus sera bon. Donc, pour exécuter ce code, le code de réglage précis, je vais retourner à mon Cmd. Je vais commencer à
taper le nom du pointeur. OK, reprenons son nom. Accédez à notre CMD et notez haut, car il s'agit d'un code Python. En d'autres termes, il envoie
des requêtes à l'API. Il doit répondre
d'un seul bit. La réponse à cette
question est revenue d'OpenAI. Cela me montre ce qui s'est passé et cela me donne
en fait un élément
très important, savoir l'identification de ceux
qui ont affiné
pour modéliser le nouveau modèle. Voici donc toute l'histoire des modèles
un-à-plusieurs
que j'ai créés auparavant. Et la plupart de ces
cas ont été couronnés de succès,
réussis, mérités. Je vais
vous les montrer dans ma prochaine leçon lorsque je vous montrerai comment tester
notre modèle pré-entraîné. en revenir à la fin de cette
réponse que j'ai reçue, je veux voir ce qui
s'est passé ici. Comme vous pouvez le voir, regardez, c'est l'identifiant
du modèle que j'
essaie de vous indiquer aujourd'hui. Je vais donc avoir besoin de
cet identifiant pour changer le
statut de ce modèle,
celui que nous sommes en le
statut de ce modèle, train de
peaufiner Da Vinci est le modèle
préentraîné que nous utilisons et nous allons nous contenter
du processus de réglage. Et le nom du nouveau modèle est Narrow Disorder et ainsi de suite. Ce sont donc les
informations importantes dont nous avons besoin. Et comme vous
pouvez le voir ici, il est dit que c'est toujours en attente. En attente signifie qu'il utilise toujours le
modèle de réglage précis parce que ce n'était pas Il n'est toujours pas affiné. C'est en train de le faire. Si vous
regardez ici la dernière fois, j'ai essayé d'en trouver deux
unimodaux, mais j'ai échoué. Il y a eu
un problème. Si vous revenez ci-dessus, vous verrez l'
historique de tous les modèles amusants à modéliser et chacun
d'entre eux avec son identifiant. Cela peut donc m'aider à me souvenir de ce que j'ai
fait auparavant si j'avais besoin d'un identifiant ou pour un
modèle préformé, etc. Donc, afin de vérifier ce qui s'est passé avec le mien
et le processus de réglage, je peux utiliser une commande
Open AI incluse pour vous
dans ce fichier. Cela peut être la dernière étape. Cette commande est
préparée par OpenAI. Et cette commande
est en fait deux fois pour suivre
l'état du modèle affiné, mais vous devez inclure l'
ID du modal ici. Revenez donc à votre CMD, copiez l'identifiant, l'idée
du modèle affiné. Ici. Je vais le recopier
deux fois, je
vais revenir ici, coller l'identifiant après
la lettre. Prenez cette réponse ou cette
commande comme elle l'a fait. Retournez à votre sable, collez-le et amusez-vous. OK, bien. Il indique qu'open IE n'est pas reconnu comme une commande interne
ou externe. C'est tellement bien que nous avons
ce problème ici. Afin de résoudre
ce problème, je vais installer
la bibliothèque d'ouverture. Alors j'opte pour pip, j'
installe Open AI. Une fois que je l'aurai fait,
je pourrai ouvrir. J'ai installé. Bien. Il est prêt à être utilisé. OK, réessayons. Collez notre commande avec l'
idée de notre modèle et
envoyez-la pour l'ouvrir
et voir ce qu'il est
advenu de notre modèle affiné. Et c'est à nous. Comme vous pouvez le voir, ouvrez EBI foreign pour suivre. Une fois qu'il a suivi, il est dit que notre modèle a été bien créé. Cela a donc créé notre modèle
affiné. Et c'est l'idée
du nouveau fine-tune. Alors c'est ça. Il s'agit de l'ensemble du processus
de mise au point d'un nouveau modèle. Et dans le prochain cours,
nous allons vous montrer comment
tester notre outil de pointage.
15. Tester votre modèle réglé sur OpenAI Playground: Bonjour et bon retour. Dans notre leçon d'aujourd'hui,
nous allons
tester notre modèle Fine Tune. Où le testons-nous ? We're Fine Tune Global
a été retesté sur le terrain de jeu. C'est le premier endroit où
nous avons apporté nos clés d'API. Et c'est l'endroit
où les développeurs ou les utilisateurs peuvent réellement tester si leur compte et l'IA ouverte fonctionnent et où la clé de notre API est activée. Alors, qu'allons-nous
passer à un nouveau navigateur Web ? Accédez à Open AI Playground. Et une fois qu'on l'aura ouvert , d'
accord, voilà. Je vais cliquer sur
Plaguing Old en haut. J'adore. C'est le polygonal
et c'est là
que je passe à la décimale et que j'
affine le modèle. Comme nous l'avons dit à plusieurs reprises, sur le côté droit se
trouve l'endroit où
vous pouvez
choisir celui avec lequel vous souhaitez traiter, le modèle
auquel vous souhaitez répondre. Une fois que vous avez cliqué dessus, vous pouvez prévisualiser les modèles GPT is. Vous avez ces modèles de base et vers le bas, vous pouvez trouver
votre ajustement. Pour notre modèle, celui que nous avons créé
ensemble et Visa Sense, il s'agissait de Married Disorder Mobile. Alors voilà. Maintenant, une fois que j'ai choisi mon modèle, je peux également modifier la température pour m'assurer que
le modèle n'
utilise pas réellement d'
informations supplémentaires ou n'essaie pas de faire créativité en ajoutant
des informations supplémentaires, référant au modèle
dimensionnel Je peux également décider si je
veux que mes réponses soient plus courtes qu'une
limite spécifique de tokenisation. Et je dois également utiliser
cette séquence supérieure, les sujets que j'ai ajoutés à mes données avant de
les peaufiner. Donc, la première chose
à faire est que je vais écrire mon invite ici. Puisque ce modèle
porte sur le trouble, je vais commencer par écrire
qu'est-ce qu'un trouble mental ? Et je me souviens que
ce suffixe ou le séparateur que j'ai
ajouté à la fin de chaque invite était une
barre oblique inverse et une barre oblique inverse. Je vais donc l'
ajouter ici. Je dois également ajouter
une séquence d'arrêt, le suffixe que j'ai ajouté à
mes complétions dans mes données, qui était un triple hashtag. Une fois que vous avez écrit le
caractère de séquence d'arrêt que vous avez utilisé, vous cliquez en haut. Vous l'avez donc ajouté. Vous pouvez maintenant soumettre votre demande et voir quelle
réponse vous obtenez. Comme vous le voyez, j'obtiens une
réponse précise et une réponse courte, même si je n'ai pas réellement
modifié la limite ici. Imaginons que j'ai oublié d'ajouter ces suffixes
ici et ici. Voyons ce qui
va se passer. Supprimez donc simplement le
suffixe Y ici. Et je vais supprimer
cette séquence supérieure. Et je vais mettre
, par exemple , la
longueur maximale de la tokenisation et ils se soumettront, j'obtiendrai en fait une réponse
très courte. Et si j'ajoute 50 libérations supplémentaires, je vais le soumettre à nouveau. Et comme vous pouvez le voir, j'obtiens une réponse plus longue et
elle est indiquée par ce numéro. Donc, cette séquence supérieure est en fait
quelque chose qui m'aide. Ici, comme vous pouvez le voir,
ça s'est arrêté ici. Et il a tout de même ajouté quelques jetons
supplémentaires ici afin d'utiliser
la totalité des 50 tokenisations. Le
fait est que ces suffixes sont là parce qu'ils nous
aident à faire comprendre à notre
modal que vous devez vous arrêter là où chaque
fin que vous avez lue lorsque vous avez été entraîné se terminait par
ces trois hashtags ? C'est ainsi que j'obtiens une réponse
précise et fixe à ma question ici. C'est ça. C'est ainsi
que nous testons notre modèle. Nous
arrivons en fait du bon côté. Nous choisissons le modèle que
nous testons. Devons-nous écrire notre approche
ici, puis définir les suffixes des
complétions sur le processus Et c'est tout.