Transcription
1. À propos du cours: Dans ce cours vidéo,
découvrez la phase d'étreinte
et ses concepts Hugging Face est une
entreprise et une communauté open source qui se concentre sur le traitement du langage naturel et l'intelligence artificielle Il est surtout connu pour sa bibliothèque de
transformateurs, qui fournit des outils et des modèles
pré-entraînés pour un
large éventail de tâches de traitement automatique, telles que la classification de textes, analyse des
sentiments, la
traduction automatique, etc. Dans ce cours, nous avons abordé les leçons suivantes à
l'aide d'exemples de course
en direct. Commençons par
la première leçon.
2. Visage étreint : introduction et caractéristiques: Dans cette leçon, nous allons
apprendre ce qu'est un visage étreint. Avec cela, nous allons
également comprendre les fonctionnalités. Commençons. Hugging Face est une entreprise largement
connue et communauté
open source
qui se concentre sur le NLP, c'
est-à-dire le traitement du
langage naturel Il met également l'accent sur
l'intelligence artificielle. Hugging Face est surtout connu pour sa bibliothèque de transformateurs qui fournit des outils et des modèles
pré-entraînés Ainsi, un large éventail de tâches de PNL telles que l'analyse des
sentiments, traduction
automatique, le
résumé de texte peuvent être effectuées Les bibliothèques de visages les plus utilisées
sont les transformateurs, les
ensembles de données et les tokeniseurs Voyons les fonctionnalités. Il
comprend de nombreuses bibliothèques. L'une des bibliothèques clés
est celle des transformateurs. Cela inclut les
modèles pré-entraînés tels que BT. Hugging Face
inclut également le Model Hub. Il s'agit d'une plate-forme sur laquelle les utilisateurs peuvent partager et télécharger des modèles
préentraînés. Grâce à cela, les utilisateurs peuvent également télécharger des ensembles de données
et d'autres ressources Hugging Face inclut également une bibliothèque pour
divers ensembles de données La bibliothèque s'appelle Datasets Library et
est utilisée pour les tâches NLP Hugging Face dispose également d'
une plateforme d' hébergement et de partage de démos et d'applications
d'apprentissage automatique , appelée spaces Grâce à cela, Hugging Face vous permet de déployer et d'utiliser facilement modèles dans des
environnements de production. Hugging Face bénéficie d'une communauté
et d'une collaboration
solides C'est une communauté
de développeurs, amoureux
de l'IA qui contribuent
à l'écosystème. Voyons quelques-uns des
modèles populaires sur Hugging Face. L'oiseau largement utilisé il est utilisé pour comprendre le contexte des mots
dans une phrase. Sa forme complète est constituée de représentations d'
encodeurs bidirectionnels à
partir de transformateurs partir de Il s'agit d'un puissant framework d'apprentissage
automatique open source développé par Google pour le NLP Il excelle dans
la compréhension du contexte des mots
et des phrases en analysant les relations
entre eux manière bidirectionnelle,
ce qui permet aux ordinateurs de mieux
comprendre le sens
d'un ce qui permet aux ordinateurs de mieux langage ambigu Il inclut également PT, un transformateur génératif
pré-entraîné, ainsi
qu' transformateur génératif
pré-entraîné, ainsi transformateur de texte en texte avec ce robot qui est une approche robotique robuste et
optimisée Robota est un modèle de langage
basé sur un transformateur qui utilise l'attention personnelle pour
analyser les séquences d'entrée Robota applique un masquage dynamique lorsque le
modèle de masquage Il offre des performances améliorées
sur diverses tâches de PNL. Vous pouvez donc également associer
BT à Robota. Sachez que l'objectif principal
du modèle Robota est d'améliorer les performances du modèle
de bord en remédiant à ses limites Ce sont les
modèles populaires de la phase d'étreinte. Dans cette leçon, nous avons vu
ce qu'est la phase d'étreinte, ses fonctionnalités d'introduction
et certains modèles populaires Merci d'avoir
regardé la vidéo.
3. Visage étreint - Cas d'utilisation: Dans cette leçon, nous
allons comprendre les cas d'utilisation de la phase d'étreinte Hugging Face prend en charge
un large éventail de cas d'utilisation dans les domaines de la PNL, vision par
ordinateur et même des applications
multimodales Voyons les cas d'utilisation. La phase d'étreinte est largement utilisée. Nous avons discuté de certains cas d'utilisation
clés ici, commencer par l'IE
conversationnelle, que vous
connaissez déjà, à savoir chatbds D'accord, créez des forums de
discussion intelligents en utilisant des modèles tels que GPT, Blender board, etc. Ces forums de discussion peuvent être utilisés pour le support
client, comme l'assistance
virtuelle Cela vous permet également de créer des systèmes de dialogue
interactifs. Ils peuvent être utilisés comme assistance
pédagogique ainsi que comme conseils thérapeutiques. Vient ensuite l'analyse des sentiments, comme son nom l'indique. Comme son nom l'indique, vous pouvez facilement
analyser les commentaires des
clients , leurs publications sur
les
réseaux sociaux ou les réponses à un
sondage afin déterminer le sentiment qu'il est positif,
négatif ou neutre. Avec cela, générez facilement
du texte, des articles, des
blogs et même des poèmes à
l'aide de modèles tels que GPT Les citations peuvent également être
facilement générées, générer des extraits de code dans
n'importe quel langage de programmation Cela permet de
générer du contenu, notamment
des descriptions de produits, des critiques, des plans
marketing, etc. Vient ensuite le résumé du texte. Si vous voulez
résumer votre texte, disons que vous
voulez résumer les actualités, vous pouvez facilement le faire. Supposons que vous ayez
des documents PDF et
que vous souhaitiez simplement les résumer. Ces longs documents
peuvent être facilement résumés en points
importants. Avec cela, vous pouvez également
prendre des notes de réunion. Vient ensuite la reconnaissance de votre
entité nommée, permet d'extraire facilement les noms, les compétences
et l'expérience des CV Il est également utile dans le domaine de la santé
pour identifier
le diagnostic, le nom des patients, certains termes
médicaux et d'autres. Avec cela, vous pouvez également
extraire le nom des entreprises mode de fonctionnement à partir de leurs rapports
financiers. Par conséquent, il est également utilisé
dans le domaine de la finance. traduction automatique,
comme son nom l'indique, vous pouvez traduire
votre site Web, votre application et même des documents d'une
langue à l'autre, disons de l'
anglais vers l'espagnol. Il peut également être utilisé dans des
langues à faibles ressources. C'
est pour la traduction. cas d'utilisation de la réponse aux questions est principalement utile pour
le support client. Grâce à cela, répondez facilement
aux questions posées par les étudiants sur la base d'un manuel ou de notes
spécifiques Il est facile de répondre aux questions fréquentes et lorsque j'ai parlé de support
client, cela signifie en soi
que nous avons vu des tickets d'
assistance sur des sites Web afin que les utilisateurs puissent facilement
poser des questions. Vous pouvez ainsi
facilement récupérer des réponses à partir de documents
ou de bases de données volumineux. Utilisez-le également pour la
reconnaissance vocale et la synthèse. Vous pouvez également convertir la
parole en texte, créer des applications de commande vocale à
l'aide modèles de synthèse vocale
et de synthèse vocale. Vous pouvez également fournir des sous-titres
en temps réel, générer des descriptions
pour les images Supposons que vous ayez numérisé un document ou des images et que
vous souhaitiez en extraire du texte, vous pouvez facilement y parvenir. De plus, si vous souhaitez
lire ou numériser des images, cela peut également être réalisé. Cela signifie une réponse visuelle. Viennent ensuite vos systèmes de
recommandation. Vous devez l'avoir vu sur
Netflix ou Amazon Prime. Recommandez facilement
des films ou des séries Web en utilisant ce que les utilisateurs
aiment réellement sur leur compte. Avec ce NAS, les résultats de recherche reposent sur la compréhension
de l'intention des utilisateurs et de leur contexte. Détectez également facilement les fraudes. En ce qui concerne les e-mails, détectez et
filtrez
facilement les e-mails de Sam, la santé
mentale peut également être
surveillée à l'aide d'un modèle, analyser
facilement le texte ou le
discours afin de détecter les
émotions, telles que le stress, l'anxiété
ou même la dépression. Vous pouvez ainsi comprendre
les émotions des clients lors des
appels d'assistance ou même du chat. synthèse vocale et la synthèse vocale
peuvent également être réalisées et les traductions en
temps réel peuvent être facilement effectuées. Les applications multimodales
analysent facilement le contenu vidéo. Avec les applications multimodales,
vous pouvez facilement analyser, pas même du texte, mais
également de la vidéo et de l'audio Les applications de réalité augmentée peuvent également être conçues pour générer facilement des données textuelles
synthétiques pour la formation et les modèles
d'apprentissage automatique. Vous pouvez également paraphraser le texte, identifier les relations
entre les entités du texte, évaluer facilement les
essais ou les devoirs
des étudiants, créer des outils de correction
grammaticale, de
vocabulaire, de reformulation
du contenu Utilisation dans les soins de santé
et les sciences de la vie. À partir du
dossier médical d'un patient, vous pouvez facilement
extraire les informations. À partir des documents juridiques,
extrayez facilement les clauses clés, obligations ou les risques éventuels. Avec cela, vous pouvez également créer des récits basés sur l'
IA pour les jeux Analysez
facilement les réseaux sociaux
afin d'identifier les
sujets tendances ou même les hashtags Analysez également l'impact du
post effectué par des influences. Des
applications multilingues peuvent également être créées afin que vous puissiez activer la recherche dans
plusieurs langues. discours de haine et
les contenus préjudiciables
sont des sujets sur lesquels il faut travailler. Ainsi, vous pouvez facilement
les détecter et les modérer. Prédisez facilement les tendances du marché
boursier
en analysant les articles de presse, les sentiments sur les réseaux
sociaux, les publications
sur Twitter, etc. Prédisez des événements tels que le lancement
d'un produit, contenu d'e-mail
personnalisé
pour les campagnes marketing, personnalisez le contenu d'un site Web ou d'une application en fonction des préférences
et du comportement des utilisateurs. Ajustez les modèles pré-entraînés
pour votre tâche spécifique. Vous pouvez également comparer
les performances de différents modèles
sur des ensembles de données personnalisés. Donc, les gars, nous avons vu certains
des meilleurs cas d'utilisation de la phase
de câlin Dans les prochaines leçons, nous
mettrons en œuvre certaines d'entre elles.
4. Bibliothèque de transformers en caresses: Dans cette leçon, nous
allons comprendre la bibliothèque des transformateurs en phase
d'étreinte. Nous allons également apprendre comment
l'installer. Voyons voir. La bibliothèque Transformers est
la bibliothèque de base pour les modèles et les pipelines
préentraînés Il s'agit d'une bibliothèque
Python open source. Comme je l'ai déjà dit, Hugging Phase a développé la bibliothèque de
transformateurs, est modulaire
et extensible Il inclut des milliers de modèles
pré-entraînés pour un large éventail de tâches de PNL
telles que la traduction, le résumé de texte, la
classification de textes, etc. Dans cette leçon, nous
allons donc comprendre ce qu' est la bibliothèque Transformers, pourquoi utiliser la bibliothèque
Transformers, cas d'utilisation et comment
l'installer Commençons. Nous avons donc déjà vu quelle est la bibliothèque
des transformateurs ici Nous allons maintenant voir pourquoi utiliser
la bibliothèque Transformers. La bibliothèque Transformers est
largement utilisée car elle est assez simple à utiliser
avec des modèles NLP complexes Il vous donne accès
à des modèles de pointe. Il est ainsi soutenu par une communauté
nombreuse et active. Il prend en charge la personnalisation
et le réglage fin. Vous pouvez ainsi intégrer la bibliothèque de transformateurs à
d'autres outils Voici quelques cas d'utilisation de
la bibliothèque Transformers, classer les textes en catégories,
comme la classification de texte en cas de
détection de spam dans les e-mails Identifiez également les
entités telles que les noms, les dates et les lieux dans le texte, ce que l'on appelle la reconnaissance d'
entités nommées. Traduisez des textes entre différentes langues,
de l'anglais à l' allemand, en générant
du texte à l'aide de modèles tels que GPT Implémentez également la réponse par
quotien. Il s'agit de répondre en
fonction d'un contexte donné. Voyons comment installer
la bibliothèque Transformers. Voici donc différentes méthodes. Utilisez PIP pour installer la bibliothèque de
transformateurs. PIP est un
gestionnaire de packages permettant de télécharger, installer et de gérer des
packages et des bibliothèques Python Avec cela, vous pouvez
également utiliser Google Colab. Vous trouverez ici quelques
différences de syntaxe. Il y a un signe d'exclamation si vous l'installez
sur Google Colab Avec cela, vous pouvez également installer la
bibliothèque Transformers directement depuis le dépôt
Github de Hugging Phase Voyons donc comment l'installer. Nous utiliserons Google Colab pour cela. Nous allons ajouter la
commande suivante. Voyons voir. Voici notre navigateur, je vais taper Google Colab et appuyer sur Entrée Voici le lien fourni par Google uniquement
colab.research.google.com Ici, vous pouvez voir que je suis
déjà connecté à
mon compte Gmail,
il s'ouvrira donc directement. J'ai cliqué dessus,
il me demande donc de créer
un nouveau carnet ici Voici mes carnets de notes déjà
créés. Je vais cliquer sur Nouveau bloc-notes. Il s'agit donc d'une application Web gratuite. Nous allons donc maintenant utiliser la même
commande ici pour l'installer. Je vais vous le montrer à nouveau.
Voici la commande. OK, tapons
la même commande. OK, PIP Space installe des transformateurs
spatiaux. Ensuite, pour ce que nous
devons faire, il suffit de cliquer dessus.
C'est écrit « run here ». Pouvez-vous voir des runs Ok, donc de cette façon, nous pouvons installer la bibliothèque Transformers à l'
aide de Google Colab Vous pouvez ajouter le nom de
votre bloc-notes Python ici. Cela a donc créé un bloc-notes
Python. Si vous connaissez Anaconda, vous pouvez facilement deviner ce qu'est un bloc-notes
Python Enregistrez-le d'ici
et renommez-le plus tard. Je viens donc d'implémenter cette syntaxe pour installer
la bibliothèque Transformers Dans cette leçon, nous avons vu ce qu'
est la bibliothèque Transformers. Nous avons également vu pourquoi
il est si populaire
auprès de cela, nous avons également vu quelques cas d'
utilisation et comment l'installer.
5. Bibliothèque de jeux de données de visages étirés: Dans cette leçon, nous
allons comprendre la bibliothèque de jeux de données
lors de la phase d'étreinte Avec cela, nous verrons
également comment l'installer. Commençons. La bibliothèque de jeux de données
permet d'accéder facilement à une grande variété d'ensembles
de données pour NLP et d'autres tâches d'apprentissage automatique Il est développé par Hugging
Face et est une bibliothèque Python. Il permet aux développeurs
et
aux chercheurs de travailler plus facilement et
aux chercheurs de travailler avec les données pour la formation
et l'évaluation des modèles. Dans cette leçon,
nous verrons ce qu' est la
bibliothèque de jeux de données et pourquoi l'utiliser Utilisez donc des cas de bibliothèque de
jeux de données pour l'installer Commençons. Nous avons déjà expliqué ce qu'est la bibliothèque de
jeux de données Commençons donc par les raisons d'
utiliser la bibliothèque de jeux de données. L'une des raisons est que
l'efficacité, le chargement
différé et le streaming facilitent le travail avec
de grands ensembles Les ensembles de données peuvent être énormes, et nous avons toujours besoin d'une
bibliothèque ou d'une technologie pour faciliter l'accès à ces ensembles de
données et Cette bibliothèque est donc vraiment utile. Il dispose d'une API unifiée pour le
traitement des ensembles de données. Vous pouvez également utiliser la bibliothèque
Transformers et d'autres frameworks ML avec la bibliothèque de jeux de données afin l'intégration et
l'interopérabilité Des milliers de jeux de données sont
fournis par Huggingfas. Il prend en charge les ensembles de données personnalisés
et les pipelines de prétraitement. Donc, avant d'installer
la bibliothèque de jeux de données, laissez-moi vous montrer son site Web Voici donc le lien huggface.co, site officiel des ensembles de données
Huggingface Vous pouvez donc voir
combien de jeux de données sont fournis sur 350
K, et le voici Si vous cliquez sur l'un
d'entre eux, vous pouvez
obtenir tous les détails. Dans ce didacticiel, nous vous
montrerons également comment télécharger et accéder facilement
à un ensemble de données à
l'aide de Huggingface Je parlerai plus tard des cas d'utilisation
ou de la bibliothèque de jeux de données qui permet de charger et de
prétraiter facilement des ensembles de données
pour des tâches telles que Cela relève de la classification
du texte. Avec cela, vous pouvez
également travailler avec l'analyse des sentiments et la réponse par
quotiens Grâce à cela, vous pouvez facilement créer des systèmes de réponse par quotiens Certains ensembles de données sont également
fournis à des fins de traduction avec ce nom. L'objectif de
reconnaissance des entités peut également être rempli avec certains ensembles de données déjà
fournis par Hugging Face Chargez et prétraitez
vos ensembles de données personnalisés l'aide de la bibliothèque de jeux de données Voyons maintenant comment installer la bibliothèque
de jeux de données. Vous pouvez donc utiliser le gestionnaire de
packages PIP PPA pour télécharger, installer et gérer des
packages et des bibliothèques Python Il suffit d'utiliser la commande PIP
Space install space datasets. Avec cela, vous pouvez également
utiliser facilement Google Colab. Mais il y a une différence
entre les deux syntaxes. Vous avez un point d'exclamation pour Google Colab. Nous
le verrons plus tard. Vous pouvez ainsi le télécharger
directement depuis le référentiel HuggfasGitHub en
utilisant la syntaxe fournie, les ensembles de données Git plus github.com
hugfacelash Tell S
pip pour installer
le package depuis le référentiel d'ensembles de données Hugging Phase sur Github Git plus github.com
hugfacelash Tell S
pip pour installer
le package depuis le référentiel d'ensembles pip le référentiel HuggfasGitHub en
utilisant la syntaxe fournie, les ensembles de données Git plus github.com
hugfacelash Tell S
pip pour installer
le package depuis le référentiel d'ensembles de données Hugging Phase sur Github. Voyons maintenant comment installer la bibliothèque
de jeux de données. Nous avons déjà vu Google Colab. Je vais donc simplement utiliser la deuxième syntaxe pour installer la bibliothèque Datasets
sur Google Colab C'était donc notre Gold Collab. Nous avons déjà vu comment installer
la librairie Transformers. Nous pouvons installer la
bibliothèque de jeux de données ici même, mais laissez-moi créer un nouveau
bloc-notes, allez dans Fichier Cliquez sur Nouveau bloc-notes. Maintenant, un
nouveau bloc-notes Python s'est ouvert. Tapons la commande
pour installer des ensembles de données,
Pip install PIP space installe des ensembles de données d'espace
, et exécutons simplement la Je l'ai déjà montré également. Attendons. Tik Mark est visible. Cela signifie que nous l'avons
installé avec succès. Vous pouvez également l'enregistrer
à partir d'ici, je vous l'ai dit auparavant, enregistrer également et
laissez-nous ajouter le nom à
notre bloc-notes Python. Ainsi, les gars, nous
pouvons facilement installer
la bibliothèque de jeux de données Dans les prochaines leçons,
nous verrons également
comment les utiliser
et leurs cas d'utilisation. Les gars, nous avons vu ce qu'est
la bibliothèque de jeux de données. Nous avons facilement compris
le concept, ses cas d'utilisation également,
et nous avons également vu comment installer la bibliothèque de jeux de données
6. Tokenizers Library of Hugging Face: Dans cette leçon, nous
allons comprendre la bibliothèque de tokenizers de la phase
d'étreinte Avec cela, nous
verrons également comment l'installer. La bibliothèque Tokenizers est
une bibliothèque rapide et efficace
pour tokeniser du texte,
qui est souvent utilisée parallèlement
à la bibliothèque qui est souvent utilisée parallèlement Nous avons déjà vu la bibliothèque
des transformateurs dans les leçons précédentes La bibliothèque tokenizer est donc une
bibliothèque rapide, efficace et flexible conçue pour
tokeniser Il s'agit d'une étape cruciale dans le traitement du langage
naturel. tokenisation consiste à
diviser les textes en unités plus petites
telles que des mots, sous-mots ou des caractères, puis celles-ci sont converties en représentations
numériques
que les modèles ML peuvent traiter Dans cette leçon, nous
allons comprendre ce qu'est la bibliothèque du tokenizer, pourquoi l'utiliser, quels sont ses cas d'utilisation, ainsi que comment l'installer Commençons donc, nous avons déjà vu ce qu'est la bibliothèque
tokenizers Nous allons donc maintenant voir pourquoi utiliser
la bibliothèque tokenizers. Il est assez rapide
pour la tokenisation, c'est-à-dire optimisé
pour une tokenisation rapide, même Il prend également en charge les tokeniseurs
personnalisés et suffisamment flexible pour prendre en
charge plusieurs algorithmes de tokenisation L'intégration est possible. Cela signifie que vous pouvez l'utiliser avec d'autres bibliothèques de visages très étreintants,
comme Transformers Il dispose d'une API simple
pour la tokenisation, décodage et Grâce à cela, vous pouvez facilement
accéder à des tokeniseurs pré-entraînés. Voyons maintenant les cas d'utilisation. Unifiez facilement les données textuelles
pour classer le texte afin de détecter le
spam dans les e-mails Avec cela, vous pouvez
également analyser le spam. Effectuez facilement une analyse des
sentiments, alignez les jetons sur
les étiquettes des entités. Il est également utilisé pour la traduction
automatique. Certains de ses autres cas d'utilisation incluent la génération de texte et
même la réponse aux questions. Avec cela, entraînez et
utilisez des tokeniseurs pour des ensembles de données
spécifiques à un domaine Voyons maintenant comment installer
la bibliothèque tokenizers. Nous pouvons utiliser le
gestionnaire de packages PEP PIP pour télécharger, installer et gérer des packages
Python, utiliser l'espace Syntax PIP
install
tokenizers pour l' installer Avec cela, nous pouvons également utiliser la bibliothèque de tokenizers
sur Google Nous avons déjà vu comment installer
une bibliothèque sur Google Collab. De même, nous pouvons utiliser le point d'exclamation PIP space install space
tokenizers De plus, la troisième méthode vous permet PIP d'installer
le package depuis le référentiel des
ensembles de données de la phase de câlin Vous pouvez également utiliser
la troisième méthode directement installée depuis
le dépôt Github, tapez PIP space Install space Git
plus le
chemin Github pour l'installer plus le
chemin Github pour Voyons maintenant comment installer la bibliothèque
Tokenizers
sur Google Nous allons ouvrir à nouveau Google Colab. Voici donc notre Google Colab. Nous avons déjà installé les transformateurs et la bibliothèque d'
ensembles de données. Nous pouvons installer la
bibliothèque Tokenizer ici même, mais laissez-moi créer un nouveau bloc-notes
Python,
GodOfle cliquez sur Nouveau bloc-notes GodOfle Tapons maintenant la commande. Point d'exclamation, espace
PIP, installez tokeniseurs d'
espace et
cliquez sur la cellule Cliquez ici, Exécutez Sell. La bibliothèque tokenizers
va maintenant être installée. Vous pouvez également l'enregistrer.
Comme je l'ai déjà dit, cela créera un bloc-notes
Python. Donc ici, je vais taper
Amith underscore. Vous pouvez ajouter n'importe quel nom. Et
voici notre bloc-notes en Python. D'accord, nous utiliserons toutes
ces bibliothèques plus tard lorsque nous travaillerons sur les cas d'
utilisation de Hugging Face Alors, les gars, nous avons vu ce qu'est
la bibliothèque de tokenizers. Nous avons également vu son objectif, ainsi que les cas d'utilisation. Avec cela, nous avons également installé la bibliothèque de tokenizers
sur Google Colab
7. Jeton d'accès facial à l'embrassement (clé API) et comment créer: Dans cette leçon, nous allons apprendre ce qu'est un jeton excédentaire d'étreinte Avec cela, nous
apprendrons également à
le créer . Commençons. Considérez un jeton excédentaire comme une chaîne de caractères sécurisée. Ceci est principalement utilisé pour accéder aux services
et aux ressources de la phase de
câlin La phase d'étreinte, la clé API et le
jeton d'excédent de phase d'étreinte sont identiques Dans cette leçon, nous
verrons ce qu'est un jeton excédentaire, c'
est-à-dire une clé d'API. Avec cela, nous apprendrons
quand avons-nous besoin d'un jeton d'excédent de
phase d'étreinte Nous comprendrons également que lorsque le jeton
excédentaire de la phase d'étreinte n'est pas requis, nous finirons par
apprendre à créer une clé d'API. Commençons. Nous avons donc expliqué ce qu'est un APK, c'
est-à-dire un jeton excédentaire
en phase de câlin Voyons maintenant quand avons-nous besoin d'un
jeton d'excédent de
phase d'étreinte C'est ici. Lorsque vous utilisez un modèle
privé ou fermé ou une API d'inférence,
vous avez besoin d'un jeton d'excédent de
phase d'étreinte Vous devez avoir entendu
parler de Meta Sama. Il s'agit d'un modèle privé. Pour y accéder, vous
devez vous authentifier. Cela signifie que vous
devez créer une clé d'API. Il te faut un jeton. Ainsi, si vous utilisez
l'API d'inférence Huggingpas,
vous avez besoin d'un
jeton d'accès pour effectuer des appels d'API vous avez besoin d'un
jeton d'accès pour effectuer des appels d' De plus, si vous
téléchargez des modèles, des
ensembles de données ou même des espaces
vers le hub Hugging Pace, vous avez besoin d'un Voyons maintenant quand
vous n'avez pas besoin d'un jeton d'accès
huggingfas Évidemment, si vous
accédez à des modèles publics qui peuvent être
téléchargés et utilisés par le public, vous n'avez pas besoin d'un jeton supplémentaire. Tout comme pour GDP Two, si vous utilisez les modèles
via la bibliothèque de transformateurs de Hugging Phase, vous n'avez pas besoin de jeton d'accès Ils sont
accessibles au public et peuvent être facilement téléchargeables sans aucune authentification,
sans aucun APake De plus, de nombreux modèles open
source sont disponibles pour accéder à
ces modèles, vous n'avez pas besoin de clé d'API, vous n'avez pas besoin de jeton d'accès car ils sont disponibles
gratuitement. Dans les prochaines leçons,
nous travaillerons donc sur ces modèles
publics et open source uniquement afin qu'il ne soit pas nécessaire de
créer un jeton d'accès à la
phase d'étreinte Voyons maintenant comment créer
un jeton d'accès à la phase d'étreinte Nous irons donc sur le site Web de Hugging
Phase et nous créerons un
jeton d'accès. Commençons donc. Ouvrez le site officiel huggface.co slash Alors voilà, vous devez vous inscrire. Cela signifie que vous devez créer
un compte sur Hugging Face. Ici, vous pouvez utiliser
votre adresse e-mail. Permettez-moi donc de créer mon compte. J'ai donc ajouté un compte, mon adresse e-mail. Non,
entrez le mot de passe. Le voici maintenant, cliquez sur Suivant, complétez votre profil
ici, ajoutez un nom d'utilisateur. Ajoutez votre nom. Vous pouvez également
ajouter votre nom d'utilisateur Twitter. Ce sont également des profils
LinkedIn facultatifs. Vous pouvez également télécharger
votre OTR. Je vais cliquer. Vous pouvez également ajouter votre nom
d'utilisateur iHub ainsi que votre site Web Comme vous pouvez le constater,
elles sont facultatives. Cliquez sur J'ai du rouge. Ensuite, cliquez sur Créer un compte. Nous avons créé un compte. Vous devez vérifier la présence d'un lien de confirmation dans vos
courriers électroniques . Votre compte est maintenant vérifié. Votre adresse e-mail
a été vérifiée. Cliquez sur votre profil. Allez ci-dessous. Ce sont des jetons excédentaires écrits. C'est ici. Cliquez dessus. Vous devez maintenant créer un
nouveau jeton en cliquant ici. N'oubliez pas de ne partager vos jetons
excédentaires avec personne. Créez un nouveau jeton.
Ajoutez le nom du jeton. Disons que je vais taper la clé de démonstration. OK. Maintenant, allez ci-dessous. Cliquez sur Créer un jeton. La
clé a été créée avec succès. Vous pouvez le copier et le sauvegarder. Ici c'est écrit,
gardez-le dans un endroit sûr. Vous ne pourrez plus le voir
une fois que vous aurez
fermé ce modèle. Cliquez sur Terminé. Toutes
vos clés sont désormais visibles. Voilà, nous venons de créer
une clé unique, et lorsque vous cliquez
ici, vous pouvez la modifier. Vous pouvez modifier les autorisations,
mais aussi les supprimer. OK, nous avons vu ce que sont les jetons excédentaires ou la
clé APA dans un câlin. Grâce à cela, nous avons également
appris à créer.
8. Téléchargez un ensemble de données sur Hugging Face: Dans cette leçon,
nous allons apprendre comment télécharger un jeu
de données depuis la phase Hugging Pour cela, nous utiliserons la bibliothèque
de jeux de données. Voyons qu'un ensemble de données fait référence à un ensemble
de données structurées, qui peuvent être utilisées pour former, évaluer ou tester des modèles d'apprentissage
automatique. Hugging pace dispose donc
de nombreux ensembles de données sur sa plate-forme, qui peuvent être utilisés pour
divers cas d'utilisation tels que Nous utiliserons la
bibliothèque de jeux de données pour télécharger un ensemble de données depuis la phase de Hugging
. Laissez-nous voir. Voyons d'abord les ensembles de données. Accédez aux ensembles de données Slash du
site Web de Hugging Phase. Voici donc les ensembles de données
fournis par Hugging face. Vous pouvez en voir beaucoup. Voyons comment nous
pouvons le télécharger. Nous allons donc passer sur la même
plateforme, Google Colab, que nous avons déjà utilisée dans
ce tutoriel. C'est ici. OK. C'est donc le
carnet que nous avons déjà créé. Dans ce premier cas, nous avons installé
la bibliothèque de jeux de données. Je vous ai déjà expliqué
comment l'installer sur Google Colab à l'aide de
la commande PIP. Ensuite, nous avons chargé un ensemble de données à l'aide du jeu de données
load underscoe. Fonction. Cette fonction
permet de télécharger des ensembles de données depuis le hub Hugging Face ou de les
charger à partir de fichiers locaux Nous téléchargeons actuellement un ensemble
de données depuis le hub Hugging
Face C'est ici. OK, nous
chargeons ici le jeu de données IMDB Ensuite, j'imprime le jeu de données en utilisant
la méthode d'impression. importons ici la fonction de jeu de données Load Underscore Cela donne accès à divers ensembles de données publics
tels que IMDB dans ce cas Nous chargeons ici le jeu
de données IMDB. L'ensemble de données IMDB contient des critiques de
films étiquetées comme positives ou négatives ou une classification par
sentiment Lorsque vous l'exécutez, il
télécharge et traite
automatiquement le jeu de données. Nous imprimons ici
le jeu de données. Cela divisera l'ensemble de données
en train et test. OK, il affichera
un aperçu de l'ensemble de données, y compris le nombre d'
échantillons dans chaque division. Voyons voir qu'après l'
exécution, le voici, il nous montre la structure du jeu
de données IMDB En tant que dictionnaire de jeux de données, qui organise le jeu de données
en différentes divisions Le train contient 25 Kos avec du texte pour les critiques de films et une étiquette pour
les sentiments positifs ou négatifs. Ici, pour le test, cela représente 25 Kos à des fins de test
avec les mêmes fonctionnalités. Il contient 50 ko, mais ce split ne comporte généralement
pas d'étiquette pour l'analyse des
sentiments. Il est souvent utilisé pour des tâches telles que le pré-entraînement ou l'apprentissage
semi-supervisé. Dans ce jeu, nous
pouvons télécharger un ensemble de données.
9. Téléchargez un modèle de Hugging Face: Dans cette leçon, nous
allons apprendre comment télécharger un modèle
depuis Hugging Face Laissez-nous voir. Pour le téléchargement, nous allons donc utiliser la bibliothèque
Transformers Avec cela, nous pouvons également télécharger directement depuis le
Hugging Face Hub Voyons un guide étape par étape pour télécharger et utiliser les
modèles de Hugging Face Nous utiliserons la bibliothèque
Transformers, dont nous avons déjà parlé Laissez-nous voir. Voici notre code VS. Nous avons déjà créé un
fichier de bloc-notes, ouvrez un bloc-notes. Ici, nous avons déjà créé le modèle de téléchargement AMTNderscoe. Pour ce faire, nous avons d'abord installé la bibliothèque
Transformers Nous avons déjà expliqué
que Hugging Phase développé cette bibliothèque Nous avons donc utilisé PIP pour l'
installer sur Google Colab. Ensuite, ce que nous avons fait ici, nous avons téléchargé un modèle à l'aide de
la bibliothèque Transformers nous avons utilisé la
méthode pré-entraînée From Pour cela, nous avons utilisé la
méthode pré-entraînée From
underscore Cette méthode permet de télécharger
les poids, la
configuration et le tokenizer
du modèle depuis le hub Hugging Phase Nous sommes en train de télécharger un modèle d'oiseau
pré-dressé. C'est ici. Après avoir utilisé ce que nous allons obtenir, nous l'avons fait et
nous avons obtenu la forme. Cette forme est couramment
observée dans les modèles bits où chaque jeton d'une séquence est représenté par
un vecteur à 768 dimensions. Lorsque nous utilisons le modèle non encadré par un trait d'
union de base de Burt et passons la phase d'entrée « hello
hugging », la dernière forme
de sortie à
état caché représente les que nous
passons la phase d'entrée « hello
hugging »,
la dernière forme
de sortie à
état caché représente les dimensions du tenseur. Dans cet exemple, la forme
que vous verrez généralement
est la suivante. Ici, l'un d'eux est visible. Il s'agit de la taille de la batte puisqu'
il n'y a qu'une phrase d'entrée. Sept est la longueur de la séquence. Cela correspond à
la version tokenisée de la phase Hello Hugging
incluant Cela signifie la phase de
bonjour suivante. 768 est la taille cachée. Chaque jeton est représenté sous la forme d'une norme
vectorielle à 768 dimensions pour l'architecture de base des oiseaux. De cette façon, les gars, nous pouvons
facilement télécharger un modèle en utilisant la bibliothèque Transformers
avec Google Colab
10. Analyse des sentiments à l'aide d'un visage qui embrasse: Dans cette leçon,
nous allons apprendre comment implémenter l'
analyse des sentiments avec Hugging face Nous allons comprendre
ce qu'est
l'analyse des sentiments dans son genre. Ensuite, nous allons exécuter un exemple de
codage sur Google Colab. Voyons voir, nous avons déjà discuté de la bibliothèque de
transformateurs fournie par Hugging Face C'est un outil puissant pour des
tâches telles que l'analyse des sentiments. Maintenant, qu'est-ce que l'analyse des sentiments ? Comme son nom l'indique,
cela inclut
la détermination du sentiment exprimé
dans un texte, il soit négatif ou neutre. Disons que j'adore le cricket, donc c'est une phrase positive. OK, je n'aime pas quelque chose, je vais toucher quelque chose, donc c'
est un sentiment négatif. De même, lorsque j'expliquerai les types d'analyse des sentiments, les choses seront plus claires. Le premier est la détection de
polarité positive,
négative ou neutre J'adore ce produit, c'est
positif, évidemment. Le service est terrible, il n'est pas bon, il est négatif. Et lorsque les choses ne
sont pas claires, ce sera neutre, comme si le
colis était arrivé à temps. Vient ensuite la détection des émotions. Supposons que vous disiez : « Ce
n'est pas bon, c'est pathétique ». C'est tellement frustrant.
C'est de la colère. Et la joie s'exprime par une phrase comme « Je suis
ravie des résultats ». La détection des émotions
inclut donc le bonheur, la frustration et d'autres émotions. Vient ensuite l'analyse des
sentiments basée sur les aspects, comme le sentiment à l'égard d'un produit ou d'un service
spécifique. Comme si la nourriture était excellente,
mais le service était lent. Dans ce cas, la nourriture dégage un
sentiment positif, évidemment. Mais comme le service n'
était pas bon, c'est un sentiment négatif. Ensuite, l'analyse de l'intention, comme l'intention d'acheter
quelque chose pour se plaindre. Disons que vous avez dit : « Nous pouvons acheter ce produit » ? Il s'agit donc d'une intention d'achat. C'étaient donc les types
d'analyse des sentiments. Voyons maintenant l'exemple de
codage. Pour ce faire, nous
utiliserons un modèle public. Nous ne créerons donc pas jeton
supplémentaire car
pour les modèles publics, comme je l'ai déjà dit,
nous n'en avons pas besoin. Nous allons exécuter le
code sur Gool Colab. Pour plus d'efficacité, nous
pouvons également modifier le temps d'exécution sur Google Collab Je vais
donc également vous
le montrer avec l'exemple Commençons Voici
notre Google Colab. OK, laissez-moi ouvrir le
code, le fichier, ouvrir le bloc-notes. J'ai déjà créé le projet. Ici, il s'agit d'une analyse des sentiments. C'est ici. Pour plus d'efficacité, nous pouvons donc modifier le type d'exécution. Cliquez sur le menu d'exécution,
cliquez ici pour modifier le type d'exécution. OK. Nous pouvons voir que nous avons déjà sélectionné le
To GPU, ce n'est pas un problème. Si votre projet est assez complexe ou si vous avez un projet à
grande échelle, vous pouvez également sélectionner le TPU V deux
tirets huit Je vais garder la même chose, d'accord ? Donc, au départ,
ce que nous avons fait,
nous avons d'abord installé les bibliothèques
requises, savoir Transformers et Torch OK, nous utilisons le papier. Nous avons déjà expliqué comment l'installer dans les leçons
précédentes. Après cela, nous l'avons exécuté en utilisant cette exécution Nous avons importé les
modules nécessaires dans cette ligne. Nous avons chargé ici le pipeline
d'analyse des sentiments. La fonction de pipeline
fournit un moyen simple d' effectuer diverses tâches de PNL, notamment l'analyse des sentiments Vous pouvez charger un
modèle d'analyse des
sentiments pré-entraîné comme suit. Donc voilà, ce que nous avons fait, nous avons
chargé le modèle suivant. OK. Ensuite, nous avons
effectué une analyse des sentiments. Puisque nous avons chargé le pipeline d'analyse des
sentiments, utilisez-le pour analyser le
sentiment d'un texte. Ici, j'adore jouer
et regarder le cricket. Ce sont mes textes,
et je déteste quand
on est à Collis, ça fait un siècle Donc, évidemment, vous pouvez deviner qu'il s'
agit d'une phrase positive et que c'est une phrase négative. Vous pouvez facilement le deviner. Voici donc l'analyse des sentiments. Ici, le résultat que vous pouvez voir
est une liste de dictionnaires. C'est ici que chaque dictionnaire contient l'étiquette de sentiment
et le code de confiance. Ici, c'est le label et
le noyau de confiance. Nous avons donc analysé plusieurs textes à la
fois en transmettant une liste de piqûres à l'analyseur de
sentiments Maintenant, comprenons complètement
le résultat. Le score indiqué dans le résultat
du pipeline d' analyse des sentiments de la phase d'étreinte représente le niveau de confiance ou probabilité que le modèle attribue à l'étiquette de
sentiment prédictive Cela indique dans quelle mesure
le modèle est sûr que le
texte donné correspond au sentiment
prédictif. Le score est une valeur de 0 à 1. Comme vous pouvez le constater, un score
plus proche de un signifie que le modèle est très confiant
dans ses prévisions. Si le score était plus proche de zéro, cela signifierait que le modèle est moins sûr de
sa prédiction. L'étiquette positive
indique que le modèle prédit que l'impression
du texte est positive.
C'est ce qui suit. Le négatif signifie le
contraire, c'est-à-dire négatif. C'est ici. Ici, vous vous demanderiez
pourquoi le score est si élevé, proche de un. Cela est dû au fait que le modèle que
nous utilisons a été affiné sur un vaste ensemble de données et il est très précis pour les tâches d'analyse des
sentiments. Le texte d'entrée contient probablement langage
fort et sans ambiguïté qui permet au modèle de
prédire facilement le sentiment
avec une grande confiance, comme manger signifie négatif
et aimer signifie positif Donc, de cette façon, les gars, nous pouvons travailler sur l'analyse des sentiments
avec un visage étreint
11. Classification de texte à l'aide de Hugging Face: Dans cette leçon, nous
allons apprendre comment
utiliser la phase d'étreinte
pour la classification du texte Tout d'abord, nous allons comprendre
ce qu'est la classification de texte. Cela nous permettra également de voir la différence entre l' analyse des
sentiments et la classification
du texte. Ensuite, nous allons
créer et exécuter un exemple sur Google
Colab. Commençons. La classification du texte,
comme son nom l'indique, peut être utilisée pour détecter le spam. Donc, sur votre adresse e-mail
, vous devez avoir vu que certains
e-mails sont considérés comme des spams, tandis autres ne sont pas
considérés comme du spam. la même manière, vous pouvez également
classer les articles de presse ou documents tels qu'un
article sportif dans la catégorie sport, un article lié à la technologie dans
la catégorie technologie. , il
inclut également un cas d'utilisation
pour la détection des intentions, comme l'annulation d'une commande, réservation d'un vol, etc. Voyons donc jusqu'à présent, nous avons couvert l'analyse des
sentiments. Voici donc la
différence entre l' analyse des
sentiments et la classification
du texte. Comme son nom l'indique, l'analyse des
sentiments est étroite. Cela est spécifique
au sentiment. Disons un sentiment positif pour un texto comme « I love Cricket ». De la même manière, les libellés
pour la classification du texte
dépendent de la tâche, comme je viens dire à propos du spam ou du
non-spam ou d'autres sujets. Ensuite, pour l'analyse
du sentiment, nous en avons discuté avant qu'il ne soit principalement positif,
négatif ou neutre. Certains cas d'utilisation
incluent le classement des
e-mails en tant que spam ou non en tant que courrier indésirable dans le
cadre de la classification textuelle Dans le cadre de l'analyse des sentiments,
l'un des cas d'utilisation peut être une évaluation
positive du produit. Voyons maintenant un
exemple de codage dans lequel nous
détecterons le spam ou non
sur la base d'un texte. Nous utiliserons un modèle
accessible au public qui
est le suivant. Nous n'aurons donc pas besoin
d' un jeton supplémentaire de
Hugging Face pour cela Voyons donc l'exemple et classons le texte comme
spam ou non comme spam. Voici notre Google
Colab. Nous avons créé ces carnets jusqu'à présent Ouvrons notre bloc-notes de
classification de texte , bloc-notes
ouvert. C'est ici. Nous l'avons déjà créé
. Voyons les étapes. Tout d'abord, nous allons installer
les bibliothèques requises. Cela commence par
la bibliothèque Hugging Face Transformers
ainsi que par la bibliothèque Torch Nous avons donc utilisé la
commande d'installation PIP pour cela.
Passons ci-dessous. Ensuite, nous allons importer
les modules nécessaires. Ici, nous avons importé
le module de pipeline. Ensuite, nous avons chargé un modèle de détection de spam
pré-entraîné qui est le suivant ici.
Il est disponible gratuitement. Nous n'avons donc pas appliqué de clé
pour étreindre le visage. L'étape suivante consiste maintenant à
effectuer la détection du spam. Tout d'abord, nous avons défini
plusieurs textes afin pouvoir détecter si ces
textes sont du spam ou non. Nous avons classé
plusieurs textes à la fois en leur transmettant
une liste de chaînes. C'est ici. Nous avons associé libellés au spam
et non au spam ici Ici, c'est le mappage des étiquettes. Négatif signifie spam,
neutre signifie pas spam, positif signifie pas spam. D'accord. Pour afficher les résultats, nous avons utilisé les quatre en boucle. C'est ici. Que va-t-il se passer ? Un score sera visible
dans le résultat. D'accord. Le résultat
inclura également l'étiquette, qu'il
s'agisse
d'un spam ou non. Ainsi, le score
sera également visible. Ce sont les scores de confiance. Ici il en est ainsi
selon notre modèle, le premier texte est un spam. Évidemment, parce qu'il s'agit d'une
marque de félicitations. Nous avons l'une des cartes-cadeaux Amazon de 500
INR, cliquez ici pour la réclamer maintenant Le second n'est pas un
spam. De toute évidence, son mythe. Rencontrons-nous
demain à midi. Donc, évidemment, il ne s'
agit pas d'un spam. Ce dernier est également
considéré comme un spam. Nous recevons de nombreux spams indiquant
que votre compte Gmail
a été compromis. Ici, l'intervalle de confiance
affiche le score. faibles
scores de confiance indiquent que le modèle est incertain
quant à ses prévisions. Le modèle suivant est
affiné pour l'analyse des sentiments, mais pas spécifiquement
pour la détection du spam. Nous sommes toujours en train de
l'adapter pour la détection du spam. D'accord. C'est pourquoi ici,
il n'affiche aucun spam, mais le score de confiance
est même inférieur à 0,7. Je vous ai dit que les faibles scores de
confiance indiquent que le modèle est incertain quant à ses prévisions. Vous pouvez définir ici un
modèle différent à partir de
la phase d'étreinte Nous montrons ici un exemple. Ainsi, nous pouvons
utiliser la
bibliothèque Transformers sur Hugging
Face pour détecter C'est pour effectuer une classification de
texte.
12. Des résumés de texte à l'aide de Hugging Face: Dans cette leçon, nous
allons comprendre comment effectuer des résumés à l'
aide d'un visage étreint. Tout d'abord, nous allons comprendre
pourquoi nous avons besoin de résumer, puis nous verrons
un exemple de codage sur Google Colab pour résumer
le texte. Commençons. le savez déjà, la bibliothèque
Transformers en phase d'étreinte Comme vous le savez déjà, la bibliothèque
Transformers en phase d'étreinte
est utilisée pour les tâches de PNL Cela inclut également le résumé
du texte. Alors pourquoi un résumé ? La synthèse est
en fait utilisée dans de nombreuses
applications du monde réel Vous devez avoir vu le résumé de
longs articles en courts extraits avec celui résumant des documents Les chatbots fournissent également des réponses
rapides et concises. Cela vous permet d'
extraire des points clés et des résumés d'un document ainsi que de grands ensembles de Voyons maintenant un exemple. Ici, nous utiliserons le modèle
suivant, qui est
accessible au public sur Hugging face Nous n'avons donc pas besoin d'
ajouter le jeton excédentaire. D'accord, nous allons exécuter le code sur Google Colab comme nous l'avons vu auparavant Voyons donc le code.
Voici donc notre Google Colab Nous allons ouvrir notre
fichier de code, ouvrir notre bloc-notes. Nous
discutons donc ici de la synthèse. Voici notre code.
Tout d'abord, ce que nous avons fait, nous avons installé les bibliothèques
requises. Nous avons donc installé les
transformateurs ainsi que bibliothèque Pytoch ici à
l' aide de la commande PIP Nous avons déjà discuté de
cette commande. Ensuite, nous utiliserons Atomdel
pour la séquence à séquence LM et le tokenizer automatique
pour mieux
contrôler le processus afin de
pouvoir charger directement le modèle et
le C'est donc ce que nous
avons fait ici. Nous avons chargé ici le
modèle pré-entraîné suivant à des fins de synthèse. Nous avons donc défini ici le texte
d'entrée pour le résumer. Voici donc notre texte. Nous
allons résumer cela. Tout d'abord, nous avons tokenisé
le texte saisi en utilisant ce
qui OK, vous pouvez donc
voir ici quelques paramètres. Ces paramètres permettront de contrôler la
longueur et la qualité des résumés La longueur maximale du trait de soulignement est le nombre maximal de
jetons dans le résumé Nous avons défini 512, donc ici le résumé
ne dépassera pas 512 jetons. Nous avons tokenisé le texte
saisi ici. Pour générer le résumé, nous
avons utilisé la méthode generate. Nous avons ici quelques paramètres pour l'entrée, les
suivants, tokenisés Ensuite, la longueur maximale, qui est le nombre maximum de
jetons dans le résumé. Il s'agit du nombre minimum
de jetons indiqué dans le résumé. La longueur souligne la pénalité.
Qu'est-ce que c'est ? Cela encourage les résumés plus
ou moins longs. Ici, il y en a deux, ce qui
signifie des résumés plus longs. Les faisceaux de soulignement Num contrôlent
la largeur de recherche du faisceau,
augmentent les valeurs, améliorent la qualité, mais ralentissent Ici, nous l'avons fixé à quatre. Cela signifie quatre
faisceaux pour le décodage. OK, voici donc notre contribution, et voici le résumé ici. Nous avons imprimé le résumé
ici. Nous l'avons résumé. OK. Donc, de cette façon, les gars, nous pouvons utiliser la phase d'étreinte Donc, de cette façon, les gars, nous
pouvons facilement résumer le texte.
13. Texte à texte (traduire) en utilisant Hugging Face: Dans cette leçon, nous
allons comprendre comment effectuer une traduction à
l'aide de Hugging Face Il s'agit de la génération de texte en texte. Voyons voir pour la tâche de traduction, nous utiliserons la bibliothèque Hugging
Phase Transformers. Certains modèles sont déjà
fournis à cet effet. Ainsi, comme nous le savons
tous, la traduction inclut, disons, la traduction de l'
anglais, du texte en espagnol Il s'agit d'une partie des modèles de
texte en texte qui nécessite un préfixe de tâche pour spécifier
le type de tâche, par
exemple, traduction,
synthèse, etc. La génération de texte en texte inclut non seulement la traduction,
mais également la synthèse, la
paraphrase, la réponse aux
questions
et même la classification et même Voyons donc la
différence entre texte à texte et génération de
texte. La génération de texte est donc utilisée pour la génération de
texte autodgressive où le modèle génère texte séquentiellement,
un jeton à la fois,
comme des systèmes de dialogue, des
complétions de texte, La classe de
génération de texte en texte est utilisée pour les
tâches de séquence à séquence dans lesquelles le modèle prend une séquence d'entrée et génère une séquence de sortie, comme la synthèse de texte, la paraphrase et
même la traduction Voyons maintenant un
exemple pour effectuer une
traduction à l' aide de la bibliothèque Hugging
Phase Transformers. Pour cela, on utilisera un modèle
T five underscore Small, qui est accessible au public
lors de la phase Hugging Ce modèle est une version
réduite
du modèle T five et peut être utilisé pour des tâches
telles que le résumé, la traduction et même les réponses
en mode silencieux Voyons l'exemple
sur Google Colab. Voici un Google Colab. Nous venons voir l'exemple de
résumé du texte Maintenant, ouvrons. Maintenant, ouvrons l'exemple de traduction. C'est ici. Nous allons d'abord
installer les bibliothèques requises. C'est ce qui suit
ici. Nous avons utilisé la commande PIP space
install Nous avons déjà vu cette
commande. Ensuite, nous chargerons un modèle de traduction
préformé. C'est ici que nous avons
chargé le modèle T five. Il s'agit d'un modèle de
texte à texte polyvalent. Cela peut gérer
la traduction en préfixant
l'entrée par une invite
spécifique à la tâche Nous chargeons donc
un modèle T five. Ici. Ici, nous avons
préparé le texte d'entrée. Voici donc le texte que
nous allons traduire,
traduire de l'anglais vers l'espagnol. C'est le texte suivant
que nous allons faire traduire. Convertissez le texte saisi en identifiants
d'entrée que le
modèle peut traiter Utilisez le modèle pour générer
le texte traduit. Vous pouvez personnaliser le processus de
génération avec des paramètres tels que la longueur maximale et faisceaux de soulignement que nous avons également vus
dans la leçon précédente Ici, les jetons de sortie
seront décodés en texte, puis nous
imprimerons le texte traduit Voici donc le résultat, le texte
traduit. Je m'appelle Amed Devan
et j'adore le cricket. Le voici donc
traduit en espagnol. Ainsi, les gars, nous
pouvons effectuer la traduction.
14. Répondre aux questions en utilisant Hugging Face: Dans cette leçon, nous
allons comprendre comment utiliser la
phase d'étreinte pour répondre en silence Nous verrons également un
exemple. Commençons. Nous allons donc utiliser la bibliothèque de phase d'
étreinte des
transformateurs pour effectuer la tâche de réponse
Quotien Nous allons exécuter le code
sur Google Colab. Nous allons donc utiliser ici
le modèle suivant, qui est accessible au public
lors de la phase de câlin, nous n'avons
donc pas besoin de créer
un jeton supplémentaire pour cela Voyons l'exemple
sur Google Colab. Nous allons donc ouvrir ici notre code. Tout d'abord, nous allons installer les bibliothèques requises
que nous avons montrées. Nous avons utilisé la même commande d'
installation PIP que celle que nous avons vue auparavant pour installer les bibliothèques
requises Ensuite, nous
chargerons un modèle d'
assurance qualité et un tokenizer pré-entraînés modèle d'
assurance qualité et un tokenizer Voici notre modèle
et le tokenizer. Préparez l'entrée pour la tâche QA. C'est pour la tâche de
réponse au quotien. Nous avons besoin d'un contexte
et d'un quotien. Quel est le contexte actuel ? Il s'agit d'un paragraphe ou d'un texte
dans lequel la réponse peut être trouvée. C'est ce qui suit.
Je fournis également
un contexte, et
voici la citation Il s'agit donc de moi,
et voici
la question à laquelle vous voulez répondre. OK. Nous avons donc dit les deux. Ensuite, nous allons
tokeniser l'entrée, tokeniser le contexte et
quotien à l'aide du
tokenizer contexte et
quotien à l'aide du
tokenizer.
Nous avons fait les deux. Obtenez la prédiction du modèle, transmettez l'entrée tokenisée au modèle pour obtenir la réponse.
C'est ce qui suit. Il extraira également les scores de début
et de fin. Je vais obtenir les
positions de début et de fin les plus
probables ici et il les
utilisera pour reconvertir les identifiants de
jetons en
mots afin que la réponse
soit affichée ici. Les jetons de réponse et de discothèque seront placés ici et ils seront
décodés à nouveau vers Cela aura votre résultat. C'est donc ici que le quotien est basé
sur Amid the Onean. Le contexte était le suivant, et la réponse est Deli Donc, de cette façon, les gars, nous
pouvons répondre facilement.
15. Du texte à l'image à l'aide d'un visage qui embrasse: Dans cette leçon, nous
allons comprendre comment transformer texte en image en
utilisant le visage étreint Laissez-nous comprendre
avec un exemple, nous allons
donc utiliser ici la bibliothèque de diffuseurs Hugging
Face Cet exemple utilisera également le modèle de diffusion
stable, qui est l'un des modèles d'image texte les plus
populaires disponibles dans la bibliothèque de
diffuseurs. Maintenant, qu'est-ce que la
bibliothèque de diffuseurs et la diffusion stable ? La bibliothèque diffusers
est une bibliothèque
Python open source qui se concentre sur les modèles de diffusion
pour générer des images, son et d'autres types de données Il s'agit d'une classe de modèles
génératifs développés
uniquement par Hugging Face Qu'est-ce que la diffusion stable ? Il s'agit d'un modèle de diffusion latente conçu pour la génération
d'images de haute qualité. Vous pouvez donc générer des images
à partir de proms de texte en utilisant cela. C'est également l'un des modèles génératifs
les plus populaires. Voyons l'exemple. Ici, nous utiliserons un
modèle accessible au public sur huggingface Voyons l'exemple et
convertissons le texte en image. Le résultat sera généré sous forme d'image
sur Google Colab lui-même. Alors voyons voir.
Voici notre Google Colab Ouvrons notre bloc-notes
pour convertir le texte en image. C'est ici. Tout d'abord, nous installerons les bibliothèques
requises en utilisant la même
commande pip install dont nous avons déjà parlé Nous allons donc maintenant charger le pipeline de diffusion
stable. La bibliothèque de diffuseurs fournit un
pipeline de diffusion stable qui
facilite la génération d'
images à partir d'instructions textuelles Nous allons charger le modèle de
diffusion stable ici. présent, générez une image
à partir d'une invite de texte, générez
facilement une
image en passant une barre de texte au pipeline.
Voici notre message. Des voitures volantes survolent un paysage urbain
futuriste au coucher du soleil. Ce qui suit va
générer l'image. OK. Voici notre image. Cette image sera enregistrée sur Google Colab uniquement
en utilisant la même méthode, et elle imprimera également l'image
enregistrée sous forme d'image de
soulignement générée au format PNG. Le fichier PNG sera généré, où il sera visible sur
Google Colab, cliquez ici Vous pouvez voir les fichiers. Maintenant, je vais le lancer. Je vais le gérer. Je vais le gérer maintenant. Maintenant, je cours pour générer
une image et l'enregistrer. OK, voici donc notre
image. C'est écrit. Image enregistrée sous forme de point de
soulignement au format PNG généré. OK, donc ça l'a généré. Je vais juste y aller à partir d'ici. Vous pouvez le télécharger. Vous
pouvez également copier le chemin. Je vais cliquer sur Télécharger. Il a été téléchargé. OK, c'est ici. Nous avons donc généré une image
qui est du texte à l'image.
16. Du texte à la vidéo à l'aide d'embrasser des visages: Dans cette leçon, nous
allons comprendre comment transformer du texte
en vidéo à
l'aide d'un visage pressant. C'est ce qu'on appelle
la synthèse texte-vidéo. Nous allons comprendre ce que c'est, et nous allons également
utiliser un exemple. Commençons donc par le texte en vidéo,
qui inclut génération de vidéos à partir de descriptions
textuelles comme la saisie d'un texte et la
génération d'une vidéo Comme nous l'avons vu dans la leçon
précédente, du texte à l'image, nous avons saisi un
texte et généré une image Dans ce cas, nous allons
générer une vidéo. Nous disposons donc de nombreux modèles
et outils
pré-entraînés pour générer des vidéos. Hugging Face propose
les mêmes modèles. La synthèse texte-vidéo
Tom dont je viens de parler inclut la génération
d'une séquence d' images basée sur une description
textuelle Comme il s'agit d'une tâche complexe, elle nécessite de combiner
différents modèles de PNL
avec des modèles génératifs ou
même des modèles de diffusion D'accord, les modèles de diffusion que nous avons
vus dans la leçon précédente sont utilisés pour générer
des images ou des vidéos. Voyons quelques frameworks de
génération vidéo avant de passer
à l'exemple. L'un des plus
populaires est Runway ML. Il propose des outils pour la
génération et le montage de vidéos. Principalement pour les vidéos générées, vous pouvez utiliser les laboratoires PIA. Avec ce percepteur mental profond E/S peuvent également être utilisées pour
gérer des entrées multimodales La saisie multimodale peut inclure
du texte, des images et même des vidéos. Vous devez utiliser la
bibliothèque telle que Pitch ou Tensor Flow
afin de pouvoir créer des pipelines pour générer des images
vidéo Voyons un
exemple. Nous utiliserons donc ici également la
bibliothèque du diffuseur Nous avons déjà parlé
de la bibliothèque de diffuseurs. Il s'agit d'une
bibliothèque open source développée par Hugging Face et utilisée pour générer des images
et même des vidéos Nous utiliserons le modèle de division stable
accessible au public. Dans notre exemple, nous
allons exécuter le code sur Google
Colab comme nous l'avons vu précédemment Commençons.
Voici une collaboration avec Google. Ouvrons notre code, notre
fichier, notre bloc-notes. Nous allons ouvrir notre bloc-notes
pour convertir du texte en vidéo. Je vais taper une vidéo uniquement
pour rechercher. C'est ici. Tout d'abord, nous allons installer. Nous avons donc utilisé ici la commande pip install pour
installer les transformateurs, ainsi que la
bibliothèque de diffuseurs également Ensuite, nous chargerons un texte modèle
d'image,
nous le chargeons donc ici. C'est le modèle dont je vous ai
déjà parlé. Nous avons utilisé la
bibliothèque des diffuseurs pour charger un texte
pré-entraîné modèle
d'image, comme une diffusion
stable Générez d'
abord des cadres à partir du texte, nous avons défini le prom. Ici, nous allons générer des cadres
individuels en
fonction de la description du texte. Voici la description textuelle, un paysage urbain futuriste de
nuit avec Cela générera dix images
à l'aide de la boucle étrangère. En voici dix, et
cela s'ajoutera. Plus tard, nous avons utilisé la bibliothèque OpenCV pour esquisser
les images dans une vidéo Ici, nous utilisons l'OpenCV à l'intérieur de la boucle étrangère
afin de pouvoir l'assembler Nous avons également utilisé
la bibliothèque Numpi. Nous y utilisons le tableau
Numpi. Cela permettra donc d'enregistrer
les cadres sous forme d'images. Cela permettra d'assembler
les images dans les vidéos, et ce qui suit
affichera le résultat, qui rassemble les images à l'
aide de la boucle étrangère Et le résultat
sera affiché ainsi sous forme de cadres. Donc, quand je cours,
il m'affiche dix images parce que nous
générons dix images ici. Et après cela, il affichera la vidéo. Voici donc la sortie, la vidéo
de sortie aura le nom suivant output
underscore video point mp four, mais elle
générera également des images Combien de cadres ? Dix cadres. Le format du cadre sera le suivant :
le cadre
soulignera la valeur de I. Ainsi, les cadres seront comme un cadre de soulignement PNG à
zéro point, cadre souligné d'un point PNG, et cela ira Cela signifie dix images. Et le résultat sera là, je vous l'ai dit. Maintenant, laissez-nous le gérer. R Maintenant, nous allons cliquer ici. Et ici, vous pouvez voir que je
vous ai dit qu'il générera dix images. Frame, soulignez de zéro point png à neuf et la
vidéo de sortie sera disponible. C'était donc le résultat.
Je vais simplement cliquer ici et cliquer sur Télécharger. Téléchargez-le. Cliquez avec le bouton droit de la souris et ouvrez.
Voici notre vidéo. D'accord, vous pouvez voir dix images. Donc, de cette façon, les gars,
nous pouvons générer vidéo à partir d'
un texte avec un visage câlin Merci d'avoir
regardé la vidéo.