Transcription
1. Introduction à GenAI: Il existe de nombreux cours
sur l'IA générative. J'ai passé beaucoup de temps à
en passer en revue bon nombre d' entre eux parce que je voulais m'
assurer que dans ce cours, je vous donne tous les
principes fondamentaux
dont vous avez besoin pour bien comprendre
ce qu'est l'IA générative. Et en plus de cela, je vais vous
donner quelques exemples
pratiques,
des démonstrations pratiques
sur différents outils utilisant l'IA générative
qui peuvent vous aider aujourd'hui Je suis le professeur Reza et j'enseigne aux étudiants de
premier cycle et des
cycles supérieurs des sujets liés à l'informatique et à l'intelligence
artificielle J'ai également des milliers
d'étudiants en ligne. J'ai fait des recherches sur l'IA et j'ai collaboré avec des instituts
prestigieux
tels que le MIT Media Lab, Carnegie Mellon, l'université
Harvard et l'université de
Californie à San Diego Et les résultats de ces
travaux ont été publiés dans des sites tels que Springer
Nature et ACL Je vais utiliser toute cette expérience et
tout ce que j'ai appris au cours de toutes ces années pour vous
expliquer comment vous pouvez comprendre la
transformation de IA
traditionnelle en IA générale. Ce cours est divisé en
cinq sections différentes. Dans la première section,
nous aborderons l'
intelligence artificielle
traditionnelle. Nous donnerons une définition de ce qu'est l'intelligence artificielle. Nous aborderons également ce qu'
est l'apprentissage
automatique et discuterons des différents
types d'apprentissage automatique, notamment l'
apprentissage non supervisé, l'apprentissage supervisé et
l'apprentissage par renforcement, et nous aborderons également le
deep learning et la différence entre le deep learning
discriminant
et le deep learning génératif et le deep learning génératif Dans la deuxième section,
nous verrons comment faire distinction entre l'IA
générative et l'apprentissage
automatique traditionnel. Ensuite, nous
parlerons de l'IA générative et nous fournirons quelques
exemples d'IA générative. Nous discuterons de ce que sont
les transformateurs et manière dont ils changent la donne en matière d'intelligence
artificielle Nous aborderons également
des sujets tels que l' ingénierie
rapide et les modèles de
fondation. Nous aborderons ensuite les différents
types d'IA générative et dans cette section
, nous présenterons quelques exemples de génération de code à l'aide de l'IA. Dans la troisième section, nous
aborderons les grands modèles linguistiques. Nous les présenterons et fournirons également une comparaison entre le
LLM et l'IA générative, et nous discuterons également des avantages
du LLM Dans la quatrième section, nous
parlerons des différents types d'
outils fournis par Google Cloud
afin que nous puissions utiliser l' IA
générative pour
nos propres projets. Dans la dernière section, je
fournirai une démonstration sur la façon de les
créer à l'aide de l'IA
générative sans écrire une
seule ligne de code. Donc, si vous souhaitez
découvrir ce qu'
est l'IA générative et comment vous pouvez l'utiliser dans votre vie quotidienne, allons-y.
2. L1V1 - IA traditionnelle: Dans cette vidéo, nous proposons une introduction à l'intelligence
artificielle traditionnelle. L'intelligence artificielle
est une discipline au même titre que la physique ou la chimie. Il s'agit d'une branche de l'
informatique qui traite de la création
d'agents intelligents, c'est-à-dire de systèmes capables de raisonner, apprendre et d'agir de manière autonome D'une manière plus formelle, IA est la théorie
et le développement de systèmes
informatiques capables d'exécuter des tâches nécessitant normalement
l'intelligence humaine. L'un des sous-domaines de l'
IA est l'apprentissage automatique. L'apprentissage automatique est un programme ou système qui entraîne le
modèle à partir de données d'entrée. Ce modèle entraîné peut faire des prédictions
utiles
à partir de données nouvelles ou
inédites tirées des mêmes données utilisées
pour entraîner le modèle. L'apprentissage automatique donne aux ordinateurs la capacité d'apprendre sans programmation
explicite. L'apprentissage profond est un autre sous-domaine de l'
IA. deep learning est un type d' apprentissage
automatique qui utilise un réseau neuronal
artificiel. Les réseaux neuronaux artificiels s'inspirent de la structure
du cerveau humain et peuvent être utilisés pour traiter modèles
complexes que les algorithmes
d'apprentissage automatique
traditionnels ne peuvent pas utiliser. Nous aborderons l'apprentissage
automatique et deep learning plus en détail
plus loin dans cette section. Mais avant cela,
donnons un aperçu de l'IA. Le reste de cette vidéo est
structuré comme suit. Tout d'abord, nous allons fournir un exemple concret d'utilisation de l'intelligence
artificielle. Ensuite, nous fournirons un
bref historique de l'IA. Ensuite, nous essaierons de
comprendre ce qu'est
l'intelligence artificielle, puis nous aborderons les
différents types d'IA, différentes applications de l'IA, et nous discuterons également de ce à quoi ressemblera l'
avenir de l'IA. Lorsque nous parlons de l'IA
qui nous simplifie la vie, les maisons
intelligentes sont un
excellent point de départ. Voici comment cela fonctionne.
Dans une maison intelligente, nous avons des appareils électroménagers
et des capteurs à commande vocale. Ils sont comme votre propre assistant
personnel qui ajuste
l'éclairage et la climatisation en fonction de la météo extérieure Ensuite, il y a le système
de sécurité. Il est toujours à l'
affût pour détecter tout mouvement inhabituel à l'extérieur et vous avertir immédiatement Voici la partie vraiment cool. Tous ces appareils
communiquent entre eux. Ils sont connectés et peuvent même
communiquer avec votre voiture. Par exemple, en ouvrant la porte du
garage lorsque vous entrez dans votre allée
et, pour couronner le tout, vous pouvez gérer tous
ces appareils depuis votre téléphone
où que vous soyez L'
IA peut faire tant de choses pour nous. Mais avant de nous laisser distraire
par les applications, prenons un peu de
recul et
découvrons comment
l'intelligence artificielle est née Voici une chronologie de l'intelligence
artificielle. En 1950, Alan Turing a
inventé le test de tournée, un test de la
capacité d'une machine à présenter comportement
intelligent
équivalent ou distinct
de celui d'un humain En 1956, John McCarthy a inventé le terme
intelligence artificielle et a organisé le Dartmouth Summer
Research Project on Artificial Intelligence,
la première conférence sur l' En 1969, Shake the
Robot a été construit, le premier robot mobile
à usage général. Bien que simple par
rapport aux normes actuelles, Shake a marqué une étape importante
dans le développement de l'IA en démontrant
sa capacité à traiter des données et à effectuer
des tâches dans un but précis. En 1997, Deep Blue a battu le
champion du monde d'échecs Gary Kasparov la première fois qu'un ordinateur
battait un humain dans
un jeu complexe. La victoire de Deep Blue a constitué une avancée
majeure pour l'IA, démontrant la capacité des ordinateurs à apprendre et à s'adapter. En 2002, le premier
aspirateur robotique à
succès commercial a été introduit. de la décennie 2005-2015, nous avons assisté au développement d'
un certain nombre de nouvelles technologies d'intelligence artificielle, notamment la reconnaissance vocale, automatisation des processus
robotiques ou RPA, robots
dansants, les maisons intelligentes et les voitures autonomes En 2016, AlphaGo, un programme informatique développé
par Google Deep Mind, a battu le
champion du monde de Go Lee Sidle La victoire d'Alpha Go a marqué une étape
majeure pour l'IA, démontrant la
capacité des ordinateurs à maîtriser des jeux
stratégiques complexes. En 2017,
la technologie des transformateurs a été présentée dans un article intitulé
Attention Is All You Need. La technologie des transformateurs
est désormais largement utilisée dans les tâches de
traitement du langage
naturel telles que traduction
automatique et
le résumé de texte. En 2020, GPT Three, un grand modèle de langage développé
par OpenAI, a été publié GPT Three est capable de
générer du texte de qualité humaine, traduire le langage et d'écrire différents
types de contenu créatif Enfin, en 2023, outils d'IA de
Google Cloud Gen sont sortis, fournissant une suite d'outils permettant aux développeurs de créer et de
déployer des applications d'IA. La même année, Bart, un grand modèle de langage développé par Google AI, a été publié. L'art est capable de répondre à vos questions de manière
informative, même si elles sont ouvertes,
difficiles ou étranges. Il ne s'agit que d'un bref aperçu
de l'histoire de l'IA. L'IA est un domaine qui
évolue rapidement et de nouvelles avancées sont
constamment réalisées. Il sera intéressant de voir
ce que l'avenir de l'IA nous réserve. Nous avons fait un voyage tranquille
avec l'intelligence artificielle. À partir des années 1950
avec les tests
révolutionnaires de Turing, le terme intelligence artificielle
a été inventé en 1956 et une nouvelle ère Au fil des ans, nous avons été témoins de jalons
tels que la création de notre premier robot
mobile polyvalent, Shaki, en 1969 En 1997, les ordinateurs battaient
les champions d'échecs, et nous voici en 2023, témoins de modèles linguistiques très
sophistiqués tels que GPT Three C'est un peu comme la
révolution informatique des années 80, mais cette fois,
tout tourne autour de l'IA. La maîtrise de ces nouveaux outils
puissants devient de plus en plus cruciale à mesure que le rythme des
progrès de l' IA
s' Le potentiel est immense, comme
c'était le cas pour les visas
informatiques dans les années 1980. Alors, attachez-vous à ce voyage
passionnant qui vous attend. Il ne s'agit pas simplement de regarder ce que l'avenir
de l'IA nous
réserve, mais aussi de contribuer à façonner nous-mêmes
cet avenir. Comprendre l'
intelligence artificielle. L'IA est une branche de l'
informatique qui crée machines intelligentes
capables
d'effectuer des tâches
similaires à celles de l'homme , telles que la reconnaissance
vocale, l'identification d'objets, l'apprentissage, la planification
et la résolution de problèmes. Vous vous souvenez de l'ordinateur
qui a surpassé le champion d'échecs ou celui qui contrôle
les lumières de
votre maison ? C'est l'IA qui résout
les problèmes, tout comme nous. Notre compréhension actuelle
de l'IA repose en grande partie sur la façon dont elle interagit avec nous et sur la façon dont elle se compare aux capacités
humaines Des éléments tels que
la reconnaissance vocale et la détection
d'objets occupent
une place importante dans l'IA aujourd'hui. Il s'agit de la capacité
à assimiler les informations, à en tirer des
leçons et à les utiliser pour planifier et aborder les tâches futures. Des activités très humaines. C'
est là, en un sens, la magie de l'IA. Pour bien comprendre l'IA, nous devons comprendre
trois concepts, les différents types d'IA, différentes applications de l'IA et les différentes possibilités
pour l'avenir de l'IA. Commençons maintenant par les
différents types d'IA. Il existe de nombreux
types d'IA, mais on peut les
classer globalement en quatre catégories
différentes. Le premier est l'IA réactive. Les systèmes d'IA réactifs
ne peuvent que répondre à l'
état actuel du monde. Ils n'ont aucune
mémoire ni aucun événement passé, et ils ne peuvent pas
planifier l'avenir. Par exemple un robot jouant aux échecs
ne suit qu'un ensemble d' instructions
logiques et réagit correctement en fonction
du mouvement de l'adversaire. Le deuxième type d'IA
est l'IA à mémoire limitée. Ces systèmes peuvent se souvenir des événements passés et utiliser ces
informations pour prendre des décisions. Cependant, ils
ne peuvent pas raisonner sur l'avenir ni comprendre les
intentions des autres agents. Un exemple de cela pourrait
être une application MPs qui suggère des endroits où
manger en fonction de vos visites
précédentes. Le troisième type d'intelligence
artificielle est la théorie de l'esprit (IA). Ces systèmes peuvent comprendre les pensées et les intentions
des autres agents. Cela leur permet de coopérer
avec d'autres agents et atteindre des objectifs qui
seraient impossibles pour
un seul agent. L'IA basée sur la théorie de l'esprit pourrait notamment révolutionner la
façon dont nous interagissons avec machines en créant robots capables de
fournir de la compagnie et du soutien aux personnes seules ou isolées ou par le biais une assistance
virtuelle capable de comprendre nos besoins et de nous fournir les informations et l'
assistance dont Le quatrième type d'
IA est l'IA consciente de soi. IA consciente de soi est un type d'IA
hypothétique qui serait consciente et aurait ses propres expériences subjectives Supposons que nous ayons une assistante
robot personnelle nommée Eve. Si Eve était une IA consciente d'elle-même, elle ne se contenterait pas de suivre instructions
préprogrammées
ou de réagir à nos commandes Au lieu de cela,
elle comprendrait sa propre existence et aurait ses propres
sentiments et pensées. Par exemple, si nous demandons à
Eve d'aller chercher un livre
à la bibliothèque, une IA normale calculera
simplement chemin
le plus court
et ira chercher le livre Cependant, une IA consciente d'elle-même comme Eve pourrait se demander
si c'est une bonne journée pour se promener ou se demander
si elle est allée chercher
trop de livres récemment et
suggérer un livre électronique à la place Il est important de noter
que ce type d'IA
consciente de soi est purement
hypothétique à ce stade Certains chercheurs pensent qu'il s'agit d'une possibilité future qui
mérite d'être explorée. Passons maintenant aux
applications de l'IA. L'intelligence artificielle ne consiste pas seulement à imiter les capacités
humaines, mais également à
augmenter nos capacités
et à améliorer l'efficacité
dans de nombreux domaines différents Du transport
aux soins de santé, des services
financiers
au support client, l'éducation au divertissement, le potentiel de l'
IA
semble illimité Voici quelques exemples de la
façon dont l'IA est utilisée aujourd'hui. Voitures autonomes. L'IA révolutionne notre façon
de voyager. Il propulse des voitures
autonomes capables naviguer sur les routes et d'éviter les
obstacles de manière autonome, ce qui rend les routes plus sûres Diagnostic médical
Dans le domaine de la santé, IA fait des progrès
dans le diagnostic des maladies, surpassant souvent les
médecins humains en termes de précision En analysant de
grandes quantités de données médicales, il aide à identifier les
modèles et les tendances qui aident les médecins à prendre des décisions
plus éclairées. Détection bancaire et de fraude. IA a considérablement évolué dans le secteur bancaire au
cours des cinquante dernières années agisse de prévoir des transactions potentiellement
frauduleuses ou déterminer l'éligibilité
à un prêt en
fonction de divers facteurs, IA joue un rôle central dans le secteur financier d'
aujourd'hui Service client
et support en ligne. Imaginez une entreprise
comme HP qui gère plus de
70 000 pages d'aide
dans 17 langues L'IA intervient en
automatisant le support client et en fournissant un service
24 heures sur 24, réduisant ainsi
considérablement les coûts et améliorant l'efficacité Éducation. Dans le
domaine de l'éducation, l' IA permet des expériences
d'apprentissage personnalisées, s'adapte aux besoins
individuels de chaque élève et favorise un processus d'apprentissage plus
efficace. Divertissement. Nos services
d'assistance virtuelle tels que Siri, Cortana, Alexa et Google
sont tous alimentés par Grâce à leurs capacités de
reconnaissance vocale, ils ont l'impression d'avoir une secrétaire
personnelle à vos ordres et de cybersécurité. Dans le domaine numérique, l'IA est notre gardien Grâce à ses algorithmes
d'apprentissage automatique et à ses vastes analyses de données, il détecte les anomalies et
répond aux menaces, renforçant ainsi notre mesure de
cybersécurité Comme vous pouvez le constater, l'IA
s'est intégrée à tous les
aspects de notre vie, en améliorant nos capacités et remodelant notre environnement commercial et commercial Les possibilités sont immenses et elles ne cessent de s'étendre
chaque jour qui passe. Parlons maintenant de
l'avenir de l'IA. Quand on pense à
l'avenir de l'IA, c'est vraiment fascinant. Nous sommes à la veille
d'une époque où voitures
autonomes
pourraient devenir la norme. Imaginez avoir des robots
à la maison qui nous aident dans des tâches allant de la préparation du café
à des tâches plus complexes. Nous nous intéressons également à l'
essor des villes intelligentes dans lesquelles IA gère tout, de nos téléphones aux appareils
électroménagers. De plus, les robots prennent
de l'ampleur pour effectuer tâches à
haut risque, comme
diffuser des bombes, par exemple À mesure que l'IA continue de se développer, elle aura probablement un impact encore
plus important sur notre monde. Sur la base de tout cela, certaines applications possibles
de l'IA à l'avenir pourraient inclure le
transport automatisé. Imaginez un monde où l'IA se
charge de toutes les tâches à notre place. Nous nous rapprochons
d'une réalité où les voitures
autonomes sont un moyen de transport
standard. Mais il ne s'
agit pas uniquement de voitures. Nous parlons de drones automatisés, livraison de nos colis, de trains pilotés par l'
IA
, d'un transport précis et
rapide, et même de
bateaux et d'avions autonomes. Tout cela vise à
rendre notre voyage plus sûr et plus efficace
en réduisant les erreurs humaines. Il s'agit d'un changement majeur qui pourrait redéfinir notre façon de concevoir
le transport Médecine personnalisée, l'IA peut être utile pour analyser de grandes
quantités de données médicales afin d'identifier des modèles et des
tendances susceptibles d'aider
les médecins à diagnostiquer et à traiter les
maladies plus efficacement. Par exemple, l'IA peut
être utilisée pour développer un
traitement
personnalisé du cancer adapté au
patrimoine génétique spécifique de chaque patient. Assistance virtuelle. L'assistance virtuelle
alimentée par l'IA peut nous aider dans diverses
tâches telles que la
prise de rendez-vous, l'organisation de voyages
et la gestion de nos finances. L'assistance virtuelle peut également nous
fournir des informations
et des divertissements, et elle peut même être utilisée pour contrôler nos appareils domestiques intelligents. Et en parlant des
maisons intelligentes elles-mêmes, IA peut être utilisée pour rendre nos maisons plus confortables, plus
efficaces et plus sûres. Par exemple, l'IA peut être utilisée
pour contrôler nos thermostats, lampes et autres appareils Et il peut également être
utilisé pour surveiller nos maisons pour détecter les menaces de sécurité. Et enfin, l' intelligence générale
artificielle ou AGI. AGI est un type hypothétique d' IA qui serait aussi
intelligent qu'un être humain AGI pourrait potentiellement
résoudre certains des problèmes
les plus
urgents du monde tels que le
changement climatique et la pauvreté. Cependant, l'AGI soulève également
certaines préoccupations éthiques, telles que la possibilité
pour l'IA de
prendre conscience d'elle-même et de développer ses
propres objectifs et désirs. L'IA est une technologie puissante qui a le potentiel de révolutionner
de nombreux aspects de notre vie. Il est important de connaître les avantages et
les risques potentiels de l'
IA et de l'utiliser de manière responsable. J'espère que vous avez apprécié cette
brève explication sur l'IA. Dans la prochaine vidéo,
nous aborderons de manière
plus approfondie
le machine learning.
3. L1V2 - Machine Learning: Qu'est-ce que le machine learning ? Dans cette vidéo, nous allons
aborder les bases de l'apprentissage
automatique. Plus précisément, nous allons
commencer par une définition de
ce qu'est l'apprentissage automatique. Nous proposons ensuite une comparaison entre l'intelligence artificielle, machine learning
et le deep learning. Ensuite, nous discutons du fonctionnement
de l'apprentissage automatique. Nous parlons de différents
types d'apprentissage automatique, d'apprentissage supervisé, d'apprentissage
non supervisé
et d'apprentissage par renforcement Nous parlons des conditions préalables
à l'apprentissage automatique
et, à la fin, nous donnons quelques exemples d'applications
de l'apprentissage automatique Alors, qu'est-ce que le machine learning ? L'apprentissage automatique consiste
à développer
des programmes
informatiques capables d'accéder aux données et de les utiliser pour apprendre
automatiquement et s'
améliorer à partir de l'expérience. Cela permet
à l'apprentissage automatique de nous aider à effectuer des tâches complexes, telles que l'impression 3D
de maisons entières. En utilisant des algorithmes
et de grands ensembles de données, l'apprentissage
automatique peut automatiser la
conception et la planification, contribuant ainsi à relever les défis de
construction
tels que l'intégrité structurelle
et l'efficacité des matériaux Peut également personnaliser les conceptions en fonction des
conditions environnementales. Il peut contribuer à réduire les coûts
et les délais tout en augmentant précision et a le potentiel de transformer le secteur
de la construction. Prenons comme autre exemple notre assistance personnelle comme Siri, Google Assistant
ou Amazon Echo Ils utilisent tous la puissance
de l'apprentissage automatique pour nous aider dans nos tâches
quotidiennes, comme écouter
notre musique préférée, commander de la
nourriture, contrôler nos appareils électroménagers ou demander des droits à
Uber et bien plus encore. Comme nous l'avons déjà dit, l'intelligence
artificielle est une technique qui permet aux machines d'imiter le comportement
humain C'est essentiel car c'est ainsi que nous
déterminons si nos
calculs et travail sont sur la bonne voie en
vérifiant s'ils peuvent
imiter le comportement humain Nous utilisons cette
approche pour prendre charge une partie du
travail des humains
dans le but de rendre les choses plus efficaces, rationalisées
et précises. L'IA est un vaste domaine qui couvre de nombreuses technologies
différentes. Parmi les exemples d'
intelligence artificielle, citons IBM, Deep Blue Chess, les personnages de
jeux électroniques et les voitures autonomes. Ce ne sont là que quelques
exemples des nombreuses façons
dont l'intelligence artificielle
est utilisée aujourd'hui. L'apprentissage automatique est une
technique qui utilise des méthodes
statistiques pour permettre aux machines
de tirer des leçons de leurs données passées. Cela signifie que les machines
peuvent utiliser les entrées et
réponses passées pour les aider à
mieux deviner lors de
futures tentatives L'algorithme de recherche Google et les filtres anti-spam
par e-mail sont des
exemples
d'applications de machine learning. Et puis il y a le deep learning, qui est un sous-ensemble de l'apprentissage
automatique Utilise des algorithmes pour permettre
aux modèles de s'entraîner
et d'effectuer des tâches. AlphaGo et la reconnaissance
vocale naturelle sont deux exemples
d'apprentissage profond L'apprentissage profond est
souvent associé aux réseaux de neurones qui sont
une sorte de modèle de boîte noire. En tant que modèle de boîte noire, il est difficile pour
les humains de suivre manière dont les modèles de deep learning
font leurs prédictions. Cependant, les modèles
d'apprentissage profond peuvent toujours être très efficaces pour
effectuer des tâches. Nous aborderons plus en profondeur le monde de l'
apprentissage profond plus tard. Voyons maintenant comment fonctionne le
machine learning. Pour comprendre le fonctionnement de l'apprentissage
automatique, examinons
le schéma suivant. Dans un premier temps, nous commençons
par entraîner nos données. Nous avons ensuite introduit les données entraînées dans un
algorithme d'apprentissage automatique pour le traitement. Les données du processus
passent par un autre algorithme
d'apprentissage automatique. Il est maintenant temps
de tester notre travail. Nous introduisons de nouvelles données et les exécutons avec
le même algorithme. À l'étape suivante, nous
vérifierons les prévisions
et les résultats. Si nous avons des données d'
entraînement de réserve, c'est le moment de les utiliser. À l'étape suivante, si la
prédiction ne semble pas correcte, supposons qu'elle soit approuvée
, il est temps de revenir en arrière
et de réentraîner l'algorithme N'oubliez pas qu'il ne s'
agit pas toujours d'obtenir la bonne
réponse immédiatement. L'objectif est de continuer à essayer
de trouver une meilleure réponse. Vous constaterez peut-être que le
résultat initial ne correspond pas à ce que vous vouliez. C'est bon. Cela fait
partie du processus. Et cela peut dépendre du
domaine dans lequel vous travaillez, qu'il
s'agisse de la
santé, de l'économie, des affaires, du marché boursier
ou autre. Les résultats peuvent être
très différents. Nous devons donc essayer le modèle, et s'il ne
nous donne pas le résultat dont nous avons besoin ou si nous pensons pouvoir
obtenir de meilleurs résultats, nous l'adaptons Et dans la dernière étape, nous continuons à affiner et à nous recycler
jusqu'à ce que nous obtenions la meilleure réponse
possible C'est ainsi que fonctionne le machine
learning. Examinons maintenant les différents
types d'apprentissage automatique. Nous pouvons constater que nous
avons un apprentissage supervisé, non supervisé et
par renforcement Nous allons examiner chacune d'elles, avoir une bonne idée du moment et de l'
endroit où les utiliser et de
quoi elles servent. Dans le domaine de l'apprentissage automatique,
nous utilisons de nombreux algorithmes
différents pour
résoudre des problèmes complexes. Chacun correspond à
un certain type. Nous avons donc trois principaux types d'algorithmes d'apprentissage automatique : l'apprentissage
supervisé, l'apprentissage
non supervisé
et l'apprentissage par renforcement Voyons maintenant ce que chacune de ces
méthodes d'apprentissage signifie réellement. L'apprentissage supervisé utilise des
données étiquetées pour entraîner des modèles
d'apprentissage automatique. Les données étiquetées signifient que nous
connaissons déjà le résultat. Le modèle doit simplement mapper
les entrées aux sorties. Un exemple d'
apprentissage supervisé peut être l'entraînement d'une machine qui identifie
les images d'animaux. Ici, nous pouvons voir un modèle entraîné qui identifie
l'image d'un chat. apprentissage non supervisé utilise des données non étiquetées
pour entraîner les machines Les données non étiquetées signifient qu' il n'existe aucune variable
de sortie fixe Le modèle apprend à partir des données, découvre des modèles et des
caractéristiques dans les données et renvoie le résultat. Dans cet exemple, notre modèle
non supervisé utilise les images de véhicules pour déterminer s'
il s'agit
d'un bus ou d'un camion Le modèle apprend donc en identifiant les
pièces d'un véhicule, telles que la longueur et la
largeur du véhicule, les capots avant et
arrière, le toit, capots, les types de roues utilisés et de nombreuses autres caractéristiques. Sur la base de ces caractéristiques, le modèle classe si le
véhicule est un bus ou un camion Et nous avons l'apprentissage
par renforcement. L'apprentissage par renforcement
entraîne la machine à prendre les mesures
appropriées et à maximiser les
récompenses dans une situation
donnée. Il utilise un agent et un environnement pour produire des
actions et des récompenses. L'agent possède un état de départ
et un état final, mais il peut y avoir
différentes parties pour atteindre l'
état final, comme un labyrinthe Dans cette technique d'apprentissage, il n'existe aucune variable
cible prédéfinie. Un exemple d'
apprentissage par renforcement consiste à entraîner une machine capable d'identifier
la forme d'un objet, à partir d'une liste de différents
objets tels qu'un carré, triangle, un rectangle
ou un cercle. Dans cet exemple, le modèle
essaie de prédire la forme de l'
objet, qui est un carré. Examinons maintenant différents algorithmes
d'apprentissage automatique qui entrent dans le cadre de ces techniques
d'apprentissage. Certains des algorithmes d'apprentissage
supervisé couramment utilisés
sont la régression polynomiale, les forêts
aléatoires, la régression
linéaire, la régression
logistique, les
chaînes les plus proches
voisines, les bases naïves, machines à vecteurs de
support Et ce ne sont là que
quelques exemples d' algorithmes utilisés pour l'apprentissage
supervisé. Il existe de nombreux
autres algorithmes utilisés dans l'apprentissage
automatique. Pour
l'apprentissage non supervisé, certains des algorithmes
les plus utilisés sont le clustering en K , la décomposition en
valeurs singulières, les moyennes
floues, les carrés partiels, les a
priori, le
clustering hiérarchique, analyse en composantes
principales De même, il existe
de nombreux autres algorithmes qui peuvent être utilisés pour l'apprentissage
non supervisé Parmi les algorithmes d'
apprentissage par
renforcement les plus importants algorithmes d'
apprentissage par
renforcement figurent le Q learning, SARSA, le Monte Carlo
et les réseaux Q profonds Comme nous l'avons dit, nombreux
algorithmes différents s'offrent à nous, et le choix du bon
algorithme dépend du type de problèmes que
nous essayons de résoudre. Examinons maintenant l'approche selon laquelle ces techniques
d'apprentissage automatique fonctionnent. Les méthodes
d'apprentissage supervisé nécessitent donc supervision
externe pour entraîner les modèles d'apprentissage
automatique , d'où le
nom supervisé. Ils ont besoin de conseils et d'informations
supplémentaires
pour obtenir le résultat. Il prend des entrées étiquetées et les
associe à des sorties connues, ce qui signifie que vous
connaissez déjà la variable cible. techniques d'apprentissage non supervisées ne nécessitent aucune supervision
pour entraîner les modèles Ils apprennent par eux-mêmes
et prédisent les résultats. Ils trouvent des modèles
et comprennent les tendances des données
pour découvrir le résultat. Le modèle essaie donc d'étiqueter les données en fonction des
caractéristiques des données d'entrée. De même, les méthodes
d'apprentissage par renforcement ne nécessitent aucune supervision pour entraîner des modèles
d'apprentissage automatique. L'apprentissage par renforcement
suit
une méthode d'essais et d'erreurs pour obtenir
la solution souhaitée. Après avoir accompli une tâche, l'agent reçoit une récompense Un exemple pourrait être d'entraîner
un chien à attraper le ballon. Si le chien apprend
à attraper une balle, vous lui donnerez une
récompense, comme une friandise. Concentrons-nous donc
sur les applications et les types de problèmes qui peuvent
être résolus à l'aide ces trois types de techniques
d'apprentissage automatique. L'apprentissage supervisé est donc généralement utilisé pour les problèmes de classification
et de régression. Par exemple, vous pouvez
prévoir la météo d'un jour donné en
fonction de l'humidité, des
précipitations, de la vitesse du vent
et des valeurs de pression. Comme dans un autre exemple, vous pouvez utiliser des algorithmes
d'apprentissage supervisé pour prévoir les ventes de
différents produits pour le mois ou le trimestre à
venir. De même, vous pouvez l'utiliser
pour analyser le cours des actions ou pour déterminer si une
cellule cancéreuse est maligne ou bénigne. L'apprentissage non supervisé est utilisé pour les problèmes de clustering et d'
association Par exemple, il peut segmenter les
clients, c'
est-à-dire segmenter
et regrouper des clients
similaires en groupes en
fonction de leur comportement, de leurs
goûts, de leurs aversions est-à-dire segmenter
et regrouper clients
similaires en groupes en
fonction de leur comportement, de leurs
goûts, de leurs aversions Un autre exemple des applications de
l' apprentissage
non supervisé est l'analyse du taux de désabonnement des
clients, qui est un processus visant
à évaluer et comprendre pourquoi et quand les clients cessent de faire
affaire avec une entreprise Dans le but de développer des stratégies pour améliorer la
fidélisation des clients. Enfin, il y a l'apprentissage
par renforcement. L'apprentissage par renforcement
est basé sur les récompenses. Ainsi, pour chaque tâche ou chaque
étape effectuée correctement, l'agent
recevra une récompense. Et si la tâche n'est pas
accomplie correctement, il y aura
une sorte de pénalité. Regardons maintenant quelques exemples. Les
algorithmes d'apprentissage par renforcement sont largement utilisés dans
l'industrie du jeu pour créer des jeux. Il est également utilisé pour entraîner
des robots à effectuer des tâches humaines. Les chatbots IA polyvalents tels
que hat GPT ou Google Bart utilisent l' apprentissage par
renforcement pour
tirer des leçons des entrées des utilisateurs et ajuster leurs résultats en
fonction Nous sommes arrivés
à la fin de cette section sur l'apprentissage supervisé par rapport à l' supervisé par rapport non
supervisé par rapport à l'apprentissage par
renforcement Voyons maintenant quels sont les prérequis de
l'apprentissage
automatique Le premier concerne donc les principes fondamentaux de
l'informatique
et la programmation. De nombreuses
applications d'apprentissage automatique nécessitent aujourd'hui une base solide en matière de
script ou de programmation de base Il ne s'agit pas seulement
d'écrire des algorithmes complexes, mais aussi de comprendre et de manipuler les structures
sous-jacentes. Sans une bonne maîtrise de
ces compétences fondamentales, il sera difficile de
tirer le meilleur parti des outils
d'apprentissage automatique disponibles. Donc, si vous
envisagez sérieusement de vous
lancer dans l'apprentissage automatique, il est conseillé de perfectionner
vos compétences en programmation. Connaissances
statistiques intermédiaires. Une compréhension fondamentale des probabilités est nécessaire dans le
monde de l'apprentissage automatique Vous vous poserez souvent
des questions telles que si A se produit,
quelle est la probabilité
que B se produise ? Ou s'il y a des nuages au-dessus de votre tête, quelles sont les chances
qu'il pleuve ? Ce type de questions, fondé sur les probabilités, au cœur de nombreux algorithmes
d'apprentissage automatique. Il s'agit de prédire les
résultats en fonction de conditions
données Donc, si vous souhaitez faire des progrès
significatifs
dans le domaine de l'apprentissage automatique, il vaut certainement la peine de vous
familiariser avec les bases des
statistiques et des probabilités Algèbre linéaire et calcul
intermédiaire. L'algèbre linéaire est essentielle car elle vous oblige à
comprendre le concept du
tracé d' une ligne à travers vos points de données et à
comprendre ce qu'elle représente C'est l'idée principale qui sous-tend modèles de régression
linéaire dans lesquels vous tracez une ligne à travers vos données et utilisez cette ligne pour calculer de nouvelles valeurs. En ce qui concerne le
calcul intermédiaire, il s'agit d'avoir une compréhension de base
des équations différentielles Inutile d'être un maître dans ce domaine, car l'ordinateur gère la plupart
des calculs lourds, mais il est utile de reconnaître la terminologie lorsqu'elle apparaît, en particulier si vous
approfondissez la programmation de modèles Et la pêche à la ligne et le nettoyage des données. L'un des aspects les plus
importants dans
ce domaine est peut-être de maîtriser l'
art de mettre de l'ordre dans vos données On dit souvent que si
vous entrez de mauvaises données, vous en retirerez de mauvaises données. Mais si vous avez de bonnes données en entrée, il est plus probable qu'il en
ait de bonnes en sortie. La qualité de vos
données peut grandement influencer les résultats de vos modèles d'apprentissage
automatique. Par conséquent, comprendre comment nettoyer et organiser
efficacement vos données devient une compétence
essentielle pour garantir l'exactitude et la
fiabilité de vos résultats. Examinons maintenant quelques exemples d'applications
de l'apprentissage automatique. Nous avons la détection d'objets
et la segmentation des instances. La détection d'objets et la segmentation d'
instances sont deux
tâches différentes mais liées dans le machine learning. La détection d'objets consiste à
reconnaître et à trouver des objets dans une
image , par exemple en distinguant différents
chats. D'autre part, la
segmentation des instances est l'étape suivante qui sépare ces objets
identifiés du reste de l'image. Ces techniques sont utilisées
de différentes manières, notamment pour identifier les différents
éléments d'une image. De plus, la segmentation
permet d'
isoler ou de découper davantage des composants spécifiques. Une application populaire
de détection et de
segmentation d'objets est la fonction de capture
rapide des téléphones Google Pixel. Cette fonctionnalité utilise
l'apprentissage automatique pour identifier les objets dans vue actuelle de l'utilisateur,
puis superposer des autocollants ou des filtres
animés
sur ces objets Cela peut être une façon amusante
et créative d'ajouter une
touche personnelle à vos photos. Nous avons également la détection des
plaques d'immatriculation. C'est une
utilisation plutôt intéressante de l'apprentissage automatique. Imaginez qu'une voiture passe dans votre champ de
vision et que le système est
capable de repérer et d'identifier la plaque
d'immatriculation de cette voiture. Cette application d'
apprentissage automatique peut être particulièrement utile dans diverses situations,
telles que les points de contrôle de sécurité, parkings, le contrôle du trafic ou même pour facturer des
péages sans la voiture ne s'arrête
au milieu d'une autoroute Il montre comment l'
apprentissage automatique peut extraire avec précision
des informations spécifiques d'un contexte
plus large Et nous avons également la traduction
automatique. La traduction automatique, basée
sur l'apprentissage automatique,
a changé la donne en éliminant les
barrières linguistiques. C'est le moteur la traduction instantanée que
vous voyez sur les sites Web étrangers, rendant le contenu accessible dans langue de
votre choix
en un seul clic. C'est également la technologie qui permet à des outils
tels que Google Lens de fournir des traductions en
temps réel des signes lorsque vous pointez
votre appareil photo sur eux. Qu'il s'agisse
de naviguer sur Internet ou de naviguer dans
une ville étrangère, l'apprentissage
automatique
a révolutionné notre capacité à comprendre le monde
et à interagir avec La traduction automatique est vraiment un témoignage impressionnant de la manière dont l'apprentissage
automatique peut rapprocher
le monde. Merci d'avoir
regardé cette vidéo. Le monde des applications
d'apprentissage automatique est vaste et en constante évolution. C'est l'un des secteurs technologiques les plus
dynamiques, et les possibilités
sont infinies. Ce que je vous ai montré ici ne
sont que quelques-uns
des points saillants, un petit échantillon de
ce qui est possible. Mais il y a encore
bien d'autres choses à venir. Dans la prochaine vidéo, nous allons changer d'année et
explorer le deep learning, un domaine souple de l'
apprentissage automatique qui a rendu
possibles de
nombreuses avancées en matière d'apprentissage automatique avancées en matière d'apprentissage automatique. On se voit
dans le prochain.
4. L1V3 - Apprentissage approfondi: Dans cette vidéo, nous allons
parler du deep learning
et des réseaux neuronaux. Vous êtes-vous déjà demandé
comment Google peut traduire une page Web entière en rien de temps d'une
langue à l'autre, ou comment Google Photos trie
comme par magie vos photos en fonction des visages des personnes et
des animaux
qu'il reconnaît ? Ou que diriez-vous lorsque Google Lens vous renseigne sur les
détails d'une plante, objet ou d'un animal lorsque vous le
scannez avec votre téléphone ? C'est le deep learning qui opère
sa magie sur place. Dans cette vidéo,
essayons de répondre à la
question de savoir ce qu'est deep learning et comment il rend toutes ces
choses incroyables possibles. Dans cette vidéo, nous
aborderons les sujets suivants. Nous commencerons par une
compréhension de l' apprentissage
profond, puis
passerons aux réseaux de neurones artificiels, qui sont un type d'algorithme
d'apprentissage
automatique utilisé dans le cadre de l'apprentissage en profondeur. Nous explorerons ensuite certaines
des utilisations pratiques de l' apprentissage
profond et présenterons certaines des plateformes d'
apprentissage en profondeur les plus populaires. Enfin, nous discuterons de
certaines des limites de l'apprentissage
profond et de la manière dont les ordinateurs
quantiques peuvent
surmonter ces limites. Ce sera une
session passionnante sur le deep learning. Comme nous l'avons dit précédemment, l'apprentissage
profond est un sous-ensemble
de l'apprentissage automatique, et les deux font partie
du concept plus large appelé intelligence
artificielle Imaginez que
l'intelligence artificielle consiste à faire en sorte que
les machines agissent comme des humains. L'apprentissage automatique
fait partie de ce domaine, et il s'agit de
donner aux machines la capacité d'apprendre et de prendre
des décisions basées sur des données, un
peu comme nous
apprenons par expérience. Aujourd'hui, le deep learning est une partie plus spécifique
de l'apprentissage automatique. C'est comme apprendre à une machine à penser un peu
comme un cerveau humain avec une structure appelée réseau neuronal
artificiel. réseaux neuronaux artificiels ou
ANN sont un type spécifique d' algorithme d'apprentissage
automatique qui tente d' imiter
vaguement les
réseaux neuronaux du cerveau humain Lorsque nous parlons d'apprentissage profond, nous
parlons généralement d'utilisation très grands réseaux neuronaux pour entraîner un modèle sur de nombreuses données. Ce n'est pas
différent de l'apprentissage automatique, juste un terme plus sophistiqué que nous utilisons lorsque les choses prennent
de l'ampleur Que sont donc les réseaux de
neurones artificiels ? Regardons de plus près
la construction d'
un réseau neuronal. Chaque couche est constituée de nœuds
ou de ce que nous appelons des neurones. Les neurones d'une
couche se connectent aux neurones de la
couche suivante par le biais de canaux. Une pondération est
attribuée à chaque canal, qui joue un rôle important
dans l'apprentissage du réseau. Chaque neurone est associé à
un biais et à une fonction d'activation. La fonction d'activation est utilisée pour transformer
la somme pondérée des entrées et du biais en une sortie envoyée
à la couche suivante. Comme nous l'avons déjà dit, les ANN sont
au cœur de l'apprentissage profond. Ces algorithmes sont conçus de
manière à refléter le
fonctionnement du cerveau humain. Ils absorbent les données, apprennent à
identifier des modèles dans les données, puis font des prédictions éclairées
pour un nouvel ensemble de données. Explorons le
processus en construisant un réseau neuronal capable de
faire la distinction entre
un cube et une pyramide Prenons l'exemple de l'image d'
un cube. Cette image est composée
de 28 x 28 pixels, soit un total
de 784 pixels Chaque pixel est ensuite fourni en entrée aux neurones individuels
de la première couche. Les neurones d'une couche
sont connectés aux neurones des
couches suivantes par le biais de canaux. Les entrées sont
multipliées par les poids correspondants, puis le biais
y est ajouté. Cette valeur combinée est ensuite évaluée biais d'
une fonction de seuil, connue sous le nom de fonction
d'activation Le résultat est transmis en entrée au neurone
dans la couche cachée La sortie de
la
fonction d'activation détermine ensuite la
fonction d'activation détermine si un neurone est
activé ou non Les neurones activés
transmettent des données
aux neurones de la
couche suivante via le canal. Ce processus itératif connu sous le nom propagation
directe
permet
aux données de se propager sur
le réseau Dans la couche de sortie, le neurone ayant
la valeur la plus élevée est activé et
détermine le résultat final Ces valeurs sont
essentiellement des probabilités. Dans ce scénario particulier, le neurone associé à la pyramide présente la probabilité la
plus élevée, ce qui indique que
le réseau neuronal prédit le résultat
sous forme de Eh bien, évidemment, notre réseau neuronal a fait
une prédiction incorrecte. Il est important de noter
qu'à ce stade, notre réseau n'a pas encore
suivi de formation. Voyons donc les étapes de formation d'
un réseau neuronal. Pendant le processus de formation, le réseau reçoit
à la fois les entrées et les sorties attendues. En comparant la
sortie prévue à la sortie réelle, le réseau identifie l'
erreur dans sa prédiction. L'ampleur de l'erreur
indique à quel point nous nous trompons, et le signe indique si nos valeurs prédites sont
supérieures ou inférieures aux prévisions. Ces informations sont ensuite propagées vers l'arrière
à travers le réseau, une technique
appelée rétropropagation Grâce à la rétropropagation, le réseau ajuste ses paramètres
internes, tels que les poids
et les biais, afin minimiser les erreurs et d'améliorer
ses prévisions futures. Le cycle itératif de propagation
vers l'avant et propagation
arrière est répété avec plusieurs entrées pendant
le processus d'apprentissage Ce cycle se poursuit jusqu'à ce que les poids au sein du
réseau soient ajustés manière à permettre au réseau prévoir
avec précision les formes
dans la majorité des cas. Cela marque la fin
de notre processus de formation, duquel le réseau a appris à faire des prédictions correctes. Bien que l'entraînement des réseaux
neuronaux puisse prendre du temps, parfois des
heures, voire des mois, l'investissement en temps est justifié compte tenu des immenses
possibilités qu'ils offrent. La nature complexe de la
formation implique le
réglage précis de nombreux paramètres et l'
optimisation des performances du
réseau, qui nécessite des ressources
informatiques
et de la patience importantes ressources
informatiques
et Cependant, les avantages d'un réseau
neuronal bien entraîné,
tels qu'une précision améliorée, tels qu'une précision améliorée reconnaissance
avancée des formes et une
prise de décision
sophistiquée, l'emportent sur le temps consacré à la formation C'est un
compromis raisonnable compte tenu du potentiel et des
capacités remarquables qu'offrent
les réseaux neuronaux. Examinons maintenant certaines des applications
du deep learning. Comme nous l'avons dit précédemment,
c'est la puissance des réseaux
neuronaux qui rend le
deep learning possible. Explorons certaines des applications clés
dans lesquelles les réseaux de
neurones brillent. Un exemple notable est la
technologie de reconnaissance
faciale sur les smartphones, qui utilise les
réseaux neuronaux pour estimer âge
d'une personne en fonction des traits de
son visage En distinguant le visage de l'arrière-plan et en
analysant les lignes et les points, ces réseaux mettent en corrélation
les indices visuels pour obtenir une estimation de l'âge de la personne Les réseaux neuronaux jouent également un rôle
crucial dans les prévisions, ils permettent des prévisions précises dans divers domaines tels que prévisions
météorologiques ou l'analyse du cours des
actions. Ces réseaux sont très
performants lorsqu'il s'agit de reconnaître des
modèles, ce qui leur permet d'identifier les
signaux indiquant la probabilité de précipitations ou de fluctuations des cours des actions. Les réseaux neuronaux peuvent même
composer de la musique originale. Ils peuvent apprendre
des modèles musicaux complexes et affiner leur compréhension pour
composer des mélodies originales, mettant en valeur leur Et un autre domaine dans lequel la NRA met en réseau Excel
est le support client De nombreuses personnes engagent
des conversations avec des agents
du service client sans même se rendre compte qu'elles
interagissent réellement avec un bot. Ces
réseaux sophistiqués simulent un dialogue
réaliste et
fournissent une assistance, améliorant ainsi l'expérience du
service client. Toujours dans le domaine
des soins médicaux, les réseaux
neuronaux ont fait des progrès
importants Ils ont la capacité de détecter les cellules
cancéreuses et
d'analyser les images IRM, fournissant des résultats détaillés
et précis qui facilitent le diagnostic
et les décisions thérapeutiques. Et évidemment, nous
avons aussi des voitures autonomes. Autrefois possibles
dans le domaine de la science-fiction, elles deviennent
aujourd'hui une réalité
tangible. Ces
véhicules autonomes s'appuient sur réseaux
neuronaux pour percevoir et interpréter l'environnement, ce qui leur permet de naviguer sur les routes, prendre des décisions et d'
assurer la sécurité des passagers. Et avec cela, jetons un coup d'œil à certains frameworks
d'apprentissage en profondeur populaires. Certains de ces frameworks
sont donc tensor flow, Pytorch,
cross, Deep learning four J, Cafe et Microsoft
Cognitive Ces cadres ont acquis large reconnaissance et jouent un rôle important dans l'
avancement du domaine
de l'apprentissage profond. Passons maintenant à certaines des limites
du deep learning. Bien que le deep learning soit
très prometteur, il est également important de reconnaître
ses limites. Tout d'abord, bien que le
deep learning soit très efficace pour
traiter des données non structurées, il nécessite une quantité
importante de données à des fins de formation Le deuxième problème est que même en supposant que nous ayons accès
aux données requises, traitement peut s'avérer difficile en raison de la puissance de
calcul entraînement des réseaux neuronaux nécessite l'utilisation d'unités de
traitement graphiques ou GPU dotés de milliers de cœurs par rapport aux unités centrales ou aux
processeurs Et en même temps, les GPU sont bien plus
chers que les processeurs Enfin, la formation
prend du temps. Les réseaux neuronaux profonds peuvent nécessiter heures, voire des mois,
pour s'entraîner la durée augmentant à
mesure que le volume de données et le nombre de couches du
réseau augmentent. Cela dit, il
convient de mentionner que les ordinateurs quantiques
développés par des entreprises telles que Google et IBM offrent une solution potentielle pour
surmonter ces limites. Les ordinateurs quantiques ont
la capacité d'effectuer des calculs
complexes à un rythme exponentiellement plus rapide
que les ordinateurs classiques Grâce à leur
architecture unique et unités de traitement
quantique ou QP, ils ont le potentiel
d'
accélérer considérablement le
processus d'entraînement des réseaux neuronaux En outre,
les ordinateurs quantiques peuvent gérer plus efficacement des
ensembles de données à plus grande échelle Réduire les
exigences en matière de données et atténuer les défis associés au traitement de telles
quantités d'informations Bien que l'informatique quantique
n'en soit qu'à ses débuts, recherche et le
développement
en cours devraient permettre de surmonter les limites auxquelles sont
confrontées les approches traditionnelles
d'apprentissage profond. Merci d'avoir exploré le monde du deep
learning avec moi. Il est essentiel de
reconnaître que nous n'en sommes qu'aux premiers stades
de
l' exploration de ce que l'apprentissage profond et les réseaux neuronaux
peuvent faire pour nous. Cependant, de grands noms tels que Google, IBM et Nvidia ont reconnu
cette trajectoire de croissance en
investissant dans le développement de bibliothèques, de modèles prédictifs et de puissants GPU pour soutenir la mise en œuvre
de réseaux neuronaux Nous sommes presque arrivés à la fin de cette section sur l'intelligence
artificielle traditionnelle. Il est important de noter que
nous n'avons fait qu'effleurer la surface en ce qui concerne le potentiel de l'
apprentissage profond et de l'IA Des possibilités passionnantes nous
attendent. À mesure que nous repoussons les limites
du possible, la frontière entre
science-fiction et réalité devient de
plus en plus floue L'avenir réserve de
nombreuses surprises, et le deep learning est
au cœur de ces avancées
révolutionnaires Dans la vidéo suivante, qui est la dernière
de cette section, nous apprendrons la
différence entre les modèles d'apprentissage
automatique
discriminants et génératifs, ce qui nous préparera à la
prochaine section de ce cours sur l'
intelligence artificielle générative On se voit dans le prochain.
5. L1V4 - Discrimination vs générative: Dans cette vidéo, nous
allons parler d' algorithmes
discriminants et
génératifs Il s'agit de deux types importants
de modèles d'apprentissage automatique. Pour
vous faciliter la tâche, nous allons commencer par l'histoire puis nous expliquerons en
détail comment
ces deux types d' apprentissage
automatique fonctionnent en apprentissage
automatique fonctionnent en utilisant
des algorithmes populaires comme exemples. Alors allons-y directement. C'est bon.
Plongons dans notre histoire. Imaginons que nous ayons
deux visiteurs extraterrestres qui n'ont jamais vu de pommes
ni de bananes auparavant. Nous voulons observer
comment ils apprennent à distinguer
ces deux fruits. Le premier extraterrestre décide de comprendre ces fruits
en les dessinant. Il observe attentivement
la forme, la couleur et la texture de chaque fruit, puis
les recrée sur papier De cette façon, il crée une représentation visuelle ou un modèle de l'apparence de chaque
fruit. Chaque fois qu'il voit un nouveau fruit, il se réfère à ces dessins
pour identifier ce fruit. Ceci est similaire à ce que nous appelons un algorithme génératif
en apprentissage automatique. Le deuxième extraterrestre, en
revanche, s'y prend différemment. Au lieu de dessiner, il commence à comparer les caractéristiques
des fruits. Il remarque que les pommes
sont généralement rondes et rouges tandis que les bananes
sont longues et jaunes. Lorsqu'on lui donne un nouveau fruit, il ne semble pas correspondre parfaitement. Il vérifie plutôt quels
fruits présentent les caractéristiques les plus proches du nouveau fruit et devine qu'il s'
agit du même fruit. Cette approche s'apparente
davantage à ce que nous appelons un
algorithme discriminant en apprentissage automatique C'est donc l'idée de base. Ces deux
approches différentes nous aideront à comprendre les algorithmes discriminants
et génératifs Ensuite, définissons formellement nos deux types d'algorithmes en nous
basant sur notre approche des extraterrestres. La première méthode des extraterrestres est un excellent exemple de ce que nous appelons la
classification générative. C'est là qu'un modèle apprend à générer une représentation
de chaque classe. C'est comme apprendre à quoi
ressemble
une pomme ou une banane et utiliser ces connaissances pour identifier la future instance. En revanche, la
deuxième méthode des étrangers représente une
classification discriminante Ce modèle apprend à
distinguer les classes en
fonction de leurs caractéristiques. Au lieu d'apprendre à quoi ressemble une
pomme ou une banane, il apprend les différences
entre les deux. Il utilise ensuite ces différences pour déterminer ce que pourrait être un
nouveau fruit. Chaque approche a ses
forces et ses faiblesses, et elles sont utilisées dans
différents scénarios. Maintenant que nous avons
présenté les concepts, explorons-les plus
en profondeur. Pour mieux comprendre ces concepts, nous allons discuter d'algorithmes
spécifiques qui utilisent ces deux
types de classifications. Pour la
classification discriminante, nous prenons l'exemple de la
régression logistique Et pour la
classification générative, notre exemple sera l'algorithme de base
naïf Ainsi, dans le domaine de la classification
discriminante, régression
logistique crée
une limite de décision basée sur les caractéristiques
de l'entrée Pour notre exemple de fruit, ces caractéristiques peuvent être
la couleur, la longueur ou le poids. L'algorithme apprend
des modèles à partir de ces caractéristiques, puis
les utilise pour classer les nouveaux fruits. À l'inverse, l'algorithme de
base naïf, qui est un modèle de
classification génératif, essaie de comprendre
la distribution de chaque classe dans
l'espace des fonctionnalités Plutôt que de simplement identifier les différences entre les classes, il apprend comment chaque classe
distribue les données. Maintenant, approfondissons
et comprenons comment ces algorithmes utilisent les
stratégies pour classer les nouvelles données. Avec le modèle de
régression logistique, nous traitons de
caractéristiques telles que la couleur, la longueur et le poids
des fruits Le modèle utilise ces fonctionnalités pour apprendre des modèles
et prendre des décisions. Par exemple, il
pourrait apprendre que si un fruit a une couleur jaune
et mesure plus de 5 pouces, il y a de fortes chances que
ce soit une banane. Cette méthode de création d'une limite de
décision basée sur des
caractéristiques d'exemples est l'essence même de l'apprentissage
discriminant autre côté, l'apprentissage
génératif utilisé par le modèle de base naïf
tente de comprendre la distribution de chaque classe dans un plan multidimensionnel comme un espace tridimensionnel
pour les trois caractéristiques de nos fruits Le modèle essaie de visualiser endroit où les pommes et
les bananes sont susceptibles d' apparaître dans cet espace en fonction leur couleur, de leur forme et de leur poids. Réfléchissons maintenant à
quelques questions importantes concernant quelques questions importantes modèles
génératifs et
discriminants Des questions telles que : quel modèle
a besoin de plus de données pour l'entraînement ? Lequel est concerné
par les données manquantes ? Quel modèle est
influencé par les valeurs aberrantes, lequel nécessite plus de calculs et lequel a tendance à être surajusté Il est important de réfléchir à ces questions, car elles influent sur la manière dont vous pourriez
choisir d'utiliser ces modèles. Par exemple, un
modèle génératif n'a pas besoin de beaucoup de données car il essaie simplement de
comprendre les
caractéristiques de base de chaque classe. Cependant, un
modèle discriminant a besoin de plus de données car il essaie de comprendre les différences complexes
entre les classes Réfléchir à ces questions
peut vous aider à mieux comprendre ces modèles et à les
utiliser plus efficacement. Mais ne vous inquiétez pas si vous
n'êtes pas sûr des réponses. Nous allons en discuter
en détail. Regardons donc
la première question. Quel modèle a besoin de plus
de données pour l'entraînement ? Les modèles discriminants
tels que la régression logistique nécessitent
généralement davantage de
données pour Ils apprennent en identifiant les
différences entre les classes. Ils ont donc besoin d'un ensemble
d'exemples riches
et variés pour
le faire efficacement. La deuxième question est lequel est concerné
par les données manquantes ? Le fait est que les deux types de modèles peuvent être affectés
par des données manquantes. Mais les modèles génératifs
peuvent être plus sensibles car ils
tentent de capturer la distribution globale
des données. Toute
information manquante pourrait fausser leur compréhension
de cette distribution La question suivante est la suivante : quel modèle est
affecté par les valeurs aberrantes ? Encore une fois, les valeurs aberrantes peuvent
affecter les deux modèles, mais les modèles discriminants
peuvent être plus sensibles Ces modèles se concentrent sur
les limites entre les classes, et une couche extérieure peut modifier
ces limites de
manière significative La question suivante est la suivante : qu'est-ce qui
nécessite le plus de mathématiques ? En termes de mathématiques, les modèles
génératifs tels que la base
naïve nécessitent souvent plus de calculs car ils impliquent l'estimation de la
distribution des données, ce qui peut nécessiter beaucoup de
calculs Et la dernière question est lequel a tendance à être surdimensionné ? surajustement peut se produire
dans les deux modèles, mais les modèles discriminants y sont
généralement plus exposés Cela est dû au fait qu'ils peuvent devenir trop attentifs aux données d'entraînement apprendre même qu'il s'agit de
bruit et d'erreurs. Maintenant que nous connaissons
la différence entre les discriminants et génératifs algorithmes d'apprentissage
automatique
discriminants et génératifs, examinons quelques
exemples courants de chaque type Certains des algorithmes discriminants
sont donc la régression logistique, les machines à vecteurs de
support, les arbres de
décision, forêts
aléatoires et les machines augmentant le
gradient Certains des
algorithmes génératifs sont la base
naïve, les modèles de
mélange gaussien, les modèles de Markov
cachés, l'allocation directe
latente et les réseaux antagonistes base
naïve, les modèles de
mélange gaussien, les modèles de Markov
cachés, l'allocation directe
latente et les réseaux antagonistes génératifs. Pour conclure, dans cette vidéo, nous avons exploré le monde modèles
discriminants et
génératifs l'aide d'une histoire simple et
captivante Nous avons vu comment la régression
logistique dans un modèle discriminatif utilise des caractéristiques
distinctes pour créer des limites de
décision, tandis que le modèle génératif, basé base
naïve, essaie comprendre la
distribution globale des données Comprendre la
différence entre les modèles
discriminants et
génératifs nous donne des informations
précieuses sur le fonctionnement des systèmes d'IA
générative Les modèles génératifs tels
que ceux utilisés dans l'IA générative apprennent la distribution sous-jacente
des données d'entraînement. Ces connaissances sont
ensuite utilisées pour générer de nouvelles données qui reflètent
les données d'entraînement. C'est pourquoi l'
IA générative est si puissante. Il peut générer de nouveaux
résultats réalistes tels que des images, du texte et même de la musique, car il comprend le monde
de ses données d'entraînement. En revanche, les modèles
discriminants apprennent
simplement les limites
entre les classes et sont principalement utilisés pour les tâches de
classification Ils ne peuvent pas générer de nouvelles
données parce qu'ils n'
essaient pas de comprendre la
distribution sous-jacente des données, les différences entre les classes. En comprenant
ces différences, vous pourrez mieux apprécier
les capacités
et la flexibilité des systèmes d'IA
générative. Cette compréhension pourrait
vous aider à choisir
le type de système d' IA le mieux adapté à votre
projet ou à votre cas d'utilisation particulier Nous avons ainsi atteint
la fin de la première section de ce cours,
l'intelligence
artificielle traditionnelle. Je vous verrai dans la section deux, où nous discuterons de l'intelligence
artificielle générative.
6. L2V1 - Transformateurs: Passons maintenant
aux transformateurs et leur rôle de premier plan dans le développement l'intelligence
artificielle générative transformateurs sont un type de réseau
neuronal
capable d'apprendre les dépendances à longue portée dans des séquences Cela les rend parfaitement
adaptés à des tâches telles que la génération de
texte, où le modèle doit
comprendre
le contexte des mots précédents
afin de générer le mot suivant. Transformers
a révolutionné le traitement du langage naturel
en 2018 traitement du langage naturel
en Voyons maintenant comment fonctionnent
les transformateurs. Les transformateurs sont
composés de deux parties principales, un encodeur et un décodeur encodeurs sont
chargés de prendre une séquence d'entrée et la convertir en une
séquence d'états cachés L'encodeur est composé d'
une pile de couches d'
attention personnelle L'attention personnelle est un mécanisme
qui permet à l'encodeur de prendre
en compte différentes parties de la séquence d'entrée lors de la
génération des états cachés Cela permet à l'encodeur d'apprendre les dépendances à longue portée
dans la séquence d'entrée, ce qui est essentiel pour des tâches
telles que la génération de texte décodeurs sont
chargés de prendre une séquence d'états cachés
et de générer une séquence de
sortie Le décodeur est également composé d'une pile de couches d'
attention personnelle Cependant, le décodeur
possède également une couche d'
attention particulière qui lui permet de prendre séquence d'entrée lors de
la
génération de la séquence de sortie Cela permet au décodeur
d'apprendre à générer une sortie cohérente avec la séquence
d'entrée L'encodeur et le décodeur
travaillent donc ensemble pour générer
une séquence de sortie Le codeur convertit d'abord la séquence d'entrée en une
séquence d'états cachés Le décodeur prend ensuite ces états cachés et
génère une séquence de sortie La
couche d'attention du décodeur lui permet de prendre en séquence d'entrée lors de la
génération de la sortie Cela permet au décodeur
d'apprendre à générer une sortie cohérente avec la séquence
d'entrée présente plusieurs avantages utilisation de transformateurs
pour l'IA générative Tout d'abord, les transformateurs sont capables d'
apprendre les dépendances à longue portée par séquences Cela leur permet de générer des résultats
plus réalistes et
cohérents. Deuxièmement, les transformateurs peuvent être entraînés sur de très
grands ensembles Cela leur permet d'apprendre des modèles et des
relations
plus complexes dans les données. Et troisièmement, plusieurs transformateurs
parallèles peuvent fonctionner ensemble. Cela leur permet d'être formés plus rapidement
et plus efficacement. Grâce à ces avantages,
les transformateurs
sont devenus une approche de
pointe pour une grande variété de tâches
génératives d'IA,
telles que la génération de texte, la génération d'images et
la génération de musique Lorsque vous utilisez des transformateurs, il faut savoir qu'ils peuvent
créer des hallucinations Dans les transformateurs, les hallucinations
sont des mots ou des phrases générés par
le modèle qui sont souvent absurdes ou Mais pourquoi les hallucinations se produisent-elles ? Les hallucinations peuvent être causées
par un certain nombre de facteurs, notamment le fait que le modèle n'est pas
entraîné sur suffisamment de données, ou le modèle est entraîné
sur des données bruyantes ou sales, ou le modèle ne
reçoit pas suffisamment de contexte ou le modèle n'est pas soumis à
suffisamment de contraintes. Les hallucinations peuvent être un
problème pour les transformateurs car elles peuvent rendre le texte de sortie
difficile à comprendre Ils peuvent également rendre le
modèle plus susceptible de
générer des informations incorrectes ou
trompeuses. Alors, comment atténuer les
hallucinations ? Il existe plusieurs moyens d'
atténuer les hallucinations
chez les transformateurs. L'une des solutions consiste à entraîner le
modèle sur un plus grand nombre de données. Une autre méthode consiste à utiliser une
technique appelée recherche par faisceau, qui permet au
modèle d'explorer un plus large éventail de sorties
possibles. Enfin, il est important donner
au modèle
suffisamment de contexte et contraintes pour qu'il ne
génère pas de résultats absurdes ou
grammaticalement Voici quelques exemples
d'hallucinations générées
par des transformateurs. Le chat s'est assis sur le tapis
et le chien a mangé la lune. Le garçon est allé au magasin
et a acheté un gallon d'air. La femme s'est rendue à la banque
et a retiré 1 million de dollars. Comme vous pouvez le constater,
ces exemples sont tous absurdes ou
grammaticalement Cela est dû au fait que les transformateurs ont généré ces mots ou phrases sans aucun
contexte ni contrainte Il est important de noter que les hallucinations ne sont pas
toujours une mauvaise chose. Dans certains cas, ils
peuvent être utilisés pour générer des textes créatifs et
intéressants. Cependant, il est important d'
être conscient du risque d'
hallucinations lors de l'utilisation de transformateurs et de prendre des mesures
pour les atténuer. transformateurs sont
utilisés pour générer une grande variété de contenus
créatifs,
notamment du texte, des images, de
la musique et même des vidéos Parmi les
applications les plus courantes des transformateurs dans l'IA générative, citons la génération de
texte Les transformateurs peuvent être utilisés pour générer des textes
tels que des articles de presse, des articles blog et des écrits
créatifs Par exemple, le modèle de
transformateur GPT Three a été utilisé pour
générer de faux articles de presse réalistes, et il peut même écrire de
la poésie et des histoires Génération d'images.
Les transformateurs peuvent être utilisés pour générer des
images telles que des peintures, des photographies et de l'art numérique Par exemple, le modèle de
transformateur Imagine a été
utilisé pour générer des images
réalistes de
personnes, d'animaux et d'objets. Génération musicale.
Les transformateurs peuvent être utilisés pour générer de la musique, telle que des chansons, des
mélodies et des rythmes Par exemple, le modèle de
transformateur Mus Net a été capable de
générer une
musique originale qui sonne comme si elle avait été composée
par un musicien humain. Et nous avons la génération de vidéos. Les transformateurs peuvent être
utilisés pour générer des vidéos, telles que des films, des émissions de télévision
et des dessins animés Par exemple, le modèle de
transformateur Deep Mind video a
été utilisé pour générer une
vidéo
réaliste qui
semble avoir été filmée par un
caméraman humain. mesure que la technologie
continue de se développer, nous pouvons nous attendre à voir applications
encore plus étonnantes des transformateurs
dans l'IA générative Les transformateurs ont
le potentiel de
révolutionner la façon dont nous
créons et consommons du contenu, et ils sont déjà
utilisés pour créer des choses vraiment
incroyables.
7. L2V2 - Gen IA: Bienvenue dans l'intelligence
artificielle générative. Nous commençons cette vidéo
en expliquant comment faire la distinction entre l'IA
générative et l'apprentissage
automatique traditionnel. Ensuite, nous donnons une définition
officielle de l'intelligence artificielle
générative et terminons la vidéo par quelques
exemples d'IA générative. Nous présentons ici deux approches clés de l'intelligence
artificielle, l' apprentissage automatique
traditionnel
et l' intelligence
artificielle générative. L'image du haut montre l'apprentissage automatique
traditionnel. Ici, le modèle apprend à partir des données
associées à des étiquettes. Ce qu'il fait,
c'est établir le lien entre les caractéristiques
des données et les étiquettes
correspondantes. Cette compréhension
est ensuite utilisée pour faire des suppositions
éclairées sur de nouvelles
données inédites Maintenant, la partie inférieure de l'image montre quelque chose
d'un peu différent. Le modèle d'IA générative. Au lieu de simplement déterminer la relation entre
les entrées et les sorties,
il approfondit les choses. Il met l'accent sur le
schéma complexe du contenu. est cette compréhension du
modèle qui lui donne le pouvoir de créer lui-même du contenu nouveau et
réaliste. Cela peut être n'importe quoi, un poème, un article de presse, une photo ou même une composition musicale. Vous voyez donc que l'IA générative apporte un nouvel angle créatif
au vaste monde de l'IA. La nature du résultat
joue un rôle crucial dans la différenciation entre l' IA
générative et les autres modèles Les modèles traditionnels produisent
généralement des résultats
catégoriels ou
numériques, exemple pour déterminer si un
e-mail est un spam ou
non ou pour prédire les chiffres de vente D'autre part, l'IA
générative peut produire des résultats tels que du langage
écrit ou parlé, des images ou même du son, reflétant ainsi sa capacité à générer du contenu
imitant la réalité On peut l'imaginer mathématiquement
ainsi. Si vous n'avez
pas vu cette équation récemment, voici un petit rappel. L'équation Y égale F de X calcule le résultat en
fonction de différentes entrées Y symbolise le
résultat du modèle. F représente la fonction
que nous utilisons dans le calcul. Et qu'en est-il de X ?
Cela représente les entrées ou les entrées
utilisées dans l'équation. Donc, en termes simples, la sortie du modèle est
fonction de toutes les entrées. La clé ici est de
comprendre la nature de la sortie Y en
fonction des entrées X. Les modèles
traditionnels
produisent généralement des résultats numériques. Les modèles d'
IA générative peuvent associer ces valeurs numériques à
différentes formes d'informations, ce qui les rend capables de générer des réponses
complexes
telles que des phrases en langage naturel,
des images et des vidéos. En résumé,
les processus
classiques traditionnels d' apprentissage supervisé et non supervisé utilisent code de
formation et les
données d'étiquetage pour créer un modèle Selon le
cas d'utilisation ou le problème, le modèle peut
vous donner une prédiction. Il peut classer
ou regrouper quelque chose. La différence réside
dans l'application. Les modèles traditionnels
font des prédictions, classifient ou regroupent les données, tandis que
les modèles d'IA générative sont plus polyvalents créent un large
éventail de contenus. La méthode d'IA générative peut fonctionner avec
du code d'apprentissage, des données étiquetées et des données non étiquetées de toutes sortes pour construire ce que nous
appelons un modèle de base Ce modèle de base peut
ensuite produire de nouveaux contenus, tels que du texte, du code, des images, du son, de la vidéo, etc. La puissance de l'IA générative réside dans sa capacité à ingérer
divers types de données, y compris des données non étiquetées, pour créer des modèles qui
génèrent du nouveau contenu, au-delà des capacités des
modèles traditionnels Nous avons parcouru un long
chemin en passant de la programmation
traditionnelle
aux réseaux neuronaux et maintenant aux modèles génératifs. À l'époque de la programmation
traditionnelle, nous devions saisir manuellement les règles pour
différencier le chat. Nous avons dû intégrer des
règles spécifiques dans le programme. C'était un peu comme si c' un animal à quatre
pattes, deux oreilles, une
fée, et qu'il aimait
la laine et l'herbe à chat, alors c'est probablement un Et nous avons dû écrire
tout cela dans
un langage de programmation
et non dans un langage naturel. À la manière des réseaux neuronaux, nous pourrions montrer les
images des réseaux de chats et de chiens, puis nous demander s'il s'agit d'un chat. Le réseau
répondrait probablement par une
prédiction, c'est un chat. Nous pouvons donc constater que
les réseaux de neurones permettent une prise de décision
plus nuancée en s'entraînant sur des exemples,
ce qui constitue une évolution
par rapport aux règles
de codage en dur Dans le cadre de la vague générative, nous pouvons produire notre propre contenu, tel que du texte, des images
, du son, de la vidéo, etc. Des modèles tels que le modèle de langage Palm ou
Pathways, modèle de langage
Lambda pour les applications de
dialogue et le GPT, transformateur
génératif
pré-entraîné, consomment de grandes quantités de
données provenant de diverses sources, y compris Internet pour créer des modèles
linguistiques de base, qui peuvent être utilisés simplement en
posant une question, qu'il
s'agisse de la taper dans une invite ou en parlant verbalement dans
se demande elle-même. Donc, si nous lui demandons ce qu'est un chat, il peut nous donner tout ce qu'il
a appris sur le chat. L'IA générative stimule
l'interaction avec les utilisateurs, les
transformant du statut de simples
spectateurs en créateurs actifs Des modèles comme Palm, Lambda et GPT se démarquent Ils sont formés
sur de grands ensembles de données et fournissent des réponses intelligentes tenant compte du
contexte Cette focalisation sur l'utilisateur rend l' IA
générative attrayante pour une gamme d'
applications différentes. Donnons maintenant notre définition
officielle. Qu'est-ce que l'IA générative ? L'IA générative est un type d'intelligence
artificielle qui crée de nouveaux contenus en
fonction de ce qu'elle a appris
du contenu existant. Le processus d'apprentissage à partir du contenu
existant est appelé formation et aboutit à la création d'un
modèle statistique lorsqu'on lui en donne l'ordre. IA utilise le modèle
pour prédire quelle pourrait être
une réponse attendue ce qui génère du nouveau contenu L'accent est mis ici sur l'héritabilité de l'
IA générative pour apprendre et créer Contrairement aux modèles traditionnels, qui prévoient en fonction de relations
préétablies, IA
générative se concentre sur la
compréhension de la
structure sous-jacente des données d'entrée. Après la formation, le modèle peut générer des
réponses ou du contenu uniques, ce qui
élargit considérablement les applications
et les capacités des systèmes d'IA Essentiellement, il apprend
la structure sous-jacente des données et peut ensuite générer de nouveaux échantillons similaires aux
données sur lesquelles il a été formé. Voyons donc quelle
est la différence
entre les modèles de langage
et les modèles d'image. Les modèles de langage génératifs découvrent les modèles du langage
grâce à des données d'entraînement. Ensuite, à partir de quelques textes, ils prédisent ce qui va suivre. Les modèles d'image génératifs produisent nouvelles images à l'aide de
techniques telles que la diffusion. Ensuite, à partir d'une invite
ou d'une imagerie associée, ils transforment le bruit aléatoire en images ou génèrent des
images à partir d'instructions. Examinons chacun d'eux un peu plus
en profondeur. Comme indiqué précédemment, les modèles de langage
génératifs se concentrent sur la compréhension de la structure
inhérente des modèles au sein des données Ils exploitent ensuite ces
modèles appris pour générer de nouvelles
réponses ou de nouveaux contenus. Qui
ressemblent souvent étroitement aux données d'origine. Ces caractéristiques font des
grands modèles linguistiques un exemple exceptionnel du potentiel
générateur de l'AIS. Un modèle de langage génératif
prend du texte en entrée et peut générer davantage de texte et d'images,
de son ou de décisions. Par exemple, sous
le texte de sortie, réponse à
une question est générée, et sous l'image de sortie, une
vidéo est générée. grands
modèles linguistiques sont donc un type d'IA générative,
car ils génèrent de
nouvelles combinaisons de textes sous forme de langage
naturel Nous avons également des modèles
d'image génératifs, qui prennent une image en
entrée et peuvent générer du texte, une autre image ou une vidéo. Par exemple, sous
le texte de sortie, vous pouvez obtenir une réponse visuelle aux
questions, une tâche de vision par
ordinateur
qui consiste à répondre à
des questions sur une image, tandis que sous l'image de sortie, une complétion d'image
est générée. Et sur leur vidéo de sortie, une
animation est générée. Comme nous l'avons déjà mentionné, modèles de langage
génératifs découvrent les modèles et les structures linguistiques grâce à leurs données d'entraînement. Et puis, lorsqu'on leur donne un texto, ils essaient de prédire
ce qui va suivre. Ainsi, dans un sens, les modèles de
langage génératifs peuvent être considérés comme des systèmes d'
appariement de modèles, affinant leur capacité à discerner des modèles à partir des données qui leur
sont présentées Maintenant que nous avons fourni la définition officielle de l' intelligence artificielle
générative, terminons cette vidéo par quelques
exemples d'IA générative. Voici un exemple de fonctionnalité de saisie automatique de Google Search. Sur la base des enseignements
tirés de ses données d'entraînement, il propose des prédictions sur la manière de
compléter cette phrase. Les chats détestent, et certaines suggestions
suggèrent que les chats détestent l'odeur de
l'eau, les chats détestent les concombres. Voici le même
exemple utilisant bar, modèle de langage formé sur
une énorme quantité de
données textuelles et capable de
communiquer et de générer du texte semblable à celui d'un
humain en réponse à un large éventail
de demandes et de questions Donc, quand j'utilise le message, les chats détestent qu'il réponde. Les chats détestent beaucoup de choses, mais certaines des plus courantes
incluent, puis une liste de choses
qu'ils pensent que les chats détesteraient. Et la même invite
utilisant GPT quatre produit cette
réponse. Les chats détestent. Les chats peuvent exprimer leur aversion
ou leur malaise en réponse à une variété de situations, d'objets
ou de comportements Vous trouverez ci-dessous certaines des
choses que les chats
n'aiment généralement pas et énumérez certaines
des choses qu'ils
pensent que les chats détesteraient À l'instar de Bart,
GPT four est également un modèle linguistique formé sur une énorme quantité
de données textuelles et capable de communiquer
et de générer du
texte semblable à celui d'un humain en réponse à un large éventail de demandes
et de questions Voyons maintenant quelques
exemples de génération d'images. Nous utilisons la même invite sur
trois outils d'IA différents. L'invite est un chat
entouré de choses que les chats détestent. Si nous essayons cette invite sur DALE, qui est un générateur
d'images AI construit par OpenAI, la même société qui a créé GPT Nous obtenons ce résultat. Nous pouvons également l'essayer sur le générateur d'images Adobe Firefly Tik
to Et voici quelques-uns
des résultats
que nous obtenons avec Firefly Nous pouvons également essayer l'application de synthèse texte
en image Canva, fournit quelques
exemples de ce
qu'elle juge approprié en
réponse à nos demandes. N'oubliez pas que
nous avons utilisé ici un message très
minimaliste, juste pour montrer que même sans
fournir beaucoup de contexte, nous pouvons toujours produire des résultats plus
ou moins pertinents Nous obtiendrions un bien meilleur
résultat si notre message incluait plus de détails et
suivait une structure solide. Cela souligne
l'importance d'une conception et d' une ingénierie
rapides, que nous aborderons plus loin
dans cette section. Dans la prochaine vidéo, nous
parlerons des transformateurs, une technologie qui a rendu tout cela possible.
On se voit dans le prochain.
8. L2V3 - Applications de l'IA de génération: Examinons
le type de tâches
que les différents
modèles d'IA peuvent effectuer. Cette tâche peut généralement être classée en fonction du type de données d' entrée qu'ils acceptent et du type de
données de sortie qu'ils génèrent. Voici quelques exemples. Texte à texte. Ceci est généralement utilisé dans la traduction
automatique, la synthèse de
texte et les chatbots
tels que Bard et chat GPT Par exemple, si vous demandez à
GPT 4, qu'est-ce qu'un chat ? Je dois vous dire qu'un chat est un petit mammifère carnivore
que l'on garde souvent comme Le terme fait généralement référence aux chats, puis il continue de générer plus en plus d'
informations sur les chats. Un autre modèle est le texte en image. Ceci est utilisé pour générer des
images à partir de descriptions textuelles. L'application texte vers
image
Canvas,
qui crée des images à
partir de saisies de texte, en est un exemple application texte vers
image
Canvas,
qui crée des images à
partir de saisies de texte, . Dans cet exemple, nous
pouvons utiliser l'invite un chat gris et blanc assis sur le rebord
d'une fenêtre en train de regarder des
pigeons à l'extérieur. Et cela va générer cette
image pour nous. Du texte à la vidéo. L'IA peut également être utilisée pour
générer des vidéos à partir de descriptions
textuelles, bien qu'il s'agisse d'une tâche plus
complexe et moins explorée que la génération de texte en image. Par exemple, à l'aide
d'outils tels que la vidéo, nous pouvons créer une vidéo
avec juste un message de promotion. Le modèle d'IA utilise notre invite pour écrire un
script pour la vidéo
, puis sélectionne les images et les clips
vidéo pertinents par rapport au
contenu du script. Il peut même appliquer des filtres et
des transitions à la vidéo. Certains de ces outils
peuvent également sélectionner une musique adaptée au
contenu de la vidéo. Par exemple, le modèle d'IA
peut associer les animaux espièglerie, puis choisir une musique ludique à
ajouter à la vidéo Du texte en trois D,
ces modèles génèrent des objets tridimensionnels qui correspondent à la description
textuelle de l'utilisateur. Par exemple, si vous demandez à Shape E, un modèle
génératif conditionnel trois actifs D, de créer un avion
ressemblant à une banane. Il crée l'
objet en trois D que vous pouvez voir ici. Nous avons également du texte à coder. Ces modèles sont capables d'utiliser description en langage
naturel
, puis de créer un code
basé sur cela. Il est utile pour des tâches telles que la génération
automatique de code, détection
d'erreurs et la traduction de
code. Par exemple, le copilote Hat
GPT, Bart et Github partagent la capacité
de générer du code Les modèles tels que Chat GPT, grâce à leur formation sur un
large éventail de textes Internet,
y compris le code, ont la capacité de
générer du code lorsqu'ils sont fournis
avec un bal de fin d'année approprié Bart two travaille
dans le même sens, mais sa formation est spécifiquement axée sur la programmation de textes liés à
la programmation. Nous avons également un copilote Github qui utilise le modèle Codex d'OpenAI,
qui est formé sur du code accessible
au public, ce qui
lui permet de suggérer la complétion du code et de
générer
du code à partir de commentaires ou de signatures de fonctions C'est une tâche difficile. Les modèles
Takes to Task sont entraînés à exécuter une tâche ou une
action définie en fonction de la saisie de texte. Cette tâche peut
consister en un large éventail d'actions,
telles que répondre à une question, effectuer une recherche, faire une prédiction ou effectuer une action quelconque. Par exemple, un
modèle Ts to Task peut être entraîné à naviguer dans une interface utilisateur Web ou apporter des modifications à un
document via l'interface graphique. Nous avons également une image pour le texte. Ceci est utilisé dans des tâches telles que sous-titrage d'
images où l'IA décrit une image avec des mots Par exemple, BLip, qui est un modèle d'IA capable à la
fois de sous-titrer et de
générer des images, peut prendre une image en
entrée et fournir une description de cette
image sous forme de texte en sortie Nous avons également une image par image. Ces modèles exécutent des tâches telles que la traduction d'images, par
exemple conversion d'images de jour en images de nuit, la colorisation d'images en noir
et blanc ou l'amélioration de la résolution Par exemple, Night Cafe est
un générateur d'images basé sur l'IA qui peut prendre une image en entrée pour initialiser le processus de
création d'image Il produit ensuite une image
stylisée en
sortie en fonction de l'invite de l'utilisateur et d'autres paramètres
pouvant être Selon l'algorithme
choisi, artistique ou cohérent, l'image de départ répond à
différents objectifs. Pour l'algorithme artistique, les formes et les structures de l'image sont
plus importantes. Mais dans l'algorithme cohérent, plus grande attention est accordée à la résolution, aux couleurs et aux textures. Comme autre exemple,
examinons la fonction d'édition
magique de Canva Grâce à cette fonctionnalité, nous pouvons
sélectionner une partie spécifique de l'image et la
remplacer par une autre image. Par exemple, ici, je
sélectionne le panier puis dis au modèle que je veux remplacer par une
chaîne de montagnes, espérant que le résultat
donnera l'
impression que le chat est
assis sur un rocher. Et nous pouvons voir que le
modèle me fait des suggestions. Si je ne suis pas
satisfait du résultat, je peux demander au modèle de régénérer
les résultats jusqu'
à ce que je
trouve quelque chose qui me plaît Et voici le résultat final. Je peux même aller plus loin et
sélectionner le plafond en arrière-plan et demander
au modèle de le remplacer par
le ciel avec des nuages. Et voici à quoi ressemble le
résultat. De la vidéo au texte. Cela
implique de générer une description textuelle ou une
transcription à partir d'une vidéo. Par exemple, RS AI peut créer des transcriptions ou des
sous-titres à partir d'une entrée vidéo, voire les traduire d'
une langue à l'autre Bien que ce que nous voyons
dans cet exemple sous-titre uniquement l'
élément vocal de la vidéo, certains des outils de
sous-titrage les plus avancés sont capables de sous-titrer des éléments non
vocaux éléments non vocaux peuvent inclure des
effets sonores, par exemple bourdonnement
d'une abeille, le bruit du fromage ou une
sonnette, de la musique, arrière-plan
ou dans le cadre d'une scène, les réactions du
public, par exemple, des
rires, des gémissements ou des huées, une
manière de parler, par exemple, chuchoter, crier, souligner un mot ou parler avec un accent Les éléments non vocaux peuvent
inclure des
effets sonores, par exemple le bourdonnement
d'une abeille, le bruit du fromage
ou une
sonnette, de la musique, en arrière-plan
ou dans le cadre d'une scène, les réactions du
public, par exemple, des
rires, des gémissements ou des huées, une
manière de parler, par exemple,
chuchoter, crier,
souligner un mot ou parler avec un accent et un haut-parleur
identification d'un narrateur ou d'un
orateur hors écran ou de
plusieurs orateurs De même, nous avons le
format audio en texte. Ceci est généralement utilisé dans les systèmes de reconnaissance
vocale pour transcrire le
langage parlé en texte écrit Whisper by Open AI est un exemple de modèle de
conversion audio en texte L'IA peut également
transformer le texte en discours synthétisé. Les systèmes de synthèse vocale convertissent le texte
en langue parlée. De nombreux outils d'intelligence artificielle,
tels que Play Dot HT, peuvent saisir du texte et
générer un discours semblable à celui d'un humain avec des voix synthétisées qui peuvent ressembler à différents genres, âges, accents ou
même à différents tons, tels que joie, tristesse,
colère, etc. De l'image à la vidéo. Cette tâche
consiste à générer une séquence d'images ou une vidéo à partir d'une
seule image ou d'un ensemble d'images. Par exemple, les photos cinématographiques, une fonctionnalité de Google Photos, utilisent l'
apprentissage automatique pour estimer profondeur
d'une image et créer une
représentation tridimensionnelle de la scène,
que l' image d'origine
contienne ou non
des informations de profondeur
provenant de l'appareil photo suite de cette estimation,
le système anime une caméra virtuelle pour créer un effet panoramique fluide semblable
à une séquence cinématographique Ce processus complexe utilise l'intelligence
artificielle pour transformer une image statique
en une scène
tridimensionnelle dynamique, lui conférant ainsi une qualité similaire à celle d'une vidéo Ce dont nous avons discuté jusqu'ici ne
sont que quelques exemples, et la liste ne
cesse de s'allonger à mesure que le domaine de l'IA progresse et que les chercheurs inventent de nouvelles applications
pour ces technologies. De plus, dans de nombreuses applications du monde
réel, ces tâches sont combinées. Par exemple, un
système d'intelligence artificielle peut avoir besoin de
convertir la parole en texte à l'aide
d'un modèle de synthèse vocale, puis de traiter le texte à
l'aide d'un modèle ,
puis de générer une réponse appropriée en
langage parlé, qui utilise un modèle
texte-audio. Mais attendez, il y en a plus. Il existe de nombreux autres domaines dans lesquels GNAI peut avoir des
applications révolutionnaires. Par exemple, considérez simplement
le mot « musique ». Les tâches liées à la musique constituent un domaine actif de recherche
et de développement dans le domaine de l'IA. Voici quelques tâches courantes. Nous avons du texto en musique. Ces modèles peuvent générer de
la musique en fonction des entrées de texte. Par exemple, ils peuvent créer
une mélodie ou une composition décrite par une phrase ou un
morceau de texte. De la musique au texto. D'autre part, l'IA peut
également convertir de la musique en texte, exemple en créant des
partitions pour une chanson ou en générant un texte descriptif
ou émotionnel basé sur un morceau de musique. Nous avons l'audio en audio, qui permet de convertir un type de son ou de musique en un autre, exemple en changeant le
genre d'une chanson, transformant un bourdonnement en
une pièce composée ou même en supprimant
les voix des pistes Il y a aussi des
recommandations musicales. L'IA est largement utilisée pour
recommander de la musique en fonction des habitudes d'écoute, des
préférences et même de l'humeur des utilisateurs préférences et même de l'humeur Nous avons également la génération musicale. Mus Net d'Open AI est un
exemple de génération musicale. Des modèles tels que
Mus enet d'OpenAI peuvent générer des compositions
musicales de quatre minutes avec dix instruments différents
et peuvent combiner styles allant du country au
mozart en passant par les Beatles Il y a aussi l'amélioration de la musique. Par exemple, Audio Studio peut être utilisé pour améliorer ou
modifier de la musique existante. Il peut le faire en augmentant la qualité audio
, en modifiant le tempo
ou en ajoutant des effets Et il y a aussi la séparation des
sources musicales. Nous pouvons également utiliser des modèles
d'IA pour séparer les
instruments individuels, les voix ou d'autres composants
d'une piste mixée ou master Metas DMax est un exemple d'outil de
séparation de sources musicales En conclusion, le domaine
de l'IA générative est diversifié, fascinant et
plein de potentiel. L'éventail de tâches
qu'il peut effectuer s'agisse
de
prises de vue, de prises d'images, de prises
audio ou de tâches
complexes telles que amélioration et la
génération de
musique, est vraiment remarquable C'est un domaine
en constante évolution, repoussant les limites de
ce que nous croyions possible. Au fur et à mesure que nous continuons à
explorer et à innover, la liste des applications ne fera que
s'allonger. IA générative est la clé de nombreuses percées
et avancées susceptibles de révolutionner de
nombreux
secteurs et la façon dont nous
interagissons avec la Alors que nous continuons à explorer
cette ère passionnante de l'IA, qui sait quelles
possibilités étonnantes nous pourrions découvrir ? L'essentiel est de rester curieux, continuer à explorer et de commencer à
imaginer un avenir dans lequel nous pourrons interagir avec les systèmes d'
IA de manière fiable, responsable et éthique.
9. L2V4 - Ingénierie rapide: Parlons d'un sujet
fascinant dans le domaine
de l' IA générative, l'ingénierie
rapide Comme son nom l'indique, IA
générative concerne les
systèmes qui génèrent des résultats, il
s'agisse de texte, d'images ou de tout autre type de contenu. Comme vous le verrez dans la
section suivante de ce cours, grands modèles linguistiques ou LLM,
qui sont la puissance de l'IA générative, sont
conçus pour générer
du texte semblable à celui de l'homme en fonction des instructions de saisie En plus de générer
des textes de type humain, LLM aident également à traduire nos instructions en sorties d'autres types
de contenu, tels que des images et des vidéos Cela signifie que plus
nos instructions de saisie sont efficaces, plus nous avons
de chances d'obtenir des résultats de
meilleure plus nous avons
de chances d'obtenir qualité avec
n'importe quel outil d'IA générative Aujourd'hui, nous allons explorer plusieurs aspects clés liés
à ces invites de saisie Nous allons clarifier ce qu'
est
exactement une invite et son rôle dans
le façonnement de la sortie du modèle. Nous ferons la distinction entre
une conception
rapide et une ingénierie
rapide, puis passerons
à l'introduction de diverses méthodes
d'ingénierie rapide. Enfin, nous discuterons des limites de
l'
ingénierie rapide afin de
vous donner une compréhension
et des attentes réalistes à l'égard de
ce processus passionnant. Commençons donc. Alors, qu'est-ce qu'une invite ? Une invite est essentiellement
un texte envoyé à un modèle d'
IA génératif en entrée. Mais il ne s'agit pas de n'importe quelles prises. Elle répond à un objectif fondamental. Ces instructions constituent votre lien
de communication avec le modèle. Ils dirigent le modèle d'IA et
orientent sa génération de résultats. Le modèle prend en compte votre
invite, la traite et fournit une sortie
conforme aux instructions de l'
invite. En d'autres termes,
ces instructions sont outil qui
vous permet de contrôler
la sortie du modèle Pensez à une invite comme instruction d'orientation vers
le modèle d'IA générative, comme un réalisateur
guidant un acteur. Plus votre direction est précise et
claire, meilleure est
la performance que vous
pouvez attendre de l'acteur. De même, des instructions bien
conçues permettent au modèle de produire des résultats de
meilleure qualité et
plus spécifiques N'oubliez pas que la clé réside dans la qualité et le design
de vos instructions, et c'est là que
les concepts de conception
rapide et
d'ingénierie rapide entrent en jeu, dont nous allons
parler maintenant Comme nous l'avons mentionné précédemment, la qualité de l'invite
joue un rôle crucial dans la
détermination de la qualité
du résultat d'un modèle d'IA
génératif. Ici, deux concepts entrent en jeu : une conception rapide
et une ingénierie rapide. conception rapide fait référence à
l'élaboration d'instructions spécifiques à la tâche
que le modèle est
invité à Par exemple, si vous
souhaitez que le modèle traduise un texte
de l'anglais vers le français, l'invite sera
rédigée en anglais et indiquera que le
résultat souhaité doit être en français. Il s'agit essentiellement de
créer des invites qui généreront
le résultat souhaité. D'autre part, nous
avons une ingénierie rapide. Ce processus vise davantage à améliorer les performances
du modèle. Cela implique des stratégies telles que l'exploitation de connaissances
spécifiques à un domaine, la
fourniture d'exemples du résultat souhaité ou l'incorporation de
mots clés connus pour être efficaces pour un modèle d'IA
générative particulier. Vous voyez,
bien que les deux concepts tournent
autour de la création d'instructions, ils ont des objectifs différents. La conception rapide consiste à
adapter les instructions aux tâches, tandis que l'ingénierie rapide
vise à améliorer les performances Cependant, ils ne
s'excluent pas mutuellement. Dans la pratique, la création d'une invite efficace implique
souvent à
la fois de la concevoir pour la tâche et de l'adapter à de
meilleures performances. Examinons maintenant certaines des techniques utilisées dans
l' ingénierie
rapide pour optimiser la qualité de sortie de nos modèles d'IA
générative. L'une de ces méthodes consiste à utiliser des connaissances spécifiques au
domaine. Lorsque vous connaissez bien le domaine de
tâche, vous pouvez tirer parti de cette
expertise pour concevoir des instructions qui guident le
modèle de manière plus efficace Par exemple, si vous
travaillez dans le domaine de l'IA médicale, vous pouvez utiliser
la terminologie et les
structures médicales dans vos instructions
pour améliorer la précision Une autre méthode consiste à utiliser mots clés connus pour être efficaces
pour un modèle spécifique. Tout comme dans l'optimisation pour les
moteurs de recherche, où des mots clés spécifiques
aident à mieux classer les pages, certains mots clés peuvent orienter
le modèle de manière plus efficace. Le choix des mots clés
serait basé sur les données d'entraînement du modèle
et ses modèles appris. Avec des modèles tels que
Bart ou chat GPT, vous pouvez directement
demander au modèle quels sont ces mots clés et
comment les utiliser pour
optimiser votre invite Nous devrions également envisager des stratégies
avancées
telles que l'incitation à des rôles, l'incitation à des
tirs et l'incitation par chaîne
de pensée invite à jouer un rôle est une technique dans laquelle nous demandons au modèle GNAI assumer un certain rôle ou un certain personnage lors
de la génération de sa Par exemple, vous pourriez demander
au modèle de réagir comme s'il s'agissait d'un historien expliquant les causes
de la Première Guerre mondiale Le modèle utilise ensuite
ses données
d'entraînement pour générer une réponse
correspondant à cette personne invite de prise de vue,
quant à elle, consiste à donner une vue du contexte avant l'instruction
elle-même Vous pouvez fournir des exemples
du résultat souhaité. Cela permet d'orienter le modèle
en lui fournissant une référence ou un plan
de ce qui est attendu Par exemple, si vous souhaitez obtenir
un résumé d'un document, vous pouvez fournir
quelques exemples de résumés en plus
du texte original Ou si vous
recherchez une critique de film,
au lieu de simplement dire « rédigez une critique du
film X », vous pourriez dire Imaginez que vous venez de
terminer de regarder le palpitant film X
dans un cinéma bondé Rédigez une critique du film. Ce contexte ajouté peut
aider le modèle à produire des résultats
plus chargés d'émotions
et plus sensibles au contexte. Il existe différents
types d'invite à la prise de vue, à zéro, à une ou à quelques
prises Zero Shot invite à exécuter le modèle Gen AI
sans exemples préalables Par exemple, traduisez cette phrase
anglaise en français. Le chat est effréné. Ici, nous proposons
une tâche sans exemple précis de la
manière dont elle doit être effectuée. invite One Shot fournit un exemple unique à titre indicatif Par exemple, poursuivez
l'histoire suivante. Il était une fois, dans
un pays lointain, une nuit courageuse. Ensuite, nous donnons un exemple
de suite de l'histoire. Le modèle essaie ensuite
de continuer l'histoire suivant le style de
l'exemple que nous avons fourni. Et nous avons quelques suggestions de prises de vue
, également connues sous le nom d'invite
multiprises Nous fournissons ici plusieurs
exemples pour aider le modèle. Par exemple, demandez au modèle de générer
une critique de produit, précédée d'une série d'
exemples de critiques de produits. Le modèle essaiera de rédiger une critique similaire aux
exemples que nous avons fournis. Enfin et surtout, incitation à la
chaîne de pensée
implique de fournir un raisonnement ou un
argument au modèle GNAI Au lieu d'une
question ou d'une instruction directe, vous donnez une série de réflexions
qui mènent à la question. Par exemple, au lieu de demander quelles sont les causes
du réchauffement climatique, vous demanderiez que nous avons assisté une augmentation des températures
mondiales au cours des dernières décennies. Ce changement, souvent appelé
réchauffement de la planète, semble être
influencé par divers facteurs. Quelles en sont les causes ? Ces stratégies peuvent améliorer la richesse et la pertinence
des résultats du modèle, démontrant ainsi la puissance d'une ingénierie rapide et habile N'oubliez pas qu'il ne s'agit pas de méthodes
autonomes, mais qu'elles peuvent souvent être combinées pour
créer une invite puissante Maintenant que nous avons compris
ces techniques, passons aux limites
de l'ingénierie rapide. Bien qu'une
ingénierie rapide ouvre des opportunités
intéressantes
pour affiner le résultat d'un modèle d'IA
générative, il est important de garder
à l'esprit qu'il ne s'agit pas d'une baguette magique qui peut toujours
garantir des résultats parfaits. Il existe certaines limites et contraintes
dont nous devons être conscients. Tout d'abord, les modèles d'IA générative, bien que puissants, ne
sont pas omnipotents Ils sont formés sur un large
éventail de données, mais cela ne signifie pas
qu'ils sont capables de répondre
avec précision à n'importe quelle question ou d'accomplir toutes les tâches que vous leur demandez. Par exemple, le
modèle n'a pas la capacité de
générer du contenu en dehors de la date limite de formation ou de prévoir avec précision les événements
futurs. Deuxièmement, la précision
et la pertinence de la sortie du modèle dépendent
fortement de la qualité et de la clarté
de votre message. Cependant, même une invite
parfaitement conçue peut ne pas toujours produire le résultat escompté en raison de l'imprévisibilité inhérente aux
modèles d'IA Troisièmement, même avec une ingénierie
rapide et méticuleuse, les modèles peuvent parfois générer des résultats factuellement
incorrects ou absurdes En effet, ces
modèles génèrent des réponses basées sur les modèles
qu'ils ont appris pendant l'entraînement, et ils ne comprennent pas le
contenu au sens humain du terme. Enfin, certaines tâches
peuvent nécessiter un niveau de
spécification ou de connaissances
spécifiques à un domaine celui de la formation du
modèle Un modèle d'IA
générative à usage général peut ne pas être en mesure de
générer avec précision du contenu hautement spécialisé ou de répondre à des demandes hautement techniques
dans des domaines tels que le droit, les mathématiques
avancées ou des
sous-disciplines médicales spécifiques Bien que l'ingénierie rapide
soit un outil puissant, il est essentiel
de connaître ces limites pour maintenir des attentes
réalistes et utiliser modèles d'IA
génératifs de manière
plus efficace. Bien, terminons les choses. Aujourd'hui, nous avons exploré le monde des instructions dans les modèles d'IA
générative Nous avons découvert la conception et l'
ingénierie
rapides et avons discuté diverses méthodes telles que le
prompt prompting, roll prompting et le guidage par chaîne
de pensée N'oubliez pas qu'une ingénierie rapide n'
est pas une solution miracle. C'est un outil, et comme tout outil, il a ses limites. Essayez donc de créer vos propres instructions et
explorez les possibilités Merci d'avoir regardé, je vous
verrai dans le prochain.
10. L3V1 - LLM: Bienvenue dans l'introduction
aux grands modèles linguistiques. grands modèles linguistiques,
ou LLM en abrégé, sont un sous-ensemble de l'apprentissage profond Elles se recoupent avec l'IA
générative, qui fait également partie
du deep learning Nous avons déjà expliqué que l'IA
générative est un type d'intelligence artificielle
capable de produire de nouveaux contenus, notamment du texte, des images,
du son et des données synthétiques. Mais que sont les grands modèles
linguistiques ? Lorsque nous utilisons le terme «
grands modèles linguistiques », nous faisons référence à de grands
modèles linguistiques à
usage général que nous pouvons
préformer puis affiner répondre
à nos besoins à
des fins spécifiques. Mais qu'entendons-nous par «
pré-formé » et « affiné » ? Pensez au processus
de dressage d'un chien. Généralement, vous donnez des instructions de
base à votre chien , comme s'asseoir, se
calmer et rester Ces commandes sont généralement
suffisantes pour la vie de tous les jours aident votre chien à devenir un chien bien élevé
dans le quartier Toutefois, lorsque vous avez besoin d'un chien pour remplir un rôle spécial, tel qu'un
chien de sécurité, un chien-guide ou un chien policier, formation spécifique
supplémentaire devient nécessaire. Le même principe s'applique
aux grands modèles linguistiques, tout comme le dressage
spécialisé prépare les chiens à
leurs rôles uniques, peaufinage d'un
grand modèle linguistique pré-entraîné lui permet d'effectuer des tâches spécifiques de manière efficace
et précise, qu'il
s'agisse d'analyse des sentiments
ou de traduction automatique. Le modèle peut être affiné vers
Excel dans le domaine souhaité. Ces modèles font l'objet d'une
formation générale qui les
prépare à aborder
les tâches standard
liées au langage, les
prépare à aborder
les tâches standard
liées au langage telles que la classification de texte, une tâche de
traitement du langage naturel largement utilisée qui consiste à classer le texte en groupes
organisés en fonction de son contenu La réponse aux questions, qui est une tâche importante dans le traitement du langage
naturel, où le modèle est entraîné pour comprendre et répondre
aux demandes avec précision, simulant
essentiellement
la capacité humaine à comprendre les questions et à
y répondre Récapitulatif de documents,
où le modèle est
chargé de produire un résumé concis et fluide d'un texte volumineux, d' conserver l'essence et les idées
principales et idées
principales générer du
texte dans de
nombreux secteurs, de
créer un texte de type humain, créer un texte de type humain, qui peut être adapté à
un secteur spécifique, qu'il
s'agisse de rédiger des e-mails
dans le cadre de la communication d'entreprise, créer une
description de produit dans commerce électronique ou génération de
rapports de patients dans le secteur de la santé. Ces modèles peuvent être affinés afin de résoudre des défis
uniques
dans divers secteurs,
notamment le commerce de détail, la finance
et le divertissement, en utilisant des ensembles de données spécifiques à des
domaines relativement plus petits Par exemple, dans le commerce de détail, ils peuvent être utilisés
pour des recommandations de
produits personnalisées basées sur des données textuelles. Dans le domaine de la finance,
ils peuvent aider à prévoir les tendances du marché
à partir des rapports financiers Dans le
secteur du divertissement, ils peuvent également contribuer à génération de
scripts ou à la recommandation de
contenu, démontrant ainsi la flexibilité et large applicabilité des
grands modèles linguistiques Décomposons ensuite le concept en trois caractéristiques principales des
grands modèles linguistiques. grands modèles linguistiques sont volumineux, polyvalents,
préformés et affinés. Discutons
de chacun d'eux séparément. Le terme « grand »
désigne deux choses. Tout d'abord, cela souligne la taille massive de
l'ensemble de données d'entraînement, atteignant
parfois l'
échelle du pétaoctet Deuxièmement, cela met en évidence l'immense nombre de
paramètres impliqués. Dans le domaine de l'apprentissage
automatique, ces paramètres sont souvent
appelés hyperparamètres Essentiellement, ces
paramètres agissent comme la mémoire et les connaissances acquises la machine
lors de l'entraînement du modèle. Ils décrivent souvent la
capacité d'un modèle
à aborder une tâche
telle que la prédiction En ajustant ces paramètres, nous pouvons affiner les performances du modèle pour des prévisions
plus précises. L'usage général signifie
que les modèles sont suffisamment
puissants pour résoudre les problèmes
courants du quotidien Ce concept repose sur
deux raisons. Tout d'abord, le langage humain
présente une nature universelle, quelle que soit la
tâche distincte à laquelle il est appliqué. Deuxièmement, nous devons tenir compte
des limites de ressources. Seul un nombre limité
d'organisations ont la capacité de former ces modèles linguistiques
massifs, qui nécessitent de vastes ensembles et une quantité énorme
de paramètres Alors pourquoi ne pas laisser ces
organisations élaborer des modèles linguistiques
fondamentaux que d'autres pourront utiliser Cela nous amène à
l'aspect final des grands modèles linguistiques, pré-formation et de la mise au point. Cela signifie essentiellement
qu'un grand modèle linguistique est d'abord préformé
pour des cas d'utilisation étendus, en utilisant un vaste ensemble de données, collectant un large éventail de modèles
et de connaissances
linguistiques. Après cette phase préalable à l'
entraînement, le modèle est ensuite
affiné pour répondre à des objectifs
particuliers à l'aide d'un données
relativement petit et plus
spécialisé Ce processus en deux étapes garantit que le modèle conserve une large
base de compréhension tout en étant capable de comprendre en
profondeur et générer des prédictions spécifiques
à un domaine ou à une tâche donné. C'est ainsi que nous concluons notre introduction aux
grands modèles linguistiques. Dans la vidéo suivante,
nous aborderons certains des avantages de l'utilisation des LLM
11. L3V2 - Avantages de LMM: Dans cette vidéo, nous allons
explorer les différents avantages
de l' utilisation de grands
modèles linguistiques, ou LLM en abrégé Nous verrons comment ces
impressionnants modèles d'IA peuvent être utilisés pour
diverses tâches,
comment ils fonctionnent avec un
minimum de données d'entraînement sur le terrain et comment ils continuent de s'améliorer à mesure que de nouvelles données et de
nouveaux paramètres sont ajoutés. Nous verrons également comment LLM s'adaptent aux différents scénarios
d'apprentissage, même avec un minimum
de données préalables J'espère donc qu'en discutant de
ces avantages, nous pourrons comprendre pourquoi les LLM constituent une avancée majeure dans le domaine de l'
intelligence artificielle présente de nombreux avantages
évidents
et percutants emploi de LLM Ils ne sont pas limités
à une seule tâche. Un modèle en lui-même est une centrale multitâche remplissant de nombreux Ces LLM sophistiqués, formés sur un
énorme volume de données et développant des milliards de paramètres, ont la capacité gérer une variété de tâches Par exemple, ils excellent lorsqu'il s'
agit de répondre aux questions. Les LLM peuvent parcourir leurs
nombreuses données de formation pour trouver les réponses les plus appropriées
et les plus précises à un large éventail de Ils sont capables de comprendre
le contexte, l'ambiguïté et même les nuances du langage, ce qui les rend très efficaces pour répondre
à des questions Le modèle génère une réponse adaptée au contexte, au
ton et à la complexité des requêtes , fournissant des réponses
précises et
adaptées au contexte En termes de génération de texte, les
LLM brillent vraiment. Ils peuvent créer un
texte de haute qualité, cohérent, adapté
au contexte
et remarquablement humain. Qu'il s'agisse de
générer une nouvelle, d'écrire un poème ou même de créer
une histoire captivante, LLM sont très compétents Ils peuvent également vous aider dans des tâches
telles que la création de contenu, l'assistance à la
rédaction et
même la rédaction de brouillons. En tenant compte de l'entrée donnée et en utilisant leur vaste base de
connaissances, ils peuvent générer un texte non seulement
grammaticalement correct, mais également riche en contenu répondant aux exigences de divers cas
d'utilisation grands modèles linguistiques sont également très performants en matière de traduction
linguistique. Dotés de la connaissance de nombreuses langues grâce à leurs
nombreuses données de formation, ils peuvent traduire avec précision des textes d'une
langue à l'autre, en conservant le sens sémantique et le contexte du texte
original Non seulement ils fonctionnent avec des langues
couramment parlées, mais les LLM peuvent également gérer des langues
moins répandues, ce qui en fait un
outil inestimable pour la
communication interculturelle En outre, ils peuvent comprendre et s'adapter
à différents dialectes, argot et langage informel,
garantissant ainsi des traductions
précises, garantissant ainsi des traductions
précises, lisibles et LLM sont également un outil puissant matière de brainstorming Ils peuvent générer des idées, suggérer des
perspectives alternatives et contribuer à la résolution
créative de problèmes. Que vous
recherchiez un titre accrocheur, une stratégie marketing unique
ou une nouvelle intrigue pour un roman, ces modèles peuvent générer nombreuses possibilités en fonction du contexte que vous leur fournissez En s'entraînant sur un
vaste éventail de données, ils ont appris
à proposer des idées
diverses et innovantes
susceptibles de susciter
davantage d'inspiration et de faire avancer votre
projet. Non seulement cela, mais
ils peuvent également émettre des critiques et des suggestions pour
améliorer les idées existantes, en agissant comme un partenaire de
brainstorming artificiel disponible à tout moment Et il y a bien plus encore. Au-delà de la tâche dont nous avons
discuté jusqu'à présent, les LLM offrent
de nombreuses autres fonctionnalités Par exemple, ils peuvent être
utilisés dans l'analyse
des sentiments, pour déterminer si un texte exprime un sentiment positif, négatif ou neutre Ils peuvent aider à résumer de
longs passages de texte. Les LLM peuvent également être utilisés
dans les systèmes de tutorat, fournissant des explications sur
des sujets complexes dans une variété de Les possibilités sont
infinies et ne cessent s'étendre au fur et à mesure que ces modèles
évoluent et s'améliorent. Un autre avantage majeur des grands modèles linguistiques
est leur capacité à fournir des performances impressionnantes avec
un minimum de données de formation adaptées à un problème spécifique Ils peuvent fournir des
résultats de qualité même lorsqu' disposent d'une petite quantité
de données spécifiques à un domaine. Cette qualité les rend
très adaptables à des scénarios d'
apprentissage comportant
peu ou pas de prise de vue. Maintenant, ne nous y
trompons pas. Permettez-moi de vous expliquer quelle
est la différence
entre l' apprentissage des prises de vue
et l'incitation à prendre Comme nous l'avons expliqué dans la vidéo d'ingénierie
rapide, invite
à prendre une photo du contexte avant l'instruction
proprement dite Ce contexte ajouté peut
aider le modèle à produire des résultats plus chargés d'émotions et plus sensibles au contexte. Nous avons également indiqué qu'il existe différents types d'invite à la
prise de vue, zéro, à une ou à quelques
prises Zero Shot invite à modifier le modèle GNAI sans exemples
préalables instructions en une seule prise
fournissent un seul exemple, et les instructions en quelques prises fournissent plusieurs exemples
pour aider le modèle Dans le contexte de l'apprentissage
automatique, l' apprentissage par étapes
fait référence à des scénarios dans lesquels un modèle est entraîné
sur un ensemble limité de données. Ce processus est particulièrement
utile dans les situations où de grandes quantités de données d' entraînement ne sont pas
disponibles ou pratiques. D'autre part,
Zero Shot fait référence à une
capacité encore plus impressionnante des modèles. Cela implique qu'un
modèle peut identifier et comprendre des concepts ou des tâches lesquels il n'a pas été
explicitement formé. C'est comme avoir un
système intelligent capable de faire des hypothèses
logiques et de fournir des solutions basées sur les
connaissances acquises,
même lorsqu'il est confronté à des scénarios
totalement nouveaux. Nous pouvons donc constater que les
LLM peuvent exceller même dans scénarios
nuls grâce à leur formation sur de vastes ensembles Ils peuvent gérer de nouvelles
situations en tirant parti leurs connaissances approfondies pour
déduire les réponses appropriées, même sans avoir
directement rencontré le scénario spécifique
dans leurs données d'entraînement Essentiellement, le LLM peut être rapidement adapté à un
large éventail de tâches, même lorsque ces
tâches ne relèvent pas
du domaine spécifique sur lequel le modèle a été
initialement formé Cette adaptabilité ouvre
un monde de possibilités pour l'utilisation de ces modèles dans divers domaines
et applications un des principaux avantages des LLM est leur
amélioration constante à mesure que nous
augmentons la quantité de données et le nombre de paramètres
impliqués dans leur formation Par exemple, considérez le
trajet entre GPT 3.5 avec 175 milliards de paramètres et GPT quatre avec environ
170 billions L'augmentation exponentielle
du nombre de paramètres a entraîné une amélioration notable capacités, de
la
compréhension et de la précision du modèle Cette tendance de croissance suggère que LLM peuvent encore évoluer alors que nous continuons à repousser
les limites des données
disponibles et des ressources
informatiques GPT 4
surpasse largement GPT 3.5 en raison de son plus grand
nombre de Il montre une meilleure compréhension
des contextes et des nuances, fournit des
réponses plus précises et performant dans les tâches de traduction
et de synthèse En outre, GPT four est plus
capable de comprendre instructions
complexes
sans avoir à les décomposer
en étapes plus petites, montre sa capacité
supérieure à
s'adapter à des scénarios d'apprentissage sans ou
peu de coups Et le quatrième avantage des LLM est qu'
en interagissant en langage naturel, ils améliorent l'accessibilité à l' IA pour tous ceux qui possèdent
un ordinateur de base, éliminant ainsi le besoin de compétences techniques
spécialisées Que vous soyez un étudiant à la
recherche d'aide pour ses devoirs, un écrivain en quête d'inspiration ou
un chef d'entreprise cherchant à analyser les tendances
du marché, LLM sont là pour vous aider Leurs capacités de reconnaissance vocale et de synthèse vocale
humaine
ouvrent des
possibilités à ceux qui ont du
mal à taper ou même à ceux qui
ne savent ni lire ni écrire. En outre, leurs capacités de
traduction de haute qualité suppriment les barrières linguistiques, rendant ces
outils puissants utilisables par des
personnes de divers
groupes démographiques et de divers horizons Essentiellement, les LLM
transforment la façon dont nous interagissons
avec la technologie, en apportant des capacités d'IA complexes à un large éventail d'
utilisateurs dans le monde entier En conclusion, les grands modèles
linguistiques font tomber les barrières et rendent l'IA accessible à tous. Grâce à leurs
capacités polyvalentes et à leur potentiel en constante évolution, LLM révolutionnent la façon dont nous interagissons avec Alors que nous nous tournons vers l'avenir, nous sommes certains de voir ces
modèles continuer à améliorer nos vies et à améliorer notre travail de manière
inimaginable Dans la vidéo suivante, nous
examinons un peu plus
en détail trois exemples de LLM Palm et Lambda de Google et de GPT d'Open AI.
On se voit dans le prochain.
12. L3V3 - Exemples de LLM: Dans cette vidéo, nous examinons quelques exemples de grands modèles
linguistiques. Nous aborderons en détail
trois LLM de
pointe , Palm, Lambda
et GPT, et nous
discuterons également d'autres LLM, qui se sont révélés prometteurs dans
le domaine de l' Commençons donc par Palm, qui est l'abréviation de
Pathways Language Model. Palm est un modèle de langage de 540 milliards de
paramètres développé par Google AI. Il est formé sur un vaste
ensemble de données de textes et codes et peut effectuer un
large éventail de tâches, notamment la réponse à des questions, l'inférence en langage
naturel, génération de
code, la traduction
et la synthèse Il utilise le système
Pathways de Google, qui lui permet
d'être entraîné sur un énorme ensemble
de données de texte et de code Avec 540 milliards de paramètres, Palm est l'un des plus grands modèles de
langage au monde. Il s'agit d'un modèle de transformateur à décodeur dense
uniquement, ce qui signifie qu'
il est spécialement conçu pour les tâches de génération de
langage naturel Palm peut atteindre des
performances de pointe en quelques coups sur
la plupart des tâches, ce qui signifie qu'il peut apprendre à effectuer une nouvelle tâche en se
basant uniquement sur quelques exemples. Palm est donc un
outil puissant pour
de nombreuses applications. Alors, qu'est-ce que le système Pathways ? Le système Pathway est une
architecture d'IA qui reste très efficace
tout en générant dans différents
domaines et tâches. Il est capable d'entraîner efficacement un seul modèle sur
plusieurs modules TPU V Four Pods, qui sont les accélérateurs d'
apprentissage automatique
conçus sur mesure par Google accélérateurs d'
apprentissage automatique
conçus Cela permet au système Pathway de
gérer plusieurs tâches à la fois, refléter une meilleure
compréhension du monde et d'apprendre rapidement de nouvelles tâches. Pathway Systems
y parvient en utilisant un certain nombre de techniques,
notamment le parallélisme des modèles Cette technique permet d'entraîner simultanément
plusieurs modèles sur les mêmes
données. Cela peut améliorer
la vitesse d'entraînement et l'efficacité du système de
parcours. Parallélisme des données. Cette technique permet d'entraîner
plusieurs copies
du même modèle
sur différents ensembles de données. Cela peut améliorer la précision du système de parcours en lui permettant d'
apprendre à partir d'une plus grande variété de données et de l'apprentissage automatique Cette technique permet au système
Pathway d' optimiser
automatiquement
ses paramètres d'entraînement. Cela peut améliorer
les performances du système
Pathway en l'empêchant de trop
s'adapter
aux données d'entraînement Le système Pathway est toujours
en cours de développement, mais il a le potentiel de
révolutionner la façon dont nous
créons et déployons des modèles d'IA En permettant
aux modèles d'orchestrer calcul
distribué
pour les accélérateurs, les systèmes
Pathway peuvent
faciliter la création et l'entraînement grands modèles d'IA complexes capables de gérer une grande
variété Passons maintenant à l'
autre LLM de Google, Lambda. Lambda est l'abréviation de Language
Model for Dialog Applications. Lambda est une famille de modèles de langage
neuronal
développés par Google AI Il est formé au
dialogue et comporte jusqu'à 130 milliards de paramètres, préentraînés sur un ensemble
de données de 1,56 billion de mots Lambda a trois objectifs clés de qualité, de sécurité
et de solidité. Ces objectifs sont mesurés par des indicateurs tels que la sensibilité, la
spécificité, l' intérêt et le caractère informatif. Lambda est conçu pour
être informatif et complet tout en
étant sûr et basé sur des bases solides. Il est capable de générer différents
formats de texte créatifs tels que des poèmes, du code, des scripts, des pièces musicales, e-mails, des lettres et bien plus encore. Il fera de son mieux pour
répondre à toutes vos exigences. Lambda a le potentiel de
révolutionner la façon dont nous
interagissons avec les ordinateurs Il peut être utilisé pour créer des expériences de
dialogue
plus naturelles et plus engageantes et pour fournir aux utilisateurs une assistance
plus utile et plus
informative. Comme nous l'avons dit précédemment, Lambda présente trois avantages principaux Un dialogue unique, naturel et
engageant. Lambda peut engager dialogue
naturel et engageant avec les humains Il peut comprendre le
contexte d'une conversation et y répondre d'une
manière à la fois informative
et intéressante. Deuxièmement, une assistance utile et
informative. Lambda peut fournir
aux utilisateurs une assistance utile et
informative Il peut répondre aux questions, générer des formats de texte créatifs
et suivre les instructions. Et trois, sains et saufs. Lambda est conçu pour
être sûr et ancré. Il est formé sur un énorme
ensemble de données de texte et de code et est capable de faire la distinction entre le contenu sûr et le contenu dangereux. Passons maintenant au GPT
d'OpenAI,
qui est l' abréviation de Generative Pretrained Transformer
Transformer Le GPT est un type de modèle d' apprentissage
profond utilisé pour
générer du texte semblable à celui de l'homme Il a été développé par OpenAI, une société de recherche à but non lucratif
et est financé par Microsoft Le GPT utilise une architecture de
transformateur, qui est un type de réseau
neuronal bien adapté aux tâches de traitement du
langage naturel Les paramètres de la
dernière version de GPT,
qui est le GPT quatre, ne
sont pas divulgués, mais ils sont probablement
beaucoup plus importants que GPT Cela signifie que GPT four a une plus grande capacité à apprendre
et à comprendre la langue GPT four s'est également
révélé compétent
pour les évaluations de compétences
telles que l'examen du barreau. Dans une étude récente,
GPT Four a obtenu un score
au 90e
percentile à l'examen du barreau, un
test standardisé requis pour être admis au
barreau dans de nombreuses juridictions Le GPT est un outil puissant qui peut être utilisé pour
diverses tâches,
notamment la génération de texte, la
réponse à des questions, la traduction de langues,
etc. Outre ce dont
nous avons discuté jusqu'à présent, il existe d'autres LLM qui
transforment notre vision de l'IA et contribuent à façonner
l'avenir du domaine Passons brièvement en revue
certains d'entre eux. Le premier est Touring
NLG by Microsoft, un modèle linguistique à plus grande échelle formé sur divers textes Internet qui est capable de rédiger des paragraphes
cohérents,
voire des articles entiers Burt by Google, un modèle
révolutionnaire basé sur un
transformateur préformé sur un vaste corpus de textes et
affiné pour diverses tâches de traitement du
langage naturel, offrant un haut niveau de
compréhension du contexte
et des significations sémantiques Transformer XL, un
modèle de langage développé par équipe du cerveau de
Google
qui
gère de manière innovante les
dépendances à long terme dans des séquences, améliorant ainsi de
manière significative
les performances de tâches telles que la génération de texte
et la traduction Il existe également Excel Net, une extension
de Transformer XL, développée par Google Brain et l'université
Carnegie Melon Il utilise une méthode d'
entraînement basée sur la permutation pour surmonter certaines limites du BIRT et surpasser sur
plusieurs benchmarks Electra est une approche de
pré-entraînement très efficace développée par Google Research qui utilise moins de puissance de calcul pour performances
similaires, voire meilleures, que des modèles tels que le BRT Nous avons le transformateur Megatron, un modèle basé sur un transformateur
développé par Nvidia, conçu pour entraîner de très
grands modèles de langage avec des milliards de paramètres Il tire parti des capacités
de traitement parallèle des GPU modernes Et nous avons
introduit ama par meta Lama est un
grand modèle de langage fondamental, plus petit mais performant Il est conçu pour élargir l'
accès à la recherche sur l'IA, nécessitant moins de
puissance de calcul et de ressources pour tester de nouvelles approches et
valider les travaux existants Lama peut également être disponible
en différentes tailles, allant de 700 000 à 65 milliards de paramètres Dans cette vidéo,
nous avons donc examiné les avancées
passionnantes des grands modèles linguistiques,
en concentrant sur Palm et Lambda de Google
AI, ainsi que sur le GPT d'OpenAI Nous avons également mis en avant d'autres modèles
remarquables dans le domaine, tels que Touring Energy,
BRT, xLnt et le méga
tron Transformer Nous avons discuté de la façon dont ces LLM, dont les paramètres peuvent atteindre
des centaines de milliards redéfinissent l'
apprentissage multitâche et révolutionnent notre interaction avec les ordinateurs
grâce Ces modèles ont déjà démontré leurs capacités
exceptionnelles dans des tâches telles que la génération de textes et même des évaluations pratiques
comme les examens du barreau, et ils ne
cessent de s'améliorer.
13. L3V4 - Modèles de base: Dans cette vidéo, vous
découvrirez les modèles de base
qui, comme leur nom l'indique, constituent la base des modèles d'IA
générative. Plus précisément, nous
commençons par fournir une définition des modèles de
base et par expliquer ce qu'ils sont. Ensuite, nous
parlerons des plateformes qui fournissent différents types
de modèles de fondations en mettant accent sur le jardin de modèles de Vertex
AI et terminerons la vidéo en discutant des différents types
de modèles de fondations Maintenant, que sont les modèles de base ? Demandons à Bart de
nous aider à répondre à la question. Il fournit trois brouillons
différents. Les modèles de base sont grands réseaux
neuronaux pré-entraînés qui peuvent être affinés
pour diverses
tâches telles que le traitement du langage naturel, vision par
ordinateur et la reconnaissance
vocale. Les modèles de base sont de grands modèles
linguistiques formés sur des ensembles de données
volumineux qui
peuvent être affinés pour diverses
tâches en aval, telles que la traduction, réponses aux
questions
et la synthèse Les modèles de base sont grands modèles
d'apprentissage automatique pré-entraînés qui peuvent être adaptés à un large éventail de tâches telles que le traitement du
langage naturel, vision par
ordinateur et la robotique. Les modèles de base sont donc de
grands modèles d'IA qui peuvent être adaptés à un large éventail de tâches et peuvent générer des résultats de
haute qualité. Même si les modèles d'IA
ne sont pas nouveaux pour nous, de base ont
quelque chose de
très différent ces modèles de base ont
quelque chose de
très différent. Ils sont dotés de
plusieurs caractéristiques clés qui les distinguent, marquant ainsi un changement significatif par rapport
aux modèles d' IA que nous avions vus
dans les générations précédentes. Les modèles de base ne
se limitent pas à une seule tâche. Ils sont multitâches. Un
modèle de base unique peut aborder un large éventail de tâches
dès le départ,
telles que la synthèse, la réponse à des
questions
ou la classification Ils peuvent gérer différentes
modalités de types de données, notamment des images,
du texte, du code, etc. Avec une
formation minimale ou inexistante, les modèles de
base peuvent très bien
fonctionner dès le départ. Ils peuvent également être adaptés à des cas d'utilisation spécifiques en utilisant seulement
quelques exemples de données. Comme ils sont
généralement entraînés sur de grandes quantités de données diverses, ces modèles peuvent apprendre des modèles et des
représentations
généraux, qui peuvent ensuite être appliqués à divers
domaines et tâches. Jusqu'à présent, les modèles de fondation
étaient difficiles d'accès. Compétences spécialisées en apprentissage
automatique et ressources informatiques requises
pour être utilisées en production. Mais avec la récente vague de
progrès dans le domaine de l' IA générative, les choses sont en train de changer
radicalement Prenons l'exemple de Vertex AI, une plateforme d'
apprentissage automatique entièrement gérée disponible sur Google Cloud Si vous connaissez déjà les outils
de Google Cloud, vous savez déjà que Vertex
AI vous permet d'accéder, de
créer, d'expérimenter, déployer et de gérer différents modèles d'apprentissage
automatique Des choses comme
la science des données traditionnelle, l'apprentissage automatique, les MLP ou simplement la création
d'une application pilotée par l'IA Vertex AI est équipé pour prendre en
charge toutes ces charges de travail. C'est plutôt cool, mais c'est là que les choses commencent
à devenir vraiment intéressantes. Google Cloud a récemment annoncé deux outils majeurs qui nous permettent encore plus
de modélisme de jardin
et de studio d'IA générative. Ces outils mettent les modèles de
base à la
disposition d'un public beaucoup
plus large, même s'ils n'ont pas beaucoup d'expérience
en matière de codage et de développement ML. La dernière section de ce
cours est consacrée à la présentation des outils d'IA de Google
Cloud Gen, et nous parlerons plus studio d'IA
générative
dans cette section. Dans cette vidéo, concentrons-nous
uniquement sur le jardin modèle. Où se trouve exactement
le XAI Model Garden ? Il s'agit d'un endroit unique
pour explorer et interagir à la fois avec les modèles leaders du
secteur de Google, ainsi qu'avec les modèles
open source populaires, ou avec le support EmlopStoling
intégré à Google Cloud pour les
entreprises Il héberge à la fois des modèles d'apprentissage
automatique traditionnels et des modèles fondamentaux pour les applications d'IA
générative Dans Model Garden, vous trouverez une gamme de modèles
issus de Google Cloud, Google Research et de
diverses sources externes, adaptés à divers formats
de données Voici donc à quoi ressemble le Model
Garden de
Vertex AI Avec de nombreux modèles
prêts à l'emploi à votre disposition, Model Garden vous permet sélectionner le modèle le plus
adapté, en fonction de votre cas d'utilisation, votre expertise en apprentissage automatique et de votre budget disponible. N'oubliez pas que nous utilisons Model Garden de
Vertex AI comme exemple de plate-forme
fournie Google Cloud pour différents outils et API d'IA générative et
d'autres
outils et API d'apprentissage automatique D'autres
entreprises ont également
leurs propres versions de
Model Garden. Par exemple, Amazon Sagemaker, IBM Watson assistant et
Vida Clara, data IKAI,
Open AI chat GPT API, Microsoft Azores
Machine Learning,
data Robot AI et Databricks
LakehousePlatform fournissent
tous des outils et des API pour les modèles d'apprentissage automatique et Databricks
LakehousePlatform fournissent
tous des outils et traditionnels et les IBM Watson assistant et
Vida Clara, data IKAI,
Open AI chat GPT API,
Microsoft Azores
Machine Learning,
data Robot AI et Databricks
LakehousePlatform fournissent
tous des outils et des API pour les modèles d'apprentissage automatique traditionnels et
les modèles de base de l'IA générative. Il existe différents types
de modèles de base, notamment la génération
et le résumé de texte, le
chat et le dialogue, la génération et la complétion de code, la
génération et modification
d'images, ainsi que les intégrations Maintenant,
examinons chacun d' eux de plus près. Modèles de texte. Ces modèles vous aident à effectuer des tâches en langage
naturel
sans qu'il y ait ou peu d'instructions. Ils peuvent effectuer des tâches
telles que la synthèse, l'
extraction d'entités et d'informations, la génération d'
idées, etc. Par exemple, un
journaliste peut utiliser des modèles de
texte pour résumer
des articles ou des rapports volumineux Un chercheur universitaire
peut extraire des entités d'information spécifiques à partir d'un vaste corpus d'articles, ou lors d'une séance de brainstorming, un entrepreneur
peut utiliser le modèle pour générer de nouvelles idées
ou perspectives. Comme mentionné précédemment,
ces modèles fonctionnent efficacement
dès leur sortie de la boîte. Toutefois, si vous souhaitez que le modèle suive certaines
spécifications, vous pouvez fournir des exemples
structurés pour guider ses réponses. Cela permet une expérience
personnalisée qui correspond à vos
besoins et objectifs spécifiques Concentrons-nous ensuite sur le dialogue. Ces modèles sont
également basés sur le texte, mais ils ont été affinés pour permettre une conversation naturelle. Les modèles de dialogue vous permettent d' engager des conversations à
tour de rôle, en conservant le contexte
tout au long de l'interaction. Imaginons un scénario dans un centre de support
client un chatbot basé sur l'IA ces modèles de dialogue
peut aider les clients à se souvenir de la tournure précédente de la conversation et à fournir des réponses
adaptées au contexte Il peut répondre à des questions,
résumer des informations ou même guider les utilisateurs à travers des procédures
complexes, ou tout en étant adapté
à votre domaine spécifique. Ces modèles peuvent vous aider à créer des outils
puissants qui
améliorent considérablement l'expérience utilisateur, qu'ils soient déployés sur un navigateur, une application mobile ou d'autres interfaces
numériques. Passons à la
complétion et à la génération du code. Ces modèles agissent comme votre assistant de codage
suralimenté. Vous pouvez créer une balise en
langage naturel pour décrire un morceau de
code que vous souhaitez écrire, ou vous pouvez utiliser le modèle pour
compléter automatiquement un morceau de code. Il existe même des extensions
pour les IDE qui peuvent prendre un extrait de code partiel en entrée et fournir ensuite
la suite probable Imaginez que vous travaillez sur un projet logiciel
complexe. Cela peut vous aider à éliminer les aspects
fastidieux du codage, voire à le
déboguer,
ce qui vous permet, en tant que
développeur, de vous concentrer davantage sur
la résolution créative de problèmes
et moins sur la syntaxe
ou le code ce qui vous permet, en tant que
développeur, de vous concentrer davantage sur la résolution créative de problèmes de routine Passons maintenant à la
génération d'images. Ces modèles
vous permettent de générer et modifier des images
selon vos spécifications. En outre, vous pouvez utiliser ces modèles pour des tâches liées aux
médias, telles que la classification, la détection d'
objets, etc. De plus, ces modèles intègrent
généralement des mécanismes de modération
du contenu pour garantir des pratiques de sécurité responsables en matière d'
IA. Imaginez que vous créez
une plateforme de commerce électronique. Un modèle de détection d'objets peut automatiquement étiqueter les articles
dans les images du produit, tandis qu'un modèle de
génération d'images peut créer de nouvelles images de produits sur la
base des descriptions. La
fonction de modération du contenu garantirait que tout le contenu généré par les utilisateurs conforme à la politique de votre
plateforme, améliorant ainsi l'expérience utilisateur,
enfin et surtout pas le moindre Parlons des intégrations, qui peuvent sembler
un peu complexes, mais c'est en fait un concept
vraiment cool Alors laissez-moi vous l'expliquer. Imaginez que vous avez une énorme corbeille de fruits et que vous
voulez les trier. Vous pouvez les trier par couleur, taille, poids ou même par goût. De même, dans le monde des données, nous avons souvent besoin de trier
ou de classer les éléments Mais
nous avons affaire à des mots ou à des
phrases, pas à des fruits. C'est là que les
intégrations entrent en jeu. Ils sont comme une carte d'identité unique
pour chaque mot ou phrase, mais au lieu d'une carte, il s'agit d'une liste de chiffres, que nous
appelons un vecteur. Cette liste de chiffres reflète l'essence de ce
mot ou de cette phrase. sens est le contexte et ses relations
avec les autres mots. Grâce aux intégrations, nous pouvons donner un
sens à des données non structurées, comme un long livre ou
un fil Twitter, et utiliser
cette compréhension pour moteurs de
recommandation
ou cibler
les publicités ou cibler Prenons par exemple
le domaine du commerce électronique. Un modèle intégré peut être utilisé pour alimenter les moteurs de
recommandation, en mettant en relation les utilisateurs avec les
produits les plus
susceptibles de les intéresser en
fonction de leur historique de navigation Ou dans le domaine du marketing numérique, ces modèles peuvent améliorer les systèmes de ciblage
publicitaire, permettant ainsi une publicité hautement
personnalisée. Ils peuvent également être utilisés pour des tâches de classification
complexes, des fonctionnalités
de recherche et
de nombreuses autres applications. En conclusion, les modèles de
base représentent une
avancée significative dans le domaine de la technologie de l'IA. Ils offrent une base puissante
et adaptable qui peut être utilisée pour un large éventail de tâches
dès la sortie de la boîte. Grâce à des plateformes telles que Model Garden de
Vertex AI, ces outils sont plus
accessibles que jamais, mettant ainsi les
capacités avancées de l'IA à la disposition d'une
population d'utilisateurs beaucoup plus large Qu'il s'agisse de tâches en langage naturel dialogues
multitours, de mise en œuvre de
code , de génération
et de modification d'
images ou d'extraction d'
informations sémantiques, les applications potentielles
de ces modèles sont vastes Qu'il s'agisse d'améliorer le
service client grâce à des chatbots intelligents, aider les développeurs à générer du code
automatiquement ou de dynamiser les moteurs de
recommandation, les modèles de
base
façonnent l'avenir de l'IA Grâce aux modèles de base et à
la puissance de l'IA générative, nous ne nous contentons pas
de prédire l'avenir. Nous sommes en train de le construire.
Dans la vidéo suivante, nous verrons certaines des applications
étonnantes proposées par
différents types de modèles d'IA
générative.
14. L3V5 - Développement de LLM: Parlons de la manière dont les grands modèles
linguistiques sont développés. Dans cette vidéo, nous commençons
par une comparaison entre le développement du LLM et le développement traditionnel de
l'apprentissage automatique Ensuite, nous
parlerons de trois principaux types
de LLM et, à la fin, discuterons d'un concept appelé raisonnement par chaîne
de pensée et de la façon dont cela peut aider à concevoir de
meilleures instructions pour les Commençons par
comparer le
développement de LLM à l'
aide de modèles préexistants à approche traditionnelle
du développement de l'apprentissage
automatique Dans le monde du LLM, il n'y a aucune condition préalable
à une expertise technique ou à des
exemples de formation approfondis, et devinez quoi ? Vous pouvez également oublier la formation des
modèles. Tout repose sur l'
art d'un design rapide, clair, concis et riche
en informations utiles. D'autre part, l'apprentissage
automatique traditionnel vous oblige à vous retrousser les manches et à étudier en
profondeur des exemples de formation, former des
modèles,
et même parfois avoir besoin de connaissances de base en matière de matériel et de puissance informatique. Il existe trois
principaux types de LLM :
générique, réglé par instructions et
réglé par dialogue Chacun de ces modèles nécessite son propre style d'invite. Les modèles linguistiques génériques fonctionnent comme la saisie automatique de votre téléphone, prédisant le mot suivant en
fonction des modèles
linguistiques des données d'apprentissage Les modèles adaptés aux instructions,
quant à eux, répondent à
des directives spécifiques, qu'il
s'agisse de résumer un texte, générer un poème dans le
style d'un poète célèbre ou de proposer une
analyse sentimentale d'une déclaration Ces modèles suivent
les instructions intégrées à l'entrée. Enfin, nous avons des modèles optimisés pour le
dialogue. Il s'agit d'un sous-ensemble de modèles adaptés aux
instructions spécialement conçus pour un contexte
interactif, peu comme une discussion avec un bot Passons donc à des exemples de ces trois types et
voyons-les en action. Avant de passer à
des exemples de différents types de LLM, donnons une
définition des jetons Un jeton est une unité de données
traitée par le modèle. Il peut s'agir d'un mot
ou d'une partie d'un mot. Nous allons commencer par les modèles linguistiques
génériques. Ils sont assez simples. Leur tâche principale est de prédire le mot suivant en fonction du contexte fourni
par les données d'entraînement. Prenons un exemple simple. Le chat s'est assis dessus et maintenant
nous voulons savoir quel est
le mot suivant le plus probable Le modèle nous
dit que c'est cette réponse. Tout comme le
suggéreraient les fonctionnalités de
saisie automatique de votre téléphone suggéreraient les fonctionnalités de
saisie automatique C'est un
aperçu fascinant de la façon dont l'IA peut imiter la façon dont nous communiquons
naturellement Passons aux modèles
adaptés aux instructions, ces modèles brillent lorsqu'il
s'agit de générer des réponses. Ils s'inspirent des instructions
données dans
la saisie, qu'il
s'agisse d'une demande visant
à résumer un texte, générer un poème dans
un style particulier ou même à classer
un sentiment textuel. C'est comme si vous disposiez de votre
propre assistant numérique, toujours prêt à exécuter vos
instructions avec précision. Enfin, nous avons les modèles adaptés aux
dialectes, qui sont un type spécialisé de modèles
d'instructions ajustés Cependant, ils ne se contentent pas
d'attendre des instructions. Ils sont formés pour engager une
conversation aller-retour. Vous pouvez généralement
les rencontrer sous la forme de chatbots Si vous avez déjà posé une question à un assistant
virtuel, vous avez probablement interagi
avec ce type de modèle Il s'agit de permettre une
interaction conversationnelle naturelle Il est maintenant temps d'explorer
un concept intéressant, le raisonnement par chaîne de pensée. Il s'agit d'une observation selon laquelle les
modèles produisent des réponses
correctes avec plus de
précision lorsqu'
ils génèrent pour la première fois une voie ou une chaîne de raisonnement
menant à la réponse. Prenons un exemple simple. Roger possède cinq balles de tennis
et achète deux autres canettes, chacune contenant trois balles. Combien de balles
Roger a-t-il maintenant ? Au début, le modèle peut avoir mal à fournir
la bonne réponse. Cependant, après avoir présenté
le problème une deuxième fois, le modèle a plus
de chances de trouver
la bonne réponse. Le raisonnement par chaîne de pensée
aide à améliorer les capacités
de compréhension et de
réponse des grands modèles linguistiques. En conclusion, le
développement et le déploiement de grands modèles linguistiques ouvrent nouvelles perspectives
passionnantes dans le
monde de l'apprentissage automatique. Au fur et à mesure que nous améliorons et
affinons ces technologies, nous anticipons un avenir où compréhension
avancée du langage par IA modifiera radicalement notre interaction avec les plateformes
numériques Maintenant que nous comprenons
comment les LLM sont développés, il est temps de comprendre pourquoi il est
important de
les adapter à des tâches spécifiques et comment nous pouvons ajuster les
LLM de manière efficace Rendez-vous dans la prochaine vidéo.
15. L3V6 - Tuning LLM: Dans cette vidéo, nous allons
parler de l'importance d'adapter les
LLM à des tâches spécifiques et de la
manière de le faire efficacement. C'est une
idée intéressante d'avoir un modèle capable de tout
gérer. Mais dans la pratique, les LLM comportent leur juste
part de limites Pour accroître leur
fiabilité et leur efficacité, LLM doivent être affinés pour des tâches spécifiques et sur des connaissances de domaine
spécifiques Tout comme un athlète professionnel spécialisé dans son sport, ces modèles doivent affiner leurs compétences pour maîtriser
leurs performances. Commençons par un exemple de tâche
simple. Réponse à une question. Il s'agit d'un sous-domaine du traitement du langage
naturel qui à répondre
automatiquement aux questions posées dans le
langage courant Ces systèmes de questions-réponses sont des outils puissants capables de
répondre à un large éventail de questions, qu'elles soient
factuelles ou
basées sur des opinions , grâce à leur formation
approfondie sur le texte et Cependant, l'
ingrédient secret du succès de ce modèle
réside dans la connaissance du domaine. Réfléchis à ceci. Lorsque vous développez un modèle d'assurance qualité
pour le support client, soins de santé ou la chaîne d'approvisionnement, connaissance du
domaine devient
une exigence essentielle. En matière de support client, un LLM adapté au
domaine peut fournir des informations pertinentes sur les abonnements et les services, garantissant ainsi à vos clients un service
efficace assisté par l'IA Dans le domaine de l'éducation, ces modèles peuvent fournir des informations
détaillées
sur les cours, les frais de
scolarité ou les politiques
académiques. Pour les soins de santé, ils pourraient
servir d'
outils d'autogestion pour les patients, fournissant des informations essentielles
liées à la santé. Les entreprises de vente au détail
pourraient bénéficier de meilleurs chatbots basés sur l'IA et d'une meilleure visualisation des
produits, améliorant ainsi l'expérience
client Et dans le domaine de la gestion de la chaîne
d'approvisionnement, LLM peuvent fournir des informations logistiques
et des informations d'inventaire
précieuses Et n'oublions pas
les grandes entreprises technologiques. Ils pourraient utiliser ces modèles pour fournir un
support technique supérieur aux clients. Chaque secteur a ses
propres exigences, et le réglage d'un LLM, conformément à ces
spécifications, peut considérablement améliorer
l'efficacité du modèle Alors que les modèles de
questions-réponses génératifs peuvent utiliser leur
base de connaissances sur les trains pour répondre à des questions sans avoir besoin de connaissances
spécifiques au domaine, des questions sans avoir besoin de connaissances
spécifiques au domaine, le
fait d'ajuster ces modèles en fonction de connaissances spécifiques à un
domaine améliore considérablement leur
précision et leur fiabilité Cela revient à fournir au modèle une carte détaillée du terrain sur
lequel il est censé naviguer. Prenons l'exemple de Vertex AI. Il fournit des modèles de
base spécifiques aux tâches qui sont déjà adaptés
à divers cas d'utilisation. Supposons que vous souhaitiez mieux comprendre les sentiments de
vos clients à l'égard vos produits ou services. Vertex AI dispose d'un modèle de tâches d'
analyse des sentiments parfaitement adapté à
cette tâche Vous travaillez peut-être dans le secteur du commerce de détail
ou de l'immobilier et vous devez effectuer des analyses
d'occupation. Il existe également un modèle spécifique aux tâches
conçu pour cela. Ces modèles, conçus
pour des tâches spécifiques, démontrent la valeur du réglage Ils sont plus
efficaces, ciblés et efficaces dans leurs tâches
respectives. La possibilité de sélectionner et d'
utiliser un modèle adapté à vos besoins spécifiques
peut
améliorer considérablement l'efficacité globale
de vos solutions d'IA OK, il est maintenant temps de définir officiellement ce que
nous entendons par réglage. Le réglage fait référence au processus
consistant à adapter un modèle
pré-entraîné à une tâche plus spécifique,
telle qu'un ensemble de cas d'utilisation
personnalisés ou nouveau domaine, en
l'entraînant sur de nouvelles données. Le réglage est réalisé en
entraînant le modèle sur de
nouvelles données pertinentes
pour la tâche à accomplir. Par exemple, si nous travaillons dans le secteur juridique
ou médical, nous collecterons des données de
formation ces domaines afin d'ajuster
notre modèle en conséquence. Mais qu'est-ce que le réglage fin ? Considérez le réglage fin comme un
ajustement de haute précision du modèle. Vous apportez votre propre ensemble de données
et vous réentraînez le modèle, ce qui affecte chaque
poids du LLM Cela peut être un travail exigeant en main-d'œuvre et en
ressources et nécessite d'héberger votre
propre modèle raffiné. Et cela peut le rendre
peu pratique pour de nombreux cas d'utilisation. Mais il est important de savoir
qu'un modèle affiné est doté d'un haut niveau
de précision et de spécificité. Prenons un exemple
concret pour illustrer le pouvoir
du réglage fin. Imaginez un modèle de
fondation de santé qui a reçu formation
approfondie sur un large
éventail de données de santé. Il peut effectuer diverses
tâches de manière fluide, répondant à des questions médicales, en
analysant des images médicales, trouvant des patients présentant
des affections similaires, et bien plus encore. Ce succès s'explique par le fait qu'il été affiné avec
des connaissances spécifiques au domaine. Ce faisant, il devient un spécialiste
plutôt que un généraliste, fournissant des résultats précis
et fiables dans le contexte des soins de santé Ce processus souligne
l'immense potentiel et la polyvalence du réglage, transformant un modèle unique en un
outil hautement spécialisé permettant de
naviguer dans des scénarios de soins de
santé complexes Le réglage précis est un excellent moyen d'améliorer les performances d'un modèle, mais tout comme la rénovation d'
une maison entière, cela peut s'avérer coûteux et
pas toujours pratique Donc, si nous cherchons
un moyen plus efficace d'ajuster de grands
modèles linguistiques, que pouvons-nous faire ? L'une des approches à suivre est méthodes de réglage efficaces par
paramètres, ou PETM en abrégé Imaginez que le PETM
donne à votre modèle une cure de jouvence plutôt qu'
une rénovation complète Normalement, avec un réglage précis, nous ajustons tous les
paramètres du modèle, ce qui est compliqué
et prend beaucoup de temps. Mais avec le PETM, nous nous
concentrons sur la modification d'un petit sous-ensemble de ces paramètres ou même sur l'
ajout de quelques nouveaux Peut-être ajoutons-nous des couches
supplémentaires
au modèle ou
ajoutons-nous une information supplémentaire. Trouver le
meilleur moyen d'y parvenir reste un sujet d'actualité
parmi les chercheurs Le principal point à retenir ici est que le
PETM est comme un raccourci. Cela nous permet d'éviter de devoir
recycler l'ensemble du modèle, nous
permet d'économiser du temps, des
efforts et des ressources De plus, cela simplifie même le processus d'
utilisation
ultérieure de ces modèles , car nous utilisons simplement le modèle de base et ajoutons
nos éléments supplémentaires. Nous sommes maintenant arrivés à
la fin de notre exploration du monde
des grands modèles linguistiques. Dans cette section, nous avons acquis des informations
précieuses sur les LLM, en commençant par une introduction à leur structure et à leur fonction Nous avons discuté des nombreux
avantages de l'utilisation des LLM et en avons fourni quelques
exemples,
notamment Palm, Lambda et Nous avons également parlé du
processus de développement du LLM, en soulignant en quoi il est
différent du développement traditionnel de
l'apprentissage automatique Et surtout, nous avons souligné l'importance du réglage
des LLM Découvrez comment cela améliore leur
fiabilité et leur précision. Nous avons vu comment les connaissances
spécifiques à un domaine peuvent améliorer considérablement leurs performances
et nous avons découvert des méthodes de réglage
efficaces, telles que les méthodes réglage efficaces par
paramètres. Dans la section suivante,
nous allons
nous familiariser avec quatre
outils principaux de Google Cloud qui nous
permettent d'accéder à des modèles d'IA
générative, de les affiner
et modèles d'IA
générative, de les affiner
et créer nos propres applications d'
IA générative.
16. L4V1 - Fiche d'application: Parlons d'apshet plateforme sans code
innovante de Google qui
tire parti de la puissance de l'IA
générative pour transformer le développement d' applications à Imaginez un monde dans lequel n'importe qui, quelles que soient ses compétences en matière de
codage, peut
créer rapidement des applications centrées sur les données
pour Google Workspace. C'est exactement ce pour quoi
apsheet est conçu. N'oubliez pas le processus fastidieux du développement d'applications traditionnel, de la conceptualisation
à la rédaction des
spécifications du projet, de la
collaboration d'équipe au codage, ce fut un voyage long et
exhaustif Mais avec apsheet, le cycle de vie
du développement des applications a été
considérablement rationalisé Ce qui prenait auparavant des mois peut désormais être accompli en
quelques jours, voire en quelques heures, vous
permet de consacrer plus de temps à des tâches
plus importantes La beauté d'Apshet
réside dans sa polyvalence. Il vous permet de créer des
applications pour plusieurs plateformes, notamment des applications de bureau, mobiles
et de chat. Apsheet fournit une gamme d' applications aussi
variées que vos besoins spécifiques. Il se peut que vous gériez un
entrepôt et que vous ayez besoin d'une solution rationalisée
pour le suivi des stocks. Peut-être que vous organisez
un événement d'entreprise majeur et que vous avez besoin d'un outil de planification d'
événements détaillé, ou peut-être que vous menez une vaste campagne
marketing à multiples facettes et que vous avez besoin d'une application pour coordonner
les nombreux éléments mobiles De la gestion de la
relation client
à la coordination de la chaîne d'approvisionnement, planification des
employés à la gestion de
projet. Apsheet est suffisamment adaptable pour répondre
à vos besoins spécifiques. Sa flexibilité et sa polyvalence ouvrent la voie à
d'innombrables scénarios, ce qui en fait une plateforme incontournable pour développement d'applications personnalisées centrées sur les
données. Tant que vous avez une idée
claire de ce
dont vous avez besoin et que vous pouvez
l'expliquer en langage naturel, apsheet peut vous aider à transformer cette
idée en application Alors plongeons-nous plus profondément. Apshet a récemment introduit de
nouvelles fonctionnalités, toutes alimentées par l'IA générative Vous pouvez désormais transformer votre idée en une
application entièrement fonctionnelle en quelques minutes, et vous pouvez le faire
en utilisant le langage naturel. Par exemple, vous souhaitez créer une application pour suivre les dépenses
de voyage. Tout ce que vous avez à faire est de
décrire votre processus d'apset. Aphet prend ensuite le relais pour poser des questions de
suivi afin de mieux comprendre les
exigences de votre application Une fois qu'Apsheet a rassemblé
suffisamment d'informations, il présente un aperçu
des tableaux votre application et
fournit même des exemples de données
pour vous aider à les tester Ensuite, Upseet crée l'application
de démarrage pour vous. Dès que l'application est prête, vous pouvez la lancer, l'essayer et apporter les
modifications nécessaires. Il est intéressant de noter que vous
pouvez continuer à utiliser le langage
naturel pour spécifier les modifications
souhaitées, et apsheet
vous aidera à affiner votre application Créer une application en langage
naturel
sans aucun codage, c'est la magie d'apsheet Il permet à chacun de
développer des applications pour son organisation
rapidement et efficacement. Voyons donc comment Apsheet tire parti de l'IA générative
pour rendre cela possible Lorsque l'utilisateur
interagit avec Apheet,
Dialogflow et l'IA générative, assistés par un LLM formé sur mesure, travaillent ensemble pour fournir les informations nécessaires à la création de
l'application Dialect Flow rassemble des informations
essentielles sur le problème commercial de l'utilisateur qu' Apsheet utilisera pour créer une application de
démarrage Apsheet essaie de faire en sorte que
cette application
corresponde le plus possible à
la solution idéale de l'utilisateur Une fois que Direct Flow a rassemblé
les informations requises, Apsheet envoie une
demande au LLM pour l'
aider à générer
le modèle de données et les vues nécessaires à l'application Lorsque le LLM fournit
le bon schéma, apsheet utilise toutes les informations
collectées pour créer une application de démarrage
en quelques minutes seulement L'application fournie inclut
une base de données complète, une interface d'application intuitive et toutes les configurations
spécifiques exprimées
au cours de l'interaction, telles que les
préférences de notification. Une fois que l'application de démarrage est prête, les utilisateurs peuvent continuer à
collaborer avec Apsheet pour affiner et
améliorer encore l'application En fonction de la
complexité de la demande, apsheet peut utiliser à la
fois Dialogflow et le LLM au cours de cette interaction La combinaison de
Dialect flow et du LLM améliore
les capacités d'
Apheet, lui permettant de gérer les demandes de développement d' applications les plus complexes Vous pouvez même personnaliser
ces deux technologies. Pour le flux de dialecte, vous pouvez le
personnaliser pour vous aider à
créer des interfaces de
chat conversationnelles Voici comment procéder. Vous devez d'abord créer un agent de flux de
dialectes. Définissez ensuite votre
intention et vos entités personnalisées. Une fois cela fait, l'API
Dialect Flow est là pour vous aider à intégrer cet agent dans
votre application Essentiellement, vous
adaptez une technologie sophistiquée
à vos besoins spécifiques Pour le LLM, vous pouvez
concevoir un modèle répondant aux exigences
uniques de votre application avec le studio d'IA
génératif Vertex AI Cette plateforme présente une
gamme de modèles fondamentaux issus de Google Cloud que vous pouvez affiner en fonction
de vos besoins Vous pouvez y parvenir en
formulant et en ajustant les instructions en affinant les
modèles à l'aide de vos propres données En conclusion, en
tirant parti des technologies d'
intelligence artificielle génératives, particulier du flux
Dialect de Google et d'un LLM personnalisé, Appset permet à toute
personne de développer applications basées sur les
données sans aucune expérience de codage et
en très peu C'est devenu une plate-forme
puissante qui permet aux utilisateurs de générer différentes applications en langage
naturel. est ainsi que
s'achève cette section consacrée quatre puissants outils d'IA
générative disponibles sur Google Cloud. Dans la prochaine et dernière
section de ce cours, nous essaierons d'utiliser
ces outils pour créer notre propre application en utilisant
la puissance de l'IA générative.
17. L4V2 - Gen App Builder: Le générateur d'applications Jen disponible via Vertex AI de Google
Cloud associe de
manière magistrale les modèles de
base la puissance de l'IA de recherche
et de conversation, permettant à un nouvel éventail d'utilisateurs
de créer applications d'
IA génératives
innovantes en temps et
sans aucune compétence de
codage requise L'aspect humain et
la nature engageante des
interactions en ligne offrent aux
utilisateurs l'
occasion d'améliorer leurs liens avec
leur public potentiel. Pour les entreprises, cela signifie une meilleure communication
avec les clients, les employés et les partenaires. Avec Jen App Builder, création de ces puissantes applications
GN AI ne nécessite
aucun codage. Pensez à créer votre assistant numérique
personnalisé, moteurs de recherche
personnalisés, bases de
connaissances, vos
applications pédagogiques et bien plus encore Avec Jen App Builder, vous avez le pouvoir de donner vie à de
telles visions. Le Jen App Builder dispose d'
une interface Dragon
Drop conviviale, ce qui facilite considérablement le processus de conception et de développement
des
applications. Il dispose d'un
éditeur visuel qui vous permet de créer et de modifier
facilement le contenu de
votre application. Le
moteur de recherche intégré permet aux utilisateurs de trouver des informations
dans l'application, tandis que le moteur d'
intelligence artificielle conversationnel permet des interactions
en langage naturel Le Jen App Builder offre donc la flexibilité nécessaire pour créer une expérience de recherche d'entreprise, une
expérience de conversation ou de chat, ou même les deux. Le processus est simple. Vous commencez par créer
une source de contenu, qui peut être un document
Word ou une feuille de calcul contenant des
informations sur votre entreprise Ensuite, vous devez sélectionner les fonctionnalités que
vous souhaitez
intégrer à votre application. Il peut s'agir d'une recherche, d'un
chat ou des deux. Et une fois que vous avez terminé,
il vous suffit de cliquer sur Créer. Mais attendez, il y en a plus. Cette application
vous permet également de contrôler et de
personnaliser les réponses générées ou de créer des réponses par défaut. Si cela ne suffit pas, vous pouvez toujours accéder à un contrôle
granulaire réponses grâce à
des options permettant de
contrôler le type de réponse, définir des termes interdits et désactiver les
réponses générées en cas de besoin Mais ne t'inquiète pas. Même si les réponses
générées sont désactivées, votre application basée sur GAI
peut toujours répondre à des questions
complexes grâce à la technologie de recherche de
Google Jen App Builder a également la capacité d'effectuer des transactions au
nom de l'utilisateur. Grâce à l'intégration de flux
préstructurés pour les cas d'utilisation
courants
tels que la vérification statut des
commandes ou l'
explication des factures, vous pouvez facilement ajouter ces fonctions à votre application
en un seul clic, mais cela ne se limite pas à fournir des fonctionnalités prédéfinies Il vous permet de créer votre
flux de transactions unique à l'aide d' une interface simple basée sur des graphiques pour définir une logique
métier de haut niveau. Si vous préférez, vous
pouvez même utiliser la
création de flux
basée sur des instructions pour expliquer votre logique à l'aide d'un langage naturel
simple. Une fois que vous êtes satisfait de la configuration de
votre application, celle-ci est prête à être testée. Et si tout semble bon, intégrations intégrées de
Jen App Builders facilitent lancement fluide de votre application sur
votre site Web ou sur les plateformes de
messagerie populaires Il offre également une connectivité
avec les partenaires de téléphonie. Pour déployer votre nouvelle application, il
vous suffit d'obtenir le code de déploiement du
widget. C'est aussi simple que cela. Vous pouvez donc voir que Jen App Builder
vous permet de publier facilement votre conversation ou votre searchbt un site Web ou de vous connecter à des applications de messagerie
populaires Jen App Builder exploite la
puissance de l'IA pour vous permettre créer des chatbots capables de gérer des
tâches telles que répondre à des questions spécifiques à un
domaine, traiter des entrées multimédia et fournir des réponses
multimodales Ces robots de discussion peuvent guider
les utilisateurs vers du contenu pertinent et fournir des réponses génératives basées sur l'IA,
même s'ils ne possèdent pas de connaissances spécifiques sur le
domaine. Ils peuvent également effectuer
des transactions, résumer les informations à l'aide de l'IA et avoir la
flexibilité de suspendre
et de reprendre les conversations
chaque fois que cela est nécessaire. Avec Jen Apbilder,
vous créez une assistance
numérique qui redéfinit les normes
des interactions normes
des En conclusion, c'est dans
Jen Abuilder que se rejoignent les points forts des modèles fondamentaux
actuels de Google, la recherche
d'entreprise et l'IA
conversationnelle Il vous permet de créer
sans effort des applications
avancées qui
redéfinissent Son interface conviviale
et son éditeur visuellement
attrayant ouvrent la voie à la création et à la modification du contenu de l'application
avec un minimum d'effort Avec des fonctionnalités allant des moteurs de recherche
intégrés à un moteur d'intelligence artificielle conversationnel et à une interface conviviale et
intuitive, Jen App Builder propose une boîte à outils complète pour
créer des applications
dynamiques réactives Vous pouvez créer des chatbots
capables d'entrer du contenu multimédia, de réponses
multimodales et de poser des questions spécifiques à un
domaine Et avec leur capacité à effectuer des transactions, à suspendre
et à reprendre les conversations, ces chatbots sont bien
plus que de simples robots Ils sont conçus pour gérer les tâches
et les interactions les plus complexes, tout en étant
faciles à publier et à connecter à votre site Web ou à des applications de messagerie
populaires. Passons maintenant au prochain générateur
d'applications intéressant disponible sur la feuille d'application Google
Cloud.
18. L4V3 - Maker Suite: Maker SID est un outil intuitif basé sur un
navigateur conçu pour permettre un prototypage rapide et
convivial avec Palm to model L'intégration de
Maker SUID à l'API
Palm signifie que nous
pouvons désormais accéder à l'API via une interface
graphique conviviale L'API Palm est une passerelle vers grands modèles linguistiques
et les outils d'IA générative de
Google, facilitant ainsi le prototypage rapide
et accessible Cette plateforme
vous permet de tester
rapidement des modèles et d'expérimenter
avec différentes instructions. Vous pouvez l'utiliser pour créer
et affiner vos instructions, ajouter des données synthétiques à
votre ensemble de données personnalisé, générer des intégrations de
pointe
et ajuster facilement vos modèles personnalisés Et si vous trouvez
quelque chose qui vous convient,
make your Suite vous offre la possibilité de le transformer
en code Python, ce qui permet d'appeler
le modèle à l'aide de l'API Palm. Palm API et Maker Suite forment le duo parfait pour le développement de l'IA
générative. L'API Palm est votre
point de départ pour accéder aux LLM de Google, offrant aux développeurs
la liberté d'utiliser des modèles optimisés
pour diverses tâches D'autre part,
Maker Suite fournit une interface intuitive pour commencer à prototyper et à créer
vos applications uniques Jetons maintenant un coup d'œil
à Maker Suite et voyons comment nous pouvons commencer à prototyper avec grands modèles linguistiques
en quelques minutes seulement. Voici donc à quoi ressemble l'intérieur de
Maker Suite. Jetons un coup d'œil à ce
menu sur la gauche. Ici, nous pouvons créer de nouvelles invites. Comme nous pouvons le constater, il existe
trois types d'
invites différents dans lesquels nous pouvons
créer des invites de texte, des invites données et des invites de chat Nous avons également accès
à notre bibliothèque, qui est la page
actuellement ouverte. Si vous allez chercher ApiKey, nous pouvons voir qu'ici, nous avons la possibilité de créer une clé d'API pour un nouveau projet Et d'autres liens
rapides sont également disponibles. Il existe un guide pour
vous aider à démarrer. Il existe une galerie d'invites qui vous
permet d'explorer différents
types d'invites. Vous trouverez de la documentation sur l'API ainsi que des informations supplémentaires sur la politique de confidentialité et
les conditions d'utilisation. Revenons maintenant à notre bibliothèque et essayons
différentes instructions. Le premier est une
invite de texte. Essayons-le. Donc, ici, il y a
des choses intéressantes à explorer. La première chose à remarquer
sont ces exemples d'instructions. Voici quelques exemples
pour nous aider à avoir une meilleure idée de ce à quoi pourraient ressembler ces
instructions De plus, si vous
prêtez attention aux manuels, nous pouvons voir que certains
exemples nous sont fournis Lisons certains d'entre eux. Classez une pomme dans la catégorie des
fruits ou des légumes. Ecrivez une fonction JavaScript
et expliquez-le-moi. Pour paraphraser, il
semblerait qu'il soit sur le point de pleuvoir, et bien
d'autres exemples Il indique simplement le type
d'invite que vous pouvez utiliser comme exemple
d'invite textuelle Explorons maintenant l'un
des exemples
fournis ici. Jetons un coup d'œil aux
réflexions occasionnelles. L'invite serait donc de le réécrire
dans un e-mail ordinaire, puis de fournir
un texte pour un e-mail Je peux cliquer sur Exécuter et maintenant je peux voir que
le modèle de langage a créé une réponse à mon invite. Explorons l'autre type
d'invite, l'invite de données. Donc, ici, nous pouvons voir qu'il
y a deux parties différentes. Le premier est un tableau pour
écrire nos exemples rapides. Et la deuxième partie est de nous
aider à tester notre prompt. Regardons donc un exemple
et voyons à quoi cela ressemblerait. Essayons les contraires. Dans les exemples, nous voyons
que nous fournissons quatre exemples différents
de ce que chacune de ces entrées devrait
recevoir en sortie. Donc, si notre invite est de trouver un mot ou une phrase
ayant un sens opposé, nous pouvons fournir des exemples
, par exemple si l'entrée est forte, la sortie doit être faible. Si l'entrée est épaisse, la sortie doit
être fine et ainsi de suite. Après avoir fourni ces exemples, nous pouvons tester notre invite. Maintenant, nous posons la question du modèle linguistique. Si l'entrée est erronée, quelle sera la sortie ? Et si l'entrée est rapide, quelle doit être la sortie ? Et maintenant, si nous
exécutons, nous constatons qu'en
réponse à une erreur, le modèle
de langage crée correctement, et pour la saisie rapide, le modèle de langage crée lentement. Nous pouvons voir que pour chaque entrée, le modèle de langage crée
le contraire de la sortie. Explorons le troisième type
d'invite, l'invite de chat. Ici, nous pouvons également voir
qu'il y a deux parties. Il y a une partie pour écrire nos exemples rapides et une autre partie pour
tester notre invite. Examinons donc certains
de ces exemples. Essayons de discuter avec un extraterrestre. Ainsi, dans l'exemple, nous fournissons un certain contexte. Incarnez un extraterrestre vivant sur l'une des lunes de Jupiter et donnez
un exemple de conversation Si l'utilisateur dit «
comment ça va », le modèle doit dire « je
vais bien » et ainsi de suite. Si vous souhaitez ajouter
d'autres exemples, nous avons l'option ci-dessous. Maintenant, nous pouvons tester notre modèle. Donc, en réponse, nous disons : « J'aimerais visiter ».
Que dois-je faire ? Mais le modèle fournit une réponse pertinente et poursuit
la conversation. Nous pouvons continuer à interagir avec le modèle en écrivant
plus d'instructions. Nous avons également quelques options
pour régler le modèle ci-dessous. Le premier est
un aperçu du texte de la même
invite sur laquelle nous travaillons. Qu'il s'agisse d'une
invite de table ou d'une invite de chat, nous pouvons toujours avoir accès à la version texte
de la même invite. Grâce à l'autre, nous
pouvons affiner notre modèle. Nous pouvons choisir le type
de modèle que nous voulons utiliser. Nous pouvons définir la température
qui définit le niveau de hasard ou
de créativité du modèle, et nous pouvons également personnaliser le nombre de sorties que le
modèle doit produire Des paramètres plus
avancés sont également disponibles. Donc, pour récapituler,
nous sélectionnons d'abord notre
type d'invite et saisissons une invite, y compris des exemples
et des instructions Quel que soit le type d'invite que
vous utilisez, vous avez toujours la
possibilité de le voir sous forme de texte. Si vous devez tester
les résultats des modèles, make your suit vous permet de
réutiliser
facilement les instructions de
différentes manières en utilisant les
entrées de test dans vos instructions Nous avons également la possibilité
de modifier les paramètres du
modèle. Par exemple, il existe une option
permettant de modifier le réglage de la
température, ce qui influence le caractère aléatoire
des réponses des
modèles Une valeur plus élevée permet
souvent d'obtenir des résultats
plus inattendus
, voire plus créatifs. Nous pouvons également apporter
des ajustements supplémentaires aux paramètres
tels que les séquences d'arrêt , le
nombre de sorties, etc. Enfin, une fois que vous êtes
satisfait de votre demande, vous pouvez l'enregistrer, le partager et même l'exporter vers différents environnements
de développement. Pour enregistrer vos instructions, Maker Suite propose une fonction de bibliothèque
d'instructions, agit comme un
espace de stockage sécurisé pour toutes vos instructions, rendant facilement récupérables Vous pouvez également enregistrer vos
instructions sur votre Google Drive. Pour partager votre invite, il suffit de cliquer sur
le bouton Partager. Et si vous souhaitez exporter votre travail vers un environnement de
développement, il vous suffit de cliquer sur le bouton Obtenir le code. Vous pouvez exporter vos instructions
dans le format qui vous convient. Code Python ou JavaScript, objets
JSON ou même
sous forme de commande CURL. Votre travail dans Maker Suite,
y compris les paramètres, les instructions et les
exemples de test , est enregistré dans
cet extrait de code En conclusion,
la combinaison de API
Palm et de make
your Suite offre une approche
incroyablement pratique
et conviviale prototypage avec de
grands modèles linguistiques Ils mettent la puissance de l'IA
générative entre vos mains, offrant la flexibilité nécessaire
pour expérimenter, modifier et affiner jusqu'à ce que vous ayez créé l'application parfaite
pilotée par l'IA On se voit dans le prochain.
19. Studio d'IA générative L4V4: Alors que l'intelligence artificielle
générative suscite de plus en plus d'intérêt, nous pouvons constater que sa
capacité à accélérer le
processus de prototypage d'applications change la donne Si vous avez accès
aux bons outils tels que
Generative AI Studio et aux autres
fonctionnalités GNAI
disponibles dès maintenant via
Vertex AI sur Google Cloud,
vous pouvez expérimenter, adapter et perfectionner de nouvelles idées en un Et par Snap, je veux dire minutes ou des heures plutôt que
des semaines et des mois. Pour créer une application, il
suffit d'ouvrir le studio d'IA générative dans la section Vertex AI de
la console Google Cloud Sélectionnez la modalité avec laquelle
vous souhaitez travailler,
choisissez le
format de votre choix, saisissez
votre message et ajustez paramètres du
modèle pour un contrôle
accru Avec Generative AI Studio, vous avez la possibilité d'
explorer et de personnaliser modèles d'IA
générative parfaitement adaptés à vos applications
Google Cloud. Vous pouvez même intégrer ces applications à votre
site Web ou à votre application mobile Dans cette vidéo, nous
allons découvrir Generative AI Studio
disponible sur Vertex AI Mais avant cela,
voyons brièvement quels autres outils sont
disponibles sur Vertex AI Voici donc à quoi ressemble l'intérieur de
Vertex AI. Si nous élargissons le
menu de gauche, nous pouvons voir tous
les outils à notre disposition. Nous pouvons constater que
nous avons accès à un jardin
modèle, à un établi
et à des canalisations Nous avons également un studio d'IA
générative, dont nous
parlerons prochainement. En outre, nous disposons d'
outils pour la gestion des données, le développement de
modèles, ainsi que le déploiement et l'utilisation de
modèles. Generative AI Studio aide
les développeurs à créer et à déployer modèles en fournissant des outils et ressources qui
facilitent le démarrage. Generative AI Studio vous permet tester et de
personnaliser
rapidement divers modèles de base de Google
grâce à des instructions et réglages, et vous permet de
déployer facilement vos modèles personnalisés Dans Generative Va Studio, vous pouvez accéder aux modèles de
base du langage, de
la vision et de la parole de
Google . La disponibilité de
certaines modalités varie. Par exemple, vous pouvez constater qu' au moment de l'
enregistrement de cette vidéo, je n'ai pas accès
aux modèles de vision. Concentrons-nous donc sur le
langage et la parole. Concentrons-nous sur le langage pour le moment. Vous pouvez cliquer sur la
langue dans le menu de gauche ou ouvrir le bouton en bas de
la zone de langue. Si vous souhaitez avoir une
meilleure idée de la façon dont vous pouvez utiliser GN AI Studio à différentes
fins, vous devriez explorer
la galerie d'instructions. Avant d'explorer les
différents types d'invites,
jetons un coup d'œil à
la galerie d'invites Nous pouvons voir ici une variété
d'exemples d'instructions préconçus pour aider à
démontrer les capacités du modèle Les exemples d'invites sont
classés par type de tâche, tel que la synthèse, la
classification et l'extraction Regardons un exemple. Lorsque vous ouvrez l'exemple d'invite, vous pouvez constater que les invites sont préconfigurées avec un
modèle et des valeurs de paramètres spécifiques Vous pouvez donc simplement cliquer sur Soumettre et obtenir le modèle
pour générer une réponse. Pour travailler directement avec
les modèles linguistiques, nous avons trois options. Interagissez avec le modèle sous forme libre ou sous forme
d'instructions
structurées, interagissez avec l'
agent en tant que chatbot ou créez un modèle personnalisé mieux
adapté à nos cas de test Explorons l'invite de texte ou de
code dans un format
libre. Essayons donc de concevoir et de
tester vos propres instructions. Ici, je peux donner
une invite au modèle et lui demander de
produire une réponse. Je viens de fournir un long
article ici et je demande au modèle de fournir un bref résumé de
l'article suivant. Pour différents types de demandes, je peux également utiliser mon microphone et
parler directement au modèle Sur le côté droit, nous pouvons
également voir qu'il existe certains paramètres que nous pouvons
utiliser pour configurer le modèle. Nous pouvons choisir le type
de modèle que nous voulons utiliser. Ici, nous avons deux
modèles de langage et deux modèles de. Nous pouvons régler la température
du modèle, qui contrôle le degré de
hasard ou de créativité Nous pouvons également définir la limite de jetons, qui détermine
la quantité maximale de texte sortie à partir d'une invite. Top K modifie
la façon dont le modèle sélectionne les
jetons pour la sortie. Top P modifie
la façon dont le modèle sélectionne les
jetons pour la sortie, et nous pouvons également définir différents seuils
de filtre de sécurité. Nous pouvons donc maintenant demander au modèle de produire une réponse
à notre demande. Cliquez sur Soumettre. Et nous pouvons voir que
le modèle résume le long article
en trois lignes. Si vous faites
quelques suggestions,
un modèle d'invite structuré
est disponible pour vous
faciliter la tâche en fournissant un formulaire
contenant du contexte et des exemples Pour les
instructions structurées,
revenons à notre exemple de
classification des vins Nous pouvons fournir un certain
contexte au modèle, qui indique comment le
modèle doit réagir Nous pouvons également fournir plusieurs
exemples du modèle. Ces exemples aident le modèle comprendre à quoi ressemble une réponse de
modèle appropriée. Nous avons également nos paramètres
sur le côté droit. Nous avons également la possibilité d'ajouter d'autres colonnes pour des exemples plus
complexes. Et pour tester le modèle, nous fournissons une entrée, que ce soit en l'écrivant dans la section de saisie ou en
parlant directement au modèle. Et lorsque je clique sur Soumettre, le modèle génère
une réponse pour moi. Nous pouvons facilement convertir n'importe quelle invite
structurée en format libre. Et c'est à ça que ça ressemble. Vous pouvez choisir de
lancer un chat textuel ou codé pour démarrer une
conversation avec le modèle. Vous pouvez fournir un contexte
et des exemples d' interactions pour mieux
orienter la conversation. Tous les paramètres de configuration
du modèle sont également
disponibles ici. Maintenant, essayons une invite de chat. Dans l'invite de discussion, nous avons la possibilité de fournir un certain
contexte au modèle, qui lui indique
comment il doit réagir Nous pouvons également fournir des
exemples pour aider le modèle à comprendre à quoi ressemblerait
une réponse appropriée. Par exemple, si l'
utilisateur dit cela, le modèle doit le dire. Nous avons également la possibilité de fournir d'autres exemples
au modèle. Après avoir fourni suffisamment de
contexte et d'exemples, nous pouvons commencer à discuter
avec l'agent. Donc, si vous demandez combien de planètes se trouvent dans le système solaire, le modèle fournit une réponse
appropriée. De même, nous pouvons poser
d'autres questions et le modèle continue de fournir des réponses
appropriées et
précises, conformément aux
exemples que nous avons fournis. Voyons maintenant comment créer un modèle optimisé à l'aide de
notre propre base de données. Nous avons la possibilité
de régler un modèle afin qu'il soit mieux
adapté à nos cas d'utilisation. Vérifions-le. Ici, nous pouvons choisir notre jeu de données
JSON et définir un emplacement pour stocker
l'ensemble de données dans le cloud. Après avoir fourni le jeu de données, nous pouvons ajuster les détails du modèle, puis nous
pouvons ajuster le modèle fonction de notre ensemble de données
et de nos paramètres. Pour décider quel modèle
convient le mieux à nos cas d'utilisation spécifiques, nous pouvons consulter la
bibliothèque de modèles de base de Google
, disponible
dans Model Garden. Dans Model Garden, vous pouvez
explorer les modèles par modalité, tâche et par d'autres fonctionnalités Avec de nombreux modèles
prêts à l'emploi à votre disposition, Model Garden
vous permet de sélectionner le modèle le plus adapté
en fonction de votre cas d'utilisation, votre expertise en apprentissage
automatique et de votre budget disponible. OK, il est temps de
vérifier les modèles vocaux. Il est maintenant temps d'explorer
les modèles vocaux. Nous pouvons choisir le discours
soit dans le menu de gauche, soit en cliquant sur le bouton
Ouvrir sous la zone de dialogue. Ici, nous avons deux options
différentes, le texte en discours
ou le discours en texte. Passons à la synthèse vocale. Ici, nous pouvons soit fournir le texte, soit
parler directement au modèle. Après avoir fourni le texte, nous avons quelques options pour choisir différentes langues ou régler
la vitesse du discours. Si tout semble correct, nous pouvons cliquer sur Soumettre. Et maintenant, nous avons une voix artificielle synthétisée qui
peut lire ce texte pour nous Pour créer une application, il
suffit d'ouvrir le studio d'IA générative dans la section Vertex AI de
la console Google Cloud Sélectionnez la modalité avec laquelle
vous souhaitez travailler, choisissez votre format préféré Pour des fonctionnalités plus avancées,
telles que la prise en charge d'un son plus long, nous pouvons utiliser Speech Studio et voici à quoi ressemble l'
environnement. Nous avons également un système de synthèse vocale. Ici, nous pouvons soit télécharger un fichier audio, soit
enregistrer notre propre voix. Et après avoir fourni le
discours au modèle, nous pouvons voir qu'il le
transforme en texte. Alors maintenant j'ai enregistré ma
voix et je clique sur Soumettre et voici mon
discours transformé en texte. Nous pouvons également utiliser le Speeches Studio pour les applications de
synthèse vocale. Les deux fonctionnalités,
la synthèse vocale
et synthèse vocale, sont disponibles
dans le studio vocal. Après avoir personnalisé votre modèle, plusieurs options s'
offrent à vous. Vous pouvez enregistrer l'invite dans
la galerie d'invite. Vous pouvez également effectuer un déploiement sur la plateforme d'
apprentissage automatique de
Vertex AI pour la production et la gestion Vous pouvez également implémenter vos nouveaux modèles directement dans votre site Web
et vos applications. En conclusion, grâce au studio Generative
AI de Vertex AI, nous pouvons accéder à des modèles de langage, de
vision et de parole Grâce aux modèles de langage,
nous sommes en mesure de tester, d' ajuster et de déployer des modèles de langage d'
IA génératifs. Nous pouvons également accéder à l'API Palm ou Cody
pour la génération de contenu, chat, le résumé,
le code, etc. Avec les modèles de vision,
nous sommes en mesure d'écrire instructions
textuelles pour générer de
nouvelles images à l'aide de
l'API imagine Nous pouvons également générer de nouvelles
zones pour une image existante. Et avec les modèles vocaux, nous pouvons convertir la parole en
texte à l'aide de l'API chirp Nous pouvons également synthétiser la
parole à partir de texte en utilisant le modèle
vocal universel ou USM de Google,
et c'est ainsi que se termine cette vidéo sur le studio
Generative Va
sur Vertex AI
20. Démo - Démo de la fiche d'application: Dans notre
vidéo d'introduction sur apsheet, nous avons vu que grâce à
apsheet, nous pouvons créer des applications personnalisées
sans écrire Google a récemment ajouté des fonctionnalités
GNAI, qui nous permettent d' expliquer
directement le
type d'application dont nous avons besoin
pour créer une application de démarrage basée
sur cette Nous pouvons ensuite
modifier et personnaliser davantage l'application de démarrage uniquement en
discutant avec Apheet Prenons l'exemple
suivant. Anne Gray est directrice
d'une entreprise et l'une de ses responsabilités est de superviser les
demandes de voyage de ses collègues Ces demandes peuvent
provenir de courriels, discussions ou de réunions, ce qui peut être assez
accablant. Elle se demande si la fonctionnalité
d'IA
générative apsheet peut l'aider à rationaliser
ses opérations en
proposant une solution
d' approbation et de
suivi de la Pour l'essayer, elle
décide d'explorer l'application de chat apsheet
disponible sur Google Chat Voyons comment cela fonctionne. Pour accéder à
cette fonctionnalité de chat, nous allons sur chat.google.com Ensuite, nous sélectionnons Explorer les applications
et trouvons l'application de chat apshet. Voyons maintenant à quoi
ressemblerait le processus du point de vue d'
Ann. Sur la première page, nous pouvons voir qu'apsheet souhaite
la bienvenue à l'utilisateur et l' invite à
soumettre une description d'une application ou d'un
problème commercial qu'il souhaite résoudre Par exemple, en
décrivant un flux de travail. Pour ce faire, Ann
décrit brièvement ce
dont elle a besoin pour simplifier le processus de
réception et d'approbation des demandes de
voyage par les gestionnaires réception et d'approbation des demandes de
voyage Elle ajoute à la description en indiquant les types
de données qu'elle devra également suivre.
Après avoir saisi l'invite, Ushid répond par un schéma
général de l'application Dès la première
demande d'Ann, Upshd a reconnu que l'application devait avoir
un flux d'approbation et Upshd a reconnu que
l'application devait avoir
un flux d'approbation et lui a demandé de choisir
le mode d'envoi des notifications de
demande d'approbation Comme nous pouvons le voir, différentes options
sont disponibles ici,
ne sélectionne que le courrier électronique pour le moment. Ensuite, apshet suggère
quelques écrans qu'elle pourrait souhaiter inclure, un formulaire permettant aux utilisateurs de
soumettre de nouvelles demandes, une liste récapitulative des voyages, voyages
à venir et
quelques autres vues Ces écrans sont essentiellement l'épine dorsale du schéma d'application d'
Anne. Il décrit en quoi consiste son
application. Comme elle ne veut pas d'écran M
Travel dans son application, elle le désélectionne
pour le
supprimer de l'application,
puis clique sur App Maintenant qu'Apsheet
sait quoi créer pour l' application Ann's
Travel request, elle confirme les tables qui
pourraient être créées dans la base de données
Apsheet Ces ensembles de données sont
créés en fonction des écrans ou
des vues d'applications
qu'elle vient de sélectionner Upsheet crée deux tables pour prendre en charge Schema, Travel et Team Nous n'avons pas encore saisi de
données dans notre application Toutes ces tables
seront
donc vides. Si nous n'avons aucune
donnée dans l'application, comment pouvons-nous tester pour
voir si tout fonctionne ? J'y ai pensé aussi, bouleversé. Après avoir créé les tables, Upseet propose la possibilité d'
inclure des exemples de données dans l'application Anne est prête à tester l'
application, elle choisit donc « oui ». Enfin, apseet invite Anne à choisir un
nom pour son application A appelle ce symbole le
voyage, et c'est tout. La réponse suivante d'Apshet
est un lien vers un aperçu entièrement fonctionnel de l'application qui vient d'être
créée Faisons une pause et jetons un coup d'
œil à ce que
nous avons fait jusqu'à présent. Grâce à quelques échanges de questions
et réponses, apseet a pu répondre à
la demande d'Ann, rédigée en langage
naturel, et j'ai recommandé
plusieurs solutions, notamment les écrans que les utilisateurs de
son application devront voir Ce qu'ils devront faire et l'endroit où les
données seront stockées. Il a même configuré la
notification par e-mail aux utilisateurs. La création d'une application en langage
naturel
sans codage est une magie qui est
désormais une réalité dans la feuille d'application Il permet à de nombreux nouveaux
utilisateurs de développer des applications rapidement
et efficacement. Ensuite, Anne
a la
possibilité de prévisualiser
l' application qui a
été créée pour elle ou de plonger dans l'
éditeur Ashot pour Elle choisit d'abord de jeter un coup d'
œil à l'aperçu. En naviguant dans l'émulateur d'
application sur son bureau, elle explore les vues générées par l'
abse, en
commençant par les nouveaux voyages, en passant par les voyages par utilisateur
et enfin les voyages à et enfin Cette dernière vue affiche
à la fois une carte et une liste de voyages
futurs, toutes remplies
des exemples de données qu'elle
a décidé d'inclure précédemment. Tout semble
être en ordre jusqu'à présent. Mais Ann remarque qu' une vue qu'elle avait en tête
est absente de l'application. Elle a un
ajout particulier en tête un écran qui compile toutes les demandes de voyage dans
un tableau de bord complet, fournissant à l'équipe financière une réponse à une question
fréquemment posée Quel est le coût total du voyage de
chaque employé ? Dans l'éditeur, et remarque que la fonctionnalité d'IA générative qu'elle utilisait auparavant est également
disponible ici. Elle saisit sa demande
pour un nouveau tableau de bord, et Abscht
prend rapidement sa demande, décortique et suggère les composants nécessaires
pour Elle propose une nouvelle
colonne calculée pour son tableau d'équipe et donne un aperçu du graphique qui représentera
les données agrégées, comme elle l'a fait
auparavant et souhaite examiner chaque élément
des modifications suggérées Elle consulte donc le
graphique d'aperçu. Et ça a l'air bien. Elle inspecte ensuite la nouvelle colonne la base
de données pour s'assurer que
tout y est bien Elle utilise le lien
fourni pour voir le changement proposé dans le tableau d'approbation dans
la base de données des feuilles. jetant un coup d'œil aux
chiffres, elle confirme que la nouvelle vision et les
modifications apportées aux données correspondent à
ses attentes. Elle approuve les modifications dans l'éditeur de feuille de notes,
et c'est tout Son application est maintenant en ligne et prête à être utilisée et elle sent qu'elle
a ce dont elle a besoin. Elle a une grande confiance dans les tableaux et les colonnes que l'apseet a
créés pour elle Comme elle est satisfaite des
fonctionnalités de son application, elle se débarrasse des exemples de données, déploie l'application et les
partage avec son équipe Son équipe peut désormais consulter
cette version améliorée de l'application et commencer à soumettre
ses demandes de voyage. Quelques semaines plus tard,
alors qu'Anne parcourt l' intranet de
son entreprise pour trouver un formulaire spécifique, une
idée lui vient à l'esprit. Anne retourne chez le rédacteur en chef. Sachant à quelle fréquence son
équipe utilise Google Chat, elle envisage d'utiliser la fonctionnalité de l'application de chat
sans code d'Apsheets Cela permettrait à
son équipe de récupérer le formulaire requis simplement en
discutant avec symbol travel Anne retourne dans l'
éditeur et active le voyage par
symboles en tant qu'application de chat pour les espaces internes de son domaine. Cette étape permet
aux collègues
d'Anne d' ajouter des symboles à
leurs espaces de discussion Google, discussions de
groupe ou même à leurs conversations
privées. Il est maintenant temps de passer en
revue les paramètres. Par défaut, l'application
de chat Symbol Travel affichera une liste de toutes les vues d'
applications accessibles aux utilisateurs. Mais Anne développe cette
version de chat spécifiquement
pour les utilisateurs finaux. Les employés qui souhaitent
principalement utiliser l'application pour
soumettre des demandes de voyage. Elle choisit uniquement les vues d'
application nécessaires pour ses utilisateurs, ce qui signifie qu'elle doit
tout supprimer sauf les formulaires de demande. Ensuite, elle ajoute un
message de bienvenue à ses utilisateurs, fournissant un contexte sur façon d'interagir
avec le chat. Elle décide d'inclure
une commande slash. En ajoutant cette commande, chaque fois qu'un utilisateur tape une barre oblique NETRIP, l'application de chat affiche rapidement le formulaire de demande
de voyage Aphit fournit également une commande de recherche
intelligente. Cette commande permettrait à
ses coéquipières d'utiliser pipeline de
traitement du langage naturel d'
Apht pour rechercher des données ou des vues dans son application Mais elle décide de garder les choses simples et désactive la commande de recherche
intelligente Sa dernière tâche consiste à
mettre en place une automatisation pour informer les utilisateurs chaque fois que leur statut d'approbation de
voyage change. Dans cette page, vous pouvez créer le bon flux en utilisant
une interface graphique. Elle peut ainsi jeter les bases de l'automatisation
nécessaire Une fois que c'est fait, elle
donne un nom à son automatisation, peaufine quelques détails
sur le moment où elle
doit s' exécuter et la façon dont les réponses doivent être traitées, puis retourne au générateur d'applications de chat
pour terminer le Grâce au déploiement de l'application de
chat sans code d'Apshts, n'a pas besoin de
configuration supplémentaire pour que son application ou son
automatisation fonctionnent dans Upshet s'occupe de toute la configuration
de la
plateforme Google Cloud arrière-plan, le tout en un seul
clic est maintenant prête
à partager son
application de chat avec l'équipe.
Et voilà. L'application de chat est maintenant
en ligne et est prête à être installée et utilisée par l'ensemble de
son organisation. Supposons maintenant que Jeffrey Clark, un membre de l'équipe d'Ann,
décide d'utiliser l'application. Jeffrey doit être approuvé pour ses projets de voyage pour visiter
les locaux du client. Comme il a déjà installé
l'application de chat Symbole Travel, il écrit la barre oblique
New Trip Command pour afficher le formulaire de demande
de voyage Jeffrey saisit tous les détails
nécessaires concernant son prochain voyage dans
le formulaire et clique sur Soumettre. Du côté d'Anne, elle peut voir la demande de
Jeffrey
apparaître presque instantanément La nouvelle
demande d'approbation déclenche d'une notification par e-mail au responsable de
Marcus Jeffrey. Marcus reçoit un e-mail détaillant la demande de
voyage de Jeffrey. Après avoir examiné les
détails de la soumission, Marcus approuve le formulaire directement
depuis son compte Gmail. En quelques secondes, Jeffrey remarque une
notification de chat provenant du déplacement des symboles. Le message est une confirmation
d'approbation de voyage. Félicitations Jeffrey
et bon voyage. En conclusion, nous avons été témoins la puissance de la fonctionnalité d'IA
générative d'App Sheets. Cela a aidé Ann à créer et personnaliser une solution
pour gérer les demandes de voyage de
son équipe en
langage naturel et sans code. An
a résolu efficacement un défi commercial en créant une application de
demande de voyage adaptée aux besoins de son équipe. L'intégration parfaite avec Google Chat et le bon
fonctionnement, comme en témoignent demande de voyage de
Jeffrey et approbation rapide de
Marcus soulignent l'accessibilité
et l'efficacité de la plateforme. C'est le pouvoir du développement
sans code. APSHETSGenerative AI révolutionne le développement
sans code en le
rendant accessible, rendant accessible,