Gen AI 0-100 : des bases aux outils Google Cloud

Reza Moradinezhad, AI Scientist

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

- 1.
  
  Introduction à GenAI
  
  2:50
- 2.
  
  L1V1 - IA traditionnelle
  
  18:42
- 3.
  
  L1V2 - Machine Learning
  
  19:10
- 4.
  
  L1V3 - Apprentissage approfondi
  
  14:55
- 5.
  
  L1V4 - Discrimination vs générative
  
  11:54
- 6.
  
  L2V1 - Transformateurs
  
  7:53
- 7.
  
  L2V2 - Gen IA
  
  14:52
- 8.
  
  L2V3 - Applications d'IA de génération
  
  12:47
- 9.
  
  L2V4 - Ingénierie rapide
  
  11:24
- 10.
  
  L3V1 - LLM
  
  6:41
- 11.
  
  L3V2 - Avantages de LMM
  
  10:23
- 12.
  
  L3V3 - Exemples de LLM
  
  10:13
- 13.
  
  L3V4 - Modèles de base
  
  12:51
- 14.
  
  L3V5 - Développement de LLM
  
  5:23
- 15.
  
  L3V6 - Tuning LLM
  
  8:54
- 16.
  
  L4V1 - Fiche d'application
  
  6:56
- 17.
  
  L4V2 - Gen App Builder
  
  6:11
- 18.
  
  L4V3 - Maker Suite
  
  10:16
- 19.
  
  Studio d'IA générative L4V4
  
  12:56
- 20.
  
  Démo du projet - Fiche d'application sans code
  
  12:06

Niveau débutant

Niveau intermédiaire

Niveau avancé

Tous niveaux

101

apprenants

projets

À propos de ce cours

Bienvenue dans le cours complet sur l'IA générative – votre guide ultime pour maîtriser le domaine passionnant de l'intelligence artificielle générative. Ce cours vous fournit les conseils et les compétences essentielles pour vous épanouir dans ce domaine en pleine expansion, dont la valeur devrait atteindre 100 milliards de dollars dans les années à venir.

Avec des heures de contenu détaillées, des diapositives de cours et un éventail de ressources précieuses, ce cours est le cours sur l'IA générative le plus détaillé disponible, axé sur les bases de cette technologie révolutionnaire. Que vous n'ayez aucune expérience en programmation ou que vous cherchiez à approfondir votre compréhension, ce cours vous mènera de débutant à expert. Voilà pourquoi :

Le cours est dispensé par un doctorat en informatique, avec de nombreuses publications et des années d'expérience dans l'enseignement dans des universités du monde entier.
Vous travaillerez avec les outils et les technologies révolutionnaires utilisés par les grandes entreprises telles qu'OpenAI et Google.
Aucun raccourci n'est pris. Attendez-vous à des présentations attrayantes, des quiz et des projets pratiques, des ressources téléchargeables, des articles et bien plus encore.

Développé au fil d'années d'enseignement de niveau universitaire, le programme a été affiné en fonction des retours des étudiants et des tests du monde réel.

Nous avons appris à des milliers d'étudiants à coder, dont beaucoup sont devenus développeurs professionnels ou ont lancé leurs propres entreprises technologiques.

Grâce à des tutoriels vidéo étape par étape, vous acquerrez tout ce dont vous avez besoin pour réussir dans le domaine de l'IA générative.

Le cours comprend plusieurs heures de tutoriels vidéo HD et renforce votre apprentissage avec des assignations pratiques.

Les principaux sujets abordés dans ce cours complet incluent :

Le rôle du quick design dans la génération de sorties spécifiques
Les modèles de fondation et leur influence sur l'IA générative
Créer des applications avec AppSheet et intégrer l'IA générative
Différents types de modèles d'IA génératifs (texte en texte, texte en image, etc.)
Génération de code à l'aide d'outils tels que Bard (Gemini), ChatGPT 3.5 et GPT-4
Modèles de grandes langues (LLM) et leurs avantages
Techniques d'ingénierie rapides pour les LLM
Créer des moteurs d'IA communicationnels
L'importance du deep learning dans l'IA
Modèles spécifiques aux tâches dans le jardin modèle
Formation et déploiement des modèles avec Gen AI Studio et Maker Suite
Créer des applications d'IA générative personnalisées

À la fin du cours, vous serez équipé pour appliquer les techniques d'IA générative pour donner vie à vos idées créatives et développer des solutions innovantes dans différents secteurs.

Rejoignez-nous aujourd'hui et attendez-vous à :

Leçons vidéo animées
~4 heures d'enseignement par un professeur d'université
Projets pratiques et pratiques en IA générative
Quizz et opportunités de pratique
Articles sur mesure sur l'IA générative
Plus de 1 000 $ de matériaux de cours et de programme d'apprentissage sur l'IA générative

À qui s'adresse ce cours ?

Toute personne intéressée à comprendre le domaine en évolution rapide de l'intelligence artificielle avec un potentiel créatif.
Ceux qui souhaitent explorer le monde fascinant de l'IA générative et ses applications innovantes.
Les personnes souhaitant exploiter la puissance de l'IA générative à des fins commerciales.
Les apprenants qui souhaitent suivre un cours unique et complet couvrant tout ce qu'ils doivent savoir sur l'IA générative.

Rencontrez votre enseignant·e

Reza Moradinezhad

AI Scientist

Enseignant·e

Hello, I'm Reza.

I am passionate about designing trustworthy and effective interaction techniques for Human-AI collaboration. I am an Assistant Teaching Professor at Drexel University College of Computing and Informatics (CCI), teaching both undergraduate and graduate level courses. I am also an AI Scientist at TulipAI, leading teams of young students, pushing the mission of empowering media creators through ethical and responsible use of Generative AI.

I received my PhD in Computer Science from Drexel CCI. My PhD dissertation focused on how humans build trust toward Embodied Virtual Agents (EVAs). I have collaborated with MIT Media Lab, CMU HCII, Harvard University, and UCSD, publishing and presenting in venues such as Springer Nature, ACM CHI, and ACM C&C. I have been re... Voir le profil complet

Compétences associées

IA et innovation IA pour le développement Bases de l'IA Art génératif Prompts Outils d'IA Développement sans code

Level: All Levels

Projet de cours pratique

Pour presque toutes les vidéos de ce cours, il y a une lecture correspondante et un quiz correspondant. N'oubliez pas de profiter du matériel fourni ici pour maximiser votre apprentissage. Vous pouvez télécharger vos réponses aux quiz ou vos réflexions sur les articles et en discuter avec vos pairs.

Quant à votre projet, rendez-vous sur Google AppSheet | Créez des applications sans code et votre propre exemple d'application sans code en fonction de ce que vous avez appris dans la vidéo de démonstration du projet. Vous pouvez partager des captures d'écran, des enregistrements d'écran ou des liens directs vers vos applications pour que vos pairs puissent voir et célébrer votre succès.

Daria Ispas 3 j'aime

1 commentaire

Yu Ling Lim 3 j'aime

1 commentaire

Notes attribuées au cours

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Introduction à GenAI: Il existe de nombreux cours sur l'IA générative. J'ai passé beaucoup de temps à en passer en revue bon nombre d' entre eux parce que je voulais m' assurer que dans ce cours, je vous donne tous les principes fondamentaux dont vous avez besoin pour bien comprendre ce qu'est l'IA générative. Et en plus de cela, je vais vous donner quelques exemples pratiques, des démonstrations pratiques sur différents outils utilisant l'IA générative qui peuvent vous aider aujourd'hui Je suis le professeur Reza et j'enseigne aux étudiants de premier cycle et des cycles supérieurs des sujets liés à l'informatique et à l'intelligence artificielle J'ai également des milliers d'étudiants en ligne. J'ai fait des recherches sur l'IA et j'ai collaboré avec des instituts prestigieux tels que le MIT Media Lab, Carnegie Mellon, l'université Harvard et l'université de Californie à San Diego Et les résultats de ces travaux ont été publiés dans des sites tels que Springer Nature et ACL Je vais utiliser toute cette expérience et tout ce que j'ai appris au cours de toutes ces années pour vous expliquer comment vous pouvez comprendre la transformation de IA traditionnelle en IA générale. Ce cours est divisé en cinq sections différentes. Dans la première section, nous aborderons l' intelligence artificielle traditionnelle. Nous donnerons une définition de ce qu'est l'intelligence artificielle. Nous aborderons également ce qu' est l'apprentissage automatique et discuterons des différents types d'apprentissage automatique, notamment l' apprentissage non supervisé, l'apprentissage supervisé et l'apprentissage par renforcement, et nous aborderons également le deep learning et la différence entre le deep learning discriminant et le deep learning génératif et le deep learning génératif Dans la deuxième section, nous verrons comment faire distinction entre l'IA générative et l'apprentissage automatique traditionnel. Ensuite, nous parlerons de l'IA générative et nous fournirons quelques exemples d'IA générative. Nous discuterons de ce que sont les transformateurs et manière dont ils changent la donne en matière d'intelligence artificielle Nous aborderons également des sujets tels que l' ingénierie rapide et les modèles de fondation. Nous aborderons ensuite les différents types d'IA générative et dans cette section , nous présenterons quelques exemples de génération de code à l'aide de l'IA. Dans la troisième section, nous aborderons les grands modèles linguistiques. Nous les présenterons et fournirons également une comparaison entre le LLM et l'IA générative, et nous discuterons également des avantages du LLM Dans la quatrième section, nous parlerons des différents types d' outils fournis par Google Cloud afin que nous puissions utiliser l' IA générative pour nos propres projets. Dans la dernière section, je fournirai une démonstration sur la façon de les créer à l'aide de l'IA générative sans écrire une seule ligne de code. Donc, si vous souhaitez découvrir ce qu' est l'IA générative et comment vous pouvez l'utiliser dans votre vie quotidienne, allons-y. 2. L1V1 - IA traditionnelle: Dans cette vidéo, nous proposons une introduction à l'intelligence artificielle traditionnelle. L'intelligence artificielle est une discipline au même titre que la physique ou la chimie. Il s'agit d'une branche de l' informatique qui traite de la création d'agents intelligents, c'est-à-dire de systèmes capables de raisonner, apprendre et d'agir de manière autonome D'une manière plus formelle, IA est la théorie et le développement de systèmes informatiques capables d'exécuter des tâches nécessitant normalement l'intelligence humaine. L'un des sous-domaines de l' IA est l'apprentissage automatique. L'apprentissage automatique est un programme ou système qui entraîne le modèle à partir de données d'entrée. Ce modèle entraîné peut faire des prédictions utiles à partir de données nouvelles ou inédites tirées des mêmes données utilisées pour entraîner le modèle. L'apprentissage automatique donne aux ordinateurs la capacité d'apprendre sans programmation explicite. L'apprentissage profond est un autre sous-domaine de l' IA. deep learning est un type d' apprentissage automatique qui utilise un réseau neuronal artificiel. Les réseaux neuronaux artificiels s'inspirent de la structure du cerveau humain et peuvent être utilisés pour traiter modèles complexes que les algorithmes d'apprentissage automatique traditionnels ne peuvent pas utiliser. Nous aborderons l'apprentissage automatique et deep learning plus en détail plus loin dans cette section. Mais avant cela, donnons un aperçu de l'IA. Le reste de cette vidéo est structuré comme suit. Tout d'abord, nous allons fournir un exemple concret d'utilisation de l'intelligence artificielle. Ensuite, nous fournirons un bref historique de l'IA. Ensuite, nous essaierons de comprendre ce qu'est l'intelligence artificielle, puis nous aborderons les différents types d'IA, différentes applications de l'IA, et nous discuterons également de ce à quoi ressemblera l' avenir de l'IA. Lorsque nous parlons de l'IA qui nous simplifie la vie, les maisons intelligentes sont un excellent point de départ. Voici comment cela fonctionne. Dans une maison intelligente, nous avons des appareils électroménagers et des capteurs à commande vocale. Ils sont comme votre propre assistant personnel qui ajuste l'éclairage et la climatisation en fonction de la météo extérieure Ensuite, il y a le système de sécurité. Il est toujours à l' affût pour détecter tout mouvement inhabituel à l'extérieur et vous avertir immédiatement Voici la partie vraiment cool. Tous ces appareils communiquent entre eux. Ils sont connectés et peuvent même communiquer avec votre voiture. Par exemple, en ouvrant la porte du garage lorsque vous entrez dans votre allée et, pour couronner le tout, vous pouvez gérer tous ces appareils depuis votre téléphone où que vous soyez L' IA peut faire tant de choses pour nous. Mais avant de nous laisser distraire par les applications, prenons un peu de recul et découvrons comment l'intelligence artificielle est née Voici une chronologie de l'intelligence artificielle. En 1950, Alan Turing a inventé le test de tournée, un test de la capacité d'une machine à présenter comportement intelligent équivalent ou distinct de celui d'un humain En 1956, John McCarthy a inventé le terme intelligence artificielle et a organisé le Dartmouth Summer Research Project on Artificial Intelligence, la première conférence sur l' En 1969, Shake the Robot a été construit, le premier robot mobile à usage général. Bien que simple par rapport aux normes actuelles, Shake a marqué une étape importante dans le développement de l'IA en démontrant sa capacité à traiter des données et à effectuer des tâches dans un but précis. En 1997, Deep Blue a battu le champion du monde d'échecs Gary Kasparov la première fois qu'un ordinateur battait un humain dans un jeu complexe. La victoire de Deep Blue a constitué une avancée majeure pour l'IA, démontrant la capacité des ordinateurs à apprendre et à s'adapter. En 2002, le premier aspirateur robotique à succès commercial a été introduit. de la décennie 2005-2015, nous avons assisté au développement d' un certain nombre de nouvelles technologies d'intelligence artificielle, notamment la reconnaissance vocale, automatisation des processus robotiques ou RPA, robots dansants, les maisons intelligentes et les voitures autonomes En 2016, AlphaGo, un programme informatique développé par Google Deep Mind, a battu le champion du monde de Go Lee Sidle La victoire d'Alpha Go a marqué une étape majeure pour l'IA, démontrant la capacité des ordinateurs à maîtriser des jeux stratégiques complexes. En 2017, la technologie des transformateurs a été présentée dans un article intitulé Attention Is All You Need. La technologie des transformateurs est désormais largement utilisée dans les tâches de traitement du langage naturel telles que traduction automatique et le résumé de texte. En 2020, GPT Three, un grand modèle de langage développé par OpenAI, a été publié GPT Three est capable de générer du texte de qualité humaine, traduire le langage et d'écrire différents types de contenu créatif Enfin, en 2023, outils d'IA de Google Cloud Gen sont sortis, fournissant une suite d'outils permettant aux développeurs de créer et de déployer des applications d'IA. La même année, Bart, un grand modèle de langage développé par Google AI, a été publié. L'art est capable de répondre à vos questions de manière informative, même si elles sont ouvertes, difficiles ou étranges. Il ne s'agit que d'un bref aperçu de l'histoire de l'IA. L'IA est un domaine qui évolue rapidement et de nouvelles avancées sont constamment réalisées. Il sera intéressant de voir ce que l'avenir de l'IA nous réserve. Nous avons fait un voyage tranquille avec l'intelligence artificielle. À partir des années 1950 avec les tests révolutionnaires de Turing, le terme intelligence artificielle a été inventé en 1956 et une nouvelle ère Au fil des ans, nous avons été témoins de jalons tels que la création de notre premier robot mobile polyvalent, Shaki, en 1969 En 1997, les ordinateurs battaient les champions d'échecs, et nous voici en 2023, témoins de modèles linguistiques très sophistiqués tels que GPT Three C'est un peu comme la révolution informatique des années 80, mais cette fois, tout tourne autour de l'IA. La maîtrise de ces nouveaux outils puissants devient de plus en plus cruciale à mesure que le rythme des progrès de l' IA s' Le potentiel est immense, comme c'était le cas pour les visas informatiques dans les années 1980. Alors, attachez-vous à ce voyage passionnant qui vous attend. Il ne s'agit pas simplement de regarder ce que l'avenir de l'IA nous réserve, mais aussi de contribuer à façonner nous-mêmes cet avenir. Comprendre l' intelligence artificielle. L'IA est une branche de l' informatique qui crée machines intelligentes capables d'effectuer des tâches similaires à celles de l'homme , telles que la reconnaissance vocale, l'identification d'objets, l'apprentissage, la planification et la résolution de problèmes. Vous vous souvenez de l'ordinateur qui a surpassé le champion d'échecs ou celui qui contrôle les lumières de votre maison ? C'est l'IA qui résout les problèmes, tout comme nous. Notre compréhension actuelle de l'IA repose en grande partie sur la façon dont elle interagit avec nous et sur la façon dont elle se compare aux capacités humaines Des éléments tels que la reconnaissance vocale et la détection d'objets occupent une place importante dans l'IA aujourd'hui. Il s'agit de la capacité à assimiler les informations, à en tirer des leçons et à les utiliser pour planifier et aborder les tâches futures. Des activités très humaines. C' est là, en un sens, la magie de l'IA. Pour bien comprendre l'IA, nous devons comprendre trois concepts, les différents types d'IA, différentes applications de l'IA et les différentes possibilités pour l'avenir de l'IA. Commençons maintenant par les différents types d'IA. Il existe de nombreux types d'IA, mais on peut les classer globalement en quatre catégories différentes. Le premier est l'IA réactive. Les systèmes d'IA réactifs ne peuvent que répondre à l' état actuel du monde. Ils n'ont aucune mémoire ni aucun événement passé, et ils ne peuvent pas planifier l'avenir. Par exemple un robot jouant aux échecs ne suit qu'un ensemble d' instructions logiques et réagit correctement en fonction du mouvement de l'adversaire. Le deuxième type d'IA est l'IA à mémoire limitée. Ces systèmes peuvent se souvenir des événements passés et utiliser ces informations pour prendre des décisions. Cependant, ils ne peuvent pas raisonner sur l'avenir ni comprendre les intentions des autres agents. Un exemple de cela pourrait être une application MPs qui suggère des endroits où manger en fonction de vos visites précédentes. Le troisième type d'intelligence artificielle est la théorie de l'esprit (IA). Ces systèmes peuvent comprendre les pensées et les intentions des autres agents. Cela leur permet de coopérer avec d'autres agents et atteindre des objectifs qui seraient impossibles pour un seul agent. L'IA basée sur la théorie de l'esprit pourrait notamment révolutionner la façon dont nous interagissons avec machines en créant robots capables de fournir de la compagnie et du soutien aux personnes seules ou isolées ou par le biais une assistance virtuelle capable de comprendre nos besoins et de nous fournir les informations et l' assistance dont Le quatrième type d' IA est l'IA consciente de soi. IA consciente de soi est un type d'IA hypothétique qui serait consciente et aurait ses propres expériences subjectives Supposons que nous ayons une assistante robot personnelle nommée Eve. Si Eve était une IA consciente d'elle-même, elle ne se contenterait pas de suivre instructions préprogrammées ou de réagir à nos commandes Au lieu de cela, elle comprendrait sa propre existence et aurait ses propres sentiments et pensées. Par exemple, si nous demandons à Eve d'aller chercher un livre à la bibliothèque, une IA normale calculera simplement chemin le plus court et ira chercher le livre Cependant, une IA consciente d'elle-même comme Eve pourrait se demander si c'est une bonne journée pour se promener ou se demander si elle est allée chercher trop de livres récemment et suggérer un livre électronique à la place Il est important de noter que ce type d'IA consciente de soi est purement hypothétique à ce stade Certains chercheurs pensent qu'il s'agit d'une possibilité future qui mérite d'être explorée. Passons maintenant aux applications de l'IA. L'intelligence artificielle ne consiste pas seulement à imiter les capacités humaines, mais également à augmenter nos capacités et à améliorer l'efficacité dans de nombreux domaines différents Du transport aux soins de santé, des services financiers au support client, l'éducation au divertissement, le potentiel de l' IA semble illimité Voici quelques exemples de la façon dont l'IA est utilisée aujourd'hui. Voitures autonomes. L'IA révolutionne notre façon de voyager. Il propulse des voitures autonomes capables naviguer sur les routes et d'éviter les obstacles de manière autonome, ce qui rend les routes plus sûres Diagnostic médical Dans le domaine de la santé, IA fait des progrès dans le diagnostic des maladies, surpassant souvent les médecins humains en termes de précision En analysant de grandes quantités de données médicales, il aide à identifier les modèles et les tendances qui aident les médecins à prendre des décisions plus éclairées. Détection bancaire et de fraude. IA a considérablement évolué dans le secteur bancaire au cours des cinquante dernières années agisse de prévoir des transactions potentiellement frauduleuses ou déterminer l'éligibilité à un prêt en fonction de divers facteurs, IA joue un rôle central dans le secteur financier d' aujourd'hui Service client et support en ligne. Imaginez une entreprise comme HP qui gère plus de 70 000 pages d'aide dans 17 langues L'IA intervient en automatisant le support client et en fournissant un service 24 heures sur 24, réduisant ainsi considérablement les coûts et améliorant l'efficacité Éducation. Dans le domaine de l'éducation, l' IA permet des expériences d'apprentissage personnalisées, s'adapte aux besoins individuels de chaque élève et favorise un processus d'apprentissage plus efficace. Divertissement. Nos services d'assistance virtuelle tels que Siri, Cortana, Alexa et Google sont tous alimentés par Grâce à leurs capacités de reconnaissance vocale, ils ont l'impression d'avoir une secrétaire personnelle à vos ordres et de cybersécurité. Dans le domaine numérique, l'IA est notre gardien Grâce à ses algorithmes d'apprentissage automatique et à ses vastes analyses de données, il détecte les anomalies et répond aux menaces, renforçant ainsi notre mesure de cybersécurité Comme vous pouvez le constater, l'IA s'est intégrée à tous les aspects de notre vie, en améliorant nos capacités et remodelant notre environnement commercial et commercial Les possibilités sont immenses et elles ne cessent de s'étendre chaque jour qui passe. Parlons maintenant de l'avenir de l'IA. Quand on pense à l'avenir de l'IA, c'est vraiment fascinant. Nous sommes à la veille d'une époque où voitures autonomes pourraient devenir la norme. Imaginez avoir des robots à la maison qui nous aident dans des tâches allant de la préparation du café à des tâches plus complexes. Nous nous intéressons également à l' essor des villes intelligentes dans lesquelles IA gère tout, de nos téléphones aux appareils électroménagers. De plus, les robots prennent de l'ampleur pour effectuer tâches à haut risque, comme diffuser des bombes, par exemple À mesure que l'IA continue de se développer, elle aura probablement un impact encore plus important sur notre monde. Sur la base de tout cela, certaines applications possibles de l'IA à l'avenir pourraient inclure le transport automatisé. Imaginez un monde où l'IA se charge de toutes les tâches à notre place. Nous nous rapprochons d'une réalité où les voitures autonomes sont un moyen de transport standard. Mais il ne s' agit pas uniquement de voitures. Nous parlons de drones automatisés, livraison de nos colis, de trains pilotés par l' IA , d'un transport précis et rapide, et même de bateaux et d'avions autonomes. Tout cela vise à rendre notre voyage plus sûr et plus efficace en réduisant les erreurs humaines. Il s'agit d'un changement majeur qui pourrait redéfinir notre façon de concevoir le transport Médecine personnalisée, l'IA peut être utile pour analyser de grandes quantités de données médicales afin d'identifier des modèles et des tendances susceptibles d'aider les médecins à diagnostiquer et à traiter les maladies plus efficacement. Par exemple, l'IA peut être utilisée pour développer un traitement personnalisé du cancer adapté au patrimoine génétique spécifique de chaque patient. Assistance virtuelle. L'assistance virtuelle alimentée par l'IA peut nous aider dans diverses tâches telles que la prise de rendez-vous, l'organisation de voyages et la gestion de nos finances. L'assistance virtuelle peut également nous fournir des informations et des divertissements, et elle peut même être utilisée pour contrôler nos appareils domestiques intelligents. Et en parlant des maisons intelligentes elles-mêmes, IA peut être utilisée pour rendre nos maisons plus confortables, plus efficaces et plus sûres. Par exemple, l'IA peut être utilisée pour contrôler nos thermostats, lampes et autres appareils Et il peut également être utilisé pour surveiller nos maisons pour détecter les menaces de sécurité. Et enfin, l' intelligence générale artificielle ou AGI. AGI est un type hypothétique d' IA qui serait aussi intelligent qu'un être humain AGI pourrait potentiellement résoudre certains des problèmes les plus urgents du monde tels que le changement climatique et la pauvreté. Cependant, l'AGI soulève également certaines préoccupations éthiques, telles que la possibilité pour l'IA de prendre conscience d'elle-même et de développer ses propres objectifs et désirs. L'IA est une technologie puissante qui a le potentiel de révolutionner de nombreux aspects de notre vie. Il est important de connaître les avantages et les risques potentiels de l' IA et de l'utiliser de manière responsable. J'espère que vous avez apprécié cette brève explication sur l'IA. Dans la prochaine vidéo, nous aborderons de manière plus approfondie le machine learning. 3. L1V2 - Machine Learning: Qu'est-ce que le machine learning ? Dans cette vidéo, nous allons aborder les bases de l'apprentissage automatique. Plus précisément, nous allons commencer par une définition de ce qu'est l'apprentissage automatique. Nous proposons ensuite une comparaison entre l'intelligence artificielle, machine learning et le deep learning. Ensuite, nous discutons du fonctionnement de l'apprentissage automatique. Nous parlons de différents types d'apprentissage automatique, d'apprentissage supervisé, d'apprentissage non supervisé et d'apprentissage par renforcement Nous parlons des conditions préalables à l'apprentissage automatique et, à la fin, nous donnons quelques exemples d'applications de l'apprentissage automatique Alors, qu'est-ce que le machine learning ? L'apprentissage automatique consiste à développer des programmes informatiques capables d'accéder aux données et de les utiliser pour apprendre automatiquement et s' améliorer à partir de l'expérience. Cela permet à l'apprentissage automatique de nous aider à effectuer des tâches complexes, telles que l'impression 3D de maisons entières. En utilisant des algorithmes et de grands ensembles de données, l'apprentissage automatique peut automatiser la conception et la planification, contribuant ainsi à relever les défis de construction tels que l'intégrité structurelle et l'efficacité des matériaux Peut également personnaliser les conceptions en fonction des conditions environnementales. Il peut contribuer à réduire les coûts et les délais tout en augmentant précision et a le potentiel de transformer le secteur de la construction. Prenons comme autre exemple notre assistance personnelle comme Siri, Google Assistant ou Amazon Echo Ils utilisent tous la puissance de l'apprentissage automatique pour nous aider dans nos tâches quotidiennes, comme écouter notre musique préférée, commander de la nourriture, contrôler nos appareils électroménagers ou demander des droits à Uber et bien plus encore. Comme nous l'avons déjà dit, l'intelligence artificielle est une technique qui permet aux machines d'imiter le comportement humain C'est essentiel car c'est ainsi que nous déterminons si nos calculs et travail sont sur la bonne voie en vérifiant s'ils peuvent imiter le comportement humain Nous utilisons cette approche pour prendre charge une partie du travail des humains dans le but de rendre les choses plus efficaces, rationalisées et précises. L'IA est un vaste domaine qui couvre de nombreuses technologies différentes. Parmi les exemples d' intelligence artificielle, citons IBM, Deep Blue Chess, les personnages de jeux électroniques et les voitures autonomes. Ce ne sont là que quelques exemples des nombreuses façons dont l'intelligence artificielle est utilisée aujourd'hui. L'apprentissage automatique est une technique qui utilise des méthodes statistiques pour permettre aux machines de tirer des leçons de leurs données passées. Cela signifie que les machines peuvent utiliser les entrées et réponses passées pour les aider à mieux deviner lors de futures tentatives L'algorithme de recherche Google et les filtres anti-spam par e-mail sont des exemples d'applications de machine learning. Et puis il y a le deep learning, qui est un sous-ensemble de l'apprentissage automatique Utilise des algorithmes pour permettre aux modèles de s'entraîner et d'effectuer des tâches. AlphaGo et la reconnaissance vocale naturelle sont deux exemples d'apprentissage profond L'apprentissage profond est souvent associé aux réseaux de neurones qui sont une sorte de modèle de boîte noire. En tant que modèle de boîte noire, il est difficile pour les humains de suivre manière dont les modèles de deep learning font leurs prédictions. Cependant, les modèles d'apprentissage profond peuvent toujours être très efficaces pour effectuer des tâches. Nous aborderons plus en profondeur le monde de l' apprentissage profond plus tard. Voyons maintenant comment fonctionne le machine learning. Pour comprendre le fonctionnement de l'apprentissage automatique, examinons le schéma suivant. Dans un premier temps, nous commençons par entraîner nos données. Nous avons ensuite introduit les données entraînées dans un algorithme d'apprentissage automatique pour le traitement. Les données du processus passent par un autre algorithme d'apprentissage automatique. Il est maintenant temps de tester notre travail. Nous introduisons de nouvelles données et les exécutons avec le même algorithme. À l'étape suivante, nous vérifierons les prévisions et les résultats. Si nous avons des données d' entraînement de réserve, c'est le moment de les utiliser. À l'étape suivante, si la prédiction ne semble pas correcte, supposons qu'elle soit approuvée , il est temps de revenir en arrière et de réentraîner l'algorithme N'oubliez pas qu'il ne s' agit pas toujours d'obtenir la bonne réponse immédiatement. L'objectif est de continuer à essayer de trouver une meilleure réponse. Vous constaterez peut-être que le résultat initial ne correspond pas à ce que vous vouliez. C'est bon. Cela fait partie du processus. Et cela peut dépendre du domaine dans lequel vous travaillez, qu'il s'agisse de la santé, de l'économie, des affaires, du marché boursier ou autre. Les résultats peuvent être très différents. Nous devons donc essayer le modèle, et s'il ne nous donne pas le résultat dont nous avons besoin ou si nous pensons pouvoir obtenir de meilleurs résultats, nous l'adaptons Et dans la dernière étape, nous continuons à affiner et à nous recycler jusqu'à ce que nous obtenions la meilleure réponse possible C'est ainsi que fonctionne le machine learning. Examinons maintenant les différents types d'apprentissage automatique. Nous pouvons constater que nous avons un apprentissage supervisé, non supervisé et par renforcement Nous allons examiner chacune d'elles, avoir une bonne idée du moment et de l' endroit où les utiliser et de quoi elles servent. Dans le domaine de l'apprentissage automatique, nous utilisons de nombreux algorithmes différents pour résoudre des problèmes complexes. Chacun correspond à un certain type. Nous avons donc trois principaux types d'algorithmes d'apprentissage automatique : l'apprentissage supervisé, l'apprentissage non supervisé et l'apprentissage par renforcement Voyons maintenant ce que chacune de ces méthodes d'apprentissage signifie réellement. L'apprentissage supervisé utilise des données étiquetées pour entraîner des modèles d'apprentissage automatique. Les données étiquetées signifient que nous connaissons déjà le résultat. Le modèle doit simplement mapper les entrées aux sorties. Un exemple d' apprentissage supervisé peut être l'entraînement d'une machine qui identifie les images d'animaux. Ici, nous pouvons voir un modèle entraîné qui identifie l'image d'un chat. apprentissage non supervisé utilise des données non étiquetées pour entraîner les machines Les données non étiquetées signifient qu' il n'existe aucune variable de sortie fixe Le modèle apprend à partir des données, découvre des modèles et des caractéristiques dans les données et renvoie le résultat. Dans cet exemple, notre modèle non supervisé utilise les images de véhicules pour déterminer s' il s'agit d'un bus ou d'un camion Le modèle apprend donc en identifiant les pièces d'un véhicule, telles que la longueur et la largeur du véhicule, les capots avant et arrière, le toit, capots, les types de roues utilisés et de nombreuses autres caractéristiques. Sur la base de ces caractéristiques, le modèle classe si le véhicule est un bus ou un camion Et nous avons l'apprentissage par renforcement. L'apprentissage par renforcement entraîne la machine à prendre les mesures appropriées et à maximiser les récompenses dans une situation donnée. Il utilise un agent et un environnement pour produire des actions et des récompenses. L'agent possède un état de départ et un état final, mais il peut y avoir différentes parties pour atteindre l' état final, comme un labyrinthe Dans cette technique d'apprentissage, il n'existe aucune variable cible prédéfinie. Un exemple d' apprentissage par renforcement consiste à entraîner une machine capable d'identifier la forme d'un objet, à partir d'une liste de différents objets tels qu'un carré, triangle, un rectangle ou un cercle. Dans cet exemple, le modèle essaie de prédire la forme de l' objet, qui est un carré. Examinons maintenant différents algorithmes d'apprentissage automatique qui entrent dans le cadre de ces techniques d'apprentissage. Certains des algorithmes d'apprentissage supervisé couramment utilisés sont la régression polynomiale, les forêts aléatoires, la régression linéaire, la régression logistique, les chaînes les plus proches voisines, les bases naïves, machines à vecteurs de support Et ce ne sont là que quelques exemples d' algorithmes utilisés pour l'apprentissage supervisé. Il existe de nombreux autres algorithmes utilisés dans l'apprentissage automatique. Pour l'apprentissage non supervisé, certains des algorithmes les plus utilisés sont le clustering en K , la décomposition en valeurs singulières, les moyennes floues, les carrés partiels, les a priori, le clustering hiérarchique, analyse en composantes principales De même, il existe de nombreux autres algorithmes qui peuvent être utilisés pour l'apprentissage non supervisé Parmi les algorithmes d' apprentissage par renforcement les plus importants algorithmes d' apprentissage par renforcement figurent le Q learning, SARSA, le Monte Carlo et les réseaux Q profonds Comme nous l'avons dit, nombreux algorithmes différents s'offrent à nous, et le choix du bon algorithme dépend du type de problèmes que nous essayons de résoudre. Examinons maintenant l'approche selon laquelle ces techniques d'apprentissage automatique fonctionnent. Les méthodes d'apprentissage supervisé nécessitent donc supervision externe pour entraîner les modèles d'apprentissage automatique , d'où le nom supervisé. Ils ont besoin de conseils et d'informations supplémentaires pour obtenir le résultat. Il prend des entrées étiquetées et les associe à des sorties connues, ce qui signifie que vous connaissez déjà la variable cible. techniques d'apprentissage non supervisées ne nécessitent aucune supervision pour entraîner les modèles Ils apprennent par eux-mêmes et prédisent les résultats. Ils trouvent des modèles et comprennent les tendances des données pour découvrir le résultat. Le modèle essaie donc d'étiqueter les données en fonction des caractéristiques des données d'entrée. De même, les méthodes d'apprentissage par renforcement ne nécessitent aucune supervision pour entraîner des modèles d'apprentissage automatique. L'apprentissage par renforcement suit une méthode d'essais et d'erreurs pour obtenir la solution souhaitée. Après avoir accompli une tâche, l'agent reçoit une récompense Un exemple pourrait être d'entraîner un chien à attraper le ballon. Si le chien apprend à attraper une balle, vous lui donnerez une récompense, comme une friandise. Concentrons-nous donc sur les applications et les types de problèmes qui peuvent être résolus à l'aide ces trois types de techniques d'apprentissage automatique. L'apprentissage supervisé est donc généralement utilisé pour les problèmes de classification et de régression. Par exemple, vous pouvez prévoir la météo d'un jour donné en fonction de l'humidité, des précipitations, de la vitesse du vent et des valeurs de pression. Comme dans un autre exemple, vous pouvez utiliser des algorithmes d'apprentissage supervisé pour prévoir les ventes de différents produits pour le mois ou le trimestre à venir. De même, vous pouvez l'utiliser pour analyser le cours des actions ou pour déterminer si une cellule cancéreuse est maligne ou bénigne. L'apprentissage non supervisé est utilisé pour les problèmes de clustering et d' association Par exemple, il peut segmenter les clients, c' est-à-dire segmenter et regrouper des clients similaires en groupes en fonction de leur comportement, de leurs goûts, de leurs aversions est-à-dire segmenter et regrouper clients similaires en groupes en fonction de leur comportement, de leurs goûts, de leurs aversions Un autre exemple des applications de l' apprentissage non supervisé est l'analyse du taux de désabonnement des clients, qui est un processus visant à évaluer et comprendre pourquoi et quand les clients cessent de faire affaire avec une entreprise Dans le but de développer des stratégies pour améliorer la fidélisation des clients. Enfin, il y a l'apprentissage par renforcement. L'apprentissage par renforcement est basé sur les récompenses. Ainsi, pour chaque tâche ou chaque étape effectuée correctement, l'agent recevra une récompense. Et si la tâche n'est pas accomplie correctement, il y aura une sorte de pénalité. Regardons maintenant quelques exemples. Les algorithmes d'apprentissage par renforcement sont largement utilisés dans l'industrie du jeu pour créer des jeux. Il est également utilisé pour entraîner des robots à effectuer des tâches humaines. Les chatbots IA polyvalents tels que hat GPT ou Google Bart utilisent l' apprentissage par renforcement pour tirer des leçons des entrées des utilisateurs et ajuster leurs résultats en fonction Nous sommes arrivés à la fin de cette section sur l'apprentissage supervisé par rapport à l' supervisé par rapport non supervisé par rapport à l'apprentissage par renforcement Voyons maintenant quels sont les prérequis de l'apprentissage automatique Le premier concerne donc les principes fondamentaux de l'informatique et la programmation. De nombreuses applications d'apprentissage automatique nécessitent aujourd'hui une base solide en matière de script ou de programmation de base Il ne s'agit pas seulement d'écrire des algorithmes complexes, mais aussi de comprendre et de manipuler les structures sous-jacentes. Sans une bonne maîtrise de ces compétences fondamentales, il sera difficile de tirer le meilleur parti des outils d'apprentissage automatique disponibles. Donc, si vous envisagez sérieusement de vous lancer dans l'apprentissage automatique, il est conseillé de perfectionner vos compétences en programmation. Connaissances statistiques intermédiaires. Une compréhension fondamentale des probabilités est nécessaire dans le monde de l'apprentissage automatique Vous vous poserez souvent des questions telles que si A se produit, quelle est la probabilité que B se produise ? Ou s'il y a des nuages au-dessus de votre tête, quelles sont les chances qu'il pleuve ? Ce type de questions, fondé sur les probabilités, au cœur de nombreux algorithmes d'apprentissage automatique. Il s'agit de prédire les résultats en fonction de conditions données Donc, si vous souhaitez faire des progrès significatifs dans le domaine de l'apprentissage automatique, il vaut certainement la peine de vous familiariser avec les bases des statistiques et des probabilités Algèbre linéaire et calcul intermédiaire. L'algèbre linéaire est essentielle car elle vous oblige à comprendre le concept du tracé d' une ligne à travers vos points de données et à comprendre ce qu'elle représente C'est l'idée principale qui sous-tend modèles de régression linéaire dans lesquels vous tracez une ligne à travers vos données et utilisez cette ligne pour calculer de nouvelles valeurs. En ce qui concerne le calcul intermédiaire, il s'agit d'avoir une compréhension de base des équations différentielles Inutile d'être un maître dans ce domaine, car l'ordinateur gère la plupart des calculs lourds, mais il est utile de reconnaître la terminologie lorsqu'elle apparaît, en particulier si vous approfondissez la programmation de modèles Et la pêche à la ligne et le nettoyage des données. L'un des aspects les plus importants dans ce domaine est peut-être de maîtriser l' art de mettre de l'ordre dans vos données On dit souvent que si vous entrez de mauvaises données, vous en retirerez de mauvaises données. Mais si vous avez de bonnes données en entrée, il est plus probable qu'il en ait de bonnes en sortie. La qualité de vos données peut grandement influencer les résultats de vos modèles d'apprentissage automatique. Par conséquent, comprendre comment nettoyer et organiser efficacement vos données devient une compétence essentielle pour garantir l'exactitude et la fiabilité de vos résultats. Examinons maintenant quelques exemples d'applications de l'apprentissage automatique. Nous avons la détection d'objets et la segmentation des instances. La détection d'objets et la segmentation d' instances sont deux tâches différentes mais liées dans le machine learning. La détection d'objets consiste à reconnaître et à trouver des objets dans une image , par exemple en distinguant différents chats. D'autre part, la segmentation des instances est l'étape suivante qui sépare ces objets identifiés du reste de l'image. Ces techniques sont utilisées de différentes manières, notamment pour identifier les différents éléments d'une image. De plus, la segmentation permet d' isoler ou de découper davantage des composants spécifiques. Une application populaire de détection et de segmentation d'objets est la fonction de capture rapide des téléphones Google Pixel. Cette fonctionnalité utilise l'apprentissage automatique pour identifier les objets dans vue actuelle de l'utilisateur, puis superposer des autocollants ou des filtres animés sur ces objets Cela peut être une façon amusante et créative d'ajouter une touche personnelle à vos photos. Nous avons également la détection des plaques d'immatriculation. C'est une utilisation plutôt intéressante de l'apprentissage automatique. Imaginez qu'une voiture passe dans votre champ de vision et que le système est capable de repérer et d'identifier la plaque d'immatriculation de cette voiture. Cette application d' apprentissage automatique peut être particulièrement utile dans diverses situations, telles que les points de contrôle de sécurité, parkings, le contrôle du trafic ou même pour facturer des péages sans la voiture ne s'arrête au milieu d'une autoroute Il montre comment l' apprentissage automatique peut extraire avec précision des informations spécifiques d'un contexte plus large Et nous avons également la traduction automatique. La traduction automatique, basée sur l'apprentissage automatique, a changé la donne en éliminant les barrières linguistiques. C'est le moteur la traduction instantanée que vous voyez sur les sites Web étrangers, rendant le contenu accessible dans langue de votre choix en un seul clic. C'est également la technologie qui permet à des outils tels que Google Lens de fournir des traductions en temps réel des signes lorsque vous pointez votre appareil photo sur eux. Qu'il s'agisse de naviguer sur Internet ou de naviguer dans une ville étrangère, l'apprentissage automatique a révolutionné notre capacité à comprendre le monde et à interagir avec La traduction automatique est vraiment un témoignage impressionnant de la manière dont l'apprentissage automatique peut rapprocher le monde. Merci d'avoir regardé cette vidéo. Le monde des applications d'apprentissage automatique est vaste et en constante évolution. C'est l'un des secteurs technologiques les plus dynamiques, et les possibilités sont infinies. Ce que je vous ai montré ici ne sont que quelques-uns des points saillants, un petit échantillon de ce qui est possible. Mais il y a encore bien d'autres choses à venir. Dans la prochaine vidéo, nous allons changer d'année et explorer le deep learning, un domaine souple de l' apprentissage automatique qui a rendu possibles de nombreuses avancées en matière d'apprentissage automatique avancées en matière d'apprentissage automatique. On se voit dans le prochain. 4. L1V3 - Apprentissage approfondi: Dans cette vidéo, nous allons parler du deep learning et des réseaux neuronaux. Vous êtes-vous déjà demandé comment Google peut traduire une page Web entière en rien de temps d'une langue à l'autre, ou comment Google Photos trie comme par magie vos photos en fonction des visages des personnes et des animaux qu'il reconnaît ? Ou que diriez-vous lorsque Google Lens vous renseigne sur les détails d'une plante, objet ou d'un animal lorsque vous le scannez avec votre téléphone ? C'est le deep learning qui opère sa magie sur place. Dans cette vidéo, essayons de répondre à la question de savoir ce qu'est deep learning et comment il rend toutes ces choses incroyables possibles. Dans cette vidéo, nous aborderons les sujets suivants. Nous commencerons par une compréhension de l' apprentissage profond, puis passerons aux réseaux de neurones artificiels, qui sont un type d'algorithme d'apprentissage automatique utilisé dans le cadre de l'apprentissage en profondeur. Nous explorerons ensuite certaines des utilisations pratiques de l' apprentissage profond et présenterons certaines des plateformes d' apprentissage en profondeur les plus populaires. Enfin, nous discuterons de certaines des limites de l'apprentissage profond et de la manière dont les ordinateurs quantiques peuvent surmonter ces limites. Ce sera une session passionnante sur le deep learning. Comme nous l'avons dit précédemment, l'apprentissage profond est un sous-ensemble de l'apprentissage automatique, et les deux font partie du concept plus large appelé intelligence artificielle Imaginez que l'intelligence artificielle consiste à faire en sorte que les machines agissent comme des humains. L'apprentissage automatique fait partie de ce domaine, et il s'agit de donner aux machines la capacité d'apprendre et de prendre des décisions basées sur des données, un peu comme nous apprenons par expérience. Aujourd'hui, le deep learning est une partie plus spécifique de l'apprentissage automatique. C'est comme apprendre à une machine à penser un peu comme un cerveau humain avec une structure appelée réseau neuronal artificiel. réseaux neuronaux artificiels ou ANN sont un type spécifique d' algorithme d'apprentissage automatique qui tente d' imiter vaguement les réseaux neuronaux du cerveau humain Lorsque nous parlons d'apprentissage profond, nous parlons généralement d'utilisation très grands réseaux neuronaux pour entraîner un modèle sur de nombreuses données. Ce n'est pas différent de l'apprentissage automatique, juste un terme plus sophistiqué que nous utilisons lorsque les choses prennent de l'ampleur Que sont donc les réseaux de neurones artificiels ? Regardons de plus près la construction d' un réseau neuronal. Chaque couche est constituée de nœuds ou de ce que nous appelons des neurones. Les neurones d'une couche se connectent aux neurones de la couche suivante par le biais de canaux. Une pondération est attribuée à chaque canal, qui joue un rôle important dans l'apprentissage du réseau. Chaque neurone est associé à un biais et à une fonction d'activation. La fonction d'activation est utilisée pour transformer la somme pondérée des entrées et du biais en une sortie envoyée à la couche suivante. Comme nous l'avons déjà dit, les ANN sont au cœur de l'apprentissage profond. Ces algorithmes sont conçus de manière à refléter le fonctionnement du cerveau humain. Ils absorbent les données, apprennent à identifier des modèles dans les données, puis font des prédictions éclairées pour un nouvel ensemble de données. Explorons le processus en construisant un réseau neuronal capable de faire la distinction entre un cube et une pyramide Prenons l'exemple de l'image d' un cube. Cette image est composée de 28 x 28 pixels, soit un total de 784 pixels Chaque pixel est ensuite fourni en entrée aux neurones individuels de la première couche. Les neurones d'une couche sont connectés aux neurones des couches suivantes par le biais de canaux. Les entrées sont multipliées par les poids correspondants, puis le biais y est ajouté. Cette valeur combinée est ensuite évaluée biais d' une fonction de seuil, connue sous le nom de fonction d'activation Le résultat est transmis en entrée au neurone dans la couche cachée La sortie de la fonction d'activation détermine ensuite la fonction d'activation détermine si un neurone est activé ou non Les neurones activés transmettent des données aux neurones de la couche suivante via le canal. Ce processus itératif connu sous le nom propagation directe permet aux données de se propager sur le réseau Dans la couche de sortie, le neurone ayant la valeur la plus élevée est activé et détermine le résultat final Ces valeurs sont essentiellement des probabilités. Dans ce scénario particulier, le neurone associé à la pyramide présente la probabilité la plus élevée, ce qui indique que le réseau neuronal prédit le résultat sous forme de Eh bien, évidemment, notre réseau neuronal a fait une prédiction incorrecte. Il est important de noter qu'à ce stade, notre réseau n'a pas encore suivi de formation. Voyons donc les étapes de formation d' un réseau neuronal. Pendant le processus de formation, le réseau reçoit à la fois les entrées et les sorties attendues. En comparant la sortie prévue à la sortie réelle, le réseau identifie l' erreur dans sa prédiction. L'ampleur de l'erreur indique à quel point nous nous trompons, et le signe indique si nos valeurs prédites sont supérieures ou inférieures aux prévisions. Ces informations sont ensuite propagées vers l'arrière à travers le réseau, une technique appelée rétropropagation Grâce à la rétropropagation, le réseau ajuste ses paramètres internes, tels que les poids et les biais, afin minimiser les erreurs et d'améliorer ses prévisions futures. Le cycle itératif de propagation vers l'avant et propagation arrière est répété avec plusieurs entrées pendant le processus d'apprentissage Ce cycle se poursuit jusqu'à ce que les poids au sein du réseau soient ajustés manière à permettre au réseau prévoir avec précision les formes dans la majorité des cas. Cela marque la fin de notre processus de formation, duquel le réseau a appris à faire des prédictions correctes. Bien que l'entraînement des réseaux neuronaux puisse prendre du temps, parfois des heures, voire des mois, l'investissement en temps est justifié compte tenu des immenses possibilités qu'ils offrent. La nature complexe de la formation implique le réglage précis de nombreux paramètres et l' optimisation des performances du réseau, qui nécessite des ressources informatiques et de la patience importantes ressources informatiques et Cependant, les avantages d'un réseau neuronal bien entraîné, tels qu'une précision améliorée, tels qu'une précision améliorée reconnaissance avancée des formes et une prise de décision sophistiquée, l'emportent sur le temps consacré à la formation C'est un compromis raisonnable compte tenu du potentiel et des capacités remarquables qu'offrent les réseaux neuronaux. Examinons maintenant certaines des applications du deep learning. Comme nous l'avons dit précédemment, c'est la puissance des réseaux neuronaux qui rend le deep learning possible. Explorons certaines des applications clés dans lesquelles les réseaux de neurones brillent. Un exemple notable est la technologie de reconnaissance faciale sur les smartphones, qui utilise les réseaux neuronaux pour estimer âge d'une personne en fonction des traits de son visage En distinguant le visage de l'arrière-plan et en analysant les lignes et les points, ces réseaux mettent en corrélation les indices visuels pour obtenir une estimation de l'âge de la personne Les réseaux neuronaux jouent également un rôle crucial dans les prévisions, ils permettent des prévisions précises dans divers domaines tels que prévisions météorologiques ou l'analyse du cours des actions. Ces réseaux sont très performants lorsqu'il s'agit de reconnaître des modèles, ce qui leur permet d'identifier les signaux indiquant la probabilité de précipitations ou de fluctuations des cours des actions. Les réseaux neuronaux peuvent même composer de la musique originale. Ils peuvent apprendre des modèles musicaux complexes et affiner leur compréhension pour composer des mélodies originales, mettant en valeur leur Et un autre domaine dans lequel la NRA met en réseau Excel est le support client De nombreuses personnes engagent des conversations avec des agents du service client sans même se rendre compte qu'elles interagissent réellement avec un bot. Ces réseaux sophistiqués simulent un dialogue réaliste et fournissent une assistance, améliorant ainsi l'expérience du service client. Toujours dans le domaine des soins médicaux, les réseaux neuronaux ont fait des progrès importants Ils ont la capacité de détecter les cellules cancéreuses et d'analyser les images IRM, fournissant des résultats détaillés et précis qui facilitent le diagnostic et les décisions thérapeutiques. Et évidemment, nous avons aussi des voitures autonomes. Autrefois possibles dans le domaine de la science-fiction, elles deviennent aujourd'hui une réalité tangible. Ces véhicules autonomes s'appuient sur réseaux neuronaux pour percevoir et interpréter l'environnement, ce qui leur permet de naviguer sur les routes, prendre des décisions et d' assurer la sécurité des passagers. Et avec cela, jetons un coup d'œil à certains frameworks d'apprentissage en profondeur populaires. Certains de ces frameworks sont donc tensor flow, Pytorch, cross, Deep learning four J, Cafe et Microsoft Cognitive Ces cadres ont acquis large reconnaissance et jouent un rôle important dans l' avancement du domaine de l'apprentissage profond. Passons maintenant à certaines des limites du deep learning. Bien que le deep learning soit très prometteur, il est également important de reconnaître ses limites. Tout d'abord, bien que le deep learning soit très efficace pour traiter des données non structurées, il nécessite une quantité importante de données à des fins de formation Le deuxième problème est que même en supposant que nous ayons accès aux données requises, traitement peut s'avérer difficile en raison de la puissance de calcul entraînement des réseaux neuronaux nécessite l'utilisation d'unités de traitement graphiques ou GPU dotés de milliers de cœurs par rapport aux unités centrales ou aux processeurs Et en même temps, les GPU sont bien plus chers que les processeurs Enfin, la formation prend du temps. Les réseaux neuronaux profonds peuvent nécessiter heures, voire des mois, pour s'entraîner la durée augmentant à mesure que le volume de données et le nombre de couches du réseau augmentent. Cela dit, il convient de mentionner que les ordinateurs quantiques développés par des entreprises telles que Google et IBM offrent une solution potentielle pour surmonter ces limites. Les ordinateurs quantiques ont la capacité d'effectuer des calculs complexes à un rythme exponentiellement plus rapide que les ordinateurs classiques Grâce à leur architecture unique et unités de traitement quantique ou QP, ils ont le potentiel d' accélérer considérablement le processus d'entraînement des réseaux neuronaux En outre, les ordinateurs quantiques peuvent gérer plus efficacement des ensembles de données à plus grande échelle Réduire les exigences en matière de données et atténuer les défis associés au traitement de telles quantités d'informations Bien que l'informatique quantique n'en soit qu'à ses débuts, recherche et le développement en cours devraient permettre de surmonter les limites auxquelles sont confrontées les approches traditionnelles d'apprentissage profond. Merci d'avoir exploré le monde du deep learning avec moi. Il est essentiel de reconnaître que nous n'en sommes qu'aux premiers stades de l' exploration de ce que l'apprentissage profond et les réseaux neuronaux peuvent faire pour nous. Cependant, de grands noms tels que Google, IBM et Nvidia ont reconnu cette trajectoire de croissance en investissant dans le développement de bibliothèques, de modèles prédictifs et de puissants GPU pour soutenir la mise en œuvre de réseaux neuronaux Nous sommes presque arrivés à la fin de cette section sur l'intelligence artificielle traditionnelle. Il est important de noter que nous n'avons fait qu'effleurer la surface en ce qui concerne le potentiel de l' apprentissage profond et de l'IA Des possibilités passionnantes nous attendent. À mesure que nous repoussons les limites du possible, la frontière entre science-fiction et réalité devient de plus en plus floue L'avenir réserve de nombreuses surprises, et le deep learning est au cœur de ces avancées révolutionnaires Dans la vidéo suivante, qui est la dernière de cette section, nous apprendrons la différence entre les modèles d'apprentissage automatique discriminants et génératifs, ce qui nous préparera à la prochaine section de ce cours sur l' intelligence artificielle générative On se voit dans le prochain. 5. L1V4 - Discrimination vs générative: Dans cette vidéo, nous allons parler d' algorithmes discriminants et génératifs Il s'agit de deux types importants de modèles d'apprentissage automatique. Pour vous faciliter la tâche, nous allons commencer par l'histoire puis nous expliquerons en détail comment ces deux types d' apprentissage automatique fonctionnent en apprentissage automatique fonctionnent en utilisant des algorithmes populaires comme exemples. Alors allons-y directement. C'est bon. Plongons dans notre histoire. Imaginons que nous ayons deux visiteurs extraterrestres qui n'ont jamais vu de pommes ni de bananes auparavant. Nous voulons observer comment ils apprennent à distinguer ces deux fruits. Le premier extraterrestre décide de comprendre ces fruits en les dessinant. Il observe attentivement la forme, la couleur et la texture de chaque fruit, puis les recrée sur papier De cette façon, il crée une représentation visuelle ou un modèle de l'apparence de chaque fruit. Chaque fois qu'il voit un nouveau fruit, il se réfère à ces dessins pour identifier ce fruit. Ceci est similaire à ce que nous appelons un algorithme génératif en apprentissage automatique. Le deuxième extraterrestre, en revanche, s'y prend différemment. Au lieu de dessiner, il commence à comparer les caractéristiques des fruits. Il remarque que les pommes sont généralement rondes et rouges tandis que les bananes sont longues et jaunes. Lorsqu'on lui donne un nouveau fruit, il ne semble pas correspondre parfaitement. Il vérifie plutôt quels fruits présentent les caractéristiques les plus proches du nouveau fruit et devine qu'il s' agit du même fruit. Cette approche s'apparente davantage à ce que nous appelons un algorithme discriminant en apprentissage automatique C'est donc l'idée de base. Ces deux approches différentes nous aideront à comprendre les algorithmes discriminants et génératifs Ensuite, définissons formellement nos deux types d'algorithmes en nous basant sur notre approche des extraterrestres. La première méthode des extraterrestres est un excellent exemple de ce que nous appelons la classification générative. C'est là qu'un modèle apprend à générer une représentation de chaque classe. C'est comme apprendre à quoi ressemble une pomme ou une banane et utiliser ces connaissances pour identifier la future instance. En revanche, la deuxième méthode des étrangers représente une classification discriminante Ce modèle apprend à distinguer les classes en fonction de leurs caractéristiques. Au lieu d'apprendre à quoi ressemble une pomme ou une banane, il apprend les différences entre les deux. Il utilise ensuite ces différences pour déterminer ce que pourrait être un nouveau fruit. Chaque approche a ses forces et ses faiblesses, et elles sont utilisées dans différents scénarios. Maintenant que nous avons présenté les concepts, explorons-les plus en profondeur. Pour mieux comprendre ces concepts, nous allons discuter d'algorithmes spécifiques qui utilisent ces deux types de classifications. Pour la classification discriminante, nous prenons l'exemple de la régression logistique Et pour la classification générative, notre exemple sera l'algorithme de base naïf Ainsi, dans le domaine de la classification discriminante, régression logistique crée une limite de décision basée sur les caractéristiques de l'entrée Pour notre exemple de fruit, ces caractéristiques peuvent être la couleur, la longueur ou le poids. L'algorithme apprend des modèles à partir de ces caractéristiques, puis les utilise pour classer les nouveaux fruits. À l'inverse, l'algorithme de base naïf, qui est un modèle de classification génératif, essaie de comprendre la distribution de chaque classe dans l'espace des fonctionnalités Plutôt que de simplement identifier les différences entre les classes, il apprend comment chaque classe distribue les données. Maintenant, approfondissons et comprenons comment ces algorithmes utilisent les stratégies pour classer les nouvelles données. Avec le modèle de régression logistique, nous traitons de caractéristiques telles que la couleur, la longueur et le poids des fruits Le modèle utilise ces fonctionnalités pour apprendre des modèles et prendre des décisions. Par exemple, il pourrait apprendre que si un fruit a une couleur jaune et mesure plus de 5 pouces, il y a de fortes chances que ce soit une banane. Cette méthode de création d'une limite de décision basée sur des caractéristiques d'exemples est l'essence même de l'apprentissage discriminant autre côté, l'apprentissage génératif utilisé par le modèle de base naïf tente de comprendre la distribution de chaque classe dans un plan multidimensionnel comme un espace tridimensionnel pour les trois caractéristiques de nos fruits Le modèle essaie de visualiser endroit où les pommes et les bananes sont susceptibles d' apparaître dans cet espace en fonction leur couleur, de leur forme et de leur poids. Réfléchissons maintenant à quelques questions importantes concernant quelques questions importantes modèles génératifs et discriminants Des questions telles que : quel modèle a besoin de plus de données pour l'entraînement ? Lequel est concerné par les données manquantes ? Quel modèle est influencé par les valeurs aberrantes, lequel nécessite plus de calculs et lequel a tendance à être surajusté Il est important de réfléchir à ces questions, car elles influent sur la manière dont vous pourriez choisir d'utiliser ces modèles. Par exemple, un modèle génératif n'a pas besoin de beaucoup de données car il essaie simplement de comprendre les caractéristiques de base de chaque classe. Cependant, un modèle discriminant a besoin de plus de données car il essaie de comprendre les différences complexes entre les classes Réfléchir à ces questions peut vous aider à mieux comprendre ces modèles et à les utiliser plus efficacement. Mais ne vous inquiétez pas si vous n'êtes pas sûr des réponses. Nous allons en discuter en détail. Regardons donc la première question. Quel modèle a besoin de plus de données pour l'entraînement ? Les modèles discriminants tels que la régression logistique nécessitent généralement davantage de données pour Ils apprennent en identifiant les différences entre les classes. Ils ont donc besoin d'un ensemble d'exemples riches et variés pour le faire efficacement. La deuxième question est lequel est concerné par les données manquantes ? Le fait est que les deux types de modèles peuvent être affectés par des données manquantes. Mais les modèles génératifs peuvent être plus sensibles car ils tentent de capturer la distribution globale des données. Toute information manquante pourrait fausser leur compréhension de cette distribution La question suivante est la suivante : quel modèle est affecté par les valeurs aberrantes ? Encore une fois, les valeurs aberrantes peuvent affecter les deux modèles, mais les modèles discriminants peuvent être plus sensibles Ces modèles se concentrent sur les limites entre les classes, et une couche extérieure peut modifier ces limites de manière significative La question suivante est la suivante : qu'est-ce qui nécessite le plus de mathématiques ? En termes de mathématiques, les modèles génératifs tels que la base naïve nécessitent souvent plus de calculs car ils impliquent l'estimation de la distribution des données, ce qui peut nécessiter beaucoup de calculs Et la dernière question est lequel a tendance à être surdimensionné ? surajustement peut se produire dans les deux modèles, mais les modèles discriminants y sont généralement plus exposés Cela est dû au fait qu'ils peuvent devenir trop attentifs aux données d'entraînement apprendre même qu'il s'agit de bruit et d'erreurs. Maintenant que nous connaissons la différence entre les discriminants et génératifs algorithmes d'apprentissage automatique discriminants et génératifs, examinons quelques exemples courants de chaque type Certains des algorithmes discriminants sont donc la régression logistique, les machines à vecteurs de support, les arbres de décision, forêts aléatoires et les machines augmentant le gradient Certains des algorithmes génératifs sont la base naïve, les modèles de mélange gaussien, les modèles de Markov cachés, l'allocation directe latente et les réseaux antagonistes base naïve, les modèles de mélange gaussien, les modèles de Markov cachés, l'allocation directe latente et les réseaux antagonistes génératifs. Pour conclure, dans cette vidéo, nous avons exploré le monde modèles discriminants et génératifs l'aide d'une histoire simple et captivante Nous avons vu comment la régression logistique dans un modèle discriminatif utilise des caractéristiques distinctes pour créer des limites de décision, tandis que le modèle génératif, basé base naïve, essaie comprendre la distribution globale des données Comprendre la différence entre les modèles discriminants et génératifs nous donne des informations précieuses sur le fonctionnement des systèmes d'IA générative Les modèles génératifs tels que ceux utilisés dans l'IA générative apprennent la distribution sous-jacente des données d'entraînement. Ces connaissances sont ensuite utilisées pour générer de nouvelles données qui reflètent les données d'entraînement. C'est pourquoi l' IA générative est si puissante. Il peut générer de nouveaux résultats réalistes tels que des images, du texte et même de la musique, car il comprend le monde de ses données d'entraînement. En revanche, les modèles discriminants apprennent simplement les limites entre les classes et sont principalement utilisés pour les tâches de classification Ils ne peuvent pas générer de nouvelles données parce qu'ils n' essaient pas de comprendre la distribution sous-jacente des données, les différences entre les classes. En comprenant ces différences, vous pourrez mieux apprécier les capacités et la flexibilité des systèmes d'IA générative. Cette compréhension pourrait vous aider à choisir le type de système d' IA le mieux adapté à votre projet ou à votre cas d'utilisation particulier Nous avons ainsi atteint la fin de la première section de ce cours, l'intelligence artificielle traditionnelle. Je vous verrai dans la section deux, où nous discuterons de l'intelligence artificielle générative. 6. L2V1 - Transformateurs: Passons maintenant aux transformateurs et leur rôle de premier plan dans le développement l'intelligence artificielle générative transformateurs sont un type de réseau neuronal capable d'apprendre les dépendances à longue portée dans des séquences Cela les rend parfaitement adaptés à des tâches telles que la génération de texte, où le modèle doit comprendre le contexte des mots précédents afin de générer le mot suivant. Transformers a révolutionné le traitement du langage naturel en 2018 traitement du langage naturel en Voyons maintenant comment fonctionnent les transformateurs. Les transformateurs sont composés de deux parties principales, un encodeur et un décodeur encodeurs sont chargés de prendre une séquence d'entrée et la convertir en une séquence d'états cachés L'encodeur est composé d' une pile de couches d' attention personnelle L'attention personnelle est un mécanisme qui permet à l'encodeur de prendre en compte différentes parties de la séquence d'entrée lors de la génération des états cachés Cela permet à l'encodeur d'apprendre les dépendances à longue portée dans la séquence d'entrée, ce qui est essentiel pour des tâches telles que la génération de texte décodeurs sont chargés de prendre une séquence d'états cachés et de générer une séquence de sortie Le décodeur est également composé d'une pile de couches d' attention personnelle Cependant, le décodeur possède également une couche d' attention particulière qui lui permet de prendre séquence d'entrée lors de la génération de la séquence de sortie Cela permet au décodeur d'apprendre à générer une sortie cohérente avec la séquence d'entrée L'encodeur et le décodeur travaillent donc ensemble pour générer une séquence de sortie Le codeur convertit d'abord la séquence d'entrée en une séquence d'états cachés Le décodeur prend ensuite ces états cachés et génère une séquence de sortie La couche d'attention du décodeur lui permet de prendre en séquence d'entrée lors de la génération de la sortie Cela permet au décodeur d'apprendre à générer une sortie cohérente avec la séquence d'entrée présente plusieurs avantages utilisation de transformateurs pour l'IA générative Tout d'abord, les transformateurs sont capables d' apprendre les dépendances à longue portée par séquences Cela leur permet de générer des résultats plus réalistes et cohérents. Deuxièmement, les transformateurs peuvent être entraînés sur de très grands ensembles Cela leur permet d'apprendre des modèles et des relations plus complexes dans les données. Et troisièmement, plusieurs transformateurs parallèles peuvent fonctionner ensemble. Cela leur permet d'être formés plus rapidement et plus efficacement. Grâce à ces avantages, les transformateurs sont devenus une approche de pointe pour une grande variété de tâches génératives d'IA, telles que la génération de texte, la génération d'images et la génération de musique Lorsque vous utilisez des transformateurs, il faut savoir qu'ils peuvent créer des hallucinations Dans les transformateurs, les hallucinations sont des mots ou des phrases générés par le modèle qui sont souvent absurdes ou Mais pourquoi les hallucinations se produisent-elles ? Les hallucinations peuvent être causées par un certain nombre de facteurs, notamment le fait que le modèle n'est pas entraîné sur suffisamment de données, ou le modèle est entraîné sur des données bruyantes ou sales, ou le modèle ne reçoit pas suffisamment de contexte ou le modèle n'est pas soumis à suffisamment de contraintes. Les hallucinations peuvent être un problème pour les transformateurs car elles peuvent rendre le texte de sortie difficile à comprendre Ils peuvent également rendre le modèle plus susceptible de générer des informations incorrectes ou trompeuses. Alors, comment atténuer les hallucinations ? Il existe plusieurs moyens d' atténuer les hallucinations chez les transformateurs. L'une des solutions consiste à entraîner le modèle sur un plus grand nombre de données. Une autre méthode consiste à utiliser une technique appelée recherche par faisceau, qui permet au modèle d'explorer un plus large éventail de sorties possibles. Enfin, il est important donner au modèle suffisamment de contexte et contraintes pour qu'il ne génère pas de résultats absurdes ou grammaticalement Voici quelques exemples d'hallucinations générées par des transformateurs. Le chat s'est assis sur le tapis et le chien a mangé la lune. Le garçon est allé au magasin et a acheté un gallon d'air. La femme s'est rendue à la banque et a retiré 1 million de dollars. Comme vous pouvez le constater, ces exemples sont tous absurdes ou grammaticalement Cela est dû au fait que les transformateurs ont généré ces mots ou phrases sans aucun contexte ni contrainte Il est important de noter que les hallucinations ne sont pas toujours une mauvaise chose. Dans certains cas, ils peuvent être utilisés pour générer des textes créatifs et intéressants. Cependant, il est important d' être conscient du risque d' hallucinations lors de l'utilisation de transformateurs et de prendre des mesures pour les atténuer. transformateurs sont utilisés pour générer une grande variété de contenus créatifs, notamment du texte, des images, de la musique et même des vidéos Parmi les applications les plus courantes des transformateurs dans l'IA générative, citons la génération de texte Les transformateurs peuvent être utilisés pour générer des textes tels que des articles de presse, des articles blog et des écrits créatifs Par exemple, le modèle de transformateur GPT Three a été utilisé pour générer de faux articles de presse réalistes, et il peut même écrire de la poésie et des histoires Génération d'images. Les transformateurs peuvent être utilisés pour générer des images telles que des peintures, des photographies et de l'art numérique Par exemple, le modèle de transformateur Imagine a été utilisé pour générer des images réalistes de personnes, d'animaux et d'objets. Génération musicale. Les transformateurs peuvent être utilisés pour générer de la musique, telle que des chansons, des mélodies et des rythmes Par exemple, le modèle de transformateur Mus Net a été capable de générer une musique originale qui sonne comme si elle avait été composée par un musicien humain. Et nous avons la génération de vidéos. Les transformateurs peuvent être utilisés pour générer des vidéos, telles que des films, des émissions de télévision et des dessins animés Par exemple, le modèle de transformateur Deep Mind video a été utilisé pour générer une vidéo réaliste qui semble avoir été filmée par un caméraman humain. mesure que la technologie continue de se développer, nous pouvons nous attendre à voir applications encore plus étonnantes des transformateurs dans l'IA générative Les transformateurs ont le potentiel de révolutionner la façon dont nous créons et consommons du contenu, et ils sont déjà utilisés pour créer des choses vraiment incroyables. 7. L2V2 - Gen IA: Bienvenue dans l'intelligence artificielle générative. Nous commençons cette vidéo en expliquant comment faire la distinction entre l'IA générative et l'apprentissage automatique traditionnel. Ensuite, nous donnons une définition officielle de l'intelligence artificielle générative et terminons la vidéo par quelques exemples d'IA générative. Nous présentons ici deux approches clés de l'intelligence artificielle, l' apprentissage automatique traditionnel et l' intelligence artificielle générative. L'image du haut montre l'apprentissage automatique traditionnel. Ici, le modèle apprend à partir des données associées à des étiquettes. Ce qu'il fait, c'est établir le lien entre les caractéristiques des données et les étiquettes correspondantes. Cette compréhension est ensuite utilisée pour faire des suppositions éclairées sur de nouvelles données inédites Maintenant, la partie inférieure de l'image montre quelque chose d'un peu différent. Le modèle d'IA générative. Au lieu de simplement déterminer la relation entre les entrées et les sorties, il approfondit les choses. Il met l'accent sur le schéma complexe du contenu. est cette compréhension du modèle qui lui donne le pouvoir de créer lui-même du contenu nouveau et réaliste. Cela peut être n'importe quoi, un poème, un article de presse, une photo ou même une composition musicale. Vous voyez donc que l'IA générative apporte un nouvel angle créatif au vaste monde de l'IA. La nature du résultat joue un rôle crucial dans la différenciation entre l' IA générative et les autres modèles Les modèles traditionnels produisent généralement des résultats catégoriels ou numériques, exemple pour déterminer si un e-mail est un spam ou non ou pour prédire les chiffres de vente D'autre part, l'IA générative peut produire des résultats tels que du langage écrit ou parlé, des images ou même du son, reflétant ainsi sa capacité à générer du contenu imitant la réalité On peut l'imaginer mathématiquement ainsi. Si vous n'avez pas vu cette équation récemment, voici un petit rappel. L'équation Y égale F de X calcule le résultat en fonction de différentes entrées Y symbolise le résultat du modèle. F représente la fonction que nous utilisons dans le calcul. Et qu'en est-il de X ? Cela représente les entrées ou les entrées utilisées dans l'équation. Donc, en termes simples, la sortie du modèle est fonction de toutes les entrées. La clé ici est de comprendre la nature de la sortie Y en fonction des entrées X. Les modèles traditionnels produisent généralement des résultats numériques. Les modèles d' IA générative peuvent associer ces valeurs numériques à différentes formes d'informations, ce qui les rend capables de générer des réponses complexes telles que des phrases en langage naturel, des images et des vidéos. En résumé, les processus classiques traditionnels d' apprentissage supervisé et non supervisé utilisent code de formation et les données d'étiquetage pour créer un modèle Selon le cas d'utilisation ou le problème, le modèle peut vous donner une prédiction. Il peut classer ou regrouper quelque chose. La différence réside dans l'application. Les modèles traditionnels font des prédictions, classifient ou regroupent les données, tandis que les modèles d'IA générative sont plus polyvalents créent un large éventail de contenus. La méthode d'IA générative peut fonctionner avec du code d'apprentissage, des données étiquetées et des données non étiquetées de toutes sortes pour construire ce que nous appelons un modèle de base Ce modèle de base peut ensuite produire de nouveaux contenus, tels que du texte, du code, des images, du son, de la vidéo, etc. La puissance de l'IA générative réside dans sa capacité à ingérer divers types de données, y compris des données non étiquetées, pour créer des modèles qui génèrent du nouveau contenu, au-delà des capacités des modèles traditionnels Nous avons parcouru un long chemin en passant de la programmation traditionnelle aux réseaux neuronaux et maintenant aux modèles génératifs. À l'époque de la programmation traditionnelle, nous devions saisir manuellement les règles pour différencier le chat. Nous avons dû intégrer des règles spécifiques dans le programme. C'était un peu comme si c' un animal à quatre pattes, deux oreilles, une fée, et qu'il aimait la laine et l'herbe à chat, alors c'est probablement un Et nous avons dû écrire tout cela dans un langage de programmation et non dans un langage naturel. À la manière des réseaux neuronaux, nous pourrions montrer les images des réseaux de chats et de chiens, puis nous demander s'il s'agit d'un chat. Le réseau répondrait probablement par une prédiction, c'est un chat. Nous pouvons donc constater que les réseaux de neurones permettent une prise de décision plus nuancée en s'entraînant sur des exemples, ce qui constitue une évolution par rapport aux règles de codage en dur Dans le cadre de la vague générative, nous pouvons produire notre propre contenu, tel que du texte, des images , du son, de la vidéo, etc. Des modèles tels que le modèle de langage Palm ou Pathways, modèle de langage Lambda pour les applications de dialogue et le GPT, transformateur génératif pré-entraîné, consomment de grandes quantités de données provenant de diverses sources, y compris Internet pour créer des modèles linguistiques de base, qui peuvent être utilisés simplement en posant une question, qu'il s'agisse de la taper dans une invite ou en parlant verbalement dans se demande elle-même. Donc, si nous lui demandons ce qu'est un chat, il peut nous donner tout ce qu'il a appris sur le chat. L'IA générative stimule l'interaction avec les utilisateurs, les transformant du statut de simples spectateurs en créateurs actifs Des modèles comme Palm, Lambda et GPT se démarquent Ils sont formés sur de grands ensembles de données et fournissent des réponses intelligentes tenant compte du contexte Cette focalisation sur l'utilisateur rend l' IA générative attrayante pour une gamme d' applications différentes. Donnons maintenant notre définition officielle. Qu'est-ce que l'IA générative ? L'IA générative est un type d'intelligence artificielle qui crée de nouveaux contenus en fonction de ce qu'elle a appris du contenu existant. Le processus d'apprentissage à partir du contenu existant est appelé formation et aboutit à la création d'un modèle statistique lorsqu'on lui en donne l'ordre. IA utilise le modèle pour prédire quelle pourrait être une réponse attendue ce qui génère du nouveau contenu L'accent est mis ici sur l'héritabilité de l' IA générative pour apprendre et créer Contrairement aux modèles traditionnels, qui prévoient en fonction de relations préétablies, IA générative se concentre sur la compréhension de la structure sous-jacente des données d'entrée. Après la formation, le modèle peut générer des réponses ou du contenu uniques, ce qui élargit considérablement les applications et les capacités des systèmes d'IA Essentiellement, il apprend la structure sous-jacente des données et peut ensuite générer de nouveaux échantillons similaires aux données sur lesquelles il a été formé. Voyons donc quelle est la différence entre les modèles de langage et les modèles d'image. Les modèles de langage génératifs découvrent les modèles du langage grâce à des données d'entraînement. Ensuite, à partir de quelques textes, ils prédisent ce qui va suivre. Les modèles d'image génératifs produisent nouvelles images à l'aide de techniques telles que la diffusion. Ensuite, à partir d'une invite ou d'une imagerie associée, ils transforment le bruit aléatoire en images ou génèrent des images à partir d'instructions. Examinons chacun d'eux un peu plus en profondeur. Comme indiqué précédemment, les modèles de langage génératifs se concentrent sur la compréhension de la structure inhérente des modèles au sein des données Ils exploitent ensuite ces modèles appris pour générer de nouvelles réponses ou de nouveaux contenus. Qui ressemblent souvent étroitement aux données d'origine. Ces caractéristiques font des grands modèles linguistiques un exemple exceptionnel du potentiel générateur de l'AIS. Un modèle de langage génératif prend du texte en entrée et peut générer davantage de texte et d'images, de son ou de décisions. Par exemple, sous le texte de sortie, réponse à une question est générée, et sous l'image de sortie, une vidéo est générée. grands modèles linguistiques sont donc un type d'IA générative, car ils génèrent de nouvelles combinaisons de textes sous forme de langage naturel Nous avons également des modèles d'image génératifs, qui prennent une image en entrée et peuvent générer du texte, une autre image ou une vidéo. Par exemple, sous le texte de sortie, vous pouvez obtenir une réponse visuelle aux questions, une tâche de vision par ordinateur qui consiste à répondre à des questions sur une image, tandis que sous l'image de sortie, une complétion d'image est générée. Et sur leur vidéo de sortie, une animation est générée. Comme nous l'avons déjà mentionné, modèles de langage génératifs découvrent les modèles et les structures linguistiques grâce à leurs données d'entraînement. Et puis, lorsqu'on leur donne un texto, ils essaient de prédire ce qui va suivre. Ainsi, dans un sens, les modèles de langage génératifs peuvent être considérés comme des systèmes d' appariement de modèles, affinant leur capacité à discerner des modèles à partir des données qui leur sont présentées Maintenant que nous avons fourni la définition officielle de l' intelligence artificielle générative, terminons cette vidéo par quelques exemples d'IA générative. Voici un exemple de fonctionnalité de saisie automatique de Google Search. Sur la base des enseignements tirés de ses données d'entraînement, il propose des prédictions sur la manière de compléter cette phrase. Les chats détestent, et certaines suggestions suggèrent que les chats détestent l'odeur de l'eau, les chats détestent les concombres. Voici le même exemple utilisant bar, modèle de langage formé sur une énorme quantité de données textuelles et capable de communiquer et de générer du texte semblable à celui d'un humain en réponse à un large éventail de demandes et de questions Donc, quand j'utilise le message, les chats détestent qu'il réponde. Les chats détestent beaucoup de choses, mais certaines des plus courantes incluent, puis une liste de choses qu'ils pensent que les chats détesteraient. Et la même invite utilisant GPT quatre produit cette réponse. Les chats détestent. Les chats peuvent exprimer leur aversion ou leur malaise en réponse à une variété de situations, d'objets ou de comportements Vous trouverez ci-dessous certaines des choses que les chats n'aiment généralement pas et énumérez certaines des choses qu'ils pensent que les chats détesteraient À l'instar de Bart, GPT four est également un modèle linguistique formé sur une énorme quantité de données textuelles et capable de communiquer et de générer du texte semblable à celui d'un humain en réponse à un large éventail de demandes et de questions Voyons maintenant quelques exemples de génération d'images. Nous utilisons la même invite sur trois outils d'IA différents. L'invite est un chat entouré de choses que les chats détestent. Si nous essayons cette invite sur DALE, qui est un générateur d'images AI construit par OpenAI, la même société qui a créé GPT Nous obtenons ce résultat. Nous pouvons également l'essayer sur le générateur d'images Adobe Firefly Tik to Et voici quelques-uns des résultats que nous obtenons avec Firefly Nous pouvons également essayer l'application de synthèse texte en image Canva, fournit quelques exemples de ce qu'elle juge approprié en réponse à nos demandes. N'oubliez pas que nous avons utilisé ici un message très minimaliste, juste pour montrer que même sans fournir beaucoup de contexte, nous pouvons toujours produire des résultats plus ou moins pertinents Nous obtiendrions un bien meilleur résultat si notre message incluait plus de détails et suivait une structure solide. Cela souligne l'importance d'une conception et d' une ingénierie rapides, que nous aborderons plus loin dans cette section. Dans la prochaine vidéo, nous parlerons des transformateurs, une technologie qui a rendu tout cela possible. On se voit dans le prochain. 8. L2V3 - Applications de l'IA de génération: Examinons le type de tâches que les différents modèles d'IA peuvent effectuer. Cette tâche peut généralement être classée en fonction du type de données d' entrée qu'ils acceptent et du type de données de sortie qu'ils génèrent. Voici quelques exemples. Texte à texte. Ceci est généralement utilisé dans la traduction automatique, la synthèse de texte et les chatbots tels que Bard et chat GPT Par exemple, si vous demandez à GPT 4, qu'est-ce qu'un chat ? Je dois vous dire qu'un chat est un petit mammifère carnivore que l'on garde souvent comme Le terme fait généralement référence aux chats, puis il continue de générer plus en plus d' informations sur les chats. Un autre modèle est le texte en image. Ceci est utilisé pour générer des images à partir de descriptions textuelles. L'application texte vers image Canvas, qui crée des images à partir de saisies de texte, en est un exemple application texte vers image Canvas, qui crée des images à partir de saisies de texte, . Dans cet exemple, nous pouvons utiliser l'invite un chat gris et blanc assis sur le rebord d'une fenêtre en train de regarder des pigeons à l'extérieur. Et cela va générer cette image pour nous. Du texte à la vidéo. L'IA peut également être utilisée pour générer des vidéos à partir de descriptions textuelles, bien qu'il s'agisse d'une tâche plus complexe et moins explorée que la génération de texte en image. Par exemple, à l'aide d'outils tels que la vidéo, nous pouvons créer une vidéo avec juste un message de promotion. Le modèle d'IA utilise notre invite pour écrire un script pour la vidéo , puis sélectionne les images et les clips vidéo pertinents par rapport au contenu du script. Il peut même appliquer des filtres et des transitions à la vidéo. Certains de ces outils peuvent également sélectionner une musique adaptée au contenu de la vidéo. Par exemple, le modèle d'IA peut associer les animaux espièglerie, puis choisir une musique ludique à ajouter à la vidéo Du texte en trois D, ces modèles génèrent des objets tridimensionnels qui correspondent à la description textuelle de l'utilisateur. Par exemple, si vous demandez à Shape E, un modèle génératif conditionnel trois actifs D, de créer un avion ressemblant à une banane. Il crée l' objet en trois D que vous pouvez voir ici. Nous avons également du texte à coder. Ces modèles sont capables d'utiliser description en langage naturel , puis de créer un code basé sur cela. Il est utile pour des tâches telles que la génération automatique de code, détection d'erreurs et la traduction de code. Par exemple, le copilote Hat GPT, Bart et Github partagent la capacité de générer du code Les modèles tels que Chat GPT, grâce à leur formation sur un large éventail de textes Internet, y compris le code, ont la capacité de générer du code lorsqu'ils sont fournis avec un bal de fin d'année approprié Bart two travaille dans le même sens, mais sa formation est spécifiquement axée sur la programmation de textes liés à la programmation. Nous avons également un copilote Github qui utilise le modèle Codex d'OpenAI, qui est formé sur du code accessible au public, ce qui lui permet de suggérer la complétion du code et de générer du code à partir de commentaires ou de signatures de fonctions C'est une tâche difficile. Les modèles Takes to Task sont entraînés à exécuter une tâche ou une action définie en fonction de la saisie de texte. Cette tâche peut consister en un large éventail d'actions, telles que répondre à une question, effectuer une recherche, faire une prédiction ou effectuer une action quelconque. Par exemple, un modèle Ts to Task peut être entraîné à naviguer dans une interface utilisateur Web ou apporter des modifications à un document via l'interface graphique. Nous avons également une image pour le texte. Ceci est utilisé dans des tâches telles que sous-titrage d' images où l'IA décrit une image avec des mots Par exemple, BLip, qui est un modèle d'IA capable à la fois de sous-titrer et de générer des images, peut prendre une image en entrée et fournir une description de cette image sous forme de texte en sortie Nous avons également une image par image. Ces modèles exécutent des tâches telles que la traduction d'images, par exemple conversion d'images de jour en images de nuit, la colorisation d'images en noir et blanc ou l'amélioration de la résolution Par exemple, Night Cafe est un générateur d'images basé sur l'IA qui peut prendre une image en entrée pour initialiser le processus de création d'image Il produit ensuite une image stylisée en sortie en fonction de l'invite de l'utilisateur et d'autres paramètres pouvant être Selon l'algorithme choisi, artistique ou cohérent, l'image de départ répond à différents objectifs. Pour l'algorithme artistique, les formes et les structures de l'image sont plus importantes. Mais dans l'algorithme cohérent, plus grande attention est accordée à la résolution, aux couleurs et aux textures. Comme autre exemple, examinons la fonction d'édition magique de Canva Grâce à cette fonctionnalité, nous pouvons sélectionner une partie spécifique de l'image et la remplacer par une autre image. Par exemple, ici, je sélectionne le panier puis dis au modèle que je veux remplacer par une chaîne de montagnes, espérant que le résultat donnera l' impression que le chat est assis sur un rocher. Et nous pouvons voir que le modèle me fait des suggestions. Si je ne suis pas satisfait du résultat, je peux demander au modèle de régénérer les résultats jusqu' à ce que je trouve quelque chose qui me plaît Et voici le résultat final. Je peux même aller plus loin et sélectionner le plafond en arrière-plan et demander au modèle de le remplacer par le ciel avec des nuages. Et voici à quoi ressemble le résultat. De la vidéo au texte. Cela implique de générer une description textuelle ou une transcription à partir d'une vidéo. Par exemple, RS AI peut créer des transcriptions ou des sous-titres à partir d'une entrée vidéo, voire les traduire d' une langue à l'autre Bien que ce que nous voyons dans cet exemple sous-titre uniquement l' élément vocal de la vidéo, certains des outils de sous-titrage les plus avancés sont capables de sous-titrer des éléments non vocaux éléments non vocaux peuvent inclure des effets sonores, par exemple bourdonnement d'une abeille, le bruit du fromage ou une sonnette, de la musique, arrière-plan ou dans le cadre d'une scène, les réactions du public, par exemple, des rires, des gémissements ou des huées, une manière de parler, par exemple, chuchoter, crier, souligner un mot ou parler avec un accent Les éléments non vocaux peuvent inclure des effets sonores, par exemple le bourdonnement d'une abeille, le bruit du fromage ou une sonnette, de la musique, en arrière-plan ou dans le cadre d'une scène, les réactions du public, par exemple, des rires, des gémissements ou des huées, une manière de parler, par exemple, chuchoter, crier, souligner un mot ou parler avec un accent et un haut-parleur identification d'un narrateur ou d'un orateur hors écran ou de plusieurs orateurs De même, nous avons le format audio en texte. Ceci est généralement utilisé dans les systèmes de reconnaissance vocale pour transcrire le langage parlé en texte écrit Whisper by Open AI est un exemple de modèle de conversion audio en texte L'IA peut également transformer le texte en discours synthétisé. Les systèmes de synthèse vocale convertissent le texte en langue parlée. De nombreux outils d'intelligence artificielle, tels que Play Dot HT, peuvent saisir du texte et générer un discours semblable à celui d'un humain avec des voix synthétisées qui peuvent ressembler à différents genres, âges, accents ou même à différents tons, tels que joie, tristesse, colère, etc. De l'image à la vidéo. Cette tâche consiste à générer une séquence d'images ou une vidéo à partir d'une seule image ou d'un ensemble d'images. Par exemple, les photos cinématographiques, une fonctionnalité de Google Photos, utilisent l' apprentissage automatique pour estimer profondeur d'une image et créer une représentation tridimensionnelle de la scène, que l' image d'origine contienne ou non des informations de profondeur provenant de l'appareil photo suite de cette estimation, le système anime une caméra virtuelle pour créer un effet panoramique fluide semblable à une séquence cinématographique Ce processus complexe utilise l'intelligence artificielle pour transformer une image statique en une scène tridimensionnelle dynamique, lui conférant ainsi une qualité similaire à celle d'une vidéo Ce dont nous avons discuté jusqu'ici ne sont que quelques exemples, et la liste ne cesse de s'allonger à mesure que le domaine de l'IA progresse et que les chercheurs inventent de nouvelles applications pour ces technologies. De plus, dans de nombreuses applications du monde réel, ces tâches sont combinées. Par exemple, un système d'intelligence artificielle peut avoir besoin de convertir la parole en texte à l'aide d'un modèle de synthèse vocale, puis de traiter le texte à l'aide d'un modèle , puis de générer une réponse appropriée en langage parlé, qui utilise un modèle texte-audio. Mais attendez, il y en a plus. Il existe de nombreux autres domaines dans lesquels GNAI peut avoir des applications révolutionnaires. Par exemple, considérez simplement le mot « musique ». Les tâches liées à la musique constituent un domaine actif de recherche et de développement dans le domaine de l'IA. Voici quelques tâches courantes. Nous avons du texto en musique. Ces modèles peuvent générer de la musique en fonction des entrées de texte. Par exemple, ils peuvent créer une mélodie ou une composition décrite par une phrase ou un morceau de texte. De la musique au texto. D'autre part, l'IA peut également convertir de la musique en texte, exemple en créant des partitions pour une chanson ou en générant un texte descriptif ou émotionnel basé sur un morceau de musique. Nous avons l'audio en audio, qui permet de convertir un type de son ou de musique en un autre, exemple en changeant le genre d'une chanson, transformant un bourdonnement en une pièce composée ou même en supprimant les voix des pistes Il y a aussi des recommandations musicales. L'IA est largement utilisée pour recommander de la musique en fonction des habitudes d'écoute, des préférences et même de l'humeur des utilisateurs préférences et même de l'humeur Nous avons également la génération musicale. Mus Net d'Open AI est un exemple de génération musicale. Des modèles tels que Mus enet d'OpenAI peuvent générer des compositions musicales de quatre minutes avec dix instruments différents et peuvent combiner styles allant du country au mozart en passant par les Beatles Il y a aussi l'amélioration de la musique. Par exemple, Audio Studio peut être utilisé pour améliorer ou modifier de la musique existante. Il peut le faire en augmentant la qualité audio , en modifiant le tempo ou en ajoutant des effets Et il y a aussi la séparation des sources musicales. Nous pouvons également utiliser des modèles d'IA pour séparer les instruments individuels, les voix ou d'autres composants d'une piste mixée ou master Metas DMax est un exemple d'outil de séparation de sources musicales En conclusion, le domaine de l'IA générative est diversifié, fascinant et plein de potentiel. L'éventail de tâches qu'il peut effectuer s'agisse de prises de vue, de prises d'images, de prises audio ou de tâches complexes telles que amélioration et la génération de musique, est vraiment remarquable C'est un domaine en constante évolution, repoussant les limites de ce que nous croyions possible. Au fur et à mesure que nous continuons à explorer et à innover, la liste des applications ne fera que s'allonger. IA générative est la clé de nombreuses percées et avancées susceptibles de révolutionner de nombreux secteurs et la façon dont nous interagissons avec la Alors que nous continuons à explorer cette ère passionnante de l'IA, qui sait quelles possibilités étonnantes nous pourrions découvrir ? L'essentiel est de rester curieux, continuer à explorer et de commencer à imaginer un avenir dans lequel nous pourrons interagir avec les systèmes d' IA de manière fiable, responsable et éthique. 9. L2V4 - Ingénierie rapide: Parlons d'un sujet fascinant dans le domaine de l' IA générative, l'ingénierie rapide Comme son nom l'indique, IA générative concerne les systèmes qui génèrent des résultats, il s'agisse de texte, d'images ou de tout autre type de contenu. Comme vous le verrez dans la section suivante de ce cours, grands modèles linguistiques ou LLM, qui sont la puissance de l'IA générative, sont conçus pour générer du texte semblable à celui de l'homme en fonction des instructions de saisie En plus de générer des textes de type humain, LLM aident également à traduire nos instructions en sorties d'autres types de contenu, tels que des images et des vidéos Cela signifie que plus nos instructions de saisie sont efficaces, plus nous avons de chances d'obtenir des résultats de meilleure plus nous avons de chances d'obtenir qualité avec n'importe quel outil d'IA générative Aujourd'hui, nous allons explorer plusieurs aspects clés liés à ces invites de saisie Nous allons clarifier ce qu' est exactement une invite et son rôle dans le façonnement de la sortie du modèle. Nous ferons la distinction entre une conception rapide et une ingénierie rapide, puis passerons à l'introduction de diverses méthodes d'ingénierie rapide. Enfin, nous discuterons des limites de l' ingénierie rapide afin de vous donner une compréhension et des attentes réalistes à l'égard de ce processus passionnant. Commençons donc. Alors, qu'est-ce qu'une invite ? Une invite est essentiellement un texte envoyé à un modèle d' IA génératif en entrée. Mais il ne s'agit pas de n'importe quelles prises. Elle répond à un objectif fondamental. Ces instructions constituent votre lien de communication avec le modèle. Ils dirigent le modèle d'IA et orientent sa génération de résultats. Le modèle prend en compte votre invite, la traite et fournit une sortie conforme aux instructions de l' invite. En d'autres termes, ces instructions sont outil qui vous permet de contrôler la sortie du modèle Pensez à une invite comme instruction d'orientation vers le modèle d'IA générative, comme un réalisateur guidant un acteur. Plus votre direction est précise et claire, meilleure est la performance que vous pouvez attendre de l'acteur. De même, des instructions bien conçues permettent au modèle de produire des résultats de meilleure qualité et plus spécifiques N'oubliez pas que la clé réside dans la qualité et le design de vos instructions, et c'est là que les concepts de conception rapide et d'ingénierie rapide entrent en jeu, dont nous allons parler maintenant Comme nous l'avons mentionné précédemment, la qualité de l'invite joue un rôle crucial dans la détermination de la qualité du résultat d'un modèle d'IA génératif. Ici, deux concepts entrent en jeu : une conception rapide et une ingénierie rapide. conception rapide fait référence à l'élaboration d'instructions spécifiques à la tâche que le modèle est invité à Par exemple, si vous souhaitez que le modèle traduise un texte de l'anglais vers le français, l'invite sera rédigée en anglais et indiquera que le résultat souhaité doit être en français. Il s'agit essentiellement de créer des invites qui généreront le résultat souhaité. D'autre part, nous avons une ingénierie rapide. Ce processus vise davantage à améliorer les performances du modèle. Cela implique des stratégies telles que l'exploitation de connaissances spécifiques à un domaine, la fourniture d'exemples du résultat souhaité ou l'incorporation de mots clés connus pour être efficaces pour un modèle d'IA générative particulier. Vous voyez, bien que les deux concepts tournent autour de la création d'instructions, ils ont des objectifs différents. La conception rapide consiste à adapter les instructions aux tâches, tandis que l'ingénierie rapide vise à améliorer les performances Cependant, ils ne s'excluent pas mutuellement. Dans la pratique, la création d'une invite efficace implique souvent à la fois de la concevoir pour la tâche et de l'adapter à de meilleures performances. Examinons maintenant certaines des techniques utilisées dans l' ingénierie rapide pour optimiser la qualité de sortie de nos modèles d'IA générative. L'une de ces méthodes consiste à utiliser des connaissances spécifiques au domaine. Lorsque vous connaissez bien le domaine de tâche, vous pouvez tirer parti de cette expertise pour concevoir des instructions qui guident le modèle de manière plus efficace Par exemple, si vous travaillez dans le domaine de l'IA médicale, vous pouvez utiliser la terminologie et les structures médicales dans vos instructions pour améliorer la précision Une autre méthode consiste à utiliser mots clés connus pour être efficaces pour un modèle spécifique. Tout comme dans l'optimisation pour les moteurs de recherche, où des mots clés spécifiques aident à mieux classer les pages, certains mots clés peuvent orienter le modèle de manière plus efficace. Le choix des mots clés serait basé sur les données d'entraînement du modèle et ses modèles appris. Avec des modèles tels que Bart ou chat GPT, vous pouvez directement demander au modèle quels sont ces mots clés et comment les utiliser pour optimiser votre invite Nous devrions également envisager des stratégies avancées telles que l'incitation à des rôles, l'incitation à des tirs et l'incitation par chaîne de pensée invite à jouer un rôle est une technique dans laquelle nous demandons au modèle GNAI assumer un certain rôle ou un certain personnage lors de la génération de sa Par exemple, vous pourriez demander au modèle de réagir comme s'il s'agissait d'un historien expliquant les causes de la Première Guerre mondiale Le modèle utilise ensuite ses données d'entraînement pour générer une réponse correspondant à cette personne invite de prise de vue, quant à elle, consiste à donner une vue du contexte avant l'instruction elle-même Vous pouvez fournir des exemples du résultat souhaité. Cela permet d'orienter le modèle en lui fournissant une référence ou un plan de ce qui est attendu Par exemple, si vous souhaitez obtenir un résumé d'un document, vous pouvez fournir quelques exemples de résumés en plus du texte original Ou si vous recherchez une critique de film, au lieu de simplement dire « rédigez une critique du film X », vous pourriez dire Imaginez que vous venez de terminer de regarder le palpitant film X dans un cinéma bondé Rédigez une critique du film. Ce contexte ajouté peut aider le modèle à produire des résultats plus chargés d'émotions et plus sensibles au contexte. Il existe différents types d'invite à la prise de vue, à zéro, à une ou à quelques prises Zero Shot invite à exécuter le modèle Gen AI sans exemples préalables Par exemple, traduisez cette phrase anglaise en français. Le chat est effréné. Ici, nous proposons une tâche sans exemple précis de la manière dont elle doit être effectuée. invite One Shot fournit un exemple unique à titre indicatif Par exemple, poursuivez l'histoire suivante. Il était une fois, dans un pays lointain, une nuit courageuse. Ensuite, nous donnons un exemple de suite de l'histoire. Le modèle essaie ensuite de continuer l'histoire suivant le style de l'exemple que nous avons fourni. Et nous avons quelques suggestions de prises de vue , également connues sous le nom d'invite multiprises Nous fournissons ici plusieurs exemples pour aider le modèle. Par exemple, demandez au modèle de générer une critique de produit, précédée d'une série d' exemples de critiques de produits. Le modèle essaiera de rédiger une critique similaire aux exemples que nous avons fournis. Enfin et surtout, incitation à la chaîne de pensée implique de fournir un raisonnement ou un argument au modèle GNAI Au lieu d'une question ou d'une instruction directe, vous donnez une série de réflexions qui mènent à la question. Par exemple, au lieu de demander quelles sont les causes du réchauffement climatique, vous demanderiez que nous avons assisté une augmentation des températures mondiales au cours des dernières décennies. Ce changement, souvent appelé réchauffement de la planète, semble être influencé par divers facteurs. Quelles en sont les causes ? Ces stratégies peuvent améliorer la richesse et la pertinence des résultats du modèle, démontrant ainsi la puissance d'une ingénierie rapide et habile N'oubliez pas qu'il ne s'agit pas de méthodes autonomes, mais qu'elles peuvent souvent être combinées pour créer une invite puissante Maintenant que nous avons compris ces techniques, passons aux limites de l'ingénierie rapide. Bien qu'une ingénierie rapide ouvre des opportunités intéressantes pour affiner le résultat d'un modèle d'IA générative, il est important de garder à l'esprit qu'il ne s'agit pas d'une baguette magique qui peut toujours garantir des résultats parfaits. Il existe certaines limites et contraintes dont nous devons être conscients. Tout d'abord, les modèles d'IA générative, bien que puissants, ne sont pas omnipotents Ils sont formés sur un large éventail de données, mais cela ne signifie pas qu'ils sont capables de répondre avec précision à n'importe quelle question ou d'accomplir toutes les tâches que vous leur demandez. Par exemple, le modèle n'a pas la capacité de générer du contenu en dehors de la date limite de formation ou de prévoir avec précision les événements futurs. Deuxièmement, la précision et la pertinence de la sortie du modèle dépendent fortement de la qualité et de la clarté de votre message. Cependant, même une invite parfaitement conçue peut ne pas toujours produire le résultat escompté en raison de l'imprévisibilité inhérente aux modèles d'IA Troisièmement, même avec une ingénierie rapide et méticuleuse, les modèles peuvent parfois générer des résultats factuellement incorrects ou absurdes En effet, ces modèles génèrent des réponses basées sur les modèles qu'ils ont appris pendant l'entraînement, et ils ne comprennent pas le contenu au sens humain du terme. Enfin, certaines tâches peuvent nécessiter un niveau de spécification ou de connaissances spécifiques à un domaine celui de la formation du modèle Un modèle d'IA générative à usage général peut ne pas être en mesure de générer avec précision du contenu hautement spécialisé ou de répondre à des demandes hautement techniques dans des domaines tels que le droit, les mathématiques avancées ou des sous-disciplines médicales spécifiques Bien que l'ingénierie rapide soit un outil puissant, il est essentiel de connaître ces limites pour maintenir des attentes réalistes et utiliser modèles d'IA génératifs de manière plus efficace. Bien, terminons les choses. Aujourd'hui, nous avons exploré le monde des instructions dans les modèles d'IA générative Nous avons découvert la conception et l' ingénierie rapides et avons discuté diverses méthodes telles que le prompt prompting, roll prompting et le guidage par chaîne de pensée N'oubliez pas qu'une ingénierie rapide n' est pas une solution miracle. C'est un outil, et comme tout outil, il a ses limites. Essayez donc de créer vos propres instructions et explorez les possibilités Merci d'avoir regardé, je vous verrai dans le prochain. 10. L3V1 - LLM: Bienvenue dans l'introduction aux grands modèles linguistiques. grands modèles linguistiques, ou LLM en abrégé, sont un sous-ensemble de l'apprentissage profond Elles se recoupent avec l'IA générative, qui fait également partie du deep learning Nous avons déjà expliqué que l'IA générative est un type d'intelligence artificielle capable de produire de nouveaux contenus, notamment du texte, des images, du son et des données synthétiques. Mais que sont les grands modèles linguistiques ? Lorsque nous utilisons le terme « grands modèles linguistiques », nous faisons référence à de grands modèles linguistiques à usage général que nous pouvons préformer puis affiner répondre à nos besoins à des fins spécifiques. Mais qu'entendons-nous par « pré-formé » et « affiné » ? Pensez au processus de dressage d'un chien. Généralement, vous donnez des instructions de base à votre chien , comme s'asseoir, se calmer et rester Ces commandes sont généralement suffisantes pour la vie de tous les jours aident votre chien à devenir un chien bien élevé dans le quartier Toutefois, lorsque vous avez besoin d'un chien pour remplir un rôle spécial, tel qu'un chien de sécurité, un chien-guide ou un chien policier, formation spécifique supplémentaire devient nécessaire. Le même principe s'applique aux grands modèles linguistiques, tout comme le dressage spécialisé prépare les chiens à leurs rôles uniques, peaufinage d'un grand modèle linguistique pré-entraîné lui permet d'effectuer des tâches spécifiques de manière efficace et précise, qu'il s'agisse d'analyse des sentiments ou de traduction automatique. Le modèle peut être affiné vers Excel dans le domaine souhaité. Ces modèles font l'objet d'une formation générale qui les prépare à aborder les tâches standard liées au langage, les prépare à aborder les tâches standard liées au langage telles que la classification de texte, une tâche de traitement du langage naturel largement utilisée qui consiste à classer le texte en groupes organisés en fonction de son contenu La réponse aux questions, qui est une tâche importante dans le traitement du langage naturel, où le modèle est entraîné pour comprendre et répondre aux demandes avec précision, simulant essentiellement la capacité humaine à comprendre les questions et à y répondre Récapitulatif de documents, où le modèle est chargé de produire un résumé concis et fluide d'un texte volumineux, d' conserver l'essence et les idées principales et idées principales générer du texte dans de nombreux secteurs, de créer un texte de type humain, créer un texte de type humain, qui peut être adapté à un secteur spécifique, qu'il s'agisse de rédiger des e-mails dans le cadre de la communication d'entreprise, créer une description de produit dans commerce électronique ou génération de rapports de patients dans le secteur de la santé. Ces modèles peuvent être affinés afin de résoudre des défis uniques dans divers secteurs, notamment le commerce de détail, la finance et le divertissement, en utilisant des ensembles de données spécifiques à des domaines relativement plus petits Par exemple, dans le commerce de détail, ils peuvent être utilisés pour des recommandations de produits personnalisées basées sur des données textuelles. Dans le domaine de la finance, ils peuvent aider à prévoir les tendances du marché à partir des rapports financiers Dans le secteur du divertissement, ils peuvent également contribuer à génération de scripts ou à la recommandation de contenu, démontrant ainsi la flexibilité et large applicabilité des grands modèles linguistiques Décomposons ensuite le concept en trois caractéristiques principales des grands modèles linguistiques. grands modèles linguistiques sont volumineux, polyvalents, préformés et affinés. Discutons de chacun d'eux séparément. Le terme « grand » désigne deux choses. Tout d'abord, cela souligne la taille massive de l'ensemble de données d'entraînement, atteignant parfois l' échelle du pétaoctet Deuxièmement, cela met en évidence l'immense nombre de paramètres impliqués. Dans le domaine de l'apprentissage automatique, ces paramètres sont souvent appelés hyperparamètres Essentiellement, ces paramètres agissent comme la mémoire et les connaissances acquises la machine lors de l'entraînement du modèle. Ils décrivent souvent la capacité d'un modèle à aborder une tâche telle que la prédiction En ajustant ces paramètres, nous pouvons affiner les performances du modèle pour des prévisions plus précises. L'usage général signifie que les modèles sont suffisamment puissants pour résoudre les problèmes courants du quotidien Ce concept repose sur deux raisons. Tout d'abord, le langage humain présente une nature universelle, quelle que soit la tâche distincte à laquelle il est appliqué. Deuxièmement, nous devons tenir compte des limites de ressources. Seul un nombre limité d'organisations ont la capacité de former ces modèles linguistiques massifs, qui nécessitent de vastes ensembles et une quantité énorme de paramètres Alors pourquoi ne pas laisser ces organisations élaborer des modèles linguistiques fondamentaux que d'autres pourront utiliser Cela nous amène à l'aspect final des grands modèles linguistiques, pré-formation et de la mise au point. Cela signifie essentiellement qu'un grand modèle linguistique est d'abord préformé pour des cas d'utilisation étendus, en utilisant un vaste ensemble de données, collectant un large éventail de modèles et de connaissances linguistiques. Après cette phase préalable à l' entraînement, le modèle est ensuite affiné pour répondre à des objectifs particuliers à l'aide d'un données relativement petit et plus spécialisé Ce processus en deux étapes garantit que le modèle conserve une large base de compréhension tout en étant capable de comprendre en profondeur et générer des prédictions spécifiques à un domaine ou à une tâche donné. C'est ainsi que nous concluons notre introduction aux grands modèles linguistiques. Dans la vidéo suivante, nous aborderons certains des avantages de l'utilisation des LLM 11. L3V2 - Avantages de LMM: Dans cette vidéo, nous allons explorer les différents avantages de l' utilisation de grands modèles linguistiques, ou LLM en abrégé Nous verrons comment ces impressionnants modèles d'IA peuvent être utilisés pour diverses tâches, comment ils fonctionnent avec un minimum de données d'entraînement sur le terrain et comment ils continuent de s'améliorer à mesure que de nouvelles données et de nouveaux paramètres sont ajoutés. Nous verrons également comment LLM s'adaptent aux différents scénarios d'apprentissage, même avec un minimum de données préalables J'espère donc qu'en discutant de ces avantages, nous pourrons comprendre pourquoi les LLM constituent une avancée majeure dans le domaine de l' intelligence artificielle présente de nombreux avantages évidents et percutants emploi de LLM Ils ne sont pas limités à une seule tâche. Un modèle en lui-même est une centrale multitâche remplissant de nombreux Ces LLM sophistiqués, formés sur un énorme volume de données et développant des milliards de paramètres, ont la capacité gérer une variété de tâches Par exemple, ils excellent lorsqu'il s' agit de répondre aux questions. Les LLM peuvent parcourir leurs nombreuses données de formation pour trouver les réponses les plus appropriées et les plus précises à un large éventail de Ils sont capables de comprendre le contexte, l'ambiguïté et même les nuances du langage, ce qui les rend très efficaces pour répondre à des questions Le modèle génère une réponse adaptée au contexte, au ton et à la complexité des requêtes , fournissant des réponses précises et adaptées au contexte En termes de génération de texte, les LLM brillent vraiment. Ils peuvent créer un texte de haute qualité, cohérent, adapté au contexte et remarquablement humain. Qu'il s'agisse de générer une nouvelle, d'écrire un poème ou même de créer une histoire captivante, LLM sont très compétents Ils peuvent également vous aider dans des tâches telles que la création de contenu, l'assistance à la rédaction et même la rédaction de brouillons. En tenant compte de l'entrée donnée et en utilisant leur vaste base de connaissances, ils peuvent générer un texte non seulement grammaticalement correct, mais également riche en contenu répondant aux exigences de divers cas d'utilisation grands modèles linguistiques sont également très performants en matière de traduction linguistique. Dotés de la connaissance de nombreuses langues grâce à leurs nombreuses données de formation, ils peuvent traduire avec précision des textes d'une langue à l'autre, en conservant le sens sémantique et le contexte du texte original Non seulement ils fonctionnent avec des langues couramment parlées, mais les LLM peuvent également gérer des langues moins répandues, ce qui en fait un outil inestimable pour la communication interculturelle En outre, ils peuvent comprendre et s'adapter à différents dialectes, argot et langage informel, garantissant ainsi des traductions précises, garantissant ainsi des traductions précises, lisibles et LLM sont également un outil puissant matière de brainstorming Ils peuvent générer des idées, suggérer des perspectives alternatives et contribuer à la résolution créative de problèmes. Que vous recherchiez un titre accrocheur, une stratégie marketing unique ou une nouvelle intrigue pour un roman, ces modèles peuvent générer nombreuses possibilités en fonction du contexte que vous leur fournissez En s'entraînant sur un vaste éventail de données, ils ont appris à proposer des idées diverses et innovantes susceptibles de susciter davantage d'inspiration et de faire avancer votre projet. Non seulement cela, mais ils peuvent également émettre des critiques et des suggestions pour améliorer les idées existantes, en agissant comme un partenaire de brainstorming artificiel disponible à tout moment Et il y a bien plus encore. Au-delà de la tâche dont nous avons discuté jusqu'à présent, les LLM offrent de nombreuses autres fonctionnalités Par exemple, ils peuvent être utilisés dans l'analyse des sentiments, pour déterminer si un texte exprime un sentiment positif, négatif ou neutre Ils peuvent aider à résumer de longs passages de texte. Les LLM peuvent également être utilisés dans les systèmes de tutorat, fournissant des explications sur des sujets complexes dans une variété de Les possibilités sont infinies et ne cessent s'étendre au fur et à mesure que ces modèles évoluent et s'améliorent. Un autre avantage majeur des grands modèles linguistiques est leur capacité à fournir des performances impressionnantes avec un minimum de données de formation adaptées à un problème spécifique Ils peuvent fournir des résultats de qualité même lorsqu' disposent d'une petite quantité de données spécifiques à un domaine. Cette qualité les rend très adaptables à des scénarios d' apprentissage comportant peu ou pas de prise de vue. Maintenant, ne nous y trompons pas. Permettez-moi de vous expliquer quelle est la différence entre l' apprentissage des prises de vue et l'incitation à prendre Comme nous l'avons expliqué dans la vidéo d'ingénierie rapide, invite à prendre une photo du contexte avant l'instruction proprement dite Ce contexte ajouté peut aider le modèle à produire des résultats plus chargés d'émotions et plus sensibles au contexte. Nous avons également indiqué qu'il existe différents types d'invite à la prise de vue, zéro, à une ou à quelques prises Zero Shot invite à modifier le modèle GNAI sans exemples préalables instructions en une seule prise fournissent un seul exemple, et les instructions en quelques prises fournissent plusieurs exemples pour aider le modèle Dans le contexte de l'apprentissage automatique, l' apprentissage par étapes fait référence à des scénarios dans lesquels un modèle est entraîné sur un ensemble limité de données. Ce processus est particulièrement utile dans les situations où de grandes quantités de données d' entraînement ne sont pas disponibles ou pratiques. D'autre part, Zero Shot fait référence à une capacité encore plus impressionnante des modèles. Cela implique qu'un modèle peut identifier et comprendre des concepts ou des tâches lesquels il n'a pas été explicitement formé. C'est comme avoir un système intelligent capable de faire des hypothèses logiques et de fournir des solutions basées sur les connaissances acquises, même lorsqu'il est confronté à des scénarios totalement nouveaux. Nous pouvons donc constater que les LLM peuvent exceller même dans scénarios nuls grâce à leur formation sur de vastes ensembles Ils peuvent gérer de nouvelles situations en tirant parti leurs connaissances approfondies pour déduire les réponses appropriées, même sans avoir directement rencontré le scénario spécifique dans leurs données d'entraînement Essentiellement, le LLM peut être rapidement adapté à un large éventail de tâches, même lorsque ces tâches ne relèvent pas du domaine spécifique sur lequel le modèle a été initialement formé Cette adaptabilité ouvre un monde de possibilités pour l'utilisation de ces modèles dans divers domaines et applications un des principaux avantages des LLM est leur amélioration constante à mesure que nous augmentons la quantité de données et le nombre de paramètres impliqués dans leur formation Par exemple, considérez le trajet entre GPT 3.5 avec 175 milliards de paramètres et GPT quatre avec environ 170 billions L'augmentation exponentielle du nombre de paramètres a entraîné une amélioration notable capacités, de la compréhension et de la précision du modèle Cette tendance de croissance suggère que LLM peuvent encore évoluer alors que nous continuons à repousser les limites des données disponibles et des ressources informatiques GPT 4 surpasse largement GPT 3.5 en raison de son plus grand nombre de Il montre une meilleure compréhension des contextes et des nuances, fournit des réponses plus précises et performant dans les tâches de traduction et de synthèse En outre, GPT four est plus capable de comprendre instructions complexes sans avoir à les décomposer en étapes plus petites, montre sa capacité supérieure à s'adapter à des scénarios d'apprentissage sans ou peu de coups Et le quatrième avantage des LLM est qu' en interagissant en langage naturel, ils améliorent l'accessibilité à l' IA pour tous ceux qui possèdent un ordinateur de base, éliminant ainsi le besoin de compétences techniques spécialisées Que vous soyez un étudiant à la recherche d'aide pour ses devoirs, un écrivain en quête d'inspiration ou un chef d'entreprise cherchant à analyser les tendances du marché, LLM sont là pour vous aider Leurs capacités de reconnaissance vocale et de synthèse vocale humaine ouvrent des possibilités à ceux qui ont du mal à taper ou même à ceux qui ne savent ni lire ni écrire. En outre, leurs capacités de traduction de haute qualité suppriment les barrières linguistiques, rendant ces outils puissants utilisables par des personnes de divers groupes démographiques et de divers horizons Essentiellement, les LLM transforment la façon dont nous interagissons avec la technologie, en apportant des capacités d'IA complexes à un large éventail d' utilisateurs dans le monde entier En conclusion, les grands modèles linguistiques font tomber les barrières et rendent l'IA accessible à tous. Grâce à leurs capacités polyvalentes et à leur potentiel en constante évolution, LLM révolutionnent la façon dont nous interagissons avec Alors que nous nous tournons vers l'avenir, nous sommes certains de voir ces modèles continuer à améliorer nos vies et à améliorer notre travail de manière inimaginable Dans la vidéo suivante, nous examinons un peu plus en détail trois exemples de LLM Palm et Lambda de Google et de GPT d'Open AI. On se voit dans le prochain. 12. L3V3 - Exemples de LLM: Dans cette vidéo, nous examinons quelques exemples de grands modèles linguistiques. Nous aborderons en détail trois LLM de pointe , Palm, Lambda et GPT, et nous discuterons également d'autres LLM, qui se sont révélés prometteurs dans le domaine de l' Commençons donc par Palm, qui est l'abréviation de Pathways Language Model. Palm est un modèle de langage de 540 milliards de paramètres développé par Google AI. Il est formé sur un vaste ensemble de données de textes et codes et peut effectuer un large éventail de tâches, notamment la réponse à des questions, l'inférence en langage naturel, génération de code, la traduction et la synthèse Il utilise le système Pathways de Google, qui lui permet d'être entraîné sur un énorme ensemble de données de texte et de code Avec 540 milliards de paramètres, Palm est l'un des plus grands modèles de langage au monde. Il s'agit d'un modèle de transformateur à décodeur dense uniquement, ce qui signifie qu' il est spécialement conçu pour les tâches de génération de langage naturel Palm peut atteindre des performances de pointe en quelques coups sur la plupart des tâches, ce qui signifie qu'il peut apprendre à effectuer une nouvelle tâche en se basant uniquement sur quelques exemples. Palm est donc un outil puissant pour de nombreuses applications. Alors, qu'est-ce que le système Pathways ? Le système Pathway est une architecture d'IA qui reste très efficace tout en générant dans différents domaines et tâches. Il est capable d'entraîner efficacement un seul modèle sur plusieurs modules TPU V Four Pods, qui sont les accélérateurs d' apprentissage automatique conçus sur mesure par Google accélérateurs d' apprentissage automatique conçus Cela permet au système Pathway de gérer plusieurs tâches à la fois, refléter une meilleure compréhension du monde et d'apprendre rapidement de nouvelles tâches. Pathway Systems y parvient en utilisant un certain nombre de techniques, notamment le parallélisme des modèles Cette technique permet d'entraîner simultanément plusieurs modèles sur les mêmes données. Cela peut améliorer la vitesse d'entraînement et l'efficacité du système de parcours. Parallélisme des données. Cette technique permet d'entraîner plusieurs copies du même modèle sur différents ensembles de données. Cela peut améliorer la précision du système de parcours en lui permettant d' apprendre à partir d'une plus grande variété de données et de l'apprentissage automatique Cette technique permet au système Pathway d' optimiser automatiquement ses paramètres d'entraînement. Cela peut améliorer les performances du système Pathway en l'empêchant de trop s'adapter aux données d'entraînement Le système Pathway est toujours en cours de développement, mais il a le potentiel de révolutionner la façon dont nous créons et déployons des modèles d'IA En permettant aux modèles d'orchestrer calcul distribué pour les accélérateurs, les systèmes Pathway peuvent faciliter la création et l'entraînement grands modèles d'IA complexes capables de gérer une grande variété Passons maintenant à l' autre LLM de Google, Lambda. Lambda est l'abréviation de Language Model for Dialog Applications. Lambda est une famille de modèles de langage neuronal développés par Google AI Il est formé au dialogue et comporte jusqu'à 130 milliards de paramètres, préentraînés sur un ensemble de données de 1,56 billion de mots Lambda a trois objectifs clés de qualité, de sécurité et de solidité. Ces objectifs sont mesurés par des indicateurs tels que la sensibilité, la spécificité, l' intérêt et le caractère informatif. Lambda est conçu pour être informatif et complet tout en étant sûr et basé sur des bases solides. Il est capable de générer différents formats de texte créatifs tels que des poèmes, du code, des scripts, des pièces musicales, e-mails, des lettres et bien plus encore. Il fera de son mieux pour répondre à toutes vos exigences. Lambda a le potentiel de révolutionner la façon dont nous interagissons avec les ordinateurs Il peut être utilisé pour créer des expériences de dialogue plus naturelles et plus engageantes et pour fournir aux utilisateurs une assistance plus utile et plus informative. Comme nous l'avons dit précédemment, Lambda présente trois avantages principaux Un dialogue unique, naturel et engageant. Lambda peut engager dialogue naturel et engageant avec les humains Il peut comprendre le contexte d'une conversation et y répondre d'une manière à la fois informative et intéressante. Deuxièmement, une assistance utile et informative. Lambda peut fournir aux utilisateurs une assistance utile et informative Il peut répondre aux questions, générer des formats de texte créatifs et suivre les instructions. Et trois, sains et saufs. Lambda est conçu pour être sûr et ancré. Il est formé sur un énorme ensemble de données de texte et de code et est capable de faire la distinction entre le contenu sûr et le contenu dangereux. Passons maintenant au GPT d'OpenAI, qui est l' abréviation de Generative Pretrained Transformer Transformer Le GPT est un type de modèle d' apprentissage profond utilisé pour générer du texte semblable à celui de l'homme Il a été développé par OpenAI, une société de recherche à but non lucratif et est financé par Microsoft Le GPT utilise une architecture de transformateur, qui est un type de réseau neuronal bien adapté aux tâches de traitement du langage naturel Les paramètres de la dernière version de GPT, qui est le GPT quatre, ne sont pas divulgués, mais ils sont probablement beaucoup plus importants que GPT Cela signifie que GPT four a une plus grande capacité à apprendre et à comprendre la langue GPT four s'est également révélé compétent pour les évaluations de compétences telles que l'examen du barreau. Dans une étude récente, GPT Four a obtenu un score au 90e percentile à l'examen du barreau, un test standardisé requis pour être admis au barreau dans de nombreuses juridictions Le GPT est un outil puissant qui peut être utilisé pour diverses tâches, notamment la génération de texte, la réponse à des questions, la traduction de langues, etc. Outre ce dont nous avons discuté jusqu'à présent, il existe d'autres LLM qui transforment notre vision de l'IA et contribuent à façonner l'avenir du domaine Passons brièvement en revue certains d'entre eux. Le premier est Touring NLG by Microsoft, un modèle linguistique à plus grande échelle formé sur divers textes Internet qui est capable de rédiger des paragraphes cohérents, voire des articles entiers Burt by Google, un modèle révolutionnaire basé sur un transformateur préformé sur un vaste corpus de textes et affiné pour diverses tâches de traitement du langage naturel, offrant un haut niveau de compréhension du contexte et des significations sémantiques Transformer XL, un modèle de langage développé par équipe du cerveau de Google qui gère de manière innovante les dépendances à long terme dans des séquences, améliorant ainsi de manière significative les performances de tâches telles que la génération de texte et la traduction Il existe également Excel Net, une extension de Transformer XL, développée par Google Brain et l'université Carnegie Melon Il utilise une méthode d' entraînement basée sur la permutation pour surmonter certaines limites du BIRT et surpasser sur plusieurs benchmarks Electra est une approche de pré-entraînement très efficace développée par Google Research qui utilise moins de puissance de calcul pour performances similaires, voire meilleures, que des modèles tels que le BRT Nous avons le transformateur Megatron, un modèle basé sur un transformateur développé par Nvidia, conçu pour entraîner de très grands modèles de langage avec des milliards de paramètres Il tire parti des capacités de traitement parallèle des GPU modernes Et nous avons introduit ama par meta Lama est un grand modèle de langage fondamental, plus petit mais performant Il est conçu pour élargir l' accès à la recherche sur l'IA, nécessitant moins de puissance de calcul et de ressources pour tester de nouvelles approches et valider les travaux existants Lama peut également être disponible en différentes tailles, allant de 700 000 à 65 milliards de paramètres Dans cette vidéo, nous avons donc examiné les avancées passionnantes des grands modèles linguistiques, en concentrant sur Palm et Lambda de Google AI, ainsi que sur le GPT d'OpenAI Nous avons également mis en avant d'autres modèles remarquables dans le domaine, tels que Touring Energy, BRT, xLnt et le méga tron Transformer Nous avons discuté de la façon dont ces LLM, dont les paramètres peuvent atteindre des centaines de milliards redéfinissent l' apprentissage multitâche et révolutionnent notre interaction avec les ordinateurs grâce Ces modèles ont déjà démontré leurs capacités exceptionnelles dans des tâches telles que la génération de textes et même des évaluations pratiques comme les examens du barreau, et ils ne cessent de s'améliorer. 13. L3V4 - Modèles de base: Dans cette vidéo, vous découvrirez les modèles de base qui, comme leur nom l'indique, constituent la base des modèles d'IA générative. Plus précisément, nous commençons par fournir une définition des modèles de base et par expliquer ce qu'ils sont. Ensuite, nous parlerons des plateformes qui fournissent différents types de modèles de fondations en mettant accent sur le jardin de modèles de Vertex AI et terminerons la vidéo en discutant des différents types de modèles de fondations Maintenant, que sont les modèles de base ? Demandons à Bart de nous aider à répondre à la question. Il fournit trois brouillons différents. Les modèles de base sont grands réseaux neuronaux pré-entraînés qui peuvent être affinés pour diverses tâches telles que le traitement du langage naturel, vision par ordinateur et la reconnaissance vocale. Les modèles de base sont de grands modèles linguistiques formés sur des ensembles de données volumineux qui peuvent être affinés pour diverses tâches en aval, telles que la traduction, réponses aux questions et la synthèse Les modèles de base sont grands modèles d'apprentissage automatique pré-entraînés qui peuvent être adaptés à un large éventail de tâches telles que le traitement du langage naturel, vision par ordinateur et la robotique. Les modèles de base sont donc de grands modèles d'IA qui peuvent être adaptés à un large éventail de tâches et peuvent générer des résultats de haute qualité. Même si les modèles d'IA ne sont pas nouveaux pour nous, de base ont quelque chose de très différent ces modèles de base ont quelque chose de très différent. Ils sont dotés de plusieurs caractéristiques clés qui les distinguent, marquant ainsi un changement significatif par rapport aux modèles d' IA que nous avions vus dans les générations précédentes. Les modèles de base ne se limitent pas à une seule tâche. Ils sont multitâches. Un modèle de base unique peut aborder un large éventail de tâches dès le départ, telles que la synthèse, la réponse à des questions ou la classification Ils peuvent gérer différentes modalités de types de données, notamment des images, du texte, du code, etc. Avec une formation minimale ou inexistante, les modèles de base peuvent très bien fonctionner dès le départ. Ils peuvent également être adaptés à des cas d'utilisation spécifiques en utilisant seulement quelques exemples de données. Comme ils sont généralement entraînés sur de grandes quantités de données diverses, ces modèles peuvent apprendre des modèles et des représentations généraux, qui peuvent ensuite être appliqués à divers domaines et tâches. Jusqu'à présent, les modèles de fondation étaient difficiles d'accès. Compétences spécialisées en apprentissage automatique et ressources informatiques requises pour être utilisées en production. Mais avec la récente vague de progrès dans le domaine de l' IA générative, les choses sont en train de changer radicalement Prenons l'exemple de Vertex AI, une plateforme d' apprentissage automatique entièrement gérée disponible sur Google Cloud Si vous connaissez déjà les outils de Google Cloud, vous savez déjà que Vertex AI vous permet d'accéder, de créer, d'expérimenter, déployer et de gérer différents modèles d'apprentissage automatique Des choses comme la science des données traditionnelle, l'apprentissage automatique, les MLP ou simplement la création d'une application pilotée par l'IA Vertex AI est équipé pour prendre en charge toutes ces charges de travail. C'est plutôt cool, mais c'est là que les choses commencent à devenir vraiment intéressantes. Google Cloud a récemment annoncé deux outils majeurs qui nous permettent encore plus de modélisme de jardin et de studio d'IA générative. Ces outils mettent les modèles de base à la disposition d'un public beaucoup plus large, même s'ils n'ont pas beaucoup d'expérience en matière de codage et de développement ML. La dernière section de ce cours est consacrée à la présentation des outils d'IA de Google Cloud Gen, et nous parlerons plus studio d'IA générative dans cette section. Dans cette vidéo, concentrons-nous uniquement sur le jardin modèle. Où se trouve exactement le XAI Model Garden ? Il s'agit d'un endroit unique pour explorer et interagir à la fois avec les modèles leaders du secteur de Google, ainsi qu'avec les modèles open source populaires, ou avec le support EmlopStoling intégré à Google Cloud pour les entreprises Il héberge à la fois des modèles d'apprentissage automatique traditionnels et des modèles fondamentaux pour les applications d'IA générative Dans Model Garden, vous trouverez une gamme de modèles issus de Google Cloud, Google Research et de diverses sources externes, adaptés à divers formats de données Voici donc à quoi ressemble le Model Garden de Vertex AI Avec de nombreux modèles prêts à l'emploi à votre disposition, Model Garden vous permet sélectionner le modèle le plus adapté, en fonction de votre cas d'utilisation, votre expertise en apprentissage automatique et de votre budget disponible. N'oubliez pas que nous utilisons Model Garden de Vertex AI comme exemple de plate-forme fournie Google Cloud pour différents outils et API d'IA générative et d'autres outils et API d'apprentissage automatique D'autres entreprises ont également leurs propres versions de Model Garden. Par exemple, Amazon Sagemaker, IBM Watson assistant et Vida Clara, data IKAI, Open AI chat GPT API, Microsoft Azores Machine Learning, data Robot AI et Databricks LakehousePlatform fournissent tous des outils et des API pour les modèles d'apprentissage automatique et Databricks LakehousePlatform fournissent tous des outils et traditionnels et les IBM Watson assistant et Vida Clara, data IKAI, Open AI chat GPT API, Microsoft Azores Machine Learning, data Robot AI et Databricks LakehousePlatform fournissent tous des outils et des API pour les modèles d'apprentissage automatique traditionnels et les modèles de base de l'IA générative. Il existe différents types de modèles de base, notamment la génération et le résumé de texte, le chat et le dialogue, la génération et la complétion de code, la génération et modification d'images, ainsi que les intégrations Maintenant, examinons chacun d' eux de plus près. Modèles de texte. Ces modèles vous aident à effectuer des tâches en langage naturel sans qu'il y ait ou peu d'instructions. Ils peuvent effectuer des tâches telles que la synthèse, l' extraction d'entités et d'informations, la génération d' idées, etc. Par exemple, un journaliste peut utiliser des modèles de texte pour résumer des articles ou des rapports volumineux Un chercheur universitaire peut extraire des entités d'information spécifiques à partir d'un vaste corpus d'articles, ou lors d'une séance de brainstorming, un entrepreneur peut utiliser le modèle pour générer de nouvelles idées ou perspectives. Comme mentionné précédemment, ces modèles fonctionnent efficacement dès leur sortie de la boîte. Toutefois, si vous souhaitez que le modèle suive certaines spécifications, vous pouvez fournir des exemples structurés pour guider ses réponses. Cela permet une expérience personnalisée qui correspond à vos besoins et objectifs spécifiques Concentrons-nous ensuite sur le dialogue. Ces modèles sont également basés sur le texte, mais ils ont été affinés pour permettre une conversation naturelle. Les modèles de dialogue vous permettent d' engager des conversations à tour de rôle, en conservant le contexte tout au long de l'interaction. Imaginons un scénario dans un centre de support client un chatbot basé sur l'IA ces modèles de dialogue peut aider les clients à se souvenir de la tournure précédente de la conversation et à fournir des réponses adaptées au contexte Il peut répondre à des questions, résumer des informations ou même guider les utilisateurs à travers des procédures complexes, ou tout en étant adapté à votre domaine spécifique. Ces modèles peuvent vous aider à créer des outils puissants qui améliorent considérablement l'expérience utilisateur, qu'ils soient déployés sur un navigateur, une application mobile ou d'autres interfaces numériques. Passons à la complétion et à la génération du code. Ces modèles agissent comme votre assistant de codage suralimenté. Vous pouvez créer une balise en langage naturel pour décrire un morceau de code que vous souhaitez écrire, ou vous pouvez utiliser le modèle pour compléter automatiquement un morceau de code. Il existe même des extensions pour les IDE qui peuvent prendre un extrait de code partiel en entrée et fournir ensuite la suite probable Imaginez que vous travaillez sur un projet logiciel complexe. Cela peut vous aider à éliminer les aspects fastidieux du codage, voire à le déboguer, ce qui vous permet, en tant que développeur, de vous concentrer davantage sur la résolution créative de problèmes et moins sur la syntaxe ou le code ce qui vous permet, en tant que développeur, de vous concentrer davantage sur la résolution créative de problèmes de routine Passons maintenant à la génération d'images. Ces modèles vous permettent de générer et modifier des images selon vos spécifications. En outre, vous pouvez utiliser ces modèles pour des tâches liées aux médias, telles que la classification, la détection d' objets, etc. De plus, ces modèles intègrent généralement des mécanismes de modération du contenu pour garantir des pratiques de sécurité responsables en matière d' IA. Imaginez que vous créez une plateforme de commerce électronique. Un modèle de détection d'objets peut automatiquement étiqueter les articles dans les images du produit, tandis qu'un modèle de génération d'images peut créer de nouvelles images de produits sur la base des descriptions. La fonction de modération du contenu garantirait que tout le contenu généré par les utilisateurs conforme à la politique de votre plateforme, améliorant ainsi l'expérience utilisateur, enfin et surtout pas le moindre Parlons des intégrations, qui peuvent sembler un peu complexes, mais c'est en fait un concept vraiment cool Alors laissez-moi vous l'expliquer. Imaginez que vous avez une énorme corbeille de fruits et que vous voulez les trier. Vous pouvez les trier par couleur, taille, poids ou même par goût. De même, dans le monde des données, nous avons souvent besoin de trier ou de classer les éléments Mais nous avons affaire à des mots ou à des phrases, pas à des fruits. C'est là que les intégrations entrent en jeu. Ils sont comme une carte d'identité unique pour chaque mot ou phrase, mais au lieu d'une carte, il s'agit d'une liste de chiffres, que nous appelons un vecteur. Cette liste de chiffres reflète l'essence de ce mot ou de cette phrase. sens est le contexte et ses relations avec les autres mots. Grâce aux intégrations, nous pouvons donner un sens à des données non structurées, comme un long livre ou un fil Twitter, et utiliser cette compréhension pour moteurs de recommandation ou cibler les publicités ou cibler Prenons par exemple le domaine du commerce électronique. Un modèle intégré peut être utilisé pour alimenter les moteurs de recommandation, en mettant en relation les utilisateurs avec les produits les plus susceptibles de les intéresser en fonction de leur historique de navigation Ou dans le domaine du marketing numérique, ces modèles peuvent améliorer les systèmes de ciblage publicitaire, permettant ainsi une publicité hautement personnalisée. Ils peuvent également être utilisés pour des tâches de classification complexes, des fonctionnalités de recherche et de nombreuses autres applications. En conclusion, les modèles de base représentent une avancée significative dans le domaine de la technologie de l'IA. Ils offrent une base puissante et adaptable qui peut être utilisée pour un large éventail de tâches dès la sortie de la boîte. Grâce à des plateformes telles que Model Garden de Vertex AI, ces outils sont plus accessibles que jamais, mettant ainsi les capacités avancées de l'IA à la disposition d'une population d'utilisateurs beaucoup plus large Qu'il s'agisse de tâches en langage naturel dialogues multitours, de mise en œuvre de code , de génération et de modification d' images ou d'extraction d' informations sémantiques, les applications potentielles de ces modèles sont vastes Qu'il s'agisse d'améliorer le service client grâce à des chatbots intelligents, aider les développeurs à générer du code automatiquement ou de dynamiser les moteurs de recommandation, les modèles de base façonnent l'avenir de l'IA Grâce aux modèles de base et à la puissance de l'IA générative, nous ne nous contentons pas de prédire l'avenir. Nous sommes en train de le construire. Dans la vidéo suivante, nous verrons certaines des applications étonnantes proposées par différents types de modèles d'IA générative. 14. L3V5 - Développement de LLM: Parlons de la manière dont les grands modèles linguistiques sont développés. Dans cette vidéo, nous commençons par une comparaison entre le développement du LLM et le développement traditionnel de l'apprentissage automatique Ensuite, nous parlerons de trois principaux types de LLM et, à la fin, discuterons d'un concept appelé raisonnement par chaîne de pensée et de la façon dont cela peut aider à concevoir de meilleures instructions pour les Commençons par comparer le développement de LLM à l' aide de modèles préexistants à approche traditionnelle du développement de l'apprentissage automatique Dans le monde du LLM, il n'y a aucune condition préalable à une expertise technique ou à des exemples de formation approfondis, et devinez quoi ? Vous pouvez également oublier la formation des modèles. Tout repose sur l' art d'un design rapide, clair, concis et riche en informations utiles. D'autre part, l'apprentissage automatique traditionnel vous oblige à vous retrousser les manches et à étudier en profondeur des exemples de formation, former des modèles, et même parfois avoir besoin de connaissances de base en matière de matériel et de puissance informatique. Il existe trois principaux types de LLM : générique, réglé par instructions et réglé par dialogue Chacun de ces modèles nécessite son propre style d'invite. Les modèles linguistiques génériques fonctionnent comme la saisie automatique de votre téléphone, prédisant le mot suivant en fonction des modèles linguistiques des données d'apprentissage Les modèles adaptés aux instructions, quant à eux, répondent à des directives spécifiques, qu'il s'agisse de résumer un texte, générer un poème dans le style d'un poète célèbre ou de proposer une analyse sentimentale d'une déclaration Ces modèles suivent les instructions intégrées à l'entrée. Enfin, nous avons des modèles optimisés pour le dialogue. Il s'agit d'un sous-ensemble de modèles adaptés aux instructions spécialement conçus pour un contexte interactif, peu comme une discussion avec un bot Passons donc à des exemples de ces trois types et voyons-les en action. Avant de passer à des exemples de différents types de LLM, donnons une définition des jetons Un jeton est une unité de données traitée par le modèle. Il peut s'agir d'un mot ou d'une partie d'un mot. Nous allons commencer par les modèles linguistiques génériques. Ils sont assez simples. Leur tâche principale est de prédire le mot suivant en fonction du contexte fourni par les données d'entraînement. Prenons un exemple simple. Le chat s'est assis dessus et maintenant nous voulons savoir quel est le mot suivant le plus probable Le modèle nous dit que c'est cette réponse. Tout comme le suggéreraient les fonctionnalités de saisie automatique de votre téléphone suggéreraient les fonctionnalités de saisie automatique C'est un aperçu fascinant de la façon dont l'IA peut imiter la façon dont nous communiquons naturellement Passons aux modèles adaptés aux instructions, ces modèles brillent lorsqu'il s'agit de générer des réponses. Ils s'inspirent des instructions données dans la saisie, qu'il s'agisse d'une demande visant à résumer un texte, générer un poème dans un style particulier ou même à classer un sentiment textuel. C'est comme si vous disposiez de votre propre assistant numérique, toujours prêt à exécuter vos instructions avec précision. Enfin, nous avons les modèles adaptés aux dialectes, qui sont un type spécialisé de modèles d'instructions ajustés Cependant, ils ne se contentent pas d'attendre des instructions. Ils sont formés pour engager une conversation aller-retour. Vous pouvez généralement les rencontrer sous la forme de chatbots Si vous avez déjà posé une question à un assistant virtuel, vous avez probablement interagi avec ce type de modèle Il s'agit de permettre une interaction conversationnelle naturelle Il est maintenant temps d'explorer un concept intéressant, le raisonnement par chaîne de pensée. Il s'agit d'une observation selon laquelle les modèles produisent des réponses correctes avec plus de précision lorsqu' ils génèrent pour la première fois une voie ou une chaîne de raisonnement menant à la réponse. Prenons un exemple simple. Roger possède cinq balles de tennis et achète deux autres canettes, chacune contenant trois balles. Combien de balles Roger a-t-il maintenant ? Au début, le modèle peut avoir mal à fournir la bonne réponse. Cependant, après avoir présenté le problème une deuxième fois, le modèle a plus de chances de trouver la bonne réponse. Le raisonnement par chaîne de pensée aide à améliorer les capacités de compréhension et de réponse des grands modèles linguistiques. En conclusion, le développement et le déploiement de grands modèles linguistiques ouvrent nouvelles perspectives passionnantes dans le monde de l'apprentissage automatique. Au fur et à mesure que nous améliorons et affinons ces technologies, nous anticipons un avenir où compréhension avancée du langage par IA modifiera radicalement notre interaction avec les plateformes numériques Maintenant que nous comprenons comment les LLM sont développés, il est temps de comprendre pourquoi il est important de les adapter à des tâches spécifiques et comment nous pouvons ajuster les LLM de manière efficace Rendez-vous dans la prochaine vidéo. 15. L3V6 - Tuning LLM: Dans cette vidéo, nous allons parler de l'importance d'adapter les LLM à des tâches spécifiques et de la manière de le faire efficacement. C'est une idée intéressante d'avoir un modèle capable de tout gérer. Mais dans la pratique, les LLM comportent leur juste part de limites Pour accroître leur fiabilité et leur efficacité, LLM doivent être affinés pour des tâches spécifiques et sur des connaissances de domaine spécifiques Tout comme un athlète professionnel spécialisé dans son sport, ces modèles doivent affiner leurs compétences pour maîtriser leurs performances. Commençons par un exemple de tâche simple. Réponse à une question. Il s'agit d'un sous-domaine du traitement du langage naturel qui à répondre automatiquement aux questions posées dans le langage courant Ces systèmes de questions-réponses sont des outils puissants capables de répondre à un large éventail de questions, qu'elles soient factuelles ou basées sur des opinions , grâce à leur formation approfondie sur le texte et Cependant, l' ingrédient secret du succès de ce modèle réside dans la connaissance du domaine. Réfléchis à ceci. Lorsque vous développez un modèle d'assurance qualité pour le support client, soins de santé ou la chaîne d'approvisionnement, connaissance du domaine devient une exigence essentielle. En matière de support client, un LLM adapté au domaine peut fournir des informations pertinentes sur les abonnements et les services, garantissant ainsi à vos clients un service efficace assisté par l'IA Dans le domaine de l'éducation, ces modèles peuvent fournir des informations détaillées sur les cours, les frais de scolarité ou les politiques académiques. Pour les soins de santé, ils pourraient servir d' outils d'autogestion pour les patients, fournissant des informations essentielles liées à la santé. Les entreprises de vente au détail pourraient bénéficier de meilleurs chatbots basés sur l'IA et d'une meilleure visualisation des produits, améliorant ainsi l'expérience client Et dans le domaine de la gestion de la chaîne d'approvisionnement, LLM peuvent fournir des informations logistiques et des informations d'inventaire précieuses Et n'oublions pas les grandes entreprises technologiques. Ils pourraient utiliser ces modèles pour fournir un support technique supérieur aux clients. Chaque secteur a ses propres exigences, et le réglage d'un LLM, conformément à ces spécifications, peut considérablement améliorer l'efficacité du modèle Alors que les modèles de questions-réponses génératifs peuvent utiliser leur base de connaissances sur les trains pour répondre à des questions sans avoir besoin de connaissances spécifiques au domaine, des questions sans avoir besoin de connaissances spécifiques au domaine, le fait d'ajuster ces modèles en fonction de connaissances spécifiques à un domaine améliore considérablement leur précision et leur fiabilité Cela revient à fournir au modèle une carte détaillée du terrain sur lequel il est censé naviguer. Prenons l'exemple de Vertex AI. Il fournit des modèles de base spécifiques aux tâches qui sont déjà adaptés à divers cas d'utilisation. Supposons que vous souhaitiez mieux comprendre les sentiments de vos clients à l'égard vos produits ou services. Vertex AI dispose d'un modèle de tâches d' analyse des sentiments parfaitement adapté à cette tâche Vous travaillez peut-être dans le secteur du commerce de détail ou de l'immobilier et vous devez effectuer des analyses d'occupation. Il existe également un modèle spécifique aux tâches conçu pour cela. Ces modèles, conçus pour des tâches spécifiques, démontrent la valeur du réglage Ils sont plus efficaces, ciblés et efficaces dans leurs tâches respectives. La possibilité de sélectionner et d' utiliser un modèle adapté à vos besoins spécifiques peut améliorer considérablement l'efficacité globale de vos solutions d'IA OK, il est maintenant temps de définir officiellement ce que nous entendons par réglage. Le réglage fait référence au processus consistant à adapter un modèle pré-entraîné à une tâche plus spécifique, telle qu'un ensemble de cas d'utilisation personnalisés ou nouveau domaine, en l'entraînant sur de nouvelles données. Le réglage est réalisé en entraînant le modèle sur de nouvelles données pertinentes pour la tâche à accomplir. Par exemple, si nous travaillons dans le secteur juridique ou médical, nous collecterons des données de formation ces domaines afin d'ajuster notre modèle en conséquence. Mais qu'est-ce que le réglage fin ? Considérez le réglage fin comme un ajustement de haute précision du modèle. Vous apportez votre propre ensemble de données et vous réentraînez le modèle, ce qui affecte chaque poids du LLM Cela peut être un travail exigeant en main-d'œuvre et en ressources et nécessite d'héberger votre propre modèle raffiné. Et cela peut le rendre peu pratique pour de nombreux cas d'utilisation. Mais il est important de savoir qu'un modèle affiné est doté d'un haut niveau de précision et de spécificité. Prenons un exemple concret pour illustrer le pouvoir du réglage fin. Imaginez un modèle de fondation de santé qui a reçu formation approfondie sur un large éventail de données de santé. Il peut effectuer diverses tâches de manière fluide, répondant à des questions médicales, en analysant des images médicales, trouvant des patients présentant des affections similaires, et bien plus encore. Ce succès s'explique par le fait qu'il été affiné avec des connaissances spécifiques au domaine. Ce faisant, il devient un spécialiste plutôt que un généraliste, fournissant des résultats précis et fiables dans le contexte des soins de santé Ce processus souligne l'immense potentiel et la polyvalence du réglage, transformant un modèle unique en un outil hautement spécialisé permettant de naviguer dans des scénarios de soins de santé complexes Le réglage précis est un excellent moyen d'améliorer les performances d'un modèle, mais tout comme la rénovation d' une maison entière, cela peut s'avérer coûteux et pas toujours pratique Donc, si nous cherchons un moyen plus efficace d'ajuster de grands modèles linguistiques, que pouvons-nous faire ? L'une des approches à suivre est méthodes de réglage efficaces par paramètres, ou PETM en abrégé Imaginez que le PETM donne à votre modèle une cure de jouvence plutôt qu' une rénovation complète Normalement, avec un réglage précis, nous ajustons tous les paramètres du modèle, ce qui est compliqué et prend beaucoup de temps. Mais avec le PETM, nous nous concentrons sur la modification d'un petit sous-ensemble de ces paramètres ou même sur l' ajout de quelques nouveaux Peut-être ajoutons-nous des couches supplémentaires au modèle ou ajoutons-nous une information supplémentaire. Trouver le meilleur moyen d'y parvenir reste un sujet d'actualité parmi les chercheurs Le principal point à retenir ici est que le PETM est comme un raccourci. Cela nous permet d'éviter de devoir recycler l'ensemble du modèle, nous permet d'économiser du temps, des efforts et des ressources De plus, cela simplifie même le processus d' utilisation ultérieure de ces modèles , car nous utilisons simplement le modèle de base et ajoutons nos éléments supplémentaires. Nous sommes maintenant arrivés à la fin de notre exploration du monde des grands modèles linguistiques. Dans cette section, nous avons acquis des informations précieuses sur les LLM, en commençant par une introduction à leur structure et à leur fonction Nous avons discuté des nombreux avantages de l'utilisation des LLM et en avons fourni quelques exemples, notamment Palm, Lambda et Nous avons également parlé du processus de développement du LLM, en soulignant en quoi il est différent du développement traditionnel de l'apprentissage automatique Et surtout, nous avons souligné l'importance du réglage des LLM Découvrez comment cela améliore leur fiabilité et leur précision. Nous avons vu comment les connaissances spécifiques à un domaine peuvent améliorer considérablement leurs performances et nous avons découvert des méthodes de réglage efficaces, telles que les méthodes réglage efficaces par paramètres. Dans la section suivante, nous allons nous familiariser avec quatre outils principaux de Google Cloud qui nous permettent d'accéder à des modèles d'IA générative, de les affiner et modèles d'IA générative, de les affiner et créer nos propres applications d' IA générative. 16. L4V1 - Fiche d'application: Parlons d'apshet plateforme sans code innovante de Google qui tire parti de la puissance de l'IA générative pour transformer le développement d' applications à Imaginez un monde dans lequel n'importe qui, quelles que soient ses compétences en matière de codage, peut créer rapidement des applications centrées sur les données pour Google Workspace. C'est exactement ce pour quoi apsheet est conçu. N'oubliez pas le processus fastidieux du développement d'applications traditionnel, de la conceptualisation à la rédaction des spécifications du projet, de la collaboration d'équipe au codage, ce fut un voyage long et exhaustif Mais avec apsheet, le cycle de vie du développement des applications a été considérablement rationalisé Ce qui prenait auparavant des mois peut désormais être accompli en quelques jours, voire en quelques heures, vous permet de consacrer plus de temps à des tâches plus importantes La beauté d'Apshet réside dans sa polyvalence. Il vous permet de créer des applications pour plusieurs plateformes, notamment des applications de bureau, mobiles et de chat. Apsheet fournit une gamme d' applications aussi variées que vos besoins spécifiques. Il se peut que vous gériez un entrepôt et que vous ayez besoin d'une solution rationalisée pour le suivi des stocks. Peut-être que vous organisez un événement d'entreprise majeur et que vous avez besoin d'un outil de planification d' événements détaillé, ou peut-être que vous menez une vaste campagne marketing à multiples facettes et que vous avez besoin d'une application pour coordonner les nombreux éléments mobiles De la gestion de la relation client à la coordination de la chaîne d'approvisionnement, planification des employés à la gestion de projet. Apsheet est suffisamment adaptable pour répondre à vos besoins spécifiques. Sa flexibilité et sa polyvalence ouvrent la voie à d'innombrables scénarios, ce qui en fait une plateforme incontournable pour développement d'applications personnalisées centrées sur les données. Tant que vous avez une idée claire de ce dont vous avez besoin et que vous pouvez l'expliquer en langage naturel, apsheet peut vous aider à transformer cette idée en application Alors plongeons-nous plus profondément. Apshet a récemment introduit de nouvelles fonctionnalités, toutes alimentées par l'IA générative Vous pouvez désormais transformer votre idée en une application entièrement fonctionnelle en quelques minutes, et vous pouvez le faire en utilisant le langage naturel. Par exemple, vous souhaitez créer une application pour suivre les dépenses de voyage. Tout ce que vous avez à faire est de décrire votre processus d'apset. Aphet prend ensuite le relais pour poser des questions de suivi afin de mieux comprendre les exigences de votre application Une fois qu'Apsheet a rassemblé suffisamment d'informations, il présente un aperçu des tableaux votre application et fournit même des exemples de données pour vous aider à les tester Ensuite, Upseet crée l'application de démarrage pour vous. Dès que l'application est prête, vous pouvez la lancer, l'essayer et apporter les modifications nécessaires. Il est intéressant de noter que vous pouvez continuer à utiliser le langage naturel pour spécifier les modifications souhaitées, et apsheet vous aidera à affiner votre application Créer une application en langage naturel sans aucun codage, c'est la magie d'apsheet Il permet à chacun de développer des applications pour son organisation rapidement et efficacement. Voyons donc comment Apsheet tire parti de l'IA générative pour rendre cela possible Lorsque l'utilisateur interagit avec Apheet, Dialogflow et l'IA générative, assistés par un LLM formé sur mesure, travaillent ensemble pour fournir les informations nécessaires à la création de l'application Dialect Flow rassemble des informations essentielles sur le problème commercial de l'utilisateur qu' Apsheet utilisera pour créer une application de démarrage Apsheet essaie de faire en sorte que cette application corresponde le plus possible à la solution idéale de l'utilisateur Une fois que Direct Flow a rassemblé les informations requises, Apsheet envoie une demande au LLM pour l' aider à générer le modèle de données et les vues nécessaires à l'application Lorsque le LLM fournit le bon schéma, apsheet utilise toutes les informations collectées pour créer une application de démarrage en quelques minutes seulement L'application fournie inclut une base de données complète, une interface d'application intuitive et toutes les configurations spécifiques exprimées au cours de l'interaction, telles que les préférences de notification. Une fois que l'application de démarrage est prête, les utilisateurs peuvent continuer à collaborer avec Apsheet pour affiner et améliorer encore l'application En fonction de la complexité de la demande, apsheet peut utiliser à la fois Dialogflow et le LLM au cours de cette interaction La combinaison de Dialect flow et du LLM améliore les capacités d' Apheet, lui permettant de gérer les demandes de développement d' applications les plus complexes Vous pouvez même personnaliser ces deux technologies. Pour le flux de dialecte, vous pouvez le personnaliser pour vous aider à créer des interfaces de chat conversationnelles Voici comment procéder. Vous devez d'abord créer un agent de flux de dialectes. Définissez ensuite votre intention et vos entités personnalisées. Une fois cela fait, l'API Dialect Flow est là pour vous aider à intégrer cet agent dans votre application Essentiellement, vous adaptez une technologie sophistiquée à vos besoins spécifiques Pour le LLM, vous pouvez concevoir un modèle répondant aux exigences uniques de votre application avec le studio d'IA génératif Vertex AI Cette plateforme présente une gamme de modèles fondamentaux issus de Google Cloud que vous pouvez affiner en fonction de vos besoins Vous pouvez y parvenir en formulant et en ajustant les instructions en affinant les modèles à l'aide de vos propres données En conclusion, en tirant parti des technologies d' intelligence artificielle génératives, particulier du flux Dialect de Google et d'un LLM personnalisé, Appset permet à toute personne de développer applications basées sur les données sans aucune expérience de codage et en très peu C'est devenu une plate-forme puissante qui permet aux utilisateurs de générer différentes applications en langage naturel. est ainsi que s'achève cette section consacrée quatre puissants outils d'IA générative disponibles sur Google Cloud. Dans la prochaine et dernière section de ce cours, nous essaierons d'utiliser ces outils pour créer notre propre application en utilisant la puissance de l'IA générative. 17. L4V2 - Gen App Builder: Le générateur d'applications Jen disponible via Vertex AI de Google Cloud associe de manière magistrale les modèles de base la puissance de l'IA de recherche et de conversation, permettant à un nouvel éventail d'utilisateurs de créer applications d' IA génératives innovantes en temps et sans aucune compétence de codage requise L'aspect humain et la nature engageante des interactions en ligne offrent aux utilisateurs l' occasion d'améliorer leurs liens avec leur public potentiel. Pour les entreprises, cela signifie une meilleure communication avec les clients, les employés et les partenaires. Avec Jen App Builder, création de ces puissantes applications GN AI ne nécessite aucun codage. Pensez à créer votre assistant numérique personnalisé, moteurs de recherche personnalisés, bases de connaissances, vos applications pédagogiques et bien plus encore Avec Jen App Builder, vous avez le pouvoir de donner vie à de telles visions. Le Jen App Builder dispose d' une interface Dragon Drop conviviale, ce qui facilite considérablement le processus de conception et de développement des applications. Il dispose d'un éditeur visuel qui vous permet de créer et de modifier facilement le contenu de votre application. Le moteur de recherche intégré permet aux utilisateurs de trouver des informations dans l'application, tandis que le moteur d' intelligence artificielle conversationnel permet des interactions en langage naturel Le Jen App Builder offre donc la flexibilité nécessaire pour créer une expérience de recherche d'entreprise, une expérience de conversation ou de chat, ou même les deux. Le processus est simple. Vous commencez par créer une source de contenu, qui peut être un document Word ou une feuille de calcul contenant des informations sur votre entreprise Ensuite, vous devez sélectionner les fonctionnalités que vous souhaitez intégrer à votre application. Il peut s'agir d'une recherche, d'un chat ou des deux. Et une fois que vous avez terminé, il vous suffit de cliquer sur Créer. Mais attendez, il y en a plus. Cette application vous permet également de contrôler et de personnaliser les réponses générées ou de créer des réponses par défaut. Si cela ne suffit pas, vous pouvez toujours accéder à un contrôle granulaire réponses grâce à des options permettant de contrôler le type de réponse, définir des termes interdits et désactiver les réponses générées en cas de besoin Mais ne t'inquiète pas. Même si les réponses générées sont désactivées, votre application basée sur GAI peut toujours répondre à des questions complexes grâce à la technologie de recherche de Google Jen App Builder a également la capacité d'effectuer des transactions au nom de l'utilisateur. Grâce à l'intégration de flux préstructurés pour les cas d'utilisation courants tels que la vérification statut des commandes ou l' explication des factures, vous pouvez facilement ajouter ces fonctions à votre application en un seul clic, mais cela ne se limite pas à fournir des fonctionnalités prédéfinies Il vous permet de créer votre flux de transactions unique à l'aide d' une interface simple basée sur des graphiques pour définir une logique métier de haut niveau. Si vous préférez, vous pouvez même utiliser la création de flux basée sur des instructions pour expliquer votre logique à l'aide d'un langage naturel simple. Une fois que vous êtes satisfait de la configuration de votre application, celle-ci est prête à être testée. Et si tout semble bon, intégrations intégrées de Jen App Builders facilitent lancement fluide de votre application sur votre site Web ou sur les plateformes de messagerie populaires Il offre également une connectivité avec les partenaires de téléphonie. Pour déployer votre nouvelle application, il vous suffit d'obtenir le code de déploiement du widget. C'est aussi simple que cela. Vous pouvez donc voir que Jen App Builder vous permet de publier facilement votre conversation ou votre searchbt un site Web ou de vous connecter à des applications de messagerie populaires Jen App Builder exploite la puissance de l'IA pour vous permettre créer des chatbots capables de gérer des tâches telles que répondre à des questions spécifiques à un domaine, traiter des entrées multimédia et fournir des réponses multimodales Ces robots de discussion peuvent guider les utilisateurs vers du contenu pertinent et fournir des réponses génératives basées sur l'IA, même s'ils ne possèdent pas de connaissances spécifiques sur le domaine. Ils peuvent également effectuer des transactions, résumer les informations à l'aide de l'IA et avoir la flexibilité de suspendre et de reprendre les conversations chaque fois que cela est nécessaire. Avec Jen Apbilder, vous créez une assistance numérique qui redéfinit les normes des interactions normes des En conclusion, c'est dans Jen Abuilder que se rejoignent les points forts des modèles fondamentaux actuels de Google, la recherche d'entreprise et l'IA conversationnelle Il vous permet de créer sans effort des applications avancées qui redéfinissent Son interface conviviale et son éditeur visuellement attrayant ouvrent la voie à la création et à la modification du contenu de l'application avec un minimum d'effort Avec des fonctionnalités allant des moteurs de recherche intégrés à un moteur d'intelligence artificielle conversationnel et à une interface conviviale et intuitive, Jen App Builder propose une boîte à outils complète pour créer des applications dynamiques réactives Vous pouvez créer des chatbots capables d'entrer du contenu multimédia, de réponses multimodales et de poser des questions spécifiques à un domaine Et avec leur capacité à effectuer des transactions, à suspendre et à reprendre les conversations, ces chatbots sont bien plus que de simples robots Ils sont conçus pour gérer les tâches et les interactions les plus complexes, tout en étant faciles à publier et à connecter à votre site Web ou à des applications de messagerie populaires. Passons maintenant au prochain générateur d'applications intéressant disponible sur la feuille d'application Google Cloud. 18. L4V3 - Maker Suite: Maker SID est un outil intuitif basé sur un navigateur conçu pour permettre un prototypage rapide et convivial avec Palm to model L'intégration de Maker SUID à l'API Palm signifie que nous pouvons désormais accéder à l'API via une interface graphique conviviale L'API Palm est une passerelle vers grands modèles linguistiques et les outils d'IA générative de Google, facilitant ainsi le prototypage rapide et accessible Cette plateforme vous permet de tester rapidement des modèles et d'expérimenter avec différentes instructions. Vous pouvez l'utiliser pour créer et affiner vos instructions, ajouter des données synthétiques à votre ensemble de données personnalisé, générer des intégrations de pointe et ajuster facilement vos modèles personnalisés Et si vous trouvez quelque chose qui vous convient, make your Suite vous offre la possibilité de le transformer en code Python, ce qui permet d'appeler le modèle à l'aide de l'API Palm. Palm API et Maker Suite forment le duo parfait pour le développement de l'IA générative. L'API Palm est votre point de départ pour accéder aux LLM de Google, offrant aux développeurs la liberté d'utiliser des modèles optimisés pour diverses tâches D'autre part, Maker Suite fournit une interface intuitive pour commencer à prototyper et à créer vos applications uniques Jetons maintenant un coup d'œil à Maker Suite et voyons comment nous pouvons commencer à prototyper avec grands modèles linguistiques en quelques minutes seulement. Voici donc à quoi ressemble l'intérieur de Maker Suite. Jetons un coup d'œil à ce menu sur la gauche. Ici, nous pouvons créer de nouvelles invites. Comme nous pouvons le constater, il existe trois types d' invites différents dans lesquels nous pouvons créer des invites de texte, des invites données et des invites de chat Nous avons également accès à notre bibliothèque, qui est la page actuellement ouverte. Si vous allez chercher ApiKey, nous pouvons voir qu'ici, nous avons la possibilité de créer une clé d'API pour un nouveau projet Et d'autres liens rapides sont également disponibles. Il existe un guide pour vous aider à démarrer. Il existe une galerie d'invites qui vous permet d'explorer différents types d'invites. Vous trouverez de la documentation sur l'API ainsi que des informations supplémentaires sur la politique de confidentialité et les conditions d'utilisation. Revenons maintenant à notre bibliothèque et essayons différentes instructions. Le premier est une invite de texte. Essayons-le. Donc, ici, il y a des choses intéressantes à explorer. La première chose à remarquer sont ces exemples d'instructions. Voici quelques exemples pour nous aider à avoir une meilleure idée de ce à quoi pourraient ressembler ces instructions De plus, si vous prêtez attention aux manuels, nous pouvons voir que certains exemples nous sont fournis Lisons certains d'entre eux. Classez une pomme dans la catégorie des fruits ou des légumes. Ecrivez une fonction JavaScript et expliquez-le-moi. Pour paraphraser, il semblerait qu'il soit sur le point de pleuvoir, et bien d'autres exemples Il indique simplement le type d'invite que vous pouvez utiliser comme exemple d'invite textuelle Explorons maintenant l'un des exemples fournis ici. Jetons un coup d'œil aux réflexions occasionnelles. L'invite serait donc de le réécrire dans un e-mail ordinaire, puis de fournir un texte pour un e-mail Je peux cliquer sur Exécuter et maintenant je peux voir que le modèle de langage a créé une réponse à mon invite. Explorons l'autre type d'invite, l'invite de données. Donc, ici, nous pouvons voir qu'il y a deux parties différentes. Le premier est un tableau pour écrire nos exemples rapides. Et la deuxième partie est de nous aider à tester notre prompt. Regardons donc un exemple et voyons à quoi cela ressemblerait. Essayons les contraires. Dans les exemples, nous voyons que nous fournissons quatre exemples différents de ce que chacune de ces entrées devrait recevoir en sortie. Donc, si notre invite est de trouver un mot ou une phrase ayant un sens opposé, nous pouvons fournir des exemples , par exemple si l'entrée est forte, la sortie doit être faible. Si l'entrée est épaisse, la sortie doit être fine et ainsi de suite. Après avoir fourni ces exemples, nous pouvons tester notre invite. Maintenant, nous posons la question du modèle linguistique. Si l'entrée est erronée, quelle sera la sortie ? Et si l'entrée est rapide, quelle doit être la sortie ? Et maintenant, si nous exécutons, nous constatons qu'en réponse à une erreur, le modèle de langage crée correctement, et pour la saisie rapide, le modèle de langage crée lentement. Nous pouvons voir que pour chaque entrée, le modèle de langage crée le contraire de la sortie. Explorons le troisième type d'invite, l'invite de chat. Ici, nous pouvons également voir qu'il y a deux parties. Il y a une partie pour écrire nos exemples rapides et une autre partie pour tester notre invite. Examinons donc certains de ces exemples. Essayons de discuter avec un extraterrestre. Ainsi, dans l'exemple, nous fournissons un certain contexte. Incarnez un extraterrestre vivant sur l'une des lunes de Jupiter et donnez un exemple de conversation Si l'utilisateur dit « comment ça va », le modèle doit dire « je vais bien » et ainsi de suite. Si vous souhaitez ajouter d'autres exemples, nous avons l'option ci-dessous. Maintenant, nous pouvons tester notre modèle. Donc, en réponse, nous disons : « J'aimerais visiter ». Que dois-je faire ? Mais le modèle fournit une réponse pertinente et poursuit la conversation. Nous pouvons continuer à interagir avec le modèle en écrivant plus d'instructions. Nous avons également quelques options pour régler le modèle ci-dessous. Le premier est un aperçu du texte de la même invite sur laquelle nous travaillons. Qu'il s'agisse d'une invite de table ou d'une invite de chat, nous pouvons toujours avoir accès à la version texte de la même invite. Grâce à l'autre, nous pouvons affiner notre modèle. Nous pouvons choisir le type de modèle que nous voulons utiliser. Nous pouvons définir la température qui définit le niveau de hasard ou de créativité du modèle, et nous pouvons également personnaliser le nombre de sorties que le modèle doit produire Des paramètres plus avancés sont également disponibles. Donc, pour récapituler, nous sélectionnons d'abord notre type d'invite et saisissons une invite, y compris des exemples et des instructions Quel que soit le type d'invite que vous utilisez, vous avez toujours la possibilité de le voir sous forme de texte. Si vous devez tester les résultats des modèles, make your suit vous permet de réutiliser facilement les instructions de différentes manières en utilisant les entrées de test dans vos instructions Nous avons également la possibilité de modifier les paramètres du modèle. Par exemple, il existe une option permettant de modifier le réglage de la température, ce qui influence le caractère aléatoire des réponses des modèles Une valeur plus élevée permet souvent d'obtenir des résultats plus inattendus , voire plus créatifs. Nous pouvons également apporter des ajustements supplémentaires aux paramètres tels que les séquences d'arrêt , le nombre de sorties, etc. Enfin, une fois que vous êtes satisfait de votre demande, vous pouvez l'enregistrer, le partager et même l'exporter vers différents environnements de développement. Pour enregistrer vos instructions, Maker Suite propose une fonction de bibliothèque d'instructions, agit comme un espace de stockage sécurisé pour toutes vos instructions, rendant facilement récupérables Vous pouvez également enregistrer vos instructions sur votre Google Drive. Pour partager votre invite, il suffit de cliquer sur le bouton Partager. Et si vous souhaitez exporter votre travail vers un environnement de développement, il vous suffit de cliquer sur le bouton Obtenir le code. Vous pouvez exporter vos instructions dans le format qui vous convient. Code Python ou JavaScript, objets JSON ou même sous forme de commande CURL. Votre travail dans Maker Suite, y compris les paramètres, les instructions et les exemples de test , est enregistré dans cet extrait de code En conclusion, la combinaison de API Palm et de make your Suite offre une approche incroyablement pratique et conviviale prototypage avec de grands modèles linguistiques Ils mettent la puissance de l'IA générative entre vos mains, offrant la flexibilité nécessaire pour expérimenter, modifier et affiner jusqu'à ce que vous ayez créé l'application parfaite pilotée par l'IA On se voit dans le prochain. 19. Studio d'IA générative L4V4: Alors que l'intelligence artificielle générative suscite de plus en plus d'intérêt, nous pouvons constater que sa capacité à accélérer le processus de prototypage d'applications change la donne Si vous avez accès aux bons outils tels que Generative AI Studio et aux autres fonctionnalités GNAI disponibles dès maintenant via Vertex AI sur Google Cloud, vous pouvez expérimenter, adapter et perfectionner de nouvelles idées en un Et par Snap, je veux dire minutes ou des heures plutôt que des semaines et des mois. Pour créer une application, il suffit d'ouvrir le studio d'IA générative dans la section Vertex AI de la console Google Cloud Sélectionnez la modalité avec laquelle vous souhaitez travailler, choisissez le format de votre choix, saisissez votre message et ajustez paramètres du modèle pour un contrôle accru Avec Generative AI Studio, vous avez la possibilité d' explorer et de personnaliser modèles d'IA générative parfaitement adaptés à vos applications Google Cloud. Vous pouvez même intégrer ces applications à votre site Web ou à votre application mobile Dans cette vidéo, nous allons découvrir Generative AI Studio disponible sur Vertex AI Mais avant cela, voyons brièvement quels autres outils sont disponibles sur Vertex AI Voici donc à quoi ressemble l'intérieur de Vertex AI. Si nous élargissons le menu de gauche, nous pouvons voir tous les outils à notre disposition. Nous pouvons constater que nous avons accès à un jardin modèle, à un établi et à des canalisations Nous avons également un studio d'IA générative, dont nous parlerons prochainement. En outre, nous disposons d' outils pour la gestion des données, le développement de modèles, ainsi que le déploiement et l'utilisation de modèles. Generative AI Studio aide les développeurs à créer et à déployer modèles en fournissant des outils et ressources qui facilitent le démarrage. Generative AI Studio vous permet tester et de personnaliser rapidement divers modèles de base de Google grâce à des instructions et réglages, et vous permet de déployer facilement vos modèles personnalisés Dans Generative Va Studio, vous pouvez accéder aux modèles de base du langage, de la vision et de la parole de Google . La disponibilité de certaines modalités varie. Par exemple, vous pouvez constater qu' au moment de l' enregistrement de cette vidéo, je n'ai pas accès aux modèles de vision. Concentrons-nous donc sur le langage et la parole. Concentrons-nous sur le langage pour le moment. Vous pouvez cliquer sur la langue dans le menu de gauche ou ouvrir le bouton en bas de la zone de langue. Si vous souhaitez avoir une meilleure idée de la façon dont vous pouvez utiliser GN AI Studio à différentes fins, vous devriez explorer la galerie d'instructions. Avant d'explorer les différents types d'invites, jetons un coup d'œil à la galerie d'invites Nous pouvons voir ici une variété d'exemples d'instructions préconçus pour aider à démontrer les capacités du modèle Les exemples d'invites sont classés par type de tâche, tel que la synthèse, la classification et l'extraction Regardons un exemple. Lorsque vous ouvrez l'exemple d'invite, vous pouvez constater que les invites sont préconfigurées avec un modèle et des valeurs de paramètres spécifiques Vous pouvez donc simplement cliquer sur Soumettre et obtenir le modèle pour générer une réponse. Pour travailler directement avec les modèles linguistiques, nous avons trois options. Interagissez avec le modèle sous forme libre ou sous forme d'instructions structurées, interagissez avec l' agent en tant que chatbot ou créez un modèle personnalisé mieux adapté à nos cas de test Explorons l'invite de texte ou de code dans un format libre. Essayons donc de concevoir et de tester vos propres instructions. Ici, je peux donner une invite au modèle et lui demander de produire une réponse. Je viens de fournir un long article ici et je demande au modèle de fournir un bref résumé de l'article suivant. Pour différents types de demandes, je peux également utiliser mon microphone et parler directement au modèle Sur le côté droit, nous pouvons également voir qu'il existe certains paramètres que nous pouvons utiliser pour configurer le modèle. Nous pouvons choisir le type de modèle que nous voulons utiliser. Ici, nous avons deux modèles de langage et deux modèles de. Nous pouvons régler la température du modèle, qui contrôle le degré de hasard ou de créativité Nous pouvons également définir la limite de jetons, qui détermine la quantité maximale de texte sortie à partir d'une invite. Top K modifie la façon dont le modèle sélectionne les jetons pour la sortie. Top P modifie la façon dont le modèle sélectionne les jetons pour la sortie, et nous pouvons également définir différents seuils de filtre de sécurité. Nous pouvons donc maintenant demander au modèle de produire une réponse à notre demande. Cliquez sur Soumettre. Et nous pouvons voir que le modèle résume le long article en trois lignes. Si vous faites quelques suggestions, un modèle d'invite structuré est disponible pour vous faciliter la tâche en fournissant un formulaire contenant du contexte et des exemples Pour les instructions structurées, revenons à notre exemple de classification des vins Nous pouvons fournir un certain contexte au modèle, qui indique comment le modèle doit réagir Nous pouvons également fournir plusieurs exemples du modèle. Ces exemples aident le modèle comprendre à quoi ressemble une réponse de modèle appropriée. Nous avons également nos paramètres sur le côté droit. Nous avons également la possibilité d'ajouter d'autres colonnes pour des exemples plus complexes. Et pour tester le modèle, nous fournissons une entrée, que ce soit en l'écrivant dans la section de saisie ou en parlant directement au modèle. Et lorsque je clique sur Soumettre, le modèle génère une réponse pour moi. Nous pouvons facilement convertir n'importe quelle invite structurée en format libre. Et c'est à ça que ça ressemble. Vous pouvez choisir de lancer un chat textuel ou codé pour démarrer une conversation avec le modèle. Vous pouvez fournir un contexte et des exemples d' interactions pour mieux orienter la conversation. Tous les paramètres de configuration du modèle sont également disponibles ici. Maintenant, essayons une invite de chat. Dans l'invite de discussion, nous avons la possibilité de fournir un certain contexte au modèle, qui lui indique comment il doit réagir Nous pouvons également fournir des exemples pour aider le modèle à comprendre à quoi ressemblerait une réponse appropriée. Par exemple, si l' utilisateur dit cela, le modèle doit le dire. Nous avons également la possibilité de fournir d'autres exemples au modèle. Après avoir fourni suffisamment de contexte et d'exemples, nous pouvons commencer à discuter avec l'agent. Donc, si vous demandez combien de planètes se trouvent dans le système solaire, le modèle fournit une réponse appropriée. De même, nous pouvons poser d'autres questions et le modèle continue de fournir des réponses appropriées et précises, conformément aux exemples que nous avons fournis. Voyons maintenant comment créer un modèle optimisé à l'aide de notre propre base de données. Nous avons la possibilité de régler un modèle afin qu'il soit mieux adapté à nos cas d'utilisation. Vérifions-le. Ici, nous pouvons choisir notre jeu de données JSON et définir un emplacement pour stocker l'ensemble de données dans le cloud. Après avoir fourni le jeu de données, nous pouvons ajuster les détails du modèle, puis nous pouvons ajuster le modèle fonction de notre ensemble de données et de nos paramètres. Pour décider quel modèle convient le mieux à nos cas d'utilisation spécifiques, nous pouvons consulter la bibliothèque de modèles de base de Google , disponible dans Model Garden. Dans Model Garden, vous pouvez explorer les modèles par modalité, tâche et par d'autres fonctionnalités Avec de nombreux modèles prêts à l'emploi à votre disposition, Model Garden vous permet de sélectionner le modèle le plus adapté en fonction de votre cas d'utilisation, votre expertise en apprentissage automatique et de votre budget disponible. OK, il est temps de vérifier les modèles vocaux. Il est maintenant temps d'explorer les modèles vocaux. Nous pouvons choisir le discours soit dans le menu de gauche, soit en cliquant sur le bouton Ouvrir sous la zone de dialogue. Ici, nous avons deux options différentes, le texte en discours ou le discours en texte. Passons à la synthèse vocale. Ici, nous pouvons soit fournir le texte, soit parler directement au modèle. Après avoir fourni le texte, nous avons quelques options pour choisir différentes langues ou régler la vitesse du discours. Si tout semble correct, nous pouvons cliquer sur Soumettre. Et maintenant, nous avons une voix artificielle synthétisée qui peut lire ce texte pour nous Pour créer une application, il suffit d'ouvrir le studio d'IA générative dans la section Vertex AI de la console Google Cloud Sélectionnez la modalité avec laquelle vous souhaitez travailler, choisissez votre format préféré Pour des fonctionnalités plus avancées, telles que la prise en charge d'un son plus long, nous pouvons utiliser Speech Studio et voici à quoi ressemble l' environnement. Nous avons également un système de synthèse vocale. Ici, nous pouvons soit télécharger un fichier audio, soit enregistrer notre propre voix. Et après avoir fourni le discours au modèle, nous pouvons voir qu'il le transforme en texte. Alors maintenant j'ai enregistré ma voix et je clique sur Soumettre et voici mon discours transformé en texte. Nous pouvons également utiliser le Speeches Studio pour les applications de synthèse vocale. Les deux fonctionnalités, la synthèse vocale et synthèse vocale, sont disponibles dans le studio vocal. Après avoir personnalisé votre modèle, plusieurs options s' offrent à vous. Vous pouvez enregistrer l'invite dans la galerie d'invite. Vous pouvez également effectuer un déploiement sur la plateforme d' apprentissage automatique de Vertex AI pour la production et la gestion Vous pouvez également implémenter vos nouveaux modèles directement dans votre site Web et vos applications. En conclusion, grâce au studio Generative AI de Vertex AI, nous pouvons accéder à des modèles de langage, de vision et de parole Grâce aux modèles de langage, nous sommes en mesure de tester, d' ajuster et de déployer des modèles de langage d' IA génératifs. Nous pouvons également accéder à l'API Palm ou Cody pour la génération de contenu, chat, le résumé, le code, etc. Avec les modèles de vision, nous sommes en mesure d'écrire instructions textuelles pour générer de nouvelles images à l'aide de l'API imagine Nous pouvons également générer de nouvelles zones pour une image existante. Et avec les modèles vocaux, nous pouvons convertir la parole en texte à l'aide de l'API chirp Nous pouvons également synthétiser la parole à partir de texte en utilisant le modèle vocal universel ou USM de Google, et c'est ainsi que se termine cette vidéo sur le studio Generative Va sur Vertex AI 20. Démo - Démo de la fiche d'application: Dans notre vidéo d'introduction sur apsheet, nous avons vu que grâce à apsheet, nous pouvons créer des applications personnalisées sans écrire Google a récemment ajouté des fonctionnalités GNAI, qui nous permettent d' expliquer directement le type d'application dont nous avons besoin pour créer une application de démarrage basée sur cette Nous pouvons ensuite modifier et personnaliser davantage l'application de démarrage uniquement en discutant avec Apheet Prenons l'exemple suivant. Anne Gray est directrice d'une entreprise et l'une de ses responsabilités est de superviser les demandes de voyage de ses collègues Ces demandes peuvent provenir de courriels, discussions ou de réunions, ce qui peut être assez accablant. Elle se demande si la fonctionnalité d'IA générative apsheet peut l'aider à rationaliser ses opérations en proposant une solution d' approbation et de suivi de la Pour l'essayer, elle décide d'explorer l'application de chat apsheet disponible sur Google Chat Voyons comment cela fonctionne. Pour accéder à cette fonctionnalité de chat, nous allons sur chat.google.com Ensuite, nous sélectionnons Explorer les applications et trouvons l'application de chat apshet. Voyons maintenant à quoi ressemblerait le processus du point de vue d' Ann. Sur la première page, nous pouvons voir qu'apsheet souhaite la bienvenue à l'utilisateur et l' invite à soumettre une description d'une application ou d'un problème commercial qu'il souhaite résoudre Par exemple, en décrivant un flux de travail. Pour ce faire, Ann décrit brièvement ce dont elle a besoin pour simplifier le processus de réception et d'approbation des demandes de voyage par les gestionnaires réception et d'approbation des demandes de voyage Elle ajoute à la description en indiquant les types de données qu'elle devra également suivre. Après avoir saisi l'invite, Ushid répond par un schéma général de l'application Dès la première demande d'Ann, Upshd a reconnu que l'application devait avoir un flux d'approbation et Upshd a reconnu que l'application devait avoir un flux d'approbation et lui a demandé de choisir le mode d'envoi des notifications de demande d'approbation Comme nous pouvons le voir, différentes options sont disponibles ici, ne sélectionne que le courrier électronique pour le moment. Ensuite, apshet suggère quelques écrans qu'elle pourrait souhaiter inclure, un formulaire permettant aux utilisateurs de soumettre de nouvelles demandes, une liste récapitulative des voyages, voyages à venir et quelques autres vues Ces écrans sont essentiellement l'épine dorsale du schéma d'application d' Anne. Il décrit en quoi consiste son application. Comme elle ne veut pas d'écran M Travel dans son application, elle le désélectionne pour le supprimer de l'application, puis clique sur App Maintenant qu'Apsheet sait quoi créer pour l' application Ann's Travel request, elle confirme les tables qui pourraient être créées dans la base de données Apsheet Ces ensembles de données sont créés en fonction des écrans ou des vues d'applications qu'elle vient de sélectionner Upsheet crée deux tables pour prendre en charge Schema, Travel et Team Nous n'avons pas encore saisi de données dans notre application Toutes ces tables seront donc vides. Si nous n'avons aucune donnée dans l'application, comment pouvons-nous tester pour voir si tout fonctionne ? J'y ai pensé aussi, bouleversé. Après avoir créé les tables, Upseet propose la possibilité d' inclure des exemples de données dans l'application Anne est prête à tester l' application, elle choisit donc « oui ». Enfin, apseet invite Anne à choisir un nom pour son application A appelle ce symbole le voyage, et c'est tout. La réponse suivante d'Apshet est un lien vers un aperçu entièrement fonctionnel de l'application qui vient d'être créée Faisons une pause et jetons un coup d' œil à ce que nous avons fait jusqu'à présent. Grâce à quelques échanges de questions et réponses, apseet a pu répondre à la demande d'Ann, rédigée en langage naturel, et j'ai recommandé plusieurs solutions, notamment les écrans que les utilisateurs de son application devront voir Ce qu'ils devront faire et l'endroit où les données seront stockées. Il a même configuré la notification par e-mail aux utilisateurs. La création d'une application en langage naturel sans codage est une magie qui est désormais une réalité dans la feuille d'application Il permet à de nombreux nouveaux utilisateurs de développer des applications rapidement et efficacement. Ensuite, Anne a la possibilité de prévisualiser l' application qui a été créée pour elle ou de plonger dans l' éditeur Ashot pour Elle choisit d'abord de jeter un coup d' œil à l'aperçu. En naviguant dans l'émulateur d' application sur son bureau, elle explore les vues générées par l' abse, en commençant par les nouveaux voyages, en passant par les voyages par utilisateur et enfin les voyages à et enfin Cette dernière vue affiche à la fois une carte et une liste de voyages futurs, toutes remplies des exemples de données qu'elle a décidé d'inclure précédemment. Tout semble être en ordre jusqu'à présent. Mais Ann remarque qu' une vue qu'elle avait en tête est absente de l'application. Elle a un ajout particulier en tête un écran qui compile toutes les demandes de voyage dans un tableau de bord complet, fournissant à l'équipe financière une réponse à une question fréquemment posée Quel est le coût total du voyage de chaque employé ? Dans l'éditeur, et remarque que la fonctionnalité d'IA générative qu'elle utilisait auparavant est également disponible ici. Elle saisit sa demande pour un nouveau tableau de bord, et Abscht prend rapidement sa demande, décortique et suggère les composants nécessaires pour Elle propose une nouvelle colonne calculée pour son tableau d'équipe et donne un aperçu du graphique qui représentera les données agrégées, comme elle l'a fait auparavant et souhaite examiner chaque élément des modifications suggérées Elle consulte donc le graphique d'aperçu. Et ça a l'air bien. Elle inspecte ensuite la nouvelle colonne la base de données pour s'assurer que tout y est bien Elle utilise le lien fourni pour voir le changement proposé dans le tableau d'approbation dans la base de données des feuilles. jetant un coup d'œil aux chiffres, elle confirme que la nouvelle vision et les modifications apportées aux données correspondent à ses attentes. Elle approuve les modifications dans l'éditeur de feuille de notes, et c'est tout Son application est maintenant en ligne et prête à être utilisée et elle sent qu'elle a ce dont elle a besoin. Elle a une grande confiance dans les tableaux et les colonnes que l'apseet a créés pour elle Comme elle est satisfaite des fonctionnalités de son application, elle se débarrasse des exemples de données, déploie l'application et les partage avec son équipe Son équipe peut désormais consulter cette version améliorée de l'application et commencer à soumettre ses demandes de voyage. Quelques semaines plus tard, alors qu'Anne parcourt l' intranet de son entreprise pour trouver un formulaire spécifique, une idée lui vient à l'esprit. Anne retourne chez le rédacteur en chef. Sachant à quelle fréquence son équipe utilise Google Chat, elle envisage d'utiliser la fonctionnalité de l'application de chat sans code d'Apsheets Cela permettrait à son équipe de récupérer le formulaire requis simplement en discutant avec symbol travel Anne retourne dans l' éditeur et active le voyage par symboles en tant qu'application de chat pour les espaces internes de son domaine. Cette étape permet aux collègues d'Anne d' ajouter des symboles à leurs espaces de discussion Google, discussions de groupe ou même à leurs conversations privées. Il est maintenant temps de passer en revue les paramètres. Par défaut, l'application de chat Symbol Travel affichera une liste de toutes les vues d' applications accessibles aux utilisateurs. Mais Anne développe cette version de chat spécifiquement pour les utilisateurs finaux. Les employés qui souhaitent principalement utiliser l'application pour soumettre des demandes de voyage. Elle choisit uniquement les vues d' application nécessaires pour ses utilisateurs, ce qui signifie qu'elle doit tout supprimer sauf les formulaires de demande. Ensuite, elle ajoute un message de bienvenue à ses utilisateurs, fournissant un contexte sur façon d'interagir avec le chat. Elle décide d'inclure une commande slash. En ajoutant cette commande, chaque fois qu'un utilisateur tape une barre oblique NETRIP, l'application de chat affiche rapidement le formulaire de demande de voyage Aphit fournit également une commande de recherche intelligente. Cette commande permettrait à ses coéquipières d'utiliser pipeline de traitement du langage naturel d' Apht pour rechercher des données ou des vues dans son application Mais elle décide de garder les choses simples et désactive la commande de recherche intelligente Sa dernière tâche consiste à mettre en place une automatisation pour informer les utilisateurs chaque fois que leur statut d'approbation de voyage change. Dans cette page, vous pouvez créer le bon flux en utilisant une interface graphique. Elle peut ainsi jeter les bases de l'automatisation nécessaire Une fois que c'est fait, elle donne un nom à son automatisation, peaufine quelques détails sur le moment où elle doit s' exécuter et la façon dont les réponses doivent être traitées, puis retourne au générateur d'applications de chat pour terminer le Grâce au déploiement de l'application de chat sans code d'Apshts, n'a pas besoin de configuration supplémentaire pour que son application ou son automatisation fonctionnent dans Upshet s'occupe de toute la configuration de la plateforme Google Cloud arrière-plan, le tout en un seul clic est maintenant prête à partager son application de chat avec l'équipe. Et voilà. L'application de chat est maintenant en ligne et est prête à être installée et utilisée par l'ensemble de son organisation. Supposons maintenant que Jeffrey Clark, un membre de l'équipe d'Ann, décide d'utiliser l'application. Jeffrey doit être approuvé pour ses projets de voyage pour visiter les locaux du client. Comme il a déjà installé l'application de chat Symbole Travel, il écrit la barre oblique New Trip Command pour afficher le formulaire de demande de voyage Jeffrey saisit tous les détails nécessaires concernant son prochain voyage dans le formulaire et clique sur Soumettre. Du côté d'Anne, elle peut voir la demande de Jeffrey apparaître presque instantanément La nouvelle demande d'approbation déclenche d'une notification par e-mail au responsable de Marcus Jeffrey. Marcus reçoit un e-mail détaillant la demande de voyage de Jeffrey. Après avoir examiné les détails de la soumission, Marcus approuve le formulaire directement depuis son compte Gmail. En quelques secondes, Jeffrey remarque une notification de chat provenant du déplacement des symboles. Le message est une confirmation d'approbation de voyage. Félicitations Jeffrey et bon voyage. En conclusion, nous avons été témoins la puissance de la fonctionnalité d'IA générative d'App Sheets. Cela a aidé Ann à créer et personnaliser une solution pour gérer les demandes de voyage de son équipe en langage naturel et sans code. An a résolu efficacement un défi commercial en créant une application de demande de voyage adaptée aux besoins de son équipe. L'intégration parfaite avec Google Chat et le bon fonctionnement, comme en témoignent demande de voyage de Jeffrey et approbation rapide de Marcus soulignent l'accessibilité et l'efficacité de la plateforme. C'est le pouvoir du développement sans code. APSHETSGenerative AI révolutionne le développement sans code en le rendant accessible, rendant accessible,

Gen AI 0-100 : des bases aux outils Google Cloud

Reza Moradinezhad, AI Scientist

Regardez ce cours et des milliers d'autres

Regardez ce cours et des milliers d'autres

Leçons de ce cours

1.

Introduction à GenAI

2:50

2.

L1V1 - IA traditionnelle

18:42

3.

L1V2 - Machine Learning

19:10

4.

L1V3 - Apprentissage approfondi

14:55

5.

L1V4 - Discrimination vs générative

11:54

6.

L2V1 - Transformateurs

7:53

7.

L2V2 - Gen IA

14:52

8.

L2V3 - Applications d'IA de génération

12:47

9.

L2V4 - Ingénierie rapide

11:24

10.

L3V1 - LLM

6:41

11.

L3V2 - Avantages de LMM

10:23

12.

L3V3 - Exemples de LLM

10:13

13.

L3V4 - Modèles de base

12:51

14.

L3V5 - Développement de LLM

5:23

15.

L3V6 - Tuning LLM

8:54

16.

L4V1 - Fiche d'application

6:56

17.

L4V2 - Gen App Builder

6:11

18.

L4V3 - Maker Suite

10:16

19.

Studio d'IA générative L4V4

12:56

20.

Démo du projet - Fiche d'application sans code

12:06