Google Gemini : La seule IA qui puisse tout gérer (images, vidéo et texte) | Anna Kolenkina | Skillshare

Vitesse de lecture


1.0x


  • 0.5x
  • 0.75x
  • 1 x (normale)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Google Gemini : La seule IA qui puisse tout gérer (images, vidéo et texte)

teacher avatar Anna Kolenkina, Product Builder, Entrepreneur

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

    • 1.

      Bienvenue au cours sur l'IA de Google Gemini !

      3:06

    • 2.

      Qu'est-ce que Gemini ? Comprendre l'écosystème d'IA de Google

      5:57

    • 3.

      Rencontre avec la famille des modèles Gemini

      4:38

    • 4.

      Configuration de Gemini et de votre premier chat

      4:53

    • 5.

      Donner de meilleurs résultats à Gemini : section Intro

      1:39

    • 6.

      Qu'est-ce qu'une invite ? Invitation, ingénierie d'invitation, invites personnelles vs invites de production

      4:59

    • 7.

      Comment parler à Google Gemini IA : les éléments constitutifs d'une invite efficace

      7:57

    • 8.

      S'appuyer sur les réponses de Gemini : invite itérative

      5:54

    • 9.

      Faire de Gemini un véritable personnage :

      7:14

    • 10.

      Comment partager des fichiers et d'autres contenus avec Google Gemini AI

      9:20

    • 11.

      Utiliser des exemples dans vos invites

      10:37

    • 12.

      Spécifier le format de sortie dans Gemini

      4:46

    • 13.

      Suivi : choix du bon modèle et brainstorming avec Gemini ming

      9:43

    • 14.

      Suivi : obtenir des retours avec l’IA de Google Gemini

      8:48

    • 15.

      Rester réel : stratégies pratiques pour minimiser les hallucinations par l'IA

      10:12

    • 16.

      Travailler avec la toile et des pierres précieuses Gemini : Section Intro tro

      1:38

    • 17.

      Bienvenue sur la toile Gemini

      3:39

    • 18.

      Suivi : création et édition de documents dans Gemini Canvas (partie 1)

      5:38

    • 19.

      Suivi : création et édition de documents dans Gemini Canvas (partie 2)

      5:42

    • 20.

      Suivi : Transformer un projet Gemini en un PDF raffiné avec Gamma

      9:29

    • 21.

      Que sont les pierres gemmes et pourquoi en avons-nous besoin ?

      5:34

    • 22.

      Suivi de suivi : Construire un joyau de la vérification grammaticale em

      10:10

    • 23.

      : suivre : créer un joyau de coach fitness (partie 1)

      7:23

    • 24.

      : créer un joyau de coach physique (partie 2)

      4:46

    • 25.

      Gemini pour la création visuelle : section Intro être à

      2:11

    • 26.

      Qu'est-ce que la nano banana ? Explication des caractéristiques clés à

      6:42

    • 27.

      Créer votre première image avec Gemini

      7:05

    • 28.

      7 conseils pour créer de meilleurs visuels

      6:17

    • 29.

      Mélange contextuel, renouvelement itératif et synthèse visuelle

      7:50

    • 30.

      La suite d'édition : transformer des ébauches en prototypes et en restauration photo au

      4:14

    • 31.

      La suite de montage : des retouches ciblées avec l'outil de marquage et des annotations externes

      6:30

    • 32.

      - Jacqueline Jensen Visuels complexes ams

      6:15

    • 33.

      Visuels complexes : adapter les actifs sur différents formats et plateformes

      4:32

    • 34.

      Au-delà de la discussion - Recherche approfondie et construction avec Gemini : section d'introduction

      1:25

    • 35.

      Recherche approfondie : Au-delà des réponses

      5:48

    • 36.

      La recherche approfondie en action - Comprendre le sujet

      8:54

    • 37.

      La recherche en action - Décisions d'achat

      5:23

    • 38.

      La recherche en action - Apprendre un nouveau sujet

      5:28

    • 39.

      Au-delà des documents : que peut faire la toile d'autre ?

      6:08

    • 40.

      Suivi de suivi : Création d'une application avec Canvas - De la recherche à une application en cours d'exécution

      9:30

    • 41.

      Suivi : créer une application avec une toile - Affiner et partager

      6:57

  • --
  • Niveau débutant
  • Niveau intermédiaire
  • Niveau avancé
  • Tous niveaux

Généré par la communauté

Le niveau est déterminé par l'opinion majoritaire des apprenants qui ont évalué ce cours. La recommandation de l'enseignant est affichée jusqu'à ce qu'au moins 5 réponses d'apprenants soient collectées.

42

apprenants

--

À propos de ce cours

Vous en avez assez de passer d’un outil à l’autre pour différentes tâches créatives ? Et si vous pouviez travailler avec une IA qui comprend le texte, analyse des images, traite les vidéos et s’intègre sans problème aux outils que vous utilisez déjà au quotidien ?

Google Gemini AI, l'outil qui change la façon dont les créatifs travaillent simultanément avec plusieurs formats de contenu.

Avec plus de 750 millions d'utilisateurs mensuels (et une croissance plus rapide que ChatGPT sur de nombreux marchés), Gemini n'est pas un simple chatbot avec IA : c'est votre partenaire créatif qui vit dans Gmail, Google Docs, Chrome et votre téléphone. C’est l’IA qui vous aide là où vous travaillez déjà.

Ce qui rend ce cours différent :

Ceci n'est pas un cours technique sur l'IA. C'est une boîte à outils créative pour quiconque souhaite produire un meilleur contenu plus rapidement, générer des visuels époustouflants et transformer des idées en réalité - le tout sans connaissances techniques.

Dans ce cours pratique, vous découvrirez comment :

Création de contenu multimodal :

  • Analyser des images et obtenir des retours créatifs sur votre travail visuel
  • Travaillez les vidéos pour en extraire des informations, des résumés et des idées de contenu.
  • Combiner du texte, des images et du contexte d'une manière que ChatGPT ne peut tout simplement pas
  • Générer des visuels par IA directement dans votre flux de travail

Idéation créative et brainstorming :

  • Générer un nombre infini de concepts créatifs sur plusieurs formats
  • Obtenir instantanément des retours de niveau professionnel sur votre travail
  • Surmonter les blocages créatifs grâce à l'inspiration multimodale inspiration

Productivité basée sur l'IA pour les créatifs :

  • Créez des assistants d’IA personnalisés pour des tâches créatives spécifiques (vérification grammaticale, voix de la marque, coaching fitness) )
  • Transformer des recherches complexes en briefs créatifs détaillés avec Deep Research
  • Résumer de longs documents, vidéos et contenus visuels en quelques secondes
  • Gmail, Docs et Drive

Création d'application et de prototypes sans code :

  • Créez des applications fonctionnelles et des prototypes interactifs en décrivant simplement ce que vous voulez, sans écrire de code

Pourquoi Gémeaux pour les créatifs ?

Contrairement à d'autres outils d'IA, Gemini excelle pour comprendre le contexte visuel et textuel ensemble, maintenir la direction créative sur des projets étendus et travailler à l'intérieur des outils Google que vous utilisez quotidiennement. C'est comme si vous aviez à la fois un directeur de création, un analyste visuel et un rédacteur de contenu – disponible 24 heures sur 24, 7 jours sur 7, où que vous travailliez.

Ce que vous allez apprendre :

: Base (parfait pour les débutants en IA) :

  • Comment communiquer avec Gemini en utilisant des techniques d'incitation efficaces
  • Comment structurer vos invites pour obtenir de meilleurs résultats
  • Comment travailler avec du texte, des images et une vidéo dans une seule conversation

Applications créatives :

  • Brainstorming avec analyse combinée de texte, d'image et de vidéo
  • Créer des campagnes de marketing avec du contenu visuel et écrit
  • Créer des assistants IA personnalisés pour vos besoins créatifs spécifiques
  • Utiliser la recherche en profondeur pour transformer les idées en stratégies créatives exploitables

Techniques créatives avancées :

  • Combiner les visuels et les mots pour obtenir de meilleures solutions créatives
  • Comment repérer et prévenir les erreurs d'IA (hallucinations)
  • Créer des applications et des prototypes sans code pour votre entreprise créative business
  • Intégration de Gemini dans votre flux de travail Google existant

Vous n’avez pas besoin de comprendre le fonctionnement de l’IA ni de connaissances en programmation. Si vous pouvez utiliser Gmail ou Google Docs, vous pouvez utiliser Gemini. Ce cours est conçu spécifiquement pour les créatifs non techniques qui souhaitent obtenir des résultats puissants sans complexité. ()

Structure du cours :

  • + de 4 heures de tutoriels vidéo étape par étape.
  • Véritables projets créatifs que vous réaliserez à mes côtés.
  • Ressources téléchargeables comprenant des modèles et des guides d'invitation
  • Certificat de fin de l'apprentissage pour présenter vos nouvelles compétences en IA

À qui s'adresse-t-il ?

Freelancers et Solopreneurs :

  • Les créateurs de contenu qui travaillent avec plusieurs formats de médias (texte, images, vidéo)
  • Les graphistes ayant besoin d'aide par une IA pour le développement de concepts
  • Les photographes qui souhaitent avoir des retours et une orientation créative sur l'IA
  • Les entraîneurs et les consultants créant du matériel éducatif

Les créatifs marketing et commerciaux :

  • Les gestionnaires de réseaux sociaux créent du contenu visuel et écrit
  • Les spécialistes du marketing par courriel réalisent des campagnes multimédias
  • Les stratèges de marque développant des stratégies créatives complètes
  • Les propriétaires de petites entreprises gérant le contenu sur plusieurs plateformes

Professionnels de la création :

  • Les écrivains combinant la recherche visuelle à la création de contenu creation creation
  • Les créateurs de cours développent du matériel d'apprentissage multimédia ;
  • Les concepteurs de présentations travaillant sur différents formats
  • avec plusieurs outils de création qui souhaite avoir un partenaire d’IA unifié.

Pourquoi maintenant ?

L'IA transforme le travail créatif, mais elle ne les remplace pas, elle les autonomise. Les créatifs qui apprennent à collaborer avec l'IA aujourd'hui auront un avantage considérable demain. Ce cours vous donnera cet avantage.

Rencontrez votre enseignant·e

Teacher Profile Image

Anna Kolenkina

Product Builder, Entrepreneur

Enseignant·e

I help professionals and fresh graduates to learn digital skills, start new careers and advance in their roles.

I started my journey in the IT industry and software product management 15 years back from being an IT and management consultant and then transitioning to a full-on startup Product Manager and Product Director. I've built products from scratch for different industries - commodities trading, logistics, natural language processing, and e-learning - and also for different markets, from Europe to Asia. I have a Master's Degree in Applied Informatics and an MBA from the National University of Singapore.

Before joining online education, I shared my expertise and knowledge with only a limited number of people - my co-workers and mentees. With Skillshare, I'd like to s... Voir le profil complet

Level: Beginner

Notes attribuées au cours

Les attentes sont-elles satisfaites ?
    Dépassées !
  • 0%
  • Oui
  • 0%
  • En partie
  • 0%
  • Pas vraiment
  • 0%

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Bienvenue au cours sur l'IA de Google Gemini !: Tout le monde, et bienvenue au cours sur Google Gemini. Saviez-vous que Google Gemini a officiellement dépassé les 750 millions d'utilisateurs actifs par mois Cela représente près des trois quarts d'un milliard de personnes. Pour mettre les choses en perspective, la croissance de Gemini dépasse actuellement celle de presque tous les autres chatbots basés sur l' IA sur le marché, comblant ainsi l' écart avec ChatGPT Mais ce n'est pas qu'une question de chiffres, car Gemini est créé par Google C'est aujourd'hui l'IE la plus intégrée au monde. Il se trouve dans votre Gmail, votre Google Docs, votre navigateur Chrome et votre téléphone portable. Cela représente le plus grand changement dans notre façon de travailler et de créer depuis l' invention d'Internet. Nous nous dirigeons vers un monde où l'IE ne se limite pas à l'utiliser. C'est un collaborateur qui est déjà là où vous travaillez. m'appelle Anna et je serai votre instructrice pour ce cours. Instructeur en ligne avec mes autres cours disponibles ici sur la plateforme, axés sur la gestion des produits et l'IA générative. En participant à ce cours, vous aurez accès à plus de 4 heures de contenu HDVdo, didacticiels et à des activités étape par étape mettant en lumière le monde réel, des applications pratiques des outils Gemini, des résumés PDF pour passer en revue les principaux enseignements du cours et bien plus encore Nous commencerons par découvrir de quoi Gemini est capable, comment communiquer avec lui et structurer vos demandes, et comment faire en sorte que Gemini fonctionne le mieux pour À partir de là, nous passerons en revue des scénarios utilisant Gemini pour réfléchir à des idées et obtenir des commentaires professionnels Créez vos propres systèmes d'IE personnalisés pour des tâches spécifiques et générez des visuels de haute qualité Nous aborderons également des techniques avancées telles que la recherche approfondie pour transformer des tâches complexes en rapports détaillés et la création applications entièrement fonctionnelles simplement en décrivant ce que vous voulez. Aucun codage n'est requis. Et nous veillerons à ce que vous sachiez comment détecter et empêcher les réponses incorrectes de l'IA, afin que votre travail soit toujours précis. Et oui, vous n' avez pas besoin de connaissances techniques ou de connaissances préalables en IA pour commencer le cours. Commençons donc Ilsa dans la vidéo suivante. 2. Qu'est-ce que Gemini ? Comprendre l'écosystème d'IA de Google: Tout le monde, et bienvenue au premier cours. Repensez à tous les films de science-fiction que vous avez vus. Il y a toujours un personnage, un assistant qui ne se contente pas d'attendre une commande, mais qui comprend vraiment le monde du héros. Il anticipe les problèmes avant qu'ils ne surviennent et agit comme un véritable partenaire Pendant des années, ce n' était que de la fiction. Mais avec Gemini, nous nous rapprochons de plus en plus d' un avenir où ce type de partenariat deviendra réalité Alors, qu'est-ce que Gemini ? J'aime l'imaginer comme les trois couches d'une maison les fondations, le cerveau. Ce sont les modèles Gemini eux-mêmes conçus par le laboratoire de recherche Deep Mind de Google Dans ce cours, nous utiliserons la dernière génération de modèles Gemini Cela inclut des modèles de raisonnement de haut niveau pour une logique complexe, outils de génération d'images avancés pour des visuels photoréalistes et des modèles vidéo de nouvelle génération capables générer des scènes haute définition avec Ces modèles sont nativement multimodaux, ce qui signifie qu'ils ne se contentent pas de traiter du texte. Ils voient ici et réfléchissent sur tous les supports à la fois, tout comme nous. Pour en revenir à l'analogie de la maison, le deuxième niveau est l'espace de vie, l'assistant. C'est ici que nous passerons le plus clair de notre temps dans l'application de votre téléphone et sur le site Web gemini.google.com C'est un espace créatif où vous pouvez discuter avec des codes et utiliser des outils tels que Jams pour personnaliser le comportement de l'IE. Enfin, la troisième couche est l'infrastructure. C'est Gemini qui vit dans Gmail, Google Docs et Search. C'est la vue d'ensemble de l'IE qui résume les résultats de votre recherche ou le bouton Aidez-moi à rédiger qui rédige Dans ce cours, nous nous concentrons sur couche intermédiaire, cette GeminieIsistet La vision de Google à ce sujet est centrée sur les trois éléments suivants : personnel, proactif et puissant. Voyons ce que cela signifie. Tout d'abord, c'est personnel. La plupart des modèles d'IA sont des généralistes. Ils en savent beaucoup sur le monde, mais très peu sur vous. Gemini est conçu pour être votre extension personnelle. Avec votre permission, il peut se connecter à votre contexte personnel, à vos e-mails, vos fichiers et à votre historique pour vous fournir une aide particulièrement adaptée à votre vie. Deuxièmement, il est proactif. Aujourd'hui, la plupart des IA sont réactives. Vous lui demandez des réponses. L'avenir des Gémeaux consiste à voir ce qui va arriver. Si vous avez une présentation à un gros client vendredi, Gemini ne doit pas simplement vous rappeler qu'elle est imminente Il devrait consulter votre calendrier une semaine à l'avance et indiquer : «  J'ai remarqué que votre réunion stratégique avec l'entreprise A a lieu vendredi, sur base de la proposition contenue dans votre dossier et de la dernière menace par e-mail concernant son équipe ». Voici le dossier de préparation et les trois questions auxquelles vous serez probablement confronté. Troisièmement, il est puissant. Grâce aux dernières avancées de Gemini, nous allons au-delà simple génération de texte vie à des choses, qu'il s'agisse de créer un site Web complet à partir une seule invite ou de créer vidéo cinématographique pour une Le pouvoir qui nécessitait auparavant toute une équipe de spécialistes est désormais à portée de main. Mais avoir tous ces pouvoirs ne signifie pas que je suis responsable. Il est important de se rappeler que même lorsque Gemini est proactif, il prend toujours les devants Il n'a pas son propre programme secret ni ses propres croyances. Il est conçu pour suivre les ordres. Vous le donnez par le biais de vos instructions et de vos préférences. Ainsi, qu'il s'agisse de votre chercheur, votre codeur ou de votre collaborateur créatif, vous êtes toujours aux commandes La productivité ne signifie pas que l' IE fait ce qu'elle veut. C'est l'IE qui anticipe ce dont vous avez besoin car vous avez déjà défini l'objectif Maintenant que nous avons exploré la vision et l'architecture, il est temps de passer de la théorie à la pratique. Dans la prochaine conférence, nous examinerons de plus près les différents modèles spécialisés pour le raisonnement, les images et les vidéos. Et je vais également vous montrer comment configurer votre compte avec Gemini. Je t'y verrai. 3. Rencontre avec la famille des modèles Gemini: Lors de la dernière conférence, nous avons parlé Gémeaux en tant que maison à trois niveaux le cerveau, l'assistant et le moteur intégré Maintenant, approfondissons ce cerveau d'un niveau. La plupart des anciens modèles EI étaient d' abord entraînés sur le texte , puis étaient dotés d'autres fonctionnalités supplémentaires. Gemini a été conçu différemment dès le départ pour être multimodal Cela signifie qu'il ne se contente pas de lire la description d'une vidéo, je comprends la vidéo, le son, les images et le texte en même temps. Que vous téléchargiez un PDF de 1 000 pages, une vidéo d'une heure ou une énorme base de code, Gemini traite le tout dans un seul espace unifié Il ne s'agit pas de traduire secrètement des images en texte dans les coulisses, mais de les voir directement. Lorsque vous ouvrez Gemini sur geminiggle.com, vous remarquerez Considérez-les comme des modes différents, chacun vous redirigeant vers un modèle sous-jacent différent que Google a optimisé pour un type de tâche spécifique. La gamme complète de modèles Google est vaste, mais pour un usage quotidien, ce sont ceux que vous utiliserez le plus. Avant de les parcourir, un petit mot sur ce qu'est réellement un mannequin . Considérez-le comme un spécialiste, vous recrutez pour un emploi. Chaque modèle a été entraîné différemment, alimenté par différents types de données et optimisé pour différents points forts. Lorsque vous choisissez un mode dans Gemini, vous choisissez essentiellement à quel spécialiste confier votre tâche Fast est notre sprinter rapide et conversationnel. C'est le spécialiste que vous recherchez lorsque vous avez besoin d'une réponse instantanée. Un résumé rapide ou une aide à la rédaction d'un message rapide. Il est optimisé pour la rapidité et gère un volume élevé de demandes. Ne l'utilisez simplement pas pour quoi que ce soit qui nécessite un raisonnement approfondi en plusieurs étapes. La pensée est notre stratège. Ce spécialiste fait une pause avant de répondre , élaborant sa logique avant de vous donner une réponse. Si vous avez un problème complexe, plan en plusieurs étapes à résoudre ou une question nuancée à laquelle une réponse rapide risque de vous tromper C'est celui qui réfléchit avant de parler. Pro est notre expert. Vous l'utilisez lorsque la tâche est complexe, qu'il s'agisse de recherches approfondies, d' analyse d'un document volumineux, rédaction avancée qui doit trouver le ton exact. Pro utilise le modèle sous-jacent le plus performant de la gamme, ce qui signifie qu'il peut contenir plus d'informations à fois et capter plus de nuances que les autres modèles pourraient manquer. Le compromis est qu'il est plus lent et que ses limites d'utilisation quotidienne sont inférieures. Conservez-le donc pour les tâches réellement nécessaires. Ces trois modèles de langage Fast Thinking et Pro sont des modèles de langage Gemini Ce sont eux qui alimentent la conversation. Mais la famille Gemini ne s'arrête pas là. Il inclut également des modèles dédiés à génération d'images et de vidéos, et vous les déclenchez simplement en utilisant les commandes de génération d'image ou de génération vidéo directement dans votre chat ou dans l'interface Gemini Lorsque vous le faites, Gemini confie discrètement la tâche au bon spécialiste dans les coulisses, et nous rencontrerons ces spécialistes plus tard dans le cours Maintenant, une fois que nous aurons déterminé avec quels modèles nous allons travailler, laissez-moi vous expliquer comment accéder à Gemini 4. Configuration de Gemini et de votre premier chat: Accédez à Gemini Dot Google Forward Slash Abonnements pour voir les plans actuels et attention, les prix et la disponibilité varient selon Ce que vous voyez sur votre écran peut donc sembler un peu différent de ce que je montre ici. Le forfait gratuit vous donne un accès quotidien à Gemini. C'est un bon point de départ et ne nécessite rien de plus qu'un compte Google. Google AI plus vous donne un meilleur accès aux modèles et fonctionnalités les plus performants, y compris la génération améliorée d'images et de vidéos, et vous aurez accès à Gemini dans Gmail, ainsi qu'à Google MIT Google AI Pro va encore plus loin avec limites d'utilisation plus élevées : Gemini dans votre Gmail, Google MIT Docs, ainsi que diapositives et deux téraoctets de stockage dans le cloud Enfin, Google AI Ultra est le meilleur niveau. Il vous offre les limites d'utilisation les plus élevées, ainsi qu'un accès anticipé exclusif aux nouvelles fonctionnalités de Google. Je vous recommande d'utiliser Google AI à condition qu'il propose un essai gratuit, ce qui signifie que vous pouvez suivre gratuitement tout ce que je montre ici dans le cours montre ici dans le cours pendant le premier mois. Et après ce mois d'essai gratuit, vous pouvez décider si vous souhaitez continuer avec votre abonnement passer à Google Plus ou revenir à l'abonnement gratuit Pour commencer, sélectionnez votre plan d'adhésion, cliquez sur Commencer. Ensuite, vous devez fournir un mode de paiement pour l'essai, mais vous ne serez pas débité si vous annulez ou rétrogradez avant la fin du mois Une fois connecté, voici ce que vous voyez dans le coin supérieur droit, vous voyez votre plan d'adhésion. Pro, si vous décidez de vous abonner à AI Pro ou si vous décidez de poursuivre avec ce plan, au centre de l' écran se trouve votre principale entrée de discussion sous la barre de saisie, vous remarquerez une rangée de boutons de démarrage rapide. Ce ne sont que des raccourcis pour vous aider à démarrer rapidement. Vous verrez également un sélecteur de mode. Il s'affiche actuellement rapidement. Il s'agit du sélecteur de modèle dont nous venons de parler. Cliquez dessus pour passer de Fast Thinking ou Pro en fonction de vos besoins. Sur le côté gauche, cliquez sur l'icône du menu ouvrir la barre latérale dans laquelle vous trouverez l'historique de vos discussions Vous pouvez également démarrer une nouvelle discussion à partir d'ici. Essayons de le faire. Je le garde en mode rapide pour ce chat, car je vais poser une question simple. Je commence le cours sur les Gémeaux en fonction de la date d'aujourd'hui. Quelles sont les trois dernières mises à jour majeures publiées par Google pour l'écosystème Gemini ? Je demande à Gemini de faire une recherche sur le Web pour les vérifier et les résumer pour moi. Appuyons sur Soumettre. Notez que les Gémeaux ne répondent pas simplement de mémoire. Il sort et effectue des recherches sur le Web en temps réel, puis m' apporte les résultats pertinents pour aujourd'hui lorsque j' enregistre ce didacticiel. Voici les trois modifications les plus récentes introduites par Gemini le mois dernier Et, bien sûr, nous allons en parler ici dans le cours. Dans la section suivante, nous allons utiliser tout ce que nous venons de configurer ici, en commençant par la rédaction d' une bonne invite. Je t'y verrai. 5. Donner de meilleurs résultats à Gemini : section Intro: Bienvenue dans la nouvelle section consacrée à l'ingénierie rapide. C'est dans cette partie du cours vous acquérez une compétence qui rend chaque outil d'IA plus utile : comment rédiger des instructions qui vous donnent constamment d'excellents résultats Nous allons commencer par définir ce qu'est une invite, ce que signifie une invite et comment ingénierie rapide s'inscrit dans le contexte global. Ensuite, nous examinerons deux modes. n'y a aucune invite dans le chat ni dans les instructions de production lorsque vous concevez des instructions destinées à être réutilisées. Ensuite, je vais vous expliquer une formule d' incitation simple Vous pouvez l'utiliser pour presque tout. Vous vous entraînerez également à formuler des instructions itératives, à vous appuyer sur des réponses antérieures et à améliorer le résultat étape par étape Vous apprendrez à vous guider à l'aide d'exemples, à demander le format de sortie exact que vous souhaitez et à travailler avec des fichiers et des pièces jointes. Et bien entendu, nous utiliserons des instructions multimodales. Man et votre invite peuvent inclure du texte, des documents, des captures d'écran et des liens. À la fin de cette section, vous serez en mesure d' utiliser ces compétences d'incitation dans le cadre de tâches réelles liées au travail ou à des projets personnels. Commençons 6. Qu'est-ce qu'une invite ? Invitation, ingéni: Tout le monde Pense à la dernière fois que tu as posé une question à quelqu'un. La façon dont vous avez formulé cette question a probablement influencé la réponse que vous avez reçue C'est exactement ce à quoi nous assistons aujourd'hui dans le monde de l'IA. Nous allons commencer par décrire trois termes clés essentiels à la communication avec les systèmes d'IA. Qu'est-ce qu'une invite exactement ? Qu'entendons-nous par « inviter » ? Et comment l'ingénierie rapide permet-elle de réunir tous ces éléments ? Nous explorerons également cette distinction entre chat et les messages d'entreprise. Commençons. Une invite est l'entrée que vous donnez à une IA, vos instructions, ce que vous voulez et le contexte que vous fournissez. Du texte, des fichiers, des images, des liens, des exemples ou des données. Considérez-le comme le moteur de la réponse de l'EI. L'incitation est l'acte d' écrire ces instructions. Il s'agit de l' activité générale qui consiste à interagir avec les modèles d'IA et à leur donner des instructions. Il s'agit du processus de communication avec le modèle. L'ingénierie rapide est une approche plus spécialisée et systématique pour créer et affiner des instructions. Cela implique de comprendre le raisonnement du modèle, tester et d'itérer selon les instructions et de prendre en compte les cas He Pense à ça comme à la cuisine. Une invite, c'est comme une recette unique. Promptin ressemble à la cuisine en général, et l'ingénierie rapide, c'est comme être un chef professionnel qui développe et teste systématiquement des recettes en tenant compte des ingrédients, équipement, des préférences des utilisateurs, etc. Maintenant, il existe deux principaux types d'instructions que vous devez connaître instructions personnelles et les instructions de production ou d'entreprise Les suggestions personnelles sont ce que la plupart des gens font dans un chat. Vous rédigez une demande, l'IA répond et vous pouvez continuer à l'affiner par le biais d'une conversation. C'est flexible et informel. Si votre premier message n'est pas parfait, ce n'est pas grave. Il vous suffit de faire un suivi, de clarifier et d'itérer. Par exemple, demander à N AI de vous aider à rédiger un e-mail, à réfléchir à des idées ou à résumer un document dans l'interface de discussion C'est une incitation personnelle. instructions de production ou d'entreprise, en revanche, concernent la conception d'instructions destinées à être réutilisées par vous-même, par une équipe ou dans le cadre d'un produit ou d'un flux de travail L'objectif n'est pas d'obtenir une seule bonne réponse, mais aussi d'obtenir des résultats cohérents sur de nombreuses séries et de nombreuses entrées. Par exemple, imaginez un assistant de support client sur le site Web d'une entreprise. Il doit répondre de manière fiable à des milliers de questions des clients, y compris aux entrées MC, telles que les fautes de frappe, les demandes imprécises ou les informations manquantes Dans ce contexte, les instructions doivent être plus structurées, plus prévisibles et plus fiables C'est pourquoi les instructions de production incluent généralement des règles claires, format de sortie plus strict et davantage de garde-fous, car elles sont conçues pour fonctionner à plusieurs reprises, et non une seule En d'autres termes, les instructions personnelles ou les instructions par chat vous aident à obtenir d' excellents résultats en premier, tandis que les instructions de production vous aident à obtenir des résultats fiables Pourquoi parle-t-on tant de cette distinction entre incitation personnelle et incitation à la production Parce que la façon dont vous rédigez et affinez les instructions change en fonction du paramètre Si vous recherchez des informations supplémentaires sur les instructions, vous trouverez souvent des conseils conçus pour une utilisation en production, instructions qui doivent fonctionner de manière fiable pour de nombreux utilisateurs, nombreuses entrées et de nombreux cas particuliers. C'est très utile lorsque vous créez des flux de travail reproductibles ou que vous intégrez l'IE dans un produit Mais si votre principal cas d'utilisation consiste simplement utiliser une IA dans un chat pour obtenir de l'aide pour le moment, vous n'avez pas besoin de trop compliquer alors gardez cette distinction à Dans ce cours, nous nous concentrerons principalement sur les instructions personnelles dans une interface de chat Maintenant que nous sommes sur la même longueur d'onde en ce qui concerne la terminologie, passons à l' aspect pratique de l'incitation personnelle Allca lors de la prochaine conférence. 7. Comment parler à Google Gemini IA : les éléments constitutifs d'une invite efficace: Tout le monde. Bienvenue à notre première conférence sur les messages instantanés. Ici, vous apprendrez comment créer et affiner des invites pouvant être utilisées dans l'interface de chat Commençons. Lorsque vous discutez avec un ami, vous n'utilisez pas de modèles rigides ni de structures formelles. Vous avez une conversation fluide et naturelle. Le même principe s'applique à l'envoi de messages par chat avec des modèles d'IA Cependant, il arrive qu' un peu de structure puisse nous aider à obtenir de meilleurs résultats et rendre une invite plus efficace qu'une autre. Passons donc en revue les ingrédients clés d'un prompt efficace. La partie centrale de chaque invite est l'intention ou la tâche principale. Cela peut prendre la forme d'instructions, telles que la rédaction d'un e-mail de cinq paragraphes pour présenter une nouvelle application de productivité aux propriétaires de petites entreprises, accent sur ses fonctionnalités permettant de gagner du temps. Considérez les instructions comme la tâche que vous souhaitez que le modèle exécute. L'intention peut également prendre une autre forme : quelles étapes dois-je suivre pour créer un profil Linkin convaincant Ou comment structurer un plan d'affaires pour une idée de démarrage ? Lorsque vous rédigez une tâche, votre objectif est d'être clair et précis quant à ce que vous souhaitez accomplir. Écrire quelque chose comme « Aidez-moi à faire une présentation » ne suffira pas pour obtenir un document de haute qualité que vous pourrez présenter en toute confiance à votre patron, collègues ou à vos investisseurs En règle générale, n' oubliez pas que toute personne n'ayant aucune connaissance spécifique de votre sujet doit être capable de comprendre votre demande et de l'exécuter. S'ils ne savent pas comment suivre vos instructions, le système d'assurance-emploi le sera également. Ne partez pas du principe qu'il contient des informations contextuelles sur votre tâche, telles que la manière dont les résultats seront utilisés le public cible À quoi ressemble une tâche réussie ou une liste de points que vous n'aborderez pas. Vous devez fournir vous-même le contexte ou les détails de la tâche. Par exemple, si vous souhaitez créer une présentation, incluez des informations sur le nombre de diapositives, le but de la présentation les principaux sujets à aborder. Voici un exemple d'invite bien conçue. Créez une présentation de sept diapositives sur le thème de l'image de marque personnelle. Indiquez ce que c'est, les grands compteurs, les composants clés et les étapes à suivre pour développer votre marque. Ou autre exemple, expliquez comment rédiger un e-mail convaincant en cinq étapes simples. Les instructions doivent couvrir élaboration et l'engagement de la ligne d' objet, la structuration claire de l'e-mail et l'utilisation d'un ton professionnel Simplifiez le processus suffisamment pour que tout le monde puisse suivre, même sans expérience préalable en rédaction officielle. Vous pouvez fournir un contexte, non seulement pour la tâche elle-même, mais également pour le ton que vous souhaitez utiliser. Par exemple, adoptez un ton de conversation qui concilie professionnalisme et accessibilité Vous pouvez également définir des règles ou des contraintes que le système IE doit suivre. Par exemple, dans le guide de rédaction d'e-mails dont nous venons de parler, vous pouvez ajouter : lorsque votre message implique des allégations factuelles telles que vous pouvez ajouter : lorsque des statistiques, événements actuels, les caractéristiques du produit, informations juridiques ou médicales ou tout autre élément pour lequel la précision est vraiment importante, deux ingrédients supplémentaires peuvent améliorer considérablement le résultat. Le premier est le reality check, également appelé grounding. C'est à ce moment-là que vous le dites à l'IE. Ne vous contentez pas de paraître confiant, soyez vérifiable. Vous pouvez donc ajouter une règle comme si vous faites des allégations factuelles, citez des sources et me dites ce dont vous n' êtes pas sûr, le deuxième ingrédient est le raisonnement. De nombreux sujets changent rapidement : outils, fonctionnalités tarifaires, politiques, meilleures pratiques. Il est donc utile de dire à l'IE quelle fenêtre horaire utiliser. Par exemple, utilisez les sources des 12 derniers mois, sauf si toutes les ressources sont requises. Voici à quoi cela ressemble lorsque vous ajoutez les deux à une invite. Ces deux ajouts sont particulièrement utiles lorsque vous utilisez l'IA pour la recherche ou la prise de décision, pas seulement pour la rédaction, car ils poussent la réponse à une réponse claire sur ce qui est prouvé, ce qui est actuel et ce qui est incertain. Une autre façon d'améliorer votre invite consiste à attribuer un rôle spécifique lors de l'exécution d'une tâche. C'est ce que l'on appelle également l'invite à jouer un rôle. jeux de rôle aident les modèles d' IA à adopter les nuances de points de vue spécifiques, améliorant ainsi la pertinence et la qualité de leurs réponses. Par exemple, agissez en tant qu' assistant exécutif chevronné avec plus de 15 ans d'expérience la gestion de correspondance commerciale de haut niveau ou prétendez être un rédacteur professionnel devenu consultant en rédaction de courriels. Vous pouvez aller encore plus loin en fournissant un contexte au public en plus du rôle. Par exemple, remarquez comment l'IE adapte les exemples de choses à faire et ne pas faire pour les rendre pertinents pour les professionnels techniques C'est plutôt incroyable. Et si vous vous sentez dépassé par l'idée de créer un message aussi détaillé, ne vous inquiétez pas L'avantage de travailler dans une interface de chat réside dans le fait que vous n' avez pas besoin de concevoir une invite parfaitement réfléchie pour démarrer la conversation. Vous pouvez commencer par une question ou une tâche générale et l'affiner en dialoguant avec le modèle de l'IE. Cette approche itérative vous permet de clarifier vos besoins et d'améliorer les réponses que vous recevez au fil du temps. Nous parlerons plus détail des instructions interactives dans notre prochaine vidéo, et pour l'instant, résumons ce nous avons parlé dans cette conférence 8. S'appuyer sur les réponses de Gemini : invite itérative: Bienvenue à tous. Si, après avoir visionné la conférence précédente, vous avez l'impression que créer une bonne invite est une tâche ardue et que vous devez vous transformer en ingénieur rapide pour réussir dans ce travail Voici un secret utilisé par les experts. Considérez les questions posées comme une conversation ou un processus en plusieurs étapes, non comme une question ponctuelle Tout comme vous pouvez clarifier itinéraire dans une nouvelle ville avec un local, vous pouvez affiner vos instructions en fonction des réponses de l'IE Passons en revue un exemple concret d'invite itérative pour voir comment cela fonctionne Supposons que nous aimerions que l'IE nous aide à créer une proposition commerciale pour un service mobile de toilettage pour chiens Première étape, l'invite initiale peut être assez générale, comme créer grandes lignes d'une proposition commerciale pour un service mobile de toilettage pour chiens Dans un deuxième temps, nous affinons ou affinons notre demande initiale en disant quelque chose comme : «   prenez les grandes lignes, vous créez et développez la section d'analyse de marché, concentrez-vous sur les données démographiques et la concurrence dans les zones urbaines ». À la troisième étape, nous demandons des informations spécifiques. Par exemple, développez maintenant la section des projections financières, incluez les coûts de démarrage, les dépenses d'exploitation mensuelles et les prévisions de revenus pour la première année. Nous pouvons répéter les étapes deux et trois plusieurs fois en fonction de notre degré de satisfaction à l' égard des réponses. Parfois, les instructions itératives sont encore plus puissantes lorsque vous travaillez sur quelque chose qui doit être précis, et pas seulement bien écrit Par exemple, première étape , commencez au sens large. Donnez-moi un aperçu du marché du toilettage mobile pour chiens en milieu urbain Deuxième étape, demandez des hypothèses et des preuves. Dressez la liste des principales hypothèses que vous faites. Si vous mentionnez des faits ou des chiffres, dites-moi d'où ils viennent et signalez tout ce dont vous n' êtes pas sûr. Troisième étape, contre-vérifier. Maintenant, vérifiez votre propre réponse. Quelles sont les parties les plus susceptibles d'être erronées ou obsolètes ? Que vérifieriez-vous en premier ? De cette façon, vous ne vous contentez pas de peaufiner le libellé, vous améliorez la fiabilité vous améliorez la fiabilité du contenu au fur et à mesure. Veuillez noter que tout comme un chef de projet compétent s'appuie sur les discussions et décisions précédentes, IA basée sur le chat garde le contexte tout au long de votre conversation. Cela signifie que vous pouvez vous référer aux parties précédentes du chat et en tirer parti au lieu de tout répéter à zéro. Vous pourriez donc vous demander quelque chose comme, sur la base de la stratégie marketing dont nous avons parlé plus tôt dans cette discussion, poursuivons sur cette lancée, mais concentrons-nous sur familles des banlieues dans les zones où les options de toilettage sont limitées Bien entendu, si vous estimez que votre conversation ne va pas dans le bon sens, vous avez toujours la possibilité de recommencer à zéro et de recadrer la première question La dernière étape du processus itératif consiste généralement à demander à l'IA de peaufiner la réponse Sinon, vous pouvez demander à fournir des commentaires sur l'ensemble du contenu. Dans ce cas, la proposition commerciale, en se concentrant sur la manière dont elle peut être encore améliorée. Vous pouvez ensuite inclure ces modifications dans la version finale du document. Cette approche étape par étape vous permet revoir et d'affiner le résultat à chaque étape, apporter des ajustements en fonction des résultats intermédiaires, garder le contrôle sur le produit final et de renforcer progressivement la complexité. Considère ça comme une sculpture. Vous commencez par la forme de base, puis vous affinez progressivement les détails jusqu'à obtenir exactement ce que vous voulez. Et c'est tout pour la vidéo. Résumons les points essentiels que nous venons d'aborder. 9. Faire de Gemini un véritable personnage :: Bonjour à tous, et bon retour. Parfois, lorsque vous parlez à un assistant IA, vous avez l'impression de repartir de zéro à chaque fois. Vous pouvez écrire l'invite parfaite tout en obtenant une réponse générique car Gemini n'a aucune idée de qui vous êtes ni de la façon dont vous travaillez. Dans cette vidéo, nous allons voir comment faire en sorte que Gemini fonctionne comme vous travaillez Il existe trois niveaux de personnalisation que vous pouvez utiliser pour personnaliser votre expérience Le premier niveau est constitué d'instructions personnalisées de base. Vous dites aux Gémeaux comment vous vouliez vous comporter à chaque fois. Soyez toujours professionnel, formatez toujours les réponses sous forme de puces. Tout ce qui fonctionne pour vous vous évite de vous répéter à chaque demande. Le niveau deux est la mémoire de discussion intermédiaire. C'est là que Gemini commence à se souvenir des faits et des préférences de vos conversations précédentes, afin que vous puissiez reprendre exactement là où vous vous êtes arrêté. Et le niveau trois est l'intelligence personnelle la plus avancée. Cela permet à Gemini de faire le lien entre l'ensemble de votre écosystème Google, votre GML, vos photos, YouTube et même votre historique de recherche Imaginez au lieu de passer des heures à jouer à un week-end. Vous dites simplement que les Gémeaux planifient un voyage pour ce samedi en fonction de mon passe-temps favori Personal Intelligence découvre que vous avez récemment acheté du matériel de randonnée à Jimel, extrait vos photos de randonnée préférées de Google Photos, vérifie l'historique de vos visites sur YouTube pour trouver des guides locaux et suggère un sentier spécifique, sachant exactement quel niveau de difficulté vous convient Avant de commencer, il convient de noter que l'intelligence personnelle est toujours en cours Nous allons donc nous concentrer sur les deux premiers niveaux aujourd'hui. De plus, ces fonctionnalités de personnalisation font partie de l'abonnement Google AI Pro Si vous n'avez pas encore effectué la mise à niveau, consultez notre conférence où je vous ai montré comment y accéder gratuitement. Passons à la démo. Nous commençons par accéder à l'application Web Gemini à l'adresse gemini.google.com Je me suis déjà connecté à mon compte P. Ensuite, regardez en bas à gauche de votre écran et cliquez sur l'icône Réglages en forme de roue dentée. Dans ce menu, sélectionnez le contexte personnel. Le premier set s'appelle tes meilleurs chapeaux avec Gémeaux. Lorsqu'il est activé, comme sur mon écran ici, Gemini apprend de votre histoire pour mieux vous comprendre au fil du temps Lorsque je viens d'activer ce paramètre, voici ce que Gemini m' a suggéré Il résumait correctement tout ce sur quoi j'ai travaillé récemment. Et d'ailleurs, si vous souhaitez avoir une conversation privée qui n'est pas stockée dans l'historique des discussions, vous pouvez utiliser le chat temporaire. Vous voyez qu'il est disponible ici en haut à gauche de l' écran. Alors, cliquons dessus. Nous voyons la même interface que celle que vous connaissez déjà. Laisse-moi te demander quelque chose. J'utilise un modèle rapide car il ne s'agit que d'une question très rapide. Voici donc les suggestions. Ils sont plutôt bons. Et puisque nous étions en train de goûter au chat temporaire, laissez-moi consulter l'historique de mes discussions. Vous voyez que nous n'avons rien à voir avec un blanc plat ici. Permettez-moi d'actualiser la page pour m'assurer que cette discussion temporaire ne sera pas enregistrée dans l'historique des discussions. Oui, tout va bien. Mais en même temps, nous avons également perdu cette conversation. Bien, revenons aux paramètres, au contexte personnel Le deuxième Google ici s'appelle Vos instructions pour les Gémeaux Nous voyons qu'ils sont également actifs par défaut pour ajouter une nouvelle instruction, cliquant sur AD. Et ici, nous pouvons inclure toute information concernant votre comportement, style de communication personnel, préférences que vous souhaitez partager avec Gemini Voici donc mon message. J'aimerais donc diviser les instructions en deux parties. Tout d'abord, je dis à l'IE ce que je fais. Vous voyez ici que j'ai partagé mon rôle d'éducateur et de consultant, en fournissant un peu de contexte sur ce que je fais dans ces deux rôles Ensuite, j'ai expliqué à quel point j'aimais travailler. Sauvegardons ces instructions en cliquant sur le bouton Soumettre. Tout va bien. Enfin, pour voir tout ce que Gemini a stocké, revenez aux paramètres, puis cliquez sur Activité Voici la liste de toutes les activités que vous avez récemment eues avec l'application Gemini Vous pouvez supprimer manuellement des discussions spécifiques au cas où vous n'en auriez pas besoin pour certaines raisons, et vous pouvez également définir un calendrier de suppression. Vos données sont donc effacées tous les deux ou trois mois. Par exemple, je peux choisir une durée ici. Je vis 18 mois, ce qui est une période raisonnable pour me débarrasser des vieilles conversations, et je clique sur Suivant. Parfait. Et c'est tout pour ce tutoriel. Vous savez maintenant comment personnaliser Gemini pour qu'il fonctionne exactement comme vous le souhaitez Et Alca dans la vidéo suivante. 10. Comment partager des fichiers et d'autres contenus avec Google Gemini AI: Bonjour à tous, et bon retour. Dans les conférences précédentes sur l'ingénierie rapide, nous avons beaucoup parlé de la manière de formuler vos instructions et des informations à inclure. Mais outre les instructions, vous devez parfois fournir à l'IE sources tels que des documents, des feuilles de calcul, des captures d'écran ou des PDF, afin qu'elle puisse les examiner et les analyser Voyons comment cela fonctionne. Vous pouvez fournir des informations provenant de documents et d'images à Gemini de deux manières principales : en collant le texte directement dans le chat ou en joignant le fichier entier à la Ainsi, la première option consistant à coller le texte fonctionne bien lorsque vous n'avez besoin d'aide que pour un fragment spécifique de votre document Par exemple, voici mon CV, et je souhaite obtenir des commentaires sur une seule section du document Je peux donc simplement le copier, coller dans le chat, puis donner les instructions à Gemini J'ai donc répondu qu'il s'agissait d' un extrait de mon CV, et j'ai demandé à Gemini si ces compétences étaient pertinentes pour un poste de responsable produit dans une start-up Fintech Et voici la réponse. Mais vous souhaitez souvent que Gemini travaille avec l'ensemble du document, qu' un long PDF ou d'une feuille Gemini peut gérer presque tous les types de fichiers courants , des documents Word aux fichiers CSV, en passant photos et même les vidéos Pour joindre le fichier, cliquez sur l'icône plus sur le côté gauche de la barre de discussion. Vous pouvez choisir un fichier depuis votre appareil, depuis votre Google Drive, depuis Google Photos. Prenons donc un exemple. J'ai besoin d'idées pour cuisiner pour le dîner. Ce que je vais faire, c'est télécharger plusieurs photos des ingrédients que j'ai dans mon frigo. Voici les ingrédients que j'ai. Je vais demander à Gemini quelles sont les trois recettes simples pour le dîner que je peux préparer en moins de 20 minutes. Et voici les recommandations fournies par Gemini. Vous voyez qu'il a réussi à identifier les ingrédients sur la base des photos. Nous voyons ici la capacité des Gémeaux à reconnaître des objets et à appliquer un frisonin créatif Ensuite, essayons le document. Supposons que vous ayez reçu un document de facture d'électricité complexe. Vous pouvez donc télécharger ce PDF sur Gemini et lui demander s'il peut résumer les principales accusations. Essayons ça. Je vais revenir au même chat, cliquer sur l'icône plus, puis choisir les fichiers de mon Drive local. Et voici mon message. Utilisons le modèle rapide ici car la demande devrait être assez simple, et voyons quelle réponse nous allons obtenir. Oui, très bon résumé correct des frais, ainsi que de ma consommation de données. Tout va bien ici. Bien, essayons autre chose et soumettons différents types de documents à Gemini pour voir s' il peut vraiment fonctionner avec différents fichiers J'ai un PDF avec mon itinéraire de vol pour mon prochain voyage à Phuket. Et voici un guide de voyage avec quelques informations concernant les visites. Ça, je peux le faire pendant que je suis à Phuket. C'est bon. Cette démo prend un certain temps. Donc, ce que je vais faire, c'est arrêter cette réponse. Je vais copier cette invite et ouvrir une nouvelle discussion. J'ai inclus le même message, et ici, passons à la façon de penser. Parce que j'ai ici un document PDF assez complexe. J'ai également des visuels avec des dates concrètes que Gemini doit analyser et comparer avec les dates de ce document Il serait donc peut-être préférable de passer à un modèle plus intelligent. Essayons ça. Maintenant, nous avons obtenu le résultat presque immédiatement. Alors lisons ce que les Gémeaux nous disent. Il reconnaît toutes les informations contenues dans les documents que j'ai fournis et m'a également donné de bonnes recommandations sur ce que je peux faire juste après mon arrivée à destination. C'est là que nous voyons Gemini agir en tant que cardinateur personnel reliant différents types de fichiers Et n'oubliez pas que même si Gemini peut lire et analyser ces fichiers pour générer des résumés, des tableaux ou des recommandations, il ne modifiera pas réellement le fichier d'origine lui-même Bien, passons à notre démo, disons que j'ai un fichier audio que je veux que Gemini analyse, comme toujours en cliquant sur le bouton Plus Ensuite, je sélectionne dans mon fichier audio, et voici mon message. Peux-tu résumer les points essentiels de cet audio ? Je vais continuer à utiliser mode réflexion ici, car il s' agit d'une tâche plus complexe que de simplement poser une question rapide. Et voici le résumé. Il s'agit du résumé correct fourni par Gemini. Je peux le confirmer car il s'agit de l'enregistrement que j'ai préparé moi-même pour mon autre cours. Excellent travail Gemini. Et permettez-moi également de vous montrer comment cela peut fonctionner avec des vidéos. J'ai ce lien vers la présentation principale de Google. Et comme je travaille actuellement sur le cours Gemini, je veux que Gemini m'aide à trouver tous les moments où les intervenants parlent de l' application Gemini, Appuyons sur Entrée et voyons ce que Gemini va suggérer. Voici l' analyse détaillée de cette vidéo. Et ce que j' aime vraiment ici, c'est qu' il inclut les codes temporels. Par exemple, nous voyons ici que Gemini a mentionné le contexte personnel, et qu'il incluait ce code temporel spécifique dans lequel l'un des orateurs parlait de cette fonctionnalité Donc, si je souhaite revoir cette conversation, je peux simplement cliquer sur ce code temporel. Je vais être redirigé vers cette partie de la présentation. Et c'est tout pour cette conférence. Résumons brièvement ce que nous avons appris ici. La plupart des modèles d'IA modernes acceptent les formats de fichiers courants, notamment les PDF, les documents Word, les fichiers Excel, les CSV, les images et les fichiers texte Les fichiers peuvent être téléchargés à l'aide d'un bouton de téléchargement ou icône de pièce jointe sur l'interface de discussion. Vous devez donner des instructions claires sur ce que vous voulez que l'IA fasse avec les fichiers. fait d'être précis dans vos demandes permet d'obtenir de meilleurs résultats. Vous pouvez télécharger plusieurs fichiers et demander au modèle d'IA de les comparer ou de les analyser ensemble. L'IA ne modifie généralement pas directement votre fichier, mais elle peut générer un contenu amélioré. Vous pouvez le copier à nouveau dans votre document. Très bien, et je te verrai lors de la prochaine conférence. 11. Utiliser des exemples dans vos invites: Tout le monde, et bienvenue à la nouvelle conférence où nous continuerons à parler de la manière de communiquer avec systèmes d' assurance-emploi et de ce qu'il faut inclure dans votre message. Jusqu'à présent, nous avons abordé plusieurs éléments qui peuvent être inclus dans une invite, une tâche ou ce que vous souhaitez accomplir, suivis des détails ou du contexte spécifiques et des règles nécessaires pour effectuer la tâche ou répondre à une question. Vient ensuite le contexte des rôles, un rôle spécifique que l'IE jouera lors de l' exécution d'une tâche. Vous pouvez également éventuellement présenter le public cible de votre tâche. Enfin, nous avons indiqué que vous pouvez partager du contenu supplémentaire en joignant des documents à votre conversation ou en incluant le texte comme donnée d'entrée directement dans le chat et en respectant l'ordre des composants dans votre invite. L'ordre est important pour certains éléments, mais pas pour d'autres. Par exemple, il est recommandé d'inclure le contexte RL plus tôt dans l'invite, car données d'entrée peuvent ne pas être nécessaires en fonction de la tâche, et leur ordre est également flexible. Mais en général, si vous vous en tenez à l'ordre indiqué dans les diapositives de présentation du cours, ce sera un bon point de départ pour une invite efficace. OK, introduisons un autre élément d'incitation. Des exemples. Les exemples, également connus sous le nom de photos, constituent des démonstrations qui orientent le modèle d'IA générative sur le type de résultat que vous recherchez, y compris le format de réponse et ce que vous souhaitez éviter. Vous avez peut-être entendu parler de termes tels que un coup » ou « quelques coups » qui vous incitent à agir. Cela fait référence à l'utilisation d'un ou de plusieurs exemples dans votre description rapide. Pour les demandes de chat, les exemples montrent généralement le ton. Par exemple, le formel contre l'informel, sérieux par rapport au calendrier, empathie par rapport à la réalité, et le style tel que la longueur des phrases, les modèles de format, les puces par rapport aux paragraphes, le niveau de détail technique, de base par rapport à la terminologie avancée, etc. Passons en revue quelques exemples concrets. Tout d'abord, je vais demander à Gemini un simple e-mail sans donner d'exemple Voici donc mon message. Pour cette démo, je vais utiliser le modèle Fest. Allons-y. Cet e-mail est bien, mais il est également assez générique. Rendons-le maintenant beaucoup plus précis en montrant un exemple du ton et de la structure souhaités. Voici donc mon autre message. J'ai donc la même instruction au début, puis j'ai fourni un exemple référence de style mentionnant le ton, la longueur de la phrase et la structure que j'aimerais que Gemini utilise Exécutons cette deuxième version. Maintenant, si nous comparons cette nouvelle réponse à la version initiale, nous constatons qu'elle semble plus humaine. Les phrases sont plus courtes et la structure est plus proche de ce que nous avons montré dans l'exemple. Et pendant que nous en sommes à l'exemple de l'e-mail, permettez-moi de vous montrer rapidement ce que Gemini peut faire ensuite avec cet e-mail Il s'est avéré que vous n'avez pas besoin de copier-coller l'e-mail dans votre boîte de réception. Si vous regardez juste en dessous de la réponse, vous verrez plus d'icônes. Cliquons dessus. Et ici, vous verrez un brouillon dans l'option Gmail. Si vous cliquez dessus, Gemini ouvrira une nouvelle fenêtre et placera ce texte exact dans un véritable brouillon Gmail, que vous pourrez modifier et éventuellement envoyer à votre destinataire Essayons donc de le faire. Gemini est en train de rédiger un e-mail. Jetons un coup d'œil. Je vais cliquer sur Ouvrir Gmail. Nous constatons qu'il a bien saisi l'objet de l'e-mail. C'est le texte exact que nous avons vu dans le chat. Essayons quelque chose d'un peu plus avancé. Jusqu'à présent, nous avons utilisé des exemples pour fixer le ton et le style de réponse. Mais vous pouvez également utiliser des exemples pour définir un cadre mental. Le cadre mental ne change pas seulement les mots utilisés par les Gémeaux. Cela change la logique qu'il utilise pour résoudre votre problème. Ainsi, au lieu de rédiger une longue liste de règles, comme être pratique ou ne pas être trop académique, vous pouvez simplement montrer aux Gémeaux une photo ou un exemple du point de vue que vous souhaitez adopter Allons-y donc étape par étape. Tout d'abord, je vais ouvrir un nouveau chat. Et là, j'aimerais passer à un modèle pro. Et attention, si vous avez un forfait gratuit, vous aurez toujours accès au modèle pro. Vous voyez, j'utilise mon compte gratuit et je peux toujours sélectionner ce modèle. Mais vos limites d'utilisation peuvent être inférieures à celles des forfaits payants. Je reviens donc à mon compte que j' utilise pour cette démo. Voyons d'abord comment Gemini gère les demandes sans aucun cadrage Je vais vous poser une question sur un sujet populaire : le personal branding. Je souhaite en savoir plus sur le personal branding. Comment dois-je commencer ? Appuyons sur Entrée. Si cela nous intéresse, nous pouvons examiner le processus de pensée des Gémeaux Vous voyez, ce sont les étapes qu'il a prises pour nous donner cette recommandation. Tout est correct, mais c'est très théorique. Cela semble être une longue liste de choses à faire avant même de commencer. Utilisons maintenant un exemple unique pour passer de la logique à un cadre mental pratique. Je veux que Gemini agisse comme un entraîneur qui privilégie les petites victoires immédiates par rapport aux grandes théories Voici donc ma nouvelle invite, dehors de mes instructions d'origine. J'ai également inclus un exemple de logique pratique. Entrons et voyons ce que Jimmy et moi pouvons suggérer ici. Tu vois ça ? Parce que j'ai qualifié la logique de pratique et que j'ai montré à Gemini l'exemple de Hello World, cela ne me donne plus de liste de lecture Il m'indique littéralement les recommandations pratiques, les choses que je peux faire dès maintenant. Alors maintenant, Gemini reflète la façon de penser, pas seulement le ton et le style, comme dans notre premier D'accord. Et prenons un autre exemple rapide. Cela est particulièrement utile lorsque vous effectuez des recherches. Supposons que vous souhaitiez que Gemini réponde non seulement à la question, mais aussi qu'il montre d'où viennent les informations, vous pouvez inclure un exemple illustrant vous pouvez inclure un exemple illustrant le format souhaité Par exemple, vous pouvez écrire une invite complète comme celle-ci. Et ce qui est important, c'est que j'ai également fourni des règles pour les Gémeaux. Pour les cas, il ne peut pas trouver de source fiable pour une réclamation. Allons-y. Ce type d'exemple rend le résultat beaucoup plus structuré et plus fiable car vous montrez le format exact, que vous voulez comme preuve. C'est bon. Hormis l'affichage d'une ou de quelques photos, il existe une autre technique utilisant des exemples interactifs Les exemples interactifs diffèrent des exemples classiques dans la mesure où ils créent une expérience d'apprentissage dynamique, dans laquelle chaque exemple s'appuie sur connaissances ou des commentaires antérieurs, tandis que les exemples réguliers sont des démonstrations d'étude. Les exemples interactifs impliquent une participation active et une itération. Voici comment fonctionnent les exemples interactifs. Vous fournissez un exemple de version initiale. L'IA fournit des commentaires et des suggestions spécifiques. Vous créez une version améliorée en fonction de ces commentaires. L'IA analyse les améliorations et suggère d'autres améliorations. Vous pouvez répéter l'opération si nécessaire. L'essentiel est que chaque itération s'appuie sur les commentaires de la version précédente, créant ainsi un processus d' amélioration collaboratif OK, super. Et c'est tout pour cette vidéo Passons rapidement en revue ce que nous avons appris ici. Et je vous verrai dans la prochaine vidéo où nous aborderons une autre technique d'incitation 12. Spécifier le format de sortie dans Gemini: Tout le monde. Nous avons presque fini de décrire les ingrédients clés d'un bon prompt. Il y a encore un autre élément que vous pourriez trouver intéressant d'inclure dans vos informations rapides sur le format que vous souhaitez donner à la réponse de l' IA. Parlons-en maintenant. N'oubliez pas que dans notre première conférence sur l'incitation, nous avons dit qu'il est important d'inclure des informations concernant le plan de base ou la liste de points Vous ne l'aborderez pas comme contexte pour votre tâche. Il s'avère que vous pouvez également spécifier vos préférences de mise en forme pour la réponse, ce qui peut aider à organiser les informations de manière plus efficace. Ces informations peuvent ne pas être nécessaires en fonction de la tâche, mais si vous les incluez, il est préférable de les indiquer vers la fin de votre invite plutôt qu'au début Passons en revue quelques exemples de formatage que vous pouvez demander. Vous pouvez demander des styles de formatage spécifiques. Par exemple, si vous avez besoin d'un rapport commercial, vous pourriez dire : «  Veuillez le formater comme un rapport professionnel avec des en-têtes, des sous-titres et de courts paragraphes clairs L'IA structurera les informations en conséquence, afin de les préparer à un usage professionnel. Lorsque vous travaillez avec des données ou des analyses, vous pouvez demander des tableaux ou des mises en page spécifiques Au lieu d'un mur de texte, vous pourriez dire présenter la comparaison de ces trois produits sous forme de tableau clair avec les fonctionnalités dans la colonne de gauche. Cela facilite la compréhension et l'utilisation des informations complexes . Et voici quelques autres formats et modèles particulièrement utiles pour la recherche ou la prise de décision. Tableau comparatif Donnez-moi un tableau comparatif de ces options avec des colonnes pour les principales fonctionnalités, les avantages, les inconvénients et les quatre meilleures. Cartographie des sources, dressez la liste des sources que vous avez utilisées et expliquez brièvement ce que chaque source soutient dans votre réponse. Les faits contre les interprétations. Séparez votre réponse en deux sections : les faits, les déclarations vérifiables et les interprétations, votre raisonnement, vos hypothèses ou vos recommandations Vous pouvez demander une mise en forme de markdown spécifique. L'IA peut utiliser du texte en gras, italique, des en-têtes et des puces selon les besoins Il vous suffit de demander les points clés en gras ou les termes importants en italique, et la réponse sera formatée comme vous l'avez demandé Vous pouvez organiser vos conseils à l' aide de points pour clarifier l'astuce principale, les informations complémentaires et les autres détails Enfin, n'oubliez pas que vous pouvez toujours demander de reformater la réponse si la première version ne correspond pas exactement à vos besoins C'est parfaitement normal de dire : pourriez-vous réorganiser ces informations sous forme de liste numérotée ? Vous pouvez également le décomposer en paragraphes plus courts pour une meilleure lisibilité météo OK, et c'est tout pour cette brève conférence. Récapitulons les points clés que nous venons d'aborder. Spécifiez toujours le format souhaité dès le départ pour obtenir la réponse la plus utile Vous pouvez demander des structures spécifiques telles que des rapports, des tableaux ou des listes. Les tableaux de comparaison sont parfaits pour la prise de décision. Vous pouvez demander un tableau structuré avec des avantages, inconvénients et la meilleure forme. Pour les tâches de recherche, vous pouvez demander des sources et même séparer les faits des interprétations pour plus de clarté. Un modèle d'IA peut adapter son style d'écriture pour répondre à vos besoins, qu'ils soient occasionnels ou professionnels. formatage Markdown permet de mettre en évidence les informations importantes Vous pouvez demander un reformatage si la première réponse n'est pas tout à fait correcte Des instructions de mise en forme claires permettent réponses plus utiles et plus exploitables Et c'est tout pour cette vidéo, et comme toujours pour AlCa dans la suivante 13. Suivi : Choix du bon modèle et réflexions avec Gemini ming: Tout le monde. Jusqu'à présent, nous avons exploré Brampton de manière isolée. Il est temps de réunir ces éléments dans un flux de travail complet de bout en bout. En cours de route, je vais vous montrer quelques packs de productivité disponibles dans Gemini, exemple comment vérifier l' exactitude des réponses et les exporter directement vers Google Docs Nous allons explorer deux scénarios qui sont de loin l' un de mes préférés lorsqu'il s'agit de travailler avec Gemini Il s'agit du brainstorming et de l'obtention de commentaires. Mais avant de commencer avec notre premier scénario, parlons un peu de la manière de choisir votre modèle d'IA. Vous m'avez vu passer de l'un à l'autre tout au long de cette section de démos, et vous vous demandez peut-être, alors quel modèle choisir ? Et lorsque votre choix dépend de votre plan d'abonnement. Si vous êtes un utilisateur payant, je vous suggère de faire de la réflexion votre choix par défaut. Sa capacité de raisonnement lui permet de passer à la vitesse supérieure, uniquement pour les tâches à faible enjeu, comme les vérifications grammaticales rapides ou les questions rapides, et de passer à professionnelle lorsque vous avez affaire à de longs documents, recherches approfondies ou à tout ce qui nécessite une concentration soutenue sur une grande quantité de contenu, c'est là qu'elle mérite sa place. Je travaille avec Gemini depuis un certain temps déjà, et c'est le meilleur flux de travail que j'ai trouvé après de nombreuses expériences Si vous êtes un utilisateur gratuit, optez pour la version rapide par défaut, car les modèles les plus avancés ont des quotas quotidiens limités sur le plan gratuit Vous devez donc faire preuve de stratégie et conserver ces crédits pour le moment où vous en aurez vraiment besoin. Passez à la réflexion lorsqu'une tâche nécessite logique approfondie ou un raisonnement en plusieurs étapes, et passez à méthode professionnelle lorsque vous travaillez sur un contenu volumineux ou que vous avez besoin d' un niveau élevé de nuance et de profondeur. Maintenant, dans cet esprit, passons à notre premier scénario de suivi du processus de brainstorming Je veux que vous imaginiez que vous êtes le directeur marketing d'une start-up très ambitieuse et imaginative spécialisée dans les technologies du sommeil appelée Snooze Nous sommes sur le point de lancer le Snooze One, le premier pilote automatique au monde de Comme vous pouvez le constater lors de notre briefing interne, ce matelas intègre tout technologie de zonage climatique analyse des rêves en passant par le moteur Vibe Sing Story Il est nécessaire de créer une campagne de lancement sur les réseaux sociaux qui fasse du sommeil intelligent un élément essentiel. Ouvrons donc Gemini pour démarrer la démo. J'ai choisi le modèle de réflexion parce que nous avons besoin d'un stratège créatif capable de gérer les nuances Et commençons notre brainstorming. Voici la première invite que je vais utiliser. Vous voyez que je présente d'abord le rôle que je veux que Gémeaux joue. J'ai ensuite inclus un peu de contexte en ce qui concerne ce que nous sommes sur le point de lancer. Notre public cible. Ensuite, j'ai chargé Gemini de suggérer des thèmes de contenu pour les tentes pour notre fenêtre de lancement de 30 jours Et permettez-moi également d'inclure le fichier PDF que vous venez de voir pour fournir encore plus de contexte à Gemini Et appuyons sur Entrée Voici les dix thèmes suggérés par Gemini C'est ce thème qui me plaît le plus. Demandons donc à Gemini d' approfondir ce thème spécifique Voici donc mon deuxième message. Et permettez-moi de préciser que je veux dix idées de coûts. Appuyons sur Entrée. D'excellentes suggestions. Et au cas où certaines d'entre elles ne vous plairaient pas, vous pouvez toujours demander à Gemini de vous suggérer dix autres idées. Alors faisons-le. Je remarque que lorsque vous le faites plusieurs fois, vous pouvez avoir de très bonnes suggestions. Essayez donc de le faire et n' utilisez pas simplement la première liste d'idées fournie par Gemini Faisons encore une itération. J'ai fait part de mes commentaires à Gemini concernant la liste d' idées qu'il a fournie Sympa. Je pense que nous pouvons continuer à travailler avec certaines de ces idées. Mais avant de commencer à écrire les scripts de notre publication ou de nos vidéos, permettez-moi de poser une autre question à Gemini Avant de passer à autre chose, je veux savoir quelles sont les tendances actuelles en matière de contenu sur les réseaux sociaux pour les lancements de produits technologiques, comme dans notre cas. Voici les tendances. Vous voyez qu'il a bien suivi l'année en cours. Et voici mon prochain message. Je vais demander à Gemini de suggérer dix identifiants de script vidéo abrégés pour la série Vibe Check Storytelling Disons que j'aimerais Instagram soit notre plateforme de prédilection. Et notez que j'ai également inclus ce PDF avec les idées de crochets viraux que je souhaite que Gemini utilise lors de la préparation de la réponse C'est ce que l' on appelle la mise à la terre. J'ancre donc la réponse d'EI dans notre style de marque spécifique afin que les scripts ne semblent pas génériques Ensuite, j'ai également fourni la structure du script et c'est tout. Appuyons sur Entrée. D'accord, nous voyons que Gemini a inclus des espaces réservés, et je veux vraiment avoir un script complet prêt pour le prompteur afin que nous puissions simplement enregistrer nous puissions Ainsi, lors du brainstorming, je commence par demander à Gemini d'explorer un large éventail d'idées, puis je peux répéter ces idées plusieurs Ensuite, je sélectionne généralement une idée qui me plaît et je demande à Gemini de me concentrer sur ce sujet et, disons, créer un article ou une histoire en rapport avec l'idée de mon choix Très bien, notre script est prêt. Je peux continuer à parler avec Gemini et demander à ajuster ce script ou à prendre une autre idée pour l'étendre Mais disons que je suis d' accord avec celui-ci, je peux en fait exporter ce script directement dans le Google Doc. Vous voyez trois points que j'entends. Si je clique dessus, je peux choisir d'exporter deux chiens, et voyons ce qui se passe. Gemini m'indique que le nouveau document est créé. Cliquez sur Ouvrir. Très sympa. Nous avons même un tableau avec des codes temporels et du texte exact que nous devons dire très cool. Et vous pouvez également voir ici des jests de Geminis pour exporter ce tableau Essayons de le faire également. Personnellement, j'aime bien exporter vers Google Docs pour ce scénario. Je pense que cela fonctionne mieux pour ce type de document, mais vous avez compris l'idée. C'est tout pour ce tutoriel et pour Alca dans le suivant. 14. Suivi : obtenir des retours avec l’IA de Google Gemini: Tout le monde. Bienvenue dans la deuxième vidéo de suivi. Explorons la possibilité de recueillir les commentaires de Gemini. Ce cas d'utilisation est l'un des premiers avec lesquels j'ai commencé. Lors de l'utilisation de l'assistant EI. J'avais l'habitude de soumettre mes documents tels que des présentations, des rapports, des CV, et de demander à l'IE de me faire part de mes commentaires afin d'obtenir un deuxième avis à ce sujet et d'apporter des améliorations. Mais Gemini a fait passer ce processus à tout autre niveau, car il est nativement multimodal, ce qui signifie qu'il peut traiter non seulement des textes, ce qui signifie qu'il peut traiter non seulement des textes mais aussi d'autres types de contenu tels que des vidéos Vous pouvez désormais obtenir des commentaires personnalisés sur vos performances réelles, pas seulement sur ce que vous avez écrit. La raison pour laquelle Gemini est si dominant ici est son énorme fenêtre contextuelle C'est la première fois que nous utilisons ce terme. Présentons-le donc. La fenêtre contextuelle est essentiellement la mémoire à court terme d'IIS. Il s'agit de la quantité de données que le modèle peut stocker simultanément dans son cerveau pour comprendre la demande. Alors que d'autres modèles peuvent avoir du mal à se souvenir de plus de quelques minutes d'enregistrement, Gemini peut traiter jusqu' à 1 million de jetons Pour vous donner une idée, cela représente environ une heure de vidéo ou des milliers de pages de texte en une seule fois. Cette énorme mémoire est exactement la raison pour laquelle tant d'utilisateurs optent pour Gemini pour l'analyse vidéo Mais ne me croyez pas sur parole . Vérifions-le. Je vais utiliser le mode réflexion pour vérifier la réclamation. Et c'est l'invite que je vais utiliser en premier. Laisse-moi appuyer sur Entrée. Si j'ai commencé par cette question, c'est parce que je veux vous montrer la fonction de réponse à double vérification. Et voici la réponse avec les détails sur les raisons pour lesquelles les professionnels passent à Gemini et pour accéder à la fonction de double vérification, cliquez sur l'icône à trois points en bas de la réponse Et ici, vous verrez une réponse de double vérification. Cette fonctionnalité utilise la recherche Google pour trouver du contenu légèrement similaire ou différent des déclarations générées par Gemini Et veuillez noter que cette fonctionnalité est spécialement conçue pour vérifier les affirmations factuelles. Il n'apparaîtra pas pour des tâches telles que l'écriture créative, le code ou des tâches similaires. Gemini a commencé à évaluer les déclarations et nous voyons ici les points verts confirmant les affirmations de Gemini Et nous pouvons même élargir cette fenêtre pour voir l'article détaillé que Gemini a utilisé pour valider cette affirmation C'est une fonctionnalité très pratique. Passons maintenant à la technique. J'ai enregistré une vidéo de moi-même lors d'un entretien avec Zoom pour un poste de responsable produit. Il s'agit d'un enregistrement d'une heure, ce qui représente une énorme quantité d'informations. C'est pour cette raison que je vais choisir le modèle pro. Mais d'abord, commençons une nouvelle discussion. Ici, je vais choisir P. Le modèle Pro est conçu avec un plafond d'intelligence beaucoup plus élevé et est supérieur pour maintenir une compréhension cohérente pendant toute une heure de tournage. Alors laissez-moi d'abord joindre la vidéo. J'ai ici dix fragments vidéo différents, et je soumets également mes instructions. J'ai commencé par confier à Gemini un rôle de coach en leadership exécutif J'ai fourni le contexte de la vidéo, ce que je fais ici, et c'est ma tâche. Avec les questions spécifiques que je veux que Gemini réponde. J'attends de Gemini qu'il me fournisse des informations sur ma présence, ma communication, mon style et ma clarté, mes forces et les domaines à améliorer J'ai également demandé à Gemini de fournir les horodatages spécifiques de ses observations afin que je puisse rapidement trouver le fragment auquel Gemini fait référence et le revoir moi-même Regardez comment Gemini traite ces informations. Et voici les commentaires. Ce sont là d'excellentes observations et des points que je pourrais certainement améliorer. Maintenant, prenons ce feedback et transformons-le en quelque chose d'utile. Je vais demander à Gemini réécrire mon script « Tell me about yourself afin qu'il soit plus percutant et qu'il soit plus pertinent pour le poste de chef de produit pour lequel je vais postuler Lorsque vous travaillez avec Pmdel, comme dans notre exemple actuel, la génération de réponses prend beaucoup plus de temps, alors soyez conscient de cela Et enfin, voici la version réécrite de mon introduction à Tell me About Yourself, elle a l'air plutôt bonne Mais bien sûr, si je l'utilisais dans une vraie conversation la prochaine fois, je préférerais changer certaines choses pour m'assurer qu'il me ressemble davantage. Excellent travail Gemini. Et juste comme ça, vous avez fait de Gemini votre coach personnel Je peux imaginer de nombreux cas d'utilisation pour ce type de feedback vidéo. Imaginez que vous participez à un défi de yoga de 28 jours et que vous avez besoin de commentaires quotidiens pour savoir si vous vous améliorez ou si vous avez peur de parler en public Vous pouvez donc vous enregistrer, envoyer la vidéo à Gemini, accompagnée de vos diapositives de présentation et demander ce qui a fonctionné et ce qui n'a pas fonctionné Ce que j'ai remarqué en commençant à le faire régulièrement est un effet secondaire positif que je n'ai pas remarqué s'attendre à. Le fait que vous vous enregistrez vous-même vous rend plus conscient de vous-même. Avant même que les Gémeaux ne disent quoi que ce soit, vous commencez à accorder plus d'attention à ce que vous faites et à la façon dont vous le faites Mais c'est tout, et c'est important. Prenez les commentaires de l'IA avec un grain de sel. Ces modèles sont incroyablement puissants, mais ils commettent des erreurs. Par exemple, dans l' exemple que nous venons de regarder, Gemini m'a dit que j'étais assise tout le temps alors que j'étais debout Utilisez donc les informations comme point de départ, mais comptez toujours sur vous-même pour le jugement final. Dans les questions-réponses de cette vidéo, dites-moi quels scénarios vous allez expérimenter avec Alcia dans la prochaine 15. Rester réel : stratégies pratiques pour minimiser les hallucinations par l'IA: Imaginez que vous interrogez AI Assistant sur un événement d'actualité récent et qu'il cite avec assurance un article détaillé qui n' existe pas réellement ou qu' il pose des questions sur des personnalités publiques et qu'il obtienne des réponses mêlant des faits réels à des détails complètement inventés Ce ne sont pas des bugs ou des problèmes. Ce sont ce que nous appelons des hallucinations dans l'IA. Et ils constituent l'un des plus grands défis lorsque l'on travaille avec de grands modèles linguistiques. Voyons pourquoi ces hallucinations se produisent, comment les détecter et, surtout, quelles sont les techniques pratiques que vous pouvez utiliser immédiatement pour obtenir des réponses plus précises et plus fiables. Pour comprendre pourquoi ces erreurs se produisent, nous devons examiner comment ces modèles sont construits. Contrairement à un humain qui comprend vraiment un sujet, modèles linguistiques fonctionnent en prédisant le mot suivant le plus probable d'une séquence sur la base de modèles statistiques , car ils sont conçus pour être aussi utiles que possible. Ils donnent souvent la priorité à fournir une réponse complète et fluide plutôt qu'à admettre qu'ils le sont incertain. Lorsqu'un modèle présente une lacune dans les informations sur lesquelles il a été formé ou lorsqu'il rencontre une demande ambiguë, il peut combler les lacunes en devinant le son le plus probable en réponse Ce n'est pas un problème. C'est un effet secondaire du fait que l'IA donne la priorité à une conversation fluide plutôt qu'à une vérité vérifiée Maintenant que nous comprenons pourquoi les hallucinations se produisent, voyons comment les détecter dans la pratique. Considérez cela comme le développement de vos compétences en matière de vérification des faits par l'IA. Une fois que vous connaissez les signaux d'avertissement, ils deviennent beaucoup plus faciles à détecter. Voici les principaux signes avant-coureurs à surveiller. Des détails trop précis. Lorsque le modèle d'IA fournit des détails très spécifiques, en particulier sur des événements récents ou des statistiques, cela devrait déclencher un examen plus approfondi. Par exemple, s'il fournit des chiffres ou des statistiques exacts pour des événements spécifiques ou en évolution rapide, sans citer de source en direct, c'est un signal d'alarme. Dans ces cas, il se peut que l'IA généralise à partir de modèles historiques similaires plutôt que de rendre compte de l' événement spécifique au sujet duquel vous avez posé Des citations, des exemples ou des statistiques qui sonnent parfaitement. Si vous remarquez une réponse qui semble trop parfaite, c'est une bonne raison de vérifier les informations. Et croyez-moi, plus vous acquerrez de l'expérience en travaillant avec les outils de l'IE, mieux vous exporterez ces deux bons moments. Vous développerez un instinct pour reconnaître quand quelque chose ne semble pas normal ou trop poli. Et c'est le moment idéal pour approfondir, vérifier les faits ou recouper les sources. Faites confiance mais vérifiez. C'est la règle d'or lorsque vous travaillez avec du contenu généré par l'IE. Réponses incohérentes. Si vous posez la même question plusieurs fois et que vous obtenez des détails spécifiques différents à chaque fois, c'est un indicateur fort d'hallucination Des déclarations trop définitives. Lorsque l'IA fait des déclarations très définitives sur des sujets qui devraient être incertains, en particulier en ce qui concerne des événements futurs ou des sujets complexes, soyez prudent. Savoir pourquoi les hallucinations se produisent et comment les détecter est un bon début. Mais comment les prévenir réellement ? Passons en revue quatre stratégies utiles qui vous aideront à obtenir des réponses plus fiables et plus précises à chaque fois. Stratégie 1. Soyez explicite en ce qui concerne l'incertitude. Au lieu de poser une question directe qui oblige l'IA à deviner, donnez-lui une réponse claire en lui demandant de donner la priorité à la précision plutôt qu' à l'exhaustivité. Par exemple, au lieu d'écrire, quelles ont été les principales conclusions du rapport Johnson ? Essaie ça. Si vous avez vérifié l'accès au rapport de Johnson, veuillez partager ses principales conclusions. Si vous n'êtes pas sûr à 100 % des détails, veuillez indiquer explicitement les parties que vous ne pouvez pas vérifier. Ou au lieu de répertorier toutes les entreprises qui utilisent cette technologie, essayez-la en vous basant sur les données sur lesquelles vous avez été formé. Pouvez-vous citer des exemples vérifiés d'entreprises utilisant cette technologie ? Veuillez fournir les sources ou le contexte spécifiques de chaque exemple et indiquer si l'un de ces cas est spéculatif plutôt que confirmé Au lieu de vous demander quelle est la taille du marché d'AichatBDS en ce moment, essayez ceci Pouvez-vous fournir les estimations les plus récentes de la taille du marché d'AichatBDS à partir de sources citées fiables ? Veuillez préciser la période exacte pour toutes les données que vous partagez et faites-moi savoir si vous n'avez pas accès aux derniers chiffres. Notez que chaque invite révisée donne explicitement l'autorisation de reconnaître l'incertitude et les limites. Ce simple changement peut améliorer considérablement la fiabilité des réponses. Deuxième stratégie, exiger des citations fondées sur des preuves. Lorsque vous demandez des sources, ne vous contentez pas de rechercher une liste de liens. L'IA peut parfois générer des citations parfaites pour des articles ou des sites Web qui n'existent pas. Demandez plutôt au modèle de citer la phrase spécifique de la source qui soutient votre conclusion En forçant l'IE à faire correspondre mot à mot sa demande à un texte existant, vous réduisez considérablement sa capacité à inventer des détails au milieu d'une phrase. Troisième stratégie : utiliser des formats de sortie structurés. demande de résultats structurés peut aider à minimiser les hallucinations en forçant le modèle d'IA à organiser les informations de manière plus systématique. Par exemple, analysez ces données de vente en utilisant la structure suivante, les points de données vérifiés, chiffres directs du document, les mesures calculées, montrez vos calculs, vos interprétations, clairement étiquetés comme des interprétations, et les incertitudes, les domaines où les données ne sont pas claires ou manquantes. Stratégie 4. Mettez en œuvre les étapes de vérification. Incluez des étapes de vérification directement dans vos invites afin d' améliorer la précision et la fiabilité des réponses Par exemple, vous pouvez lui demander d'énumérer toutes les hypothèses formulées lors de son analyse, mettre en évidence les domaines dans lesquels il y a moins de confiance ou de certitude. Recommandez des informations supplémentaires qui pourraient aider à valider ses conclusions. Cette approche garantit résultats plus complets et transparents, ce qui facilite l'évaluation de la qualité de la réponse. Maintenant que vous avez toutes les informations sur les hallucinations liées à l'IA, prenez un moment pour passer en revue l'une de vos récentes instructions. Comment pourriez-vous le modifier en utilisant les stratégies que nous venons de décrire ? N'oubliez pas que l'objectif n'est pas d'éliminer complètement les hallucinations, mais de créer un flux de travail dans lequel elles sont moins susceptibles d'avoir un impact sur vos résultats. Veuillez partager votre demande originale et révisée dans la section questions-réponses de cette vidéo Et comme toujours, récapitulons brièvement les points clés de cette conférence Les hallucinations liées à l'IA se produisent lorsque les modèles linguistiques génèrent des informations sonores fausses mais plausibles Les hallucinations se produisent parce que l'IA est une conteuse confiante qui privilégie une conversation fluide plutôt son travail à un manuel ou Les signes avant-coureurs des hallucinations incluent des détails trop spécifiques, citations parfaitement prononcées, des réponses incohérentes et des déclarations trop définitives Expliquez clairement l'incertitude dans les messages afin d'encourager l'IA à reconnaître ses limites Demandez des citations et des justifications pour vérifier les résultats de l' IA et identifier les hallucinations. Utilisez des formats de sortie structurés pour minimiser les hallucinations en organisant systématiquement les informations. Intégrez des étapes de vérification dans les instructions, telles que la mise en évidence des incertitudes ou la liste des hypothèses C'est bon. C'est tout pour cette conférence, et je vous verrai dans la prochaine vidéo. 16. Travailler avec la toile et des pierres précieuses Gemini : Section Intro tro: Bienvenue dans la section suivante. À présent, vous devriez bien comprendre comment parler aux Gémeaux Bien que nous continuions à nous appuyer sur ces principes fondamentaux, il est temps de passer au niveau supérieur. Nous allons au-delà des simples allers-retours pour explorer Canvas et les jams Nous allons commencer par Canvas, un espace de travail côte à côte dans lequel vous pouvez modifier du texte, comparer des versions et répéter votre travail Ne pas repartir de zéro à chaque fois et faire bien plus encore. Ensuite, nous apprendrons les confitures. Ce sont comme des spécialistes sur mesure qui se souviennent de vos règles spécifiques, vous n'avez donc pas à les répéter. Nous allons créer deux d'entre eux ensemble, un réviseur de grammaire et d'orthographe. Ce jam agit en tant qu' éditeur professionnel pour tirer profit de votre écriture tout en gardant votre voix inchangée et en tant que coach de fitness basé sur l' IA, celui-ci peut regarder vos vidéos d'entraînement, vérifier la sécurité de votre formulaire et même créer arrière-plans de motivation personnalisés pour votre téléphone À la fin de cette section, vous ne vous contenterez pas d'envoyer des instructions. Vous allez créer votre propre équipe d'experts pour transformer vos idées rapides en travaux terminés ou pour automatiser vos routines. Commençons. 17. Bienvenue sur la toile Gemini: Tout le monde. Bienvenue à la première conférence de cette section. Jusqu'à présent, nous avons vu l'interface de chat standard de Gemini, comme celles avec lesquelles nous avons l'habitude de travailler dans différents messagers C'est idéal pour poser une question rapide, obtenir des commentaires ou faire du brainstorming Mais cela peut sembler un peu limité lorsque vous travaillez sur un tout nouveau document. Ou un contenu qui nécessite plusieurs révisions. En effet, lorsque vous rédigez quelque chose de complexe, vous avez besoin de plus qu'une simple conversation. Vous avez besoin d'un espace de travail avec différents outils d'édition. C'est là qu'intervient Gemini Canvas. Considérez Gemini Canvas comme un espace de travail collaboratif. Dans un chat standard, l'EIS vous donne une réponse, et si vous souhaitez modifier une phrase, vous devez généralement demander que le tout soit réécrit Dans Canvas, Gemini ouvre une fenêtre côte à côte. Sur la gauche, vous avez votre chat. Sur la droite, vous avez un document évolutif. Ce n'est plus un simple chatbot c'est un éditeur assis juste à côté de vous Vous pouvez cliquer sur le texte, modifier vous-même les mots ou surligner un paragraphe spécifique et le dire aux Gémeaux Percez juste cette pièce. Si cela vous convient, attendez de l'entendre. La toile ne sert pas uniquement à écrire, elle sert aussi à construire. À partir du menu de l'interface, vous pouvez générer des pages Web, infographies visuelles pour des données complexes et même des outils d'étude tels que des quiz Pour ceux qui préfèrent écouter. Il existe des aperçus audio qui créent des résumés de vos résultats sous forme de podcast est peut-être le plus impressionnant, c'est que vous pouvez générer des mini-applications fonctionnelles Décrivez simplement un outil tel qu'un agenda familial ou un calendrier personnel, et Canvas créera et exécutera le code pour vous en temps réel. Vous n'avez pas besoin de savoir comment coder. Il vous suffit de décrire ce que l'outil doit effectuer, un processus désormais connu sous le nom de Vibe Coding Aujourd'hui, Canvas étant si puissant, il peut être tentant de se lancer directement dans la création d' applications et de jeux Cependant, nous allons procéder étape par étape. Pour l'instant, dans cette section du cours, nous allons nous concentrer entièrement sur la rédaction de documents. exemple d'une entreprise imaginaire de matelas utilisant l'IA, nous verrons comment utiliser l'espace de travail Canvas pour affiner un récit et générer soutien et des visuels en une seule session fluide Une fois que nous aurons maîtrisé la création de documents, nous passerons aux fonctionnalités plus avancées telles que la création d'applications interactives et prototypage rapide plus tard dans le cours Dans la leçon suivante, je vais vous montrer comment ouvrir l'interface Canvas, et nous allons commencer notre tout premier brouillon collaboratif. Je te retrouverai dans le prochain. 18. Suivi : création et édition de documents dans Gemini Canvas (partie 1): Comme promis dans cette vidéo, nous allons mettre la main dessus. Nous explorerons comment naviguer dans l'espace de travail Canvas, comment effectuer des modifications ciblées à l'aide de la fonction Ask Gemini, nous modifierons des parties spécifiques du document sans réécrire le brouillon dans son intégralité Nous examinerons également les actions rapides pour modifier des éléments tels que le ton et la longueur du document. Enfin, nous passerons au multimodal. Nous donnerons vie à la marque avec des logos et des visuels de produits générés par l' IE Passons à Gemini pour la démo. Commençons par passer en mode Canvas. Pour cela, je clique sur Outils et je choisis Canvas dans la fenêtre contextuelle. Passons également au modèle de pensée. Et je vais commencer par un message de conversation général. Voici ce que je vais taper. J'ai donné à Gemini un peu de contexte quant à ce que je m'apprête à faire J'ai fourni la tâche. J'ai dit que j'avais besoin d'une brève description de l'entreprise et du nouveau produit que cette société s'apprête à lancer. J'ai également fourni des détails sur le style. Je veux que Gemini vienne chercher. Appuyons sur Entrée et voyons ce que Gemini va écrire. Cela ouvre l' espace de travail Canvas avec le chat sur le côté gauche et avec le texte sur le côté droit. Nous voyons ici qu'il a créé la description de l'entreprise, y compris le nom , le moteur et un bref aperçu de ce que fait cette entreprise. Ensuite, nous avons les informations sur le produit, y compris les principales caractéristiques du matelas, et il a même suggéré des objectifs de brainstorming pour ma prochaine démonstration Parfait. Explorons cet espace de travail sur le côté droit. En haut de l'espace de travail, vous pouvez tout d'abord voir quelques outils d'édition. Par exemple, vous pouvez modifier le style de titre de votre texte. Vous pouvez ajouter une liste à puces ou un numéro à la liste, ou même des formules ici. Si vous le souhaitez, vous pouvez imprimer cette page. un document PDF, il y a d'autres fonctions que nous allons explorer un peu plus tard dans ce didacticiel et dans les suivants. La vraie magie de cet espace de travail est la fonction ask Gemini Supposons que vous souhaitiez apporter une modification à une partie de votre texte. Et au lieu de demander un tout nouveau brouillon dans le chat, vous pouvez simplement mettre en évidence la partie que vous souhaitez modifier, puis écrire votre demande à Gemini Par exemple, j'aimerais modifier l'emplacement du bureau de l'entreprise. Donc, ce que je vais faire, c'est mettre en évidence ce texte, et je vais simplement inclure mes instructions pour le changement que je veux que Gemini apporte Vous voyez, Gemini a fait le changement et a inclus ce nouveau texte directement dans le document Et dans la barre latérale gauche, nous voyons qu'il incluait le texte d'information et même une description de ce changement Permettez-moi de parcourir ce texte et de voir quels types de modifications j'aimerais apporter en plus de l'emplacement du bureau M Je peux continuer à travailler sur ce document et à faire des allers-retours, y compris les modifications, jusqu'au moment où je serai entièrement satisfait du texte. Franchement, j'utilise Canvas pour la création de documents grâce à cette fonctionnalité Ask Gemini Comme dans la plupart des cas, je dois ajuster une partie très précise d'un document. Cependant, voici ce que j'ai découvert après des semaines d'expérimentation. Puisque Gemini se concentre sur cette partie spécifique d'un document, il passe parfois à côté d'une vue d' ensemble. J'ai remarqué des cas où il répète des phrases utilisées dans d'autres parties du document ou introduit des termes qui ne sont introduits que plus tard donc en revue rapidement votre travail pour vous assurer qu'il s'intègre parfaitement. Et c'est tout pour la première partie de ce tutoriel. Et je te verrai dans le second. 19. Suivi : création et édition de documents dans Gemini Canvas (partie 2): Bienvenue dans la deuxième partie du didacticiel, où nous explorons Gemini Canvas pour la création de documents Outre demander à Gemini, il existe des actions rapides qui peuvent vous être utiles pour apporter des modifications à votre texte La première action rapide consiste à modifier la longueur. C'est idéal si vous avez besoin de développer rapidement une section avec plus de détails ou de la réduire pour en faire un résumé percutant. Supposons que nous voulions modifier la longueur de notre texte, je clique sur ce bouton, puis je dois choisir la longueur que je souhaite pour mon nouveau texte. Supposons que je veuille qu'elle soit plus longue que la version actuelle, et attendons les modifications. Et Gemini a développé ce texte. Vous voyez qu'il a surligné le nouveau texte en bleu ici. Revenons aux boutons d'action de la semaine. Et le second, c'est pour changer de ton. Donc, si vous voulez paraître plus professionnel ou un peu plus bavard, un peu plus bavard, c'est le bouton qui vous aidera à changer l'ambiance de votre écriture en un seul clic Changeons de ton, et je pourrai passer du formel au très formel ou au décontracté et au très décontracté. Franchement, je suis d'accord avec le ton actuel du texte, mais par exemple, rendons-le un peu plus formel pour les besoins de cette démo. Nous voyons que Gemini a modifié presque tout le fragment de texte ici Je préférerais revenir à la version précédente. Mais je pense que vous avez une idée de ce que cette option de changement de ton peut faire. Je reviens donc à la version précédente du document. Enfin, il existe également une fonction permettant de suggérer des modifications. C'est comme avoir un corps d'écriture. Gemini vous donnera des commentaires et vous montrera comment améliorer votre écriture sans modifier immédiatement votre texte original Essayons également cette fonction. Très bien, super Nous constatons que Gemini a inclus certaines modifications dans les informations sur la raison de ces modifications Si je suis d'accord avec tous ces changements, je peux tous les appliquer. Si vous n'aimez pas les suggestions de Gemini et que vous souhaitez revenir à la version précédente du document, vous pouvez le dire à Gemini directement ici dans le chat Cool. Cliquons donc sur Appliquer pour les suggestions restantes afin de pouvoir les conserver dans la nouvelle version du document. C'est bon. Continuons la démo. le cadre de la prochaine étape, je souhaite créer des visuels pour vous montrer les capacités multimodales de Nous aurons une section dédiée à la création de contenu visuel plus tard dans le cours. Donc pour l'instant, je vais simplement taper une invite très courte et simple. Et laissez-moi presser Andrew de voir les résultats. Et voici la première image. C'est incroyable que Gemini ait même inclus le nom du produit ici sur un côté du matelas Gemini me dit également qu'il ne peut générer qu'une seule image à la fois. Il me demande si je souhaite poursuivre avec le logo de l'entreprise. Les Gémeaux sont de plus en plus doués pour inclure des textes dans les images Et demandons plusieurs visuels pour les fonctionnalités. Génial. Et vous comprenez pourquoi il est important de créer des images dans ce même chat où nous avons créé le texte original. Gemini utilise le contexte des conversations précédentes pour créer l'image Vous voyez qu'il a fallu des informations sur un angle de trois degrés, même si cet angle me semble un peu plus grand. Mais c'est bon. Nous pouvons ajuster cela grâce à des itérations en travaillant sur cette image Il incluait également le nom du matelas ici. Créons la quatrième image. C'est génial Vous voyez que dans la description, nous avons l'information que cette fonction crée un dôme d'air pur au-dessus des traverses, et c'est exactement ce que nous voyons ici sur la photo. Incroyable Et vérifions le texte. Humidité et qualité de l'air optimales. Oui, et le texte est correct. Je ne vois aucune erreur ici. Bien, terminons ce tutoriel avant qu'il ne devienne trop long. Nous continuerons à travailler avec le texte et les images dans notre prochaine vidéo. 20. Suivi : Transformer un projet Gemini en un PDF raffiné avec Gamma: histoire de notre marque, les caractéristiques de nos produits et les images sont désormais organisées dans Gemini Considérez cela comme notre studio de dessin. L'espace de réflexion et d'écriture de base. Cependant, notre projet de travail n' est pas livrable. Si vous devez le présenter à un responsable ou à un client sous forme de rapport professionnel, nous devons transférer ce contenu vers un outil de conception dédié tel que Canva ou Gamma App Vous pensez peut-être que je ne peux pas simplement demander à Gemini de générer le PDF pour moi ? Bonne question Et oui, c'était également mon intention lorsque j'ai eu pour la première fois la tâche de créer le PDF final. Voici comment Gemini gère cela. Si vous essayez de créer un PDF dans Canvas, vous n'obtiendrez pas le document final. L'outil Canvas est conçu pour l' édition en direct et la collaboration, pas pour la publication. Comme il fonctionne dans un espace de travail privé, il ne peut pas voir vos fichiers image locaux pour les inclure dans le document. Si vous essayez d'exporter à partir d'ici, vous verrez un fichier contenant des espaces réservés vides où devraient se trouver vos images Bien sûr, vous pouvez également essayer un chat régulier. Elle est plus fonctionnelle. Il peut générer des fichiers en arrière-plan pour vous donner un PDF téléchargeable. Cependant, il ne dispose pas du contrôle de mise en page et raffinement nécessaires à une présentation professionnelle. Voici le PDF que Gemini a créé pour moi. C'est un bon début, mais il a fallu un important formatage manuel pour bien paraître. Donc, pour que notre présentation soit prête à être terminée, dans laquelle le texte circule correctement autour des images et où l'image de marque soit cohérente, nous passons du studio de dessin à un studio de design. Dans le prochain tutoriel, j'utiliserai l'application Gamma pour le démontrer. C'est mon outil principal depuis près d'un an, et c'est ce que j'utilise pour presque tous mes travaux de conception. Cependant, les mêmes principes s'appliquent à d'autres plateformes similaires telles que Canva ou Adobe Retournons dans Gemini et préparons notre contenu pour le déménagement Transférons le texte et les images de nos actifs vers l'application Gamma. Je vais commencer par copier le texte. Pour cela, je vais cliquer sur le bouton Partager et exporter. À partir de là, je vais choisir Copier le contenu. Et j'ai déjà téléchargé les quatre images que nous avions générées dans le précédent tutoriel. Tout est donc prêt pour que nous déménagions à Gamma. Ouvrons l'application Gamma. Voici la page principale de Gamma. La partie centrale est la grille de contenu. Cette zone affiche nos projets également appelés Gammas. La barre supérieure sert à créer de nouveaux documents. Sur le côté gauche, nous avons des modèles. Ici, nous pouvons accéder à des mises en page prédéfinies pour démarrer la conception de notre présentation Nous avons des choses aussi utiles que des images MAI. Où nous pouvons visualiser et utiliser les images que nous avons générées à l'aide de l'outil d'image EI intégré à Gammas Nous pouvons également créer des dossiers afin de séparer nos documents par thèmes ou sujets spécifiques. Passons donc directement à la création d'un fichier PDF. Je vais choisir Create New with AI. Et ici, nous avons différentes options. Comme nous avons déjà un texte, que j'ai copié depuis Gemini, je vais choisir cette option de collage de texte Et ici, je vais inclure le texte de Gemini. Ensuite, nous avons plusieurs options quant à ce que l'application Gamma peut faire avec notre contenu. Et il est important que nous choisissions de conserver ce texte exact. Cela signifie que Gamma n'apportera aucune modification à notre brouillon. s'agit de la méthode la plus efficace dans notre exemple , car elle nous permet d'utiliser Gemini pour le gros travail de réflexion et de rédaction , puis d'utiliser Gamma pour gérer le formatage et embellissement du document final Je vais sélectionner Continuer pour inviter l'éditeur ici. Ici, nous pouvons choisir différents thèmes pour notre présentation. Choisissons celui-ci et cliquez sur Sélectionner un thème. Avant de cliquer sur Générer, notez les deux modes en haut, formulaire libre et carte par carte. Permettez-moi de vous expliquer rapidement la différence. Lorsque vous choisissez carte par carte, Gamma divise automatiquement votre contenu en diapositives numérotées distinctes. Une idée par carte, mais vous pouvez toujours réorganiser les cartes ou en ajouter de nouvelles. Il est parfait pour les présentations. Avec Reform, tout est regroupé dans un seul document fluide, ressemble davantage à un rapport qu'à un diaporama. Même contenu, mais il se lit de haut en bas sans peine entre les sections Cela vous permet de mieux contrôler la mise en page et le flux. C'est idéal pour les documents ou les rapports. Pour notre démonstration, je choisirai Freeform car je souhaite que le texte et les images s' enchaînent naturellement Et appuyons sur Générer. Gamma commence à créer nos diapositives. Tout d'abord, comme je le fais habituellement, je demande à Gamma de me suggérer plusieurs autres mises en page afin que je puisse comparer la mise en page par défaut avec d'autres suggestions Pour cela, je clique sur le bouton Modifier avec l'agent, et à partir de là, je choisis Try New layout. Faisons encore un tour pour voir s'il existe quelque chose de mieux que notre première option par défaut. Je pense que je vais choisir celui-ci. J'aime bien cette image de fond ici. Passons à la diapositive suivante. Je vais inclure l' image de notre logo à la place de celle-ci. Pour changer l'image, je vais cliquer sur celle-ci. Ensuite, je passe à Modifier l'image. À partir de là, je choisis le téléchargement de l'image ou l'URL. J'ai mes images sur mon Drive local. Et c'est parti. Il s'agit de notre première image. Attachons-le. Parfait. Passons à la troisième diapositive. C'est bon, nous sommes prêts à partir. Faisons la dernière vérification et jetons un coup d'œil à toutes nos diapositives. Pour exporter ce fichier, nous cliquons sur l'icône à trois points. Ici, nous choisissons Exporter, et je vais exporter au format PDF. Ouvrons le fichier tout de suite, et c'est parti. Ça a l'air cool. C'est donc ma méthode de travail préférée lorsqu'il s'agit de créer de nouveaux documents. Je laisse Gemini s'occuper de la réflexion créative, puis je laisse mon outil de conception préféré, comme Gamma, s'occuper de lui donner une belle apparence. J'espère que vous avez apprécié ce tutoriel, et comme toujours, je vous verrai dans le prochain. 21. Que sont les pierres gemmes et pourquoi en avons-nous besoin ?: Tout le monde, lorsque vous commencez à utiliser Gemini régulièrement, vous remarquez rapidement que vous l'utilisez encore et encore pour certaines choses, ce soit pour réfléchir, obtenir des commentaires ou générer du nouveau contenu Vous pouvez vous retrouver à taper mêmes instructions et à donner le même contexte encore et encore, ce qui peut commencer à sembler un peu répétitif, vous remarquez rapidement que vous l'utilisez encore et encore pour certaines choses, que ce soit pour réfléchir, obtenir des commentaires ou générer du nouveau contenu. Vous pouvez vous retrouver à taper les mêmes instructions et à donner le même contexte encore et encore, ce qui peut commencer à sembler un peu répétitif, comme votre propre numérique version de Groundhog Day. Eh bien, aujourd'hui, nous mettons fin à ce cycle. Nous allons explorer une fonctionnalité qui vous permettra de regrouper ces instructions répétitives et d' en faire votre équipe d'experts en IA ou d'assistants personnels. Ils sont appelés Gemini Gems. Et non, nous ne parlons pas de diamants ici. Mais une fois que vous aurez vu combien de temps ils vous font gagner, vous pourriez penser qu'ils sont tout aussi précieux. Alors, qu'est-ce qu'un problème ? Considérez-les comme des versions personnalisées de Gemini conçues pour vous aider à effectuer des tâches répétitives ou à acquérir une expertise approfondie dans des domaines spécifiques Lorsque vous discutez avec Jam, Gemini se souvient automatiquement de vos objectifs et de vos directives , vous évitant ainsi de vous répéter à chaque demande. Ainsi, alors qu'un Gémeaux standard est comme un bibliothécaire, qui sait où tout se trouve, un joyau est comme un spécialiste dévoué Il ne connaît pas seulement un sujet. Il suit vos règles spécifiques pour effectuer le travail à votre place. Il existe trois types de confitures, les confitures préfabriquées. Ce sont des outils prêts à l'emploi conçus par Google. Vous ne pouvez ni voir ni modifier leur logique sous-jacente. Vous ne pouvez les épingler que sur votre barre latérale pour y accéder rapidement. Ils ont souvent des interfaces uniques, comme la mise en page de dix pages d'un livre de contes que les jams classiques ne peuvent tout simplement pas imiter Confitures personnalisées. C'est l'objectif de nos prochains tutoriels car vous les créez vous-même. Vous fournissez les instructions et pouvez télécharger jusqu'à dix fichiers personnels qui serviront de base de connaissances à Jams. C'est la différence entre un assistant général et un expert dédié spécialement adapté à vos données et à vos objectifs. Confitures en opale. Ople est un projet expérimental qui fait évoluer l'IA au-delà des simples fenêtres de discussion. Ces batteries sont des mini-applications interactives qui suivent un flux de travail spécifique. Leur caractéristique la plus remarquable est la possibilité de les remixer. Vous pouvez utiliser un outil prédéfini, comme un styliste de mode et modifier ses étapes internes pour créer quelque chose de nouveau Ils sont très visuels et peuvent générer du texte, des images et des vidéos simultanément. Nous allons explorer ces barrages dans les dernières sections du cours. Maintenant que nous avons déjà travaillé avec Canvas, vous vous posez peut-être une question logique. En quoi un Jam est-il vraiment différent ? L'essentiel est de considérer Canvas comme votre espace de travail partagé. Il s'agit d' un bureau collaboratif où vous et l'IE travaillez côte à côte sur des documents ou des codes détaillés. gemmes, quant à elles, sont vos spécialistes tactiques. Vous utilisez un tambour pour produire le brouillon initial, exemple pour générer une première version spécialisée basée sur les données que vous avez téléchargées, puis vous transmettez ce travail à Canvas pour l'affiner et le peaufiner. L'un est le spécialiste, vous demandez le résultat initial. L'autre est le bureau où le projet est terminé. Bien entendu, vous pouvez également utiliser les tambours seuls pour certaines tâches, ce qui nous amène à notre prochaine conférence de suivi. Mais avant de commencer à travailler avec la batterie, récapitulons brièvement ce que nous avons appris ici C'est bon. Et c'est tout pour cette vidéo. Je te retrouverai dans le prochain. 22. Suivi de suivi : Construire un joyau de la vérification grammaticale em: Tout le monde, et bienvenue dans notre premier tutoriel sur Gemini Gems Aujourd'hui, je vais vous montrer comment créer un expert personnalisé pour relire vos écrits, qu'il s'agisse de rédiger des pages de destination, des descriptions de produits, des e-mails rapides ou tout autre texte C'est comme avoir une deuxième paire d'yeux qui vous donne une confiance totale dans chaque mot que vous partagez. Ouvrons Gemini pour créer ce Jam. Nous allons commencer par cliquer sur Jams. Dans la barre latérale, nous accédons à Jam Manager, la section où nous créons des gemmes personnalisées Et ici, je vais cliquer sur New Jam. Commençons par donner le nom notre confiture, voici la description de ma gemme. Ensuite, j'ai inclus mes instructions. C'est de loin la partie la plus importante de votre bijou. J'ai inclus une description du rôle, disant que vous êtes un expert dans l'art de vérifier la grammaire, orthographe et la ponctuation dans les textes anglais et de les corriger si vous rencontrez des erreurs. Ensuite, je fournis une description du public cible Si vous suivez le même chemin et créez le même type de gemme, vous pouvez modifier le public cible pour plus adapté à votre cas d' utilisation et à votre domaine Ensuite, nous avons les règles de base suivies des informations sur le résultat que nous recherchons et nous avons également une invite de démarrage. Vous voyez que j'utilise des balises de hachage dans le texte des instructions. Ils agissent comme des séparateurs de section qui créent un squelette propre pour vos instructions Ils permettent au cerveau de Gems d'être mieux organisé afin que l'IA sache où s'arrête une règle et où commence la suivante. Revenons maintenant à l'ensemble des règles et discutons-en. Comment puis-je réellement obtenir cette liste ? Je vous recommande vivement d'effectuer manuellement la tâche que vous souhaitez automatiser trois à cinq fois trois à cinq fois avant même d'essayer de créer le bourrage. Si vous suivez directement les instructions, cela peut sembler intimidant Chaque règle de cette liste existe parce qu'il s'agit d'une préférence spécifique. Au fil des semaines, j'ai découvert que j'activais manuellement l'IA. Vous remarquerez peut-être aussi que j' utilise des mots dans le journal des tasses, comme par exemple ici. Il n'y a aucune exigence technique pour les utiliser. Les Gémeaux sont très sophistiqués. Il comprend les minuscules aussi bien que les majuscules. Mais j'ai trouvé que leur utilisation est toujours utile. Considérez ces mots comme des mots puissants. Nous pouvons les utiliser pour mettre en évidence les règles non négociables, afin que l'IA sache exactement ce qui est indispensable par rapport à ce qui est possible. Très bien, passons à la prochaine étape. Je suis d'accord avec ces instructions pour le moment, même si nous pouvons toujours revenir à cette liste après avoir créé ce jam et l'avoir modifié. Nous pouvons également choisir un outil par défaut. Cet outil sera sélectionné lorsque vous entamerez la nouvelle conversation avec le Jam. Je vais choisir Canvas comme outil par défaut. Au lieu d'une conversation de chat désordonnée, votre texte dirigé glissera dans un panneau latéral propre, parfaitement formaté et prêt à être copié Vous pouvez également inclure des fichiers dans la base de connaissances si vous souhaitez que votre jam fasse référence à des sources externes. Lors de la préparation de la réponse, vous voyez que nous pouvons télécharger des fichiers provenant de différentes sources ici. Mais pour cet exemple précis, je vais le laisser vide. Et nous sommes prêts. Épargnons donc le matin. Je clique sur le bouton Enregistrer. Et nous pouvons commencer notre nouvelle discussion. Voici le texte que je veux que Gemini vérifie. J'ai fait exprès plusieurs fautes de grammaire ici. Voyons donc s'il sera en mesure les trouver et de corriger ce brouillon. Il ouvre un canevas avec notre nouveau texte. Ça m'a l'air super. Et n'oubliez pas que vous pouvez utiliser cette interface Canvas pour apporter des modifications rapides à ce texte au cas où vous souhaiteriez apporter des modifications ici, par exemple, surlignons, réconcilier et demander à trouver alternative. Et si ces modifications nous conviennent, nous pouvons cliquer sur Partager et exporter, choisir le contenu de la copie, ou nous pouvons choisir d'exporter ce texte directement sur notre Google Docs. Permettez-moi de revenir à notre JAM, vous voyez que nous l'avons dans la liste des joyaux sur la barre de gauche. Une chose que j'ai remarquée, est qu'il n'y a aucun déclencheur de conversation ici. Donc, lorsque j'ai ouvert cette interface, je ne sais pas très bien que dois-je faire ici ? J'ai fait quelques recherches et j'ai trouvé cet article avec exactement la même question. Il s'est avéré que ces initiateurs de conversation ne sont pas pris en charge par des pierres précieuses pour le moment Il existe également une solution que nous pouvons essayer. L'article indique que vous pouvez simuler de telles instructions de démarrage en incluant une description supplémentaire dans votre Jam Bien, essayons d' inclure un exemple de démarreur de conversation pour voir si cela peut vous aider Je retourne à mon Jam. Si je clique sur les trois points, CN, je peux choisir l'option Modifier, et nous pouvons apporter les modifications que nous voulons. Permettez-moi d'inclure cet exemple sous la version actuelle des instructions. Et ce que nous pouvons également faire ici, en plus d'inclure un exemple de notre invite de démarrage, nous pouvons utiliser ce bouton magique pour que Gemini réécrive nos instructions et les améliore Essayons ça. Peut-être que ça pourrait aider. Je vois que Gemini a supprimé notre exemple d'invite de démarrage Ce que j'ai décidé de faire, inclure la règle numéro six, demandant aux Gémeaux de toujours démarrer la conversation avec l'invite de démarrage suivante Voyons si cela fonctionnera. Je vais donc mettre à jour les instructions de mes gemmes , les enregistrer et tester. Lorsque j'ai ouvert mon Jam mis à jour, je n'ai toujours aucun point de départ de conversation ici. Malheureusement, toutes mes autres expériences avec des instructions Jams définies pour ajouter le déclencheur de conversation se sont révélées infructueuses. Dans ce contexte, définissons la description du jam afin de fournir des informations sur ce qu'un utilisateur doit faire pour démarrer la conversation. Pour cela, revenons à l'interface d'édition JAMS. J'ai inclus de soumettre votre texte pour commencer. Texte à la fin de la description de Jam, je vais le mettre à jour et le tester à nouveau. Nos instructions sont ici, et soumettons-nous autre chose pour une modification. J'ai ce fragment. Voyons comment Gemini va le gérer. Parfait. Et si ce jam me convient et que je souhaite le partager avec mes amis ou collègues, je peux cliquer sur le bouton Partager et choisir Partager. Jim et moi allons créer un lien. Je peux le copier puis l'envoyer. Je laisse le lien vers ce jam dans les ressources de cette vidéo au cas où vous voudriez la tester. Et je vous retrouverai dans le prochain tutoriel où nous allons créer le coach personnel Jam 23. : suivre : créer un joyau de coach fitness (partie 1): Créons maintenant un jam compatible avec la vidéo. Supposons que je participe à un défi d' entraînement en ligne de 28 jours sur une application et que je veux savoir si je m'améliore réellement de jour en jour. Je vais m'enregistrer en train de faire les exercices quotidiens et demander avis de mon entraîneur de fitness basé sur l'IA, par mesure de prudence Comme nous en avons déjà discuté, même si l'IA est un bon partenaire pour suivre vos mouvements et votre forme, elle n'est pas un expert médical. Consultez toujours le professionnel de santé avant de commencer le nouveau programme de conditionnement physique. Cet outil est destiné au coaching et au progrès, et non à un conseil médical. OK, ouvrons Gemini pour commencer la démo. Créons un nouveau Jem. J'élargis ce menu. Va voir Jams. Ici, nous voyons des confitures fabriquées par des laboratoires. Je fais défiler la page vers le bas jusqu' à Jam Manager. J'ai déjà une révision grammaticale et orthographique Jam visible ici dans la liste de mes gemmes. Et pour l'instant, permettez-moi d'en créer un nouveau. Je clique sur New Gem. Fournissons le nom, description et les instructions de notre coach AI personnalisé Jam. J'ai inclus cette description. Ce jam analyse vos vidéos d'entraînement pour fournir des informations détaillées sur vos performances, et crée des arrière-plans de téléphone verticaux personnalisés arrière-plans de téléphone verticaux pour vous inspirer Et voici mes instructions. Comme toujours, j'ai commencé par décrire le rôle. Je veux que ce jam soit joué. Dans notre cas, je voulais devenir coach sportif professionnel. Ensuite, j'ai inclus une tâche pour ce jam. Nous demandons à Gemini d' analyser nos vidéos d'entraînement, recherche de signaux d'engagement et de sécurité comme Cin ou Domin. J'ai également expliqué que je voulais que Gemini crée une image verticale avec une J'ai également inclus des instructions de démarrage, même si nous avons constaté que instructions de démarrage ne fonctionnent pas tout à fait pour le moment Mais voyons quand même ce qui va se passer cette fois. Et pour que ce drame soit vraiment personnel, je vais télécharger une image dans la base de connaissances qui représente l'ambiance de l'image motivante que je souhaite que Gemini crée Je clique sur le bouton Plus. J'ai mon fichier de référence sur mon disque local, je vais donc choisir Upload files. Voici mon dossier, et c'est la citation motivante que j'ai sélectionnée Bien entendu, vous pouvez également inclure d'autres fichiers ici. Par exemple, si vous avez un article de recherche que vous souhaitez analyser lors la fourniture des recommandations, au lieu de simplement utiliser ses connaissances générales, vous pouvez toujours télécharger ce fichier ici. Et pour ce qui est de l'outil par défaut, pour ce jam, je ne vais rien choisir ici. C'est parce que notre entraîneur de fitness fait deux choses très différentes. Cela nous donne un feedback textuel et crée une image en haute résolution. Ainsi, en laissant Gemini choisir l'outil le mieux adapté à chaque tâche, nous veillons à ce que les arrière-plans de notre téléphone soient nets et nos commentaires soient transmis sans aucun problème technique Tout va bien ici. Nous sommes prêts à cliquer sur Safe. Et d'ailleurs, notez qu'il existe également cette fenêtre d'aperçu que vous pouvez utiliser pour tester vos instructions avant de les enregistrer. Mais dans mon cas, j'ai déjà fait le premier test avant de commencer à enregistrer ce tutoriel, donc je suis prêt à partir. Je vais simplement cliquer sur Safe et commençons notre discussion. ai mis en ligne ma première vidéo du premier jour de mon entraînement, et attendons un peu que les Gémeaux l'analysent Notre vidéo a été mise en ligne, et avant d'appuyer sur Entrée, parlons de la sélection des modèles ici. Comme cette impasse implique une analyse multimodale, le visionnage de vidéos, vérification des files d'attente liées à la sécurité et la fourniture de commentaires structurés, je vais choisir un modèle de réflexion qui privilégie le raisonnement Et nous sommes tous prêts, et je vais juste appuyer sur Entrée. Et voici les recommandations de Gemini. Tout d'abord, j' aime beaucoup le fait que cela nous indique que ces informations sont fournies à titre informatif uniquement. Et pour un avis médical ou un diagnostic, nous devrions consulter le professionnel. C'est tout à fait vrai. Notez qu'il a réussi à identifier qu'il s'agit de ma séance d'entraînement du premier jour en raison du nom pertinent de ce fichier, qui contenait un entraînement du premier jour dans le nom. Voici le tableau de bord, ce que j'ai réussi, et une chose Je suis d'accord avec cela. Ensuite, il y a une question. Aimeriez-vous que je crée votre arrière-plan téléphonique personnalisé pour votre motivation quotidienne, en fonction de vos progrès quotidiens ? Oui, définitivement, oui. Alors répondons simplement. Oui. Et c'est parti. Nous avons cette citation parfaite, mais il y a un problème avec cette image. Si nous la comparons à mon image de référence originale, nous constaterons qu' elles ne sont pas identiques. Voici une image que j'ai demandé à Gemini de créer. Vous voyez que le contexte est complètement différent. Revenons donc à notre routine et travaillons avec Gemini pour voir si nous pouvons changer cela et nous assurer que cela crée des images avec un arrière-plan similaire à celui notre fichier de référence 24. : créer un joyau de coach physique (partie 2): Bon retour. Dans la première partie de ce tutoriel, nous avons défini la logique de base de notre coach de fitness Jam. Mais nous avons rencontré une limite. Même si nous avons téléchargé une image de référence dans la base de connaissances qui générait la motivation quotidienne, les arrière-plans ne ressemblaient en rien à notre image d'origine. Nous allons résoudre ce problème en comprenant comment le système traite réellement ces différents types de données. J'ai déjà mentionné que Gemini est multimodal. Il peut voir, lire et entendre à la fois. Tout cela est vrai. Cependant, il existe une différence technique entre la façon dont une gemme lit un fichier et la façon dont elle crée une image. Lorsque nous saluons une référence à la base de connaissances, Gemini utilise sa capacité de vision pour analyser le fichier et le résumer en données textuelles destinées à sa mémoire à long terme Mais lorsque le am génère une nouvelle image, il déclenche un modèle de génération d'image distinct. Selon la documentation technique de Gemini, ce modèle de génération ne peut pas voir directement les pixels bruts de vos fichiers de base de connaissances Il ne reçoit qu'une invite sous forme de texte. Si vos instructions indiquent simplement de correspondre au style de la base de connaissances, l'IA travaille à partir d'un résumé, non de la source d'origine, et le style d'origine est perdu. Pour résoudre ce problème, nous passons du référencement à la spécification. Au lieu de montrer un fichier au jam espérant qu'il interprète correctement le style, nous allons écrire une spécification visuelle directement dans les instructions Cela garantit que chaque fois que le jam crée une image, il suit exactement vos règles sans aucune conjecture Voici comment nous procédons. Accédez à votre liste de Jams, trouvez celui que vous souhaitez modifier et cliquez sur l'icône d'édition. Et à partir de là, suivez vos instructions. Dans la section sur la motivation, supprimons cette vague instruction. Ensuite, nous allons ajouter une description notre image pour la créer, ouvrir une discussion séparée, applaudir votre image de référence et utiliser cette invite Je suggère de passer au modèle de pensée ici en fonction des résultats. Une fois que vous avez la description de l'image, collez-la directement dans vos instructions Jams. Voici la description que j' ai pour mon image de référence. Cela définit la mise en page, les téléphones et l'atmosphère. Le modèle dispose donc d'un ensemble clair de garde-corps. Une fois cela fait, nous pouvons cliquer sur Mettre à jour pour enregistrer les modifications. Permettez-moi de commencer un nouveau graphique pour tester les modifications que nous venons d'apporter. R Vous voyez que notre nouvelle image et celle de référence ne sont pas identiques mais très similaires dans leur mise en page, leur hiérarchie visuelle et leur esthétique générale, un manuel en verre dépoli sur un paysage urbain pastel Et c'est tout pour ce tutoriel. Veuillez écrire dans les commentaires de cette vidéo sur quel jam vous prévoyez de travailler. Et je vais voir dans la vidéo suivante. 25. Gemini pour la création visuelle : section Intro: Bienvenue dans cette nouvelle section du cours. Vous m'avez déjà vu créer quelques images avec Gemini plus tôt dans le cours, et il est maintenant temps d' entrer dans les détails Nous allons utiliser les outils d' image et de vidéo de Gemini pour un essai routier approprié Et je pense que c'est l'une des parties les plus visuelles de tout le cours. Nous allons commencer par génération d'images et pas seulement par les bases. Je vais vous montrer comment utiliser techniques telles que le mixage contextuel Où vous combinez des images de référence pour créer quelque chose de complètement nouveau et de raffinement itératif, où vous dirigez des Gémeaux comme un photographe ajustant un élément à la fois jusqu'à obtenir exactement la photo que vous Nous examinerons également la synthèse visuelle dans laquelle vous transmettez plusieurs ingrédients aux Gémeaux et les laissez créer une scène unique et fluide Ensuite, nous passerons ce que j'appelle la suite de retouche, dans laquelle nous utiliserons Gemini pour travailler avec des images que vous possédez déjà, par exemple pour travailler avec des images que vous possédez déjà restaurer de vieilles photos, transformer des croquis en photos de produits et effectuer des retouches précises à l'aide de l'outil de balisage de bâtiment Geminis Nous étudierons ensuite la possibilité de créer des systèmes visuels complets, des infographies, des organigrammes et des ressources adaptés aux différentes plateformes et tailles d'écran. Nous terminerons cette section avec le tutoriel sur la création de vidéos. Bien entendu, je partagerai également mes meilleurs conseils recommandations pratiques que j'ai élaborées en travaillant avec Gemini, un autre logiciel de génération d'images et de vidéos basé sur l'intelligence artificielle qui vous aidera à obtenir de meilleurs résultats C'est bon. Faisons preuve de créativité. 26. Qu'est-ce que la nano banana ? Explication des caractéristiques clés à: Vous avez peut-être remarqué apparition d'un étrange petit moja à la banane dans votre application Gemini Ce n'est pas juste une jolie icône. C'est un petit indice d' une histoire de dénomination amusante qui se cache derrière ce modèle. Avant la publication officielle de ce modèle, Google l'a soumis à des tests anonymes sur une plateforme appelée ALM Arena, un site public où les utilisateurs comparent deux modèles d'IA côte à côte et votent pour tests anonymes sur une plateforme appelée ALM Arena, un site public où les utilisateurs comparent le résultat qu'ils préfèrent sans savoir quel est le modèle. C'est ainsi que les laboratoires d'IA recueillent commentaires du monde réel avant un lancement complet Le modèle avait besoin d'un nom d' espace réservé, ce qui n'indiquerait pas qu'il s'agissait d'un produit Google pour le soumettre sur le site de LM Arena À 2 h 30 du matin, Nina, chef de produit de Google, a saisi Nano Banana pensais qu'il ne s'agissait que d'une étiquette fictive que personne en dehors de la plateforme de test ne verrait jamais Mais le modèle fonctionnait si bien que les utilisateurs X sont devenus obsédés par cette mystérieuse puissante Nano Banana, spéculant sur le laboratoire qui l'avait fabriquée, s'il s'agissait d'un projet secret de Google ou s'il s'agissait d'un projet totalement nouveau Au lieu de corriger discrètement le compte rendu, Google s'y est penché Ils ont ajouté l'image de la banane ou l'application Gemini et ont même créé un produit en édition limitée sur le thème de la banane La raison pour laquelle la banane est devenue virale n'était pas simplement le nom du cheval. C'était une fonctionnalité spécifique que outils d'imagerie de l' IE s'étaient trompés auparavant, cohérence des personnages dans le passé Si vous téléchargiez une photo de vous-même et que vous demandiez à une IA de la réinventer, vous obteniez quelque chose qui vous ressemblait vaguement Ce que les gens ont commencé à appeler votre cousin éloigné de l'IA, Nano Banana, a changé le fait que vous téléchargiez une photo de vous-même, et qu'il préserve votre véritable ressemblance scénarios complètement différents, dans des scénarios complètement différents, vous pouvez vous transformer en graffiti mural Personnalisé sur du carton ou un K en céramique, vous êtes reconnaissable dans chacun Vous pouvez vous transporter dans différents lieux, différentes tenues, différentes décennies. Le visage reste le tien. Vous pouvez même ajouter du mouvement transformant portrait esthétique en une courte vidéo dans laquelle le sujet tourne la tête ou change d'expression Nous examinerons cela plus en détail lorsque nous verrons le modèle vidéo de Gemini Mais la cohérence des personnages n'en est qu'un élément. Permettez-moi de vous expliquer les autres éléments qui font que ce modèle mérite d'être compris. Le mélange de scènes vous permet de télécharger deux photos distinctes et de les fusionner en une seule image cohérente Vous pouvez vous asseoir avec un personnage historique à la même table ou créer une photo de groupe de personnes qui ne sont jamais allées au même endroit. Gemini gère l'éclairage, les angles et le contexte. Le résultat ressemble donc à une seule image plutôt qu'à quelque chose qui semble assemblé. montage multitour transforme votre conversation en un canevas dynamique Vous n'êtes pas obligé de tout faire correctement dès le premier message. Vous pouvez commencer par une pièce vide et lui donner vie, peindre les murs, ajouter un canapé en cuir, déposer une tasse de café fumante sur la table Chaque invite s'appuie sur la précédente. Une chose importante à retenir, le chat conserve le contexte tout au long de vos modifications Donc, si vous souhaitez démarrer un projet complètement distinct, ouvrez une nouvelle discussion plutôt que de continuer dans le même fil de discussion. design mix consiste à prendre la texture ou le langage visuel d' une chose pour en faire une autre, le motif d'une aile de papillon devenant une robe de haute couture La texture d'un carreau de marbre enroulé autour d' une paire de baskets consiste moins à retoucher une photo qu'à fusionner deux mondes qui ne vont normalement pas ensemble Maintenant, une chose importante à comprendre sur la façon dont tout cela s'intègre, Gemini lui-même est un modèle de raisonnement et de langage à la base Les fonctionnalités d'image et de vidéo proviennent de modèles spécialisés dédiés que Gemini utilise en arrière-plan pour obtenir des images C'est Nano Banana. Officiellement nommée Gemini 2.5 Flash Image, bien que personne ne l'appelle Pour la vidéo, il s'agit d'un modèle appelé VO. Considérez-les comme l'équipe créative de Gemini disponible sur demande Lorsque vous demandez à Gemini de générer ou de modifier une image, il confie la tâche à Nano Banana Lorsque vous demandez une vidéo, le système appelle VO. La conversation reste en Gémeaux. Le travail spécialisé se déroulera en dessous lors de la prochaine conférence Nous allons ouvrir Gemini et essayer de créer nos premières images. Je t'y retrouverai. 27. Créer votre première image avec Gemini: Maintenant que vous avez vu un aperçu des capacités visuelles de Gemini, mettons-nous la main à la pâte et créons notre première image La création d'images est disponible sur tous les forfaits. Ouvrons Gemini et mettons-nous au travail. Pour créer une image, deux options s'offrent à vous. Première option : créez une image dans votre chat existant dans laquelle vous posez des questions ou travaillez à la création d'un nouveau contenu, comme lors de notre dernière conférence où nous avons travaillé sur notre fiche produit pour une entreprise de matelas dotés d'intelligence artificielle. La deuxième option est de repartir de zéro. C'est ce que je vais faire cette fois. Je vais commencer par le simple message. Un chat roux moelleux qui dort sur un canapé. Pour indiquer aux Gémeaux que nous allons créer une image, choisissons une image dans la liste des outils De cette façon, Gemini sait que nous attendons une image en sortie, nous n'avons donc pas besoin de taper ces instructions verbales dans l'invite Avant de générer une image, l'étape suivante consiste à choisir un modèle de génération d' image, qu'il soit rapide ou professionnel. Je vais choisir vite cette fois. Une autre façon de créer une image serait de taper créer une image de » directement dans votre invite. Et dans ce cas, il n'est pas nécessaire de sélectionner Créer une image dans la liste des outils. C'est ma façon préférée de travailler avec Gemini. Mais pour cette démo, continuons avec l'option Créer une image sélectionnée. Notre image est prête, plutôt bonne compte tenu de la brièveté de notre message et du fait qu'il ne s'agit que de notre première itération. Vous pouvez partager, copier ou télécharger cette image, ou vous pouvez continuer à l'ajuster simplement en discutant avec Gemini et en ajoutant plus de détails à votre demande initiale. Vous voyez que Gemini modifie l'invite d'image en ajoutant plus de détails tout en conservant le contexte précédent en place Mais si vous souhaitez recommencer avec l'une de vos versions précédentes, cliquez sur Plus et choisissez une branche dans Nouveau chat Ensuite, vous pouvez donner l' invite à Gemini, et dans ce cas, Gemini modifiera l'image sélectionnée Bien sûr, vous pouvez donner l' invite complète à Gemini immédiatement, ou au lieu de décrire vous-même les détails, ou au lieu de décrire vous-même les détails, choisir un Par exemple, au lieu de décrire la lumière que nous voulons voir apparaître dans notre image, choisissons cinématique dans la liste ci-dessous Vous m'avez vu choisir entre le mode rapide et le mode réflexion. Dans l'application Gemini, ces modes représentent la puissance de traitement et le raisonnement utilisés par l'IA pour créer votre image, tandis que les noms de modèles spécifiques, tels que nana Banana, évoluent rapidement en fonction du fonctionnement de ces deux modes Reste constant. Je recommande toujours de consulter les pages d' assistance officielles de Gemini pour connaître les derniers noms de version Mais voici la meilleure façon de penser à votre flux de travail. Considérez le mode rapide comme une couche interactive. Il est conçu pour être rapide et itérer rapidement. Si vous changez de couleur de chemise, essayez une nouvelle coiffure, changez de fond ou que vous générez de nombreuses variations, maintenez le mode Fast Thinking, la couche de raisonnement, cela prend plus de temps car il faut faire plus attention avant de générer Utilisez-le lorsque vous avez besoin de précision, comme du texte clair et lisible pour assigner des photos de produits cohérentes ou des scènes complexes où les détails comptent vraiment. Vous pouvez me demander, mais Anna, pourquoi je n'aurais pas envie de penser tout le temps si c'est plus puissant. C'est une bonne question, mais il y a deux compromis pratiques. Le premier est le temps. Le premier mode est l'outil de rapidité de pensée. Le mode réflexion nécessite une période d'attente pendant que l'IE réfléchit à l'invite. Deuxièmement, les limites d'utilisation, car mode de réflexion est plus coûteux en termes de calcul. Il a généralement des limites quotidiennes plus strictes que le mode rapide. Le processus que je recommande utilise le mode rapide pour explorer et générer rapidement des options approximatives. Et une fois que vous avez trouvé le concept de votre héros, passez en mode réflexion pour peaufiner la haute fidélité. Commencez immédiatement par le mode réflexion, uniquement pour les tâches très complexes telles visualisation des flux de processus ou création d'images avec des textes localisés spécifiques C'est bon. Vous avez maintenant une première idée de la façon d'inciter Gemini à créer des visuels Dans la vidéo suivante, nous allons aller un peu plus loin et nous allons apprendre comment créer un bon LCR rapide dans la vidéo suivante 28. 7 conseils pour créer de meilleurs visuels: Bonjour à tous, et bienvenue à la conférence. Comme cette section du cours traite génération de visuels, nous ne pouvons pas oublier un sujet aussi important que la création de ces instructions Dans la prochaine vidéo, je vais partager mes sept principales recommandations sur la façon de créer des instructions efficaces. Commençons. Parfois, vous verrez des résultats solides avec de simples instructions ouvertes, surtout si vous êtes ouvert aux surprises Cependant, lorsque vous avez une vision précise en tête, description de divers détails peut vous aider à atteindre la perfection. Mais quelle que soit la direction que vous souhaitez prendre, je vous recommande de commencer une simple invite, puis d'ajouter des détails supplémentaires un par un pour voir comment ils affectent l'image. Commencez par la description de votre sujet, de votre personne, de votre animal, paysage, de votre personnage fictif, etc. Générez votre première image, puis incluez détails ou un contexte supplémentaires tels que son emplacement, informations sur l' environnement et l'éclairage, ainsi que les émotions ou les humeurs que vous souhaitez introduire Pour clarifier l'idée de ce que vous voulez créer, il est utile de vous poser une série de questions. Voici une liste de contrôle que vous pourriez utiliser. Décidez si vous voulez une photo ou une illustration. Quel est votre sujet, votre personne, animal, votre paysage, votre personnage fictif, etc. Pensez aux effets et aux détails spécifiques que vous souhaitez inclure dans les mouvements artistiques, les thèmes, techniques, les effets, les matériaux, les concepts, couleurs et les tons, l'éclairage et la composition. Allez au-delà des principes de base et incluez des descriptions supplémentaires dans votre message qui peuvent au processus de création une toute autre orientation au processus de création ou ajouter de la saveur et des nuances à vos images. Voici quelques exemples de ce que vous pouvez ajouter. Type de photographie, environnements, émotions et humeurs, styles artistiques spécifiques, cinématographiques ou picturaux L'expérimentation de ce type de descripteurs est l'un des aspects les plus agréables de la génération d' images Gemini De petits ajouts peuvent changer radicalement l'apparence d'une image. Faites attention à l'ordre des mots dans votre message. Les mots du début ont plus de poids que ceux de la fin. Donc, si votre paysage enneigé compte plus que la cabine au premier plan, commencez par le Essayez de réorganiser le même ensemble de mots, et vous obtiendrez souvent des résultats sensiblement différents Soyez attentif aux droits des tiers. Gemini vous permet de faire référence à des artistes historiques et à des mouvements artistiques par leur nom Donc, demander un homme qui aime la qualité ou un style de Vang fonctionne parfaitement Cependant, l'IE bloquera les messages demandant des informations sur les styles de vie ou les artistes contemporains afin de protéger les créateurs Elle restreint également les caractères protégés par des droits d'auteur et les logos de marque. Si vous recherchez le look d' artiste moderne ou d'une marque en particulier, décrivez les qualités visuelles que vous recherchez au lieu de les nommer directement. Cherchez de l'inspiration et des exemples lorsque vous créez vos propres instructions Si vous débutez génération d'images par IA et que vous n' avez aucune expérience en design, il peut être difficile de rédiger des instructions descriptives détaillées au début, qui est tout à fait normal Une bonne façon de commencer est de parcourir les communautés d' images que j'ai générées en ligne, trouver les images que vous aimez, regarder les instructions qui les sous-tendent et commencer à expérimenter en apportant de petites modifications C'est également une bonne idée de créer un moodboard d' images que vous aimez et que vous souhaiterez peut-être consulter ultérieurement. Enregistrez l'image, l'invite utilisée et toutes les notes de style associées. Cela devient une référence créative vraiment utile au fil du temps. Enfin et surtout, profitez du processus. Au début, on peut avoir l'impression que c'est l'IE qui fait tout le travail créatif. Mais sans vos idées uniques, votre instinct quant à ce qui semble beau et votre curiosité pour expérimenter, l'IE ne produirait rien d'intéressant. Alors soyez vous-même, exposez vos idées et amusez-vous avec. Pour récapituler. Voici les sept conseils. Commencez simplement, puis ajoutez les détails un par un. Posez-vous une série de questions pour clarifier votre vision. Allez au-delà des notions de base en utilisant des descripteurs d'environnement, d'ambiance, de style, etc. L'ordre des mots est important. Ce qui vient en premier a plus de poids. Soyez attentif aux droits des tiers. Les styles artistiques sont équitables, mais évitez les personnages protégés par des droits d'auteur et les images de marque Trouvez l'inspiration en ligne et créez les moodboards comme référence créative. Amuse-toi bien avec. Comme toujours, Alca dans la vidéo suivante. 29. Mélange contextuel, renouvelement itératif et synthèse visuelle: Bon retour. Jusqu'à présent, nous avons rencontré la banane Banana et avons appris à créer une image à partir de zéro. Mais dans la plupart des cas, vous ne recherchez pas uniquement des images sympas. Vous recherchez des actifs. Vous avez besoin de l'image de héros parfaite pour un site Web ou une publicité sur les réseaux sociaux qui arrête réellement le défilement. Dans cette vidéo, nous allons découvrir comment créer ces actifs. Bien sûr, vous pouvez repartir de zéro et demander à Gemini quelle image vous souhaitez Mais pensez-y. décrire un angle d'éclairage spécifique, une texture unique ou difficile de décrire un angle d'éclairage spécifique, une texture unique ou une structure physique complexe à l'aide d'un simple texte. Vous pouvez passer 30 minutes à écrire l'invite parfaite et ne pas comprendre ce que vous avez en tête. Mais si vous montrez l'image de référence des Gémeaux, vous fournissez une carte instantanée de vos attentes Aujourd'hui, nous allons voir comment utiliser les images pour communiquer avec l'IA. Commençons par le défi marketing classique. Vous avez un produit, dans ce cas, flacon de soin pour la peau, et vous voulez qu'il soit éclatant, frais et de qualité supérieure Pour cela, nous allons utiliser le mixage contextuel. Regardez ce qui se passe lorsque je télécharge une simple photo de la bouteille à côté l'image de référence, puis que je guide Gemini pour qu'il la place dans une toute nouvelle scène créative Dans notre première invite, nous ne demandons pas simplement une photo prise au hasard. Nous disons exactement à Gemini ce que nous voulons en faisant référence à l'image originale et en demandant à en remplacer certaines parties, en remplaçant l'eau par du jus et le flacon original par notre marque de soins pour la Commençons par le mode rapide. J'ai cliqué sur Soumettre, et voici notre image. Le texte est net et la bouteille se trouve parfaitement sous la ligne de flottaison Apportons maintenant quelques modifications. Tout d'abord, je vais ajouter cette phrase dans l'invite. Des phrases telles que la photo d'un produit de commerce électronique, éclairage de studio lumineux ou arrière-plan blanc pur sont les secrets professionnels qui donnent à une image l'apparence d'une véritable publicité plutôt que d'une expérience d'IA. Passons également en mode réflexion ici. J'ai utilisé le même message, mais le flacon se retrouve soudainement au-dessus du liquide. Pourquoi ? Comme le modèle raisonne en fait par le biais de la physique, il sait que le jus d'orange, contrairement à l'eau, n'est pas transparent. Il pense que si je plonge cette bouteille dans du jus, la moitié inférieure de l' étiquette disparaîtra. Essayons de le forcer en ajoutant des instructions à moitié immergées à l'invite. Des résultats similaires. Le mode réflexion donne la priorité logique de photographie du produit par rapport mes instructions de mise en page spécifiques Cela suppose qu'une bonne photo doit montrer l'ensemble de la marque, donc cela corrige ma composition en retirant le produit du jus. Passons maintenant au raffinement itératif. C'est là que les Gémeaux brillent vraiment. Vous n'êtes pas obligé d'obtenir la photo parfaite en une seule fois. Au lieu de cela, vous le dirigez comme un photographe qui ajuste un élément à la fois jusqu'à ce que vous arriviez exactement où vous le souhaitez. Pour ce sac à café Gemini, nous allons créer une riche photo textuelle du produit étape par étape, en commençant par le placement, puis en affinant la composition, en ajoutant de l' éclat et de la profondeur, et enfin en ajustant l'éclairage Découvrez comment chaque invite rapproche l'image de cette esthétique haut de gamme Enfin, examinons la technique qui me semble la plus impressionnante de toutes les synthèses visuelles. Parfois, vous avez un kit de campagne complet, plusieurs produits, un modèle, une tenue. Dans le passé, la mise en place de tout cela nécessitait un énorme brief créatif et de nombreux allers-retours. Avec le mode de pensée des Gémeaux, nous avons simplement remis les pièces et nous les avons laissés s'occuper du reste Créer à partir de zéro est une question direction, pas seulement de description. Vous avez vu comment mélanger le contexte, affiner une prise de vue étape par étape et synthétiser plusieurs éléments en une seule image complète Mais que se passe-t-il lorsqu'une image est presque parfaite et ne nécessite qu'une modification spécifique ? Dans notre prochaine vidéo, nous aborderons la suite de montage dans laquelle nous utiliserons Gemini pour corriger, restaurer et éditer des images avec précision Alca est déjà là. 30. La suite d'édition : transformer des ébauches en prototypes et en restauration photo au format: Tout le monde, et bienvenue dans la série de conférences sur la création d' images avec Gemini Dans cette vidéo, nous abordons les capacités d'édition de Gemini Je vais vous montrer comment utiliser couche de réflexion Gemini pour corriger, restaurer et littéralement lire puis ajuster les images que vous avez déjà C'est là que nous passons du statut de créateurs à celui d'éditeurs sophistiqués. Permettez-moi d'ouvrir Gemini pour commencer la démo. Cela commence généralement sur une serviette ou un tableau blanc. Vous avez une vision pour un produit, mais vous n'êtes pas designer. Voici ce que nous allons faire. Je télécharge ce croquis d' un nouveau design de chaise sur Gemini Je n'ai pas besoin d'être artiste. Je pourrais simplement demander à Gemini interpréter ce croquis pour en une photo de produit photoréaliste car nous sommes en mode réflexion Gemini utilise les lignes comme guide structurel. Il comprend le point de vue que j'avais prévu et complète les détails, je n'ai pas pu le dessiner moi-même. Cela transforme vos brouillons en prototypes en quelques secondes. Changeons le tissu de la chaise. Mais au lieu d'expliquer la couleur et la texture que je souhaite, j'utiliserai des images de référence. Étonnamment, j'ai reçu cette image du livre parce que j'ai utilisé le mot couverture dans mon message. Commençons une nouvelle discussion pour corriger l'image. Et, bien sûr, nous pouvons donner à cette action une rotation de 360 degrés. Ici, j'ai l' image des cheveux et ma vidéo pmt. Et j'ai également sélectionné la vidéo dans le menu déroulant pour m'assurer que Gemini a bien compris ma tâche. Voyons maintenant l'une des réparations les plus puissantes que vous puissiez effectuer pour la restauration. Nous avons tous ces vieilles photos de famille délavées ou ces photos numériques de mauvaise qualité datant d'il y a des années Au lieu de simplement le colorier, je vais demander à Gemini de le restaurer À l'aide de sa couche de réflexion, Gemini analyse les textures et le contexte historique Il élimine les rayures, affine les visages et applique des couleurs naturelles et réalistes comme si la photo avait été prise aujourd'hui Il n'y a pas que le filtre. C'est l'IE qui reconstruit la qualité perdue au fil du temps. Jetons un coup d'œil. Mm. Oh, quelle sensation danser sur la pédale , perdue au rythme du soleil 31. La suite de montage : des retouches ciblées avec l'outil de marquage et des annotations externes: Passons à autre chose. Et si l'image est belle, mais que vous voulez changer une chose en particulier ? Voyons comment travailler avec outil de balisage d' image dédié de Gemini, ainsi que son alternative J'aimerais modifier cette image. Je vais le télécharger sur Gemini et ouvrir l'outil de balisage. Je clique simplement sur l'image. Et voici notre espace de travail d'édition. Ce que je vais faire ici s'appelle une incitation spéciale. Je montre aux Gémeaux exactement où je veux le changement et je décrit ce que le changement devrait être Je vais d'abord choisir une couleur. Allons-y avec le rouge. Et je fais le tour de cette cheminée. Ensuite, je dois expliquer l'intention Je vais donc passer à l' outil texte et taper Ed fire. Remarquez que j'ai utilisé un verbe ici. Vous pouvez être précis avec des actions telles que l'ajout ou le remplacement, ou vous pouvez simplement décrire l'objet. Par exemple, ajoutons deux tasses de café sur cette table d'appoint ici. Si vous avez fait une erreur, vous pouvez toujours appuyer sur le bouton d' annulation pour revenir en arrière. Je clique sur Terminé car je viens finaliser les annotations et appuyons Entrée sans fournir d'instructions, car nous venons de les créer sur cette image Et voici la nouvelle image. Nous constatons que Gemini a inclus les modifications avec succès. Nous voyons le feu dans la cheminée et nous voyons ici deux tasses de café. Excellent travail. Lorsque j'ouvre cette nouvelle image, vous remarquerez que cliquer dessus n'ouvre plus l'outil de balisage Cet outil est donc spécialement conçu pour vos premiers téléchargements. Cependant, vous n'êtes pas bloqué, vous pouvez continuer à affiner le résultat à l'aide de modifications conversationnelles Voici donc ma nouvelle invite. Les Gémeaux sont conscients du contexte de l'image. Il vient de créer et continuera à apporter les modifications que vous avez demandées. Et pour en revenir à mes annotations d'origine, remarquez que j'aime faire correspondre la couleur du texte à la couleur du cercle pendant que l'IA suit principalement les coordonnées Il s'agit d'une excellente bonne pratique pour organiser vos instructions. Vous pouvez également importer des annotations provenant d'outils externes tels que Canva Par exemple, ici, j'ai annoté cette photo du bâtiment Bursch Khalifa Je veux que Gemini apporte exactement ces modifications. Je veux que ce bâtiment soit supprimé et je souhaite changer les couleurs de certaines parties du bâtiment. J'ai ouvert un nouveau chat, et j'ai soumis cette image au chat. Pour des tâches complexes comme celle-ci, je recommande de passer en mode réflexion. Cela déclenche un modèle de raisonnement plus puissant, qui suit bien mieux ces instructions précises. Je vais également inclure ces instructions, y compris cette invite ici qui est importante. Par exemple, voici l'image que j'ai obtenue en ajustant cette même image sans fournir d' instructions à Gemini Nous constatons que Gemini a réussi le changement. Cependant, nous voyons toujours les annotations, et c'était mon image originale sans aucune instruction fournie Revenons à notre discussion et appuyons sur Enter. Malheureusement, cette fois, nous avons toujours les instructions sur la nouvelle image, et nous constatons également que Gemini a apporté d'autres modifications avec succès Nous ne voyons pas le bâtiment ici sur le côté droit, et les nouvelles couleurs ont été appliquées avec succès. Demandons à Gemini de supprimer les instructions d'annotation de l'image. Et c'est parti. La deuxième tentative a été couronnée de succès. Comme vous pouvez le constater, les Gémeaux reconnaissent le texte, retirent le bâtiment et changent parfaitement les couleurs Ensuite, nous avons fourni la deuxième instruction pour supprimer les annotations. Tout va bien ici. Enfin, voyons comment les Gémeaux raisonnent à propos du monde qui se trouve dans vos photos Par exemple, si vous téléchargez une photo de l'horizon d'une ville, vous pouvez demander à Gemini de l'annoter, de regarder comment elle identifie les points de repère et ajoute des étiquettes exactement là où Il ne s'agit pas simplement de dessin, mais de conception de l'information. Il s'agit de transformer un pota cru en un outil pédagogique intelligent pour une présentation ou un manuel Et c'est vraiment le thème de tout ce que nous abordons dans cette vidéo. Qu' il s'agisse de donner vie à un croquis, de restaurer un ancien forum, restaurer un ancien forum, annoter une image ou d' étiqueter intelligemment une scène complexe, Gemini se charge du travail de précision, vous n'avez donc pas à le faire Dans notre prochaine vidéo, nous allons réunir toutes ces compétences pour créer des systèmes visuels complexes, notamment des infographies et des visualisations de données qui transforment les données complexes en instantanément claires. Je t'y verrai. 32. - Jacqueline Jensen Visuels complexes ams: Bon retour. Jusqu'à présent, nous avons abordé de nombreux sujets en créant à partir de zéro, éditant avec précision et en synthétisant des scènes complexes Voyons maintenant ce que Gemini peut faire lorsque la tâche devient encore plus ambitieuse, en créant des ressources visuelles en plusieurs parties, telles diagrammes infographiques et des ressources qui fonctionnent sur différentes plateformes sociales et différents Commençons. Je veux que Gemini crée une page Menu infographique utilisant ces images de café. Je voulais identifier chaque boisson et la placer dans une section propre avec son nom et une brève description. Choisissons également de créer des images à partir de la sélection d'outils. D'après la description de Pam ici, il n'est pas très clair si je veux une image ou un texte comme résultat final. Commençons. Et voici notre photo. Parce que Gemini possède cette couche de résonance profonde, il voit la différence entre les images que nous avons soumises et peut identifier une tasse à café contenant des glaçons par rapport à une tasse contenant du lait chaud Permettez-moi de demander à Gemini de modifier un peu cette mise en page et de changer les couleurs pour qu'elles s'adaptent aux couleurs de notre marque Oh, c'est un super design. Je l'aime mieux que notre première itération. Et faisons un autre changement. Je souhaite remplacer le texte de ce menu de café par le nom de notre marque. Et voici notre image. Je l'aime beaucoup. La seule chose que je veux changer, supprimer ces grains de café pour que le texte soit entièrement visible. Mais au lieu de le faire comme une série d'instructions itératives, essayons d'utiliser une autre technique ici Je vais utiliser l'outil de balisage dont nous avons parlé dans la démo précédente Permettez-moi de télécharger cette image en taille réelle. J'ai créé un nouveau chat, téléchargé notre image que nous venons de générer. Ensuite, j'ai ouvert l'outil de balisage et j'ai mis en évidence les grains de café J'ai ajouté l'instruction à Gemini de retirer les grains de café Cela va être un peu délicat car nous voyons les haricots en même temps que le texte. Mais essayons de le faire fonctionner. Je choisis ici le modèle de pensée et sélectionne et crée des images. Ma première tentative a donc échoué. Vous voyez que les images OF sont toujours présentes à l'intérieur de l'image. Essayons de décrire le changement que j' aimerais apporter. Et voici notre image. C'est vraiment incroyable que Gemini ait si bien suivi mes instructions et retiré ces grains de café du coin supérieur droit du menu Et maintenant, nous pouvons voir clairement notre texte. Génial. Et passons à la deuxième démo ici. Parfois, vous devez expliquer à quoi ressemble le voyage du grain à la tasse dans mon exemple de marque de café Gemini Voici donc le processus de brassage emblématique de notre marque. Je vais demander à Gemini ce qui suit. Je souhaite que Gemini finalise ce processus de signature Gemini Brew en cinq étapes dans un organigramme à architecture épurée Je voulais utiliser une mise en page minimaliste et faire correspondre les couleurs à celles que nous utilisons dans notre fichier PDF. Laissez-moi choisir le mode de réflexion. Et pour cet exemple, je vais également choisir Créer des images. Et voici notre schéma. Gemini a construit la structure, créé les icônes et étiqueté chaque étape Ce que je n'aime pas ici, ce sont ces lancers qui ne sont absolument pas nécessaires. Et ce texte que l'on peut voir sur chaque boîte. Demandons aux Gémeaux de le supprimer. Et voici l'image la plus nette. Et j'aimerais également supprimer ce cadre. Demandons à Gemini de le faire. Et c'est une bien meilleure image. Et je veux faire une autre itération pour rendre cette image plus belle Regarde ça. Il s'agit d'une esthétique complètement différente. Dites-moi dans les questions-réponses de cette vidéo, laquelle vous préférez Et nous passons à la prochaine étape avec notre démo. 33. Visuels complexes : adapter les actifs sur différents formats et plateformes: Bien entendu, vous pouvez modifier davantage cette image si vous le souhaitez, soit en continuant à demander Gemini des améliorations directement ici dans le chat, soit en copiant cette image et en suivant les instructions de l' outil de balisage Mais laissez-moi vous montrer un autre exemple pendant que nous sommes ici sur cette image. Supposons que nous prévoyons une expansion internationale de la marque Gemini Brew Nous avons donc besoin que ce schéma soit traduit dans d'autres langues. Je vais donc demander de changer l'image pour que les textes soient affichés en chinois. Et voici notre schéma traduit. Notez que dans mon message, je dis explicitement que je veux que Gemini change l'image, pas simplement qu'il affiche les textes en chinois afin qu' il soit parfaitement clair pour Gemini que j'ai besoin d' une autre variante de cette image traduite en chinois C'est bon. Et prenons un dernier exemple. Supposons que nous ayons besoin de ressources pour la campagne marketing de Gemini Brew qui fonctionneront partout, qu'il s' agisse d'histoires et de publications sur Instagram ou d'une image de héros sur notre site Web Nous allons prendre cette photo que nous avons créée plus tôt avec Gemini, et je vais dire à Gemini que c'est notre principal atout Et maintenant, j'ai besoin d'une version pour un article vertical sur les réseaux sociaux, d'un post carré et d'un en-tête blanc pour le site Web de Gemini Brew ai également joint l'image que je souhaite que Gemini modifie Et voici le message que j'ai reçu de Gemini lorsque j'ai testé cette invite avant d'enregistrer le didacticiel C'est parce que les Gémeaux peuvent créer une image à la fois. Bien que Gemini puisse traiter plusieurs images de référence à la fois, son objectif est toujours de les synthétiser en une composition finale haute fidélité Si vous lui demandez plusieurs fichiers image distincts en une seule fois, comme dans mon exemple, il ne sera pas en mesure de traiter votre demande. Définissez donc toujours votre demande sous la forme d'un projet unique, tel qu'une infographie, un menu ou une photo de campagne où tous vos éléments sont réunis dans une seule image Permettez-moi donc de modifier l'invite. Je voudrais d'abord créer une image d'en-tête blanche pour le site Web de Gemini Brew Comme toujours, je sélectionne le mode réflexion, et choisissons également Créer des images pour donner aux Gémeaux des instructions claires indiquant que je m'attends à voir une image dans ce cas Et voici notre nouvelle image de héros blanc pour notre site Web. Nous constatons que Gemini ne se contente pas étirer notre image d'origine, il la surpeint Il y ajoute donc plus de détails , comme ces vieilles machines à café ou ces grains de café sur les côtés gauche et droit de l' image d'origine, tout en veillant à ce que notre produit soit toujours parfaitement positionné au centre de la composition, quelle que soit la taille de l'écran Créons également une image de taille verticale et une image de taille carrée pour nos publications Instagram. 34. Au-delà de la discussion - Recherche approfondie et construction avec Gemini : section d'introduction: Que se passe-t-il lorsque vous confiez à Gemini une tâche de recherche qui vous prendrait normalement une demi-journée ? C'est le sujet de cette section, puis nous emmenons ces résultats là où vous ne vous y attendriez peut-être pas. Nous allons le faire en utilisant une fonctionnalité Gemini appelée recherche approfondie, et nous travaillerons sur trois situations réelles très différentes avec elle Un problème auquel la plupart d'entre nous sont confrontés chaque semaine, un autre qui consiste à prendre une décision d'achat sans tomber dans le terrier des sites d'évaluation et des fils de discussion, et un autre qui consiste à se familiariser avec un sujet complètement nouveau Dans chaque cas, je veux que vous voyiez non seulement ce que produit Gemini, mais aussi comment le demander, afin que le résultat vous soit réellement utile Ensuite, nous allons aller encore plus loin en utilisant Canvas pour transformer l'un de ces résultats de recherche en une application interactive fonctionnelle créée à partir d'une conversation. Aucun code ne l'exige. J'espère que tu es prête. Alors, prenez-vous une tasse de thé ou de café, et allons-y. 35. Recherche approfondie : Au-delà des réponses: Levez la main si cela vous est déjà arrivé, si vous posez une question difficile et importante à un chatbot, exemple  : « Je veux augmenter le financement de la série A Quels sont les investisseurs les plus actifs dans mon espace en ce moment ? Et il répond par une liste d'options, qui est assez superficielle, et vous obtenez également un tas de recommandations de haut niveau. Par exemple, vous devriez rechercher des investisseurs actifs dans votre catégorie. Vous devez créer une liste de cibles. Vous devriez contacter votre réseau pour des présentations chaleureuses, etc. L'équipe produit de Google a un nom pour cela. Ils appellent cela un plan de réponse, une carte de haut niveau qui vous indique ce qu'il faut trouver tout en vous laissant le soin de vous occuper du travail Vous êtes toujours en train de vous noyer dans 50 onglets de navigateur ouverts, à essayer de séparer le signal utile du bruit La recherche approfondie de Gemini peut vous aider à dépasser le plan directeur et à obtenir quelque chose très complet sur lequel vous pouvez agir immédiatement La recherche approfondie n'est pas simplement un chatbot plus intelligent. Il s'agit d'un système agentique, ce qui signifie qu'il planifie, recherche les raisons et synthétise de manière autonome les informations provenant de centaines de sources C'est comme si vous aviez un assistant de recherche de niveau doctorat dans votre équipe un assistant de recherche de niveau doctorat qui effectue des heures d' investigation complexe en quelques minutes et revient avec un rapport soigné, et non une liste de choses à faire. Alors, que fait réellement un assistant de recherche au niveau du doctorat pour vous dans la pratique ? Permettez-moi de vous présenter les trois cas d'utilisation les plus puissants. Tout d'abord, la compréhension du sujet, approfondissement de sujets complexes. Imaginez que vous êtes un responsable des ressources humaines qui essaie comprendre l'impact de l'IA sur le personnel au cours des trois prochaines années. Vous ne voulez pas simplement un résumé du niveau de surface. Vous devez comprendre le paysage. En quoi l'automatisation de l'IA se compare-t-elle à l'augmentation de l'IA ? Quels sont les rôles les plus menacés et ceux qui évoluent. Que font déjà d'autres entreprises ? Et que dit la recherche par rapport à ce qui ne fait que du battage médiatique ? Une recherche approfondie explore simultanément des articles universitaires, des rapports sectoriels, des commentaires d'experts et des études de cas réels des rapports sectoriels, des commentaires d'experts et des études de cas réels Il revient avec une analyse structurée qui cartographie le paysage, en contraste les idées concurrentes, met en évidence les relations entre les concepts et explique le pourquoi de tout cela Deuxièmement, la due diligence professionnelle. Pensez à préparer une réunion de vente d'entreprise. Avant de vous lancer, vous devez comprendre les vous devez comprendre principaux défis commerciaux des prospects, les récentes décisions stratégiques, la pression concurrentielle à laquelle ils sont confrontés et la manière dont votre produit s'intègre à tous ces défis. Des recherches approfondies portent sur les produits de l'entreprise, découvrent l'historique, l' équipe de direction et l'environnement concurrentiel. Et c'est très important : associez le tout à vos propres notes internes sur la relation client, ce qui aurait pris une journée complète à un analyste junior pour compiler est désormais prêt en quelques minutes Vous entrez donc dans cette salle de réunion en sachant plus sur leur activité que ce à quoi ils pourraient s'attendre. Troisièmement, des enjeux élevés, des décisions personnelles. Tout ne tourne pas autour du travail, de l'achat d'une voiture, du choix d'un quartier, de la comparaison des options d'assurance. Ces décisions sont tout aussi importantes, et la recherche Rabbit Hole est tout aussi approfondie. Au lieu d' un week-end perdu à parcourir blog contradictoires et des fils de discussion, vous obtenez un rapport structuré en fonction de votre situation spécifique, avantages, des inconvénients et des nuances que les conseils génériques ne vous apportent jamais Et voici ce qui rend ces trois cas d'utilisation possibles dans la pratique. Une recherche approfondie ne se limite pas à vous fournir une liste de liens. Il produit un rapport complet de plusieurs pages, analyse structurée, des sources citées et même des éléments tels infographies qui donnent vie aux données Lors de la prochaine conférence, nous allons mettre la main dessus. Je vais vous montrer comment lancer une recherche approfondie, comment créer le plan de recherche avant qu'il ne commence, et nous allons passer en revue un exemple concret ensemble afin que vous puissiez voir le processus complet, de invite au rapport final. Je t'y retrouverai. 36. La recherche approfondie en action - Comprendre le sujet: Comme promis, voyons des recherches approfondies en action. Nous allons commencer par le sujet de la compréhension des cas d'utilisation, et j'ai choisi un exemple auquel je pense que la plupart d'entre nous peuvent s'identifier personnellement. Nous allons utiliser des recherches approfondies pour aborder l'un des sujets les plus confus de la vie quotidienne. Petit déjeuner, alimentation, vous connaissez ce sentiment. Si vous recherchez Google RX en bonne santé et que vous obtenez dix réponses complètement différentes selon l'article sur lequel vous atterrissez, vous aurez besoin d'un plan Gemini payant Si vous utilisez actuellement un forfait gratuit et que vous souhaitez effectuer une mise à niveau, consultez la conférence dans la section des cours d'introduction où je vous explique comment procéder. OK, allons-y. Pour lancer une recherche approfondie, ouvrez une nouvelle discussion et choisissez recherche approfondie dans la liste des outils. Par défaut, Gemini utilise la recherche Google comme source principale Mais vous pouvez étendre cela. Par exemple, vous pouvez choisir votre compte Gmail ou Google Drive comme source ou télécharger vos propres fichiers. C'est ce qui rend la recherche approfondie si puissante. Il ne s'agit pas simplement de faire des recherches sur le Web. Il peut fusionner des informations publiques avec vos propres documents privés. Pour cette démo, nous allons rester simples et utiliser la recherche sur le Web Voici l'invite que je vais utiliser. Notez à quel point cette invite est spécifique. Nous ne nous demandons pas simplement que dois-je manger au petit-déjeuner ? Nous menons des recherches approfondies, un programme de recherche clair avec trois tâches distinctes. Plus vous lui donnez de direction dès le départ, plus le résultat est utile. En ce qui concerne la sélection du modèle ici, l'analogie spécialisée que nous avons présentée plus tôt dans le cours reste exactement la même lorsque vous activez la recherche approfondie. Le mode que vous sélectionnez détermine le comportement de ce spécialiste pendant le processus de recherche Fast reste votre sprinter, effectuant une analyse rapide des sources les plus pertinentes pour vous donner un bref résumé sans entrer dans les moindres détails Réfléchir, c'est toujours votre stratège qui cherche à croiser plusieurs sources et résoudre les contradictions pour trouver un angle plus logique Pro reste votre expert dans tous les domaines, qu'il s'agisse de rapports denses PDF techniques ou de longs fils de discussion, pour vous fournir une synthèse vraiment complète Je vais choisir de penser ici. Maintenant, appuyons sur Soumettre et voyons d'abord ce qui se passe. C'est l'étape de décomposition de l'objectif, et c'est l'une de mes parties préférées du processus. Au lieu de plonger directement dans la recherche, recherche approfondie s'arrête et élabore un plan de recherche personnalisé en plusieurs étapes en fonction de votre demande. Vous pouvez le voir cartographier exactement ce qu'il a l' intention d'étudier. Si nécessaire, vous pouvez modifier ce plan avant qu'il ne commence. Si vous souhaitez l'orienter vers un angle spécifique, ajouter un sous-sujet ou supprimer un élément qui ne vous concerne pas, faites-le maintenant avant qu'une seule recherche ne soit lancée Pour cette démo, je suis content du plan tel qu'il est. Approuvons-le donc et laissez-le fonctionner. Et maintenant, la recherche commence. Gemini utilise des sources en temps réel, des articles universitaires, des publications sur la nutrition, des directives et des publications sur la santé Il s'agit de décider quelles menaces doivent être étudiées en parallèle et lesquelles doivent se produire dans l'ordre. Vous pouvez même cliquer sur l'un des sites Web ici si vous êtes curieux de savoir quelles sont les sources utilisées par Gemini Lorsque Gemini Deep Research lit chaque source, il ne se contente pas de collecter des informations et de passer à autre Il réfléchit à ce qu'il faut rechercher ensuite. Il mène un processus d' autocritique continu, contradictions entre les sources, signale les affirmations vagues ou non étayées et reconnaît que lorsqu' une donnée ne correspond tout simplement pas, vous pouvez le voir ajuster ses orientations de ne correspond tout simplement pas, vous pouvez le voir recherche en temps réel, fur et à mesure que de nouvelles informations arrivent, et lorsqu'il se trouve dans une impasse, disons qu'une étude est payante ou qu'un site Web est en ça ne s'arrête pas. Il redirige et trouve un autre chemin vers la même réponse. Il y a encore une chose qui rend cela possible à grande échelle. La recherche approfondie s' effectue dans une fenêtre contextuelle, les IIs, la mémoire de travail. Concrètement, cela signifie que Gemini garde en mémoire chaque source lue pendant toute la session Rien n'est perdu ni oublié au fur et à mesure que la recherche se développe. Et c'est aussi pourquoi les questions de suivi posées plus tard sont si pointues. Je ne perds jamais la menace de ce qu'il a déjà enquêté. Et vous pouvez déjà deviner que vous n'avez pas besoin de rester assis là à regarder tout cela se produire. La recherche approfondie est asynchrone. Vous pouvez fermer l'onglet et retourner à votre travail, et Gemini vous indiquera quand votre rapport sera prêt Si vous utilisez l'application Web, vous verrez une notification apparaître à côté du fil de discussion dans votre barre latérale Et si l'application mobile Gemini est installée, vous recevez une notification push directement sur votre téléphone Et je viens de recevoir le mien. Notre rapport est prêt. Revenons donc aux Gémeaux pour y jeter un coup d'œil. C'est ce que fournit une recherche approfondie et remarquez ce qu'elle n'est pas. Il ne s'agit pas d'une liste de liens. Il ne s'agit pas d'un résumé à puces. Il s'agit d'une analyse structurée de plusieurs pages avec des sources citées, des sections organisées et des conclusions réelles. Vous pouvez agir sur la base du tableau des ingrédients à plusieurs niveaux que nous vous avons demandé, qui se trouve ici, niveau 1, niveau 2 et niveau 3, clair, exploitable et basé sur Et si vous êtes curieux de connaître l'une des sources, chaque réclamation contient des liens pertinents. Vous pouvez cliquer et lire vous-même la recherche originale. Je ne sais pas pour vous, mais il m'aurait fallu des heures pour lire toutes ces ressources et compiler le rapport manuellement. Et il est important qu' une recherche approfondie ne remplace pas votre jugement. Il fait ce travail de base fastidieux afin que votre jugement soit réellement plus éclairé Lors de notre prochaine conférence, nous effectuerons des recherches approfondies dans un contexte personnel et passerons en revue quelques exemples supplémentaires. Je t'y verrai. 37. La recherche en profondeur - Décisions d'achat: Dans cette conférence, nous allons examiner deux autres cas d'utilisation pour des recherches approfondies qui, je pense, vous seront immédiatement utiles dans votre propre vie. La première consiste à prendre une décision d'achat en toute confiance, et je vais utiliser un exemple très concret. Le second concerne l'apprentissage d' une matière totalement nouvelle. Je vais vous montrer quelque chose que je n'ai jamais montré auparavant. Comment transformer un rapport de recherche approfondi en infographie, quiz et en cartes flash sans quitter l'interface de recherche approfondie de Gemini. Commençons. Ma bague Aura Slip Tracking s'est récemment cassée. J'aimerais la remplacer, mais je ne sais pas si je dois simplement acheter la dernière bague de la même marque ou en profiter pour passer à quelque chose de mieux. Et il y a une fonctionnalité spécifique que je recherchais depuis des années. Alarme silencieuse vibrante consciente du cycle de sommeil qui vous réveille réellement au bon moment de votre cycle de sommeil, pas seulement à une heure fixe Utilisons des recherches approfondies en tant qu' assistant d'achat personnel pour parcourir les critiques et les articles en ligne. Voici mon message. Notez quelques points à propos de cette invite. C'est personnel. J'ai donné à des recherches approfondies le contexte réel ma situation et de ce que je recherche. J'ai inclus l'alarme vibrante, non seulement parce que je le voulais, mais aussi pour voir si Gemini peut filtrer les choix évidents Les bagues les plus populaires n'ont en fait pas de modèles de vibrations. Une recherche de base pourrait donc me donner une liste des dix meilleurs anneaux qui ne tient pas compte de cette exigence Des recherches approfondies devraient permettre de comprendre cela. L'invite contient un programme de recherche clair comportant trois tâches, et elle demande un format de sortie spécifique à la fin, un tableau des fonctionnalités, ce qui signifie que le rapport sera immédiatement utilisable, pas seulement le mur de texte. Choisissons une recherche approfondie parmi une liste d'outils. Je vais m'appuyer sur la recherche ici comme source principale, et je choisis le mode de réflexion. Et commençons. Gemini a préparé ce plan de recherche pour moi, et j'aimerais apporter une modification ici. Pour cela, je clique sur Modifier le plan Ensuite, je vais taper la modification que je souhaite que Gemini apporte au plan actuel Je souhaite que Gemini inclue également une marque spécifique dans ses recherches Nous constatons que la liste des marques a été mise à jour. Je suis maintenant d'accord avec ce plan, je vais donc l'approuver et commencer les recherches. Et dans quelques minutes, notre rapport sera prêt. Parcourons-le ensemble. Vous pouvez constater que des recherches approfondies ont permis identifier les trois meilleurs candidats, les analyser en fonction exactement des critères que j'ai demandés, y compris le système d'alarme intelligent vibrant et de produire le tableau de comparaison des fonctionnalités ici C'est le type de sortie qui nécessiterait normalement au moins une heure de changement de pression, fils de discussion prêts et une analyse de sites d' évaluation contradictoires. Je l'ai structuré en quelques minutes en fonction de ma situation et de mes exigences spécifiques. Et voici la liste des recommandations stratégiques de Gemini Un avis parce que je lui ai donné un contexte personnel dès le départ. Les recommandations ne sont pas génériques. Ils le filtrent en fonction de mes priorités réelles. Rapport qualité/prix, pas d'abonnement trop élevé et avertisseur de glissement, cela fonctionne vraiment. Il s'agit d'un excellent exemple d'utilisation de recherches approfondies pour prendre des décisions d'achat. Au lieu de vous noyer dans les options, vous repartez avec une liste restreinte claire et raisonnée Dans la deuxième partie de ce didacticiel, nous continuerons à explorer recherches approfondies pour un autre cas d'utilisation, ACA dans ce cas. 38. La recherche en action - Apprendre un nouveau sujet: Voyons maintenant quelque chose d' un peu différent. Utiliser des recherches approfondies pour accélérer votre apprentissage lorsque vous abordez une nouvelle matière. J'ai récemment commencé à étudier l'investissement immobilier. J'ai assisté à mon premier cours et j'ai pris quelques notes sur les sujets que nous y avons abordés. Je souhaite maintenant en savoir plus sur ces sujets grâce à des recherches approfondies. Je peux télécharger cette photo directement dans l'invite. Gémeaux Je lirai mes notes manuscrites, extrairai les principaux sujets et je les utiliserai comme base pour un rapport de recherche Je n'ai pas besoin de retaper quoi que ce soit. Laissez-moi vous montrer comment cela fonctionne. Tout d'abord, choisissons la recherche approfondie dans la liste des outils. Je vais passer en mode réflexion ici, taper mon invite, puis je joindrai mes notes manuscrites Ce que j'aime dans cette approche, c'est que la recherche est ancrée dans ce que j'ai déjà commencé à apprendre. Le rapport renforce et développe donc mes connaissances existantes plutôt que de partir de zéro Pour cela, j'ai spécifiquement demandé à Gemini de faire référence aux thèmes clés de mes notes, lors de la recherche et de la rédaction du rapport Et voici notre plan de recherche qui me semble parfait, alors je vais commencer la recherche. Et notre rapport est prêt. Vous pouvez voir qu'il a repris tous les sujets clés de mes notes et qu'il a construit une analyse structurée autour d'eux. Définitions, contexte, relations entre les concepts, implications pratiques. Nous pouvons utiliser ces informations comme complément d'étude, et pas simplement comme résumé. Mais c'est là que ça devient vraiment intéressant. Une fois que le rapport de recherche approfondi sera prêt, nous pourrons transformer ce mur de texte en outils d'apprentissage actifs. Vous remarquerez la création d'un bouton dans le coin supérieur droit du panneau Canvas. Cliquez dessus pour obtenir un menu déroulant avec plusieurs options pour transformer le rapport. Examinons d'abord les infographies. Gemini prend les informations complexes telles que la différence entre les actifs résidentiels et industriels dans notre exemple immobilier et les transforme en un résumé visuel C'est parfait pour un examen rapide et de haut niveau ou pour partager une page avec une partie prenante Revenons à notre rapport sur les tendances de l'investissement immobilier pour poursuivre la démonstration. Ensuite, pour nous assurer que les informations restent correctes, nous pouvons générer un quiz. Gemini crée des questions interactives basées spécifiquement sur le rapport Au fur et à mesure que vous répondez, il fournit un feedback immédiat, vous aidant à identifier exactement les domaines dans lesquels votre compréhension d'un nouveau sujet pourrait nécessiter plus de travail. I Et enfin, nous avons des flashcards Vous pouvez l'utiliser de deux manières. Vous pouvez générer un jeu complet de flashcards pour passer en revue tous les termes clés du rapport Mais si vous venez de terminer le quiz, comme dans notre exemple ici, Gemini peut générer des cartes basées spécifiquement sur les résultats de votre quiz Il cible les zones dans lesquelles vous avez eu du mal. Faisons-le. Nous voyons donc ici une boucle d'apprentissage complète , comprenez, testez-vous et renforcez vos connaissances au sein d'un seul outil Dans la prochaine vidéo, nous allons passer d'une recherche approfondie à un examen approfondi pour le découvrir, mais nous explorerons ses cas d'utilisation avancés, particulier la création d'applications d' IA Et à titre d'avertissement, nous allons utiliser les principaux points à retenir de l'un de nos rapports de recherche approfondis comme données d'entrée, notre application sera construite Et plus d'informations à ce sujet dans la vidéo suivante. 39. Au-delà des documents : que peut faire la toile d'autre ?: Bon retour. Lors de notre dernière conférence Canvas, nous nous sommes donc concentrés sur la rédaction de documents. Comment Canvas vous offre un espace de vie et de travail pour peaufiner l' écriture avec des Gémeaux juste à côté de vous Mais la rédaction de documents n'est vraiment que le début de ce que Canvas peut faire. Et vous en avez déjà vu une partie sans vous en rendre compte. N'oubliez pas que le bouton de création qui est apparu après votre rapport de recherche approfondi était Radium, les infographies, le quiz, les cartes flash, c'était Deep Research fournit son rapport directement dans Canvas , c'est pourquoi vous pouvez le transformer dans tous ces formats sans jamais changer d'outil. La recherche approfondie et Canvas sont intrinsèquement liés . Google les a conçus pour qu'ils s'intègrent parfaitement. Regardons donc une vue d'ensemble de ce que Canvas peut faire. La première chose que Canvas peut créer au-delà des documents, ce sont les pages Web. Et je ne parle pas de HTML brut avec du texte dessus. Je veux dire des pages interactives structurées avec des fiches d'information, des graphiques, des mises en page visuelles et des éléments cliquables Pensez à la dernière fois où vous avez dû partager un rapport ou un brief avec quelqu'un qui n'était pas censé lire un mur de texte. Avec Canvas, vous pouvez prendre le même contenu et dire, transformez-le en page Web ou cliquez simplement sur le bouton de la page Web. Et en quelques secondes, vous avez quelque chose qui ressemble vraiment à une vraie page. Vous pouvez le partager à l'aide du lien. Aucune configuration de publication ou d'hébergement n'est requise. Viennent ensuite les infographies. Si vous avez déjà essayé d'expliquer quelque chose de complexe à un intervenant non technique, un processus, une comparaison, cadre décisionnel, vous connaissez le défi. Les mots ne peuvent pas faire grand-chose. Canvas peut prendre votre contenu brut et le restructurer dans un format visuel Sections propres, morceaux faciles à digérer, icônes, comparaison côte à côte Et vous pouvez continuer à l'affiner dans le même graphique. Agrandissez la deuxième section, changez le ton pour qu'elle soit moins formelle et elle sera mise à jour en temps réel. Troisièmement, Canvas peut également générer des quiz interactifs et des cartes flash à partir de tout contenu que vous lui proposez C'est utile au-delà de la simple étude. Pensez à l'intégration du client, formation des équipes, à la vérification de la connaissance des produits. Vous décrivez ce que vous voulez et Canvas, créez un quiz interactif fonctionnel. Aucun outil tiers, aucun générateur de formulaires, aucune étape supplémentaire. Il existe également un mode audio. Canvas peut transformer le contenu écrit en un aperçu audio de style podcast, conversation entre deux animateurs IA qui discutent et résument votre contenu. C'est utile si vous souhaitez parcourir un long document pendant que vous travaillez ou partager les résultats avec des personnes qui préfèrent écouter plutôt que lire. Bienvenue dans le Deep Dive. Aujourd'hui, nous dévoilons une vision qui semble vraiment changer sous nos pieds. Nous sommes en train de dépasser la vieille idée d' un assistant intelligent qui se contente de régler des minuteries ou de jouer de la musique Nous étudions ce concept d'assistant universel. Un partenaire qui anticipe réellement ce dont vous avez besoin avant même que vous ne le demandiez Et puis il y a la solution la plus importante : Canvas peut créer des applications entièrement fonctionnelles, des logiciels fonctionnels. Vous décrivez ce que vous voulez, organisateur de recettes, un planificateur de voyage, un outil de quiz ou un outil de suivi du budget, et Canvas génère le code et l'exécute pour vous. Juste là, dans la fenêtre, vous ne voyez pas le code. Vous n'avez pas besoin de comprendre le code. Vous ne voyez qu'une application interactive fonctionnelle, et elle n'est pas statique. Vous pouvez continuer à discuter avec Gemini pour l'ajuster. C'est ce que l'on appelle le Vibe Coding. Créez un logiciel en décrivant ce que vous voulez plutôt qu'en écrivant du code ligne par ligne. Nous avons abordé ce concept dans la conférence Geni Implementation sur l'impact du cours Et maintenant, nous sommes sur le point de le voir vivre. Voici ce que j'aime le plus chez Canvas dans ce contexte. Il ne s'agit pas d'un outil de développement distinct. Il s'agit du même espace de travail que celui que vous avez déjà utilisé pour rédiger des documents et des plans. Le passage de la rédaction d'un document à la création d'une application n'est qu'une conversation. notre prochaine conférence exactement ce que nous allons faire lors de notre prochaine conférence. Nous allons reprendre là où nous nous sommes arrêtés. Nous avons utilisé des recherches approfondies pour finalement obtenir une réponse claire fondée sur des preuves sur la nutrition du petit-déjeuner. Et nous allons transformer cette recherche en une application de recettes de petit-déjeuner familiale qui suggère des repas rapides et sains pour les adultes et les enfants. Allons construire ça. 40. Suivi de suivi : Création d'une application avec Canvas - De la recherche à une application en cours d'exécution: Bon retour. Nous sommes ici en train de préparer le petit déjeuner par le chef, des repas rapides de moins de 20 minutes, adaptés aux familles avec des photos du repas fini. tout dans Gemini Canvas, aucun code, aucune formation technique requise. Juste une bonne invite et un peu de va-et-vient avec Gemini. Allons-y Pour que notre flux de travail reste organisé, nous allons suivre quatre étapes simples : identifier huit, créer, affiner et enfin partager. Et voici la première étape, iDED. Voici notre rapport de recherche approfondi sur la nutrition du petit-déjeuner. Réfléchissons avec Gemini à l'idée de l'ampli et à ce qu'il va J'ai quelques premières idées, mais je voudrais les développer. J'ai commencé par décrire le but de l'application. J'ai également indiqué que je voulais l'application utilise les résultats de la recherche, et j'ai fait référence au cadre complet TireedGrocery du rapport pour souligner que je n'ai pas besoin d' une liste aléatoire d'ingrédients pour les recettes Je veux que Gemini propose trois fonctionnalités intéressantes pour l'application, et je suggère également un look Aviall pour l' J'ai mis quelques mots descriptifs ici, comme amusant, chaleureux, accessible, pour indiquer l'orientation navale de ce que je veux voir Je cherche une description détaillée de l'application. Le concept, sur lequel nous pouvons commencer à créer l'application elle-même. Appuyons sur Entrée. Et voici la description de notre application. Demandons à Gemini d'apporter quelques modifications à ce concept. La première fonctionnalité, le chronomètre familial à chargement frontal, semble assez complexe, surtout pour la première version de l'application. Demandons donc à Gemini de le remplacer par quelque chose de plus simple. Question simple sur le type de repas préféré aujourd'hui. Et j'ajoute également des détails supplémentaires pour m' assurer que chaque fois que nous demandons une recette, nous en obtenons une nouvelle et que l'application utilise strictement les ingrédients recommandés dans notre rapport. Je vais donc appuyer à nouveau sur Entrée et voyons comment Gemini intégrera ces modifications Et voici la version mise à jour de la description de l'application. Je suis d'accord avec ce concept, mais avant de passer à la deuxième étape, à savoir créer l'application, nous devons vérifier nos paramètres. Regardez le sélecteur de modèle ici Vous pourriez être tenté par P. Il parle de mathématiques avancées et de code. Cela semble donc être le choix le plus puissant. Mais voici ce que j'ai découvert lorsque j'ai testé les deux lors de la création de cette application de petit-déjeuner auparavant. Pro a en fait rendu le processus plus difficile. Il m'a fallu plus d'allers-retours pour obtenir les résultats souhaités, et j'ai rapidement épuisé mes crédits P, ce qui m'a fait attendre quelques heures avant de pouvoir continuer. Le mode réflexion m'a permis d'y arriver plus rapidement. Voici donc ma recommandation. Commencez toujours par réfléchir. Il est conçu pour un raisonnement étape par étape, ce qui est exactement ce que nécessite la création d' applications. En utilisant la logique, la structure et le flux, économisez des avantages lorsque votre application doit fonctionner avec un grand volume de contenu provenant de sources multiples, documents, de vidéos, d' images, etc. Commençons par la deuxième étape, celle de créer l'application. Mes tests précédents montrent que si vous envoyez cette demande directement dans ce chat, Gemini ne démarrera pas le processus de création, mais vous enverra à nouveau la description du concept de l'application. Oui, c'est ce qui s'est passé cette fois également. Vous voyez qu'au lieu de créer l'application, Gemini a simplement apporté quelques modifications au rapport lui-même, et ce n'est pas ce dont nous avons besoin Donc, pour lancer le processus de création du logiciel d'application, pas seulement une description textuelle, cliquez sur Créer et décrivez votre propre section d'application, écrivez ceci Créez une application en vous basant sur la description ci-dessus. Vous voyez que Gemini affiche cette commande dans la description de notre application ici, et il commence à la créer Et pendant que Gemini développe l'application, permettez-moi de répondre à une question que vous vous posez probablement en ce moment Et si je ne partais pas d'un rapport de recherche approfondi ? Et si je voulais simplement créer une application à partir de zéro ? Dans ce cas, commencez par ouvrir un nouveau chat. Mais avant de taper quoi que ce soit, passez d' abord en mode Canvas. Voici pourquoi. Gemini ne peut créer et exécuter des applications que dans Canvas. Il s'agit d'un espace de travail dédié spécialement conçu pour cela. Une discussion régulière peut vous aider à réfléchir à des idées, mais elle ne peut pas réellement créer une application fonctionnelle. Une fois dans Canvas, réfléchissez à votre idée d'application avec Gemini Décrivez ce que vous voulez construire, quoi il sert et ce qu'il doit faire. Lorsque vous êtes prêt à commencer à construire, cliquez sur le bouton Créer, saisissez votre invite et Gemini se mettra au travail Bon, revenons à notre démo. Et notre application est prête. Nous commençons par choisir comment nous nous sentons aujourd'hui et quel type de repas nous préférons. Et Gemini suggérerait un repas sain. En conséquence, nous voyons ici une liste d'ingrédients, suivie d'instructions sur la façon de préparer le repas. Nous avons une excellente mousse illustrant ce que nous allons manger Et nous pouvons également choisir un mode chef pour enfants afin d'avoir une liste de tâches pour nos jeunes assistants. Plutôt mignon. Passons maintenant à la troisième étape, affiner. Comme vous pouvez l'imaginer, nous n'en avons pas terminé ici. Nous pouvons continuer à itérer et à améliorer notre application. Disons que je souhaite ajuster certaines choses. Je vais taper mes demandes dans le chat. Vous venez de me voir introduire plusieurs modifications dans notre application. Lorsque vous le faites, introduisez une modification à la fois, plutôt que d'essayer de tout inclure dans une seule invite. Permettez-moi d'apporter plusieurs autres modifications à notre application. Voici la version que j'ai reçue jusqu'à présent. J'ai décidé d'ajouter la possibilité d'inclure d'autres ingrédients en plus de la liste prédéfinie. Et s'il s'agit d'un produit appartenant à la catégorie 3, un message pertinent s'affichera, mais la recette sera tout de même créée. J'ai également ajouté la possibilité de sauvegarder une recette dans les favoris , accessibles ici. Enfin, j'ai ajouté le bouton de réinitialisation au cas où nous voudrions tout recommencer et choisir différents ingrédients. Comme vous pouvez le constater, nous avons pu apporter de nombreux changements simplement en discutant avec Gemini avec désinvolture , sans aucun codage Je suis satisfait de nos progrès actuels et de l'expérience utilisateur que nous avons créée. Dans la deuxième partie de ce didacticiel, je vais vous montrer une autre méthode pour apporter modifications à votre application à l'aide de la barre d'outils Canvas. Et nous verrons également comment le partager avec d'autres. Je vous verrai dans la deuxième partie. 41. Suivi : créer une application avec une toile - Affiner et partager: Tout le monde Bienvenue dans la deuxième partie du didacticiel, où nous explorons comment créer un logiciel fonctionnel en décrivant ce que nous voulons plutôt que d'écrire du code ligne par ligne, le processus connu sous le nom de vibe coding. Comme promis, je souhaite vous montrer une autre option pour apporter modifications à votre application dans le cadre de notre étape affinée Notez cette barre d'outils Gemini Canvas. Découvrons ce qu' il peut faire pour nous. Commençons par cette icône scintillante. Il s'agit de l'injecteur de fonctionnalités AI. Il ajoute des fonctionnalités EI à votre application. Lorsque vous cliquez dessus, Gemini analyse l'affichage actuel de votre application et suggère des composants intelligents, tels qu'une barre de stockage basée sur l'IA ou une génération de texte et d' images, puis injecte ces éléments directement dans la logique de votre application Demandons à Gemini d'ajouter des fonctionnalités d'IA et de voir comment cela fonctionne. Dans le chat de gauche, Gemini donne un aperçu des fonctionnalités d'IA ajoutées à l'application Nous pouvons répondre dans le chat et demander à Gemini d'apporter des modifications supplémentaires Mais d'abord, essayons ces nouvelles fonctionnalités. Voici la fonctionnalité magique numéro deux. Nous voyons que Gemini I a proposé ingrédient plus diététique au lieu de celui que je viens de sélectionner, mais je ne l'ai pas pour le moment Je vais donc simplement cliquer sur Annuler et continuer avec ces trois Voici la carte de sagesse de l'IE plutôt sympa. Et bien sûr, nous allons essayer le fonctionnement du narrateur audio Levez-vous et brillez. La mission d'aujourd'hui est d'admirer les nuages d'épinards et d'avocats sur le côté ensoleillé. Les épinards riches en fer associés aux acides gras mono et saturés de l'avocat fournissent un regain d'énergie propre qui vous permet de vous sentir agile et rafraîchie Apportons une modification à l'une des fonctionnalités. Gemini confirme que le changement a été effectué, alors testons-le Respirez profondément et commençons la journée. Votre recette d'aujourd'hui est l'Emerald Cloud Nest. La combinaison d' épinards riches en fer et de graisses monoinsaturées provenant de l'avocat assure une lente libération d'énergie, ainsi de vous sentir légère et aérée. Wasson, nous venons de voir comment Gemini a suivi nos instructions, et je suggère que nous revenions à la barre d'outils de Gemini Canvas et que nous l'explorions La prochaine fois que j'entends, c'est la poignée. Il est utilisé pour déplacer l'atolbr afin de ne pas bloquer la navigation de votre application lors de la dégustation Et il existe également une troisième icône, l'outil de raffinement, qui indique à Gemini de modifier un élément spécifique de votre application Vous remarquerez peut-être qu'il n' est pas visible ici dans notre application Golden Hour. C'est en fait intentionnel. Gemini reconnaît que cette application a subi suffisamment d'itérations, sorte que de petites modifications automatisées peuvent S'il essaie de modifier un élément mais qu'il interprète mal le contexte, il risque de casser un autre élément qui en dépend Il masque donc l'icône comme mesure de protection pour montrer le fonctionnement de l'outil de raffinement. Passons à une application plus simple. J'ai commencé à construire avant d'enregistrer ce tutoriel. Je n'y ai fait que quelques itérations, donc l'icône est disponible. Disons que je souhaite changer la couleur de ce bouton. Je choisis donc sélectionner et demander, surligne ce bouton, puis je saisis mon invite suggérer une autre palette de couleurs. Je remarque ce qui s'est passé ici. Au lieu de changer uniquement ce bouton, la couleur, Gemini a repensé l'ensemble de l'application. Pourquoi est-ce le cas ? Il s'avère que c'est la palette de mots qui pose problème ici. Une palette de couleurs fait référence à l'ensemble des couleurs utilisées dans votre application. Gemini prend donc cela lettre et met à jour tout pour correspondre Cela ne fait rien de mal. Il s'agit simplement de suivre vos instructions à la lettre. Pour modifier uniquement la couleur de ce bouton, vous devez décrire clairement l'étendue de la modification. Laissez-moi vous montrer comment. Je sélectionne à nouveau le bouton et je saisis une autre invite. Vous voyez que mon message détaillé a fonctionné, et cette fois, Gemini a appliqué les modifications à l' élément que j'ai indiqué via l'outil de raffinement C'est une chose vraiment utile à garder à l'esprit. Plus votre demande est précise, plus le résultat est précis. Revenons à notre application Golden Hour. Maintenant que nous avons expliqué comment affiner et ajuster votre application. Parlons de ce qui se passe lorsque vous en êtes satisfait. Quatrième étape, partagez. Une fois que vous avez terminé, vous pouvez obtenir un lien partageable et l' envoyer à n'importe qui Ils peuvent ouvrir et utiliser l' application directement dans le navigateur. Aucun téléchargement, aucun signe, aucune configuration technique de leur côté. Ils peuvent même le remixer. C'est l'une des fonctionnalités que Google a intégrées à Canvas. Quelqu'un peut prendre votre application, l'ouvrir et créer sa propre version à partir de celle-ci. C'est bon. Et c'est tout pour ce didacticiel Merci de partager les applications sur lesquelles vous travaillez dans la section questions-réponses de cette vidéo J'adorerais voir ce que tu es en train de construire.