Transcription
1. Bienvenue au cours sur l'IA de Google Gemini !: Tout le monde, et bienvenue au
cours sur Google Gemini. Saviez-vous que Google
Gemini a officiellement dépassé les 750 millions d'utilisateurs actifs par
mois Cela représente près des trois quarts
d'un milliard de personnes. Pour mettre les choses en perspective, la croissance de
Gemini
dépasse actuellement celle de presque tous les autres chatbots basés sur l'
IA sur le marché, comblant ainsi l' écart avec ChatGPT Mais ce n'est pas qu'une question de chiffres, car Gemini
est créé par Google C'est aujourd'hui l'IE la plus
intégrée au monde. Il se trouve dans votre Gmail, votre Google Docs,
votre navigateur Chrome et votre téléphone portable. Cela représente le plus grand
changement dans notre façon de travailler et de créer depuis l'
invention d'Internet. Nous nous dirigeons vers un monde où l'IE ne se limite pas à l'utiliser. C'est un collaborateur qui
est déjà là où vous travaillez. m'appelle Anna et je serai votre instructrice pour ce cours. Instructeur en ligne
avec mes autres cours disponibles ici sur la plateforme, axés sur la
gestion des produits et l'IA générative. En participant à ce cours, vous aurez accès à plus de
4 heures de contenu HDVdo, didacticiels et à des
activités
étape par étape mettant en lumière le monde
réel, des applications
pratiques des outils Gemini, des résumés
PDF pour passer en revue les principaux enseignements du
cours et bien plus encore Nous commencerons par découvrir de
quoi Gemini est capable, comment communiquer avec lui
et structurer vos demandes,
et comment faire en sorte que Gemini
fonctionne le mieux pour À partir de là, nous passerons en
revue des scénarios utilisant Gemini pour réfléchir à des idées et
obtenir des commentaires professionnels Créez vos propres systèmes d'IE
personnalisés pour des tâches spécifiques et
générez des visuels de haute qualité Nous aborderons également des techniques
avancées telles que la recherche
approfondie pour transformer des tâches
complexes en
rapports détaillés et la création applications
entièrement fonctionnelles simplement
en décrivant ce que vous voulez. Aucun codage n'est requis. Et nous
veillerons à ce que vous sachiez comment détecter et empêcher les
réponses incorrectes de l'IA, afin que votre travail soit toujours précis. Et oui, vous n'
avez pas besoin de connaissances techniques ou de connaissances préalables en IA pour
commencer le cours. Commençons donc Ilsa
dans la vidéo suivante.
2. Qu'est-ce que Gemini ? Comprendre l'écosystème d'IA de Google: Tout le monde, et bienvenue
au premier cours. Repensez à tous les films de
science-fiction que vous avez vus. Il y a toujours
un personnage, un assistant qui ne se
contente pas d'attendre une commande, mais qui comprend vraiment
le monde du héros. Il anticipe les
problèmes avant qu'ils ne surviennent et agit comme
un véritable partenaire Pendant des années, ce n'
était que de la fiction. Mais avec Gemini, nous nous
rapprochons de plus en plus d' un avenir où ce type de partenariat
deviendra réalité Alors, qu'est-ce que Gemini ? J'aime l'imaginer comme les
trois couches d'une maison les fondations, le cerveau. Ce sont les modèles Gemini eux-mêmes conçus par le laboratoire de
recherche Deep Mind de Google Dans ce cours, nous utiliserons la dernière génération
de modèles Gemini Cela inclut des modèles de raisonnement de haut
niveau pour une logique complexe, outils de génération d'images
avancés pour des visuels photoréalistes et des modèles vidéo de nouvelle
génération capables générer des
scènes haute définition avec Ces modèles sont nativement multimodaux, ce qui signifie qu'ils
ne se contentent pas de traiter du texte. Ils voient ici et réfléchissent sur tous les supports à la
fois, tout comme nous. Pour en revenir à l'analogie de
la
maison, le deuxième niveau est l'espace de
vie, l'assistant. C'est ici que nous
passerons le plus clair de notre temps dans l'application de votre téléphone et sur le site Web
gemini.google.com C'est un espace créatif
où vous pouvez discuter avec des codes et utiliser des outils tels que Jams pour
personnaliser le comportement de l'IE. Enfin, la troisième couche
est l'infrastructure. C'est Gemini qui vit
dans Gmail, Google Docs et Search. C'est la
vue d'ensemble de l'IE qui résume les résultats de
votre recherche ou le bouton
Aidez-moi à rédiger qui
rédige Dans ce cours, nous nous concentrons sur couche intermédiaire,
cette GeminieIsistet La vision de Google à
ce sujet est centrée
sur les trois éléments suivants :
personnel, proactif et puissant. Voyons ce que cela signifie. Tout d'abord, c'est personnel. La plupart des modèles d'IA sont des généralistes. Ils en savent beaucoup sur le monde, mais très peu sur vous. Gemini est conçu pour être
votre extension personnelle. Avec votre permission,
il peut se connecter à votre
contexte personnel, à vos e-mails, vos fichiers et à votre
historique pour
vous fournir une aide particulièrement
adaptée à votre vie. Deuxièmement, il est proactif. Aujourd'hui, la plupart des IA sont réactives. Vous lui demandez des réponses. L'avenir des Gémeaux
consiste à voir ce qui va arriver. Si vous avez une
présentation à un gros client vendredi, Gemini ne doit pas simplement vous
rappeler qu'elle est imminente Il devrait consulter votre calendrier
une semaine à l'avance et indiquer : « J'ai remarqué que votre réunion stratégique avec l'entreprise A a lieu vendredi, sur base de la proposition contenue
dans votre dossier et de la dernière
menace par e-mail concernant son équipe ». Voici le dossier de préparation et les trois questions auxquelles
vous serez probablement confronté. Troisièmement, il est puissant. Grâce aux dernières
avancées de Gemini, nous allons au-delà simple génération de texte vie à des
choses, qu'il s'agisse de créer
un site Web complet à partir une seule invite ou de créer vidéo
cinématographique pour une Le pouvoir qui nécessitait auparavant toute
une équipe de spécialistes
est désormais à portée de main. Mais avoir tous ces pouvoirs
ne signifie pas que je suis responsable. Il est important de se rappeler que même lorsque Gemini est
proactif, il prend toujours les devants Il n'a pas son propre
programme secret ni ses propres croyances. Il est conçu pour
suivre les ordres. Vous le donnez par le biais de vos
instructions et de vos préférences. Ainsi, qu'il s'agisse
de votre chercheur, votre codeur ou de votre collaborateur
créatif, vous êtes toujours
aux commandes La productivité ne signifie pas que l'
IE fait ce qu'elle veut. C'est l'IE qui
anticipe ce
dont vous avez besoin car vous avez
déjà défini l'objectif Maintenant que nous avons exploré la vision et l'architecture, il est temps de passer de
la théorie à la pratique. Dans la prochaine conférence, nous examinerons de plus près les différents modèles spécialisés
pour le raisonnement, les images et les vidéos. Et je vais également
vous montrer comment configurer votre compte avec Gemini.
Je t'y verrai.
3. Rencontre avec la famille des modèles Gemini: Lors de la dernière conférence,
nous avons parlé Gémeaux en tant que maison à trois niveaux le cerveau, l'assistant
et le moteur intégré Maintenant,
approfondissons ce cerveau d'un niveau. La plupart des anciens modèles EI
étaient d'
abord entraînés sur le texte , puis étaient
dotés d'autres fonctionnalités supplémentaires. Gemini a été conçu différemment dès le départ
pour être multimodal Cela signifie qu'il ne
se contente pas de lire la description d'une vidéo, je comprends la vidéo, le son, les
images et le texte en même temps. Que vous téléchargiez un PDF de
1 000 pages, une vidéo d'une heure ou
une énorme base de code, Gemini traite le tout
dans un seul espace unifié Il ne s'agit pas de traduire secrètement des images en texte dans les
coulisses, mais de les voir directement. Lorsque vous ouvrez Gemini
sur geminiggle.com, vous remarquerez Considérez-les comme des modes
différents, chacun vous redirigeant vers un modèle
sous-jacent différent que Google a optimisé pour
un type de tâche spécifique. La gamme complète de modèles
Google est vaste, mais pour un usage quotidien, ce sont ceux que vous
utiliserez le plus. Avant de les parcourir, un petit mot sur ce qu'est
réellement un mannequin .
Considérez-le comme un spécialiste, vous recrutez pour un emploi. Chaque modèle a été
entraîné différemment, alimenté par différents types de données et optimisé pour
différents points forts. Lorsque vous choisissez un mode dans Gemini, vous
choisissez essentiellement à quel spécialiste confier votre tâche Fast est notre sprinter
rapide et conversationnel. C'est le spécialiste que vous recherchez lorsque vous avez besoin
d'une réponse instantanée. Un résumé rapide ou une aide à
la rédaction d'un message rapide. Il est optimisé pour la rapidité et gère un
volume élevé de demandes. Ne l'utilisez simplement pas pour quoi que ce soit qui nécessite un raisonnement approfondi en plusieurs
étapes. La pensée est notre stratège. Ce spécialiste fait une pause
avant de répondre
, élaborant sa logique avant de vous
donner une réponse. Si vous avez un problème complexe, plan en
plusieurs étapes
à résoudre ou une question
nuancée à laquelle une
réponse rapide risque de vous tromper C'est celui qui
réfléchit avant de parler. Pro est notre expert. Vous l'utilisez lorsque la tâche
est complexe, qu'il s'agisse de recherches approfondies, d'
analyse d'un document volumineux, rédaction
avancée qui doit trouver le ton exact. Pro utilise le modèle
sous-jacent le plus performant de la gamme, ce qui signifie qu'il peut contenir
plus d'informations à fois et capter plus de nuances que les autres
modèles pourraient manquer. Le compromis est
qu'il est plus lent et que ses limites
d'utilisation quotidienne sont inférieures. Conservez-le donc pour
les tâches réellement nécessaires. Ces trois modèles de langage Fast Thinking et Pro sont des modèles de langage Gemini Ce sont eux qui alimentent
la conversation. Mais la famille Gemini
ne s'arrête pas là. Il inclut également des modèles
dédiés à génération d'images et de vidéos, et vous les déclenchez simplement en
utilisant les
commandes de génération d'image ou de
génération vidéo directement dans votre chat ou dans l'interface
Gemini Lorsque vous le faites, Gemini
confie discrètement la tâche au bon
spécialiste dans les coulisses, et nous rencontrerons ces spécialistes
plus tard dans le cours Maintenant, une fois que nous aurons déterminé avec
quels modèles nous
allons travailler, laissez-moi vous expliquer comment accéder
à Gemini
4. Configuration de Gemini et de votre premier chat: Accédez à Gemini Dot Google Forward Slash
Abonnements pour voir les plans actuels et attention, les prix et la disponibilité
varient selon Ce que vous voyez sur votre
écran peut donc sembler un peu différent de
ce que je montre ici. Le forfait gratuit vous donne un accès
quotidien à Gemini. C'est un bon point de départ et ne
nécessite rien
de plus qu'un compte Google. Google AI plus
vous donne un meilleur accès
aux modèles et fonctionnalités les plus performants, y compris la génération améliorée d'images
et de vidéos, et vous aurez accès
à Gemini dans Gmail, ainsi qu'à Google MIT Google AI Pro va encore
plus loin avec limites d'utilisation
plus élevées :
Gemini dans votre Gmail, Google MIT Docs, ainsi que diapositives et deux téraoctets
de stockage dans le cloud Enfin, Google AI
Ultra est le meilleur niveau. Il vous offre les limites
d'utilisation les
plus élevées, ainsi qu'un accès anticipé exclusif
aux nouvelles fonctionnalités de Google. Je vous recommande d'utiliser
Google AI à condition qu'il
propose un essai gratuit, ce qui signifie que vous pouvez
suivre gratuitement tout ce que je montre ici dans le cours montre ici dans le cours
pendant le premier mois. Et après ce mois d'essai gratuit, vous pouvez décider si vous souhaitez continuer avec votre
abonnement passer à Google Plus ou revenir à
l'abonnement gratuit Pour commencer, sélectionnez
votre plan d'adhésion, cliquez sur Commencer. Ensuite, vous devez fournir un mode de
paiement pour l'essai, mais vous ne serez pas
débité si vous annulez ou rétrogradez avant
la fin du mois Une fois connecté, voici
ce que vous voyez dans le coin
supérieur droit, vous voyez votre plan d'adhésion. Pro, si vous
décidez de vous abonner
à AI Pro
ou si vous décidez de poursuivre avec
ce plan, au centre de
l' écran se trouve votre principale
entrée de discussion sous la barre de saisie, vous remarquerez une rangée
de boutons de démarrage rapide. Ce ne sont que des raccourcis pour
vous aider à démarrer rapidement. Vous verrez également
un sélecteur de mode. Il s'affiche actuellement rapidement. Il s'agit du sélecteur de modèle dont
nous venons de parler. Cliquez dessus pour passer de Fast Thinking ou Pro en
fonction de vos besoins. Sur le côté gauche, cliquez sur l'icône du menu ouvrir la barre latérale dans laquelle
vous trouverez l'historique de vos discussions Vous pouvez également démarrer une
nouvelle discussion à partir d'ici. Essayons de le faire. Je le garde
en mode rapide pour ce chat, car je vais poser une question
simple. Je commence le cours sur les
Gémeaux en fonction de la date d'aujourd'hui. Quelles sont les trois
dernières mises à jour majeures publiées par
Google pour
l'écosystème Gemini ? Je demande à Gemini de faire une
recherche sur le Web pour les vérifier et les résumer pour
moi. Appuyons sur Soumettre. Notez que les Gémeaux ne répondent pas
simplement de mémoire. Il sort et effectue des recherches sur le
Web en temps réel, puis m'
apporte les résultats pertinents pour aujourd'hui lorsque j'
enregistre ce didacticiel. Voici les trois modifications les plus
récentes introduites par
Gemini
le mois dernier Et, bien sûr, nous allons en
parler ici dans le cours. Dans la section suivante, nous
allons utiliser tout ce que nous
venons de configurer ici, en commençant par la rédaction d' une bonne invite.
Je t'y verrai.
5. Donner de meilleurs résultats à Gemini : section Intro: Bienvenue dans la nouvelle section
consacrée à l'ingénierie rapide. C'est dans cette partie du cours vous acquérez une
compétence qui rend chaque outil d'IA plus
utile : comment rédiger des instructions qui vous
donnent constamment d'excellents résultats Nous allons commencer par définir ce
qu'est une invite, ce que signifie une invite et comment ingénierie
rapide s'inscrit
dans le contexte global. Ensuite, nous examinerons deux modes. n'y a aucune invite dans le chat ni
dans les
instructions de production lorsque vous concevez des
instructions destinées à être réutilisées. Ensuite, je vais vous expliquer une formule d'
incitation simple Vous pouvez l'utiliser pour presque tout. Vous vous entraînerez également à
formuler des instructions itératives, à vous appuyer sur des réponses
antérieures et à améliorer le
résultat étape par étape Vous apprendrez à vous
guider à l'aide d'exemples, à demander le format de
sortie exact que vous souhaitez et à travailler avec des
fichiers et des pièces jointes. Et bien entendu, nous
utiliserons des instructions multimodales. Man et votre invite peuvent
inclure du texte, des documents, des captures d'écran et des liens. À la fin de cette section, vous serez en mesure d'
utiliser ces compétences d'incitation dans le cadre de tâches réelles liées au travail ou à des projets
personnels. Commençons
6. Qu'est-ce qu'une invite ? Invitation, ingéni: Tout le monde Pense à la dernière fois que tu as posé une question à quelqu'un. La façon dont vous avez formulé
cette question a probablement influencé la
réponse que vous avez reçue C'est exactement ce à quoi nous
assistons aujourd'hui dans le monde de l'IA. Nous allons commencer par décrire
trois termes clés
essentiels à la communication
avec les systèmes d'IA. Qu'est-ce qu'une invite exactement ? Qu'entendons-nous par « inviter » ? Et comment l'ingénierie rapide permet-elle
de réunir tous ces éléments ? Nous explorerons également cette
distinction entre chat et les
messages d'entreprise. Commençons. Une invite est l'entrée
que vous donnez à une IA, vos instructions, ce que vous voulez et le contexte que vous fournissez. Du texte, des fichiers, des images,
des liens, des exemples ou des données. Considérez-le comme le
moteur de la réponse de l'EI. L'incitation est l'acte d'
écrire ces instructions. Il s'agit de l'
activité générale qui consiste à interagir avec les modèles d'IA et à leur donner des
instructions. Il s'agit du processus de
communication avec le modèle. L'ingénierie rapide est une approche
plus spécialisée et
systématique pour créer et
affiner des instructions. Cela implique de
comprendre le raisonnement du modèle, tester et d'itérer selon les instructions et de prendre en
compte les cas He Pense à ça comme à la cuisine. Une invite, c'est comme
une recette unique. Promptin ressemble à
la cuisine en général, et l'ingénierie rapide, c'est comme être un chef
professionnel qui développe et teste
systématiquement des recettes en
tenant compte des ingrédients, équipement, des
préférences des utilisateurs, etc. Maintenant, il existe deux principaux types d'instructions que vous
devez connaître instructions personnelles et les instructions
de production ou
d'entreprise Les suggestions personnelles sont ce que
la plupart des gens font dans un chat. Vous rédigez une demande,
l'IA répond et vous pouvez continuer à l'affiner par
le biais d'une conversation. C'est flexible et informel. Si votre premier message n'est pas
parfait, ce n'est pas grave. Il vous suffit de faire un suivi, de
clarifier et d'itérer. Par exemple, demander à N
AI de vous aider à rédiger un e-mail, à réfléchir à des idées ou à résumer un document
dans l'interface de discussion C'est une incitation personnelle. instructions de production ou d'entreprise, en revanche,
concernent la conception d'instructions destinées
à être réutilisées par vous-même,
par une équipe ou dans le cadre d'un
produit ou d'un flux de travail L'objectif n'est pas d'obtenir
une seule bonne réponse,
mais aussi d'obtenir des résultats cohérents sur
de nombreuses séries et de nombreuses entrées. Par exemple, imaginez un assistant de support
client sur le site Web d'une entreprise. Il doit répondre de manière fiable à des milliers de
questions des clients,
y compris aux entrées MC, telles que les fautes de frappe, les demandes imprécises
ou les informations manquantes Dans ce contexte, les instructions
doivent être plus structurées, plus prévisibles
et plus fiables C'est pourquoi les instructions de production incluent
généralement des règles claires, format de sortie
plus strict et
davantage de garde-fous, car elles sont conçues pour fonctionner à plusieurs reprises, et
non une seule En d'autres termes, les instructions
personnelles
ou les instructions par chat vous aident à obtenir d' excellents résultats en premier, tandis que les instructions de
production vous aident à
obtenir des résultats fiables Pourquoi
parle-t-on tant de cette distinction entre incitation personnelle
et incitation à la production Parce que la façon dont vous
rédigez et affinez les instructions change en
fonction du paramètre Si vous recherchez des informations supplémentaires
sur les instructions, vous trouverez souvent des conseils conçus pour une utilisation en
production, instructions qui doivent fonctionner de
manière fiable pour de nombreux utilisateurs, nombreuses entrées et de
nombreux cas particuliers. C'est très utile
lorsque vous créez des flux de travail
reproductibles ou que vous
intégrez l'IE dans un produit Mais si votre principal cas
d'utilisation consiste simplement utiliser une IA dans un chat pour
obtenir de l'aide pour le moment, vous n'avez pas besoin de trop compliquer alors gardez cette
distinction à Dans ce cours, nous nous
concentrerons principalement sur les instructions
personnelles
dans une interface de chat Maintenant que nous sommes sur la même longueur d'onde en ce qui concerne
la terminologie, passons à l'
aspect pratique de l'incitation personnelle Allca lors de la prochaine conférence.
7. Comment parler à Google Gemini IA : les éléments constitutifs d'une invite efficace: Tout le monde. Bienvenue à notre première
conférence sur les messages instantanés. Ici, vous apprendrez
comment
créer et affiner des invites pouvant être utilisées dans
l'interface de chat Commençons. Lorsque vous discutez avec un ami, vous n'utilisez pas de modèles rigides
ni de structures formelles. Vous avez une conversation
fluide et naturelle. Le même principe s'applique à l'envoi de messages par
chat avec des modèles d'IA Cependant, il
arrive qu' un peu de
structure puisse nous aider à obtenir de meilleurs résultats et rendre une invite plus
efficace qu'une autre. Passons donc en revue les ingrédients
clés d'un prompt efficace. La partie centrale de chaque invite est l'intention ou la tâche
principale. Cela peut prendre la
forme d'instructions, telles que la rédaction d'un e-mail de cinq
paragraphes pour présenter une nouvelle
application de productivité aux propriétaires de petites entreprises, accent sur ses fonctionnalités
permettant de gagner du temps. Considérez les instructions comme la tâche que vous souhaitez que le
modèle exécute. L'intention peut également
prendre une autre forme : quelles étapes dois-je suivre pour créer un profil
Linkin convaincant Ou comment structurer un
plan d'affaires pour une idée de démarrage ? Lorsque vous rédigez une tâche, votre objectif est d'être clair et précis quant à ce que vous
souhaitez accomplir. Écrire quelque chose comme « Aidez-moi
à faire une présentation »
ne suffira pas pour obtenir un
document de haute qualité que vous pourrez présenter
en toute confiance
à votre patron, collègues ou à vos investisseurs En règle générale, n'
oubliez pas que toute personne n'ayant aucune connaissance
spécifique de
votre sujet doit être capable de comprendre
votre demande et de l'exécuter. S'ils ne savent pas comment suivre
vos instructions, le système d'assurance-emploi le
sera également. Ne partez pas du principe qu'il contient des
informations contextuelles sur votre tâche, telles que la manière dont les
résultats seront utilisés le public cible À quoi
ressemble
une tâche réussie ou une liste de points
que vous n'aborderez pas. Vous devez fournir vous-même le contexte
ou
les détails de la tâche. Par exemple, si vous
souhaitez créer une présentation, incluez des informations sur
le nombre de diapositives, le but de la présentation les principaux sujets à aborder. Voici un exemple
d'invite bien conçue. Créez une présentation de sept
diapositives sur le thème de l'image de marque
personnelle. Indiquez ce que c'est, les grands compteurs, les composants
clés et les étapes
à suivre pour développer votre marque. Ou autre exemple,
expliquez comment rédiger un e-mail convaincant
en cinq étapes simples. Les instructions doivent couvrir élaboration et l'engagement de la ligne d'
objet, la
structuration claire de l'e-mail et l'utilisation d'un ton professionnel Simplifiez le processus
suffisamment pour que tout le monde puisse suivre, même sans
expérience préalable en rédaction officielle. Vous pouvez fournir un contexte, non seulement pour la tâche elle-même, mais également pour le ton que
vous souhaitez utiliser. Par exemple, adoptez un ton de
conversation qui concilie professionnalisme et
accessibilité Vous pouvez également définir des règles ou des contraintes que le
système IE doit suivre. Par exemple, dans le guide de
rédaction d'e-mails dont nous venons de parler,
vous pouvez ajouter : lorsque
votre message implique des
allégations factuelles telles que vous pouvez ajouter : lorsque des statistiques, événements
actuels, les caractéristiques
du produit, informations
juridiques ou médicales ou tout autre élément pour lequel la précision est
vraiment importante, deux ingrédients
supplémentaires peuvent
améliorer considérablement le résultat. Le premier est le reality
check, également appelé grounding. C'est à ce moment-là que
vous le dites à l'IE. Ne vous contentez pas de paraître
confiant, soyez vérifiable. Vous pouvez donc ajouter une
règle comme si vous faites des allégations factuelles,
citez des sources et me dites ce dont vous n'
êtes pas sûr, le deuxième ingrédient
est le raisonnement. De nombreux sujets
changent rapidement : outils, fonctionnalités
tarifaires,
politiques, meilleures pratiques. Il est donc utile de dire à l'IE
quelle fenêtre horaire utiliser. Par exemple, utilisez les sources
des 12 derniers mois, sauf si toutes
les ressources sont requises. Voici à quoi cela ressemble
lorsque vous ajoutez les deux à une invite. Ces deux ajouts
sont particulièrement utiles lorsque vous utilisez l'IA pour la
recherche ou la prise de décision, pas seulement pour la rédaction,
car ils poussent la réponse à une réponse claire
sur ce qui est prouvé, ce qui est actuel et
ce qui est incertain. Une autre façon d'améliorer
votre invite consiste à attribuer un rôle spécifique
lors de l'exécution d'une tâche. C'est ce que l'on appelle également
l'invite à jouer un rôle. jeux de rôle aident les modèles d'
IA à adopter les nuances de points de vue
spécifiques, améliorant ainsi la pertinence et la
qualité de leurs réponses. Par exemple, agissez en
tant qu' assistant exécutif chevronné avec plus de 15 ans d'expérience la gestion de correspondance
commerciale de haut niveau ou prétendez être un rédacteur
professionnel devenu consultant en rédaction de courriels. Vous pouvez aller encore plus loin en
fournissant
un contexte au public en plus du
rôle. Par exemple, remarquez comment l'IE adapte
les exemples de choses à faire et ne pas faire pour les rendre
pertinents pour les professionnels techniques C'est plutôt incroyable. Et si vous vous sentez dépassé par l'idée de créer un message aussi
détaillé, ne vous inquiétez pas L'avantage de travailler dans une interface de chat
réside dans le fait que vous n'
avez pas besoin de concevoir une invite parfaitement réfléchie pour
démarrer la conversation. Vous pouvez commencer par une question ou une tâche
générale et l'affiner en
dialoguant avec le modèle de l'IE. Cette approche itérative vous
permet de clarifier vos besoins et d'améliorer les réponses que vous
recevez au fil du temps. Nous parlerons plus détail des instructions interactives
dans notre prochaine vidéo, et pour l'instant, résumons ce nous avons parlé
dans cette conférence
8. S'appuyer sur les réponses de Gemini : invite itérative: Bienvenue à tous. Si, après avoir visionné la conférence
précédente, vous avez l'impression que créer une bonne
invite est une tâche ardue et que vous devez vous transformer en ingénieur rapide pour
réussir dans ce travail Voici un secret utilisé
par les experts. Considérez les questions posées comme une conversation ou un processus en
plusieurs étapes, non comme une question ponctuelle Tout comme vous pouvez clarifier itinéraire dans une nouvelle
ville avec un local, vous pouvez affiner vos instructions en
fonction des réponses de l'IE Passons en revue un exemple
concret d'invite itérative
pour voir comment cela fonctionne Supposons que nous aimerions que
l'IE nous aide à créer une proposition commerciale pour un service
mobile de toilettage pour chiens Première étape, l'invite initiale peut être assez générale, comme créer grandes lignes
d'une proposition
commerciale pour un service mobile de
toilettage
pour chiens Dans un deuxième temps, nous
affinons ou affinons notre demande initiale en disant quelque chose comme : «
prenez les grandes lignes, vous créez et développez la section d'analyse de
marché, concentrez-vous sur les données démographiques et
la concurrence dans les zones urbaines ». À la troisième étape, nous demandons des informations spécifiques. Par exemple, développez maintenant la section
des projections financières, incluez les coûts de démarrage, les dépenses d'exploitation
mensuelles et
les prévisions de revenus pour la première année. Nous pouvons répéter les étapes deux
et trois plusieurs fois en fonction de notre degré de
satisfaction à l'
égard des réponses. Parfois, les instructions itératives
sont encore plus puissantes lorsque vous travaillez sur quelque chose qui
doit être précis, et pas seulement bien écrit Par exemple, première étape
, commencez au sens large. Donnez-moi un aperçu
du marché du toilettage mobile
pour chiens
en milieu urbain Deuxième étape, demandez des
hypothèses et des preuves. Dressez la liste des principales hypothèses
que vous faites. Si vous mentionnez des faits ou des chiffres, dites-moi d'où ils viennent et signalez tout ce dont vous n'
êtes pas sûr. Troisième étape, contre-vérifier. Maintenant, vérifiez
votre propre réponse. Quelles sont les parties les plus
susceptibles d'être erronées ou obsolètes ? Que vérifieriez-vous en premier ? De cette façon, vous ne vous contentez pas de
peaufiner le libellé, vous améliorez
la fiabilité vous améliorez
la fiabilité
du contenu au fur et à mesure. Veuillez noter que tout comme
un chef de projet compétent s'appuie sur les
discussions et décisions précédentes, IA basée sur le
chat garde le contexte tout
au long de votre conversation. Cela signifie que vous pouvez vous
référer aux parties précédentes
du chat et en tirer parti au lieu de
tout répéter à zéro. Vous pourriez donc vous demander
quelque chose comme, sur
la base de la stratégie marketing
dont nous avons parlé plus tôt dans cette discussion,
poursuivons sur cette lancée, mais concentrons-nous sur familles des
banlieues dans les zones où les
options de toilettage sont limitées Bien entendu, si vous estimez que votre conversation ne
va pas dans le bon sens, vous avez toujours la
possibilité de
recommencer à zéro et de recadrer
la première question La dernière étape du processus
itératif
consiste généralement à demander à l'IA de
peaufiner la réponse Sinon, vous pouvez demander à fournir des commentaires sur l'ensemble du contenu. Dans ce cas, la proposition
commerciale, en se concentrant sur la manière dont elle peut
être encore améliorée. Vous pouvez ensuite inclure ces modifications dans la
version finale du document. Cette
approche étape par étape vous permet revoir et d'affiner le
résultat à chaque étape, apporter des ajustements en
fonction des résultats intermédiaires, garder
le contrôle sur le produit final et de renforcer progressivement la complexité. Considère ça comme une sculpture. Vous commencez par la forme de base, puis vous affinez progressivement les détails jusqu'à obtenir
exactement ce que vous voulez. Et c'est tout pour la vidéo. Résumons les points essentiels
que nous venons d'aborder.
9. Faire de Gemini un véritable personnage :: Bonjour à tous, et bon retour. Parfois, lorsque vous
parlez à un assistant IA, vous avez
l'impression de
repartir de zéro à
chaque fois. Vous pouvez écrire l'invite
parfaite tout en obtenant une réponse générique car Gemini n'a aucune idée de qui vous êtes ni de la façon dont vous
travaillez. Dans cette vidéo, nous allons voir comment
faire en sorte que Gemini fonctionne comme vous travaillez Il existe trois niveaux de personnalisation que vous pouvez utiliser
pour personnaliser votre expérience Le premier niveau est constitué d'instructions
personnalisées de base. Vous dites aux Gémeaux comment vous
vouliez vous comporter à
chaque fois. Soyez toujours professionnel,
formatez toujours les réponses sous forme de puces. Tout ce qui fonctionne pour vous vous évite de
vous répéter à chaque demande. Le niveau deux est la mémoire de
discussion intermédiaire. C'est là que Gemini
commence à se souvenir des faits et des préférences de vos conversations
précédentes, afin que vous puissiez reprendre exactement
là où vous vous êtes arrêté. Et le niveau trois est l'intelligence
personnelle la plus avancée. Cela permet à Gemini de
faire le lien entre l'ensemble de votre écosystème
Google, votre GML, vos photos, YouTube et même votre historique
de recherche Imaginez au lieu de passer des
heures à jouer à un week-end. Vous dites simplement que les Gémeaux planifient un voyage pour ce samedi
en fonction de mon passe-temps favori Personal Intelligence découvre que vous avez récemment acheté du matériel de randonnée à Jimel, extrait vos photos
de randonnée préférées de Google Photos, vérifie
l'historique de vos visites sur YouTube pour trouver des guides locaux et suggère un sentier spécifique, sachant exactement quel niveau de
difficulté vous convient Avant de commencer, il convient de noter que l'intelligence
personnelle
est toujours en cours Nous allons
donc nous concentrer sur les deux
premiers niveaux aujourd'hui. De plus, ces fonctionnalités de
personnalisation font partie de l'abonnement Google
AI Pro Si vous n'avez pas encore effectué la mise à niveau, consultez notre conférence où je vous ai montré comment
y accéder gratuitement. Passons à la démo. Nous commençons par
accéder à l'application Web Gemini à l'adresse
gemini.google.com Je me suis déjà
connecté à mon compte P. Ensuite, regardez en bas à gauche de votre écran et cliquez
sur l'icône Réglages en forme de roue dentée. Dans ce menu, sélectionnez le contexte
personnel. Le premier set s'appelle
tes meilleurs chapeaux avec Gémeaux. Lorsqu'il est activé,
comme sur mon écran ici, Gemini apprend de votre histoire pour
mieux vous comprendre au fil du temps Lorsque je viens d'activer
ce paramètre, voici ce que Gemini m'
a suggéré Il résumait correctement
tout ce sur quoi j'ai
travaillé récemment. Et d'ailleurs, si
vous souhaitez avoir une conversation privée qui
n'est pas stockée dans l'historique des discussions, vous pouvez utiliser le chat temporaire. Vous voyez qu'il est
disponible ici
en haut à gauche de l'
écran. Alors, cliquons dessus. Nous voyons la même interface que celle que
vous connaissez déjà. Laisse-moi te demander quelque chose. J'utilise un modèle rapide car il ne s'agit que d'une question
très rapide. Voici donc les suggestions. Ils sont plutôt bons. Et puisque nous étions en train
de goûter au chat temporaire, laissez-moi consulter l'historique de mes discussions. Vous voyez que nous n'avons rien à voir avec
un blanc plat ici. Permettez-moi d'actualiser la
page pour m'assurer que cette discussion temporaire ne sera pas
enregistrée dans l'historique des discussions. Oui, tout va bien. Mais
en même temps, nous avons également perdu cette
conversation. Bien, revenons aux paramètres,
au contexte personnel Le deuxième Google ici
s'appelle Vos instructions
pour les Gémeaux Nous voyons qu'ils sont également actifs par défaut pour ajouter
une nouvelle instruction, cliquant sur AD. Et ici, nous pouvons inclure toute information
concernant votre comportement, style de communication
personnel, préférences que vous
souhaitez partager avec Gemini Voici donc mon message. J'aimerais donc diviser les
instructions en deux parties. Tout d'abord, je dis à l'IE ce que je fais. Vous voyez ici que j'ai
partagé mon rôle d'éducateur et
de consultant, en fournissant un
peu de contexte sur ce que je fais dans ces deux
rôles Ensuite, j'ai expliqué à
quel point j'aimais travailler. Sauvegardons ces instructions en
cliquant sur le bouton Soumettre. Tout va bien. Enfin, pour voir tout ce que
Gemini a stocké, revenez aux paramètres, puis cliquez sur Activité Voici la liste de
toutes les activités que vous avez récemment
eues avec l'application Gemini Vous pouvez supprimer manuellement des discussions spécifiques au
cas où vous n'en auriez pas besoin
pour certaines raisons, et vous pouvez également
définir un calendrier de suppression. Vos données sont donc effacées tous
les deux ou trois mois. Par exemple, je peux
choisir une durée ici. Je vis 18 mois, ce qui est une période raisonnable pour me débarrasser des
vieilles conversations, et je clique sur Suivant. Parfait. Et
c'est tout pour ce tutoriel. Vous savez maintenant comment personnaliser Gemini pour qu'il fonctionne exactement comme vous
le souhaitez Et Alca dans la vidéo suivante.
10. Comment partager des fichiers et d'autres contenus avec Google Gemini AI: Bonjour à tous, et bon retour. Dans les conférences précédentes
sur l'ingénierie rapide, nous avons beaucoup
parlé de la manière de formuler vos instructions et
des informations à inclure. Mais outre les instructions, vous
devez
parfois fournir à l'IE sources
tels que
des documents, des
feuilles de calcul, des
captures d'écran ou des PDF, afin qu'elle puisse les examiner
et les analyser Voyons comment cela fonctionne. Vous pouvez fournir des
informations provenant de documents et d'images à Gemini de deux manières principales :
en collant le
texte directement dans le chat ou en
joignant le fichier entier
à la Ainsi, la première option consistant à coller
le texte fonctionne bien lorsque vous n'avez besoin d'aide que pour un
fragment spécifique de votre document Par exemple, voici mon CV, et je souhaite obtenir des commentaires sur
une seule section du document Je peux
donc simplement le copier, coller dans le chat, puis donner les
instructions à Gemini J'ai donc répondu qu'il s'agissait d'
un extrait de mon CV, et j'ai demandé à Gemini si ces compétences étaient pertinentes pour un poste de responsable produit dans une
start-up Fintech Et voici la réponse. Mais vous souhaitez souvent que Gemini travaille avec l'ensemble
du document,
qu' un long PDF ou d'une feuille Gemini peut gérer presque
tous les types
de fichiers courants , des documents Word aux fichiers CSV, en passant photos et même les vidéos Pour joindre le fichier, cliquez sur l'icône plus sur le côté gauche
de la barre de discussion. Vous pouvez choisir un fichier
depuis votre appareil, depuis votre Google Drive,
depuis Google Photos. Prenons donc un exemple. J'ai besoin d'idées
pour cuisiner pour le dîner. Ce que je vais
faire, c'est télécharger plusieurs photos des ingrédients
que j'ai dans mon frigo. Voici les
ingrédients que j'ai. Je vais demander à Gemini quelles sont les trois recettes simples pour le dîner que je peux préparer en moins de 20 minutes. Et voici les recommandations
fournies par Gemini. Vous voyez qu'il
a réussi à identifier les ingrédients sur la
base des photos. Nous voyons ici la capacité des Gémeaux à
reconnaître des objets et à appliquer un frisonin créatif Ensuite, essayons le document. Supposons que vous ayez reçu un document de facture d'électricité
complexe. Vous pouvez donc télécharger ce
PDF sur Gemini et lui demander s'il peut résumer les principales
accusations. Essayons ça. Je vais revenir au même chat, cliquer sur l'icône plus,
puis choisir les fichiers
de mon Drive local. Et voici mon message. Utilisons le modèle rapide ici car la demande devrait être assez
simple, et voyons quelle réponse
nous allons obtenir. Oui, très bon
résumé correct des frais, ainsi que de ma
consommation de données. Tout va bien ici. Bien, essayons autre
chose et soumettons différents types de documents à Gemini pour voir s' il peut vraiment fonctionner
avec différents fichiers J'ai un PDF avec mon itinéraire de vol pour mon
prochain voyage à Phuket. Et voici un guide de voyage avec quelques informations
concernant les visites. Ça, je peux le faire
pendant que je suis à Phuket. C'est bon. Cette démo
prend un certain temps. Donc, ce que je vais faire, c'est arrêter cette réponse. Je vais copier cette invite
et ouvrir une nouvelle discussion. J'ai inclus le même message, et ici, passons à la
façon de penser. Parce que j'ai ici un document PDF assez
complexe. J'ai également des visuels avec des dates
concrètes que Gemini doit analyser et comparer avec les dates de ce
document Il serait donc peut-être préférable de passer à un modèle plus intelligent. Essayons ça. Maintenant, nous avons obtenu le résultat
presque immédiatement. Alors lisons ce que les
Gémeaux nous disent. Il reconnaît toutes
les informations contenues dans les documents
que j'ai fournis et m'a également donné de
bonnes recommandations sur ce que je peux faire juste après mon
arrivée à destination. C'est là que nous voyons
Gemini agir en tant que cardinateur personnel reliant différents types de
fichiers Et n'oubliez pas que
même si Gemini peut lire et analyser ces fichiers
pour générer des résumés, des tableaux ou des
recommandations, il ne modifiera pas réellement le fichier
d'origine lui-même Bien,
passons à notre démo, disons que j'ai
un fichier audio que je veux que Gemini analyse, comme toujours en cliquant
sur le bouton Plus Ensuite, je sélectionne dans mon fichier audio, et voici mon message. Peux-tu résumer les
points essentiels de cet audio ? Je vais continuer à utiliser mode
réflexion ici, car il s' agit d'une tâche plus
complexe que de simplement poser
une question rapide. Et voici le résumé. Il s'agit du résumé correct
fourni par Gemini. Je peux le confirmer car il s'agit de l'enregistrement que j'ai préparé
moi-même pour mon autre cours. Excellent travail Gemini. Et permettez-moi également de vous montrer
comment cela peut fonctionner avec des vidéos. J'ai ce lien vers la présentation
principale de Google. Et comme je
travaille actuellement sur le cours Gemini, je veux que Gemini m'aide à
trouver tous les moments
où les intervenants parlent de l' application
Gemini, Appuyons sur Entrée et voyons
ce que Gemini va suggérer. Voici l'
analyse détaillée de cette vidéo. Et ce que j'
aime vraiment ici, c'est qu' il inclut les codes temporels. Par exemple, nous voyons ici que Gemini a mentionné le contexte
personnel, et qu'il incluait ce code
temporel spécifique dans lequel
l'un des orateurs
parlait de cette fonctionnalité Donc, si je souhaite
revoir cette conversation, je peux simplement cliquer
sur ce code temporel. Je vais être redirigé vers cette
partie de la présentation. Et c'est tout pour cette conférence. Résumons brièvement
ce que nous avons appris ici. La plupart des modèles d'IA modernes
acceptent les formats de fichiers courants, notamment les PDF, les documents Word, les fichiers
Excel, les CSV, les
images et les fichiers texte Les fichiers peuvent être téléchargés à l'aide d'un bouton de téléchargement ou icône de
pièce jointe sur
l'interface de discussion. Vous devez donner des
instructions claires sur ce que vous voulez que l'IA
fasse avec les fichiers. fait
d'être précis dans vos demandes permet d'obtenir de meilleurs résultats. Vous pouvez télécharger
plusieurs fichiers et demander au modèle d'IA de les comparer
ou de les analyser ensemble. L'IA ne
modifie généralement pas directement votre fichier, mais elle peut générer un contenu
amélioré. Vous pouvez le copier à nouveau
dans votre document. Très bien, et je
te verrai lors de la prochaine conférence.
11. Utiliser des exemples dans vos invites: Tout le monde, et bienvenue à la nouvelle conférence où
nous continuerons à
parler de la manière de communiquer avec systèmes d'
assurance-emploi et de ce qu'il faut
inclure dans votre message. Jusqu'à présent, nous avons abordé plusieurs éléments qui peuvent
être inclus dans une invite, une tâche ou ce que vous
souhaitez accomplir, suivis des détails ou du
contexte spécifiques et des règles nécessaires pour effectuer la tâche
ou répondre à une question. Vient ensuite le contexte des rôles, un rôle spécifique que l'IE
jouera lors de l'
exécution d'une tâche. Vous pouvez également éventuellement présenter le
public cible de votre tâche. Enfin, nous avons indiqué
que vous pouvez partager du contenu
supplémentaire en
joignant des documents à votre conversation ou en
incluant le texte comme donnée
d'entrée directement
dans le chat et en respectant l'ordre des
composants dans votre invite. L'ordre est important
pour certains éléments, mais pas pour d'autres. Par exemple, il est
recommandé d'inclure le contexte RL plus tôt
dans l'invite, car données d'entrée peuvent ne pas être nécessaires en
fonction de la tâche, et leur ordre
est également flexible. Mais en général, si vous vous en tenez à l'ordre indiqué dans les diapositives de présentation du
cours, ce sera un bon point de départ
pour une invite efficace. OK, introduisons un autre
élément d'incitation. Des exemples. Les exemples, également connus sous le nom de
photos, constituent des démonstrations qui orientent le modèle d'IA
générative sur le type de résultat que
vous recherchez, y compris le format de réponse
et ce que vous souhaitez éviter. Vous avez peut-être
entendu parler de termes tels que un coup » ou « quelques coups » qui vous incitent à agir. Cela fait référence à l'utilisation d'un ou de plusieurs exemples dans
votre description rapide. Pour les demandes de chat, les exemples montrent
généralement le ton. Par exemple, le formel
contre l'informel, sérieux par rapport au calendrier, empathie par rapport
à la réalité,
et le style tel que la longueur des phrases, les modèles de
format, les puces
par rapport aux paragraphes, le niveau de détail
technique, de base par rapport à
la terminologie avancée, etc. Passons en revue quelques exemples
concrets. Tout d'abord, je vais demander à Gemini un simple e-mail sans
donner d'exemple Voici donc mon message. Pour cette démo, je
vais utiliser le modèle
Fest. Allons-y. Cet e-mail est bien, mais il est également assez générique. Rendons-le maintenant beaucoup
plus précis en montrant un exemple du ton et de
la structure souhaités. Voici donc mon autre message. J'ai donc la même
instruction au début, puis j'ai fourni un exemple référence de style mentionnant
le ton, la longueur de la
phrase
et la structure que j'aimerais que Gemini utilise Exécutons cette deuxième version. Maintenant, si nous comparons cette nouvelle réponse à
la version initiale, nous constatons qu'elle semble plus humaine. Les phrases sont plus courtes
et la structure est plus proche de ce que nous avons
montré dans l'exemple. Et pendant que nous en sommes
à l'exemple de l'e-mail, permettez-moi de
vous montrer rapidement ce que Gemini peut faire ensuite avec cet e-mail Il s'est avéré que vous
n'avez pas besoin de
copier-coller l'e-mail
dans votre boîte de réception. Si vous regardez juste
en dessous de la réponse, vous verrez plus d'icônes. Cliquons dessus. Et ici, vous verrez un brouillon dans l'option Gmail. Si vous cliquez dessus, Gemini
ouvrira une nouvelle fenêtre et placera ce texte exact dans
un véritable brouillon Gmail, que vous pourrez modifier et éventuellement envoyer
à votre destinataire Essayons donc de le faire. Gemini est en train de rédiger un e-mail. Jetons un coup d'œil. Je vais
cliquer sur Ouvrir Gmail. Nous constatons qu'il a bien saisi
l'objet de l'e-mail. C'est le texte exact
que nous avons vu dans le chat. Essayons quelque chose
d'un peu plus avancé. Jusqu'à présent, nous avons utilisé des exemples pour fixer le ton et le
style de réponse. Mais vous pouvez également utiliser des exemples
pour définir un cadre mental. Le cadre mental ne
change pas seulement les mots utilisés par les Gémeaux. Cela change la logique qu'il
utilise pour résoudre votre problème. Ainsi, au lieu de rédiger une
longue liste de règles, comme être pratique ou ne pas
être trop académique, vous pouvez simplement
montrer aux Gémeaux une photo ou un exemple du point de vue
que vous souhaitez adopter Allons-y donc étape par étape. Tout d'abord, je vais
ouvrir un nouveau chat. Et là, j'aimerais
passer à un modèle pro. Et attention, si
vous avez un forfait gratuit, vous aurez toujours
accès au modèle pro. Vous voyez, j'utilise
mon compte gratuit et je peux toujours
sélectionner ce modèle. Mais vos limites d'utilisation peuvent être
inférieures à celles des forfaits payants. Je reviens donc à mon compte que j'
utilise pour cette démo. Voyons d'abord comment Gemini gère les demandes sans
aucun cadrage Je vais vous poser une question sur un
sujet populaire : le personal branding. Je souhaite en savoir plus sur le
personal branding. Comment dois-je commencer ?
Appuyons sur Entrée. Si cela nous intéresse, nous pouvons examiner le processus de
pensée des Gémeaux Vous voyez, ce sont
les étapes qu'il a prises pour nous donner cette
recommandation. Tout est correct, mais
c'est très théorique. Cela semble être une longue liste de
choses à faire avant même de commencer. Utilisons maintenant un exemple
unique pour passer de la logique à
un cadre mental pratique. Je veux que Gemini
agisse comme un entraîneur qui privilégie les petites
victoires immédiates par rapport aux grandes théories Voici donc ma nouvelle invite, dehors de mes instructions
d'origine. J'ai également inclus un exemple
de logique pratique. Entrons et voyons
ce que Jimmy et moi pouvons suggérer ici. Tu vois ça ? Parce que j'ai qualifié la
logique de pratique
et que j'ai montré à Gemini l'exemple de
Hello World, cela ne me donne plus de liste de
lecture Il m'indique littéralement les
recommandations pratiques, les choses que je peux faire dès maintenant. Alors maintenant, Gemini reflète
la façon de penser, pas seulement le ton et le style, comme dans notre premier D'accord. Et prenons
un autre exemple rapide. Cela est particulièrement utile
lorsque vous effectuez des recherches. Supposons que vous souhaitiez que Gemini réponde
non seulement à la question, mais aussi qu'il
montre d'où viennent les
informations, vous pouvez inclure un exemple illustrant vous pouvez inclure un exemple illustrant le
format souhaité Par exemple, vous pouvez écrire
une invite complète comme celle-ci. Et ce qui est important, c'est que j'ai également
fourni des règles pour les Gémeaux. Pour les cas, il ne peut pas trouver de
source fiable pour une réclamation. Allons-y. Ce
type d'exemple rend le résultat beaucoup plus
structuré et plus fiable car vous
montrez le format exact, que
vous voulez comme
preuve. C'est bon. Hormis l'affichage d'une ou de
quelques photos, il existe une autre technique
utilisant des exemples interactifs Les exemples interactifs diffèrent des exemples
classiques dans la mesure où
ils créent une
expérience d'apprentissage
dynamique, dans laquelle chaque exemple s'appuie sur connaissances
ou des commentaires
antérieurs, tandis que les exemples réguliers
sont des démonstrations d'étude. Les exemples interactifs impliquent une participation
active
et une itération. Voici comment fonctionnent les
exemples interactifs. Vous fournissez un exemple de
version initiale. L'IA fournit des
commentaires et des suggestions spécifiques. Vous créez une version améliorée
en fonction de ces commentaires. L'IA analyse les améliorations et suggère d'autres
améliorations. Vous pouvez répéter l'opération si nécessaire. L'essentiel est que chaque
itération s'appuie sur les commentaires de
la version précédente, créant ainsi un processus d'
amélioration collaboratif OK, super. Et
c'est tout pour cette vidéo Passons rapidement en revue ce que
nous avons appris ici. Et je vous verrai
dans la prochaine vidéo où nous aborderons
une autre technique d'incitation
12. Spécifier le format de sortie dans Gemini: Tout le monde. Nous avons presque fini de décrire les ingrédients clés
d'un bon prompt. Il y a encore un autre élément que vous pourriez
trouver intéressant d'inclure dans vos informations rapides sur le format
que vous souhaitez donner à la réponse de l'
IA. Parlons-en maintenant. N'oubliez pas que dans notre première
conférence sur l'incitation, nous avons dit qu'il est important
d'inclure des informations concernant le
plan de base ou la liste de points Vous ne l'aborderez pas comme
contexte pour votre tâche. Il s'avère que vous
pouvez également spécifier vos préférences de mise en forme
pour la réponse, ce qui peut aider à organiser les
informations de manière plus efficace. Ces informations peuvent ne pas être nécessaires en fonction de la tâche, mais si vous les incluez,
il est
préférable de
les indiquer vers la fin de votre invite plutôt qu'au début Passons en revue quelques exemples de formatage que vous pouvez demander. Vous pouvez demander des styles de
formatage spécifiques. Par exemple, si vous avez besoin d'un rapport commercial,
vous pourriez dire : « Veuillez le formater comme un rapport
professionnel avec des en-têtes, des sous-titres et de courts
paragraphes clairs L'IA structurera les
informations en conséquence, afin de les préparer à
un usage professionnel. Lorsque vous travaillez avec
des données ou des analyses, vous pouvez demander des tableaux
ou des mises en page spécifiques Au lieu d'un mur de
texte, vous pourriez dire présenter la comparaison
de ces trois produits sous forme de tableau clair avec les
fonctionnalités dans la colonne de gauche. Cela facilite la compréhension et l'utilisation des informations
complexes . Et voici quelques autres formats et modèles particulièrement
utiles pour la recherche ou la prise de
décision. Tableau comparatif Donnez-moi un tableau comparatif de ces options avec des
colonnes pour les principales fonctionnalités, les avantages, les inconvénients et les quatre meilleures. Cartographie des sources, dressez la liste des
sources que vous avez utilisées et expliquez
brièvement ce que chaque
source soutient dans votre réponse. Les faits contre les interprétations. Séparez votre réponse
en deux sections : les faits, les déclarations
vérifiables
et les interprétations, votre raisonnement, vos hypothèses
ou vos recommandations Vous pouvez demander une mise en forme de
markdown spécifique. L'IA peut utiliser du texte en gras, italique, des en-têtes et des
puces selon les besoins Il vous suffit de demander les points clés en gras ou les
termes importants en italique, et la
réponse sera formatée comme vous l'avez demandé Vous pouvez organiser vos conseils à l'
aide de points pour
clarifier l'astuce principale, les informations complémentaires
et les autres détails Enfin, n'oubliez pas que
vous pouvez toujours demander de reformater la réponse si la première version ne correspond pas
exactement à vos besoins C'est parfaitement normal de dire : pourriez-vous réorganiser ces
informations sous forme de liste numérotée ? Vous pouvez également le décomposer en paragraphes
plus courts pour une meilleure lisibilité
météo OK, et c'est tout pour
cette brève conférence. Récapitulons les points clés que
nous venons d'aborder. Spécifiez toujours le format
souhaité dès le départ pour obtenir la réponse la
plus utile Vous pouvez demander
des structures spécifiques telles que des rapports, des tableaux ou des listes. Les tableaux de comparaison sont
parfaits pour la prise de décision. Vous pouvez demander un tableau
structuré avec des avantages, inconvénients et la meilleure forme. Pour les tâches de recherche, vous
pouvez demander des sources et même séparer les faits des
interprétations pour plus de clarté. Un modèle d'IA peut adapter
son style d'écriture pour répondre à vos besoins, qu'ils soient
occasionnels ou professionnels. formatage Markdown permet de mettre en évidence
les informations importantes Vous pouvez demander un reformatage si la première réponse
n'est pas tout à fait correcte Des instructions de mise en forme claires permettent réponses
plus utiles et plus
exploitables Et c'est tout pour cette vidéo, et comme toujours pour AlCa
dans la suivante
13. Suivi : Choix du bon modèle et réflexions avec Gemini ming: Tout le monde. Jusqu'à présent, nous avons exploré
Brampton de manière isolée. Il est temps de réunir ces éléments dans un flux de travail complet de
bout en bout. En cours de route, je vais vous montrer quelques packs de productivité disponibles dans Gemini, exemple comment
vérifier l'
exactitude des réponses et les exporter
directement vers Google Docs Nous allons explorer deux
scénarios qui sont de loin l' un de mes préférés lorsqu'il
s'agit de travailler avec Gemini Il s'agit du brainstorming
et de l'obtention de commentaires. Mais avant de commencer avec
notre premier scénario, parlons un peu de la manière de
choisir votre modèle d'IA. Vous m'avez vu
passer de l'un à l'autre tout au long de
cette section de démos, et vous vous demandez peut-être, alors quel modèle choisir ? Et lorsque votre choix
dépend de votre plan d'abonnement. Si vous êtes un utilisateur payant, je vous suggère de faire de la réflexion
votre choix par défaut. Sa capacité de raisonnement lui permet de
passer à la vitesse supérieure, uniquement pour les tâches à faible enjeu,
comme les vérifications grammaticales
rapides ou les questions rapides, et de passer à professionnelle lorsque vous avez affaire
à de longs documents, recherches
approfondies ou à
tout ce qui nécessite une concentration
soutenue
sur une grande quantité de contenu,
c'est là qu'elle mérite sa place. Je travaille avec Gemini
depuis un certain temps déjà, et c'est le
meilleur flux de travail que j'ai trouvé après de
nombreuses expériences Si vous êtes un utilisateur gratuit,
optez pour la version rapide
par défaut, car les modèles les plus avancés ont des
quotas quotidiens limités sur le plan gratuit Vous devez
donc faire preuve de
stratégie et conserver ces crédits pour le moment où
vous en aurez vraiment besoin. Passez à la réflexion
lorsqu'une tâche nécessite logique
approfondie ou un
raisonnement en plusieurs étapes, et passez à méthode professionnelle lorsque vous travaillez sur un contenu
volumineux ou
que vous avez besoin d' un niveau élevé de
nuance et de profondeur. Maintenant, dans cet esprit, passons à notre premier scénario de suivi du
processus de
brainstorming Je veux que vous imaginiez que vous êtes le directeur
marketing d'une start-up très ambitieuse et
imaginative spécialisée dans les technologies du sommeil
appelée Snooze Nous sommes sur le point de lancer
le Snooze One, le premier
pilote automatique au monde de Comme vous pouvez le constater lors de
notre briefing interne, ce matelas intègre tout technologie
de zonage climatique analyse des
rêves en passant par
le moteur Vibe Sing Story Il est nécessaire de créer une campagne de lancement
sur les réseaux sociaux qui fasse du sommeil intelligent
un élément essentiel. Ouvrons donc Gemini
pour démarrer la démo. J'ai choisi le
modèle de réflexion parce que nous avons besoin d'un stratège créatif
capable de gérer les nuances Et commençons
notre brainstorming. Voici la première invite
que je vais utiliser. Vous voyez que je
présente d'abord le rôle que
je veux que Gémeaux joue. J'ai ensuite inclus un peu de contexte en ce qui concerne ce que
nous sommes sur le point de lancer. Notre public cible. Ensuite, j'ai chargé Gemini
de suggérer des thèmes de contenu pour les
tentes pour
notre fenêtre de lancement de 30 jours Et permettez-moi également d'inclure
le fichier PDF que vous venez de voir pour fournir encore
plus de contexte à Gemini Et appuyons sur Entrée Voici les dix thèmes
suggérés par Gemini C'est ce thème qui me plaît le plus. Demandons donc à Gemini d' approfondir ce thème
spécifique Voici donc mon deuxième message. Et permettez-moi de
préciser que je veux dix idées de coûts. Appuyons sur Entrée. D'excellentes suggestions. Et au cas où certaines d'entre elles ne vous
plairaient pas, vous pouvez toujours demander à Gemini de vous
suggérer dix autres idées. Alors faisons-le. Je remarque que
lorsque vous le faites plusieurs fois, vous pouvez avoir de
très bonnes suggestions. Essayez donc de le
faire et n'
utilisez pas simplement la première liste d'idées fournie
par Gemini Faisons encore une itération. J'ai fait part de mes commentaires à Gemini concernant la liste d'
idées qu'il a fournie Sympa. Je pense que nous pouvons continuer
à travailler avec certaines de ces idées. Mais avant de commencer à écrire
les scripts de
notre publication ou de nos vidéos, permettez-moi de poser
une autre question à Gemini Avant de passer à autre chose, je veux savoir quelles sont
les tendances actuelles en matière de contenu
sur les réseaux sociaux
pour les lancements de produits technologiques, comme dans notre cas. Voici les tendances. Vous voyez qu'il
a bien suivi l'année en cours. Et voici mon prochain message. Je vais demander à
Gemini de suggérer
dix identifiants de script vidéo abrégés pour la série Vibe Check
Storytelling Disons que j'aimerais Instagram soit notre
plateforme de prédilection. Et notez que j'ai également
inclus ce PDF avec les idées de crochets viraux que je souhaite que Gemini utilise
lors de la préparation de la réponse C'est ce que l'
on appelle la mise à la terre. J'ancre donc
la réponse d'EI dans notre style de marque spécifique afin que les scripts
ne semblent pas génériques Ensuite, j'ai également fourni
la structure du script et c'est tout. Appuyons sur Entrée. D'accord, nous voyons que Gemini a inclus
des espaces réservés, et je veux vraiment
avoir un script complet prêt pour le prompteur afin que
nous puissions simplement enregistrer nous puissions Ainsi, lors du brainstorming,
je commence par demander à
Gemini d'explorer un
large éventail d'idées, puis je peux répéter
ces idées plusieurs Ensuite, je sélectionne généralement une
idée qui me plaît et je demande à
Gemini de me concentrer sur
ce sujet et, disons, créer un article ou une histoire en rapport avec
l'idée de mon choix Très bien, notre script est prêt. Je peux continuer à parler
avec Gemini et demander à ajuster ce script ou à prendre
une autre idée pour l'étendre Mais disons que je suis d'
accord avec celui-ci, je peux en fait exporter ce script directement
dans le Google Doc. Vous voyez trois points que j'entends. Si je clique dessus, je peux
choisir d'exporter deux chiens, et voyons ce qui se passe. Gemini m'indique que le
nouveau document est créé. Cliquez sur Ouvrir. Très sympa. Nous avons même un tableau
avec des codes temporels et du texte
exact que nous
devons dire très cool. Et vous pouvez également voir
ici des jests de Geminis pour exporter ce
tableau Essayons de le faire également. Personnellement, j'aime bien exporter
vers Google Docs
pour ce scénario. Je pense que cela fonctionne mieux
pour ce type de document, mais vous avez compris l'idée. C'est tout pour ce tutoriel
et pour Alca dans le suivant.
14. Suivi : obtenir des retours avec l’IA de Google Gemini: Tout le monde. Bienvenue dans la
deuxième vidéo de suivi. Explorons la possibilité de recueillir les
commentaires de Gemini. Ce cas d'utilisation est l'un
des premiers avec lesquels j'ai commencé. Lors de l'utilisation de l'assistant EI. J'avais l'habitude de soumettre mes documents tels que des présentations, des
rapports, des CV, et de demander à l'IE de me faire part de mes commentaires
afin
d'obtenir un deuxième avis à ce sujet
et d'apporter des améliorations. Mais Gemini a fait passer ce processus à tout autre niveau, car
il est nativement multimodal,
ce qui signifie qu'il peut traiter
non seulement des textes, ce qui signifie qu'il peut traiter
non seulement des textes mais aussi d'autres types de
contenu tels que des vidéos Vous pouvez désormais obtenir des commentaires
personnalisés
sur vos performances réelles, pas seulement sur ce que vous avez écrit. La raison pour laquelle Gemini est si dominant ici est son énorme fenêtre
contextuelle C'est la première fois
que nous utilisons ce terme. Présentons-le donc. La fenêtre contextuelle est essentiellement la mémoire à
court terme d'IIS. Il s'agit de la quantité de
données que le modèle peut stocker simultanément dans son cerveau
pour comprendre la demande. Alors que d'autres modèles
peuvent avoir du mal à se souvenir de plus de
quelques minutes d'enregistrement, Gemini peut traiter jusqu'
à 1 million de jetons Pour vous donner une idée,
cela représente environ une heure de vidéo ou des milliers de pages
de texte en une seule fois. Cette énorme mémoire
est exactement la raison pour laquelle
tant d'utilisateurs optent pour
Gemini pour l'analyse vidéo Mais ne me croyez pas sur parole
. Vérifions-le. Je vais utiliser le
mode réflexion pour vérifier la réclamation. Et c'est l'invite que
je vais utiliser en premier. Laisse-moi appuyer sur Entrée. Si j'ai commencé par
cette question, c'est parce que je veux vous montrer la fonction de réponse à double
vérification. Et voici la réponse avec les détails sur les raisons pour
lesquelles les
professionnels passent à Gemini et pour accéder à la fonction de double
vérification, cliquez sur l'icône à
trois points en bas de la réponse Et ici, vous verrez une réponse de
double vérification. Cette fonctionnalité utilise
la recherche Google pour trouver du contenu légèrement similaire ou différent des déclarations
générées par Gemini Et veuillez noter que
cette fonctionnalité est spécialement conçue pour
vérifier les affirmations factuelles. Il n'apparaîtra pas pour des tâches
telles que l'écriture créative, le code ou des tâches similaires. Gemini a commencé à évaluer
les déclarations et nous voyons ici les points
verts confirmant les
affirmations de Gemini Et nous pouvons même élargir
cette fenêtre pour voir l'article détaillé que Gemini a utilisé pour
valider cette affirmation C'est une fonctionnalité très
pratique. Passons maintenant à la technique. J'ai enregistré une vidéo de moi-même lors d'un entretien avec Zoom pour
un poste de responsable produit. Il s'agit d'un enregistrement d'une heure, ce qui représente une énorme
quantité d'informations. C'est pour cette raison que je vais
choisir le modèle pro. Mais d'abord,
commençons une nouvelle discussion. Ici, je vais
choisir P.
Le modèle Pro est conçu avec un plafond d'intelligence beaucoup
plus élevé et est supérieur pour maintenir une compréhension cohérente pendant toute une heure de tournage. Alors laissez-moi d'abord joindre
la vidéo. J'ai ici dix fragments
vidéo différents, et je soumets également
mes instructions. J'ai commencé par confier à Gemini un rôle de coach en
leadership exécutif J'ai fourni le
contexte de la vidéo, ce que je fais ici,
et c'est ma tâche. Avec les questions spécifiques que je veux que Gemini
réponde. J'attends de Gemini qu'il me fournisse des informations sur
ma présence, ma
communication, mon
style et ma clarté, mes forces et les domaines
à améliorer J'ai également demandé à Gemini de fournir les
horodatages spécifiques de ses observations afin
que je puisse rapidement trouver le fragment auquel Gemini fait référence et
le revoir moi-même Regardez comment Gemini traite
ces informations. Et voici les commentaires. Ce sont là d'excellentes observations et des points que je pourrais
certainement améliorer. Maintenant, prenons ce feedback et transformons-le en
quelque chose d'utile. Je vais demander à Gemini réécrire mon script « Tell me
about yourself afin qu'il soit plus
percutant et qu'il soit plus pertinent pour le poste de chef de produit pour lequel je
vais postuler Lorsque vous travaillez avec Pmdel,
comme dans notre exemple actuel, la génération de réponses prend
beaucoup plus de temps, alors soyez conscient de cela Et enfin, voici
la version réécrite de mon introduction à Tell me About
Yourself, elle a l'air plutôt bonne Mais bien sûr, si je
l'utilisais dans une vraie
conversation la prochaine fois, je préférerais
changer certaines choses pour m'assurer qu'il me
ressemble davantage. Excellent travail Gemini. Et juste comme ça, vous avez fait de Gemini
votre coach personnel Je peux imaginer de nombreux
cas d'utilisation pour ce type
de feedback vidéo. Imaginez que vous participez à un défi de yoga de
28 jours et que vous avez besoin de commentaires
quotidiens pour savoir si vous vous améliorez ou si vous avez
peur de parler en public Vous pouvez
donc vous enregistrer, envoyer la vidéo à Gemini, accompagnée de vos
diapositives de présentation et demander ce qui
a fonctionné et ce qui n'a pas
fonctionné Ce que j'ai remarqué en
commençant à le faire régulièrement est un
effet secondaire positif que je n'ai pas remarqué s'attendre à. Le fait que vous vous enregistrez vous-même vous rend
plus conscient de vous-même. Avant même que les Gémeaux ne
disent quoi que ce soit, vous commencez
à accorder plus d'attention à ce que vous faites
et à la façon dont vous le faites Mais c'est tout, et
c'est important. Prenez les commentaires de l'IA avec
un grain de sel. Ces modèles sont
incroyablement puissants, mais ils commettent des erreurs. Par exemple, dans l'
exemple que nous venons de regarder, Gemini m'a dit que j'étais assise tout
le temps alors que
j'étais debout Utilisez donc les informations
comme point de départ, mais comptez toujours sur vous-même
pour le jugement final. Dans les questions-réponses
de cette vidéo, dites-moi quels scénarios
vous allez expérimenter avec Alcia dans la prochaine
15. Rester réel : stratégies pratiques pour minimiser les hallucinations par l'IA: Imaginez que vous
interrogez AI Assistant sur un événement d'actualité récent et qu'il cite avec assurance un article détaillé qui
n'
existe pas réellement ou qu' il pose des questions
sur des personnalités publiques et qu'il obtienne des réponses
mêlant des faits réels à des détails
complètement inventés Ce ne sont pas des bugs ou des problèmes. Ce sont ce que nous appelons
des hallucinations dans l'IA. Et ils constituent l'un
des plus grands défis lorsque l'on travaille avec de grands modèles
linguistiques. Voyons pourquoi
ces hallucinations se produisent, comment les détecter
et, surtout, quelles sont les
techniques pratiques que vous pouvez utiliser immédiatement pour obtenir des réponses plus
précises et plus fiables. Pour comprendre pourquoi
ces erreurs se produisent, nous devons examiner comment
ces modèles sont construits.
Contrairement à un humain qui
comprend vraiment un sujet, modèles
linguistiques fonctionnent en
prédisant le mot
suivant le plus probable d'une séquence sur la
base de modèles statistiques ,
car ils sont conçus pour
être aussi utiles que possible.
Ils donnent souvent la priorité à fournir une réponse complète et
fluide plutôt qu'à
admettre qu'ils le sont incertain. Lorsqu'un modèle présente une lacune dans les informations
sur
lesquelles il a été formé ou lorsqu'il rencontre
une demande ambiguë, il peut combler les lacunes en devinant le
son le plus probable en réponse Ce n'est pas un problème. C'est
un effet secondaire du fait que l'IA donne la priorité à une
conversation fluide plutôt qu'à une vérité vérifiée Maintenant que nous comprenons
pourquoi les hallucinations se produisent, voyons comment les
détecter dans la pratique. Considérez cela comme le développement de
vos compétences en matière de vérification des faits par l'IA. Une fois que vous connaissez les signaux d'avertissement, ils deviennent beaucoup
plus faciles à détecter. Voici les principaux
signes avant-coureurs à surveiller. Des détails trop précis. Lorsque le modèle d'IA fournit des détails
très spécifiques, en particulier sur
des événements récents ou des statistiques, cela devrait déclencher un examen
plus approfondi. Par exemple, s'il
fournit des chiffres ou des
statistiques exacts pour des événements
spécifiques ou en évolution rapide, sans citer de source en direct, c'est un signal d'alarme. Dans ces cas, il
se peut que l'IA généralise à partir de modèles historiques
similaires plutôt que de
rendre compte de l'
événement spécifique au sujet duquel vous avez posé Des citations, des
exemples ou des statistiques qui sonnent parfaitement. Si vous remarquez une réponse
qui semble trop parfaite, c'est une bonne raison de
vérifier les informations. Et croyez-moi,
plus
vous acquerrez de l'expérience en travaillant
avec
les outils de l'IE, mieux vous exporterez ces deux bons moments. Vous développerez un
instinct pour reconnaître quand quelque chose ne semble
pas normal ou trop poli. Et c'est le
moment idéal pour approfondir, vérifier les faits ou
recouper les sources. Faites confiance mais vérifiez. C'est la règle d'or lorsque vous travaillez avec du contenu
généré par l'IE. Réponses incohérentes. Si vous posez la même
question plusieurs fois et que vous obtenez
des détails spécifiques différents à chaque fois, c'est un indicateur fort
d'hallucination Des déclarations trop définitives. Lorsque l'IA fait des déclarations très
définitives sur des sujets qui
devraient être incertains, en particulier en ce qui concerne des événements
futurs ou des sujets complexes, soyez prudent. Savoir pourquoi les
hallucinations se produisent et comment les détecter
est un bon début. Mais comment les
prévenir réellement ? Passons en revue quatre stratégies
utiles qui vous aideront à
obtenir des réponses plus fiables et plus précises à chaque fois. Stratégie 1. Soyez explicite en ce qui
concerne l'incertitude. Au lieu de poser
une question directe qui oblige l'IA à deviner, donnez-lui une réponse claire en lui demandant de donner la priorité
à la précision
plutôt qu' à l'exhaustivité. Par exemple,
au lieu d'écrire, quelles ont été les principales conclusions du
rapport Johnson ? Essaie ça. Si vous avez vérifié l'accès
au rapport de Johnson, veuillez partager ses principales conclusions. Si vous n'êtes pas
sûr à 100 % des détails, veuillez indiquer explicitement les
parties que vous ne pouvez pas vérifier. Ou au lieu de
répertorier toutes les entreprises qui
utilisent cette technologie, essayez-la en vous basant sur les
données sur lesquelles vous avez été formé. Pouvez-vous citer des exemples vérifiés d'entreprises utilisant
cette technologie ? Veuillez fournir les sources
ou le contexte
spécifiques de chaque exemple et indiquer si l'un de ces cas est spéculatif
plutôt que confirmé Au lieu de vous demander quelle est
la taille du marché d'AichatBDS en ce
moment, essayez ceci Pouvez-vous fournir les estimations les plus
récentes de la taille du marché d'AichatBDS à partir de sources citées
fiables ? Veuillez préciser la période
exacte pour toutes les données que vous partagez et faites-moi savoir si vous n'avez pas accès
aux derniers chiffres. Notez que chaque
invite révisée donne explicitement l'autorisation de reconnaître
l'incertitude et les limites. Ce simple changement peut améliorer
considérablement la
fiabilité des réponses. Deuxième stratégie, exiger des citations fondées sur des
preuves. Lorsque vous demandez des sources, ne vous contentez pas de rechercher
une liste de liens. L'IA peut parfois générer des citations
parfaites pour des articles ou des sites Web
qui n'existent pas. Demandez plutôt au modèle
de citer la phrase spécifique de la source qui soutient
votre conclusion En forçant l'IE à faire correspondre mot à mot
sa demande
à un texte existant, vous
réduisez considérablement sa capacité à inventer des détails au milieu d'une phrase. Troisième stratégie : utiliser des formats de sortie
structurés. demande de résultats structurés peut aider à minimiser les hallucinations en forçant le modèle d'IA à organiser les informations de manière
plus systématique. Par exemple, analysez ces données de vente en utilisant la structure suivante, les points de données
vérifiés, chiffres
directs
du document, les mesures
calculées, montrez vos calculs, vos
interprétations, clairement
étiquetés comme des interprétations,
et les incertitudes, les domaines où les données ne sont pas claires ou manquantes. Stratégie 4. Mettez en œuvre les étapes de vérification. Incluez des étapes de vérification
directement dans vos invites afin d' améliorer la précision et la
fiabilité des réponses Par exemple, vous pouvez lui demander d'énumérer toutes les hypothèses formulées
lors de son analyse, mettre en évidence les domaines dans lesquels il y a moins de confiance
ou de certitude. Recommandez des
informations supplémentaires qui pourraient aider à valider
ses conclusions. Cette approche garantit résultats
plus complets et
transparents, ce qui facilite l'évaluation de
la qualité de la réponse. Maintenant que vous avez toutes les informations
sur les hallucinations liées à l'IA, prenez un moment pour passer en revue l'une
de vos récentes instructions. Comment pourriez-vous le modifier en utilisant les stratégies que
nous venons de décrire ? N'oubliez pas que l'objectif n'est pas d'éliminer complètement les
hallucinations, mais de créer un
flux de travail dans lequel elles sont moins susceptibles d'avoir un
impact sur vos résultats. Veuillez partager votre demande originale
et révisée
dans la section questions-réponses
de cette vidéo Et comme toujours,
récapitulons brièvement les points clés
de cette conférence Les hallucinations liées à l'IA se produisent lorsque les modèles
linguistiques génèrent des informations
sonores
fausses mais plausibles Les hallucinations se produisent
parce que l'IA est une conteuse confiante qui privilégie une
conversation fluide plutôt son
travail à
un manuel ou Les signes avant-coureurs des hallucinations
incluent des détails trop spécifiques, citations
parfaitement prononcées, des réponses
incohérentes et des
déclarations trop définitives Expliquez clairement
l'incertitude dans les messages afin d'encourager l'IA à
reconnaître ses limites Demandez des citations et des
justifications pour vérifier les résultats de l'
IA et identifier les
hallucinations. Utilisez des
formats de sortie structurés pour minimiser les hallucinations en organisant systématiquement
les informations. Intégrez des
étapes de vérification dans les instructions, telles que la mise en évidence des incertitudes ou la
liste des hypothèses C'est bon.
C'est tout pour cette conférence, et je vous verrai
dans la prochaine vidéo.
16. Travailler avec la toile et des pierres précieuses Gemini : Section Intro tro: Bienvenue dans la section suivante. À présent, vous
devriez bien comprendre
comment parler aux Gémeaux Bien que nous continuions à nous appuyer
sur ces principes fondamentaux, il est temps de passer au niveau supérieur. Nous allons au-delà des simples allers-retours
pour explorer Canvas et les jams Nous allons commencer par
Canvas, un espace de travail
côte à côte dans lequel
vous pouvez modifier du texte, comparer des
versions et répéter votre travail Ne pas repartir de zéro à
chaque fois et faire bien plus encore. Ensuite, nous apprendrons les confitures. Ce sont comme
des spécialistes sur mesure qui se souviennent de
vos règles spécifiques, vous n'avez
donc pas
à les répéter. Nous allons créer
deux d'entre eux ensemble, un réviseur de grammaire et d'orthographe. Ce jam agit en
tant qu' éditeur professionnel
pour tirer profit de votre écriture tout en gardant votre voix inchangée et en tant que coach de fitness basé sur l'
IA, celui-ci peut regarder
vos vidéos d'entraînement, vérifier la sécurité de votre formulaire et même créer arrière-plans de motivation
personnalisés pour votre téléphone À la fin de cette section, vous ne vous contenterez pas
d'envoyer des instructions. Vous allez créer
votre propre équipe d'experts pour transformer vos idées rapides
en travaux
terminés ou pour automatiser
vos routines. Commençons.
17. Bienvenue sur la toile Gemini: Tout le monde. Bienvenue à la première conférence
de cette section. Jusqu'à présent, nous avons vu l'interface de chat
standard de Gemini, comme celles avec lesquelles nous avons l'habitude de travailler dans
différents messagers C'est idéal pour poser une question rapide, obtenir des commentaires
ou faire du brainstorming Mais cela peut sembler un
peu limité lorsque vous travaillez sur un
tout nouveau document. Ou un contenu qui
nécessite plusieurs révisions. En effet, lorsque vous
rédigez quelque chose de complexe, vous avez besoin de plus qu'une simple conversation. Vous avez besoin d'un espace de travail avec
différents outils d'édition. C'est là qu'intervient Gemini
Canvas. Considérez Gemini Canvas comme
un espace de travail collaboratif. Dans un chat standard, l'EIS vous donne une réponse, et si vous souhaitez
modifier une phrase, vous devez généralement
demander que le tout
soit réécrit Dans Canvas, Gemini ouvre
une fenêtre côte à côte. Sur la gauche, vous avez votre chat. Sur la droite, vous avez
un document évolutif. Ce n'est plus un simple chatbot c'est un éditeur assis
juste à côté de vous Vous pouvez cliquer sur le texte,
modifier vous-même les mots ou surligner un
paragraphe spécifique et le dire aux Gémeaux Percez juste cette pièce. Si cela vous convient, attendez de l'entendre. La toile ne sert pas uniquement à écrire, elle sert aussi à construire. À partir du menu de l'interface, vous pouvez générer des pages Web, infographies
visuelles
pour des données complexes et même des outils d'étude tels que des
quiz Pour ceux qui préfèrent écouter. Il existe des
aperçus audio qui créent des résumés de vos résultats sous forme
de
podcast est peut-être le plus impressionnant, c'est que vous pouvez générer des mini-applications
fonctionnelles Décrivez simplement un outil tel
qu'un agenda familial ou un calendrier personnel, et Canvas créera et exécutera le
code pour vous en temps réel. Vous n'avez pas besoin de
savoir comment coder. Il vous suffit de décrire
ce que l'outil doit effectuer, un processus désormais
connu sous le nom de Vibe Coding Aujourd'hui, Canvas
étant si puissant, il peut être tentant de se lancer directement dans la création d'
applications et de jeux Cependant, nous allons
procéder étape par étape. Pour l'instant, dans cette
section du cours, nous allons nous concentrer entièrement
sur la rédaction de documents. exemple d'une
entreprise imaginaire de matelas utilisant l'IA, nous verrons comment utiliser l'espace de travail
Canvas pour affiner un récit et générer soutien et des visuels
en une seule session fluide Une fois que nous aurons maîtrisé la création de
documents, nous passerons aux fonctionnalités plus
avancées telles que la création d'applications
interactives et prototypage
rapide plus tard dans
le cours Dans la leçon suivante, je vais vous montrer comment
ouvrir l'interface Canvas, et nous allons commencer notre tout
premier brouillon collaboratif. Je te retrouverai dans le prochain.
18. Suivi : création et édition de documents dans Gemini Canvas (partie 1): Comme promis dans cette vidéo, nous allons mettre la main dessus. Nous explorerons comment
naviguer dans l'espace de travail Canvas, comment effectuer des modifications ciblées à
l'aide de la fonction Ask Gemini, nous modifierons des parties spécifiques du document sans
réécrire
le brouillon dans son intégralité Nous
examinerons également les actions rapides pour
modifier des éléments tels que
le ton et la longueur du document. Enfin, nous passerons au multimodal. Nous donnerons vie à la
marque avec des logos
et des visuels de produits générés par l'
IE Passons à
Gemini pour la démo. Commençons par
passer en mode Canvas. Pour cela, je clique sur Outils et je choisis Canvas dans
la fenêtre contextuelle. Passons également au
modèle de pensée. Et je vais commencer par un message de conversation
général. Voici ce que je vais taper. J'ai donné à Gemini un peu de contexte
quant à ce que je m'apprête à faire J'ai fourni la tâche. J'ai dit que j'avais besoin d'une brève
description de l'entreprise et du nouveau produit que cette
société s'apprête à lancer. J'ai également fourni des détails
sur le style. Je veux que Gemini vienne chercher. Appuyons sur Entrée et voyons
ce que Gemini va écrire. Cela ouvre l'
espace de travail Canvas avec le chat sur le côté gauche et avec le texte sur le côté droit. Nous voyons ici qu'il a créé la description de l'entreprise,
y compris le nom , le
moteur et un bref aperçu de ce que fait cette entreprise. Ensuite, nous avons les informations
sur le produit, y compris les principales
caractéristiques du matelas, et il a même suggéré des objectifs de brainstorming
pour ma prochaine démonstration Parfait. Explorons
cet espace de travail sur le côté droit. En haut de l'espace de travail, vous pouvez tout d'abord
voir quelques outils d'édition. Par exemple, vous pouvez modifier le style de
titre de votre texte. Vous pouvez ajouter une liste à puces
ou un numéro à la liste, ou même des formules ici. Si vous le souhaitez, vous pouvez
imprimer cette page. un document PDF, il y a d'autres fonctions
que nous allons
explorer un peu plus tard dans ce didacticiel et dans les
suivants. La vraie magie de cet espace de travail est la fonction ask Gemini Supposons que vous
souhaitiez apporter une modification à une partie de votre texte. Et au lieu de demander un
tout nouveau brouillon dans le chat, vous pouvez simplement mettre en évidence
la partie que vous souhaitez modifier, puis écrire
votre demande à Gemini Par exemple, j'aimerais
modifier l'emplacement du bureau de
l'entreprise. Donc, ce que je vais faire, c'est mettre en évidence ce texte, et je vais simplement inclure mes instructions pour le changement
que je veux que Gemini apporte Vous voyez, Gemini a fait le changement et a inclus ce nouveau texte directement
dans le document Et dans la barre latérale gauche, nous voyons qu'il incluait le texte d'information et même une description
de ce changement Permettez-moi de parcourir ce
texte et de voir quels types de modifications j'aimerais
apporter en plus de l'emplacement
du bureau M Je peux continuer à travailler sur ce document
et à faire des allers-retours, y compris les modifications,
jusqu'au
moment où je serai entièrement
satisfait du texte. Franchement, j'utilise Canvas pour la création
de
documents grâce à cette fonctionnalité Ask Gemini Comme dans la plupart des cas, je dois ajuster une partie très
précise d'un document. Cependant, voici ce que j'ai découvert après des semaines
d'expérimentation. Puisque Gemini se concentre sur cette partie spécifique
d'un document, il passe parfois à côté d'une vue d'
ensemble. J'ai remarqué des cas où il répète des phrases utilisées
dans d'autres parties
du document ou introduit des
termes qui ne sont
introduits que plus tard donc en revue rapidement votre travail pour
vous assurer qu'il s'intègre parfaitement. Et c'est tout pour la première
partie de ce tutoriel. Et je te verrai
dans le second.
19. Suivi : création et édition de documents dans Gemini Canvas (partie 2): Bienvenue dans la deuxième
partie du didacticiel, où nous explorons Gemini
Canvas pour la création de documents Outre demander à Gemini, il existe des
actions rapides qui peuvent vous être utiles pour apporter des
modifications à votre texte La première action
rapide consiste à modifier la longueur. C'est idéal si vous avez besoin de développer
rapidement une section avec plus de détails ou de la réduire pour en
faire un résumé percutant. Supposons que nous voulions modifier
la longueur de notre texte, je clique sur ce bouton, puis je dois
choisir la longueur que je souhaite
pour mon nouveau texte. Supposons que je veuille qu'elle soit
plus longue que la version actuelle, et attendons les modifications. Et Gemini a
développé ce texte. Vous voyez qu'il a surligné le nouveau texte en bleu ici. Revenons aux boutons d'action de la
semaine. Et le second, c'est
pour changer de ton. Donc, si vous voulez paraître plus professionnel ou
un peu plus bavard, un peu plus bavard, c'est le bouton qui
vous aidera à changer l'ambiance de votre écriture en un
seul clic Changeons de ton, et je pourrai passer du formel au très formel ou au décontracté
et au très décontracté. Franchement, je suis d'accord avec le ton
actuel du texte, mais par exemple,
rendons-le un peu plus formel pour les
besoins de cette démo. Nous voyons que Gemini a modifié presque tout le fragment de
texte ici Je préférerais revenir
à la version précédente. Mais je pense que vous avez une idée
de ce que cette option de changement de ton peut faire. Je reviens donc à la
version précédente du document. Enfin, il existe également une
fonction permettant de suggérer des modifications. C'est comme avoir
un corps d'écriture. Gemini vous donnera des commentaires
et vous montrera comment améliorer votre écriture sans modifier immédiatement votre
texte original Essayons également cette
fonction. Très bien, super Nous constatons que Gemini a inclus certaines modifications dans
les informations sur la raison
de ces modifications Si je suis d'accord avec
tous ces changements, je peux tous les appliquer. Si vous n'aimez pas les
suggestions de Gemini et que vous souhaitez revenir
à la version précédente
du document,
vous pouvez le dire à Gemini
directement ici dans le chat Cool.
Cliquons donc sur Appliquer pour les suggestions restantes
afin de pouvoir les
conserver dans la nouvelle
version du document. C'est bon.
Continuons la démo. le cadre de la prochaine étape, je souhaite créer des
visuels pour vous
montrer les capacités multimodales de Nous aurons une section
dédiée à la création de contenu
visuel
plus tard dans le cours. Donc pour l'instant, je vais simplement taper une invite très courte
et simple. Et laissez-moi presser Andrew
de voir les résultats. Et voici la première image. C'est incroyable que Gemini ait
même inclus le nom du produit ici sur
un côté du matelas Gemini
me dit également qu'il ne peut
générer qu'une seule image à la fois. Il me demande si je souhaite poursuivre
avec le logo de l'entreprise. Les Gémeaux sont de plus en plus
doués pour inclure des textes
dans les images Et demandons
plusieurs visuels pour les fonctionnalités. Génial. Et vous comprenez pourquoi il est
important de créer des images dans ce même chat où nous avons
créé le texte original. Gemini utilise le contexte
des conversations précédentes
pour créer l'image Vous voyez qu'il a fallu des informations sur un angle de
trois degrés, même si cet angle me semble un peu plus grand.
Mais c'est bon. Nous pouvons ajuster cela grâce à des itérations en travaillant
sur cette image Il incluait également le nom du
matelas ici. Créons la quatrième
image. C'est génial Vous voyez que dans la description, nous avons l'information
que cette fonction crée un
dôme d'air pur au-dessus des traverses, et c'est exactement ce que nous voyons ici sur la
photo. Incroyable Et vérifions le texte. Humidité et qualité de l'air optimales. Oui, et le texte est correct. Je ne vois aucune erreur ici. Bien,
terminons ce tutoriel avant qu'il ne devienne trop long. Nous continuerons à
travailler avec le texte et les images dans notre prochaine vidéo.
20. Suivi : Transformer un projet Gemini en un PDF raffiné avec Gamma: histoire de notre
marque, les caractéristiques de nos
produits et les images
sont désormais organisées dans Gemini Considérez cela comme notre studio
de dessin. L'espace de
réflexion et d'écriture de base. Cependant, notre projet de travail n'
est pas livrable. Si vous devez le présenter à un responsable ou à un client sous forme
de rapport professionnel, nous devons transférer
ce contenu vers un outil de conception dédié
tel que Canva ou Gamma App Vous pensez peut-être que je
ne peux pas simplement demander à
Gemini de générer le PDF
pour moi ? Bonne question Et oui, c'était également mon
intention
lorsque j'ai eu pour la première fois la tâche
de créer le PDF final. Voici comment Gemini gère cela. Si vous essayez de créer un
PDF dans Canvas, vous n'obtiendrez pas le document
final. L'outil Canvas est conçu pour l' édition
en direct et la collaboration,
pas pour la publication. Comme il fonctionne dans
un espace de travail privé, il ne peut pas voir vos fichiers image
locaux pour les inclure dans le document. Si vous essayez d'exporter à partir d'ici, vous verrez un fichier contenant des espaces réservés
vides où devraient se trouver
vos images Bien sûr, vous pouvez également essayer
un chat régulier. Elle est plus fonctionnelle. Il peut générer des fichiers
en arrière-plan pour
vous donner un PDF téléchargeable. Cependant, il ne dispose pas du contrôle de
mise en page et raffinement nécessaires à une présentation
professionnelle. Voici le PDF que Gemini
a créé pour moi. C'est un bon début, mais il a fallu un
important
formatage manuel pour bien paraître. Donc, pour que notre présentation
soit prête à être terminée, dans laquelle le texte
circule correctement autour des images
et où l'image de marque soit cohérente, nous passons du
studio de dessin à un studio de design. Dans le prochain tutoriel, j'utiliserai l'application Gamma
pour le démontrer. C'est mon
outil principal depuis près d'un an, et c'est ce que j'utilise pour
presque tous mes travaux de conception. Cependant, les mêmes
principes s'appliquent à d'autres plateformes
similaires telles que Canva ou Adobe Retournons dans Gemini et préparons notre
contenu pour le déménagement Transférons le
texte et les images de nos actifs vers l'application Gamma. Je vais commencer par copier le texte. Pour cela, je vais cliquer sur le bouton
Partager et exporter. À partir de là, je vais
choisir Copier le contenu. Et j'ai déjà téléchargé les quatre images que nous avions générées
dans le précédent tutoriel. Tout est donc prêt
pour que nous déménagions à Gamma. Ouvrons l'application Gamma. Voici la page principale de Gamma. La partie centrale est
la grille de contenu. Cette zone affiche nos
projets également appelés Gammas. La barre supérieure sert à
créer de nouveaux documents. Sur le côté gauche,
nous avons des modèles. Ici, nous pouvons accéder à des mises en page
prédéfinies pour démarrer la conception de notre
présentation Nous avons des
choses aussi utiles que des images MAI. Où nous pouvons visualiser et
utiliser les images que nous avons générées à l'aide de l'outil d'image EI
intégré à Gammas Nous pouvons également créer des dossiers
afin de séparer nos documents par
thèmes ou sujets spécifiques. Passons donc directement à la
création d'un fichier PDF. Je vais choisir Create New with AI. Et ici, nous avons
différentes options. Comme nous avons déjà un texte, que j'ai copié depuis Gemini, je vais choisir cette option de
collage de texte Et ici, je vais inclure
le texte de Gemini. Ensuite, nous avons
plusieurs options quant à ce que l'application Gamma peut
faire avec notre contenu. Et il est important que nous choisissions de conserver ce texte exact. Cela signifie que Gamma n'apportera aucune modification
à notre brouillon. s'agit de la méthode la plus
efficace dans
notre exemple , car elle nous
permet d'utiliser Gemini pour le gros travail de
réflexion et de rédaction
, puis d'utiliser Gamma pour gérer
le formatage et embellissement
du document final Je vais sélectionner Continuer pour
inviter l'éditeur ici. Ici, nous pouvons choisir différents
thèmes pour notre présentation. Choisissons celui-ci
et cliquez sur Sélectionner un thème. Avant de cliquer sur Générer, notez les deux modes en haut, formulaire
libre et carte par carte. Permettez-moi de vous expliquer rapidement
la différence. Lorsque vous choisissez carte par carte, Gamma
divise automatiquement votre contenu en diapositives numérotées distinctes. Une idée par carte, mais vous pouvez toujours réorganiser
les cartes ou en ajouter de nouvelles. Il est parfait pour les présentations. Avec Reform, tout est regroupé dans un seul document fluide, ressemble
davantage à un rapport
qu'à un diaporama. Même contenu, mais
il se lit de haut en bas sans peine
entre les sections Cela vous permet de mieux
contrôler la mise en page et le flux. C'est idéal pour les
documents ou les rapports. Pour notre démonstration, je
choisirai Freeform car je souhaite que le texte et les images s'
enchaînent naturellement Et appuyons sur Générer. Gamma commence à
créer nos diapositives. Tout d'abord, comme je le fais habituellement, je demande à Gamma de
me suggérer
plusieurs autres mises en page afin que je puisse comparer la mise en page par défaut avec
d'autres suggestions Pour cela, je clique sur le bouton
Modifier avec l'agent, et à partir de là, je
choisis Try New layout. Faisons encore un tour
pour voir s'il existe quelque chose de mieux que notre
première option par défaut. Je pense que je vais
choisir celui-ci. J'aime bien cette
image de fond ici. Passons à la diapositive suivante. Je vais inclure l'
image de notre logo à la place de celle-ci. Pour changer l'image, je
vais cliquer sur celle-ci. Ensuite, je passe à Modifier l'image. À partir de là, je choisis le téléchargement de
l'image ou l'URL. J'ai mes images sur mon
Drive local. Et c'est parti. Il s'agit de notre première image. Attachons-le. Parfait.
Passons à la troisième diapositive. C'est bon, nous sommes prêts à partir. Faisons la dernière vérification et
jetons un coup d'œil à
toutes nos diapositives. Pour exporter ce fichier, nous cliquons sur l'icône à trois points. Ici, nous choisissons Exporter, et je vais exporter au format PDF. Ouvrons le fichier
tout de suite, et c'est parti. Ça a l'air cool. C'est donc ma
méthode de travail préférée lorsqu'il s'agit de créer de nouveaux documents. Je laisse Gemini s'occuper de la réflexion
créative,
puis je laisse mon outil de
conception préféré,
comme Gamma, s'occuper de lui donner une belle apparence. J'espère que vous avez
apprécié ce tutoriel, et comme toujours, je
vous verrai dans le prochain.
21. Que sont les pierres gemmes et pourquoi en avons-nous besoin ?: Tout le monde, lorsque vous commencez à
utiliser Gemini régulièrement, vous remarquez rapidement
que vous l'utilisez
encore et encore pour
certaines choses, ce soit pour réfléchir, obtenir des commentaires ou
générer du nouveau contenu Vous pouvez vous retrouver à taper mêmes instructions et à donner
le même contexte encore et encore, ce qui peut commencer à
sembler un peu répétitif, vous remarquez rapidement
que vous l'utilisez
encore et encore pour
certaines choses, que
ce soit pour réfléchir,
obtenir des commentaires ou
générer du nouveau contenu.
Vous pouvez vous retrouver à taper les mêmes instructions et à donner
le même contexte encore et encore,
ce qui peut commencer à
sembler un peu répétitif,
comme votre propre numérique
version de Groundhog Day. Eh bien, aujourd'hui, nous mettons
fin à ce cycle. Nous allons explorer une fonctionnalité qui
vous permettra de regrouper ces
instructions répétitives et d'
en faire votre équipe d'experts en IA
ou d'assistants personnels. Ils sont appelés Gemini Gems. Et non, nous ne
parlons pas de diamants ici. Mais une fois que vous aurez vu
combien de temps ils vous font gagner, vous pourriez penser qu'ils sont
tout aussi précieux. Alors, qu'est-ce qu'un problème ? Considérez-les comme des versions
personnalisées de Gemini conçues pour vous aider à effectuer des tâches
répétitives ou à acquérir une
expertise approfondie dans des domaines spécifiques Lorsque vous discutez avec Jam, Gemini se souvient
automatiquement de vos
objectifs et de vos directives , vous évitant ainsi de vous
répéter
à chaque demande. Ainsi, alors qu'un Gémeaux standard
est comme un bibliothécaire, qui sait où tout se trouve, un joyau est comme un spécialiste
dévoué Il ne
connaît pas seulement un sujet. Il suit vos règles spécifiques
pour effectuer le travail à votre place. Il existe trois types
de confitures, les confitures préfabriquées. Ce sont des
outils prêts à l'emploi conçus par Google. Vous ne pouvez ni voir ni modifier
leur logique sous-jacente. Vous ne pouvez les épingler que
sur votre barre latérale pour y accéder rapidement. Ils ont souvent des
interfaces uniques, comme la mise en page de dix pages d'un livre de contes que les jams classiques ne peuvent
tout simplement pas imiter Confitures personnalisées. C'est l'objectif de nos prochains tutoriels car
vous les créez vous-même. Vous fournissez les
instructions et pouvez télécharger jusqu'à dix fichiers personnels qui serviront de base de
connaissances à Jams. C'est la différence entre
un assistant général et un expert dédié
spécialement adapté à vos
données et à vos objectifs. Confitures en opale. Ople est un projet expérimental qui fait évoluer l'IA au-delà des
simples fenêtres de discussion. Ces batteries sont des mini-applications
interactives qui suivent un flux de travail spécifique. Leur caractéristique la plus remarquable est
la possibilité de les remixer. Vous pouvez utiliser un
outil prédéfini, comme un styliste de mode et modifier ses étapes internes
pour créer quelque chose de nouveau Ils sont très visuels
et peuvent générer du texte, des images et des vidéos simultanément. Nous allons explorer ces barrages dans les dernières
sections du cours. Maintenant que nous avons déjà
travaillé avec Canvas, vous vous posez peut-être une question
logique. En quoi un Jam est-il vraiment différent ? L'essentiel est de considérer Canvas
comme votre espace de travail partagé. Il s'agit d'
un bureau collaboratif où vous et l'IE travaillez côte à côte sur
des documents ou des codes détaillés. gemmes, quant à
elles, sont vos spécialistes tactiques. Vous utilisez un tambour pour produire
le brouillon initial, exemple pour générer une première version
spécialisée basée sur les données que vous avez téléchargées, puis vous transmettez ce travail à Canvas pour l'affiner
et le peaufiner. L'un est le spécialiste, vous demandez le résultat initial. L'autre est le bureau où
le projet est terminé. Bien entendu, vous pouvez
également utiliser les
tambours seuls
pour certaines tâches, ce qui nous amène à notre
prochaine conférence de suivi. Mais avant de commencer à
travailler avec la batterie, récapitulons brièvement ce que
nous avons appris ici C'est bon. Et
c'est tout pour cette vidéo. Je te retrouverai dans le prochain.
22. Suivi de suivi : Construire un joyau de la vérification grammaticale em: Tout le monde, et bienvenue dans notre premier tutoriel
sur Gemini Gems Aujourd'hui, je vais vous
montrer comment créer
un expert personnalisé pour relire vos écrits, qu'il s'agisse de
rédiger des pages de destination, des descriptions de
produits, des e-mails
rapides ou tout autre texte C'est comme avoir une
deuxième paire d'yeux qui vous
donne une confiance totale
dans chaque mot que vous partagez. Ouvrons Gemini
pour créer ce Jam. Nous allons commencer
par cliquer sur Jams. Dans la barre latérale, nous accédons
à Jam Manager, la section où nous
créons des gemmes personnalisées Et ici, je vais cliquer sur New Jam. Commençons par
donner le nom notre confiture, voici la description de ma
gemme. Ensuite, j'ai inclus
mes instructions. C'est de loin la partie la plus
importante de votre bijou. J'ai inclus une description du rôle, disant que vous êtes un
expert dans l'art de vérifier la grammaire, orthographe et la ponctuation dans les textes
anglais et de les corriger si vous
rencontrez des erreurs.
Ensuite, je fournis une description du
public cible Si vous suivez le même chemin et
créez le même type de gemme, vous pouvez modifier le
public cible pour plus adapté à votre cas d'
utilisation et à votre domaine Ensuite, nous avons les règles de base
suivies des
informations sur le résultat que nous
recherchons et nous avons également
une invite de démarrage. Vous voyez que j'utilise des
balises de hachage dans le texte des instructions. Ils agissent comme des séparateurs de section qui créent un squelette propre
pour vos instructions Ils permettent au cerveau de Gems d'être
mieux organisé afin que l'IA sache où
s'arrête une règle et où commence la suivante. Revenons maintenant à l'ensemble
des règles et discutons-en. Comment puis-je réellement
obtenir cette liste ? Je vous recommande vivement d'effectuer
manuellement la
tâche que vous souhaitez automatiser trois à cinq fois trois à cinq fois avant même
d'essayer de créer le bourrage. Si vous suivez
directement les instructions, cela peut sembler intimidant Chaque règle de cette liste existe parce qu'il s'agit d'une préférence
spécifique. Au fil des semaines, j'ai découvert que j'activais
manuellement l'IA. Vous remarquerez peut-être aussi que j'
utilise des mots dans le journal des tasses, comme par exemple ici. Il n'y a aucune
exigence technique pour les utiliser. Les Gémeaux sont très sophistiqués. Il comprend les minuscules aussi
bien que les majuscules. Mais j'ai trouvé que
leur utilisation est toujours utile. Considérez ces mots
comme des mots puissants. Nous pouvons les utiliser pour mettre en évidence
les règles non négociables, afin que l'IA sache exactement ce qui
est indispensable par rapport à ce qui est possible. Très bien, passons à la prochaine étape. Je suis d'accord avec ces
instructions pour le moment, même si nous pouvons toujours
revenir à cette liste après avoir créé ce jam
et l'avoir modifié. Nous pouvons également choisir
un outil par défaut. Cet outil sera
sélectionné lorsque vous
entamerez la nouvelle conversation
avec le Jam. Je vais choisir Canvas
comme outil par défaut. Au lieu d'une conversation de
chat désordonnée, votre texte dirigé
glissera dans un panneau latéral propre, parfaitement formaté et prêt
à être copié Vous pouvez également inclure des fichiers
dans la base de connaissances si vous souhaitez que votre jam fasse référence à
des sources externes. Lors de la préparation de la réponse, vous voyez que nous pouvons télécharger des fichiers provenant de différentes
sources ici. Mais pour cet exemple précis, je vais le laisser vide. Et nous sommes prêts. Épargnons donc le matin. Je clique sur le bouton Enregistrer. Et nous pouvons commencer notre nouvelle discussion. Voici le texte que je
veux que Gemini vérifie. J'ai fait exprès plusieurs
fautes de grammaire ici. Voyons donc s'il sera en mesure les
trouver et de
corriger ce brouillon. Il ouvre un canevas
avec notre nouveau texte. Ça m'a l'air super. Et n'oubliez pas que vous pouvez utiliser cette interface Canvas pour
apporter des modifications rapides à
ce texte au cas où vous souhaiteriez
apporter des modifications ici, par
exemple, surlignons,
réconcilier et demander à trouver alternative. Et si ces modifications nous conviennent, nous pouvons cliquer sur
Partager et exporter, choisir le contenu de la copie, ou nous pouvons choisir d'exporter ce texte directement
sur notre Google Docs. Permettez-moi de revenir à
notre JAM, vous voyez
que nous l'avons dans la liste
des joyaux sur la barre de gauche. Une chose que j'ai remarquée, est
qu'il n'y a aucun
déclencheur de conversation ici. Donc, lorsque j'ai ouvert
cette interface,
je ne sais pas très bien que dois-je faire ici ? J'ai fait quelques recherches et j'ai trouvé cet article avec
exactement la même question. Il s'est avéré que ces
initiateurs de conversation ne sont pas pris en charge par des pierres précieuses pour le moment Il existe également une
solution que nous pouvons essayer. L'article indique que vous pouvez simuler de telles instructions de démarrage en incluant une
description supplémentaire dans votre Jam Bien, essayons d'
inclure un exemple de démarreur de conversation
pour voir si cela peut vous aider Je retourne à mon Jam. Si je clique sur les
trois points, CN, je peux choisir l'option Modifier, et nous pouvons apporter
les modifications que nous voulons. Permettez-moi d'inclure cet exemple sous la version actuelle
des instructions. Et ce que nous pouvons également faire ici, en plus d'inclure un
exemple de notre invite de démarrage, nous pouvons utiliser ce bouton
magique pour que Gemini réécrive nos
instructions et les améliore Essayons ça. Peut-être que ça pourrait aider. Je vois que Gemini a supprimé notre exemple d'invite de
démarrage Ce que j'ai décidé de faire, inclure la règle numéro six, demandant aux Gémeaux de toujours démarrer la conversation avec l'invite de démarrage
suivante Voyons si cela fonctionnera. Je vais donc mettre à jour les instructions de
mes gemmes , les
enregistrer et tester. Lorsque j'ai ouvert mon Jam mis à jour, je n'ai toujours aucun point de départ de
conversation ici. Malheureusement, toutes mes
autres expériences avec des instructions Jams
définies pour ajouter
le déclencheur de conversation
se sont révélées infructueuses. Dans ce contexte, définissons la description du
jam afin de fournir des informations sur ce qu'un utilisateur doit faire pour démarrer
la conversation. Pour cela, revenons à
l'interface d'édition JAMS. J'ai inclus de soumettre votre
texte pour commencer. Texte à la fin de
la description de Jam, je vais le mettre à jour et le tester à nouveau. Nos instructions sont ici, et soumettons-nous
autre chose pour une modification. J'ai ce fragment. Voyons comment Gemini
va le gérer. Parfait. Et si ce jam me convient et que je souhaite le partager avec
mes amis ou collègues, je peux cliquer sur le
bouton Partager et choisir Partager. Jim et moi allons créer un lien. Je peux le copier
puis l'envoyer. Je laisse le lien vers ce
jam dans les ressources de cette vidéo au cas où
vous voudriez la tester. Et je vous retrouverai dans
le prochain tutoriel où nous allons créer
le coach personnel Jam
23. : suivre : créer un joyau de coach fitness (partie 1): Créons maintenant un jam
compatible avec la vidéo. Supposons que je participe à
un défi d'
entraînement en ligne de 28 jours sur une application et que je veux savoir si je m'améliore
réellement de jour en jour. Je vais m'enregistrer en train de faire les exercices quotidiens et demander avis de
mon entraîneur de fitness basé sur l'IA, par mesure de prudence Comme nous en avons déjà discuté, même si l'IA est un bon partenaire pour suivre vos
mouvements et votre forme, elle n'est pas un expert médical. Consultez toujours
le
professionnel de santé avant de commencer
le nouveau programme de conditionnement physique. Cet outil est destiné au coaching et au progrès, et non à
un conseil médical. OK, ouvrons Gemini
pour commencer la démo. Créons un nouveau Jem. J'élargis ce menu. Va voir Jams. Ici, nous voyons des confitures fabriquées par des laboratoires. Je fais défiler la page vers le bas jusqu'
à Jam Manager. J'ai déjà une révision grammaticale
et orthographique Jam visible ici dans
la liste de mes gemmes. Et pour l'instant, permettez-moi d'en
créer un nouveau. Je clique sur New Gem. Fournissons le nom, description et
les
instructions de notre coach AI personnalisé Jam. J'ai inclus cette description. Ce jam analyse
vos vidéos d'entraînement pour fournir des informations détaillées sur vos
performances, et crée des arrière-plans de
téléphone
verticaux personnalisés arrière-plans de
téléphone
verticaux pour vous inspirer Et voici mes instructions. Comme toujours, j'ai commencé
par décrire le rôle. Je veux que ce jam soit joué. Dans notre cas, je voulais devenir coach sportif
professionnel. Ensuite, j'ai inclus une
tâche pour ce jam. Nous demandons à Gemini d'
analyser nos vidéos d'entraînement, recherche de signaux d'engagement
et de sécurité comme Cin ou Domin. J'ai également expliqué que je voulais que
Gemini crée une image verticale avec
une J'ai également inclus des instructions de démarrage, même si nous avons constaté que instructions de
démarrage ne fonctionnent pas
tout à fait pour le moment Mais voyons quand même ce qui
va se passer cette fois. Et pour que ce
drame soit vraiment personnel, je vais télécharger une image dans la base
de connaissances qui représente l'ambiance de l'image motivante que
je souhaite que Gemini crée Je clique sur le bouton Plus. J'ai mon
fichier de référence sur mon disque local, je vais
donc choisir Upload files. Voici mon dossier, et c'est la citation motivante
que j'ai sélectionnée Bien entendu, vous pouvez également inclure d'autres fichiers
ici. Par exemple, si vous avez
un article de recherche que vous souhaitez analyser lors la
fourniture des recommandations, au lieu
de simplement utiliser ses connaissances générales, vous pouvez
toujours télécharger ce fichier ici. Et pour ce qui
est de l'outil par défaut, pour ce jam, je ne vais rien
choisir ici. C'est parce que
notre entraîneur de fitness fait deux choses très
différentes. Cela nous donne un feedback textuel et crée une image en haute
résolution. Ainsi, en laissant Gemini choisir
l'outil le mieux adapté à chaque tâche, nous veillons à ce que les
arrière-plans de notre téléphone soient nets et nos commentaires soient transmis
sans aucun problème technique Tout va bien ici. Nous
sommes prêts à cliquer sur Safe. Et d'ailleurs,
notez qu'il existe également cette fenêtre d'aperçu que vous pouvez utiliser pour tester vos instructions
avant de les enregistrer. Mais dans mon cas, j'ai déjà fait le premier test avant de commencer à
enregistrer ce tutoriel, donc je suis prêt à partir. Je vais simplement cliquer sur Safe
et commençons notre discussion. ai mis en ligne ma première vidéo du premier jour de mon entraînement, et attendons un peu que
les Gémeaux l'analysent Notre vidéo a été mise en ligne, et avant d'appuyer sur Entrée, parlons de la sélection des
modèles ici. Comme cette impasse implique une analyse
multimodale, le
visionnage de vidéos, vérification des files d'attente liées à la sécurité et la fourniture de commentaires
structurés, je vais choisir un modèle de
réflexion qui privilégie le raisonnement Et nous sommes tous prêts, et je vais juste appuyer sur Entrée. Et voici les
recommandations de Gemini. Tout d'abord, j'
aime beaucoup le fait que cela nous indique que ces informations sont fournies à titre
informatif uniquement. Et pour un
avis médical ou un diagnostic, nous devrions consulter
le professionnel. C'est tout à fait vrai. Notez qu'il
a réussi à identifier qu'il s'agit de ma séance
d'entraînement
du premier jour en raison du nom pertinent de ce fichier, qui contenait un
entraînement du premier jour dans le nom. Voici le tableau de bord, ce que j'ai réussi, et
une chose Je suis d'accord avec cela.
Ensuite, il y a une question. Aimeriez-vous que je
crée votre arrière-plan
téléphonique personnalisé pour votre motivation
quotidienne, en fonction de vos progrès quotidiens ? Oui, définitivement, oui.
Alors répondons simplement. Oui. Et c'est parti. Nous avons cette citation parfaite, mais il y a un problème
avec cette image. Si nous la comparons à mon image de référence
originale, nous constaterons qu'
elles ne sont pas identiques. Voici une image que j'ai
demandé à Gemini de créer. Vous voyez que le contexte
est complètement différent. Revenons donc à notre routine
et travaillons avec
Gemini pour voir si nous pouvons
changer cela et nous assurer que cela crée des images avec un arrière-plan
similaire à celui notre fichier de référence
24. : créer un joyau de coach physique (partie 2): Bon retour. Dans la première
partie de ce tutoriel, nous avons défini la logique de base
de notre coach de fitness Jam. Mais nous avons
rencontré une limite. Même si nous avons téléchargé une image de référence
dans la base de connaissances qui
générait la
motivation quotidienne, les arrière-plans ne ressemblaient en rien
à notre image d'origine. Nous allons résoudre ce problème en
comprenant comment le système traite réellement ces différents types de données. J'ai déjà mentionné que
Gemini est multimodal. Il peut voir, lire et entendre à la fois. Tout cela est vrai. Cependant, il existe une différence
technique entre la façon dont une gemme lit un fichier et la
façon dont elle crée une image. Lorsque nous saluons une référence
à la base de connaissances, Gemini utilise sa capacité de vision
pour analyser le fichier et le résumer en données
textuelles destinées à sa mémoire à long terme Mais lorsque le am
génère une nouvelle image, il déclenche un modèle de génération
d'image distinct. Selon la documentation
technique de Gemini, ce modèle de génération
ne peut pas
voir directement les pixels bruts de vos fichiers de base de
connaissances Il ne reçoit qu'une invite sous forme de
texte. Si vos instructions
indiquent simplement de correspondre au style de
la base de connaissances, l'IA travaille
à partir d'un résumé, non de la source d'origine, et le
style d'origine est perdu. Pour résoudre ce problème, nous passons du
référencement à la spécification. Au lieu de montrer un fichier
au jam espérant qu'il interprète correctement
le style, nous allons écrire une spécification visuelle directement
dans les instructions Cela garantit que chaque fois que
le jam crée une image, il suit exactement vos règles
sans aucune conjecture Voici comment nous procédons. Accédez à votre liste de Jams, trouvez celui que vous souhaitez modifier et cliquez sur l'icône d'édition. Et à partir de là, suivez
vos instructions. Dans la section sur la motivation, supprimons cette
vague instruction. Ensuite, nous allons ajouter une description notre image
pour la créer,
ouvrir une discussion séparée, applaudir votre image de référence et utiliser cette invite Je suggère de passer au modèle de
pensée ici
en fonction des résultats. Une fois que vous avez la description de
l'image, collez-la directement dans
vos instructions Jams. Voici la description que j'
ai pour mon image de référence. Cela définit la mise en page, les téléphones et l'atmosphère. Le modèle dispose donc d'un
ensemble clair de garde-corps. Une fois cela fait, nous pouvons cliquer sur Mettre à jour pour enregistrer les modifications. Permettez-moi de commencer un nouveau graphique pour tester les modifications
que nous venons d'apporter. R Vous voyez que notre nouvelle image et celle de
référence ne sont pas identiques mais très
similaires dans leur mise en page, leur hiérarchie
visuelle et leur esthétique
générale, un manuel en verre dépoli sur un paysage urbain pastel Et c'est tout pour ce tutoriel. Veuillez écrire dans les commentaires de cette vidéo sur quel jam
vous prévoyez de travailler. Et je vais voir dans la vidéo
suivante.
25. Gemini pour la création visuelle : section Intro: Bienvenue dans cette nouvelle
section du cours. Vous m'avez déjà
vu créer quelques images avec Gemini
plus tôt dans le cours, et il est maintenant temps d'
entrer dans les détails Nous allons utiliser les outils d'
image et de vidéo de Gemini pour un essai routier approprié Et je pense que c'est l'une
des parties les plus visuelles
de tout le cours. Nous allons commencer par génération
d'images et
pas seulement par les bases. Je vais vous montrer comment utiliser techniques telles que le
mixage contextuel Où vous combinez des images de
référence pour créer quelque chose de complètement
nouveau et de raffinement itératif, où vous dirigez des Gémeaux
comme un photographe ajustant
un élément à la fois jusqu'à obtenir
exactement la photo que vous Nous examinerons également
la synthèse visuelle dans laquelle vous transmettez
plusieurs ingrédients aux Gémeaux et les
laissez créer une scène unique et
fluide Ensuite, nous passerons ce que j'appelle
la suite de retouche,
dans laquelle nous utiliserons Gemini pour
travailler avec des images
que
vous possédez déjà, par exemple pour travailler avec des images
que
vous possédez déjà restaurer de vieilles photos,
transformer des croquis
en photos de produits et effectuer des retouches précises à l'aide de l'outil de balisage de bâtiment
Geminis Nous étudierons ensuite la possibilité de créer des systèmes visuels
complets, des infographies, des
organigrammes et des ressources adaptés aux différentes
plateformes et tailles d'écran. Nous terminerons cette section avec le tutoriel sur la création de vidéos. Bien entendu, je
partagerai également mes meilleurs conseils recommandations pratiques que j'ai élaborées en
travaillant avec Gemini, un
autre logiciel de génération d'images et de vidéos basé sur l'intelligence artificielle qui vous aidera à
obtenir de meilleurs résultats C'est bon. Faisons preuve de créativité.
26. Qu'est-ce que la nano banana ? Explication des caractéristiques clés à: Vous avez peut-être remarqué apparition d'un
étrange petit moja à la banane dans votre application Gemini Ce n'est pas juste une jolie icône. C'est un petit indice d' une histoire de dénomination amusante
qui se cache derrière ce modèle. Avant la publication
officielle de ce modèle,
Google l'a soumis à des tests
anonymes sur une
plateforme appelée ALM Arena,
un site public où les
utilisateurs comparent
deux modèles d'IA côte à
côte et votent pour tests
anonymes sur une
plateforme appelée ALM Arena, un site public où les
utilisateurs comparent le résultat qu'ils préfèrent sans savoir
quel est le modèle.
C'est ainsi que les laboratoires d'IA recueillent commentaires du monde
réel
avant un lancement complet Le modèle avait besoin d'un nom d'
espace réservé, ce qui
n'indiquerait pas qu'il s'agissait d'un produit Google pour le soumettre
sur le site de LM Arena À 2 h 30 du matin,
Nina, chef de produit de
Google, a saisi Nano Banana pensais qu'il ne s'agissait que
d'une étiquette fictive que personne en dehors de la
plateforme de test ne verrait jamais Mais le modèle fonctionnait
si bien que les utilisateurs X sont devenus
obsédés par cette mystérieuse puissante Nano Banana, spéculant sur le
laboratoire qui l'avait fabriquée,
s'il s'agissait d'un projet
secret de Google ou s'il s'agissait d'un
projet totalement nouveau Au lieu de
corriger discrètement le compte rendu, Google s'y est penché Ils ont ajouté l'image de la banane
ou l'application Gemini et ont
même créé un produit en édition limitée sur le thème de
la banane La raison pour laquelle la banane est devenue virale n'était pas simplement
le nom du cheval. C'était une
fonctionnalité spécifique que outils d'imagerie de l'
IE
s'étaient trompés auparavant, cohérence des
personnages
dans le passé Si vous téléchargiez une photo de vous-même et que vous
demandiez à une IA de la réinventer, vous obteniez quelque chose qui vous
ressemblait vaguement Ce que les gens ont commencé à appeler
votre cousin éloigné de l'IA, Nano Banana, a changé le fait que vous téléchargiez une
photo de vous-même, et qu'il préserve
votre véritable ressemblance scénarios complètement
différents, dans des scénarios complètement
différents,
vous pouvez vous transformer en graffiti mural Personnalisé sur du carton ou un K en céramique, vous êtes reconnaissable dans chacun Vous pouvez vous
transporter dans différents lieux, différentes tenues,
différentes décennies. Le visage reste le tien. Vous pouvez même ajouter du mouvement transformant portrait
esthétique en une
courte vidéo dans laquelle le sujet tourne la tête ou
change d'expression Nous examinerons cela plus
en détail lorsque nous verrons le modèle vidéo de
Gemini Mais la cohérence des personnages n'en
est qu'un élément. Permettez-moi de vous expliquer
les autres éléments qui font que ce modèle mérite d'être compris. Le mélange de scènes vous permet de télécharger deux photos distinctes et de
les fusionner en une seule image
cohérente Vous pouvez vous asseoir avec un personnage
historique à la même table ou créer une photo de groupe de personnes qui ne
sont
jamais allées au même endroit. Gemini gère l'éclairage, les
angles et le contexte. Le résultat
ressemble donc à une seule image
plutôt qu'à quelque chose qui
semble assemblé. montage multitour transforme
votre conversation en un canevas dynamique Vous n'êtes pas obligé de
tout faire correctement dès
le premier message. Vous pouvez commencer par une pièce vide et lui donner vie, peindre les murs,
ajouter un canapé en cuir, déposer une tasse de
café fumante sur la table Chaque invite s'appuie sur la précédente. Une chose importante à retenir, le chat conserve le contexte
tout au long de vos modifications Donc, si vous souhaitez démarrer un projet
complètement distinct, ouvrez une nouvelle discussion
plutôt que de continuer dans
le même fil de discussion. design mix consiste à
prendre la texture ou le langage visuel d'
une chose pour
en faire une autre,
le motif d'une aile de papillon devenant
une robe de haute couture La texture d'un
carreau de marbre enroulé autour d'
une paire de baskets consiste moins à retoucher
une photo qu'à fusionner deux mondes qui ne vont
normalement pas ensemble Maintenant, une chose importante à comprendre sur la façon dont tout
cela s'intègre, Gemini lui-même est un
modèle de raisonnement et de langage à la base Les
fonctionnalités d'image et de vidéo proviennent de modèles spécialisés
dédiés que Gemini utilise en arrière-plan pour obtenir
des images C'est Nano Banana. Officiellement nommée Gemini
2.5 Flash Image, bien que personne ne l'appelle Pour la vidéo, il s'agit d'un
modèle appelé VO. Considérez-les comme l'équipe créative de
Gemini disponible sur demande Lorsque vous demandez à Gemini de
générer ou de modifier une image, il confie la tâche
à Nano Banana Lorsque vous demandez une
vidéo, le système appelle VO. La conversation
reste en Gémeaux. Le travail spécialisé se déroulera en
dessous lors de la prochaine conférence Nous allons
ouvrir Gemini et essayer de créer nos premières images.
Je t'y retrouverai.
27. Créer votre première image avec Gemini: Maintenant que vous avez vu un aperçu
des capacités visuelles de Gemini,
mettons-nous la main à la pâte
et créons notre première image La création d'images est
disponible sur tous les forfaits. Ouvrons Gemini
et mettons-nous au travail. Pour créer une image, deux options s'offrent à
vous. Première option : créez une image
dans votre chat existant dans laquelle vous posez des questions ou travaillez à la création d'un
nouveau contenu,
comme lors de notre dernière
conférence où nous avons travaillé sur notre fiche produit pour
une entreprise de matelas dotés d'intelligence artificielle. La deuxième option est de
repartir de zéro. C'est ce que je vais
faire cette fois. Je vais commencer par
le simple message. Un chat roux moelleux qui
dort sur un canapé. Pour indiquer aux Gémeaux que nous
allons créer une image, choisissons une image dans
la liste des outils De cette façon, Gemini sait que nous attendons une
image en sortie, nous n'avons
donc pas besoin de taper ces instructions verbales
dans l'invite Avant de générer
une image, l'étape suivante consiste à choisir un modèle de génération d'
image,
qu'il soit rapide ou professionnel. Je vais choisir vite cette fois. Une autre façon de créer
une image serait de taper créer une image de »
directement dans votre invite. Et dans ce cas, il
n'est pas nécessaire de sélectionner Créer une image
dans la liste des outils. C'est ma façon préférée
de travailler avec Gemini. Mais pour cette démo, continuons avec l'option
Créer une image sélectionnée. Notre image est prête, plutôt bonne compte tenu de la
brièveté de notre message et du fait qu'il ne s'agit que de
notre première itération. Vous pouvez partager, copier ou
télécharger cette image, ou vous pouvez continuer à
l'ajuster simplement en discutant avec Gemini et en ajoutant plus de détails à votre demande
initiale. Vous voyez que Gemini modifie
l'invite d'image en ajoutant plus de détails tout en conservant le
contexte précédent en place Mais
si vous souhaitez recommencer avec l'une de vos versions
précédentes,
cliquez sur Plus et choisissez une
branche dans Nouveau chat Ensuite, vous pouvez donner l'
invite à Gemini, et dans ce cas, Gemini
modifiera l'image sélectionnée Bien
sûr, vous pouvez donner l'
invite complète à
Gemini immédiatement,
ou au lieu de décrire vous-même les
détails, ou au lieu de décrire vous-même les
détails, choisir un Par exemple, au lieu
de décrire la lumière
que
nous voulons voir apparaître dans notre image, choisissons cinématique dans la
liste ci-dessous Vous m'avez vu choisir entre le mode
rapide et le mode réflexion. Dans l'application Gemini, ces modes représentent la puissance de
traitement et le raisonnement utilisés par l'IA
pour créer votre image, tandis que les
noms de modèles spécifiques,
tels que nana Banana, évoluent rapidement en fonction du fonctionnement de ces
deux modes Reste constant. Je recommande toujours de consulter les pages d'
assistance officielles de Gemini pour connaître les derniers noms de version Mais voici la meilleure façon de
penser à votre flux de travail. Considérez le mode rapide comme
une couche interactive. Il est conçu pour être rapide
et itérer rapidement. Si vous changez de couleur de chemise, essayez une nouvelle coiffure, changez de fond ou que vous
générez de nombreuses variations, maintenez le mode Fast Thinking, la couche de raisonnement, cela prend plus de temps car il faut
faire plus attention avant de générer Utilisez-le lorsque vous avez besoin de
précision, comme du texte clair et lisible pour assigner des photos de produits
cohérentes ou des scènes complexes où
les détails comptent vraiment. Vous pouvez me demander, mais Anna, pourquoi je n'aurais pas envie de penser tout le temps
si c'est plus puissant. C'est une bonne question, mais il y a deux compromis
pratiques. Le premier est le temps. Le premier mode
est l'outil de rapidité de pensée. Le mode réflexion nécessite une période
d'attente pendant que l'IE
réfléchit à l'invite. Deuxièmement, les limites d'utilisation, car mode de
réflexion est plus coûteux en
termes de calcul. Il a généralement des
limites quotidiennes plus strictes que le mode rapide. Le processus que je recommande utilise le mode rapide pour explorer et générer rapidement des options
approximatives. Et une fois que vous avez trouvé le concept de
votre héros, passez en mode réflexion
pour peaufiner la haute
fidélité. Commencez immédiatement par le
mode réflexion, uniquement pour les tâches très
complexes telles visualisation des flux de processus ou création d'images avec des textes localisés
spécifiques C'est bon. Vous avez maintenant
une première idée de la façon d'inciter Gemini
à créer des visuels Dans la vidéo suivante, nous allons aller un peu
plus loin et nous allons
apprendre comment créer un bon
LCR rapide dans la vidéo suivante
28. 7 conseils pour créer de meilleurs visuels: Bonjour à tous, et
bienvenue à la conférence. Comme cette section du cours traite génération de visuels, nous ne pouvons pas oublier
un sujet
aussi important que la création de
ces instructions Dans la prochaine vidéo, je vais partager mes
sept principales recommandations sur la façon de créer
des instructions efficaces. Commençons. Parfois, vous
verrez des résultats solides avec de simples instructions ouvertes, surtout si vous êtes
ouvert aux surprises Cependant, lorsque vous avez une vision
précise en tête, description de divers détails peut vous
aider à atteindre la perfection. Mais quelle que soit la
direction que vous souhaitez prendre, je vous recommande de commencer une simple invite, puis
d'ajouter des détails supplémentaires
un par un pour voir comment ils
affectent l'image. Commencez par la description
de votre sujet, de votre
personne, de votre animal, paysage, de votre
personnage fictif, etc. Générez votre première
image, puis incluez détails ou un contexte
supplémentaires
tels que son emplacement, informations sur l'
environnement et l'éclairage, ainsi que les émotions ou les humeurs que
vous souhaitez introduire Pour clarifier l'idée de
ce que vous voulez créer, il est utile de vous poser
une série de questions. Voici une liste de contrôle
que vous pourriez utiliser. Décidez si vous voulez une
photo ou une illustration. Quel est votre
sujet, votre personne, animal, votre paysage, votre
personnage fictif, etc. Pensez aux
effets et aux détails spécifiques que vous souhaitez inclure dans les
mouvements artistiques, les thèmes, techniques, les effets, les
matériaux, les concepts, couleurs et les tons, l'éclairage
et la composition. Allez au-delà des principes de base et incluez des descriptions
supplémentaires dans
votre message qui peuvent au processus de création une toute autre
orientation au processus de création ou ajouter de la saveur et des
nuances à vos images. Voici quelques exemples
de ce que vous pouvez ajouter. Type de photographie,
environnements, émotions et humeurs, styles artistiques
spécifiques, cinématographiques ou picturaux L'expérimentation de ce type
de descripteurs est l'un des aspects
les plus agréables de la génération
d' images Gemini De petits ajouts peuvent
changer radicalement l'apparence d'une image. Faites attention à l'ordre
des mots dans votre message. Les mots du début ont
plus de poids que ceux de la fin. Donc, si votre paysage enneigé compte plus que la
cabine au premier plan, commencez par
le Essayez de réorganiser le
même ensemble de mots, et vous obtiendrez souvent des résultats
sensiblement différents Soyez attentif aux droits des
tiers. Gemini vous permet de faire
référence à des artistes historiques
et à des mouvements artistiques par leur nom Donc, demander un homme qui aime la qualité ou un style de Vang
fonctionne parfaitement Cependant, l'IE bloquera les messages demandant des informations sur les styles de vie ou les
artistes contemporains afin de protéger les créateurs Elle restreint également les
caractères protégés par des droits d'auteur et les logos de marque. Si vous recherchez le look d' artiste
moderne ou
d'une marque en particulier, décrivez les
qualités visuelles que vous
recherchez au lieu de les
nommer directement. Cherchez de l'inspiration et des exemples lorsque vous créez
vos propres instructions Si vous débutez génération d'images par
IA et que vous n'
avez aucune expérience en design, il peut être difficile de
rédiger des
instructions descriptives détaillées au début, qui est tout à fait normal Une bonne façon de
commencer est de parcourir les
communautés d' images
que j'ai générées en ligne, trouver les images que vous aimez, regarder les instructions qui les
sous-tendent et commencer à expérimenter en
apportant de petites modifications C'est également une bonne idée de
créer un moodboard d' images que vous aimez et que vous
souhaiterez peut-être consulter ultérieurement. Enregistrez l'image, l'invite utilisée et toutes les notes de
style associées. Cela devient une
référence créative vraiment utile au fil du temps. Enfin et surtout,
profitez du processus. Au début, on peut avoir
l'impression que c'est l'IE qui fait tout
le travail créatif. Mais sans vos idées uniques, votre instinct quant à ce qui semble beau et votre curiosité
pour expérimenter, l'IE ne produirait
rien d'intéressant. Alors soyez vous-même,
exposez vos idées et amusez-vous avec. Pour récapituler. Voici les sept conseils. Commencez simplement, puis ajoutez
les détails un par un. Posez-vous une série de questions pour clarifier
votre vision. Allez au-delà des notions de base en
utilisant des descripteurs d'environnement, d'ambiance, de style, etc. L'ordre des mots est important. Ce qui vient en premier
a plus de poids. Soyez attentif aux droits des
tiers. Les styles artistiques sont équitables, mais évitez les
personnages protégés par des droits d'auteur et les images de marque Trouvez l'inspiration
en ligne et créez les moodboards comme
référence créative. Amuse-toi bien avec. Comme toujours, Alca dans
la vidéo suivante.
29. Mélange contextuel, renouvelement itératif et synthèse visuelle: Bon retour. Jusqu'à présent, nous avons rencontré la banane Banana et avons appris à créer
une image à partir de zéro. Mais dans la plupart des cas, vous ne
recherchez pas uniquement des images sympas. Vous recherchez des actifs. Vous avez besoin de l'image de
héros parfaite pour un site Web ou une publicité sur les réseaux sociaux qui arrête réellement le défilement. Dans cette vidéo, nous allons
découvrir comment
créer ces actifs. Bien sûr, vous pouvez repartir de
zéro et demander à
Gemini quelle image vous souhaitez Mais pensez-y. décrire un angle
d'éclairage spécifique, une texture unique ou difficile de décrire un angle
d'éclairage spécifique,
une texture unique ou une structure physique
complexe
à l'aide d'un simple texte. Vous pouvez passer 30 minutes à écrire l'invite parfaite et ne
pas comprendre ce que vous avez en tête. Mais si vous montrez l'image de
référence des Gémeaux, vous fournissez une
carte instantanée de vos attentes Aujourd'hui, nous allons
voir comment
utiliser les images pour communiquer avec l'IA. Commençons par le défi
marketing classique. Vous avez un produit,
dans ce cas, flacon de
soin pour la peau, et vous
voulez qu'il soit éclatant,
frais et de qualité supérieure Pour cela, nous allons
utiliser le mixage contextuel. Regardez ce qui se passe lorsque je télécharge une simple photo de
la bouteille à côté l'image de référence,
puis que je guide Gemini pour qu'il la place dans une
toute nouvelle scène créative Dans notre première invite, nous ne demandons pas simplement une photo
prise au hasard. Nous disons
exactement à Gemini ce que nous voulons en
faisant référence à l'image originale et en demandant à en
remplacer certaines parties, en
remplaçant l'eau par du jus et le flacon original par
notre marque de soins pour
la Commençons par le mode rapide. J'ai cliqué sur Soumettre, et
voici notre image. Le texte est net et la bouteille se trouve parfaitement
sous la ligne de flottaison Apportons maintenant quelques modifications. Tout d'abord, je vais ajouter
cette phrase dans l'invite. Des phrases telles que la photo d'un
produit de commerce électronique, éclairage de studio
lumineux ou arrière-plan blanc
pur
sont les secrets professionnels qui donnent à une image l'apparence d'une véritable publicité
plutôt que d'une expérience d'IA. Passons également en mode
réflexion ici. J'ai utilisé le même message, mais le flacon se
retrouve soudainement au-dessus du liquide. Pourquoi ? Comme le modèle raisonne en
fait par le
biais de la physique, il sait que le jus d'orange, contrairement à l'eau, n'est pas transparent. Il pense que si je plonge
cette bouteille dans du jus, la moitié inférieure de l'
étiquette disparaîtra. Essayons de le forcer en
ajoutant des instructions
à moitié immergées à l'invite. Des résultats similaires. Le mode réflexion donne la priorité logique de photographie
du produit par rapport mes instructions de mise en page spécifiques Cela suppose qu'une bonne photo
doit montrer l'ensemble de la marque, donc cela corrige ma composition en
retirant le produit du jus. Passons maintenant au raffinement
itératif. C'est là que les Gémeaux
brillent vraiment. Vous n'êtes pas obligé d'obtenir la photo
parfaite en une seule fois. Au lieu de cela, vous le dirigez comme
un photographe qui ajuste un élément à la fois jusqu'à ce que vous arriviez exactement
où vous le souhaitez. Pour ce sac à café Gemini, nous allons créer une riche
photo textuelle du produit étape par étape, en
commençant par le placement, puis en
affinant la composition,
en ajoutant de l' éclat et de la profondeur, et enfin
en ajustant l'éclairage Découvrez comment chaque invite
rapproche l'image de cette esthétique haut de
gamme Enfin,
examinons la technique qui me semble
la plus impressionnante
de toutes les synthèses visuelles. Parfois, vous avez un kit de campagne
complet, plusieurs produits,
un modèle, une tenue. Dans le passé, la mise en place de tout
cela nécessitait un énorme brief créatif et de nombreux allers-retours. Avec le mode de pensée des Gémeaux, nous avons simplement remis les pièces et nous les avons
laissés s'occuper du reste Créer à partir de zéro est une question direction, pas seulement de description. Vous avez vu
comment mélanger le contexte, affiner une prise de vue étape par étape et synthétiser plusieurs
éléments en une seule image complète Mais que se passe-t-il
lorsqu'une image est presque parfaite et ne
nécessite qu'une modification spécifique ? Dans notre prochaine vidéo, nous aborderons la suite de
montage dans laquelle nous
utiliserons Gemini pour corriger, restaurer
et éditer des images avec précision Alca est déjà là.
30. La suite d'édition : transformer des ébauches en prototypes et en restauration photo au format: Tout le monde, et
bienvenue dans la série de conférences sur la création d'
images avec Gemini Dans cette vidéo, nous
abordons les capacités d'édition de Gemini Je vais vous montrer comment utiliser couche de réflexion
Gemini pour corriger, restaurer et littéralement lire
puis ajuster les images
que vous avez déjà C'est là que nous passons du statut de créateurs à celui d'éditeurs
sophistiqués. Permettez-moi d'ouvrir Gemini
pour commencer la démo. Cela commence généralement sur une
serviette ou un tableau blanc. Vous avez une vision pour un produit, mais vous n'êtes pas designer. Voici ce que nous allons faire. Je télécharge ce croquis d'
un nouveau design de chaise sur Gemini Je n'ai pas besoin d'être artiste. Je pourrais simplement demander à Gemini interpréter ce croquis pour en une photo de produit
photoréaliste car nous sommes
en mode réflexion Gemini utilise les lignes
comme guide structurel. Il comprend le point de vue que j'avais prévu et complète
les détails, je n'ai pas pu le dessiner moi-même. Cela transforme vos brouillons
en prototypes en quelques secondes. Changeons le tissu de la chaise. Mais au lieu d'expliquer la
couleur et la texture que je souhaite, j'utiliserai des images de référence. Étonnamment, j'ai reçu
cette image du livre parce que j'ai utilisé le mot
couverture dans mon message. Commençons une nouvelle discussion
pour corriger l'image. Et, bien sûr, nous pouvons donner à
cette action une rotation de 360 degrés. Ici, j'ai l'
image des cheveux et ma vidéo pmt. Et j'ai également sélectionné la vidéo
dans le menu déroulant pour m'assurer que Gemini a bien compris
ma tâche. Voyons maintenant l'une des réparations
les plus puissantes que vous
puissiez effectuer pour la restauration. Nous avons tous ces vieilles photos de famille
délavées
ou ces
photos numériques de mauvaise qualité datant d'il y a des années Au lieu de simplement le colorier, je vais demander à Gemini de le restaurer À l'aide de sa couche de réflexion, Gemini analyse les textures
et le contexte historique Il élimine les rayures,
affine les visages et applique des couleurs naturelles et
réalistes comme si la photo
avait été prise aujourd'hui Il n'y a pas que le filtre. C'est l'IE qui reconstruit la qualité perdue
au fil du temps. Jetons un coup d'œil. Mm. Oh, quelle sensation danser sur la pédale
, perdue au rythme du soleil
31. La suite de montage : des retouches ciblées avec l'outil de marquage et des annotations externes: Passons à autre chose. Et si
l'image est belle, mais que vous voulez changer
une chose en particulier ? Voyons comment travailler avec outil de balisage d'
image dédié de
Gemini, ainsi que son alternative J'aimerais modifier cette image. Je vais le télécharger sur Gemini et
ouvrir l'outil de balisage. Je clique simplement sur l'image. Et voici notre espace de travail
d'édition. Ce que je vais faire ici
s'appelle une incitation spéciale. Je montre aux Gémeaux
exactement où je veux le changement et je décrit
ce que le changement devrait être Je vais d'abord choisir une couleur. Allons-y avec le rouge. Et je fais le tour de cette cheminée. Ensuite, je dois
expliquer l'intention Je vais
donc passer à l'
outil texte et taper Ed fire. Remarquez que j'ai utilisé un verbe ici. Vous pouvez être précis avec des
actions telles que l'ajout ou le remplacement, ou vous pouvez simplement
décrire l'objet. Par exemple, ajoutons deux tasses de café sur
cette table d'appoint ici. Si vous avez fait une erreur, vous pouvez toujours appuyer sur le bouton d'
annulation pour revenir en arrière. Je clique sur Terminé car je viens finaliser les
annotations et appuyons Entrée
sans fournir d'instructions, car nous
venons de les créer sur cette image Et voici la nouvelle image. Nous constatons que Gemini a inclus les modifications
avec succès. Nous voyons le feu dans
la cheminée et nous voyons ici deux tasses de
café. Excellent travail. Lorsque j'ouvre cette nouvelle image, vous remarquerez
que cliquer dessus n'ouvre plus l'outil de
balisage Cet outil est donc spécialement conçu
pour vos premiers téléchargements. Cependant, vous n'êtes pas bloqué, vous pouvez continuer à affiner
le résultat à l'aide de modifications
conversationnelles Voici donc ma nouvelle invite. Les Gémeaux sont
conscients du contexte de l'image. Il vient de créer et
continuera à apporter les modifications
que vous avez demandées. Et pour en revenir à mes annotations
d'origine, remarquez que j'aime faire
correspondre la couleur du texte à
la couleur du cercle pendant que l'IA
suit principalement les coordonnées Il s'agit d'une excellente bonne pratique pour organiser vos
instructions. Vous pouvez également importer des
annotations provenant d'outils externes tels que Canva Par exemple, ici,
j'ai annoté cette photo du bâtiment Bursch
Khalifa Je veux que Gemini apporte exactement
ces modifications. Je veux que ce bâtiment
soit supprimé et je souhaite changer les couleurs de certaines parties
du bâtiment. J'ai ouvert un nouveau chat, et j'ai soumis cette
image au chat. Pour des tâches complexes comme celle-ci, je recommande de
passer en mode réflexion. Cela déclenche un modèle de raisonnement plus
puissant, qui
suit bien mieux ces instructions
précises. Je vais également inclure
ces instructions, y compris cette invite
ici qui est importante. Par exemple, voici l'image
que j'ai obtenue en ajustant cette même image sans fournir d'
instructions à Gemini Nous constatons que Gemini a
réussi le changement. Cependant, nous
voyons toujours les annotations, et c'était mon image originale sans aucune
instruction fournie Revenons à notre
discussion et appuyons sur Enter. Malheureusement, cette
fois, nous
avons toujours les instructions
sur la nouvelle image, et nous constatons également que Gemini a
apporté d'autres modifications avec succès Nous ne voyons pas le bâtiment
ici sur le côté droit, et les nouvelles couleurs
ont été appliquées avec succès. Demandons à Gemini de supprimer les instructions
d'annotation de l'image. Et c'est parti. La deuxième tentative
a été couronnée de succès. Comme vous pouvez le constater, les Gémeaux
reconnaissent le texte, retirent le bâtiment et
changent parfaitement les couleurs Ensuite, nous avons fourni la deuxième instruction pour supprimer les annotations.
Tout va bien ici. Enfin,
voyons comment les Gémeaux raisonnent
à propos du monde qui se
trouve dans vos photos Par exemple, si vous téléchargez
une photo de l'horizon d'une ville, vous pouvez demander
à Gemini de l'annoter, de
regarder comment elle identifie les points de repère
et ajoute
des étiquettes exactement
là où Il ne s'agit pas simplement de dessin,
mais de conception de l'information. Il s'agit de transformer un pota
cru en un outil pédagogique intelligent pour
une présentation ou un manuel Et c'est vraiment le thème de
tout ce que nous abordons dans cette vidéo. Qu'
il
s'agisse de donner vie à
un croquis, de
restaurer un ancien forum, restaurer un ancien forum, annoter une image ou d'
étiqueter intelligemment une scène complexe, Gemini se charge du
travail de précision, vous n'avez donc pas à le faire Dans notre prochaine vidéo, nous allons
réunir
toutes ces compétences pour créer des systèmes visuels
complexes, notamment des infographies et des visualisations de
données qui transforment les données complexes en instantanément
claires.
Je t'y verrai.
32. - Jacqueline Jensen Visuels complexes ams: Bon retour. Jusqu'à présent, nous avons abordé de nombreux
sujets en créant à partir de zéro, éditant avec précision et en
synthétisant des scènes complexes Voyons maintenant
ce que Gemini peut faire lorsque la tâche devient
encore plus ambitieuse, en créant des ressources
visuelles en plusieurs
parties, telles diagrammes
infographiques
et des ressources qui fonctionnent sur différentes
plateformes sociales et différents Commençons. Je veux que
Gemini crée une page Menu infographique utilisant
ces images de café. Je voulais identifier chaque
boisson et la placer dans une section propre avec son nom
et une brève description. Choisissons également de créer des images à partir de la
sélection d'outils. D'après la
description de Pam ici, il n'est pas très clair
si je veux une image ou un texte comme
résultat final. Commençons. Et voici notre photo. Parce que Gemini possède cette couche de résonance
profonde, il voit la différence entre
les images que nous avons soumises
et peut identifier une tasse à café contenant des glaçons par
rapport à une tasse
contenant du lait chaud Permettez-moi de demander à Gemini de
modifier
un peu cette mise en page et de changer les couleurs pour qu'elles s'adaptent
aux couleurs de notre marque Oh, c'est un super design. Je l'aime mieux que
notre première itération. Et faisons un autre changement. Je souhaite remplacer le texte de ce
menu de café par le nom de notre marque. Et voici notre image. Je l'aime beaucoup. La seule chose que
je veux changer, supprimer ces grains de café pour que
le texte soit entièrement visible. Mais au lieu de le faire comme une série d'instructions itératives, essayons d'utiliser
une autre technique ici Je vais utiliser l'outil de balisage dont nous avons parlé dans
la démo précédente Permettez-moi de télécharger cette image
en taille réelle. J'ai créé un nouveau chat, téléchargé notre image que
nous venons de générer. Ensuite, j'ai ouvert l'outil de balisage et j'ai mis en évidence
les grains de café J'ai ajouté l'instruction à Gemini de retirer
les grains de café Cela va être un
peu délicat car nous voyons les haricots en même temps
que le texte. Mais essayons de le faire fonctionner. Je choisis ici le modèle de
pensée et sélectionne et crée des images. Ma première tentative
a donc échoué. Vous voyez que les images OF sont toujours présentes à l'intérieur de l'image. Essayons de décrire le changement que j'
aimerais apporter. Et voici notre image. C'est vraiment incroyable que
Gemini ait si bien suivi mes instructions
et retiré ces grains de café du coin
supérieur droit du menu Et maintenant, nous pouvons voir clairement
notre texte. Génial. Et passons
à la deuxième démo ici. Parfois, vous devez expliquer
à quoi ressemble le voyage
du grain à la tasse dans mon exemple de marque de café
Gemini Voici donc le processus de brassage
emblématique de notre marque. Je vais demander à
Gemini ce qui suit. Je souhaite que Gemini finalise ce processus de signature Gemini
Brew en cinq étapes dans un organigramme à architecture
épurée Je voulais utiliser une
mise en page minimaliste et faire correspondre les couleurs à celles que
nous utilisons dans notre fichier PDF. Laissez-moi choisir le mode de réflexion. Et pour cet exemple, je vais également
choisir Créer des images. Et voici notre schéma. Gemini a construit la structure, créé les icônes et
étiqueté chaque étape Ce que je n'aime pas ici, ce sont ces lancers qui ne sont
absolument pas nécessaires. Et ce texte que l'on
peut voir sur chaque boîte. Demandons aux Gémeaux de le supprimer. Et voici l'image la plus nette. Et j'aimerais également
supprimer ce cadre. Demandons à Gemini de le faire. Et c'est une bien
meilleure image. Et je veux faire
une autre itération pour rendre cette image
plus belle Regarde ça. Il s'agit d'une esthétique
complètement différente. Dites-moi dans les
questions-réponses de cette vidéo, laquelle vous préférez Et nous passons à la
prochaine étape avec notre démo.
33. Visuels complexes : adapter les actifs sur différents formats et plateformes: Bien entendu, vous pouvez
modifier davantage cette image si vous le souhaitez, soit en continuant à demander Gemini des améliorations
directement ici dans le chat, soit en copiant
cette image et en suivant les instructions de l'
outil de balisage Mais laissez-moi vous montrer
un autre exemple pendant que nous sommes ici sur cette image. Supposons que nous prévoyons une expansion internationale
de la marque Gemini Brew Nous avons donc besoin que ce schéma soit traduit dans
d'autres langues. Je vais donc demander de
changer l'image pour que les textes soient affichés
en chinois. Et voici notre schéma
traduit. Notez que dans mon message, je dis explicitement que je veux que
Gemini change l'image, pas simplement qu'il affiche les textes en chinois afin qu'
il soit parfaitement clair pour Gemini que j'ai besoin d' une autre variante de cette image traduite en
chinois C'est bon. Et
prenons un dernier exemple. Supposons que nous ayons
besoin de ressources pour la
campagne marketing de Gemini Brew qui fonctionneront
partout, qu'il s' agisse d'histoires
et de publications sur
Instagram ou d'une
image de héros sur notre site Web Nous allons prendre cette photo que nous avons créée plus tôt avec Gemini, et je vais dire à Gemini que c'est
notre principal atout Et maintenant, j'ai besoin d'une version pour un article vertical sur les réseaux sociaux, d'un post carré et d'un en-tête blanc pour le site Web de
Gemini Brew ai également joint l'image que je souhaite que Gemini modifie Et voici le message
que j'ai reçu de Gemini lorsque j'ai testé cette invite avant
d'enregistrer le didacticiel C'est parce que les Gémeaux peuvent
créer une image à la fois. Bien que Gemini puisse traiter plusieurs images de
référence à la fois, son objectif est toujours
de les synthétiser en une composition finale haute
fidélité Si vous lui demandez plusieurs fichiers image
distincts en une seule fois, comme dans mon exemple, il ne sera pas en mesure
de traiter votre demande. Définissez donc toujours votre demande sous la forme d'un projet unique, tel qu'une
infographie, un menu ou une photo de campagne où tous vos éléments sont
réunis dans une seule image Permettez-moi donc de modifier l'invite. Je voudrais d'abord créer une image d'en-tête blanche pour
le site Web de Gemini Brew Comme toujours, je sélectionne le mode
réflexion, et choisissons également
Créer des images pour donner aux Gémeaux des instructions claires indiquant que je m'attends à voir
une image dans ce cas Et voici notre nouvelle image de
héros blanc pour notre site Web. Nous constatons que Gemini ne se contente pas étirer notre
image d'origine, il la surpeint Il y ajoute
donc plus de détails ,
comme ces vieilles machines à café ou ces grains de café sur les côtés gauche et droit de
l' image d'origine,
tout en veillant à ce que notre produit soit toujours parfaitement positionné au
centre de la composition,
quelle que soit la taille de l'écran Créons également une image de taille
verticale
et une image de taille carrée
pour nos publications Instagram.
34. Au-delà de la discussion - Recherche approfondie et construction avec Gemini : section d'introduction: Que se passe-t-il lorsque vous confiez à Gemini une tâche de recherche qui vous
prendrait normalement une demi-journée ? C'est le sujet de cette
section, puis nous emmenons ces résultats là où
vous ne vous y attendriez peut-être pas. Nous allons le faire en utilisant une fonctionnalité Gemini
appelée recherche approfondie, et nous travaillerons sur trois situations
réelles très différentes avec elle Un problème auquel la plupart d'entre nous sont
confrontés chaque semaine, un autre qui consiste à prendre une
décision d'achat sans
tomber dans le terrier des
sites d'évaluation et des fils de discussion, et un autre qui consiste à se familiariser avec un sujet complètement
nouveau Dans chaque cas, je veux que vous voyiez non seulement ce que produit Gemini, mais aussi comment le demander, afin que le résultat vous soit
réellement utile Ensuite, nous
allons aller encore plus
loin en utilisant Canvas pour transformer l'un de ces résultats de
recherche en une application interactive fonctionnelle
créée à partir d'une conversation. Aucun code ne l'exige.
J'espère que tu es prête. Alors, prenez-vous une tasse
de thé ou de café, et allons-y.
35. Recherche approfondie : Au-delà des réponses: Levez la main si cela vous est déjà
arrivé, si
vous posez une question difficile et
importante à un chatbot, exemple
: « Je veux
augmenter le financement de la série A Quels sont les
investisseurs les plus actifs dans mon espace en ce moment ? Et il répond par
une liste d'options, qui est assez superficielle, et vous obtenez également un tas de recommandations de
haut niveau. Par exemple, vous devriez rechercher des investisseurs
actifs
dans votre catégorie. Vous devez créer une liste de cibles. Vous devriez contacter
votre réseau pour des présentations
chaleureuses, etc. L'équipe produit de Google
a un nom pour cela. Ils appellent cela un plan de réponse, une carte de haut niveau qui vous
indique ce qu'il faut
trouver tout en vous laissant le soin
de vous occuper du travail Vous êtes toujours en train de vous noyer
dans 50 onglets de navigateur ouverts, à
essayer de séparer le
signal utile du bruit La recherche approfondie de Gemini
peut vous aider à dépasser le plan directeur et à obtenir quelque chose très complet sur lequel vous
pouvez agir immédiatement La recherche approfondie n'est pas
simplement un chatbot plus intelligent. Il s'agit d'un système agentique, ce qui signifie qu'il planifie,
recherche les raisons et synthétise de manière autonome les informations provenant
de centaines de sources C'est comme si vous aviez un assistant de recherche de niveau doctorat dans votre équipe
un assistant de recherche de niveau doctorat qui effectue des heures d' investigation
complexe
en quelques minutes et revient avec un
rapport soigné, et non une liste de choses à faire. Alors, que fait
réellement un assistant
de recherche au niveau du doctorat pour vous dans la pratique ? Permettez-moi de vous présenter les trois cas d'utilisation
les plus puissants. Tout d'abord, la compréhension du sujet, approfondissement de sujets complexes. Imaginez que vous êtes un responsable des
ressources humaines qui essaie comprendre
l'impact de l'IA sur le personnel
au cours des trois prochaines années. Vous ne voulez pas simplement un résumé du niveau de
surface. Vous devez comprendre
le paysage. En quoi l'automatisation de l'IA
se compare-t-elle à l'augmentation de l'IA ? Quels sont les rôles les plus
menacés et ceux qui évoluent. Que font déjà d'autres
entreprises ? Et que dit la
recherche par rapport à ce qui ne fait que du battage médiatique ? Une recherche approfondie
explore
simultanément des articles universitaires, des rapports
sectoriels, des commentaires
d'experts et des études de cas
réels des rapports
sectoriels, des commentaires
d'experts et des études de cas
réels Il revient avec une analyse
structurée qui cartographie le paysage, en
contraste les idées concurrentes, met en évidence les relations
entre les concepts et explique le
pourquoi de tout cela Deuxièmement, la
due diligence professionnelle. Pensez à préparer une réunion de vente
d'entreprise. Avant de vous lancer,
vous devez comprendre les vous devez comprendre principaux défis
commerciaux des prospects,
les récentes décisions stratégiques, la pression concurrentielle à laquelle
ils sont confrontés
et
la manière dont votre produit
s'intègre à tous ces défis. Des recherches approfondies portent sur
les produits de l'entreprise, découvrent l'historique, l' équipe de
direction et l'environnement
concurrentiel. Et c'est très important :
associez le tout à vos
propres notes internes sur la relation client,
ce qui aurait pris une journée complète à un analyste junior pour compiler est désormais
prêt en quelques minutes Vous entrez donc dans cette salle de
réunion en sachant plus sur leur activité
que ce à quoi ils pourraient s'attendre. Troisièmement, des enjeux élevés,
des décisions personnelles. Tout ne tourne pas autour du
travail, de l'achat d'une voiture, du choix d'un quartier, de la
comparaison des options d'assurance. Ces décisions sont tout aussi
importantes, et la recherche Rabbit Hole
est tout aussi approfondie. Au lieu d' un week-end perdu à parcourir blog
contradictoires
et des fils de discussion, vous obtenez un rapport
structuré en fonction de votre situation spécifique, avantages, des inconvénients et des nuances que les
conseils génériques ne vous apportent jamais Et voici ce qui rend ces trois cas
d'utilisation
possibles dans la pratique. Une recherche approfondie ne se limite
pas à vous fournir une liste de liens. Il produit un rapport complet
de plusieurs pages, analyse
structurée, des sources
citées et même des éléments tels infographies qui donnent vie
aux données Lors de la prochaine conférence, nous allons mettre
la main dessus. Je vais vous montrer comment
lancer une recherche approfondie, comment créer le
plan de recherche avant qu'il ne commence, et nous allons passer en revue un exemple concret ensemble
afin que vous puissiez voir le processus complet, de invite au rapport final.
Je t'y retrouverai.
36. La recherche approfondie en action - Comprendre le sujet: Comme promis, voyons des recherches
approfondies en action. Nous allons commencer par le sujet de la compréhension des cas
d'utilisation, et j'ai choisi un exemple auquel je
pense que la plupart d'entre nous peuvent
s'identifier personnellement. Nous allons utiliser des
recherches approfondies pour aborder l'un des
sujets les plus confus de la vie quotidienne. Petit déjeuner, alimentation,
vous connaissez ce sentiment. Si vous recherchez Google RX en bonne santé et que vous obtenez dix
réponses complètement différentes selon l'article sur lequel vous atterrissez,
vous aurez besoin d'un plan Gemini
payant Si vous utilisez actuellement un
forfait gratuit et que vous souhaitez effectuer une mise à niveau, consultez la conférence dans la section des cours d'introduction où je vous explique
comment procéder. OK, allons-y. Pour lancer une recherche approfondie, ouvrez une nouvelle discussion et choisissez recherche
approfondie
dans la liste des outils. Par défaut, Gemini utilise la recherche
Google comme
source principale Mais vous pouvez étendre cela. Par exemple, vous pouvez
choisir votre compte Gmail ou Google Drive comme source
ou télécharger vos propres fichiers. C'est ce qui rend
la recherche approfondie si puissante. Il ne s'agit pas simplement de faire des recherches sur le Web. Il peut fusionner des informations publiques avec vos propres documents privés. Pour cette démo, nous allons rester
simples et utiliser la recherche
sur le Web Voici l'invite
que je vais utiliser. Notez à quel point
cette invite est spécifique. Nous ne nous demandons pas simplement que dois-je manger au petit-déjeuner ? Nous menons des recherches approfondies, un programme de recherche clair
avec trois tâches distinctes. Plus
vous lui donnez de direction dès le départ, plus
le résultat est utile. En ce qui concerne la sélection du modèle ici, l'analogie spécialisée
que nous avons présentée plus tôt dans le cours reste exactement la même lorsque vous activez la recherche
approfondie. Le mode que vous sélectionnez
détermine le comportement de ce spécialiste pendant
le processus de recherche Fast reste votre sprinter, effectuant une analyse rapide des sources
les plus pertinentes pour vous donner un bref résumé sans entrer dans
les moindres détails Réfléchir, c'est toujours votre
stratège qui cherche à
croiser plusieurs sources et résoudre les contradictions pour
trouver un angle plus logique Pro reste votre expert dans tous
les domaines, qu'il s'agisse
de rapports
denses PDF techniques ou de longs fils de discussion, pour
vous fournir une synthèse vraiment
complète Je vais choisir de penser ici. Maintenant, appuyons sur Soumettre et
voyons d'abord ce qui se passe. C'est l'étape de
décomposition de l'objectif, et c'est l'une de mes
parties préférées du processus. Au lieu de plonger
directement dans la recherche, recherche
approfondie s'arrête et élabore un plan de recherche personnalisé en plusieurs
étapes en fonction de votre demande. Vous pouvez le voir cartographier exactement ce qu'il a l'
intention d'étudier. Si nécessaire, vous pouvez modifier
ce plan avant qu'il ne commence. Si vous souhaitez l'orienter vers un angle spécifique,
ajouter un sous-sujet ou supprimer un élément qui ne vous concerne
pas, faites-le maintenant avant qu'une
seule recherche ne soit lancée Pour cette démo, je suis
content du plan tel qu'il est. Approuvons-le donc et laissez-le fonctionner. Et maintenant, la recherche commence. Gemini utilise des
sources en temps réel, des articles
universitaires, des publications sur la nutrition, des
directives et des publications sur la santé Il s'agit de décider quelles
menaces doivent être
étudiées en parallèle et lesquelles
doivent se produire dans l'ordre. Vous pouvez même cliquer sur l'un
des sites Web ici si vous êtes curieux de savoir quelles sont les sources utilisées par
Gemini Lorsque Gemini Deep Research
lit chaque source, il ne se contente pas de collecter des
informations et de passer à autre Il réfléchit
à ce qu'il faut rechercher ensuite. Il mène un processus d'
autocritique continu, contradictions
entre les sources, signale les affirmations vagues ou
non étayées et reconnaît que lorsqu'
une donnée ne correspond
tout simplement pas, vous pouvez le voir
ajuster ses
orientations de ne correspond
tout simplement pas, vous pouvez le voir recherche en temps réel, fur et à mesure que de nouvelles informations arrivent,
et lorsqu'il se trouve dans une impasse, disons qu'une étude est
payante ou qu'un site Web est en ça ne s'arrête pas. Il redirige et trouve un autre
chemin vers la même réponse. Il y a encore une chose qui rend cela possible à grande échelle. La recherche approfondie s'
effectue dans une fenêtre contextuelle, les IIs, la mémoire de travail. Concrètement, cela
signifie que Gemini garde en mémoire chaque source lue pendant toute la session Rien n'est perdu ni oublié au
fur et à mesure que la recherche se développe. Et c'est aussi pourquoi les questions de suivi posées plus tard sont si pointues. Je ne perds jamais la menace de
ce qu'il a déjà enquêté. Et vous pouvez déjà
deviner que vous n'avez pas besoin de rester assis là à regarder
tout cela se produire. La recherche approfondie est asynchrone. Vous pouvez fermer l'onglet et
retourner à votre travail, et Gemini vous indiquera
quand votre rapport sera prêt Si vous utilisez l'application Web, vous verrez une
notification apparaître à
côté du fil de discussion
dans votre barre latérale Et si l'application
mobile Gemini est installée, vous recevez une notification push
directement sur votre téléphone Et je viens de recevoir le mien. Notre rapport est prêt. Revenons donc aux
Gémeaux pour y jeter un coup d'œil. C'est ce que
fournit une recherche approfondie et remarquez
ce qu'elle n'est pas. Il ne s'agit pas d'une liste de liens. Il ne s'agit pas d'un
résumé à puces. Il s'agit d'une analyse structurée de
plusieurs pages avec des sources citées, des sections
organisées et des conclusions réelles.
Vous pouvez agir sur la base du tableau des ingrédients à plusieurs niveaux que nous vous avons demandé, qui se trouve ici, niveau 1, niveau 2
et niveau 3,
clair, exploitable et
basé sur Et si vous êtes curieux de
connaître l'une des sources, chaque réclamation contient des liens pertinents. Vous pouvez cliquer et lire vous-même la
recherche originale. Je ne sais pas pour vous, mais il m'aurait fallu
des
heures pour lire toutes ces ressources et
compiler le rapport manuellement. Et il est important qu' une recherche approfondie ne
remplace pas votre jugement. Il fait ce
travail de base fastidieux afin que votre jugement soit
réellement plus éclairé Lors de notre prochaine conférence, nous effectuerons des recherches approfondies dans un contexte personnel et
passerons en revue quelques exemples supplémentaires.
Je t'y verrai.
37. La recherche en profondeur - Décisions d'achat: Dans cette conférence, nous
allons
examiner deux autres cas d'utilisation pour des recherches
approfondies qui,
je pense, vous seront immédiatement
utiles
dans votre propre vie. La première consiste à prendre une décision
d'achat en toute confiance, et je vais utiliser un exemple
très concret. Le second concerne l'apprentissage d'
une matière totalement nouvelle. Je vais vous montrer quelque chose
que je n'ai jamais montré auparavant. Comment transformer un
rapport de recherche approfondi en infographie, quiz et
en cartes
flash sans quitter l'interface de recherche
approfondie de Gemini. Commençons. Ma
bague Aura Slip Tracking s'est récemment cassée. J'aimerais la remplacer, mais je ne sais pas si je
dois simplement acheter
la dernière bague de la même marque ou en
profiter pour passer
à quelque chose de mieux. Et il y a une fonctionnalité
spécifique que
je recherchais depuis des années. Alarme silencieuse vibrante
consciente du cycle de sommeil qui vous réveille
réellement
au bon moment de
votre cycle de sommeil, pas seulement à une heure fixe Utilisons des recherches approfondies en tant qu' assistant d'achat personnel pour parcourir
les
critiques et les articles en ligne. Voici mon message. Notez quelques points à propos de
cette invite. C'est personnel. J'ai donné à des
recherches approfondies le contexte
réel ma situation et de
ce que je recherche. J'ai inclus l'alarme vibrante, non seulement parce que je le voulais, mais aussi pour voir si Gemini peut
filtrer les choix évidents Les bagues les plus populaires
n'ont en fait pas de modèles de vibrations. Une recherche de base
pourrait donc me donner une liste des dix meilleurs anneaux qui ne
tient pas compte de cette exigence Des recherches approfondies devraient permettre de comprendre cela. L'invite contient un
programme de recherche clair comportant trois tâches, et elle demande un format de
sortie spécifique à la fin, un tableau des fonctionnalités, ce qui signifie que le rapport sera
immédiatement utilisable, pas seulement le mur de texte. Choisissons une recherche approfondie
parmi une liste d'outils. Je vais m'appuyer sur la recherche
ici comme source principale, et je choisis le
mode de réflexion. Et commençons. Gemini a préparé ce plan de
recherche pour moi, et j'aimerais
apporter une modification ici. Pour cela, je clique sur Modifier le plan Ensuite, je vais taper
la modification que je souhaite que Gemini apporte
au plan actuel Je souhaite que Gemini inclue également une marque spécifique
dans ses recherches Nous constatons que la liste des
marques a été mise à jour. Je suis maintenant d'accord avec ce plan, je vais
donc l'approuver
et commencer les recherches. Et dans quelques minutes, notre rapport sera prêt. Parcourons-le ensemble. Vous pouvez constater que des recherches
approfondies ont permis identifier les
trois meilleurs candidats, les
analyser en fonction exactement
des critères que j'ai demandés, y compris le système d'alarme
intelligent vibrant et de produire le tableau de
comparaison des fonctionnalités ici C'est le type de sortie
qui
nécessiterait normalement au moins une
heure de changement de pression, fils de discussion
prêts et une analyse de sites d'
évaluation contradictoires. Je l'ai
structuré en quelques minutes en fonction de ma
situation et de mes exigences spécifiques. Et voici la liste des recommandations
stratégiques
de Gemini Un avis parce que je lui ai donné un contexte
personnel dès le départ. Les recommandations
ne sont pas génériques. Ils le filtrent en fonction de
mes priorités réelles. Rapport qualité/prix, pas d'abonnement
trop élevé et avertisseur de glissement, cela fonctionne
vraiment. Il s'agit d'un excellent exemple d'utilisation de recherches
approfondies pour prendre des décisions
d'achat. Au lieu de vous noyer dans les options, vous repartez avec une liste restreinte claire et
raisonnée Dans la deuxième partie
de ce didacticiel, nous continuerons à explorer recherches
approfondies pour un autre cas
d'utilisation, ACA dans ce cas.
38. La recherche en action - Apprendre un nouveau sujet: Voyons maintenant quelque chose d'
un peu différent. Utiliser des recherches approfondies pour accélérer votre apprentissage lorsque vous
abordez une nouvelle matière. J'ai récemment commencé à étudier l'investissement
immobilier. J'ai assisté à mon premier
cours et j'ai pris quelques notes sur les sujets
que nous y avons abordés. Je souhaite maintenant en savoir plus sur ces sujets
grâce à des recherches approfondies. Je peux télécharger cette photo
directement dans l'invite. Gémeaux Je lirai mes notes
manuscrites, extrairai les principaux sujets et je les utiliserai comme base
pour un rapport de recherche Je n'ai pas besoin de
retaper quoi que ce soit. Laissez-moi vous montrer comment cela fonctionne. Tout d'abord, choisissons la recherche
approfondie
dans la liste des outils. Je vais passer en mode
réflexion ici, taper mon invite, puis je joindrai
mes notes manuscrites Ce que j'aime dans
cette approche, c'est que la recherche est ancrée dans ce que j'ai déjà
commencé à apprendre. Le rapport renforce
et développe donc mes connaissances existantes
plutôt que de partir de zéro Pour cela, j'ai spécifiquement
demandé à Gemini de faire référence aux
thèmes clés de mes notes, lors de la recherche et de la
rédaction du rapport Et voici notre
plan de recherche qui me semble parfait, alors je vais commencer la recherche. Et notre rapport est prêt. Vous pouvez voir qu'il a repris
tous les sujets clés de mes notes et qu'il a construit une
analyse structurée autour d'eux. Définitions, contexte, relations entre les concepts, implications
pratiques. Nous pouvons utiliser ces informations
comme complément d'étude, et pas simplement comme résumé. Mais c'est là que ça
devient vraiment intéressant. Une fois que le
rapport de recherche approfondi sera prêt, nous pourrons transformer ce mur de texte en outils d'apprentissage actifs. Vous remarquerez la
création d'un bouton dans le coin supérieur droit
du panneau Canvas. Cliquez dessus pour obtenir
un menu déroulant avec plusieurs options pour
transformer le rapport. Examinons d'abord
les infographies. Gemini prend les informations
complexes telles que la différence entre les actifs
résidentiels et
industriels dans notre exemple immobilier et les transforme en
un résumé visuel C'est parfait pour un examen rapide et de
haut niveau ou pour partager une page
avec une partie prenante Revenons à notre
rapport sur les tendances de l'investissement
immobilier pour poursuivre la démonstration. Ensuite, pour nous assurer que les
informations restent correctes, nous pouvons générer un quiz. Gemini crée des questions
interactives basées spécifiquement
sur le rapport Au fur et à mesure que vous répondez, il fournit un feedback
immédiat, vous
aidant à identifier
exactement les domaines dans lesquels votre compréhension d'un nouveau
sujet pourrait nécessiter plus de travail. I Et enfin, nous avons des flashcards Vous pouvez l'utiliser de deux manières. Vous pouvez générer un jeu complet de flashcards pour passer en revue tous les
termes clés du rapport Mais si vous venez de
terminer le quiz, comme dans notre exemple ici, Gemini peut générer des cartes basées spécifiquement sur les résultats de
votre quiz Il cible les zones dans lesquelles
vous avez eu du mal. Faisons-le. Nous voyons donc ici une boucle
d'apprentissage complète , comprenez,
testez-vous et renforcez vos connaissances au
sein d'un seul outil Dans la prochaine vidéo, nous allons passer d'une recherche
approfondie à un examen approfondi pour
le découvrir, mais nous explorerons ses cas d'utilisation
avancés, particulier la création d'applications d'
IA Et à titre d'avertissement, nous allons utiliser les
principaux points à retenir de l'un de
nos rapports de recherche approfondis
comme données d'entrée, notre application sera construite Et plus d'informations à ce
sujet dans la vidéo suivante.
39. Au-delà des documents : que peut faire la toile d'autre ?: Bon retour. Lors de notre
dernière conférence Canvas, nous nous sommes donc concentrés sur la rédaction de documents. Comment Canvas vous offre
un espace de vie et de travail pour
peaufiner l' écriture avec des
Gémeaux juste à côté de vous Mais la rédaction de documents n'est
vraiment que le début de
ce que Canvas peut faire. Et vous en avez déjà vu une partie sans vous en rendre compte. N'oubliez pas que
le bouton de création qui est apparu après votre
rapport de recherche approfondi était Radium, les infographies, le quiz, les cartes flash,
c'était Deep Research fournit son
rapport directement dans Canvas
, c'est pourquoi vous pouvez le
transformer dans tous ces formats sans
jamais changer d'outil. La recherche approfondie et
Canvas sont
intrinsèquement liés . Google les a conçus
pour qu'ils s'intègrent parfaitement. Regardons donc une
vue d'ensemble de ce que Canvas peut faire. La première chose que Canvas peut créer au-delà des documents, ce sont les pages Web. Et je ne parle pas de
HTML brut avec du texte dessus. Je veux dire des pages
interactives structurées avec des fiches
d'information, des graphiques, des mises en page visuelles
et des éléments cliquables Pensez à la dernière fois où
vous avez dû partager un rapport ou un brief avec quelqu'un qui n'était pas censé lire
un mur de texte. Avec Canvas, vous pouvez prendre
le même contenu et dire, transformez-le en page Web ou cliquez
simplement sur le bouton de la page
Web. Et en quelques secondes, vous avez quelque chose qui
ressemble vraiment à une vraie page. Vous pouvez le partager à l'aide du lien. Aucune configuration de publication ou
d'hébergement n'est requise. Viennent ensuite les infographies. Si vous avez déjà
essayé d'expliquer quelque chose de complexe à un intervenant non
technique, un processus, une comparaison, cadre
décisionnel, vous
connaissez le défi. Les mots ne peuvent pas faire grand-chose. Canvas peut prendre votre contenu brut et le restructurer
dans un format visuel Sections propres, morceaux
faciles à digérer, icônes, comparaison côte à côte Et vous pouvez continuer à
l'affiner dans le même graphique. Agrandissez la deuxième section, changez le ton pour
qu'elle soit moins formelle et elle sera mise à jour en temps réel. Troisièmement, Canvas peut également générer des quiz
interactifs
et des cartes flash à partir de tout contenu
que vous lui proposez C'est utile au-delà de la
simple étude. Pensez à l'intégration du client, formation des
équipes, à la vérification de la
connaissance des produits. Vous décrivez ce que
vous voulez et Canvas, créez un quiz
interactif fonctionnel. Aucun outil tiers, aucun générateur de formulaires, aucune étape supplémentaire. Il existe également un mode audio. Canvas peut transformer le contenu
écrit en un aperçu
audio de style podcast, conversation entre
deux animateurs IA qui discutent et
résument votre contenu. C'est utile si vous souhaitez
parcourir un long
document pendant que vous travaillez ou partager les résultats
avec des personnes qui préfèrent écouter
plutôt que lire.
Bienvenue dans le Deep Dive. Aujourd'hui, nous dévoilons une
vision qui
semble vraiment changer
sous nos pieds. Nous sommes en train de dépasser
la vieille idée d' un assistant intelligent qui se contente de régler des
minuteries ou de jouer de la musique Nous étudions ce concept
d'assistant universel. Un partenaire qui anticipe
réellement ce dont vous avez besoin avant même que
vous ne le demandiez Et puis il y a la solution la plus
importante : Canvas peut créer des
applications entièrement fonctionnelles, des logiciels fonctionnels. Vous décrivez ce que vous voulez, organisateur de
recettes, un planificateur de voyage, un outil de quiz
ou un outil de suivi du budget, et Canvas génère le
code et l'exécute pour vous. Juste là, dans la fenêtre, vous ne voyez pas le code. Vous n'avez pas besoin de
comprendre le code. Vous ne voyez qu'une application
interactive fonctionnelle, et elle n'est pas statique. Vous pouvez continuer à discuter
avec Gemini pour l'ajuster. C'est ce que l'on
appelle le Vibe Coding. Créez un logiciel en
décrivant ce que vous voulez plutôt qu'en écrivant
du code ligne par ligne. Nous avons abordé ce concept dans la conférence Geni Implementation
sur l'impact du cours Et maintenant, nous sommes sur le
point de le voir vivre. Voici ce que j'aime le plus
chez Canvas dans ce contexte. Il ne s'agit pas d'un outil
de développement distinct. Il s'agit du même espace de travail
que celui que vous avez déjà utilisé pour rédiger
des documents et des plans. Le passage de la rédaction
d'un document à la création d'une application
n'est qu'une conversation. notre prochaine conférence exactement ce
que nous allons faire lors de notre prochaine conférence. Nous allons reprendre
là où nous nous sommes arrêtés. Nous avons utilisé des recherches approfondies
pour finalement obtenir une réponse claire fondée sur des preuves
sur la nutrition du petit-déjeuner. Et nous allons
transformer cette recherche en une application de
recettes de petit-déjeuner familiale qui suggère des repas rapides et sains
pour les adultes et les enfants. Allons construire ça.
40. Suivi de suivi : Création d'une application avec Canvas - De la recherche à une application en cours d'exécution: Bon retour. Nous sommes ici en
train de préparer le petit déjeuner par le chef, des repas
rapides de moins de 20 minutes, adaptés aux
familles avec
des photos du repas fini. tout dans Gemini Canvas, aucun code, aucune
formation technique requise. Juste une bonne invite et un peu de va-et-vient avec
Gemini. Allons-y Pour que notre flux de travail reste organisé, nous allons suivre
quatre étapes simples : identifier huit, créer, affiner
et enfin partager. Et voici la première étape, iDED. Voici notre
rapport de recherche approfondi sur la nutrition du petit-déjeuner. Réfléchissons avec Gemini à
l'idée de l'ampli
et à ce qu'il va J'ai quelques premières idées, mais je voudrais les développer. J'ai commencé par décrire
le but de l'application. J'ai également indiqué que je voulais l'application utilise les résultats de la
recherche, et j'ai fait référence au cadre complet
TireedGrocery
du rapport pour souligner
que je n'ai pas besoin d' une liste aléatoire d'ingrédients
pour les recettes Je veux que Gemini propose trois
fonctionnalités intéressantes pour l'application, et je suggère également un
look Aviall pour l' J'ai mis quelques
mots descriptifs ici, comme amusant, chaleureux,
accessible, pour indiquer
l'orientation navale de ce que je veux voir Je cherche une
description détaillée de l'application. Le concept, sur lequel nous pouvons commencer à
créer l'application elle-même. Appuyons sur Entrée. Et voici la description de notre
application. Demandons à Gemini d'apporter quelques
modifications à ce concept. La première fonctionnalité, le chronomètre familial à chargement
frontal, semble assez complexe, surtout pour la première
version de l'application. Demandons donc à Gemini
de le remplacer par quelque chose
de plus
simple. Question simple sur le type
de repas préféré aujourd'hui. Et j'ajoute également des
détails supplémentaires pour m'
assurer que chaque fois que
nous demandons une recette, nous en obtenons une nouvelle et
que l'application utilise strictement les ingrédients
recommandés dans notre rapport. Je vais donc appuyer
à nouveau sur Entrée et
voyons comment Gemini
intégrera ces modifications Et voici
la version mise à jour de la description de l'application. Je suis d'accord
avec ce concept, mais avant de passer à la deuxième étape, à savoir créer l'application, nous devons vérifier nos paramètres. Regardez le sélecteur de
modèle ici Vous pourriez être tenté par P. Il parle de mathématiques avancées et de code. Cela semble donc être le choix le
plus puissant. Mais voici ce que j'ai
découvert lorsque j'ai testé les deux lors de la création de cette application de
petit-déjeuner auparavant. Pro a en fait rendu
le processus plus difficile. Il m'a fallu plus d'allers-retours
pour obtenir les résultats souhaités, et j'ai rapidement épuisé
mes crédits P, ce qui m'a fait attendre quelques heures
avant de pouvoir continuer. Le mode réflexion
m'a permis d'y arriver plus rapidement. Voici donc ma recommandation. Commencez toujours par réfléchir. Il est conçu pour un raisonnement étape
par étape, ce qui est exactement ce que nécessite la création d'
applications. En utilisant la logique,
la structure et le flux, économisez des avantages lorsque votre
application doit fonctionner avec un grand volume de contenu
provenant de sources multiples, documents, de vidéos, d'
images, etc. Commençons par la
deuxième étape, celle de créer l'application. Mes tests précédents
montrent que si vous envoyez cette demande directement dans
ce chat, Gemini ne démarrera pas
le processus de création, mais vous enverra à nouveau la
description du concept de l'application. Oui, c'est ce qui s'est passé
cette fois également. Vous voyez qu'au lieu
de créer l'application, Gemini a simplement apporté quelques modifications
au rapport lui-même, et ce n'est pas ce dont nous avons besoin Donc, pour lancer le processus de création du
logiciel d'application, pas seulement une description textuelle, cliquez sur Créer et décrivez votre propre
section d'application, écrivez ceci Créez une application en vous basant sur
la description ci-dessus. Vous voyez que Gemini affiche cette commande dans la description de notre
application ici, et il commence à la créer Et pendant que Gemini
développe l'application, permettez-moi de répondre à une question que vous
vous posez probablement en ce moment Et si je ne partais pas
d'un rapport de recherche approfondi ? Et si je voulais simplement
créer une application à partir de zéro ? Dans ce cas, commencez par
ouvrir un nouveau chat. Mais avant de taper quoi que ce soit, passez d'
abord en mode Canvas. Voici pourquoi. Gemini ne peut créer et
exécuter des applications que dans Canvas. Il s'agit d'un espace de travail dédié spécialement
conçu pour cela. Une discussion régulière peut
vous aider à réfléchir à des idées, mais elle ne peut pas
réellement créer une application fonctionnelle. Une fois dans Canvas, réfléchissez à votre
idée d'application avec Gemini Décrivez ce que vous voulez construire, quoi il sert et
ce qu'il doit faire. Lorsque vous êtes prêt
à commencer à construire, cliquez sur le bouton Créer, saisissez votre invite et Gemini se mettra au travail Bon, revenons à notre démo. Et notre application est prête. Nous commençons par choisir comment nous nous
sentons aujourd'hui et quel type
de repas nous préférons. Et Gemini
suggérerait un repas sain. En conséquence, nous voyons ici
une liste d'ingrédients, suivie d'instructions sur la
façon de préparer le repas. Nous avons une excellente mousse illustrant ce que nous
allons manger Et nous pouvons également choisir
un mode chef pour enfants
afin d'avoir une liste de tâches
pour nos jeunes assistants. Plutôt mignon. Passons maintenant
à la troisième étape, affiner. Comme vous pouvez l'imaginer,
nous n'en avons pas terminé ici. Nous pouvons continuer à itérer
et à améliorer notre application. Disons que je souhaite
ajuster certaines choses. Je vais taper mes demandes
dans le chat. Vous venez de me voir introduire
plusieurs modifications dans notre application. Lorsque vous le faites, introduisez
une modification à la fois, plutôt que d'essayer de tout
inclure dans
une seule invite. Permettez-moi d'apporter plusieurs autres
modifications à notre application. Voici la version
que j'ai reçue jusqu'à présent. J'ai décidé d'ajouter la
possibilité d'inclure d'autres ingrédients en plus
de la liste prédéfinie. Et s'il s'agit d'un produit appartenant à la catégorie 3, un message
pertinent s'affichera, mais la recette
sera tout de même créée. J'ai également ajouté la
possibilité de sauvegarder une recette
dans les favoris
, accessibles ici. Enfin, j'ai ajouté le bouton de
réinitialisation au cas où nous
voudrions tout
recommencer et choisir
différents ingrédients. Comme vous pouvez le constater, nous avons
pu apporter de nombreux changements simplement en discutant avec
Gemini avec désinvolture , sans aucun codage Je suis satisfait de nos progrès
actuels et de l'expérience utilisateur
que nous avons créée. Dans la deuxième partie
de ce didacticiel, je vais vous montrer une autre
méthode pour apporter modifications à votre application à l'aide de
la barre d'outils Canvas. Et nous verrons également comment
le partager avec d'autres. Je vous verrai dans la deuxième partie.
41. Suivi : créer une application avec une toile - Affiner et partager: Tout le monde Bienvenue dans la
deuxième partie du didacticiel, où nous explorons comment
créer un logiciel fonctionnel en décrivant ce que nous voulons plutôt que d'écrire
du code ligne par ligne, le processus connu sous le nom de vibe
coding. Comme promis, je souhaite vous montrer
une autre option pour apporter modifications à votre application dans le
cadre de notre étape affinée Notez cette barre d'outils Gemini
Canvas. Découvrons ce qu'
il peut faire pour nous. Commençons par
cette icône scintillante. Il s'agit de l'injecteur de fonctionnalités AI. Il ajoute des fonctionnalités EI
à votre application. Lorsque vous cliquez dessus,
Gemini analyse l'affichage actuel de
votre application et
suggère des composants intelligents, tels qu'une
barre de stockage basée sur l'IA ou une génération de texte et d'
images, puis injecte ces éléments directement
dans la logique de votre application Demandons à Gemini d'ajouter des
fonctionnalités d'IA et de voir comment cela fonctionne. Dans le chat de gauche, Gemini donne un
aperçu des fonctionnalités d'IA
ajoutées à l'application Nous pouvons répondre dans le chat et demander à Gemini d'apporter des modifications
supplémentaires Mais d'abord, essayons
ces nouvelles fonctionnalités. Voici la
fonctionnalité magique numéro deux. Nous voyons que Gemini I a proposé ingrédient
plus diététique au lieu de celui que je viens de sélectionner, mais je ne l'ai pas pour le moment Je vais
donc simplement cliquer sur Annuler et
continuer avec ces trois Voici la
carte de sagesse de l'IE plutôt sympa. Et bien sûr, nous allons
essayer le fonctionnement du
narrateur audio Levez-vous et brillez.
La mission d'aujourd'hui est d'admirer les nuages d'épinards
et d'avocats sur le côté ensoleillé. Les épinards riches en fer
associés aux acides gras mono et saturés de l'avocat fournissent un regain d'énergie
propre qui vous permet de vous sentir
agile et rafraîchie Apportons une modification à
l'une des fonctionnalités. Gemini confirme que le
changement a été effectué, alors testons-le Respirez profondément et
commençons la journée. Votre recette d'aujourd'hui est
l'Emerald Cloud Nest. La combinaison d'
épinards riches en fer et de
graisses monoinsaturées provenant de l'avocat assure
une lente libération d'énergie, ainsi de vous sentir légère et aérée. Wasson, nous venons de voir comment Gemini a suivi
nos instructions, et je suggère que nous revenions à la barre d'outils de Gemini Canvas
et que nous l'explorions La prochaine fois que j'entends,
c'est la poignée. Il est utilisé pour déplacer
l'atolbr afin de
ne pas bloquer la
navigation de votre application lors de la dégustation Et il existe également une troisième
icône, l'outil de raffinement, qui indique à Gemini de modifier un
élément spécifique de votre application Vous remarquerez peut-être qu'il n'
est pas visible ici dans notre application Golden Hour. C'est en fait intentionnel. Gemini reconnaît que cette application a subi
suffisamment d'itérations, sorte que de petites
modifications automatisées peuvent S'il essaie de modifier un élément mais qu'il interprète
mal le contexte,
il risque de casser un
autre élément qui en dépend Il masque donc l'icône comme mesure
de protection
pour montrer le
fonctionnement de l'outil de raffinement. Passons à une application plus simple. J'ai commencé à construire avant
d'enregistrer ce tutoriel. Je n'y ai fait que
quelques itérations, donc l'icône est disponible. Disons que je souhaite changer
la couleur de ce bouton. Je choisis donc sélectionner et demander, surligne ce bouton,
puis je saisis mon invite suggérer une autre palette de couleurs. Je remarque ce qui s'est passé ici. Au lieu de changer
uniquement ce bouton, la
couleur, Gemini a repensé
l'ensemble de l'application. Pourquoi est-ce le cas ? Il s'avère que c'est la
palette de mots qui pose problème ici. Une palette de couleurs fait référence à l'ensemble des couleurs
utilisées dans votre application. Gemini prend donc cela lettre et met à jour
tout pour correspondre Cela ne fait rien de mal. Il s'agit simplement de suivre vos
instructions à la lettre. Pour modifier uniquement la
couleur de ce bouton, vous devez décrire clairement l'étendue de la modification.
Laissez-moi vous montrer comment. Je sélectionne à nouveau le bouton et je saisis une autre invite. Vous voyez que mon message détaillé a fonctionné, et cette fois, Gemini a appliqué les modifications à
l' élément que j'ai indiqué
via l'outil de raffinement C'est une
chose vraiment utile à garder à l'esprit. Plus votre demande est précise, plus
le résultat est précis. Revenons à
notre application Golden Hour. Maintenant que nous avons expliqué comment
affiner et ajuster votre application. Parlons de ce qui se passe
lorsque vous en êtes satisfait. Quatrième étape, partagez. Une fois que vous avez terminé, vous pouvez obtenir un lien partageable et l'
envoyer à n'importe qui Ils peuvent ouvrir et utiliser l'
application directement dans le navigateur. Aucun téléchargement, aucun signe, aucune configuration technique de leur côté. Ils peuvent même le remixer. C'est l'une des fonctionnalités que
Google a intégrées à Canvas. Quelqu'un peut prendre
votre application, l'ouvrir et créer sa propre
version à partir de celle-ci. C'est bon. Et
c'est tout pour ce didacticiel Merci de partager
les applications
sur lesquelles vous travaillez dans la section questions-réponses
de cette vidéo J'adorerais voir
ce que tu es en train de construire.