Transkripte
1. Willkommen zum Kurs zu Google Gemini AI!: Alle zusammen und willkommen zum
Kurs auf Google Gemini. Wussten Sie, dass Google
Gemini offiziell die Marke von 750 Millionen aktiven Nutzern
pro Monat
überschritten hat? 750 Millionen aktiven Nutzern
pro Monat
überschritten Das sind fast drei Viertel
von 1 Milliarde Menschen. Um das ins rechte Licht zu rücken Das Wachstum von
Gemini
übertrifft derzeit fast jeden anderen
KI-Chatbot auf dem Markt und
schließt die Lücke ChatGPT Aber es geht nicht nur um Zahlen, denn Gemini
wurde Es ist heute das am besten
integrierte EI der Welt. Es befindet sich in Ihrem Gmail, Ihren Google-Dokumenten,
Ihrem Chrome-Browser und Ihrem Mobiltelefon. Dies ist die größte
Veränderung in der Art und Weise, wie wir arbeiten und gestalten, seit der
Erfindung des Internets. Wir bewegen uns auf eine Welt zu
, in der EI nicht nur dazu dient, sie zu nutzen. Es ist ein Mitarbeiter, der bereits dort
ist, wo Sie arbeiten. Mein Name ist Anna und ich werde
deine Dozentin für diesen Kurs sein deine Dozentin für diesen Kurs Online-Dozent
mit meinen anderen Kursen , die hier auf der Plattform
verfügbar sind sich auf
Produktmanagement und generative KI konzentrieren. diesem Kurs teilnehmen, erhalten
Sie Zugriff auf über
4 Stunden HDVdo-Inhalte, schrittweise Anleitungen und
Aktivitäten, die
praktische Anwendungen von Gemini-Tools in
der
realen Welt hervorheben , PDF-Zusammenfassungen zum Nachlesen
der wichtigsten Erkenntnisse aus dem
Kurs und vieles mehr Zunächst erfahren wir,
wozu Gemini in der Lage ist, wie Sie mit Gemini kommunizieren und Ihre Anfragen strukturieren können
und wie
Gemini für Sie am besten Von dort aus werden wir praktische Szenarien mit
Gemini
durchgehen , um Ideen zu sammeln und professionelles Feedback Erstellen Sie Ihre eigenen
personalisierten EI-Systeme für bestimmte Aufgaben und
generieren Sie hochwertige Grafiken Wir werden auch
fortgeschrittene Techniken wie
gründliche Recherchen zur Umwandlung
komplexer Aufgaben in detaillierte
Berichte und die Erstellung
voll funktionsfähiger Apps behandeln fortgeschrittene Techniken wie
gründliche Recherchen zur Umwandlung komplexer Aufgaben in detaillierte
Berichte und die Erstellung ,
indem wir lediglich beschreiben, was Sie möchten Keine Codierung erforderlich. Und wir stellen
sicher, dass Sie wissen, wie Sie falsche
Antworten von KI
erkennen und verhindern können, damit Ihre Arbeit immer korrekt ist. Und ja, Sie benötigen
keinen technischen Hintergrund oder Vorkenntnisse über KI,
um mit dem Kurs zu beginnen. Fangen wir also mit Ilsa
im nächsten Video an.
2. Was ist Gemini? Das KI-Ökosystem von Google verstehen: Alle zusammen und willkommen zur
ersten Kursvorlesung. Denken Sie an jeden
Science-Fiction-Film zurück Sie je gesehen haben. Es gibt immer
diesen einen Charakter, einen Assistenten, der nicht
nur auf einen Befehl wartet, sondern die Welt
des Helden tatsächlich versteht. Er antizipiert
Probleme, bevor sie auftreten, und agiert als
echter Partner Jahrelang
war das nur Fiktion. Aber mit Gemini
kommen wir
einer Zukunft immer näher , in der diese Art von Partnerschaft Realität
wird Also, was ist Gemini? Ich stelle mir das gerne als
drei Schichten eines Hauses vor, das Fundament, das Gehirn Dies sind die Gemini-Modelle selbst, die von Googles
Research Lab Deep Mind gebaut wurden In diesem Kurs werden wir
die neueste Generation
von Gemini-Modellen verwenden die neueste Generation
von Gemini-Modellen Dazu gehören hochwertige
Argumentationsmodelle für komplexe Logik, fortschrittliche Tools zur Bilderzeugung für fotorealistische Bilder und
Videomodelle der nächsten Generation, die hochauflösende
Szenen mit
Ton erzeugen können hochauflösende
Szenen mit
Ton erzeugen Diese Modelle sind von Haus multimodal, was bedeutet, dass sie
nicht Sie sehen hier und denken in allen Medien
gleichzeitig, genau wie wir Um auf die Analogie mit dem
Haus zurückzukommen Die zweite Ebene ist der
Wohnraum, der Assistent Dies ist die Basis, auf der wir die meiste Zeit in der App auf Ihrem Telefon und auf
der Website unter
gemini.google.com
verbringen werden meiste Zeit in der App auf Ihrem Telefon und auf
der Website unter
gemini.google.com
verbringen App auf Ihrem Telefon und auf
der Website unter
gemini.google.com Es ist ein kreativer Bereich
, in dem du Codes chatten
und Tools wie Jams verwenden kannst , um das Verhalten des
EI anzupassen Und schließlich
ist die dritte Ebene die Infrastruktur. Das ist Gemini, das
in Gmail, Google Docs
und der Suche lebt. Es ist die
EI-Übersicht, die
Ihre Suchergebnisse zusammenfasst, oder die Schaltfläche „Hilf
mir beim Schreiben“, mit der Ihre E-Mails
verfasst werden. In diesem Kurs liegt unser Fokus auf dieser mittleren Ebene
, dem GeminiEisistet Die Vision von Google
in dieser Hinsicht konzentriert
sich auf drei Elemente:
persönlich, proaktiv und Lassen Sie uns untersuchen, was das bedeutet. Erstens ist es persönlich. Die meisten KI-Modelle sind Generalisten. Sie wissen viel über die Welt, aber ziemlich wenig über dich Gemini wurde als
Ihre persönliche Erweiterung konzipiert. Mit Ihrer Zustimmung kann
es eine Verbindung zu Ihrem persönlichen
Kontext, Ihren E-Mails, Ihren Dateien und
Ihrem
Verlauf herstellen, um
Ihnen Hilfe zu bieten , die für Ihr Leben einzigartig
relevant ist Zweitens ist es proaktiv. Heute ist der Großteil der KI reaktiv. Du fragst sie nach Antworten. In der Zukunft von Gemini geht es
darum zu sehen, was kommt. Wenn Sie am Freitag eine große
Kundenpräsentation haben, sollte
Gemini Sie nicht nur
daran erinnern, dass sie bevorsteht Es sollte
eine Woche zuvor in Ihren Kalender schauen und sagen, dass mir aufgefallen ist, dass Ihr Strategietreffen mit Firma A am Freitag stattfindet, basierend auf dem Vorschlag
in Ihrer Ablage und der neuesten
E-Mail-Bedrohung mit deren Team Hier finden Sie den Überblick über die Vorbereitung und drei Fragen, mit denen
Sie wahrscheinlich konfrontiert werden. Drittens ist es mächtig. Mit den neuesten
Fortschritten in Gemini gehen
wir über die
einfache Textgenerierung hinaus und
denken Dinge in die Realität über, egal ob Sie
eine ganze Website aus einer einzigen Aufforderung heraus erstellen oder
ein Filmvideo für eine Die Leistung, für die früher
ein ganzes Team von Spezialisten erforderlich war,
steht Ihnen jetzt zur Verfügung Aber all diese Macht zu haben, heißt
nicht, dass ich das Sagen habe. Es ist wichtig, sich daran zu erinnern, dass Gemini,
selbst wenn
es
proaktiv ist, immer Ihre Führung übernimmt Es hat keine eigene geheime
Agenda oder Glaubenssätze. Es ist so konzipiert, dass es den Befehlen
folgt. Sie geben es anhand Ihrer
Anweisungen und Präferenzen weiter. Egal, ob es Ihr
Forscher, Ihr Programmierer oder Ihr
kreativer Mitarbeiter ist, Sie haben immer
das Sagen Produktivität bedeutet nicht, dass die
EI ihr eigenes Ding macht. Es ist das EI, das
voraussieht, was Sie benötigen, weil Sie das Ziel
bereits definiert haben Nachdem wir die Vision und
die Architektur untersucht haben , ist
es an der Zeit, von der
Theorie zur Praxis überzugehen In der nächsten Vorlesung werden
wir uns
die verschiedenen Spezialmodelle
für Argumentation, Bilder und Video genauer die verschiedenen Spezialmodelle für Argumentation, Bilder und Video Und ich werde dir auch zeigen, wie
du
dein Konto bei Gemini einrichtest .
Ich werde dich dort sehen
3. Lernen Sie die Gemini-Modellfamilie kennen: In der letzten Vorlesung haben
wir über
Gemini als dreischichtiges Haus,
das Gehirn, den Assistenten
und den integrierten Motor gesprochen Gemini als dreischichtiges Haus, das Gehirn, den Assistenten
und den integrierten Gehen wir nun eine Ebene
tiefer in dieses Gehirn vor. Die meisten älteren EI-Modelle
wurden
zuerst mit Text trainiert und verfügten dann über weitere
Funktionen. Gemini wurde
von Grund auf anders gebaut , um
multimodal zu sein Das heißt, es liest nicht nur die Beschreibung
eines Videos, ich verstehe
das Video, den Ton, die Bilder und den Text gleichzeitig ob Sie ein
1.000 Seiten starkes PDF,
ein einstündiges Video oder
eine riesige Codebasis hochladen , Gemini verarbeitet alles
in einem einheitlichen Bereich Es geht nicht darum,
Bilder heimlich
hinter den Kulissen in Text zu übersetzen , sie direkt zu sehen Wenn Sie Gemini
auf geminiggle.com öffnen, werden Sie eine Modellauswahl sehen. Stellen Sie sich diese als
verschiedene Modi vor, von jeder Sie zu
einem anderen
zugrunde liegenden Modell weiterleitet , das Google für
eine bestimmte Art von Aufgabe optimiert hat Die gesamte
Google-Modellfamilie ist riesig, aber für den täglichen Gebrauch werden Sie am häufigsten auf
diese Modelle zurückgreifen. Bevor wir sie durchgehen, ein kurzer Hinweis darauf, was ein Modell eigentlich ist. Stellen Sie
sich das wie einen Spezialisten vor, Sie stellen für einen Job ein. Jedes Modell wurde anders
trainiert, unterschiedlichen Daten
gefüttert und für
unterschiedliche Stärken
optimiert. Wenn Sie in Gemini einen Modus auswählen, entscheiden
Sie im Wesentlichen, welchem Spezialisten Sie Ihre Aufgabe übertragen möchten Schnell ist unser Sprinter
schnell und gesprächig. Dies ist der Spezialist, an den Sie wenden, wenn Sie
eine sofortige Antwort benötigen Eine schnelle Zusammenfassung oder Hilfe beim
Verfassen einer Kurznachricht. Es ist auf Geschwindigkeit optimiert und verarbeitet eine große
Anzahl von Anfragen. es nur nicht für etwas, das
tiefgründiges Denken
in mehreren
Schritten erfordert Denken ist unser Stratege. Dieser Experte macht eine Pause,
bevor er antwortet, und legt seine Logik fest, bevor er Ihnen
eine Wenn Sie ein komplexes Problem haben, mehrstufigen Plan zur
Bearbeitung oder eine nuancierte Frage haben, bei der eine schnelle
Antwort möglicherweise falsch ist Das ist derjenige, der
denkt, bevor er spricht. Pro ist unser Experte. Sie setzen ihn ein, wenn es sich um eine komplexe Aufgabe
handelt, gründliche Recherchen, Analyse eines großen Dokuments, fortgeschrittenes Schreiben, bei dem der Ton genau richtig sein muss . Pro verwendet das leistungsfähigste
Basismodell der Produktreihe, was bedeutet, dass es
mehr Informationen
gleichzeitig speichern und
mehr Nuancen aufnehmen kann gleichzeitig speichern und
mehr Nuancen aufnehmen , die anderen
Modellen möglicherweise fehlen. Der Nachteil ist
, dass es langsamer ist und niedrigere tägliche
Nutzungslimits hat. Speichern Sie es also für die Aufgaben
, die tatsächlich benötigt werden. Diese drei schnell denkenden und
professionellen Modelle sind Gemini-Sprachmodelle. Sie sind es,
die das Gespräch antreiben. Aber die Gemini-Familie
hört hier nicht auf. Es enthält auch
spezielle Modelle für die Bild- und Videogenerierung. Sie lösen sie einfach aus, Sie lösen sie einfach indem Sie die
Befehle „Bild generieren“ oder „Video
generieren“ direkt in
Ihrem Chat oder in der
Gemini-Oberfläche Wenn Sie das getan haben,
übergibt Gemini die Aufgabe im Hintergrund an den richtigen
Spezialisten, und wir werden diese Spezialisten
später im Kurs kennenlernen Nachdem wir herausgefunden haben, mit
welchen Modellen wir arbeiten
werden,
möchte ich Ihnen zeigen, wie Sie Zugang
zu Gemini erhalten
4. Einrichten von Gemini und Ihres ersten Chats: Gehen Sie zu Gemini Dot Google Forward
Slash-Abonnements, um
die aktuellen Pläne zu sehen . Hinweis: Preise und Verfügbarkeit
variieren je nach Land Was Sie auf Ihrem
Bildschirm sehen, sieht also möglicherweise
etwas anders aus als das,
was ich hier zeige Mit dem kostenlosen Tarif haben Sie
täglich Zugriff auf Gemini. Es ist ein guter Ausgangspunkt und erfordert nichts weiter
als ein Google-Konto Mit Google AI plus
haben Sie mehr
Zugriff auf die leistungsfähigsten
Modelle und Funktionen, einschließlich verbesserter Bild
- und Videogenerierung Außerdem erhalten Sie
Zugriff auf Gemini in Gmail sowie auf Google MIT Google AI Pro geht
noch einen Schritt weiter und bietet höhere Nutzungslimits für
Gemini in Gmail, Google MIT-Dokumenten sowie Folien und zwei Terabyte Cloud-Speicher Und schließlich ist Google AI
Ultra die Spitzenklasse. Es bietet Ihnen höchste
Nutzungsbeschränkungen sowie exklusiven Frühzugriff
auf neue Funktionen von Google. Meine Empfehlung hier
wäre, mit
Google AI fortzufahren , solange es eine kostenlose Testversion
anbietet. Das bedeutet, dass Sie im ersten Monat alles, was ich hier
im Kurs
demonstriere, kostenlos verfolgen
können hier
im Kurs
demonstriere . Und nach diesem kostenlosen Testmonat können
Sie entscheiden, ob Sie Ihre
Mitgliedschaft
fortsetzen oder Google
Plus herabstufen oder zur
kostenlosen Mitgliedschaft zurückkehren
möchten Plus herabstufen oder zur
kostenlosen Mitgliedschaft zurückkehren Wählen Sie zunächst
Ihren Mitgliedsplan klicken Sie auf Erste Schritte Als Nächstes müssen Sie eine
Zahlungsmethode für die Testversion angeben Wenn Sie vor
Ablauf des Monats kündigen
oder ein Downgrade durchführen, werden Ihnen
jedoch keine
Gebühren berechnet vor
Ablauf des Monats kündigen
oder ein Downgrade Sobald Sie sich angemeldet haben, sehen Sie in der
oberen rechten Ecke Folgendes Sie sehen Ihren Mitgliedsplan Pro, falls Sie
sich entscheiden, eine AI Pro-Mitgliedschaft zu abonnieren ,
oder Plus, wenn Sie
sich
für diesen Plan entscheiden, befindet sich in der Mitte
des Bildschirms Ihr
Haupt-Chat-Eingang unter der Eingabeleiste Sie werden eine Reihe
von Schnellstartschaltflächen bemerken. Dies sind nur Abkürzungen, mit
denen Sie schnell loslegen können. Sie werden auch
einen Moduswähler sehen. Es wird derzeit schnell angezeigt. Dies ist der Modellselektor, über den
wir gerade gesprochen haben. Klicken Sie darauf, um je nach Bedarf zwischen schnell,
denkend oder
professionell zu wechseln je nach Bedarf zwischen schnell,
denkend oder
professionell zu auf der linken Seite
auf das Menüsymbol klicken, wird Ihre Seitenleiste geöffnet, in der
Sie Ihren Chat-Verlauf finden Sie können von hier aus auch einen
neuen Chat starten. Lass uns versuchen, das zu tun. Ich lasse es für diesen Chat
im Schnellmodus, da ich eine
einfache Frage stellen werde. Ich beginne den Kurs über
Zwillinge auf der Grundlage des heutigen Datums. Was sind die drei
neuesten wichtigen Updates Google für
das Gemini-Ökosystem veröffentlicht hat Ich bitte Gemini, im Internet zu
suchen, um sie für mich zu überprüfen und zusammenzufassen.
Lass uns auf Senden klicken Beachten Sie, dass Gemini nicht
nur aus dem Gedächtnis antwortet. Es geht raus und durchsucht das
Internet in Echtzeit und
bringt mir dann die
für heute relevanten Ergebnisse , wenn ich dieses Tutorial
aufnehme Hier sind die drei
neuesten Änderungen, die Gemini
im letzten Monat eingeführt hat Und natürlich werden wir hier im Kurs über sie
sprechen Im nächsten Abschnitt
nehmen wir alles, was wir
gerade hier eingerichtet haben ,
und setzen es in die Praxis um, angefangen damit, wie man
eine gute Aufforderung schreibt .
Wir sehen uns dort.
5. Wie Sie Gemini zu besseren Ergebnissen motivieren: Abschnitt Intro: Willkommen im neuen Abschnitt zum Thema Prompt Engineering
. Dies ist der Teil des Kurses in dem Sie eine
Fähigkeit erlernen, die
jedes KI-Tool
nützlicher macht, nämlich das Schreiben Eingabeaufforderungen, die
Ihnen durchweg hervorragende Ergebnisse liefern Wir beginnen mit den
Definitionen, was eine Aufforderung ist, was eine Aufforderung bedeutet und wie Prompt Engineering
in das Gesamtbild passt Dann schauen wir uns zwei Modi an. Eingabeaufforderungen entwerfen, die wiederverwendet werden sollen, gibt es
im Chat und in der
Produktionsumgebung keine Wenn Sie Eingabeaufforderungen entwerfen, die wiederverwendet werden sollen, gibt es
im Chat und in der
Produktionsumgebung keine
Eingabeaufforderungen Danach führe ich Sie
durch eine einfache Formel für die Eingabeaufforderung durch eine Sie können es für fast alles verwenden. Sie werden auch die
iterative Eingabeaufforderung üben und
lernen, wie Sie auf
früheren Antworten aufbauen und die
Ergebnisse Schritt für Schritt verbessern Sie lernen, wie Sie anhand von Beispielen eine
Anleitung
erstellen, genau das gewünschte
Ausgabeformat anfordern
und wie Sie mit
Dateien und Anhängen arbeiten Und natürlich werden wir multimodale Eingabeaufforderungen
verwenden. Man und Ihre Aufforderung können Text sowie Dokumente,
Screenshots und Links
enthalten Screenshots und Am Ende dieses Abschnitts werden
Sie sich sicher
fühlen, diese Aufforderungsfähigkeiten bei realen Aufgaben für berufliche oder
private Projekte einzusetzen. Fangen wir an
6. Was ist ein Prompt? Aufforderung, Prompt Engineering, persönliche und Produktionsaufforderungen: Jeder. Denken Sie an das letzte Mal Sie jemandem eine Frage gestellt haben. Die Art und Weise, wie Sie diese Frage formuliert haben
, hat
wahrscheinlich die
Antwort beeinflusst, die Sie erhalten haben Genau das
sehen wir heute in der Welt der KI Wir werden zunächst
drei Schlüsselbegriffe aufschlüsseln , die
für die Kommunikation
mit KI-Systemen unerlässlich sind . Was genau ist eine Aufforderung? Was meinen wir mit Aufforderung? Und wie
bringt Prompt Engineering das alles zusammen? Wir werden auch diesen
Unterschied zwischen
Chat und Enterprise
Prompting untersuchen . Lass uns anfangen Eine Aufforderung ist die Eingabe, die
Sie einer KI geben, Ihre Anweisungen, was Sie wollen
und der Kontext, den Sie bereitstellen. Text, Dateien, Bilder,
Links, Beispiele oder Daten. Stellen Sie sich das als das vor, was die
Reaktion der EIs bestimmt. Eine Aufforderung ist das
Schreiben dieser Eingabeaufforderungen. Es ist die allgemeine
Aktivität,
mit KI-Modellen zu interagieren und ihnen
Anweisungen zu geben Dies ist der Prozess der
Kommunikation mit dem Modell. Prompt Engineering ist ein spezialisierterer und
systematischerer Ansatz zur Erstellung und
Verfeinerung von Eingabeaufforderungen Es geht darum, die Gründe des Modells zu
verstehen, testen und zu wiederholen und He-Fälle zu Anweisungen zu
testen und zu wiederholen und He-Fälle zu
berücksichtigen Stellen Sie sich das wie Kochen vor. Eine Aufforderung ist wie
ein einzelnes Rezept. Promptin ist wie
Kochen im Allgemeinen, und Prompt Engineering ist wie ein
professioneller Koch, der systematisch
entwickelt und testet und Rezepte
systematisch
entwickelt und testet und dabei Zutaten,
Ausrüstung,
Benutzerpräferenzen usw.
berücksichtigt Ausrüstung,
Benutzerpräferenzen usw. Es gibt zwei Hauptarten von Ansagen: Sie
müssen sich der persönlichen Eingabeaufforderung und
der
Produktions- oder
Unternehmensaufforderung bewusst sein persönlichen Eingabeaufforderung und
der
Produktions- oder
Unternehmensaufforderung Produktions- oder Persönliche Eingabeaufforderungen sind das, was
die meisten Leute in einem Chat tun. Sie schreiben eine Anfrage,
die KI antwortet und Sie können
sie durch Konversation weiter verfeinern Es ist flexibel und informell. Wenn Ihre erste Nachricht nicht
perfekt ist, ist das keine große Sache. Du gehst einfach nach,
klärst und wiederholst. Bitten Sie N
AI beispielsweise, Ihnen beim Schreiben
einer E-Mail zu helfen , Ideen zu sammeln oder ein Dokument
in der Chat-Oberfläche zusammenzufassen Das ist persönliche Aufforderung. Produktions- oder
Unternehmensaufforderungen hingegen entwerfen Sie Eingabeaufforderungen
, Bei Produktions- oder
Unternehmensaufforderungen hingegen entwerfen Sie Eingabeaufforderungen
,
die von Ihnen,
einem Team oder innerhalb eines
Produkts oder Workflows wiederverwendet werden sollen einem Team oder innerhalb eines
Produkts oder Das Ziel ist nicht nur einmal
eine gute Antwort, sondern konsistente Ergebnisse über
viele Durchläufe und viele Eingaben hinweg Stellen Sie sich zum Beispiel einen
Kundenbetreuer auf der Website eines Unternehmens vor. Es muss
Tausende von
Kundenfragen zuverlässig beantworten , einschließlich MC-Eingaben wie Tippfehler, unklare Anfragen
oder fehlende Informationen In dieser Umgebung
müssen die Eingabeaufforderungen strukturierter,
vorhersehbarer
und zuverlässiger sein ,
vorhersehbarer
und zuverlässiger diesem Grund enthalten Produktionsaufforderungen in der Regel klare Regeln, strengeres Ausgabeformat und
mehr Leitplanken, da sie
dazu bestimmt sind , wiederholt und
nicht nur einmal zu funktionieren Mit anderen Worten,
persönliche Eingabeaufforderungen oder Chat-Eingabeaufforderungen helfen Ihnen dabei, zuerst
gute Ergebnisse zu erzielen, und Produktionsaufforderungen helfen Ihnen oder Chat-Eingabeaufforderungen helfen Ihnen dabei, zuerst
gute Ergebnisse zu erzielen, und
Produktionsaufforderungen helfen Ihnen
, wiederholt zuverlässige Ergebnisse zu erzielen. Warum sprechen wir so viel
über diesen Unterschied zwischen persönlicher Aufforderung und Produktionsaufforderung Weil sich die Art und Weise, wie Sie
Eingabeaufforderungen
schreiben und verfeinern ,
je nach Einstellung ändert Wenn Sie bei der Eingabe von Eingabeaufforderungen nach zusätzlichen
Materialien suchen, werden
Sie häufig auf Ratschläge , die für den
produktiven Einsatz konzipiert sind, stoßen
, die für den
produktiven Einsatz konzipiert sind,
d. h. Eingabeaufforderungen, die bei vielen Benutzern, vielen Eingaben und
vielen Sonderfällen
zuverlässig funktionieren müssen Eingaben und
vielen Sonderfällen Das ist sehr nützlich,
wenn Sie wiederholbare Workflows erstellen oder EI in ein
Produkt integrieren Wenn Ihr Hauptanwendungsfall derzeit jedoch nur
darin besteht, eine KI in einem Chat zu
verwenden , um Hilfe zu
erhalten, müssen
Sie
es nicht überkomplizieren. Denken Sie also an diesen
Unterschied In diesem Kurs
konzentrieren wir uns hauptsächlich auf persönliche Eingabeaufforderungen
in einer Chat-Oberfläche Jetzt, wo wir mit
der Terminologie auf derselben Wellenlänge sind ,
wollen wir uns mit
der praktischen
Seite der persönlichen Benutzerführung befassen. Allca in der nächsten Vorlesung.
7. So kommunizieren Sie mit Google Gemini AI Die Bausteine einer effektiven Eingabeaufforderung: Jeder. Willkommen zu unserem ersten
Vortrag über Chat-Eingabeaufforderungen. Hier erfahren Sie,
wie Eingabeaufforderungen, die in
der Chat-Oberfläche verwendet werden können
,
erstellen und verfeinern in
der Chat-Oberfläche verwendet werden können
, Lass uns anfangen. Wenn Sie mit einem Freund chatten, verwenden
Sie keine starren Vorlagen
oder formalen Strukturen. Sie führen eine natürliche,
fließende Konversation. Das gleiche Prinzip gilt für Chat-Eingabeaufforderungen mit KI-Modellen. Es gibt jedoch
Zeiten, in denen uns ein bisschen
Struktur helfen kann bessere Ergebnisse
zu erzielen und eine Aufforderung
effektiver
zu gestalten als eine andere Lassen Sie uns also die
wichtigsten Bestandteile
einer effektiven Aufforderung behandeln . Der zentrale Teil jeder Aufforderung ist die
Kernabsicht oder -aufgabe. Dies kann in
Form von Anweisungen erfolgen,
z. B. das Schreiben einer E-Mail mit fünf
Absätzen, um Kleinunternehmern eine neue
Produktivitäts-App
vorzustellen, wobei der Schwerpunkt auf den
zeitsparenden Funktionen liegt. Stellen Sie sich Anweisungen als die Aufgabe vor, die das
Modell ausführen soll. Eine andere Form, die die Absicht
annehmen kann, ist eine Frage wie:
Welche Schritte sollte ich befolgen, um ein überzeugendes
Linkin-Profil zu erstellen Oder wie strukturiere ich einen
Geschäftsplan für eine Startup-Idee? Wenn du eine Aufgabe schreibst, ist es
dein Ziel, klar und konkret zu formulieren, was du erreichen
möchtest. Etwas wie „Hilf mir
bei der Präsentation“ zu schreiben , reicht
nicht aus, um
ein qualitativ hochwertiges
Dokument zu erhalten , das Sie Ihrem Chef, Ihren
Kollegen oder Investoren
vertrauensvoll präsentieren
können Ihrem Chef, Ihren
Kollegen oder Investoren
vertrauensvoll präsentieren Kollegen oder Investoren als Faustregel
daran, dass jeder, der keine spezifischen Kenntnisse in
Ihrem Thema hat, in der
Lage sein sollte , Ihre
Aufforderung zu verstehen und sie umzusetzen Wenn sie sich nicht sicher wie sie
Ihren Anweisungen folgen sollen, wird auch
das EI-System verwirrt
sein. Sie nicht davon aus, dass es irgendwelche kontextbezogenen
Informationen zu Ihrer Aufgabe enthält, z. B. wie die
Ergebnisse verwendet werden sollen oder
wer die Zielgruppe Wie die erfolgreiche
Erledigung einer Aufgabe
aussieht oder eine Liste von Punkten, auf die
Sie nicht eingehen werden Sie müssen
diese Kontext
- oder Aufgabendetails selbst angeben . Wenn Sie beispielsweise eine Präsentation erstellen
möchten, Informationen über
die Anzahl der Folien, den Zweck der Präsentation und die wichtigsten Themen an, die behandelt werden sollen. Hier ist ein Beispiel für
eine gut gestaltete Aufforderung. Erstellen Sie eine Präsentation mit sieben
Folien zum
Thema
Personal Branding. Geben Sie an, was es ist, breite Messgeräte ,
wichtige Komponenten und Schritte
zur Entwicklung Ihrer Marke. Oder ein anderes Beispiel:
Erklären
Sie, wie Sie
in fünf einfachen Schritten eine überzeugende E-Mail schreiben. Die Anweisungen sollten die
Erstellung und Ansprache der
Betreffzeile, die klare
Strukturierung der E-Mail
und die Verwendung eines professionellen Umgangs umfassen Erstellung und Ansprache der
Betreffzeile, klare
Strukturierung der E-Mail . Machen Sie den Vorgang
so einfach, dass jeder ihn auch ohne vorherige
Erfahrung im formellen Schreiben
befolgen Sie können den Kontext angeben, nicht nur für die Aufgabe selbst, sondern auch für den Ton, den
Sie verwenden möchten. Verwenden Sie beispielsweise einen
Umgangston
, der Professionalität
und Barrierefreiheit in Einklang Sie können auch Regeln oder
Einschränkungen angeben , denen das
EI-System folgen sollte In der Aufforderung zum
Verfassen von E-Mails, über
die wir gerade gesprochen haben, könnten
Sie beispielsweise Aufforderung zum
Verfassen von E-Mails, über
die wir gerade gesprochen haben, Folgendes hinzufügen: Wenn Ihre Aufforderung sachliche
Angaben wie Statistiken,
aktuelle Ereignisse,
Produktmerkmale,
rechtliche oder medizinische Informationen oder
etwas anderes beinhaltet aktuelle Ereignisse,
Produktmerkmale, rechtliche oder medizinische Informationen oder , bei dem es
wirklich auf Genauigkeit ankommt, gibt es zwei zusätzliche Zutaten die das Ergebnis erheblich
verbessern können Der erste ist der
Realitätscheck, auch Grounding genannt. Das ist der Zeitpunkt, an dem
Sie es dem EI sagen. Klingt nicht nur
selbstbewusst, sondern seid auch überprüfbar. Sie können also eine
Regel hinzufügen, z. B. wenn Sie Tatsachenbehauptungen
aufstellen, Quellen
zitieren
und mir sagen, worüber Sie sich nicht sicher
sind, die zweite Zutat
ist Vernunft Viele Themen
ändern sich schnell — Tools,
Preisgestaltung, Richtlinien und bewährte Verfahren Es hilft also, dem EI mitzuteilen,
welches Zeitfenster verwendet werden soll. Verwenden Sie beispielsweise Quellen der letzten 12 Monate, sofern nicht alle
Ressourcen benötigt werden. So sieht es aus,
wenn Sie beide zu einer Eingabeaufforderung hinzufügen. Diese beiden Ergänzungen
sind besonders hilfreich wenn Sie KI für
Recherchen oder zur Entscheidungsfindung verwenden, nicht nur für
das Schreiben,
da sie dazu führen, dass die Antwort deutlich
macht,
was bewiesen , aktuell und
was ungewiss ist. Eine weitere Möglichkeit,
Ihre Eingabeaufforderung zu verbessern, besteht bei der Ausführung einer Aufgabe eine bestimmte Rolle
zuzuweisen. Dies wird auch
als Rollenaufforderung bezeichnet. Rollenspiele helfen
KI-Modellen dabei, die Nuancen
bestimmter Perspektiven die Relevanz und
Qualität ihrer Antworten zu
verbessern zum Beispiel
als erfahrener Assistent der Geschäftsleitung mit über 15 Jahren Erfahrung in der
Verwaltung von Geschäftskorrespondenz auf hoher Ebene oder tun Sie so, als wären Sie ein
professioneller Autor, der zum E-Mail-Schreiben
wurde Sie können bei der Rollenauswahl noch
einen Schritt weiter gehen,
indem Sie
zusätzlich zur Rolle den Zielgruppenkontext angeben. Beachten Sie zum Beispiel, wie das EI
die Beispiele für Vor- und
Nachteile adaptiert , um sie für technische Experten
verständlich zu machen verständlich Es ist ziemlich erstaunlich. Und wenn Sie sich von
der Idee, eine so
detaillierte Aufforderung zu erstellen, überwältigt fühlen , machen Sie sich keine Sorgen Das Schöne an der Arbeit in einer Chat-Oberfläche
ist, dass Sie keine perfekt
durchdachte Aufforderung entwerfen
müssen, um die Konversation zu
beginnen Sie können mit einer
allgemeinen Frage oder Aufgabe beginnen
und diese im
Dialog mit dem EI-Modell verfeinern. Dieser iterative Ansatz
ermöglicht es Ihnen,
Ihre Bedürfnisse zu klären und
die Antworten, die Sie im Laufe der Zeit
erhalten, zu verbessern die Antworten, die Sie im Laufe der Zeit
erhalten sprechen In unserem nächsten Video werden wir mehr über
die interaktive Eingabeaufforderung Lassen Sie uns zunächst zusammenfassen, worüber wir
in dieser Vorlesung gesprochen haben
8. Auf den Antworten von Gemini aufbauen: Iterative Aufforderung: Alle zusammen, willkommen zurück. Wenn
Sie nach der
vorherigen Vorlesung der Meinung sind, dass das Erstellen einer guten
Aufforderung eine mühsame Aufgabe ist und dass Sie sie in
einen Prompt-Techniker verwandeln müssen , um in dieser Aufgabe
erfolgreich zu sein Hier ist ein Geheimnis,
das die Experten verwenden. Stellen Sie sich eine Aufforderung als eine Konversation oder einen
mehrstufigen Prozess vor, nicht als eine einmalige Frage, genauso wie Sie in einer neuen
Stadt mit einem Einheimischen den Weg klären
könnten in einer neuen
Stadt mit einem Einheimischen Sie können Ihre Eingabeaufforderungen auf der
Grundlage der EI-Antworten verfeinern Sehen wir uns ein
Beispiel iterative Eingabeaufforderungen
aus der Praxis an,
um zu sehen, wie das funktioniert Nehmen wir an, wir möchten, dass uns
die EI bei der Erstellung eines Geschäftsvorschlags für einen
mobilen Hundepflegedienst Schritt eins: Die erste Aufforderung
kann sehr allgemein sein, z. B.
eine Gliederung für einen
Geschäftsvorschlag
für einen mobilen
Hundepflegedienst zu erstellen eine Gliederung für einen
Geschäftsvorschlag
für einen mobilen
Hundepflegedienst Im zweiten Schritt
grenzen wir
unsere ursprüngliche Anfrage ein oder verfeinern sie, indem etwa
sagen,
nehmen Sie die Gliederung, Sie erstellen und erweitern den Bereich
Marktanalysen, konzentrieren uns auf demografische Daten und den
Wettbewerb in städtischen Gebieten Im dritten Schritt fragen
wir nach spezifischen Details. Entwickeln Sie jetzt beispielsweise den Abschnitt
Finanzprognosen, Startkosten, die
monatlichen Betriebskosten
und die Umsatzprognosen
für das erste Jahr
umfasst monatlichen Betriebskosten . Wir können Schritt zwei
und Schritt drei
mehrmals wiederholen , je nachdem, wie zufrieden wir
mit den Antworten sind. Manchmal sind iterative Eingabeaufforderungen
sogar noch effektiver ,
wenn Sie
an etwas arbeiten , das präzise und
nicht nur gut geschrieben sein
muss nicht nur gut Beispiel: Schritt
eins: Fangen Sie breit an. Geben Sie mir einen
Überblick über den Markt für mobile Hundepflege
in städtischen Gebieten Schritt zwei: Fragen Sie nach
Annahmen und Beweisen. Listen Sie die wichtigsten Annahmen auf
, die Sie treffen. Wenn Sie Fakten oder Zahlen erwähnen,
sagen Sie mir, woher sie kommen,
und kennzeichnen Sie alles, bei dem Sie
sich nicht sicher sind. Schritt drei, Gegenprüfung. Überprüfe jetzt
deine eigene Antwort auf Vernunft. Welche Teile sind am
wahrscheinlichsten falsch oder veraltet? Was würden Sie zuerst überprüfen? Auf diese Weise feilen Sie
nicht nur am Wortlaut, verbessern auch
die Zuverlässigkeit des Inhalts Bitte beachten Sie: So wie
ein erfahrener Projektmanager auf früheren
Diskussionen und Entscheidungen
aufbaut, behält die
chatbasierte KI den Kontext während Ihrer
Konversation Das bedeutet, dass Sie auf frühere Teile
des Chats
zurückgreifen und darauf aufbauen anstatt
alles von vorne zu wiederholen. Sie könnten also
etwas fragen,
das auf der Marketingstrategie basiert , die wir zuvor in diesem Chat
besprochen haben Lassen Sie uns darauf aufbauen, aber konzentrieren Sie sich auf Familien in
Vororten in Gebieten
mit begrenzten Pflegemöglichkeiten Wenn Sie das Gefühl haben, dass
Ihre Konversation nicht in die richtige Richtung
geht, haben
Sie natürlich immer die
Möglichkeit, von
vorne zu beginnen und die erste Frage neu zu formulieren Der letzte Schritt des
iterativen Prozesses besteht in der Regel darin, die KI
zu bitten, die Antwort zu verfeinern Alternativ können
Sie auch um Feedback
zum gesamten Inhalt bitten zum gesamten Inhalt In diesem Fall der
Geschäftsvorschlag, der
sich darauf konzentriert, wie er weiter verbessert
werden kann. Anschließend können Sie
diese Änderungen in die endgültige
Version des Dokuments aufnehmen . Dieser schrittweise
Ansatz ermöglicht es Ihnen, das Ergebnis in jeder Phase zu überprüfen und
zu verfeinern, Anpassungen
auf der Grundlage von Zwischenergebnissen
vorzunehmen, Kontrolle über
das Endprodukt zu
behalten und die Komplexität schrittweise zu erhöhen. Stellen Sie sich das wie Bildhauerei vor. Sie beginnen mit der Grundform
und verfeinern dann schrittweise
die Details, und verfeinern dann schrittweise bis Sie
genau das erreichen, was Sie möchten Und das war's für das Video. Lassen Sie uns die wichtigsten Punkte zusammenfassen
, die wir gerade behandelt haben.
9. Gemini wirklich zu dir machen: Personalisierung: Hallo zusammen und willkommen zurück. Wenn Sie mit einem KI-Assistenten
sprechen, fühlt
es sich manchmal so an, als
würden Sie jedes Mal bei Null anfangen. Sie können die perfekte Aufforderung schreiben und trotzdem eine allgemeine Antwort erhalten weil Gemini keine Ahnung hat, wer Sie sind und wie Sie
arbeiten. In diesem Video werden
wir uns ansehen, wie Gemini so funktioniert, wie Sie arbeiten Es gibt drei
Personalisierungsebenen , mit denen Sie Ihr Erlebnis individuell gestalten können Stufe eins sind grundlegende
personalisierte Anweisungen. Du sagst Gemini
jedes Mal, wie du dich verhalten
wolltest Seien Sie immer professionell,
formatieren Sie Antworten immer als Stichpunkte Was auch immer für Sie funktioniert, es erspart Ihnen,
sich bei jeder einzelnen Aufforderung zu wiederholen . Stufe zwei ist der
Chat-Zwischenspeicher. Hier
fängt Gemini an, sich Fakten
und Vorlieben aus Ihren
früheren Konversationen zu merken , sodass Sie genau
dort weitermachen können, wo Sie aufgehört haben Und Stufe drei ist die fortschrittlichste
persönliche Intelligenz Auf diese Weise kann Gemini Ihr
gesamtes
Google-Ökosystem, Ihr GML,
Ihre Fotos,
YouTube und sogar Ihren
Suchverlauf
miteinander verbinden Ihr
gesamtes
Google-Ökosystem, Ihr GML, Ihre Fotos,
YouTube und sogar Ihren Suchverlauf Stellen Sie sich einen Wochenendtrip vor, anstatt
stundenlang zu spielen. Du sagst einfach, dass Gemini für diesen Samstag
eine Reise plant , die auf meinem Lieblingshobby
basiert Personal Intelligence findet deinen letzten Kauf von Wanderausrüstung in Jimel, ruft deine Lieblingswanderfotos
von Google Fotos ab, sucht in deinem
YouTube-Wiedergabeverlauf nach lokalen Führern
und schlägt dir einen bestimmten Weg vor, wobei du genau
weißt, welcher
Schwierigkeitsgrad Eine Sache, die es zu beachten gilt,
bevor wir beginnen Persönliche Intelligenz
wird immer noch eingeführt, weshalb wir uns heute auf die
ersten beiden Stufen konzentrieren werden Diese
Personalisierungsfunktionen
sind auch Teil des Google
AI Pro-Abonnements Wenn Sie noch kein Upgrade durchgeführt haben, schauen Sie sich unseren Vortrag an, in dem ich Ihnen
gezeigt habe , wie Sie kostenlosen
Zugang erhalten Lass uns mit der Demo beginnen. Wir beginnen mit der
Gemini-Web-App
auf gemini.google.com Ich habe mich bereits in mein P-Konto
eingeloggt. Schauen Sie als Nächstes unten links Ihrem Bildschirm nach und klicken Sie
auf das Zahnradsymbol Einstellungen. Wählen Sie in diesem Menü den
persönlichen Kontext aus. Die erste Einstellung heißt „
Deine besten Hüte mit Gemini“. Wenn sie eingeschaltet ist,
wie auf meinem Bildschirm hier, lernt
Gemini aus deinem Verlauf, lernt
Gemini aus deinem Verlauf dich im Laufe der Zeit
besser
zu verstehen Als ich
diese Einstellung gerade aktiviert habe, hat mir Gemini Folgendes
vorgeschlagen Es hat
alle Dinge
, an denen ich in letzter Zeit
gearbeitet habe, korrekt zusammengefasst , an denen ich in letzter Zeit
gearbeitet habe Übrigens, wenn
Sie jemals
eine private Konversation führen möchten , die
nicht im Chat-Verlauf gespeichert ist , können
Sie den temporären Chat verwenden. Sie sehen, dass es hier oben links auf
dem
Bildschirm
verfügbar ist . Also lass uns darauf klicken. Wir sehen dieselbe Oberfläche, mit der
Sie bereits vertraut sind. Lass mich etwas fragen. Ich verwende ein schnelles Modell da dies nur eine
sehr kurze Frage ist. Also hier sind die Vorschläge. Sie sind ziemlich gut. Und da wir
den temporären Chat probiert haben, lassen Sie mich einen Blick auf meinen Chat-Verlauf werfen. Sie sehen, dass wir hier
nichts haben , was mit
einem flachen Weiß zu tun hat. Lassen Sie mich versuchen, die
Seite zu aktualisieren, um sicherzustellen, dass dieser temporäre Chat nicht im Chat-Verlauf
gespeichert wird. Ja, alles gut. Aber
gleichzeitig haben wir auch dieses
Gespräch verloren. Okay, kommen wir zurück zu den Einstellungen, dem persönlichen Kontext Das zweite Google hier
heißt Your Instructions
for Gemini Wir sehen, dass sie auch
standardmäßig aktiv sind , um
eine neue Anweisung hinzuzufügen, ein Klick auf AD Und hier können wir alle
Informationen zu Ihrem Verhalten, Ihrem persönlichen Kommunikationsstil und Ihren Vorlieben angeben, die Sie mit Gemini teilen
möchten Also hier ist meine Aufforderung. Also möchte ich die
Anweisungen in zwei Teile unterteilen. Zuerst sage ich dem EI, was ich mache. Sie sehen hier, dass ich sowohl meine Rolle
als Pädagoge als auch
als Berater
geteilt habe und
ein
wenig Kontext zu
dem gegeben habe, ein
wenig Kontext zu
dem gegeben was ich in diesen beiden
Rollen mache Und zweitens habe ich erklärt,
wie gerne ich arbeite. Speichern wir diese Anweisungen
, indem wir auf die Schaltfläche Senden klicken. Alles gut. Und schließlich, um alles zu sehen, was
Gemini gespeichert hat, kehren Sie zu den Einstellungen zurück und klicken Sie von
hier aus auf Aktivität Dies ist die Liste
aller Aktivitäten
, die Sie kürzlich mit der
Gemini-App Sie können
bestimmte Chats manuell löschen ,
falls Sie sie aus bestimmten
Gründen nicht benötigen, und Sie können auch einen Löschplan einrichten Ihre Daten werden also alle paar Monate gelöscht
. Zum Beispiel kann ich hier eine Dauer
wählen. Ich lebe 18 Monate, was ein angemessener Zeitraum ist um die
alten Konversationen loszuwerden, und ich klicke auf Weiter. Perfekt. Und das
war's für dieses Tutorial. Jetzt wissen Sie, wie Sie
Gemini so anpassen können , dass es genau
so funktioniert, wie Sie es möchten Und Alca im nächsten Video.
10. So teilen Sie Dateien und andere Inhalte mit Google Gemini AI: Hallo zusammen und willkommen zurück. In den vorherigen Vorlesungen
zum Thema Prompt Engineering haben
wir viel
darüber gesprochen, wie Sie Ihre Anweisungen formulieren und welche
Informationen Sie enthalten sollten. Aber neben den Anweisungen müssen Sie dem EI
manchmal auch Quellenmaterial
wie Dokumente,
Tabellen,
Screenshots oder PDF-Dateien zur Quellenmaterial
wie Dokumente,
Tabellen, Verfügung stellen, damit es diese überprüfen
und analysieren kann Mal sehen, wie es funktioniert. Sie können Gemini
auf zwei Arten
Informationen aus Dokumenten
und Bildern zur Verfügung stellen , indem Sie den
Text direkt in den Chat einfügen oder
die gesamte Datei
an die
Konversation anhängen Die erste Option,
den Text einzufügen, funktioniert also gut, wenn Sie nur Hilfe bei einem bestimmten
Fragment Ihres Dokuments benötigen Hier ist zum Beispiel mein Lebenslauf, und ich möchte Feedback zu nur
einem Abschnitt des Dokuments, sodass ich ihn einfach kopieren, in den Chat
einfügen und dann Gemini die
Anweisungen geben Also habe ich gesagt, dass dies ein
Fragment aus meinem Lebenslauf ist, und ich habe Gemini gefragt, ob diese Fähigkeiten für eine Position als Produktleiter
für
ein Fintech-Startup relevant sind Position als Produktleiter
für
ein Fintech-Startup Und hier ist die Antwort. Aber oft möchten Sie, dass Gemini mit
dem gesamten Dokument arbeitet,
z. B. mit einem langen PDF oder einer Gemini kann fast
jeden gängigen Dateityp verarbeiten von Word-Dokumenten bis hin zu CSV-Dateien,
Fotos und sogar Videos Fotos Um die Datei anzuhängen, klicken Sie auf das Plus-Symbol auf der linken Seite
der Chat-Leiste Sie können eine Datei
von Ihrem Gerät,
von Ihrem Google Drive,
Ihren Google Fotos auswählen . Nehmen wir also ein Beispiel. Ich brauche ein paar Ideen,
was ich zum Abendessen kochen soll. Was ich
tun werde, ich werde
mehrere Fotos von Zutaten hochladen , die
ich in meinem Kühlschrank habe. Das sind die
Zutaten, die ich habe. Ich frage Gemini, was sind die drei einfachen Rezepte für ein Abendessen ich in weniger als 20 Minuten zubereiten kann Und hier sind die Empfehlungen
, die Gemini gegeben hat. Sie sehen, dass die Inhaltsstoffe
anhand der Bilder erfolgreich identifiziert Hier sehen wir Geminis Fähigkeit, Objekte zu erkennen und kreatives
Frisonin anzuwenden Als Nächstes versuchen wir es mit einem Dokument. Nehmen wir an, Sie haben ein
komplexes Dokument mit einer Stromrechnung erhalten . Sie können dieses
PDF also auf Gemini hochladen und fragen ob es die wichtigsten
Gebühren zusammenfassen kann. Lass uns das ausprobieren Ich kehre zum selben Chat zurück, klicke auf das Plus-Symbol und wähle
dann Dateien
aus meinem lokalen Laufwerk aus. Und hier ist meine Aufforderung. Lassen Sie uns hier das schnelle Modell verwenden weil es eine ziemlich
einfache Anfrage sein sollte, und lassen Sie uns sehen, welche Antwort
wir erhalten werden. Ja, ziemlich gute, korrekte
Zusammenfassung der Gebühren sowie meines
Datenverbrauchs. Alles gut hier. Ordnung, lassen Sie uns
etwas anderes ausprobieren und verschiedene Arten von
Dokumenten an Gemini senden , um zu sehen, ob es wirklich
mit verschiedenen Dateien funktioniert Ich habe ein PDF mit meiner Flugroute für meine
bevorstehende Reise nach Phuket Und hier habe ich einen Reiseführer mit einigen
Informationen zu den Touren. Das kann ich dort machen,
während ich in Phuket bin. Ordnung. Diese Demo
dauert eine ganze Weile. Also was ich tun werde, ich
werde diese Reaktion beenden. Ich kopiere diese Aufforderung
und öffne einen neuen Chat. Ich habe dieselbe Aufforderung eingefügt, und hier wollen wir zum Nachdenken übergehen. Weil ich hier ein ziemlich
komplexes PDF-Dokument habe. Ich habe auch Bilder mit
konkreten Daten, die Gemini analysieren und mit den Daten
in diesem Dokument
vergleichen muss mit den Daten
in diesem Dokument
vergleichen Vielleicht wäre es also besser, auf ein intelligenteres Modell
umzusteigen ein intelligenteres Modell
umzusteigen Lass uns das ausprobieren. Jetzt haben wir das Ergebnis
fast sofort erhalten. Lesen wir also, was
Gemini uns sagt. Es erkennt alle Informationen
in
den Dokumenten,
die ich zur Verfügung gestellt habe, und es hat auch eine
nette Empfehlung gegeben, was ich tun kann, sobald ich
an meinem Zielort angekommen bin Hier fungiert
Gemini als unser persönlicher
Kardinator, der
Punkte zwischen verschiedenen
Dateitypen verbindet Punkte zwischen verschiedenen
Dateitypen Und bitte denken Sie daran, dass Gemini diese Dateien
zwar lesen
und analysieren kann ,
um Zusammenfassungen,
Tabellen oder
Empfehlungen zu erstellen , die Originaldatei selbst jedoch nicht verändert Ordnung, fahren wir mit unserer Demo fort.
Nehmen wir
an, ich habe eine Audiodatei, die Gemini analysieren
soll, indem ich wie immer
auf die Plus-Schaltfläche klicke Dann wähle ich in meiner Audiodatei aus, und hier ist meine Aufforderung Können Sie die wichtigsten
Punkte dieses Audios zusammenfassen? Ich werde hier weiterhin den
Denkmodus verwenden , da dies komplexere Aufgabe
ist als nur
eine kurze Frage zu Und hier ist die Zusammenfassung. Dies ist die korrekte Zusammenfassung
von Gemini. Ich kann dies bestätigen, da dies
die Aufnahme ist , die ich
selbst für meinen anderen Kurs vorbereitet habe Tolle Arbeit Gemini. Und lassen Sie mich auch zeigen,
wie es mit Videos funktionieren kann. Ich habe diesen Link zur
Google-Keynote-Präsentation. Und da ich gerade am Gemini-Kurs
arbeite, möchte
ich, dass Gemini mir hilft, all die Momente zu
finden, in
denen Redner über die Gemini-App und neue Funktionen sprechen Lass uns die Eingabetaste drücken und schauen,
was Gemini vorschlagen wird. Hier ist die detaillierte
Analyse dieses Videos. Und was mir hier wirklich
gefällt, ist, dass es die Zeitcodes enthielt. Wir sehen hier zum Beispiel, dass Gemini den
persönlichen Kontext erwähnt hat
und dass dieser spezielle
Zeitcode enthalten ist, in dem einer
der Redner
über diese Funktion gesprochen Wenn ich also diese Konversation
überprüfen möchte, kann
ich einfach
auf diesen Timecode klicken Ich werde zu diesem
Teil der Präsentation weitergeleitet. Und das war's für diesen Vortrag. Lassen Sie uns kurz zusammenfassen
, was wir hier gelernt haben. Die meisten modernen KI-Modelle
akzeptieren gängige Dateiformate, darunter PDFs, Word-Dokumente, Excel-Dateien, CSVs,
Bilder und Textdateien Dateien können über
eine Upload-Schaltfläche oder ein
Anhangssymbol auf
der Chat-Oberfläche hochgeladen werden eine Upload-Schaltfläche oder ein Anhangssymbol auf
der Sie müssen klare
Anweisungen dazu geben,
was die KI
mit den Dateien machen soll Wenn Sie Ihre Anfragen spezifisch
behandeln ,
führt dies zu besseren Ergebnissen. Sie können
mehrere Dateien hochladen und
das KI-Modell bitten , sie zu vergleichen
oder gemeinsam zu analysieren. Die KI
bearbeitet Ihre Datei normalerweise nicht direkt, kann
aber
verbesserte Inhalte generieren. Sie können zurück
in Ihr Dokument kopieren. In Ordnung, und wir
sehen uns in der nächsten Vorlesung.
11. Verwenden von Beispielen in Eingabeaufforderungen: Alle zusammen, und willkommen zurück zur neuen Vorlesung, in
der
wir weiter
darüber sprechen , wie Sie mit
EI-Systemen kommunizieren können und was Sie in Ihre Aufforderung
aufnehmen Bisher haben wir
verschiedene Komponenten behandelt, die in einer Aufforderung,
einer Aufgabe oder dem, was Sie erreichen
möchten, enthalten
sein können , gefolgt von spezifischen Details oder Kontexten und Regeln, die für die Ausführung der Aufgabe
oder die Beantwortung einer Frage erforderlich sind. Als Nächstes folgt der Rollenkontext, eine spezifische Rolle, die das EI bei der
Ausführung einer Aufgabe spielen
wird . Optional können Sie auch die
Zielgruppe für Ihre Aufgabe
vorstellen. Schließlich haben wir erwähnt,
dass Sie
zusätzliche Inhalte teilen können , indem Sie Dokumente an
Ihre Konversation
anhängen oder den Text als Eingabedaten direkt
in den Chat aufnehmen und die Reihenfolge der
Komponenten in Ihrer Aufforderung festlegen Die Reihenfolge ist
für einige Elemente wichtig, für andere
jedoch nicht Es wird beispielsweise
empfohlen,
den RL-Kontext zu
einem früheren Zeitpunkt in der Eingabeaufforderung einzufügen , obwohl Eingabedaten
je nach Aufgabe
möglicherweise nicht erforderlich sind
und die Reihenfolge auch flexibel
ist. Im Allgemeinen ist
es jedoch ein guter Anfang für
eine effektive Aufforderung, wenn Sie sich an die Reihenfolge halten , die
auf den Folien der
Kurspräsentation angegeben ist. Okay, lassen Sie uns
ein weiteres
Aufforderungselement einführen . Beispiele, auch
Shots genannt, dienen als
Veranschaulichung , anhand derer das
generative KI-Modell anhand dessen ermittelt werden kann, nach welcher Art von Ausgabe
Sie suchen, einschließlich des Antwortformats
und dessen, was Sie vermeiden möchten. Vielleicht haben Sie von Begriffen wie
One-Shot oder Fee-Shot-Prompting
gehört One-Shot oder Fee-Shot-Prompting Diese beziehen sich auf die Verwendung eines oder mehrerer Beispiele in
Ihrer Prompt-Beschreibung Bei Chat-Eingabeaufforderungen verdeutlichen Beispiele
in der Regel den Tonfall. Zum Beispiel formell
versus informell, seriös versus terminlich, einfühlsam versus
sachlich und Stil wie
Satzlänge,
Formatmuster, Aufzählungspunkte im Vergleich zu Absätzen,
technischer Detailgrad, grundlegende oder fortgeschrittene
Terminologie usw. Lassen Sie uns einige
konkrete Beispiele durchgehen. Zunächst werde ich Gemini um
eine einfache E-Mail bitten , ohne ein Beispiel
zu nennen Also hier ist meine Aufforderung. Für diese Demo
werde ich das
Fest-Modell verwenden . Lass es uns ausführen. Diese E-Mail ist in Ordnung, aber sie ist auch ziemlich allgemein gehalten. Lassen Sie uns es nun viel
spezifischer machen, indem wir
ein Beispiel für den gewünschten Ton und die gewünschte
Struktur zeigen . Also hier ist meine andere Aufforderung. Ich habe also am Anfang dieselbe
Anweisung, und dann habe ich ein Beispiel
als Stilreferenz angegeben ,
in dem der Ton, die
Satzlänge
und die Struktur erwähnt werden, die Gemini verwenden soll Lassen Sie uns diese zweite Version ausführen. Wenn wir nun
diese neue Antwort mit
der ersten Version vergleichen , stellen wir fest, dass sie sich menschlicher anfühlt. Die Sätze sind kürzer
und die Struktur entspricht eher dem, was wir im Beispiel
gezeigt haben. Und wo wir schon beim E-Mail-Beispiel sind, lassen Sie mich
Ihnen kurz zeigen, was Gemini als Nächstes mit dieser E-Mail
machen kann Nächstes mit dieser E-Mail
machen Es hat sich herausgestellt, dass Sie die E-Mail
nicht kopieren
und
in Ihren Posteingang einfügen müssen E-Mail
nicht kopieren
und
in Ihren Posteingang einfügen Wenn Sie direkt
unter der Antwort nachschauen, sehen
Sie ein weiteres Symbol. Lass uns darauf klicken. Und hier sehen
Sie die Option Entwurf in Gmail. Wenn Sie darauf klicken,
öffnet Gemini ein neues Fenster und platziert genau
diesen Text in
einem echten Gmail-Entwurf
, den Sie weiter bearbeiten und
schließlich
an Ihren Empfänger senden können schließlich
an Ihren Empfänger senden Also lass uns versuchen, das zu tun. Gemini verfasst eine E-Mail. Lass uns einen Blick darauf werfen. Ich
klicke auf Gmail öffnen. Wir sehen, dass der Betreff der E-Mail korrekt erfasst wurde
. Dies ist genau der Text
, den wir im Chat gesehen haben. Lass uns
etwas Fortgeschritteneres versuchen. Bisher haben wir anhand von Beispielen den Ton und den
Stil der Reaktion festgelegt. Sie können aber auch Beispiele verwenden
, um einen mentalen Rahmen festzulegen. Der mentale Rahmen
verändert nicht nur die Wörter, die Gemini verwendet. Es ändert die Logik, mit
der es Ihr Problem löst. Anstatt also eine
lange Liste mit Regeln wie
praktisch oder nicht
zu akademisch zu schreiben , können
Sie Gemini einfach eine Aufnahme
oder ein Beispiel der Perspektive
zeigen , die
Sie einnehmen wollten Gehen wir also Schritt für Schritt vor. Zuallererst
öffne ich einen neuen Chat. Und hier würde ich gerne zu einem Pro-Model
wechseln. Und nur zur Vorwarnung, wenn
Sie einen kostenlosen Tarif haben, haben
Sie weiterhin
Zugriff auf das Pro-Modell. Sie sehen, ich verwende
mein kostenloses Konto und kann dieses Modell immer noch
auswählen. Ihre Nutzungslimits sind jedoch möglicherweise
niedriger als bei kostenpflichtigen Tarifen. Ich kehre also zu
meinem Konto zurück , das ich für diese Demo
verwende. Lassen Sie uns zunächst sehen, wie Gemini Anfragen ganz
ohne Framing
behandelt Ich werde nach einem beliebten
Thema fragen: Personal Branding. Ich möchte etwas über
Personal Branding erfahren. Wie sollte ich anfangen?
Lass uns die Eingabetaste drücken. Wenn wir interessiert sind, können
wir uns Geminis
Denkprozess ansehen Sie sehen,
das sind die Schritte, die unternommen wurden um uns diese
Empfehlung zu geben Alles ist richtig, aber
es ist sehr theoretisch. Es fühlt sich an wie eine lange Aufgabenliste, bevor Sie überhaupt angefangen
haben. Lassen Sie uns nun anhand eines einmaligen
Beispiels die Logik auf ein praktisches
mentales System
verlagern. Ich möchte, dass Gemini sich wie ein Coach
benimmt , der sofortige kleine
Siege wichtiger schätzt als große Theorien Also hier ist meine neue Aufforderung, abgesehen von meiner
ursprünglichen Anweisung Ich habe auch ein Beispiel
für praktische Logik beigefügt. Lass uns reingehen und sehen
, was Jimmy und ich hier
vorschlagen würden . Siehst du das? Weil ich die
Logik als praktisch bezeichnet habe und Gemini das
Hallo-World-Beispiel gezeigt habe
, habe ich keine
Leseliste mehr. Es gibt mir wortwörtlich
praktische Empfehlungen,
Dinge, die ich jetzt tun kann Jetzt spiegelt Gemini also
die Denkweise wider, nicht nur den Ton und den Stil, wie in unserem ersten In Ordnung. Und lassen Sie uns noch
ein kurzes Beispiel nehmen Dies ist besonders nützlich
, wenn Sie recherchieren. Angenommen, Sie möchten, dass Gemini nicht nur die Frage beantwortet, sondern auch zeigt, woher die
Informationen stammen.
Sie können ein Beispiel hinzufügen, das das gewünschte
Format
demonstriert Sie können beispielsweise
eine vollständige Eingabeaufforderung wie diese schreiben. Und was wichtig ist, ich habe auch Regeln für Gemini
bereitgestellt. In diesen Fällen kann sie keine zuverlässige
Quelle für eine Reklamation
finden Lass es uns ausführen. Diese
Art von Beispiel macht die Ausgabe viel
strukturierter und
vertrauenswürdiger, weil Sie genau das
Format anzeigen, Sie als
Beweismittel benötigen. In Ordnung. Abgesehen von einer oder
wenigen Eingabeaufforderungen
gibt es noch eine weitere Technik, bei der interaktive Beispiele
verwendet Interaktive Beispiele unterscheiden sich von regulären Beispielen dadurch, dass
sie eine dynamische
Lernerfahrung bieten, bei der jedes Beispiel auf
früheren Erkenntnissen
oder Rückmeldungen aufbaut , während es sich bei regulären Beispielen um Studiendemonstrationen
handelt Interaktive Beispiele erfordern aktive Teilnahme
und Iteration. So funktionieren interaktive
Beispiele. Sie geben ein Beispiel für eine erste
Version an. Die KI gibt spezifisches
Feedback und Vorschläge. Auf der
Grundlage dieses Feedbacks erstellen Sie eine verbesserte Version. Die KI analysiert die Verbesserungen und schlägt weitere
Verbesserungen Bei Bedarf iterieren Sie erneut. Entscheidend ist, dass jede
Iteration
auf dem Feedback
der vorherigen Version aufbaut auf dem Feedback
der vorherigen Version so einen gemeinsamen
Verbesserungsprozess Okay, großartig. Und das
war's für dieses Video. Lassen Sie uns kurz darauf eingehen, was
wir hier gelernt haben. Und wir sehen uns im nächsten Video,
in
dem wir uns mit
einer weiteren Aufforderungstechnik befassen werden
12. Festlegen des Ausgabeformats in Gemini: Jeder einzelne. Wir sind fast fertig damit die wichtigsten Zutaten
einer guten Aufforderung zu
behandeln. Es gibt noch eine weitere Komponente, die
Sie vielleicht für sinnvoll halten, in Ihre Eingabeaufforderung aufzunehmen, in
welchem Format die Antwort der
KI aussehen soll. Lassen Sie uns jetzt darüber sprechen. Denken Sie daran, dass
wir in unserer ersten
Vorlesung zum Thema Prompting gesagt haben, dass es
wichtig ist,
Informationen über die
Grundzüge oder die Liste der Punkte aufzunehmen Informationen über die
Grundzüge oder die Liste der Punkte Sie werden es nicht als
Kontext für Ihre Aufgabe behandeln. Es stellt sich heraus, dass Sie auch
Ihre Formatierungseinstellungen
für die Antwort angeben
können , was Ihnen helfen kann,
Informationen effektiver zu organisieren. diese Informationen möglicherweise nicht Je nach Aufgabe sind diese Informationen möglicherweise nicht
erforderlich, aber wenn Sie
sie einbeziehen, ist es
besser, sie gegen Ende
der Aufforderung zu bündeln als zu Beginn Sehen wir uns einige Formatierungsbeispiele an, die Sie anfordern können Sie können nach bestimmten
Formatierungsstilen fragen. Wenn Sie beispielsweise
einen Geschäftsbericht benötigen , könnten
Sie sagen: Bitte formatieren Sie diesen als
professionellen Bericht mit Überschriften,
Zwischenüberschriften und kurzen
, Zwischenüberschriften und kurzen KI strukturiert die
Informationen entsprechend macht sie für
den professionellen Einsatz bereit Wenn Sie mit
Daten oder Analysen arbeiten, können
Sie Tabellen
oder bestimmte Layouts anfordern. Anstatt einer
Textwand könnten Sie sagen, den Vergleich
dieser drei Produkte
in einem übersichtlichen Tabellenformat mit
Funktionen in der linken Spalte
präsentieren . Dadurch sind komplexe Informationen leichter zu verstehen und zu verwenden. Und hier sind noch ein paar weitere Formate und Muster, die besonders für Recherchen oder
Entscheidungen
nützlich sind . Vergleichstabelle. Geben Sie mir eine Vergleichstabelle
dieser Optionen mit
Spalten für die wichtigsten Funktionen, Vor- und Nachteile und die besten vier. Quellenzuordnung, liste die von dir verwendeten
Quellen auf und erkläre in deiner Antwort
kurz, was jede
Quelle unterstützt. Fakten versus Interpretationen. Teilen Sie Ihre Antwort
in zwei Abschnitte auf: Fakten, überprüfbare Aussagen
und Interpretationen, Ihre Argumentation, Annahmen
oder Empfehlungen Sie können eine bestimmte
Markdown-Formatierung anfordern. Die KI kann nach Bedarf fetten Text,
Kursivschrift, Überschriften und
Aufzählungspunkte verwenden Kursivschrift, Überschriften und
Aufzählungspunkte Fragen Sie einfach
fett gedruckt nach wichtigen Punkten oder nach wichtigen
Begriffen in Kursivschrift, und die
Antwort wird so formatiert, wie Sie es Sie können Ihre Tipps organisieren, indem Aufzählungspunkte für den Haupttipp von
Claridm, unterstützende Details
und weitere Denken Sie schließlich daran, dass
Sie jederzeit darum bitten können, die Antwort
neu zu formatieren, wenn die erste Version nicht
ganz Ihren Anforderungen entspricht Es ist völlig in Ordnung zu sagen: Könnten Sie diese
Informationen als nummerierte Liste neu organisieren Oder teilen Sie dies bitte in
kürzere Absätze auf , um das
Wetter besser lesbar Okay, und das war's für
diesen kurzen Vortrag. Lassen Sie uns die wichtigsten Punkte zusammenfassen, die
wir gerade behandelt haben. Geben Sie immer im
Voraus Ihr
gewünschtes Format an, um die
nützlichste Antwort zu erhalten Sie können
bestimmte Strukturen
wie Berichte, Tabellen oder Listen anfordern wie Berichte, Tabellen oder Listen Vergleichstabellen eignen sich
hervorragend für die Entscheidungsfindung. Sie können nach einer
strukturierten Tabelle mit Vor- und
Nachteilen und der besten Form fragen . Für Forschungsaufgaben
können Sie Quellen anfordern und aus Gründen der Klarheit sogar Fakten von
Interpretationen trennen. Ein KI-Modell kann
seinen Schreibstil
an Ihre Bedürfnisse anpassen , von
lässig bis professionell. Markdown-Formatierung hilft dabei,
wichtige Informationen hervorzuheben Sie können um eine Neuformatierung bitten , wenn die erste Antwort
nicht ganz richtig Klare
Formatierungsanweisungen führen zu nützlicheren und
umsetzbareren Und das war's für dieses Video und wie immer für AlCa
im nächsten
13. Nachverfolgung: Auswahl des richtigen Modells und Brainstorming mit Gemini: Jeder. Bis jetzt haben
wir
Brampton vereinzelt erkundet. Es ist an der Zeit, diese Teile zu einem vollständigen
Ende-zu-Ende-Workflow
zusammenzuführen einem vollständigen
Ende-zu-Ende-Workflow
zusammenzuführen Und nebenbei zeige
ich Ihnen einige
Produktivitätspakete, zeige
ich Ihnen einige
Produktivitätspakete die in Gemini verfügbar sind, z. B. wie
Sie Antworten auf
Richtigkeit überprüfen und sie
direkt in Google Docs exportieren können Wir werden zwei
Szenarien untersuchen, die bei weitem zu meinen Favoriten
gehören, wenn es um die Arbeit mit Gemini
geht Das sind Brainstorming
und das Einholen von Feedback. Aber bevor wir mit
unserem ersten Szenario beginnen, lassen Sie uns ein wenig darüber sprechen, wie Sie Ihr
KI-Modell auswählen können Sie haben gesehen, wie ich in
diesen Demos
zwischen ihnen gewechselt habe, und Sie fragen sich vielleicht, und Sie fragen sich vielleicht, welches Modell Sie wählen sollten Und wenn Ihre Wahl von Ihrem Abonnement
abhängt. Wenn Sie ein bezahlter Benutzer sind, schlage
ich vor, dass Sie das Denken zu
Ihrer Standardwahl machen. Seine Argumentationskraft bewältigt fast alles.
Wechseln Sie zu schnell, nur für Aufgaben, bei denen wenig auf dem Spiel steht,
wie
schnelle Grammatikprüfungen oder schnelle Fragen, und wechseln Sie zu Profi, wenn Sie es
mit langen Dokumenten,
gründlichen Recherchen oder
etwas anderem zu tun haben , das eine
anhaltende Konzentration
auf eine große
Menge an Inhalten erfordert anhaltende Konzentration
auf eine große
Menge an , und genau da verdient
es seinen Platz Ich arbeite jetzt schon
seit geraumer Zeit mit Gemini, und das ist der
beste Arbeitsablauf, den ich mir nach
vielen Experimenten
ausgedacht habe nach
vielen Experimenten
ausgedacht Wenn Sie die kostenlose Version nutzen,
sollten Sie schnell als
Standard verwenden, da die fortgeschritteneren Modelle begrenzte
Tageskontingente im kostenlosen Tarif
haben. Sie müssen
also
strategisch vorgehen und
diese Credits für den Zeitpunkt aufsparen, Sie müssen
also
strategisch vorgehen und
diese Credits für den Zeitpunkt aufsparen an dem
Sie sie wirklich benötigen Wechseln Sie zum Denken
, wenn eine Aufgabe
tiefgründige Logik oder
mehrstufiges Denken erfordert , und wechseln Sie zum Profi, wenn Sie mit
umfangreichen Inhalten arbeiten oder ein hohes Maß an
Nuancen und Tiefe benötigen hohes Maß an
Nuancen und nun vor diesem Hintergrund Lassen Sie uns nun vor diesem Hintergrund zu unserem ersten Folgeszenario des
Brainstorming-Prozesses übergehen Folgeszenario des
Brainstorming-Prozesses Ich möchte, dass Sie sich vorstellen, Sie sind der Marketingmanager
eines sehr ehrgeizigen, einfallsreichen Schlaftech-Startups
namens Wir sind dabei,
den Snooze One auf den Markt zu bringen, den weltweit ersten Wie Sie
unserem internen Briefing entnehmen können, bietet
diese Matratze alles, bietet
diese Matratze alles von der Klimazonen-Technologie Dream-Sync-Analysen bis hin zur Vibe Sing Story Sie müssen eine Kampagne zur Markteinführung in den sozialen
Medien aufbauen , die intelligentes Schlafen
unverzichtbar macht Öffnen wir also Gemini
, um die Demo zu starten. Ich wähle das
Denkmodell, weil wir
einen kreativen Strategen brauchen , der mit Nuancen umgehen kann Und lassen Sie uns mit
unserem Brainstorming beginnen. Hier ist die erste Aufforderung
, die ich verwenden werde. Sie sehen, dass ich zuerst die Rolle
vorstelle,
die Gemini übernehmen soll Dann habe ich ein wenig
Kontext zu dem hinzugefügt , was
wir demnächst auf den Markt bringen werden Unsere Zielgruppe. Und dann habe ich Gemini
beauftragt, Themen für
Zeltinhalte für
unser 30-tägiges Startfenster vorzuschlagen Themen für
Zeltinhalte für
unser 30-tägiges Startfenster Und lassen Sie mich auch
die PDF-Datei hinzufügen, die Sie gerade gesehen haben, um Gemini noch
mehr Kontext zu geben Und lassen Sie uns die Eingabetaste drücken also hier sind die zehn Themen
, die Gemini vorgeschlagen Mir gefällt dieses Thema am besten. Bitten wir Gemini also, sich eingehender mit diesem
speziellen Thema zu befassen Also hier ist meine zweite Aufforderung. Und lassen Sie mich tatsächlich
spezifizieren, dass ich
zehn Kostenideen haben möchte . Lassen Sie uns die Eingabetaste drücken. Tolle Vorschläge. Und falls Ihnen einige davon nicht
gefallen, können
Sie Gemini jederzeit bitten, Ihnen zehn weitere Ideen
vorzuschlagen Also lass uns das machen. Ich merke wenn du das mehrmals machst, kannst
du dir
wirklich tolle Vorschläge einfallen lassen. Versuchen Sie
es also bitte und
verwenden Sie nicht nur die erste Ideenliste
, die Gemini bietet Lass uns noch eine Iteration machen. Ich habe Gemini
einige Rückmeldungen zu der darin enthaltenen
Ideenliste gegeben Nett. Ich sehe, dass wir mit einigen Ideen weiter arbeiten können. Aber bevor wir anfangen,
die eigentlichen Skripte für
unseren Beitrag oder unsere Videos zu erstellen, möchte ich Gemini
noch eine Frage stellen Bevor wir weitermachen, möchte
ich wissen, was
die aktuellen Trends bei
Social-Media-Inhalten
für die Einführung von Technologieprodukten sind die aktuellen Trends bei
Social-Media-Inhalten , wie in unserem Fall Hier sind die Trends. Sie sehen, dass das aktuelle Jahr korrekt
aufgenommen wurde. Und hier ist meine nächste Aufforderung. Ich werde
Gemini bitten,
zehn Kurzform-Videoskript-IDs
für die
Vibe-Check-Storytelling-Serie vorzuschlagen zehn Kurzform-Videoskript-IDs für die
Vibe-Check-Storytelling-Serie Nehmen wir an, ich möchte, dass Instagram die
Plattform unserer Wahl ist Und beachten Sie, dass ich dieses PDF auch mit
den Viral-Hook-Ideen
beigefügt den Viral-Hook-Ideen habe
, die Gemini
bei der Vorbereitung der Antwort verwenden soll Das
nennt man Erdung. Deshalb verankere ich
die Antwort von EIs in unserem spezifischen Markenstil damit sich die Skripte
nicht generisch anfühlen Als Nächstes habe ich auch
die Struktur für
das Drehbuch bereitgestellt und das war's Lass uns die Eingabetaste drücken. Okay, wir sehen, dass Gemini
einige Platzhalter hinzugefügt hat, und ich möchte wirklich ein vollständiges Skript
für den Teleprompter bereit
haben , damit
wir das Video einfach aufnehmen können Beim Brainstorming bitte
ich
Gemini also zunächst, eine
Vielzahl von Ideen zu untersuchen, und
dann werde ich diese Ideen möglicherweise mehrmals wiederholen dann Und dann wähle ich normalerweise eine
Idee aus, die mir gefällt, und bitte Gemini, sich auf
dieses Thema zu beschränken und, sagen wir, einen Beitrag oder
eine
Geschichte zu dieser Idee meiner Wahl zu verfassen In Ordnung, unser Drehbuch ist fertig. Ich kann weiter
mit Gemini sprechen und darum bitten, das Skript
anzupassen oder
eine andere Idee zur Erweiterung anzunehmen Aber nehmen wir an, dass ich mit diesem Skript
einverstanden bin Ich kann
dieses Skript tatsächlich direkt
in das Google-Dokument exportieren dieses Skript tatsächlich direkt
in das Google-Dokument Du siehst drei Punkte, die ich hören kann. Wenn ich darauf klicke, kann ich zwei Hunde exportieren
wählen
und mal sehen, was passiert. Gemini teilt mir mit, dass das
neue Dokument erstellt wurde. Klicken wir auf Öffnen. Sehr nett. Wir haben sogar eine Tabelle
mit Zeitcodes und genauem Text, den wir sagen
müssen. Sehr cool. Und du siehst
hier auch, wie Geminis versucht, diese
Tabelle in Blätter zu exportieren Versuchen wir das auch zu tun. Persönlich exportiere ich
für dieses Szenario gerne in Google Docs. Ich denke, es funktioniert besser
für diese Art von Dokument, aber Sie haben die Idee. Das war's für dieses Tutorial
und Alca im nächsten.
14. Folgemaßnahmen: Feedback mit Google Gemini AI erhalten: Jeder. Willkommen zum
zweiten Follow-Along Video. Lassen Sie uns untersuchen, wie Sie
Feedback von Gemini erhalten. Dieser Anwendungsfall ist einer
der ersten, mit denen ich angefangen habe. Bei Verwendung des EI-Assistenten. Früher habe ich meine Dokumente
wie Präsentationen,
Berichte und Lebensläufe eingereicht wie Präsentationen,
Berichte und Lebensläufe und EI um Feedback gebeten,
damit ich
eine zweite Meinung dazu einholen
und Verbesserungen vornehmen kann . Aber Gemini hat diesen Prozess auf
eine völlig neue Ebene gebracht , da
er von Natur aus multimodal ist,
was bedeutet, dass er
nicht nur Texte,
sondern auch andere Arten von
Inhalten wie Videos verarbeiten kann sondern auch andere Arten von
Inhalten Sie können jetzt
personalisiertes Feedback
zu Ihrer tatsächlichen Leistung erhalten ,
nicht nur zu dem, was Sie nicht nur zu dem, was Der Grund, warum Gemini
hier so dominant ist , ist sein riesiges
Kontextfenster. Das ist das erste Mal, dass
wir diesen Begriff verwenden. Lassen Sie uns ihn also vorstellen. Das Kontextfenster ist im Wesentlichen das
IIS-Kurzzeitgedächtnis. Es ist die
Datenmenge, die das Modell gleichzeitig in seinem Gehirn
speichern kann , um die Anfrage zu verstehen. Während andere Modelle
möglicherweise Schwierigkeiten haben, sich mehr als ein
paar Minuten an Filmmaterial zu
merken, kann
Gemini bis
zu 1 Million Tokens verarbeiten Um Ihnen eine Vorstellung zu geben
, das ist ungefähr eine Stunde Video oder Tausende
von Textseiten in einem einzigen Durchgang Dieser riesige Speicher
ist genau der Grund, warum so viele Benutzer für die Videoanalyse zu
Gemini wechseln Aber verlassen Sie sich nicht einfach auf mein Wort
. Lass es uns überprüfen. Ich werde den
Denkmodus verwenden, um die Behauptung zu überprüfen. Und das ist die Aufforderung, die
ich zuerst verwenden werde. Lass mich Enter drücken. Der Grund, warum ich mit
dieser Frage angefangen habe, ist,
dass ich Ihnen die Funktion zur doppelten
Überprüfung der Antwort zeigen möchte. Und hier ist die Antwort mit den Details darüber,
warum Profis zu Gemini wechseln. Um auf zu Gemini wechseln. Um die
Double-Check-Response-Funktion zuzugreifen, klicken Sie unten in der Antwort auf das Symbol mit
den drei Punkten Und hier sehen Sie die Antwort auf
Double Check. Diese Funktion verwendet die
Google-Suche, um Inhalte zu finden, die geringfügig ähneln oder von Gemini
generierten Aussagen
geringfügig ähneln oder sich von diesen
unterscheiden Und bitte beachten Sie, dass
diese Funktion speziell zur
Überprüfung von Tatsachenbehauptungen entwickelt wurde Sie wird nicht für Dinge
wie kreatives Schreiben,
Programmieren oder ähnliche Aufgaben angezeigt ,
Programmieren oder ähnliche Aufgaben Gemini begann mit
der Auswertung der Aussagen Und hier sehen wir die
grünen Markierungen die
die Behauptungen von Gemini
bestätigen Und wir können
dieses Fenster sogar erweitern, um
den ausführlichen Artikel zu sehen , Gemini diese Behauptung
bestätigt Das ist eine ziemlich
praktische Funktion. Und jetzt lasst uns technisch werden. Ich habe
während eines Zoom-Interviews für eine Rolle als Produktleiter
ein Video von mir aufgenommen . Dies ist eine einstündige Aufnahme, die eine riesige
Menge an Informationen darstellt. Aus diesem Grund werde ich mich
für das Pro-Modell entscheiden. Aber zuerst
starten wir einen neuen Chat. Hier
entscheide ich mich für P.
Das Pro-Modell wurde mit einer wesentlich
höheren Intelligenzgrenze entwickelt und ist besser darin,
ein kohärentes Verständnis über
die gesamte Stunde des Filmmaterials aufrechtzuerhalten ein kohärentes Verständnis über . Lassen Sie mich also zuerst
das Filmmaterial anhängen. Ich habe hier zehn verschiedene
Videofragmente und reiche auch
meine Anweisungen ein. Ich begann damit, Gemini
eine Rolle als Coach für
Führungskräfte zu geben eine Rolle als Coach für
Führungskräfte Ich habe den Kontext in
Bezug auf das Video bereitgestellt, was ich hier mache,
und das ist meine Aufgabe Mit den spezifischen Fragen , die Gemini mir stellen
soll Ich erwarte von Gemini, dass ich
Informationen
über meine Präsenz,
Kommunikation, Stil und Klarheit,
meine Stärken und Verbesserungsmöglichkeiten erhalte Und ich habe Gemini auch gebeten, die genauen
Zeitstempel für
seine Beobachtungen
anzugeben , damit ich das Fragment, auf das sich Gemini
bezieht, schnell finden
und
es mir selbst erneut ansehen kann Fragment, auf das sich Gemini
bezieht, schnell finden
und
es mir selbst erneut ansehen Beobachten Sie, wie Gemini diese Informationen verarbeitet. Und hier ist das Feedback. Das sind großartige Beobachtungen und Dinge, die ich
definitiv verbessern könnte. Und jetzt lasst uns dieses Feedback nehmen und es in
etwas Nützliches umwandeln. Ich werde Gemini bitten, mein „Erzähl mir
von dir“ -Skript
neu zu schreiben ,
damit es
aussagekräftiger ist und für die Rolle als
Produktleiter, für die ich mich bewerben
werde,
relevanter ist ,
relevanter Rolle als
Produktleiter, für die ich mich bewerben
werde Wenn Sie
wie in unserem aktuellen Beispiel mit Pmdel arbeiten, dauert
die Generierung der Antworten
deutlich länger.
Seien Sie sich dessen Seien Und schließlich ist hier
die neu geschriebene Version meiner Einführung in Erzählen Sie mir
von
sich selbst, sie sieht ziemlich gut aus Aber wenn ich es das nächste Mal in einer echten
Konversation
verwenden würde, würde
ich es natürlich es das nächste Mal in einer echten
Konversation
verwenden würde, vorziehen, einige Dinge zu
ändern um sicherzustellen, dass es mehr nach mir
klingt Tolle Arbeit Gemini. Und einfach so haben
Sie Gemini zu Ihrem persönlichen
Coach gemacht Ich kann mir so viele
Anwendungsfälle für diese Art
von Videofeedback vorstellen Anwendungsfälle für diese Art
von Videofeedback Stellen Sie sich vor, Sie machen eine
28-tägige Yoga-Herausforderung
und benötigen täglich Feedback
darüber, ob Sie sich verbessern oder ob Sie Angst haben
,
in der Öffentlichkeit zu sprechen Sie können sich selbst aufnehmen, . Sie können sich selbst aufnehmen, das Video
zusammen mit Ihren
Präsentationsfolien bei Gemini
einreichen und fragen, zusammen mit Ihren
Präsentationsfolien was
funktioniert hat und was nicht,
was mir aufgefallen ist, als
ich anfing, das
regelmäßig zu tun , ist ein positiver
Nebeneffekt, den ich nicht erwarte Die Tatsache, dass Sie sich
selbst aufnehmen , macht Sie
selbstbewusster. Noch bevor Gemini etwas
sagt, achtest
du mehr
darauf , was du tust
und wie du es tust Aber das ist es, und
das ist wichtig. Nehmen Sie KI-Feedback mit
Vorsicht. Diese Modelle sind
unglaublich leistungsfähig, machen
aber Fehler. In dem
Beispiel, das wir uns gerade angesehen haben, sagte mir
Gemini zum Beispiel, dass ich
die ganze Zeit im Stehen gesessen
habe Nutze also die Erkenntnisse
als Ausgangspunkt,
aber verlasse dich immer auf dich selbst, wenn es
um das endgültige Urteil geht Bitte lass mich in
den Fragen und Antworten zu diesem Video wissen, welche Szenarien
du im nächsten
mit Alcia experimentierst im nächsten
mit Alcia
15. Realität bleiben: Praktische Strategien zur Minimierung von KI-Halluzinationen: Stellen Sie sich vor, Sie
fragen den KI-Assistenten einem aktuellen Nachrichtenereignis
und er zitiert selbstbewusst
einen ausführlichen Artikel, den es eigentlich
nicht
gibt, oder Sie fragen ihn
nach öffentlichen Lebens und
erhalten Antworten, die echte Fakten mit
völlig
erfundenen Details vermischen Das sind keine Bugs oder Pannen. Das nennen wir
Halluzinationen in der KI. Und sie sind eine der größten Herausforderungen bei
der Arbeit mit großen Lassen Sie uns untersuchen, warum
diese Halluzinationen auftreten, wie man sie erkennt
und vor allem, welche praktischen
Techniken Sie
sofort anwenden können , um
genauere und zuverlässigere Antworten zu erhalten Um zu verstehen, warum
diese Fehler passieren, müssen
wir uns ansehen, wie
diese Modelle aufgebaut sind.
Im Gegensatz zu Menschen, die ein Thema wirklich
verstehen, Sprachmodell prognostiziert ein
Sprachmodell das wahrscheinlichste
nächste Wort in einer Sequenz auf der
Grundlage statistischer Muster weil sie so
hilfreich wie möglich sind.
Sie legen oft Wert
darauf, eine vollständige,
flüssige Antwort zu geben, anstatt
zuzugeben, dass sie es sind Wenn ein Modell
auf eine Informationslücke
stößt , anhand
derer es trainiert wurde , oder wenn es auf
eine mehrdeutige Anfrage stößt, kann
es die Lücken füllen, indem Antwort das wahrscheinlichste
Geräusch errät Es ist kein Fehler. Es ist
ein Nebeneffekt, dass die KI einer reibungslosen
Konversation
Vorrang vor verifizierter wir nun verstanden haben,
warum Halluzinationen auftreten,
wollen wir untersuchen, wie wir sie in der Praxis
erkennen können Stellen Sie sich das so vor, als würden
Sie Ihre Fähigkeiten zur Überprüfung von KI-Fakten weiterentwickeln. Sobald Sie die Warnzeichen kennen, sind sie viel
leichter zu erkennen. Hier sind die wichtigsten
Warnzeichen, auf die Sie achten sollten. Zu spezifische Details. Wenn das KI-Modell
sehr spezifische Details liefert, insbesondere über aktuelle
Ereignisse oder Statistiken, sollte
dies zu einer
zusätzlichen Prüfung führen Wenn es beispielsweise exakte Zahlen oder
Statistiken für sehr spezielle oder sich schnell ändernde Ereignisse
liefert , ohne eine Live-Quelle zu nennen, ist
das ein Alarmsignal In diesen Fällen basiert die KI
möglicherweise ähnlichen historischen
Mustern, anstatt über das spezifische
Ereignis zu
berichten, nach dem Sie gefragt haben Perfekt klingende Zitate,
Beispiele oder Statistiken. Wenn Sie eine Antwort bemerken
, die zu perfekt klingt, ist
das ein guter Grund, die Informationen noch
einmal zu überprüfen Und glauben Sie mir,
je mehr Erfahrung
Sie in der Arbeit
mit EI-Tools sammeln, desto besser werden Sie
diese beiden schönen Momente exportieren , um wahr zu
werden. Sie werden einen
Instinkt dafür entwickeln, zu erkennen , wenn sich etwas falsch oder zu
ausgefeilt anfühlt Und das ist Ihr
Ansporn, tiefer zu graben, Fakten zu
verifizieren oder Quellen zu
überprüfen Vertrauen Sie, aber verifizieren Sie. Das ist die goldene Regel bei der Arbeit mit
EI-generierten Inhalten. Inkonsistente Antworten. Wenn Sie dieselbe
Frage mehrmals stellen und jedes
Mal unterschiedliche
spezifische Details erhalten, ist
das ein starker Indikator für
Halluzination Zu definitive Aussagen. wenn KI sehr
definitive
Aussagen zu Themen macht , bei
denen eine gewisse Unsicherheit bestehen sollte, insbesondere in Bezug auf
zukünftige Ereignisse vorsichtig, wenn KI sehr
definitive
Aussagen zu Themen macht, bei
denen eine gewisse Unsicherheit bestehen sollte,
insbesondere in Bezug auf
zukünftige Ereignisse
oder komplexe Themen Zu wissen, warum
Halluzinationen auftreten und wie man sie erkennt,
ist ein guter Anfang Aber wie verhindern wir sie tatsächlich
? Lassen Sie uns vier
nützliche Strategien durchgehen , die Ihnen helfen, jedes Mal zuverlässigere und
genauere Antworten zu
erhalten . Strategie eins. Seien Sie explizit in
Bezug auf Unsicherheit. Anstatt
eine direkte Frage zu stellen , die die KI zum Erraten zwingt, geben Sie ihr eine klare Antwort, indem Sie sie
bitten Genauigkeit
Vorrang vor der Vollständigkeit von Johnsons
Bericht,
anstatt zu schreiben Was waren zum Beispiel die wichtigsten Ergebnisse ? Versuch das. Wenn Sie verifizierten
Zugriff auf Johnsons Bericht haben, teilen
Sie uns bitte die wichtigsten Ergebnisse mit. Wenn Sie sich bei Einzelheiten nicht hundertprozentig
sicher sind, geben Sie bitte ausdrücklich an, welche
Teile Sie nicht verifizieren können. Oder anstatt
alle Unternehmen aufzulisten , die diese Technologie
verwenden, versuchen Sie es anhand der
Daten, an denen Sie geschult wurden. Können Sie verifizierte Beispiele
von Unternehmen auflisten , die
diese Technologie einsetzen? Bitte geben Sie die
spezifischen Quellen oder den Kontext für jedes Beispiel an
und geben Sie an, ob es sich bei einem
dieser Fälle
eher um Spekulationen als um bestätigte Fälle handelt Folgendes, anstatt
die aktuelle Marktgröße für AichatBDS zu ermitteln. Können Sie die
neuesten Schätzungen der Marktgröße
für AichatBDS aus zuverlässigen zitierten Quellen bereitstellen für AichatBDS Bitte geben Sie den genauen
Zeitraum für alle Daten an, die Sie teilen, und lassen Sie mich wissen, wenn Sie keinen Zugriff
auf die neuesten Zahlen haben Beachten Sie, dass jede überarbeitete
Aufforderung ausdrücklich die
Erlaubnis gibt ,
Unsicherheiten und Einschränkungen anzuerkennen. Diese einfache Änderung kann die
Zuverlässigkeit der Antworten
erheblich verbessern. Strategie zwei:
faktengestützte Zitate einfordern. Wenn Sie nach Quellen fragen, suchen
Sie nicht nur nach
einer Linkliste KI kann manchmal
perfekt aussehende Zitate für
Artikel oder Websites generieren perfekt aussehende Zitate , die es nicht gibt Weisen Sie
das Modell stattdessen an, den spezifischen Satz aus
der Quelle zu zitieren spezifischen Satz aus
der ,
der
Ihre Schlussfolgerung stützt Indem Sie das EI zwingen,
seinen Anspruch Wort für Wort
mit einem vorhandenen Text abzugleichen , reduzieren
Sie seine Fähigkeit, Details mitten im Satz
zu erfinden, erheblich Details mitten im Satz
zu erfinden Strategie drei: Verwenden Sie
strukturierte Ausgabeformate. Anfordern strukturierter Ausgaben kann dazu beitragen, Halluzinationen zu minimieren indem das KI-Modell gezwungen wird, Informationen
systematischer zu organisieren Analysieren Sie
diese Verkaufsdaten beispielsweise anhand
der folgenden Struktur:
verifizierte Datenpunkte ,
direkte Zahlen
aus dem Dokument, berechnete Kennzahlen, zeigen Sie Ihre Berechnungen und Interpretationen, eindeutig als
Interpretationen
gekennzeichnet sind,
und Unsicherheiten, Bereiche, in denen Daten unklar Strategie vier. Implementieren Sie die Schritte zur Überprüfung. Nehmen Sie Verifizierungsschritte
direkt in Ihre Eingabeaufforderungen auf, um die Genauigkeit und
Zuverlässigkeit der Antworten zu verbessern Sie können beispielsweise darum bitten,
alle Annahmen aufzulisten , die
während der Analyse getroffen wurden, und Bereiche
hervorzuheben, in denen das Vertrauen
oder die Sicherheit geringer
ist Empfehlen
Sie zusätzliche Informationen, die zur Bestätigung der
Schlussfolgerungen beitragen
könnten. Dieser Ansatz gewährleistet gründlicheres und
transparenteres Ergebnis, sodass
die Qualität der Antworten leichter beurteilt werden kann. Sie jetzt
alle Informationen
über KI-Halluzinationen haben ,
nehmen Sie sich einen Moment Zeit, um eine Ihrer letzten Aufforderungen
zu lesen Wie könnten Sie es mit den Strategien,
die
wir gerade behandelt haben, modifizieren Strategien,
die
wir Denken Sie daran, dass das Ziel nicht darin besteht Halluzinationen vollständig
zu eliminieren, sondern einen
Arbeitsablauf zu schaffen, bei dem die Wahrscheinlichkeit geringer ist, dass sie sich auf Ihre Ergebnisse
auswirken Bitte teilen Sie uns Ihre ursprüngliche
und überarbeitete Aufforderung im Bereich
Fragen und Antworten Und wie immer lassen Sie uns kurz die wichtigsten Punkte dieses Vortrags
zusammenfassen KI-Halluzinationen entstehen, wenn Sprachmodelle
falsche, aber plausibel klingende Informationen erzeugen falsche, aber plausibel klingende Informationen Halluzinationen entstehen,
weil die KI ein selbstbewusster Geschichtenerzähler
ist, der einer reibungslosen
Konversation
Vorrang einräumt, anstatt seine Arbeit anhand eines Lehrbuches oder realer Fakten zu überprüfen. Warnsignalen von Halluzinationen gehören zu spezifische Details, perfekt klingende Zitate,
widersprüchliche Antworten Zu den Warnsignalen von Halluzinationen
gehören zu spezifische Details, perfekt klingende Zitate,
widersprüchliche Antworten und zu definitive Aussagen. Zu den Warnsignalen von Halluzinationen
gehören zu spezifische Details, perfekt klingende Zitate,
widersprüchliche Antworten und zu definitive Aussagen. Gehen Sie in Aufforderungen
explizit auf
Unsicherheit ein, um KI zu ermutigen, ihre Grenzen anzuerkennen. Fordere Zitate und
Argumentation an, um die Ergebnisse der
KI zu verifizieren und Verwenden Sie strukturierte
Ausgabeformate, um
Halluzinationen zu minimieren, indem Sie Informationen systematisch organisieren Integrieren Sie
Bestätigungsschritte in Aufforderungen, z. B. das Hervorheben Unsicherheiten Ordnung. Und das
war's für diesen Vortrag, und wir sehen uns
im nächsten Video.
16. Arbeiten mit Gemini Canvas und Gems: Abschnitt Intro: Willkommen im nächsten Abschnitt. Inzwischen sollten Sie
ein gutes Verständnis dafür haben, wie man mit Zwillingen spricht Wir werden zwar weiter
auf diesen Fundamentaldaten aufbauen,
aber es ist an der Zeit, ein höheres Level zu erreichen Wir gehen über
einfache Hin- und Her-Eingabeaufforderungen
hinaus und erkunden Canvas und Jams Wir beginnen mit
Canvas, einem Arbeitsbereich
, in dem
Sie Text bearbeiten, Versionen
vergleichen und an Ihrer
Arbeit arbeiten können , Versionen
vergleichen und an Ihrer
Arbeit arbeiten Nicht
jedes Mal bei Null anfangen und viel mehr tun. Dann lernen wir Konfitüren. Diese sind wie maßgeschneiderte Spezialisten, die sich an
Ihre spezifischen Regeln erinnern, sodass Sie sie nicht wiederholen
müssen. Wir werden
zwei davon zusammen erstellen, den
Grammatik- und den Rechtschreibprüfer. Dieser Jam fungiert
als professioneller Redakteur
, um von Ihrem Schreiben zu profitieren gleichzeitig Ihre Stimme und
gleichzeitig Ihre Stimme
unverändert zu lassen. Als
KI-Fitnesscoach kann
dieser
Ihre Trainingsvideos ansehen, Ihre Form auf Sicherheit
überprüfen und sogar
individuelle
Motivationshintergründe für Ihr Handy entwerfen individuelle
Motivationshintergründe für Ihr Handy Am Ende dieses Abschnitts werden
Sie nicht nur Aufforderungen
senden Sie werden
Ihr eigenes Expertenteam
zusammenstellen , um Ihre schnellen Gedanken
in fertige Arbeiten
umzusetzen oder
Ihre Routinen zu automatisieren Lass uns anfangen.
17. Willkommen bei Gemini Canvas: Jeder. Willkommen zurück zur ersten Vorlesung
dieses Abschnitts. Bisher haben wir die
Standard-Chat-Oberfläche von Gemini gesehen, wie wir es gewohnt sind, in
verschiedenen Messengern zu arbeiten Es eignet sich hervorragend für kurze Fragen, Feedback
oder
Brainstorming Feedback
oder
Brainstorming Es kann sich jedoch
etwas eingeschränkt anfühlen, wenn Sie an einem
brandneuen Dokument arbeiten Oder ein Inhalt, der mehrfach überarbeitet
werden muss. Das liegt daran, dass Sie, wenn Sie etwas Komplexes
entwerfen, mehr benötigen als ein Hin
- und Her-Gespräch Sie benötigen einen Arbeitsbereich mit
verschiedenen Bearbeitungswerkzeugen. Hier kommt Gemini
Canvas ins Spiel. Stellen Sie sich Gemini Canvas als kollaborativen
Arbeitsbereich vor. In einem Standard-Chat gibt Ihnen
das EIS eine Antwort, und wenn Sie einen Satz
ändern möchten, müssen
Sie normalerweise darum
bitten , dass das Ganze neu
geschrieben wird In Canvas öffnet Gemini
ein Fenster nebeneinander. Auf der linken Seite haben Sie Ihren Chat. Auf der rechten Seite haben Sie
ein lebendes Dokument. Es ist nicht mehr nur ein Chatbot ein Redakteur, der
direkt neben Ihnen sitzt Sie können in den Text klicken, Wörter selbst
ändern oder einen bestimmten
Absatz markieren und es Gemini mitteilen Lass nur diesen Teil durchbohren. Wenn das gut klingt,
warte, bis du das hörst Leinwand eignet sich nicht nur zum Schreiben, sondern auch zum Bauen. Direkt vom Schnittstellenmenü aus können
Sie Webseiten, visuelle Infografiken
für komplexe Daten
und sogar Lernwerkzeuge wie
Quizze und Karteikarten erstellen visuelle Infografiken
für komplexe Daten und sogar Lernwerkzeuge wie
Quizze und Für diejenigen, die lieber zuhören. Es gibt
Audioübersichten, mit denen Sie Ihre
Ergebnisse im Podcast-Stil zusammenfassen Am beeindruckendsten ist vielleicht, dass Sie
funktionale
Mini-Apps erstellen können Beschreiben Sie einfach ein Tool wie
einen Familienrezept-Organizer oder einen persönlichen Kalender und Canvas erstellt den
Code für Sie und führt ihn in Echtzeit Sie müssen nicht
wissen, wie man programmiert. Sie müssen nur beschreiben,
was das Tool
tun soll — ein Prozess, der heute als Vibe-Codierung
bekannt ist Nun, da Canvas so mächtig
ist, kann
es verlockend sein,
direkt mit der Entwicklung von
Apps und Spielen zu direkt mit der Entwicklung von
Apps und Spielen zu Wir werden
dies jedoch Schritt für Schritt tun. In diesem
Abschnitt des Kurses werden
wir uns vorerst ausschließlich
auf die Erstellung von Dokumenten konzentrieren. Am Beispiel eines imaginären
KI-Matratzenherstellers werden
wir sehen, wie Sie den
Canvas-Arbeitsbereich nutzen können, um
in einer flüssigen Sitzung
eine Erzählung zu verfeinern und
Unterstützung und Bildmaterial zu generieren und
Unterstützung und Bildmaterial Sobald wir die Erstellung von
Dokumenten gemeistert haben, werden
wir uns später im Kurs mit den
fortgeschritteneren Funktionen wie interaktiven App-Erstellung und der
interaktiven App-Erstellung und
Rapid Prototyping
befassen In der nächsten Lektion werde
ich Ihnen zeigen, wie Sie die Canvas-Oberfläche
öffnen, und wir werden mit unserem
allerersten gemeinsamen Entwurf beginnen Ich treffe dich in der nächsten.
18. Weiterführende Schritte: Erstellen und Bearbeiten von Dokumenten in Gemini Canvas (Teil 1): Wie in diesem Video versprochen, werden
wir es in die Hand nehmen Wir werden untersuchen, wie man im Canvas-Arbeitsbereich
navigiert, wie man
mit der Funktion „Frag Gemini“ gezielte Bearbeitungen durchführt und
wir werden bestimmte Teile des Dokuments ändern, wir werden bestimmte Teile des Dokuments ändern ohne
den gesamten Entwurf
neu schreiben Wir werden uns auch die Schnellaktionen
ansehen denen
sich Dinge wie Ton und Länge
des Dokuments ändern Schließlich werden wir multimodal werden. Wir werden die
Marke mit von
EI generierten Logos
und Produktbildern zum Leben erwecken . Wechseln wir für die Demo zu
Gemini. Beginnen wir mit dem Wechsel in
den Canvas-Modus. Dazu klicke ich auf Tools und wähle Canvas
im Popup-Fenster. Lassen Sie uns auch das
Modell des Denkens ändern. Und ich werde mit einer
allgemeinen Konversationsaufforderung beginnen. Hier ist, was ich eingeben werde. Ich habe Gemini einen Überblick darüber gegeben, was ich tun werde Ich habe die Aufgabe gestellt. Ich sagte, dass ich eine kurze
Beschreibung des Unternehmens
und des neuen Produkts benötige , das dieses
Unternehmen auf den Markt bringen wird. Ich habe auch
Details zum Stil angegeben. Ich möchte, dass Gemini abholt. Lass uns die Eingabetaste drücken und sehen,
was Gemini schreiben wird. Es öffnet den
Canvas-Arbeitsbereich mit dem Chat auf der linken Seite und dem Text auf der rechten Seite Wir sehen hier, dass es
die
Unternehmensbeschreibung mit Namen,
Motor und einem kurzen
Überblick über die Aktivitäten dieses Unternehmens erstellt die
Unternehmensbeschreibung mit Namen, Motor und einem kurzen
Überblick über hat. Als Nächstes haben wir die Informationen
über das Produkt, einschließlich der wichtigsten
Merkmale der Matratze, und es wurden sogar
einige Brainstorming-Ziele
für meine bevorstehende Demo vorgeschlagen einige Brainstorming-Ziele
für meine Perfekt. Lassen Sie uns
diesen Arbeitsbereich auf der rechten Seite erkunden. Oben im Arbeitsbereich können
Sie zunächst einige Bearbeitungswerkzeuge
sehen. Sie können beispielsweise den
Überschriftenstil für Ihren Text ändern. Sie können hier eine
Aufzählung oder eine Nummer zur Liste
oder sogar einige Formeln hinzufügen . Wenn Sie möchten, können Sie diese Seite
ausdrucken. ein PDF-Dokument, und
hier gibt es noch andere Funktionen, die wir etwas später in
diesem und den
folgenden Tutorials
untersuchen werden etwas später in
diesem und den
folgenden Tutorials
untersuchen . Die wahre Magie in diesem Arbeitsbereich ist die Funktion „Frag Gemini“ Nehmen wir an, Sie
möchten an einem Teil Ihres Textes eine Änderung
vornehmen Teil Ihres Textes eine Und anstatt im Chat nach einem
ganz neuen Entwurf zu fragen, können
Sie einfach
den Teil markieren, den Sie
bearbeiten möchten, und dann
Ihre Anfrage an Gemini schreiben Ich möchte zum Beispiel den Standort
des Firmenbüros
ändern Also was ich tun werde, ich
werde diesen Text hervorheben und nur
meine Anweisungen für die Änderung beifügen , die Gemini vornehmen soll Siehst du, Gemini hat die Änderung vorgenommen und
diesen neuen Text direkt
in das Dokument aufgenommen diesen neuen Text direkt
in das Und in der linken Seitenleiste sehen
wir, dass sie
den Informationstext und
sogar eine Beschreibung
dieser Änderung enthielt den Informationstext und sogar eine Beschreibung
dieser Änderung Lassen Sie mich diesen
Text durchblättern und sehen, welche Änderungen ich zusätzlich zum Bürostandort
vornehmen möchte zusätzlich zum Bürostandort
vornehmen M Ich kann weiter an diesem Dokument
arbeiten
und hin und her gehen, einschließlich der Änderungen,
bis
ich mit dem Text vollständig
zufrieden Ehrlich gesagt verwende ich Canvas für die Erstellung
von
Dokumenten aufgrund dieser Funktion „Frag Gemini Wie in den meisten Fällen muss
ich einen ganz
bestimmten Teil eines Dokuments anpassen Folgendes habe ich jedoch nach wochenlangen
Experimenten
entdeckt Da sich Gemini auf
diesen bestimmten Teil
eines Dokuments konzentriert , wird manchmal das Gesamtbild
übersehen Mir sind Fälle aufgefallen, in denen es Ausdrücke
wiederholt, die
in anderen Teilen
des Dokuments verwendet wurden, oder Begriffe verwendet, die erst später
eingeführt wurden Geben Sie Ihrer Arbeit also auf jeden Fall einen kurzen Überblick, um
sicherzustellen, dass alles zusammenpasst Und das war's für den ersten
Teil dieses Tutorials. Und wir sehen uns
im zweiten.
19. Weiterführende Schritte: Erstellen und Bearbeiten von Dokumenten in Gemini Canvas (Teil 2): Willkommen zum zweiten
Teil des Tutorials, in
dem wir Gemini
Canvas für die Erstellung von Dokumenten untersuchen Abgesehen von Ask Gemini
gibt es schnelle
Aktionen, die Sie möglicherweise nützlich
finden, um
Änderungen an Ihrem Text vorzunehmen Die erste schnelle Aktion
ist die Änderung der Länge. Dies ist ideal, wenn Sie einen Abschnitt
schnell
mit mehr Details erweitern oder ihn
zu einer kurzen Zusammenfassung verkleinern müssen Nehmen wir an, wir möchten
die Länge unseres Textes ändern Ich klicke auf diese Schaltfläche
und muss dann die Länge
wählen, die ich
für meinen neuen Text haben möchte Nehmen wir an, ich möchte, dass er
länger als der aktuelle Text ist, und warten wir auf die Änderungen. Und Gemini hat diesen Text
erweitert. Sie sehen, dass
der neue Text hier blau hervorgehoben wurde der neue Text hier blau Kommen wir zurück zu den Aktionsschaltflächen der
Woche. Und die zweite dient dazu,
den Ton zu ändern. Falls Sie also professioneller oder
andererseits etwas
gesprächiger klingen möchten , ist
dies die Schaltfläche, mit der Sie die Atmosphäre Ihres Schreibens mit
buchstäblich nur einem Klick ändern können Wählen wir „Ton ändern“, und ich kann von formell zu
sehr formell oder lässig
und sehr lässig wechseln sehr formell oder lässig
und sehr lässig Ehrlich gesagt bin ich mit dem
aktuellen Ton für den Text einverstanden, aber
lassen Sie uns ihn für diese Demo zum
Beispiel etwas formeller
gestalten für diese Demo zum
Beispiel etwas formeller
gestalten Wir sehen, dass Gemini hier fast das gesamte
Textfragment
geändert hat fast das gesamte
Textfragment
geändert Ich würde es vorziehen,
zur vorherigen Version zurückzukehren. Aber ich denke, Sie haben
eine Vorstellung davon, was diese Option zum Ändern des Tons bewirken kann. Ich kehre also zur vorherigen
Version des Dokuments zurück. Und schließlich gibt es auch eine
Funktion zum Vorschlagen von Änderungen. Das ist, als hätte man
einen Schreibkörper. Gemini gibt Ihnen Feedback
und zeigt Ihnen, wie Sie Ihr Schreiben verbessern können, ohne Ihren
Originaltext sofort zu
ändern Lassen Sie uns auch diese Funktion
ausprobieren. In Ordnung, großartig Wir sehen, dass Gemini
einige Änderungen zusammen mit
den Informationen
über den Grund
für diese Änderung hinzugefügt hat einige Änderungen zusammen mit
den Informationen
über den Grund
für diese Wenn ich mit
all diesen Änderungen einverstanden bin, kann
ich sie alle anwenden Wenn Ihnen der
Vorschlag von Gemini nicht gefällt und Sie zur vorherigen Version
des Dokuments zurückkehren
möchten , können
Sie dies Gemini
direkt hier im Chat mitteilen Cool.
Klicken wir also auf Bewerben für die verbleibenden Vorschläge,
damit wir sie in der neuen
Version des Dokuments
beibehalten können . Ordnung. Lass uns die Demo
fortsetzen. Und als nächsten Schritt möchte
ich einige
Grafiken erstellen, um Ihnen
die multimodalen
Fähigkeiten von Gemini zu zeigen die multimodalen
Fähigkeiten von Kurs werden wir einen
eigenen Abschnitt zur Später im Kurs werden wir einen
eigenen Abschnitt zur Erstellung
visueller Inhalte Also werde ich vorerst nur
eine sehr kurze, unkomplizierte Eingabeaufforderung eingeben. Und lassen Sie mich Andrew drücken
, um die Ergebnisse zu sehen. Und hier ist das erste Bild. Erstaunlich, dass Gemini
sogar
den Produktnamen hier auf
einer Seite der Matratze angegeben den Produktnamen hier auf
einer Seite der Matratze Gemini sagt
mir auch, dass es jeweils nur ein Bild
erzeugen kann ein Bild
erzeugen Es fragt mich, ob
ich mit dem Firmenlogo fortfahren möchte Gemini wird sehr gut
darin , Texte
in die Bilder aufzunehmen Und lassen Sie uns nach
mehreren Bildern für
Funktionen fragen mehreren Bildern für . Großartig Und Sie sehen, warum es
wichtig ist, Bilder in
demselben Chat zu erstellen , in dem wir den Originaltext
erstellt haben. Gemini verwendet den Kontext aus den vorherigen Konversationen
, um das Bild zu erstellen Sie sehen, dass
Informationen über einen Winkel von
drei Grad benötigt
wurden, obwohl dieser Winkel für mich
etwas größer aussieht .
Aber das ist in Ordnung. Wir können dies durch
Iterationen, die an diesem Bild
arbeiten, anpassen Iterationen, die an diesem Bild
arbeiten Hier war auch der Name der
Matratze enthalten. Lassen Sie uns das vierte
Bild erstellen. Das ist großartig. siehst du in der Beschreibung, wir haben die Information,
dass diese Funktion eine saubere
Luftkuppel über den Schlafenden
erzeugt, und genau das
sehen wir hier auf dem
Bild. Unglaublich. Und lass uns den Text überprüfen. Optimale Luftfeuchtigkeit, Luftqualität. Ja, und der Text ist korrekt. Ich sehe hier keine Fehler. Ordnung, lassen Sie uns dieses Tutorial
beenden bevor es zu lang wird Wir werden in unserem nächsten Video weiter mit dem Text
und den Bildern
arbeiten in unserem nächsten Video weiter mit dem Text
und den Bildern
20. Weiterführende Schritte: Verwandeln eines Gemini-Entwurfs in ein poliertes PDF mit Gamma: Wir haben jetzt die Hintergrundgeschichte unserer
Marke, Produktmerkmale und die Bilder in Gemini
organisiert Stellen Sie sich das als unser
Entwurfsstudio vor. Der Raum für
Kerndenken und Schreiben. Unser Arbeitsentwurf
ist jedoch noch nicht fertig und kann geliefert werden. Wenn Sie dies
einem Manager oder Kunden als
professionellen Bericht vorlegen müssen , müssen
wir
diesen Inhalt in
ein spezielles Designtool
wie Canva oder Gamma App übertragen ein spezielles Designtool
wie Canva oder Gamma Sie denken vielleicht,
kann ich nicht einfach
Gemini bitten , das PDF
für mich zu generieren? Gute Frage Und ja, das war auch meine
Absicht,
als ich die Aufgabe bekam, das endgültige PDF
zu erstellen. So geht Gemini damit um. Wenn Sie versuchen, ein
PDF in Canvas zu erstellen, erhalten
Sie das
endgültige Dokument nicht Das Canvas-Tool wurde für die Live-Bearbeitung und Zusammenarbeit entwickelt,
nicht für die Veröffentlichung. Da es in
einem privaten Arbeitsbereich arbeitet, kann
es Ihre
lokalen Bilddateien nicht sehen , um sie in das Dokument aufzunehmen. Wenn Sie versuchen, von hier aus zu exportieren, werden
Sie eine Datei mit
leeren Platzhaltern an der Stelle sehen , an der sich
Ihre Bilder befinden sollten Natürlich kannst du es auch
mit einem normalen Chat versuchen. Es ist funktionaler. Es kann Dateien im
Hintergrund generieren , um
Ihnen ein herunterladbares PDF zur Verfügung zu stellen. Es fehlen jedoch die
Layoutkontrolle und der Feinschliff, die für eine
professionelle Präsentation erforderlich sind. Hier ist das PDF, das Gemini für mich
erstellt hat. Es ist ein guter Anfang, aber es erforderte eine
umfangreiche manuelle Formatierung, um richtig auszusehen Um also unsere Präsentation
fertig zu stellen, wo der Text korrekt um die Bilder
fließt
und das Branding einheitlich ist, wechseln
wir vom
Entwurfsstudio zum Designstudio. Im nächsten Tutorial werde
ich die Gamma-App verwenden, um dies zu demonstrieren. Es ist seit fast einem Jahr mein
Hauptwerkzeug und ich verwende es für
fast alle meine Designarbeiten. Dieselben
Prinzipien gelten jedoch andere ähnliche Plattformen
wie Canva oder Adobe Gehen wir zurück zu Gemini und bereiten wir unsere
Inhalte für den Lassen Sie uns die
Texte und Bilder unserer Assets in die Gamma-App übertragen. Ich beginne damit, den Text zu kopieren. Dazu klicke ich auf die Schaltfläche
Teilen und Exportieren. Und von hier aus
wähle ich Inhalte kopieren. Und ich habe bereits
die vier Bilder heruntergeladen , die wir
im vorherigen Tutorial generiert haben Also ist alles bereit
für uns, nach Gamma zu wechseln. Lassen Sie uns die Gamma-App öffnen. Hier ist die Gamma-Hauptseite. Der zentrale Teil ist
das Inhaltsraster. In diesem Bereich werden unsere
Projekte, auch Gammas genannt, angezeigt. In der oberen Leiste können Sie neue Dokumente
erstellen. Auf der linken Seite haben
wir Vorlagen. Hier können wir auf
voreingestellte Layouts zugreifen , um unser
Präsentationsdesign zu beschleunigen. Wir haben so nützliche
Dinge wie MAI-Bilder. Hier können wir Bilder ansehen und
verwenden, die wir mit dem in Gammas
integrierten EI-Bildtool
generiert haben mit dem in Gammas
integrierten EI-Bildtool
generiert Wir können auch Ordner erstellen,
um
unsere Materialien nach bestimmten
Themen oder Themen zu trennen unsere Materialien nach bestimmten
Themen oder Themen zu Lassen Sie uns also gleich mit der
Erstellung einer PDF-Datei beginnen. Ich wähle Create New with AI. Und hier haben wir
verschiedene Optionen. Da wir bereits einen Text haben
, den ich von Gemini kopiert
habe, werde ich diese Option zum
Einfügen in Text wählen Und hier werde ich
den Text von Gemini einfügen. Als Nächstes haben wir
verschiedene Optionen,
was die Gamma-App mit unseren Inhalten
machen kann Und es ist wichtig, dass wir uns dafür entscheiden, genau diesen Text beizubehalten. Das bedeutet, dass Gamma keine Änderungen
an unserem Entwurf vornehmen wird. Dies ist die
effektivste Methode für unser Beispiel, da wir damit Gemini
für die schwere Arbeit des
Denkens und Entwurfs verwenden
und dann
Gamma verwenden
können für die schwere Arbeit des
Denkens und Entwurfs verwenden
und dann
Gamma verwenden , um
das endgültige Dokument zu formatieren und zu verschönern Ich wähle hier die Option Weiter zur Eingabeaufforderung
für den Editor aus. Hier können wir verschiedene
Themen für unsere Präsentation auswählen. Wählen wir dieses aus
und klicken Sie auf Thema auswählen. Bevor wir auf Generieren klicken, beachten Sie die beiden Modi oben Freiform und Karte für Karte. Lassen Sie mich kurz
den Unterschied erklären. Wenn Sie Karte für Karte auswählen, teilt
Gamma Ihren Inhalt automatisch in separate nummerierte Folien auf. Eine Idee pro Karte, aber Sie können
die Karten immer noch neu anordnen oder neue hinzufügen Es ist perfekt für Präsentationen. Bei Reform bleibt alles einem fortlaufenden Dokument, das eher einem Bericht
als einem Folienstapel ähnelt. Derselbe Inhalt, aber
es wird von oben nach
unten gelesen , ohne dass es
zwischen den Abschnitten zu Dadurch haben Sie mehr Kontrolle
über das Layout und den Ablauf. Es eignet sich hervorragend für
Dokumente oder Berichte. Für unsere Demo werde ich Freeform
wählen, weil ich möchte, dass Text und Bilder auf natürliche Weise
zusammenfließen Und lass uns auf Generieren klicken. Gamma beginnt mit der
Erstellung unserer Folien. Zunächst bitte
ich Gamma, mir
mehrere andere Layouts vorzuschlagen , damit ich
das Standardlayout mit
anderen Vorschlägen vergleichen kann . Dazu klicke ich auf „Mit Agent
bearbeiten“ und
wähle von hier aus „Neues Layout testen“. Lassen Sie uns noch einmal nachschauen
, ob es
etwas Besseres als unsere
erste Standardoption gibt. Ich glaube, ich
werde diesen wählen. Mir gefällt dieses
Hintergrundbild hier. Gehen wir zur nächsten Folie über. Ich werde unser
Logo-Bild anstelle dieses einbinden. Um das Bild zu ändern,
klicke ich auf das Bild. Als Nächstes gehe ich zu Bild bearbeiten. Und von hier aus wähle ich
Bild-Upload oder URL. Ich habe meine Bilder auf meinem lokalen
Laufwerk. Und los geht's. Das ist unser erstes Bild. Lass es uns anhängen. Perfekt.
Gehen wir zur dritten Folie über. In Ordnung, wir sind bereit zu gehen. Lassen Sie uns den letzten Check
machen und einen kurzen Blick auf
all unsere Folien werfen. Um diese Datei zu exportieren, klicken
wir auf das Symbol mit den drei Punkten. Hier wählen wir Exportieren und ich werde nach PDF exportieren. Lassen Sie uns die Datei
sofort öffnen und los geht's. Sieht cool aus. Das ist also meine bevorzugte
Arbeitsweise, wenn es darum geht, neue Dokumente zu erstellen. Ich überlasse Gemini den Teil des
kreativen Denkens, und dann lasse ich mein
bevorzugtes Designtool wie Gamma dafür sorgen, dass
es gut aussieht Ich hoffe, dass Ihnen dieses Tutorial
gefallen hat, und wie immer
sehen wir uns im nächsten
21. Was sind Gemini Gems und warum brauchen wir sie?: Jeder, wenn Sie anfangen, Gemini regelmäßig zu
verwenden, Sie schnell fest,
dass es
bestimmte Dinge gibt , für die Sie
es immer wieder verwenden, sei es für Brainstorming, Feedback oder die
Generierung neuer Inhalte. Möglicherweise
müssen Sie dieselben Eingabeaufforderungen eingeben und
immer wieder denselben Kontext angeben,
was sich dieselben Eingabeaufforderungen eingeben und ein bisschen repetitiv
anfühlen kann, ein bisschen repetitiv
anfühlen kann stellen
Sie schnell fest,
dass es
bestimmte Dinge gibt, für die Sie
es immer wieder verwenden,
sei es für Brainstorming, Feedback oder die
Generierung neuer Inhalte. Möglicherweise
müssen Sie dieselben Eingabeaufforderungen eingeben und
immer wieder denselben Kontext angeben,
was sich ein bisschen repetitiv
anfühlen kann, wie Ihr eigener digitaler Nun, heute
beenden wir diesen Zyklus. Wir werden
eine Funktion untersuchen , mit der
Sie
diese sich wiederholenden
Anweisungen zusammenfassen und sie
in Ihr Team von KI-Experten
oder persönlichen Assistenten umwandeln können diese sich wiederholenden
Anweisungen zusammenfassen und sie
in Ihr Team von KI-Experten
oder persönlichen Assistenten umwandeln in Ihr Team von KI-Experten
oder persönlichen Assistenten Sie werden Gemini Gems genannt. Und nein, wir sprechen hier nicht
über Diamanten. Aber wenn Sie einmal gesehen haben, wie
viel Zeit Sie sparen, denken
Sie vielleicht, dass sie
genauso wertvoll sind. Was genau ist ein Jam Stellen Sie sich diese als
maßgeschneiderte Versionen von Gemini vor, die Ihnen helfen,
sich wiederholende Aufgaben zu bewältigen oder tiefes
Fachwissen in bestimmten Bereichen zu erwerben Wenn Sie mit Jam chatten, erinnert sich
Gemini
automatisch an Ihre
Ziele und Richtlinien , sodass Sie sich nicht
bei jeder Aufforderung wiederholen Während also ein normaler Zwilling wie ein Bibliothekar
ist, der weiß, wo
sich alles befindet, ist ein Edelstein wie ein
engagierter Er
kennt sich nicht nur mit einem Thema aus. Es folgt Ihren spezifischen Regeln
, um Arbeit für Sie zu verrichten. Es gibt drei Arten
von Konfitüren, vorgefertigte Marmeladen. Dies sind sofort einsatzbereite
Tools, die von Google entwickelt wurden. Sie können
ihre zugrunde liegende Logik nicht sehen oder bearbeiten. Du kannst sie nur an deine
Seitenleiste anheften, um schnell darauf zugreifen zu können. Sie haben oft einzigartige
Benutzeroberflächen wie das zehnseitige Märchenbuch-Layout , das normale Jams
einfach nicht nachahmen können Benutzerdefinierte Jams. Diese stehen im Mittelpunkt
unserer nächsten Tutorials, da
Sie sie selbst erstellen. Sie stellen die
Anweisungen zur Verfügung und können
bis zu zehn persönliche Dateien hochladen bis zu zehn persönliche Dateien , die als
Wissensdatenbank von Jams dienen. Das ist der Unterschied zwischen
einem allgemeinen Assistenten und einem engagierten Experten, der
speziell auf Ihre
Daten und Ihre Ziele zugeschnitten ist. Konfitüren in Opal. Ople ist ein experimentelles Projekt , das KI über
einfache Chatfenster hinaus Diese Drums sind
interaktive Mini-Apps , die einem bestimmten Workflow folgen. Ihr herausragendes Merkmal ist
die Fähigkeit, sie zu remixen. Sie können ein vorgefertigtes
Tool wie einen Modestylist und dessen interne Schritte ändern, um etwas Neues
zu kreieren Sie sind sehr visuell
und können gleichzeitig Text,
Bilder und Videos generieren gleichzeitig Text,
Bilder und Videos Wir werden
diese Dämme in den späteren
Abschnitten des Kurses erkunden diese Dämme in den späteren
Abschnitten des Kurses Da wir bereits mit Canvas
gearbeitet haben, haben
Sie jetzt vielleicht eine
logische Frage Wie unterscheidet sich ein Jam eigentlich? Der Schlüssel ist, sich Canvas
als Ihren gemeinsamen Arbeitsbereich vorzustellen. Es ist der kollaborative
Schreibtisch, an
dem Sie und das EI Seite an Seite an
langen Dokumenten oder Code arbeiten. Edelsteine hingegen sind deine taktischen Spezialisten. Sie verwenden eine Trommel, um
den ersten Entwurf zu erstellen, z. B. eine
spezielle erste Version auf der
Grundlage Ihrer hochgeladenen Daten zu generieren , und geben diese Arbeit
dann an Canvas weiter, um sie zu verfeinern
und zu polieren. Einer ist der Spezialist, Sie für den ersten Output beauftragen. Der andere ist der Schreibtisch, an
dem das Projekt abgeschlossen wird. Natürlich können Sie das Schlagzeug
auch
ganz alleine
für bestimmte Aufgaben verwenden , und das bringt uns zu unserer
nächsten Folgevorlesung. Aber bevor wir anfangen, mit Schlagzeug zu
arbeiten, wollen wir kurz zusammenfassen, was
wir hier gelernt haben Ordnung. Und das
war's für dieses Video. Ich treffe dich im nächsten.
22. Weiterverfolgung: Erstellen eines Juwels zur Grammatikprüfung: Alle zusammen, und willkommen zu unserem ersten Tutorial zu Gemini
Gems Heute werde ich Ihnen
zeigen, wie Sie
einen individuellen Experten für das
Korrekturlesen Ihrer Texte zusammenstellen können, egal ob Sie Landingpages,
Produktbeschreibungen,
schnelle E-Mails
oder andere Texte
verfassen Produktbeschreibungen,
schnelle E-Mails oder andere Es ist, als hätten Sie ein
zweites Paar Augen, das Ihnen bei jedem Wort, das Sie teilen,
absolutes Vertrauen gibt Lass uns Gemini öffnen
, um diesen Jam zu erstellen. Wir beginnen mit
einem Klick auf Jams. In der Seitenleiste gehen wir hier
zum Jam Manager,
dem Abschnitt, in dem wir benutzerdefinierte Gems
erstellen Und hier klicke ich auf New Jam. Lassen Sie uns zunächst
den Namen für unseren Jam angeben. Hier ist meine
Edelsteinbeschreibung. Als Nächstes habe ich
meine Anweisungen beigefügt. Dies ist bei weitem der
wichtigste Teil Ihres Edelsteins. Ich habe eine Rollenbeschreibung hinzugefügt und
gesagt, dass Sie ein
Experte darin sind, Grammatik,
Rechtschreibung und Zeichensetzung in
englischen Texten zu überprüfen Rechtschreibung und Zeichensetzung in und sie zu korrigieren, falls Sie auf Fehler stoßen Dann gebe ich eine
Zielgruppenbeschreibung wenn Sie weitermachen und dieselbe Art von Edelstein
erstellen, können
Sie die
Zielgruppe auf etwas ändern, das für Ihren
Anwendungsfall und Ihre Domäne
relevanter ist Ihren
Anwendungsfall und Ihre Domäne
relevanter Als Nächstes haben wir die Grundregeln,
gefolgt von den Informationen darüber, nach welcher Ausgabe wir
suchen , und wir haben auch
eine Startaufforderung Sie sehen, dass ich
Hashtags im Anweisungstext verwende. Diese dienen als Abschnittsteiler , die ein sauberes Grundgerüst
für Ihre Anweisungen bilden Sie sorgen dafür, dass das Gehirn von Gems
besser organisiert
wird, sodass die KI weiß, wo eine Regel
endet und die nächste beginnt Kehren wir nun zum
Regelwerk zurück und besprechen wir es. Wie komme ich eigentlich
auf diese Liste? Ich empfehle dringend, die
Aufgabe, die Sie automatisieren möchten,
drei- bis fünfmal
manuell zu erledigen drei- bis fünfmal , bevor Sie überhaupt
versuchen, den Jam zu erstellen. Wenn Sie direkt
in die Anweisungen einsteigen, kann
das einschüchternd wirken Jede Regel in dieser Liste existiert, weil es sich um eine
bestimmte Präferenz handelt Ich habe über Wochen hinweg festgestellt, dass ich die KI
manuell dazu aufgefordert habe. Möglicherweise stellen Sie auch fest, dass ich Wörter aus dem CUP-Protokoll
verwende, wie zum Beispiel hier. Es gibt keine technischen
Voraussetzungen, um sie zu verwenden. Gemini ist sehr anspruchsvoll. Es versteht Kleinbuchstaben genauso gut wie Großbuchstaben Aber ich habe festgestellt, dass es immer noch hilfreich ist,
sie zu verwenden. Stellen Sie sich diese Worte
als Machtwörter vor. Wir können sie verwenden, um die Regeln hervorzuheben,
die nicht verhandelbar sind, sodass die KI genau weiß, was ein Muss und was ein Vielleicht
ist In Ordnung, lassen Sie uns als Nächstes weitermachen. Ich bin vorerst mit diesen
Anweisungen einverstanden, obwohl wir jederzeit zu dieser Liste
zurückkehren können,
nachdem wir diesen Jam erstellt
und weiter bearbeitet Wir können auch
ein Standardtool wählen. Dieses Tool wird
ausgewählt, wenn Sie die neue Konversation
mit dem Jam
beginnen. Ich wähle Canvas
als Standardwerkzeug. Anstatt eine chaotische
Chat-Konversation zu führen, wird
Ihr gerichteter Text in
einem übersichtlichen Seitenbereich angezeigt, der perfekt formatiert ist und sofort
zum Kopieren bereit ist Sie können der Wissensdatenbank auch Dateien
hinzufügen, wenn Sie möchten, dass Ihr Jam auf externe Quellen
verweist. Bei der Vorbereitung der Antwort siehst
du, dass wir hier
Dateien aus verschiedenen
Quellen hochladen können . Aber für dieses spezielle Beispiel lasse
ich es leer. Und wir sind bereit. Also lasst uns den Morgen retten. Ich klicke auf die Schaltfläche Speichern. Und wir können unseren neuen Chat starten. Hier ist der Text, den Gemini überprüfen soll. Ich habe hier mit Absicht mehrere
Grammatikfehler gemacht. Mal sehen, ob es sie finden und diesen Entwurf
korrigieren kann . Es öffnet eine Leinwand
mit unserem neuen Text. Sieht für mich toll aus. Und denken Sie daran, dass Sie
diese Canvas-Oberfläche verwenden können , um
einige schnelle Änderungen an diesem Text vorzunehmen , falls
Sie das Gefühl haben,
dass Sie hier einige Änderungen vornehmen möchten Lassen Sie uns
zum Beispiel „
Abgleichen“ hervorheben und nach
Alternativen fragen . Wenn wir mit diesen Änderungen einverstanden
sind, können
wir auf „
Teilen und Exportieren“ klicken, „Inhalt kopieren“
auswählen oder diesen Text direkt exportieren
zu unseren Google Docs Lassen Sie mich zu
unserem JAM zurückkehren. Sie sehen, wir haben ihn in der Edelsteinliste hier in der linken Seitenleiste. Eines ist mir aufgefallen, hier
gibt es keinen
Gesprächsstarter. Als ich
diese AM-Schnittstelle geöffnet habe, war
mir nicht ganz klar, was ich hier tun soll? Ich habe einige Nachforschungen angestellt und
diesen Artikel mit
genau derselben Frage gefunden . Es stellte sich heraus, dass diese
Gesprächsstarter derzeit nicht von Gems
unterstützt Es gibt auch eine
Problemumgehung, die wir ausprobieren können. In dem Artikel heißt es, dass Sie Starteraufforderungen wie
diese
simulieren können Starteraufforderungen wie
diese
simulieren , indem Sie Ihrem Jam eine zusätzliche
Beschreibung hinzufügen Richtig, lassen Sie uns versuchen, ein
Beispiel für
einen Gesprächsstarter hinzuzufügen,
um zu sehen, ob das hilft Ich kehre zu meinem Jam zurück. Wenn ich auf die
drei Punkte klicke, CN, kann
ich die Option Bearbeiten wählen und wir können hier alle gewünschten
Änderungen vornehmen. Lassen Sie mich dieses Beispiel einfach unter die aktuelle Version
der Anleitung einfügen. Und was wir hier auch tun können,
abgesehen davon, dass wir ein
Beispiel für unsere Starter-Eingabeaufforderung hinzufügen, können
wir diesen
magischen Knopf verwenden, damit Gemini unsere
Anweisungen neu schreibt und verbessert Lass uns das ausprobieren. Vielleicht würde es helfen. Ich sehe, dass Gemini
unser Beispiel für die
Starter-Eingabeaufforderung entfernt hat unser Beispiel für die
Starter-Eingabeaufforderung Ich entschied mich dafür, die Regel Nummer sechs beizufügen und Gemini zu
bitten, die Konversation immer mit der
folgenden Starteraufforderung zu beginnen die Konversation immer mit der
folgenden Starteraufforderung Mal sehen, ob das funktioniert. Also werde ich
meine Edelstein-Anweisungen aktualisieren, sie
speichern und mit dem Testen beginnen. Als ich meinen aktualisierten Jam geöffnet
habe, habe ich hier immer noch keinen
Gesprächsstarter. Leider waren alle meine
anderen Experimente mit definierten Jams-Anweisungen zum Hinzufügen des Konversationsstarters
erfolglos. Vor diesem Hintergrund definieren wir die
Jam-Beschreibung, um
Informationen darüber zu erhalten, was ein Benutzer tun
muss, um
die Konversation zu beginnen. Kehren wir dazu zur JAMS-Bearbeitungsoberfläche zurück. Ich habe beigefügt, Ihren
Text einzureichen, um loszulegen. Text am Ende
der Jam-Beschreibung Ich werde ihn aktualisieren und ihn erneut testen. Unsere Anleitung ist hier, und lassen Sie uns zur Abwechslung etwas
anderes einreichen. Ich habe dieses Fragment. Mal sehen, wie Gemini damit umgehen
wird. Und wenn mir dieser Jam zusagt und ich ihn mit
meinen Freunden oder Kollegen teilen möchte, kann
ich auf die
Schaltfläche Teilen klicken und Teilen wählen. Jim und ich werden einen Link erstellen. Ich kann es kopieren und
dann verschicken. Ich hinterlasse den Link zu diesem
Jam in den Ressourcen für dieses Video, falls
du es testen möchtest. Und ich werde dich
im nächsten Tutorial treffen dem wir
den Personal Coach Jam bauen
23. Weiterlesen: Ein Juwel für Fitnesstrainer aufbauen (Teil 1): Lassen Sie uns nun einen Jam bauen
, der mit Video funktioniert. Nehmen wir an, ich mache eine
28-Tage-App-Workout-Herausforderung online
und möchte wissen, ob ich mich
tatsächlich von Tag zu Tag verbessere. Ich werde mich selbst bei
den täglichen Übungen aufzeichnen und
meinen KI-Fitnesstrainer zur Vorsicht um Feedback bitten , wie wir bereits besprochen haben. Die KI ist
zwar ein guter Partner, Die KI ist
zwar ein guter Partner um deine
Bewegung und Form zu verfolgen, sie ist kein medizinischer Experte. Konsultieren Sie immer
den
Arzt, bevor Sie mit dem neuen Fitnessprogramm beginnen. Dieses Tool dient dem Coaching und dem Fortschritt, nicht der
medizinischen Beratung. Okay, lassen Sie uns Gemini öffnen,
um mit der Demo zu beginnen. Lass uns einen neuen Jem erstellen. Ich erweitere dieses Menü. Geh zu Jams. Hier sehen wir Marmeladen, die von Labors hergestellt wurden. Ich scrolle runter
zu Jam Manager. Ich habe die Grammatik
- und Rechtschreibprüfung
Jam bereits hier in
der Liste meiner Edelsteine sichtbar Und lassen Sie mich vorerst einen neuen
erstellen. Ich klicke auf New Gem. Lassen Sie uns den Namen, die Beschreibung und
die
Anweisungen für
unseren personalisierten KI-Coach
Jam angeben Beschreibung und
die
Anweisungen für unseren personalisierten KI-Coach . Ich habe diese Beschreibung beigefügt. Dieser Jam analysiert
deine Trainingsvideos um detailliertes
Leistungsfeedback zu geben, und erstellt benutzerdefinierte vertikale Motivationshintergründe für dein
Handy , um dich immer wieder zu inspirieren Und hier sind meine Anweisungen. Also habe ich wie immer
mit der Beschreibung der Rolle angefangen. Ich möchte, dass dieser Jam spielt. In unserem Fall wollte ich ein
professioneller Fitnesstrainer werden. Dann habe ich eine
Aufgabe für diese Marmelade hinzugefügt. Wir fordern Gemini
auf, unsere Trainingsvideos zu
analysieren und nach Hinweisen
wie Cin oder Domin zu suchen . Ich habe auch
beschrieben, dass ich möchte, dass
Gemini
ein vertikales Bild mit
einem motivierenden Zitat erstellt ein vertikales Bild mit
einem motivierenden Zitat Ich habe auch Starter-Eingabeaufforderungen hinzugefügt, obwohl wir gesehen haben, dass die Starter-Eingabeaufforderungen momentan Aber lasst uns trotzdem überprüfen, was diesmal passieren
wird. Und um dieses
Drama wirklich persönlich zu gestalten, werde
ich ein Bild
in die Wissensdatenbank hochladen, das die
Atmosphäre des
Motivationsbildes wiedergibt , das
Gemini erstellen soll Ich klicke auf die Plus-Schaltfläche. Ich habe meine
Referenzdatei auf meinem lokalen Laufwerk, daher wähle ich Dateien hochladen. Das ist mein Ordner, und das ist
das Motivationszitat
, das ich ausgewählt habe Natürlich können Sie
hier auch andere Dateien hinzufügen. Falls Sie beispielsweise
eine Forschungsarbeit haben, Falls Sie beispielsweise
eine Forschungsarbeit haben die dieser
Jam bei der
Bereitstellung der Empfehlungen analysieren
und nicht nur
sein Allgemeinwissen nutzen soll Bereitstellung der Empfehlungen analysieren
und nicht nur
sein Allgemeinwissen nutzen , können Sie diese Datei
jederzeit hier hochladen Und was
das Standardtool
für diesen Jam angeht , werde
ich hier nichts auswählen. Das liegt daran, dass
unser Fitnesstrainer zwei sehr
unterschiedliche Dinge macht. Es gibt uns Textfeedback und erzeugt ein Bild mit hoher
Auflösung. Indem wir Gemini also
das beste Tool für jede Aufgabe auswählen lassen, stellen
wir sicher, dass unsere
Telefonhintergründe scharf aussehen und unser Feedback
ohne technische Probleme übermittelt wird Hier ist alles gut. Wir
sind bereit, auf Safe zu klicken. Beachten Sie übrigens, dass es
auch dieses Vorschaufenster gibt auch dieses Vorschaufenster dem Sie
Ihre Anweisungen testen können ,
bevor Sie sie speichern. Aber in meinem Fall habe ich
den ersten Test bereits gemacht, bevor ich mit der
Aufnahme dieses Tutorials begonnen habe, also bin ich startklar. Ich klicke einfach auf Sicher
und lass uns unseren Chat starten. Habe mein erstes Video
vom ersten Tag meines Trainings hochgeladen und lass uns ein bisschen warten, bis
der Gemini es verarbeitet hat Unser Video wurde hochgeladen, und bevor wir die Eingabetaste drücken, lassen Sie uns hier über die
Modellauswahl sprechen Da dieser Stau also
multimodale Analysen, das
Ansehen von Videos, die
Überprüfung von Sicherheitswarteschlangen
und die Bereitstellung von
strukturiertem Feedback beinhaltet multimodale Analysen, das
Ansehen von Videos, Überprüfung von Sicherheitswarteschlangen , werde
ich ein
Denkmodell wählen, bei dem Argumentation
Vorrang vor reiner Schnelligkeit eingeräumt Und wir sind hier fertig
und ich drücke einfach und ich Und hier sind die
Empfehlungen von Gemini. Zuallererst
gefällt mir sehr, dass es uns sagt, dass diese Informationen nur zu
Informationszwecken dienen Und für medizinischen
Rat oder Diagnose sollten
wir
den Fachmann konsultieren Das ist absolut wahr. Beachten Sie, dass es aufgrund des
entsprechenden Namens dieser Datei erfolgreich erkannt wurde,
dass dies meine Trainingseinheit am ersten Tag ist erkannt wurde,
dass dies meine Trainingseinheit erkannt wurde,
dass . Der Name enthielt ein
Training am ersten Tag. Hier ist die Scorecard,
was ich auf den Punkt gebracht habe, und
eine Sache, Dem kann ich zustimmen. Und
als nächstes gibt es eine Frage. Möchtest du, dass ich deinen individuellen Hintergrund für dein
tägliches
Motivationstelefon
erstelle , der auf deinen Fortschritten am ersten Tag
basiert? Ja, auf jeden Fall, ja.
Also lass uns einfach antworten. Ja. Und los geht's. Wir haben dieses perfekte Zitat, aber es gibt ein Problem
mit diesem Bild. Wenn wir es mit meinem
ursprünglichen Referenzbild vergleichen, würden
wir feststellen, dass
sie nicht identisch sind. Hier ist ein Bild, um das ich Gemini
gebeten habe. Sie sehen, dass der Hintergrund völlig anders
ist. Kehren wir also zu unserem Jam zurück und arbeiten wir mit
Gemini zusammen, um zu sehen, ob wir das
ändern können und
stellen wir sicher, dass Bilder mit
ähnlichem Hintergrund
wie in unserer Referenzdatei
erzeugt wie in unserer Referenzdatei
24. Weiterlesen: Ein Juwel für Fitnesstrainer aufbauen (Teil 2): Willkommen zurück. Im ersten
Teil dieses Tutorials haben wir die Kernlogik
für unseren Fitnesstrainer Jam eingerichtet. Wir sind jedoch auf eine Einschränkung
gestoßen. Obwohl wir
ein Referenzbild in
die Wissensdatenbank hochgeladen haben , das die täglichen
Motivationshintergründe
generierte sah es nicht so aus
wie unser Originalbild. Lassen Sie uns das beheben, indem wir
verstehen, wie das System
diese verschiedenen Datentypen tatsächlich verarbeitet . Habe bereits erwähnt, dass
Gemini multimodal ist. Es kann alles gleichzeitig sehen, lesen und hören Das ist alles wahr. Es gibt jedoch einen
technischen Unterschied darin, wie ein Gem eine Datei liest und
wie es ein Bild erstellt. Wenn wir einen Verweis
auf die Wissensdatenbank begrüßen, nutzt
Gemini seine Sehfähigkeit, um die Datei
zu analysieren und sie in
textbasierten Daten
für ihr Langzeitgedächtnis
zusammenzufassen für ihr Langzeitgedächtnis Wenn der AM jedoch ein neues Bild
generiert, löst
er ein separates
Bilderzeugungsmodell Laut der
technischen Dokumentation von Gemini kann
dieses Generierungsmodell die Rohpixel Ihrer
Wissensdatenbankdateien nicht direkt erkennen Es wird nur eine
textbasierte Eingabeaufforderung empfangen. Wenn in Ihren Anweisungen einfach steht, dass sie
dem Stil in der Wissensdatenbank entsprechen, arbeitet
die KI
anhand einer Zusammenfassung nicht anhand der Originalquelle, und der ursprüngliche
Stil geht verloren. Um dieses Problem zu lösen, gehen wir von der
Referenzierung zur Spezifizierung über. Anstatt
dem Jam eine Datei zu zeigen und zu hoffen, dass er
den Stil richtig interpretiert, werden
wir
eine visuelle Spezifikation direkt
in die Anweisungen schreiben eine visuelle Spezifikation direkt
in die Dadurch wird sichergestellt, dass jedes Mal, wenn
der Jam ein Bild erstellt, es Ihren genauen Regeln folgt,
ohne dass Sie raten So machen wir das. Gehen Sie zu Ihrer Jam-Liste, suchen Sie den, den Sie
bearbeiten möchten, und klicken Sie auf das Bearbeitungssymbol. Und von hier aus gehst du zu
deinen Anweisungen. im Abschnitt Motivation Lassen Sie uns im Abschnitt Motivation diese
vage Anweisung entfernen Als Nächstes fügen wir eine Beschreibung für unser Bild hinzu, um es zu erstellen, öffnen einen separaten Chat, begrüßen Ihr Referenzbild und verwenden diese Aufforderung Ich schlage vor, hier aufgrund der Ergebnisse
zum
Denkmodell zu wechseln hier aufgrund der Ergebnisse
zum
Denkmodell Sobald Sie die
Bildbeschreibung haben, fügen Sie sie direkt in
Ihre Jams-Anweisungen ein. Hier ist die Beschreibung, die ich für mein Referenzbild
habe. Dies definiert das Layout, die Telefone und die Atmosphäre. Das Modell hat also einen klaren
Satz von Leitplanken. Sobald wir dies getan haben, können wir
auf Update klicken , um die Änderungen zu speichern. Lassen Sie mich ein neues Diagramm erstellen , um die Änderungen zu testen
, die wir gerade vorgenommen haben. A Sie sehen, dass unser neues Bild und das
Referenzbild nicht
dasselbe sind , sondern sich in ihrem Layout, ihrer
visuellen Hierarchie und ihrer
Gesamtästhetik sehr
ähnlich sind, Textbuch aus Milchglas über
einer zarten pastellfarbenen Stadtlandschaft Und das war's für dieses Tutorial. Bitte schreibe in die Kommentare zu diesem Video, an welchem Jam du
arbeiten möchtest. Und das werde ich im
folgenden Video sehen.
25. Gemini für visuelle Kreationen: Abschnitt Intro: Willkommen in diesem neuen
Abschnitt des Kurses. Sie haben bereits
zu
Beginn des Kurses gesehen, wie ich
ein paar Bilder mit Gemini erstellt habe, und jetzt ist es an
der Zeit, auf die Details einzugehen Wir werden die
Bild- und Videotools
von Gemini auf eine ordentliche Probefahrt mitnehmen eine ordentliche Probefahrt Und ich denke, das ist einer
der visuellsten Teile
des gesamten Kurses Wir werden mit der
Bilderzeugung beginnen und
nicht nur mit den Grundlagen. Ich werde Ihnen zeigen, wie Sie
Techniken wie
kontextuelles Mischen anwenden können Techniken wie
kontextuelles Hier kombiniert man
Referenzbilder zu etwas völlig
Neuem und iterativer Verfeinerung, bei der man Zwillinge dirigiert
wie ein Fotograf, indem man ein Element nach
dem anderen
anpasst, bis man genau das Bild bekommt, das man sich
wünscht Wir werden uns auch mit der visuellen
Synthese befassen, bei der Sie Gemini mehrere Zutaten geben und
es zu einer einzigen, nahtlosen Szene zusammenfügen lassen es zu einer einzigen, nahtlosen Szene zusammenfügen Von dort aus gehen wir
zu dem, was ich
die Bearbeitungssuite nenne,
wo wir Gemini verwenden werden, um mit Bildern zu arbeiten, die
Sie bereits haben,
denken Sie daran, alte Fotos zu restaurieren, grobe Skizzen
in Produktaufnahmen
umzuwandeln und präzise Änderungen mit dem
Geminis Building Markup Dann schauen wir uns an, wie
komplette visuelle Systeme, Infografiken,
Flussdiagramme und Inhalte
erstellt werden, die an verschiedene Plattformen und Bildschirmgrößen angepasst sind. Wir werden diesen Abschnitt mit dem Tutorial
zur Videoerstellung beenden Tutorial
zur Videoerstellung Und natürlich werde ich auch meine wichtigsten Tipps und praktischen
Empfehlungen
weitergeben, die ich aus
der
Arbeit mit Gemini
entwickelt habe aus
der
Arbeit mit Gemini
entwickelt anderen KI-Bild- und
Videogenerierungssoftware , die Ihnen helfen wird, bessere Ergebnisse zu
erzielen Ordnung. Lass uns kreativ werden.
26. Was ist eine Nano-Banane? Erläuterung der wichtigsten Funktionen: Möglicherweise haben Sie bemerkt, dass in Ihrer Gemini-App ein
seltsames kleines Bananen-Moja
erscheint Es ist nicht nur eine süße Ikone. Es ist ein winziger Hinweis auf eine lustige Namensgeschichte
hinter diesem Modell. Bevor dieses Modell
offiziell veröffentlicht wurde, hat Google es für
anonyme Tests auf einer
Plattform namens ALM Arena eingereicht ,
einer öffentlichen Website, auf der
Menschen
zwei KI-Modelle miteinander vergleichen und darüber abstimmen welches Ergebnis sie bevorzugen ohne zu wissen,
welches Modell welches
ist So sammeln KI-Labore vor einer vollständigen Markteinführung Feedback aus der
realen Welt Das Modell benötigte einen
Platzhalternamen, nicht darauf hindeutete, dass es ein Google-Produkt handelt, um
es auf der LM Arena-Website einzureichen Um 2:30 Uhr morgens tippte die Google-Produktmanagerin
Nina Nano Banana Ich dachte, es sei nur
ein Platzhalterlabel , das niemand außerhalb der
Testplattform jemals sehen würde Aber das Modell schnitt
so gut ab, dass die Leute auf X von dieser mysteriösen,
mächtigen Nano-Banane
besessen waren und darüber
spekulierten, welches
Labor sie gebaut hatte,
ob es sich um ein
geheimes Google-Projekt handelte oder ob es sich um
etwas völlig Neues handelte Anstatt den Datensatz stillschweigend
zu korrigieren, Google darauf gestützt. Sie haben das Bananen-Bild
oder die Gemini-App hinzugefügt und sogar eine limitierte Auflage
von Fanartikeln zum Thema Bananen hergestellt Der Grund, warum die Banane
viral wurde, war nicht nur
der Name des Pferdes Es war eine bestimmte
Fähigkeit, die EI-Bildwerkzeuge zuvor falsch verstanden hatten, Charakterkonsistenz
in der Vergangenheit Wenn du ein Foto von
dir hochlädst und eine KI bittest, es neu zu erfinden,
bekamst du etwas, das dir vage
ähnelte was die Leute anfingen,
deinen entfernten Verwandten der KI zu nennen, Nano Banana, hat geändert, dass du ein
Foto von dir hochlädst, und es bewahrt
dein aktuelles Abbild in völlig
unterschiedlichen Szenarien.
Du kannst dich selbst in ein Graffiti-Wandbild verwandeln Benutzerdefiniert auf Karton oder einem keramischen K, und auf jedem Bild bist du erkennbar Du kannst dich
an verschiedene Orte, verschiedene Outfits,
verschiedene Jahrzehnte transportieren Outfits,
verschiedene Jahrzehnte Das Gesicht bleibt deins. Sie können sogar Bewegung hinzufügen, um ein
ästhetisches Porträt in ein
kurzes Video zu verwandeln ,
in dem die Person ihren Kopf
dreht oder den Gesichtsausdruck ändert ihren Kopf
dreht oder den Gesichtsausdruck ändert.
Wir werden uns das genauer ansehen, wenn wir uns
Geminis Videomodell Aber Charakterkonstanz
ist nur ein Teil davon. Lassen Sie mich Ihnen
die anderen Dinge erläutern, die
dieses Modell verständnisvoll machen . Scene Blending können Sie
zwei separate Fotos hochladen und
sie zu einem einzigen
kohärenten Bild zusammenfügen Sie können sich und eine
historische Person an
einen Tisch setzen oder
ein Gruppenfoto von Personen erstellen , die noch
nie am selben Ort Gemini kümmert sich um die Beleuchtung, die
Winkel und den Kontext. Das Ergebnis fühlt sich also eher
wie ein Bild als etwas, das zusammengefügt
aussieht Multiturn-Bearbeitung wird
Ihre Konversation zu einer lebendigen Leinwand Sie müssen nicht gleich bei der ersten Aufforderung
alles richtig machen ersten Aufforderung
alles richtig Sie können mit einem leeren Raum beginnen und ihn erwecken, die Wände
streichen, ein Ledersofa
hinzufügen, eine dampfende Tasse
Kaffee auf den Tisch
stellen Jede Aufforderung baut auf der letzten auf. Eine wichtige Sache, an die du dich erinnern solltest Der Chat behält den Kontext
über deine Änderungen hinweg Wenn du also ein
komplett separates Projekt starten möchtest, öffne einen neuen Chat,
anstatt im selben Thread
fortzufahren Beim Mischen von Designs geht es darum, die Textur
oder die visuelle Sprache
einer Sache zu
nehmen und sie auf etwas
ganz
anderes abzubilden — das Muster eines Schmetterlingsflügels, der zu
einem hochmodischen Kleid Bei der Textur von
Marmorfliesen , die sich um
ein Paar Sneakers wickeln, geht
es weniger um die Bearbeitung
eines Fotos als vielmehr darum zwei Welten miteinander zu verbinden, die
normalerweise nicht
zusammengehören Nun, es ist wichtig zu verstehen, wie all
das zusammenpasst Gemini selbst ist im Kern
ein Argumentations- und
Sprachmodell Die Bild- und
Videofunktionen stammen von speziellen Spezialmodellen, die Gemini hinter
den Kulissen Das ist Nano Banana. Offiziell Gemini
2.5 Flash Image genannt, obwohl es niemand so nennt Für Videos ist es ein
Modell namens VO. Stellen Sie sich sie als das Kreativteam von
Gemini auf Anfrage
erhältlich Wenn Sie Gemini bitten, ein Bild zu
erstellen oder zu bearbeiten,
wird die Aufgabe an Nano Banana
übergeben Wenn Sie nach einem
Video fragen, wird VO aufgerufen. Die Konversation
bleibt in Gemini. Die fachliche Arbeit findet in der nächsten Lektion weiter unten statt.
Wir werden Gemini
öffnen und versuchen, unsere ersten Bilder zu erstellen.
Ich treffe dich dort
27. Erstellen Ihres ersten Images mit Gemini: Sie nun die Vorschau der visuellen Funktionen
von Gemini gesehen haben , sollten wir uns die Hände schmutzig machen
und unser erstes Bild erstellen Die Erstellung von Bildern ist
für alle Pläne verfügbar. Lass uns Gemini öffnen
und uns an die Arbeit machen. Um ein Bild zu erstellen, haben
Sie zwei Möglichkeiten. Option eins: Erstelle ein Bild
in deinem bestehenden Chat, in dem du Fragen stellst oder an der Erstellung eines
neuen Inhalts
arbeitest, wie in unserer letzten
Vorlesung, als wir
an unserer Produktbeschreibung für
ein KI-Matratzenunternehmen gearbeitet haben . Option zwei besteht darin, bei Null
anzufangen. Das werde ich dieses Mal
tun. Ich werde mit
der einfachen Aufforderung beginnen. Eine flauschige orangefarbene Katze, die auf einem Sofa
schläft. Um Gemini mitzuteilen, dass wir ein Bild erstellen werden
, wählen
wir in der Liste
der Tools das Bild aus Auf diese Weise weiß Gemini, dass
wir ein
Bild als Ausgabe erwarten, sodass wir
diese verbalen Anweisungen nicht
in die Eingabeaufforderung eingeben müssen diese verbalen Anweisungen nicht
in die Der nächste Schritt vor dem Generieren eines Bilds besteht darin, ein Modell zur
Bilderzeugung auszuwählen, entweder schnell denkend oder professionell. Diesmal entscheide ich mich schnell. Eine alternative Möglichkeit,
ein Bild zu erstellen, besteht darin, direkt
in Ihre Eingabeaufforderung create an image of einzugeben. Und in diesem Fall müssen
wir nicht Bild erstellen
aus der Liste der Tools
auswählen. Das ist meine bevorzugte
Art, mit Gemini zu arbeiten. für diese Demo jedoch Lassen Sie uns für diese Demo jedoch mit der Option
Create Image fortfahren Unser Image ist fertig,
ziemlich gut, wenn
man bedenkt, wie kurz unsere Aufforderung ist und dass es nur
unsere erste Iteration Du kannst das Bild teilen, kopieren oder
herunterladen,
oder du kannst das Bild weiter anpassen
, indem du einfach
mit Gemini chattest und deiner
ursprünglichen Aufforderung
weitere Details hinzufügst deiner
ursprünglichen Aufforderung
weitere Details hinzufügst Sie sehen, dass Gemini
die Bildaufforderung ändert, indem weitere Details
hinzufügt, während der gesamte vorherige
Kontext
beibehalten Falls Sie jedoch
mit einer Ihrer
vorherigen Iterationen von vorne beginnen
möchten , klicken Sie auf Mehr und wählen Sie unter Neuer Chat die Option
Zweig Dann können Sie Gemini die
Aufforderung geben, und in diesem Fall
ändert Gemini das ausgewählte Bild Natürlich können Sie
Gemini sofort die gesamte
Aufforderung geben oder, anstatt die
Details selbst zu beschreiben, einen Stil auswählen Anstatt
zum Beispiel zu beschreiben, welches Licht wir in unserem Bild
haben wollen, wählen
wir hier aus der Liste die
Filmsequenz aus Sie haben gesehen, wie ich zwischen
Schnellmodus und Denkmodus gewählt habe. In der Gemini-App geben
diese Modi an, wie
viel Rechenleistung und Argumentation die KI verwendet, um Ihr Bild
zu erstellen, während sich die spezifischen
Modellnamen unter der Haube,
wie Nana Banana, schnell weiterentwickeln , je nachdem, wie diese
beiden Bleibt konstant. Ich empfehle immer den offiziellen
Gemini-Supportseiten nach den neuesten Versionsnamen Aber hier ist der beste Weg, um über Ihren Arbeitsablauf
nachzudenken. Stellen Sie sich den Schnellmodus als
interaktive Ebene vor. Er ist auf Geschwindigkeit
und schnelle Iteration ausgelegt. Wenn du die Hemdfarbe änderst, eine neue Frisur
ausprobierst, einen Hintergrund
tauschst oder viele Variationen
generierst, Modus für schnelles Denken,
die Argumentationsebene,
beibehalten . Das dauert
länger, weil es
vorsichtiger ist, bevor es Verwenden Sie es, wenn Sie
Präzision benötigen, z. B. sauberen, lesbaren Text für
einheitliche Produktaufnahmen oder komplexe Szenen, in denen
Details wirklich wichtig Du kannst mich fragen, aber Anna, warum ich nicht ständig
nachdenken sollte,
wenn es mächtiger ist. Das ist eine faire Frage, aber es gibt zwei
praktische Kompromisse. Das erste ist die Zeit. Der erste Modus
ist das Tool zur Geschwindigkeit des Denkens. Der Denkmodus erfordert eine
Wartezeit während das EI die Aufforderung
durchdenkt. Zweitens gibt es Nutzungsbeschränkungen, da Denkmodus
rechenintensiver ist. In der Regel gelten für ihn strengere
Tageslimits als für den Schnellmodus. Mein empfohlenes
Verfahren verwendet den Schnellmodus , um schnell
grobe Optionen zu untersuchen und zu generieren Und wenn du
dein Heldenkonzept gefunden hast,
wechsle in den Denkmodus
, um den finalen
High-Fidelity-Feinschliff zu erhalten. Beginnen Sie sofort mit dem
Denkmodus, nur für
hochkomplexe Aufgaben wie Visualisierung von Prozessabläufen oder Erstellung von Bildern mit
bestimmten lokalisierten Texten Ordnung. Jetzt haben Sie
eine erste Vorstellung davon wie Sie Gemini dazu veranlassen können, Visuals
zu erstellen Im nächsten Video gehen
wir etwas
tiefer und lernen im nächsten Video, wie
man eine gute
Prompt-LCR erstellt
28. 7 Tipps für bessere Visualisierungen: Hallo zusammen und
willkommen zurück zur Vorlesung. Da es in diesem Abschnitt des Kurses Generieren von Bildern
geht, können
wir
ein so wichtiges Thema
wie
die Erstellung dieser Anweisungen nicht übersehen wie
die Erstellung dieser Im kommenden Video werde
ich meine
sieben wichtigsten Empfehlungen zur Erstellung effektiver
Eingabeaufforderungen vorstellen. Lass uns anfangen Manchmal werden Sie solide Ergebnisse
mit einfachen, offenen Eingabeaufforderungen
sehen ,
vor allem, wenn Sie
offen für Überraschungen sind Wenn Sie jedoch eine
bestimmte Vision vor Augen haben, kann
Ihnen
die Beschreibung verschiedener Details dabei helfen, Perfektion zu erreichen Aber unabhängig von der
Richtung, die Sie
einschlagen möchten , empfehle ich, mit
einer einfachen Aufforderung zu beginnen und dann
nacheinander
zusätzliche Details hinzuzufügen nacheinander
zusätzliche Details , um zu sehen, wie sie
sich auf das Bild auswirken. Beginnen Sie mit
der Beschreibung Ihres Themas, Person, Ihres Tieres, Ihrer
Landschaft, Ihrer fiktiven
Figur usw. Generieren Sie Ihr erstes
Bild und fügen Sie dann zusätzliche Details oder den Kontext hinzu,
z. B. den Standort, Informationen über die
Umgebung und die Beleuchtung
sowie Emotionen oder Stimmungen, die
Sie einbringen möchten Um die Idee zu verdeutlichen,
was Sie erstellen möchten, ist
es hilfreich, sich
eine Reihe von Fragen zu stellen Hier ist eine Checkliste, die
Sie verwenden könnten. Entscheiden Sie, ob Sie ein
Foto oder eine Illustration wünschen. Was ist Ihr
Thema, Person, Tier, Landschaft, fiktive
Figur usw. Denken Sie an spezifische
Effekte und Details, die Sie einbeziehen
möchten, Kunstrichtungen, Themen ,
Techniken, Effekte,
Materialien, Konzepte ,
Farbe und Ton, Beleuchtung
und Komposition Gehen Sie über die Grundlagen hinaus und fügen Sie Ihrer Aufforderung
zusätzliche Beschreibungen
hinzu,
die den kreativen Prozess in
eine völlig andere
Richtung lenken oder Ihren Bildern zusätzliche Würze und
Nuancen verleihen können die den kreativen Prozess in eine völlig andere
Richtung lenken oder hinzu,
die den kreativen Prozess in
eine völlig andere
Richtung lenken oder Ihren Bildern zusätzliche Würze und
Nuancen verleihen Hier sind nur einige
Beispiele dafür, was Sie hinzufügen können. Art der Fotografie,
Umgebungen, Emotionen und Stimmungen,
spezifische Kunststile, filmische oder malerische Effekte Experimentieren mit solchen Deskriptoren ist einer
der unterhaltsamsten Aspekte
der Arbeit unterhaltsamsten Aspekte
der Das Experimentieren mit solchen Deskriptoren ist einer
der unterhaltsamsten Aspekte
der Arbeit mit Gemini-Bildgenerierung. Kleine Ergänzungen können das Gefühl eines
Bildes dramatisch verändern Achten Sie auf die Reihenfolge
der Wörter in Ihrer Aufforderung. Die Wörter am Anfang haben mehr Gewicht als die
Wörter am Ende. Wenn also Ihre verschneite Landschaft wichtiger ist als die
Kabine im Vordergrund,
beginnen mit der Landschaft Versuchen Sie,
dieselbe Wortgruppe neu zu ordnen, und Sie werden oft
merklich unterschiedliche Ergebnisse erzielen Achten Sie auf die Rechte Dritter
. Gemini ermöglicht es Ihnen, historische Künstler
und Kunstbewegungen namentlich zu referenzieren zu fragen funktioniert also perfekt, nach einem Mann wie Qualität
oder einem Vang-Stil Die EI wird jedoch Anfragen blockieren, in denen nach dem Lebensstil oder zeitgenössischen
Künstlern gefragt wird, um die Urheber zu schützen Sie schränkt auch urheberrechtlich geschützte
Charaktere und Markenlogos ein. Wenn Sie das Aussehen eines modernen Künstlers oder
einer bestimmten Marke bevorzugen,
beschreiben Sie die visuellen
Eigenschaften, nach denen Sie suchen , anstatt sie direkt zu
benennen Suchen Sie nach Inspiration und Beispielen, wenn
Sie Ihre eigenen Aufforderungen erstellen Wenn Sie mit der
KI-Bildgenerierung noch nicht vertraut sind und noch keinen Designhintergrund
haben, kann
es zunächst schwierig sein, detaillierte beschreibende
Eingabeaufforderungen zu schreiben, und das Ein guter
Einstieg besteht darin, von
mir generierte
Bildgemeinschaften online zu durchsuchen , Bilder zu
finden, die Ihnen gefallen, sich die
dahinter stehenden Eingabeaufforderungen anzusehen und mit kleinen Änderungen zu experimentieren Es ist auch eine gute Idee, ein Moodboard mit
Bildern zu
erstellen, die dir gefallen und auf die du später vielleicht verweisen
möchtest. Speichern Sie das Bild, die verwendete Eingabeaufforderung und alle zugehörigen
Stilnotizen. Dies wird im Laufe der Zeit zu einer wirklich nützlichen kreativen
Referenz. Zu guter Letzt
genießen Sie den Prozess. Zunächst könnte es sich so anfühlen, als würde das EI
die ganze kreative Arbeit erledigen. Aber ohne Ihre einzigartigen Ideen, Ihr Gespür dafür, was
gut aussieht , und Ihre
Experimentierfreude würde
das EI
nichts Interessantes hervorbringen Also sei du selbst, wirf
deine Ideen raus und hab Spaß damit. Um es noch einmal zusammenzufassen Hier sind die sieben Tipps. Fangen Sie einfach an und fügen Sie dann nacheinander
Details hinzu. Stellen Sie sich eine Reihe von Fragen, um
Ihre Vision zu verdeutlichen. Gehen Sie bei
Deskriptoren für Umgebung,
Stimmung, Stil und mehr über die Grundlagen hinaus Stimmung, Stil und Die Reihenfolge der Wörter ist wichtig. Was zuerst kommt,
hat mehr Gewicht. Achten Sie auf die Rechte
Dritter. Künstlerstile sind Freiwild, aber vermeiden Sie urheberrechtlich geschützte
Charaktere und Suchen Sie
online nach Inspiration und erstellen Sie die Moodboards als kreative Referenz.
Viel Spaß damit. Wie immer, Alca
im nächsten Video.
29. Kontextbezogene Zusammenführung, iterative Renerierung und visuelle Synthese: Willkommen zurück. haben wir die Bananenbanane kennengelernt und gelernt, wie man
ein Bild von Grund auf neu erstellt. Aber in den meisten Fällen suchst
du nicht nur
nach coolen Bildern. Sie suchen nach Vermögenswerten. Sie benötigen das perfekte
Heldenbild für eine Website oder eine Social-Media-Anzeige , die das Scrollen tatsächlich stoppt. In diesem Video werden wir
untersuchen, wie diese Assets
erstellt werden. Natürlich können Sie bei Null
anfangen und
Gemini fragen, welches Bild Sie möchten Aber denk darüber nach. einen bestimmten
Lichtwinkel,
eine einzigartige Textur oder eine
komplexe physische Struktur nur
mit Text zu beschreiben eine einzigartige Textur oder schwierig, einen bestimmten
Lichtwinkel,
eine einzigartige Textur oder eine
komplexe physische Struktur nur
mit Text zu beschreiben. Sie können 30 Minuten damit verbringen,
die perfekte Aufforderung zu schreiben und trotzdem
nicht zu verstehen, was Sie sich vorstellen. Wenn Sie jedoch ein
Gemini-Referenzbild zeigen, erhalten
Sie sofort eine
Übersicht Ihrer Erwartungen Heute werden
wir uns ansehen, wie man Bilder
verwendet, um mit der KI zu sprechen Fangen wir mit der klassischen
Marketing-Herausforderung an. Sie haben ein Produkt,
in diesem Fall Hautpflegeflasche, und Sie möchten, dass es lebendig,
frisch und hochwertig aussieht Dafür werden wir kontextuelles
Mischen verwenden. Schau dir an, was passiert, wenn ich neben
dem Referenzbild
ein einfaches Foto
der Flasche hochlade neben
dem Referenzbild
ein einfaches Foto
der Flasche und
Gemini dann anweise , es in einer
völlig neuen kreativen Szene zu platzieren In unserer ersten Aufforderung fragen
wir nicht einfach
nach einem zufälligen Bild Wir sagen Gemini
genau, was wir wollen, indem das Originalbild
verweisen und darum bitten, Teile davon zu
ersetzen, Wasser
gegen Saft und
die Originalflasche gegen
unsere Hautpflegemarke auszutauschen die Originalflasche gegen
unsere Fangen wir mit dem Schnellmodus an. Ich habe auf Senden geklickt und
hier ist unser Bild. Der Text ist klar und
die Flasche befindet sich perfekt
unter der Wasserlinie Lassen Sie uns jetzt einige Änderungen vornehmen. Zuallererst werde ich
diesen Satz zur Eingabeaufforderung hinzufügen. Phrasen wie
E-Commerce-Produktfoto, helle Studiobeleuchtung oder rein weißer Hintergrund
sind die Geheimnisse , die ein Bild eher wie
einen echten Werbespot
als wie ein KI-Experiment aussehen lassen . Lassen Sie uns hier auch in den
Denkmodus wechseln. Ich habe dieselbe Aufforderung verwendet, aber die Flasche ist plötzlich oben
auf der Flüssigkeit. Warum? Weil das Modell tatsächlich physikalische Überlegungen
anwendet, weiß
es, dass Orangensaft im Gegensatz zu Wasser nicht durchsichtig ist Es denkt, wenn ich
diese Flasche in Saft tauche, verschwindet die untere Hälfte des
Etiketts Lassen Sie uns versuchen, dies zu erzwingen, indem Anweisungen
hinzufügen, die halb unter Wasser
liegen. Ähnliche Ergebnisse Im Denkmodus wird der Logik der
Produktfotografie Vorrang vor Logik der
Produktfotografie meinen spezifischen Layoutanweisungen Es geht davon aus, dass auf einem guten Foto die gesamte Marke zu sehen
sein muss, also korrigiert es meine Komposition indem es das Produkt
aus dem Saft herausholt Schauen wir uns nun die
iterative Verfeinerung an. Hier glänzt Gemini wirklich
. Sie müssen nicht die
perfekte Aufnahme auf einmal machen. Stattdessen richten Sie es wie
ein Fotograf, der
ein Element nach dem anderen anpasst , bis Sie genau
dort landen, wo Sie möchten. Für diesen Gemini-Brau-Kaffeebeutel werden
wir Schritt für Schritt
ein reichhaltiges Textprodukt erstellen ,
angefangen bei der Platzierung, dann der
Verfeinerung der Komposition, dem
Hinzufügen von Inhalt und Tiefe bis hin zur
Einstellung angefangen bei der Platzierung, dann der
Verfeinerung der Komposition, dem Hinzufügen von Inhalt und Tiefe bis der Beleuchtung Beobachten Sie, wie jede Aufforderung
das Bild der Premium-Ästhetik näher bringt Schauen wir uns zum Schluss die Technik
an, die meiner Meinung nach die beeindruckendste
aller visuellen Synthesen
ist Manchmal hat man ein
ganzes Kampagnen-Kit, mehrere Produkte,
ein Modell, ein Outfit. In der Vergangenheit erforderte die
Zusammenstellung dieses Ganzen ein umfangreiches kreatives Briefing und
viel Hin und Her. Im Denkmodus von Gemini haben wir einfach die Teile übergeben und es den Rest herausfinden
lassen Bei der Entwicklung von Grund auf geht es um Richtung, nicht nur um Beschreibung Sie haben gesehen, wie
man den Kontext
verschmilzt, eine Aufnahme Schritt für Schritt verfeinert
und mehrere
Elemente zu
einem einzigen Gesamtbild Aber was passiert
, wenn ein Bild
fast perfekt ist und nur eine bestimmte Änderung
benötigt In unserem nächsten Video gehen
wir zur
Bearbeitungssuite über, wo wir Gemini
verwenden werden , um Bilder zu reparieren, wiederherzustellen
und präzise zu bearbeiten Du hast Alca bereits dort.
30. Die Bearbeitungssuite: Umwandlung von Skizzen in Prototypen und Fotorestauration: Alle zusammen, und willkommen
zurück zur
Vortragsreihe über das Erstellen von Bildern mit Gemini In diesem Video gehen wir auf
die Bearbeitungsmöglichkeiten von Gemini Ich werde Ihnen zeigen, wie Sie die
Gemini-Thinkebene verwenden , um die Bilder, die
Sie bereits haben, zu korrigieren, wiederherzustellen und buchstäblich zu lesen und wiederherzustellen und buchstäblich zu lesen und
dann anzupassen Hier entwickeln wir uns von kreativen
Gestaltern zu erfahrenen
Redakteuren Lassen Sie mich Gemini öffnen
, um mit der Demo zu beginnen. Es beginnt normalerweise auf einer
Serviette oder einem Whiteboard. Sie haben eine Vision für ein Produkt, aber kein Designer Folgendes werden wir tun. Ich lade diese Skizze
eines neuen Stuhldesigns auf Gemini Ich muss kein Künstler sein. Ich könnte Gemini einfach sagen, diese Skizze zu
einer fotorealistischen
Produktaufnahme
interpretieren einer fotorealistischen
Produktaufnahme , weil wir uns
im Denkmodus befinden Gemini verwendet die Linien
als Strukturleitlinie. Es versteht die Perspektive, die ich
beabsichtigt hatte , und füllt
die Details aus, ich selbst nicht zeichnen konnte So werden aus Ihren groben
Entwürfen innerhalb von Sekunden Prototypen. Lass uns den Stuhlstoff wechseln. Aber anstatt die gewünschte
Farbe und Textur zu erklären, verwende
ich Referenzbilder. Überraschenderweise habe ich
dieses Buchbild weil ich in meiner Aufforderung das Wort
Cover verwendet habe. Lass uns einen neuen Chat starten
, um das Bild richtig zu machen. Und natürlich können wir
diese Aktie um 360 Grad drehen. Hier habe ich das
Haarbild und mein Video pmt. Und ich habe auch Video aus
dem Drop-down-Menü ausgewählt , um sicherzustellen, dass Gemini
meine Aufgabe richtig verstanden hat Schauen wir uns nun eine der leistungsstärksten Reparaturen an ,
die Sie für die Restaurierung durchführen
können Wir haben alle diese alten
verblassten Familienfotos oder digitalen
Aufnahmen von geringer Qualität von vor Jahren Anstatt es einfach einzufärben, bitte
ich Gemini, es zu restaurieren verwendet seine Denkebene Gemini verwendet seine Denkebene und analysiert die Texturen
und den historischen Kontext Es entfernt die Kratzer,
schärft die Gesichter
und trägt natürliche, realistische Farben als ob das Foto heute aufgenommen
worden wäre Es ist nicht nur der Filter. Es ist das EI, das die Qualität rekonstruiert ,
die im
Laufe der Zeit verloren gegangen ist. Lass uns einen Blick darauf werfen Mm. Oh, was für ein Gefühl auf dem Pedal zu
tanzen, verloren
im Rhythmus der Sonne
31. Die Editing Suite: Gezielte Bearbeitung mit dem Markup-Tool und externen Anmerkungen: Lass uns weitermachen. Was ist, wenn
das Bild großartig ist, Sie
aber
eine bestimmte Sache ändern möchten. Lassen Sie uns untersuchen, wie Sie mit dem speziellen
Bildmarkup-Tool von
Gemini
und seiner Alternative arbeiten speziellen
Bildmarkup-Tool von
Gemini können Ich möchte dieses Bild bearbeiten. Ich lade es auf Gemini hoch und
öffne das Markup-Tool. Ich klicke einfach auf das Bild. Und hier haben wir unseren
Bearbeitungsbereich. Was ich hier tun werde, wird
als spezielle Eingabeaufforderung bezeichnet. Ich zeige Gemini
genau, wo ich
die Änderung haben möchte , und beschreibe,
wie die Änderung aussehen soll Zuerst wähle ich eine Farbe aus. Lass uns Rot nehmen. Und ich umkreise diesen Kamin. Als Nächstes muss ich die Absicht
erklären, also wechsle ich zum
Textwerkzeug und gebe Ed Fire ein. Beachten Sie, dass ich hier ein Verb verwendet habe. Sie können mit
Aktionen wie Hinzufügen oder Ersetzen spezifisch sein, oder Sie können das Objekt einfach
beschreiben. Lassen Sie uns hier zum Beispiel zwei Tassen Kaffee auf
diesen Beistelltisch legen. Wenn Sie einen Fehler gemacht haben, können
Sie jederzeit die
Rückgängig-Taste drücken, um zurückzugehen. Ich klicke auf Fertig, da ich gerade die
Anmerkungen
fertiggestellt habe, und wir Eingabetaste, ohne
irgendwelche Anweisungen zu geben , weil wir sie
gerade auf dem Bild gemacht Und hier ist das neue Bild. Wir sehen, dass Gemini die Änderungen
erfolgreich übernommen hat. Wir sehen das Feuer
im Kamin und wir sehen hier zwei Tassen
Kaffee. Tolle Arbeit. Wenn ich dieses neue Bild öffne, werden
Sie feststellen, dass das
Markup-Tool
nicht erneut geöffnet wird, wenn Sie darauf klicken Markup-Tool
nicht erneut geöffnet Dieses Tool ist also speziell
für Ihre ersten Uploads gedacht. Sie stecken jedoch nicht fest, Sie können
das Ergebnis mithilfe von
Konversationsänderungen weiter verfeinern das Ergebnis mithilfe von
Konversationsänderungen Also hier ist meine neue Aufforderung. Gemini ist sich des Bildes kontextuell
bewusst. Es wurde gerade erstellt und wird weiterhin die von Ihnen angeforderten Änderungen vornehmen Und zurück zu meinen
ursprünglichen Anmerkungen.
Beachten Sie, dass ich die Textfarbe gerne
an die Kreisfarbe anpasse, während die KI hauptsächlich Koordinaten
verfolgt Dies ist eine hervorragende bewährte Methode um Ihre
Anweisungen zu organisieren Du kannst auch Anmerkungen aus externen Tools wie Canva Hier
habe ich zum Beispiel
dieses Foto des Bursch
Khalifa-Gebäudes markiert dieses Foto des Bursch
Khalifa-Gebäudes Ich möchte, dass Gemini genau
diese Änderungen vornimmt. Ich möchte, dass dieses Gebäude
entfernt wird, und ich möchte die
Farben einiger Teile
des Gebäudes ändern Farben einiger Teile
des Gebäudes Ich habe einen neuen Chat geöffnet und dieses
Bild für den Chat eingereicht. Für komplexe Aufgaben wie diese empfehle
ich, in
den Denkmodus zu wechseln. Dies löst ein
leistungsfähigeres Argumentationsmodell aus, das diese
genauen Anweisungen viel besser befolgen Ich werde auch
diese Anweisungen beifügen, wobei es wichtig ist, diese Aufforderung
hier
einzubeziehen Hier ist zum Beispiel das Bild,
das ich erhalten habe, als ich dasselbe Bild angepasst habe
,
ohne Gemini
Anweisungen zu Wir sehen, dass Gemini die Änderung
erfolgreich vorgenommen hat. Wir
sehen jedoch immer noch die Anmerkungen, und das war mein Originalbild ohne jegliche
Anweisungen Kehren wir zu unserem
Chat zurück und drücken die Eingabetaste. Leider
haben wir
diesmal immer noch die Anweisungen
für das neue Bild
und wir sehen auch, dass Gemini erfolgreich andere Änderungen
vorgenommen
hat Wir sehen das Gebäude
hier auf der rechten Seite nicht und die neuen Farben
wurden erfolgreich angewendet Lassen Sie uns Gemini bitten, die Anweisungen zur
Anmerkung aus
dem Bild zu entfernen . Und los geht's Der zweite Versuch
war erfolgreich. Wie Sie sehen können,
erkennt Gemini den Text, entfernt das Gebäude und
ändert die Farben perfekt Und dann haben wir
die zweite Anweisung gegeben , um die Anmerkungen zu entfernen.
Alles gut hier. Schauen wir uns zum Schluss an, wie Gemini in Ihren Fotos über die Welt Wenn du zum Beispiel
ein Foto der Skyline einer Stadt hochlädst, kannst
du Gemini bitten, es mit Anmerkungen
zu versehen. Dann kannst du
beobachten, wie es die Wahrzeichen identifiziert und Beschriftungen genau
dort anbringt Das ist nicht nur Zeichnen,
es ist Informationsdesign. Es geht darum, aus einer rohen
Kartoffel
ein intelligentes Lernmaterial für eine Präsentation oder
ein Handbuch zu ein intelligentes Lernmaterial für eine Präsentation oder
ein Handbuch Und genau das ist das Thema von allem, was wir in diesem Video behandeln
.
Egal, ob Sie
eine grobe Skizze zum Leben erwecken, ein altes Forum
restaurieren, ein Bild mit
Anmerkungen versehen oder eine komplexe Szene intelligent
beschriften, Gemini erledigt die
Präzisionsarbeit, sodass Sie es nicht tun müssen In unserem nächsten Video werden
wir
all diese Fähigkeiten
zusammenbringen, um komplexe visuelle Systeme zu entwickeln,
einschließlich Infografiken und
Datenvisualisierungen, die komplexe Daten in etwas
verwandeln, das sofort klar komplexe Daten in etwas
verwandeln ist.
Wir sehen uns dort
32. Komplexe Visualisierungen: Menüs, Diagramme und Infografiken: Willkommen zurück. Bisher haben
wir viele
Dinge behandelt, die Szenen von Grund auf neu erstellen, präzise
bearbeiten und komplexe Szenen
synthetisieren Schauen wir uns nun an,
was Gemini
tun kann , wenn die Aufgabe
noch ehrgeiziger wird, mehrteilige
visuelle Elemente wie
Infografiken und Elemente erstellen, die auf verschiedenen sozialen
Plattformen
und Bildschirmen
funktionieren Lass uns anfangen. Ich möchte, dass
Gemini eine Seite erstellt Infografik-Menü mit
diesen Kaffeebildern. Ich wollte jedes
Getränk identifizieren und es mit seinem Namen
und
einer kurzen Beschreibung in einen übersichtlichen Bereich stellen mit seinem Namen
und
einer kurzen Beschreibung in einen übersichtlichen Bereich Wählen wir auch „
Bilder erstellen “ aus der
Auswahl der Tools aus. Wie aus der
Pam-Beschreibung hier hervorgeht, ist nicht ganz klar,
ob ich ein Bild oder
einen Text als endgültige
Ausgabe haben möchte . Lass uns anfangen Und hier ist unser Bild. Da Gemini eine
tiefe Resoninschicht hat, erkennt
es den Unterschied zwischen
den von uns eingereichten Bildern
und kann eine Kaffeetasse mit den Eiswürfeln darin von der
mit der warmen Milchform Lassen Sie mich Gemini bitten, dieses Layout
ein wenig zu
ändern und auch die Farben
an unsere Markenfarben anzupassen Oh, das ist ein großartiges Design. Mir gefällt es besser als
unsere erste Iteration. Und lassen Sie uns noch eine Änderung vornehmen. Ich möchte diesen Text der
Kaffeekarte in unseren Markennamen ändern. Und hier ist unser Bild. Ich mag es sehr. Das einzige, was
ich ändern möchte, ist, dass ich
diese Kaffeebohnen entfernen möchte , damit
der Text vollständig sichtbar ist. Aber anstatt dies als
eine Reihe von iterativen Eingabeaufforderungen zu tun, versuchen
wir hier,
eine andere Technik zu verwenden Ich werde das Markup-Tool verwenden
, das wir in
der vorherigen Demo behandelt haben Lassen Sie mich dieses Bild in
voller Größe herunterladen. Ich habe einen neuen Chat erstellt und unser Bild
hochgeladen, das
wir gerade generiert haben. Als Nächstes öffnete ich das Markup-Tool und ließ mich
die Kaffeebohnen hervorheben Ich habe Gemini die Anweisung
hinzugefügt ,
die Kaffeebohnen zu entfernen Es wird ein
bisschen knifflig, weil wir die Bohnen zusammen
mit dem Text
sehen Aber lassen Sie uns versuchen, es zum Laufen zu bringen. Ich wähle hier das
Denkmodell und wähle und erstelle
auch Bilder. Mein erster Versuch
war also erfolglos. Sie sehen, dass die OF-Bilder immer noch hier im Bild
sind. Lassen Sie uns versuchen,
die Änderung zu beschreiben , die ich gerne vornehmen
würde. Und hier ist unser Bild. Es ist wirklich unglaublich, dass
Gemini
meinen Anweisungen so gut gefolgt ist
und
diese Kaffeebohnen aus der
oberen rechten Ecke des Menüs entfernt hat meinen Anweisungen so gut gefolgt ist
und
diese Kaffeebohnen aus der
oberen rechten Ecke des Menüs entfernt diese Kaffeebohnen aus der
oberen rechten Ecke des Menüs Und jetzt können wir
unseren Text deutlich sehen. Fantastisch. Und lass uns hier
zur zweiten Demo übergehen. Manchmal muss man
das wie die Reise
von der Bohne zur Tasse in meinem Beispiel für die Kaffeemarke
Gemini erklären von der Bohne zur Tasse in meinem Beispiel für die Kaffeemarke
Gemini Hier ist also der
charakteristische Brühprozess unserer Marke. Ich werde
Gemini Folgendes fragen. Ich möchte, dass Gemini
diesen fünfstufigen Gemini
Brew-Signaturprozess
in einem sauberen Architektur-Flussdiagramm abschließt diesen fünfstufigen Gemini
Brew-Signaturprozess in einem sauberen Ich wollte ein minimalistisches
Layout verwenden und
die Farben an die Farben anpassen , die
wir in unserer PDF-Datei verwenden Lassen Sie mich den Denkmodus wählen. Und für dieses Beispiel wähle
ich auch Bilder erstellen. Und hier ist unser Diagramm. Gemini hat die Struktur gebaut, die Symbole
erstellt und
auch jeden Schritt beschriftet Was ich hier nicht mag, sind
die Würfe, die
definitiv unnötig sind Und dieser Text, den wir auf jeder Box sehen
können. Bitten wir Gemini, das zu entfernen. Und hier ist das sauberere Bild. Und ich
möchte diesen Rahmen auch entfernen. Bitten wir Gemini, das zu tun. Und das ist ein viel
besseres Bild. Und ich möchte noch
eine Iteration machen
, um dieses Bild
schöner Schau dir das an. Das ist eine
völlig andere Ästhetik. Lass mich in den Fragen und
Antworten zu diesem Video wissen, welches du bevorzugst Und als
Nächstes machen wir mit unserer Demo weiter.
33. Komplexe Visualisierungen: Anpassung von Assets über Formate und Plattformen hinweg: Natürlich können Sie dieses Bild weiter
bearbeiten, wenn Sie möchten, indem Sie
entweder
Gemini weiter
direkt hier im Chat nach Verbesserungen fragen ,
oder Sie können
dieses Bild kopieren und mit den Anweisungen des
Markup-Tools
fortfahren Anweisungen des
Markup-Tools
fortfahren Aber lassen Sie mich Ihnen
ein anderes Beispiel zeigen während wir hier an diesem Bild sind Nehmen wir an, wir planen eine internationale Expansion
der Marke Gemini Brew Wir müssen dieses Diagramm
also in
andere Sprachen übersetzen Also werde ich darum bitten, das Bild so zu
ändern , dass die Texte
in chinesischer Sprache angezeigt werden. Und das ist unser
übersetztes Diagramm. Beachten Sie, dass
ich in meiner Aufforderung ausdrücklich sage, dass ich möchte, dass
Gemini das Bild ändert nicht nur die Texte in
chinesischer Sprache anzeigt ,
damit Gemini klar
ist , dass ich
eine weitere Variante dieses Bildes in die
chinesische Sprache
übersetzen muss eine weitere Variante dieses Bildes in die chinesische Sprache
übersetzen Ordnung. Und lassen Sie uns ein letztes Beispiel
nehmen. Nehmen wir an, wir
benötigen Ressourcen für die
Marketingkampagne von Gemini Brew, die
überall funktionieren, von
Instagram-Geschichten und -Posts bis hin zu einem
Heldenbild auf unserer Website Wir werden diese Aufnahme machen, wir zuvor mit Gemini gemacht haben, und ich werde
Gemini sagen , dass dies
unser Hauptinstrument ist Und jetzt benötige ich eine Version für eine vertikale Social-Media-Story, einen quadratischen Beitrag und
einen weißen Header für die
Gemini Habe auch das Bild angehängt , das Gemini ändern soll Und hier ist die Nachricht
, die ich von
Gemini erhalten habe, als ich
diese Aufforderung getestet habe , bevor ich das Tutorial
aufgenommen Dies liegt daran, dass Gemini rechtzeitig ein Bild
erstellen kann. Gemini kann zwar viele
Referenzbilder gleichzeitig verarbeiten, das
Ziel besteht jedoch immer darin, sie
zu einer endgültigen, originalgetreuen Komposition zu synthetisieren . Wenn Sie es nach mehreren
separaten Bilddateien auf einmal fragen, wie in meinem Beispiel hier, kann
es Ihre Anfrage
nicht bearbeiten Sie Ihre Anfrage also immer als
ein einzelnes Projekt, z. B. eine
Infografik, ein Menü
oder eine Kampagnenaufnahme, bei der
alle Ihre Elemente in einem Bild ein einzelnes Projekt, z. B. eine
Infografik, ein Menü
oder eine Kampagnenaufnahme, bei zusammenleben Lassen Sie mich also die Aufforderung ändern. Ich möchte zunächst
ein weißes Header-Bild für
die Gemini Brew-Website erstellen ein weißes Header-Bild für
die Gemini Brew-Website Wie immer wähle ich den
Denkmodus
und lasse uns auch Bilder
erstellen wählen, um
Gemini klare Anweisungen zu geben , dass ich in diesem Fall ein
Bild erwarte Und hier ist unser neues weißes
Heldenbild für unsere Website. Wir stellen fest, dass Gemini unser
Originalbild nicht nur ausdehnt, sondern es auch übermalt, sodass es ihm mehr Details hinzufügt ,
wie bei den alten Kaffeemaschinen sowie diesen Kaffeebohnen auf der linken und rechten Seite
des Originalbilds.
Gleichzeitig wird sichergestellt, dass unser Produkt
unabhängig von der Bildschirmgröße immer perfekt in der
Mitte der Komposition positioniert perfekt in der
Mitte der Lassen Sie uns auch ein Bild in
vertikaler Größe
und ein quadratisches Bild
für unsere Instagram-Posts erstellen und ein quadratisches Bild
für unsere Instagram-Posts
34. Mehr als nur Chatten – Tiefgreifende Forschung und Entwicklung mit Gemini: Abschnitt Intro: Was passiert, wenn Sie
Gemini eine Forschungsaufgabe geben , für die Sie normalerweise einen halben Tag benötigen
würden Darum geht es in diesem
Abschnitt, und dann bringen wir diese Ergebnisse an einen Ort, den
Sie vielleicht nicht erwarten Wir werden dazu
ein Gemini-Feature
namens Deep Research verwenden ein Gemini-Feature
namens Deep Research und damit
drei sehr unterschiedliche Situationen aus dem wirklichen
Leben durcharbeiten damit
drei sehr unterschiedliche Situationen aus dem wirklichen
Leben Eine,
mit der sich die meisten von uns jede Woche befassen,
eine davon, eine
Kaufentscheidung zu treffen, ohne in das Kaninchenloch von
Bewertungsseiten und überfallenen Threads zu
fallen,
und eine, bei der es darum geht, sich über ein völlig
neues Thema zu ein völlig
neues Thema In jedem Fall möchte ich, dass Sie
nicht nur sehen , was Gemini produziert,
sondern auch, wie Sie es aufrufen können, damit die Ergebnisse für Sie
tatsächlich nützlich Und dann werden wir noch einen
Schritt weiter
gehen und Canvas verwenden, um eines dieser
Forschungsergebnisse in eine funktionierende interaktive App umzuwandeln , die auf einer Konversation
basiert Kein Code benötigt es.
Ich hoffe du bist bereit. Holen Sie sich also eine
Tasse Tee oder Kaffee und lassen Sie uns loslegen.
35. Tiefe Forschung: Antworten über den Blueprint hinaus: Heben Sie Ihre Hand, wenn Ihnen das
schon einmal passiert ist Sie stellen einem Chatbot eine
wichtige Frage, etwa: Ich möchte die Finanzierung der Serie A
aufbringen Was sind derzeit die aktivsten
Investoren in meinem Bereich? Und es antwortet mit
einer Liste von Optionen, die ziemlich oberflächlich ist, und Sie erhalten auch eine Reihe von
hochrangigen Empfehlungen. Sie sollten zum Beispiel nach aktiven Investoren
in Ihrer Kategorie suchen. Sie sollten eine Zielliste erstellen. Sie sollten
sich an Ihr Netzwerk wenden,
um herzliche Einführungen usw.
zu erhalten Das Produktteam von Google
hat dafür einen Namen. Sie nennen es eine Blauprint-Antwort, eine übergeordnete Karte, die Ihnen
sagt, was Sie
suchen müssen , während Sie jeden Teil
der eigentlichen Arbeit Ihnen überlassen Sie sind immer noch einer, der
in 50 geöffneten Browser-Tabs ertrinkt und
versucht, das
Nutzsignal vom Rauschen zu trennen gründliche Recherche von Gemini
kann Ihnen helfen,
die Blaupause hinter sich zu lassen und etwas
sehr Umfassendes zu finden, auf das die Blaupause hinter sich zu lassen und etwas Sie
sofort reagieren können Deep Research ist nicht
nur ein intelligenterer Chatbot. Es ist ein agentisches System, das
heißt, es plant,
sucht selbstständig nach Gründen und fasst Informationen aus Hunderten
von Quellen Stellen Sie sich das so vor, als einen wissenschaftlichen Mitarbeiter auf Doktoratsniveau in Ihrem Team, der stundenlange
komplexe Untersuchungen innerhalb von Minuten
durchführt und mit einem ausgefeilten
Bericht
zurückkommt, nicht mit einer Aufgabenliste Was macht ein
wissenschaftlicher Mitarbeiter auf Doktoratsstufe tatsächlich in der Praxis für Sie? Lassen Sie mich Ihnen die drei
leistungsstärksten Anwendungsfälle vorstellen. Zunächst
geht es um das Verständnis des Themas, um komplexe Themen eingehend zu behandeln. Stellen Sie sich vor, Sie sind ein
Personalmanager, der versucht zu verstehen, wie sich KI in
den nächsten drei Jahren auf
die Belegschaft auswirken wird . Sie möchten nicht nur eine Zusammenfassung auf
oberflächlicher Ebene. Sie müssen
die Landschaft verstehen. Wie schneidet KI-Automatisierung im
Vergleich zur KI-Erweiterung ab? Welche Rollen sind am stärksten
gefährdet und welche entwickeln
sich weiter, was andere
Unternehmen bereits tun? Und was sagt die
Forschung im Vergleich zu dem
bloßen Hype aus? Tiefgründige
Recherche befasst sich
gleichzeitig mit wissenschaftlichen Arbeiten, Branchenberichten, Praxis Branchenberichten,
Expertenkommentaren und Fallstudien aus
der Das Ergebnis ist eine
strukturierte Analyse
, die die Landschaft kartografiert , konkurrierende Ideen
gegenüberstellt, die Beziehungen
zwischen Konzepten aufdeckt
und erklärt, warum all das steckt Zweitens die professionelle
Sorgfaltspflicht. Denken Sie darüber nach, sich auf ein Verkaufsgespräch für
Ihr Unternehmen vorzubereiten. Bevor Sie die Tür betreten, müssen
Sie die wichtigsten
geschäftlichen Herausforderungen
der potenziellen Kunden,
die jüngsten strategischen Schritte,
den Wettbewerbsdruck, dem
sie ausgesetzt sind,
und wissen wichtigsten
geschäftlichen Herausforderungen
der potenziellen Kunden, die jüngsten strategischen Schritte,
den Wettbewerbsdruck, dem
sie ausgesetzt sind, , wie Ihr Produkt
zu all dem passt. Gründliche Recherchen untersuchen
die Produkte des Unternehmens und
finden dabei die Geschichte, finden dabei die Geschichte, Führungsteam und das
Wettbewerbsumfeld heraus Und das ist sehr wichtig.
Kombiniert alles mit Ihren
eigenen internen Notizen zur Kundenbeziehung
, für deren Zusammenstellung
ein Junior-Analyst einen ganzen Tag gebraucht hätte ein Junior-Analyst einen ganzen Tag , ist jetzt in wenigen Minuten
fertig Sie gehen also in den
Besprechungsraum und wissen mehr über ihr Geschäft,
als sie vielleicht erwarten Drittens, viel auf dem Spiel,
persönliche Entscheidungen. Nicht alles dreht sich um
Arbeit, den Kauf eines Autos, Wahl einer Nachbarschaft und den
Vergleich von Versicherungsoptionen. Diese Entscheidungen sind genauso
wichtig, und die Recherche Rabbit Hole
ist genauso tiefgründig, anstatt ein verlorenes Wochenende durch widersprüchliche Blogbeiträge
und überfallene Threads zu verbringen.
Sie erhalten einen Bericht, der nach Ihrer spezifischen Situation,
den Vor- und Nachteilen
und den Nuancen strukturiert ist, die Ihnen generische
Ratschläge niemals geben Und genau das macht all diese drei Anwendungsfälle in
der Praxis
möglich Bei gründlicher Recherche erhalten
Sie nicht nur eine Linkliste. Es erstellt einen umfassenden
mehrseitigen Bericht,
strukturierte Analysen, zitierte Quellen
und sogar Dinge wie
Infografiken, und sogar Dinge wie die
die Daten zum Leben erwecken In der nächsten Vorlesung werden
wir es in die
Hände bekommen Ich zeige Ihnen, wie Sie eine gründliche Recherche
starten, wie Sie den
Forschungsplan erstellen, bevor er beginnt, und wir werden gemeinsam
ein reales Beispiel durchgehen ,
damit Sie
den gesamten Prozess von der
Aufforderung bis zum Abschlussbericht verfolgen können den gesamten Prozess von der
Aufforderung bis .
Ich treffe dich dort.
36. Deep Research in Aktion – Themenverständnis: Lassen Sie uns wie versprochen
tiefgreifende Forschung in Aktion erleben. Wir werden mit
dem Thema
Anwendungsfall verstehen beginnen und ich habe ein Beispiel ausgewählt, mit dem sich die meisten von uns
meiner Meinung nach persönlich
identifizieren können. Wir werden gründliche
Recherchen durchführen, um eines der verwirrendsten
Themen des täglichen Lebens zu lösen. Frühstück, Ernährung,
du kennst das Gefühl. Sie googeln RX gesund und erhalten zehn völlig unterschiedliche
Antworten, je nachdem
, auf welchem Artikel Sie landen, um dieser Demo zu
folgen Sie benötigen einen
kostenpflichtigen Gemini-Plan Wenn du derzeit einen kostenlosen
Tarif hast und ein Upgrade durchführen möchtest, schau dir die Lektion im Einführungskurs an, in der ich dir zeige,
wie das geht Okay, lass uns gehen. Um Deep Research zu starten, öffne einen neuen Chat und wähle Deep Research aus
der Liste der Tools aus. Standardmäßig verwendet Gemini Google-Suche als
Hauptquelle Aber du kannst das erweitern. Sie können beispielsweise Ihr Gmail oder
Google Drive als Quelle
auswählen oder Ihre eigenen Dateien hochladen. Das ist es, was tiefgründige
Forschung so mächtig macht. Es geht nicht nur darum, im Internet zu suchen. Es kann öffentliche Informationen
mit Ihren eigenen privaten Dokumenten zusammenführen . Für diese Demo werden wir
es einfach halten und
nur die Websuche verwenden . Hier ist die Eingabeaufforderung, die
ich verwenden werde. Beachten Sie, wie spezifisch
diese Aufforderung ist. Wir fragen nicht nur: Was soll ich zum Frühstück essen? Wir betreiben gründliche Forschung, eine klare Forschungsagenda
mit drei unterschiedlichen Aufgaben. Je mehr Anweisungen
Sie im Voraus geben, desto nützlicher ist das Ergebnis. Was die Modellauswahl hier anbelangt, die fachliche Analogie, die
wir zu Beginn
des Kurses eingeführt haben bleibt
die fachliche Analogie, die
wir zu Beginn
des Kurses eingeführt haben, genau
dieselbe , wenn Sie
gründliche Recherchen aktivieren Der Modus, den Sie wählen,
bestimmt, wie sich dieser Spezialist während
des Forschungsprozesses verhält Schnell bleibt Ihr Sprinter, der einen umfassenden Schnellscan
der relevantesten
Quellen
durchführt, einen umfassenden Schnellscan
der relevantesten
Quellen
durchführt um Ihnen
eine schnelle Zusammenfassung zu geben , ohne jedes Detail zu
untersuchen. Denken ist immer noch Ihr
Stratege, der sich ausgibt, um mehrere Quellen miteinander zu
vergleichen und
Widersprüche zu lösen, um einen logischeren mehrere Quellen miteinander zu
vergleichen und Blickwinkel zu
finden Pro bleibt Ihr Experte eingehend mit allem befasst,
von dichten Berichten und technischen PDFs bis hin zu
langen E-Mail-Threads, um Ihnen eine wirklich umfassende Zusammenfassung zu bieten Ihnen Ich entscheide mich hier für das Denken. Lassen Sie uns nun auf Senden klicken und
sehen, was zuerst passiert. Dies ist der Schritt zur
Zielzerlegung und einer meiner
Lieblingsteile des Prozesses Anstatt
direkt in die Forschung einzutauchen, pausiert die
eingehende Recherche und erstellt auf Aufforderung
einen personalisierten
mehrstufigen Forschungsplan Grundlage Ihrer Sie können sich
genau ansehen , was genau untersucht werden soll Bei Bedarf können Sie
diesen Plan bearbeiten, bevor er gestartet wird. Wenn Sie es auf
einen bestimmten Blickwinkel ausrichten, ein Unterthema
hinzufügen
oder etwas entfernen möchten , das für Sie
nicht relevant ist,
tun Sie dies jetzt, bevor eine
einzige Suche ausgeführt wird Für diese Demo bin ich
mit dem Plan, so wie er ist, zufrieden. Lassen Sie uns
ihn also genehmigen und laufen lassen. Und jetzt beginnt die Suche. Gemini arbeitet in Echtzeit mit
Quellen wie
wissenschaftlichen Arbeiten, Ernährung, Richtlinien und Gesundheitspublikationen Es entscheidet, welche
Bedrohungen
parallel untersucht werden
müssen und welche nacheinander auftreten müssen Sie können hier sogar auf eine
der Websites klicken, wenn Sie wissen möchten, welche Quellen
Gemini durchsucht Da Gemini Deep Research jede Quelle
liest, sammelt
es nicht nur
Informationen und geht dann weiter Es denkt darüber nach
, wonach es als Nächstes suchen soll. Es führt einen kontinuierlichen Prozess der
Selbstkritik durch,
entdeckt Widersprüche
zwischen Quellen, weist auf vage oder
unbegründete Behauptungen
hin
und erkennt, wenn
ein Datensatz
einfach nicht
zusammenpasst. Man kann beobachten,
wie es seine
Forschungsrichtung in Echtzeit
anpasst, wenn neue Informationen eintreffen
und wenn es in eine Sackgasse gerät,
sagen wir, eine Studie befindet sich hinter einer
Paywall oder eine Website ist ausgefallen entdeckt Widersprüche
zwischen Quellen, vage oder
unbegründete Behauptungen
hin
und erkennt, wenn
ein Datensatz
einfach nicht
zusammenpasst und erkennt, wenn
ein Datensatz . Man kann beobachten,
wie es seine
Forschungsrichtung in Echtzeit
anpasst, wenn neue Informationen eintreffen
und wenn es in seine
Forschungsrichtung in Echtzeit
anpasst, wenn neue Informationen eintreffen
und wenn es in eine Sackgasse gerät, sagen wir, eine Studie befindet sich hinter einer
Paywall oder eine Website ist es hört nicht auf. Es leitet um und findet einen anderen
Weg zur gleichen Antwort. Es gibt noch eine weitere Sache, die dies in großem Maßstab ermöglicht Tiefgründige Recherchen
werden in einem Kontextfenster, dem IIs, dem Arbeitsspeicher, durchgeführt. In der Praxis
bedeutet das, dass Gemini jede einzelne Quelle, die es während der gesamten Sitzung gelesen
hat, im
Speicher speichert jede einzelne Quelle, die es während der gesamten Sitzung gelesen
hat, im
Speicher während der gesamten Sitzung gelesen
hat, im Nichts geht verloren oder wird vergessen
, wenn die Forschung wächst. Und das ist auch der Grund, warum spätere
Folgefragen so scharf sind. Ich verliere nie die Gefahr dessen,
was es bereits untersucht hat. Und Sie denken vielleicht schon
, dass Sie nicht da sitzen und zusehen müssen , wie das
alles passiert. Tiefgründige Forschung ist asynchron. Sie können den Tab schließen und
zu Ihrer Arbeit zurückkehren. Gemini wird Sie darüber informieren, wenn Ihr Bericht fertig ist Wenn Sie sich in der Web-App befinden, wird
neben dem Chat-Thread
in Ihrer Seitenleiste eine
Benachrichtigung angezeigt neben dem Chat-Thread
in Ihrer Seitenleiste Und wenn Sie die Gemini-App für
Mobilgeräte installiert haben, erhalten
Sie eine Push-Benachrichtigung
direkt auf Ihr Telefon Und ich habe gerade meins bekommen. Unser Bericht ist fertig. Gehen wir also zurück zu
Gemini, um einen Blick darauf zu werfen. Dies ist es, was gründliche Forschung liefert, und stellen Sie fest
, was nicht der Fall ist Es ist keine Linkliste. Es handelt sich nicht um eine Zusammenfassung mit
Stichpunkten. Es handelt sich um eine strukturierte,
mehrseitige Analyse mit zitierten Quellen,
organisierten Abschnitten
und tatsächlichen Schlussfolgerungen, auf die
Sie reagieren können . Die abgestufte Zutatentabelle nach der
wir gefragt haben, ist genau hier, Stufe eins, Stufe zwei
und Stufe drei,
klar, umsetzbar und
basiert auf Und falls Sie sich für eine der Quellen
interessieren, jeder Behauptung relevante Links Sie können sich durchklicken und die
Originalforschung selbst
lesen. Ich weiß nicht, wie es Ihnen geht, aber ich hätte
Stunden gebraucht, all
diese Ressourcen durchzulesen und den Bericht manuell
zusammenzustellen. Und es ist wichtig, dass gründliche Recherchen Ihr Urteilsvermögen nicht
ersetzen. Es leistet diese mühsame
Vorarbeit, damit
Ihr Urteilsvermögen
tatsächlich fundierter ist In unserer nächsten Vorlesung werden
wir uns eingehend einem persönlichen Kontext befassen und einige weitere Beispiele
durchgehen .
Wir sehen uns dort.
37. Umfassende Forschung in Aktion – Kaufentscheidungen: In dieser Vorlesung
werden wir uns zwei weitere Anwendungsfälle für
eingehende Recherchen
ansehen zwei weitere Anwendungsfälle für
eingehende Recherchen
ansehen , von denen
ich denke, dass Sie sie
in Ihrem eigenen Leben sofort nützlich
finden werden . Beim ersten geht es
darum , eine selbstbewusste
Kaufentscheidung zu treffen, und ich werde ein
Beispiel aus der Praxis verwenden. Beim zweiten geht es darum,
ein völlig neues Thema zu lernen. Ich werde dir etwas zeigen, was
ich noch nie gezeigt habe. Wie man aus einem ausführlichen
Forschungsbericht eine Infografik,
ein Quiz und Karteikarten
macht, ohne
die Gemini-Oberfläche für Tiefenforschung zu verlassen .
Lass uns anfangen Mein
Aura-Slip-Tracking-Ring ist kürzlich kaputt gegangen. Ich würde ihn gerne austauschen, bin mir
aber nicht sicher, ob ich einfach
den neuesten Ring derselben Marke kaufen oder ihn als
Chance nutzen
soll derselben Marke kaufen oder ihn als
Chance nutzen
soll , auf etwas Besseres
umzusteigen. Und es gibt eine
bestimmte Funktion ich mir seit Jahren wünsche. Stummer Alarm mit vibrierender
Schlafzykluserkennung, der Sie
tatsächlich
im richtigen Moment
Ihres Schlafzyklus weckt , nicht nur zu einer festen Lassen Sie uns als
unseren persönlichen
Einkaufsassistenten gründliche Recherchen nutzen , um
Online-Rezensionen und Artikel zu durchforsten Hier ist meine Aufforderung. Beachten Sie einige Dinge an
dieser Aufforderung. Es ist persönlich. Ich habe tiefgründige
Nachforschungen über meine Situation und
das, wonach ich suche, durchgeführt. Ich habe den Vibrationsalarm eingebaut, nicht nur, weil ich ihn haben will, sondern um zu sehen, ob Gemini die offensichtlichen Optionen
herausfiltern kann Bei den meisten beliebten Ringen gibt
es eigentlich keine Vibrationsmodelle. Eine einfache Suche
könnte mir also nur
eine Liste mit den zehn besten Ringen geben , die diese Anforderung
ignoriert Eine gründliche Recherche sollte das aufdecken. Die Aufforderung hat einen klaren
Rechercheplan mit drei Aufgaben und verlangt am Ende ein bestimmtes
Ausgabeformat,
eine Feature-Tabelle, was bedeutet, dass der Bericht
sofort verwendet werden kann, nicht nur die gesamte Textwand. Lassen Sie uns
aus einer Liste von Tools eine gründliche Recherche auswählen. Ich werde mich
hier auf die Suche als Hauptquelle verlassen und den
Denkmodus wählen. Und lass uns anfangen. Gemini hat diesen
Forschungsplan für mich vorbereitet, und ich
möchte
hier eine Änderung vornehmen . Dafür klicke ich auf Plan bearbeiten Als Nächstes gebe ich
die Änderung ein, die Gemini am aktuellen Plan vornehmen
soll Ich möchte, dass Gemini auch eine bestimmte Marke
in seine Recherchen einbezieht Wir sehen, dass die Liste der
Marken aktualisiert wurde. Ich bin jetzt mit diesem Plan einverstanden, also werde ich ihn genehmigen
und mit der Recherche beginnen. Und in ein paar Minuten ist
unser Bericht fertig. Lassen Sie uns das gemeinsam durchgehen. Sie können sehen, dass
gründliche Recherchen die
drei besten Kandidaten
identifiziert und sie anhand genau
der Kriterien
analysiert haben, nach denen ich gefragt habe, einschließlich des
intelligenten Vibrationsalarmsystems und die
Vergleichstabelle der Funktionen hier erstellt Dies ist die Art von Ausgabe
, für die normalerweise mindestens eine
Stunde Tippwechsel,
fertige Threads und die Analyse widersprüchlicher
Bewertungsseiten
erforderlich wären mindestens eine
Stunde Tippwechsel,
fertige Threads und die Analyse widersprüchlicher
Bewertungsseiten
erforderlich fertige Threads und die Analyse widersprüchlicher
Bewertungsseiten Ich habe es innerhalb von Minuten nach meiner
spezifischen
Situation und meinen Anforderungen strukturiert meiner
spezifischen
Situation und meinen Anforderungen Und hier ist die Liste der strategischen Empfehlungen
von Gemini Ein Hinweis, weil ich ihm im Voraus einen
persönlichen Kontext gegeben habe. Die Empfehlungen
sind nicht allgemein gehalten. Sie filtern es nach
meinen tatsächlichen Prioritäten. Gutes Preis-Leistungs-Verhältnis, kein großes
Abonnement und Ausrutscher, das funktioniert
tatsächlich. Dies ist ein hervorragendes Beispiel dafür fundierte Recherchen für
Kaufentscheidungen genutzt werden können. Anstatt in Optionen zu ertrinken, gehen
Sie mit einer klaren,
begründeten Auswahlliste nach Hause. Im zweiten
Teil dieses Tutorials werden
wir uns weiter mit eingehenden Recherchen für einen anderen
Anwendungsfall befassen , nämlich ACA dort
38. Deep Research in Aktion – Lernen eines neuen Themas: Schauen wir uns nun
etwas anderes an. Nutzen Sie gründliche Recherchen, um
Ihr Lernen zu beschleunigen , wenn Sie
sich mit einem neuen Thema befassen. Ich habe vor Kurzem angefangen,
Immobilieninvestitionen zu studieren. Ich habe meinen ersten
Kurs besucht und mir
einige Notizen zu den Themen gemacht , die wir dort behandelt haben. Jetzt möchte ich
mithilfe gründlicher Recherchen mehr
über diese Themen erfahren . Ich kann dieses Foto
direkt in die Eingabeaufforderung hochladen. Zwillinge Ich lese meine
handschriftlichen Notizen, extrahiere die wichtigsten Themen und verwende sie als Grundlage
für einen Forschungsbericht Ich muss nichts erneut
eingeben. Lassen Sie mich Ihnen zeigen, wie das funktioniert. Lassen Sie uns zunächst eine
gründliche Recherche aus
der Liste der Tools auswählen . Ich werde hier in den
Denkmodus wechseln, meine Eingabeaufforderung
eingeben und dann
meine handschriftlichen Notizen anhängen Was ich an
diesem Ansatz liebe, ist, dass die Forschung auf dem basiert , was ich bereits gelernt habe
. Der Bericht verstärkt
und erweitert also
mein vorhandenes Wissen,
anstatt bei Null anzufangen Aus diesem Grund habe ich Gemini
ausdrücklich
gebeten, des Berichts auf die wichtigsten
Themen in meinen Notizen Bezug Recherche und
Erstellung Und hier ist unser
Forschungsplan, für mich sehen alle toll aus, also klicke ich auf Recherche starten Und unser Bericht ist fertig. Sie können sehen, dass er
alle wichtigen Themen aus
meinen Notizen aufgegriffen und darauf aufbauend eine strukturierte
Analyse erstellt hat. Definitionen, Kontext, Beziehungen zwischen Konzepten,
praktische Implikationen. Wir können diese Informationen
als Studienbegleiter verwenden, nicht nur als Zusammenfassung. Aber hier
wird es wirklich interessant. Sobald der ausführliche
Forschungsbericht fertig ist, können
wir diese
Textwand in aktive Lernwerkzeuge umwandeln . Sie werden feststellen, dass in
der oberen rechten Ecke
des Canvas-Bedienfelds eine Schaltfläche
erstellt wurde. Wenn Sie darauf klicken, wird
ein Drop-down-Menü mit verschiedenen Optionen zur
Transformation des Berichts angezeigt. Schauen wir uns zunächst die
Infografiken an. Gemini nimmt die
komplexen Informationen wie den Unterschied zwischen Wohn- und
Industrieanlagen in unserem Immobilienbeispiel und verwandelt sie in
eine Dies ist perfekt für eine schnelle Überprüfung auf
hoher Ebene oder für gemeinsame Nutzung eines Pagers
mit einem Kehren wir zu unserem
Bericht über
Immobilieninvestitionstrends zurück, um die Demo fortzusetzen Als Nächstes können
wir ein Quiz erstellen, um sicherzustellen, dass die
Informationen tatsächlich Bestand haben. Gemini erstellt
interaktive Fragen speziell
auf dem Bericht
basieren Sobald Sie antworten, erhalten Sie
sofort Feedback, sodass Sie
genau erkennen können, an welchen Stellen Ihr Verständnis eines neuen
Themas möglicherweise mehr Arbeit erfordert I Und schließlich haben
wir Karteikarten Sie haben zwei Möglichkeiten, dies zu verwenden. Sie können einen ganzen Satz
Karteikarten erstellen , um jeden
Schlüsselbegriff aus dem Bericht zu überprüfen Wenn Sie das Quiz jedoch gerade
abgeschlossen haben, wie in unserem Beispiel hier, kann
Gemini Karten
speziell auf Grundlage
Ihrer Quizergebnisse generieren speziell auf Grundlage
Ihrer Es zielt auf die Bereiche ab, in denen
Sie Probleme hatten. Lass uns das machen Wir sehen hier also eine komplette
Lernschleife, recherchieren, verstehen,
testen und Ihr Wissen vertiefen —
alles
in einem Tool. Im nächsten Video werden
wir von der
gründlichen Recherche weitermachen und es erneut aufgreifen, werden
wir von der
gründlichen Recherche weitermachen bis Sie
es bereits wissen, aber wir werden die
fortgeschrittenen Anwendungsfälle untersuchen, insbesondere die Entwicklung von
KI-Anwendungen Und als Vorwarnung Wir werden die
wichtigsten Erkenntnisse aus einem
unserer ausführlichen Forschungsberichte
als Eingabedaten verwenden , Grundlage
unsere App aufgebaut wird. Und mehr dazu
im nächsten Video.
39. Mehr als Dokumente: Was kann Canvas noch?: Willkommen zurück. In unserer
letzten Canvas-Vorlesung haben wir uns also auf das Verfassen von Dokumenten konzentriert. Wie Canvas Ihnen
einen Raum für Leben und Arbeit bietet, Schreiben
verfeinern können,
während Zwillinge direkt neben Ihnen stehen Aber das Verfassen von Dokumenten ist erst der Anfang dessen,
was Canvas kann Und Sie haben bereits
einiges davon gesehen , ohne es zu merken. Denken Sie daran, dass die
Schaltfläche zum Erstellen, die
nach Ihrem ausführlichen
Forschungsbericht auftauchte , Radium war, die Infografiken, das Quiz, die Karteikarten, das Deep Research stellt seinen
Bericht direkt in Canvas bereit, weshalb Sie ihn in
all diese Formate
umwandeln konnten , ohne
jemals Deep Research und
Canvas sind von
Natur aus miteinander verbunden Google hat sie so konzipiert , dass sie nahtlos
ineinander übergehen. Schauen wir uns also das
Gesamtbild dessen an, was Canvas kann. Das Erste, was Canvas
über Dokumente hinaus erstellen kann , sind Webseiten. Und ich meine nicht einfaches
HTML mit etwas Text drauf. Ich meine strukturierte interaktive Seiten mit
Informationskarten, Diagrammen, visuellen Layouts
und anklickbaren Elementen Denken Sie an das letzte Mal, als
Sie einen Bericht oder
ein Briefing mit jemandem
teilen mussten ein Briefing mit jemandem der keine Textwand lesen
wollte Mit Canvas können Sie denselben Inhalt nehmen
und sagen, daraus eine Webseite machen oder einfach auf die
Webseitenschaltfläche klicken. Und innerhalb von Sekunden haben Sie etwas, das tatsächlich wie eine echte Seite
aussieht. Sie können es mit dem Link teilen. Keine Veröffentlichungs- oder
Hosting-Einrichtung erforderlich. Als Nächstes folgen Infografiken. Wenn Sie jemals
versucht haben, einem nicht
technisch versierten Interessenvertreter
etwas Komplexes zu erklären ,
einen Prozess, einen Vergleich oder einen
Entscheidungsrahmen, dann
kennen Sie Worte können nur so viel bewirken. Canvas kann Ihren Rohinhalt nehmen und ihn
in ein visuelles Format umstrukturieren Saubere Abschnitte,
verdauliche Teile,
Symbole, Vergleich nebeneinander Und Sie können
es in derselben Tabelle weiter verfeinern. Vergrößern Sie den zweiten Abschnitt, ändern Sie den Ton, sodass
er weniger formell ist, und er wird in Echtzeit aktualisiert Drittens kann Canvas auch
interaktive Quizze
und Karteikarten
aus
beliebigen Inhalten generieren interaktive Quizze
und Karteikarten aus
beliebigen Inhalten Das ist über das bloße Lernen hinaus
nützlich. Denken Sie an das Onboarding von Kunden, Teamschulungen und
Produktwissenschecks. Sie beschreiben, was
Sie wollen, und
erstellen auf Canvas ein funktionierendes
interaktives Quiz. Kein Drittanbieter-Tool, kein Form Builder, keine zusätzlichen Schritte. Es gibt auch einen Audiomodus. Canvas kann
geschriebene Inhalte
in eine
Audioübersicht im Podcast-Stil umwandeln , Konversation zwischen
zwei KI-Moderatoren , die Ihr Material besprechen und
zusammenfassen Dies ist nützlich, wenn Sie während der Arbeit ein langes
Dokument
durchgehen
oder Ergebnisse
mit Leuten teilen möchten während der Arbeit ein langes
Dokument
durchgehen , die
lieber zuhören als lesen möchten.
Willkommen zurück zum Deep Dive Heute packen wir eine
Vision aus, die sich anfühlt, als würde sie sich wirklich
unter unseren Füßen verschieben Wir haben
die alte Vorstellung von
einem intelligenten Assistenten hinter uns gelassen, der einfach Timer
einstellt oder Musik spielt Wir schauen uns dieses Konzept
eines universellen Assistenten an. Ein Partner, der
tatsächlich vorhersieht was Sie brauchen, bevor
Sie überhaupt danach fragen Und dann ist da noch die
große Sache, mit der Canvas voll funktionsfähige
Apps, funktionierende Software,
erstellen kann voll funktionsfähige
Apps, funktionierende Software,
erstellen Sie beschreiben, was Sie wollen, Rezeptorganisator, Reiseplaner oder Quiz-Tool oder Budget-Tracker, und Canvas generiert den
Code und führt ihn für Sie aus. Genau dort im Fenster sehen
Sie den Code nicht. Sie müssen den Code nicht
verstehen. Sie sehen nur eine funktionierende
interaktive App, und sie ist nicht statisch. Sie können weiter
mit Gemini chatten, um es anzupassen. Das wird
als Vibe-Coding bezeichnet. Erstellen Sie Software, indem Sie
beschreiben, was Sie wollen, anstatt
Code Zeile für Zeile zu schreiben Wir haben dieses Konzept in
der Vorlesung „Geni
Implementation Implementation Impact“ des Kurses angesprochen der Vorlesung „Geni
Implementation Implementation Impact“ des Kurses Und jetzt sind wir dabei
, es live zu erleben. Folgendes liebe ich in diesem Zusammenhang
an Canvas am meisten. Es ist kein separates
Entwicklertool. Es ist derselbe Arbeitsbereich, den
Sie bereits zum Schreiben von
Dokumenten und Gliederungen
verwendet haben. Der Wechsel vom Entwurf
eines Dokuments zur Erstellung einer App für mich ist
nur eine Konversation. In unserer nächsten Vorlesung werden
wir genau das tun. Wir werden
genau da weitermachen, wo wir aufgehört haben. Wir haben gründliche Nachforschungen
angestellt, um endlich eine klare, auf Fakten basierende Antwort
auf die Ernährung beim Frühstück zu erhalten. Und wir werden diese Forschung in eine
Rezept-App für Familienfrühstücke umwandeln, die gesunde schnelle Mahlzeiten
für Erwachsene und Kinder
vorschlägt. Lass uns das aufbauen.
40. Folge-Along: Erstellen einer App mit Canvas – Von der Forschung zur ausführlichen App: Willkommen zurück. Hier
bauen wir den Frühstückschef auf, schnelle Mahlzeiten unter 20 Minuten, familienfreundlich mit Fotos
der fertigen Mahlzeit. Alles in Gemini Canvas, kein Code, kein technischer
Hintergrund erforderlich Nur eine gute Aufforderung und ein bisschen Hin und Her mit
Gemini. Lass uns gehen Um unseren Arbeitsablauf zu organisieren, folgen
wir
vier einfachen Schritten ID Eight, Erstellen, Verfeinern
und schließlich Teilen. Und hier ist Schritt eins, iDED. Dies ist unser ausführlicher
Forschungsbericht zur Frühstücksernährung. Lassen Sie uns mit Gemini ein Brainstorming über die Idee hinter dem Verstärker durchführen
und darüber, was er bewirken wird Ich habe einige erste Gedanken, aber ich möchte sie näher erläutern Ich habe zunächst
den Zweck der App beschrieben. Ich habe auch gesagt, dass ich möchte die App die
Forschungsergebnisse nutzt, und ich habe auf
das umfassende
TireedGrocery-Framework aus
dem Bericht verwiesen das umfassende
TireedGrocery-Framework aus
dem , um zu betonen
, dass ich keine zufällige Zutatenliste
für die Rezepte benötige zufällige Zutatenliste
für die Rezepte Ich möchte, dass Gemini sich drei
coole
Funktionen für die App einfallen lässt, und ich schlage auch ein
Aviall-Look-and-Feel Ich habe hier einige beschreibende
Worte wie lustig, warmherzig,
zugänglich eingefügt, um mir
die Richtung
für das vorzugeben , was Ich suche nach einer detaillierten
Beschreibung der App. Das Konzept, auf dem wir mit dem
Aufbau der eigentlichen App beginnen können. Drücken wir die Eingabetaste. Und hier haben wir unsere
App-Beschreibung. Bitten wir Gemini, einige
Änderungen an diesem Konzept vorzunehmen. Die erste Funktion, der
Frontloader-Familientimer, scheint ziemlich komplex zu sein, insbesondere für die erste
Version der App Bitten wir Gemini also, es durch etwas
Einfacheres
zu ersetzen . Einfache Frage, welche Art
von Mahlzeit heute bevorzugt wird. Und ich füge zusätzliche
Details hinzu, um
sicherzustellen , dass
wir jedes Mal, wenn
wir nach einem Rezept fragen, ein neues bekommen und
dass die App
ausschließlich die in unserem Bericht
empfohlenen Zutaten verwendet. Also drücke ich
erneut die Eingabetaste und lass uns sehen, wie Gemini diese
Änderungen übernimmt Und hier haben wir
die aktualisierte Version der App-Beschreibung Ich bin bereit,
mit diesem Konzept weiterzumachen, aber bevor wir mit Schritt zwei, der
Erstellung der App, fortfahren, müssen wir
unsere Einstellungen überprüfen . Schauen Sie sich die
Modellauswahl hier P könnte Sie in Versuchung führen.
Darin steht fortgeschrittene Mathematik und Programmieren Es klingt also nach der
mächtigsten Wahl. Aber hier ist, was ich
herausgefunden habe, als ich
beide getestet habe , als ich diese
Frühstücks-App zuvor erstellt habe. Pro hat
den Prozess tatsächlich schwieriger gemacht. Es dauerte mehr Hin und Her,
um die gewünschten Ergebnisse zu erzielen, und ich habe
meine P Credits schnell aufgebraucht, sodass ich einige Stunden warten musste,
bis ich weitermachen konnte. Der Denkmodus hat
mich schneller ans Ziel gebracht. Also hier ist meine Empfehlung. Beginne immer mit Denken. Es ist darauf ausgelegt, Schritt für
Schritt zu denken, was genau
das ist, was die Erstellung von
Apps erfordert Du arbeitest dich durch Logik,
Struktur und Ablauf und
spare Pro für den Fall, dass deine
App mit
einer großen Menge an Inhalten
aus verschiedenen Quellen,
Dokumenten, Videos,
Bildern und mehr arbeiten muss einer großen Menge an Inhalten
aus verschiedenen Quellen,
Dokumenten, Videos,
Bildern und mehr Beginnen wir mit Schritt
zwei, dem Erstellen der App. Meine bisherigen Tests haben
gezeigt, dass
Gemini nicht mit dem Erstellungsprozess beginnt,
sondern Ihnen die
Beschreibung
des App-Konzepts noch einmal sendet, wenn Sie
diese Anfrage direkt in diesem Chat Gemini nicht mit dem Erstellungsprozess beginnt,
sondern Ihnen die
Beschreibung
des App-Konzepts noch einmal sendet, senden Ja, genau das ist auch
dieses Mal passiert. Sie sehen, dass
Gemini,
anstatt die App
zu erstellen, nur einige Änderungen am Bericht selbst vorgenommen hat, und das ist nicht das, was wir brauchen Um also mit der Erstellung der
App-Software nicht nur mit der Textbeschreibung zu beginnen, klicken Sie auf den
Abschnitt Erstellen und beschreiben Sie Ihre eigene App und schreiben Sie Erstellen Sie eine App auf
der Grundlage der obigen Beschreibung. Sie sehen, dass Gemini
diesen Befehl unter unserer
App-Beschreibung hier anzeigt diesen Befehl unter unserer
App-Beschreibung hier und mit der Erstellung beginnt Und während Gemini die App
erstellt, möchte ich eine Frage beantworten, die Sie
sich wahrscheinlich gerade Was ist, wenn ich nicht
von einem ausführlichen Forschungsbericht ausgehe? Was ist, wenn ich einfach eine App von Grund auf neu
erstellen möchte? Öffnen Sie in diesem Fall zunächst einen neuen Chat. Bevor Sie jedoch etwas eingeben, wechseln Sie
zuerst in den Canvas-Modus. Hier ist der Grund. Gemini kann Apps nur in Canvas erstellen und
ausführen. Es ist ein spezieller Arbeitsbereich speziell dafür entwickelt wurde Ein regelmäßiger Chat kann
Ihnen helfen, Ideen zu durchdenken, aber er kann keine funktionierende App
erstellen. Sobald du in Canvas bist, deine
App-Idee mit Gemini
brainstormen Beschreiben Sie, was Sie erstellen möchten, wofür es gedacht ist und
was es tun soll Wenn Sie bereit sind, mit dem Bauen
zu beginnen, klicken Sie auf die Schaltfläche Erstellen, geben Sie Ihre Eingabeaufforderung ein, und Gemini macht sich an die Arbeit Okay, zurück zu unserer Demo. Und unsere App ist fertig. Wir wählen zunächst aus, wie wir uns heute
fühlen und welche Art
von Mahlzeit wir bevorzugen würden. Und Gemini würde eine gesunde Mahlzeit
vorschlagen. Dementsprechend sehen wir hier
eine Zutatenliste, gefolgt von
Anweisungen zur Zubereitung der Mahlzeit Wir haben den tollen Schaum veranschaulicht, was wir gleich
essen werden Und wir können auch
einen Kinderkochmodus wählen
, sodass wir eine Liste mit Aufgaben
für unsere jungen Helfer haben Ziemlich süß. Gehen wir nun
zum dritten Schritt über, verfeinern. Wie Sie sich vorstellen können, sind
wir hier noch nicht fertig. Wir können unsere App weiter iterieren
und verbessern. Nehmen wir an, ich möchte ein paar Dinge
anpassen. Ich gebe meine Anfragen
in den Chat ein. Sie haben gerade gesehen, wie ich
mehrere Änderungen an unserer App vorgenommen habe. Wenn Sie dies tun, führen Sie
jeweils eine Änderung ein, anstatt zu versuchen alles in
eine einzige Aufforderung
aufzunehmen. Lassen Sie mich einige andere
Änderungen an unserer App vornehmen. Hier ist die Version
, die ich bisher habe. Ich habe beschlossen, die
Möglichkeit hinzuzufügen, zusätzlich
zur vordefinierten Liste
weitere Zutaten aufzunehmen . Und falls es
sich um ein Produkt der dritten Kategorie handelt, wird eine
entsprechende Meldung angezeigt, aber das Rezept
wird trotzdem erstellt. Ich habe auch die
Möglichkeit hinzugefügt , ein Rezept
in den Favoriten zu speichern, die hier zugänglich sind. Und schließlich habe ich den
Reset-Button hinzugefügt, falls wir vorne beginnen und
verschiedene Zutaten auswählen
möchten noch einmal von vorne beginnen und
verschiedene Zutaten auswählen
möchten. Wie Sie sehen können,
konnten wir eine Menge Änderungen vornehmen, indem wir einfach beiläufig mit
Gemini chatten , ohne dass eine Codierung erforderlich Ich bin mit unseren
aktuellen Fortschritten
und der Benutzererfahrung, die
wir geschaffen haben, zufrieden und der Benutzererfahrung, die
wir geschaffen haben Im zweiten
Teil dieses Tutorials zeige
ich Ihnen eine weitere
Möglichkeit, wie Sie mithilfe
der Canvas-Symbolleiste
Änderungen an Ihrer App vornehmen können . Und wir werden uns auch
ansehen , wie Sie es mit anderen teilen können. Wir sehen uns im zweiten Teil.
41. Weiterführende Schritte: Erstellen einer App mit Canvas – Verfeinern und Freigeben: Jeder. Willkommen zum
zweiten Teil des Tutorials, in dem wir untersuchen, wie man funktionierende Software
erstellt, indem beschreiben, was wir wollen anstatt
Code Zeile für Zeile zu schreiben,
den Prozess, der wie versprochen als
Vibe-Codierung bekannt ist.
Ich möchte Ihnen im
Rahmen unseres verfeinerten Schritts
eine weitere Option zeigen, mit der Sie
Änderungen an Ihrer App vornehmen mit der Sie
Änderungen an Ihrer App Beachten Sie diese Gemini
Canvas-Symbolleiste. Lassen Sie uns herausfinden, was
sie für uns tun kann. Fangen wir mit
diesem funkelnden Symbol an. Dies ist der AI-Feature-Injector. Es erweitert Ihre App
um EI-Funktionen. Wenn Sie darauf klicken, analysiert
Gemini Ihre aktuelle App-Ansicht und
schlägt intelligente Komponenten vor, z. B. eine
KI-Speicherleiste oder die Text- und Bilderzeugung. Anschließend fügt es diese
Elemente direkt
in die Logik Ihrer App Lassen Sie uns Gemini bitten,
KI-Funktionen hinzuzufügen, und sehen wir uns an, wie das funktioniert. Im Chat auf der linken Seite bietet
Gemini einen Überblick darüber, welche KI-Funktionen der App
hinzugefügt wurden Wir können im Chat antworten und Gemini bitten,
weitere Änderungen vorzunehmen Aber lassen Sie uns zuerst diese neuen Funktionen
ausprobieren. Hier ist das magische
Feature Nummer zwei. Wir sehen, dass Gemini Ich
mehr
gesundheitsfördernde Inhaltsstoffe vorgeschlagen mehr
gesundheitsfördernde Inhaltsstoffe die, die ich gerade ausgewählt habe, aber ich habe sie momentan nicht, also klicke ich einfach auf Abbrechen und mache mit diesen drei
weiter Hier ist die
EI-Weisheitskarte ziemlich nett. Und lassen Sie uns natürlich
ausprobieren, wie der
Audio-Erzähler funktioniert Steh auf und strahle.
Die heutige Mission ist die Sonnenseite mit Spinat
- und Avocado-Wolken. Der eisenreiche Spinat Kombination mit monogenen und
gesättigten Fetten aus Avocado sorgt für einen
sauberen Energieschub , sodass Sie sich
flink und erfrischt fühlen Lassen Sie uns eine Änderung an
einer der Funktionen vornehmen. Gemini bestätigt, dass die
Änderung vorgenommen wurde Lassen Sie uns sie testen Atme tief durch und
lass uns den Tag beginnen. Ihr heutiges Rezept ist
das Emerald Cloud Nest. Die Kombination aus eisenreichem
Spinat und einfach ungesättigten Fetten aus Avocado sorgt für
eine langsame Energiefreisetzung, sodass Sie sich leicht und luftig fühlen. Wasson, wir haben gerade gesehen, wie Gemini
unseren Anweisungen gefolgt ist,
und ich schlage vor, dass wir zur
Gemini Canvas-Symbolleiste zurückkehren und Das nächste, was ich hören kann,
ist der Ziehgriff. Es wird verwendet, um
das Atolbr so zu verschieben, dass es Navigation Ihrer App während der Verkostung
nicht blockiert Und es gibt noch ein drittes
Symbol, das Verfeinerungstool,
das Gemini anweist, ein bestimmtes
Element Ihrer App zu ändern Sie haben vielleicht bemerkt, dass
es hier
in unserer Golden Hour App nicht sichtbar in unserer Golden Hour Das ist eigentlich beabsichtigt. Gemini ist sich bewusst, dass diese App genügend Iterationen durchlaufen
hat, sodass kleine automatisierte
Änderungen riskant sein Wenn es versucht,
ein Element zu optimieren , aber den Kontext
falsch interpretiert, könnte
es etwas
anderes kaputt machen, könnte
es etwas
anderes kaputt machen Daher wird das Symbol als
Schutzmaßnahme ausgeblendet ,
um zu demonstrieren, wie das Verfeinerungstool Wechseln wir zu einer einfacheren App. Ich habe mit dem Bauen begonnen, bevor ich dieses Tutorial
aufgenommen habe. Ich habe dort nur ein
paar Iterationen gemacht, daher ist das Symbol verfügbar Nehmen wir an, ich möchte
die Farbe dieser Schaltfläche ändern. Also wähle ich „Auswählen und fragen“, markiere diese Schaltfläche
und gebe meine Aufforderung ein, eine andere Farbpalette
vorzuschlagen. Mir ist aufgefallen, was hier passiert ist. Anstatt
nur diese Schaltfläche und die
Farbe zu ändern, hat Gemini
die gesamte App neu gestaltet. Warum ist das so? Es stellt sich heraus, dass das Wort
Palette hier das Problem ist. Eine Farbpalette bezieht sich auf den gesamten Farbsatz, der in Ihrer App
verwendet wird. Gemini nimmt das also wörtlich und aktualisiert
alles entsprechend Es macht nichts falsch. Es folgt nur genau Ihren
Anweisungen. Um nur die
Farbe dieser Schaltfläche zu ändern, müssen
Sie
den Umfang der Änderung klar beschreiben .
Lassen Sie mich zeigen, wie. Ich drücke erneut auf die Schaltfläche und tippe eine weitere Aufforderung ein. Sie sehen, dass meine detaillierte Eingabeaufforderung funktioniert
hat, und dieses Mal Gemini I die Änderungen auf das Element angewendet ,
das ich mit dem
Verfeinerungswerkzeug angegeben habe Es ist wirklich nützlich, das im
Hinterkopf zu behalten. Je spezifischer Ihre Aufforderung ist, desto genauer ist das Ergebnis. Kommen wir zurück zu
unserer Golden Hour App. Jetzt haben wir uns damit befasst, wie Sie Ihre App
verfeinern und anpassen können. Lass uns darüber sprechen, was passiert
, wenn du damit zufrieden bist. Schritt vier: Teilen. Sobald Sie fertig sind, können Sie
einen Link erhalten , den Sie teilen können, und ihn
an jeden senden Sie können die
App direkt im Browser öffnen und verwenden. Keine Downloads, keine Schilder, kein technisches Setup auf ihrer Seite. Sie können es sogar remixen. Das ist eine der Funktionen, die
Google in Canvas integriert hat. Jemand kann
deine App nehmen, sie öffnen und daraus seine eigene
Version erstellen. Ordnung. Und das
war's für dieses Tutorial Bitte teilen Sie im Q & A-Bereich
für dieses Video mit,
an welchen
Apps Sie gerade arbeiten im Q & A-Bereich
für dieses Video mit,
an Ich würde gerne sehen,
was du baust.