Gemini Google AI: Die einzige KI, die alles erledigt (Bilder, Videos und Text) | Anna Kolenkina | Skillshare

Playback-Geschwindigkeit


1.0x


  • 0.5x
  • 0.75x
  • 1x (normal)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Gemini Google AI: Die einzige KI, die alles erledigt (Bilder, Videos und Text)

teacher avatar Anna Kolenkina, Product Builder, Entrepreneur

Schau dir diesen Kurs und Tausende anderer Kurse an

Erhalte unbegrenzten Zugang zu allen Kursen
Lerne von Branchenführern, Ikonen und erfahrenen Experten
Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Schau dir diesen Kurs und Tausende anderer Kurse an

Erhalte unbegrenzten Zugang zu allen Kursen
Lerne von Branchenführern, Ikonen und erfahrenen Experten
Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Einheiten dieses Kurses

    • 1.

      Willkommen zum Kurs zu Google Gemini AI!

      3:06

    • 2.

      Was ist Gemini? Das KI-Ökosystem von Google verstehen

      5:57

    • 3.

      Lernen Sie die Gemini-Modellfamilie kennen

      4:38

    • 4.

      Einrichten von Gemini und Ihres ersten Chats

      4:53

    • 5.

      Wie man Gemini zu besseren Ergebnissen motiviert: Abschnitt Intro

      1:39

    • 6.

      Was ist ein Prompt? Aufforderung, Prompt Engineering, persönliche und Produktionsaufforderungen

      4:59

    • 7.

      So kommunizieren Sie mit Google Gemini AI Die Bausteine einer effektiven Eingabeaufforderung

      7:57

    • 8.

      Auf den Antworten von Gemini aufbauen: Iterative Aufforderung

      5:54

    • 9.

      Gemini ganz zu Ihnen machen: Personalisierung

      7:14

    • 10.

      So teilen Sie Dateien und andere Inhalte mit Google Gemini AI

      9:20

    • 11.

      Verwenden von Beispielen in Ihren Eingabeaufforderungen

      10:37

    • 12.

      Festlegen des Ausgabeformats in Gemini

      4:46

    • 13.

      Folge-Along: Auswahl des richtigen Modells und Brainstorming mit Gemini

      9:43

    • 14.

      Weiterverfolgen: Feedback mit Google Gemini AI erhalten

      8:48

    • 15.

      Keeping It Real: Praktische Strategien zur Minimierung von KI-Halluzinationen

      10:12

    • 16.

      Arbeiten mit Gemini Canvas und Gems: Abschnitt Intro

      1:38

    • 17.

      Willkommen bei Gemini Canvas

      3:39

    • 18.

      Weiterführende Schritte: Erstellen und Bearbeiten von Dokumenten in Gemini Canvas (Teil 1)

      5:38

    • 19.

      Weiterführende Schritte: Erstellen und Bearbeiten von Dokumenten in Gemini Canvas (Teil 2)

      5:42

    • 20.

      Weiterführende Schritte: Umwandeln eines Gemini-Entwurfs in ein poliertes PDF mit Gamma

      9:29

    • 21.

      Was sind Gemini Gems und warum brauchen wir sie?

      5:34

    • 22.

      Weiterlesen: Erstellen eines Juwels zur Grammatikprüfung

      10:10

    • 23.

      Weiterlesen: Aufbau eines Juwels für Fitnesstrainer (Teil 1)

      7:23

    • 24.

      Weiterlesen: Aufbau eines Juwels für Fitnesstrainer (Teil 2)

      4:46

    • 25.

      Gemini für visuelle Kreationen: Abschnitt Intro

      2:11

    • 26.

      Was ist eine Nano-Banane? Erläuterung der wichtigsten Funktionen

      6:42

    • 27.

      Erstellen Sie Ihr erstes Image mit Gemini

      7:05

    • 28.

      7 Tipps für bessere Visualisierungen

      6:17

    • 29.

      Kontextbezogene Zusammenführung, iterative Renementierung, visuelle Synthese

      7:50

    • 30.

      Die Bearbeitungssuite: Umwandlung von Skizzen in Prototypen und Fotorestaurierung

      4:14

    • 31.

      Die Editing Suite: Gezielte Bearbeitung mit dem Markup-Tool und externen Anmerkungen

      6:30

    • 32.

      Komplexe Visualisierungen: Menüs, Diagramme und Infografiken

      6:15

    • 33.

      Komplexe Visualisierungen: Anpassung von Assets für verschiedene Formate und Plattformen

      4:32

    • 34.

      Mehr als Chatten – Tiefgreifende Forschung und Entwicklung mit Gemini: Abschnitt Intro

      1:25

    • 35.

      Detaillierte Forschung: Antworten über Blueprint-Lösungen hinaus

      5:48

    • 36.

      Deep Research in Aktion – Themenverständnis

      8:54

    • 37.

      Detaillierte Forschung in Aktion – Kaufentscheidungen

      5:23

    • 38.

      Deep Research in Aktion – Lernen eines neuen Themas

      5:28

    • 39.

      Mehr als Dokumente: Was kann Canvas noch?

      6:08

    • 40.

      Follow-Along: Erstellen einer App mit Canvas – Von der Forschung zur ausführlichen App

      9:30

    • 41.

      Weiterverfolgen: Erstellen einer App mit Canvas – Verfeinern und Freigeben

      6:57

  • --
  • Anfänger-Niveau
  • Fortgeschrittenes Niveau
  • Fortgeschrittenes Niveau
  • Jedes Niveau

Von der Community generiert

Das Niveau wird anhand der mehrheitlichen Meinung der Teilnehmer:innen bestimmt, die diesen Kurs bewertet haben. Bis das Feedback von mindestens 5 Teilnehmer:innen eingegangen ist, wird die Empfehlung der Kursleiter:innen angezeigt.

30

Teilnehmer:innen

--

Projekte

Über diesen Kurs

Sind Sie es leid, für verschiedene kreative Aufgaben zwischen mehreren KI-Tools hin und her zu wechseln? Was wäre, wenn Sie mit einer KI arbeiten könnten, die Text versteht, Bilder analysiert, Videos verarbeitet und sich nahtlos in die Tools integrieren lässt, die Sie bereits täglich verwenden?

Lernen Sie Google Gemini AI kennen – das Tool, das die Arbeitsweise von Kreativen mit mehreren Content-Formaten verändert.

Mit über 750 Millionen Nutzern pro Monat (und in vielen Märkten wächst das Wachstum schneller als ChatGPT) ist Gemini nicht nur ein weiterer KI-Chatbot – es ist Ihr kreativer Partner, der in Gmail, Google Docs, Chrome und Ihrem Telefon lebt. KI trifft Sie dort an, wo Sie bereits arbeiten.

Was macht diese Klasse anders:

Dies ist kein technischer KI-Kurs. Es ist ein kreatives Toolkit für alle, die schneller bessere Inhalte erstellen, beeindruckende visuelle Elemente erstellen und Ideen in die Realität umsetzen möchten – und das alles ohne technische Kenntnisse.

In diesem praktischen Kurs lernen Sie, wie:

Erstellung multimodaler Inhalte:

  • Analysieren Sie Bilder und erhalten Sie kreatives Feedback zu Ihrer visuellen Arbeit
  • Videos verarbeiten, um Erkenntnisse, Zusammenfassungen und Inhaltsideen zu extrahieren
  • Kombinieren Sie Text, Bilder und Kontext auf eine Weise, die ChatGPT einfach nicht kann.
  • Erstellen Sie KI-Visuelle Elemente direkt in Ihrem Workflow

Kreative Ideenfindung und Brainstorming:

  • Erstellen Sie unbegrenzte kreative Konzepte in mehreren Formaten
  • Erhalten Sie sofort professionelles Feedback zu Ihrer Arbeit
  • Überwinden Sie kreative Blockaden mit multimodaler Inspiration

KI-gestützte Produktivität für Kreative:

  • Erstellen Sie personalisierte KI-Assistenten für bestimmte kreative Aufgaben (Grammatikprüfung, Markenstimme, Fitness-Coaching)
  • Verwandeln Sie komplexe Recherchen mit Deep Research in detaillierte kreative Briefings
  • Zusammenfassen langer Dokumente, Videos und visueller Content in Sekundenschnelle
  • Nahtloses Management kreativer Projekte in Gmail, Docs und Drive

Erstellung von Apps und Prototypen ohne Code:

  • Erstellen Sie funktionale Apps und interaktive Prototypen, indem Sie einfach beschreiben, was Sie möchten, ohne Code schreiben zu müssen.

Warum Gemini für Kreative?

Im Gegensatz zu anderen KI-Tools zeichnet sich Gemini durch das Verständnis visueller und textueller Kontexte aus, die kreative Richtung über erweiterte Projekte hinweg und die Arbeit mit den Google-Tools aus, die Sie täglich verwenden. Es ist so, als hätten Sie einen Creative Director, einen visuellen Analysten und einen Content-Autor – rund um die Uhr verfügbar, wo immer Sie arbeiten.

Was du lernen wirst

Foundation (perfekt für KI-Anfänger):

  • Wie kommunizieren Sie mit Gemini mithilfe effektiver Aufforderungstechniken
  • Strukturieren Sie Ihre Aufforderungen für bessere Ergebnisse
  • Arbeiten mit Text, Bildern und Videos in einer Unterhaltung

Kreative Anwendungen:

  • Brainstorming mit Text-, Bild- und Videoanalyse kombiniert
  • Erstellen von Marketingkampagnen mit visuellen und schriftlichen Inhalten
  • Entwicklung personalisierter KI-Assistenten für Ihre spezifischen kreativen Anforderungen
  • Mit Deep Research Ideen in umsetzbare kreative Strategien umwandeln

Erweiterte Kreativtechniken:

  • Kombination von visuellen Elementen und Wörtern für bessere kreative Lösungen
  • Wie man KI-Fehler erkennt und vermeidet (Halluzinationen)
  • Erstellen von Codefreien Apps und Prototypen für Ihr kreatives Unternehmen
  • Integration von Gemini in Ihren bestehenden Google Workspace-Workflow

Sie müssen nicht verstehen, wie KI funktioniert, oder Programmierkenntnisse haben. Wenn Sie Gmail oder Google Docs verwenden können, können Sie Gemini verwenden. Dieser Kurs richtet sich speziell an nicht-technische Kreative, die leistungsstarke Ergebnisse ohne Komplexität wünschen.

Kursstruktur:

  • Mehr als 4 Stunden Schritt-für-Schritt-Video-Tutorials
  • Kreative Projekte, die Sie mit mir gemeinsam realisieren
  • Downloadbare Ressourcen, einschließlich Vorlagen und Handbücher für Aufforderungen
  • Community-Zugriff, um sich mit anderen Kreativen zu vernetzen und Unterstützung zu erhalten
  • Abschlusszertifikat zur Präsentation Ihrer neuen KI-Fähigkeiten

Für wen ist das?

Freiberufler und Solopreneure:

  • Content-Ersteller, die mit mehreren Medienformaten arbeiten (Text, Bilder, Video)
  • Grafikdesigner, die KI-Unterstützung bei der Konzeptentwicklung benötigen
  • Fotografen, die KI-Feedback und kreative Richtung wünschen
  • Coaches und Berater erstellen Schulungsmaterialien

Marketing- und Geschäftskreative:

  • Social Media Manager erstellen visuellen und schriftlichen Content
  • E-Mail-Vermarkter basteln Multimedia-Kampagnen
  • Markenstrategen entwickeln umfassende kreative Strategien
  • Kleinunternehmer, die Inhalte plattformübergreifend verwalten

Kreative Fachkräfte:

  • Autoren kombinieren visuelle Forschung mit Content-Erstellung
  • Kursentwickler, die Multimedia-Lernmaterialien entwickeln
  • Präsentationsdesigner arbeiten mit Formaten
  • Alle, die mit mehreren Kreativtools jonglieren und einen einheitlichen KI-Partner suchen

Warum jetzt?

KI verändert kreative Arbeit, ersetzt Kreative jedoch nicht – sie stärkt sie. Die Kreativen, die heute lernen, mit KI zusammenzuarbeiten, werden morgen einen enormen Vorteil haben. Dieser Kurs gibt dir diesen Vorteil.

Triff deine:n Kursleiter:in

Teacher Profile Image

Anna Kolenkina

Product Builder, Entrepreneur

Kursleiter:in

I help professionals and fresh graduates to learn digital skills, start new careers and advance in their roles.

I started my journey in the IT industry and software product management 15 years back from being an IT and management consultant and then transitioning to a full-on startup Product Manager and Product Director. I've built products from scratch for different industries - commodities trading, logistics, natural language processing, and e-learning - and also for different markets, from Europe to Asia. I have a Master's Degree in Applied Informatics and an MBA from the National University of Singapore.

Before joining online education, I shared my expertise and knowledge with only a limited number of people - my co-workers and mentees. With Skillshare, I'd like to s... Vollständiges Profil ansehen

Level: Beginner

Kursbewertung

Erwartungen erfüllt?
    Voll und ganz!
  • 0%
  • Ja
  • 0%
  • Teils teils
  • 0%
  • Eher nicht
  • 0%

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Nimm an prämierten Skillshare Original-Kursen teil

Jeder Kurs setzt sich aus kurzen Einheiten und praktischen Übungsprojekten zusammen

Mit deiner Mitgliedschaft unterstützt du die Kursleiter:innen auf Skillshare

Lerne von überall aus

Ob auf dem Weg zur Arbeit, zur Uni oder im Flieger - streame oder lade Kurse herunter mit der Skillshare-App und lerne, wo auch immer du möchtest.

Transkripte

1. Willkommen zum Kurs zu Google Gemini AI!: Alle zusammen und willkommen zum Kurs auf Google Gemini. Wussten Sie, dass Google Gemini offiziell die Marke von 750 Millionen aktiven Nutzern pro Monat überschritten hat? 750 Millionen aktiven Nutzern pro Monat überschritten Das sind fast drei Viertel von 1 Milliarde Menschen. Um das ins rechte Licht zu rücken Das Wachstum von Gemini übertrifft derzeit fast jeden anderen KI-Chatbot auf dem Markt und schließt die Lücke ChatGPT Aber es geht nicht nur um Zahlen, denn Gemini wurde Es ist heute das am besten integrierte EI der Welt. Es befindet sich in Ihrem Gmail, Ihren Google-Dokumenten, Ihrem Chrome-Browser und Ihrem Mobiltelefon. Dies ist die größte Veränderung in der Art und Weise, wie wir arbeiten und gestalten, seit der Erfindung des Internets. Wir bewegen uns auf eine Welt zu , in der EI nicht nur dazu dient, sie zu nutzen. Es ist ein Mitarbeiter, der bereits dort ist, wo Sie arbeiten. Mein Name ist Anna und ich werde deine Dozentin für diesen Kurs sein deine Dozentin für diesen Kurs Online-Dozent mit meinen anderen Kursen , die hier auf der Plattform verfügbar sind sich auf Produktmanagement und generative KI konzentrieren. diesem Kurs teilnehmen, erhalten Sie Zugriff auf über 4 Stunden HDVdo-Inhalte, schrittweise Anleitungen und Aktivitäten, die praktische Anwendungen von Gemini-Tools in der realen Welt hervorheben , PDF-Zusammenfassungen zum Nachlesen der wichtigsten Erkenntnisse aus dem Kurs und vieles mehr Zunächst erfahren wir, wozu Gemini in der Lage ist, wie Sie mit Gemini kommunizieren und Ihre Anfragen strukturieren können und wie Gemini für Sie am besten Von dort aus werden wir praktische Szenarien mit Gemini durchgehen , um Ideen zu sammeln und professionelles Feedback Erstellen Sie Ihre eigenen personalisierten EI-Systeme für bestimmte Aufgaben und generieren Sie hochwertige Grafiken Wir werden auch fortgeschrittene Techniken wie gründliche Recherchen zur Umwandlung komplexer Aufgaben in detaillierte Berichte und die Erstellung voll funktionsfähiger Apps behandeln fortgeschrittene Techniken wie gründliche Recherchen zur Umwandlung komplexer Aufgaben in detaillierte Berichte und die Erstellung , indem wir lediglich beschreiben, was Sie möchten Keine Codierung erforderlich. Und wir stellen sicher, dass Sie wissen, wie Sie falsche Antworten von KI erkennen und verhindern können, damit Ihre Arbeit immer korrekt ist. Und ja, Sie benötigen keinen technischen Hintergrund oder Vorkenntnisse über KI, um mit dem Kurs zu beginnen. Fangen wir also mit Ilsa im nächsten Video an. 2. Was ist Gemini? Das KI-Ökosystem von Google verstehen: Alle zusammen und willkommen zur ersten Kursvorlesung. Denken Sie an jeden Science-Fiction-Film zurück Sie je gesehen haben. Es gibt immer diesen einen Charakter, einen Assistenten, der nicht nur auf einen Befehl wartet, sondern die Welt des Helden tatsächlich versteht. Er antizipiert Probleme, bevor sie auftreten, und agiert als echter Partner Jahrelang war das nur Fiktion. Aber mit Gemini kommen wir einer Zukunft immer näher , in der diese Art von Partnerschaft Realität wird Also, was ist Gemini? Ich stelle mir das gerne als drei Schichten eines Hauses vor, das Fundament, das Gehirn Dies sind die Gemini-Modelle selbst, die von Googles Research Lab Deep Mind gebaut wurden In diesem Kurs werden wir die neueste Generation von Gemini-Modellen verwenden die neueste Generation von Gemini-Modellen Dazu gehören hochwertige Argumentationsmodelle für komplexe Logik, fortschrittliche Tools zur Bilderzeugung für fotorealistische Bilder und Videomodelle der nächsten Generation, die hochauflösende Szenen mit Ton erzeugen können hochauflösende Szenen mit Ton erzeugen Diese Modelle sind von Haus multimodal, was bedeutet, dass sie nicht Sie sehen hier und denken in allen Medien gleichzeitig, genau wie wir Um auf die Analogie mit dem Haus zurückzukommen Die zweite Ebene ist der Wohnraum, der Assistent Dies ist die Basis, auf der wir die meiste Zeit in der App auf Ihrem Telefon und auf der Website unter gemini.google.com verbringen werden meiste Zeit in der App auf Ihrem Telefon und auf der Website unter gemini.google.com verbringen App auf Ihrem Telefon und auf der Website unter gemini.google.com Es ist ein kreativer Bereich , in dem du Codes chatten und Tools wie Jams verwenden kannst , um das Verhalten des EI anzupassen Und schließlich ist die dritte Ebene die Infrastruktur. Das ist Gemini, das in Gmail, Google Docs und der Suche lebt. Es ist die EI-Übersicht, die Ihre Suchergebnisse zusammenfasst, oder die Schaltfläche „Hilf mir beim Schreiben“, mit der Ihre E-Mails verfasst werden. In diesem Kurs liegt unser Fokus auf dieser mittleren Ebene , dem GeminiEisistet Die Vision von Google in dieser Hinsicht konzentriert sich auf drei Elemente: persönlich, proaktiv und Lassen Sie uns untersuchen, was das bedeutet. Erstens ist es persönlich. Die meisten KI-Modelle sind Generalisten. Sie wissen viel über die Welt, aber ziemlich wenig über dich Gemini wurde als Ihre persönliche Erweiterung konzipiert. Mit Ihrer Zustimmung kann es eine Verbindung zu Ihrem persönlichen Kontext, Ihren E-Mails, Ihren Dateien und Ihrem Verlauf herstellen, um Ihnen Hilfe zu bieten , die für Ihr Leben einzigartig relevant ist Zweitens ist es proaktiv. Heute ist der Großteil der KI reaktiv. Du fragst sie nach Antworten. In der Zukunft von Gemini geht es darum zu sehen, was kommt. Wenn Sie am Freitag eine große Kundenpräsentation haben, sollte Gemini Sie nicht nur daran erinnern, dass sie bevorsteht Es sollte eine Woche zuvor in Ihren Kalender schauen und sagen, dass mir aufgefallen ist, dass Ihr Strategietreffen mit Firma A am Freitag stattfindet, basierend auf dem Vorschlag in Ihrer Ablage und der neuesten E-Mail-Bedrohung mit deren Team Hier finden Sie den Überblick über die Vorbereitung und drei Fragen, mit denen Sie wahrscheinlich konfrontiert werden. Drittens ist es mächtig. Mit den neuesten Fortschritten in Gemini gehen wir über die einfache Textgenerierung hinaus und denken Dinge in die Realität über, egal ob Sie eine ganze Website aus einer einzigen Aufforderung heraus erstellen oder ein Filmvideo für eine Die Leistung, für die früher ein ganzes Team von Spezialisten erforderlich war, steht Ihnen jetzt zur Verfügung Aber all diese Macht zu haben, heißt nicht, dass ich das Sagen habe. Es ist wichtig, sich daran zu erinnern, dass Gemini, selbst wenn es proaktiv ist, immer Ihre Führung übernimmt Es hat keine eigene geheime Agenda oder Glaubenssätze. Es ist so konzipiert, dass es den Befehlen folgt. Sie geben es anhand Ihrer Anweisungen und Präferenzen weiter. Egal, ob es Ihr Forscher, Ihr Programmierer oder Ihr kreativer Mitarbeiter ist, Sie haben immer das Sagen Produktivität bedeutet nicht, dass die EI ihr eigenes Ding macht. Es ist das EI, das voraussieht, was Sie benötigen, weil Sie das Ziel bereits definiert haben Nachdem wir die Vision und die Architektur untersucht haben , ist es an der Zeit, von der Theorie zur Praxis überzugehen In der nächsten Vorlesung werden wir uns die verschiedenen Spezialmodelle für Argumentation, Bilder und Video genauer die verschiedenen Spezialmodelle für Argumentation, Bilder und Video Und ich werde dir auch zeigen, wie du dein Konto bei Gemini einrichtest . Ich werde dich dort sehen 3. Lernen Sie die Gemini-Modellfamilie kennen: In der letzten Vorlesung haben wir über Gemini als dreischichtiges Haus, das Gehirn, den Assistenten und den integrierten Motor gesprochen Gemini als dreischichtiges Haus, das Gehirn, den Assistenten und den integrierten Gehen wir nun eine Ebene tiefer in dieses Gehirn vor. Die meisten älteren EI-Modelle wurden zuerst mit Text trainiert und verfügten dann über weitere Funktionen. Gemini wurde von Grund auf anders gebaut , um multimodal zu sein Das heißt, es liest nicht nur die Beschreibung eines Videos, ich verstehe das Video, den Ton, die Bilder und den Text gleichzeitig ob Sie ein 1.000 Seiten starkes PDF, ein einstündiges Video oder eine riesige Codebasis hochladen , Gemini verarbeitet alles in einem einheitlichen Bereich Es geht nicht darum, Bilder heimlich hinter den Kulissen in Text zu übersetzen , sie direkt zu sehen Wenn Sie Gemini auf geminiggle.com öffnen, werden Sie eine Modellauswahl sehen. Stellen Sie sich diese als verschiedene Modi vor, von jeder Sie zu einem anderen zugrunde liegenden Modell weiterleitet , das Google für eine bestimmte Art von Aufgabe optimiert hat Die gesamte Google-Modellfamilie ist riesig, aber für den täglichen Gebrauch werden Sie am häufigsten auf diese Modelle zurückgreifen. Bevor wir sie durchgehen, ein kurzer Hinweis darauf, was ein Modell eigentlich ist. Stellen Sie sich das wie einen Spezialisten vor, Sie stellen für einen Job ein. Jedes Modell wurde anders trainiert, unterschiedlichen Daten gefüttert und für unterschiedliche Stärken optimiert. Wenn Sie in Gemini einen Modus auswählen, entscheiden Sie im Wesentlichen, welchem Spezialisten Sie Ihre Aufgabe übertragen möchten Schnell ist unser Sprinter schnell und gesprächig. Dies ist der Spezialist, an den Sie wenden, wenn Sie eine sofortige Antwort benötigen Eine schnelle Zusammenfassung oder Hilfe beim Verfassen einer Kurznachricht. Es ist auf Geschwindigkeit optimiert und verarbeitet eine große Anzahl von Anfragen. es nur nicht für etwas, das tiefgründiges Denken in mehreren Schritten erfordert Denken ist unser Stratege. Dieser Experte macht eine Pause, bevor er antwortet, und legt seine Logik fest, bevor er Ihnen eine Wenn Sie ein komplexes Problem haben, mehrstufigen Plan zur Bearbeitung oder eine nuancierte Frage haben, bei der eine schnelle Antwort möglicherweise falsch ist Das ist derjenige, der denkt, bevor er spricht. Pro ist unser Experte. Sie setzen ihn ein, wenn es sich um eine komplexe Aufgabe handelt, gründliche Recherchen, Analyse eines großen Dokuments, fortgeschrittenes Schreiben, bei dem der Ton genau richtig sein muss . Pro verwendet das leistungsfähigste Basismodell der Produktreihe, was bedeutet, dass es mehr Informationen gleichzeitig speichern und mehr Nuancen aufnehmen kann gleichzeitig speichern und mehr Nuancen aufnehmen , die anderen Modellen möglicherweise fehlen. Der Nachteil ist , dass es langsamer ist und niedrigere tägliche Nutzungslimits hat. Speichern Sie es also für die Aufgaben , die tatsächlich benötigt werden. Diese drei schnell denkenden und professionellen Modelle sind Gemini-Sprachmodelle. Sie sind es, die das Gespräch antreiben. Aber die Gemini-Familie hört hier nicht auf. Es enthält auch spezielle Modelle für die Bild- und Videogenerierung. Sie lösen sie einfach aus, Sie lösen sie einfach indem Sie die Befehle „Bild generieren“ oder „Video generieren“ direkt in Ihrem Chat oder in der Gemini-Oberfläche Wenn Sie das getan haben, übergibt Gemini die Aufgabe im Hintergrund an den richtigen Spezialisten, und wir werden diese Spezialisten später im Kurs kennenlernen Nachdem wir herausgefunden haben, mit welchen Modellen wir arbeiten werden, möchte ich Ihnen zeigen, wie Sie Zugang zu Gemini erhalten 4. Einrichten von Gemini und Ihres ersten Chats: Gehen Sie zu Gemini Dot Google Forward Slash-Abonnements, um die aktuellen Pläne zu sehen . Hinweis: Preise und Verfügbarkeit variieren je nach Land Was Sie auf Ihrem Bildschirm sehen, sieht also möglicherweise etwas anders aus als das, was ich hier zeige Mit dem kostenlosen Tarif haben Sie täglich Zugriff auf Gemini. Es ist ein guter Ausgangspunkt und erfordert nichts weiter als ein Google-Konto Mit Google AI plus haben Sie mehr Zugriff auf die leistungsfähigsten Modelle und Funktionen, einschließlich verbesserter Bild - und Videogenerierung Außerdem erhalten Sie Zugriff auf Gemini in Gmail sowie auf Google MIT Google AI Pro geht noch einen Schritt weiter und bietet höhere Nutzungslimits für Gemini in Gmail, Google MIT-Dokumenten sowie Folien und zwei Terabyte Cloud-Speicher Und schließlich ist Google AI Ultra die Spitzenklasse. Es bietet Ihnen höchste Nutzungsbeschränkungen sowie exklusiven Frühzugriff auf neue Funktionen von Google. Meine Empfehlung hier wäre, mit Google AI fortzufahren , solange es eine kostenlose Testversion anbietet. Das bedeutet, dass Sie im ersten Monat alles, was ich hier im Kurs demonstriere, kostenlos verfolgen können hier im Kurs demonstriere . Und nach diesem kostenlosen Testmonat können Sie entscheiden, ob Sie Ihre Mitgliedschaft fortsetzen oder Google Plus herabstufen oder zur kostenlosen Mitgliedschaft zurückkehren möchten Plus herabstufen oder zur kostenlosen Mitgliedschaft zurückkehren Wählen Sie zunächst Ihren Mitgliedsplan klicken Sie auf Erste Schritte Als Nächstes müssen Sie eine Zahlungsmethode für die Testversion angeben Wenn Sie vor Ablauf des Monats kündigen oder ein Downgrade durchführen, werden Ihnen jedoch keine Gebühren berechnet vor Ablauf des Monats kündigen oder ein Downgrade Sobald Sie sich angemeldet haben, sehen Sie in der oberen rechten Ecke Folgendes Sie sehen Ihren Mitgliedsplan Pro, falls Sie sich entscheiden, eine AI Pro-Mitgliedschaft zu abonnieren , oder Plus, wenn Sie sich für diesen Plan entscheiden, befindet sich in der Mitte des Bildschirms Ihr Haupt-Chat-Eingang unter der Eingabeleiste Sie werden eine Reihe von Schnellstartschaltflächen bemerken. Dies sind nur Abkürzungen, mit denen Sie schnell loslegen können. Sie werden auch einen Moduswähler sehen. Es wird derzeit schnell angezeigt. Dies ist der Modellselektor, über den wir gerade gesprochen haben. Klicken Sie darauf, um je nach Bedarf zwischen schnell, denkend oder professionell zu wechseln je nach Bedarf zwischen schnell, denkend oder professionell zu auf der linken Seite auf das Menüsymbol klicken, wird Ihre Seitenleiste geöffnet, in der Sie Ihren Chat-Verlauf finden Sie können von hier aus auch einen neuen Chat starten. Lass uns versuchen, das zu tun. Ich lasse es für diesen Chat im Schnellmodus, da ich eine einfache Frage stellen werde. Ich beginne den Kurs über Zwillinge auf der Grundlage des heutigen Datums. Was sind die drei neuesten wichtigen Updates Google für das Gemini-Ökosystem veröffentlicht hat Ich bitte Gemini, im Internet zu suchen, um sie für mich zu überprüfen und zusammenzufassen. Lass uns auf Senden klicken Beachten Sie, dass Gemini nicht nur aus dem Gedächtnis antwortet. Es geht raus und durchsucht das Internet in Echtzeit und bringt mir dann die für heute relevanten Ergebnisse , wenn ich dieses Tutorial aufnehme Hier sind die drei neuesten Änderungen, die Gemini im letzten Monat eingeführt hat Und natürlich werden wir hier im Kurs über sie sprechen Im nächsten Abschnitt nehmen wir alles, was wir gerade hier eingerichtet haben , und setzen es in die Praxis um, angefangen damit, wie man eine gute Aufforderung schreibt . Wir sehen uns dort. 5. Wie Sie Gemini zu besseren Ergebnissen motivieren: Abschnitt Intro: Willkommen im neuen Abschnitt zum Thema Prompt Engineering . Dies ist der Teil des Kurses in dem Sie eine Fähigkeit erlernen, die jedes KI-Tool nützlicher macht, nämlich das Schreiben Eingabeaufforderungen, die Ihnen durchweg hervorragende Ergebnisse liefern Wir beginnen mit den Definitionen, was eine Aufforderung ist, was eine Aufforderung bedeutet und wie Prompt Engineering in das Gesamtbild passt Dann schauen wir uns zwei Modi an. Eingabeaufforderungen entwerfen, die wiederverwendet werden sollen, gibt es im Chat und in der Produktionsumgebung keine Wenn Sie Eingabeaufforderungen entwerfen, die wiederverwendet werden sollen, gibt es im Chat und in der Produktionsumgebung keine Eingabeaufforderungen Danach führe ich Sie durch eine einfache Formel für die Eingabeaufforderung durch eine Sie können es für fast alles verwenden. Sie werden auch die iterative Eingabeaufforderung üben und lernen, wie Sie auf früheren Antworten aufbauen und die Ergebnisse Schritt für Schritt verbessern Sie lernen, wie Sie anhand von Beispielen eine Anleitung erstellen, genau das gewünschte Ausgabeformat anfordern und wie Sie mit Dateien und Anhängen arbeiten Und natürlich werden wir multimodale Eingabeaufforderungen verwenden. Man und Ihre Aufforderung können Text sowie Dokumente, Screenshots und Links enthalten Screenshots und Am Ende dieses Abschnitts werden Sie sich sicher fühlen, diese Aufforderungsfähigkeiten bei realen Aufgaben für berufliche oder private Projekte einzusetzen. Fangen wir an 6. Was ist ein Prompt? Aufforderung, Prompt Engineering, persönliche und Produktionsaufforderungen: Jeder. Denken Sie an das letzte Mal Sie jemandem eine Frage gestellt haben. Die Art und Weise, wie Sie diese Frage formuliert haben , hat wahrscheinlich die Antwort beeinflusst, die Sie erhalten haben Genau das sehen wir heute in der Welt der KI Wir werden zunächst drei Schlüsselbegriffe aufschlüsseln , die für die Kommunikation mit KI-Systemen unerlässlich sind . Was genau ist eine Aufforderung? Was meinen wir mit Aufforderung? Und wie bringt Prompt Engineering das alles zusammen? Wir werden auch diesen Unterschied zwischen Chat und Enterprise Prompting untersuchen . Lass uns anfangen Eine Aufforderung ist die Eingabe, die Sie einer KI geben, Ihre Anweisungen, was Sie wollen und der Kontext, den Sie bereitstellen. Text, Dateien, Bilder, Links, Beispiele oder Daten. Stellen Sie sich das als das vor, was die Reaktion der EIs bestimmt. Eine Aufforderung ist das Schreiben dieser Eingabeaufforderungen. Es ist die allgemeine Aktivität, mit KI-Modellen zu interagieren und ihnen Anweisungen zu geben Dies ist der Prozess der Kommunikation mit dem Modell. Prompt Engineering ist ein spezialisierterer und systematischerer Ansatz zur Erstellung und Verfeinerung von Eingabeaufforderungen Es geht darum, die Gründe des Modells zu verstehen, testen und zu wiederholen und He-Fälle zu Anweisungen zu testen und zu wiederholen und He-Fälle zu berücksichtigen Stellen Sie sich das wie Kochen vor. Eine Aufforderung ist wie ein einzelnes Rezept. Promptin ist wie Kochen im Allgemeinen, und Prompt Engineering ist wie ein professioneller Koch, der systematisch entwickelt und testet und Rezepte systematisch entwickelt und testet und dabei Zutaten, Ausrüstung, Benutzerpräferenzen usw. berücksichtigt Ausrüstung, Benutzerpräferenzen usw. Es gibt zwei Hauptarten von Ansagen: Sie müssen sich der persönlichen Eingabeaufforderung und der Produktions- oder Unternehmensaufforderung bewusst sein persönlichen Eingabeaufforderung und der Produktions- oder Unternehmensaufforderung Produktions- oder Persönliche Eingabeaufforderungen sind das, was die meisten Leute in einem Chat tun. Sie schreiben eine Anfrage, die KI antwortet und Sie können sie durch Konversation weiter verfeinern Es ist flexibel und informell. Wenn Ihre erste Nachricht nicht perfekt ist, ist das keine große Sache. Du gehst einfach nach, klärst und wiederholst. Bitten Sie N AI beispielsweise, Ihnen beim Schreiben einer E-Mail zu helfen , Ideen zu sammeln oder ein Dokument in der Chat-Oberfläche zusammenzufassen Das ist persönliche Aufforderung. Produktions- oder Unternehmensaufforderungen hingegen entwerfen Sie Eingabeaufforderungen , Bei Produktions- oder Unternehmensaufforderungen hingegen entwerfen Sie Eingabeaufforderungen , die von Ihnen, einem Team oder innerhalb eines Produkts oder Workflows wiederverwendet werden sollen einem Team oder innerhalb eines Produkts oder Das Ziel ist nicht nur einmal eine gute Antwort, sondern konsistente Ergebnisse über viele Durchläufe und viele Eingaben hinweg Stellen Sie sich zum Beispiel einen Kundenbetreuer auf der Website eines Unternehmens vor. Es muss Tausende von Kundenfragen zuverlässig beantworten , einschließlich MC-Eingaben wie Tippfehler, unklare Anfragen oder fehlende Informationen In dieser Umgebung müssen die Eingabeaufforderungen strukturierter, vorhersehbarer und zuverlässiger sein , vorhersehbarer und zuverlässiger diesem Grund enthalten Produktionsaufforderungen in der Regel klare Regeln, strengeres Ausgabeformat und mehr Leitplanken, da sie dazu bestimmt sind , wiederholt und nicht nur einmal zu funktionieren Mit anderen Worten, persönliche Eingabeaufforderungen oder Chat-Eingabeaufforderungen helfen Ihnen dabei, zuerst gute Ergebnisse zu erzielen, und Produktionsaufforderungen helfen Ihnen oder Chat-Eingabeaufforderungen helfen Ihnen dabei, zuerst gute Ergebnisse zu erzielen, und Produktionsaufforderungen helfen Ihnen , wiederholt zuverlässige Ergebnisse zu erzielen. Warum sprechen wir so viel über diesen Unterschied zwischen persönlicher Aufforderung und Produktionsaufforderung Weil sich die Art und Weise, wie Sie Eingabeaufforderungen schreiben und verfeinern , je nach Einstellung ändert Wenn Sie bei der Eingabe von Eingabeaufforderungen nach zusätzlichen Materialien suchen, werden Sie häufig auf Ratschläge , die für den produktiven Einsatz konzipiert sind, stoßen , die für den produktiven Einsatz konzipiert sind, d. h. Eingabeaufforderungen, die bei vielen Benutzern, vielen Eingaben und vielen Sonderfällen zuverlässig funktionieren müssen Eingaben und vielen Sonderfällen Das ist sehr nützlich, wenn Sie wiederholbare Workflows erstellen oder EI in ein Produkt integrieren Wenn Ihr Hauptanwendungsfall derzeit jedoch nur darin besteht, eine KI in einem Chat zu verwenden , um Hilfe zu erhalten, müssen Sie es nicht überkomplizieren. Denken Sie also an diesen Unterschied In diesem Kurs konzentrieren wir uns hauptsächlich auf persönliche Eingabeaufforderungen in einer Chat-Oberfläche Jetzt, wo wir mit der Terminologie auf derselben Wellenlänge sind , wollen wir uns mit der praktischen Seite der persönlichen Benutzerführung befassen. Allca in der nächsten Vorlesung. 7. So kommunizieren Sie mit Google Gemini AI Die Bausteine einer effektiven Eingabeaufforderung: Jeder. Willkommen zu unserem ersten Vortrag über Chat-Eingabeaufforderungen. Hier erfahren Sie, wie Eingabeaufforderungen, die in der Chat-Oberfläche verwendet werden können , erstellen und verfeinern in der Chat-Oberfläche verwendet werden können , Lass uns anfangen. Wenn Sie mit einem Freund chatten, verwenden Sie keine starren Vorlagen oder formalen Strukturen. Sie führen eine natürliche, fließende Konversation. Das gleiche Prinzip gilt für Chat-Eingabeaufforderungen mit KI-Modellen. Es gibt jedoch Zeiten, in denen uns ein bisschen Struktur helfen kann bessere Ergebnisse zu erzielen und eine Aufforderung effektiver zu gestalten als eine andere Lassen Sie uns also die wichtigsten Bestandteile einer effektiven Aufforderung behandeln . Der zentrale Teil jeder Aufforderung ist die Kernabsicht oder -aufgabe. Dies kann in Form von Anweisungen erfolgen, z. B. das Schreiben einer E-Mail mit fünf Absätzen, um Kleinunternehmern eine neue Produktivitäts-App vorzustellen, wobei der Schwerpunkt auf den zeitsparenden Funktionen liegt. Stellen Sie sich Anweisungen als die Aufgabe vor, die das Modell ausführen soll. Eine andere Form, die die Absicht annehmen kann, ist eine Frage wie: Welche Schritte sollte ich befolgen, um ein überzeugendes Linkin-Profil zu erstellen Oder wie strukturiere ich einen Geschäftsplan für eine Startup-Idee? Wenn du eine Aufgabe schreibst, ist es dein Ziel, klar und konkret zu formulieren, was du erreichen möchtest. Etwas wie „Hilf mir bei der Präsentation“ zu schreiben , reicht nicht aus, um ein qualitativ hochwertiges Dokument zu erhalten , das Sie Ihrem Chef, Ihren Kollegen oder Investoren vertrauensvoll präsentieren können Ihrem Chef, Ihren Kollegen oder Investoren vertrauensvoll präsentieren Kollegen oder Investoren als Faustregel daran, dass jeder, der keine spezifischen Kenntnisse in Ihrem Thema hat, in der Lage sein sollte , Ihre Aufforderung zu verstehen und sie umzusetzen Wenn sie sich nicht sicher wie sie Ihren Anweisungen folgen sollen, wird auch das EI-System verwirrt sein. Sie nicht davon aus, dass es irgendwelche kontextbezogenen Informationen zu Ihrer Aufgabe enthält, z. B. wie die Ergebnisse verwendet werden sollen oder wer die Zielgruppe Wie die erfolgreiche Erledigung einer Aufgabe aussieht oder eine Liste von Punkten, auf die Sie nicht eingehen werden Sie müssen diese Kontext - oder Aufgabendetails selbst angeben . Wenn Sie beispielsweise eine Präsentation erstellen möchten, Informationen über die Anzahl der Folien, den Zweck der Präsentation und die wichtigsten Themen an, die behandelt werden sollen. Hier ist ein Beispiel für eine gut gestaltete Aufforderung. Erstellen Sie eine Präsentation mit sieben Folien zum Thema Personal Branding. Geben Sie an, was es ist, breite Messgeräte , wichtige Komponenten und Schritte zur Entwicklung Ihrer Marke. Oder ein anderes Beispiel: Erklären Sie, wie Sie in fünf einfachen Schritten eine überzeugende E-Mail schreiben. Die Anweisungen sollten die Erstellung und Ansprache der Betreffzeile, die klare Strukturierung der E-Mail und die Verwendung eines professionellen Umgangs umfassen Erstellung und Ansprache der Betreffzeile, klare Strukturierung der E-Mail . Machen Sie den Vorgang so einfach, dass jeder ihn auch ohne vorherige Erfahrung im formellen Schreiben befolgen Sie können den Kontext angeben, nicht nur für die Aufgabe selbst, sondern auch für den Ton, den Sie verwenden möchten. Verwenden Sie beispielsweise einen Umgangston , der Professionalität und Barrierefreiheit in Einklang Sie können auch Regeln oder Einschränkungen angeben , denen das EI-System folgen sollte In der Aufforderung zum Verfassen von E-Mails, über die wir gerade gesprochen haben, könnten Sie beispielsweise Aufforderung zum Verfassen von E-Mails, über die wir gerade gesprochen haben, Folgendes hinzufügen: Wenn Ihre Aufforderung sachliche Angaben wie Statistiken, aktuelle Ereignisse, Produktmerkmale, rechtliche oder medizinische Informationen oder etwas anderes beinhaltet aktuelle Ereignisse, Produktmerkmale, rechtliche oder medizinische Informationen oder , bei dem es wirklich auf Genauigkeit ankommt, gibt es zwei zusätzliche Zutaten die das Ergebnis erheblich verbessern können Der erste ist der Realitätscheck, auch Grounding genannt. Das ist der Zeitpunkt, an dem Sie es dem EI sagen. Klingt nicht nur selbstbewusst, sondern seid auch überprüfbar. Sie können also eine Regel hinzufügen, z. B. wenn Sie Tatsachenbehauptungen aufstellen, Quellen zitieren und mir sagen, worüber Sie sich nicht sicher sind, die zweite Zutat ist Vernunft Viele Themen ändern sich schnell — Tools, Preisgestaltung, Richtlinien und bewährte Verfahren Es hilft also, dem EI mitzuteilen, welches Zeitfenster verwendet werden soll. Verwenden Sie beispielsweise Quellen der letzten 12 Monate, sofern nicht alle Ressourcen benötigt werden. So sieht es aus, wenn Sie beide zu einer Eingabeaufforderung hinzufügen. Diese beiden Ergänzungen sind besonders hilfreich wenn Sie KI für Recherchen oder zur Entscheidungsfindung verwenden, nicht nur für das Schreiben, da sie dazu führen, dass die Antwort deutlich macht, was bewiesen , aktuell und was ungewiss ist. Eine weitere Möglichkeit, Ihre Eingabeaufforderung zu verbessern, besteht bei der Ausführung einer Aufgabe eine bestimmte Rolle zuzuweisen. Dies wird auch als Rollenaufforderung bezeichnet. Rollenspiele helfen KI-Modellen dabei, die Nuancen bestimmter Perspektiven die Relevanz und Qualität ihrer Antworten zu verbessern zum Beispiel als erfahrener Assistent der Geschäftsleitung mit über 15 Jahren Erfahrung in der Verwaltung von Geschäftskorrespondenz auf hoher Ebene oder tun Sie so, als wären Sie ein professioneller Autor, der zum E-Mail-Schreiben wurde Sie können bei der Rollenauswahl noch einen Schritt weiter gehen, indem Sie zusätzlich zur Rolle den Zielgruppenkontext angeben. Beachten Sie zum Beispiel, wie das EI die Beispiele für Vor- und Nachteile adaptiert , um sie für technische Experten verständlich zu machen verständlich Es ist ziemlich erstaunlich. Und wenn Sie sich von der Idee, eine so detaillierte Aufforderung zu erstellen, überwältigt fühlen , machen Sie sich keine Sorgen Das Schöne an der Arbeit in einer Chat-Oberfläche ist, dass Sie keine perfekt durchdachte Aufforderung entwerfen müssen, um die Konversation zu beginnen Sie können mit einer allgemeinen Frage oder Aufgabe beginnen und diese im Dialog mit dem EI-Modell verfeinern. Dieser iterative Ansatz ermöglicht es Ihnen, Ihre Bedürfnisse zu klären und die Antworten, die Sie im Laufe der Zeit erhalten, zu verbessern die Antworten, die Sie im Laufe der Zeit erhalten sprechen In unserem nächsten Video werden wir mehr über die interaktive Eingabeaufforderung Lassen Sie uns zunächst zusammenfassen, worüber wir in dieser Vorlesung gesprochen haben 8. Auf den Antworten von Gemini aufbauen: Iterative Aufforderung: Alle zusammen, willkommen zurück. Wenn Sie nach der vorherigen Vorlesung der Meinung sind, dass das Erstellen einer guten Aufforderung eine mühsame Aufgabe ist und dass Sie sie in einen Prompt-Techniker verwandeln müssen , um in dieser Aufgabe erfolgreich zu sein Hier ist ein Geheimnis, das die Experten verwenden. Stellen Sie sich eine Aufforderung als eine Konversation oder einen mehrstufigen Prozess vor, nicht als eine einmalige Frage, genauso wie Sie in einer neuen Stadt mit einem Einheimischen den Weg klären könnten in einer neuen Stadt mit einem Einheimischen Sie können Ihre Eingabeaufforderungen auf der Grundlage der EI-Antworten verfeinern Sehen wir uns ein Beispiel iterative Eingabeaufforderungen aus der Praxis an, um zu sehen, wie das funktioniert Nehmen wir an, wir möchten, dass uns die EI bei der Erstellung eines Geschäftsvorschlags für einen mobilen Hundepflegedienst Schritt eins: Die erste Aufforderung kann sehr allgemein sein, z. B. eine Gliederung für einen Geschäftsvorschlag für einen mobilen Hundepflegedienst zu erstellen eine Gliederung für einen Geschäftsvorschlag für einen mobilen Hundepflegedienst Im zweiten Schritt grenzen wir unsere ursprüngliche Anfrage ein oder verfeinern sie, indem etwa sagen, nehmen Sie die Gliederung, Sie erstellen und erweitern den Bereich Marktanalysen, konzentrieren uns auf demografische Daten und den Wettbewerb in städtischen Gebieten Im dritten Schritt fragen wir nach spezifischen Details. Entwickeln Sie jetzt beispielsweise den Abschnitt Finanzprognosen, Startkosten, die monatlichen Betriebskosten und die Umsatzprognosen für das erste Jahr umfasst monatlichen Betriebskosten . Wir können Schritt zwei und Schritt drei mehrmals wiederholen , je nachdem, wie zufrieden wir mit den Antworten sind. Manchmal sind iterative Eingabeaufforderungen sogar noch effektiver , wenn Sie an etwas arbeiten , das präzise und nicht nur gut geschrieben sein muss nicht nur gut Beispiel: Schritt eins: Fangen Sie breit an. Geben Sie mir einen Überblick über den Markt für mobile Hundepflege in städtischen Gebieten Schritt zwei: Fragen Sie nach Annahmen und Beweisen. Listen Sie die wichtigsten Annahmen auf , die Sie treffen. Wenn Sie Fakten oder Zahlen erwähnen, sagen Sie mir, woher sie kommen, und kennzeichnen Sie alles, bei dem Sie sich nicht sicher sind. Schritt drei, Gegenprüfung. Überprüfe jetzt deine eigene Antwort auf Vernunft. Welche Teile sind am wahrscheinlichsten falsch oder veraltet? Was würden Sie zuerst überprüfen? Auf diese Weise feilen Sie nicht nur am Wortlaut, verbessern auch die Zuverlässigkeit des Inhalts Bitte beachten Sie: So wie ein erfahrener Projektmanager auf früheren Diskussionen und Entscheidungen aufbaut, behält die chatbasierte KI den Kontext während Ihrer Konversation Das bedeutet, dass Sie auf frühere Teile des Chats zurückgreifen und darauf aufbauen anstatt alles von vorne zu wiederholen. Sie könnten also etwas fragen, das auf der Marketingstrategie basiert , die wir zuvor in diesem Chat besprochen haben Lassen Sie uns darauf aufbauen, aber konzentrieren Sie sich auf Familien in Vororten in Gebieten mit begrenzten Pflegemöglichkeiten Wenn Sie das Gefühl haben, dass Ihre Konversation nicht in die richtige Richtung geht, haben Sie natürlich immer die Möglichkeit, von vorne zu beginnen und die erste Frage neu zu formulieren Der letzte Schritt des iterativen Prozesses besteht in der Regel darin, die KI zu bitten, die Antwort zu verfeinern Alternativ können Sie auch um Feedback zum gesamten Inhalt bitten zum gesamten Inhalt In diesem Fall der Geschäftsvorschlag, der sich darauf konzentriert, wie er weiter verbessert werden kann. Anschließend können Sie diese Änderungen in die endgültige Version des Dokuments aufnehmen . Dieser schrittweise Ansatz ermöglicht es Ihnen, das Ergebnis in jeder Phase zu überprüfen und zu verfeinern, Anpassungen auf der Grundlage von Zwischenergebnissen vorzunehmen, Kontrolle über das Endprodukt zu behalten und die Komplexität schrittweise zu erhöhen. Stellen Sie sich das wie Bildhauerei vor. Sie beginnen mit der Grundform und verfeinern dann schrittweise die Details, und verfeinern dann schrittweise bis Sie genau das erreichen, was Sie möchten Und das war's für das Video. Lassen Sie uns die wichtigsten Punkte zusammenfassen , die wir gerade behandelt haben. 9. Gemini wirklich zu dir machen: Personalisierung: Hallo zusammen und willkommen zurück. Wenn Sie mit einem KI-Assistenten sprechen, fühlt es sich manchmal so an, als würden Sie jedes Mal bei Null anfangen. Sie können die perfekte Aufforderung schreiben und trotzdem eine allgemeine Antwort erhalten weil Gemini keine Ahnung hat, wer Sie sind und wie Sie arbeiten. In diesem Video werden wir uns ansehen, wie Gemini so funktioniert, wie Sie arbeiten Es gibt drei Personalisierungsebenen , mit denen Sie Ihr Erlebnis individuell gestalten können Stufe eins sind grundlegende personalisierte Anweisungen. Du sagst Gemini jedes Mal, wie du dich verhalten wolltest Seien Sie immer professionell, formatieren Sie Antworten immer als Stichpunkte Was auch immer für Sie funktioniert, es erspart Ihnen, sich bei jeder einzelnen Aufforderung zu wiederholen . Stufe zwei ist der Chat-Zwischenspeicher. Hier fängt Gemini an, sich Fakten und Vorlieben aus Ihren früheren Konversationen zu merken , sodass Sie genau dort weitermachen können, wo Sie aufgehört haben Und Stufe drei ist die fortschrittlichste persönliche Intelligenz Auf diese Weise kann Gemini Ihr gesamtes Google-Ökosystem, Ihr GML, Ihre Fotos, YouTube und sogar Ihren Suchverlauf miteinander verbinden Ihr gesamtes Google-Ökosystem, Ihr GML, Ihre Fotos, YouTube und sogar Ihren Suchverlauf Stellen Sie sich einen Wochenendtrip vor, anstatt stundenlang zu spielen. Du sagst einfach, dass Gemini für diesen Samstag eine Reise plant , die auf meinem Lieblingshobby basiert Personal Intelligence findet deinen letzten Kauf von Wanderausrüstung in Jimel, ruft deine Lieblingswanderfotos von Google Fotos ab, sucht in deinem YouTube-Wiedergabeverlauf nach lokalen Führern und schlägt dir einen bestimmten Weg vor, wobei du genau weißt, welcher Schwierigkeitsgrad Eine Sache, die es zu beachten gilt, bevor wir beginnen Persönliche Intelligenz wird immer noch eingeführt, weshalb wir uns heute auf die ersten beiden Stufen konzentrieren werden Diese Personalisierungsfunktionen sind auch Teil des Google AI Pro-Abonnements Wenn Sie noch kein Upgrade durchgeführt haben, schauen Sie sich unseren Vortrag an, in dem ich Ihnen gezeigt habe , wie Sie kostenlosen Zugang erhalten Lass uns mit der Demo beginnen. Wir beginnen mit der Gemini-Web-App auf gemini.google.com Ich habe mich bereits in mein P-Konto eingeloggt. Schauen Sie als Nächstes unten links Ihrem Bildschirm nach und klicken Sie auf das Zahnradsymbol Einstellungen. Wählen Sie in diesem Menü den persönlichen Kontext aus. Die erste Einstellung heißt „ Deine besten Hüte mit Gemini“. Wenn sie eingeschaltet ist, wie auf meinem Bildschirm hier, lernt Gemini aus deinem Verlauf, lernt Gemini aus deinem Verlauf dich im Laufe der Zeit besser zu verstehen Als ich diese Einstellung gerade aktiviert habe, hat mir Gemini Folgendes vorgeschlagen Es hat alle Dinge , an denen ich in letzter Zeit gearbeitet habe, korrekt zusammengefasst , an denen ich in letzter Zeit gearbeitet habe Übrigens, wenn Sie jemals eine private Konversation führen möchten , die nicht im Chat-Verlauf gespeichert ist , können Sie den temporären Chat verwenden. Sie sehen, dass es hier oben links auf dem Bildschirm verfügbar ist . Also lass uns darauf klicken. Wir sehen dieselbe Oberfläche, mit der Sie bereits vertraut sind. Lass mich etwas fragen. Ich verwende ein schnelles Modell da dies nur eine sehr kurze Frage ist. Also hier sind die Vorschläge. Sie sind ziemlich gut. Und da wir den temporären Chat probiert haben, lassen Sie mich einen Blick auf meinen Chat-Verlauf werfen. Sie sehen, dass wir hier nichts haben , was mit einem flachen Weiß zu tun hat. Lassen Sie mich versuchen, die Seite zu aktualisieren, um sicherzustellen, dass dieser temporäre Chat nicht im Chat-Verlauf gespeichert wird. Ja, alles gut. Aber gleichzeitig haben wir auch dieses Gespräch verloren. Okay, kommen wir zurück zu den Einstellungen, dem persönlichen Kontext Das zweite Google hier heißt Your Instructions for Gemini Wir sehen, dass sie auch standardmäßig aktiv sind , um eine neue Anweisung hinzuzufügen, ein Klick auf AD Und hier können wir alle Informationen zu Ihrem Verhalten, Ihrem persönlichen Kommunikationsstil und Ihren Vorlieben angeben, die Sie mit Gemini teilen möchten Also hier ist meine Aufforderung. Also möchte ich die Anweisungen in zwei Teile unterteilen. Zuerst sage ich dem EI, was ich mache. Sie sehen hier, dass ich sowohl meine Rolle als Pädagoge als auch als Berater geteilt habe und ein wenig Kontext zu dem gegeben habe, ein wenig Kontext zu dem gegeben was ich in diesen beiden Rollen mache Und zweitens habe ich erklärt, wie gerne ich arbeite. Speichern wir diese Anweisungen , indem wir auf die Schaltfläche Senden klicken. Alles gut. Und schließlich, um alles zu sehen, was Gemini gespeichert hat, kehren Sie zu den Einstellungen zurück und klicken Sie von hier aus auf Aktivität Dies ist die Liste aller Aktivitäten , die Sie kürzlich mit der Gemini-App Sie können bestimmte Chats manuell löschen , falls Sie sie aus bestimmten Gründen nicht benötigen, und Sie können auch einen Löschplan einrichten Ihre Daten werden also alle paar Monate gelöscht . Zum Beispiel kann ich hier eine Dauer wählen. Ich lebe 18 Monate, was ein angemessener Zeitraum ist um die alten Konversationen loszuwerden, und ich klicke auf Weiter. Perfekt. Und das war's für dieses Tutorial. Jetzt wissen Sie, wie Sie Gemini so anpassen können , dass es genau so funktioniert, wie Sie es möchten Und Alca im nächsten Video. 10. So teilen Sie Dateien und andere Inhalte mit Google Gemini AI: Hallo zusammen und willkommen zurück. In den vorherigen Vorlesungen zum Thema Prompt Engineering haben wir viel darüber gesprochen, wie Sie Ihre Anweisungen formulieren und welche Informationen Sie enthalten sollten. Aber neben den Anweisungen müssen Sie dem EI manchmal auch Quellenmaterial wie Dokumente, Tabellen, Screenshots oder PDF-Dateien zur Quellenmaterial wie Dokumente, Tabellen, Verfügung stellen, damit es diese überprüfen und analysieren kann Mal sehen, wie es funktioniert. Sie können Gemini auf zwei Arten Informationen aus Dokumenten und Bildern zur Verfügung stellen , indem Sie den Text direkt in den Chat einfügen oder die gesamte Datei an die Konversation anhängen Die erste Option, den Text einzufügen, funktioniert also gut, wenn Sie nur Hilfe bei einem bestimmten Fragment Ihres Dokuments benötigen Hier ist zum Beispiel mein Lebenslauf, und ich möchte Feedback zu nur einem Abschnitt des Dokuments, sodass ich ihn einfach kopieren, in den Chat einfügen und dann Gemini die Anweisungen geben Also habe ich gesagt, dass dies ein Fragment aus meinem Lebenslauf ist, und ich habe Gemini gefragt, ob diese Fähigkeiten für eine Position als Produktleiter für ein Fintech-Startup relevant sind Position als Produktleiter für ein Fintech-Startup Und hier ist die Antwort. Aber oft möchten Sie, dass Gemini mit dem gesamten Dokument arbeitet, z. B. mit einem langen PDF oder einer Gemini kann fast jeden gängigen Dateityp verarbeiten von Word-Dokumenten bis hin zu CSV-Dateien, Fotos und sogar Videos Fotos Um die Datei anzuhängen, klicken Sie auf das Plus-Symbol auf der linken Seite der Chat-Leiste Sie können eine Datei von Ihrem Gerät, von Ihrem Google Drive, Ihren Google Fotos auswählen . Nehmen wir also ein Beispiel. Ich brauche ein paar Ideen, was ich zum Abendessen kochen soll. Was ich tun werde, ich werde mehrere Fotos von Zutaten hochladen , die ich in meinem Kühlschrank habe. Das sind die Zutaten, die ich habe. Ich frage Gemini, was sind die drei einfachen Rezepte für ein Abendessen ich in weniger als 20 Minuten zubereiten kann Und hier sind die Empfehlungen , die Gemini gegeben hat. Sie sehen, dass die Inhaltsstoffe anhand der Bilder erfolgreich identifiziert Hier sehen wir Geminis Fähigkeit, Objekte zu erkennen und kreatives Frisonin anzuwenden Als Nächstes versuchen wir es mit einem Dokument. Nehmen wir an, Sie haben ein komplexes Dokument mit einer Stromrechnung erhalten . Sie können dieses PDF also auf Gemini hochladen und fragen ob es die wichtigsten Gebühren zusammenfassen kann. Lass uns das ausprobieren Ich kehre zum selben Chat zurück, klicke auf das Plus-Symbol und wähle dann Dateien aus meinem lokalen Laufwerk aus. Und hier ist meine Aufforderung. Lassen Sie uns hier das schnelle Modell verwenden weil es eine ziemlich einfache Anfrage sein sollte, und lassen Sie uns sehen, welche Antwort wir erhalten werden. Ja, ziemlich gute, korrekte Zusammenfassung der Gebühren sowie meines Datenverbrauchs. Alles gut hier. Ordnung, lassen Sie uns etwas anderes ausprobieren und verschiedene Arten von Dokumenten an Gemini senden , um zu sehen, ob es wirklich mit verschiedenen Dateien funktioniert Ich habe ein PDF mit meiner Flugroute für meine bevorstehende Reise nach Phuket Und hier habe ich einen Reiseführer mit einigen Informationen zu den Touren. Das kann ich dort machen, während ich in Phuket bin. Ordnung. Diese Demo dauert eine ganze Weile. Also was ich tun werde, ich werde diese Reaktion beenden. Ich kopiere diese Aufforderung und öffne einen neuen Chat. Ich habe dieselbe Aufforderung eingefügt, und hier wollen wir zum Nachdenken übergehen. Weil ich hier ein ziemlich komplexes PDF-Dokument habe. Ich habe auch Bilder mit konkreten Daten, die Gemini analysieren und mit den Daten in diesem Dokument vergleichen muss mit den Daten in diesem Dokument vergleichen Vielleicht wäre es also besser, auf ein intelligenteres Modell umzusteigen ein intelligenteres Modell umzusteigen Lass uns das ausprobieren. Jetzt haben wir das Ergebnis fast sofort erhalten. Lesen wir also, was Gemini uns sagt. Es erkennt alle Informationen in den Dokumenten, die ich zur Verfügung gestellt habe, und es hat auch eine nette Empfehlung gegeben, was ich tun kann, sobald ich an meinem Zielort angekommen bin Hier fungiert Gemini als unser persönlicher Kardinator, der Punkte zwischen verschiedenen Dateitypen verbindet Punkte zwischen verschiedenen Dateitypen Und bitte denken Sie daran, dass Gemini diese Dateien zwar lesen und analysieren kann , um Zusammenfassungen, Tabellen oder Empfehlungen zu erstellen , die Originaldatei selbst jedoch nicht verändert Ordnung, fahren wir mit unserer Demo fort. Nehmen wir an, ich habe eine Audiodatei, die Gemini analysieren soll, indem ich wie immer auf die Plus-Schaltfläche klicke Dann wähle ich in meiner Audiodatei aus, und hier ist meine Aufforderung Können Sie die wichtigsten Punkte dieses Audios zusammenfassen? Ich werde hier weiterhin den Denkmodus verwenden , da dies komplexere Aufgabe ist als nur eine kurze Frage zu Und hier ist die Zusammenfassung. Dies ist die korrekte Zusammenfassung von Gemini. Ich kann dies bestätigen, da dies die Aufnahme ist , die ich selbst für meinen anderen Kurs vorbereitet habe Tolle Arbeit Gemini. Und lassen Sie mich auch zeigen, wie es mit Videos funktionieren kann. Ich habe diesen Link zur Google-Keynote-Präsentation. Und da ich gerade am Gemini-Kurs arbeite, möchte ich, dass Gemini mir hilft, all die Momente zu finden, in denen Redner über die Gemini-App und neue Funktionen sprechen Lass uns die Eingabetaste drücken und schauen, was Gemini vorschlagen wird. Hier ist die detaillierte Analyse dieses Videos. Und was mir hier wirklich gefällt, ist, dass es die Zeitcodes enthielt. Wir sehen hier zum Beispiel, dass Gemini den persönlichen Kontext erwähnt hat und dass dieser spezielle Zeitcode enthalten ist, in dem einer der Redner über diese Funktion gesprochen Wenn ich also diese Konversation überprüfen möchte, kann ich einfach auf diesen Timecode klicken Ich werde zu diesem Teil der Präsentation weitergeleitet. Und das war's für diesen Vortrag. Lassen Sie uns kurz zusammenfassen , was wir hier gelernt haben. Die meisten modernen KI-Modelle akzeptieren gängige Dateiformate, darunter PDFs, Word-Dokumente, Excel-Dateien, CSVs, Bilder und Textdateien Dateien können über eine Upload-Schaltfläche oder ein Anhangssymbol auf der Chat-Oberfläche hochgeladen werden eine Upload-Schaltfläche oder ein Anhangssymbol auf der Sie müssen klare Anweisungen dazu geben, was die KI mit den Dateien machen soll Wenn Sie Ihre Anfragen spezifisch behandeln , führt dies zu besseren Ergebnissen. Sie können mehrere Dateien hochladen und das KI-Modell bitten , sie zu vergleichen oder gemeinsam zu analysieren. Die KI bearbeitet Ihre Datei normalerweise nicht direkt, kann aber verbesserte Inhalte generieren. Sie können zurück in Ihr Dokument kopieren. In Ordnung, und wir sehen uns in der nächsten Vorlesung. 11. Verwenden von Beispielen in Eingabeaufforderungen: Alle zusammen, und willkommen zurück zur neuen Vorlesung, in der wir weiter darüber sprechen , wie Sie mit EI-Systemen kommunizieren können und was Sie in Ihre Aufforderung aufnehmen Bisher haben wir verschiedene Komponenten behandelt, die in einer Aufforderung, einer Aufgabe oder dem, was Sie erreichen möchten, enthalten sein können , gefolgt von spezifischen Details oder Kontexten und Regeln, die für die Ausführung der Aufgabe oder die Beantwortung einer Frage erforderlich sind. Als Nächstes folgt der Rollenkontext, eine spezifische Rolle, die das EI bei der Ausführung einer Aufgabe spielen wird . Optional können Sie auch die Zielgruppe für Ihre Aufgabe vorstellen. Schließlich haben wir erwähnt, dass Sie zusätzliche Inhalte teilen können , indem Sie Dokumente an Ihre Konversation anhängen oder den Text als Eingabedaten direkt in den Chat aufnehmen und die Reihenfolge der Komponenten in Ihrer Aufforderung festlegen Die Reihenfolge ist für einige Elemente wichtig, für andere jedoch nicht Es wird beispielsweise empfohlen, den RL-Kontext zu einem früheren Zeitpunkt in der Eingabeaufforderung einzufügen , obwohl Eingabedaten je nach Aufgabe möglicherweise nicht erforderlich sind und die Reihenfolge auch flexibel ist. Im Allgemeinen ist es jedoch ein guter Anfang für eine effektive Aufforderung, wenn Sie sich an die Reihenfolge halten , die auf den Folien der Kurspräsentation angegeben ist. Okay, lassen Sie uns ein weiteres Aufforderungselement einführen . Beispiele, auch Shots genannt, dienen als Veranschaulichung , anhand derer das generative KI-Modell anhand dessen ermittelt werden kann, nach welcher Art von Ausgabe Sie suchen, einschließlich des Antwortformats und dessen, was Sie vermeiden möchten. Vielleicht haben Sie von Begriffen wie One-Shot oder Fee-Shot-Prompting gehört One-Shot oder Fee-Shot-Prompting Diese beziehen sich auf die Verwendung eines oder mehrerer Beispiele in Ihrer Prompt-Beschreibung Bei Chat-Eingabeaufforderungen verdeutlichen Beispiele in der Regel den Tonfall. Zum Beispiel formell versus informell, seriös versus terminlich, einfühlsam versus sachlich und Stil wie Satzlänge, Formatmuster, Aufzählungspunkte im Vergleich zu Absätzen, technischer Detailgrad, grundlegende oder fortgeschrittene Terminologie usw. Lassen Sie uns einige konkrete Beispiele durchgehen. Zunächst werde ich Gemini um eine einfache E-Mail bitten , ohne ein Beispiel zu nennen Also hier ist meine Aufforderung. Für diese Demo werde ich das Fest-Modell verwenden . Lass es uns ausführen. Diese E-Mail ist in Ordnung, aber sie ist auch ziemlich allgemein gehalten. Lassen Sie uns es nun viel spezifischer machen, indem wir ein Beispiel für den gewünschten Ton und die gewünschte Struktur zeigen . Also hier ist meine andere Aufforderung. Ich habe also am Anfang dieselbe Anweisung, und dann habe ich ein Beispiel als Stilreferenz angegeben , in dem der Ton, die Satzlänge und die Struktur erwähnt werden, die Gemini verwenden soll Lassen Sie uns diese zweite Version ausführen. Wenn wir nun diese neue Antwort mit der ersten Version vergleichen , stellen wir fest, dass sie sich menschlicher anfühlt. Die Sätze sind kürzer und die Struktur entspricht eher dem, was wir im Beispiel gezeigt haben. Und wo wir schon beim E-Mail-Beispiel sind, lassen Sie mich Ihnen kurz zeigen, was Gemini als Nächstes mit dieser E-Mail machen kann Nächstes mit dieser E-Mail machen Es hat sich herausgestellt, dass Sie die E-Mail nicht kopieren und in Ihren Posteingang einfügen müssen E-Mail nicht kopieren und in Ihren Posteingang einfügen Wenn Sie direkt unter der Antwort nachschauen, sehen Sie ein weiteres Symbol. Lass uns darauf klicken. Und hier sehen Sie die Option Entwurf in Gmail. Wenn Sie darauf klicken, öffnet Gemini ein neues Fenster und platziert genau diesen Text in einem echten Gmail-Entwurf , den Sie weiter bearbeiten und schließlich an Ihren Empfänger senden können schließlich an Ihren Empfänger senden Also lass uns versuchen, das zu tun. Gemini verfasst eine E-Mail. Lass uns einen Blick darauf werfen. Ich klicke auf Gmail öffnen. Wir sehen, dass der Betreff der E-Mail korrekt erfasst wurde . Dies ist genau der Text , den wir im Chat gesehen haben. Lass uns etwas Fortgeschritteneres versuchen. Bisher haben wir anhand von Beispielen den Ton und den Stil der Reaktion festgelegt. Sie können aber auch Beispiele verwenden , um einen mentalen Rahmen festzulegen. Der mentale Rahmen verändert nicht nur die Wörter, die Gemini verwendet. Es ändert die Logik, mit der es Ihr Problem löst. Anstatt also eine lange Liste mit Regeln wie praktisch oder nicht zu akademisch zu schreiben , können Sie Gemini einfach eine Aufnahme oder ein Beispiel der Perspektive zeigen , die Sie einnehmen wollten Gehen wir also Schritt für Schritt vor. Zuallererst öffne ich einen neuen Chat. Und hier würde ich gerne zu einem Pro-Model wechseln. Und nur zur Vorwarnung, wenn Sie einen kostenlosen Tarif haben, haben Sie weiterhin Zugriff auf das Pro-Modell. Sie sehen, ich verwende mein kostenloses Konto und kann dieses Modell immer noch auswählen. Ihre Nutzungslimits sind jedoch möglicherweise niedriger als bei kostenpflichtigen Tarifen. Ich kehre also zu meinem Konto zurück , das ich für diese Demo verwende. Lassen Sie uns zunächst sehen, wie Gemini Anfragen ganz ohne Framing behandelt Ich werde nach einem beliebten Thema fragen: Personal Branding. Ich möchte etwas über Personal Branding erfahren. Wie sollte ich anfangen? Lass uns die Eingabetaste drücken. Wenn wir interessiert sind, können wir uns Geminis Denkprozess ansehen Sie sehen, das sind die Schritte, die unternommen wurden um uns diese Empfehlung zu geben Alles ist richtig, aber es ist sehr theoretisch. Es fühlt sich an wie eine lange Aufgabenliste, bevor Sie überhaupt angefangen haben. Lassen Sie uns nun anhand eines einmaligen Beispiels die Logik auf ein praktisches mentales System verlagern. Ich möchte, dass Gemini sich wie ein Coach benimmt , der sofortige kleine Siege wichtiger schätzt als große Theorien Also hier ist meine neue Aufforderung, abgesehen von meiner ursprünglichen Anweisung Ich habe auch ein Beispiel für praktische Logik beigefügt. Lass uns reingehen und sehen , was Jimmy und ich hier vorschlagen würden . Siehst du das? Weil ich die Logik als praktisch bezeichnet habe und Gemini das Hallo-World-Beispiel gezeigt habe , habe ich keine Leseliste mehr. Es gibt mir wortwörtlich praktische Empfehlungen, Dinge, die ich jetzt tun kann Jetzt spiegelt Gemini also die Denkweise wider, nicht nur den Ton und den Stil, wie in unserem ersten In Ordnung. Und lassen Sie uns noch ein kurzes Beispiel nehmen Dies ist besonders nützlich , wenn Sie recherchieren. Angenommen, Sie möchten, dass Gemini nicht nur die Frage beantwortet, sondern auch zeigt, woher die Informationen stammen. Sie können ein Beispiel hinzufügen, das das gewünschte Format demonstriert Sie können beispielsweise eine vollständige Eingabeaufforderung wie diese schreiben. Und was wichtig ist, ich habe auch Regeln für Gemini bereitgestellt. In diesen Fällen kann sie keine zuverlässige Quelle für eine Reklamation finden Lass es uns ausführen. Diese Art von Beispiel macht die Ausgabe viel strukturierter und vertrauenswürdiger, weil Sie genau das Format anzeigen, Sie als Beweismittel benötigen. In Ordnung. Abgesehen von einer oder wenigen Eingabeaufforderungen gibt es noch eine weitere Technik, bei der interaktive Beispiele verwendet Interaktive Beispiele unterscheiden sich von regulären Beispielen dadurch, dass sie eine dynamische Lernerfahrung bieten, bei der jedes Beispiel auf früheren Erkenntnissen oder Rückmeldungen aufbaut , während es sich bei regulären Beispielen um Studiendemonstrationen handelt Interaktive Beispiele erfordern aktive Teilnahme und Iteration. So funktionieren interaktive Beispiele. Sie geben ein Beispiel für eine erste Version an. Die KI gibt spezifisches Feedback und Vorschläge. Auf der Grundlage dieses Feedbacks erstellen Sie eine verbesserte Version. Die KI analysiert die Verbesserungen und schlägt weitere Verbesserungen Bei Bedarf iterieren Sie erneut. Entscheidend ist, dass jede Iteration auf dem Feedback der vorherigen Version aufbaut auf dem Feedback der vorherigen Version so einen gemeinsamen Verbesserungsprozess Okay, großartig. Und das war's für dieses Video. Lassen Sie uns kurz darauf eingehen, was wir hier gelernt haben. Und wir sehen uns im nächsten Video, in dem wir uns mit einer weiteren Aufforderungstechnik befassen werden 12. Festlegen des Ausgabeformats in Gemini: Jeder einzelne. Wir sind fast fertig damit die wichtigsten Zutaten einer guten Aufforderung zu behandeln. Es gibt noch eine weitere Komponente, die Sie vielleicht für sinnvoll halten, in Ihre Eingabeaufforderung aufzunehmen, in welchem Format die Antwort der KI aussehen soll. Lassen Sie uns jetzt darüber sprechen. Denken Sie daran, dass wir in unserer ersten Vorlesung zum Thema Prompting gesagt haben, dass es wichtig ist, Informationen über die Grundzüge oder die Liste der Punkte aufzunehmen Informationen über die Grundzüge oder die Liste der Punkte Sie werden es nicht als Kontext für Ihre Aufgabe behandeln. Es stellt sich heraus, dass Sie auch Ihre Formatierungseinstellungen für die Antwort angeben können , was Ihnen helfen kann, Informationen effektiver zu organisieren. diese Informationen möglicherweise nicht Je nach Aufgabe sind diese Informationen möglicherweise nicht erforderlich, aber wenn Sie sie einbeziehen, ist es besser, sie gegen Ende der Aufforderung zu bündeln als zu Beginn Sehen wir uns einige Formatierungsbeispiele an, die Sie anfordern können Sie können nach bestimmten Formatierungsstilen fragen. Wenn Sie beispielsweise einen Geschäftsbericht benötigen , könnten Sie sagen: Bitte formatieren Sie diesen als professionellen Bericht mit Überschriften, Zwischenüberschriften und kurzen , Zwischenüberschriften und kurzen KI strukturiert die Informationen entsprechend macht sie für den professionellen Einsatz bereit Wenn Sie mit Daten oder Analysen arbeiten, können Sie Tabellen oder bestimmte Layouts anfordern. Anstatt einer Textwand könnten Sie sagen, den Vergleich dieser drei Produkte in einem übersichtlichen Tabellenformat mit Funktionen in der linken Spalte präsentieren . Dadurch sind komplexe Informationen leichter zu verstehen und zu verwenden. Und hier sind noch ein paar weitere Formate und Muster, die besonders für Recherchen oder Entscheidungen nützlich sind . Vergleichstabelle. Geben Sie mir eine Vergleichstabelle dieser Optionen mit Spalten für die wichtigsten Funktionen, Vor- und Nachteile und die besten vier. Quellenzuordnung, liste die von dir verwendeten Quellen auf und erkläre in deiner Antwort kurz, was jede Quelle unterstützt. Fakten versus Interpretationen. Teilen Sie Ihre Antwort in zwei Abschnitte auf: Fakten, überprüfbare Aussagen und Interpretationen, Ihre Argumentation, Annahmen oder Empfehlungen Sie können eine bestimmte Markdown-Formatierung anfordern. Die KI kann nach Bedarf fetten Text, Kursivschrift, Überschriften und Aufzählungspunkte verwenden Kursivschrift, Überschriften und Aufzählungspunkte Fragen Sie einfach fett gedruckt nach wichtigen Punkten oder nach wichtigen Begriffen in Kursivschrift, und die Antwort wird so formatiert, wie Sie es Sie können Ihre Tipps organisieren, indem Aufzählungspunkte für den Haupttipp von Claridm, unterstützende Details und weitere Denken Sie schließlich daran, dass Sie jederzeit darum bitten können, die Antwort neu zu formatieren, wenn die erste Version nicht ganz Ihren Anforderungen entspricht Es ist völlig in Ordnung zu sagen: Könnten Sie diese Informationen als nummerierte Liste neu organisieren Oder teilen Sie dies bitte in kürzere Absätze auf , um das Wetter besser lesbar Okay, und das war's für diesen kurzen Vortrag. Lassen Sie uns die wichtigsten Punkte zusammenfassen, die wir gerade behandelt haben. Geben Sie immer im Voraus Ihr gewünschtes Format an, um die nützlichste Antwort zu erhalten Sie können bestimmte Strukturen wie Berichte, Tabellen oder Listen anfordern wie Berichte, Tabellen oder Listen Vergleichstabellen eignen sich hervorragend für die Entscheidungsfindung. Sie können nach einer strukturierten Tabelle mit Vor- und Nachteilen und der besten Form fragen . Für Forschungsaufgaben können Sie Quellen anfordern und aus Gründen der Klarheit sogar Fakten von Interpretationen trennen. Ein KI-Modell kann seinen Schreibstil an Ihre Bedürfnisse anpassen , von lässig bis professionell. Markdown-Formatierung hilft dabei, wichtige Informationen hervorzuheben Sie können um eine Neuformatierung bitten , wenn die erste Antwort nicht ganz richtig Klare Formatierungsanweisungen führen zu nützlicheren und umsetzbareren Und das war's für dieses Video und wie immer für AlCa im nächsten 13. Nachverfolgung: Auswahl des richtigen Modells und Brainstorming mit Gemini: Jeder. Bis jetzt haben wir Brampton vereinzelt erkundet. Es ist an der Zeit, diese Teile zu einem vollständigen Ende-zu-Ende-Workflow zusammenzuführen einem vollständigen Ende-zu-Ende-Workflow zusammenzuführen Und nebenbei zeige ich Ihnen einige Produktivitätspakete, zeige ich Ihnen einige Produktivitätspakete die in Gemini verfügbar sind, z. B. wie Sie Antworten auf Richtigkeit überprüfen und sie direkt in Google Docs exportieren können Wir werden zwei Szenarien untersuchen, die bei weitem zu meinen Favoriten gehören, wenn es um die Arbeit mit Gemini geht Das sind Brainstorming und das Einholen von Feedback. Aber bevor wir mit unserem ersten Szenario beginnen, lassen Sie uns ein wenig darüber sprechen, wie Sie Ihr KI-Modell auswählen können Sie haben gesehen, wie ich in diesen Demos zwischen ihnen gewechselt habe, und Sie fragen sich vielleicht, und Sie fragen sich vielleicht, welches Modell Sie wählen sollten Und wenn Ihre Wahl von Ihrem Abonnement abhängt. Wenn Sie ein bezahlter Benutzer sind, schlage ich vor, dass Sie das Denken zu Ihrer Standardwahl machen. Seine Argumentationskraft bewältigt fast alles. Wechseln Sie zu schnell, nur für Aufgaben, bei denen wenig auf dem Spiel steht, wie schnelle Grammatikprüfungen oder schnelle Fragen, und wechseln Sie zu Profi, wenn Sie es mit langen Dokumenten, gründlichen Recherchen oder etwas anderem zu tun haben , das eine anhaltende Konzentration auf eine große Menge an Inhalten erfordert anhaltende Konzentration auf eine große Menge an , und genau da verdient es seinen Platz Ich arbeite jetzt schon seit geraumer Zeit mit Gemini, und das ist der beste Arbeitsablauf, den ich mir nach vielen Experimenten ausgedacht habe nach vielen Experimenten ausgedacht Wenn Sie die kostenlose Version nutzen, sollten Sie schnell als Standard verwenden, da die fortgeschritteneren Modelle begrenzte Tageskontingente im kostenlosen Tarif haben. Sie müssen also strategisch vorgehen und diese Credits für den Zeitpunkt aufsparen, Sie müssen also strategisch vorgehen und diese Credits für den Zeitpunkt aufsparen an dem Sie sie wirklich benötigen Wechseln Sie zum Denken , wenn eine Aufgabe tiefgründige Logik oder mehrstufiges Denken erfordert , und wechseln Sie zum Profi, wenn Sie mit umfangreichen Inhalten arbeiten oder ein hohes Maß an Nuancen und Tiefe benötigen hohes Maß an Nuancen und nun vor diesem Hintergrund Lassen Sie uns nun vor diesem Hintergrund zu unserem ersten Folgeszenario des Brainstorming-Prozesses übergehen Folgeszenario des Brainstorming-Prozesses Ich möchte, dass Sie sich vorstellen, Sie sind der Marketingmanager eines sehr ehrgeizigen, einfallsreichen Schlaftech-Startups namens Wir sind dabei, den Snooze One auf den Markt zu bringen, den weltweit ersten Wie Sie unserem internen Briefing entnehmen können, bietet diese Matratze alles, bietet diese Matratze alles von der Klimazonen-Technologie Dream-Sync-Analysen bis hin zur Vibe Sing Story Sie müssen eine Kampagne zur Markteinführung in den sozialen Medien aufbauen , die intelligentes Schlafen unverzichtbar macht Öffnen wir also Gemini , um die Demo zu starten. Ich wähle das Denkmodell, weil wir einen kreativen Strategen brauchen , der mit Nuancen umgehen kann Und lassen Sie uns mit unserem Brainstorming beginnen. Hier ist die erste Aufforderung , die ich verwenden werde. Sie sehen, dass ich zuerst die Rolle vorstelle, die Gemini übernehmen soll Dann habe ich ein wenig Kontext zu dem hinzugefügt , was wir demnächst auf den Markt bringen werden Unsere Zielgruppe. Und dann habe ich Gemini beauftragt, Themen für Zeltinhalte für unser 30-tägiges Startfenster vorzuschlagen Themen für Zeltinhalte für unser 30-tägiges Startfenster Und lassen Sie mich auch die PDF-Datei hinzufügen, die Sie gerade gesehen haben, um Gemini noch mehr Kontext zu geben Und lassen Sie uns die Eingabetaste drücken also hier sind die zehn Themen , die Gemini vorgeschlagen Mir gefällt dieses Thema am besten. Bitten wir Gemini also, sich eingehender mit diesem speziellen Thema zu befassen Also hier ist meine zweite Aufforderung. Und lassen Sie mich tatsächlich spezifizieren, dass ich zehn Kostenideen haben möchte . Lassen Sie uns die Eingabetaste drücken. Tolle Vorschläge. Und falls Ihnen einige davon nicht gefallen, können Sie Gemini jederzeit bitten, Ihnen zehn weitere Ideen vorzuschlagen Also lass uns das machen. Ich merke wenn du das mehrmals machst, kannst du dir wirklich tolle Vorschläge einfallen lassen. Versuchen Sie es also bitte und verwenden Sie nicht nur die erste Ideenliste , die Gemini bietet Lass uns noch eine Iteration machen. Ich habe Gemini einige Rückmeldungen zu der darin enthaltenen Ideenliste gegeben Nett. Ich sehe, dass wir mit einigen Ideen weiter arbeiten können. Aber bevor wir anfangen, die eigentlichen Skripte für unseren Beitrag oder unsere Videos zu erstellen, möchte ich Gemini noch eine Frage stellen Bevor wir weitermachen, möchte ich wissen, was die aktuellen Trends bei Social-Media-Inhalten für die Einführung von Technologieprodukten sind die aktuellen Trends bei Social-Media-Inhalten , wie in unserem Fall Hier sind die Trends. Sie sehen, dass das aktuelle Jahr korrekt aufgenommen wurde. Und hier ist meine nächste Aufforderung. Ich werde Gemini bitten, zehn Kurzform-Videoskript-IDs für die Vibe-Check-Storytelling-Serie vorzuschlagen zehn Kurzform-Videoskript-IDs für die Vibe-Check-Storytelling-Serie Nehmen wir an, ich möchte, dass Instagram die Plattform unserer Wahl ist Und beachten Sie, dass ich dieses PDF auch mit den Viral-Hook-Ideen beigefügt den Viral-Hook-Ideen habe , die Gemini bei der Vorbereitung der Antwort verwenden soll Das nennt man Erdung. Deshalb verankere ich die Antwort von EIs in unserem spezifischen Markenstil damit sich die Skripte nicht generisch anfühlen Als Nächstes habe ich auch die Struktur für das Drehbuch bereitgestellt und das war's Lass uns die Eingabetaste drücken. Okay, wir sehen, dass Gemini einige Platzhalter hinzugefügt hat, und ich möchte wirklich ein vollständiges Skript für den Teleprompter bereit haben , damit wir das Video einfach aufnehmen können Beim Brainstorming bitte ich Gemini also zunächst, eine Vielzahl von Ideen zu untersuchen, und dann werde ich diese Ideen möglicherweise mehrmals wiederholen dann Und dann wähle ich normalerweise eine Idee aus, die mir gefällt, und bitte Gemini, sich auf dieses Thema zu beschränken und, sagen wir, einen Beitrag oder eine Geschichte zu dieser Idee meiner Wahl zu verfassen In Ordnung, unser Drehbuch ist fertig. Ich kann weiter mit Gemini sprechen und darum bitten, das Skript anzupassen oder eine andere Idee zur Erweiterung anzunehmen Aber nehmen wir an, dass ich mit diesem Skript einverstanden bin Ich kann dieses Skript tatsächlich direkt in das Google-Dokument exportieren dieses Skript tatsächlich direkt in das Google-Dokument Du siehst drei Punkte, die ich hören kann. Wenn ich darauf klicke, kann ich zwei Hunde exportieren wählen und mal sehen, was passiert. Gemini teilt mir mit, dass das neue Dokument erstellt wurde. Klicken wir auf Öffnen. Sehr nett. Wir haben sogar eine Tabelle mit Zeitcodes und genauem Text, den wir sagen müssen. Sehr cool. Und du siehst hier auch, wie Geminis versucht, diese Tabelle in Blätter zu exportieren Versuchen wir das auch zu tun. Persönlich exportiere ich für dieses Szenario gerne in Google Docs. Ich denke, es funktioniert besser für diese Art von Dokument, aber Sie haben die Idee. Das war's für dieses Tutorial und Alca im nächsten. 14. Folgemaßnahmen: Feedback mit Google Gemini AI erhalten: Jeder. Willkommen zum zweiten Follow-Along Video. Lassen Sie uns untersuchen, wie Sie Feedback von Gemini erhalten. Dieser Anwendungsfall ist einer der ersten, mit denen ich angefangen habe. Bei Verwendung des EI-Assistenten. Früher habe ich meine Dokumente wie Präsentationen, Berichte und Lebensläufe eingereicht wie Präsentationen, Berichte und Lebensläufe und EI um Feedback gebeten, damit ich eine zweite Meinung dazu einholen und Verbesserungen vornehmen kann . Aber Gemini hat diesen Prozess auf eine völlig neue Ebene gebracht , da er von Natur aus multimodal ist, was bedeutet, dass er nicht nur Texte, sondern auch andere Arten von Inhalten wie Videos verarbeiten kann sondern auch andere Arten von Inhalten Sie können jetzt personalisiertes Feedback zu Ihrer tatsächlichen Leistung erhalten , nicht nur zu dem, was Sie nicht nur zu dem, was Der Grund, warum Gemini hier so dominant ist , ist sein riesiges Kontextfenster. Das ist das erste Mal, dass wir diesen Begriff verwenden. Lassen Sie uns ihn also vorstellen. Das Kontextfenster ist im Wesentlichen das IIS-Kurzzeitgedächtnis. Es ist die Datenmenge, die das Modell gleichzeitig in seinem Gehirn speichern kann , um die Anfrage zu verstehen. Während andere Modelle möglicherweise Schwierigkeiten haben, sich mehr als ein paar Minuten an Filmmaterial zu merken, kann Gemini bis zu 1 Million Tokens verarbeiten Um Ihnen eine Vorstellung zu geben , das ist ungefähr eine Stunde Video oder Tausende von Textseiten in einem einzigen Durchgang Dieser riesige Speicher ist genau der Grund, warum so viele Benutzer für die Videoanalyse zu Gemini wechseln Aber verlassen Sie sich nicht einfach auf mein Wort . Lass es uns überprüfen. Ich werde den Denkmodus verwenden, um die Behauptung zu überprüfen. Und das ist die Aufforderung, die ich zuerst verwenden werde. Lass mich Enter drücken. Der Grund, warum ich mit dieser Frage angefangen habe, ist, dass ich Ihnen die Funktion zur doppelten Überprüfung der Antwort zeigen möchte. Und hier ist die Antwort mit den Details darüber, warum Profis zu Gemini wechseln. Um auf zu Gemini wechseln. Um die Double-Check-Response-Funktion zuzugreifen, klicken Sie unten in der Antwort auf das Symbol mit den drei Punkten Und hier sehen Sie die Antwort auf Double Check. Diese Funktion verwendet die Google-Suche, um Inhalte zu finden, die geringfügig ähneln oder von Gemini generierten Aussagen geringfügig ähneln oder sich von diesen unterscheiden Und bitte beachten Sie, dass diese Funktion speziell zur Überprüfung von Tatsachenbehauptungen entwickelt wurde Sie wird nicht für Dinge wie kreatives Schreiben, Programmieren oder ähnliche Aufgaben angezeigt , Programmieren oder ähnliche Aufgaben Gemini begann mit der Auswertung der Aussagen Und hier sehen wir die grünen Markierungen die die Behauptungen von Gemini bestätigen Und wir können dieses Fenster sogar erweitern, um den ausführlichen Artikel zu sehen , Gemini diese Behauptung bestätigt Das ist eine ziemlich praktische Funktion. Und jetzt lasst uns technisch werden. Ich habe während eines Zoom-Interviews für eine Rolle als Produktleiter ein Video von mir aufgenommen . Dies ist eine einstündige Aufnahme, die eine riesige Menge an Informationen darstellt. Aus diesem Grund werde ich mich für das Pro-Modell entscheiden. Aber zuerst starten wir einen neuen Chat. Hier entscheide ich mich für P. Das Pro-Modell wurde mit einer wesentlich höheren Intelligenzgrenze entwickelt und ist besser darin, ein kohärentes Verständnis über die gesamte Stunde des Filmmaterials aufrechtzuerhalten ein kohärentes Verständnis über . Lassen Sie mich also zuerst das Filmmaterial anhängen. Ich habe hier zehn verschiedene Videofragmente und reiche auch meine Anweisungen ein. Ich begann damit, Gemini eine Rolle als Coach für Führungskräfte zu geben eine Rolle als Coach für Führungskräfte Ich habe den Kontext in Bezug auf das Video bereitgestellt, was ich hier mache, und das ist meine Aufgabe Mit den spezifischen Fragen , die Gemini mir stellen soll Ich erwarte von Gemini, dass ich Informationen über meine Präsenz, Kommunikation, Stil und Klarheit, meine Stärken und Verbesserungsmöglichkeiten erhalte Und ich habe Gemini auch gebeten, die genauen Zeitstempel für seine Beobachtungen anzugeben , damit ich das Fragment, auf das sich Gemini bezieht, schnell finden und es mir selbst erneut ansehen kann Fragment, auf das sich Gemini bezieht, schnell finden und es mir selbst erneut ansehen Beobachten Sie, wie Gemini diese Informationen verarbeitet. Und hier ist das Feedback. Das sind großartige Beobachtungen und Dinge, die ich definitiv verbessern könnte. Und jetzt lasst uns dieses Feedback nehmen und es in etwas Nützliches umwandeln. Ich werde Gemini bitten, mein „Erzähl mir von dir“ -Skript neu zu schreiben , damit es aussagekräftiger ist und für die Rolle als Produktleiter, für die ich mich bewerben werde, relevanter ist , relevanter Rolle als Produktleiter, für die ich mich bewerben werde Wenn Sie wie in unserem aktuellen Beispiel mit Pmdel arbeiten, dauert die Generierung der Antworten deutlich länger. Seien Sie sich dessen Seien Und schließlich ist hier die neu geschriebene Version meiner Einführung in Erzählen Sie mir von sich selbst, sie sieht ziemlich gut aus Aber wenn ich es das nächste Mal in einer echten Konversation verwenden würde, würde ich es natürlich es das nächste Mal in einer echten Konversation verwenden würde, vorziehen, einige Dinge zu ändern um sicherzustellen, dass es mehr nach mir klingt Tolle Arbeit Gemini. Und einfach so haben Sie Gemini zu Ihrem persönlichen Coach gemacht Ich kann mir so viele Anwendungsfälle für diese Art von Videofeedback vorstellen Anwendungsfälle für diese Art von Videofeedback Stellen Sie sich vor, Sie machen eine 28-tägige Yoga-Herausforderung und benötigen täglich Feedback darüber, ob Sie sich verbessern oder ob Sie Angst haben , in der Öffentlichkeit zu sprechen Sie können sich selbst aufnehmen, . Sie können sich selbst aufnehmen, das Video zusammen mit Ihren Präsentationsfolien bei Gemini einreichen und fragen, zusammen mit Ihren Präsentationsfolien was funktioniert hat und was nicht, was mir aufgefallen ist, als ich anfing, das regelmäßig zu tun , ist ein positiver Nebeneffekt, den ich nicht erwarte Die Tatsache, dass Sie sich selbst aufnehmen , macht Sie selbstbewusster. Noch bevor Gemini etwas sagt, achtest du mehr darauf , was du tust und wie du es tust Aber das ist es, und das ist wichtig. Nehmen Sie KI-Feedback mit Vorsicht. Diese Modelle sind unglaublich leistungsfähig, machen aber Fehler. In dem Beispiel, das wir uns gerade angesehen haben, sagte mir Gemini zum Beispiel, dass ich die ganze Zeit im Stehen gesessen habe Nutze also die Erkenntnisse als Ausgangspunkt, aber verlasse dich immer auf dich selbst, wenn es um das endgültige Urteil geht Bitte lass mich in den Fragen und Antworten zu diesem Video wissen, welche Szenarien du im nächsten mit Alcia experimentierst im nächsten mit Alcia 15. Realität bleiben: Praktische Strategien zur Minimierung von KI-Halluzinationen: Stellen Sie sich vor, Sie fragen den KI-Assistenten einem aktuellen Nachrichtenereignis und er zitiert selbstbewusst einen ausführlichen Artikel, den es eigentlich nicht gibt, oder Sie fragen ihn nach öffentlichen Lebens und erhalten Antworten, die echte Fakten mit völlig erfundenen Details vermischen Das sind keine Bugs oder Pannen. Das nennen wir Halluzinationen in der KI. Und sie sind eine der größten Herausforderungen bei der Arbeit mit großen Lassen Sie uns untersuchen, warum diese Halluzinationen auftreten, wie man sie erkennt und vor allem, welche praktischen Techniken Sie sofort anwenden können , um genauere und zuverlässigere Antworten zu erhalten Um zu verstehen, warum diese Fehler passieren, müssen wir uns ansehen, wie diese Modelle aufgebaut sind. Im Gegensatz zu Menschen, die ein Thema wirklich verstehen, Sprachmodell prognostiziert ein Sprachmodell das wahrscheinlichste nächste Wort in einer Sequenz auf der Grundlage statistischer Muster weil sie so hilfreich wie möglich sind. Sie legen oft Wert darauf, eine vollständige, flüssige Antwort zu geben, anstatt zuzugeben, dass sie es sind Wenn ein Modell auf eine Informationslücke stößt , anhand derer es trainiert wurde , oder wenn es auf eine mehrdeutige Anfrage stößt, kann es die Lücken füllen, indem Antwort das wahrscheinlichste Geräusch errät Es ist kein Fehler. Es ist ein Nebeneffekt, dass die KI einer reibungslosen Konversation Vorrang vor verifizierter wir nun verstanden haben, warum Halluzinationen auftreten, wollen wir untersuchen, wie wir sie in der Praxis erkennen können Stellen Sie sich das so vor, als würden Sie Ihre Fähigkeiten zur Überprüfung von KI-Fakten weiterentwickeln. Sobald Sie die Warnzeichen kennen, sind sie viel leichter zu erkennen. Hier sind die wichtigsten Warnzeichen, auf die Sie achten sollten. Zu spezifische Details. Wenn das KI-Modell sehr spezifische Details liefert, insbesondere über aktuelle Ereignisse oder Statistiken, sollte dies zu einer zusätzlichen Prüfung führen Wenn es beispielsweise exakte Zahlen oder Statistiken für sehr spezielle oder sich schnell ändernde Ereignisse liefert , ohne eine Live-Quelle zu nennen, ist das ein Alarmsignal In diesen Fällen basiert die KI möglicherweise ähnlichen historischen Mustern, anstatt über das spezifische Ereignis zu berichten, nach dem Sie gefragt haben Perfekt klingende Zitate, Beispiele oder Statistiken. Wenn Sie eine Antwort bemerken , die zu perfekt klingt, ist das ein guter Grund, die Informationen noch einmal zu überprüfen Und glauben Sie mir, je mehr Erfahrung Sie in der Arbeit mit EI-Tools sammeln, desto besser werden Sie diese beiden schönen Momente exportieren , um wahr zu werden. Sie werden einen Instinkt dafür entwickeln, zu erkennen , wenn sich etwas falsch oder zu ausgefeilt anfühlt Und das ist Ihr Ansporn, tiefer zu graben, Fakten zu verifizieren oder Quellen zu überprüfen Vertrauen Sie, aber verifizieren Sie. Das ist die goldene Regel bei der Arbeit mit EI-generierten Inhalten. Inkonsistente Antworten. Wenn Sie dieselbe Frage mehrmals stellen und jedes Mal unterschiedliche spezifische Details erhalten, ist das ein starker Indikator für Halluzination Zu definitive Aussagen. wenn KI sehr definitive Aussagen zu Themen macht , bei denen eine gewisse Unsicherheit bestehen sollte, insbesondere in Bezug auf zukünftige Ereignisse vorsichtig, wenn KI sehr definitive Aussagen zu Themen macht, bei denen eine gewisse Unsicherheit bestehen sollte, insbesondere in Bezug auf zukünftige Ereignisse oder komplexe Themen Zu wissen, warum Halluzinationen auftreten und wie man sie erkennt, ist ein guter Anfang Aber wie verhindern wir sie tatsächlich ? Lassen Sie uns vier nützliche Strategien durchgehen , die Ihnen helfen, jedes Mal zuverlässigere und genauere Antworten zu erhalten . Strategie eins. Seien Sie explizit in Bezug auf Unsicherheit. Anstatt eine direkte Frage zu stellen , die die KI zum Erraten zwingt, geben Sie ihr eine klare Antwort, indem Sie sie bitten Genauigkeit Vorrang vor der Vollständigkeit von Johnsons Bericht, anstatt zu schreiben Was waren zum Beispiel die wichtigsten Ergebnisse ? Versuch das. Wenn Sie verifizierten Zugriff auf Johnsons Bericht haben, teilen Sie uns bitte die wichtigsten Ergebnisse mit. Wenn Sie sich bei Einzelheiten nicht hundertprozentig sicher sind, geben Sie bitte ausdrücklich an, welche Teile Sie nicht verifizieren können. Oder anstatt alle Unternehmen aufzulisten , die diese Technologie verwenden, versuchen Sie es anhand der Daten, an denen Sie geschult wurden. Können Sie verifizierte Beispiele von Unternehmen auflisten , die diese Technologie einsetzen? Bitte geben Sie die spezifischen Quellen oder den Kontext für jedes Beispiel an und geben Sie an, ob es sich bei einem dieser Fälle eher um Spekulationen als um bestätigte Fälle handelt Folgendes, anstatt die aktuelle Marktgröße für AichatBDS zu ermitteln. Können Sie die neuesten Schätzungen der Marktgröße für AichatBDS aus zuverlässigen zitierten Quellen bereitstellen für AichatBDS Bitte geben Sie den genauen Zeitraum für alle Daten an, die Sie teilen, und lassen Sie mich wissen, wenn Sie keinen Zugriff auf die neuesten Zahlen haben Beachten Sie, dass jede überarbeitete Aufforderung ausdrücklich die Erlaubnis gibt , Unsicherheiten und Einschränkungen anzuerkennen. Diese einfache Änderung kann die Zuverlässigkeit der Antworten erheblich verbessern. Strategie zwei: faktengestützte Zitate einfordern. Wenn Sie nach Quellen fragen, suchen Sie nicht nur nach einer Linkliste KI kann manchmal perfekt aussehende Zitate für Artikel oder Websites generieren perfekt aussehende Zitate , die es nicht gibt Weisen Sie das Modell stattdessen an, den spezifischen Satz aus der Quelle zu zitieren spezifischen Satz aus der , der Ihre Schlussfolgerung stützt Indem Sie das EI zwingen, seinen Anspruch Wort für Wort mit einem vorhandenen Text abzugleichen , reduzieren Sie seine Fähigkeit, Details mitten im Satz zu erfinden, erheblich Details mitten im Satz zu erfinden Strategie drei: Verwenden Sie strukturierte Ausgabeformate. Anfordern strukturierter Ausgaben kann dazu beitragen, Halluzinationen zu minimieren indem das KI-Modell gezwungen wird, Informationen systematischer zu organisieren Analysieren Sie diese Verkaufsdaten beispielsweise anhand der folgenden Struktur: verifizierte Datenpunkte , direkte Zahlen aus dem Dokument, berechnete Kennzahlen, zeigen Sie Ihre Berechnungen und Interpretationen, eindeutig als Interpretationen gekennzeichnet sind, und Unsicherheiten, Bereiche, in denen Daten unklar Strategie vier. Implementieren Sie die Schritte zur Überprüfung. Nehmen Sie Verifizierungsschritte direkt in Ihre Eingabeaufforderungen auf, um die Genauigkeit und Zuverlässigkeit der Antworten zu verbessern Sie können beispielsweise darum bitten, alle Annahmen aufzulisten , die während der Analyse getroffen wurden, und Bereiche hervorzuheben, in denen das Vertrauen oder die Sicherheit geringer ist Empfehlen Sie zusätzliche Informationen, die zur Bestätigung der Schlussfolgerungen beitragen könnten. Dieser Ansatz gewährleistet gründlicheres und transparenteres Ergebnis, sodass die Qualität der Antworten leichter beurteilt werden kann. Sie jetzt alle Informationen über KI-Halluzinationen haben , nehmen Sie sich einen Moment Zeit, um eine Ihrer letzten Aufforderungen zu lesen Wie könnten Sie es mit den Strategien, die wir gerade behandelt haben, modifizieren Strategien, die wir Denken Sie daran, dass das Ziel nicht darin besteht Halluzinationen vollständig zu eliminieren, sondern einen Arbeitsablauf zu schaffen, bei dem die Wahrscheinlichkeit geringer ist, dass sie sich auf Ihre Ergebnisse auswirken Bitte teilen Sie uns Ihre ursprüngliche und überarbeitete Aufforderung im Bereich Fragen und Antworten Und wie immer lassen Sie uns kurz die wichtigsten Punkte dieses Vortrags zusammenfassen KI-Halluzinationen entstehen, wenn Sprachmodelle falsche, aber plausibel klingende Informationen erzeugen falsche, aber plausibel klingende Informationen Halluzinationen entstehen, weil die KI ein selbstbewusster Geschichtenerzähler ist, der einer reibungslosen Konversation Vorrang einräumt, anstatt seine Arbeit anhand eines Lehrbuches oder realer Fakten zu überprüfen. Warnsignalen von Halluzinationen gehören zu spezifische Details, perfekt klingende Zitate, widersprüchliche Antworten Zu den Warnsignalen von Halluzinationen gehören zu spezifische Details, perfekt klingende Zitate, widersprüchliche Antworten und zu definitive Aussagen. Zu den Warnsignalen von Halluzinationen gehören zu spezifische Details, perfekt klingende Zitate, widersprüchliche Antworten und zu definitive Aussagen. Gehen Sie in Aufforderungen explizit auf Unsicherheit ein, um KI zu ermutigen, ihre Grenzen anzuerkennen. Fordere Zitate und Argumentation an, um die Ergebnisse der KI zu verifizieren und Verwenden Sie strukturierte Ausgabeformate, um Halluzinationen zu minimieren, indem Sie Informationen systematisch organisieren Integrieren Sie Bestätigungsschritte in Aufforderungen, z. B. das Hervorheben Unsicherheiten Ordnung. Und das war's für diesen Vortrag, und wir sehen uns im nächsten Video. 16. Arbeiten mit Gemini Canvas und Gems: Abschnitt Intro: Willkommen im nächsten Abschnitt. Inzwischen sollten Sie ein gutes Verständnis dafür haben, wie man mit Zwillingen spricht Wir werden zwar weiter auf diesen Fundamentaldaten aufbauen, aber es ist an der Zeit, ein höheres Level zu erreichen Wir gehen über einfache Hin- und Her-Eingabeaufforderungen hinaus und erkunden Canvas und Jams Wir beginnen mit Canvas, einem Arbeitsbereich , in dem Sie Text bearbeiten, Versionen vergleichen und an Ihrer Arbeit arbeiten können , Versionen vergleichen und an Ihrer Arbeit arbeiten Nicht jedes Mal bei Null anfangen und viel mehr tun. Dann lernen wir Konfitüren. Diese sind wie maßgeschneiderte Spezialisten, die sich an Ihre spezifischen Regeln erinnern, sodass Sie sie nicht wiederholen müssen. Wir werden zwei davon zusammen erstellen, den Grammatik- und den Rechtschreibprüfer. Dieser Jam fungiert als professioneller Redakteur , um von Ihrem Schreiben zu profitieren gleichzeitig Ihre Stimme und gleichzeitig Ihre Stimme unverändert zu lassen. Als KI-Fitnesscoach kann dieser Ihre Trainingsvideos ansehen, Ihre Form auf Sicherheit überprüfen und sogar individuelle Motivationshintergründe für Ihr Handy entwerfen individuelle Motivationshintergründe für Ihr Handy Am Ende dieses Abschnitts werden Sie nicht nur Aufforderungen senden Sie werden Ihr eigenes Expertenteam zusammenstellen , um Ihre schnellen Gedanken in fertige Arbeiten umzusetzen oder Ihre Routinen zu automatisieren Lass uns anfangen. 17. Willkommen bei Gemini Canvas: Jeder. Willkommen zurück zur ersten Vorlesung dieses Abschnitts. Bisher haben wir die Standard-Chat-Oberfläche von Gemini gesehen, wie wir es gewohnt sind, in verschiedenen Messengern zu arbeiten Es eignet sich hervorragend für kurze Fragen, Feedback oder Brainstorming Feedback oder Brainstorming Es kann sich jedoch etwas eingeschränkt anfühlen, wenn Sie an einem brandneuen Dokument arbeiten Oder ein Inhalt, der mehrfach überarbeitet werden muss. Das liegt daran, dass Sie, wenn Sie etwas Komplexes entwerfen, mehr benötigen als ein Hin - und Her-Gespräch Sie benötigen einen Arbeitsbereich mit verschiedenen Bearbeitungswerkzeugen. Hier kommt Gemini Canvas ins Spiel. Stellen Sie sich Gemini Canvas als kollaborativen Arbeitsbereich vor. In einem Standard-Chat gibt Ihnen das EIS eine Antwort, und wenn Sie einen Satz ändern möchten, müssen Sie normalerweise darum bitten , dass das Ganze neu geschrieben wird In Canvas öffnet Gemini ein Fenster nebeneinander. Auf der linken Seite haben Sie Ihren Chat. Auf der rechten Seite haben Sie ein lebendes Dokument. Es ist nicht mehr nur ein Chatbot ein Redakteur, der direkt neben Ihnen sitzt Sie können in den Text klicken, Wörter selbst ändern oder einen bestimmten Absatz markieren und es Gemini mitteilen Lass nur diesen Teil durchbohren. Wenn das gut klingt, warte, bis du das hörst Leinwand eignet sich nicht nur zum Schreiben, sondern auch zum Bauen. Direkt vom Schnittstellenmenü aus können Sie Webseiten, visuelle Infografiken für komplexe Daten und sogar Lernwerkzeuge wie Quizze und Karteikarten erstellen visuelle Infografiken für komplexe Daten und sogar Lernwerkzeuge wie Quizze und Für diejenigen, die lieber zuhören. Es gibt Audioübersichten, mit denen Sie Ihre Ergebnisse im Podcast-Stil zusammenfassen Am beeindruckendsten ist vielleicht, dass Sie funktionale Mini-Apps erstellen können Beschreiben Sie einfach ein Tool wie einen Familienrezept-Organizer oder einen persönlichen Kalender und Canvas erstellt den Code für Sie und führt ihn in Echtzeit Sie müssen nicht wissen, wie man programmiert. Sie müssen nur beschreiben, was das Tool tun soll — ein Prozess, der heute als Vibe-Codierung bekannt ist Nun, da Canvas so mächtig ist, kann es verlockend sein, direkt mit der Entwicklung von Apps und Spielen zu direkt mit der Entwicklung von Apps und Spielen zu Wir werden dies jedoch Schritt für Schritt tun. In diesem Abschnitt des Kurses werden wir uns vorerst ausschließlich auf die Erstellung von Dokumenten konzentrieren. Am Beispiel eines imaginären KI-Matratzenherstellers werden wir sehen, wie Sie den Canvas-Arbeitsbereich nutzen können, um in einer flüssigen Sitzung eine Erzählung zu verfeinern und Unterstützung und Bildmaterial zu generieren und Unterstützung und Bildmaterial Sobald wir die Erstellung von Dokumenten gemeistert haben, werden wir uns später im Kurs mit den fortgeschritteneren Funktionen wie interaktiven App-Erstellung und der interaktiven App-Erstellung und Rapid Prototyping befassen In der nächsten Lektion werde ich Ihnen zeigen, wie Sie die Canvas-Oberfläche öffnen, und wir werden mit unserem allerersten gemeinsamen Entwurf beginnen Ich treffe dich in der nächsten. 18. Weiterführende Schritte: Erstellen und Bearbeiten von Dokumenten in Gemini Canvas (Teil 1): Wie in diesem Video versprochen, werden wir es in die Hand nehmen Wir werden untersuchen, wie man im Canvas-Arbeitsbereich navigiert, wie man mit der Funktion „Frag Gemini“ gezielte Bearbeitungen durchführt und wir werden bestimmte Teile des Dokuments ändern, wir werden bestimmte Teile des Dokuments ändern ohne den gesamten Entwurf neu schreiben Wir werden uns auch die Schnellaktionen ansehen denen sich Dinge wie Ton und Länge des Dokuments ändern Schließlich werden wir multimodal werden. Wir werden die Marke mit von EI generierten Logos und Produktbildern zum Leben erwecken . Wechseln wir für die Demo zu Gemini. Beginnen wir mit dem Wechsel in den Canvas-Modus. Dazu klicke ich auf Tools und wähle Canvas im Popup-Fenster. Lassen Sie uns auch das Modell des Denkens ändern. Und ich werde mit einer allgemeinen Konversationsaufforderung beginnen. Hier ist, was ich eingeben werde. Ich habe Gemini einen Überblick darüber gegeben, was ich tun werde Ich habe die Aufgabe gestellt. Ich sagte, dass ich eine kurze Beschreibung des Unternehmens und des neuen Produkts benötige , das dieses Unternehmen auf den Markt bringen wird. Ich habe auch Details zum Stil angegeben. Ich möchte, dass Gemini abholt. Lass uns die Eingabetaste drücken und sehen, was Gemini schreiben wird. Es öffnet den Canvas-Arbeitsbereich mit dem Chat auf der linken Seite und dem Text auf der rechten Seite Wir sehen hier, dass es die Unternehmensbeschreibung mit Namen, Motor und einem kurzen Überblick über die Aktivitäten dieses Unternehmens erstellt die Unternehmensbeschreibung mit Namen, Motor und einem kurzen Überblick über hat. Als Nächstes haben wir die Informationen über das Produkt, einschließlich der wichtigsten Merkmale der Matratze, und es wurden sogar einige Brainstorming-Ziele für meine bevorstehende Demo vorgeschlagen einige Brainstorming-Ziele für meine Perfekt. Lassen Sie uns diesen Arbeitsbereich auf der rechten Seite erkunden. Oben im Arbeitsbereich können Sie zunächst einige Bearbeitungswerkzeuge sehen. Sie können beispielsweise den Überschriftenstil für Ihren Text ändern. Sie können hier eine Aufzählung oder eine Nummer zur Liste oder sogar einige Formeln hinzufügen . Wenn Sie möchten, können Sie diese Seite ausdrucken. ein PDF-Dokument, und hier gibt es noch andere Funktionen, die wir etwas später in diesem und den folgenden Tutorials untersuchen werden etwas später in diesem und den folgenden Tutorials untersuchen . Die wahre Magie in diesem Arbeitsbereich ist die Funktion „Frag Gemini“ Nehmen wir an, Sie möchten an einem Teil Ihres Textes eine Änderung vornehmen Teil Ihres Textes eine Und anstatt im Chat nach einem ganz neuen Entwurf zu fragen, können Sie einfach den Teil markieren, den Sie bearbeiten möchten, und dann Ihre Anfrage an Gemini schreiben Ich möchte zum Beispiel den Standort des Firmenbüros ändern Also was ich tun werde, ich werde diesen Text hervorheben und nur meine Anweisungen für die Änderung beifügen , die Gemini vornehmen soll Siehst du, Gemini hat die Änderung vorgenommen und diesen neuen Text direkt in das Dokument aufgenommen diesen neuen Text direkt in das Und in der linken Seitenleiste sehen wir, dass sie den Informationstext und sogar eine Beschreibung dieser Änderung enthielt den Informationstext und sogar eine Beschreibung dieser Änderung Lassen Sie mich diesen Text durchblättern und sehen, welche Änderungen ich zusätzlich zum Bürostandort vornehmen möchte zusätzlich zum Bürostandort vornehmen M Ich kann weiter an diesem Dokument arbeiten und hin und her gehen, einschließlich der Änderungen, bis ich mit dem Text vollständig zufrieden Ehrlich gesagt verwende ich Canvas für die Erstellung von Dokumenten aufgrund dieser Funktion „Frag Gemini Wie in den meisten Fällen muss ich einen ganz bestimmten Teil eines Dokuments anpassen Folgendes habe ich jedoch nach wochenlangen Experimenten entdeckt Da sich Gemini auf diesen bestimmten Teil eines Dokuments konzentriert , wird manchmal das Gesamtbild übersehen Mir sind Fälle aufgefallen, in denen es Ausdrücke wiederholt, die in anderen Teilen des Dokuments verwendet wurden, oder Begriffe verwendet, die erst später eingeführt wurden Geben Sie Ihrer Arbeit also auf jeden Fall einen kurzen Überblick, um sicherzustellen, dass alles zusammenpasst Und das war's für den ersten Teil dieses Tutorials. Und wir sehen uns im zweiten. 19. Weiterführende Schritte: Erstellen und Bearbeiten von Dokumenten in Gemini Canvas (Teil 2): Willkommen zum zweiten Teil des Tutorials, in dem wir Gemini Canvas für die Erstellung von Dokumenten untersuchen Abgesehen von Ask Gemini gibt es schnelle Aktionen, die Sie möglicherweise nützlich finden, um Änderungen an Ihrem Text vorzunehmen Die erste schnelle Aktion ist die Änderung der Länge. Dies ist ideal, wenn Sie einen Abschnitt schnell mit mehr Details erweitern oder ihn zu einer kurzen Zusammenfassung verkleinern müssen Nehmen wir an, wir möchten die Länge unseres Textes ändern Ich klicke auf diese Schaltfläche und muss dann die Länge wählen, die ich für meinen neuen Text haben möchte Nehmen wir an, ich möchte, dass er länger als der aktuelle Text ist, und warten wir auf die Änderungen. Und Gemini hat diesen Text erweitert. Sie sehen, dass der neue Text hier blau hervorgehoben wurde der neue Text hier blau Kommen wir zurück zu den Aktionsschaltflächen der Woche. Und die zweite dient dazu, den Ton zu ändern. Falls Sie also professioneller oder andererseits etwas gesprächiger klingen möchten , ist dies die Schaltfläche, mit der Sie die Atmosphäre Ihres Schreibens mit buchstäblich nur einem Klick ändern können Wählen wir „Ton ändern“, und ich kann von formell zu sehr formell oder lässig und sehr lässig wechseln sehr formell oder lässig und sehr lässig Ehrlich gesagt bin ich mit dem aktuellen Ton für den Text einverstanden, aber lassen Sie uns ihn für diese Demo zum Beispiel etwas formeller gestalten für diese Demo zum Beispiel etwas formeller gestalten Wir sehen, dass Gemini hier fast das gesamte Textfragment geändert hat fast das gesamte Textfragment geändert Ich würde es vorziehen, zur vorherigen Version zurückzukehren. Aber ich denke, Sie haben eine Vorstellung davon, was diese Option zum Ändern des Tons bewirken kann. Ich kehre also zur vorherigen Version des Dokuments zurück. Und schließlich gibt es auch eine Funktion zum Vorschlagen von Änderungen. Das ist, als hätte man einen Schreibkörper. Gemini gibt Ihnen Feedback und zeigt Ihnen, wie Sie Ihr Schreiben verbessern können, ohne Ihren Originaltext sofort zu ändern Lassen Sie uns auch diese Funktion ausprobieren. In Ordnung, großartig Wir sehen, dass Gemini einige Änderungen zusammen mit den Informationen über den Grund für diese Änderung hinzugefügt hat einige Änderungen zusammen mit den Informationen über den Grund für diese Wenn ich mit all diesen Änderungen einverstanden bin, kann ich sie alle anwenden Wenn Ihnen der Vorschlag von Gemini nicht gefällt und Sie zur vorherigen Version des Dokuments zurückkehren möchten , können Sie dies Gemini direkt hier im Chat mitteilen Cool. Klicken wir also auf Bewerben für die verbleibenden Vorschläge, damit wir sie in der neuen Version des Dokuments beibehalten können . Ordnung. Lass uns die Demo fortsetzen. Und als nächsten Schritt möchte ich einige Grafiken erstellen, um Ihnen die multimodalen Fähigkeiten von Gemini zu zeigen die multimodalen Fähigkeiten von Kurs werden wir einen eigenen Abschnitt zur Später im Kurs werden wir einen eigenen Abschnitt zur Erstellung visueller Inhalte Also werde ich vorerst nur eine sehr kurze, unkomplizierte Eingabeaufforderung eingeben. Und lassen Sie mich Andrew drücken , um die Ergebnisse zu sehen. Und hier ist das erste Bild. Erstaunlich, dass Gemini sogar den Produktnamen hier auf einer Seite der Matratze angegeben den Produktnamen hier auf einer Seite der Matratze Gemini sagt mir auch, dass es jeweils nur ein Bild erzeugen kann ein Bild erzeugen Es fragt mich, ob ich mit dem Firmenlogo fortfahren möchte Gemini wird sehr gut darin , Texte in die Bilder aufzunehmen Und lassen Sie uns nach mehreren Bildern für Funktionen fragen mehreren Bildern für . Großartig Und Sie sehen, warum es wichtig ist, Bilder in demselben Chat zu erstellen , in dem wir den Originaltext erstellt haben. Gemini verwendet den Kontext aus den vorherigen Konversationen , um das Bild zu erstellen Sie sehen, dass Informationen über einen Winkel von drei Grad benötigt wurden, obwohl dieser Winkel für mich etwas größer aussieht . Aber das ist in Ordnung. Wir können dies durch Iterationen, die an diesem Bild arbeiten, anpassen Iterationen, die an diesem Bild arbeiten Hier war auch der Name der Matratze enthalten. Lassen Sie uns das vierte Bild erstellen. Das ist großartig. siehst du in der Beschreibung, wir haben die Information, dass diese Funktion eine saubere Luftkuppel über den Schlafenden erzeugt, und genau das sehen wir hier auf dem Bild. Unglaublich. Und lass uns den Text überprüfen. Optimale Luftfeuchtigkeit, Luftqualität. Ja, und der Text ist korrekt. Ich sehe hier keine Fehler. Ordnung, lassen Sie uns dieses Tutorial beenden bevor es zu lang wird Wir werden in unserem nächsten Video weiter mit dem Text und den Bildern arbeiten in unserem nächsten Video weiter mit dem Text und den Bildern 20. Weiterführende Schritte: Verwandeln eines Gemini-Entwurfs in ein poliertes PDF mit Gamma: Wir haben jetzt die Hintergrundgeschichte unserer Marke, Produktmerkmale und die Bilder in Gemini organisiert Stellen Sie sich das als unser Entwurfsstudio vor. Der Raum für Kerndenken und Schreiben. Unser Arbeitsentwurf ist jedoch noch nicht fertig und kann geliefert werden. Wenn Sie dies einem Manager oder Kunden als professionellen Bericht vorlegen müssen , müssen wir diesen Inhalt in ein spezielles Designtool wie Canva oder Gamma App übertragen ein spezielles Designtool wie Canva oder Gamma Sie denken vielleicht, kann ich nicht einfach Gemini bitten , das PDF für mich zu generieren? Gute Frage Und ja, das war auch meine Absicht, als ich die Aufgabe bekam, das endgültige PDF zu erstellen. So geht Gemini damit um. Wenn Sie versuchen, ein PDF in Canvas zu erstellen, erhalten Sie das endgültige Dokument nicht Das Canvas-Tool wurde für die Live-Bearbeitung und Zusammenarbeit entwickelt, nicht für die Veröffentlichung. Da es in einem privaten Arbeitsbereich arbeitet, kann es Ihre lokalen Bilddateien nicht sehen , um sie in das Dokument aufzunehmen. Wenn Sie versuchen, von hier aus zu exportieren, werden Sie eine Datei mit leeren Platzhaltern an der Stelle sehen , an der sich Ihre Bilder befinden sollten Natürlich kannst du es auch mit einem normalen Chat versuchen. Es ist funktionaler. Es kann Dateien im Hintergrund generieren , um Ihnen ein herunterladbares PDF zur Verfügung zu stellen. Es fehlen jedoch die Layoutkontrolle und der Feinschliff, die für eine professionelle Präsentation erforderlich sind. Hier ist das PDF, das Gemini für mich erstellt hat. Es ist ein guter Anfang, aber es erforderte eine umfangreiche manuelle Formatierung, um richtig auszusehen Um also unsere Präsentation fertig zu stellen, wo der Text korrekt um die Bilder fließt und das Branding einheitlich ist, wechseln wir vom Entwurfsstudio zum Designstudio. Im nächsten Tutorial werde ich die Gamma-App verwenden, um dies zu demonstrieren. Es ist seit fast einem Jahr mein Hauptwerkzeug und ich verwende es für fast alle meine Designarbeiten. Dieselben Prinzipien gelten jedoch andere ähnliche Plattformen wie Canva oder Adobe Gehen wir zurück zu Gemini und bereiten wir unsere Inhalte für den Lassen Sie uns die Texte und Bilder unserer Assets in die Gamma-App übertragen. Ich beginne damit, den Text zu kopieren. Dazu klicke ich auf die Schaltfläche Teilen und Exportieren. Und von hier aus wähle ich Inhalte kopieren. Und ich habe bereits die vier Bilder heruntergeladen , die wir im vorherigen Tutorial generiert haben Also ist alles bereit für uns, nach Gamma zu wechseln. Lassen Sie uns die Gamma-App öffnen. Hier ist die Gamma-Hauptseite. Der zentrale Teil ist das Inhaltsraster. In diesem Bereich werden unsere Projekte, auch Gammas genannt, angezeigt. In der oberen Leiste können Sie neue Dokumente erstellen. Auf der linken Seite haben wir Vorlagen. Hier können wir auf voreingestellte Layouts zugreifen , um unser Präsentationsdesign zu beschleunigen. Wir haben so nützliche Dinge wie MAI-Bilder. Hier können wir Bilder ansehen und verwenden, die wir mit dem in Gammas integrierten EI-Bildtool generiert haben mit dem in Gammas integrierten EI-Bildtool generiert Wir können auch Ordner erstellen, um unsere Materialien nach bestimmten Themen oder Themen zu trennen unsere Materialien nach bestimmten Themen oder Themen zu Lassen Sie uns also gleich mit der Erstellung einer PDF-Datei beginnen. Ich wähle Create New with AI. Und hier haben wir verschiedene Optionen. Da wir bereits einen Text haben , den ich von Gemini kopiert habe, werde ich diese Option zum Einfügen in Text wählen Und hier werde ich den Text von Gemini einfügen. Als Nächstes haben wir verschiedene Optionen, was die Gamma-App mit unseren Inhalten machen kann Und es ist wichtig, dass wir uns dafür entscheiden, genau diesen Text beizubehalten. Das bedeutet, dass Gamma keine Änderungen an unserem Entwurf vornehmen wird. Dies ist die effektivste Methode für unser Beispiel, da wir damit Gemini für die schwere Arbeit des Denkens und Entwurfs verwenden und dann Gamma verwenden können für die schwere Arbeit des Denkens und Entwurfs verwenden und dann Gamma verwenden , um das endgültige Dokument zu formatieren und zu verschönern Ich wähle hier die Option Weiter zur Eingabeaufforderung für den Editor aus. Hier können wir verschiedene Themen für unsere Präsentation auswählen. Wählen wir dieses aus und klicken Sie auf Thema auswählen. Bevor wir auf Generieren klicken, beachten Sie die beiden Modi oben Freiform und Karte für Karte. Lassen Sie mich kurz den Unterschied erklären. Wenn Sie Karte für Karte auswählen, teilt Gamma Ihren Inhalt automatisch in separate nummerierte Folien auf. Eine Idee pro Karte, aber Sie können die Karten immer noch neu anordnen oder neue hinzufügen Es ist perfekt für Präsentationen. Bei Reform bleibt alles einem fortlaufenden Dokument, das eher einem Bericht als einem Folienstapel ähnelt. Derselbe Inhalt, aber es wird von oben nach unten gelesen , ohne dass es zwischen den Abschnitten zu Dadurch haben Sie mehr Kontrolle über das Layout und den Ablauf. Es eignet sich hervorragend für Dokumente oder Berichte. Für unsere Demo werde ich Freeform wählen, weil ich möchte, dass Text und Bilder auf natürliche Weise zusammenfließen Und lass uns auf Generieren klicken. Gamma beginnt mit der Erstellung unserer Folien. Zunächst bitte ich Gamma, mir mehrere andere Layouts vorzuschlagen , damit ich das Standardlayout mit anderen Vorschlägen vergleichen kann . Dazu klicke ich auf „Mit Agent bearbeiten“ und wähle von hier aus „Neues Layout testen“. Lassen Sie uns noch einmal nachschauen , ob es etwas Besseres als unsere erste Standardoption gibt. Ich glaube, ich werde diesen wählen. Mir gefällt dieses Hintergrundbild hier. Gehen wir zur nächsten Folie über. Ich werde unser Logo-Bild anstelle dieses einbinden. Um das Bild zu ändern, klicke ich auf das Bild. Als Nächstes gehe ich zu Bild bearbeiten. Und von hier aus wähle ich Bild-Upload oder URL. Ich habe meine Bilder auf meinem lokalen Laufwerk. Und los geht's. Das ist unser erstes Bild. Lass es uns anhängen. Perfekt. Gehen wir zur dritten Folie über. In Ordnung, wir sind bereit zu gehen. Lassen Sie uns den letzten Check machen und einen kurzen Blick auf all unsere Folien werfen. Um diese Datei zu exportieren, klicken wir auf das Symbol mit den drei Punkten. Hier wählen wir Exportieren und ich werde nach PDF exportieren. Lassen Sie uns die Datei sofort öffnen und los geht's. Sieht cool aus. Das ist also meine bevorzugte Arbeitsweise, wenn es darum geht, neue Dokumente zu erstellen. Ich überlasse Gemini den Teil des kreativen Denkens, und dann lasse ich mein bevorzugtes Designtool wie Gamma dafür sorgen, dass es gut aussieht Ich hoffe, dass Ihnen dieses Tutorial gefallen hat, und wie immer sehen wir uns im nächsten 21. Was sind Gemini Gems und warum brauchen wir sie?: Jeder, wenn Sie anfangen, Gemini regelmäßig zu verwenden, Sie schnell fest, dass es bestimmte Dinge gibt , für die Sie es immer wieder verwenden, sei es für Brainstorming, Feedback oder die Generierung neuer Inhalte. Möglicherweise müssen Sie dieselben Eingabeaufforderungen eingeben und immer wieder denselben Kontext angeben, was sich dieselben Eingabeaufforderungen eingeben und ein bisschen repetitiv anfühlen kann, ein bisschen repetitiv anfühlen kann stellen Sie schnell fest, dass es bestimmte Dinge gibt, für die Sie es immer wieder verwenden, sei es für Brainstorming, Feedback oder die Generierung neuer Inhalte. Möglicherweise müssen Sie dieselben Eingabeaufforderungen eingeben und immer wieder denselben Kontext angeben, was sich ein bisschen repetitiv anfühlen kann, wie Ihr eigener digitaler Nun, heute beenden wir diesen Zyklus. Wir werden eine Funktion untersuchen , mit der Sie diese sich wiederholenden Anweisungen zusammenfassen und sie in Ihr Team von KI-Experten oder persönlichen Assistenten umwandeln können diese sich wiederholenden Anweisungen zusammenfassen und sie in Ihr Team von KI-Experten oder persönlichen Assistenten umwandeln in Ihr Team von KI-Experten oder persönlichen Assistenten Sie werden Gemini Gems genannt. Und nein, wir sprechen hier nicht über Diamanten. Aber wenn Sie einmal gesehen haben, wie viel Zeit Sie sparen, denken Sie vielleicht, dass sie genauso wertvoll sind. Was genau ist ein Jam Stellen Sie sich diese als maßgeschneiderte Versionen von Gemini vor, die Ihnen helfen, sich wiederholende Aufgaben zu bewältigen oder tiefes Fachwissen in bestimmten Bereichen zu erwerben Wenn Sie mit Jam chatten, erinnert sich Gemini automatisch an Ihre Ziele und Richtlinien , sodass Sie sich nicht bei jeder Aufforderung wiederholen Während also ein normaler Zwilling wie ein Bibliothekar ist, der weiß, wo sich alles befindet, ist ein Edelstein wie ein engagierter Er kennt sich nicht nur mit einem Thema aus. Es folgt Ihren spezifischen Regeln , um Arbeit für Sie zu verrichten. Es gibt drei Arten von Konfitüren, vorgefertigte Marmeladen. Dies sind sofort einsatzbereite Tools, die von Google entwickelt wurden. Sie können ihre zugrunde liegende Logik nicht sehen oder bearbeiten. Du kannst sie nur an deine Seitenleiste anheften, um schnell darauf zugreifen zu können. Sie haben oft einzigartige Benutzeroberflächen wie das zehnseitige Märchenbuch-Layout , das normale Jams einfach nicht nachahmen können Benutzerdefinierte Jams. Diese stehen im Mittelpunkt unserer nächsten Tutorials, da Sie sie selbst erstellen. Sie stellen die Anweisungen zur Verfügung und können bis zu zehn persönliche Dateien hochladen bis zu zehn persönliche Dateien , die als Wissensdatenbank von Jams dienen. Das ist der Unterschied zwischen einem allgemeinen Assistenten und einem engagierten Experten, der speziell auf Ihre Daten und Ihre Ziele zugeschnitten ist. Konfitüren in Opal. Ople ist ein experimentelles Projekt , das KI über einfache Chatfenster hinaus Diese Drums sind interaktive Mini-Apps , die einem bestimmten Workflow folgen. Ihr herausragendes Merkmal ist die Fähigkeit, sie zu remixen. Sie können ein vorgefertigtes Tool wie einen Modestylist und dessen interne Schritte ändern, um etwas Neues zu kreieren Sie sind sehr visuell und können gleichzeitig Text, Bilder und Videos generieren gleichzeitig Text, Bilder und Videos Wir werden diese Dämme in den späteren Abschnitten des Kurses erkunden diese Dämme in den späteren Abschnitten des Kurses Da wir bereits mit Canvas gearbeitet haben, haben Sie jetzt vielleicht eine logische Frage Wie unterscheidet sich ein Jam eigentlich? Der Schlüssel ist, sich Canvas als Ihren gemeinsamen Arbeitsbereich vorzustellen. Es ist der kollaborative Schreibtisch, an dem Sie und das EI Seite an Seite an langen Dokumenten oder Code arbeiten. Edelsteine hingegen sind deine taktischen Spezialisten. Sie verwenden eine Trommel, um den ersten Entwurf zu erstellen, z. B. eine spezielle erste Version auf der Grundlage Ihrer hochgeladenen Daten zu generieren , und geben diese Arbeit dann an Canvas weiter, um sie zu verfeinern und zu polieren. Einer ist der Spezialist, Sie für den ersten Output beauftragen. Der andere ist der Schreibtisch, an dem das Projekt abgeschlossen wird. Natürlich können Sie das Schlagzeug auch ganz alleine für bestimmte Aufgaben verwenden , und das bringt uns zu unserer nächsten Folgevorlesung. Aber bevor wir anfangen, mit Schlagzeug zu arbeiten, wollen wir kurz zusammenfassen, was wir hier gelernt haben Ordnung. Und das war's für dieses Video. Ich treffe dich im nächsten. 22. Weiterverfolgung: Erstellen eines Juwels zur Grammatikprüfung: Alle zusammen, und willkommen zu unserem ersten Tutorial zu Gemini Gems Heute werde ich Ihnen zeigen, wie Sie einen individuellen Experten für das Korrekturlesen Ihrer Texte zusammenstellen können, egal ob Sie Landingpages, Produktbeschreibungen, schnelle E-Mails oder andere Texte verfassen Produktbeschreibungen, schnelle E-Mails oder andere Es ist, als hätten Sie ein zweites Paar Augen, das Ihnen bei jedem Wort, das Sie teilen, absolutes Vertrauen gibt Lass uns Gemini öffnen , um diesen Jam zu erstellen. Wir beginnen mit einem Klick auf Jams. In der Seitenleiste gehen wir hier zum Jam Manager, dem Abschnitt, in dem wir benutzerdefinierte Gems erstellen Und hier klicke ich auf New Jam. Lassen Sie uns zunächst den Namen für unseren Jam angeben. Hier ist meine Edelsteinbeschreibung. Als Nächstes habe ich meine Anweisungen beigefügt. Dies ist bei weitem der wichtigste Teil Ihres Edelsteins. Ich habe eine Rollenbeschreibung hinzugefügt und gesagt, dass Sie ein Experte darin sind, Grammatik, Rechtschreibung und Zeichensetzung in englischen Texten zu überprüfen Rechtschreibung und Zeichensetzung in und sie zu korrigieren, falls Sie auf Fehler stoßen Dann gebe ich eine Zielgruppenbeschreibung wenn Sie weitermachen und dieselbe Art von Edelstein erstellen, können Sie die Zielgruppe auf etwas ändern, das für Ihren Anwendungsfall und Ihre Domäne relevanter ist Ihren Anwendungsfall und Ihre Domäne relevanter Als Nächstes haben wir die Grundregeln, gefolgt von den Informationen darüber, nach welcher Ausgabe wir suchen , und wir haben auch eine Startaufforderung Sie sehen, dass ich Hashtags im Anweisungstext verwende. Diese dienen als Abschnittsteiler , die ein sauberes Grundgerüst für Ihre Anweisungen bilden Sie sorgen dafür, dass das Gehirn von Gems besser organisiert wird, sodass die KI weiß, wo eine Regel endet und die nächste beginnt Kehren wir nun zum Regelwerk zurück und besprechen wir es. Wie komme ich eigentlich auf diese Liste? Ich empfehle dringend, die Aufgabe, die Sie automatisieren möchten, drei- bis fünfmal manuell zu erledigen drei- bis fünfmal , bevor Sie überhaupt versuchen, den Jam zu erstellen. Wenn Sie direkt in die Anweisungen einsteigen, kann das einschüchternd wirken Jede Regel in dieser Liste existiert, weil es sich um eine bestimmte Präferenz handelt Ich habe über Wochen hinweg festgestellt, dass ich die KI manuell dazu aufgefordert habe. Möglicherweise stellen Sie auch fest, dass ich Wörter aus dem CUP-Protokoll verwende, wie zum Beispiel hier. Es gibt keine technischen Voraussetzungen, um sie zu verwenden. Gemini ist sehr anspruchsvoll. Es versteht Kleinbuchstaben genauso gut wie Großbuchstaben Aber ich habe festgestellt, dass es immer noch hilfreich ist, sie zu verwenden. Stellen Sie sich diese Worte als Machtwörter vor. Wir können sie verwenden, um die Regeln hervorzuheben, die nicht verhandelbar sind, sodass die KI genau weiß, was ein Muss und was ein Vielleicht ist In Ordnung, lassen Sie uns als Nächstes weitermachen. Ich bin vorerst mit diesen Anweisungen einverstanden, obwohl wir jederzeit zu dieser Liste zurückkehren können, nachdem wir diesen Jam erstellt und weiter bearbeitet Wir können auch ein Standardtool wählen. Dieses Tool wird ausgewählt, wenn Sie die neue Konversation mit dem Jam beginnen. Ich wähle Canvas als Standardwerkzeug. Anstatt eine chaotische Chat-Konversation zu führen, wird Ihr gerichteter Text in einem übersichtlichen Seitenbereich angezeigt, der perfekt formatiert ist und sofort zum Kopieren bereit ist Sie können der Wissensdatenbank auch Dateien hinzufügen, wenn Sie möchten, dass Ihr Jam auf externe Quellen verweist. Bei der Vorbereitung der Antwort siehst du, dass wir hier Dateien aus verschiedenen Quellen hochladen können . Aber für dieses spezielle Beispiel lasse ich es leer. Und wir sind bereit. Also lasst uns den Morgen retten. Ich klicke auf die Schaltfläche Speichern. Und wir können unseren neuen Chat starten. Hier ist der Text, den Gemini überprüfen soll. Ich habe hier mit Absicht mehrere Grammatikfehler gemacht. Mal sehen, ob es sie finden und diesen Entwurf korrigieren kann . Es öffnet eine Leinwand mit unserem neuen Text. Sieht für mich toll aus. Und denken Sie daran, dass Sie diese Canvas-Oberfläche verwenden können , um einige schnelle Änderungen an diesem Text vorzunehmen , falls Sie das Gefühl haben, dass Sie hier einige Änderungen vornehmen möchten Lassen Sie uns zum Beispiel „ Abgleichen“ hervorheben und nach Alternativen fragen . Wenn wir mit diesen Änderungen einverstanden sind, können wir auf „ Teilen und Exportieren“ klicken, „Inhalt kopieren“ auswählen oder diesen Text direkt exportieren zu unseren Google Docs Lassen Sie mich zu unserem JAM zurückkehren. Sie sehen, wir haben ihn in der Edelsteinliste hier in der linken Seitenleiste. Eines ist mir aufgefallen, hier gibt es keinen Gesprächsstarter. Als ich diese AM-Schnittstelle geöffnet habe, war mir nicht ganz klar, was ich hier tun soll? Ich habe einige Nachforschungen angestellt und diesen Artikel mit genau derselben Frage gefunden . Es stellte sich heraus, dass diese Gesprächsstarter derzeit nicht von Gems unterstützt Es gibt auch eine Problemumgehung, die wir ausprobieren können. In dem Artikel heißt es, dass Sie Starteraufforderungen wie diese simulieren können Starteraufforderungen wie diese simulieren , indem Sie Ihrem Jam eine zusätzliche Beschreibung hinzufügen Richtig, lassen Sie uns versuchen, ein Beispiel für einen Gesprächsstarter hinzuzufügen, um zu sehen, ob das hilft Ich kehre zu meinem Jam zurück. Wenn ich auf die drei Punkte klicke, CN, kann ich die Option Bearbeiten wählen und wir können hier alle gewünschten Änderungen vornehmen. Lassen Sie mich dieses Beispiel einfach unter die aktuelle Version der Anleitung einfügen. Und was wir hier auch tun können, abgesehen davon, dass wir ein Beispiel für unsere Starter-Eingabeaufforderung hinzufügen, können wir diesen magischen Knopf verwenden, damit Gemini unsere Anweisungen neu schreibt und verbessert Lass uns das ausprobieren. Vielleicht würde es helfen. Ich sehe, dass Gemini unser Beispiel für die Starter-Eingabeaufforderung entfernt hat unser Beispiel für die Starter-Eingabeaufforderung Ich entschied mich dafür, die Regel Nummer sechs beizufügen und Gemini zu bitten, die Konversation immer mit der folgenden Starteraufforderung zu beginnen die Konversation immer mit der folgenden Starteraufforderung Mal sehen, ob das funktioniert. Also werde ich meine Edelstein-Anweisungen aktualisieren, sie speichern und mit dem Testen beginnen. Als ich meinen aktualisierten Jam geöffnet habe, habe ich hier immer noch keinen Gesprächsstarter. Leider waren alle meine anderen Experimente mit definierten Jams-Anweisungen zum Hinzufügen des Konversationsstarters erfolglos. Vor diesem Hintergrund definieren wir die Jam-Beschreibung, um Informationen darüber zu erhalten, was ein Benutzer tun muss, um die Konversation zu beginnen. Kehren wir dazu zur JAMS-Bearbeitungsoberfläche zurück. Ich habe beigefügt, Ihren Text einzureichen, um loszulegen. Text am Ende der Jam-Beschreibung Ich werde ihn aktualisieren und ihn erneut testen. Unsere Anleitung ist hier, und lassen Sie uns zur Abwechslung etwas anderes einreichen. Ich habe dieses Fragment. Mal sehen, wie Gemini damit umgehen wird. Und wenn mir dieser Jam zusagt und ich ihn mit meinen Freunden oder Kollegen teilen möchte, kann ich auf die Schaltfläche Teilen klicken und Teilen wählen. Jim und ich werden einen Link erstellen. Ich kann es kopieren und dann verschicken. Ich hinterlasse den Link zu diesem Jam in den Ressourcen für dieses Video, falls du es testen möchtest. Und ich werde dich im nächsten Tutorial treffen dem wir den Personal Coach Jam bauen 23. Weiterlesen: Ein Juwel für Fitnesstrainer aufbauen (Teil 1): Lassen Sie uns nun einen Jam bauen , der mit Video funktioniert. Nehmen wir an, ich mache eine 28-Tage-App-Workout-Herausforderung online und möchte wissen, ob ich mich tatsächlich von Tag zu Tag verbessere. Ich werde mich selbst bei den täglichen Übungen aufzeichnen und meinen KI-Fitnesstrainer zur Vorsicht um Feedback bitten , wie wir bereits besprochen haben. Die KI ist zwar ein guter Partner, Die KI ist zwar ein guter Partner um deine Bewegung und Form zu verfolgen, sie ist kein medizinischer Experte. Konsultieren Sie immer den Arzt, bevor Sie mit dem neuen Fitnessprogramm beginnen. Dieses Tool dient dem Coaching und dem Fortschritt, nicht der medizinischen Beratung. Okay, lassen Sie uns Gemini öffnen, um mit der Demo zu beginnen. Lass uns einen neuen Jem erstellen. Ich erweitere dieses Menü. Geh zu Jams. Hier sehen wir Marmeladen, die von Labors hergestellt wurden. Ich scrolle runter zu Jam Manager. Ich habe die Grammatik - und Rechtschreibprüfung Jam bereits hier in der Liste meiner Edelsteine sichtbar Und lassen Sie mich vorerst einen neuen erstellen. Ich klicke auf New Gem. Lassen Sie uns den Namen, die Beschreibung und die Anweisungen für unseren personalisierten KI-Coach Jam angeben Beschreibung und die Anweisungen für unseren personalisierten KI-Coach . Ich habe diese Beschreibung beigefügt. Dieser Jam analysiert deine Trainingsvideos um detailliertes Leistungsfeedback zu geben, und erstellt benutzerdefinierte vertikale Motivationshintergründe für dein Handy , um dich immer wieder zu inspirieren Und hier sind meine Anweisungen. Also habe ich wie immer mit der Beschreibung der Rolle angefangen. Ich möchte, dass dieser Jam spielt. In unserem Fall wollte ich ein professioneller Fitnesstrainer werden. Dann habe ich eine Aufgabe für diese Marmelade hinzugefügt. Wir fordern Gemini auf, unsere Trainingsvideos zu analysieren und nach Hinweisen wie Cin oder Domin zu suchen . Ich habe auch beschrieben, dass ich möchte, dass Gemini ein vertikales Bild mit einem motivierenden Zitat erstellt ein vertikales Bild mit einem motivierenden Zitat Ich habe auch Starter-Eingabeaufforderungen hinzugefügt, obwohl wir gesehen haben, dass die Starter-Eingabeaufforderungen momentan Aber lasst uns trotzdem überprüfen, was diesmal passieren wird. Und um dieses Drama wirklich persönlich zu gestalten, werde ich ein Bild in die Wissensdatenbank hochladen, das die Atmosphäre des Motivationsbildes wiedergibt , das Gemini erstellen soll Ich klicke auf die Plus-Schaltfläche. Ich habe meine Referenzdatei auf meinem lokalen Laufwerk, daher wähle ich Dateien hochladen. Das ist mein Ordner, und das ist das Motivationszitat , das ich ausgewählt habe Natürlich können Sie hier auch andere Dateien hinzufügen. Falls Sie beispielsweise eine Forschungsarbeit haben, Falls Sie beispielsweise eine Forschungsarbeit haben die dieser Jam bei der Bereitstellung der Empfehlungen analysieren und nicht nur sein Allgemeinwissen nutzen soll Bereitstellung der Empfehlungen analysieren und nicht nur sein Allgemeinwissen nutzen , können Sie diese Datei jederzeit hier hochladen Und was das Standardtool für diesen Jam angeht , werde ich hier nichts auswählen. Das liegt daran, dass unser Fitnesstrainer zwei sehr unterschiedliche Dinge macht. Es gibt uns Textfeedback und erzeugt ein Bild mit hoher Auflösung. Indem wir Gemini also das beste Tool für jede Aufgabe auswählen lassen, stellen wir sicher, dass unsere Telefonhintergründe scharf aussehen und unser Feedback ohne technische Probleme übermittelt wird Hier ist alles gut. Wir sind bereit, auf Safe zu klicken. Beachten Sie übrigens, dass es auch dieses Vorschaufenster gibt auch dieses Vorschaufenster dem Sie Ihre Anweisungen testen können , bevor Sie sie speichern. Aber in meinem Fall habe ich den ersten Test bereits gemacht, bevor ich mit der Aufnahme dieses Tutorials begonnen habe, also bin ich startklar. Ich klicke einfach auf Sicher und lass uns unseren Chat starten. Habe mein erstes Video vom ersten Tag meines Trainings hochgeladen und lass uns ein bisschen warten, bis der Gemini es verarbeitet hat Unser Video wurde hochgeladen, und bevor wir die Eingabetaste drücken, lassen Sie uns hier über die Modellauswahl sprechen Da dieser Stau also multimodale Analysen, das Ansehen von Videos, die Überprüfung von Sicherheitswarteschlangen und die Bereitstellung von strukturiertem Feedback beinhaltet multimodale Analysen, das Ansehen von Videos, Überprüfung von Sicherheitswarteschlangen , werde ich ein Denkmodell wählen, bei dem Argumentation Vorrang vor reiner Schnelligkeit eingeräumt Und wir sind hier fertig und ich drücke einfach und ich Und hier sind die Empfehlungen von Gemini. Zuallererst gefällt mir sehr, dass es uns sagt, dass diese Informationen nur zu Informationszwecken dienen Und für medizinischen Rat oder Diagnose sollten wir den Fachmann konsultieren Das ist absolut wahr. Beachten Sie, dass es aufgrund des entsprechenden Namens dieser Datei erfolgreich erkannt wurde, dass dies meine Trainingseinheit am ersten Tag ist erkannt wurde, dass dies meine Trainingseinheit erkannt wurde, dass . Der Name enthielt ein Training am ersten Tag. Hier ist die Scorecard, was ich auf den Punkt gebracht habe, und eine Sache, Dem kann ich zustimmen. Und als nächstes gibt es eine Frage. Möchtest du, dass ich deinen individuellen Hintergrund für dein tägliches Motivationstelefon erstelle , der auf deinen Fortschritten am ersten Tag basiert? Ja, auf jeden Fall, ja. Also lass uns einfach antworten. Ja. Und los geht's. Wir haben dieses perfekte Zitat, aber es gibt ein Problem mit diesem Bild. Wenn wir es mit meinem ursprünglichen Referenzbild vergleichen, würden wir feststellen, dass sie nicht identisch sind. Hier ist ein Bild, um das ich Gemini gebeten habe. Sie sehen, dass der Hintergrund völlig anders ist. Kehren wir also zu unserem Jam zurück und arbeiten wir mit Gemini zusammen, um zu sehen, ob wir das ändern können und stellen wir sicher, dass Bilder mit ähnlichem Hintergrund wie in unserer Referenzdatei erzeugt wie in unserer Referenzdatei 24. Weiterlesen: Ein Juwel für Fitnesstrainer aufbauen (Teil 2): Willkommen zurück. Im ersten Teil dieses Tutorials haben wir die Kernlogik für unseren Fitnesstrainer Jam eingerichtet. Wir sind jedoch auf eine Einschränkung gestoßen. Obwohl wir ein Referenzbild in die Wissensdatenbank hochgeladen haben , das die täglichen Motivationshintergründe generierte sah es nicht so aus wie unser Originalbild. Lassen Sie uns das beheben, indem wir verstehen, wie das System diese verschiedenen Datentypen tatsächlich verarbeitet . Habe bereits erwähnt, dass Gemini multimodal ist. Es kann alles gleichzeitig sehen, lesen und hören Das ist alles wahr. Es gibt jedoch einen technischen Unterschied darin, wie ein Gem eine Datei liest und wie es ein Bild erstellt. Wenn wir einen Verweis auf die Wissensdatenbank begrüßen, nutzt Gemini seine Sehfähigkeit, um die Datei zu analysieren und sie in textbasierten Daten für ihr Langzeitgedächtnis zusammenzufassen für ihr Langzeitgedächtnis Wenn der AM jedoch ein neues Bild generiert, löst er ein separates Bilderzeugungsmodell Laut der technischen Dokumentation von Gemini kann dieses Generierungsmodell die Rohpixel Ihrer Wissensdatenbankdateien nicht direkt erkennen Es wird nur eine textbasierte Eingabeaufforderung empfangen. Wenn in Ihren Anweisungen einfach steht, dass sie dem Stil in der Wissensdatenbank entsprechen, arbeitet die KI anhand einer Zusammenfassung nicht anhand der Originalquelle, und der ursprüngliche Stil geht verloren. Um dieses Problem zu lösen, gehen wir von der Referenzierung zur Spezifizierung über. Anstatt dem Jam eine Datei zu zeigen und zu hoffen, dass er den Stil richtig interpretiert, werden wir eine visuelle Spezifikation direkt in die Anweisungen schreiben eine visuelle Spezifikation direkt in die Dadurch wird sichergestellt, dass jedes Mal, wenn der Jam ein Bild erstellt, es Ihren genauen Regeln folgt, ohne dass Sie raten So machen wir das. Gehen Sie zu Ihrer Jam-Liste, suchen Sie den, den Sie bearbeiten möchten, und klicken Sie auf das Bearbeitungssymbol. Und von hier aus gehst du zu deinen Anweisungen. im Abschnitt Motivation Lassen Sie uns im Abschnitt Motivation diese vage Anweisung entfernen Als Nächstes fügen wir eine Beschreibung für unser Bild hinzu, um es zu erstellen, öffnen einen separaten Chat, begrüßen Ihr Referenzbild und verwenden diese Aufforderung Ich schlage vor, hier aufgrund der Ergebnisse zum Denkmodell zu wechseln hier aufgrund der Ergebnisse zum Denkmodell Sobald Sie die Bildbeschreibung haben, fügen Sie sie direkt in Ihre Jams-Anweisungen ein. Hier ist die Beschreibung, die ich für mein Referenzbild habe. Dies definiert das Layout, die Telefone und die Atmosphäre. Das Modell hat also einen klaren Satz von Leitplanken. Sobald wir dies getan haben, können wir auf Update klicken , um die Änderungen zu speichern. Lassen Sie mich ein neues Diagramm erstellen , um die Änderungen zu testen , die wir gerade vorgenommen haben. A Sie sehen, dass unser neues Bild und das Referenzbild nicht dasselbe sind , sondern sich in ihrem Layout, ihrer visuellen Hierarchie und ihrer Gesamtästhetik sehr ähnlich sind, Textbuch aus Milchglas über einer zarten pastellfarbenen Stadtlandschaft Und das war's für dieses Tutorial. Bitte schreibe in die Kommentare zu diesem Video, an welchem Jam du arbeiten möchtest. Und das werde ich im folgenden Video sehen. 25. Gemini für visuelle Kreationen: Abschnitt Intro: Willkommen in diesem neuen Abschnitt des Kurses. Sie haben bereits zu Beginn des Kurses gesehen, wie ich ein paar Bilder mit Gemini erstellt habe, und jetzt ist es an der Zeit, auf die Details einzugehen Wir werden die Bild- und Videotools von Gemini auf eine ordentliche Probefahrt mitnehmen eine ordentliche Probefahrt Und ich denke, das ist einer der visuellsten Teile des gesamten Kurses Wir werden mit der Bilderzeugung beginnen und nicht nur mit den Grundlagen. Ich werde Ihnen zeigen, wie Sie Techniken wie kontextuelles Mischen anwenden können Techniken wie kontextuelles Hier kombiniert man Referenzbilder zu etwas völlig Neuem und iterativer Verfeinerung, bei der man Zwillinge dirigiert wie ein Fotograf, indem man ein Element nach dem anderen anpasst, bis man genau das Bild bekommt, das man sich wünscht Wir werden uns auch mit der visuellen Synthese befassen, bei der Sie Gemini mehrere Zutaten geben und es zu einer einzigen, nahtlosen Szene zusammenfügen lassen es zu einer einzigen, nahtlosen Szene zusammenfügen Von dort aus gehen wir zu dem, was ich die Bearbeitungssuite nenne, wo wir Gemini verwenden werden, um mit Bildern zu arbeiten, die Sie bereits haben, denken Sie daran, alte Fotos zu restaurieren, grobe Skizzen in Produktaufnahmen umzuwandeln und präzise Änderungen mit dem Geminis Building Markup Dann schauen wir uns an, wie komplette visuelle Systeme, Infografiken, Flussdiagramme und Inhalte erstellt werden, die an verschiedene Plattformen und Bildschirmgrößen angepasst sind. Wir werden diesen Abschnitt mit dem Tutorial zur Videoerstellung beenden Tutorial zur Videoerstellung Und natürlich werde ich auch meine wichtigsten Tipps und praktischen Empfehlungen weitergeben, die ich aus der Arbeit mit Gemini entwickelt habe aus der Arbeit mit Gemini entwickelt anderen KI-Bild- und Videogenerierungssoftware , die Ihnen helfen wird, bessere Ergebnisse zu erzielen Ordnung. Lass uns kreativ werden. 26. Was ist eine Nano-Banane? Erläuterung der wichtigsten Funktionen: Möglicherweise haben Sie bemerkt, dass in Ihrer Gemini-App ein seltsames kleines Bananen-Moja erscheint Es ist nicht nur eine süße Ikone. Es ist ein winziger Hinweis auf eine lustige Namensgeschichte hinter diesem Modell. Bevor dieses Modell offiziell veröffentlicht wurde, hat Google es für anonyme Tests auf einer Plattform namens ALM Arena eingereicht , einer öffentlichen Website, auf der Menschen zwei KI-Modelle miteinander vergleichen und darüber abstimmen welches Ergebnis sie bevorzugen ohne zu wissen, welches Modell welches ist So sammeln KI-Labore vor einer vollständigen Markteinführung Feedback aus der realen Welt Das Modell benötigte einen Platzhalternamen, nicht darauf hindeutete, dass es ein Google-Produkt handelt, um es auf der LM Arena-Website einzureichen Um 2:30 Uhr morgens tippte die Google-Produktmanagerin Nina Nano Banana Ich dachte, es sei nur ein Platzhalterlabel , das niemand außerhalb der Testplattform jemals sehen würde Aber das Modell schnitt so gut ab, dass die Leute auf X von dieser mysteriösen, mächtigen Nano-Banane besessen waren und darüber spekulierten, welches Labor sie gebaut hatte, ob es sich um ein geheimes Google-Projekt handelte oder ob es sich um etwas völlig Neues handelte Anstatt den Datensatz stillschweigend zu korrigieren, Google darauf gestützt. Sie haben das Bananen-Bild oder die Gemini-App hinzugefügt und sogar eine limitierte Auflage von Fanartikeln zum Thema Bananen hergestellt Der Grund, warum die Banane viral wurde, war nicht nur der Name des Pferdes Es war eine bestimmte Fähigkeit, die EI-Bildwerkzeuge zuvor falsch verstanden hatten, Charakterkonsistenz in der Vergangenheit Wenn du ein Foto von dir hochlädst und eine KI bittest, es neu zu erfinden, bekamst du etwas, das dir vage ähnelte was die Leute anfingen, deinen entfernten Verwandten der KI zu nennen, Nano Banana, hat geändert, dass du ein Foto von dir hochlädst, und es bewahrt dein aktuelles Abbild in völlig unterschiedlichen Szenarien. Du kannst dich selbst in ein Graffiti-Wandbild verwandeln Benutzerdefiniert auf Karton oder einem keramischen K, und auf jedem Bild bist du erkennbar Du kannst dich an verschiedene Orte, verschiedene Outfits, verschiedene Jahrzehnte transportieren Outfits, verschiedene Jahrzehnte Das Gesicht bleibt deins. Sie können sogar Bewegung hinzufügen, um ein ästhetisches Porträt in ein kurzes Video zu verwandeln , in dem die Person ihren Kopf dreht oder den Gesichtsausdruck ändert ihren Kopf dreht oder den Gesichtsausdruck ändert. Wir werden uns das genauer ansehen, wenn wir uns Geminis Videomodell Aber Charakterkonstanz ist nur ein Teil davon. Lassen Sie mich Ihnen die anderen Dinge erläutern, die dieses Modell verständnisvoll machen . Scene Blending können Sie zwei separate Fotos hochladen und sie zu einem einzigen kohärenten Bild zusammenfügen Sie können sich und eine historische Person an einen Tisch setzen oder ein Gruppenfoto von Personen erstellen , die noch nie am selben Ort Gemini kümmert sich um die Beleuchtung, die Winkel und den Kontext. Das Ergebnis fühlt sich also eher wie ein Bild als etwas, das zusammengefügt aussieht Multiturn-Bearbeitung wird Ihre Konversation zu einer lebendigen Leinwand Sie müssen nicht gleich bei der ersten Aufforderung alles richtig machen ersten Aufforderung alles richtig Sie können mit einem leeren Raum beginnen und ihn erwecken, die Wände streichen, ein Ledersofa hinzufügen, eine dampfende Tasse Kaffee auf den Tisch stellen Jede Aufforderung baut auf der letzten auf. Eine wichtige Sache, an die du dich erinnern solltest Der Chat behält den Kontext über deine Änderungen hinweg Wenn du also ein komplett separates Projekt starten möchtest, öffne einen neuen Chat, anstatt im selben Thread fortzufahren Beim Mischen von Designs geht es darum, die Textur oder die visuelle Sprache einer Sache zu nehmen und sie auf etwas ganz anderes abzubilden — das Muster eines Schmetterlingsflügels, der zu einem hochmodischen Kleid Bei der Textur von Marmorfliesen , die sich um ein Paar Sneakers wickeln, geht es weniger um die Bearbeitung eines Fotos als vielmehr darum zwei Welten miteinander zu verbinden, die normalerweise nicht zusammengehören Nun, es ist wichtig zu verstehen, wie all das zusammenpasst Gemini selbst ist im Kern ein Argumentations- und Sprachmodell Die Bild- und Videofunktionen stammen von speziellen Spezialmodellen, die Gemini hinter den Kulissen Das ist Nano Banana. Offiziell Gemini 2.5 Flash Image genannt, obwohl es niemand so nennt Für Videos ist es ein Modell namens VO. Stellen Sie sich sie als das Kreativteam von Gemini auf Anfrage erhältlich Wenn Sie Gemini bitten, ein Bild zu erstellen oder zu bearbeiten, wird die Aufgabe an Nano Banana übergeben Wenn Sie nach einem Video fragen, wird VO aufgerufen. Die Konversation bleibt in Gemini. Die fachliche Arbeit findet in der nächsten Lektion weiter unten statt. Wir werden Gemini öffnen und versuchen, unsere ersten Bilder zu erstellen. Ich treffe dich dort 27. Erstellen Ihres ersten Images mit Gemini: Sie nun die Vorschau der visuellen Funktionen von Gemini gesehen haben , sollten wir uns die Hände schmutzig machen und unser erstes Bild erstellen Die Erstellung von Bildern ist für alle Pläne verfügbar. Lass uns Gemini öffnen und uns an die Arbeit machen. Um ein Bild zu erstellen, haben Sie zwei Möglichkeiten. Option eins: Erstelle ein Bild in deinem bestehenden Chat, in dem du Fragen stellst oder an der Erstellung eines neuen Inhalts arbeitest, wie in unserer letzten Vorlesung, als wir an unserer Produktbeschreibung für ein KI-Matratzenunternehmen gearbeitet haben . Option zwei besteht darin, bei Null anzufangen. Das werde ich dieses Mal tun. Ich werde mit der einfachen Aufforderung beginnen. Eine flauschige orangefarbene Katze, die auf einem Sofa schläft. Um Gemini mitzuteilen, dass wir ein Bild erstellen werden , wählen wir in der Liste der Tools das Bild aus Auf diese Weise weiß Gemini, dass wir ein Bild als Ausgabe erwarten, sodass wir diese verbalen Anweisungen nicht in die Eingabeaufforderung eingeben müssen diese verbalen Anweisungen nicht in die Der nächste Schritt vor dem Generieren eines Bilds besteht darin, ein Modell zur Bilderzeugung auszuwählen, entweder schnell denkend oder professionell. Diesmal entscheide ich mich schnell. Eine alternative Möglichkeit, ein Bild zu erstellen, besteht darin, direkt in Ihre Eingabeaufforderung create an image of einzugeben. Und in diesem Fall müssen wir nicht Bild erstellen aus der Liste der Tools auswählen. Das ist meine bevorzugte Art, mit Gemini zu arbeiten. für diese Demo jedoch Lassen Sie uns für diese Demo jedoch mit der Option Create Image fortfahren Unser Image ist fertig, ziemlich gut, wenn man bedenkt, wie kurz unsere Aufforderung ist und dass es nur unsere erste Iteration Du kannst das Bild teilen, kopieren oder herunterladen, oder du kannst das Bild weiter anpassen , indem du einfach mit Gemini chattest und deiner ursprünglichen Aufforderung weitere Details hinzufügst deiner ursprünglichen Aufforderung weitere Details hinzufügst Sie sehen, dass Gemini die Bildaufforderung ändert, indem weitere Details hinzufügt, während der gesamte vorherige Kontext beibehalten Falls Sie jedoch mit einer Ihrer vorherigen Iterationen von vorne beginnen möchten , klicken Sie auf Mehr und wählen Sie unter Neuer Chat die Option Zweig Dann können Sie Gemini die Aufforderung geben, und in diesem Fall ändert Gemini das ausgewählte Bild Natürlich können Sie Gemini sofort die gesamte Aufforderung geben oder, anstatt die Details selbst zu beschreiben, einen Stil auswählen Anstatt zum Beispiel zu beschreiben, welches Licht wir in unserem Bild haben wollen, wählen wir hier aus der Liste die Filmsequenz aus Sie haben gesehen, wie ich zwischen Schnellmodus und Denkmodus gewählt habe. In der Gemini-App geben diese Modi an, wie viel Rechenleistung und Argumentation die KI verwendet, um Ihr Bild zu erstellen, während sich die spezifischen Modellnamen unter der Haube, wie Nana Banana, schnell weiterentwickeln , je nachdem, wie diese beiden Bleibt konstant. Ich empfehle immer den offiziellen Gemini-Supportseiten nach den neuesten Versionsnamen Aber hier ist der beste Weg, um über Ihren Arbeitsablauf nachzudenken. Stellen Sie sich den Schnellmodus als interaktive Ebene vor. Er ist auf Geschwindigkeit und schnelle Iteration ausgelegt. Wenn du die Hemdfarbe änderst, eine neue Frisur ausprobierst, einen Hintergrund tauschst oder viele Variationen generierst, Modus für schnelles Denken, die Argumentationsebene, beibehalten . Das dauert länger, weil es vorsichtiger ist, bevor es Verwenden Sie es, wenn Sie Präzision benötigen, z. B. sauberen, lesbaren Text für einheitliche Produktaufnahmen oder komplexe Szenen, in denen Details wirklich wichtig Du kannst mich fragen, aber Anna, warum ich nicht ständig nachdenken sollte, wenn es mächtiger ist. Das ist eine faire Frage, aber es gibt zwei praktische Kompromisse. Das erste ist die Zeit. Der erste Modus ist das Tool zur Geschwindigkeit des Denkens. Der Denkmodus erfordert eine Wartezeit während das EI die Aufforderung durchdenkt. Zweitens gibt es Nutzungsbeschränkungen, da Denkmodus rechenintensiver ist. In der Regel gelten für ihn strengere Tageslimits als für den Schnellmodus. Mein empfohlenes Verfahren verwendet den Schnellmodus , um schnell grobe Optionen zu untersuchen und zu generieren Und wenn du dein Heldenkonzept gefunden hast, wechsle in den Denkmodus , um den finalen High-Fidelity-Feinschliff zu erhalten. Beginnen Sie sofort mit dem Denkmodus, nur für hochkomplexe Aufgaben wie Visualisierung von Prozessabläufen oder Erstellung von Bildern mit bestimmten lokalisierten Texten Ordnung. Jetzt haben Sie eine erste Vorstellung davon wie Sie Gemini dazu veranlassen können, Visuals zu erstellen Im nächsten Video gehen wir etwas tiefer und lernen im nächsten Video, wie man eine gute Prompt-LCR erstellt 28. 7 Tipps für bessere Visualisierungen: Hallo zusammen und willkommen zurück zur Vorlesung. Da es in diesem Abschnitt des Kurses Generieren von Bildern geht, können wir ein so wichtiges Thema wie die Erstellung dieser Anweisungen nicht übersehen wie die Erstellung dieser Im kommenden Video werde ich meine sieben wichtigsten Empfehlungen zur Erstellung effektiver Eingabeaufforderungen vorstellen. Lass uns anfangen Manchmal werden Sie solide Ergebnisse mit einfachen, offenen Eingabeaufforderungen sehen , vor allem, wenn Sie offen für Überraschungen sind Wenn Sie jedoch eine bestimmte Vision vor Augen haben, kann Ihnen die Beschreibung verschiedener Details dabei helfen, Perfektion zu erreichen Aber unabhängig von der Richtung, die Sie einschlagen möchten , empfehle ich, mit einer einfachen Aufforderung zu beginnen und dann nacheinander zusätzliche Details hinzuzufügen nacheinander zusätzliche Details , um zu sehen, wie sie sich auf das Bild auswirken. Beginnen Sie mit der Beschreibung Ihres Themas, Person, Ihres Tieres, Ihrer Landschaft, Ihrer fiktiven Figur usw. Generieren Sie Ihr erstes Bild und fügen Sie dann zusätzliche Details oder den Kontext hinzu, z. B. den Standort, Informationen über die Umgebung und die Beleuchtung sowie Emotionen oder Stimmungen, die Sie einbringen möchten Um die Idee zu verdeutlichen, was Sie erstellen möchten, ist es hilfreich, sich eine Reihe von Fragen zu stellen Hier ist eine Checkliste, die Sie verwenden könnten. Entscheiden Sie, ob Sie ein Foto oder eine Illustration wünschen. Was ist Ihr Thema, Person, Tier, Landschaft, fiktive Figur usw. Denken Sie an spezifische Effekte und Details, die Sie einbeziehen möchten, Kunstrichtungen, Themen , Techniken, Effekte, Materialien, Konzepte , Farbe und Ton, Beleuchtung und Komposition Gehen Sie über die Grundlagen hinaus und fügen Sie Ihrer Aufforderung zusätzliche Beschreibungen hinzu, die den kreativen Prozess in eine völlig andere Richtung lenken oder Ihren Bildern zusätzliche Würze und Nuancen verleihen können die den kreativen Prozess in eine völlig andere Richtung lenken oder hinzu, die den kreativen Prozess in eine völlig andere Richtung lenken oder Ihren Bildern zusätzliche Würze und Nuancen verleihen Hier sind nur einige Beispiele dafür, was Sie hinzufügen können. Art der Fotografie, Umgebungen, Emotionen und Stimmungen, spezifische Kunststile, filmische oder malerische Effekte Experimentieren mit solchen Deskriptoren ist einer der unterhaltsamsten Aspekte der Arbeit unterhaltsamsten Aspekte der Das Experimentieren mit solchen Deskriptoren ist einer der unterhaltsamsten Aspekte der Arbeit mit Gemini-Bildgenerierung. Kleine Ergänzungen können das Gefühl eines Bildes dramatisch verändern Achten Sie auf die Reihenfolge der Wörter in Ihrer Aufforderung. Die Wörter am Anfang haben mehr Gewicht als die Wörter am Ende. Wenn also Ihre verschneite Landschaft wichtiger ist als die Kabine im Vordergrund, beginnen mit der Landschaft Versuchen Sie, dieselbe Wortgruppe neu zu ordnen, und Sie werden oft merklich unterschiedliche Ergebnisse erzielen Achten Sie auf die Rechte Dritter . Gemini ermöglicht es Ihnen, historische Künstler und Kunstbewegungen namentlich zu referenzieren zu fragen funktioniert also perfekt, nach einem Mann wie Qualität oder einem Vang-Stil Die EI wird jedoch Anfragen blockieren, in denen nach dem Lebensstil oder zeitgenössischen Künstlern gefragt wird, um die Urheber zu schützen Sie schränkt auch urheberrechtlich geschützte Charaktere und Markenlogos ein. Wenn Sie das Aussehen eines modernen Künstlers oder einer bestimmten Marke bevorzugen, beschreiben Sie die visuellen Eigenschaften, nach denen Sie suchen , anstatt sie direkt zu benennen Suchen Sie nach Inspiration und Beispielen, wenn Sie Ihre eigenen Aufforderungen erstellen Wenn Sie mit der KI-Bildgenerierung noch nicht vertraut sind und noch keinen Designhintergrund haben, kann es zunächst schwierig sein, detaillierte beschreibende Eingabeaufforderungen zu schreiben, und das Ein guter Einstieg besteht darin, von mir generierte Bildgemeinschaften online zu durchsuchen , Bilder zu finden, die Ihnen gefallen, sich die dahinter stehenden Eingabeaufforderungen anzusehen und mit kleinen Änderungen zu experimentieren Es ist auch eine gute Idee, ein Moodboard mit Bildern zu erstellen, die dir gefallen und auf die du später vielleicht verweisen möchtest. Speichern Sie das Bild, die verwendete Eingabeaufforderung und alle zugehörigen Stilnotizen. Dies wird im Laufe der Zeit zu einer wirklich nützlichen kreativen Referenz. Zu guter Letzt genießen Sie den Prozess. Zunächst könnte es sich so anfühlen, als würde das EI die ganze kreative Arbeit erledigen. Aber ohne Ihre einzigartigen Ideen, Ihr Gespür dafür, was gut aussieht , und Ihre Experimentierfreude würde das EI nichts Interessantes hervorbringen Also sei du selbst, wirf deine Ideen raus und hab Spaß damit. Um es noch einmal zusammenzufassen Hier sind die sieben Tipps. Fangen Sie einfach an und fügen Sie dann nacheinander Details hinzu. Stellen Sie sich eine Reihe von Fragen, um Ihre Vision zu verdeutlichen. Gehen Sie bei Deskriptoren für Umgebung, Stimmung, Stil und mehr über die Grundlagen hinaus Stimmung, Stil und Die Reihenfolge der Wörter ist wichtig. Was zuerst kommt, hat mehr Gewicht. Achten Sie auf die Rechte Dritter. Künstlerstile sind Freiwild, aber vermeiden Sie urheberrechtlich geschützte Charaktere und Suchen Sie online nach Inspiration und erstellen Sie die Moodboards als kreative Referenz. Viel Spaß damit. Wie immer, Alca im nächsten Video. 29. Kontextbezogene Zusammenführung, iterative Renerierung und visuelle Synthese: Willkommen zurück. haben wir die Bananenbanane kennengelernt und gelernt, wie man ein Bild von Grund auf neu erstellt. Aber in den meisten Fällen suchst du nicht nur nach coolen Bildern. Sie suchen nach Vermögenswerten. Sie benötigen das perfekte Heldenbild für eine Website oder eine Social-Media-Anzeige , die das Scrollen tatsächlich stoppt. In diesem Video werden wir untersuchen, wie diese Assets erstellt werden. Natürlich können Sie bei Null anfangen und Gemini fragen, welches Bild Sie möchten Aber denk darüber nach. einen bestimmten Lichtwinkel, eine einzigartige Textur oder eine komplexe physische Struktur nur mit Text zu beschreiben eine einzigartige Textur oder schwierig, einen bestimmten Lichtwinkel, eine einzigartige Textur oder eine komplexe physische Struktur nur mit Text zu beschreiben. Sie können 30 Minuten damit verbringen, die perfekte Aufforderung zu schreiben und trotzdem nicht zu verstehen, was Sie sich vorstellen. Wenn Sie jedoch ein Gemini-Referenzbild zeigen, erhalten Sie sofort eine Übersicht Ihrer Erwartungen Heute werden wir uns ansehen, wie man Bilder verwendet, um mit der KI zu sprechen Fangen wir mit der klassischen Marketing-Herausforderung an. Sie haben ein Produkt, in diesem Fall Hautpflegeflasche, und Sie möchten, dass es lebendig, frisch und hochwertig aussieht Dafür werden wir kontextuelles Mischen verwenden. Schau dir an, was passiert, wenn ich neben dem Referenzbild ein einfaches Foto der Flasche hochlade neben dem Referenzbild ein einfaches Foto der Flasche und Gemini dann anweise , es in einer völlig neuen kreativen Szene zu platzieren In unserer ersten Aufforderung fragen wir nicht einfach nach einem zufälligen Bild Wir sagen Gemini genau, was wir wollen, indem das Originalbild verweisen und darum bitten, Teile davon zu ersetzen, Wasser gegen Saft und die Originalflasche gegen unsere Hautpflegemarke auszutauschen die Originalflasche gegen unsere Fangen wir mit dem Schnellmodus an. Ich habe auf Senden geklickt und hier ist unser Bild. Der Text ist klar und die Flasche befindet sich perfekt unter der Wasserlinie Lassen Sie uns jetzt einige Änderungen vornehmen. Zuallererst werde ich diesen Satz zur Eingabeaufforderung hinzufügen. Phrasen wie E-Commerce-Produktfoto, helle Studiobeleuchtung oder rein weißer Hintergrund sind die Geheimnisse , die ein Bild eher wie einen echten Werbespot als wie ein KI-Experiment aussehen lassen . Lassen Sie uns hier auch in den Denkmodus wechseln. Ich habe dieselbe Aufforderung verwendet, aber die Flasche ist plötzlich oben auf der Flüssigkeit. Warum? Weil das Modell tatsächlich physikalische Überlegungen anwendet, weiß es, dass Orangensaft im Gegensatz zu Wasser nicht durchsichtig ist Es denkt, wenn ich diese Flasche in Saft tauche, verschwindet die untere Hälfte des Etiketts Lassen Sie uns versuchen, dies zu erzwingen, indem Anweisungen hinzufügen, die halb unter Wasser liegen. Ähnliche Ergebnisse Im Denkmodus wird der Logik der Produktfotografie Vorrang vor Logik der Produktfotografie meinen spezifischen Layoutanweisungen Es geht davon aus, dass auf einem guten Foto die gesamte Marke zu sehen sein muss, also korrigiert es meine Komposition indem es das Produkt aus dem Saft herausholt Schauen wir uns nun die iterative Verfeinerung an. Hier glänzt Gemini wirklich . Sie müssen nicht die perfekte Aufnahme auf einmal machen. Stattdessen richten Sie es wie ein Fotograf, der ein Element nach dem anderen anpasst , bis Sie genau dort landen, wo Sie möchten. Für diesen Gemini-Brau-Kaffeebeutel werden wir Schritt für Schritt ein reichhaltiges Textprodukt erstellen , angefangen bei der Platzierung, dann der Verfeinerung der Komposition, dem Hinzufügen von Inhalt und Tiefe bis hin zur Einstellung angefangen bei der Platzierung, dann der Verfeinerung der Komposition, dem Hinzufügen von Inhalt und Tiefe bis der Beleuchtung Beobachten Sie, wie jede Aufforderung das Bild der Premium-Ästhetik näher bringt Schauen wir uns zum Schluss die Technik an, die meiner Meinung nach die beeindruckendste aller visuellen Synthesen ist Manchmal hat man ein ganzes Kampagnen-Kit, mehrere Produkte, ein Modell, ein Outfit. In der Vergangenheit erforderte die Zusammenstellung dieses Ganzen ein umfangreiches kreatives Briefing und viel Hin und Her. Im Denkmodus von Gemini haben wir einfach die Teile übergeben und es den Rest herausfinden lassen Bei der Entwicklung von Grund auf geht es um Richtung, nicht nur um Beschreibung Sie haben gesehen, wie man den Kontext verschmilzt, eine Aufnahme Schritt für Schritt verfeinert und mehrere Elemente zu einem einzigen Gesamtbild Aber was passiert , wenn ein Bild fast perfekt ist und nur eine bestimmte Änderung benötigt In unserem nächsten Video gehen wir zur Bearbeitungssuite über, wo wir Gemini verwenden werden , um Bilder zu reparieren, wiederherzustellen und präzise zu bearbeiten Du hast Alca bereits dort. 30. Die Bearbeitungssuite: Umwandlung von Skizzen in Prototypen und Fotorestauration: Alle zusammen, und willkommen zurück zur Vortragsreihe über das Erstellen von Bildern mit Gemini In diesem Video gehen wir auf die Bearbeitungsmöglichkeiten von Gemini Ich werde Ihnen zeigen, wie Sie die Gemini-Thinkebene verwenden , um die Bilder, die Sie bereits haben, zu korrigieren, wiederherzustellen und buchstäblich zu lesen und wiederherzustellen und buchstäblich zu lesen und dann anzupassen Hier entwickeln wir uns von kreativen Gestaltern zu erfahrenen Redakteuren Lassen Sie mich Gemini öffnen , um mit der Demo zu beginnen. Es beginnt normalerweise auf einer Serviette oder einem Whiteboard. Sie haben eine Vision für ein Produkt, aber kein Designer Folgendes werden wir tun. Ich lade diese Skizze eines neuen Stuhldesigns auf Gemini Ich muss kein Künstler sein. Ich könnte Gemini einfach sagen, diese Skizze zu einer fotorealistischen Produktaufnahme interpretieren einer fotorealistischen Produktaufnahme , weil wir uns im Denkmodus befinden Gemini verwendet die Linien als Strukturleitlinie. Es versteht die Perspektive, die ich beabsichtigt hatte , und füllt die Details aus, ich selbst nicht zeichnen konnte So werden aus Ihren groben Entwürfen innerhalb von Sekunden Prototypen. Lass uns den Stuhlstoff wechseln. Aber anstatt die gewünschte Farbe und Textur zu erklären, verwende ich Referenzbilder. Überraschenderweise habe ich dieses Buchbild weil ich in meiner Aufforderung das Wort Cover verwendet habe. Lass uns einen neuen Chat starten , um das Bild richtig zu machen. Und natürlich können wir diese Aktie um 360 Grad drehen. Hier habe ich das Haarbild und mein Video pmt. Und ich habe auch Video aus dem Drop-down-Menü ausgewählt , um sicherzustellen, dass Gemini meine Aufgabe richtig verstanden hat Schauen wir uns nun eine der leistungsstärksten Reparaturen an , die Sie für die Restaurierung durchführen können Wir haben alle diese alten verblassten Familienfotos oder digitalen Aufnahmen von geringer Qualität von vor Jahren Anstatt es einfach einzufärben, bitte ich Gemini, es zu restaurieren verwendet seine Denkebene Gemini verwendet seine Denkebene und analysiert die Texturen und den historischen Kontext Es entfernt die Kratzer, schärft die Gesichter und trägt natürliche, realistische Farben als ob das Foto heute aufgenommen worden wäre Es ist nicht nur der Filter. Es ist das EI, das die Qualität rekonstruiert , die im Laufe der Zeit verloren gegangen ist. Lass uns einen Blick darauf werfen Mm. Oh, was für ein Gefühl auf dem Pedal zu tanzen, verloren im Rhythmus der Sonne 31. Die Editing Suite: Gezielte Bearbeitung mit dem Markup-Tool und externen Anmerkungen: Lass uns weitermachen. Was ist, wenn das Bild großartig ist, Sie aber eine bestimmte Sache ändern möchten. Lassen Sie uns untersuchen, wie Sie mit dem speziellen Bildmarkup-Tool von Gemini und seiner Alternative arbeiten speziellen Bildmarkup-Tool von Gemini können Ich möchte dieses Bild bearbeiten. Ich lade es auf Gemini hoch und öffne das Markup-Tool. Ich klicke einfach auf das Bild. Und hier haben wir unseren Bearbeitungsbereich. Was ich hier tun werde, wird als spezielle Eingabeaufforderung bezeichnet. Ich zeige Gemini genau, wo ich die Änderung haben möchte , und beschreibe, wie die Änderung aussehen soll Zuerst wähle ich eine Farbe aus. Lass uns Rot nehmen. Und ich umkreise diesen Kamin. Als Nächstes muss ich die Absicht erklären, also wechsle ich zum Textwerkzeug und gebe Ed Fire ein. Beachten Sie, dass ich hier ein Verb verwendet habe. Sie können mit Aktionen wie Hinzufügen oder Ersetzen spezifisch sein, oder Sie können das Objekt einfach beschreiben. Lassen Sie uns hier zum Beispiel zwei Tassen Kaffee auf diesen Beistelltisch legen. Wenn Sie einen Fehler gemacht haben, können Sie jederzeit die Rückgängig-Taste drücken, um zurückzugehen. Ich klicke auf Fertig, da ich gerade die Anmerkungen fertiggestellt habe, und wir Eingabetaste, ohne irgendwelche Anweisungen zu geben , weil wir sie gerade auf dem Bild gemacht Und hier ist das neue Bild. Wir sehen, dass Gemini die Änderungen erfolgreich übernommen hat. Wir sehen das Feuer im Kamin und wir sehen hier zwei Tassen Kaffee. Tolle Arbeit. Wenn ich dieses neue Bild öffne, werden Sie feststellen, dass das Markup-Tool nicht erneut geöffnet wird, wenn Sie darauf klicken Markup-Tool nicht erneut geöffnet Dieses Tool ist also speziell für Ihre ersten Uploads gedacht. Sie stecken jedoch nicht fest, Sie können das Ergebnis mithilfe von Konversationsänderungen weiter verfeinern das Ergebnis mithilfe von Konversationsänderungen Also hier ist meine neue Aufforderung. Gemini ist sich des Bildes kontextuell bewusst. Es wurde gerade erstellt und wird weiterhin die von Ihnen angeforderten Änderungen vornehmen Und zurück zu meinen ursprünglichen Anmerkungen. Beachten Sie, dass ich die Textfarbe gerne an die Kreisfarbe anpasse, während die KI hauptsächlich Koordinaten verfolgt Dies ist eine hervorragende bewährte Methode um Ihre Anweisungen zu organisieren Du kannst auch Anmerkungen aus externen Tools wie Canva Hier habe ich zum Beispiel dieses Foto des Bursch Khalifa-Gebäudes markiert dieses Foto des Bursch Khalifa-Gebäudes Ich möchte, dass Gemini genau diese Änderungen vornimmt. Ich möchte, dass dieses Gebäude entfernt wird, und ich möchte die Farben einiger Teile des Gebäudes ändern Farben einiger Teile des Gebäudes Ich habe einen neuen Chat geöffnet und dieses Bild für den Chat eingereicht. Für komplexe Aufgaben wie diese empfehle ich, in den Denkmodus zu wechseln. Dies löst ein leistungsfähigeres Argumentationsmodell aus, das diese genauen Anweisungen viel besser befolgen Ich werde auch diese Anweisungen beifügen, wobei es wichtig ist, diese Aufforderung hier einzubeziehen Hier ist zum Beispiel das Bild, das ich erhalten habe, als ich dasselbe Bild angepasst habe , ohne Gemini Anweisungen zu Wir sehen, dass Gemini die Änderung erfolgreich vorgenommen hat. Wir sehen jedoch immer noch die Anmerkungen, und das war mein Originalbild ohne jegliche Anweisungen Kehren wir zu unserem Chat zurück und drücken die Eingabetaste. Leider haben wir diesmal immer noch die Anweisungen für das neue Bild und wir sehen auch, dass Gemini erfolgreich andere Änderungen vorgenommen hat Wir sehen das Gebäude hier auf der rechten Seite nicht und die neuen Farben wurden erfolgreich angewendet Lassen Sie uns Gemini bitten, die Anweisungen zur Anmerkung aus dem Bild zu entfernen . Und los geht's Der zweite Versuch war erfolgreich. Wie Sie sehen können, erkennt Gemini den Text, entfernt das Gebäude und ändert die Farben perfekt Und dann haben wir die zweite Anweisung gegeben , um die Anmerkungen zu entfernen. Alles gut hier. Schauen wir uns zum Schluss an, wie Gemini in Ihren Fotos über die Welt Wenn du zum Beispiel ein Foto der Skyline einer Stadt hochlädst, kannst du Gemini bitten, es mit Anmerkungen zu versehen. Dann kannst du beobachten, wie es die Wahrzeichen identifiziert und Beschriftungen genau dort anbringt Das ist nicht nur Zeichnen, es ist Informationsdesign. Es geht darum, aus einer rohen Kartoffel ein intelligentes Lernmaterial für eine Präsentation oder ein Handbuch zu ein intelligentes Lernmaterial für eine Präsentation oder ein Handbuch Und genau das ist das Thema von allem, was wir in diesem Video behandeln . Egal, ob Sie eine grobe Skizze zum Leben erwecken, ein altes Forum restaurieren, ein Bild mit Anmerkungen versehen oder eine komplexe Szene intelligent beschriften, Gemini erledigt die Präzisionsarbeit, sodass Sie es nicht tun müssen In unserem nächsten Video werden wir all diese Fähigkeiten zusammenbringen, um komplexe visuelle Systeme zu entwickeln, einschließlich Infografiken und Datenvisualisierungen, die komplexe Daten in etwas verwandeln, das sofort klar komplexe Daten in etwas verwandeln ist. Wir sehen uns dort 32. Komplexe Visualisierungen: Menüs, Diagramme und Infografiken: Willkommen zurück. Bisher haben wir viele Dinge behandelt, die Szenen von Grund auf neu erstellen, präzise bearbeiten und komplexe Szenen synthetisieren Schauen wir uns nun an, was Gemini tun kann , wenn die Aufgabe noch ehrgeiziger wird, mehrteilige visuelle Elemente wie Infografiken und Elemente erstellen, die auf verschiedenen sozialen Plattformen und Bildschirmen funktionieren Lass uns anfangen. Ich möchte, dass Gemini eine Seite erstellt Infografik-Menü mit diesen Kaffeebildern. Ich wollte jedes Getränk identifizieren und es mit seinem Namen und einer kurzen Beschreibung in einen übersichtlichen Bereich stellen mit seinem Namen und einer kurzen Beschreibung in einen übersichtlichen Bereich Wählen wir auch „ Bilder erstellen “ aus der Auswahl der Tools aus. Wie aus der Pam-Beschreibung hier hervorgeht, ist nicht ganz klar, ob ich ein Bild oder einen Text als endgültige Ausgabe haben möchte . Lass uns anfangen Und hier ist unser Bild. Da Gemini eine tiefe Resoninschicht hat, erkennt es den Unterschied zwischen den von uns eingereichten Bildern und kann eine Kaffeetasse mit den Eiswürfeln darin von der mit der warmen Milchform Lassen Sie mich Gemini bitten, dieses Layout ein wenig zu ändern und auch die Farben an unsere Markenfarben anzupassen Oh, das ist ein großartiges Design. Mir gefällt es besser als unsere erste Iteration. Und lassen Sie uns noch eine Änderung vornehmen. Ich möchte diesen Text der Kaffeekarte in unseren Markennamen ändern. Und hier ist unser Bild. Ich mag es sehr. Das einzige, was ich ändern möchte, ist, dass ich diese Kaffeebohnen entfernen möchte , damit der Text vollständig sichtbar ist. Aber anstatt dies als eine Reihe von iterativen Eingabeaufforderungen zu tun, versuchen wir hier, eine andere Technik zu verwenden Ich werde das Markup-Tool verwenden , das wir in der vorherigen Demo behandelt haben Lassen Sie mich dieses Bild in voller Größe herunterladen. Ich habe einen neuen Chat erstellt und unser Bild hochgeladen, das wir gerade generiert haben. Als Nächstes öffnete ich das Markup-Tool und ließ mich die Kaffeebohnen hervorheben Ich habe Gemini die Anweisung hinzugefügt , die Kaffeebohnen zu entfernen Es wird ein bisschen knifflig, weil wir die Bohnen zusammen mit dem Text sehen Aber lassen Sie uns versuchen, es zum Laufen zu bringen. Ich wähle hier das Denkmodell und wähle und erstelle auch Bilder. Mein erster Versuch war also erfolglos. Sie sehen, dass die OF-Bilder immer noch hier im Bild sind. Lassen Sie uns versuchen, die Änderung zu beschreiben , die ich gerne vornehmen würde. Und hier ist unser Bild. Es ist wirklich unglaublich, dass Gemini meinen Anweisungen so gut gefolgt ist und diese Kaffeebohnen aus der oberen rechten Ecke des Menüs entfernt hat meinen Anweisungen so gut gefolgt ist und diese Kaffeebohnen aus der oberen rechten Ecke des Menüs entfernt diese Kaffeebohnen aus der oberen rechten Ecke des Menüs Und jetzt können wir unseren Text deutlich sehen. Fantastisch. Und lass uns hier zur zweiten Demo übergehen. Manchmal muss man das wie die Reise von der Bohne zur Tasse in meinem Beispiel für die Kaffeemarke Gemini erklären von der Bohne zur Tasse in meinem Beispiel für die Kaffeemarke Gemini Hier ist also der charakteristische Brühprozess unserer Marke. Ich werde Gemini Folgendes fragen. Ich möchte, dass Gemini diesen fünfstufigen Gemini Brew-Signaturprozess in einem sauberen Architektur-Flussdiagramm abschließt diesen fünfstufigen Gemini Brew-Signaturprozess in einem sauberen Ich wollte ein minimalistisches Layout verwenden und die Farben an die Farben anpassen , die wir in unserer PDF-Datei verwenden Lassen Sie mich den Denkmodus wählen. Und für dieses Beispiel wähle ich auch Bilder erstellen. Und hier ist unser Diagramm. Gemini hat die Struktur gebaut, die Symbole erstellt und auch jeden Schritt beschriftet Was ich hier nicht mag, sind die Würfe, die definitiv unnötig sind Und dieser Text, den wir auf jeder Box sehen können. Bitten wir Gemini, das zu entfernen. Und hier ist das sauberere Bild. Und ich möchte diesen Rahmen auch entfernen. Bitten wir Gemini, das zu tun. Und das ist ein viel besseres Bild. Und ich möchte noch eine Iteration machen , um dieses Bild schöner Schau dir das an. Das ist eine völlig andere Ästhetik. Lass mich in den Fragen und Antworten zu diesem Video wissen, welches du bevorzugst Und als Nächstes machen wir mit unserer Demo weiter. 33. Komplexe Visualisierungen: Anpassung von Assets über Formate und Plattformen hinweg: Natürlich können Sie dieses Bild weiter bearbeiten, wenn Sie möchten, indem Sie entweder Gemini weiter direkt hier im Chat nach Verbesserungen fragen , oder Sie können dieses Bild kopieren und mit den Anweisungen des Markup-Tools fortfahren Anweisungen des Markup-Tools fortfahren Aber lassen Sie mich Ihnen ein anderes Beispiel zeigen während wir hier an diesem Bild sind Nehmen wir an, wir planen eine internationale Expansion der Marke Gemini Brew Wir müssen dieses Diagramm also in andere Sprachen übersetzen Also werde ich darum bitten, das Bild so zu ändern , dass die Texte in chinesischer Sprache angezeigt werden. Und das ist unser übersetztes Diagramm. Beachten Sie, dass ich in meiner Aufforderung ausdrücklich sage, dass ich möchte, dass Gemini das Bild ändert nicht nur die Texte in chinesischer Sprache anzeigt , damit Gemini klar ist , dass ich eine weitere Variante dieses Bildes in die chinesische Sprache übersetzen muss eine weitere Variante dieses Bildes in die chinesische Sprache übersetzen Ordnung. Und lassen Sie uns ein letztes Beispiel nehmen. Nehmen wir an, wir benötigen Ressourcen für die Marketingkampagne von Gemini Brew, die überall funktionieren, von Instagram-Geschichten und -Posts bis hin zu einem Heldenbild auf unserer Website Wir werden diese Aufnahme machen, wir zuvor mit Gemini gemacht haben, und ich werde Gemini sagen , dass dies unser Hauptinstrument ist Und jetzt benötige ich eine Version für eine vertikale Social-Media-Story, einen quadratischen Beitrag und einen weißen Header für die Gemini Habe auch das Bild angehängt , das Gemini ändern soll Und hier ist die Nachricht , die ich von Gemini erhalten habe, als ich diese Aufforderung getestet habe , bevor ich das Tutorial aufgenommen Dies liegt daran, dass Gemini rechtzeitig ein Bild erstellen kann. Gemini kann zwar viele Referenzbilder gleichzeitig verarbeiten, das Ziel besteht jedoch immer darin, sie zu einer endgültigen, originalgetreuen Komposition zu synthetisieren . Wenn Sie es nach mehreren separaten Bilddateien auf einmal fragen, wie in meinem Beispiel hier, kann es Ihre Anfrage nicht bearbeiten Sie Ihre Anfrage also immer als ein einzelnes Projekt, z. B. eine Infografik, ein Menü oder eine Kampagnenaufnahme, bei der alle Ihre Elemente in einem Bild ein einzelnes Projekt, z. B. eine Infografik, ein Menü oder eine Kampagnenaufnahme, bei zusammenleben Lassen Sie mich also die Aufforderung ändern. Ich möchte zunächst ein weißes Header-Bild für die Gemini Brew-Website erstellen ein weißes Header-Bild für die Gemini Brew-Website Wie immer wähle ich den Denkmodus und lasse uns auch Bilder erstellen wählen, um Gemini klare Anweisungen zu geben , dass ich in diesem Fall ein Bild erwarte Und hier ist unser neues weißes Heldenbild für unsere Website. Wir stellen fest, dass Gemini unser Originalbild nicht nur ausdehnt, sondern es auch übermalt, sodass es ihm mehr Details hinzufügt , wie bei den alten Kaffeemaschinen sowie diesen Kaffeebohnen auf der linken und rechten Seite des Originalbilds. Gleichzeitig wird sichergestellt, dass unser Produkt unabhängig von der Bildschirmgröße immer perfekt in der Mitte der Komposition positioniert perfekt in der Mitte der Lassen Sie uns auch ein Bild in vertikaler Größe und ein quadratisches Bild für unsere Instagram-Posts erstellen und ein quadratisches Bild für unsere Instagram-Posts 34. Mehr als nur Chatten – Tiefgreifende Forschung und Entwicklung mit Gemini: Abschnitt Intro: Was passiert, wenn Sie Gemini eine Forschungsaufgabe geben , für die Sie normalerweise einen halben Tag benötigen würden Darum geht es in diesem Abschnitt, und dann bringen wir diese Ergebnisse an einen Ort, den Sie vielleicht nicht erwarten Wir werden dazu ein Gemini-Feature namens Deep Research verwenden ein Gemini-Feature namens Deep Research und damit drei sehr unterschiedliche Situationen aus dem wirklichen Leben durcharbeiten damit drei sehr unterschiedliche Situationen aus dem wirklichen Leben Eine, mit der sich die meisten von uns jede Woche befassen, eine davon, eine Kaufentscheidung zu treffen, ohne in das Kaninchenloch von Bewertungsseiten und überfallenen Threads zu fallen, und eine, bei der es darum geht, sich über ein völlig neues Thema zu ein völlig neues Thema In jedem Fall möchte ich, dass Sie nicht nur sehen , was Gemini produziert, sondern auch, wie Sie es aufrufen können, damit die Ergebnisse für Sie tatsächlich nützlich Und dann werden wir noch einen Schritt weiter gehen und Canvas verwenden, um eines dieser Forschungsergebnisse in eine funktionierende interaktive App umzuwandeln , die auf einer Konversation basiert Kein Code benötigt es. Ich hoffe du bist bereit. Holen Sie sich also eine Tasse Tee oder Kaffee und lassen Sie uns loslegen. 35. Tiefe Forschung: Antworten über den Blueprint hinaus: Heben Sie Ihre Hand, wenn Ihnen das schon einmal passiert ist Sie stellen einem Chatbot eine wichtige Frage, etwa: Ich möchte die Finanzierung der Serie A aufbringen Was sind derzeit die aktivsten Investoren in meinem Bereich? Und es antwortet mit einer Liste von Optionen, die ziemlich oberflächlich ist, und Sie erhalten auch eine Reihe von hochrangigen Empfehlungen. Sie sollten zum Beispiel nach aktiven Investoren in Ihrer Kategorie suchen. Sie sollten eine Zielliste erstellen. Sie sollten sich an Ihr Netzwerk wenden, um herzliche Einführungen usw. zu erhalten Das Produktteam von Google hat dafür einen Namen. Sie nennen es eine Blauprint-Antwort, eine übergeordnete Karte, die Ihnen sagt, was Sie suchen müssen , während Sie jeden Teil der eigentlichen Arbeit Ihnen überlassen Sie sind immer noch einer, der in 50 geöffneten Browser-Tabs ertrinkt und versucht, das Nutzsignal vom Rauschen zu trennen gründliche Recherche von Gemini kann Ihnen helfen, die Blaupause hinter sich zu lassen und etwas sehr Umfassendes zu finden, auf das die Blaupause hinter sich zu lassen und etwas Sie sofort reagieren können Deep Research ist nicht nur ein intelligenterer Chatbot. Es ist ein agentisches System, das heißt, es plant, sucht selbstständig nach Gründen und fasst Informationen aus Hunderten von Quellen Stellen Sie sich das so vor, als einen wissenschaftlichen Mitarbeiter auf Doktoratsniveau in Ihrem Team, der stundenlange komplexe Untersuchungen innerhalb von Minuten durchführt und mit einem ausgefeilten Bericht zurückkommt, nicht mit einer Aufgabenliste Was macht ein wissenschaftlicher Mitarbeiter auf Doktoratsstufe tatsächlich in der Praxis für Sie? Lassen Sie mich Ihnen die drei leistungsstärksten Anwendungsfälle vorstellen. Zunächst geht es um das Verständnis des Themas, um komplexe Themen eingehend zu behandeln. Stellen Sie sich vor, Sie sind ein Personalmanager, der versucht zu verstehen, wie sich KI in den nächsten drei Jahren auf die Belegschaft auswirken wird . Sie möchten nicht nur eine Zusammenfassung auf oberflächlicher Ebene. Sie müssen die Landschaft verstehen. Wie schneidet KI-Automatisierung im Vergleich zur KI-Erweiterung ab? Welche Rollen sind am stärksten gefährdet und welche entwickeln sich weiter, was andere Unternehmen bereits tun? Und was sagt die Forschung im Vergleich zu dem bloßen Hype aus? Tiefgründige Recherche befasst sich gleichzeitig mit wissenschaftlichen Arbeiten, Branchenberichten, Praxis Branchenberichten, Expertenkommentaren und Fallstudien aus der Das Ergebnis ist eine strukturierte Analyse , die die Landschaft kartografiert , konkurrierende Ideen gegenüberstellt, die Beziehungen zwischen Konzepten aufdeckt und erklärt, warum all das steckt Zweitens die professionelle Sorgfaltspflicht. Denken Sie darüber nach, sich auf ein Verkaufsgespräch für Ihr Unternehmen vorzubereiten. Bevor Sie die Tür betreten, müssen Sie die wichtigsten geschäftlichen Herausforderungen der potenziellen Kunden, die jüngsten strategischen Schritte, den Wettbewerbsdruck, dem sie ausgesetzt sind, und wissen wichtigsten geschäftlichen Herausforderungen der potenziellen Kunden, die jüngsten strategischen Schritte, den Wettbewerbsdruck, dem sie ausgesetzt sind, , wie Ihr Produkt zu all dem passt. Gründliche Recherchen untersuchen die Produkte des Unternehmens und finden dabei die Geschichte, finden dabei die Geschichte, Führungsteam und das Wettbewerbsumfeld heraus Und das ist sehr wichtig. Kombiniert alles mit Ihren eigenen internen Notizen zur Kundenbeziehung , für deren Zusammenstellung ein Junior-Analyst einen ganzen Tag gebraucht hätte ein Junior-Analyst einen ganzen Tag , ist jetzt in wenigen Minuten fertig Sie gehen also in den Besprechungsraum und wissen mehr über ihr Geschäft, als sie vielleicht erwarten Drittens, viel auf dem Spiel, persönliche Entscheidungen. Nicht alles dreht sich um Arbeit, den Kauf eines Autos, Wahl einer Nachbarschaft und den Vergleich von Versicherungsoptionen. Diese Entscheidungen sind genauso wichtig, und die Recherche Rabbit Hole ist genauso tiefgründig, anstatt ein verlorenes Wochenende durch widersprüchliche Blogbeiträge und überfallene Threads zu verbringen. Sie erhalten einen Bericht, der nach Ihrer spezifischen Situation, den Vor- und Nachteilen und den Nuancen strukturiert ist, die Ihnen generische Ratschläge niemals geben Und genau das macht all diese drei Anwendungsfälle in der Praxis möglich Bei gründlicher Recherche erhalten Sie nicht nur eine Linkliste. Es erstellt einen umfassenden mehrseitigen Bericht, strukturierte Analysen, zitierte Quellen und sogar Dinge wie Infografiken, und sogar Dinge wie die die Daten zum Leben erwecken In der nächsten Vorlesung werden wir es in die Hände bekommen Ich zeige Ihnen, wie Sie eine gründliche Recherche starten, wie Sie den Forschungsplan erstellen, bevor er beginnt, und wir werden gemeinsam ein reales Beispiel durchgehen , damit Sie den gesamten Prozess von der Aufforderung bis zum Abschlussbericht verfolgen können den gesamten Prozess von der Aufforderung bis . Ich treffe dich dort. 36. Deep Research in Aktion – Themenverständnis: Lassen Sie uns wie versprochen tiefgreifende Forschung in Aktion erleben. Wir werden mit dem Thema Anwendungsfall verstehen beginnen und ich habe ein Beispiel ausgewählt, mit dem sich die meisten von uns meiner Meinung nach persönlich identifizieren können. Wir werden gründliche Recherchen durchführen, um eines der verwirrendsten Themen des täglichen Lebens zu lösen. Frühstück, Ernährung, du kennst das Gefühl. Sie googeln RX gesund und erhalten zehn völlig unterschiedliche Antworten, je nachdem , auf welchem Artikel Sie landen, um dieser Demo zu folgen Sie benötigen einen kostenpflichtigen Gemini-Plan Wenn du derzeit einen kostenlosen Tarif hast und ein Upgrade durchführen möchtest, schau dir die Lektion im Einführungskurs an, in der ich dir zeige, wie das geht Okay, lass uns gehen. Um Deep Research zu starten, öffne einen neuen Chat und wähle Deep Research aus der Liste der Tools aus. Standardmäßig verwendet Gemini Google-Suche als Hauptquelle Aber du kannst das erweitern. Sie können beispielsweise Ihr Gmail oder Google Drive als Quelle auswählen oder Ihre eigenen Dateien hochladen. Das ist es, was tiefgründige Forschung so mächtig macht. Es geht nicht nur darum, im Internet zu suchen. Es kann öffentliche Informationen mit Ihren eigenen privaten Dokumenten zusammenführen . Für diese Demo werden wir es einfach halten und nur die Websuche verwenden . Hier ist die Eingabeaufforderung, die ich verwenden werde. Beachten Sie, wie spezifisch diese Aufforderung ist. Wir fragen nicht nur: Was soll ich zum Frühstück essen? Wir betreiben gründliche Forschung, eine klare Forschungsagenda mit drei unterschiedlichen Aufgaben. Je mehr Anweisungen Sie im Voraus geben, desto nützlicher ist das Ergebnis. Was die Modellauswahl hier anbelangt, die fachliche Analogie, die wir zu Beginn des Kurses eingeführt haben bleibt die fachliche Analogie, die wir zu Beginn des Kurses eingeführt haben, genau dieselbe , wenn Sie gründliche Recherchen aktivieren Der Modus, den Sie wählen, bestimmt, wie sich dieser Spezialist während des Forschungsprozesses verhält Schnell bleibt Ihr Sprinter, der einen umfassenden Schnellscan der relevantesten Quellen durchführt, einen umfassenden Schnellscan der relevantesten Quellen durchführt um Ihnen eine schnelle Zusammenfassung zu geben , ohne jedes Detail zu untersuchen. Denken ist immer noch Ihr Stratege, der sich ausgibt, um mehrere Quellen miteinander zu vergleichen und Widersprüche zu lösen, um einen logischeren mehrere Quellen miteinander zu vergleichen und Blickwinkel zu finden Pro bleibt Ihr Experte eingehend mit allem befasst, von dichten Berichten und technischen PDFs bis hin zu langen E-Mail-Threads, um Ihnen eine wirklich umfassende Zusammenfassung zu bieten Ihnen Ich entscheide mich hier für das Denken. Lassen Sie uns nun auf Senden klicken und sehen, was zuerst passiert. Dies ist der Schritt zur Zielzerlegung und einer meiner Lieblingsteile des Prozesses Anstatt direkt in die Forschung einzutauchen, pausiert die eingehende Recherche und erstellt auf Aufforderung einen personalisierten mehrstufigen Forschungsplan Grundlage Ihrer Sie können sich genau ansehen , was genau untersucht werden soll Bei Bedarf können Sie diesen Plan bearbeiten, bevor er gestartet wird. Wenn Sie es auf einen bestimmten Blickwinkel ausrichten, ein Unterthema hinzufügen oder etwas entfernen möchten , das für Sie nicht relevant ist, tun Sie dies jetzt, bevor eine einzige Suche ausgeführt wird Für diese Demo bin ich mit dem Plan, so wie er ist, zufrieden. Lassen Sie uns ihn also genehmigen und laufen lassen. Und jetzt beginnt die Suche. Gemini arbeitet in Echtzeit mit Quellen wie wissenschaftlichen Arbeiten, Ernährung, Richtlinien und Gesundheitspublikationen Es entscheidet, welche Bedrohungen parallel untersucht werden müssen und welche nacheinander auftreten müssen Sie können hier sogar auf eine der Websites klicken, wenn Sie wissen möchten, welche Quellen Gemini durchsucht Da Gemini Deep Research jede Quelle liest, sammelt es nicht nur Informationen und geht dann weiter Es denkt darüber nach , wonach es als Nächstes suchen soll. Es führt einen kontinuierlichen Prozess der Selbstkritik durch, entdeckt Widersprüche zwischen Quellen, weist auf vage oder unbegründete Behauptungen hin und erkennt, wenn ein Datensatz einfach nicht zusammenpasst. Man kann beobachten, wie es seine Forschungsrichtung in Echtzeit anpasst, wenn neue Informationen eintreffen und wenn es in eine Sackgasse gerät, sagen wir, eine Studie befindet sich hinter einer Paywall oder eine Website ist ausgefallen entdeckt Widersprüche zwischen Quellen, vage oder unbegründete Behauptungen hin und erkennt, wenn ein Datensatz einfach nicht zusammenpasst und erkennt, wenn ein Datensatz . Man kann beobachten, wie es seine Forschungsrichtung in Echtzeit anpasst, wenn neue Informationen eintreffen und wenn es in seine Forschungsrichtung in Echtzeit anpasst, wenn neue Informationen eintreffen und wenn es in eine Sackgasse gerät, sagen wir, eine Studie befindet sich hinter einer Paywall oder eine Website ist es hört nicht auf. Es leitet um und findet einen anderen Weg zur gleichen Antwort. Es gibt noch eine weitere Sache, die dies in großem Maßstab ermöglicht Tiefgründige Recherchen werden in einem Kontextfenster, dem IIs, dem Arbeitsspeicher, durchgeführt. In der Praxis bedeutet das, dass Gemini jede einzelne Quelle, die es während der gesamten Sitzung gelesen hat, im Speicher speichert jede einzelne Quelle, die es während der gesamten Sitzung gelesen hat, im Speicher während der gesamten Sitzung gelesen hat, im Nichts geht verloren oder wird vergessen , wenn die Forschung wächst. Und das ist auch der Grund, warum spätere Folgefragen so scharf sind. Ich verliere nie die Gefahr dessen, was es bereits untersucht hat. Und Sie denken vielleicht schon , dass Sie nicht da sitzen und zusehen müssen , wie das alles passiert. Tiefgründige Forschung ist asynchron. Sie können den Tab schließen und zu Ihrer Arbeit zurückkehren. Gemini wird Sie darüber informieren, wenn Ihr Bericht fertig ist Wenn Sie sich in der Web-App befinden, wird neben dem Chat-Thread in Ihrer Seitenleiste eine Benachrichtigung angezeigt neben dem Chat-Thread in Ihrer Seitenleiste Und wenn Sie die Gemini-App für Mobilgeräte installiert haben, erhalten Sie eine Push-Benachrichtigung direkt auf Ihr Telefon Und ich habe gerade meins bekommen. Unser Bericht ist fertig. Gehen wir also zurück zu Gemini, um einen Blick darauf zu werfen. Dies ist es, was gründliche Forschung liefert, und stellen Sie fest , was nicht der Fall ist Es ist keine Linkliste. Es handelt sich nicht um eine Zusammenfassung mit Stichpunkten. Es handelt sich um eine strukturierte, mehrseitige Analyse mit zitierten Quellen, organisierten Abschnitten und tatsächlichen Schlussfolgerungen, auf die Sie reagieren können . Die abgestufte Zutatentabelle nach der wir gefragt haben, ist genau hier, Stufe eins, Stufe zwei und Stufe drei, klar, umsetzbar und basiert auf Und falls Sie sich für eine der Quellen interessieren, jeder Behauptung relevante Links Sie können sich durchklicken und die Originalforschung selbst lesen. Ich weiß nicht, wie es Ihnen geht, aber ich hätte Stunden gebraucht, all diese Ressourcen durchzulesen und den Bericht manuell zusammenzustellen. Und es ist wichtig, dass gründliche Recherchen Ihr Urteilsvermögen nicht ersetzen. Es leistet diese mühsame Vorarbeit, damit Ihr Urteilsvermögen tatsächlich fundierter ist In unserer nächsten Vorlesung werden wir uns eingehend einem persönlichen Kontext befassen und einige weitere Beispiele durchgehen . Wir sehen uns dort. 37. Umfassende Forschung in Aktion – Kaufentscheidungen: In dieser Vorlesung werden wir uns zwei weitere Anwendungsfälle für eingehende Recherchen ansehen zwei weitere Anwendungsfälle für eingehende Recherchen ansehen , von denen ich denke, dass Sie sie in Ihrem eigenen Leben sofort nützlich finden werden . Beim ersten geht es darum , eine selbstbewusste Kaufentscheidung zu treffen, und ich werde ein Beispiel aus der Praxis verwenden. Beim zweiten geht es darum, ein völlig neues Thema zu lernen. Ich werde dir etwas zeigen, was ich noch nie gezeigt habe. Wie man aus einem ausführlichen Forschungsbericht eine Infografik, ein Quiz und Karteikarten macht, ohne die Gemini-Oberfläche für Tiefenforschung zu verlassen . Lass uns anfangen Mein Aura-Slip-Tracking-Ring ist kürzlich kaputt gegangen. Ich würde ihn gerne austauschen, bin mir aber nicht sicher, ob ich einfach den neuesten Ring derselben Marke kaufen oder ihn als Chance nutzen soll derselben Marke kaufen oder ihn als Chance nutzen soll , auf etwas Besseres umzusteigen. Und es gibt eine bestimmte Funktion ich mir seit Jahren wünsche. Stummer Alarm mit vibrierender Schlafzykluserkennung, der Sie tatsächlich im richtigen Moment Ihres Schlafzyklus weckt , nicht nur zu einer festen Lassen Sie uns als unseren persönlichen Einkaufsassistenten gründliche Recherchen nutzen , um Online-Rezensionen und Artikel zu durchforsten Hier ist meine Aufforderung. Beachten Sie einige Dinge an dieser Aufforderung. Es ist persönlich. Ich habe tiefgründige Nachforschungen über meine Situation und das, wonach ich suche, durchgeführt. Ich habe den Vibrationsalarm eingebaut, nicht nur, weil ich ihn haben will, sondern um zu sehen, ob Gemini die offensichtlichen Optionen herausfiltern kann Bei den meisten beliebten Ringen gibt es eigentlich keine Vibrationsmodelle. Eine einfache Suche könnte mir also nur eine Liste mit den zehn besten Ringen geben , die diese Anforderung ignoriert Eine gründliche Recherche sollte das aufdecken. Die Aufforderung hat einen klaren Rechercheplan mit drei Aufgaben und verlangt am Ende ein bestimmtes Ausgabeformat, eine Feature-Tabelle, was bedeutet, dass der Bericht sofort verwendet werden kann, nicht nur die gesamte Textwand. Lassen Sie uns aus einer Liste von Tools eine gründliche Recherche auswählen. Ich werde mich hier auf die Suche als Hauptquelle verlassen und den Denkmodus wählen. Und lass uns anfangen. Gemini hat diesen Forschungsplan für mich vorbereitet, und ich möchte hier eine Änderung vornehmen . Dafür klicke ich auf Plan bearbeiten Als Nächstes gebe ich die Änderung ein, die Gemini am aktuellen Plan vornehmen soll Ich möchte, dass Gemini auch eine bestimmte Marke in seine Recherchen einbezieht Wir sehen, dass die Liste der Marken aktualisiert wurde. Ich bin jetzt mit diesem Plan einverstanden, also werde ich ihn genehmigen und mit der Recherche beginnen. Und in ein paar Minuten ist unser Bericht fertig. Lassen Sie uns das gemeinsam durchgehen. Sie können sehen, dass gründliche Recherchen die drei besten Kandidaten identifiziert und sie anhand genau der Kriterien analysiert haben, nach denen ich gefragt habe, einschließlich des intelligenten Vibrationsalarmsystems und die Vergleichstabelle der Funktionen hier erstellt Dies ist die Art von Ausgabe , für die normalerweise mindestens eine Stunde Tippwechsel, fertige Threads und die Analyse widersprüchlicher Bewertungsseiten erforderlich wären mindestens eine Stunde Tippwechsel, fertige Threads und die Analyse widersprüchlicher Bewertungsseiten erforderlich fertige Threads und die Analyse widersprüchlicher Bewertungsseiten Ich habe es innerhalb von Minuten nach meiner spezifischen Situation und meinen Anforderungen strukturiert meiner spezifischen Situation und meinen Anforderungen Und hier ist die Liste der strategischen Empfehlungen von Gemini Ein Hinweis, weil ich ihm im Voraus einen persönlichen Kontext gegeben habe. Die Empfehlungen sind nicht allgemein gehalten. Sie filtern es nach meinen tatsächlichen Prioritäten. Gutes Preis-Leistungs-Verhältnis, kein großes Abonnement und Ausrutscher, das funktioniert tatsächlich. Dies ist ein hervorragendes Beispiel dafür fundierte Recherchen für Kaufentscheidungen genutzt werden können. Anstatt in Optionen zu ertrinken, gehen Sie mit einer klaren, begründeten Auswahlliste nach Hause. Im zweiten Teil dieses Tutorials werden wir uns weiter mit eingehenden Recherchen für einen anderen Anwendungsfall befassen , nämlich ACA dort 38. Deep Research in Aktion – Lernen eines neuen Themas: Schauen wir uns nun etwas anderes an. Nutzen Sie gründliche Recherchen, um Ihr Lernen zu beschleunigen , wenn Sie sich mit einem neuen Thema befassen. Ich habe vor Kurzem angefangen, Immobilieninvestitionen zu studieren. Ich habe meinen ersten Kurs besucht und mir einige Notizen zu den Themen gemacht , die wir dort behandelt haben. Jetzt möchte ich mithilfe gründlicher Recherchen mehr über diese Themen erfahren . Ich kann dieses Foto direkt in die Eingabeaufforderung hochladen. Zwillinge Ich lese meine handschriftlichen Notizen, extrahiere die wichtigsten Themen und verwende sie als Grundlage für einen Forschungsbericht Ich muss nichts erneut eingeben. Lassen Sie mich Ihnen zeigen, wie das funktioniert. Lassen Sie uns zunächst eine gründliche Recherche aus der Liste der Tools auswählen . Ich werde hier in den Denkmodus wechseln, meine Eingabeaufforderung eingeben und dann meine handschriftlichen Notizen anhängen Was ich an diesem Ansatz liebe, ist, dass die Forschung auf dem basiert , was ich bereits gelernt habe . Der Bericht verstärkt und erweitert also mein vorhandenes Wissen, anstatt bei Null anzufangen Aus diesem Grund habe ich Gemini ausdrücklich gebeten, des Berichts auf die wichtigsten Themen in meinen Notizen Bezug Recherche und Erstellung Und hier ist unser Forschungsplan, für mich sehen alle toll aus, also klicke ich auf Recherche starten Und unser Bericht ist fertig. Sie können sehen, dass er alle wichtigen Themen aus meinen Notizen aufgegriffen und darauf aufbauend eine strukturierte Analyse erstellt hat. Definitionen, Kontext, Beziehungen zwischen Konzepten, praktische Implikationen. Wir können diese Informationen als Studienbegleiter verwenden, nicht nur als Zusammenfassung. Aber hier wird es wirklich interessant. Sobald der ausführliche Forschungsbericht fertig ist, können wir diese Textwand in aktive Lernwerkzeuge umwandeln . Sie werden feststellen, dass in der oberen rechten Ecke des Canvas-Bedienfelds eine Schaltfläche erstellt wurde. Wenn Sie darauf klicken, wird ein Drop-down-Menü mit verschiedenen Optionen zur Transformation des Berichts angezeigt. Schauen wir uns zunächst die Infografiken an. Gemini nimmt die komplexen Informationen wie den Unterschied zwischen Wohn- und Industrieanlagen in unserem Immobilienbeispiel und verwandelt sie in eine Dies ist perfekt für eine schnelle Überprüfung auf hoher Ebene oder für gemeinsame Nutzung eines Pagers mit einem Kehren wir zu unserem Bericht über Immobilieninvestitionstrends zurück, um die Demo fortzusetzen Als Nächstes können wir ein Quiz erstellen, um sicherzustellen, dass die Informationen tatsächlich Bestand haben. Gemini erstellt interaktive Fragen speziell auf dem Bericht basieren Sobald Sie antworten, erhalten Sie sofort Feedback, sodass Sie genau erkennen können, an welchen Stellen Ihr Verständnis eines neuen Themas möglicherweise mehr Arbeit erfordert I Und schließlich haben wir Karteikarten Sie haben zwei Möglichkeiten, dies zu verwenden. Sie können einen ganzen Satz Karteikarten erstellen , um jeden Schlüsselbegriff aus dem Bericht zu überprüfen Wenn Sie das Quiz jedoch gerade abgeschlossen haben, wie in unserem Beispiel hier, kann Gemini Karten speziell auf Grundlage Ihrer Quizergebnisse generieren speziell auf Grundlage Ihrer Es zielt auf die Bereiche ab, in denen Sie Probleme hatten. Lass uns das machen Wir sehen hier also eine komplette Lernschleife, recherchieren, verstehen, testen und Ihr Wissen vertiefen — alles in einem Tool. Im nächsten Video werden wir von der gründlichen Recherche weitermachen und es erneut aufgreifen, werden wir von der gründlichen Recherche weitermachen bis Sie es bereits wissen, aber wir werden die fortgeschrittenen Anwendungsfälle untersuchen, insbesondere die Entwicklung von KI-Anwendungen Und als Vorwarnung Wir werden die wichtigsten Erkenntnisse aus einem unserer ausführlichen Forschungsberichte als Eingabedaten verwenden , Grundlage unsere App aufgebaut wird. Und mehr dazu im nächsten Video. 39. Mehr als Dokumente: Was kann Canvas noch?: Willkommen zurück. In unserer letzten Canvas-Vorlesung haben wir uns also auf das Verfassen von Dokumenten konzentriert. Wie Canvas Ihnen einen Raum für Leben und Arbeit bietet, Schreiben verfeinern können, während Zwillinge direkt neben Ihnen stehen Aber das Verfassen von Dokumenten ist erst der Anfang dessen, was Canvas kann Und Sie haben bereits einiges davon gesehen , ohne es zu merken. Denken Sie daran, dass die Schaltfläche zum Erstellen, die nach Ihrem ausführlichen Forschungsbericht auftauchte , Radium war, die Infografiken, das Quiz, die Karteikarten, das Deep Research stellt seinen Bericht direkt in Canvas bereit, weshalb Sie ihn in all diese Formate umwandeln konnten , ohne jemals Deep Research und Canvas sind von Natur aus miteinander verbunden Google hat sie so konzipiert , dass sie nahtlos ineinander übergehen. Schauen wir uns also das Gesamtbild dessen an, was Canvas kann. Das Erste, was Canvas über Dokumente hinaus erstellen kann , sind Webseiten. Und ich meine nicht einfaches HTML mit etwas Text drauf. Ich meine strukturierte interaktive Seiten mit Informationskarten, Diagrammen, visuellen Layouts und anklickbaren Elementen Denken Sie an das letzte Mal, als Sie einen Bericht oder ein Briefing mit jemandem teilen mussten ein Briefing mit jemandem der keine Textwand lesen wollte Mit Canvas können Sie denselben Inhalt nehmen und sagen, daraus eine Webseite machen oder einfach auf die Webseitenschaltfläche klicken. Und innerhalb von Sekunden haben Sie etwas, das tatsächlich wie eine echte Seite aussieht. Sie können es mit dem Link teilen. Keine Veröffentlichungs- oder Hosting-Einrichtung erforderlich. Als Nächstes folgen Infografiken. Wenn Sie jemals versucht haben, einem nicht technisch versierten Interessenvertreter etwas Komplexes zu erklären , einen Prozess, einen Vergleich oder einen Entscheidungsrahmen, dann kennen Sie Worte können nur so viel bewirken. Canvas kann Ihren Rohinhalt nehmen und ihn in ein visuelles Format umstrukturieren Saubere Abschnitte, verdauliche Teile, Symbole, Vergleich nebeneinander Und Sie können es in derselben Tabelle weiter verfeinern. Vergrößern Sie den zweiten Abschnitt, ändern Sie den Ton, sodass er weniger formell ist, und er wird in Echtzeit aktualisiert Drittens kann Canvas auch interaktive Quizze und Karteikarten aus beliebigen Inhalten generieren interaktive Quizze und Karteikarten aus beliebigen Inhalten Das ist über das bloße Lernen hinaus nützlich. Denken Sie an das Onboarding von Kunden, Teamschulungen und Produktwissenschecks. Sie beschreiben, was Sie wollen, und erstellen auf Canvas ein funktionierendes interaktives Quiz. Kein Drittanbieter-Tool, kein Form Builder, keine zusätzlichen Schritte. Es gibt auch einen Audiomodus. Canvas kann geschriebene Inhalte in eine Audioübersicht im Podcast-Stil umwandeln , Konversation zwischen zwei KI-Moderatoren , die Ihr Material besprechen und zusammenfassen Dies ist nützlich, wenn Sie während der Arbeit ein langes Dokument durchgehen oder Ergebnisse mit Leuten teilen möchten während der Arbeit ein langes Dokument durchgehen , die lieber zuhören als lesen möchten. Willkommen zurück zum Deep Dive Heute packen wir eine Vision aus, die sich anfühlt, als würde sie sich wirklich unter unseren Füßen verschieben Wir haben die alte Vorstellung von einem intelligenten Assistenten hinter uns gelassen, der einfach Timer einstellt oder Musik spielt Wir schauen uns dieses Konzept eines universellen Assistenten an. Ein Partner, der tatsächlich vorhersieht was Sie brauchen, bevor Sie überhaupt danach fragen Und dann ist da noch die große Sache, mit der Canvas voll funktionsfähige Apps, funktionierende Software, erstellen kann voll funktionsfähige Apps, funktionierende Software, erstellen Sie beschreiben, was Sie wollen, Rezeptorganisator, Reiseplaner oder Quiz-Tool oder Budget-Tracker, und Canvas generiert den Code und führt ihn für Sie aus. Genau dort im Fenster sehen Sie den Code nicht. Sie müssen den Code nicht verstehen. Sie sehen nur eine funktionierende interaktive App, und sie ist nicht statisch. Sie können weiter mit Gemini chatten, um es anzupassen. Das wird als Vibe-Coding bezeichnet. Erstellen Sie Software, indem Sie beschreiben, was Sie wollen, anstatt Code Zeile für Zeile zu schreiben Wir haben dieses Konzept in der Vorlesung „Geni Implementation Implementation Impact“ des Kurses angesprochen der Vorlesung „Geni Implementation Implementation Impact“ des Kurses Und jetzt sind wir dabei , es live zu erleben. Folgendes liebe ich in diesem Zusammenhang an Canvas am meisten. Es ist kein separates Entwicklertool. Es ist derselbe Arbeitsbereich, den Sie bereits zum Schreiben von Dokumenten und Gliederungen verwendet haben. Der Wechsel vom Entwurf eines Dokuments zur Erstellung einer App für mich ist nur eine Konversation. In unserer nächsten Vorlesung werden wir genau das tun. Wir werden genau da weitermachen, wo wir aufgehört haben. Wir haben gründliche Nachforschungen angestellt, um endlich eine klare, auf Fakten basierende Antwort auf die Ernährung beim Frühstück zu erhalten. Und wir werden diese Forschung in eine Rezept-App für Familienfrühstücke umwandeln, die gesunde schnelle Mahlzeiten für Erwachsene und Kinder vorschlägt. Lass uns das aufbauen. 40. Folge-Along: Erstellen einer App mit Canvas – Von der Forschung zur ausführlichen App: Willkommen zurück. Hier bauen wir den Frühstückschef auf, schnelle Mahlzeiten unter 20 Minuten, familienfreundlich mit Fotos der fertigen Mahlzeit. Alles in Gemini Canvas, kein Code, kein technischer Hintergrund erforderlich Nur eine gute Aufforderung und ein bisschen Hin und Her mit Gemini. Lass uns gehen Um unseren Arbeitsablauf zu organisieren, folgen wir vier einfachen Schritten ID Eight, Erstellen, Verfeinern und schließlich Teilen. Und hier ist Schritt eins, iDED. Dies ist unser ausführlicher Forschungsbericht zur Frühstücksernährung. Lassen Sie uns mit Gemini ein Brainstorming über die Idee hinter dem Verstärker durchführen und darüber, was er bewirken wird Ich habe einige erste Gedanken, aber ich möchte sie näher erläutern Ich habe zunächst den Zweck der App beschrieben. Ich habe auch gesagt, dass ich möchte die App die Forschungsergebnisse nutzt, und ich habe auf das umfassende TireedGrocery-Framework aus dem Bericht verwiesen das umfassende TireedGrocery-Framework aus dem , um zu betonen , dass ich keine zufällige Zutatenliste für die Rezepte benötige zufällige Zutatenliste für die Rezepte Ich möchte, dass Gemini sich drei coole Funktionen für die App einfallen lässt, und ich schlage auch ein Aviall-Look-and-Feel Ich habe hier einige beschreibende Worte wie lustig, warmherzig, zugänglich eingefügt, um mir die Richtung für das vorzugeben , was Ich suche nach einer detaillierten Beschreibung der App. Das Konzept, auf dem wir mit dem Aufbau der eigentlichen App beginnen können. Drücken wir die Eingabetaste. Und hier haben wir unsere App-Beschreibung. Bitten wir Gemini, einige Änderungen an diesem Konzept vorzunehmen. Die erste Funktion, der Frontloader-Familientimer, scheint ziemlich komplex zu sein, insbesondere für die erste Version der App Bitten wir Gemini also, es durch etwas Einfacheres zu ersetzen . Einfache Frage, welche Art von Mahlzeit heute bevorzugt wird. Und ich füge zusätzliche Details hinzu, um sicherzustellen , dass wir jedes Mal, wenn wir nach einem Rezept fragen, ein neues bekommen und dass die App ausschließlich die in unserem Bericht empfohlenen Zutaten verwendet. Also drücke ich erneut die Eingabetaste und lass uns sehen, wie Gemini diese Änderungen übernimmt Und hier haben wir die aktualisierte Version der App-Beschreibung Ich bin bereit, mit diesem Konzept weiterzumachen, aber bevor wir mit Schritt zwei, der Erstellung der App, fortfahren, müssen wir unsere Einstellungen überprüfen . Schauen Sie sich die Modellauswahl hier P könnte Sie in Versuchung führen. Darin steht fortgeschrittene Mathematik und Programmieren Es klingt also nach der mächtigsten Wahl. Aber hier ist, was ich herausgefunden habe, als ich beide getestet habe , als ich diese Frühstücks-App zuvor erstellt habe. Pro hat den Prozess tatsächlich schwieriger gemacht. Es dauerte mehr Hin und Her, um die gewünschten Ergebnisse zu erzielen, und ich habe meine P Credits schnell aufgebraucht, sodass ich einige Stunden warten musste, bis ich weitermachen konnte. Der Denkmodus hat mich schneller ans Ziel gebracht. Also hier ist meine Empfehlung. Beginne immer mit Denken. Es ist darauf ausgelegt, Schritt für Schritt zu denken, was genau das ist, was die Erstellung von Apps erfordert Du arbeitest dich durch Logik, Struktur und Ablauf und spare Pro für den Fall, dass deine App mit einer großen Menge an Inhalten aus verschiedenen Quellen, Dokumenten, Videos, Bildern und mehr arbeiten muss einer großen Menge an Inhalten aus verschiedenen Quellen, Dokumenten, Videos, Bildern und mehr Beginnen wir mit Schritt zwei, dem Erstellen der App. Meine bisherigen Tests haben gezeigt, dass Gemini nicht mit dem Erstellungsprozess beginnt, sondern Ihnen die Beschreibung des App-Konzepts noch einmal sendet, wenn Sie diese Anfrage direkt in diesem Chat Gemini nicht mit dem Erstellungsprozess beginnt, sondern Ihnen die Beschreibung des App-Konzepts noch einmal sendet, senden Ja, genau das ist auch dieses Mal passiert. Sie sehen, dass Gemini, anstatt die App zu erstellen, nur einige Änderungen am Bericht selbst vorgenommen hat, und das ist nicht das, was wir brauchen Um also mit der Erstellung der App-Software nicht nur mit der Textbeschreibung zu beginnen, klicken Sie auf den Abschnitt Erstellen und beschreiben Sie Ihre eigene App und schreiben Sie Erstellen Sie eine App auf der Grundlage der obigen Beschreibung. Sie sehen, dass Gemini diesen Befehl unter unserer App-Beschreibung hier anzeigt diesen Befehl unter unserer App-Beschreibung hier und mit der Erstellung beginnt Und während Gemini die App erstellt, möchte ich eine Frage beantworten, die Sie sich wahrscheinlich gerade Was ist, wenn ich nicht von einem ausführlichen Forschungsbericht ausgehe? Was ist, wenn ich einfach eine App von Grund auf neu erstellen möchte? Öffnen Sie in diesem Fall zunächst einen neuen Chat. Bevor Sie jedoch etwas eingeben, wechseln Sie zuerst in den Canvas-Modus. Hier ist der Grund. Gemini kann Apps nur in Canvas erstellen und ausführen. Es ist ein spezieller Arbeitsbereich speziell dafür entwickelt wurde Ein regelmäßiger Chat kann Ihnen helfen, Ideen zu durchdenken, aber er kann keine funktionierende App erstellen. Sobald du in Canvas bist, deine App-Idee mit Gemini brainstormen Beschreiben Sie, was Sie erstellen möchten, wofür es gedacht ist und was es tun soll Wenn Sie bereit sind, mit dem Bauen zu beginnen, klicken Sie auf die Schaltfläche Erstellen, geben Sie Ihre Eingabeaufforderung ein, und Gemini macht sich an die Arbeit Okay, zurück zu unserer Demo. Und unsere App ist fertig. Wir wählen zunächst aus, wie wir uns heute fühlen und welche Art von Mahlzeit wir bevorzugen würden. Und Gemini würde eine gesunde Mahlzeit vorschlagen. Dementsprechend sehen wir hier eine Zutatenliste, gefolgt von Anweisungen zur Zubereitung der Mahlzeit Wir haben den tollen Schaum veranschaulicht, was wir gleich essen werden Und wir können auch einen Kinderkochmodus wählen , sodass wir eine Liste mit Aufgaben für unsere jungen Helfer haben Ziemlich süß. Gehen wir nun zum dritten Schritt über, verfeinern. Wie Sie sich vorstellen können, sind wir hier noch nicht fertig. Wir können unsere App weiter iterieren und verbessern. Nehmen wir an, ich möchte ein paar Dinge anpassen. Ich gebe meine Anfragen in den Chat ein. Sie haben gerade gesehen, wie ich mehrere Änderungen an unserer App vorgenommen habe. Wenn Sie dies tun, führen Sie jeweils eine Änderung ein, anstatt zu versuchen alles in eine einzige Aufforderung aufzunehmen. Lassen Sie mich einige andere Änderungen an unserer App vornehmen. Hier ist die Version , die ich bisher habe. Ich habe beschlossen, die Möglichkeit hinzuzufügen, zusätzlich zur vordefinierten Liste weitere Zutaten aufzunehmen . Und falls es sich um ein Produkt der dritten Kategorie handelt, wird eine entsprechende Meldung angezeigt, aber das Rezept wird trotzdem erstellt. Ich habe auch die Möglichkeit hinzugefügt , ein Rezept in den Favoriten zu speichern, die hier zugänglich sind. Und schließlich habe ich den Reset-Button hinzugefügt, falls wir vorne beginnen und verschiedene Zutaten auswählen möchten noch einmal von vorne beginnen und verschiedene Zutaten auswählen möchten. Wie Sie sehen können, konnten wir eine Menge Änderungen vornehmen, indem wir einfach beiläufig mit Gemini chatten , ohne dass eine Codierung erforderlich Ich bin mit unseren aktuellen Fortschritten und der Benutzererfahrung, die wir geschaffen haben, zufrieden und der Benutzererfahrung, die wir geschaffen haben Im zweiten Teil dieses Tutorials zeige ich Ihnen eine weitere Möglichkeit, wie Sie mithilfe der Canvas-Symbolleiste Änderungen an Ihrer App vornehmen können . Und wir werden uns auch ansehen , wie Sie es mit anderen teilen können. Wir sehen uns im zweiten Teil. 41. Weiterführende Schritte: Erstellen einer App mit Canvas – Verfeinern und Freigeben: Jeder. Willkommen zum zweiten Teil des Tutorials, in dem wir untersuchen, wie man funktionierende Software erstellt, indem beschreiben, was wir wollen anstatt Code Zeile für Zeile zu schreiben, den Prozess, der wie versprochen als Vibe-Codierung bekannt ist. Ich möchte Ihnen im Rahmen unseres verfeinerten Schritts eine weitere Option zeigen, mit der Sie Änderungen an Ihrer App vornehmen mit der Sie Änderungen an Ihrer App Beachten Sie diese Gemini Canvas-Symbolleiste. Lassen Sie uns herausfinden, was sie für uns tun kann. Fangen wir mit diesem funkelnden Symbol an. Dies ist der AI-Feature-Injector. Es erweitert Ihre App um EI-Funktionen. Wenn Sie darauf klicken, analysiert Gemini Ihre aktuelle App-Ansicht und schlägt intelligente Komponenten vor, z. B. eine KI-Speicherleiste oder die Text- und Bilderzeugung. Anschließend fügt es diese Elemente direkt in die Logik Ihrer App Lassen Sie uns Gemini bitten, KI-Funktionen hinzuzufügen, und sehen wir uns an, wie das funktioniert. Im Chat auf der linken Seite bietet Gemini einen Überblick darüber, welche KI-Funktionen der App hinzugefügt wurden Wir können im Chat antworten und Gemini bitten, weitere Änderungen vorzunehmen Aber lassen Sie uns zuerst diese neuen Funktionen ausprobieren. Hier ist das magische Feature Nummer zwei. Wir sehen, dass Gemini Ich mehr gesundheitsfördernde Inhaltsstoffe vorgeschlagen mehr gesundheitsfördernde Inhaltsstoffe die, die ich gerade ausgewählt habe, aber ich habe sie momentan nicht, also klicke ich einfach auf Abbrechen und mache mit diesen drei weiter Hier ist die EI-Weisheitskarte ziemlich nett. Und lassen Sie uns natürlich ausprobieren, wie der Audio-Erzähler funktioniert Steh auf und strahle. Die heutige Mission ist die Sonnenseite mit Spinat - und Avocado-Wolken. Der eisenreiche Spinat Kombination mit monogenen und gesättigten Fetten aus Avocado sorgt für einen sauberen Energieschub , sodass Sie sich flink und erfrischt fühlen Lassen Sie uns eine Änderung an einer der Funktionen vornehmen. Gemini bestätigt, dass die Änderung vorgenommen wurde Lassen Sie uns sie testen Atme tief durch und lass uns den Tag beginnen. Ihr heutiges Rezept ist das Emerald Cloud Nest. Die Kombination aus eisenreichem Spinat und einfach ungesättigten Fetten aus Avocado sorgt für eine langsame Energiefreisetzung, sodass Sie sich leicht und luftig fühlen. Wasson, wir haben gerade gesehen, wie Gemini unseren Anweisungen gefolgt ist, und ich schlage vor, dass wir zur Gemini Canvas-Symbolleiste zurückkehren und Das nächste, was ich hören kann, ist der Ziehgriff. Es wird verwendet, um das Atolbr so zu verschieben, dass es Navigation Ihrer App während der Verkostung nicht blockiert Und es gibt noch ein drittes Symbol, das Verfeinerungstool, das Gemini anweist, ein bestimmtes Element Ihrer App zu ändern Sie haben vielleicht bemerkt, dass es hier in unserer Golden Hour App nicht sichtbar in unserer Golden Hour Das ist eigentlich beabsichtigt. Gemini ist sich bewusst, dass diese App genügend Iterationen durchlaufen hat, sodass kleine automatisierte Änderungen riskant sein Wenn es versucht, ein Element zu optimieren , aber den Kontext falsch interpretiert, könnte es etwas anderes kaputt machen, könnte es etwas anderes kaputt machen Daher wird das Symbol als Schutzmaßnahme ausgeblendet , um zu demonstrieren, wie das Verfeinerungstool Wechseln wir zu einer einfacheren App. Ich habe mit dem Bauen begonnen, bevor ich dieses Tutorial aufgenommen habe. Ich habe dort nur ein paar Iterationen gemacht, daher ist das Symbol verfügbar Nehmen wir an, ich möchte die Farbe dieser Schaltfläche ändern. Also wähle ich „Auswählen und fragen“, markiere diese Schaltfläche und gebe meine Aufforderung ein, eine andere Farbpalette vorzuschlagen. Mir ist aufgefallen, was hier passiert ist. Anstatt nur diese Schaltfläche und die Farbe zu ändern, hat Gemini die gesamte App neu gestaltet. Warum ist das so? Es stellt sich heraus, dass das Wort Palette hier das Problem ist. Eine Farbpalette bezieht sich auf den gesamten Farbsatz, der in Ihrer App verwendet wird. Gemini nimmt das also wörtlich und aktualisiert alles entsprechend Es macht nichts falsch. Es folgt nur genau Ihren Anweisungen. Um nur die Farbe dieser Schaltfläche zu ändern, müssen Sie den Umfang der Änderung klar beschreiben . Lassen Sie mich zeigen, wie. Ich drücke erneut auf die Schaltfläche und tippe eine weitere Aufforderung ein. Sie sehen, dass meine detaillierte Eingabeaufforderung funktioniert hat, und dieses Mal Gemini I die Änderungen auf das Element angewendet , das ich mit dem Verfeinerungswerkzeug angegeben habe Es ist wirklich nützlich, das im Hinterkopf zu behalten. Je spezifischer Ihre Aufforderung ist, desto genauer ist das Ergebnis. Kommen wir zurück zu unserer Golden Hour App. Jetzt haben wir uns damit befasst, wie Sie Ihre App verfeinern und anpassen können. Lass uns darüber sprechen, was passiert , wenn du damit zufrieden bist. Schritt vier: Teilen. Sobald Sie fertig sind, können Sie einen Link erhalten , den Sie teilen können, und ihn an jeden senden Sie können die App direkt im Browser öffnen und verwenden. Keine Downloads, keine Schilder, kein technisches Setup auf ihrer Seite. Sie können es sogar remixen. Das ist eine der Funktionen, die Google in Canvas integriert hat. Jemand kann deine App nehmen, sie öffnen und daraus seine eigene Version erstellen. Ordnung. Und das war's für dieses Tutorial Bitte teilen Sie im Q & A-Bereich für dieses Video mit, an welchen Apps Sie gerade arbeiten im Q & A-Bereich für dieses Video mit, an Ich würde gerne sehen, was du baust.