KI der Generation 0 – 100: Von den Grundlagen zu Google Cloud-Tools

Reza Moradinezhad, AI Scientist

Erhalte unbegrenzten Zugang zu allen Kursen

Lerne von Branchenführern, Ikonen und erfahrenen Experten

Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Erhalte unbegrenzten Zugang zu allen Kursen

Lerne von Branchenführern, Ikonen und erfahrenen Experten

Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Einheiten dieses Kurses

- 1.
  
  Einführung in GenAI
  
  2:50
- 2.
  
  L1V1 – Traditionelle KI
  
  18:42
- 3.
  
  L1V2 – Maschinelles Lernen
  
  19:10
- 4.
  
  L1V3 – Deep Learning
  
  14:55
- 5.
  
  L1V4 – Diskriminativ vs. Generativ
  
  11:54
- 6.
  
  L2V1 – Transformatoren
  
  7:53
- 7.
  
  L2V2 – Gen-KI
  
  14:52
- 8.
  
  L2V3 – Gen-KI-Anwendungen
  
  12:47
- 9.
  
  L2V4 – Prompt Engineering
  
  11:24
- 10.
  
  L3V1 – LLMs
  
  6:41
- 11.
  
  L3V2 – LMM-Vorteile
  
  10:23
- 12.
  
  L3V3 – Beispiele für LLMs
  
  10:13
- 13.
  
  L3V4 – Foundation-Modelle
  
  12:51
- 14.
  
  L3V5 – LLM-Entwicklung
  
  5:23
- 15.
  
  L3V6 – Tuning von LLMs
  
  8:54
- 16.
  
  L4V1 – App-Blatt
  
  6:56
- 17.
  
  L4V2 – Gen-App-Builder
  
  6:11
- 18.
  
  L4V3 – Maker Suite
  
  10:16
- 19.
  
  L4V4 Generatives KI-Studio
  
  12:56
- 20.
  
  Projekt-Demo- App-Blatt No-Code App Builder
  
  12:06

Anfänger-Niveau

Fortgeschrittenes Niveau

Jedes Niveau

101

Teilnehmer:innen

Projekte

Über diesen Kurs

Willkommen zum umfassenden generativen KI-Kurs – deinem ultimativen Leitfaden zur Beherrschung des aufregenden Bereichs der generativen künstlichen Intelligenz. Dieser Kurs stattet Sie mit den wesentlichen Kenntnissen und Fähigkeiten aus, um in diesem schnell expandierenden Feld zu gedeihen, das in den kommenden Jahren einen Wert von 100 Milliarden US-Dollar erreichen wird.

Mit Stunden vertiefter Inhalte, Weltklasse-Folien und einer Reihe wertvoller Ressourcen ist dies der detaillierteste generative KI-Kurs, der verfügbar ist, der sich auf die Grundlagen dieser bahnbrechenden Technologie konzentriert. Egal, ob du keine Programmiererfahrung hast oder dein Verständnis vertiefen möchtest, dieser Kurs wird dich vom Anfänger zum Experten bringen. Und die Gründe:

Der Kurs wird von einer Promotion in Informatik unterrichtet, mit zahlreichen Publikationen und jahrelanger Erfahrung in der Lehre an Universitäten auf der ganzen Welt.
Sie arbeiten mit den bahnbrechenden Tools und Technologien, die von großen Unternehmen wie OpenAI und Google verwendet werden.
Es werden keine Abkürzungen gemacht – Sie können ansprechende Präsentationen, Quiz, praktische Projekte, herunterladbare Ressourcen, Artikel und mehr erwarten.

Der Lehrplan wurde in Jahren auf Universitätsebene entwickelt und auf der Grundlage von Studentenfeedback und realen Tests verfeinert.

Wir haben Tausenden von Teilnehmer:innen beigebracht, wie man programmiert, viele von ihnen sind professionelle Entwickler geworden oder haben ihre eigenen Tech-Projekte gestartet.

Durch Schritt-für-Schritt-Video-Tutorials erwerben Sie alles, was Sie benötigen, um im Bereich der generativen KI erfolgreich zu sein.

Der Kurs enthält mehrere Stunden HD-Video-Tutorials und verstärkt dein Lernen mit praktischen Aufgaben.

Zu den wichtigsten Themen, die in diesem umfassenden Kurs behandelt werden, gehören:

Die Rolle des Prompt-Designs bei der Generierung bestimmter Ergebnisse
Grundlagenmodelle und ihr Einfluss auf die generative KI
Apps mit AppSheet und Integration von generativer KI
Verschiedene Arten von generativen KI-Modellen (Text-zu-Text, Text-zu-Bild usw.)
Code-Generierung mit Tools wie Bard (Gemini), ChatGPT 3.5 und GPT-4
Große Sprachmodelle (LLMs) und ihre Vorteile
Prompt Engineering-Techniken für LLMs
Aufbau von konversationalen KI-Engines
Die Bedeutung von Deep Learning in KI
Aufgabenspezifische Modelle im Modellgarten
Modelltraining und Bereitstellung mit Gen AI Studio und Maker Suite
Erstellen benutzerdefinierter generativer KI-Anwendungen

Am Ende des Kurses sind Sie in der Lage, generative KI-Techniken anzuwenden, um Ihre kreativen Ideen zum Leben zu erwecken und innovative Lösungen in verschiedenen Branchen zu entwickeln.

Begleiten Sie uns noch heute und freuen Sie sich auf:

Animierte Video-Lektionen
~4 Stunden Unterricht von einem Universitätsprofessor
Praktische generative KI-Aufgaben und Projekte
Quizze und Übungsmöglichkeiten
Maßgeschneiderte generative KI-Artikel
Generative KI-Kursmaterialien und Curriculum im Wert von über 1000 USD

Für wen ist dieser Kurs gedacht?

Jeder, der das sich schnell entwickelnde Feld der künstlichen Intelligenz mit kreativem Potenzial verstehen möchte.
Diejenigen, die neugierig sind, die faszinierende Welt der generativen KI und ihrer innovativen Anwendungen zu erkunden.
Personen, die die Macht der generativen KI für geschäftliche Zwecke nutzen möchten.
Teilnehmer:innen, die einen einzigen, umfassenden Kurs wünschen, der alles abdeckt, was sie über generative KI wissen müssen.

Triff deine:n Kursleiter:in

Reza Moradinezhad

AI Scientist

Kursleiter:in

Hello, I'm Reza.

I am passionate about designing trustworthy and effective interaction techniques for Human-AI collaboration. I am an Assistant Teaching Professor at Drexel University College of Computing and Informatics (CCI), teaching both undergraduate and graduate level courses. I am also an AI Scientist at TulipAI, leading teams of young students, pushing the mission of empowering media creators through ethical and responsible use of Generative AI.

I received my PhD in Computer Science from Drexel CCI. My PhD dissertation focused on how humans build trust toward Embodied Virtual Agents (EVAs). I have collaborated with MIT Media Lab, CMU HCII, Harvard University, and UCSD, publishing and presenting in venues such as Springer Nature, ACM CHI, and ACM C&C. I have been re... Vollständiges Profil ansehen

Skills dieses Kurses

KI und Innovation KI für Entwicklung Grundlagen der KI Generative Kunst Prompting KI-Werkzeuge No-Code-Development

Level: All Levels

Praxisnahes Kursprojekt

Für fast jedes Video in diesem Kurs gibt es eine entsprechende Lesung und ein Quiz. Achte darauf, die Vorteile des hier bereitgestellten Materials zu nutzen, um dein Lernen zu maximieren. Du kannst deine Antworten auf die Quiz oder deine Gedanken zu den Artikeln hochladen und mit deinen Kollegen diskutieren.

Gehe für dein Projekt zu Google AppSheet | Baue Apps ohne Code und erstelle deine eigene No-Code-Beispiel-App auf der Grundlage dessen, was du im Projekt-Demo-Video gelernt hast. Du kannst Screenshots, Bildschirmaufzeichnungen oder direkte Links zu deinen Apps teilen, damit deine Kollegen deinen Erfolg sehen und feiern.

Daria Ispas 3 Likes

1 Kommentar

Yu Ling Lim 3 Likes

1 Kommentar

Kursbewertung

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Nimm an prämierten Skillshare Original-Kursen teil

Jeder Kurs setzt sich aus kurzen Einheiten und praktischen Übungsprojekten zusammen

Mit deiner Mitgliedschaft unterstützt du die Kursleiter:innen auf Skillshare

Lerne von überall aus

Ob auf dem Weg zur Arbeit, zur Uni oder im Flieger - streame oder lade Kurse herunter mit der Skillshare-App und lerne, wo auch immer du möchtest.

Transkripte

1. Einführung in GenAI: Es gibt viele Kurse zum Thema generative KI. Ich habe viel Zeit damit verbracht, viele davon durchzugehen , weil ich sichergehen wollte, dass ich Ihnen in diesem Kurs alle Grundlagen vermittle, die Sie benötigen, um vollständig zu verstehen, was generative KI ist Darüber hinaus werde ich Ihnen einige praktische Beispiele und einige praktische Demos zu verschiedenen Tools geben, verschiedenen Tools die generative KI verwenden und Ihnen heute helfen können Ich bin Professor Reza und unterrichte Studenten und Doktoranden Themen zu Informatik und Ich habe auch Tausende von Online-Studenten. Ich habe über KI geforscht und mit renommierten Instituten wie DEM MIT Media Lab, der Carnegie Mellon University, der Harvard University und der University of California San Diego zusammengearbeitet renommierten Instituten wie DEM MIT Media Lab, der Carnegie Mellon University, der Harvard University und der University of California San Diego Und die Ergebnisse dieser Arbeiten wurden an Orten wie Springer Nature und ACL veröffentlicht Orten wie Springer Ich werde all diese Erfahrungen und alles andere , was ich in all diesen Zeiten gelernt habe, nutzen Erfahrungen und alles andere , was ich in all diesen Zeiten gelernt habe, , um Ihnen mitzuteilen, wie Sie die Transformation von traditioneller KI zu allgemeiner KI verstehen können die Transformation von traditioneller KI zu allgemeiner KI verstehen traditioneller KI zu allgemeiner KI Dieser Kurs ist in fünf verschiedene Abschnitte unterteilt. Im ersten Abschnitt werden wir uns traditioneller künstlicher Intelligenz befassen. Wir werden definieren was künstliche Intelligenz ist. Wir behandeln auch, was maschinelles Lernen ist, und erörtern verschiedene Arten von maschinellem Lernen, einschließlich unbeaufsichtigtem Lernen, überwachtem Lernen und verstärkendem Lernen. Außerdem werden wir Deep Learning und den Unterschied zwischen diskriminativem Deep Learning und generativem Deep Learning erörtern den Unterschied zwischen diskriminativem Deep Learning und generativem Deep Learning und generativem Im zweiten Abschnitt werden wir erörtern, wie man zwischen generativer KI und traditionellem maschinellen Lernen unterscheidet und traditionellem maschinellen Dann werden wir über generative KI sprechen und einige Beispiele für generative KI nennen. Wir werden diskutieren, was Transformatoren sind und wie sie das Spiel der künstlichen Intelligenz verändern. Wir werden auch Themen wie schnelles Engineering und Fundamentmodelle behandeln. Anschließend werden wir verschiedene Arten generativer KI besprechen und in diesem Abschnitt einige Beispiele für Codegenerierung mithilfe von KI vorstellen. In Abschnitt drei werden wir große Sprachmodelle diskutieren. Wir werden sie vorstellen und auch einen Vergleich zwischen LLM und generativer KI anbieten Außerdem werden wir die Vorteile von LLMs erörtern In Abschnitt vier werden wir über verschiedene Arten von Tools sprechen, die uns Google Cloud zur Verfügung stellt, damit wir generative KI für unsere eigenen Projekte verwenden können generative KI für unsere eigenen Im letzten Abschnitt werde ich eine Demo bereitstellen, wie sie mithilfe generativer KI erstellt ohne eine einzige Codezeile zu schreiben. Wenn Sie also gerne erfahren möchten, was generative KI ist und wie Sie sie in Ihrem täglichen Leben einsetzen können , lassen Sie uns eintauchen. 2. L1V1 – Traditionelle KI: In diesem Video geben wir eine Einführung in die traditionelle künstliche Intelligenz Künstliche Intelligenz ist eine Disziplin wie Physik oder Chemie. Es ist ein Zweig der Informatik, sich mit der Schaffung intelligenter Agenten befasst. Dabei handelt es sich um Systeme, die selbstständig argumentieren, lernen und handeln können selbstständig argumentieren, lernen und handeln Formeller ausgedrückt ist KI die Theorie und Entwicklung von Computersystemen, ist KI die Theorie und Entwicklung von die Aufgaben ausführen können, die normalerweise menschliche Intelligenz erfordern Einer der Teilbereiche der KI ist maschinelles Lernen. Maschinelles Lernen ist ein Programm oder System, das das Modell anhand von Eingabedaten trainiert Dieses trainierte Modell kann nützliche Vorhersagen anhand neuer oder noch nie dagewesener Daten treffen, die aus denselben Daten stammen , mit denen das Modell trainiert wurde. Maschinelles Lernen gibt Computern die Möglichkeit, ohne explizite Programmierung zu lernen. Ein weiterer Teilbereich der KI ist Deep Learning. Deep Learning ist eine Art von maschinellem Lernen, das künstliche neuronale Netzwerke verwendet Künstliche neuronale Netze sind von der Struktur des menschlichen Gehirns inspiriert und können verwendet werden, um komplexe Muster zu verarbeiten , die herkömmliche Algorithmen für maschinelles Lernen nicht können. Wir werden später in diesem Abschnitt ausführlicher auf maschinelles Lernen und Deep Learning eingehen . Aber vorher wollen wir einen Überblick über KI geben. Der Rest dieses Videos ist wie folgt strukturiert. Zunächst werden wir ein Beispiel aus der Praxis für den Einsatz künstlicher Intelligenz geben . Dann werden wir einen kurzen Überblick über die Geschichte der KI geben. Als Nächstes werden wir versuchen zu verstehen, was künstliche Intelligenz ist, und dann behandeln wir verschiedene Arten von KI, verschiedene Anwendungen von KI und diskutieren auch, wie die Zukunft der KI aussehen wird. Wenn wir darüber sprechen, dass KI unser Leben einfacher macht, sind Smart Homes ein guter Anfang. So funktioniert es. In einem intelligenten Haus haben wir Haushaltsgeräte und sprachgesteuerte Sensoren. Sie sind wie Ihr persönlicher Assistent, der das Licht und die Klimaanlage an das Wetter draußen anpasst der das Licht und die Klimaanlage an das Wetter draußen anpasst Dann ist da noch das Sicherheitssystem. Es ist immer auf der Hut, erkennt jede ungewöhnliche Bewegung draußen und alarmiert Sie sofort Hier ist der wirklich coole Teil. All diese Geräte sprechen miteinander. Sie sind verbunden und können sogar mit Ihrem Auto kommunizieren. beispielsweise das Garagentor öffnen, wenn Sie Ihre Einfahrt betreten, und das Ganze auffüllen, können Sie all diese Geräte von Ihrem Telefon aus verwalten , wo auch immer Sie sind KI kann so viel für uns tun. Aber bevor wir uns von den Anwendungen ablenken lassen, sollten wir jetzt einen Schritt zurücktreten und uns damit befassen , wie künstliche Intelligenz entstanden ist Hier ist eine Zeitleiste der künstlichen Intelligenz. 1950 entwickelte Alan Turing den Touring-Test, einen Test der Fähigkeit einer Maschine, intelligentes Verhalten zu zeigen , das dem eines Menschen entspricht oder sich von diesem unterscheidet 1956 prägte John McCarthy den Begriff künstliche Intelligenz und organisierte das Dartmouth Summer Research Project on Artificial Intelligence, die erste Konferenz zum Thema KI Dartmouth Summer Research Project on Artificial Intelligence, die erste Konferenz zum Thema KI. 1969 wurde Shake the Robot gebaut, erste Obwohl Shake nach heutigen Maßstäben einfach ist, markierte es doch einen Meilenstein in der KI-Entwicklung, indem die Fähigkeit demonstrierte, Daten zu verarbeiten und Aufgaben zielgerichtet auszuführen. 1997 besiegte Deep Blue den Schachweltmeister Gary Kasparov Das erste Mal, dass ein Computer einen Menschen in einem komplexen Spiel besiegt hatte einen Menschen in einem komplexen Spiel besiegt Der Sieg von Deep Blue war ein großer Durchbruch für KI und demonstrierte die Fähigkeit von Computern, zu lernen und sich anzupassen. Im Jahr 2002 wurde der erste kommerziell erfolgreiche Roboterstaubsauger eingeführt. Und im Jahrzehnt 2005-2015 wurden eine Reihe neuer KI-Technologien entwickelt, entwickelt darunter Spracherkennung, robotergestützte Prozessautomatisierung oder RPAs, tanzende Roboter, Smart Homes und selbstfahrende 2016 besiegte AlphaGo, ein von Google Deep Mind entwickeltes Computerprogramm, ein von Google Deep Mind entwickeltes Computerprogramm, den Go-Weltmeister Der Sieg von Alpha Go war ein wichtiger Meilenstein für KI und demonstrierte die Fähigkeit von Computern komplexe strategische Spiele zu meistern Im Jahr 2017 wurde die Transformator-Technologie in einem Artikel mit dem Titel Attention Is All You Need vorgestellt. Die Transformer-Technologie wird heute häufig bei Aufgaben zur Verarbeitung natürlicher Sprache wie maschineller Übersetzung und Textzusammenfassung Im Jahr 2020 wurde GPT Three, ein großes Sprachmodell, das von OpenAI entwickelt wurde GPT Three ist in der Lage, Text in menschlicher Qualität zu generieren, Sprache zu übersetzen und verschiedene Arten von kreativen Inhalten zu schreiben Und schließlich werden 2023 die KI-Tools der Google Cloud Generation veröffentlicht, die Entwicklern eine Reihe von Tools zum Erstellen und Bereitstellen von KI-Anwendungen Im selben Jahr wurde Bart, ein großes Sprachmodell, das von Google AI entwickelt wurde, veröffentlicht. Kunst ist in der Lage, Ihre Fragen informativ zu beantworten , auch wenn sie offen, herausfordernd oder seltsam sind. Dies ist nur ein kurzer Überblick über die Geschichte der KI. KI ist ein sich schnell entwickelndes Gebiet, und es werden ständig neue Fortschritte erzielt. Es wird interessant sein zu sehen, was die Zukunft der KI bereithält. Wir haben eine ziemliche Reise mit künstlicher Intelligenz hinter uns. Beginnend mit Turings bahnbrechenden Tests in den 1950er Jahren mit Turings bahnbrechenden Tests wurde 1956 der Begriff künstliche Intelligenz geprägt, und eine neue Ära Im Laufe der Jahre erlebten wir Meilensteine wie die Entwicklung unseres ersten mobilen Allzweckroboters Shaki 1997 besiegten Computer Schachmeister, und jetzt, im Jahr 2023, erleben wir hochentwickelte Sprachmodelle wie GPT Es ist ein bisschen wie die Computerrevolution der 80er, aber dieses Mal dreht sich alles um KI Beherrschung dieser neuen und leistungsstarken Tools wird immer wichtiger , da sich das Tempo der Fortschritte in der KI Das Potenzial ist immens, ähnlich wie bei diesen Computervisa Machen Sie sich also bereit für diese aufregende Reise, die vor uns liegt. Es geht nicht nur darum, zu beobachten was die Zukunft der KI bringen wird, sondern darum, diese Zukunft selbst mitzugestalten. Künstliche Intelligenz verstehen. KI ist ein Zweig der Informatik, der intelligente Maschinen entwickelt , die menschenähnliche Aufgaben wie Spracherkennung, Objektidentifikation, Lernen, Planung und Problemlösung ausführen können menschenähnliche Aufgaben wie Spracherkennung, Objektidentifikation, . Erinnerst du dich an den Computer , der den Schachmeister überlistet hat , oder den Computer, der deine Hausbeleuchtung steuert? Das ist KI, die Probleme löst, genau wie wir. Unser derzeitiges Verständnis von KI basiert weitgehend darauf wie sie mit uns interagiert und wie sie im Vergleich zu menschlichen Fähigkeiten Dinge wie Spracherkennung und Objekterkennung sind heute ein wichtiger Bestandteil der KI Es geht um die Fähigkeit, Informationen aufzunehmen, daraus zu lernen und sie zur Planung und Bewältigung zukünftiger Aufgaben zu nutzen . Aktivitäten, die sehr menschlich sind. Das ist gewissermaßen die Magie der KI. Um KI richtig zu verstehen, müssen wir drei Konzepte verstehen verschiedene Arten von KI, verschiedene KI-Anwendungen und verschiedene Möglichkeiten für die Zukunft der KI. Lassen Sie uns nun mit verschiedenen Arten von KI beginnen. Es gibt viele verschiedene Arten von KI, aber sie können grob in vier verschiedene Kategorien eingeteilt werden. Die erste ist reaktive KI. Reaktive KI-Systeme können nur auf den aktuellen Zustand der Welt reagieren. Sie haben keine Erinnerung an vergangene Ereignisse und können nicht für die Zukunft planen. Ein Beispiel dafür ist ein Schachroboter, der nur einer Reihe logischer Anweisungen folgt und auf der Grundlage des Zuges des Gegners richtig reagiert . Die zweite Art von KI ist KI mit begrenztem Speicher. Diese Systeme können sich an vergangene Ereignisse erinnern und diese Informationen verwenden, um Entscheidungen zu treffen. Sie können jedoch nicht über die Zukunft nachdenken oder die Absichten anderer Akteure verstehen. Ein Beispiel dafür könnte ein Antrag eines Abgeordneten sein , der auf der Grundlage Ihrer früheren Besuche Restaurants vorschlägt . Die dritte Art künstlicher Intelligenz ist die Theorie der geistigen KI. Diese Systeme können die Gedanken und Absichten anderer Akteure verstehen . Dies ermöglicht es ihnen, mit anderen Agenten zusammenzuarbeiten und Ziele zu erreichen, die für einen einzelnen Agenten unmöglich wären . Eine Möglichkeit, wie Theory of Mind KI die Art und Weise, wie wir mit Maschinen interagieren, revolutionieren könnte , ist die Entwicklung von Robotern, die in der Lage sind, Menschen, die einsam oder isoliert sind, Gesellschaft und Unterstützung zu bieten Menschen, die einsam oder isoliert sind, Gesellschaft und Unterstützung zu , oder durch virtuelle Assistenz, die in der Lage sind, unsere Bedürfnisse zu verstehen und uns mit den Informationen und der Unterstützung zu versorgen , Die vierte Art von KI ist selbstbewusste KI. Selbstbewusste KI ist eine hypothetische Art von KI, die bewusst ist und ihre eigenen subjektiven Angenommen, wir haben eine persönliche Roboterassistentin namens Eve. Wenn Eve eine selbstbewusste KI wäre, würde sie nicht einfach vorprogrammierten Anweisungen folgen oder auf unsere Befehle reagieren Stattdessen würde sie ihre eigene Existenz verstehen und ihre eigenen Gefühle und Gedanken haben Wenn wir Eve zum Beispiel bitten, ein Buch aus der Bibliothek zu holen, würde eine normale KI einfach den kürzesten Weg berechnen und das Buch holen Eine selbstbewusste KI wie Eve könnte jedoch darüber nachdenken, ob es ein schöner Tag für einen Spaziergang ist , oder darüber nachdenken, ob sie in letzter Zeit zu viele Bücher geholt hat, und stattdessen ein E-Book vorschlagen Es ist wichtig zu beachten , dass diese Art von selbstbewusster KI derzeit rein hypothetisch ist Einige Forscher glauben, dass es sich um eine zukünftige Möglichkeit handelt, die es wert Lassen Sie uns nun auf die Anwendungen der KI eingehen. künstlicher Intelligenz geht es nicht nur darum, menschliche Fähigkeiten nachzuahmen, sondern auch darum, unsere Fähigkeiten zu erweitern und die Effizienz in vielen verschiedenen Bereichen zu steigern Vom Transportwesen bis zum Gesundheitswesen, Finanzdienstleistungen bis hin zum Kundensupport und von Bildung bis Unterhaltung das Potenzial von KI scheint grenzenlos zu sein Hier sind einige Beispiele dafür, wie KI heute eingesetzt wird. Selbstfahrende Autos. KI revolutioniert die Art und Weise, wie wir reisen. Sie treibt selbstfahrende Autos an, die selbstständig auf Straßen navigieren und Hindernissen ausweichen können , was zu sichereren Straßen führt Medizinische Diagnose. Im Gesundheitswesen macht KI Fortschritte bei der Diagnose von Krankheiten und übertrifft häufig menschliche Ärzte in Bezug auf die Durch die Analyse riesiger Mengen medizinischer Daten hilft sie dabei, Muster und Trends zu erkennen und Ärzte dabei zu unterstützen, fundiertere Entscheidungen zu treffen Bankwesen und Betrugserkennung. KI hat im Bankensektor in den letzten halben zehn Jahren erheblich Bankensektor in den letzten halben zehn Jahren Von der Vorhersage potenziell betrügerischer Transaktionen bis hin zur Bestimmung der Kreditwürdigkeit auf der Grundlage verschiedener Faktoren spielt KI im heutigen Finanzsektor eine zentrale Rolle Kundenservice und Online-Support. Stellen Sie sich ein Unternehmen wie HP vor, das mehr als 70.000 Hilfeseiten in 17 Sprachen verwaltet mehr als 70.000 Hilfeseiten in 17 Sprachen KI kommt hier ins Spiel, automatisiert den Kundensupport und bietet Service rund um die Uhr, Kosten erheblich gesenkt und die Effizienz gesteigert Bildung. Im Bildungsbereich ermöglicht KI personalisierte Lernerfahrungen, passt sich an die individuellen Bedürfnisse jedes einzelnen Schülers und fördert einen effektiveren Lernprozess Unterhaltung. Unsere virtuellen Assistenten wie Siri, Cortana, Alexa und Google werden alle von KI unterstützt Mit ihren Spracherkennungsfunktionen sind sie so, als hätten Sie eine persönliche Sekretärin, die Ihnen zur Verfügung steht , und sorgen für Cybersicherheit Im digitalen Bereich ist KI unser Wachmann Mit ihren Algorithmen für maschinelles Lernen und der umfangreichen Datenanalyse erkennt sie Anomalien und reagiert auf Bedrohungen, wodurch unsere Cybersicherheitsmaßnahmen gestärkt Sie sehen, KI hat sich in alle Facetten unseres Lebens integriert, unsere Fähigkeiten erweitert und sowohl unsere Geschäfts- als auch unsere Geschäftslandschaft neu gestaltet Die Möglichkeiten sind immens und sie erweitern sich mit jedem Tag weiter Lassen Sie uns nun über die Zukunft der KI sprechen. Wenn wir über die Zukunft der KI nachdenken, ist das wirklich ziemlich faszinierend. Wir stehen kurz vor einer Zeit, in der selbstfahrende Autos die Norm sein könnten Stellen Sie sich vor, Roboter hätten zu Hause, die uns bei Aufgaben helfen , von der Kaffeezubereitung bis hin zu komplizierteren Dingen Wir beobachten auch den Aufstieg intelligenter Städte, in denen KI alles steuert, von unseren Telefonen bis hin zu Haushaltsgeräten. Außerdem übernehmen Roboter zunehmend Aufgaben mit hohem Risiko, wie zum Beispiel Bombendiffusionen Da sich die KI weiterentwickelt, wird sie wahrscheinlich noch größere Auswirkungen auf unsere Welt haben Auf der Grundlage all dessen einige mögliche Anwendungen der KI in der Zukunft den automatisierten Verkehr umfassen. Stellen Sie sich eine Welt vor, in der KI das ganze Fahren für uns erledigt. Wir nähern uns einer Realität , in selbstfahrende Autos eine Standardmethode sind, sich fortzubewegen. Es geht aber nicht nur um Autos. Wir sprechen von automatisierten Drohnen, Auslieferung unserer Pakete, von KI-gesteuerten Zügen, präzisen und termingerechten Transport sicherstellen, und sogar von autonomen Booten und Flugzeugen. All dies zielt darauf ab, unsere Reise sicherer und effizienter zu machen , indem menschliche Fehler reduziert werden. Es ist ein massiver Wandel, der unsere Einstellung zum Verkehr neu definieren könnte unsere Einstellung zum Verkehr neu definieren Personalisierte Medizin, KI, kann nützlich sein, um große Mengen medizinischer Daten zu analysieren und Muster und Trends zu identifizieren, die Ärzten helfen können, Krankheiten effektiver zu diagnostizieren und zu behandeln KI kann beispielsweise verwendet werden, um personalisierte Krebsbehandlungen zu entwickeln , die auf die spezifische genetische Ausstattung jedes Patienten zugeschnitten sind . Virtuelle Unterstützung. KI-gestützte virtuelle Unterstützung kann uns bei einer Vielzahl von Aufgaben wie der Terminplanung, Reiseplanung und der Verwaltung unserer Finanzen helfen. Virtuelle Assistenz kann uns auch mit Informationen und Unterhaltung versorgen und sie kann sogar zur Steuerung unserer Smart-Home-Geräte verwendet werden . Apropos Smart Homes selbst: KI kann eingesetzt werden, um unser Zuhause komfortabler, effizienter und sicherer zu gestalten . KI kann beispielsweise verwendet werden, um unsere Thermostate, Lichter und andere Geräte zu steuern , Lichter und andere Geräte Und es kann auch verwendet werden, um unsere Häuser auf Sicherheitsbedrohungen zu überwachen unsere Häuser auf Sicherheitsbedrohungen Und nicht zuletzt künstliche allgemeine Intelligenz oder AGI. AGI ist eine hypothetische Art von KI, die so intelligent wäre wie ein Mensch AGI könnte möglicherweise einige der dringendsten Probleme der Welt wie Klimawandel und Armut lösen der dringendsten Probleme der Welt wie Klimawandel und AGI wirft jedoch auch einige ethische Bedenken auf, wie etwa das Potenzial der KI, sich ihrer selbst bewusst zu werden und ihre eigenen Ziele und Wünsche zu entwickeln. KI ist eine leistungsstarke Technologie mit dem Potenzial, viele Aspekte unseres Lebens zu revolutionieren Es ist wichtig, sich der potenziellen Vorteile und Risiken von KI bewusst der potenziellen Vorteile und Risiken von zu sein und sie verantwortungsbewusst einzusetzen Ich hoffe, Ihnen hat diese kurze Erklärung zur KI gefallen. Im nächsten Video werden wir uns eingehender mit maschinellem Lernen befassen. 3. L1V2 – Maschinelles Lernen: Was ist maschinelles Lernen? In diesem Video werden wir die Grundlagen des maschinellen Lernens behandeln. Insbesondere werden wir mit einer Definition dessen beginnen, was maschinelles Lernen ist. Dann bieten wir einen Vergleich zwischen künstlicher Intelligenz, maschinellem Lernen und tiefem Lernen. Dann besprechen wir, wie maschinelles Lernen funktioniert. Wir sprechen über verschiedene Arten von maschinellem Lernen, überwachtem Lernen, unbeaufsichtigtem Lernen und Reinforcement-Learning und Reinforcement-Learning Wir sprechen über die Voraussetzungen für maschinelles Lernen und geben am Ende einige Anwendungsbeispiele für maschinelles Lernen Was ist also maschinelles Lernen? Maschinelles Lernen befasst sich mit der Entwicklung von Computerprogrammen , die auf Daten zugreifen und diese verwenden können , um automatisch aus Erfahrungen zu lernen und sich zu verbessern. Dadurch kann uns maschinelles Lernen dabei helfen, komplexe Aufgaben zu erledigen, wie zum Beispiel das Drei-D-Drucken ganzer Häuser. Durch den Einsatz von Algorithmen und großen Datensätzen kann maschinelles Lernen Design und Planung automatisieren und so dazu beitragen, bauliche Herausforderungen wie strukturelle Integrität und Materialeffizienz Kann Designs auch an die Umgebungsbedingungen anpassen Umgebungsbedingungen Es kann dazu beitragen, Kosten und Zeit zu reduzieren und gleichzeitig die Präzision zu erhöhen , und hat das Potenzial , die Bauindustrie zu verändern. Denken Sie als weiteres Beispiel unsere persönliche Assistenz wie Siri, Google Assistant oder Amazon Echo Sie alle nutzen die Macht des maschinellen Lernens , um uns bei unseren täglichen Aufgaben zu helfen, wie dem Abspielen unserer Lieblingsmusik, der Bestellung von Essen oder der Sprachsteuerung unserer Haushaltsgeräte oder Beantragung von Rechten bei Uber und vielem mehr Wie bereits erwähnt, ist künstliche Intelligenz eine Technik, die es Maschinen ermöglicht, menschliches Verhalten nachzuahmen Das ist wichtig, denn so können wir herausfinden , ob unsere Berechnungen und unsere Arbeit auf dem richtigen Weg sind, indem sehen, ob sie menschliches Verhalten nachahmen können Wir verwenden diesen Ansatz, um einen Teil der Arbeit zu übernehmen , die Menschen erledigen, mit dem Ziel, die Dinge effizienter , rationeller und KI ist ein weites Feld , das viele verschiedene Technologien abdeckt Einige Beispiele für künstliche Intelligenz sind IBM, Deep Blue Chess, elektronische Spielfiguren und selbstfahrende Autos. Dies sind nur einige Beispiele für viele Arten , wie künstliche Intelligenz heute eingesetzt wird. Maschinelles Lernen ist eine Technik, die mithilfe statistischer Methoden Maschinen in die Lage versetzt, aus ihren Daten aus der Vergangenheit zu lernen. Das bedeutet, dass Maschinen frühere Eingaben und Antworten verwenden können , um bei zukünftigen Versuchen bessere Vermutungen anzustellen zukünftigen Versuchen bessere Vermutungen Google-Suchalgorithmus und E-Mail-Spamfilter sind Beispiele für Anwendungen des maschinellen Lernens Und dann haben wir Deep Learning , ein Teilgebiet des maschinellen Lernens Nutzt Algorithmen, um es Modellen zu ermöglichen , sich selbst zu trainieren und Aufgaben auszuführen AlphaGo und natürliche Spracherkennung sind zwei Beispiele für Deep Learning Deep Learning wird häufig mit neuronalen Netzwerken in Verbindung gebracht , bei denen es sich um eine Art Black-Box-Modell Da es sich um ein Black-Box-Modell handelt, ist es für Menschen schwierig nachzuvollziehen, wie Deep-Learning-Modelle ihre Vorhersagen treffen. Deep-Learning-Modelle können jedoch bei der Ausführung von Aufgaben immer noch sehr effektiv sein. Wir werden später tiefer in die Welt des Deep Learning eintauchen. Lassen Sie uns nun sehen, wie maschinelles Lernen funktioniert. Um zu verstehen, wie maschinelles Lernen funktioniert, schauen wir uns das folgende Diagramm an. Im ersten Schritt trainieren wir zunächst unsere Daten. Anschließend haben wir die trainierten Daten zur Verarbeitung in einen Algorithmus für maschinelles Lernen eingespeist . Die Prozessdaten durchlaufen einen anderen Algorithmus für maschinelles Lernen. Und jetzt ist es an der Zeit , unsere Arbeit zu testen. Wir bringen einige neue Daten und lassen sie mit demselben Algorithmus laufen. Im nächsten Schritt überprüfen wir die Prognosen und Ergebnisse. Wenn wir Reservetrainingsdaten haben, ist es jetzt an der Zeit, sie zu verwenden. Wenn die Vorhersage im nächsten Schritt nicht richtig aussieht, sagen wir, sie bekommt die Daumen runter, ist es an der Zeit, einen Rückweg zu machen und den Algorithmus neu zu trainieren Denken Sie daran, dass es nicht immer darum geht, sofort die richtige Antwort Das Ziel ist es, weiterhin nach einer besseren Antwort zu suchen. Möglicherweise stellen Sie fest, dass das ursprüngliche Ergebnis nicht Ihren Wünschen entspricht. Das ist okay. Das ist Teil des Prozesses. Und es kann von dem Bereich abhängen, in dem Sie arbeiten, ob es sich um Gesundheitswesen, Wirtschaft, Wirtschaft , Aktienmarkt oder etwas anderes handelt. Die Ergebnisse können sehr unterschiedlich sein. Also müssen wir das Modell ausprobieren, und wenn es uns nicht das gewünschte Ergebnis liefert oder wenn wir glauben, dass wir bessere Ergebnisse erzielen können, schulen wir unser Modell neu Und im letzten Schritt verfeinern und schulen wir weiter, verfeinern und schulen wir weiter bis wir die bestmögliche Antwort erhalten So funktioniert maschinelles Lernen. Schauen wir uns nun verschiedene Arten des maschinellen Lernens an. Wir können sehen, dass wir überwachtes, unbeaufsichtigtes und verstärkendes Lernen haben unbeaufsichtigtes und verstärkendes Lernen Wir werden uns mit jedem einzelnen befassen und uns ein gutes Bild davon machen, wann und wo wir sie einsetzen können und worum es bei ihnen geht Beim maschinellen Lernen verwenden wir viele verschiedene Algorithmen, um schwierige Probleme zu lösen. Jeder passt in einen bestimmten Typ. Wir haben also drei Haupttypen von Algorithmen für maschinelles Lernen: überwachtes Lernen, unüberwachtes Lernen und Reinforcement-Learning und Reinforcement-Learning Lassen Sie uns nun näher darauf eingehen, was jede dieser Lernmethoden wirklich bedeutet Überwachtes Lernen verwendet beschriftete Daten, um Modelle für maschinelles Lernen zu trainieren. Gekennzeichnete Daten bedeuten, dass uns die Ergebnisse bereits bekannt sind. Das Modell muss nur die Eingaben den Ausgaben zuordnen. Ein Beispiel für überwachtes Lernen kann darin bestehen, eine Maschine zu trainieren , die Bilder von Tieren identifiziert. Hier sehen wir ein trainiertes Modell, das das Bild einer Katze identifiziert. Unüberwachtes Lernen verwendet unbeschriftete Daten , um Maschinen zu trainieren Unbeschriftete Daten bedeuten, dass es keine feste Ausgangsvariable gibt Das Modell lernt aus den Daten, erkennt Muster und Merkmale in den Daten und gibt die Ausgabe zurück In diesem Beispiel verwendet unser unbeaufsichtigtes Modell die Bilder von Fahrzeugen, um zu klassifizieren, ob es sich um einen Bus oder einen Lkw Das Modell lernt also, indem die Teile eines Fahrzeugs identifiziert, z. B. die Länge und Breite des Fahrzeugs, die vorderen und hinteren Endverkleidungen, das Dach, Motorhauben, die verwendeten Radtypen und viele andere Merkmale Anhand dieser Merkmale klassifiziert das Modell, ob es sich bei dem Fahrzeug um einen Bus oder einen Lkw handelt Und wir haben Reinforcement-Learning. Reinforcement Learning trainiert die Maschine darin, geeignete Maßnahmen zu ergreifen und die Belohnung zu maximieren in einer bestimmten Situation geeignete Maßnahmen zu ergreifen und die Belohnung zu maximieren. Es verwendet einen Agenten und eine Umgebung, um Aktionen und Belohnungen zu erzeugen. Der Agent hat einen Start - und einen Endstatus, aber es kann verschiedene Teile geben, um den Endstatus zu erreichen, wie in einem Labyrinth Bei dieser Lerntechnik gibt es keine vordefinierte Zielvariable Ein Beispiel für Reinforcement-Learning ist das Training einer Maschine, die anhand einer Liste verschiedener Objekte wie Quadrat, Dreieck, Rechteck oder Kreis die Form eines Objekts erkennen kann einer Liste verschiedener Objekte wie Quadrat, Dreieck, . In diesem Beispiel versucht das Modell, die Form des Objekts, bei dem es sich um ein Quadrat handelt, vorherzusagen. Schauen wir uns nun verschiedene Algorithmen für maschinelles Lernen , die unter diese Lerntechniken fallen. Einige der am häufigsten verwendeten Algorithmen für überwachtes Lernen sind polynomielle Regression, Random Forests, lineare Regression, logistische Regression, Chain Nearest Neighbors, Naive Base, Support Und dies sind nur einige Beispiele für Algorithmen, die für überwachtes Lernen verwendet werden. Es gibt so viele andere Algorithmen , die beim maschinellen Lernen verwendet werden. Für unbeaufsichtigtes Lernen sind einige der am häufigsten verwendeten Algorithmen K bedeutet Clustering, Singulärwertzerlegung, Fuzzy-Mittelwerte, partielle Quadrate, a priori, hierarchisches Clustering, Hauptkomponentenanalyse bedeutet Clustering, Singulärwertzerlegung, Fuzzy-Mittelwerte, partielle Quadrate, a priori, hierarchisches Clustering, Hauptkomponentenanalyse und DBS-Scan. In ähnlicher Weise gibt es so viele andere Algorithmen, die für unbeaufsichtigtes Lernen verwendet werden können. Und einige der wichtigen Algorithmen für verstärkendes Lernen sind Q-Learning, SARSA, Monte Carlo und Deep-Q-Netzwerke Wie gesagt, es stehen uns so viele verschiedene Algorithmen zur Verfügung, und die Wahl des richtigen Algorithmus hängt von der Art der Probleme ab, die wir zu lösen versuchen Schauen wir uns nun den Ansatz an dem diese Techniken des maschinellen Lernens funktionieren. Methoden des überwachten Lernens benötigen also externe Überwachung, um Modelle für maschinelles Lernen zu trainieren, und daher kommt der Name überwachtes Lernen. Sie benötigen Anleitung und zusätzliche Informationen , um das Ergebnis zurückzugeben. Es verwendet beschriftete Eingaben und ordnet sie bekannten Ausgaben zu, was bedeutet, dass Sie die Zielvariable bereits kennen. Techniken des unbeaufsichtigten Lernens benötigen keine Aufsicht , um Modelle zu trainieren Sie lernen selbstständig und prognostizieren das Ergebnis. Sie finden Muster und verstehen die Trends in den Daten , um die Ergebnisse zu ermitteln. Daher versucht das Modell, die Daten anhand der Merkmale der Eingabedaten zu kennzeichnen . Und in ähnlicher Weise benötigen Reinforcement-Learning-Methoden keine Aufsicht , um Modelle für maschinelles Lernen zu trainieren. Reinforcement-Learning folgt der Methode Versuch und Irrtum, um die gewünschte Lösung zu erhalten. Nach Erledigung einer Aufgabe erhält der Agent eine Auszeichnung Ein Beispiel könnte sein, einem Hund beizubringen, den Ball zu fangen. Wenn der Hund lernt, einen Ball zu fangen, gibst du ihm eine Belohnung, zum Beispiel ein Leckerli. Konzentrieren wir uns damit auf Anwendungen und Arten von Problemen, die mit diesen drei Arten von Techniken des maschinellen Lernens gelöst werden können . Daher wird überwachtes Lernen im Allgemeinen für Klassifikations - und Regressionsprobleme eingesetzt Sie können beispielsweise das Wetter für einen bestimmten Tag anhand der Werte für Luftfeuchtigkeit, Niederschlag, Windgeschwindigkeit und Luftdruck vorhersagen für einen bestimmten Tag anhand der Werte für Luftfeuchtigkeit, Niederschlag, Windgeschwindigkeit und Luftdruck Wie in einem anderen Beispiel können Sie Algorithmen für überwachtes Lernen verwenden, können Sie Algorithmen für überwachtes Lernen verwenden um Umsätze für verschiedene Produkte für den nächsten Monat oder das nächste Quartal zu prognostizieren für verschiedene Produkte für den nächsten Monat oder . In ähnlicher Weise können Sie es zur Aktienkursanalyse oder zur Feststellung verwenden , ob eine Krebszelle bösartig oder gutartig ist Unüberwachtes Lernen wird bei Clustering- und Assoziationsproblemen eingesetzt Clustering- und Es kann beispielsweise eine Kundensegmentierung durchführen, bei der ähnliche Kunden auf der Grundlage ihres Verhaltens , ihrer Vorlieben, Abneigungen und Interessen segmentiert und in Gruppen gruppiert Abneigungen Ein weiteres Beispiel für die Anwendungen von unbeaufsichtigtem Lernen ist die Analyse der Kundenabwanderung. Dabei wird bewertet und verstanden, warum und wann Kunden aufhören, mit einem warum und wann Kunden aufhören Mit dem Ziel, Strategien zur Verbesserung der Kundenbindung zu entwickeln Strategien zur Verbesserung der Kundenbindung zu Und schließlich haben wir Reinforcement-Learning. Reinforcement-Learning basiert auf Belohnungen. Für jede Aufgabe oder jeden Schritt, der korrekt abgeschlossen wurde, erhält der Mitarbeiter also eine Belohnung. Und wenn die Aufgabe nicht korrekt ausgeführt wird, wird es eine Strafe geben. Schauen wir uns nun einige Beispiele an. Reinforcement-Learning-Algorithmen werden in der Spielebranche häufig zur Entwicklung von Spielen eingesetzt. Es wird auch verwendet, um Roboter für die Ausführung menschlicher Aufgaben zu trainieren. Mehrzweck-KI-Chatbots wie Hat GPT oder Google Bart nutzen Reinforcement-Learning, um aus den Benutzereingaben zu lernen und ihre Ergebnisse auf der Grundlage früherer Konversationen anzupassen Damit sind wir am Ende dieses Abschnitts über überwachtes und unbeaufsichtigtes Lernen im Vergleich zu Reinforcement-Learning unbeaufsichtigtes Lernen im Vergleich zu Reinforcement-Learning angelangt Schauen wir uns nun an, was die Voraussetzungen für maschinelles Lernen sind die Voraussetzungen für maschinelles Lernen Der erste betrifft also die Grundlagen der Informatik und die Programmierung Viele Anwendungen für maschinelles Lernen erfordern heute eine solide Grundlage für grundlegendes Scripting oder Programmieren Es geht nicht nur darum, komplexe Algorithmen zu schreiben, sondern auch darum, die zugrunde liegenden Strukturen zu verstehen und zu manipulieren Ohne ein gutes Verständnis dieser grundlegenden Fähigkeiten wird es schwierig sein, das Beste aus den verfügbaren Tools für maschinelles Lernen Wenn Sie also ernsthaft erwägen, in maschinelles Lernen einzutauchen, ist es ratsam, Ihre Programmierkenntnisse aufzufrischen Statistische Grundkenntnisse. des maschinellen Lernens ist ein grundlegendes Verständnis In der Welt des maschinellen Lernens ist ein grundlegendes Verständnis von Wahrscheinlichkeiten erforderlich Sie werden sich oft Fragen stellen wie Wenn A passiert, wie hoch ist die Wahrscheinlichkeit , dass B eintritt Oder wenn es Wolken über uns gibt, wie hoch ist die Wahrscheinlichkeit, dass es regnet? Diese Art von Fragen, Wahrscheinlichkeiten beruhen, stehen im Mittelpunkt vieler Algorithmen für maschinelles Lernen. Es geht darum, Ergebnisse auf der Grundlage bestimmter Bedingungen vorherzusagen Ergebnisse auf der Grundlage bestimmter Bedingungen Wenn Sie also große Fortschritte beim maschinellen Lernen erzielen möchten , lohnt es sich auf jeden Fall, sich mit den Grundlagen von Statistik und Wahrscheinlichkeit vertraut mit den Grundlagen von Statistik Lineare Algebra und Zwischenrechnung. Lineare Algebra ist von entscheidender Bedeutung, da Sie das Konzept des Zeichnens einer Linie durch Ihre Datenpunkte verstehen und verstehen müssen einer Linie durch Ihre Datenpunkte verstehen und Dies ist die Grundidee hinter linearen Regressionsmodellen, bei denen Sie eine Linie durch Ihre Daten ziehen und diese Linie verwenden , um neue Werte zu berechnen Bei der Zwischenrechnung geht es darum, ein grundlegendes Verständnis von Differentialgleichungen zu haben Sie müssen kein Meister darin sein, da der Computer die meisten schweren Berechnungen abwickelt, aber es ist von Vorteil, die Terminologie zu kennen , wenn sie auftaucht, insbesondere wenn Sie tiefer in die Modellprogrammierung eintauchen tiefer in die Modellprogrammierung Und Daten ausfindig machen und reinigen. Einer der vielleicht wichtigsten Aspekte in diesem Bereich ist die Beherrschung der Kunst, Ihre Daten aufzuräumen Es wird oft gesagt, wenn Sie schlechte Daten eingeben, erhalten Sie schlechte Daten heraus Aber wenn Sie gute Daten haben, ist es wahrscheinlicher, dass gute Daten herauskommen. Die Qualität Ihrer Daten kann das Ergebnis Ihrer Modelle für maschinelles Lernen stark beeinflussen. Daher ist es wichtig zu verstehen, wie effektiv bereinigen und organisieren Sie Ihre Daten um die Genauigkeit und Zuverlässigkeit Ihrer Ergebnisse sicherzustellen. Schauen wir uns nun einige Anwendungsbeispiele für maschinelles Lernen an. Wir haben Objekterkennung und Instanzsegmentierung. Objekterkennung und Instanzsegmentierung sind zwei verschiedene, aber verwandte Aufgaben beim maschinellen Lernen Objekterkennung geht es darum, Objekte in einem Bild zu erkennen und zu finden Objekte in einem Bild , wie zum Beispiel verschiedene Katzen voneinander Andererseits ist die Instanzsegmentierung der nächste Schritt, der diese identifizierten Objekte vom Rest des Bildes trennt diese identifizierten Objekte vom Rest des Bildes Diese Techniken werden auf verschiedene Weise eingesetzt, unter anderem zur Identifizierung verschiedener Elemente in einem Bild Darüber hinaus können durch die Segmentierung bestimmte Komponenten weiter isoliert oder herausgeschnitten Eine beliebte Anwendung zur Objekterkennung und Segmentierung ist die Schnellschnappschussfunktion von Google Pixel-Telefonen Diese Funktion verwendet maschinelles Lernen, um Objekte in der aktuellen Ansicht eines Benutzers zu identifizieren und diese Objekte dann mit animierten Aufklebern oder Filtern zu überlagern diese Objekte dann mit animierten Aufklebern oder Filtern zu überlagern Dies kann eine unterhaltsame und kreative Möglichkeit sein, Fotos eine persönliche Note zu verleihen Wir haben auch eine Nummernschilderkennung. Das ist ein ziemlich cooler Einsatz von maschinellem Lernen. Stellen Sie sich vor, ein Auto fährt in Sichtweite und das System kann das Nummernschild an diesem Auto erkennen und identifizieren. Diese Anwendung des maschinellen Lernens kann in verschiedenen Situationen besonders nützlich sein , z. B. bei Sicherheitskontrollen, Parkplätzen, Verkehrskontrollen oder sogar bei der Erhebung von Mautgebühren, ohne dass das Auto mitten auf einer Autobahn anhalten Es zeigt, wie maschinelles Lernen spezifische Informationen aus einem größeren Kontext mit Genauigkeit extrahieren kann spezifische Informationen aus einem größeren Kontext Und wir haben auch automatische Übersetzungen. automatische Übersetzung, die auf maschinellem Lernen basiert, hat beim Abbau von Sprachbarrieren eine entscheidende Rolle gespielt ist die treibende Kraft hinter der Sofortübersetzung, die Sie auf ausländischen Websites sehen, und macht den Inhalt mit nur einem Klick in Ihrer bevorzugten Sprache zugänglich mit nur einem Klick in Ihrer bevorzugten Sprache Es ist auch die Technologie , die es Tools wie Google Lens ermöglicht Echtzeit zu übersetzen Schilder in Echtzeit zu übersetzen, wenn Sie Ihre Kamera darauf richten. Egal, ob es darum geht, im Internet zu surfen oder in einer fremden Stadt zu navigieren, maschinelles Lernen hat unsere Fähigkeit, die Welt zu verstehen und mit ihr zu interagieren, revolutioniert unsere Fähigkeit, die Welt zu verstehen und mit ihr zu interagieren automatische Übersetzung ist wirklich ein beeindruckender Beweis dafür, wie maschinelles Lernen die Welt näher zusammenbringen kann Danke, dass Sie sich dieses Video angesehen haben. Die Welt der Anwendungen für maschinelles Lernen ist riesig und entwickelt sich ständig weiter. Es ist einer der am schnellsten wachsenden Technologiesektoren, und die Möglichkeiten sind endlos. Was ich Ihnen hier gezeigt habe sind nur einige der Höhepunkte, eine kleine Auswahl dessen, was möglich ist. Aber es wird noch so viel mehr kommen. Im nächsten Video werden wir die Jahre hinter uns lassen und uns mit Deep Learning befassen, einem weichen Bereich des maschinellen Lernens, der viele der Fortschritte beim maschinellen Lernen ermöglicht hat der Fortschritte beim maschinellen Lernen . Wir sehen uns im nächsten Video. 4. L1V3 – Deep Learning: In diesem Video werden wir über Deep Learning und neuronale Netzwerke sprechen über Deep Learning und neuronale Haben Sie sich jemals gefragt, wie Google eine ganze Webseite im Handumdrehen von fast jeder Sprache in eine andere übersetzen kann eine ganze Webseite im Handumdrehen oder wie Google Photos Ihre Bilder auf magische Weise nach den Gesichtern von Menschen und Haustieren sortiert den Gesichtern , die es erkennt? Oder wie wäre es, wenn Google Lens Sie über die Details einer Pflanze, eines Objekts oder eines Tieres informiert, wenn Sie es mit Ihrem Telefon scannen Das ist Deep Learning, das genau dort seine Magie entfaltet. Lassen Sie uns in diesem Video versuchen, die Frage zu beantworten, was Deep Learning ist und wie es all diese unglaublichen Dinge ermöglicht. In diesem Video werden wir die folgenden Themen besprechen. Wir beginnen mit einem Verständnis von Deep Learning und gehen dann zu künstlichen neuronalen Netzwerken über, denen es sich um eine Art Algorithmus für maschinelles Lernen handelt , der beim Deep Learning verwendet wird. Anschließend werden wir einige der praktischen Einsatzmöglichkeiten von Deep Learning untersuchen und einige der beliebtesten Deep-Learning-Plattformen vorstellen . Und schließlich werden wir einige der Einschränkungen von Deep Learning erörtern und erläutern, wie Quantencomputer diese Einschränkungen bewältigen können. Es wird eine spannende Sitzung zum Thema Deep Learning werden. Wie bereits erwähnt, ist Deep Learning eine Untergruppe des maschinellen Lernens, und beide sind Teil des größeren Konzepts, das als künstliche Intelligenz bezeichnet wird Stellen Sie sich künstliche Intelligenz als den gesamten Bereich vor, in dem Maschinen dazu gebracht werden, sich wie Menschen zu verhalten Maschinelles Lernen ist ein Teil dieses Bereichs, und es geht darum, Maschinen die Fähigkeit zu geben , auf der Grundlage von Daten zu lernen und Entscheidungen zu treffen, so wie wir aus Erfahrungen lernen. Heute ist Deep Learning ein spezifischerer Teil des maschinellen Lernens. Es ist, als würde man einer Maschine beibringen ein bisschen wie ein menschliches Gehirn zu denken mit einer Struktur, die als künstliches neuronales Netzwerk bezeichnet wird. Künstliche neuronale Netze oder ANNs sind eine spezielle Art von Algorithmus für maschinelles Lernen, die versuchen, die neuronalen Netzwerke im menschlichen Gehirn lose nachzuahmen Wenn wir Deep Learning sagen, sprechen wir normalerweise davon, wirklich große neuronale Netzwerke zu verwenden , um ein Modell mit einer Vielzahl von Daten zu trainieren. Es unterscheidet sich nicht von maschinellem Lernen, nur ein schickerer Begriff, den wir verwenden wenn die Dinge ziemlich umfangreich werden Was sind also künstliche neuronale Netze? Schauen wir uns den Aufbau eines neuronalen Netzes genauer an . Jede Schicht besteht aus Knoten oder sogenannten Neuronen. Die Neuronen in einer Schicht verbinden sich über Kanäle mit Neuronen in der nächsten Schicht. Jedem Kanal wird eine Gewichtung zugewiesen, die beim Lernen des Netzwerks eine wichtige Rolle spielt. Jedem Neuron sind ein Bias und eine Aktivierungsfunktion zugeordnet und eine Aktivierungsfunktion Die Aktivierungsfunktion wird verwendet, um die gewichtete Summe der Eingaben und des Bias in eine Ausgabe umzuwandeln Eingaben und des Bias in , die an die nächste Schicht gesendet wird Wie bereits erwähnt, bilden ANNs das Herzstück von Deep Learning. Diese Algorithmen sind so konzipiert , dass sie die Funktionsweise des menschlichen Gehirns widerspiegeln Sie nehmen Daten auf, lernen, Muster in den Daten zu erkennen, und treffen dann fundierte Vorhersagen für einen neuen Datensatz. Lassen Sie uns den Prozess untersuchen, indem wir ein neuronales Netzwerk aufbauen , das in der Lage ist zwischen einem Würfel und einer Pyramide zu unterscheiden Betrachten Sie als Beispiel ein Bild eines Würfels. Dieses Bild besteht aus 28 mal 28 Pixeln, was insgesamt 784 Pixeln Jedes Pixel wird dann als Eingabe für einzelne Neuronen innerhalb der ersten Schicht bereitgestellt als Eingabe für einzelne Neuronen innerhalb der ersten Schicht Neuronen in einer Schicht sind über Kanäle mit Neuronen in nachfolgenden Schichten verbunden . Die Eingaben werden mit ihren entsprechenden Gewichten multipliziert, und dann wird der Bias hinzugefügt Dieser kombinierte Wert wird dann anhand einer Schwellenwertfunktion, der sogenannten Aktivierungsfunktion Das Ergebnis wird als Eingabe an das Neuron innerhalb der verborgenen Schicht übertragen als Eingabe an das Neuron innerhalb der verborgenen Dann bestimmt die Ausgabe der Aktivierungsfunktion ob ein Neuron aktiviert wird oder Aktivierte Neuronen übertragen Daten über den Kanal an die Neuronen in der nächsten Schicht Dieser iterative Prozess, bekannt als Forward Propagation, ermöglicht die Ausbreitung der Daten durch das Netzwerk Innerhalb der Ausgabeschicht das Neuron mit dem höchsten Wert wird das Neuron mit dem höchsten Wert aktiviert und bestimmt die Bei diesen Werten handelt es sich im Wesentlichen um Wahrscheinlichkeiten. In diesem speziellen Szenario das der Pyramide zugeordnete Neuron hat das der Pyramide zugeordnete Neuron die höchste Wahrscheinlichkeit, was darauf hindeutet, dass das neuronale Netzwerk die Ausgabe als Pyramide vorhersagt Nun, offensichtlich hat unser neuronales Netzwerk eine falsche Vorhersage getroffen Es ist wichtig zu beachten , dass unser Netzwerk zu diesem Zeitpunkt noch nicht geschult wurde. Schauen wir uns also die Schritte zum Training eines neuronalen Netzwerks an . Während des Trainingsprozesses empfängt das Netzwerk sowohl die Eingabe auch die erwartete Ausgabe. Durch den Vergleich der vorhergesagten Ausgabe mit der tatsächlichen Ausgabe identifiziert das Netzwerk den Fehler in seiner Vorhersage. Die Größe des Fehlers gibt an, wie falsch wir liegen, und das Vorzeichen gibt an, ob unsere vorhergesagten Werte höher oder niedriger als erwartet sind. Diese Informationen werden dann rückwärts über das Netzwerk verbreitet, eine Technik, die als Backpropagation bezeichnet wird Bei der Backpropagation passt das Netzwerk seine internen Parameter wie Gewichte und Verzerrungen an, um den Fehler zu minimieren und seine Prognosen für die Zukunft zu verbessern Der iterative Zyklus von Vorwärtsausbreitung und Rückwärtsausbreitung wird während des Trainingsprozesses mit mehreren Eingaben wiederholt während des Trainingsprozesses mit mehreren Eingaben Dieser Zyklus wird fortgesetzt, bis die Gewichte innerhalb des Netzwerks so angepasst sind , dass das Netzwerk die Formen in den meisten Fällen genau vorhersagen Damit ist unser Trainingsprozess abgeschlossen , bei dem das Netzwerk gelernt hat korrekte Vorhersagen zu treffen. Obwohl das Training neuronaler Netze ein zeitaufwändiger Prozess sein kann, manchmal Stunden oder sogar Monate dauert, der manchmal Stunden oder sogar Monate dauert, ist der Zeitaufwand angesichts der immensen Möglichkeiten, die sie bieten, gerechtfertigt. Die Komplexität des Trainings beinhaltet die Feinabstimmung zahlreicher Parameter und die Optimierung der Netzwerkleistung, was erhebliche Rechenressourcen und Geduld erfordert Rechenressourcen und Die Vorteile eines gut trainierten neuronalen Netzwerks, wie z. B. verbesserte Genauigkeit, fortschrittliche Mustererkennung und ausgeklügelte Entscheidungsfindung, überwiegen jedoch eines gut trainierten neuronalen Netzwerks, wie z. B. verbesserte Genauigkeit, wie z. B. verbesserte Genauigkeit fortschrittliche Mustererkennung und ausgeklügelte Entscheidungsfindung, überwiegen das Training aufgewendete Zeit Angesichts des bemerkenswerten Potenzials und der Fähigkeiten, die neuronale Netze bieten, ist dies ein vernünftiger Kompromiss bemerkenswerten Potenzials und der Fähigkeiten, die neuronale Netze Schauen wir uns nun einige der Anwendungen von Deep Learning an. Wie bereits erwähnt, ist es die Leistungsfähigkeit neuronaler Netze, die Deep Learning ermöglicht. Lassen Sie uns einige der wichtigsten Anwendungen untersuchen , in denen neuronale Netzwerke glänzen. Ein bemerkenswertes Beispiel ist Gesichtserkennungstechnologie auf Smartphones , bei der neuronale Netzwerke verwendet werden, um das Alter einer Person anhand ihrer Gesichtszüge abzuschätzen das Alter einer Person anhand ihrer Gesichtszüge Durch die Unterscheidung des Gesichts vom Hintergrund und die Analyse von Linien und Flecken korrelieren diese Netzwerke die visuellen Hinweise, um das ungefähre Alter der Person zu ermitteln Neuronale Netzwerke spielen auch bei Prognosen eine entscheidende Rolle, sie genaue Vorhersagen in verschiedenen Bereichen wie Wettervorhersagen oder Aktienkursanalysen ermöglichen verschiedenen Bereichen wie Wettervorhersagen Diese Netzwerke sind sehr gut darin, Muster zu erkennen, sodass sie Signale identifizieren können, die auf die Wahrscheinlichkeit von Regenfällen oder Schwankungen der Aktienkurse hinweisen die Wahrscheinlichkeit von Regenfällen oder Schwankungen der Aktienkurse Neuronale Netzwerke können sogar Originalmusik komponieren. Sie können komplizierte Muster in der Musik erlernen und ihr Verständnis verfeinern, um originale Melodien zu komponieren und so ihr kreatives Potenzial unter Beweis zu Und ein weiterer Bereich, in dem NRA Networks Excel betreibt, ist der Kundensupport Viele Personen führen Gespräche mit Kundendienstmitarbeitern , ohne zu merken , dass sie tatsächlich mit einem Bot interagieren Diese ausgeklügelten Netzwerke simulieren einen realistischen Dialog und bieten Unterstützung, wodurch das Kundenservice-Erlebnis verbessert wird. Auch im Bereich der medizinischen Versorgung haben neuronale Netzwerke erhebliche Fortschritte gemacht Sie sind in der Lage, Krebszellen zu erkennen und MRT-Bilder zu analysieren liefern detaillierte und genaue Ergebnisse , die bei Diagnose - und Behandlungsentscheidungen helfen Und natürlich haben wir auch selbstfahrende Autos. Einst nur eine Möglichkeit in der Science-Fiction, werden sie heute greifbare Realität. Diese autonomen Fahrzeuge sind auf neuronale Netze angewiesen , um die Umgebung wahrzunehmen und zu interpretieren, sodass sie sich im Straßenverkehr zurechtfinden, Entscheidungen treffen und die Sicherheit der Passagiere gewährleisten können. Lassen Sie uns nun einen Blick auf einige beliebte Deep-Learning-Frameworks werfen. Einige dieser Frameworks sind also Tensor Flow, Pytorch, Cross, Deep Learning Four J, Cafe und Microsoft Cognitive Diese Frameworks haben breite Anerkennung gefunden und spielen eine wichtige Rolle bei der Weiterentwicklung des Bereichs Deep Learning Lassen Sie uns nun einige der Einschränkungen von Deep Learning erörtern . Deep Learning ist zwar vielversprechend, aber es ist wichtig, auch seine Grenzen anzuerkennen. Erstens ist Deep Learning zwar sehr effektiv im Umgang mit unstrukturierten Daten, benötigt aber eine beträchtliche Menge an Daten für Trainingszwecke Das zweite Problem besteht darin, dass selbst unter der Annahme, dass wir Zugriff auf die erforderlichen Daten haben, deren Verarbeitung aufgrund der Rechenleistung schwierig sein kann aufgrund der Rechenleistung schwierig Training neuronaler Netze erfordert den Einsatz grafischer Verarbeitungseinheiten oder GPUs, die im Vergleich zu Zentraleinheiten oder CPUs Tausende von Kernen haben im Vergleich zu Zentraleinheiten oder CPUs Tausende von Kernen Und gleichzeitig sind GPUs viel teurer als Und schließlich ist das Training zeitaufwändig. tiefer neuronaler Netze kann Training tiefer neuronaler Netze kann Stunden oder sogar Monate dauern , wobei die Dauer mit zunehmendem Datenvolumen und der Anzahl der Netzwerkschichten zunimmt. Es ist jedoch erwähnenswert, dass Quantencomputer, die von Unternehmen wie Google und IBM entwickelt wurden Unternehmen wie Google und IBM eine mögliche Lösung zur Überwindung dieser Einschränkungen bieten. Quantencomputer sind in der Lage, komplexe Berechnungen exponentiell schneller durchzuführen komplexe Berechnungen als klassische Mit ihrer einzigartigen Architektur und Quantenverarbeitungseinheiten oder QPs haben sie das Potenzial, den Trainingsprozess neuronaler Netze erheblich zu beschleunigen Darüber hinaus können Quantencomputer größere Datensätze effektiver verarbeiten Reduzierung der Datenanforderungen und Minderung der Herausforderungen, die mit der Verarbeitung solch großer Informationsmengen verbunden Verarbeitung solch großer Informationsmengen Quantencomputer befinden sich zwar noch in einem frühen Stadium, laufende Forschung und Entwicklung verspricht, die Einschränkungen zu überwinden, mit denen traditionelle Deep-Learning-Ansätze konfrontiert traditionelle Deep-Learning-Ansätze Vielen Dank, dass Sie mit mir die Welt des Deep Learning erforscht mit mir die Welt des Deep Learning Es ist wichtig anzuerkennen, dass wir uns noch in einem frühen Stadium der Erforschung dessen befinden , was Deep Learning und neuronale Netzwerke für uns tun können. Große Namen wie Google, IBM und Nvidia haben diesen Wachstumskurs jedoch erkannt und in die Entwicklung von Bibliotheken, Vorhersagemodellen und leistungsstarken GPUs investiert , um die Implementierung neuronaler Netzwerke zu unterstützen Wir sind fast am Ende dieses Abschnitts über traditionelle künstliche Intelligenz angelangt Es ist wichtig anzumerken, dass wir nur an der Oberfläche gekratzt haben , wenn es um das Potenzial von Deep Learning und KI geht das Potenzial von Deep Learning und KI Spannende Möglichkeiten liegen vor uns. Während wir die Grenzen des Machbaren immer weiter verschieben, die Grenze zwischen Science-Fiction und verschwimmt die Grenze zwischen Science-Fiction und Realität zunehmend Die Zukunft hält eine Fülle von Überraschungen bereit, und Deep Learning steht bei diesen bahnbrechenden Fortschritten an vorderster Front Im nächsten Video, dem letzten Video dieses Abschnitts, werden wir den Unterschied zwischen diskriminativen und generativen Modellen des maschinellen Lernens kennenlernen , was uns auf den nächsten Abschnitt dieses Kurses über generative künstliche Intelligenz vorbereiten wird auf den nächsten Abschnitt dieses Kurses über generative Wir sehen uns im nächsten. 5. L1V4 – Diskriminativ vs. Generativ: In diesem Video werden wir über diskriminative und generative Algorithmen sprechen diskriminative Dies sind zwei wichtige Arten von Modellen für maschinelles Lernen. Um es Ihnen leicht verständlich zu machen, beginnen wir mit der Geschichte und erläutern dann anhand gängiger Algorithmen als Beispiele, wie diese beiden Arten des maschinellen Lernens im Detail funktionieren maschinellen Lernens im Detail funktionieren. Lassen Sie uns also gleich loslegen. Ordnung. Lass uns in unsere Geschichte eintauchen. Stellen wir uns vor, wir haben zwei außerirdische Besucher , die noch nie Äpfel und Bananen gesehen haben. Wir wollen beobachten, wie sie lernen, zwischen diesen beiden Früchten zu unterscheiden. Der erste Außerirdische beschließt, diese Früchte zu verstehen, indem er sie zeichnet. Es beobachtet sorgfältig die Form, Farbe und Textur jeder Frucht und stellt sie dann auf Papier Auf diese Weise entsteht eine visuelle Darstellung oder ein Modell davon, wie jede Frucht aussieht Immer wenn es eine neue Frucht sieht, bezieht es sich auf diese Zeichnungen, um diese Frucht zu identifizieren. Dies ähnelt dem, was wir beim maschinellen Lernen einen generativen Algorithmus nennen . Das zweite Alien geht dagegen anders vor. Anstatt zu zeichnen, beginnt es, die Eigenschaften der Früchte zu vergleichen. Es stellt fest, dass Äpfel normalerweise rund und rot sind, während Bananen lang und gelb sind. Wenn sie eine neue Frucht bekommt, sucht sie nicht nach einer perfekten Frucht. Stattdessen prüft es, welche Fruchtmerkmale der neuen Frucht näher kommen der neuen Frucht näher und vermutet, dass es sich um dieselbe handelt. Dieser Ansatz ähnelt eher dem, was wir beim maschinellen Lernen einen diskriminativen Algorithmus nennen Das ist also die Grundidee. Diese beiden unterschiedlichen Ansätze werden uns helfen diskriminative und generative Algorithmen zu verstehen Lassen Sie uns weitermachen und unsere beiden Arten von Algorithmen formal definieren , die auf unserem Aliens-Ansatz basieren Die erste Aliens-Methode ist ein Paradebeispiel für das, was wir generative Klassifikation nennen Hier lernt ein Modell, für jede Klasse eine Repräsentation zu generieren Es ist, als würde man lernen, wie ein Apfel oder eine Banane aussieht, und dieses Wissen nutzen, um die zukünftige Instanz zu identifizieren. Im Gegensatz dazu steht die zweite Aliens-Methode für eine diskriminierende Klassifizierung Dieses Modell lernt, Klassen anhand ihrer Merkmale zu unterscheiden Klassen anhand ihrer Merkmale zu unterscheiden Anstatt zu lernen, wie ein Apfel oder eine Banane aussieht, lernt es die Unterschiede zwischen ihnen kennen. Anhand dieser Unterschiede entscheidet es dann , was eine neue Frucht sein könnte. Jeder Ansatz hat seine eigenen Stärken und Schwächen, und sie werden in verschiedenen Szenarien verwendet. Nachdem wir die Konzepte vorgestellt haben, wollen wir sie nun genauer untersuchen. Um diese Konzepte besser zu verstehen, werden wir uns mit spezifischen Algorithmen befassen , die diese beiden Arten von Klassifizierungen verwenden Für die diskriminative Klassifikation betrachten wir als Beispiel die logistische Regression Und für die generative Klassifikation wird unser Beispiel der naive Basisalgorithmus sein Im Bereich der diskriminativen Klassifikation schafft die logistische Regression also eine Entscheidungsgrenze, schafft die logistische Regression also eine Entscheidungsgrenze die auf den Merkmalen der Eingabe basiert unserem Beispiel für Obst könnten diese Merkmale Farbe, Länge oder Gewicht sein Der Algorithmus lernt anhand dieser Merkmale Muster und verwendet sie dann, um neue Früchte zu klassifizieren Umgekehrt versucht der naive Basisalgorithmus, bei dem es sich um ein generatives Klassifikationsmodell handelt, bei dem es sich um ein generatives Klassifikationsmodell handelt, die Verteilung der einzelnen Klassen im Merkmalsraum zu verstehen der einzelnen Klassen im Anstatt nur die Unterschiede zwischen den Klassen zu identifizieren , lernt er, wie sich die einzelnen Klassen in den Daten verteilen Lassen Sie uns nun tiefer gehen und verstehen, wie diese Algorithmen die Strategien zur Klassifizierung neuer Daten nutzen Beim logistischen Regressionsmodell haben wir es mit Merkmalen wie Farbe, Länge und Gewicht der Früchte zu tun , Länge und Gewicht der Das Modell verwendet diese Merkmale , um Muster zu lernen und Entscheidungen zu treffen Es könnte zum Beispiel lernen, dass, wenn eine Frucht eine gelbe Farbe hat und länger als 5 Zoll ist, Wahrscheinlichkeit hoch ist, dass es sich um eine Banane handelt. Diese Methode, anhand von Merkmalen von Beispielen eine Entscheidungsgrenze festzulegen, ist der Kern des diskriminativen Lernens Auf der anderen Seite versucht generatives Lernen, das vom naiven Basismodell verwendet wird, die Verteilung jeder Klasse in einer multidimensionalen Ebene zu verstehen die Verteilung jeder Klasse in einer multidimensionalen Ebene wie ein dreidimensionaler Raum für unsere drei für unsere drei Das Modell versucht anhand ihrer Farbe, Form und ihres Gewichts zu visualisieren , wo Äpfel und Bananen in diesem Raum wahrscheinlich vorkommen , wo Äpfel und Lassen Sie uns nun über einige wichtige Fragen zu generativen und diskriminativen Modellen nachdenken einige wichtige Fragen generativen und diskriminativen Modellen Fragen wie welches Modell mehr Daten für das Training benötigt? Welches ist von fehlenden Daten betroffen? Welches Modell wird von Ausreißern beeinflusst, welches erfordert mehr Mathematik und welches Modell neigt dazu, zu stark zu passen Es ist wichtig, über diese Fragen nachzudenken , da sie sich darauf auswirken, wie Sie diese Modelle verwenden könnten Ein generatives Modell benötigt beispielsweise nicht viele Daten, da es lediglich versucht, die grundlegenden Eigenschaften jeder Klasse zu verstehen. Ein diskriminatives Modell benötigt jedoch mehr Daten, da es versucht, die komplizierten Unterschiede zwischen den Klassen zu die komplizierten Unterschiede zwischen den über diese Fragen nachdenken, können Sie diese Modelle besser verstehen und effektiver einsetzen Machen Sie sich jedoch keine Sorgen, wenn Sie sich bei den Antworten nicht sicher sind. Wir werden sie ausführlich besprechen. Schauen wir uns also die erste Frage an. Welches Modell benötigt mehr Daten für das Training? Diskriminative Modelle wie die logistische Regression benötigen im Allgemeinen mehr Daten Sie lernen, indem sie Unterschiede zwischen den Klassen erkennen. Sie benötigen also eine reiche und vielfältige Reihe von Beispielen, um dies effektiv zu tun. Die zweite Frage ist, welche ist von fehlenden Daten betroffen? Tatsache ist, dass beide Arten von Modellen durch fehlende Daten beeinträchtigt werden können. Generative Modelle sind jedoch möglicherweise sensibler , da sie versuchen, die Gesamtverteilung der Daten zu erfassen . Jede fehlende Information könnte ihr Verständnis dieser Verteilung verzerren Die nächste Frage ist, welches Modell von Ausreißern betroffen ist? Auch hier können Ausreißer beide Modelle betreffen, diskriminierende Modelle sind jedoch möglicherweise anfälliger. Diese Modelle konzentrieren sich auf Grenzen zwischen Klassen, und ein Ausreißer könnte diese erheblich verschieben Die nächste Frage ist, was mehr Mathematik erfordert? Was die Mathematik angeht, erfordern generative Modelle wie Naive Base oft mehr Berechnungen, da sie die Schätzung der Datenverteilung beinhalten, was rechenintensiv sein kann Und die letzte Frage ist, welches Modell neigt dazu, übermäßig gut zu passen? Eine Überanpassung kann in beiden Modellen vorkommen, diskriminierende Modelle sind jedoch im Allgemeinen anfälliger dafür Das liegt daran, dass sie sich zu sehr auf die Trainingsdaten einstellen selbst deren Störungen und Fehler lernen Und da wir nun den Unterschied zwischen diskriminativen und generativen Algorithmen für maschinelles Lernen kennen diskriminativen und generativen , wollen wir einige gängige Beispiele für jeden Typ aufschlüsseln Bei einigen der diskriminativen Algorithmen handelt es sich also um logistische Regression, unterstützende Vektormaschinen, Entscheidungsbäume, Random Forests und Bei einigen der generativen Algorithmen handelt es sich naive Basisalgorithmen, Gaußsche Mischungsmodelle, Hidden-Markov-Modelle, latente um naive Basisalgorithmen, Gaußsche Mischungsmodelle, Hidden-Markov-Modelle, latente direkte Allokation und generative gegnerische Netzwerke. Um das Ganze zusammenzufassen, haben wir in diesem Video anhand einer einfachen und fesselnden Geschichte das Wort diskriminativer und generativer Modelle aufgegriffen diskriminativer . Wir haben gesehen, wie die logistische Regression in einem diskriminativen Modell unterschiedliche Merkmale verwendet , um Entscheidungsgrenzen zu schaffen, während die naive Basis des generativen Modells versucht, die Gesamtverteilung der Daten zu verstehen den Unterschied zwischen diskriminativen und generativen Modellen verstehen , erhalten wir wertvolle Einblicke in die Funktionsweise Generative Modelle, wie sie in der generativen KI verwendet werden, lernen die zugrunde liegende Verteilung der Trainingsdaten Dieses Wissen wird dann verwendet, um neue Daten zu generieren , die die Trainingsdaten widerspiegeln. Aus diesem Grund ist generative KI so mächtig. Sie kann neue realistische Ergebnisse wie Bilder, Text und sogar Musik generieren , weil sie die Welt ihrer Trainingsdaten versteht. Im Gegensatz dazu lernen diskriminative Modelle einfach die Grenzen zwischen Klassen und werden hauptsächlich für Klassifikationsaufgaben verwendet Sie können keine neuen Daten generieren, weil sie nicht versuchen, die zugrunde liegende Verteilung der Daten, die Unterschiede zwischen den Klassen, zu verstehen die zugrunde liegende Verteilung der Daten, die Unterschiede zwischen den Klassen, Unterschiede zwischen den Klassen diese Unterschiede verstehen, können Sie die Leistungsfähigkeit und Flexibilität generativer KI-Systeme besser einschätzen . Dieses Verständnis könnte Ihnen bei der Entscheidung helfen, welche Art von KI-System für Ihr spezielles Projekt oder Ihren Anwendungsfall am besten geeignet Ihr spezielles Projekt oder Ihren Anwendungsfall Damit sind wir am Ende des ersten Abschnitts dieses Kurses, der traditionellen künstlichen Intelligenz, angelangt dieses Kurses, der traditionellen künstlichen Intelligenz, Wir sehen uns in Abschnitt zwei, wo wir über generative künstliche Intelligenz sprechen. 6. L2V1 – Transformatoren: Lassen Sie uns nun über Transformatoren und ihre führende Rolle bei der Förderung generativer künstlicher Intelligenz sprechen ihre führende Rolle bei Förderung generativer künstlicher Intelligenz Transformatoren sind eine Art neuronales Netzwerk, das Lage ist, Abhängigkeiten mit großer Reichweite in Sequenzen zu lernen Dadurch eignen sie sich gut für Aufgaben wie die Textgenerierung, bei der das Modell den Kontext der vorherigen Wörter verstehen muss , um das nächste Wort zu generieren. Transformers sorgten 2018 für eine Revolution in der Verarbeitung natürlicher Sprache. Lassen Sie uns nun sehen, wie Transformatoren funktionieren. Transformatoren bestehen aus zwei Hauptteilen, einem Encoder und einem Decoder Encoder sind dafür verantwortlich, eine Eingangssequenz zu nehmen und sie in eine Folge von versteckten Zuständen umzuwandeln Der Encoder besteht aus einem Stapel von Selbstaufmerksamkeitsschichten Selbstaufmerksamkeit ist ein Mechanismus , der es dem Encoder ermöglicht, der Erzeugung der verborgenen Zustände verschiedene Teile der Eingabesequenz zu bei der Erzeugung der verborgenen Zustände verschiedene Teile der Eingabesequenz zu berücksichtigen Auf diese Weise kann der Encoder weitreichende Abhängigkeiten in der Eingabesequenz lernen , was für Aufgaben wie die Textgenerierung unerlässlich ist Decoder sind dafür verantwortlich eine Abfolge von versteckten Zuständen und eine Ausgabesequenz zu erzeugen Der Decoder besteht ebenfalls aus einem Stapel von Selbstaufmerksamkeitsschichten Der Decoder verfügt jedoch auch über eine spezielle Aufmerksamkeitsschicht, die es ihm ermöglicht, bei der Generierung der Ausgabesequenz die Eingangssequenz zu berücksichtigen Auf diese Weise kann der Decoder lernen, wie eine Ausgabe generiert wird, die mit der Eingabesequenz konsistent ist mit der Eingabesequenz konsistent Der Encoder und der Decoder arbeiten also zusammen, um eine Ausgabesequenz zu erzeugen Der Encoder wandelt zunächst die Eingabesequenz in eine Folge von versteckten Zuständen Der Decoder nimmt dann diese versteckten Zustände und generiert eine Ausgabesequenz Die Aufmerksamkeitsschicht des Decoders ermöglicht es ihm, bei der Generierung der Ausgabe die Eingabesequenz zu Auf diese Weise kann der Decoder lernen, wie eine Ausgabe generiert wird, die mit der Eingabesequenz konsistent ist mit der Eingabesequenz konsistent Die Verwendung von Transformatoren für generative KI bietet mehrere Vorteile Verwendung von Transformatoren für generative KI Erstens sind Transformatoren in der Lage, Abhängigkeiten mit großer Reichweite in Sequenzen zu erlernen. Dadurch können sie realistischere und kohärentere Ergebnisse erzeugen . Zweitens können Transformatoren an sehr großen Datensätzen trainiert werden Dadurch können sie komplexere Muster und Beziehungen in den Daten lernen komplexere Muster und Beziehungen in den Daten Und drittens können mehrere parallele Transformatoren zusammenarbeiten. Dadurch können sie schneller und effizienter trainiert werden . Aufgrund dieser Vorteile haben sich Transformatoren zum hochmodernen Ansatz für eine Vielzahl generativer KI-Aufgaben wie Textgenerierung, wie Textgenerierung, Bildgenerierung und Musikgenerierung entwickelt. Bei der Verwendung von Transformatoren ist zu beachten , dass sie Halluzinationen erzeugen können In Transformatoren sind Halluzinationen Wörter oder Phrasen, die durch das Modell erzeugt werden und die oft unsinnig oder grammatikalisch falsch sind . Aber warum passieren Halluzinationen? Halluzinationen können durch eine Reihe von Faktoren verursacht werden, darunter, dass das Modell nicht mit genügend Daten trainiert wurde, das Modell mit verrauschten oder verschmutzten Daten trainiert wurde, dass dem genügend Kontext gegeben wurde oder dass dem Modell nicht genügend Einschränkungen dass das Modell mit verrauschten oder verschmutzten Daten trainiert wurde, dass dem Modell nicht genügend Kontext gegeben wurde oder dass dem Modell nicht genügend Einschränkungen zugewiesen wurden. Halluzinationen können für Transformatoren ein Problem darstellen, da sie dazu führen können , dass der Ausgabetext schwer zu verstehen ist. Sie können auch die Wahrscheinlichkeit erhöhen, dass das Modell falsche oder irreführende Informationen generiert Wie können wir also Halluzinationen mildern? Es gibt eine Reihe von Möglichkeiten, Halluzinationen bei Transformatoren zu mildern Eine Möglichkeit besteht darin, das Modell anhand von mehr Daten zu trainieren. Eine andere Möglichkeit besteht darin, eine Technik namens Strahlsuche zu verwenden, die es dem Modell ermöglicht, ein breiteres Spektrum möglicher Ergebnisse zu untersuchen . Und schließlich ist es wichtig, dem Modell genügend Kontext und Einschränkungen zu geben , damit es keine unsinnige oder grammatikalisch falsche Ausgabe generiert Hier sind einige Beispiele für Halluzinationen , die durch Transformatoren erzeugt wurden. Die Katze saß auf der Matte und der Hund fraß den Mond. Der Junge ging in den Laden und kaufte eine Gallone Luft. Die Frau fuhr zur Bank und hob 1 Million Dollar ab. Wie Sie sehen können, sind diese Beispiele alle unsinnig oder grammatikalisch falsch Dies liegt daran, dass die Transformatoren diese Wörter oder Phrasen ohne Kontext oder Einschränkungen generiert haben oder Phrasen ohne Kontext oder Einschränkungen Es ist wichtig zu beachten, dass Halluzinationen nicht immer eine schlechte Sache sind In einigen Fällen können sie verwendet werden, um kreative und interessante Texte zu generieren Es ist jedoch wichtig, sich des Potenzials für Halluzinationen bei der Verwendung von Transformatoren bewusst zu sein Halluzinationen bei der Verwendung von Transformatoren und Maßnahmen zu ihrer Minderung zu ergreifen Transformatoren werden verwendet, um eine Vielzahl kreativer Inhalte zu generieren , darunter Text, Bilder, Musik und sogar Videos Zu den häufigsten Anwendungen von Transformatoren in der generativen KI gehört die Textgenerierung. Transformatoren können verwendet werden, um Texte wie Nachrichtenartikel, Blogbeiträge und kreatives Schreiben zu generieren . Zum Beispiel wurde das Transformer-Modell GPT Three verwendet, um realistisch aussehende Fake-News-Artikel zu generieren, und es kann sogar Gedichte und Geschichten schreiben Generierung von Bildern. Transformatoren können verwendet werden, um Bilder wie Gemälde, Fotografien und digitale Kunst zu erzeugen . Das Transformator-Modell Imagine wurde beispielsweise verwendet, um realistisch aussehende Bilder von Menschen, Tieren und Objekten zu erzeugen . Generierung von Musik. Transformers können verwendet werden, um Musik wie Songs, Melodien und Beats zu erzeugen wie Songs, Melodien und Beats Zum Beispiel war das Transformer-Modell Mus Net in der Lage, Originalmusik zu erzeugen, die klingt, als wäre sie von einem menschlichen Musiker komponiert worden Originalmusik zu erzeugen, die klingt, als wäre sie von einem menschlichen Musiker komponiert Und wir haben Videogenerierung. Transformers können zur Generierung von Videos wie Filmen, Fernsehsendungen und Zeichentrickfilmen dem Transformer-Modell Deep Mind Video wurde beispielsweise ein realistisch aussehendes Video generiert , das aussieht, als wäre es von einem menschlichen Kameramann aufgenommen Da sich die Technologie weiterentwickelt, können wir erwarten, dass noch mehr erstaunliche Anwendungen von Transformatoren in der generativen KI zu sehen noch mehr erstaunliche Anwendungen sind. Transformatoren haben das Potenzial, die Weise, wie wir Inhalte erstellen und konsumieren, zu revolutionieren, und sie werden bereits verwendet, um einige wirklich unglaubliche Dinge zu schaffen. Ich 7. L2V2 – Gen-KI: Willkommen bei generativer künstlicher Intelligenz. Wir beginnen dieses Video mit der Erklärung, wie man zwischen generativer KI und traditionellem maschinellen Lernen unterscheidet . Dann geben wir eine formale Definition für generative künstliche Intelligenz und beenden das Video mit einigen Beispielen für generative KI. Hier zeigen wir zwei wichtige Ansätze im Bereich der künstlichen Intelligenz traditionelles maschinelles Lernen und generative künstliche Intelligenz. Das obere Bild zeigt traditionelles maschinelles Lernen. Hier lernt das Modell aus Daten, an denen Etiketten angebracht sind. Es ermittelt den Zusammenhang zwischen den Merkmalen der Daten und den entsprechenden Bezeichnungen. Dieses Verständnis wird dann genutzt, um fundierte Vermutungen über neue Daten anzustellen, die es noch nie zuvor gesehen Jetzt zeigt der untere Teil des Bildes etwas anderes Das generative KI-Modell. Anstatt nur die Beziehung zwischen Eingaben und Ausgaben herauszufinden , geht es tiefer. Es konzentriert sich auf das komplexe Muster im Inhalt. Dieses Verständnis von Mustern gibt ihm die Möglichkeit, eigenständig neue und realistische Inhalte zu erstellen. Das kann alles sein, ein Gedicht, ein Nachrichtenartikel, ein Bild oder sogar eine Musikkomposition. Sie sehen also, dass generative KI der riesigen Welt der KI einen neuen kreativen Blickwinkel verleiht . Die Art des Outputs spielt eine entscheidende Rolle bei der Unterscheidung zwischen generativer KI und anderen Modellen. Herkömmliche Modelle liefern in der Regel kategorische oder numerische Ergebnisse, z. B. ob es sich bei einer E-Mail um Spam handelt oder nicht, oder um Verkaufszahlen vorherzusagen Andererseits kann generative KI Ergebnisse wie geschriebene oder gesprochene Sprache, Bilder oder sogar Audio erzeugen, was ihre Fähigkeit widerspiegelt, Inhalte zu generieren, die die Realität nachahmen Mathematisch können wir uns das so vorstellen. Wenn Sie diese Gleichung in letzter Zeit nicht gesehen haben, finden Sie hier eine kurze Erinnerung Die Gleichung Y ist gleich F von X berechnet das Ergebnis auf der Grundlage variierender Y symbolisiert das Ergebnis des Modells. F steht für die Funktion, die wir bei der Berechnung verwenden. Und was ist mit X? Das stellt die Eingaben oder Eingaben dar, die in der Gleichung verwendet werden. Einfach ausgedrückt ist die Ausgabe des Modells also eine Funktion aller Eingaben. Hier kommt es darauf an, die Art der Ausgabe Y als Funktion der Eingaben X zu verstehen . Herkömmliche Modelle führen im Allgemeinen zu numerischen Ergebnissen. Generative KI-Modelle können diese numerischen Werte zwar verschiedenen Informationsformen zuordnen, wodurch sie in der Lage sind, komplexe Antworten wie Sätze in natürlicher Sprache oder Bilder und Videos zu erzeugen . Um die traditionellen klassischen überwachten und unbeaufsichtigten Lernprozesse auf hoher Ebene zusammenzufassen traditionellen klassischen überwachten und unbeaufsichtigten , Sie Trainingscode und Kennzeichnungsdaten, um ein Modell zu erstellen Je nach Anwendungsfall oder Problem kann Ihnen das Modell eine Prognose geben Es kann etwas klassifizieren oder etwas gruppieren. Der Unterschied liegt in der Anwendung. Herkömmliche Modelle machen Vorhersagen, klassifizieren oder gruppieren Daten, während generative KI-Modelle vielseitiger sind und ein breites Spektrum an Inhalten erzeugen Die generative KI-Methode kann mit Trainingscode, beschrifteten und unbeschrifteten Daten aller Art arbeiten, und unbeschrifteten Daten aller Art um ein sogenanntes Basismodell zu erstellen. Dieses Basismodell kann dann neue Inhalte wie Text, Code, Bilder, Audio, Video usw. erzeugen wie Text, Code, Bilder, Audio, Video usw. Die Stärke der generativen KI liegt in ihrer Fähigkeit, verschiedene Datentypen, einschließlich unbeschrifteter Daten, aufzunehmen, um Modelle zu erstellen, die neue Inhalte generieren, was über die Funktionen herkömmlicher Modelle hinausgeht Wir haben einen langen Weg zurückgelegt und uns von der traditionellen Programmierung zu neuronalen Netzwerken und jetzt zu generativen Modellen entwickelt In den alten Zeiten der traditionellen Programmierung mussten wir die Regeln manuell eingeben, mussten wir die Regeln manuell eingeben um die Katze zu unterscheiden. Wir mussten spezifische Regeln in das Programm einbetten. Es war ungefähr so, wenn es ein Tier mit vier Beinen, zwei Ohren Fee ist und eine Vorliebe für Garn und Katzenminze zeigt, dann ist es wahrscheinlich Und das alles mussten wir in einer Programmiersprache schreiben und nicht in natürlicher Sprache Wie bei neuronalen Netzwerken könnten wir die Netzwerkbilder von Katzen und Hunden zeigen dann fragen: Ist das eine Katze? Das Netzwerk würde wahrscheinlich mit einer Vorhersage antworten, es ist eine Katze. Wir können also sehen, dass neuronale Netzwerke eine nuanciertere Entscheidungsfindung ermöglichen , indem sie anhand von Beispielen trainiert werden, was eine Weiterentwicklung von festen Programmierregeln darstellt In der generativen Welle können wir unsere eigenen Inhalte wie Text, Bilder, Audio, Video usw. produzieren wie Text, Bilder, Audio, Video usw. Modelle wie Palm oder Pathways Language Model, Lambda Language Model for Dialog Applications und GPT, generative Pre-Trained Transformer, verbrauchen riesige Datenmengen aus unterschiedlichen Quellen, einschließlich dem Internet, um grundlegende Sprachmodelle zu erstellen. Diese können einfach verwendet werden , indem eine Frage gestellt wird, egal ob sie in eine Aufforderung eingegeben oder mündlich gesprochen wird die Aufforderung selbst. Wenn wir also fragen, was eine Katze ist, kann sie uns alles geben, was sie über die Katze gelernt hat. Generative KI fördert die Benutzerinteraktion und macht Benutzer von bloßen Zuschauern zu aktiven Schöpfern Modelle wie Palm, Lambda und GPT Sie wurden anhand großer Datenmengen trainiert und bieten intelligente, kontextsensitive Dieser Fokus auf den Benutzer macht generative KI für eine Reihe verschiedener Anwendungen attraktiv eine Reihe verschiedener Anwendungen Lassen Sie uns nun unsere formale Definition angeben. Was ist generative KI? Generative KI ist eine Art künstlicher Intelligenz, die neue Inhalte auf der Grundlage dessen erstellt , was sie aus bestehenden Inhalten gelernt hat. Der Prozess des Lernens aus vorhandenen Inhalten wird als Training bezeichnet und führt zur Erstellung eines statistischen Modells, wenn er dazu aufgefordert wird. KI verwendet das Modell , um vorherzusagen, wie eine erwartete Reaktion aussehen könnte, und daraus werden neue Inhalte generiert Der Schwerpunkt liegt dabei auf der Vererbbarkeit generativer KI beim Lernen und Schaffen Im Gegensatz zu herkömmlichen Modellen, die auf der Grundlage vorab festgelegter Beziehungen Vorhersagen treffen, konzentriert sich die generative KI auf das Verständnis der zugrunde liegenden Struktur der Eingabedaten Nach dem Training kann das Modell einzigartige Antworten oder Inhalte generieren, was die Anwendungen und Fähigkeiten von KI-Systemen erheblich erweitert und Fähigkeiten von KI-Systemen Im Wesentlichen lernt es die zugrunde liegende Struktur der Daten und kann dann neue Stichproben generieren , die den Daten ähneln, mit denen es trainiert wurde Schauen wir uns also an, was der Unterschied zwischen Sprachmodellen und Bildmodellen ist. Generative Sprachmodelle lernen anhand von Trainingsdaten etwas über Sprachmuster. Anhand einiger Texte sagen sie dann voraus, was als Nächstes kommt. Generative Bildmodelle erzeugen mithilfe von Techniken wie Diffusion neue Bilder. Anhand einer Aufforderung oder verwandter Bilder verwandeln sie zufälliges Rauschen in Bilder oder erzeugen anhand von Eingabeaufforderungen Bilder Schauen wir uns jeden einzelnen etwas genauer an. Wie bereits erwähnt, konzentrieren sich generative Sprachmodelle darauf , die den Daten innewohnende Musterstruktur zu erfassen innewohnende Musterstruktur Anschließend nutzen sie diese erlernten Muster, um neue Antworten oder Inhalte zu generieren Die den Originaldaten oft sehr ähnlich sind. Diese Eigenschaften machen große Sprachmodelle einem außergewöhnlichen Beispiel für generatives AIS-Potenzial. Ein generatives Sprachmodell verwendet Text als Eingabe und kann mehr Text und Bild, Audio oder Entscheidungen ausgeben. Beispielsweise wird unter dem Ausgabetext die Beantwortung von Fragen generiert, und unter dem Ausgabebild wird ein Video generiert. Große Sprachmodelle sind also eine Art generativer KI , weil sie neuartige Textkombinationen in Form von natürlich klingender Sprache erzeugen neuartige Textkombinationen in Form von natürlich klingender Sprache Wir haben auch generative Bildmodelle, die ein Bild als Eingabe verwenden und Text, ein anderes Bild oder Video ausgeben können anderes Bild oder Video Unter dem Ausgabetext können Sie beispielsweise eine visuelle Beantwortung von Fragen finden, was eine Aufgabe in der Computervision ist , bei der Fragen zu einem Bild beantwortet werden, während unter Ausgabebild eine Bildvervollständigung generiert wird. Und auf ihrem Ausgabevideo wird eine Animation generiert. Wie bereits erwähnt, lernen generative Sprachmodelle anhand ihrer Trainingsdaten etwas über Muster und Sprachstrukturen Muster und Sprachstrukturen. Und wenn ihnen dann Text gegeben wird, versuchen sie vorherzusagen, was als Nächstes kommt. Generative Sprachmodelle können also gewissermaßen als Mustervergleichssysteme betrachtet werden, ihre Fähigkeit verbessern, Muster anhand der ihnen präsentierten Daten zu erkennen Muster anhand der ihnen präsentierten Daten zu wir nun die formale Definition von generativer künstlicher Intelligenz vorgestellt haben, wollen wir dieses Video mit einigen Beispielen für generative KI beenden Hier ist ein Beispiel für die automatische Vervollständigung der Google-Suche. Basierend auf den Erkenntnissen, die es aus seinen Trainingsdaten gelernt hat, bietet es Vorhersagen darüber, wie dieser Satz zu vervollständigen ist. Katzen hassen es, und einige der Vorschläge sind, dass Katzen den Geruch von Katzen hassen, dass Katzen Wasser hassen, Katzen Gurken hassen. Hier ist dasselbe Beispiel mit Bar, einem Sprachmodell, das auf einer riesigen Menge von Textdaten trainiert wurde und in der Lage ist, zu generieren kommunizieren und als Antwort auf eine Vielzahl von Aufforderungen und Fragen menschenähnlichen Text zu Wenn ich also die Aufforderung verwende, hassen Katzen Antworten Katzen hassen viele Dinge, aber zu den häufigsten gehören, und dann eine Liste von Dingen, von denen sie glauben, dass Katzen sie hassen würden. Und dieselbe Eingabeaufforderung mit GPT 4 erzeugt diese Antwort. Katzen hassen Katzen können als Reaktion auf eine Vielzahl von Situationen, Objekten oder Verhaltensweisen Abneigung oder Unbehagen zum Ausdruck bringen Reaktion auf eine Vielzahl von Situationen, Objekten oder Verhaltensweisen Abneigung oder Im Folgenden sind einige der Dinge aufgeführt, die Katzen normalerweise nicht mögen, und einige der Dinge aufgeführt , von denen Katzen glauben, dass sie sie hassen würden Ähnlich wie Bart ist auch GPT Four ein Sprachmodell, das auf einer riesigen Menge von Textdaten trainiert wurde und zu generieren in der Lage ist, als Antwort auf eine Vielzahl von Aufforderungen und Fragen zu kommunizieren und menschenähnlichen Text eine Vielzahl von Aufforderungen Schauen wir uns nun einige Beispiele für die Bilderzeugung an. Wir verwenden dieselbe Eingabeaufforderung für drei verschiedene KI-Tools. Die Aufforderung ist eine Katze, umgeben von Dingen, die Katzen hassen. Wenn wir diese Aufforderung mit DALE versuchen , einem KI-Bildgenerator , der von OpenAI entwickelt wurde, derselben Firma, die auch GPT entwickelt hat Wir erhalten dieses Ergebnis. Wir können es auch mit Adobe Firefly Tik zum Bildgenerator ausprobieren Adobe Firefly Tik zum Bildgenerator Und dies sind einige der Ergebnisse , die wir von Firefly erhalten Wir können auch die Text-zu-Bild-Anwendung Canva ausprobieren. Sie enthält einige Beispiele dafür, was sie als Antwort auf unsere Eingabeaufforderungen für angemessen hält Bitte beachte, dass wir hier eine sehr minimalistische Aufforderung verwendet haben, nur um zu zeigen, dass wir auch ohne viel Kontext Ergebnisse erzielen können, wir auch ohne viel Kontext Ergebnisse erzielen können, die mehr oder weniger relevant sind Wir würden ein viel besseres Ergebnis erzielen, wenn unsere Aufforderung mehr Details enthalten und einer soliden Struktur folgen Dies verdeutlicht, wie wichtig eine schnelle Planung und schnelle Planung sind, worauf wir später in diesem Abschnitt eingehen werden. Im nächsten Video werden wir über Transformatoren sprechen, eine Technologie, die all dies ermöglicht hat . Wir sehen uns im nächsten. 8. L2V3 – Gen-KI-Anwendungen: Schauen wir uns die Art der Aufgaben an , die verschiedene KI-Modelle ausführen können. Diese Aufgabe kann im Allgemeinen anhand der Art der Eingabedaten, die sie akzeptieren, und der Art der von ihnen generierten Ausgabedaten klassifiziert Eingabedaten, die sie akzeptieren, und werden. Hier sind einige Beispiele. Text zu Text. Dies wird in der Regel bei maschineller Übersetzung, Textzusammenfassung und Chatbots wie Bard und Chat Wenn Sie beispielsweise GPT 4 fragen, was ist eine Katze? Ich würde Ihnen sagen, eine Katze ist ein kleines fleischfressendes Säugetier , das oft als Haustier gehalten wird Der Begriff bezieht sich im Allgemeinen auf Katzen, und dann generiert er immer mehr Informationen über Katzen Ein anderes Modell ist Text zu Bild. Dies wird verwendet, um Bilder aus Textbeschreibungen zu generieren. Ein Beispiel hierfür wäre die Canvas-Text-zu-Bild-Anwendung, die Bilder aus Texteingaben erstellt. In diesem Beispiel können wir die Aufforderung einer grau-weißen Katze verwenden , die auf einer Fensterbank sitzt und Tauben draußen beobachtet Und es wird dieses Bild für uns erzeugen. Text zum Video. KI kann auch verwendet werden, um Videos aus Textbeschreibungen zu generieren, obwohl dies eine komplexere und weniger erforschte Aufgabe ist als die Generierung von Text zu Bild. Mit Tools wie in Videos können wir beispielsweise ein Video mit nur einem Abschlussball erstellen. Das KI-Modell verwendet unsere Aufforderung, um ein Skript für das Video zu schreiben, und wählt dann Bilder und Videoclips aus, die für den Inhalt des Skripts relevant sind . Es kann sogar Filter und Übergänge auf das Video anwenden. Einige dieser Tools können auch Musik auswählen , die für den Inhalt des Videos relevant ist. Das KI-Modell kann beispielsweise Haustiere mit Verspieltheit assoziieren und dann eine verspielte Musik auswählen , die dem Video hinzugefügt werden soll Text to Three D erzeugen diese Modelle dreidimensionale Objekte, die Textbeschreibung eines Benutzers entsprechen Wenn Sie beispielsweise Shape E fragen, ein bedingtes generatives Modell für drei D-Objekte, um ein Flugzeug zu bauen , das wie eine Banane aussieht. Es erzeugt das Drei-D-Objekt, das Sie hier sehen können. Wir haben auch Text zum Codieren. Diese Modelle sind in der Lage, eine Beschreibung in natürlicher Sprache zu verwenden und darauf aufbauend einen Code zu erstellen. Es ist nützlich für Aufgaben wie automatisierte Codegenerierung, Fehlererkennung und Codeübersetzung. Zum Beispiel haben GPT, Bart und Github Copilot gemeinsam die Fähigkeit, Code zu generieren Modelle wie Chat GPT aufgrund ihrer Ausbildung zu einer Vielzahl von Internettexten, einschließlich Code, in der Lage, Code zu generieren, wenn sie mit einem geeigneten Abschlussball ausgestattet Bart Two arbeitet in derselben Richtung, aber seine Ausbildung konzentriert sich speziell auf die Programmierung verwandter Texte Wir haben auch einen Github-Copilot , der das Codex-Modell von OpenAI verwendet, das auf öffentlich verfügbarem Code trainiert wurde, sodass er Codevervollständigung vorschlagen und Code aus Kommentaren oder Funktionssignaturen generieren kann Nimmt die Aufgabe an. Modelle, die Aufgaben erledigen, werden darauf trainiert, eine definierte Aufgabe oder Aktion auf der Grundlage von Texteingaben auszuführen. dieser Aufgabe kann es sich eine Vielzahl von Aktionen handeln, z. B. das Beantworten einer Frage, Durchführen einer Suche, das Erstellen einer Vorhersage oder das Ergreifen von Maßnahmen. Ein Modell von Ts to Task könnte beispielsweise darauf trainiert werden, auf einer Web-Benutzeroberfläche zu navigieren oder über die GUI Änderungen an einem Dokument vorzunehmen. Wir haben auch Bild zu Text. Dies wird bei Aufgaben wie Bilduntertiteln verwendet , bei denen die KI ein Bild in Worten beschreibt Zum Beispiel kann BLiP, ein KI-Modell Bilder sowohl untertiteln als auch erzeugen kann, ein Bild als Eingabe verwenden und als Ausgabe eine Beschreibung dieses Bildes im Text bereitstellen eine Beschreibung dieses Bildes im Text Wir haben auch Bild zu Bild. Diese Modelle führen Aufgaben wie die Bildübersetzung aus, z. B. Konvertieren von Tagesbildern in Nachtbilder, Kolorieren von Schwarzweißbildern oder das Verbessern der Bildauflösung Night Cafe ist beispielsweise ein KI-Bildgenerator, der ein Bild als Eingabe verwenden kann, ein Bild als Eingabe verwenden kann um den Bilderstellungsprozess zu initialisieren Anschließend wird ein stilisiertes Bild als Ausgabe erzeugt , das auf der Eingabeaufforderung des Benutzers und anderen Einstellungen basiert , die angepasst werden können Je nach ausgewähltem Algorithmus, künstlerisch oder kohärent, dient das Startbild unterschiedlichen Zwecken Für den künstlerischen Algorithmus die Formen und Strukturen sind die Formen und Strukturen im Bild bedeutsamer. Beim kohärenten Algorithmus wird jedoch mehr Wert auf Auflösung, Farben und Texturen gelegt . wir uns als weiteres Beispiel die Schauen wir uns als weiteres Beispiel die magische Bearbeitungsfunktion von Canva an Mit dieser Funktion können wir einen bestimmten Teil des Bildes auswählen und durch ein anderes Bild ersetzen Hier wähle ich zum Beispiel den Korb aus und teile dem Modell dann mit, dass ich ihn durch eine Bergkette ersetzen möchte , in der Hoffnung, dass das Ergebnis so aussieht , als würde die Katze auf einem Felsen sitzen. Und wir können sehen, dass mir das Modell einige Vorschläge macht. Wenn ich mit dem Ergebnis nicht zufrieden bin, kann ich das Modell bitten, die Ergebnisse zu regenerieren , bis ich etwas finde, das mir gefällt Und hier ist das Endergebnis. Ich kann sogar noch weiter gehen und die Decke im Hintergrund auswählen und das Model bitten sie durch den Himmel mit Wolken zu ersetzen. Und so sieht das Ergebnis aus. Video zum Text. Dies beinhaltet die Generierung einer Textbeschreibung oder einer Transkription aus einem Video RS AI kann beispielsweise Transkripte oder Bildunterschriften aus einem Videoeingang erstellen diese sogar von einer Sprache in eine andere übersetzen In diesem Beispiel sehen wir zwar, dass nur das Sprachelement des Videos mit Untertiteln versehen wird , aber einige der fortschrittlicheren Untertitelungstools sind in der Lage, auch Elemente zu untertiteln, die keine Sprache sind Lage, auch Elemente zu untertiteln, die keine Nichtsprachliche Elemente können Soundeffekte umfassen, z. B. summende Biene, Käseklirren oder Klingeln an der Tür, Musik , entweder im Hintergrund oder als Teil einer Szene, Reaktionen des Publikums, beispielsweise Lachen, Stöhnen oder Buhen , Sprechweise, beispielsweise Flüstern, Schreien, Hervorheben eines Wortes oder Sprechen mit Akzent und Sprecher für einen Sprecher oder Sprecher außerhalb des Bildschirms oder für mehrere Sprecher Identifikation für einen Sprecher oder Sprecher außerhalb des Bildschirms oder für mehrere Sprecher. In ähnlicher Weise haben wir Audio zu Text. Dies wird typischerweise in Spracherkennungssystemen verwendet , um gesprochene Sprache in geschriebenen Text umzuwandeln Whisper von Open AI ist ein Beispiel für ein Audio-zu-Text-Modell KI kann Text auch in synthetisierte Sprache umwandeln. Text-to-Speech-Systeme konvertieren Text in eine gesprochene Sprache Viele KI-Tools wie Play Dot HT können anhand einer Texteingabe menschliche Sprache mit synthetisierten Stimmen erzeugen , die unterschiedlichen Geschlechtern, Altersgruppen, Akzenten oder sogar unterschiedlichen Tönen ähneln können , z. B. glücklich, traurig, wütend usw. Vom Bild zum Video. Diese Aufgabe beinhaltet das Generieren einer Sequenz von Bildern oder eines Videos aus einem einzelnen oder einer Reihe von Bildern. Beispielsweise nutzen Filmfotos, eine Funktion in Google Fotos, maschinelles Lernen, eine Funktion in Google Fotos, maschinelles Lernen, um die Tiefe eines Bildes zu schätzen und eine dreidimensionale Darstellung der Szene zu erstellen, unabhängig davon, ob das Originalbild Tiefeninformationen von der Kamera enthält Nach dieser Schätzung animiert das System eine virtuelle Kamera, um einen gleichmäßigen Schwenkeffekt zu erzeugen , der einer Filmsequenz ähnelt diesem komplizierten Prozess wird mithilfe künstlicher Intelligenz ein statisches Bild in eine dynamische dreidimensionale Szene umgewandelt, die dem Bild eine Videoqualität verleiht Was wir bisher besprochen haben, sind nur einige Beispiele, und die Liste wird ständig erweitert, da der Bereich der KI voranschreitet und Forscher neue Anwendungen für diese Technologien erfinden Darüber hinaus werden diese Aufgaben in vielen realen Anwendungen kombiniert Beispielsweise muss ein KI-System möglicherweise mithilfe eines Sprache-zu-Text-Modells in Text umwandeln und dann den Text mithilfe eines Text-zu-Text-Modells verarbeiten und anschließend eine entsprechende Antwort in gesprochener Sprache generieren, die eine entsprechende Antwort in gesprochener Sprache generieren, ein Text-zu-Audiomodell verwendet. Aber warte, es gibt noch mehr. Es gibt viele andere Bereiche, in denen GNAI bahnbrechende Anwendungen haben kann Denken Sie zum Beispiel an das Wort Musik. Musikbezogene Aufgaben sind ein aktiver Bereich der Forschung und Entwicklung im Bereich KI. Hier sind einige häufig gestellte Aufgaben. Wir haben Text zur Musik. Diese Modelle können Musik auf der Grundlage von Texteingaben erzeugen. Sie können beispielsweise eine Melodie oder eine Komposition erstellen durch eine Phrase oder einen Text beschrieben wird. Musik zu Text Andererseits kann KI auch Musik in Text umwandeln, z. B. Noten für ein Lied erstellen beschreibenden oder emotionalen Text auf der Grundlage eines Musikstücks generieren auf der Grundlage eines Musikstücks Wir haben Audio in Audio, wodurch eine Art von Sound oder Musik in eine andere umgewandelt werden kann , z. B. das Genre eines Songs ändern, ein Summen in ein komponiertes Stück verwandeln oder sogar Gesang aus Songs entfernen Es gibt auch Musikempfehlungen. KI wird häufig verwendet Musik zu empfehlen, die auf den Hörgewohnheiten, Vorlieben und sogar der Stimmung der Nutzer basiert , Vorlieben und sogar der Stimmung Wir haben auch Musikgenerierung. Mus Net von Open AI ist ein Beispiel für Musikgenerierung. Modelle wie Mus enet von OpenAI können vierminütige Musikkompositionen mit zehn verschiedenen Instrumenten erzeugen und Stile von Country über Mozart bis hin zu den Beatles kombinieren Stile von Country über Mozart bis hin zu den Beatles Es gibt auch Musikverbesserungen. Audio Studio kann beispielsweise verwendet werden, um bestehende Musik zu verbessern oder zu ändern. Dies kann durch Dinge wie das Hochskalieren der Audioqualität, das Ändern des Tempos oder das Hinzufügen von Effekten geschehen Und es gibt auch eine Trennung von Musikquellen. Wir können auch KI-Modelle verwenden um einzelne Instrumente, Gesang oder andere Komponenten von einem Mix- oder Master-Track Metas DMax ist ein Beispiel für ein Tool zur Trennung von Musikquellen Zusammenfassend lässt sich sagen, dass der Bereich der generativen KI vielfältig, faszinierend und voller Potenzial ist , faszinierend und voller Potenzial Die Bandbreite der Aufgaben, die sie erfüllen kann , von Takes to Take über Takes bis hin zu Bildern, Audio zu Take und sogar komplizierten Aufgaben wie Verbesserung und Generierung von Musik ist wirklich bemerkenswert Es ist ein Bereich, der sich ständig weiterentwickelt und die Grenzen dessen, was wir für möglich gehalten haben, Während wir weiter forschen und innovativ sind, wird die Liste der Anwendungen nur noch erweitert Generative KI ist der Schlüssel zu vielen Durchbrüchen und Fortschritten, die eine Reihe von Sektoren und die Art und Weise, wie wir mit Technologie interagieren, revolutionieren könnten die Art und Weise KI weiter Wer weiß, welche erstaunlichen Möglichkeiten wir entdecken könnten, wenn wir diese aufregende Ära der erforschen. Der Schlüssel liegt darin, neugierig zu bleiben, weiter zu forschen und uns eine Zukunft vorzustellen , in der wir auf vertrauenswürdige, verantwortungsvolle und ethische Weise mit KI-Systemen interagieren können verantwortungsvolle und 9. L2V4 – Prompt Engineering: Lassen Sie uns über ein faszinierendes Thema im Bereich der generativen KI sprechen, das Prompt generativen KI sprechen, das Prompt Wie der Name schon sagt, dreht sich bei generativer KI alles um Systeme, die Ergebnisse generieren, egal ob es sich um Text, Bilder oder jede andere Art von Wie Sie im nächsten Abschnitt dieses Kurses sehen werden, sind große Sprachmodelle oder LLMs, das Kraftpaket der generativen KI, darauf ausgelegt, menschenähnlichen Text auf der Grundlage von Eingabeaufforderungen zu generieren Eingabeaufforderungen generieren nicht nur menschenähnliche Texte, LLMs generieren nicht nur menschenähnliche Texte, sondern helfen auch dabei, unsere Eingabeaufforderungen in Ausgaben für andere Arten von Inhalten wie Bilder und Videos zu übersetzen unsere Eingabeaufforderungen in Ausgaben für andere Arten von Inhalten wie Das heißt, je besser unsere Eingabeaufforderungen sind, desto wahrscheinlicher ist es, dass wir mit jedem generativen KI-Tool qualitativ hochwertigere Ergebnisse erzielen qualitativ hochwertigere Ergebnisse Heute werden wir einige wichtige Aspekte im Zusammenhang mit diesen Eingabeaufforderungen untersuchen einige wichtige Aspekte im Zusammenhang mit diesen Eingabeaufforderungen Wir werden klarstellen, was genau eine Aufforderung ist und welche Rolle sie bei der Gestaltung der Ausgabe des Modells Wir werden zwischen Prompt Design und Prompt Engineering unterscheiden und dann verschiedene Methoden der Prompt Engineering vorstellen. Abschließend werden wir auf die Grenzen von Prompt Engineering eingehen , um Ihnen ein realistisches Verständnis und eine realistische Vorstellung von diesem spannenden Prozess zu vermitteln. Lassen Sie uns also anfangen. Also, was ist eine Aufforderung? Eine Aufforderung ist im Wesentlichen ein Textstück , das einem generativen KI-Modell als Eingabe gegeben wird. Aber es sind nicht irgendwelche Takes. Es dient einem grundlegenden Zweck. Diese Eingabeaufforderungen sind Ihre Kommunikationsverbindung zum Modell. Sie steuern das KI-Modell und steuern die Generierung seiner Ergebnisse. Das Modell nimmt Ihre Eingabeaufforderung auf, verarbeitet sie und liefert eine Ausgabe, die den Anweisungen der Eingabeaufforderungen entspricht Mit anderen Worten, diese Eingabeaufforderungen sind Ihr Werkzeug zur Steuerung der Modellausgabe. Stellen Sie sich eine Aufforderung als Anleitung zum generativen KI-Modell vor, wie ein Regisseur, der einen Schauspieler leitet Je präziser und klarer Ihre Anweisungen sind, desto besser ist die Leistung, die Sie vom Schauspieler erwarten können. In ähnlicher Weise ermöglichen gut gestaltete Eingabeaufforderungen dem Modell, qualitativ hochwertigere und spezifischere Ergebnisse Denken Sie daran, dass der Schlüssel in der Qualität und dem Design Ihrer Eingabeaufforderungen liegt , und hier kommen die Konzepte von Prompt-Design und Prompt-Engineering ins Spiel, auf die wir jetzt eingehen werden Wie bereits erwähnt, spielt die Qualität der Eingabeaufforderung eine entscheidende Rolle bei der Bestimmung der Qualität der Ergebnisse eines generativen KI-Modells Hier kommen zwei Konzepte ins Spiel Prompt Design und Prompt Engineering. Prompt-Design bezieht sich auf die Erstellung von Eingabeaufforderungen , die spezifisch für die Aufgabe sind , die das Modell ausführen soll Wenn Sie beispielsweise möchten, dass das Modell einen Text vom Englischen ins Französische übersetzt, wird die Aufforderung auf Englisch verfasst und es wird angegeben, dass die gewünschte Ausgabe auf Französisch erfolgen soll Im Wesentlichen geht es darum, Eingabeaufforderungen zu erstellen , die die gewünschte Ausgabe generieren Auf der anderen Seite haben wir schnelles Engineering. Bei diesem Prozess geht es eher darum die Leistung des Modells zu verbessern. Es beinhaltet Strategien wie Nutzung von domänenspezifischem Wissen, die Bereitstellung von Beispielen für das gewünschte Ergebnis oder die Einbeziehung von Schlüsselwörtern, von denen bekannt ist, dass sie für ein bestimmtes generatives KI-Modell wirksam Sie sehen also, beide Konzepte drehen sich zwar um das Erstellen von Eingabeaufforderungen, dienen aber unterschiedlichen Zwecken. Prompt-Design geht es darum, Eingabeaufforderungen auf Aufgaben zuzuschneiden, während Prompt Engineering Sie schließen sich jedoch nicht gegenseitig aus. In der Praxis erfordert die Erstellung einer effektiven Aufforderung häufig sowohl für die jeweilige Aufgabe konzipierte als auch eine bessere Leistung. Schauen wir uns nun einige der Techniken an, die beim Prompt-Engineering eingesetzt werden , um die Ausgabequalität unserer generativen KI-Modelle zu maximieren . Eine solche Methode nutzt domänenspezifisches Wissen. Wenn Sie den Aufgabenbereich gut kennen, können Sie dieses Fachwissen nutzen, um Eingabeaufforderungen zu entwerfen , die das Modell effektiver leiten Wenn Sie beispielsweise in der medizinischen KI arbeiten, könnten Sie medizinische Terminologie und Strukturen in Ihren Eingabeaufforderungen verwenden , um die Genauigkeit zu erhöhen Eine andere Methode besteht darin, Schlüsselwörter zu verwenden, von denen bekannt ist, dass sie für ein bestimmtes Modell wirksam Genau wie bei der Suchmaschinenoptimierung, bei der bestimmte Keywords dazu beitragen, Seiten höher zu platzieren, können bestimmte Keywords das Modell effektiver steuern. Die Auswahl der Keywords würde auf den Trainingsdaten des Modells und seinen erlernten Mustern basieren . Mit Modellen wie Bart oder Chat-GPT können Sie das Modell direkt nach diesen Schlüsselwörtern fragen und erfahren, können Sie das Modell direkt nach diesen Schlüsselwörtern fragen und erfahren wie sie zur Optimierung Ihrer Eingabeaufforderung verwenden Wir sollten auch fortgeschrittene Strategien in Betracht ziehen , wie etwa Rollenanweisungen, Eingabeaufforderungen und Gedankenketten Role Prompting ist eine Technik bei der wir das GNAI-Modell anweisen eine bestimmte Rolle oder Persona zu übernehmen , bei der wir das GNAI-Modell anweisen, eine bestimmte Rolle oder Persona zu übernehmen und gleichzeitig das Ergebnis zu generieren. Sie könnten das Modell zum Beispiel anweisen, so zu reagieren, als ob es ein Historiker der die Ursachen des ersten Weltkriegs erklärt Das Modell verwendet dann seine Trainingsdaten , um eine Antwort zu generieren, die auf diese Person abgestimmt ist Eingabeaufforderung wird dagegen vor der Bei der Eingabeaufforderung wird dagegen vor der eigentlichen Anweisung ein Bild des Kontextes vermittelt Sie können Beispiele für die gewünschte Ausgabe angeben. Auf diese Weise kann das Modell als Richtschnur dienen, indem es eine Referenz oder einen Entwurf der Erwartungen enthält Wenn Sie beispielsweise eine Zusammenfassung eines Dokuments wünschen, können Sie zusammen mit dem Originaltext einige Beispiele für Zusammenfassungen angeben zusammen mit dem Originaltext einige Beispiele für Zusammenfassungen Oder wenn Sie nach einer Filmkritik suchen, könnten Sie nicht einfach sagen, schreiben Sie eine Rezension zu Film X, sondern sagen: Stellen Sie sich vor, Sie haben gerade den spannenden Film X in einem überfüllten Kino zu Ende gesehen den spannenden Film X in einem überfüllten Schreiben Sie eine Rezension des Films. Dieser zusätzliche Kontext kann das Modell dazu anleiten, emotionalere und kontextsensivere Ergebnisse zu erzielen . Es gibt verschiedene Arten von Eingabeaufforderungen: Null-, Eins- und Wenigschussabfrage Zero Shot Prompting stellt das Gen-AI-Modell ohne Übersetzen Sie beispielsweise diesen englischen Satz ins Französische. Der Chat ist umfangreich. Hier stellen wir eine Aufgabe vor, ohne ein konkretes Beispiel dafür zu geben, wie sie ausgeführt werden sollte One Shot Prompting bietet ein einziges Beispiel zur Orientierung Fahren Sie beispielsweise mit der folgenden Geschichte fort. einmal in einem weit entfernten Land, es war eine mutige Nacht. Und dann geben wir ein Beispiel für eine Fortsetzung der Geschichte. Das Modell versucht dann, die Geschichte im Stil des von uns bereitgestellten Beispiels fortzusetzen . Und wir haben nur wenige Eingabeaufforderungen, die auch als Multi-Shot-Prompting bezeichnet Hier stellen wir mehrere Beispiele zur Verfügung, um das Modell zu unterstützen. Ein Beispiel wäre, das Model zu bitten , eine Produktrezension zu erstellen, eine Reihe von Produktbewertungsbeispielen vorausgeht Das Model wird versuchen, eine Bewertung zu verfassen , die den von uns bereitgestellten Beispielen ähnelt Und nicht zuletzt beinhaltet die Anregung von Gedankenketten die Bereitstellung einer Argumentation oder Argumentation für das GNAI-Modell Anstatt einer direkten Frage oder Anweisung geben Sie eine Reihe von Gedanken, die zu der Frage führen Anstatt zum Beispiel zu fragen, was die Ursachen der globalen Erwärmung sind, würden Sie sagen, dass wir in den letzten Jahrzehnten einen Anstieg der globalen Temperaturen gesehen haben in den letzten Jahrzehnten einen Anstieg der globalen Temperaturen . Diese Veränderung, die oft als globale Erwärmung bezeichnet wird, scheint von verschiedenen Faktoren beeinflusst zu werden. Was sind diese Ursachen? Diese Strategien können den Umfang und die Relevanz des Modellergebnisses erhöhen und damit die Leistungsfähigkeit einer geschickten und zeitnahen Konstruktion erneut unter Beweis stellen geschickten Denken Sie daran, dass es sich dabei nicht um eigenständige Methoden handelt, sondern dass sie häufig kombiniert werden können, um eine aussagekräftige Eingabeaufforderung zu Nachdem wir uns mit diesen Techniken vertraut gemacht haben, wollen wir uns nun den Grenzen des Prompt-Engineerings zuwenden. Prompt Engineering eröffnet zwar spannende Möglichkeiten zur Feinabstimmung der Ergebnisse eines generativen KI-Modells, aber es ist wichtig zu bedenken, dass es sich nicht einen Zauberstab handelt, der immer perfekte Ergebnisse garantieren kann. Es gibt bestimmte Einschränkungen und Einschränkungen , deren wir uns bewusst sein müssen. Erstens sind generative KI-Modelle zwar leistungsstark, aber nicht allmächtig Sie werden mit einer Vielzahl von Daten trainiert, was jedoch nicht bedeutet, dass sie in der Lage sind, jede Frage genau zu beantworten oder jede von Ihnen gestellte Aufgabe zu erfüllen. Das Modell ist beispielsweise nicht Inhalte außerhalb des Stichtags für Schulungen zu generieren außerhalb des Stichtags für Schulungen oder zukünftige Ereignisse genau vorherzusagen Zweitens hängen die Genauigkeit und Relevanz der Ergebnisse des Modells in hohem Maße von der Qualität und Klarheit Ihrer Aufforderung Selbst eine perfekt ausgearbeitete Aufforderung führt jedoch möglicherweise nicht immer aufgrund der inhärenten Unvorhersehbarkeit der KI-Modelle möglicherweise nicht immer zum erwarteten Ergebnis inhärenten Unvorhersehbarkeit der KI-Modelle Drittens können Modelle selbst bei akribischer Prompt-Entwicklung manchmal Ergebnisse erzeugen, die sachlich falsch oder unsinnig sind Das liegt daran, dass diese Modelle Antworten auf der Grundlage von Mustern generieren , die sie während des Trainings gelernt haben, und sie verstehen den Inhalt nicht Und schließlich erfordern bestimmte Aufgaben möglicherweise ein Maß Spezifikation oder fachspezifischem Wissen , das über das Training des Modells hinausgeht Ein generatives KI-Modell für allgemeine Zwecke möglicherweise nicht in der Lage, hochspezialisierte Inhalte präzise zu generieren oder auf hochtechnische Anfragen in Bereichen wie Recht, fortgeschrittene Mathematik oder bestimmten medizinischen Teildisziplinen Prompt Engineering ist zwar ein leistungsstarkes Instrument, aber es ist wichtig, sich dieser Einschränkungen bewusst zu sein , um realistische Erwartungen aufrechtzuerhalten und generative KI-Modelle effektiver zu nutzen generative KI-Modelle effektiver In Ordnung, lassen Sie uns die Dinge zusammenfassen. Heute haben wir die Welt der Eingabeaufforderungen in generativen KI-Modellen erforscht Eingabeaufforderungen in generativen KI-Modellen Wir haben etwas über Prompt-Design und Engineering gelernt und verschiedene Methoden wie Shot Prompting, Roll Prompting und Chain of Thought Prompting besprochen verschiedene Methoden wie Shot Prompting, Roll Prompting und Chain of Thought Prompting Denken Sie daran, dass Prompt Engineering kein Wundermittel ist. Es ist ein Tool, und wie jedes Tool hat es seine Grenzen. Experimentieren Sie also damit, Ihre eigenen Eingabeaufforderungen zu erstellen , und erkunden Sie die Möglichkeiten Danke fürs Zuschauen. Wir sehen uns beim nächsten Mal. 10. L3V1 – LLMs: Willkommen zur Einführung in große Sprachmodelle. Große Sprachmodelle, kurz LLMs, sind eine Untergruppe von Deep Learning Sie überschneiden sich mit generativer KI, die ebenfalls Teil von Deep Learning ist Wir haben bereits erklärt, dass generative KI eine Art künstlicher Intelligenz ist , die neue Inhalte wie Text, Bilder, Audio und synthetische Daten erzeugen kann wie Text, Bilder, Audio und synthetische Daten Aber was sind große Sprachmodelle? Wenn wir den Begriff große Sprachmodelle verwenden, beziehen wir uns auf große allgemeine Sprachmodelle, die wir vorab trainieren und dann verfeinern können trainieren und dann verfeinern um sie an unsere Bedürfnisse für bestimmte Zwecke anzupassen. Aber was meinen wir mit „ vortrainiert“ und „fein abgestimmt“? Denken Sie über den Prozess der Hundeerziehung nach. Normalerweise unterrichtest du deinen Hund grundlegenden Befehlen wie Sitzen, Beruhige dich und Bleib Diese Befehle reichen normalerweise für das tägliche Leben aus und helfen Ihrem Hund, sich in der Nachbarschaft gut zu benehmen Wenn Sie jedoch von einem Hund verlangen, dass er eine besondere Rolle spielt, z. B. ein Sicherheitshund, ein Blindenhund oder ein Polizeihund, zusätzliche spezifische Ausbildung erforderlich. Das gleiche Prinzip gilt für große Sprachmodelle So wie die spezielle Ausbildung Hunde auf ihre einzigartigen Rollen vorbereitet, Feinabstimmung eines vorab trainierten großen Sprachmodells ermöglicht die Feinabstimmung eines vorab trainierten großen Sprachmodells es ihm, bestimmte Aufgaben effizient und genau auszuführen , sei es Stimmungsanalyse oder maschinelle Übersetzung Das Modell kann in der gewünschten Domäne auf Excel abgestimmt werden. Diese Modelle werden breit gefächert geschult und darauf vorbereitet, Standardaufgaben wie die Textklassifizierung zu bewältigen Standardaufgaben wie die , eine weit verbreitete Aufgabe der Verarbeitung natürlicher Sprache, bei der Text auf der Grundlage seines Inhalts in organisierte Gruppen eingeteilt Beantwortung von Fragen, eine wichtige Aufgabe bei der Verarbeitung natürlicher Sprache, bei der das Modell darauf trainiert wird, Anfragen genau zu verstehen und zu beantworten, wobei im Wesentlichen die menschliche Fähigkeit simuliert zu verstehen Zusammenfassung von Dokumenten, bei der das Modell die Aufgabe eine präzise und flüssige Zusammenfassung eines großen Textes zu erstellen, die Essenz und die Grundideen beizubehalten und Grundideen branchenübergreifend Texte zu generieren, menschenähnlichen Text zu erstellen , der auf eine bestimmte Branche zugeschnitten werden kann, sei es das Verfassen von E-Mails in der Unternehmenskommunikation, Erstellen von Produktbeschreibungen in E-Commerce oder die Erstellung von Patientenberichten Diese Modelle können verfeinert werden, um spezielle Herausforderungen in verschiedenen Sektoren, darunter Einzelhandel, Finanzen und Unterhaltung, zu lösen spezielle Herausforderungen in verschiedenen Sektoren, darunter Einzelhandel, , wobei vergleichsweise kleinere feldspezifische Datensätze Im Einzelhandel können sie beispielsweise für personalisierte Produktempfehlungen auf der Grundlage von Textdaten verwendet werden Produktempfehlungen auf der Grundlage von Textdaten Im Finanzbereich können sie dabei helfen, Markttrends anhand von Finanzberichten vorherzusagen Oder in der Unterhaltungsbranche könnten sie bei der Erstellung von Drehbüchern oder bei der Empfehlung von Inhalten helfen und damit die Flexibilität und breite Anwendbarkeit großer Sprachmodelle unter Beweis stellen Lassen Sie uns das Konzept weiter in drei Hauptmerkmale großer Sprachmodelle unterteilen Große Sprachmodelle sind umfangreich, universell einsetzbar und vorab trainiert und fein abgestimmt. Lassen Sie uns jeden von ihnen einzeln besprechen. Der Begriff groß bezieht sich auf zwei Dinge. Erstens weist er auf die enorme Größe des Trainingsdatensatzes hin , der manchmal die Größenordnung von Petabyte erreicht Zweitens weist es auf die enorme Anzahl der beteiligten Parameter Im Bereich des maschinellen Lernens werden diese Parameter oft als Hyperparameter bezeichnet Im Wesentlichen dienen diese Parameter als Gedächtnis und Wissen, das die Maschine beim Modelltraining gewinnt Sie beschreiben häufig die Fähigkeiten eines Modells bei der Bewältigung einer Aufgabe wie der Textvorhersage Durch die Anpassung dieser Parameter können wir die Leistung des Modells für genauere Vorhersagen optimieren Leistung des Modells für genauere Vorhersagen Allgemein bedeutet , dass die Modelle leistungsstark genug sind , um alltägliche Probleme zu lösen Dieses Konzept basiert auf zwei Gründen. Erstens weist die menschliche Sprache einen universellen Charakter auf, unabhängig von der spezifischen Aufgabe, auf die sie angewendet wird. Zweitens müssen wir die begrenzten Ressourcen berücksichtigen. Nur eine begrenzte Anzahl von Organisationen der Lage, diese riesigen Sprachmodelle zu trainieren, die umfangreiche Datensätze und eine enorme Menge an Parametern erforderlich und eine enorme Menge an Parametern Warum lassen wir diese Organisationen also nicht grundlegende Sprachmodelle entwickeln, die andere nutzen können Das bringt uns zum letzten Aspekt der großen Sprachmodelle, Vorbereitung und Feinabstimmung Im Wesentlichen bedeutet dies, dass ein umfangreiches Sprachmodell zunächst anhand eines umfangreichen Datensatzes, der ein breites Spektrum an sprachlichen Mustern und Kenntnissen erfasst, für breite Anwendungsfälle vorab trainiert anhand eines umfangreichen Datensatzes, der ein breites Spektrum an sprachlichen Mustern und Kenntnissen erfasst, für breite wird. Nach dieser Phase vor dem Training wird das Modell dann anhand eines relativ kleineren, spezialisierteren Datensatzes auf bestimmte Ziele abgestimmt anhand eines relativ kleineren, spezialisierteren Datensatzes auf bestimmte Ziele relativ kleineren, spezialisierteren Datensatzes auf Dieser zweistufige Prozess stellt sicher, dass das Modell eine breite Wissensbasis beibehält und gleichzeitig in der Lage ist, ein tiefes Verständnis zu entwickeln und Vorhersagen zu treffen, die für ein bestimmtes Gebiet oder eine bestimmte Aufgabe Damit schließen wir unsere Einführung in große Sprachmodelle ab. Im nächsten Video werden wir einige der Vorteile der Verwendung von LLMs erörtern der Vorteile der Verwendung von LLMs 11. L3V2 – LMM-Vorteile: In diesem Video werden wir die verschiedenen Vorteile der Verwendung großer Sprachmodelle, kurz LLMs, untersuchen Verwendung großer Sprachmodelle, kurz LLMs Wir werden sehen, wie diese beeindruckenden KI-Modelle für eine Vielzahl von Aufgaben verwendet werden können, wie sie mit minimalen Trainingsdaten funktionieren und wie sie sich weiter verbessern , und wie sie sich weiter verbessern mehr Daten und Parameter hinzugefügt werden Wir werden auch erörtern, wie LLMs an unterschiedliche Lernszenarien anpassen, selbst wenn nur minimale Vordaten vorhanden Hoffentlich können wir anhand der Diskussion dieser Vorteile erkennen, warum LLMs im Bereich der künstlichen Intelligenz einen großen Fortschritt Bereich der künstlichen Intelligenz Einsatz von LLMs bietet viele klare und wirkungsvolle Vorteile Der Einsatz von LLMs bietet viele klare und wirkungsvolle Vorteile . Sie sind nicht auf eine einzige Aufgabe beschränkt. Ein Modell allein ist ein Multitasking-Kraftpaket, das viele verschiedene Rollen erfüllt Diese hochentwickelten LLMs, die auf einer enormen Datenmenge trainiert werden und Milliarden von Parametern entwickeln, sind in der Lage, eine Vielzahl von Aufgaben zu bewältigen Zum Beispiel zeichnen sie sich durch hervorragende Antworten auf Fragen aus. LLMs können ihre umfangreichen Trainingsdaten durchsuchen um die geeignetsten und genauesten Antworten auf eine Vielzahl von Fragen zu finden eine Vielzahl von Fragen zu Sie sind in der Lage, Kontext, Ambiguität und sogar sprachliche Unklarheiten zu verstehen, was sie bei der Beantwortung von Fragen sehr effektiv macht Das Modell generiert eine Antwort Kontext, dem Ton und der Komplexität der Anfrage entspricht, und liefert präzise und kontextuell In Bezug auf die Textgenerierung glänzen LLMs wirklich. Sie können qualitativ hochwertigen Text erstellen, der kohärent, kontextuell angemessen und bemerkenswert menschlich ist kontextuell angemessen und bemerkenswert menschlich Egal, ob es darum geht, eine Nachricht zu generieren, ein Gedicht zu schreiben oder sogar eine fesselnde Geschichte zu erfinden, LLMs Sie können auch bei Aufgaben wie der Erstellung von Inhalten, beim Schreiben und sogar bei der Fertigstellung von Entwürfen behilflich Durch die Berücksichtigung der gegebenen Eingaben und die Nutzung ihrer umfangreichen Wissensbasis können sie Texte erstellen, können sie Texte erstellen die nicht nur grammatikalisch korrekt sind, sondern auch reich an Inhalten die den Anforderungen verschiedener Anwendungsfälle Große Sprachmodelle eignen sich auch hervorragend zur Sprachübersetzung Dank ihrer umfangreichen Trainingsdaten können sie Texte präzise von einer Sprache in eine andere übersetzen einer Sprache in eine andere dabei die semantische Bedeutung und den Kontext des Originaltextes beibehalten und den Kontext des Originaltextes Sie arbeiten nicht nur mit häufig gesprochenen Sprachen, sondern können auch mit weniger verbreiteten Sprachen umgehen, was sie zu einem unschätzbaren Werkzeug für die interkulturelle Kommunikation macht . Darüber hinaus können sie verschiedene Dialekte, Umgangssprache und informelle Sprache verstehen und sich an diese anpassen, wodurch sichergestellt wird, dass die Übersetzungen korrekt, lesbar und wodurch sichergestellt wird, dass die Übersetzungen korrekt, natürlich klingen. LLMs sind auch ein leistungsstarkes Tool wenn Sie können Ideen generieren, alternative Perspektiven vorschlagen und zur kreativen Problemlösung beitragen Egal, ob Sie nach einer einprägsamen Überschrift, einer einzigartigen Marketingstrategie oder einer neuen Handlung für einen Roman suchen, diese Modelle können je nach dem Kontext, den Sie ihnen bieten, zahlreiche Möglichkeiten eröffnen Kontext, den Sie ihnen bieten Durch das Training mit einer Vielzahl von Daten haben sie gelernt, vielfältige und innovative Ideen zu entwickeln , die Sie weiter inspirieren und Ihr Projekt voranbringen können und Ihr Projekt voranbringen Nicht nur das, sie können auch Kritik und Verbesserungsvorschläge zu bestehenden Ideen äußern und als künstlicher Brainstorming-Partner agieren, als künstlicher Brainstorming-Partner agieren zur Verfügung steht Und es gibt noch viel mehr. Neben der Aufgabe, die wir bisher besprochen haben, verfügen LLMs über eine Fülle weiterer Funktionen Sie können beispielsweise in der Stimmungsanalyse verwendet werden, um festzustellen, ob ein Text eine positive, negative oder neutrale Stimmung vermittelt negative oder Sie können bei der Zusammenfassung langer Textteile helfen. LLMs können auch in Nachhilfesystemen eingesetzt werden und bieten Erklärungen für komplexe Themen in einer Vielzahl von Fächern Die Möglichkeiten sind endlos und werden ständig erweitert, da sich diese Modelle ständig weiterentwickeln und verbessern Ein weiterer großer Vorteil großer Sprachmodelle ist ihre Fähigkeit mit minimalen Trainingsdaten, die auf ein bestimmtes Problem zugeschnitten sind, beeindruckende Leistungen zu erbringen ein bestimmtes Problem zugeschnitten sind, beeindruckende Leistungen zu Sie können qualitativ hochwertige Ergebnisse liefern, selbst wenn mit einer kleinen Menge an domänenspezifischen Daten versorgt Aufgrund dieser Qualität eignen sie sich hervorragend für Lernszenarien mit wenigen oder gar keinen Ergebnissen Lassen wir uns hier nicht verwirren. Lassen Sie mich erklären, was der Unterschied zwischen Schusslernen und Schussabgabe ist Wie wir in dem Video zum Thema Prompt Engineering besprochen haben , besteht die Möglichkeit, vor der eigentlichen Anweisung einen Überblick über den Kontext zu geben vor der eigentlichen Anweisung einen Überblick über den Kontext Dieser zusätzliche Kontext kann das Modell dazu anleiten, emotionalere und kontextsensivere Ergebnisse zu erzielen und kontextsensivere Ergebnisse Wir haben auch gesagt, dass es verschiedene Arten von Eingabeaufforderungen gibt : Null-, Eins- und Wenigschussabfrage Zero Shot Prompting stellt das GNAI-Modell das GNAI-Modell Eingabeaufforderung für ein einzelnes Bild bietet ein einziges Beispiel, und bei wenigen Eingabeaufforderungen stehen mehrere Beispiele zur Verfügung, um das Modell zu unterstützen Im Zusammenhang mit maschinellem Lernen bezieht sich Few Shot Learning auf Szenarien, bezieht sich Few Shot Learning auf Szenarien in denen ein Modell anhand eines begrenzten Datensatzes trainiert wird Dieser Prozess ist besonders vorteilhaft in Situationen denen große Mengen an Trainingsdaten nicht verfügbar oder praktikabel sind. Andererseits bezieht sich Zero Shot auf eine noch beeindruckendere Leistungsfähigkeit von Modellen. Dies bedeutet, dass ein Modell Konzepte oder Aufgaben identifizieren und verstehen kann Konzepte oder Aufgaben identifizieren und verstehen , für die es nicht explizit trainiert wurde. Es ist wie ein intelligentes System, das logische Annahmen treffen und Lösungen auf der Grundlage der gewonnenen Erkenntnisse liefern kann logische Annahmen treffen und Lösungen auf der Grundlage der gewonnenen Erkenntnisse liefern , selbst wenn es mit völlig neuen Szenarien konfrontiert wird. Wir können also sehen, dass LLMs dank ihrer Ausbildung auf riesigen Datensätzen auch in Null-Shot-Szenarien hervorragende Leistungen erbringen können dank ihrer Ausbildung auf riesigen Datensätzen auch in Null-Shot-Szenarien ihrer Ausbildung auf riesigen Datensätzen Sie können mit neuen Situationen umgehen, indem sie ihr umfangreiches Wissen nutzen , um angemessene Reaktionen abzuleiten, auch ohne in ihren Trainingsdaten direkt auf das spezifische Szenario gestoßen in ihren Trainingsdaten direkt auf das spezifische Szenario Im Wesentlichen können LLMs schnell an eine Vielzahl von Aufgaben angepasst werden , auch wenn diese Aufgaben außerhalb des spezifischen Bereichs liegen , für den das Modell ursprünglich trainiert wurde Diese Anpassungsfähigkeit eröffnet eine Vielzahl von Möglichkeiten diese Modelle in verschiedenen Bereichen und Anwendungen einzusetzen in verschiedenen Bereichen und Ein wesentlicher Vorteil von LLMs ist ihre stetige Verbesserung, da wir Datenmenge und die Anzahl der Parameter erhöhen , die für ihr Training eine Rolle spielen Stellen Sie sich zum Beispiel den Weg von GPT 3,5 mit 175 Milliarden Parametern zu GPT 4 mit geschätzten 170 Billionen Der exponentielle Anstieg der Parameterzahl führte zu einer deutlichen Verbesserung der Fähigkeiten, des Verständnisses und der Präzision des Modells Dieser Wachstumstrend deutet darauf hin, dass LLMs noch weiter entwickeln können wir die Grenzen der verfügbaren Daten und Rechenressourcen immer verfügbaren Daten und Rechenressourcen GPT four übertrifft GPTs 3.5 aufgrund seiner größeren Anzahl von Parametern deutlich 3.5 aufgrund seiner größeren Anzahl von Parametern Es zeichnet sich durch ein besseres Verständnis von Kontexten und Nuancen aus, liefert genauere Antworten und schneidet besser bei Übersetzungs - und schneidet besser bei Übersetzungs Darüber hinaus ist GPT four besser in der Lage, komplexe Anweisungen zu verstehen, ohne sie in kleinere Schritte zerlegen zu müssen , seine überlegene Fähigkeit zur Anpassung an Null-Shot- und Wene-Schuss-Lernszenarien Anpassung an Null-Shot- und Wene-Schuss-Lernszenarien Und der vierte Vorteil von LLMs besteht darin, dass sie durch die Interaktion in natürlicher Sprache den Zugang zu KI für jeden verbessern, sie durch die Interaktion in natürlicher Sprache den Zugang zu KI für jeden verbessern der über einen einfachen Computer verfügt, sodass keine speziellen technischen Fähigkeiten erforderlich Egal, ob Sie ein Student sind, der Hilfe bei den Hausaufgaben sucht, ein Autor, der Inspiration benötigt, oder ein Geschäftsinhaber, der Markttrendanalysen sucht, LLMs sind hier, LLMs sind hier Ihre Fähigkeiten zur Spracherkennung und zur Synthese menschlicher Stimmen eröffnen Möglichkeiten für Menschen, die möglicherweise Schwierigkeiten beim Tippen haben, oder sogar für Personen, die nicht lesen und Darüber hinaus beseitigen ihre hochwertigen Übersetzungsfähigkeiten Sprachbarrieren, sodass diese leistungsstarken Tools für Menschen mit unterschiedlichen demografischen Merkmalen und Hintergründen nutzbar Menschen mit unterschiedlichen demografischen Merkmalen und Hintergründen Im Wesentlichen verändern LLMs die Art und Weise, wie wir mit Technologie interagieren, und bieten einem breiten Anwenderspektrum weltweit komplexe KI-Fähigkeiten einem breiten Anwenderspektrum Zusammenfassend lässt sich sagen, dass große Sprachmodelle Barrieren überwinden und KI für alle zugänglich machen Mit ihren vielseitigen Fähigkeiten und ihrem sich ständig weiterentwickelnden Potenzial revolutionieren LLMs die Art und Weise, wie wir mit Technologie interagieren wir in die Zukunft blicken, sind wir sicher, dass diese Modelle unser Leben und unsere Arbeit auf unvorstellbare Weise weiter verbessern unser Leben und unsere Arbeit auf unvorstellbare Weise Im nächsten Video schauen wir uns drei Beispiele für die LLMs Palm und Lambda von Google und GPT von Open AI etwas genauer drei Beispiele für die LLMs Palm und Lambda von Google und GPT von Open AI an. Wir sehen uns im nächsten 12. L3V3 – Beispiele für LLMs: In diesem Video sehen wir uns einige Beispiele für große Sprachmodelle an einige Beispiele für große Wir gehen auf die Details von drei hochmodernen LLMs ein, Palm, Lambda und GPT, und wir werden auch einige andere LLMs besprechen, die sich im Bereich der generativen KI als vielversprechend erwiesen haben Beginnen wir also mit Palm, was für Pathways Language Model steht Palm ist ein Sprachmodell mit 540 Milliarden Parametern von Google AI entwickelt wurde. Es basiert auf einem riesigen Datensatz von Texten und Code und kann eine Vielzahl von Aufgaben ausführen, darunter die Beantwortung von Fragen, Inferenz in natürlicher Sprache, Codegenerierung, Übersetzung und Zusammenfassung Es nutzt das Pathways-System von Google, wodurch es an einem riesigen Datensatz aus Text und Code trainiert werden kann einem riesigen Datensatz aus Text Mit 540 Milliarden Parametern ist Palm eines der größten Sprachmodelle der Welt Es handelt sich um ein Transformatormodell mit hoher Dichte, das ausschließlich auf Decoder beschränkt ist, was bedeutet, dass es speziell für Aufgaben zur Erzeugung natürlicher Sprache konzipiert wurde Palm kann bei den meisten Aufgaben eine Leistung mit wenigen Schlägen auf dem neuesten Stand der Technik erreichen , was bedeutet, dass es anhand weniger Beispiele lernen kann was bedeutet, dass es anhand weniger Beispiele lernen kann, eine neue Aufgabe auszuführen Dies macht Palm zu einem leistungsstarken Tool für eine Vielzahl von Anwendungen. Was ist also das Pathways-System? Das Pathway-System ist eine KI-Architektur, die hochwirksam bleibt und gleichzeitig über verschiedene Bereiche und Aufgaben hinweg generiert . Es ist in der Lage, ein einzelnes Modell effektiv auf mehreren TPU V-Four-Pods zu trainieren , denen es sich um maßgeschneiderte Beschleuniger für maschinelles Lernen von Google handelt maßgeschneiderte Beschleuniger für maschinelles Lernen Auf diese Weise kann das Pathway-System viele Aufgaben gleichzeitig erledigen , ein besseres Verständnis der Welt vermitteln und schnell neue Aufgaben erlernen Pathway-Systems erreicht dies durch den Einsatz einer Reihe von Techniken, einschließlich Modellparallelität dieser Technik können mehrere Modelle gleichzeitig mit denselben Daten trainiert werden Dies kann die Trainingsgeschwindigkeit und Effizienz des Pathway-Systems verbessern . Datenparallelität. dieser Technik können mehrere Kopien desselben Modells mit unterschiedlichen Datensätzen trainiert werden Dadurch kann die Genauigkeit des Pathway-Systems verbessert werden, da es aus einer größeren Datenvielfalt lernen und maschinelles Lernen ermöglicht aus einer größeren Datenvielfalt lernen wird Diese Technik ermöglicht es dem Pathway-System, seine Trainingsparameter automatisch zu optimieren Dadurch kann die Leistung des Pathway-Systems verbessert werden, indem verhindert wird, dass es sich zu stark an die Trainingsdaten anpasst Das Pathway-System befindet sich noch in der Entwicklung, hat aber das Potenzial, die Art und Weise, wie wir KI-Modelle entwickeln und einsetzen, zu revolutionieren Indem es Modellen ermöglicht wird, verteilte Berechnungen für Beschleuniger zu orchestrieren , können Pathway-Systeme es einfacher machen, große komplexe KI-Modelle zu erstellen und zu trainieren große komplexe KI-Modelle , die eine Vielzahl von Aufgaben bewältigen können Lassen Sie uns als Nächstes über Lambda, Googles weiteren LLM, sprechen. Lambda steht für Sprachmodell für Dialoganwendungen. Lambda ist eine Familie neuronaler Sprachmodelle, die von Google AI entwickelt wurden Es ist dialogorientiert und verfügt über bis zu 130 Milliarden Parameter, anhand eines Datensatzes von 1,56 Billionen Wörtern vortrainiert wurden Lambda verfolgt drei Hauptziele Qualität, Sicherheit und Diese Ziele werden anhand von Kennzahlen wie Sensibilität, Spezifität, Interesse und Informativität gemessen von Kennzahlen wie Sensibilität, Spezifität, Interesse und Informativität Spezifität, Interesse und Informativität Lambda ist so konzipiert, dass es informativ und umfassend ist und gleichzeitig sicher und fundiert umfassend Es ist in der Lage, verschiedene kreative Textformate wie Gedichte, Code, Skripte, Musikstücke, E-Mails, Briefe und vieles mehr zu generieren verschiedene kreative Textformate wie Gedichte, Code, Skripte, Musikstücke, E-Mails, Briefe und vieles mehr Es wird sein Bestes geben, um alle Ihre Anforderungen zu erfüllen. Lambda hat das Potenzial, die Art und Weise, wie wir mit Computern interagieren, zu revolutionieren Es kann verwendet werden, um natürlichere und ansprechendere Dialogerlebnisse zu schaffen natürlichere und ansprechendere Dialogerlebnisse und Benutzern hilfreichere und informativere Unterstützung zu bieten hilfreichere und informativere Wie bereits erwähnt, Lambda drei Hauptvorteile Ein natürlicher und fesselnder Dialog. Lambda kann einen natürlichen und ansprechenden Dialog mit Menschen Es kann den Kontext einer Konversation verstehen und auf eine Weise reagieren, und auf eine Weise reagieren die sowohl informativ als auch interessant ist Zweitens: hilfreiche und informative Unterstützung. Lambda kann Benutzern hilfreiche und informative Unterstützung Es kann Fragen beantworten, kreative Textformate generieren und Anweisungen befolgen Und drittens, sicher und mit Bodenhaftung. Lambda ist so konzipiert, dass es sicher und geerdet ist. Es basiert auf einem riesigen Datensatz aus Text und Code und ist in der Lage, zwischen sicheren und unsicheren Inhalten zu unterscheiden zwischen sicheren und unsicheren Inhalten Und jetzt kommen wir zu OpenAIs GPT, Abkürzung für Generative Pre GPT ist eine Art Deep-Learning-Modell, das verwendet wird, um menschenähnlichen Text zu generieren Es wurde von OpenAI, einem gemeinnützigen Forschungsunternehmen, entwickelt und von Microsoft finanziert GPT verwendet eine Transformator-Architektur, bei der es sich um eine Art neuronales Netzwerk handelt, das sich gut für Aufgaben zur Verarbeitung natürlicher Sprache eignet Parameter für die neueste Version von GPT, GPT 4 , sind nicht bekannt, aber sie ist wahrscheinlich viel größer als Die Parameter für die neueste Version von GPT, GPT 4 , sind nicht bekannt, aber sie ist wahrscheinlich viel größer als die 3,575 Milliarden GPT-Parameter. Das bedeutet, dass GPT 4 besser in der Lage ist , Sprache zu lernen GPT four hat sich auch bei der Bewertung von Fähigkeiten wie der Anwaltsprüfung als kompetent erwiesen bei der Bewertung von Fähigkeiten wie der Anwaltsprüfung als In einer kürzlich durchgeführten Studie erzielte GPT Four bei der Anwaltsprüfung, einer standardisierten Prüfung, die in vielen Ländern für die Zulassung zur Anwaltskammer erforderlich ist, das 90. Perzentil vielen Ländern für die Zulassung zur Anwaltskammer erforderlich ist, das für die Zulassung zur Anwaltskammer erforderlich GPT ist ein leistungsstarkes Tool, das für eine Vielzahl von Aufgaben verwendet werden kann, darunter das Generieren von Text, das Beantworten von Fragen, das Übersetzen für eine Vielzahl von Aufgaben verwendet werden kann, darunter das Generieren von Text, das Beantworten von Fragen, das Übersetzen von Sprachen und vieles mehr. Zusätzlich zu dem, was wir bisher besprochen haben, gibt es noch andere LLMs, die unsere Sichtweise auf KI verändern und die Zukunft dieses Bereichs mitgestalten Lassen Sie uns einige davon kurz besprechen. Die erste ist eine Tournee mit NLG von Microsoft, einem größeren Sprachmodell auf verschiedenen Internettexten trainiert wurde in der Lage ist , zusammenhängende Absätze und sogar ganze Artikel zu schreiben zusammenhängende Absätze und sogar ganze Artikel Burt by Google, ein revolutionäres, auf Transformatoren basierendes Modell , das anhand eines großen Textkorpus vortrainiert und auf verschiedene Aufgaben der Verarbeitung natürlicher Sprache abgestimmt bietet ein hohes Maß an Verständnis von Kontext und Transformer XL, ein vom Brain-Team von Google entwickeltes Sprachmodell , das auf innovative Weise langfristige Abhängigkeiten in Sequenzen handhabt die Leistung von Aufgaben wie Textgenerierung und Übersetzung erheblich verbessert Aufgaben wie Textgenerierung Es gibt auch Excel Net , eine Erweiterung von Transformer XL, entwickelt von Google Brain und der Carnegie Melon University Es verwendet eine auf Permutationen basierende Trainingsmethode, um einige Einschränkungen von BIRT zu überwinden und es übertreffen Electra ist ein hocheffizienter Trainingsansatz, der von Google Research entwickelt wurde weniger Rechenleistung für eine ähnliche oder sogar bessere Leistung benötigt ähnliche oder sogar bessere Leistung Wir haben Megatron Transformer, ein von Nvidia entwickeltes Modell auf Transformatorbasis, das entwickelt wurde, um sehr große Sprachmodelle mit Milliarden von Parametern zu trainieren mit Es nutzt die Parallelverarbeitungsfunktionen moderner GPUs . Und wir haben Ama von meta eingeführt. Lama ist ein grundlegendes, Lama ist ein grundlegendes, kleineres und dennoch leistungsstarkes Es wurde entwickelt, um den Zugang zur KI-Forschung zu erweitern und benötigt weniger Rechenleistung und Ressourcen, um neue Ansätze zu testen und bestehende neue Ansätze zu testen Lama kann auch in verschiedenen Größen mit 7000000000-65 Milliarden Parametern erhältlich sein. In diesem Video haben wir uns mit den aufregenden Fortschritten bei großen Sprachmodellen befasst bei großen Sprachmodellen dabei auf Palm und Lambda von Google AI sowie GPT von OpenAI konzentriert sowie Wir haben auch andere bemerkenswerte Modelle auf diesem Gebiet hervorgehoben, wie Touring Energy, BRT, XLnt und Mega BRT Wir haben erörtert, wie diese LLMs mit Parametern, die Hunderte von Milliarden erreichen können, das Multitask-Lernen neu definieren und unsere Interaktion mit Computern durch einen ansprechenden Dialog revolutionieren unsere Diese Modelle haben ihre außergewöhnlichen Fähigkeiten bereits bei Aufgaben wie der Textgenerierung und sogar bei praktischen Prüfungen wie der Anwaltsprüfung unter Beweis gestellt Aufgaben wie der Textgenerierung und sogar bei praktischen Prüfungen wie , und sie werden immer besser. 13. L3V4 – Foundation-Modelle: In diesem Video erfahren Sie mehr über Basismodelle, die, wie der Name schon sagt, eine Grundlage für generative KI-Modelle Konkret stellen wir zunächst eine Definition für Basismodelle bereit und erklären, was sie sind. Anschließend werden wir über Plattformen sprechen, die verschiedene Arten von Fundamentmodellen bereitstellen, wobei Schwerpunkt auf dem Modellgarten von Vertex AI Am Ende des Videos werden verschiedene Arten von Fundamentmodellen erörtert Was sind nun Fundamentmodelle? Lassen Sie uns Bart bitten, uns bei der Beantwortung der Frage zu helfen. Es enthält drei verschiedene Entwürfe. Grundmodellen handelt es sich große, vortrainierte neuronale Netze, für eine Vielzahl von Aufgaben wie natürliche Sprachverarbeitung, Computer Vision und Spracherkennung fein abgestimmt werden können Aufgaben wie natürliche Sprachverarbeitung, Computer Vision und Spracherkennung Foundation-Modelle sind umfangreiche Sprachmodelle, die auf riesigen Datensätzen trainiert wurden und für eine Vielzahl nachgelagerter Aufgaben wie Übersetzung, Beantwortung von Fragen und Zusammenfassung fein abgestimmt werden können eine Vielzahl nachgelagerter Aufgaben wie Übersetzung, Beantwortung von Fragen und Zusammenfassung Bei Foundation-Modellen handelt es sich umfangreiche, vorab trainierte Modelle für maschinelles Lernen an eine Vielzahl von Aufgaben wie die Verarbeitung natürlicher Sprache, Computer Vision und Robotik angepasst werden können von Aufgaben wie die Verarbeitung natürlicher Sprache, Computer Vision und Bei Basismodellen handelt es sich also um umfangreiche KI-Modelle, die an eine Vielzahl von Aufgaben angepasst werden können an eine Vielzahl von Aufgaben angepasst und qualitativ hochwertige Ergebnisse liefern können. Auch wenn KI-Modelle für uns nicht brandneu sind, haben etwas ganz anderes diese Basismodelle etwas ganz anderes an sich. Sie sind mit mehreren Schlüsselmerkmalen ausgestattet , die sie von anderen unterscheiden. Sie stellen eine deutliche Veränderung gegenüber den KI-Modellen dar, die wir in früheren Generationen gesehen haben. Fundament-Modelle sind nicht auf eine einzelne Aufgabe beschränkt. Sie sind multitaskingfähig. Ein einziges Basismodell kann eine Vielzahl von Aufgaben sofort bewältigen , wie z. B. Zusammenfassung, Beantwortung von Fragen oder Klassifizierung Sie können verschiedene Modalitäten von Datentypen verarbeiten, darunter Bilder, Text, Code und vieles mehr Mit minimalem oder gar keinem Training können Basismodelle sofort einsatzbereit Sie können auch auf bestimmte Anwendungsfälle zugeschnitten werden , wobei nur eine Handvoll Beispieldaten verwendet werden. Da sie in der Regel mit riesigen Mengen unterschiedlicher Daten trainiert werden , können diese Modelle allgemeine Muster und Repräsentationen erlernen , die dann auf verschiedene Bereiche und Aufgaben angewendet werden können . Bisher war der Zugang zu Basismodellen schwierig. spezielle Fähigkeiten im Bereich maschinelles Lernen und Rechenressourcen erforderlich Einsatz in der Produktion waren spezielle Fähigkeiten im Bereich maschinelles Lernen und Rechenressourcen erforderlich. Aber mit der jüngsten Welle von Fortschritten in der generativen KI ändern sich die Dinge dramatisch Nehmen wir zum Beispiel Vertex AI, eine vollständig verwaltete Plattform für maschinelles Lernen Google Cloud verfügbar ist Wenn Sie bereits mit den Tools von Google Cloud vertraut sind, wissen Sie bereits, dass Sie mit Vertex AI auf verschiedene Modelle für maschinelles Lernen zugreifen, diese erstellen, experimentieren , bereitstellen und verwalten können Dinge wie traditionelle Datenwissenschaft, maschinelles Lernen, MLPs oder einfach die Erstellung einer KI-gestützten Vertex AI ist so ausgestattet, dass es all diese Workloads unterstützt. Das ist ziemlich cool und so, aber hier werden die Dinge wirklich interessant Vor Kurzem hat Google Cloud zwei wichtige Tools angekündigt , die es uns ermöglichen , noch mehr Model Garden und Generative AI Studio zu erstellen. Diese Tools machen Basismodelle einem viel breiteren Publikum zugänglich, auch ohne viel Erfahrung mit Codierung und ML-Entwicklung. Der letzte Abschnitt dieses Kurses ist der Einführung der KI-Tools der Google Cloud Generation gewidmet Einführung der KI-Tools der Google Cloud Generation werden wir mehr über generative KI-Studios sprechen In diesem Abschnitt werden wir mehr über generative KI-Studios sprechen. Konzentrieren wir uns in diesem Video also nur auf den Modellgarten. Wo genau befindet sich der XAI Model Garden? Es ist ein zentraler Ort , an dem Sie sowohl die branchenführenden Modelle von Google als auch beliebte Open-Source-Modelle oder den integrierten EmplopstoLing-Support von Google Cloud für Unternehmen erkunden und mit ihnen interagieren als auch beliebte Open-Source-Modelle oder den integrierten EmplopstoLing-Support und mit von Google Cloud für Unternehmen Es beherbergt sowohl traditionelle Modelle für maschinelles Lernen als auch grundlegende Modelle für generative KI-Anwendungen. In Model Garden finden Sie eine Reihe von Modellen aus Google Cloud, Google Research und verschiedenen externen Quellen, eine Vielzahl von Datenformaten So sieht Model Garden von Vertex AI also Ihnen viele verschiedene einsatzbereite Modelle für Unternehmen einsatzbereite Modelle Model Garden bietet Ihnen viele verschiedene einsatzbereite Modelle für Unternehmen und ermöglicht es Ihnen , je nach Ihrem Anwendungsfall, Ihrer ML-Kenntnisse und Ihrem verfügbaren Budget das am besten geeignete Modell auszuwählen je nach Ihrem Anwendungsfall, Ihrer ML-Kenntnisse und Ihrem verfügbaren Budget das am ML-Kenntnisse und Ihrem verfügbaren Budget Bitte beachten Sie, dass wir Model Garden von Vertex AI als Beispiel für eine Plattform verwenden , die Google Cloud für verschiedene generative KI- und andere Tools und APIs für maschinelles Lernen bereitstellt verschiedene generative KI- und andere Tools und APIs für maschinelles Lernen Es gibt auch andere Unternehmen, die ihre eigenen Versionen von Model Garden haben ihre eigenen Versionen von Model Garden Beispielsweise bieten Amazon Sagemaker, IBM Watson Assistant und Vida Clara, Data IKAI, Open AI Chat GPT API, Microsoft Azores Machine Learning, Microsoft Azores Machine Learning, Data Robot AI und Databricks LakehousePlatform Tools und IBM Watson Assistant und Vida Clara, Data IKAI, Open AI Chat GPT API, Microsoft Azores Machine Learning, Data Robot AI und Databricks LakehousePlatform Tools und APIs sowohl für traditionelle Modelle des maschinellen Lernens als auch für generative KI-Grundmodelle. sowohl für traditionelle Modelle des maschinellen Lernens als auch für generative KI-Grundmodelle. Es gibt verschiedene Arten von Basismodellen, darunter Textgenerierung und -zusammenfassung, Chat und Dialog, Codegenerierung und -vervollständigung, Bildgenerierung und -änderung sowie Einbettungen. Lassen Sie uns nun einen genaueren Blick auf jeden von ihnen werfen. Textmodelle. Diese Modelle helfen Ihnen bei der Ausführung Aufgaben in natürlicher Sprache, ohne oder mit wenigen Eingabeaufforderungen Sie können Aufgaben wie Zusammenfassung, Extraktion von Entitäten und Informationen, Ideengenerierung und vieles mehr Ein Journalist könnte beispielsweise Textmodelle für die Zusammenfassung großer Artikel oder Berichte verwenden Textmodelle für die Zusammenfassung großer Artikel oder Ein akademischer Forscher könnte spezifische Informationen aus einem riesigen Korpus von Papieren extrahieren spezifische Informationen , oder ein Unternehmer könnte das Modell in einer Brainstorming-Sitzung verwenden, um neue Ideen oder Perspektiven zu entwickeln. Wie bereits erwähnt, funktionieren diese Modelle sofort nach dem Auspacken effektiv Wenn Sie jedoch möchten, dass das Modell bestimmten Spezifikationen entspricht, können Sie strukturierte Beispiele als Richtschnur für die Reaktion angeben . Dies ermöglicht ein maßgeschneidertes Erlebnis, das auf Ihre spezifischen Bedürfnisse und Ziele Als Nächstes konzentrieren wir uns auf den Dialog. Diese Modelle basieren ebenfalls auf Text, wurden jedoch so abgestimmt , dass sie eine natürliche Konversation ermöglichen. Dialogmodelle ermöglichen es Ihnen, Konversationen mit mehreren Runden zu führen und dabei den Kontext während der gesamten Interaktion beizubehalten. Stellen Sie sich ein Szenario in einem Kundenservicecenter vor: Ein KI-Chatbot, der auf diesen Dialogmodellen basiert , kann Kunden dabei helfen sich an die vorherige Wendung der Konversation zu erinnern und kontextsensitive Antworten Er kann Fragen beantworten, Informationen zusammenfassen oder Benutzer sogar durch komplexe Verfahren führen oder dabei genau auf Ihre spezifische Domäne abgestimmt sein Diese Modelle können Ihnen dabei helfen, leistungsstarke Tools zu entwickeln , die das Benutzererlebnis erheblich verbessern, unabhängig davon, ob sie in einem Browser, einer mobilen App oder anderen digitalen Schnittstellen eingesetzt einer mobilen App oder anderen digitalen Schnittstellen Weiter zur Vervollständigung und Generierung von Code. Diese Modelle fungieren als Ihr leistungsstarker Programmierassistent. Sie können einen Prom in natürlicher Sprache geben, um einen Code zu beschreiben, den Sie schreiben möchten, oder Sie können das Modell verwenden , um einen Code automatisch zu vervollständigen Es gibt sogar Erweiterungen für IDEs, die einen Teil des Codeausschnitts als Eingabe verwenden und dann die wahrscheinliche Fortsetzung bereitstellen können einen Teil des Codeausschnitts als Eingabe verwenden und dann die wahrscheinliche Fortsetzung bereitstellen Stellen Sie sich vor, Sie arbeiten an einem komplexen Softwareprojekt. Es kann Ihnen helfen, die lästigen Aspekte des Codierens zu vermeiden, sogar beim Debuggen Ihres Codes helfen, sodass Sie sich als Entwickler mehr auf die kreative Problemlösung und weniger auf Syntax oder Routinecode konzentrieren die kreative Problemlösung und weniger auf Syntax oder Lassen Sie uns nun in die Bilderzeugung eintauchen. diesen Modellen können Sie Bilder gemäß Ihren Spezifikationen generieren und bearbeiten. Darüber hinaus können Sie diese Modelle für medienbezogene Aufgaben wie Klassifizierung, Objekterkennung und mehr verwenden diese Modelle für medienbezogene Aufgaben . Darüber hinaus beinhalten solche Modelle in der Regel Mechanismen zur Moderation von Inhalten, um verantwortungsvolle KI-Sicherheitspraktiken zu gewährleisten Stellen Sie sich vor, Sie bauen eine E-Commerce-Plattform auf. Ein Modell zur Objekterkennung kann Artikel in den Produktbildern automatisch kennzeichnen, während ein Modell zur Bilderzeugung neue Produktbilder auf der Grundlage von Beschreibungen erstellen kann . Die Funktion zur Inhaltsmoderation würde sicherstellen, dass alle nutzergenerierten Inhalte Richtlinien Ihrer Plattform entsprechen, wodurch nicht zuletzt die Benutzererfahrung verbessert wird Lassen Sie uns über Einbettungen sprechen, was vielleicht etwas komplex klingt , aber es ist tatsächlich ein wirklich cooles Lassen Sie es mich Ihnen erklären. Stellen Sie sich vor, Sie haben einen riesigen Obstkorb und möchten diese aussortieren. Sie könnten sie nach Farbe, Größe, Gewicht oder sogar Geschmack sortieren . In ähnlicher Weise müssen wir in der Welt der Daten oft Dinge sortieren oder kategorisieren Aber die Dinge, mit denen wir es zu tun haben sind Wörter oder Phrasen, keine Früchte Hier kommen die Einbettungen ins Spiel. Sie sind wie ein einzigartiger Ausweis für jedes Wort oder jede Phrase, aber statt einer Karte ist es eine Liste von Zahlen, die wir einen Vektor nennen Diese Zahlenliste erfasst die Essenz dieses Wortes oder dieser Phrase. Bedeutung ist der Kontext und seine Beziehungen zu anderen Wörtern. Durch Einbettungen können wir unstrukturierte Daten, wie z. B. ein langes Buch oder einen Twitter-Feed, verstehen wie z. B. ein langes Buch oder einen und dieses Verständnis nutzen, um beispielsweise Empfehlungsmaschinen zu unterstützen oder Werbung effektiver auszurichten Denken Sie zum Beispiel an den Bereich E-Commerce. Ein Einbettungsmodell kann verwendet werden , um Empfehlungsmaschinen zu unterstützen, die Nutzer anhand ihres Browserverlaufs den Produkten zuordnen , an denen sie am wahrscheinlichsten interessiert sind anhand ihres Browserverlaufs den Produkten zuordnen , an denen sie am wahrscheinlichsten interessiert Oder im digitalen Marketing können diese Modelle die Systeme zur gezielten Ausrichtung von Anzeigen verbessern und so hochgradig personalisierte Werbung ermöglichen Sie können auch für komplexe Klassifizierungsaufgaben, Suchfunktionen und viele andere Anwendungen verwendet werden. Zusammenfassend lässt sich sagen, dass Fundamentmodelle einen bedeutenden Fortschritt in der KI-Technologie darstellen. Sie bieten eine leistungsstarke, anpassungsfähige Basis , die sofort für eine Vielzahl von Aufgaben verwendet werden kann . Mit Plattformen wie Model Garden von Vertex AI sind diese Tools zugänglicher als je zuvor, sodass erweiterte KI-Fähigkeiten einer viel größeren Anzahl von Benutzern zur Verfügung stehen Von Aufgaben in natürlicher Sprache über Multi-Turn-Dialoge, Code-Implementierung, Bildgenerierung und -modifikation bis Multi-Turn-Dialoge, Code-Implementierung, Bildgenerierung und -modifikation semantischen Informationsextraktion die potenziellen Anwendungen dieser Modelle sind riesig ob es darum geht, den Kundenservice mit KI-Chatbots zu verbessern, Entwickler mit automatisch generiertem Code zu unterstützen oder Empfehlungsmaschinen zu unterstützen — grundlegende Modelle prägen die Zukunft der Mit Basismodellen und der Leistungsfähigkeit generativer KI prognostizieren wir nicht nur Wir bauen es. Im nächsten Video sehen wir einige der erstaunlichen Anwendungen, die verschiedene Arten von generativen KI-Modellen bieten. 14. L3V5 – LLM-Entwicklung: Lassen Sie uns darüber sprechen, wie große Sprachmodelle entwickelt werden. In diesem Video bieten wir zunächst einen Vergleich zwischen der LLM-Entwicklung und der traditionellen Entwicklung des maschinellen Lernens Anschließend werden wir über drei Hauptarten von LLMs sprechen und am Ende ein Konzept namens Chain of Thought Reasoning erörtern und erläutern, wie dieses Konzept dazu beitragen kann, bessere Aufforderungen für LLMs zu entwerfen Lassen Sie uns zunächst die Entwicklung von LLMs unter Verwendung bereits vorhandener Modelle mit dem traditionellen Ansatz der maschinellen Lernentwicklung vergleichen unter Verwendung bereits vorhandener Modelle mit dem traditionellen Ansatz der In der LLM-Welt gibt es keine Voraussetzung für technisches Fachwissen oder umfangreiche Schulungsbeispiele, und raten Sie mal, was? Sie können das Modelltraining auch vergessen. Es dreht sich alles um die Kunst des schnellen Designs, klar, präzise und voller nützlicher Informationen Andererseits erfordert herkömmliches maschinelles Lernen, dass Sie die Ärmel hochkrempeln und sich eingehend mit Schulungsbeispielen und Modelltraining befassen und manchmal sogar Grundkenntnisse über Hardware und Rechenleistung benötigen Hardware und Rechenleistung Es gibt drei Haupttypen von LLMs: generisch, befehlsgesteuert und dialoggesteuert Jedes dieser Modelle erfordert seinen eigenen Aufforderungsstil Generische Sprachmodelle funktionieren wie die automatische Vervollständigung Ihres Smartphones anhand der Sprachmuster der Trainingsdaten das nächste Wort voraus anhand der Sprachmuster der Trainingsdaten das Modelle, die auf Anweisungen abgestimmt sind, reagieren dagegen auf spezifische Anweisungen, egal ob es darum geht, einen Text zusammenzufassen, ein Gedicht im Stil eines berühmten Dichters zu verfassen oder eine Stimmungsanalyse einer Aussage anzubieten Diese Modelle folgen den Anweisungen, die in der Eingabe enthalten Schließlich haben wir Modelle entwickelt, die auf den Dialog abgestimmt sind. Dabei handelt es sich um eine Untergruppe von Modellen, die speziell für den interaktiven Kontext entwickelt wurden, ähnlich wie bei einem Chat mit einem Bot Schauen wir uns also Beispiele für diese drei Arten an und sehen sie uns in Aktion an Bevor wir uns mit Beispielen für verschiedene Arten von LLMs befassen, wollen wir eine Definition für Token geben Ein Token ist eine Dateneinheit , die das Modell verarbeitet. Es kann ein Wort oder ein Teil eines Wortes sein. Wir beginnen mit den generischen Sprachmodellen. Sie sind ziemlich einfach. Ihre Hauptaufgabe besteht darin, das nachfolgende Wort anhand des Kontextes der Trainingsdaten vorherzusagen das nachfolgende Wort anhand . Nehmen wir ein einfaches Beispiel. Die Katze hat darauf gesessen und jetzt wollen wir wissen, was das wahrscheinlichste nächste Wort ist uns das Modell sagt, und das ist diese Antwort Genau wie es die Funktionen zur automatischen Vervollständigung Ihres Telefons vermuten lassen würden Es ist ein faszinierender Einblick, wie KI nachahmen kann, wie wir auf natürliche Weise kommunizieren Kommen wir nun zu Modellen, die auf Anweisungen abgestimmt sind. Diese Modelle glänzen, wenn es darum geht, Antworten zu generieren Sie orientieren sich den Anweisungen in der Eingabe, unabhängig davon, ob es sich um die Aufforderung handelt, einen Text zusammenzufassen, ein Gedicht in einem bestimmten Stil oder sogar eine Textstimmung zu klassifizieren Es ist, als hätten Sie Ihren eigenen digitalen Assistenten, der immer bereit Ihre Anweisungen präzise auszuführen Und schließlich haben wir Modelle, die auf Dialekt abgestimmt sind. Dabei handelt es sich um spezielle Modelle, die auf Anweisungen abgestimmt Sie warten jedoch nicht nur auf Anweisungen. Sie sind darauf trainiert, ein Hin- und Her-Gespräch zu führen. Sie können ihnen normalerweise in Form von Chatbots begegnen ihnen normalerweise in Form von Chatbots Wenn Sie jemals einem virtuellen Assistenten eine Frage gestellt haben, haben Sie wahrscheinlich mit einem solchen Modell interagiert Es geht darum, eine natürliche Konversationsinteraktion zu ermöglichen eine natürliche Konversationsinteraktion Jetzt ist es an der Zeit, ein interessantes Konzept zu untersuchen, die Gedankenkette Dabei handelt es sich um eine Beobachtung, dass Modelle genauere Antworten liefern, wenn sie zunächst einen Argumentationsweg oder eine Kette von Argumenten generieren , die zur Antwort führen Betrachten wir ein einfaches Beispiel. Roger hat fünf Tennisbälle und kauft zwei weitere Dosen mit jeweils drei Bällen Wie viele Bälle hat Roger jetzt? Anfänglich könnte das Modell Schwierigkeiten haben, die richtige Antwort zu geben. das Problem jedoch ein zweites Mal vorgestellt wird, ist es wahrscheinlicher, dass das Modell mit der richtigen Antwort abschließt. Die Argumentationskette trägt dazu bei, das Verständnis und die Reaktionsfähigkeit großer Sprachmodelle zu verbessern das Verständnis und die Reaktionsfähigkeit großer Sprachmodelle Zusammenfassend lässt sich sagen, dass die Entwicklung und der Einsatz umfangreicher Sprachmodelle spannende neue Wege in der Welt des maschinellen Lernens eröffnen spannende neue Wege in der Welt des maschinellen Lernens Während wir diese Technologien weiter verbessern und verfeinern, erwarten wir eine Zukunft, in fortgeschrittene Sprachverständnis durch KI unsere Interaktion mit digitalen Plattformen drastisch verändert unsere Interaktion mit Jetzt, da wir verstehen, wie LLMs entwickelt werden, ist es an der Zeit, herauszufinden, warum es wichtig ist, sie für bestimmte Aufgaben zu optimieren und wie wir LLMs effizient abstimmen können Wir sehen uns im nächsten Video. 15. L3V6 – Tuning von LLMs: In diesem Video werden wir darüber sprechen, wie wichtig es ist, LLMs für bestimmte Aufgaben zu optimieren und wie Es ist ein interessanter Gedanke, ein Modell zu haben , das mit allem umgehen kann In der Praxis sind LLMs jedoch mit einer Reihe von Einschränkungen verbunden Um ihre Zuverlässigkeit und Effizienz zu erhöhen, müssen LLMs auf bestimmte Aufgaben und spezifische Fachkenntnisse abgestimmt werden . Genau wie ein Profisportler seinen Sport spezialisiert hat, müssen diese Modelle ihre Fähigkeiten verfeinern, um ihre Leistung zu verbessern Beginnen wir mit einem einfachen Aufgabenbeispiel. Beantwortung von Fragen. Dies ist eine Unterdomäne der Verarbeitung natürlicher Sprache, bei der es darum geht, beantworten Fragen, die in der Alltagssprache gestellt werden, automatisch zu Diese Q&A-Systeme sind Code in der Lage, eine Reihe von Fragen zu beantworten, von sachlichen bis hin zu meinungsbasierten dank ihrer umfassenden Ausbildung zu Text und Code in der Lage, eine Reihe von Fragen zu beantworten, von sachlichen bis hin zu meinungsbasierten dank ihrer umfassenden Ausbildung zu Text und Code in der Lage, eine Reihe von Fragen zu beantworten, von sachlichen bis hin zu meinungsbasierten Fragen. Die geheime Zutat für diesen Modellerfolg ist Bedenken Sie Folgendes. Wenn Sie ein QA-Modell für den Kundensupport, das Gesundheitswesen oder die Lieferkette entwickeln , wird Fachwissen zu einer wichtigen Anforderung. Im Kundensupport könnte ein auf die Domain abgestimmtes LLM aufschlussreiche Informationen zu Abonnements und Diensten liefern aufschlussreiche Informationen zu Abonnements und Diensten liefern und so sicherstellen, dass Ihre Kunden einen effizienten KI-gestützten Service erhalten effizienten KI-gestützten Im Bildungsbereich können diese Modelle detaillierte Informationen über Kurse, Studiengebühren oder akademische Richtlinien bieten detaillierte Informationen über Kurse, Studiengebühren oder akademische Richtlinien Im Gesundheitswesen könnten sie als Instrumente zur Selbstverwaltung von Patienten dienen und wichtige gesundheitsbezogene Informationen liefern. Einzelhandelsunternehmen könnten von besseren KI-Chatbots und Produktvisualisierungen profitieren und das Kundenerlebnis verbessern Und im Bereich des Lieferkettenmanagements könnten LLMs wertvolle Logistikinformationen und Einblicke in den Bestand bieten wertvolle Logistikinformationen und Und vergessen wir nicht die großen Technologieunternehmen. Sie könnten diese Modelle verwenden, um ihren Kunden erstklassigen technischen Support zu bieten. Jeder Sektor hat seine eigenen Anforderungen, und die Abstimmung eines LLM gemäß diesen Spezifikationen kann die Effektivität des Modells drastisch verbessern Generative Q&A-Modelle können zwar ihre Wissensbasis nutzen , um Fragen zu beantworten , ohne dass spezifische Fachkenntnisse erforderlich sind, Feinabstimmung dieser Modelle auf domänenspezifisches Wissen erhöht ihre Genauigkeit und Zuverlässigkeit erheblich Das ist so, als würde man dem Modell eine detaillierte Karte des Geländes zur Verfügung stellen , auf dem es navigieren soll Nehmen wir als Beispiel Vertex AI. Es bietet aufgabenspezifische Basismodelle , die bereits auf eine Vielzahl von Anwendungsfällen abgestimmt sind Nehmen wir an, Sie möchten die Meinung Ihrer Kunden zu Ihrem Produkt oder Ihrer Dienstleistung besser verstehen Ihrer Kunden zu Ihrem Produkt oder Ihrer Dienstleistung besser Vertex AI verfügt über ein Aufgabenmodell zur Stimmungsanalyse, das genau das Richtige für diese Aufgabe ist Vielleicht sind Sie im Einzelhandel oder in der Immobilienbranche tätig und müssen Belegungsanalysen durchführen Auch dafür gibt es ein aufgabenspezifisches Modell. Diese Modelle, die für bestimmte Aufgaben entwickelt wurden, zeigen, wie wichtig Tuning Sie sind effizienter, zielgerichteter und effektiver bei ihren jeweiligen Aufgaben Die Fähigkeit, ein Modell auszuwählen und zu verwenden, das Ihren spezifischen Bedürfnissen entspricht, kann die Gesamteffektivität Ihrer KI-Lösungen erheblich verbessern Okay, jetzt ist es an der Zeit, formal zu definieren, was wir mit Tuning meinen Tuning bezieht sich auf den Prozess der Anpassung eines vorab trainierten Modells an eine spezifischere Aufgabe, z. B. eine Reihe von benutzerdefinierten Anwendungsfällen oder neue Domäne, indem es anhand neuer Daten trainiert wird. Feinabstimmung wird erreicht, indem das Modell mit neuen Daten trainiert wird, die für die jeweilige Aufgabe relevant sind. Wenn wir beispielsweise im juristischen oder medizinischen Bereich tätig sind , würden wir Trainingsdaten aus diesen Bereichen sammeln , um unser Modell entsprechend abzustimmen. Aber was ist Feinabstimmung? Stellen Sie sich Feinabstimmung als eine hochpräzise Anpassung des Modells vor. Sie bringen Ihren eigenen Datensatz mit und trainieren das Modell neu, was sich auf alle Gewichte im LLM auswirkt Dies kann eine armut- und ressourcenintensive Aufgabe und erfordert das Hosten Ihres eigenen Feinabstimmungsmodells Und das kann es für viele Anwendungsfälle unpraktisch machen. Es ist jedoch wichtig zu wissen , dass ein Feinabstimmungsmodell ein hohes Maß an Genauigkeit und Spezifität verfügt Nehmen wir ein Beispiel aus der Praxis, um die Leistungsfähigkeit der Feinabstimmung zu veranschaulichen Stellen Sie sich ein Modell der Gesundheitsstiftung vor, das umfassend anhand einer Vielzahl von Gesundheitsdaten geschult wurde . Es kann verschiedene Aufgaben problemlos ausführen und medizinische Fragen beantworten, medizinische Bilder analysieren, Patienten mit ähnlichen Erkrankungen finden und vieles mehr. Der Grund für diesen Erfolg ist Feinabstimmung mit domänenspezifischem Wissen. Auf diese Weise wird das Unternehmen eher zu einem Spezialisten als zu einem Generalisten, präzise und zuverlässige Ergebnisse im Gesundheitswesen liefert . Dieser Prozess unterstreicht das enorme Potenzial und die Vielseitigkeit der Feinabstimmung verwandelt ein einheitliches Modell in ein hochspezialisiertes Tool zur Bewältigung komplexer Gesundheitsszenarien Feinabstimmung ist eine hervorragende Möglichkeit , die Leistung eines Modells zu steigern, aber ähnlich wie die Renovierung eines ganzen Hauses kann sie teuer und nicht immer praktikabel sein wir also tun, wenn wir nach einer effizienteren Möglichkeit suchen Was können wir also tun, wenn wir nach einer effizienteren Möglichkeit suchen, große Sprachmodelle zu optimieren Ein Ansatz, den wir verfolgen sollten, sind parametereffiziente Tuning-Methoden, kurz PETM Stellen Sie sich PETM so vor, dass Sie Ihrem Modell ein neues Gesicht geben , anstatt es komplett zu renovieren Normalerweise passen wir bei der Feinabstimmung alle Parameter des Modells an, was kompliziert und zeitaufwändig ist Bei PETM konzentrieren wir uns jedoch darauf, nur eine kleine Teilmenge dieser Parameter zu ändern nur eine kleine Teilmenge dieser oder sogar einige neue hinzuzufügen Vielleicht fügen wir dem Modell einige zusätzliche Ebenen hinzu oder fügen zusätzliche Informationen hinzu Herauszufinden, wie dies am besten geht, ist unter Forschern immer noch ein heißes Thema Die wichtigste Erkenntnis dabei ist, dass PETM wie eine Abkürzung ist. Es hilft uns, die Notwendigkeit zu vermeiden, das gesamte Modell neu zu schulen, was uns Zeit, Mühe und Ressourcen spart Außerdem vereinfacht es sogar die spätere Verwendung dieser Modelle , da wir nur das Basismodell verwenden und unsere zusätzlichen Teile hinzufügen Wir sind nun am Ende unserer Erkundung der Welt der großen Sprachmodelle angelangt . In diesem Abschnitt haben wir wertvolle Einblicke in LLMs gewonnen , beginnend mit einer Einführung in ihre Struktur und Funktion Wir haben die zahlreichen Vorteile der Verwendung von LLMs erörtert und einige Beispiele dafür bereitgestellt, darunter Palm, Lambda Wir haben auch über den Prozess der LLM-Entwicklung gesprochen und hervorgehoben, wie er sich von der traditionellen Entwicklung des maschinellen Lernens unterscheidet des maschinellen Lernens unterscheidet Und vor allem haben wir die Bedeutung der Optimierung von LLMs unterstrichen Wir untersuchen, wie es ihre Zuverlässigkeit und Genauigkeit verbessert Wir haben gesehen, wie domänenspezifisches Wissen erheblich verbessern kann ihre Leistung erheblich verbessern kann, und wir haben mehr über effiziente Optimierungsmethoden wie parametereffiziente Optimierungsmethoden gelernt. Im nächsten Abschnitt werden wir uns mit vier wichtigen Tools in Google Cloud vertraut machen , mit denen wir auf unsere eigenen generativen KI-Anwendungen erstellen können generative KI-Modelle zugreifen und diese verfeinern und . 16. L4V1 – App-Blatt: Lassen Sie uns über Apshet sprechen eine innovative No-Code-Plattform von Google, die die nutzt, um die App-Entwicklung weltweit generativer KI nutzt, um die App-Entwicklung weltweit zu transformieren Stellen Sie sich eine Welt vor, in der jeder, unabhängig von seinen Programmierkenntnissen, schnell datenzentrierte Apps für Google Workspace erstellen kann datenzentrierte Apps für Google Workspace erstellen Genau dafür wurde Apsheet entwickelt. Erinnern Sie sich an den langwierigen Prozess der traditionellen App-Entwicklung, von der Konzeptualisierung bis zur Ausarbeitung von Projektspezifikationen und von der Zusammenarbeit im Team bis zur Programmierung, und von der Zusammenarbeit im Team bis zur Programmierung, es war ein Mit Apsheet wurde der Lebenszyklus der App-Entwicklung jedoch drastisch vereinfacht. Mit Apsheet wurde der Lebenszyklus der App-Entwicklung jedoch drastisch vereinfacht. Was früher Monate gedauert hat, kann jetzt in Tagen oder sogar Stunden erledigt werden, sodass Sie Zeit für wertvollere Das Schöne an Apshet ist seine Vielseitigkeit. Es ermöglicht Ihnen, Apps für mehrere Plattformen zu erstellen, einschließlich Desktop-, Mobil - und Chat-Anwendungen Apsheet bietet eine Reihe von Anwendungen, die so unterschiedlich sind wie Ihre spezifischen Bedürfnisse Es kann sein, dass Sie ein Lager verwalten und eine optimierte Lösung für die Inventarverfolgung benötigen Vielleicht organisieren Sie eine große Firmenveranstaltung und benötigen ein detailliertes Tool zur Veranstaltungsplanung, oder vielleicht führen Sie eine umfangreiche, vielfältige Marketingkampagne und benötigen eine App, um die vielen beweglichen Teile zu koordinieren Vom Kundenbeziehungsmanagement die Koordination der Lieferkette, Personalplanung bis hin zum Projektmanagement Apsheet ist anpassungsfähig genug , um Ihren spezifischen Bedürfnissen gerecht zu Seine Flexibilität und Vielseitigkeit öffnen die Türen zu unzähligen Szenarien machen es zu einer idealen Plattform für Entwicklung maßgeschneiderter datenzentrierter Apps Solange Sie eine klare Vorstellung davon haben, was Sie benötigen, und Sie es in natürlicher Sprache erklären können, kann Apsheet Ihnen helfen, diese Idee in eine Anwendung umzusetzen Lassen Sie uns also tiefer eintauchen. Vor Kurzem hat Apshet neue Funktionen eingeführt alle auf generativer KI basieren Jetzt können Sie Ihre Idee innerhalb weniger Minuten in eine voll funktionsfähige App verwandeln , und zwar in natürlicher Sprache Sie möchten beispielsweise eine App zur Erfassung von Reisekosten erstellen . Alles, was Sie tun müssen, ist, apset Ihren Prozess zu beschreiben. Aphet übernimmt dann das Stellen von Folgefragen , um die Anforderungen Ihrer App besser zu verstehen Sobald Apsheet genügend Informationen gesammelt hat, zeigt es eine Vorschau der Tabellen für Ihre App und bietet sogar Beispieldaten, mit denen Sie diese testen können Anschließend erstellt Upseet die Starter-App für Sie. Sobald die App fertig ist, können Sie sie starten, ausprobieren und alle erforderlichen Anpassungen vornehmen Interessanterweise können Sie weiterhin natürliche Sprache verwenden, um die gewünschten Änderungen zu spezifizieren, und Apsheet hilft Ihnen dabei, Ihre App zu verfeinern Eine App in natürlicher Sprache ohne Programmierung zu erstellen , das ist die Magie von Apsheet Es ermöglicht jedem, schnell und effizient Anwendungen für sein Unternehmen zu entwickeln schnell und effizient Anwendungen für sein Unternehmen zu Schauen wir uns also an, wie Apsheet generative KI nutzt, um dies zu ermöglichen Wenn der Benutzer mit Apheet interagiert, Dialogflow und generative KI zusammen, unterstützt von einem individuell geschulten LLM, arbeiten Dialogflow und generative KI zusammen, unterstützt von einem individuell geschulten LLM, um die für die Erstellung der App erforderlichen Informationen bereitzustellen arbeiten Dialogflow und generative KI zusammen, unterstützt von einem individuell geschulten LLM, um die für die Erstellung der App erforderlichen Informationen bereitzustellen . Dialect Flow sammelt wichtige Informationen über das Geschäftsproblem des Benutzers, anhand derer Apsheet eine Starter-App Apsheet Apsheet versucht, diese App so weit wie möglich an die ideale Lösung des Benutzers anzupassen wie möglich an die ideale Lösung des Benutzers Nachdem Direct Flow die erforderlichen Informationen gesammelt hat, sendet Apsheet eine Anfrage an das LLM, um Unterstützung bei der Generierung des für die App benötigten Datenmodells und der Ansichten Wenn das LLM das richtige Schema bereitstellt, verwendet Apsheet alle gesammelten Informationen, in nur wenigen Minuten eine Starter-App zu erstellen Die bereitgestellte App umfasst eine umfassende Datenbank, eine intuitive App-Oberfläche und alle spezifischen Konfigurationen, und alle spezifischen Konfigurationen die während der Interaktion geäußert wurden, wie z. B. Benachrichtigungseinstellungen wie z. B. Sobald die Starter-App fertig ist, können Benutzer weiterhin mit Apsheet zusammenarbeiten , um die App zu verfeinern und weiter zu verbessern Je nach Komplexität der Anfrage kann Apsheet während dieser Interaktion sowohl Dialogflow als auch LLM verwenden LLM Die Kombination aus Dialect Flow und LLM erweitert die Fähigkeiten von Apheet, sodass es selbst die komplexesten Anfragen zur Anwendungsentwicklung bearbeiten selbst Sie können diese beiden Technologien sogar individuell anpassen . Für den Dialektfluss können Sie ihn so anpassen, dass er Ihnen bei der Erstellung von Benutzeroberflächen für Konversationen hilft . Hier erfahren Sie, wie Sie das machen. Zunächst erstellen Sie einen Dialekt-Flow-Agent. Definieren Sie dann Ihre benutzerdefinierte Absicht und Entitäten. Sobald das erledigt ist, hilft Ihnen die Dialect Flow API dabei, diesen Agenten in Ihre Anwendung zu integrieren diesen Agenten in Ihre Anwendung Im Wesentlichen passen Sie eine ausgeklügelte Technologie an Ihre spezifischen Bedürfnisse an Für das LLM können Sie mit dem generativen KI-Studio von Vertex ein Modell entwerfen Ihrer Anwendung , das den individuellen Anforderungen Diese Plattform bietet eine Reihe grundlegender Modelle von Google Cloud, die Sie an Ihre Bedürfnisse anpassen können Sie können dies erreichen, indem Sie die Eingabeaufforderungen nach Bedarf formulieren und anpassen und die Modelle anhand Ihrer eigenen Daten verfeinern Zusammenfassend lässt sich sagen, dass Appset durch Nutzung generativer KI-Technologien, insbesondere von Googles Dialect Flow und einem speziell geschulten LLM, die Nutzung generativer KI-Technologien, insbesondere von Googles Dialect Flow und einem speziell geschulten LLM, es jedem Einzelnen ermöglicht, datengesteuerte Apps ohne Programmiererfahrung und in sehr kurzer Zeit zu entwickeln datengesteuerte Apps ohne Programmiererfahrung und in sehr kurzer ohne Programmiererfahrung Es hat sich zu einer leistungsstarken Plattform entwickelt, die es Benutzern ermöglicht, verschiedene Apps in natürlicher Sprache zu generieren verschiedene Apps Damit ist dieser Abschnitt über vier leistungsstarke generative KI-Tools Google Cloud verfügbar sind. Im nächsten und letzten Abschnitt dieses Kurses werden wir versuchen, diese Tools zu verwenden, um mithilfe der Möglichkeiten generativer KI unsere eigene Anwendung zu erstellen . 17. L4V2 – Gen-App-Builder: Der Jen App Builder über die Vertex-KI von Google Cloud verfügbar ist verbindet meisterhaft grundlegende Modelle mit der Stärke von Such - und Konversations-KI und ermöglicht es einem neuen Nutzerkreis, innovative generative KI-Anwendungen in kürzester Zeit und ohne Programmierkenntnisse zu innovative generative KI-Anwendungen in kürzester Zeit Der menschenähnliche und ansprechende Charakter von Online-Interaktionen bietet Nutzern die Möglichkeit, ihre Verbindungen zu ihrem potenziellen Publikum zu verbessern ihre Verbindungen zu ihrem Für Unternehmen bedeutet dies eine bessere Kommunikation mit Kunden, Mitarbeitern und Partnern. Mit Jen App Builder Erstellung dieser leistungsstarken GN AI-Anwendungen keinerlei Codierung erforderlich. Denken Sie darüber nach, Ihren personalisierten digitalen Assistenten, maßgeschneiderte Suchmaschinen, Wissensdatenbanken, Bildungsanwendungen und vieles mehr Mit Jen App Builder haben Sie die Möglichkeit, solche Visionen zum Leben zu erwecken Der Jen App Builder verfügt über eine benutzerfreundliche Drag-Drop-Oberfläche, die den Prozess des Designs und der Entwicklung von Apps wesentlich reibungsloser macht Designs und der Entwicklung von Apps wesentlich reibungsloser Es verfügt über einen visuellen Editor, mit dem Sie Ihre App-Inhalte einfach erstellen und ändern können Ihre App-Inhalte einfach erstellen und ändern Die integrierte Suchmaschine ermöglicht es Benutzern, Informationen in der App zu finden, während die Konversations-KI-Engine Interaktionen in natürlicher Sprache ermöglicht Der Jen App Builder bietet also die Flexibilität, ein unternehmensweites Sucherlebnis, ein Konversations- oder Chat-Erlebnis oder sogar beides zu erstellen ein unternehmensweites Sucherlebnis, ein Konversations- oder Chat-Erlebnis oder sogar beides Der Prozess ist einfach. Sie beginnen mit dem Aufbau einer Inhaltsquelle , bei der es sich um ein Word-Dokument oder eine Tabelle mit Informationen über Ihr Unternehmen handeln kann eine Tabelle mit Informationen über Ihr Unternehmen Als Nächstes wählen Sie die Funktionen Sie in Ihre App integrieren möchten Dies kann Suche, Chat oder beides sein. Und wenn Sie fertig sind, klicken Sie einfach auf Erstellen. Aber warte, es gibt noch mehr. dieser App können Sie auch generierte Antworten steuern und anpassen oder Standardantworten erstellen. Wenn das nicht ausreicht, haben Sie jederzeit Zugriff auf eine detaillierte Kontrolle über die Antworten mit Optionen zur Steuerung der Antwortart, zur Festlegung verbotener Begriffe und zur Deaktivierung generierter Antworten, falls erforderlich Aber mach dir keine Sorgen. Auch wenn generierte Antworten deaktiviert sind, kann Ihre GAI-gestützte App dank der Suchtechnologie von Google immer noch komplexe Fragen beantworten dank der Suchtechnologie von Google immer noch komplexe Fragen Jen App Builder kann auch Transaktionen im Namen des Benutzers abschließen Transaktionen im Namen des Benutzers Durch die Integration vorstrukturierter Abläufe für gängige Anwendungsfälle wie die Überprüfung Bestellstatus oder die Erläuterung von Rechnungen können Sie diese Funktionen mühelos mit nur einem einzigen Klick zu Ihrer App hinzufügen . Sie beschränken sich jedoch nicht nur auf die Bereitstellung vordefinierter Funktionen Mit Hilfe einer einfachen graphischen Oberfläche können Sie Ihren individuellen Transaktionsfluss erstellen , um die Geschäftslogik auf hoher Ebene zu skizzieren Wenn Sie es vorziehen, können Sie sogar die auf Eingabeaufforderung basierende Flow-Erstellung verwenden , um Ihre Logik in einer einfachen natürlichen Sprache zu erklären . Sobald Sie mit Ihren App-Konfigurationen zufrieden sind, Sie sie testen. Und wenn alles gut aussieht, integrierten Integrationen von Jen App Builders einen reibungslosen Start Ihrer App auf Ihrer Website oder auf beliebten Messaging-Plattformen Es bietet auch Konnektivität mit Telefoniepartnern. Um Ihre neue App bereitzustellen, benötigen Sie lediglich den Widget-Bereitstellungscode. So einfach ist das. Sie können also sehen, dass Sie mit Jen App Builder Ihre Konversation oder Suche ganz einfach auf einer Website veröffentlichen oder eine Verbindung zu beliebten Messaging-Apps herstellen können Ihre Konversation oder Suche ganz einfach auf einer Website veröffentlichen oder eine Verbindung zu beliebten Messaging-Apps herstellen Jen App Builder nutzt die Leistungsfähigkeit der KI und ermöglicht es Ihnen, Chatbots zu erstellen, die Aufgaben wie die Beantwortung domänenspezifischer Fragen, die Verarbeitung von Multimedia-Eingaben und die Bereitstellung multimodaler Antworten übernehmen können Aufgaben wie die Beantwortung domänenspezifischer Fragen, Verarbeitung von Multimedia-Eingaben und die Bereitstellung Diese Chat-Bots können Benutzer zu relevanten Inhalten führen und generative KI-Antworten auch ohne spezifische Domänenkenntnisse liefern auch ohne spezifische Und sie können Transaktionen abschließen, Informationen mithilfe von KI zusammenfassen und haben die Flexibilität, Konversationen bei Bedarf zu unterbrechen und wieder aufzunehmen Mit Jen Apbilder entwickeln Sie digitale Unterstützung, die die Standards für Online-Interaktionen neu definiert Standards Zusammenfassend lässt sich sagen, dass bei Jen Abuilder die Stärken der aktuellen Gründungsmodelle von Google, Unternehmenssuche und der Konversations-KI, zusammenkommen Es ermöglicht Ihnen, mühelos fortschrittliche Anwendungen zu entwickeln fortschrittliche Anwendungen Die benutzerfreundliche Oberfläche und der visuell ansprechende Editor ebnen den Weg für die Erstellung und Änderung von App-Inhalten Mit Funktionen, die von integrierten Suchmaschinen über eine Konversations-KI-Engine bis hin zu eine Konversations-KI-Engine einer benutzerfreundlichen und intuitiven Oberfläche reichen, bietet Jen App Builder ein umfangreiches Toolkit für Erstellung responsiver Sie können Chatbots erstellen, die multimediale Eingaben, multimodale Antworten und domänenspezifische Fragen Und mit der Fähigkeit, Transaktionen abzuschließen und Konversationen zu unterbrechen und wieder aufzunehmen, sind diese Chatbots mehr als nur Sie sind für die Bewältigung der komplexesten Aufgaben und Interaktionen konzipiert die Bewältigung der komplexesten Aufgaben und Interaktionen lassen sich gleichzeitig einfach veröffentlichen und mit Ihrer Website oder beliebten Messaging-Apps verbinden Fahren wir nun mit dem nächsten interessanten App Builder fort dem nächsten interessanten App Builder auf dem Google Cloud App Sheet verfügbar ist. 18. L4V3 – Maker Suite: Maker SID ist ein intuitives browserbasiertes Tool, das entwickelt wurde, um schnelles und benutzerfreundliches Prototyping mit Palm to Model zu ermöglichen mit Palm Die Integration von Maker SUID mit Palm-API bedeutet, dass wir jetzt auf die API zugreifen können über eine benutzerfreundliche grafische Oberfläche Die Palm-API ist ein Tor zu den großen Sprachmodellen und generativen KI-Tools von Google und ermöglicht ein zeiteffizientes und leicht zugängliches Prototyping dieser Plattform können Sie Modelle schnell testen und mit verschiedenen Eingabeaufforderungen experimentieren Sie können damit Ihre Eingabeaufforderungen erstellen und verfeinern, Ihrem benutzerdefinierten Datensatz synthetische Daten hinzufügen, innovative Einbettungen generieren und Ihre benutzerdefinierten Modelle mühelos anpassen Und wenn Sie sich etwas einfallen lassen, mit dem Sie zufrieden sind, bietet Make Your Suite Ihnen die Möglichkeit, es in Python-Code umzuwandeln, sodass Sie das Modell mithilfe der Palm-API aufrufen können. Palm API und Maker Suite sind das perfekte Duo für die generative KI-Entwicklung. Palm API ist Ihr Ausgangspunkt für den Zugriff auf die LLMs von Google und gibt Entwicklern die Freiheit, Modelle zu verwenden , die für verschiedene Aufgaben optimiert Auf der anderen Seite bietet Maker Suite eine intuitive Oberfläche, über die Sie mit dem Prototyping und der Erstellung Ihrer einzigartigen Apps beginnen Prototyping und der Erstellung Ihrer einzigartigen Lassen Sie uns nun einen Einblick in die Maker Suite werfen und sehen, wie wir in wenigen Minuten mit dem Prototyping mit großen Sprachmodellen beginnen können in wenigen Minuten mit dem Prototyping mit großen Sprachmodellen So sieht es also in der Maker Suite aus. Schauen wir uns dieses Menü auf der linken Seite an. Hier können wir neue Eingabeaufforderungen erstellen. Wie wir sehen können, gibt es drei verschiedene Arten von Eingabeaufforderungen, mit denen wir Textansagen, Datenaufforderungen und Chat-Eingabeaufforderungen erstellen können Datenaufforderungen und Chat-Eingabeaufforderungen Wir haben auch Zugriff auf unsere Bibliothek, die aktuelle Seite, die gerade geöffnet ist Wenn Sie sich ApiKey holen, können wir hier sehen, dass wir die Möglichkeit haben, einen API-Schlüssel für ein neues Projekt zu erstellen einen API-Schlüssel für ein neues Projekt Und es sind auch andere Quicklinks verfügbar. Es gibt eine Anleitung für den Einstieg. Es gibt eine Galerie mit Eingabeaufforderungen, der Sie verschiedene Arten von Eingabeaufforderungen erkunden können Es gibt eine API-Dokumentation und weitere Informationen zu Datenschutzbestimmungen und Nutzungsbedingungen Kehren wir nun zu unserer Bibliothek zurück und probieren verschiedene Eingabeaufforderungen aus Die erste ist eine Textaufforderung. Lass es uns versuchen. Hier gibt es also interessante Dinge zu entdecken. Das Erste, was auffällt, sind diese Beispielaufforderungen. Es gibt einige Beispiele , die uns helfen sollen, eine bessere Vorstellung davon zu bekommen , wie diese Eingabeaufforderungen aussehen könnten Wenn Sie auf Lehrbücher achten, können wir außerdem feststellen, dass uns einige Beispiele zur Verfügung gestellt werden Lasst uns einige davon lesen. Kategorisieren Sie einen Apfel als Obst oder Gemüse. Schreiben Sie eine JavaScript-Funktion und erklären Sie sie mir. Paraphrase, es sieht so aus, als würde es gleich regnen und viele andere Beispiele Es zeigt nur, welche Art von Eingabeaufforderungen Sie als Beispiele für eine Textaufforderung verwenden können als Beispiele für eine Textaufforderung verwenden Schauen wir uns nun eines der Beispiele an, die hier bereitgestellt werden Schauen wir uns gelegentliche Überlegungen an. Die Aufforderung wäre also, dies in eine zufällige E-Mail umzuschreiben, und dann geben Sie einen Text für eine Ich kann auf Ausführen klicken und jetzt kann ich sehen, dass das Sprachmodell eine Antwort auf meine Aufforderung erstellt hat Lassen Sie uns die andere Art von Aufforderung untersuchen, die Datenaufforderung. Hier können wir also sehen, dass es zwei verschiedene Teile gibt. Die erste ist eine Tabelle zum Schreiben unserer Prompt-Beispiele. Und der zweite Teil soll uns helfen, unsere Eingabeaufforderung zu testen. Schauen wir uns also ein Beispiel an und sehen, wie es aussehen würde. Versuchen wir es mit Gegensätzen. In den Beispielen sehen wir, dass wir vier verschiedene Beispiele dafür bereitstellen , was jede dieser Eingaben als Ausgabe erhalten sollte Wenn unsere Aufforderung also darin besteht, ein Wort oder eine Phrase mit entgegengesetzter Bedeutung zu finden, können wir Beispiele angeben, z. B. wenn die Eingabe stark ist, sollte die Ausgabe schwach sein. Wenn die Eingabe dick ist, sollte die Ausgabe dünn sein und so weiter. Nachdem wir diese Beispiele bereitgestellt haben, können wir unsere Eingabeaufforderung testen. Jetzt fragen wir nach dem Sprachmodell. Wenn die Eingabe falsch ist, was wäre die Ausgabe? Und wenn die Eingabe schnell ist, was sollte die Ausgabe sein? Und wenn wir jetzt laufen, sehen wir, dass das Sprachmodell als Antwort auf falsch richtig erzeugt, und wenn es um schnelle Eingaben geht, erzeugt das Sprachmodell langsam. Wir können sehen, dass das Sprachmodell für jede Eingabe das Gegenteil als Ausgabe erzeugt. Lassen Sie uns die dritte Art von Aufforderung untersuchen, die Chat-Aufforderung. Hier können wir auch sehen , dass es zwei Teile gibt. Es gibt einen Teil zum Schreiben unserer Prompt-Beispiele und einen weiteren Teil zum Testen unserer Prompts. Schauen wir uns also einige dieser Beispiele an. Lass uns versuchen, mit einem Alien zu chatten. Im Beispiel bieten wir also einen gewissen Kontext. Sei ein Außerirdischer, der auf einem der Jupitermonde lebt , und führe ein Beispielgespräch Wenn der Benutzer sagt, wie geht's, sollte das Modell sagen: Mir geht es gut und so weiter Wenn Sie weitere Beispiele hinzufügen möchten, haben wir hier unten die Möglichkeit. Und jetzt können wir unser Modell testen. Als Antwort sagen wir, ich würde es gerne besuchen. Was sollte ich tun? Aber das Modell bietet eine Antwort, die relevant ist und die Konversation fortsetzt. Wir können weiter mit dem Modell interagieren , indem wir weitere Eingabeaufforderungen schreiben Im Folgenden haben wir auch einige Optionen zum Tunen des Modells. Die erste ist eine Textvorschau derselben Aufforderung, an der wir gerade arbeiten. Egal, ob es sich um eine Tabellenaufforderung oder eine Chat-Eingabeaufforderung handelt, wir können immer auf die Textversion derselben Aufforderung zugreifen . Mit der anderen können wir unser Modell verfeinern. Wir können wählen, welche Art von Modell wir verwenden möchten. Wir können die Temperatur festlegen , die den Grad der Zufälligkeit oder Kreativität des Modells definiert , und wir können auch die Anzahl der Ausgaben anpassen , die das Modell erzeugen soll Es sind auch einige erweiterte Einstellungen verfügbar. Um es noch einmal zusammenzufassen: Zunächst wählen wir unseren Prompt-Typ aus und geben einen Prompt wählen wir unseren Prompt-Typ aus und geben einen Prompt mit Beispielen und Anweisungen Unabhängig davon, welche Art von Aufforderung Sie verwenden, haben Sie immer die Möglichkeit , sie in Textform zu sehen Wenn Sie die Ausgabe des Modells testen müssen, können Sie mit Make Your Suit ganz einfach Eingabeaufforderungen auf unterschiedliche Weise wiederverwenden, indem Sie Testeingaben in Ihren Eingabeaufforderungen verwenden Wir haben auch die Flexibilität, mit den Modellparametern herumzuspielen Zum Beispiel gibt es die Option, die Temperatureinstellung zu optimieren, was das Zufallselement der Modellantworten beeinflusst Zufallselement der Modellantworten Ein höherer Wert führt hier oft zu unerwarteteren oder sogar kreativeren Ergebnissen Wir können auch zusätzliche Anpassungen an Parametern wie Stoppsequenzen, Anzahl der Ausgänge usw. vornehmen. Und schließlich, wenn Sie mit Ihrer Aufforderung zufrieden sind, können Sie sie speichern, teilen und sogar in verschiedene Entwicklerumgebungen exportieren. Zum Speichern Ihrer Eingabeaufforderungen bietet Maker Suite eine Funktion zur Eingabeaufforderungsbibliothek, die als sicherer Speicherplatz für all Ihre Eingabeaufforderungen dient sie für zukünftige Referenzen leicht abrufbar macht Sie können Ihre Eingabeaufforderungen auch auf Ihrem Google Drive speichern. Das Teilen Ihrer Aufforderung ist so einfach wie das Klicken auf die Schaltfläche Teilen Und wenn Sie Ihre Arbeit in eine Entwicklerumgebung exportieren möchten , einfach auf die Schaltfläche Code abrufen. Sie können Ihre Eingabeaufforderungen in dem für Sie passenden Format exportieren. Python- oder JavaScript-Code, JSON-Objekte oder sogar als CURL-Befehl Ihre Arbeit in Maker Suite, einschließlich der Einstellungen, Anweisungen und Testbeispiele , in diesem Codeausschnitt gespeichert Zusammenfassend lässt sich sagen, dass die Kombination aus Palm API und Make Your Suite einen unglaublich bequemen und benutzerfreundlichen Ansatz für das Prototyping mit großen Sprachmodellen bietet einen unglaublich bequemen und benutzerfreundlichen Ansatz Prototyping mit großen Sie legen die Macht der generativen KI in Ihre Hände und bieten Ihnen die Flexibilität, zu experimentieren, zu optimieren und zu verfeinern, bis Sie die perfekte KI-gestützte Anwendung entwickelt haben die perfekte KI-gestützte Wir sehen uns im nächsten. 19. L4V4 Generatives KI-Studio: Da die Begeisterung für generative KI zunimmt, können wir sehen, dass ihre Fähigkeit, den Prototyping-Prozess von Anwendungen zu beschleunigen , ein entscheidender Faktor ist Wenn Sie Zugriff auf die richtigen Tools wie das Generative AI Studio und andere GNAI-Funktionen haben die richtigen Tools wie das Generative AI Studio , die jetzt über Vertex AI in Google Cloud verfügbar sind , können Sie im Handumdrehen experimentieren, anpassen und neue Ideen perfektionieren Und mit Snap meine ich Minuten oder Stunden statt Wochen und Monate Das Erstellen einer App ist so einfach wie das Öffnen des generativen KI-Studios im Vertex AI-Bereich der Google Cloud Console Wählen Sie die Modalität aus, mit der Sie arbeiten möchten, wählen Sie Ihr bevorzugtes Format und geben Sie Ihre Eingabeaufforderung ein und passen Modellparameter an, um zusätzliche Kontrolle zu Mit Generative AI Studio haben Sie die Möglichkeit, generative KI-Modelle zu erforschen und anzupassen , die perfekt in Ihre Google Cloud-Anwendungen passen Sie können diese Anwendungen sogar in Ihre Website oder mobile App einbetten . In diesem Video werden wir das generative AI Studio untersuchen, das auf Vertex AI verfügbar ist Lassen Sie uns vorher kurz sehen, welche anderen Tools auf Vertex AI verfügbar sind So sieht die KI in Vertex aus. Wenn wir das Menü auf der linken Seite erweitern, können wir alle Tools sehen , die uns zur Verfügung stehen Wir können sehen, dass wir Zugang zu einem Modellgarten, einer Werkbank und Rohrleitungen Wir haben auch ein generatives KI-Studio, das wir in Kürze sprechen werden Darüber hinaus verfügen wir über Tools für Datenmanagement, Modellentwicklung sowie Modellbereitstellung und -nutzung. Generative AI Studio unterstützt Entwickler bei der Erstellung und Bereitstellung von Modellen, indem es Tools und Ressourcen bereitstellt, die den Einstieg erleichtern. Mit Generative AI Studio können Sie schnell eine Vielzahl von Google-Grundmodellen durch Eingabeaufforderungen und Optimierungen testen und anpassen Google-Grundmodellen durch Eingabeaufforderungen und Optimierungen testen und . Außerdem können Sie Ihre optimierten Modelle einfach bereitstellen In Generative Va Studio können Sie auf die grundlegenden Sprach -, Vision- und Sprachmodelle von Google zugreifen -, Vision- und Sprachmodelle Die Verfügbarkeit einiger Modalitäten ist unterschiedlich. Sie können beispielsweise sehen, dass Zeitpunkt der Aufnahme dieses Videos ich zum Zeitpunkt der Aufnahme dieses Videos keinen Zugriff auf Vision-Modelle habe Konzentrieren wir uns also auf Sprache und Sprache. Konzentrieren wir uns vorerst auf Sprache. Sie können entweder im Menü links auf die Sprache oder auf die Schaltfläche „Öffnen“ unten im Sprachfeld klicken. Wenn Sie eine bessere Vorstellung davon bekommen möchten, wie Sie GN AI Studio für verschiedene Zwecke verwenden können, sollten Sie sich die Galerie mit den Eingabeaufforderungen ansehen. Bevor wir uns also mit den verschiedenen Arten von Eingabeaufforderungen befassen, wir einen Blick auf die Galerie der Eingabeaufforderungen Hier sehen wir eine Vielzahl von Beispielaufforderungen, die vordefiniert sind, um die Modellfunktionen zu demonstrieren Die Beispielaufforderungen sind nach Aufgabentypen wie Zusammenfassung, Klassifizierung und Extraktion kategorisiert wie Zusammenfassung, Klassifizierung und Extraktion Schauen wir uns ein Beispiel an. Wenn Sie die Beispielaufforderung öffnen, können Sie sehen, dass die Eingabeaufforderungen mit einem bestimmten Modell und bestimmten Parameterwerten vorkonfiguriert sind mit einem bestimmten Modell und bestimmten Parameterwerten vorkonfiguriert Sie können also einfach auf Senden klicken und das Modell veranlassen, eine Antwort zu generieren Um direkt mit den Sprachmodellen zu arbeiten, haben wir drei Möglichkeiten. Interagiere mit dem Modell in freier Form oder mit strukturierter Aufforderung, interagiere mit dem Agenten als Chatbot oder erstelle ein maßgeschneidertes Modell , das besser für unsere Testfälle geeignet ist Lassen Sie uns den Text oder die Codeaufforderung in einem freien Format untersuchen Codeaufforderung in einem freien Format Lassen Sie uns also versuchen, Ihre eigenen Eingabeaufforderungen zu entwerfen und zu testen. Hier kann ich dem Modell eine Aufforderung geben und es bitten, eine Antwort zu Ich habe hier gerade einen langen Artikel bereitgestellt und bitte das Model, eine kurze Zusammenfassung für den folgenden Artikel bereitzustellen . Für verschiedene Arten von Ansagen kann ich auch mein Mikrofon verwenden und direkt mit dem Model sprechen Auf der rechten Seite können wir auch sehen, dass es einige Einstellungen gibt , mit denen wir das Modell konfigurieren können Wir können wählen, welche Art von Modell wir verwenden möchten. Hier haben wir zwei Sprachmodelle und zwei DE-Modelle. Wir können die Temperatur für das Modell festlegen, die den Grad der Zufälligkeit oder Kreativität bestimmt Wir können auch das Token-Limit festlegen, das die maximale Textmenge bestimmt, die von einer Eingabeaufforderung ausgegeben Top K ändert, wie das Modell Token für die Ausgabe auswählt. Top P ändert, wie das Modell Tokens für die Ausgabe auswählt, und wir können auch verschiedene Sicherheitsfilter-Schwellenwerte festlegen Jetzt können wir das Modell bitten , eine Antwort auf unsere Aufforderung zu Klicken wir auf Senden. Und wir können sehen, dass das Modell den langen Artikel in drei Zeilen zusammenfasst den langen Artikel in drei Zeilen Wenn Sie nur ein paar Eingabeaufforderungen ausführen möchten, steht Ihnen eine strukturierte Vorlage für Eingabeaufforderungen zur Verfügung, die Ihnen die Arbeit erleichtert , indem sie ein Formular mit Kontext und Beispielen bereitstellt Für strukturierte Eingabeaufforderungen kehren wir zu unserem Beispiel für die Weinklassifizierung zurück Wir können dem Modell einen gewissen Kontext geben, der angibt, wie das Modell reagieren soll Wir können dem Modell auch mehrere Beispiele geben. Diese Beispiele helfen dem Modell zu verstehen, wie eine angemessene Reaktion des Modells aussieht. Wir haben auch unsere Einstellungen auf der rechten Seite. Wir haben auch die Möglichkeit, weitere Spalten für komplexere Beispiele hinzuzufügen . Und um das Modell zu testen, geben wir einen Input, sei es, indem wir ihn in den Eingabebereich schreiben oder direkt mit dem Modell sprechen. Und wenn ich auf Senden klicke, generiert das Modell eine Antwort für mich. Wir können jede strukturierte Aufforderung problemlos in eine freie Form umwandeln. Und so sieht es aus. Sie können wählen, ob Sie einen Text- oder Code-Chat initiieren möchten, um eine Konversation mit dem Model zu beginnen. Sie können Kontext und Beispiele für Interaktionen angeben , um die Konversation weiter zu lenken. Alle Einstellungen für die Modellkonfiguration sind auch hier verfügbar. Versuchen wir es jetzt mit einer Chat-Aufforderung. In der Chat-Eingabeaufforderung haben wir die Möglichkeit, dem Modell einen Kontext zu geben , der es darüber informiert, wie es reagieren soll Wir können auch Beispiele angeben, damit das Modell versteht, wie eine angemessene Antwort aussehen würde Wenn der Benutzer dies beispielsweise sagt, sollte das Modell dies sagen. Wir haben auch die Möglichkeit, weitere Beispiele für das Modell bereitzustellen. Nachdem wir genügend Kontext und Beispiele bereitgestellt haben, können wir mit dem Agenten chatten. Wenn Sie also fragen, wie viele Planeten es im Sonnensystem gibt, liefert das Modell eine angemessene Antwort. In ähnlicher Weise können wir andere Fragen stellen, und das Modell liefert immer wieder angemessene und genaue Antworten, die mit den von uns angegebenen Beispielen übereinstimmen. Sehen wir uns nun an, wie wir mithilfe unserer eigenen Datenbank ein optimiertes Modell erstellen können . Wir haben die Möglichkeit , ein Modell so zu optimieren , dass es für unsere Anwendungsfälle besser gerüstet ist. Schauen wir es uns an. Hier können wir also unseren JSON-Datensatz auswählen und einen Speicherort für den Datensatz in der Cloud festlegen. Nachdem wir den Datensatz bereitgestellt haben, können wir die Modelldetails optimieren, und danach können wir das Modell auf der Grundlage unseres Datensatzes und unserer Einstellungen optimieren . Um zu entscheiden, welches Modell für unsere spezifischen Anwendungsfälle am besten geeignet ist, können wir uns die Google-Bibliothek mit Basismodellen ansehen, die in Model Garden verfügbar ist. In Model Garden können Sie Modelle nach Modalität, Aufgabe und anderen Funktionen untersuchen , Aufgabe und anderen Funktionen Ihnen viele verschiedene einsatzbereite Modelle, Model Garden bietet Ihnen viele verschiedene einsatzbereite Modelle, sodass Sie je nach Anwendungsfall, Ihrer Expertise im Bereich maschinelles Lernen und Ihrem verfügbaren Budget das am besten geeignete Modell auswählen je nach Anwendungsfall, Ihrer Expertise im Bereich maschinelles Lernen und Ihrem verfügbaren Budget das am besten geeignete Modell Expertise im Bereich maschinelles Lernen und Ihrem verfügbaren Budget Okay, Zeit, sich die Sprachmodelle anzusehen. Jetzt ist es an der Zeit, die Sprachmodelle zu untersuchen. Wir können die Sprache entweder aus dem Menü auf der linken Seite oder durch Klicken auf Öffnen unter dem Sprachfeld auswählen . Hier haben wir zwei verschiedene Optionen Text zu einer Rede oder Sprache zu Text. Gehen wir zu Text-to-Speech. Hier können wir entweder den Text bereitstellen oder direkt mit dem Modell sprechen. Nachdem wir den Text bereitgestellt haben, haben wir einige Optionen, um verschiedene Sprachen auszuwählen oder die Sprachgeschwindigkeit festzulegen. Wenn alles gut aussieht, können wir auf Senden klicken. Und jetzt haben wir eine synthetisierte KI-Stimme, die diesen Text für uns lesen kann Das Erstellen einer App ist so einfach wie das Öffnen des generativen KI-Studios im Vertex AI-Bereich der Google Cloud Wählen Sie die Modalität aus, mit der Sie arbeiten möchten, und wählen Sie Ihr bevorzugtes Format Für erweiterte Funktionen wie die Unterstützung längerer Audiodaten können wir Speech Studio verwenden , und so sieht die Umgebung aus Wir haben auch Sprache-to-Text. Hier können wir entweder eine Audiodatei hochladen oder unsere eigene Stimme aufnehmen. Und nachdem wir dem Modell die Sprache gegeben haben, können wir sehen, dass es daraus Text macht. Jetzt habe ich meine Stimme aufgenommen und auf Senden geklickt . Und hier ist meine Rede in Text umgewandelt. Wir können das Speechs-Studio auch für Speech-to-Text-Anwendungen verwenden . Beide Funktionen, Speech-to-Text und Text-to-Speech , sind im Sprachstudio verfügbar. Nachdem Sie Ihr Modell angepasst haben , stehen Ihnen einige Optionen zur Verfügung. Sie können die Aufforderung in der Eingabeaufforderungsgalerie speichern. Sie können die Lösung auch auf der Plattform für maschinelles Lernen von Vertex AI für Produktion und Verwaltung einsetzen Plattform für maschinelles Lernen von Vertex AI für Produktion und Verwaltung Oder Sie können Ihre neu optimierten Modelle direkt in Ihre Website und Anwendungen implementieren Ihre neu optimierten Modelle direkt in Ihre Website und Anwendungen Zusammenfassend lässt sich sagen, dass wir über das Generative AI-Studio von Vertex AI auf Sprach-, Seh - und Sprachmodelle zugreifen können - und Sprachmodelle Mithilfe von Sprachmodellen sind wir in der Lage, generative KI-Sprachmodelle zu testen , zu optimieren und einzusetzen Wir können auch auf die Palm- oder Cody-API für Inhaltsgenerierung, Chat, Zusammenfassung, Code und mehr zugreifen die Palm- oder Cody-API für Inhaltsgenerierung, Chat, Zusammenfassung, Code und Mit Vision-Modellen können wir mithilfe der Imagine-API Textanweisungen schreiben , um neue Bilder zu generieren , um neue Bilder Wir können auch neue Bereiche für ein vorhandenes Bild generieren. Und mit Sprachmodellen können wir Sprache mithilfe der Chirp-API in Text umwandeln Wir können auch Sprache aus Text synthetisieren , indem wir das Universal Speech Model oder USM von Google verwenden Damit ist dieses Video über generative Va Studio auf Vertex AI 20. Demo- App-Blatt-Demo: In unserem Einführungsvideo zu Apsheet haben wir gesehen, dass wir mit Apsheet benutzerdefinierte Apps erstellen können , ohne Vor Kurzem hat Google GNAI-Funktionen hinzugefügt, denen wir direkt erklären können , welche Art von App wir benötigen erstellt Grundlage dieser Erklärung wird uns eine Starter-App Wir können die Starter-App dann nur noch weiter modifizieren und anpassen , indem wir mit Apheet chatten Betrachten wir das folgende Beispiel. Anne Gray ist Managerin in einem Unternehmen und eine ihrer Aufgaben besteht darin , die Reiseanfragen ihrer Mitarbeiter Diese Anfragen können aus E-Mails, Chats oder Besprechungen stammen , was ziemlich überwältigend sein kann Sie fragt sich, ob die generative KI-Funktion in Apsheet ihr helfen kann, ihre Abläufe zu rationalisieren , indem sie eine Lösung für die Genehmigung und Nachverfolgung Um es auszuprobieren, beschließt sie, die Apsheet-Chat-App zu erkunden , die auf Google Chat verfügbar ist Mal sehen, wie es funktioniert. Um auf diese Chat-Funktion zuzugreifen, gehen wir zu chat.google.com Dann wählen wir Apps entdecken und suchen die Apshet-Chat-App. Lassen Sie uns nun sehen, wie der Prozess aus Anns Sicht aussehen würde Auf der ersten Seite können wir sehen, dass Apsheet den Benutzer begrüßt und ihn auffordert, eine Beschreibung einer App oder eines Geschäftsproblems einzureichen , das er lösen möchte Zum Beispiel durch die Beschreibung eines Workflows. diesem Zweck beschreibt An kurz , was sie benötigt — etwas, um den Prozess für Manager zu vereinfachen Reiseanfragen entgegenzunehmen und zu genehmigen Sie ergänzt die Beschreibung, indem sie notiert, welche Art von Daten sie auch im Auge behalten muss. Nach Eingabe der Aufforderung antwortet Ushid mit einem allgemeinen App-Schema Von Anns erster Aufforderung an hat Upshd erkannt, dass die App über einen Genehmigungsablauf verfügen sollte, und bittet sie, auszuwählen, wie die Benachrichtigungen zur Genehmigungsanfrage gesendet werden sollen Wie wir sehen können, stehen hier verschiedene Optionen zur Verfügung, wobei vorerst nur E-Mail ausgewählt wird Als Nächstes schlägt Apshet einige Bildschirme vor, sie vielleicht hinzufügen möchte, ein Formular, über das Benutzer neue Anfragen einreichen können, eine Reiseübersicht, bevorstehende Reisen und einige andere Ansichten Diese Bildschirme sind im Grunde das Rückgrat von Annes App-Schema Es beschreibt, worum es in ihrer App geht. Sie möchte keinen M Travel-Bildschirm in ihrer App haben, also deaktiviert sie ihn, um ihn aus der App zu entfernen, und klickt dann auf App Apsheet nun weiß, was für Ann's Travel Request App zusammengestellt werden muss, bestätigt es die Tabellen, die in der Apsheet-Datenbank erstellt werden könnten Diese Datensätze werden auf der Grundlage der Bildschirme oder App-Ansichten erstellt , die sie Upsheet erstellt zwei Tabellen zur Unterstützung von Schema, Travel und Team Wir haben noch keine Daten in unsere App eingegeben, daher werden all diese Tabellen leer sein Wenn wir keine Daten in der App haben, wie können wir dann testen, ob alles funktioniert? Daran dachte ich auch verärgert. Nach dem Erstellen der Tabellen bietet Upseet die Möglichkeit, Beispieldaten in die App aufzunehmen Anne ist bereit, die App zu testen, also entscheidet sie sich für Ja. Und schließlich fordert apseet Anne auf, einen Namen für ihre App zu wählen A nennt dieses Symbol Reisen, und das war's. nächste Antwort von Apshet ist ein Link zu einer voll funktionsfähigen Vorschau der App, die gerade erstellt wurde wir eine Pause und schauen wir zurück auf das, was wir bisher getan haben Durch nur ein paar Fragen und Antworten war apseet in der Lage, Anns Anfrage, die in natürlicher Sprache verfasst war, zu beantworten, und ich habe verschiedene Lösungen empfohlen, einschließlich der Bildschirme, die ihre App-Nutzer sehen müssen Die Dinge, die sie tun müssen, und der Ort, an dem die Daten gespeichert werden sollen Es wurde sogar die E-Mail-Benachrichtigung für Benutzer eingerichtet. Das Erstellen einer App in natürlicher Sprache ohne Codierung ist eine Magie, die jetzt in App Sheet Realität ist Es ermöglicht vielen neuen Benutzern, Anwendungen schnell und effizient zu entwickeln Anwendungen schnell und Im weiteren Verlauf hat Anne die Möglichkeit, entweder eine Vorschau der App anzuzeigen, die für sie erstellt wurde, oder zur Anpassung in den Ashoot-Editor einzutauchen Sie entscheidet sich dafür, zuerst einen kurzen Blick auf die Vorschau zu werfen. Während sie durch den App-Emulator auf ihrem Desktop navigiert, erkundet sie die von Apsis generierten Ansichten , angefangen bei neuen Reisen über Reisen pro Benutzer bis hin zu bevorstehenden Reisen In dieser letzten Ansicht werden sowohl eine Karte als auch eine Liste zukünftiger Reisen angezeigt , die alle mit den Beispieldaten gefüllt sind, für die sie sich zuvor entschieden hat Bisher scheint alles in Ordnung zu sein. Ann bemerkt jedoch, dass eine Ansicht, die sie im Sinn hatte, in der App fehlt. Sie hat eine besondere Ergänzung im Sinn, nämlich einen Bildschirm, der alle Reiseanfragen in einem umfassenden Dashboard zusammenfasst der alle Reiseanfragen in einem umfassenden Dashboard dem Finanzteam eine Antwort auf häufig gestellte Fragen bietet eine Antwort auf häufig gestellte Fragen Wie hoch sind die Gesamtkosten für die Reisen der einzelnen Mitarbeiter? Im Editor und bemerkt, dass die generative KI-Funktion, die sie zuvor verwendet hat , auch hier verfügbar ist. Sie tippt ihre Anfrage für ein neues Dashboard ein, und in kürzester Zeit nimmt Abscht ihre Anfrage entgegen, analysiert sie und schlägt die notwendigen Komponenten für diese Sie schlägt eine neue berechnete Spalte für ihre Teamtabelle und gibt eine Vorschau auf das Diagramm , das die aggregierten Daten darstellen wird, genau wie sie es zuvor getan hat, und möchte jeden Teil der vorgeschlagenen Änderungen überprüfen Also schaut sie sich das Vorschaudiagramm an. Und es sieht gut aus. Dann überprüft sie die neue Spalte in der Datenbank, um sicherzustellen, dass alles in Ordnung ist Sie verwendet den bereitgestellten Link, um die vorgeschlagene Änderung in der Genehmigungstabelle in der ASHEET-Datenbank zu sehen die vorgeschlagene Änderung in der Genehmigungstabelle in der ASHEET-Datenbank wirft einen kurzen Blick auf die Zahlen und bestätigt, dass die neue Ansicht und die Datenänderungen ihren Erwartungen entsprechen Sie genehmigt die Änderungen im Apsheet-Editor und das war's Ihre App ist jetzt live und einsatzbereit und sie hat das Gefühl, dass sie das hat, was sie braucht Ihr Vertrauen in die Tabellen und Spalten, die Apseet für sie geschaffen hat, ist hoch Da sie mit der Funktionalität ihrer App zufrieden ist, sie die Beispieldaten, stellt die App bereit und gibt sie an ihr Team Jetzt kann ihr Team diese verbesserte Version der App sehen und damit beginnen, ihre Reiseanfragen einzureichen Ein paar Wochen später, während Anne im Intranet ihres Unternehmens einem bestimmten Formular sucht, kommt ihr eine Idee Anne geht zurück zum Herausgeber. weiß, wie oft ihr Team Google Chat verwendet, erwägt sie, die Apsheet-Chat-App ohne Code zu nutzen Auf diese Weise könnte ihr Team das erforderliche Formular einfach per Chat mit Symbol Travel abrufen das erforderliche Formular einfach per Chat mit Anne geht zurück zum Editor und aktiviert Symbol Travel als Chat-App für die internen Bereiche ihrer Domains Dieser Schritt ermöglicht es Annes Kollegen , ihren Google-Chatbereichen, Gruppenchats oder sogar privaten Konversationen symbolische Reisen hinzuzufügen . Jetzt ist es an der Zeit, die Einstellungen durchzugehen . Standardmäßig zeigt die Symbol Travel Chat App den Benutzern eine Liste aller zugänglichen App-Ansichten an. Anne entwickelt diese Chat-Version jedoch speziell für Endbenutzer. Die Mitarbeiter, die die App hauptsächlich verwenden möchten , um Reiseanfragen einzureichen. Sie wählt nur die für ihre Benutzer erforderlichen App-Ansichten aus, was bedeutet, dass sie alles außer Anfrageformularen löschen muss . Als Nächstes fügt sie eine Willkommensnachricht für ihre Benutzer hinzu, die einen gewissen Kontext zur Interaktion mit dem Chat bietet . Sie beschließt, einen Slash-Befehl einzufügen. Durch das Hinzufügen dieses Befehls öffnet die Chat-App jedes Mal, wenn ein Benutzer den Schrägstrich NETRIP sofort das Reiseantragsformular Aphit bietet auch einen intelligenten Suchbefehl. Dieser Befehl würde es ihren Teamkollegen ermöglichen, die Pipeline zur Verarbeitung natürlicher Sprache von Aphts zu verwenden Pipeline zur Verarbeitung natürlicher Sprache von Aphts ihre App nach Daten oder Ansichten zu durchsuchen Sie entscheidet sich jedoch dafür, die Dinge einfach zu halten und deaktiviert den Ihre letzte Aufgabe besteht darin, eine Automatisierung einzurichten, Benutzer benachrichtigt werden, wenn sich der Status ihrer Reisegenehmigung ändert Auf dieser Seite können Sie mithilfe einer grafischen Oberfläche den richtigen Ablauf erstellen . Auf diese Weise kann sie die Grundlage für die erforderliche Automatisierung schaffen die Grundlage für die erforderliche Automatisierung Sobald sie fertig ist, benennt sie ihre Automatisierung, optimiert einige Details darüber, wann sie ausgeführt werden soll und wie Antworten Threads zusammengefasst werden sollen, und kehrt zum Chat-App-Builder zurück, um die Dinge abzuschließen Dank Apshts ohne Code wird die Chat-App bereitgestellt und sie muss sich nicht um weitere Konfigurationen kümmern, damit ihre App oder deren Automatisierung Upshet kümmert sich mit einem einzigen die gesamte Konfiguration der Google Cloud-Plattform Klick um die gesamte Konfiguration der Google Cloud-Plattform hinter den Kulissen Jetzt ist sie bereit, ihre Chat-App mit dem Team zu teilen . Und da ist es. Die Chat-App ist jetzt live und kann von ihrer gesamten Organisation installiert und verwendet werden. Nehmen wir nun an, Jeffrey Clark, ein Mitglied von Anns Team, beschließt, die App zu verwenden Jeffrey benötigt eine Genehmigung für seine Reisepläne, um die Räumlichkeiten des Kunden zu besuchen Er hat die Symbol Travel Chat App bereits installiert und schreibt daher den Schrägstrich New Trip Command, schreibt daher den Schrägstrich New Trip Command um das Reiseantragsformular aufzurufen Jeffrey gibt alle notwendigen Details zu seiner bevorstehenden Reise in das Formular ein und klickt auf Senden Von Annes Seite aus kann sie sehen, dass Jeffreys Anfrage fast augenblicklich auftaucht Die neue Genehmigungsanfrage löst eine E-Mail-Benachrichtigung an Marcus Jeffreys Manager Marcus erhält eine E-Mail mit Einzelheiten zu Jeffreys Nachdem er die Einzelheiten der Einreichung geprüft hat, genehmigt Marcus das Formular direkt von seinem Gmail-Konto aus Innerhalb weniger Sekunden bemerkt Jeffrey eine Chat-Benachrichtigung von Symbol Travel Die Nachricht ist die Bestätigung der Reisegenehmigung. Herzlichen Glückwunsch Jeffrey und gute Reise. Abschließend haben wir die Leistungsfähigkeit der generativen KI-Funktion von App Sheets gesehen die Leistungsfähigkeit der generativen KI-Funktion von App Sheets Es half Ann, eine Lösung für die Verwaltung der Reiseanfrage ihres Teams in natürlicher Sprache und ohne Code zu entwickeln und anzupassen Reiseanfrage ihres Teams . An hat eine geschäftliche Herausforderung effizient gelöst und eine App für Reiseanfragen entwickelt, die genau auf die Bedürfnisse ihres Teams zugeschnitten ist. Die nahtlose Integration mit Google Chat und der reibungslose Ablauf, der sich in Jeffreys Reiseanfrage und der schnellen Genehmigung von Marcus zeigt Jeffreys Reiseanfrage und , unterstreichen die Zugänglichkeit und Effizienz der Plattform Das ist die Stärke von No-Code-Entwicklung. APSheetsGenerative KI revolutioniert die No-Code-Entwicklung und macht sie zugänglich, effizient und intuitiv

KI der Generation 0 – 100: Von den Grundlagen zu Google Cloud-Tools

Reza Moradinezhad, AI Scientist

Schau dir diesen Kurs und Tausende anderer Kurse an

Schau dir diesen Kurs und Tausende anderer Kurse an

Einheiten dieses Kurses

1.

Einführung in GenAI

2:50

2.

L1V1 – Traditionelle KI

18:42

3.

L1V2 – Maschinelles Lernen

19:10

4.

L1V3 – Deep Learning

14:55

5.

L1V4 – Diskriminativ vs. Generativ

11:54

6.

L2V1 – Transformatoren

7:53

7.

L2V2 – Gen-KI

14:52

8.

L2V3 – Gen-KI-Anwendungen

12:47

9.

L2V4 – Prompt Engineering

11:24

10.

L3V1 – LLMs

6:41

11.

L3V2 – LMM-Vorteile

10:23

12.

L3V3 – Beispiele für LLMs

10:13

13.

L3V4 – Foundation-Modelle

12:51

14.

L3V5 – LLM-Entwicklung

5:23

15.

L3V6 – Tuning von LLMs

8:54

16.

L4V1 – App-Blatt

6:56

17.

L4V2 – Gen-App-Builder

6:11

18.

L4V3 – Maker Suite

10:16

19.

L4V4 Generatives KI-Studio

12:56

20.

Projekt-Demo- App-Blatt No-Code App Builder

12:06