Transkripte
1. Einführung in GenAI: Es gibt viele Kurse zum Thema
generative KI. Ich habe viel Zeit damit verbracht, viele
davon
durchzugehen , weil ich
sichergehen wollte, dass
ich Ihnen in diesem Kurs alle
Grundlagen vermittle, die Sie
benötigen, um vollständig zu verstehen,
was generative KI ist Darüber hinaus werde ich Ihnen einige
praktische Beispiele und einige praktische Demos
zu verschiedenen Tools
geben, verschiedenen Tools die generative KI verwenden und Ihnen
heute helfen können Ich bin Professor Reza und
unterrichte Studenten und
Doktoranden
Themen zu Informatik und Ich habe auch Tausende
von Online-Studenten. Ich habe über KI geforscht und mit
renommierten Instituten
wie DEM MIT Media Lab, der
Carnegie Mellon University, der
Harvard University
und der
University of California San Diego zusammengearbeitet renommierten Instituten
wie DEM MIT Media Lab, der
Carnegie Mellon University, der
Harvard University
und der
University of California San Diego Und die Ergebnisse dieser
Arbeiten wurden an Orten wie
Springer Nature und ACL veröffentlicht Orten wie
Springer Ich werde all diese Erfahrungen und alles
andere
, was ich
in all diesen Zeiten gelernt habe, nutzen Erfahrungen und alles
andere
, was ich
in all diesen Zeiten gelernt habe, , um Ihnen
mitzuteilen, wie Sie die
Transformation von
traditioneller KI zu allgemeiner KI
verstehen können die
Transformation von
traditioneller KI zu allgemeiner KI
verstehen traditioneller KI zu allgemeiner KI Dieser Kurs ist in
fünf verschiedene Abschnitte unterteilt. Im ersten Abschnitt werden
wir uns traditioneller künstlicher
Intelligenz befassen. Wir werden definieren was künstliche Intelligenz ist. Wir behandeln auch, was
maschinelles Lernen ist, und erörtern verschiedene
Arten von maschinellem Lernen, einschließlich unbeaufsichtigtem
Lernen, überwachtem Lernen und verstärkendem
Lernen. Außerdem
werden wir Deep Learning und
den Unterschied zwischen
diskriminativem Deep Learning
und generativem Deep Learning erörtern den Unterschied zwischen
diskriminativem Deep Learning
und generativem Deep Learning und generativem Im zweiten Abschnitt werden
wir erörtern, wie man zwischen
generativer KI
und traditionellem
maschinellen Lernen
unterscheidet und traditionellem
maschinellen Dann werden wir
über generative KI sprechen und einige
Beispiele für generative KI nennen. Wir werden diskutieren, was
Transformatoren sind und wie sie das Spiel der
künstlichen Intelligenz verändern. Wir werden auch
Themen wie
schnelles Engineering und
Fundamentmodelle behandeln. Anschließend werden wir verschiedene
Arten generativer KI besprechen und in diesem Abschnitt
einige Beispiele für Codegenerierung mithilfe
von KI vorstellen. In Abschnitt drei werden wir große Sprachmodelle
diskutieren. Wir werden sie vorstellen und auch einen Vergleich zwischen
LLM und generativer KI
anbieten Außerdem werden wir
die Vorteile von LLMs erörtern In Abschnitt vier werden wir
über verschiedene Arten von
Tools sprechen, die uns Google Cloud zur
Verfügung stellt, damit wir
generative KI für
unsere eigenen Projekte verwenden können generative KI für
unsere eigenen Im letzten Abschnitt werde ich eine Demo
bereitstellen, wie sie mithilfe
generativer KI
erstellt ohne eine
einzige Codezeile zu schreiben. Wenn Sie also gerne
erfahren möchten, was generative KI ist und wie Sie sie in
Ihrem täglichen Leben einsetzen können , lassen Sie uns eintauchen.
2. L1V1 – Traditionelle KI: In diesem Video geben wir eine Einführung in die traditionelle
künstliche Intelligenz Künstliche Intelligenz
ist eine Disziplin wie Physik oder Chemie. Es ist ein Zweig der
Informatik, sich mit
der Schaffung intelligenter Agenten befasst. Dabei handelt es sich um Systeme, die selbstständig
argumentieren, lernen und handeln können selbstständig
argumentieren, lernen und handeln Formeller ausgedrückt ist
KI die Theorie
und Entwicklung von
Computersystemen, ist
KI die Theorie
und Entwicklung von die
Aufgaben ausführen können, die normalerweise
menschliche Intelligenz erfordern Einer der Teilbereiche der
KI ist maschinelles Lernen. Maschinelles Lernen ist ein Programm oder System, das das
Modell anhand von Eingabedaten trainiert Dieses trainierte Modell kann
nützliche Vorhersagen anhand neuer oder noch
nie dagewesener Daten treffen,
die aus denselben Daten stammen , mit denen das Modell trainiert wurde. Maschinelles Lernen gibt Computern die Möglichkeit, ohne
explizite Programmierung zu lernen. Ein weiterer Teilbereich der
KI ist Deep Learning. Deep Learning ist eine Art von maschinellem Lernen, das
künstliche neuronale Netzwerke verwendet Künstliche neuronale Netze sind von der Struktur
des menschlichen Gehirns
inspiriert
und können verwendet werden, um
komplexe Muster zu verarbeiten , die herkömmliche Algorithmen für
maschinelles Lernen nicht können. Wir werden
später in diesem Abschnitt ausführlicher auf maschinelles Lernen und
Deep Learning eingehen . Aber vorher wollen wir einen Überblick über KI
geben. Der Rest dieses Videos ist wie folgt
strukturiert. Zunächst werden wir
ein Beispiel aus der Praxis für den Einsatz
künstlicher Intelligenz geben . Dann werden wir einen
kurzen Überblick über die Geschichte der KI geben. Als Nächstes werden wir versuchen zu
verstehen, was künstliche
Intelligenz ist, und dann behandeln wir
verschiedene Arten von KI, verschiedene Anwendungen von KI
und diskutieren auch, wie die
Zukunft der KI aussehen wird. Wenn wir darüber sprechen,
dass KI unser Leben einfacher macht, sind
Smart Homes ein
guter Anfang. So funktioniert es.
In einem intelligenten Haus haben
wir Haushaltsgeräte
und sprachgesteuerte Sensoren. Sie sind wie Ihr
persönlicher Assistent,
der das Licht und die Klimaanlage
an das Wetter draußen anpasst der das Licht und die Klimaanlage an das Wetter draußen anpasst Dann ist da noch das
Sicherheitssystem. Es ist immer auf der
Hut, erkennt jede ungewöhnliche Bewegung draußen und alarmiert Sie sofort Hier ist der wirklich coole Teil. All diese Geräte
sprechen miteinander. Sie sind verbunden und können sogar mit Ihrem Auto
kommunizieren. beispielsweise das
Garagentor öffnen, wenn Sie Ihre Einfahrt
betreten,
und das Ganze auffüllen, können
Sie all
diese Geräte
von Ihrem Telefon aus verwalten ,
wo auch immer Sie sind KI kann so viel für uns tun. Aber bevor wir uns
von den Anwendungen ablenken
lassen, sollten wir jetzt einen Schritt
zurücktreten und uns damit
befassen , wie künstliche
Intelligenz entstanden ist Hier ist eine Zeitleiste der
künstlichen Intelligenz. 1950 entwickelte
Alan Turing den Touring-Test,
einen Test der
Fähigkeit einer Maschine,
intelligentes Verhalten zu zeigen , das dem eines Menschen
entspricht oder sich
von diesem unterscheidet 1956 prägte John McCarthy
den Begriff künstliche
Intelligenz und organisierte das Dartmouth Summer
Research Project
on Artificial Intelligence,
die erste Konferenz zum Thema KI Dartmouth Summer
Research Project
on Artificial Intelligence,
die erste Konferenz zum Thema KI. 1969 wurde Shake the
Robot gebaut, erste Obwohl
Shake nach
heutigen Maßstäben einfach ist, markierte es doch einen Meilenstein
in der KI-Entwicklung, indem die
Fähigkeit
demonstrierte,
Daten zu verarbeiten und
Aufgaben zielgerichtet auszuführen. 1997
besiegte Deep Blue den
Schachweltmeister Gary Kasparov Das erste Mal, dass ein Computer einen Menschen in
einem komplexen Spiel
besiegt hatte einen Menschen in
einem komplexen Spiel
besiegt Der Sieg von Deep Blue war ein
großer Durchbruch für KI und
demonstrierte die Fähigkeit von Computern, zu lernen und sich anzupassen. Im Jahr 2002 wurde der erste kommerziell erfolgreiche
Roboterstaubsauger eingeführt. Und im Jahrzehnt 2005-2015 wurden
eine Reihe neuer KI-Technologien entwickelt, entwickelt darunter Spracherkennung, robotergestützte
Prozessautomatisierung oder RPAs, tanzende Roboter, Smart Homes und selbstfahrende 2016
besiegte AlphaGo, ein
von Google Deep Mind entwickeltes Computerprogramm, ein
von Google Deep Mind entwickeltes Computerprogramm, den
Go-Weltmeister Der Sieg von Alpha Go war ein
wichtiger Meilenstein für KI und
demonstrierte die
Fähigkeit von Computern komplexe
strategische Spiele
zu meistern Im Jahr 2017 wurde die
Transformator-Technologie in einem Artikel mit dem Titel
Attention Is All You Need
vorgestellt. Die Transformer-Technologie
wird heute häufig bei Aufgaben zur
Verarbeitung
natürlicher Sprache wie
maschineller Übersetzung und
Textzusammenfassung Im Jahr 2020 wurde GPT Three, ein großes Sprachmodell, das
von OpenAI entwickelt wurde GPT Three ist in der Lage, Text in menschlicher Qualität zu
generieren, Sprache zu
übersetzen und verschiedene
Arten von kreativen Inhalten zu schreiben Und schließlich werden 2023 die
KI-Tools der
Google Cloud Generation veröffentlicht, die
Entwicklern eine Reihe von Tools zum Erstellen und
Bereitstellen von KI-Anwendungen Im selben Jahr wurde Bart, ein großes Sprachmodell, das
von Google AI entwickelt wurde, veröffentlicht. Kunst ist in der Lage,
Ihre Fragen
informativ zu beantworten , auch wenn sie offen,
herausfordernd oder seltsam sind. Dies ist nur ein kurzer
Überblick über die Geschichte der KI. KI ist ein sich schnell
entwickelndes Gebiet, und
es werden ständig neue Fortschritte erzielt. Es wird interessant sein zu sehen,
was die Zukunft der KI bereithält. Wir haben eine ziemliche Reise
mit künstlicher Intelligenz hinter uns. Beginnend
mit Turings
bahnbrechenden Tests in
den 1950er Jahren mit Turings
bahnbrechenden Tests wurde 1956 der Begriff künstliche Intelligenz geprägt, und eine neue Ära Im Laufe der Jahre
erlebten wir Meilensteine
wie die Entwicklung
unseres ersten
mobilen Allzweckroboters Shaki 1997
besiegten Computer Schachmeister,
und jetzt, im Jahr 2023,
erleben wir hochentwickelte Sprachmodelle wie GPT Es ist ein bisschen wie die
Computerrevolution der 80er, aber dieses Mal dreht sich alles
um KI Beherrschung dieser neuen und
leistungsstarken Tools wird immer
wichtiger , da sich das Tempo der Fortschritte in der KI Das Potenzial ist immens, ähnlich wie bei diesen
Computervisa Machen Sie sich also bereit für diese
aufregende Reise, die vor uns liegt. Es geht nicht nur darum, zu beobachten was die Zukunft
der KI bringen wird, sondern darum,
diese Zukunft selbst mitzugestalten. Künstliche
Intelligenz verstehen. KI ist ein Zweig der
Informatik, der intelligente Maschinen entwickelt
, die menschenähnliche Aufgaben wie
Spracherkennung,
Objektidentifikation,
Lernen, Planung
und Problemlösung ausführen
können menschenähnliche Aufgaben wie
Spracherkennung, Objektidentifikation, . Erinnerst du dich an den Computer
,
der den Schachmeister überlistet hat , oder den Computer, der
deine Hausbeleuchtung steuert? Das ist KI, die
Probleme löst, genau wie wir. Unser derzeitiges Verständnis
von KI basiert weitgehend darauf wie sie mit uns interagiert und wie sie im Vergleich zu
menschlichen Fähigkeiten Dinge wie
Spracherkennung und Objekterkennung sind heute
ein wichtiger Bestandteil der KI Es geht um die Fähigkeit, Informationen aufzunehmen,
daraus
zu lernen und sie
zur Planung und Bewältigung zukünftiger Aufgaben zu nutzen . Aktivitäten, die sehr menschlich sind. Das
ist gewissermaßen die Magie der KI. Um KI richtig zu verstehen, müssen
wir
drei Konzepte verstehen verschiedene Arten von KI, verschiedene KI-Anwendungen und verschiedene Möglichkeiten
für die Zukunft der KI. Lassen Sie uns nun mit
verschiedenen Arten von KI beginnen. Es gibt viele
verschiedene Arten von KI, aber sie können grob in vier
verschiedene Kategorien
eingeteilt werden. Die erste ist reaktive KI. Reaktive KI-Systeme können nur auf den aktuellen
Zustand der Welt reagieren. Sie haben keine
Erinnerung an vergangene Ereignisse und können nicht
für die Zukunft planen. Ein Beispiel dafür ist ein Schachroboter, der
nur einer Reihe
logischer Anweisungen folgt und auf der Grundlage des Zuges
des Gegners
richtig reagiert . Die zweite Art von KI
ist KI mit begrenztem Speicher. Diese Systeme können sich an
vergangene Ereignisse erinnern und diese
Informationen verwenden, um Entscheidungen zu treffen. Sie
können jedoch nicht über die Zukunft nachdenken oder die
Absichten anderer Akteure verstehen. Ein Beispiel dafür könnte ein Antrag eines Abgeordneten
sein , der auf der Grundlage Ihrer
früheren Besuche
Restaurants vorschlägt . Die dritte Art
künstlicher Intelligenz ist die Theorie der geistigen KI. Diese Systeme können
die Gedanken und Absichten
anderer Akteure verstehen . Dies ermöglicht es ihnen,
mit anderen Agenten zusammenzuarbeiten und Ziele
zu erreichen, die für
einen einzelnen Agenten unmöglich
wären . Eine Möglichkeit, wie Theory of Mind KI die
Art und Weise, wie wir mit
Maschinen interagieren, revolutionieren
könnte , ist die Entwicklung von Robotern, die in der Lage sind, Menschen, die
einsam oder isoliert sind, Gesellschaft
und Unterstützung zu
bieten Menschen, die
einsam oder isoliert sind, Gesellschaft
und Unterstützung zu , oder durch virtuelle Assistenz, die in der Lage
sind,
unsere Bedürfnisse zu verstehen und uns mit
den Informationen und der
Unterstützung zu versorgen , Die vierte Art von
KI ist selbstbewusste KI. Selbstbewusste KI ist eine
hypothetische Art von KI, die bewusst
ist und ihre eigenen subjektiven Angenommen, wir haben eine persönliche
Roboterassistentin namens Eve. Wenn Eve eine selbstbewusste KI wäre, würde
sie nicht einfach
vorprogrammierten Anweisungen folgen oder auf unsere Befehle reagieren Stattdessen würde sie
ihre eigene Existenz verstehen und ihre eigenen
Gefühle und Gedanken haben Wenn wir
Eve zum Beispiel bitten, ein Buch
aus der Bibliothek zu holen, würde
eine normale KI
einfach
den kürzesten Weg berechnen und das Buch holen Eine selbstbewusste KI wie
Eve könnte jedoch darüber nachdenken, ob es ein schöner Tag für
einen Spaziergang ist , oder darüber nachdenken,
ob sie in letzter Zeit
zu viele Bücher geholt hat, und stattdessen ein
E-Book vorschlagen Es ist wichtig zu beachten
, dass diese Art von
selbstbewusster KI derzeit rein
hypothetisch ist Einige Forscher glauben, dass es sich um
eine zukünftige Möglichkeit handelt, die es
wert Lassen Sie uns nun auf die
Anwendungen der KI eingehen. künstlicher Intelligenz geht es nicht nur darum,
menschliche Fähigkeiten nachzuahmen, sondern auch darum, unsere Fähigkeiten
zu erweitern und die Effizienz
in vielen verschiedenen Bereichen zu steigern Vom Transportwesen
bis zum Gesundheitswesen, Finanzdienstleistungen
bis hin zum Kundensupport und von Bildung bis Unterhaltung das Potenzial von
KI scheint grenzenlos
zu sein Hier sind einige Beispiele dafür,
wie KI heute eingesetzt wird. Selbstfahrende Autos. KI revolutioniert
die Art und Weise, wie wir reisen. Sie treibt
selbstfahrende Autos an, die selbstständig auf Straßen
navigieren und
Hindernissen ausweichen können , was zu sichereren Straßen führt Medizinische Diagnose.
Im Gesundheitswesen macht
KI Fortschritte bei der Diagnose von Krankheiten und übertrifft
häufig menschliche
Ärzte
in Bezug auf die Durch die Analyse riesiger
Mengen medizinischer Daten hilft
sie dabei, Muster und Trends zu erkennen und Ärzte dabei zu
unterstützen,
fundiertere Entscheidungen zu treffen Bankwesen und Betrugserkennung. KI hat im Bankensektor in
den letzten halben zehn Jahren erheblich Bankensektor in
den letzten halben zehn Jahren Von der Vorhersage potenziell
betrügerischer Transaktionen bis hin zur Bestimmung der Kreditwürdigkeit auf der
Grundlage verschiedener Faktoren spielt
KI im
heutigen Finanzsektor eine zentrale Rolle Kundenservice und Online-Support. Stellen Sie sich ein Unternehmen
wie HP vor, das mehr
als 70.000 Hilfeseiten
in 17 Sprachen verwaltet mehr
als 70.000 Hilfeseiten
in 17 Sprachen KI kommt hier ins Spiel, automatisiert den Kundensupport und bietet Service rund um
die Uhr, Kosten
erheblich gesenkt
und die Effizienz gesteigert Bildung. Im
Bildungsbereich ermöglicht
KI personalisierte
Lernerfahrungen, passt sich an die
individuellen Bedürfnisse jedes einzelnen Schülers und fördert einen
effektiveren Lernprozess Unterhaltung. Unsere virtuellen
Assistenten wie Siri, Cortana, Alexa und Google
werden alle von KI unterstützt Mit ihren
Spracherkennungsfunktionen sind
sie so, als hätten Sie eine
persönliche Sekretärin, die
Ihnen zur Verfügung steht , und sorgen für Cybersicherheit Im digitalen Bereich ist
KI unser Wachmann Mit ihren Algorithmen für
maschinelles Lernen und der umfangreichen Datenanalyse erkennt sie Anomalien und
reagiert auf Bedrohungen, wodurch unsere Cybersicherheitsmaßnahmen gestärkt Sie sehen, KI hat sich in alle
Facetten unseres Lebens integriert, unsere Fähigkeiten erweitert und sowohl unsere Geschäfts- als auch unsere Geschäftslandschaft neu gestaltet Die Möglichkeiten sind immens und sie erweitern sich
mit jedem Tag weiter Lassen Sie uns nun über
die Zukunft der KI sprechen. Wenn wir über
die Zukunft der KI nachdenken, ist das wirklich ziemlich faszinierend. Wir stehen kurz vor einer Zeit, in
der selbstfahrende Autos die Norm sein
könnten Stellen Sie sich vor, Roboter
hätten zu Hause, die uns bei
Aufgaben helfen , von der
Kaffeezubereitung bis hin zu komplizierteren Dingen Wir beobachten auch den
Aufstieg intelligenter Städte, in denen KI alles steuert, von unseren Telefonen bis hin zu
Haushaltsgeräten. Außerdem übernehmen Roboter zunehmend
Aufgaben mit
hohem Risiko, wie zum Beispiel
Bombendiffusionen Da sich die KI weiterentwickelt, wird
sie wahrscheinlich noch
größere Auswirkungen auf unsere Welt haben Auf der Grundlage all dessen einige mögliche Anwendungen
der KI in der Zukunft den automatisierten
Verkehr
umfassen. Stellen Sie sich eine Welt vor, in der KI das ganze Fahren für uns
erledigt. Wir nähern uns einer Realität
, in selbstfahrende Autos eine
Standardmethode sind, sich fortzubewegen. Es geht aber nicht nur
um Autos. Wir sprechen von automatisierten Drohnen, Auslieferung unserer Pakete, von
KI-gesteuerten Zügen, präzisen und
termingerechten Transport
sicherstellen, und sogar von autonomen
Booten und Flugzeugen. All dies zielt darauf ab, unsere Reise
sicherer und effizienter zu
machen ,
indem menschliche Fehler reduziert werden. Es ist ein massiver Wandel, der unsere Einstellung
zum Verkehr
neu definieren könnte unsere Einstellung
zum Verkehr
neu definieren Personalisierte Medizin, KI, kann nützlich
sein, um große
Mengen medizinischer Daten
zu analysieren und Muster und
Trends zu identifizieren, die
Ärzten helfen können, Krankheiten effektiver zu diagnostizieren und zu behandeln KI kann beispielsweise verwendet
werden, um
personalisierte
Krebsbehandlungen zu entwickeln , die auf die spezifische
genetische Ausstattung jedes Patienten
zugeschnitten sind . Virtuelle Unterstützung.
KI-gestützte virtuelle Unterstützung
kann uns bei einer Vielzahl von Aufgaben wie der
Terminplanung, Reiseplanung
und der Verwaltung unserer Finanzen helfen. Virtuelle Assistenz kann uns auch mit Informationen
und Unterhaltung
versorgen und sie kann sogar zur
Steuerung unserer Smart-Home-Geräte verwendet werden . Apropos Smart
Homes selbst:
KI kann eingesetzt werden, um unser Zuhause
komfortabler,
effizienter und sicherer zu gestalten . KI kann beispielsweise verwendet werden,
um unsere Thermostate,
Lichter und andere Geräte zu steuern ,
Lichter und andere Geräte Und es kann auch
verwendet werden, um
unsere Häuser auf Sicherheitsbedrohungen zu überwachen unsere Häuser auf Sicherheitsbedrohungen Und nicht zuletzt künstliche allgemeine
Intelligenz oder AGI. AGI ist eine hypothetische Art von KI, die so
intelligent wäre wie ein Mensch AGI könnte möglicherweise einige
der
dringendsten Probleme der Welt
wie
Klimawandel und Armut
lösen der
dringendsten Probleme der Welt wie
Klimawandel und AGI wirft jedoch auch
einige ethische Bedenken auf, wie etwa das Potenzial
der KI, sich ihrer selbst
bewusst zu werden und ihre
eigenen Ziele und Wünsche zu entwickeln. KI ist eine leistungsstarke Technologie mit dem Potenzial,
viele Aspekte unseres Lebens zu revolutionieren Es ist wichtig, sich
der potenziellen
Vorteile und Risiken von
KI bewusst der potenziellen
Vorteile und Risiken von zu sein und sie verantwortungsbewusst einzusetzen Ich hoffe, Ihnen hat diese
kurze Erklärung zur KI gefallen. Im nächsten Video werden
wir uns
eingehender mit
maschinellem Lernen befassen.
3. L1V2 – Maschinelles Lernen: Was ist maschinelles Lernen? In diesem Video werden wir die Grundlagen des
maschinellen Lernens
behandeln. Insbesondere werden wir mit einer Definition dessen
beginnen,
was maschinelles Lernen ist. Dann bieten wir einen Vergleich zwischen künstlicher Intelligenz, maschinellem Lernen
und tiefem Lernen. Dann besprechen wir, wie
maschinelles Lernen funktioniert. Wir sprechen über verschiedene
Arten von maschinellem Lernen,
überwachtem Lernen, unbeaufsichtigtem Lernen
und Reinforcement-Learning und Reinforcement-Learning Wir sprechen über die Voraussetzungen
für maschinelles Lernen und geben am Ende einige
Anwendungsbeispiele für maschinelles Lernen Was ist also maschinelles Lernen? Maschinelles Lernen befasst
sich mit der Entwicklung von Computerprogrammen
, die auf
Daten zugreifen und diese verwenden können , um automatisch aus Erfahrungen zu lernen und sich
zu verbessern. Dadurch kann uns maschinelles Lernen dabei helfen, komplexe Aufgaben
zu erledigen, wie zum Beispiel das Drei-D-Drucken
ganzer Häuser. Durch den Einsatz von Algorithmen
und großen Datensätzen kann
maschinelles Lernen
Design und Planung automatisieren und so
dazu beitragen, bauliche Herausforderungen
wie strukturelle Integrität
und Materialeffizienz Kann Designs
auch an die
Umgebungsbedingungen anpassen Umgebungsbedingungen Es kann dazu beitragen, Kosten
und Zeit zu reduzieren und gleichzeitig die
Präzision zu erhöhen , und hat das Potenzial , die
Bauindustrie zu verändern. Denken Sie als weiteres Beispiel unsere persönliche Assistenz wie Siri, Google Assistant
oder Amazon Echo Sie alle nutzen die Macht
des maschinellen Lernens , um uns bei unseren
täglichen Aufgaben zu helfen, wie dem Abspielen unserer Lieblingsmusik, der Bestellung von
Essen oder der Sprachsteuerung unserer Haushaltsgeräte oder Beantragung von Rechten bei
Uber und vielem mehr Wie bereits erwähnt, ist
künstliche Intelligenz eine Technik, die es
Maschinen ermöglicht, menschliches Verhalten nachzuahmen Das ist wichtig, denn so können wir
herausfinden , ob unsere
Berechnungen und unsere Arbeit auf dem richtigen Weg sind, indem sehen, ob sie menschliches Verhalten
nachahmen können Wir verwenden diesen
Ansatz, um einen Teil der
Arbeit zu
übernehmen , die Menschen erledigen, mit dem Ziel, die Dinge
effizienter , rationeller
und KI ist ein weites Feld , das viele
verschiedene Technologien abdeckt Einige Beispiele für künstliche
Intelligenz sind IBM, Deep Blue Chess, elektronische
Spielfiguren und selbstfahrende Autos. Dies sind nur einige
Beispiele für viele Arten
, wie künstliche Intelligenz heute eingesetzt
wird. Maschinelles Lernen ist eine
Technik, die mithilfe statistischer Methoden
Maschinen in die Lage versetzt,
aus ihren Daten aus der Vergangenheit zu lernen. Das bedeutet, dass Maschinen frühere Eingaben und
Antworten verwenden
können , um bei
zukünftigen Versuchen
bessere Vermutungen anzustellen zukünftigen Versuchen
bessere Vermutungen Google-Suchalgorithmus und E-Mail-Spamfilter sind Beispiele für Anwendungen
des maschinellen Lernens Und dann haben wir Deep Learning
, ein Teilgebiet des
maschinellen Lernens Nutzt Algorithmen, um es Modellen
zu ermöglichen , sich selbst zu trainieren
und Aufgaben auszuführen AlphaGo und natürliche
Spracherkennung sind zwei
Beispiele für Deep Learning Deep Learning wird
häufig mit
neuronalen Netzwerken in Verbindung gebracht , bei denen es sich um
eine Art Black-Box-Modell Da es sich um ein Black-Box-Modell
handelt, ist es für
Menschen schwierig nachzuvollziehen, wie Deep-Learning-Modelle
ihre Vorhersagen treffen. Deep-Learning-Modelle können jedoch bei der Ausführung von Aufgaben
immer noch sehr effektiv sein. Wir werden später tiefer in die Welt des Deep
Learning eintauchen. Lassen Sie uns nun sehen, wie
maschinelles Lernen funktioniert. Um zu verstehen, wie
maschinelles Lernen funktioniert, schauen wir uns
das folgende Diagramm an. Im ersten Schritt trainieren wir
zunächst unsere Daten. Anschließend haben wir die trainierten Daten zur Verarbeitung
in einen
Algorithmus für maschinelles Lernen eingespeist . Die Prozessdaten
durchlaufen einen anderen Algorithmus für
maschinelles Lernen. Und jetzt ist es an der Zeit
, unsere Arbeit zu testen. Wir bringen einige neue Daten und lassen sie mit
demselben Algorithmus laufen. Im nächsten Schritt
überprüfen wir die Prognosen
und Ergebnisse. Wenn wir
Reservetrainingsdaten haben, ist es
jetzt an der Zeit, sie zu verwenden. Wenn die
Vorhersage im nächsten Schritt nicht richtig aussieht, sagen
wir, sie bekommt
die Daumen runter, ist es an der Zeit, einen Rückweg zu machen
und den Algorithmus neu zu trainieren Denken Sie daran, dass es nicht immer darum geht, sofort die richtige
Antwort Das Ziel ist es, weiterhin
nach einer besseren Antwort zu suchen. Möglicherweise stellen Sie fest, dass das ursprüngliche
Ergebnis nicht Ihren Wünschen entspricht. Das ist okay. Das ist
Teil des Prozesses. Und es kann von dem
Bereich abhängen, in dem Sie arbeiten, ob es sich um
Gesundheitswesen, Wirtschaft,
Wirtschaft , Aktienmarkt
oder etwas anderes handelt. Die Ergebnisse können
sehr unterschiedlich sein. Also müssen wir das Modell ausprobieren, und wenn es
uns nicht das gewünschte Ergebnis liefert oder wenn wir glauben, dass wir bessere Ergebnisse
erzielen können, schulen
wir unser Modell neu Und im letzten Schritt verfeinern und schulen
wir weiter, verfeinern und schulen
wir weiter bis wir die bestmögliche
Antwort erhalten So funktioniert
maschinelles Lernen. Schauen wir uns nun verschiedene
Arten des maschinellen Lernens an. Wir können sehen, dass wir überwachtes,
unbeaufsichtigtes und
verstärkendes Lernen
haben unbeaufsichtigtes und
verstärkendes Lernen Wir werden uns mit jedem einzelnen befassen und uns ein gutes Bild davon
machen, wann und wo wir sie einsetzen können und
worum es bei ihnen geht Beim maschinellen Lernen verwenden
wir viele verschiedene Algorithmen, um
schwierige Probleme zu lösen. Jeder passt in
einen bestimmten Typ. Wir haben also drei Haupttypen von Algorithmen für maschinelles Lernen:
überwachtes Lernen, unüberwachtes Lernen
und Reinforcement-Learning und Reinforcement-Learning Lassen Sie uns nun näher darauf eingehen, was jede dieser
Lernmethoden wirklich bedeutet Überwachtes Lernen verwendet beschriftete Daten, um Modelle für
maschinelles Lernen zu trainieren. Gekennzeichnete Daten bedeuten, dass uns
die Ergebnisse
bereits bekannt sind. Das Modell muss nur
die Eingaben den Ausgaben zuordnen. Ein Beispiel für überwachtes
Lernen kann darin bestehen,
eine Maschine zu trainieren ,
die Bilder von Tieren identifiziert. Hier sehen wir ein trainiertes Modell, das
das Bild einer Katze identifiziert. Unüberwachtes Lernen verwendet unbeschriftete Daten
, um Maschinen zu trainieren Unbeschriftete Daten bedeuten, dass es keine feste
Ausgangsvariable gibt Das Modell lernt aus den Daten, erkennt Muster und
Merkmale in den Daten und gibt die Ausgabe zurück In diesem Beispiel verwendet unser
unbeaufsichtigtes Modell
die Bilder von Fahrzeugen, um zu klassifizieren, ob es sich um
einen Bus oder einen Lkw Das Modell lernt also, indem die
Teile eines Fahrzeugs
identifiziert, z. B. die Länge und
Breite des Fahrzeugs,
die vorderen und hinteren
Endverkleidungen, das Dach, Motorhauben, die verwendeten Radtypen und viele andere Merkmale Anhand dieser Merkmale klassifiziert
das Modell, ob es sich bei dem
Fahrzeug um einen Bus oder einen Lkw handelt Und wir haben
Reinforcement-Learning. Reinforcement Learning
trainiert die Maschine darin, geeignete Maßnahmen zu ergreifen und die
Belohnung zu maximieren in einer
bestimmten Situation
geeignete Maßnahmen zu ergreifen und die
Belohnung zu maximieren. Es verwendet einen Agenten und eine Umgebung, um
Aktionen und Belohnungen zu erzeugen. Der Agent hat einen Start
- und einen Endstatus, aber es kann
verschiedene Teile geben,
um den
Endstatus zu erreichen, wie in einem Labyrinth Bei dieser Lerntechnik
gibt es keine vordefinierte
Zielvariable Ein Beispiel für
Reinforcement-Learning ist das Training einer Maschine,
die anhand einer Liste verschiedener
Objekte wie Quadrat,
Dreieck, Rechteck
oder Kreis die Form eines Objekts erkennen kann einer Liste verschiedener
Objekte wie Quadrat,
Dreieck, . In diesem Beispiel versucht das Modell, die Form des
Objekts, bei dem es sich
um ein Quadrat handelt, vorherzusagen. Schauen wir uns nun verschiedene Algorithmen für
maschinelles Lernen , die unter diese
Lerntechniken fallen. Einige der am häufigsten verwendeten Algorithmen für
überwachtes Lernen sind polynomielle Regression,
Random Forests,
lineare Regression, logistische Regression,
Chain Nearest
Neighbors, Naive Base, Support Und dies sind nur
einige Beispiele für Algorithmen, die für überwachtes Lernen verwendet werden. Es gibt so viele
andere Algorithmen , die beim
maschinellen Lernen verwendet werden. Für unbeaufsichtigtes
Lernen sind einige
der am häufigsten verwendeten Algorithmen K bedeutet Clustering,
Singulärwertzerlegung,
Fuzzy-Mittelwerte, partielle Quadrate,
a priori, hierarchisches
Clustering, Hauptkomponentenanalyse bedeutet Clustering,
Singulärwertzerlegung,
Fuzzy-Mittelwerte, partielle Quadrate,
a priori, hierarchisches
Clustering, Hauptkomponentenanalyse und DBS-Scan. In ähnlicher Weise gibt es so
viele andere Algorithmen, die für unbeaufsichtigtes Lernen verwendet werden können. Und einige der wichtigen Algorithmen für verstärkendes
Lernen sind Q-Learning, SARSA, Monte Carlo
und Deep-Q-Netzwerke Wie gesagt, es stehen uns
so viele verschiedene
Algorithmen zur Verfügung, und die Wahl des richtigen
Algorithmus hängt von der Art der Probleme ab, die
wir zu lösen versuchen Schauen wir uns nun den Ansatz an dem diese Techniken des
maschinellen Lernens funktionieren. Methoden des überwachten
Lernens benötigen also externe Überwachung, um Modelle für
maschinelles Lernen zu trainieren, und daher kommt der
Name überwachtes Lernen. Sie benötigen Anleitung und zusätzliche Informationen
, um das Ergebnis zurückzugeben. Es verwendet beschriftete Eingaben und
ordnet sie bekannten Ausgaben zu, was bedeutet, dass Sie die Zielvariable bereits
kennen. Techniken des unbeaufsichtigten Lernens
benötigen keine Aufsicht
, um Modelle zu trainieren Sie lernen selbstständig
und prognostizieren das Ergebnis. Sie finden Muster
und verstehen die Trends in den Daten
, um die Ergebnisse zu ermitteln. Daher versucht das Modell,
die Daten anhand der
Merkmale der Eingabedaten zu kennzeichnen . Und in ähnlicher Weise benötigen
Reinforcement-Learning-Methoden keine Aufsicht , um Modelle für
maschinelles Lernen zu trainieren. Reinforcement-Learning
folgt der Methode Versuch und Irrtum, um
die gewünschte Lösung zu erhalten. Nach Erledigung einer Aufgabe erhält
der Agent eine Auszeichnung Ein Beispiel könnte sein,
einem Hund beizubringen, den Ball zu fangen. Wenn der Hund lernt, einen Ball
zu fangen, gibst
du ihm eine
Belohnung, zum Beispiel ein Leckerli. Konzentrieren wir uns damit
auf Anwendungen und Arten von Problemen, die mit
diesen drei Arten von Techniken des
maschinellen Lernens gelöst
werden können . Daher wird überwachtes
Lernen im Allgemeinen für Klassifikations
- und Regressionsprobleme
eingesetzt Sie können beispielsweise das Wetter
für einen bestimmten Tag
anhand der Werte für Luftfeuchtigkeit,
Niederschlag, Windgeschwindigkeit
und Luftdruck
vorhersagen für einen bestimmten Tag
anhand der Werte für Luftfeuchtigkeit, Niederschlag, Windgeschwindigkeit
und Luftdruck Wie in einem anderen Beispiel können
Sie Algorithmen für überwachtes
Lernen verwenden, können
Sie Algorithmen für überwachtes
Lernen verwenden um Umsätze
für
verschiedene Produkte für den nächsten Monat oder das
nächste Quartal zu prognostizieren für
verschiedene Produkte für den nächsten Monat oder . In ähnlicher Weise können Sie es
zur Aktienkursanalyse
oder zur Feststellung verwenden , ob eine
Krebszelle bösartig oder gutartig ist Unüberwachtes
Lernen wird bei
Clustering- und
Assoziationsproblemen eingesetzt Clustering- und Es kann beispielsweise eine
Kundensegmentierung durchführen, bei der
ähnliche Kunden auf der
Grundlage ihres Verhaltens
, ihrer Vorlieben,
Abneigungen
und Interessen segmentiert und in Gruppen gruppiert Abneigungen Ein weiteres Beispiel für
die Anwendungen von unbeaufsichtigtem Lernen ist
die Analyse der
Kundenabwanderung. Dabei
wird bewertet und
verstanden, warum und wann
Kunden aufhören, mit einem warum und wann Kunden aufhören Mit dem Ziel,
Strategien zur Verbesserung der
Kundenbindung zu entwickeln Strategien zur Verbesserung der
Kundenbindung zu Und schließlich haben wir
Reinforcement-Learning. Reinforcement-Learning
basiert auf Belohnungen. Für jede Aufgabe oder jeden
Schritt, der korrekt abgeschlossen wurde,
erhält der Mitarbeiter also eine Belohnung. Und wenn die
Aufgabe nicht korrekt ausgeführt wird, wird
es
eine Strafe geben. Schauen wir uns nun einige Beispiele an. Reinforcement-Learning-Algorithmen werden in der
Spielebranche
häufig zur Entwicklung von Spielen eingesetzt. Es wird auch verwendet, um
Roboter für die Ausführung menschlicher Aufgaben zu trainieren. Mehrzweck-KI-Chatbots wie
Hat GPT oder Google Bart nutzen Reinforcement-Learning, um aus den Benutzereingaben zu
lernen und ihre Ergebnisse
auf der Grundlage früherer Konversationen anzupassen Damit sind wir am Ende dieses Abschnitts über überwachtes und
unbeaufsichtigtes Lernen im Vergleich
zu
Reinforcement-Learning unbeaufsichtigtes Lernen im Vergleich
zu
Reinforcement-Learning angelangt Schauen wir uns nun an, was
die Voraussetzungen für
maschinelles Lernen sind die Voraussetzungen für
maschinelles Lernen Der erste betrifft also die Grundlagen der
Informatik
und die Programmierung Viele
Anwendungen für maschinelles Lernen erfordern heute eine solide Grundlage für grundlegendes
Scripting oder Programmieren Es geht nicht nur darum, komplexe Algorithmen zu
schreiben, sondern auch darum, die
zugrunde liegenden Strukturen zu verstehen und zu manipulieren Ohne ein gutes Verständnis
dieser grundlegenden Fähigkeiten wird
es schwierig sein, das
Beste aus
den verfügbaren Tools für
maschinelles Lernen Wenn Sie also ernsthaft erwägen,
in maschinelles Lernen einzutauchen, ist
es ratsam,
Ihre Programmierkenntnisse aufzufrischen Statistische Grundkenntnisse. des maschinellen Lernens ist ein grundlegendes Verständnis In der
Welt des maschinellen Lernens ist ein grundlegendes Verständnis von
Wahrscheinlichkeiten erforderlich Sie werden sich oft Fragen
stellen wie Wenn A passiert, wie
hoch ist die Wahrscheinlichkeit
, dass B eintritt Oder wenn es Wolken über uns gibt, wie hoch ist die Wahrscheinlichkeit, dass
es regnet? Diese Art von Fragen, Wahrscheinlichkeiten
beruhen, stehen im Mittelpunkt vieler Algorithmen für
maschinelles Lernen. Es geht darum,
Ergebnisse auf der Grundlage
bestimmter Bedingungen vorherzusagen Ergebnisse auf der Grundlage
bestimmter Bedingungen Wenn Sie also
große Fortschritte
beim maschinellen Lernen erzielen möchten , lohnt
es sich auf jeden Fall, sich
mit den Grundlagen von
Statistik und Wahrscheinlichkeit
vertraut mit den Grundlagen von
Statistik Lineare Algebra und
Zwischenrechnung. Lineare Algebra ist von entscheidender Bedeutung,
da Sie das Konzept des
Zeichnens
einer Linie durch
Ihre Datenpunkte verstehen und
verstehen müssen einer Linie durch Ihre Datenpunkte verstehen und Dies ist die Grundidee hinter linearen
Regressionsmodellen, bei denen Sie
eine Linie durch Ihre Daten ziehen und
diese Linie verwenden , um neue Werte zu berechnen Bei der
Zwischenrechnung geht es darum, ein grundlegendes Verständnis
von Differentialgleichungen zu
haben Sie müssen kein Meister darin sein, da der Computer die meisten schweren Berechnungen abwickelt,
aber es ist
von Vorteil, die Terminologie zu kennen , wenn sie auftaucht, insbesondere wenn Sie
tiefer in die Modellprogrammierung eintauchen tiefer in die Modellprogrammierung Und Daten ausfindig machen und reinigen. Einer der vielleicht
wichtigsten Aspekte in diesem Bereich ist die Beherrschung der
Kunst, Ihre Daten aufzuräumen Es wird oft gesagt, wenn
Sie schlechte Daten eingeben, erhalten
Sie schlechte Daten heraus Aber wenn Sie gute Daten haben, ist
es wahrscheinlicher,
dass gute Daten herauskommen. Die Qualität Ihrer
Daten kann das Ergebnis Ihrer Modelle für
maschinelles Lernen stark beeinflussen. Daher ist es
wichtig zu verstehen, wie effektiv bereinigen und organisieren Sie Ihre Daten um die Genauigkeit und
Zuverlässigkeit Ihrer Ergebnisse sicherzustellen. Schauen wir uns nun einige
Anwendungsbeispiele für maschinelles Lernen an. Wir haben Objekterkennung
und Instanzsegmentierung. Objekterkennung und
Instanzsegmentierung sind zwei verschiedene, aber verwandte
Aufgaben beim maschinellen Lernen Objekterkennung geht es darum,
Objekte in einem Bild zu
erkennen und zu finden Objekte in einem Bild ,
wie zum Beispiel verschiedene
Katzen voneinander Andererseits ist die
Instanzsegmentierung der nächste Schritt, der
diese identifizierten Objekte
vom Rest des Bildes trennt diese identifizierten Objekte
vom Rest des Bildes Diese Techniken werden
auf verschiedene Weise eingesetzt, unter anderem zur Identifizierung verschiedener
Elemente in einem Bild Darüber hinaus
können durch die Segmentierung
bestimmte Komponenten weiter isoliert oder herausgeschnitten Eine beliebte Anwendung zur
Objekterkennung und Segmentierung ist die
Schnellschnappschussfunktion von Google Pixel-Telefonen Diese Funktion verwendet
maschinelles Lernen, um Objekte in der aktuellen Ansicht
eines Benutzers zu identifizieren und diese Objekte dann mit
animierten Aufklebern oder Filtern
zu überlagern diese Objekte dann mit
animierten Aufklebern oder Filtern
zu überlagern Dies kann eine unterhaltsame
und kreative
Möglichkeit sein, Fotos eine persönliche
Note zu verleihen Wir haben auch eine
Nummernschilderkennung. Das ist ein ziemlich cooler
Einsatz von maschinellem Lernen. Stellen Sie sich vor, ein Auto fährt in
Sichtweite und das System kann das
Nummernschild an diesem Auto erkennen und identifizieren. Diese Anwendung des
maschinellen Lernens kann in verschiedenen Situationen besonders
nützlich sein ,
z. B. bei Sicherheitskontrollen, Parkplätzen, Verkehrskontrollen
oder sogar bei der Erhebung von
Mautgebühren, ohne dass das Auto mitten auf einer Autobahn anhalten Es zeigt, wie
maschinelles Lernen
spezifische Informationen aus einem
größeren Kontext mit Genauigkeit extrahieren kann spezifische Informationen aus einem
größeren Kontext Und wir haben auch
automatische Übersetzungen. automatische Übersetzung, die auf maschinellem Lernen basiert,
hat beim
Abbau
von Sprachbarrieren eine entscheidende Rolle gespielt ist die treibende Kraft hinter der Sofortübersetzung, die
Sie auf ausländischen Websites sehen, und macht den Inhalt
mit nur einem Klick in
Ihrer bevorzugten Sprache zugänglich mit nur einem Klick in
Ihrer bevorzugten Sprache Es ist auch die Technologie , die es Tools
wie Google Lens ermöglicht Echtzeit
zu übersetzen Schilder in
Echtzeit
zu übersetzen, wenn Sie
Ihre Kamera darauf richten. Egal, ob es darum geht,
im Internet zu surfen oder in
einer fremden Stadt zu navigieren, maschinelles Lernen
hat
unsere Fähigkeit, die Welt zu verstehen
und mit ihr zu interagieren, revolutioniert unsere Fähigkeit, die Welt zu verstehen
und mit ihr zu interagieren automatische Übersetzung ist wirklich ein beeindruckender Beweis dafür, wie maschinelles Lernen
die Welt näher zusammenbringen kann Danke, dass Sie
sich dieses Video angesehen haben. Die Welt der Anwendungen für
maschinelles Lernen ist riesig und entwickelt sich ständig weiter. Es ist einer der am schnellsten
wachsenden Technologiesektoren, und die Möglichkeiten
sind endlos. Was ich Ihnen hier gezeigt habe sind nur einige
der Höhepunkte, eine kleine Auswahl dessen,
was möglich ist. Aber es wird noch so
viel mehr kommen. Im nächsten Video werden wir die Jahre hinter uns
lassen und
uns mit Deep Learning befassen, einem weichen Bereich des
maschinellen Lernens, der viele
der Fortschritte beim maschinellen Lernen
ermöglicht hat der Fortschritte beim maschinellen Lernen . Wir sehen uns
im nächsten Video.
4. L1V3 – Deep Learning: In diesem Video werden wir
über Deep Learning
und neuronale Netzwerke sprechen über Deep Learning
und neuronale Haben Sie sich jemals gefragt,
wie Google
eine ganze Webseite im
Handumdrehen von fast jeder
Sprache in eine andere übersetzen kann eine ganze Webseite im
Handumdrehen oder wie Google Photos
Ihre Bilder auf
magische Weise nach den Gesichtern
von Menschen und Haustieren sortiert den Gesichtern , die
es erkennt? Oder wie wäre es, wenn Google
Lens Sie über die
Details einer Pflanze, eines Objekts oder eines Tieres informiert, wenn Sie es mit Ihrem Telefon
scannen Das ist Deep Learning, das genau dort
seine Magie entfaltet. Lassen Sie uns in diesem Video
versuchen, die
Frage zu beantworten, was
Deep Learning ist und wie es all diese unglaublichen
Dinge ermöglicht. In diesem Video werden wir die folgenden Themen
besprechen. Wir beginnen mit einem
Verständnis von Deep Learning und
gehen dann zu künstlichen
neuronalen Netzwerken über, denen es sich um eine Art Algorithmus für
maschinelles Lernen handelt
, der beim Deep Learning verwendet wird. Anschließend werden wir einige
der praktischen Einsatzmöglichkeiten von
Deep Learning untersuchen und einige
der beliebtesten
Deep-Learning-Plattformen vorstellen . Und schließlich werden wir
einige der Einschränkungen von
Deep Learning erörtern und erläutern, wie Quantencomputer diese Einschränkungen
bewältigen können. Es wird eine spannende
Sitzung zum Thema Deep Learning werden. Wie bereits erwähnt, ist
Deep Learning eine Untergruppe
des maschinellen Lernens, und beide sind Teil des größeren Konzepts,
das als
künstliche Intelligenz bezeichnet wird Stellen Sie sich künstliche
Intelligenz als den gesamten Bereich vor, in dem
Maschinen dazu gebracht werden, sich wie Menschen zu verhalten Maschinelles Lernen ist ein
Teil dieses Bereichs, und es geht darum, Maschinen
die Fähigkeit zu
geben , auf der Grundlage von Daten zu lernen und
Entscheidungen
zu treffen, so wie wir aus Erfahrungen
lernen. Heute ist Deep Learning ein spezifischerer Teil
des maschinellen Lernens. Es ist, als würde man einer Maschine beibringen ein bisschen
wie ein menschliches Gehirn
zu denken mit einer Struktur, die als
künstliches neuronales Netzwerk bezeichnet wird. Künstliche neuronale Netze oder
ANNs sind eine spezielle Art von Algorithmus für
maschinelles Lernen, die versuchen, die neuronalen
Netzwerke im menschlichen Gehirn
lose nachzuahmen Wenn wir Deep Learning sagen, sprechen
wir normalerweise davon,
wirklich große neuronale Netzwerke zu verwenden , um ein Modell mit einer
Vielzahl von Daten zu trainieren. Es unterscheidet sich nicht
von maschinellem Lernen, nur ein schickerer Begriff, den wir verwenden wenn die Dinge
ziemlich umfangreich werden Was sind also künstliche
neuronale Netze? Schauen wir uns
den Aufbau
eines neuronalen Netzes genauer an . Jede Schicht besteht aus Knoten
oder sogenannten Neuronen. Die Neuronen in einer
Schicht verbinden sich über Kanäle mit Neuronen in der nächsten
Schicht. Jedem Kanal wird eine Gewichtung
zugewiesen, die
beim Lernen des Netzwerks eine wichtige Rolle spielt. Jedem Neuron sind
ein Bias
und eine Aktivierungsfunktion zugeordnet und eine Aktivierungsfunktion Die Aktivierungsfunktion wird verwendet, um
die gewichtete Summe der Eingaben und
des Bias in
eine Ausgabe umzuwandeln Eingaben und
des Bias in , die
an die nächste Schicht gesendet wird Wie bereits erwähnt, bilden ANNs das
Herzstück von Deep Learning. Diese Algorithmen sind so konzipiert , dass sie die
Funktionsweise des menschlichen Gehirns widerspiegeln Sie nehmen Daten auf, lernen, Muster in den Daten zu
erkennen, und treffen dann fundierte Vorhersagen
für einen neuen Datensatz. Lassen Sie uns den
Prozess untersuchen, indem wir
ein neuronales Netzwerk aufbauen , das in der Lage ist zwischen
einem Würfel und einer Pyramide zu
unterscheiden Betrachten Sie als Beispiel
ein Bild eines Würfels. Dieses Bild besteht
aus 28 mal 28 Pixeln, was
insgesamt 784 Pixeln Jedes Pixel wird dann
als Eingabe für einzelne Neuronen
innerhalb der ersten Schicht bereitgestellt als Eingabe für einzelne Neuronen
innerhalb der ersten Schicht Neuronen in einer Schicht
sind über Kanäle mit
Neuronen in nachfolgenden
Schichten verbunden . Die Eingaben werden mit
ihren entsprechenden Gewichten multipliziert, und dann
wird der Bias hinzugefügt Dieser kombinierte Wert wird dann anhand
einer Schwellenwertfunktion, der
sogenannten
Aktivierungsfunktion Das Ergebnis wird
als Eingabe an das Neuron
innerhalb der verborgenen Schicht übertragen als Eingabe an das Neuron
innerhalb der verborgenen Dann bestimmt die Ausgabe
der Aktivierungsfunktion ob ein Neuron
aktiviert wird oder Aktivierte Neuronen
übertragen Daten über
den Kanal an die Neuronen in der nächsten
Schicht Dieser iterative Prozess, bekannt als Forward Propagation,
ermöglicht die Ausbreitung der Daten durch
das Netzwerk Innerhalb der Ausgabeschicht das Neuron mit
dem höchsten Wert wird
das Neuron mit
dem höchsten Wert aktiviert und
bestimmt die Bei diesen Werten handelt es sich
im Wesentlichen um Wahrscheinlichkeiten. In diesem speziellen Szenario das der Pyramide zugeordnete Neuron hat
das der Pyramide zugeordnete Neuron
die
höchste Wahrscheinlichkeit,
was darauf hindeutet, dass
das neuronale Netzwerk die Ausgabe
als Pyramide
vorhersagt Nun, offensichtlich hat
unser neuronales Netzwerk
eine falsche Vorhersage getroffen Es ist wichtig zu beachten
, dass
unser Netzwerk zu diesem Zeitpunkt noch nicht
geschult wurde. Schauen wir uns also
die Schritte zum Training
eines neuronalen Netzwerks an . Während des Trainingsprozesses empfängt das Netzwerk
sowohl die Eingabe auch die erwartete Ausgabe. Durch den Vergleich der vorhergesagten
Ausgabe mit der tatsächlichen Ausgabe identifiziert
das Netzwerk den
Fehler in seiner Vorhersage. Die Größe des Fehlers
gibt an, wie falsch wir liegen, und das Vorzeichen gibt an, ob unsere vorhergesagten Werte
höher oder niedriger als erwartet sind. Diese Informationen werden dann rückwärts
über das Netzwerk
verbreitet,
eine Technik, die als Backpropagation bezeichnet wird Bei der Backpropagation passt
das Netzwerk seine
internen Parameter
wie Gewichte
und Verzerrungen an, um den Fehler zu
minimieren und seine Prognosen für die Zukunft zu verbessern Der iterative Zyklus von
Vorwärtsausbreitung und Rückwärtsausbreitung wird während des
Trainingsprozesses mit mehreren Eingaben wiederholt während des
Trainingsprozesses mit mehreren Eingaben Dieser Zyklus wird fortgesetzt, bis die Gewichte innerhalb des
Netzwerks so angepasst sind , dass das Netzwerk die Formen
in den meisten Fällen
genau vorhersagen Damit ist unser Trainingsprozess abgeschlossen
, bei dem das Netzwerk gelernt hat korrekte Vorhersagen
zu treffen. Obwohl das Training
neuronaler Netze ein zeitaufwändiger Prozess sein
kann, manchmal
Stunden oder sogar Monate dauert, der
manchmal
Stunden oder sogar Monate dauert, ist der Zeitaufwand angesichts der immensen
Möglichkeiten, die sie bieten,
gerechtfertigt. Die Komplexität des
Trainings beinhaltet die
Feinabstimmung zahlreicher Parameter und die
Optimierung der
Netzwerkleistung, was erhebliche
Rechenressourcen
und Geduld erfordert Rechenressourcen
und Die Vorteile eines gut trainierten
neuronalen Netzwerks,
wie z. B. verbesserte Genauigkeit,
fortschrittliche
Mustererkennung und
ausgeklügelte
Entscheidungsfindung, überwiegen jedoch eines gut trainierten
neuronalen Netzwerks,
wie z. B. verbesserte Genauigkeit, wie z. B. verbesserte Genauigkeit fortschrittliche
Mustererkennung und
ausgeklügelte
Entscheidungsfindung, überwiegen das Training aufgewendete Zeit Angesichts des bemerkenswerten Potenzials und der
Fähigkeiten,
die neuronale
Netze bieten, ist dies ein vernünftiger
Kompromiss bemerkenswerten Potenzials und der
Fähigkeiten,
die neuronale
Netze Schauen wir uns nun einige
der Anwendungen
von Deep Learning an. Wie bereits erwähnt, ist
es die Leistungsfähigkeit
neuronaler Netze, die
Deep Learning ermöglicht. Lassen Sie uns einige
der wichtigsten Anwendungen untersuchen , in denen
neuronale Netzwerke glänzen. Ein bemerkenswertes Beispiel ist Gesichtserkennungstechnologie auf Smartphones
, bei der neuronale
Netzwerke verwendet werden, um das Alter
einer Person anhand
ihrer Gesichtszüge abzuschätzen das Alter
einer Person anhand
ihrer Gesichtszüge Durch die Unterscheidung des Gesichts vom Hintergrund und
die
Analyse von Linien und Flecken korrelieren
diese Netzwerke
die visuellen Hinweise, um das ungefähre Alter der Person
zu ermitteln Neuronale Netzwerke spielen auch bei Prognosen eine
entscheidende Rolle, sie genaue Vorhersagen in
verschiedenen Bereichen wie
Wettervorhersagen oder Aktienkursanalysen ermöglichen verschiedenen Bereichen wie Wettervorhersagen Diese Netzwerke sind sehr
gut darin, Muster zu erkennen, sodass sie
Signale identifizieren können, die auf
die Wahrscheinlichkeit von Regenfällen
oder Schwankungen der Aktienkurse hinweisen die Wahrscheinlichkeit von Regenfällen oder Schwankungen der Aktienkurse Neuronale Netzwerke können sogar Originalmusik
komponieren. Sie können komplizierte
Muster in der Musik erlernen und ihr Verständnis
verfeinern, um originale Melodien zu
komponieren und so ihr
kreatives Potenzial unter Beweis zu Und ein weiterer Bereich, in dem NRA Networks Excel betreibt,
ist der Kundensupport Viele Personen führen Gespräche mit
Kundendienstmitarbeitern , ohne
zu merken , dass sie tatsächlich mit einem Bot
interagieren Diese ausgeklügelten
Netzwerke simulieren einen
realistischen Dialog und
bieten Unterstützung, wodurch das
Kundenservice-Erlebnis verbessert wird. Auch im Bereich
der medizinischen Versorgung haben
neuronale Netzwerke
erhebliche Fortschritte gemacht Sie sind in der Lage,
Krebszellen zu erkennen und MRT-Bilder zu
analysieren liefern detaillierte
und genaue Ergebnisse , die bei Diagnose
- und Behandlungsentscheidungen helfen Und natürlich
haben wir auch selbstfahrende Autos. Einst nur eine Möglichkeit
in der Science-Fiction, werden sie
heute
greifbare Realität. Diese autonomen
Fahrzeuge sind auf
neuronale Netze angewiesen , um die Umgebung wahrzunehmen und zu interpretieren, sodass sie sich im Straßenverkehr zurechtfinden, Entscheidungen
treffen und die Sicherheit der Passagiere
gewährleisten können. Lassen Sie uns nun einen
Blick auf einige beliebte
Deep-Learning-Frameworks werfen. Einige dieser Frameworks
sind also Tensor Flow, Pytorch,
Cross, Deep Learning Four J, Cafe und Microsoft
Cognitive Diese Frameworks haben
breite Anerkennung gefunden und spielen eine wichtige Rolle bei der
Weiterentwicklung
des Bereichs Deep Learning Lassen Sie uns nun
einige der Einschränkungen
von Deep Learning erörtern . Deep Learning ist zwar
vielversprechend, aber es ist wichtig, auch
seine Grenzen anzuerkennen. Erstens
ist
Deep Learning zwar sehr effektiv im
Umgang mit unstrukturierten Daten, benötigt
aber eine
beträchtliche
Menge an Daten für Trainingszwecke Das zweite Problem besteht darin, dass selbst unter der Annahme, dass wir
Zugriff auf die erforderlichen Daten haben, deren
Verarbeitung aufgrund der
Rechenleistung
schwierig sein kann aufgrund der
Rechenleistung
schwierig Training neuronaler Netze erfordert den Einsatz grafischer
Verarbeitungseinheiten oder GPUs, die im Vergleich zu
Zentraleinheiten oder
CPUs Tausende von Kernen haben im Vergleich zu
Zentraleinheiten oder
CPUs Tausende von Kernen Und gleichzeitig sind
GPUs viel
teurer als Und schließlich
ist das Training zeitaufwändig. tiefer neuronaler Netze kann Training tiefer neuronaler Netze kann
Stunden oder sogar Monate dauern
, wobei
die Dauer mit zunehmendem
Datenvolumen und der Anzahl der
Netzwerkschichten zunimmt. Es ist jedoch
erwähnenswert, dass Quantencomputer, die von
Unternehmen wie Google und IBM
entwickelt wurden Unternehmen wie Google und IBM eine mögliche Lösung zur
Überwindung dieser Einschränkungen
bieten. Quantencomputer sind in
der Lage,
komplexe Berechnungen exponentiell schneller durchzuführen komplexe Berechnungen als klassische Mit ihrer einzigartigen
Architektur und Quantenverarbeitungseinheiten oder QPs haben
sie das Potenzial, den
Trainingsprozess neuronaler Netze erheblich
zu beschleunigen Darüber hinaus können
Quantencomputer größere
Datensätze effektiver
verarbeiten Reduzierung der
Datenanforderungen und Minderung der Herausforderungen, die mit der
Verarbeitung solch großer
Informationsmengen verbunden Verarbeitung solch großer
Informationsmengen Quantencomputer befinden sich zwar
noch in einem frühen Stadium, laufende Forschung und
Entwicklung verspricht, die Einschränkungen zu
überwinden, mit denen traditionelle
Deep-Learning-Ansätze konfrontiert traditionelle
Deep-Learning-Ansätze Vielen Dank, dass Sie mit mir
die Welt des Deep
Learning erforscht mit mir
die Welt des Deep
Learning Es ist wichtig
anzuerkennen, dass wir uns noch in einem
frühen Stadium
der Erforschung dessen befinden , was Deep Learning und neuronale Netzwerke für uns tun
können. Große Namen wie Google,
IBM und Nvidia haben
diesen Wachstumskurs jedoch erkannt und in die Entwicklung
von Bibliotheken, Vorhersagemodellen
und leistungsstarken GPUs
investiert , um die Implementierung
neuronaler Netzwerke zu unterstützen Wir sind fast am Ende
dieses Abschnitts über traditionelle künstliche Intelligenz angelangt Es ist wichtig anzumerken, dass
wir nur an
der Oberfläche gekratzt haben , wenn es um
das Potenzial von Deep
Learning und KI geht das Potenzial von Deep
Learning und KI Spannende Möglichkeiten
liegen vor uns. Während wir die Grenzen
des Machbaren immer weiter verschieben, die Grenze zwischen
Science-Fiction und verschwimmt
die Grenze zwischen
Science-Fiction und
Realität
zunehmend Die Zukunft hält eine Fülle
von Überraschungen bereit, und Deep Learning steht bei diesen
bahnbrechenden
Fortschritten an vorderster Front Im nächsten Video, dem letzten Video dieses Abschnitts, werden
wir den
Unterschied zwischen
diskriminativen und generativen Modellen
des maschinellen Lernens kennenlernen , was uns
auf den
nächsten Abschnitt dieses Kurses über generative künstliche Intelligenz vorbereiten wird auf den
nächsten Abschnitt dieses Kurses über generative Wir sehen uns im nächsten.
5. L1V4 – Diskriminativ vs. Generativ: In diesem Video
werden wir über
diskriminative und generative Algorithmen sprechen diskriminative Dies sind zwei wichtige Arten
von Modellen für maschinelles Lernen. Um es
Ihnen leicht verständlich zu machen, beginnen
wir mit der Geschichte und erläutern dann anhand gängiger
Algorithmen als Beispiele, wie
diese beiden Arten des maschinellen Lernens im
Detail funktionieren maschinellen Lernens im
Detail funktionieren. Lassen Sie uns also gleich loslegen. Ordnung. Lass uns in unsere Geschichte
eintauchen. Stellen wir uns vor, wir haben
zwei außerirdische Besucher , die noch nie Äpfel
und Bananen gesehen haben. Wir wollen beobachten,
wie sie lernen, zwischen
diesen beiden Früchten zu unterscheiden. Der erste Außerirdische beschließt, diese Früchte zu verstehen,
indem er sie zeichnet. Es beobachtet sorgfältig
die Form, Farbe und Textur jeder Frucht und stellt
sie dann auf Papier Auf diese Weise entsteht eine visuelle Darstellung oder ein Modell davon, wie jede
Frucht aussieht Immer wenn es eine neue Frucht sieht, bezieht
es sich auf diese Zeichnungen,
um diese Frucht zu identifizieren. Dies ähnelt dem, was wir beim maschinellen Lernen
einen
generativen Algorithmus nennen . Das zweite Alien
geht dagegen anders vor. Anstatt zu zeichnen, beginnt es, die Eigenschaften
der Früchte zu
vergleichen. Es stellt fest, dass Äpfel
normalerweise rund und rot
sind, während Bananen lang und gelb sind. Wenn sie eine neue Frucht bekommt, sucht
sie nicht nach
einer perfekten Frucht. Stattdessen prüft es, welche
Fruchtmerkmale der neuen Frucht
näher kommen der neuen Frucht
näher und vermutet, dass es
sich um dieselbe handelt. Dieser Ansatz ähnelt
eher dem, was wir beim maschinellen Lernen einen diskriminativen
Algorithmus
nennen Das ist also die Grundidee. Diese beiden unterschiedlichen
Ansätze werden uns helfen diskriminative
und generative Algorithmen
zu verstehen Lassen Sie uns weitermachen und
unsere beiden Arten von Algorithmen formal definieren , die auf unserem Aliens-Ansatz
basieren Die erste Aliens-Methode ist ein Paradebeispiel für das, was wir generative
Klassifikation nennen Hier lernt ein Modell, für jede Klasse eine Repräsentation
zu generieren Es ist, als würde man lernen, wie
ein Apfel oder eine Banane aussieht, und dieses Wissen nutzen, um die zukünftige Instanz zu identifizieren. Im Gegensatz dazu steht die
zweite Aliens-Methode für eine diskriminierende Klassifizierung Dieses Modell lernt, Klassen anhand
ihrer Merkmale zu
unterscheiden Klassen anhand
ihrer Merkmale zu
unterscheiden Anstatt zu lernen, wie ein
Apfel oder eine Banane aussieht, lernt
es die Unterschiede
zwischen ihnen kennen. Anhand dieser Unterschiede entscheidet es dann , was eine
neue Frucht sein könnte. Jeder Ansatz hat seine eigenen
Stärken und Schwächen, und sie werden in
verschiedenen Szenarien verwendet. Nachdem wir die Konzepte
vorgestellt haben, wollen wir sie nun
genauer untersuchen. Um diese Konzepte besser zu verstehen, werden
wir uns mit
spezifischen Algorithmen befassen , die diese beiden
Arten von Klassifizierungen verwenden Für die diskriminative
Klassifikation betrachten
wir als Beispiel die logistische
Regression Und für die generative
Klassifikation wird
unser Beispiel der
naive Basisalgorithmus sein Im Bereich der
diskriminativen Klassifikation schafft die
logistische Regression also
eine Entscheidungsgrenze, schafft die
logistische Regression also
eine Entscheidungsgrenze die auf den Merkmalen
der Eingabe
basiert unserem Beispiel für Obst könnten
diese Merkmale
Farbe, Länge oder Gewicht sein Der Algorithmus lernt anhand
dieser Merkmale
Muster und verwendet
sie dann, um neue Früchte zu klassifizieren Umgekehrt
versucht der naive
Basisalgorithmus, bei dem es sich um ein generatives
Klassifikationsmodell handelt, bei dem es sich um ein generatives
Klassifikationsmodell handelt,
die Verteilung
der einzelnen Klassen im
Merkmalsraum zu verstehen der einzelnen Klassen im Anstatt nur
die Unterschiede zwischen den Klassen zu identifizieren , lernt
er, wie sich die einzelnen Klassen in den
Daten verteilen Lassen Sie uns nun tiefer gehen
und verstehen, wie diese Algorithmen die
Strategien zur Klassifizierung neuer Daten nutzen Beim logistischen
Regressionsmodell haben wir es mit
Merkmalen wie Farbe,
Länge und Gewicht
der Früchte zu tun ,
Länge und Gewicht
der Das Modell verwendet diese Merkmale , um Muster zu lernen
und Entscheidungen zu treffen Es
könnte zum Beispiel lernen, dass, wenn eine Frucht eine gelbe Farbe hat
und länger als 5 Zoll ist, Wahrscheinlichkeit hoch ist, dass
es sich um eine Banane handelt. Diese Methode, anhand von
Merkmalen von Beispielen eine
Entscheidungsgrenze festzulegen, ist der Kern des
diskriminativen Lernens Auf der anderen Seite
versucht
generatives Lernen, das vom naiven Basismodell
verwendet wird,
die Verteilung jeder Klasse
in einer multidimensionalen Ebene zu verstehen die Verteilung jeder Klasse in einer multidimensionalen Ebene wie ein dreidimensionaler Raum
für unsere drei für unsere drei Das Modell versucht anhand
ihrer Farbe, Form und ihres Gewichts zu visualisieren ,
wo Äpfel und
Bananen in diesem Raum wahrscheinlich vorkommen ,
wo Äpfel und Lassen Sie uns nun über
einige wichtige Fragen zu
generativen und
diskriminativen Modellen nachdenken einige wichtige Fragen generativen und
diskriminativen Modellen Fragen wie welches Modell mehr Daten für das Training
benötigt? Welches ist
von fehlenden Daten betroffen? Welches Modell wird von Ausreißern
beeinflusst, welches erfordert mehr Mathematik
und welches Modell neigt dazu, zu stark zu passen Es ist wichtig, über
diese Fragen nachzudenken , da sie sich darauf auswirken, wie Sie diese Modelle
verwenden könnten Ein generatives
Modell benötigt beispielsweise nicht viele Daten, da es lediglich versucht, die grundlegenden
Eigenschaften jeder Klasse zu verstehen. Ein diskriminatives
Modell benötigt jedoch mehr Daten, da es versucht,
die komplizierten Unterschiede
zwischen den Klassen zu die komplizierten Unterschiede
zwischen den über diese Fragen nachdenken,
können Sie
diese Modelle besser verstehen und
effektiver einsetzen Machen Sie sich jedoch keine Sorgen, wenn Sie sich bei den Antworten
nicht sicher sind. Wir werden
sie ausführlich besprechen. Schauen wir uns also
die erste Frage an. Welches Modell benötigt mehr
Daten für das Training? Diskriminative Modelle
wie die logistische Regression benötigen
im Allgemeinen mehr
Daten Sie lernen, indem sie
Unterschiede zwischen den Klassen erkennen. Sie benötigen also eine reiche
und vielfältige Reihe von Beispielen, um
dies effektiv zu tun. Die zweite Frage ist, welche ist
von fehlenden Daten betroffen? Tatsache ist, dass beide Arten von Modellen
durch fehlende Daten beeinträchtigt werden können. Generative Modelle sind jedoch
möglicherweise sensibler , da sie
versuchen,
die Gesamtverteilung
der Daten zu erfassen . Jede fehlende
Information könnte ihr Verständnis dieser
Verteilung verzerren Die nächste Frage ist, welches Modell von
Ausreißern betroffen ist? Auch hier können Ausreißer beide Modelle
betreffen, diskriminierende Modelle sind
jedoch
möglicherweise anfälliger. Diese Modelle konzentrieren sich auf
Grenzen zwischen Klassen, und ein Ausreißer könnte diese erheblich verschieben Die nächste Frage ist, was mehr Mathematik
erfordert? Was die Mathematik angeht, erfordern
generative Modelle wie
Naive Base oft mehr Berechnungen, da sie die Schätzung der
Datenverteilung
beinhalten, was
rechenintensiv sein kann Und die letzte Frage ist,
welches Modell neigt dazu, übermäßig gut zu passen? Eine Überanpassung kann
in beiden Modellen vorkommen, diskriminierende Modelle sind
jedoch
im Allgemeinen anfälliger dafür Das liegt daran, dass sie sich zu sehr auf die Trainingsdaten einstellen selbst
deren
Störungen und Fehler lernen Und da wir nun
den Unterschied zwischen
diskriminativen und generativen Algorithmen für
maschinelles Lernen kennen diskriminativen und generativen , wollen wir einige gängige
Beispiele für jeden Typ aufschlüsseln Bei einigen
der diskriminativen Algorithmen
handelt es sich also um logistische Regression,
unterstützende Vektormaschinen, Entscheidungsbäume, Random Forests und Bei einigen der generativen
Algorithmen handelt es sich naive Basisalgorithmen, Gaußsche
Mischungsmodelle,
Hidden-Markov-Modelle, latente um
naive Basisalgorithmen, Gaußsche
Mischungsmodelle,
Hidden-Markov-Modelle,
latente direkte Allokation und generative gegnerische Netzwerke. Um das Ganze zusammenzufassen, haben
wir in diesem Video anhand einer einfachen und fesselnden Geschichte das Wort
diskriminativer und generativer Modelle aufgegriffen diskriminativer . Wir haben gesehen, wie die
logistische Regression in einem diskriminativen Modell
unterschiedliche Merkmale verwendet , um
Entscheidungsgrenzen zu schaffen, während die
naive Basis des generativen Modells versucht, die Gesamtverteilung der Daten zu verstehen den
Unterschied zwischen
diskriminativen und
generativen Modellen verstehen , erhalten wir wertvolle Einblicke in die Funktionsweise Generative Modelle, wie
sie in der generativen KI verwendet werden, lernen die zugrunde liegende Verteilung
der Trainingsdaten Dieses Wissen wird
dann verwendet, um
neue Daten zu generieren , die
die Trainingsdaten widerspiegeln. Aus diesem Grund ist generative
KI so mächtig. Sie kann neue realistische
Ergebnisse wie Bilder,
Text und sogar Musik generieren , weil sie die Welt
ihrer Trainingsdaten
versteht. Im Gegensatz dazu lernen
diskriminative Modelle einfach die Grenzen zwischen Klassen und werden hauptsächlich für
Klassifikationsaufgaben verwendet Sie können keine neuen
Daten generieren, weil sie nicht versuchen,
die zugrunde liegende
Verteilung der Daten, die Unterschiede zwischen
den Klassen, zu verstehen die zugrunde liegende
Verteilung der Daten, die Unterschiede zwischen
den Klassen, Unterschiede zwischen
den Klassen diese Unterschiede verstehen, können
Sie
die Leistungsfähigkeit
und Flexibilität
generativer KI-Systeme besser einschätzen . Dieses Verständnis könnte
Ihnen bei der Entscheidung
helfen, welche Art von KI-System für Ihr spezielles
Projekt oder
Ihren Anwendungsfall am besten geeignet Ihr spezielles
Projekt oder
Ihren Anwendungsfall Damit sind wir am Ende
des ersten Abschnitts dieses Kurses,
der traditionellen
künstlichen Intelligenz, angelangt dieses Kurses,
der traditionellen
künstlichen Intelligenz, Wir sehen uns in Abschnitt zwei, wo wir über generative
künstliche Intelligenz sprechen.
6. L2V1 – Transformatoren: Lassen Sie uns nun über
Transformatoren und
ihre führende Rolle bei der
Förderung generativer
künstlicher Intelligenz sprechen ihre führende Rolle bei Förderung generativer
künstlicher Intelligenz Transformatoren sind eine Art
neuronales Netzwerk, das Lage ist,
Abhängigkeiten mit großer Reichweite in Sequenzen zu lernen Dadurch eignen sie sich gut für Aufgaben wie die
Textgenerierung, bei der das Modell den Kontext
der vorherigen Wörter
verstehen muss ,
um das nächste Wort zu generieren. Transformers
sorgten 2018 für eine Revolution in der Verarbeitung natürlicher Sprache. Lassen Sie uns nun sehen, wie
Transformatoren funktionieren. Transformatoren
bestehen aus zwei Hauptteilen, einem Encoder und einem Decoder Encoder sind
dafür verantwortlich,
eine Eingangssequenz zu nehmen und sie in eine
Folge von versteckten Zuständen
umzuwandeln Der Encoder besteht aus
einem Stapel von Selbstaufmerksamkeitsschichten Selbstaufmerksamkeit ist ein Mechanismus
, der es dem Encoder ermöglicht, der
Erzeugung der verborgenen Zustände verschiedene Teile
der Eingabesequenz zu bei
der
Erzeugung der verborgenen Zustände verschiedene Teile
der Eingabesequenz zu berücksichtigen Auf diese Weise kann der Encoder weitreichende Abhängigkeiten
in der Eingabesequenz lernen , was für Aufgaben
wie die Textgenerierung unerlässlich ist Decoder sind
dafür verantwortlich eine Abfolge von versteckten Zuständen und eine
Ausgabesequenz zu erzeugen Der Decoder besteht ebenfalls aus einem Stapel
von
Selbstaufmerksamkeitsschichten Der Decoder
verfügt jedoch auch über eine spezielle
Aufmerksamkeitsschicht, die es ihm
ermöglicht, bei der
Generierung
der Ausgabesequenz die Eingangssequenz zu berücksichtigen Auf diese Weise kann der Decoder
lernen, wie eine Ausgabe
generiert wird, die mit der
Eingabesequenz konsistent ist mit der
Eingabesequenz konsistent Der Encoder und der Decoder
arbeiten also zusammen, um
eine Ausgabesequenz zu erzeugen Der Encoder wandelt zunächst die Eingabesequenz in eine Folge von versteckten
Zuständen Der Decoder nimmt dann diese versteckten Zustände und
generiert eine Ausgabesequenz Die
Aufmerksamkeitsschicht des Decoders ermöglicht es ihm, bei der
Generierung der Ausgabe die Eingabesequenz
zu Auf diese Weise kann der Decoder
lernen, wie eine Ausgabe
generiert wird, die mit der
Eingabesequenz konsistent ist mit der
Eingabesequenz konsistent Die
Verwendung von Transformatoren
für generative KI bietet mehrere Vorteile Verwendung von Transformatoren
für generative KI Erstens sind Transformatoren in der Lage, Abhängigkeiten mit großer Reichweite in Sequenzen zu
erlernen. Dadurch können sie
realistischere und
kohärentere Ergebnisse erzeugen . Zweitens können Transformatoren an sehr
großen Datensätzen trainiert
werden Dadurch können sie
komplexere Muster und
Beziehungen in den Daten lernen komplexere Muster und
Beziehungen in den Daten Und drittens können
mehrere
parallele Transformatoren zusammenarbeiten. Dadurch können sie schneller
und effizienter
trainiert werden . Aufgrund dieser Vorteile haben sich
Transformatoren
zum hochmodernen Ansatz für eine Vielzahl
generativer KI-Aufgaben
wie Textgenerierung, wie Textgenerierung, Bildgenerierung und
Musikgenerierung entwickelt. Bei der Verwendung von Transformatoren ist zu beachten , dass sie
Halluzinationen erzeugen können In Transformatoren
sind Halluzinationen Wörter oder Phrasen, die durch das Modell erzeugt
werden und die oft unsinnig oder
grammatikalisch falsch sind . Aber warum passieren Halluzinationen? Halluzinationen können
durch eine Reihe von Faktoren verursacht werden,
darunter, dass das Modell nicht mit genügend Daten
trainiert wurde, das Modell mit verrauschten
oder verschmutzten Daten trainiert wurde, dass
dem genügend Kontext
gegeben wurde
oder dass dem Modell nicht genügend Einschränkungen dass das Modell mit verrauschten
oder verschmutzten Daten trainiert wurde, dass
dem Modell nicht genügend Kontext
gegeben wurde
oder dass dem Modell nicht genügend Einschränkungen
zugewiesen wurden. Halluzinationen können für Transformatoren ein
Problem darstellen,
da sie dazu führen können , dass der Ausgabetext schwer zu
verstehen ist. Sie können auch die Wahrscheinlichkeit erhöhen, dass das
Modell falsche oder
irreführende Informationen
generiert Wie können wir also Halluzinationen mildern? Es gibt eine Reihe von Möglichkeiten, Halluzinationen bei Transformatoren zu mildern Eine Möglichkeit besteht darin, das
Modell anhand von mehr Daten zu trainieren. Eine andere Möglichkeit besteht darin, eine
Technik namens Strahlsuche zu verwenden, die es dem
Modell ermöglicht,
ein breiteres Spektrum
möglicher Ergebnisse zu untersuchen . Und schließlich ist es wichtig, dem Modell
genügend Kontext und
Einschränkungen
zu geben , damit es keine unsinnige oder
grammatikalisch falsche Ausgabe
generiert Hier sind einige Beispiele für
Halluzinationen , die durch Transformatoren erzeugt wurden. Die Katze saß auf der Matte
und der Hund fraß den Mond. Der Junge ging in den Laden
und kaufte eine Gallone Luft. Die Frau fuhr zur Bank
und hob 1 Million Dollar ab. Wie Sie sehen können, sind
diese Beispiele alle unsinnig oder
grammatikalisch falsch Dies liegt daran, dass die Transformatoren diese Wörter
oder Phrasen ohne Kontext oder Einschränkungen generiert
haben oder Phrasen ohne Kontext oder Einschränkungen Es ist wichtig zu beachten, dass Halluzinationen nicht
immer eine schlechte Sache sind In einigen Fällen
können sie verwendet werden, um kreative und
interessante
Texte zu generieren Es ist jedoch wichtig, sich des Potenzials für
Halluzinationen bei der
Verwendung von Transformatoren bewusst zu
sein Halluzinationen bei der
Verwendung von Transformatoren und Maßnahmen zu ihrer Minderung
zu ergreifen Transformatoren werden
verwendet, um
eine Vielzahl
kreativer Inhalte zu generieren ,
darunter Text, Bilder,
Musik und sogar Videos Zu den häufigsten
Anwendungen von Transformatoren
in der generativen KI gehört die
Textgenerierung. Transformatoren können verwendet werden, um Texte
wie Nachrichtenartikel,
Blogbeiträge und
kreatives Schreiben zu
generieren . Zum Beispiel wurde das
Transformer-Modell
GPT Three verwendet, um realistisch aussehende
Fake-News-Artikel zu generieren, und es kann sogar
Gedichte und Geschichten schreiben Generierung von Bildern.
Transformatoren können verwendet
werden, um
Bilder wie Gemälde,
Fotografien und digitale Kunst zu erzeugen . Das
Transformator-Modell
Imagine wurde beispielsweise
verwendet, um
realistisch aussehende Bilder von
Menschen, Tieren und Objekten zu erzeugen . Generierung von Musik.
Transformers können verwendet
werden, um Musik
wie Songs,
Melodien und Beats zu erzeugen wie Songs,
Melodien und Beats Zum Beispiel war das
Transformer-Modell
Mus Net in der Lage, Originalmusik zu
erzeugen, die
klingt, als wäre sie
von einem menschlichen Musiker komponiert worden Originalmusik zu
erzeugen, die
klingt, als wäre sie
von einem menschlichen Musiker komponiert Und wir haben Videogenerierung. Transformers können
zur Generierung von Videos
wie Filmen, Fernsehsendungen
und Zeichentrickfilmen dem
Transformer-Modell
Deep Mind Video
wurde beispielsweise ein
realistisch aussehendes
Video generiert , das
aussieht, als wäre es von einem
menschlichen Kameramann aufgenommen Da sich die Technologie
weiterentwickelt, können
wir erwarten, dass
noch mehr erstaunliche Anwendungen
von Transformatoren
in der generativen KI zu sehen noch mehr erstaunliche Anwendungen sind. Transformatoren haben
das Potenzial, die Weise, wie wir Inhalte
erstellen und konsumieren, zu
revolutionieren, und sie
werden bereits verwendet, um einige wirklich
unglaubliche Dinge zu schaffen. Ich
7. L2V2 – Gen-KI: Willkommen bei generativer
künstlicher Intelligenz. Wir beginnen dieses Video mit der
Erklärung, wie man zwischen
generativer KI
und traditionellem
maschinellen Lernen
unterscheidet . Dann geben wir eine
formale Definition für generative künstliche
Intelligenz und beenden das Video mit einigen
Beispielen für generative KI. Hier zeigen wir zwei wichtige Ansätze im Bereich der
künstlichen Intelligenz traditionelles maschinelles Lernen und generative
künstliche Intelligenz. Das obere Bild zeigt
traditionelles maschinelles Lernen. Hier lernt das Modell
aus Daten, an denen Etiketten angebracht sind. Es
ermittelt den Zusammenhang
zwischen den Merkmalen der Daten und
den
entsprechenden Bezeichnungen. Dieses Verständnis
wird dann genutzt, um
fundierte Vermutungen über neue
Daten anzustellen, die es noch nie zuvor gesehen Jetzt zeigt der untere Teil
des Bildes
etwas anderes Das generative KI-Modell. Anstatt nur
die Beziehung zwischen
Eingaben und Ausgaben herauszufinden ,
geht es tiefer. Es konzentriert sich auf das komplexe
Muster im Inhalt. Dieses Verständnis von
Mustern gibt ihm die Möglichkeit, eigenständig neue und
realistische Inhalte zu erstellen. Das kann alles sein, ein Gedicht, ein Nachrichtenartikel, ein Bild oder sogar eine Musikkomposition. Sie sehen also, dass generative KI
der riesigen Welt der KI
einen neuen kreativen Blickwinkel verleiht . Die Art des Outputs
spielt eine entscheidende Rolle
bei der Unterscheidung zwischen generativer KI und anderen Modellen. Herkömmliche Modelle liefern
in der Regel kategorische oder
numerische Ergebnisse, z. B. ob es sich bei einer
E-Mail um Spam handelt oder
nicht, oder um Verkaufszahlen vorherzusagen Andererseits kann
generative KI Ergebnisse wie
geschriebene oder gesprochene Sprache,
Bilder oder sogar Audio
erzeugen, was ihre Fähigkeit widerspiegelt, Inhalte zu generieren,
die die Realität nachahmen Mathematisch können wir uns das
so vorstellen. Wenn Sie diese Gleichung in letzter
Zeit nicht gesehen haben,
finden Sie hier eine kurze Erinnerung Die Gleichung Y ist gleich F von X berechnet das Ergebnis auf der
Grundlage variierender Y symbolisiert das
Ergebnis des Modells. F steht für die Funktion, die
wir bei der Berechnung verwenden. Und was ist mit X?
Das stellt die Eingaben oder Eingaben dar, die in der Gleichung
verwendet werden. Einfach ausgedrückt ist die Ausgabe
des Modells also eine
Funktion aller Eingaben. Hier kommt es darauf an, die Art der Ausgabe Y als
Funktion
der Eingaben X zu
verstehen . Herkömmliche Modelle
führen im Allgemeinen zu numerischen Ergebnissen. Generative
KI-Modelle können
diese numerischen Werte zwar verschiedenen Informationsformen zuordnen,
wodurch sie in der Lage sind,
komplexe Antworten
wie Sätze in natürlicher Sprache
oder Bilder und Videos zu erzeugen . Um die traditionellen
klassischen überwachten
und
unbeaufsichtigten
Lernprozesse auf hoher Ebene zusammenzufassen traditionellen
klassischen überwachten
und
unbeaufsichtigten , Sie Trainingscode und
Kennzeichnungsdaten, um ein Modell zu erstellen Je nach
Anwendungsfall oder Problem kann
Ihnen
das Modell eine Prognose geben Es kann etwas klassifizieren
oder etwas gruppieren. Der Unterschied liegt
in der Anwendung. Herkömmliche Modelle
machen Vorhersagen, klassifizieren oder gruppieren Daten, während generative KI-Modelle vielseitiger
sind und ein breites
Spektrum an Inhalten
erzeugen Die generative KI-Methode kann mit
Trainingscode, beschrifteten
und unbeschrifteten Daten aller Art
arbeiten, und unbeschrifteten Daten aller Art um ein sogenanntes
Basismodell zu erstellen. Dieses Basismodell kann
dann neue Inhalte
wie Text, Code,
Bilder, Audio, Video usw. erzeugen wie Text, Code, Bilder, Audio, Video usw. Die Stärke der generativen KI liegt in ihrer Fähigkeit,
verschiedene Datentypen,
einschließlich unbeschrifteter Daten, aufzunehmen, um Modelle zu erstellen, die neue Inhalte
generieren, was über die Funktionen herkömmlicher
Modelle hinausgeht Wir haben einen langen
Weg zurückgelegt und uns von der traditionellen Programmierung
zu neuronalen Netzwerken und jetzt zu generativen Modellen entwickelt In den alten Zeiten der
traditionellen Programmierung mussten
wir
die Regeln manuell eingeben, mussten
wir
die Regeln manuell eingeben um die Katze zu
unterscheiden. Wir mussten spezifische
Regeln in das Programm einbetten. Es war ungefähr so, wenn es ein Tier mit vier
Beinen, zwei Ohren Fee ist und eine Vorliebe
für Garn und Katzenminze zeigt, dann ist es wahrscheinlich Und das
alles mussten wir in
einer Programmiersprache schreiben
und nicht in natürlicher Sprache Wie bei neuronalen Netzwerken könnten
wir die
Netzwerkbilder von Katzen und Hunden zeigen dann fragen: Ist das eine Katze? Das Netzwerk würde wahrscheinlich mit einer
Vorhersage
antworten, es ist eine Katze. Wir können also sehen, dass neuronale
Netzwerke eine nuanciertere Entscheidungsfindung ermöglichen ,
indem sie anhand von Beispielen trainiert werden, was eine Weiterentwicklung
von festen Programmierregeln darstellt In der generativen Welle können
wir unsere eigenen Inhalte
wie Text, Bilder,
Audio, Video usw. produzieren wie Text, Bilder, Audio, Video usw. Modelle wie Palm oder
Pathways Language Model, Lambda Language Model for
Dialog Applications und GPT, generative
Pre-Trained Transformer, verbrauchen riesige
Datenmengen aus unterschiedlichen Quellen, einschließlich dem Internet, um grundlegende
Sprachmodelle zu erstellen. Diese können einfach verwendet werden
, indem eine Frage gestellt wird, egal ob sie in eine Aufforderung eingegeben oder mündlich gesprochen wird
die Aufforderung selbst. Wenn wir also fragen, was eine Katze ist, kann
sie uns alles geben, was sie über die Katze gelernt
hat. Generative KI fördert die
Benutzerinteraktion und macht Benutzer von bloßen
Zuschauern zu aktiven Schöpfern Modelle wie Palm, Lambda und GPT Sie wurden
anhand großer Datenmengen trainiert und bieten intelligente,
kontextsensitive Dieser Fokus auf den Benutzer macht generative KI für
eine Reihe verschiedener
Anwendungen attraktiv eine Reihe verschiedener
Anwendungen Lassen Sie uns nun unsere
formale Definition angeben. Was ist generative KI? Generative KI ist eine Art
künstlicher Intelligenz, die neue Inhalte
auf der Grundlage dessen
erstellt , was sie
aus bestehenden Inhalten gelernt hat. Der Prozess des Lernens aus
vorhandenen Inhalten wird als
Training bezeichnet und führt zur Erstellung eines statistischen
Modells, wenn er dazu aufgefordert wird. KI verwendet das Modell
, um vorherzusagen, wie eine erwartete Reaktion aussehen könnte,
und daraus werden neue Inhalte generiert Der Schwerpunkt liegt dabei auf der Vererbbarkeit generativer
KI beim Lernen und Schaffen Im Gegensatz zu herkömmlichen Modellen, die auf der Grundlage vorab
festgelegter Beziehungen
Vorhersagen treffen, konzentriert sich die
generative KI auf das
Verständnis der zugrunde liegenden
Struktur der Eingabedaten Nach dem Training kann das Modell einzigartige
Antworten oder Inhalte
generieren, was die Anwendungen
und Fähigkeiten von KI-Systemen erheblich
erweitert und Fähigkeiten von KI-Systemen Im Wesentlichen lernt es
die zugrunde liegende Struktur der Daten und kann dann neue Stichproben generieren , die den
Daten ähneln, mit denen es trainiert wurde Schauen wir uns also an,
was der Unterschied zwischen Sprachmodellen
und Bildmodellen ist. Generative
Sprachmodelle lernen anhand von Trainingsdaten etwas
über
Sprachmuster. Anhand einiger Texte sagen
sie dann voraus, was als Nächstes kommt. Generative Bildmodelle erzeugen mithilfe von
Techniken wie Diffusion
neue Bilder. Anhand einer Aufforderung
oder verwandter Bilder verwandeln
sie zufälliges Rauschen in Bilder oder erzeugen anhand von Eingabeaufforderungen
Bilder Schauen wir uns jeden einzelnen etwas
genauer an. Wie bereits erwähnt, konzentrieren sich
generative Sprachmodelle
darauf , die den Daten
innewohnende Musterstruktur zu erfassen innewohnende Musterstruktur Anschließend nutzen sie diese erlernten Muster, um neue
Antworten oder Inhalte zu generieren Die den Originaldaten oft sehr
ähnlich sind. Diese Eigenschaften machen
große Sprachmodelle einem außergewöhnlichen Beispiel für
generatives AIS-Potenzial. Ein generatives
Sprachmodell verwendet Text als Eingabe und kann mehr Text und Bild,
Audio oder Entscheidungen
ausgeben. Beispielsweise wird unter
dem Ausgabetext die Beantwortung von
Fragen generiert, und unter dem Ausgabebild wird ein
Video generiert. Große
Sprachmodelle sind also eine Art generativer KI
, weil sie
neuartige Textkombinationen
in Form von natürlich
klingender Sprache erzeugen neuartige Textkombinationen in Form von natürlich
klingender Sprache Wir haben auch generative
Bildmodelle, die ein Bild als
Eingabe verwenden und Text, ein
anderes Bild oder Video ausgeben können anderes Bild oder Video Unter
dem Ausgabetext können
Sie beispielsweise eine visuelle Beantwortung von
Fragen finden, was eine Aufgabe in der
Computervision ist , bei der
Fragen zu einem Bild beantwortet werden, während unter Ausgabebild eine Bildvervollständigung generiert
wird. Und auf ihrem Ausgabevideo wird eine
Animation generiert. Wie bereits erwähnt, lernen
generative
Sprachmodelle
anhand ihrer Trainingsdaten etwas über Muster und Sprachstrukturen Muster und Sprachstrukturen. Und wenn ihnen dann Text gegeben wird, versuchen
sie vorherzusagen,
was als Nächstes kommt. Generative
Sprachmodelle
können also gewissermaßen als
Mustervergleichssysteme betrachtet werden, ihre Fähigkeit verbessern,
Muster anhand der ihnen
präsentierten Daten zu erkennen Muster anhand der ihnen
präsentierten Daten zu wir nun
die formale Definition von generativer künstlicher
Intelligenz vorgestellt haben, wollen wir dieses Video mit einigen
Beispielen für generative KI beenden Hier ist ein Beispiel für die automatische
Vervollständigung der Google-Suche. Basierend auf den Erkenntnissen, die es
aus seinen Trainingsdaten gelernt hat, bietet
es Vorhersagen darüber, wie dieser Satz
zu vervollständigen ist. Katzen hassen es, und einige
der Vorschläge sind, dass Katzen den Geruch von Katzen hassen, dass Katzen
Wasser hassen, Katzen Gurken hassen. Hier ist dasselbe
Beispiel mit Bar, einem
Sprachmodell, das auf
einer riesigen Menge von
Textdaten trainiert wurde und
in der Lage ist, zu generieren kommunizieren und als Antwort auf eine Vielzahl
von Aufforderungen und Fragen
menschenähnlichen Text zu Wenn ich also die Aufforderung verwende, hassen
Katzen Antworten Katzen hassen viele Dinge, aber zu den häufigsten
gehören,
und dann eine Liste von Dingen, von denen sie glauben, dass Katzen
sie hassen würden. Und dieselbe Eingabeaufforderung
mit GPT 4 erzeugt diese
Antwort. Katzen hassen Katzen können als
Reaktion auf eine Vielzahl von
Situationen, Objekten
oder Verhaltensweisen Abneigung
oder Unbehagen zum Ausdruck bringen Reaktion auf eine Vielzahl von
Situationen, Objekten
oder Verhaltensweisen Abneigung
oder Im Folgenden sind einige der
Dinge aufgeführt, die Katzen normalerweise nicht mögen, und einige
der Dinge aufgeführt , von denen Katzen
glauben, dass sie sie hassen würden Ähnlich wie Bart ist auch
GPT Four
ein Sprachmodell, das auf
einer riesigen Menge
von Textdaten trainiert wurde und zu generieren in der Lage
ist, als Antwort auf
eine Vielzahl von
Aufforderungen
und Fragen zu kommunizieren und menschenähnlichen
Text eine Vielzahl von
Aufforderungen Schauen wir uns nun einige
Beispiele für die Bilderzeugung an. Wir verwenden dieselbe Eingabeaufforderung für
drei verschiedene KI-Tools. Die Aufforderung ist eine Katze, umgeben
von Dingen, die Katzen hassen. Wenn wir diese Aufforderung mit DALE versuchen
, einem KI-Bildgenerator
, der von OpenAI entwickelt wurde, derselben Firma, die auch GPT entwickelt hat Wir erhalten dieses Ergebnis. Wir können es auch mit
Adobe Firefly Tik
zum Bildgenerator ausprobieren Adobe Firefly Tik
zum Bildgenerator Und dies sind einige
der Ergebnisse
, die wir von Firefly erhalten Wir können auch die
Text-zu-Bild-Anwendung Canva ausprobieren. Sie enthält einige
Beispiele dafür, was sie als Antwort auf unsere Eingabeaufforderungen für angemessen
hält Bitte beachte, dass
wir hier eine sehr
minimalistische Aufforderung verwendet haben, nur um zu zeigen, dass
wir auch
ohne viel Kontext
Ergebnisse erzielen können, wir auch
ohne viel Kontext
Ergebnisse erzielen können, die mehr
oder weniger relevant sind Wir würden ein viel besseres
Ergebnis erzielen, wenn unsere Aufforderung mehr Details
enthalten und einer soliden Struktur
folgen Dies verdeutlicht,
wie wichtig eine schnelle Planung und
schnelle Planung sind, worauf wir später
in diesem Abschnitt eingehen werden. Im nächsten Video werden wir über Transformatoren
sprechen, eine Technologie, die all
dies ermöglicht hat . Wir
sehen uns im nächsten.
8. L2V3 – Gen-KI-Anwendungen: Schauen wir uns
die Art der Aufgaben an , die verschiedene
KI-Modelle ausführen können. Diese Aufgabe kann im Allgemeinen anhand der Art der
Eingabedaten, die sie akzeptieren, und
der Art der von ihnen generierten
Ausgabedaten
klassifiziert Eingabedaten, die sie akzeptieren, und werden. Hier sind einige Beispiele. Text zu Text. Dies wird in
der Regel bei
maschineller Übersetzung, Textzusammenfassung und Chatbots
wie Bard und Chat Wenn Sie beispielsweise
GPT 4 fragen, was ist eine Katze? Ich würde Ihnen sagen, eine Katze ist
ein kleines fleischfressendes Säugetier
, das oft als Haustier gehalten wird Der Begriff bezieht sich im Allgemeinen auf Katzen, und dann generiert er immer mehr Informationen über Katzen Ein anderes Modell ist Text zu Bild. Dies wird verwendet, um
Bilder aus Textbeschreibungen zu generieren. Ein Beispiel hierfür wäre die Canvas-Text-zu-Bild-Anwendung, die Bilder
aus Texteingaben erstellt. In diesem Beispiel
können wir die Aufforderung
einer grau-weißen Katze verwenden , die auf
einer Fensterbank sitzt und Tauben draußen beobachtet Und es wird dieses
Bild für uns erzeugen. Text zum Video. KI kann auch verwendet werden, um Videos aus
Textbeschreibungen zu generieren, obwohl dies eine
komplexere und weniger erforschte Aufgabe ist als die Generierung von Text zu Bild. Mit
Tools wie in Videos können
wir beispielsweise ein Video
mit nur einem Abschlussball erstellen. Das KI-Modell verwendet unsere Aufforderung, um ein
Skript für das Video zu schreiben, und wählt
dann Bilder und Videoclips aus, die für den
Inhalt des Skripts
relevant sind . Es kann sogar Filter und
Übergänge auf das Video anwenden. Einige dieser Tools
können auch Musik auswählen , die für den
Inhalt des Videos relevant ist. Das KI-Modell
kann beispielsweise Haustiere mit
Verspieltheit assoziieren und dann
eine verspielte Musik auswählen , die dem Video
hinzugefügt werden soll Text to Three D erzeugen
diese Modelle dreidimensionale Objekte, die Textbeschreibung eines Benutzers
entsprechen Wenn Sie beispielsweise Shape E fragen, ein bedingtes
generatives Modell für drei D-Objekte, um
ein Flugzeug zu bauen , das wie eine Banane
aussieht. Es erzeugt das
Drei-D-Objekt, das Sie hier sehen können. Wir haben auch Text zum Codieren. Diese Modelle sind in der Lage, eine Beschreibung in
natürlicher Sprache zu verwenden und darauf
aufbauend einen Code zu erstellen. Es ist nützlich für Aufgaben wie
automatisierte Codegenerierung, Fehlererkennung und
Codeübersetzung. Zum Beispiel haben GPT, Bart und Github Copilot gemeinsam die Fähigkeit, Code
zu generieren Modelle wie Chat GPT aufgrund ihrer Ausbildung zu einer
Vielzahl von Internettexten,
einschließlich Code, in der Lage, Code zu
generieren,
wenn sie
mit einem geeigneten Abschlussball ausgestattet Bart Two arbeitet in
derselben Richtung, aber seine Ausbildung konzentriert sich speziell auf die
Programmierung verwandter Texte Wir haben auch einen Github-Copilot , der das Codex-Modell von OpenAI verwendet, das auf
öffentlich verfügbarem Code trainiert wurde, sodass er Codevervollständigung vorschlagen und
Code aus Kommentaren
oder
Funktionssignaturen generieren kann Nimmt die Aufgabe an. Modelle, die
Aufgaben erledigen, werden darauf trainiert, eine definierte Aufgabe oder
Aktion auf der Grundlage von Texteingaben auszuführen. dieser Aufgabe kann es sich eine Vielzahl von Aktionen handeln,
z. B. das Beantworten einer Frage, Durchführen einer Suche, das
Erstellen einer Vorhersage oder das Ergreifen von Maßnahmen. Ein
Modell von Ts to Task könnte beispielsweise darauf trainiert werden, auf einer Web-Benutzeroberfläche zu navigieren oder über die GUI Änderungen an einem
Dokument
vorzunehmen. Wir haben auch Bild zu Text. Dies wird bei Aufgaben wie
Bilduntertiteln verwendet , bei denen die KI ein Bild in Worten
beschreibt Zum Beispiel kann BLiP,
ein KI-Modell Bilder
sowohl untertiteln als auch
erzeugen
kann, ein Bild als
Eingabe verwenden und als Ausgabe
eine Beschreibung dieses
Bildes im Text bereitstellen eine Beschreibung dieses
Bildes im Text Wir haben auch Bild zu Bild. Diese Modelle führen Aufgaben wie die Bildübersetzung aus, z.
B. Konvertieren von Tagesbildern in Nachtbilder, Kolorieren von
Schwarzweißbildern oder das Verbessern der Bildauflösung Night Cafe ist beispielsweise
ein KI-Bildgenerator, der ein Bild als Eingabe verwenden
kann, ein Bild als Eingabe verwenden
kann um den
Bilderstellungsprozess zu initialisieren Anschließend wird ein
stilisiertes Bild als
Ausgabe erzeugt , das auf der Eingabeaufforderung des Benutzers
und anderen Einstellungen basiert , die angepasst werden können Je nach
ausgewähltem Algorithmus, künstlerisch oder kohärent, dient
das Startbild
unterschiedlichen Zwecken Für den künstlerischen Algorithmus die Formen und Strukturen sind
die Formen und Strukturen
im Bild
bedeutsamer. Beim kohärenten Algorithmus wird jedoch mehr Wert auf
Auflösung, Farben und Texturen gelegt . wir uns als weiteres Beispiel die Schauen wir uns als weiteres Beispiel die
magische Bearbeitungsfunktion von Canva an Mit dieser Funktion können wir einen bestimmten Teil
des Bildes
auswählen und durch ein anderes Bild ersetzen Hier
wähle ich zum Beispiel den Korb aus und teile dem
Modell dann mit, dass ich ihn
durch eine
Bergkette ersetzen möchte , in der
Hoffnung, dass das Ergebnis
so aussieht , als würde die Katze auf einem Felsen
sitzen. Und wir können sehen, dass mir
das Modell einige Vorschläge macht. Wenn ich
mit dem Ergebnis nicht zufrieden bin, kann
ich das Modell bitten, die Ergebnisse
zu regenerieren , bis ich etwas
finde, das mir gefällt Und hier ist das Endergebnis. Ich kann sogar noch weiter gehen und die Decke im
Hintergrund
auswählen und das Model bitten sie durch
den Himmel mit Wolken
zu ersetzen. Und so sieht das
Ergebnis aus. Video zum Text. Dies
beinhaltet die Generierung einer Textbeschreibung oder einer
Transkription aus einem Video RS AI kann beispielsweise Transkripte oder
Bildunterschriften aus einem Videoeingang
erstellen diese
sogar von einer Sprache in
eine andere übersetzen In diesem Beispiel sehen wir zwar, dass nur das
Sprachelement des Videos mit
Untertiteln versehen wird , aber
einige der fortschrittlicheren
Untertitelungstools sind in der
Lage, auch Elemente zu untertiteln, die keine
Sprache sind Lage, auch Elemente zu untertiteln, die keine Nichtsprachliche Elemente können Soundeffekte
umfassen,
z. B. summende Biene,
Käseklirren oder
Klingeln an der Tür, Musik ,
entweder im Hintergrund
oder als Teil einer Szene, Reaktionen des Publikums, beispielsweise Lachen, Stöhnen oder Buhen ,
Sprechweise, beispielsweise Flüstern, Schreien,
Hervorheben eines Wortes oder Sprechen mit Akzent
und Sprecher für einen Sprecher oder Sprecher außerhalb des Bildschirms oder für mehrere Sprecher Identifikation
für einen Sprecher oder Sprecher außerhalb des Bildschirms oder für mehrere Sprecher. In ähnlicher Weise haben wir
Audio zu Text. Dies wird typischerweise in
Spracherkennungssystemen verwendet , um gesprochene
Sprache in geschriebenen Text umzuwandeln Whisper von Open AI ist ein Beispiel für ein
Audio-zu-Text-Modell KI kann Text auch
in synthetisierte Sprache umwandeln. Text-to-Speech-Systeme konvertieren Text in
eine gesprochene Sprache Viele KI-Tools
wie Play Dot HT können anhand einer Texteingabe menschliche Sprache
mit synthetisierten Stimmen
erzeugen , die unterschiedlichen Geschlechtern,
Altersgruppen, Akzenten oder
sogar unterschiedlichen Tönen ähneln
können , z. B. glücklich, traurig,
wütend usw. Vom Bild zum Video. Diese Aufgabe
beinhaltet das Generieren einer Sequenz von Bildern oder eines Videos aus einem
einzelnen oder einer Reihe von Bildern. Beispielsweise
nutzen Filmfotos, eine Funktion in Google Fotos,
maschinelles Lernen, eine Funktion in Google Fotos,
maschinelles Lernen, um die Tiefe
eines Bildes zu schätzen und eine dreidimensionale
Darstellung der Szene zu
erstellen,
unabhängig davon, ob
das Originalbild Tiefeninformationen
von der Kamera
enthält Nach dieser Schätzung animiert
das System
eine virtuelle Kamera, um einen gleichmäßigen Schwenkeffekt zu erzeugen , der
einer Filmsequenz
ähnelt diesem komplizierten Prozess wird mithilfe
künstlicher Intelligenz ein statisches Bild
in eine dynamische
dreidimensionale Szene umgewandelt, die dem Bild eine
Videoqualität verleiht Was wir bisher besprochen haben,
sind nur einige Beispiele, und die Liste wird
ständig erweitert, da der Bereich der KI voranschreitet und Forscher neue Anwendungen
für diese Technologien
erfinden Darüber hinaus werden
diese Aufgaben in vielen
realen Anwendungen kombiniert Beispielsweise muss ein
KI-System möglicherweise mithilfe
eines Sprache-zu-Text-Modells in Text
umwandeln und dann den Text
mithilfe eines Text-zu-Text-Modells verarbeiten und anschließend
eine entsprechende Antwort in gesprochener
Sprache generieren,
die eine entsprechende Antwort in gesprochener
Sprache generieren, ein
Text-zu-Audiomodell verwendet. Aber warte, es gibt noch mehr. Es gibt viele andere Bereiche, in denen GNAI bahnbrechende
Anwendungen haben kann Denken Sie zum Beispiel an
das Wort Musik. Musikbezogene Aufgaben sind ein aktiver Bereich der Forschung
und Entwicklung im Bereich KI. Hier sind einige häufig gestellte Aufgaben. Wir haben Text zur Musik. Diese Modelle können
Musik auf der Grundlage von Texteingaben erzeugen. Sie können beispielsweise
eine Melodie oder eine Komposition erstellen durch eine Phrase oder einen
Text
beschrieben wird. Musik zu Text Andererseits kann KI
auch Musik in Text umwandeln, z. B.
Noten für ein Lied erstellen beschreibenden
oder emotionalen Text auf der
Grundlage eines Musikstücks generieren auf der
Grundlage eines Musikstücks Wir haben Audio in Audio, wodurch eine Art
von Sound oder Musik in eine andere umgewandelt werden kann , z. B. das
Genre eines Songs ändern, ein Summen in
ein komponiertes Stück
verwandeln oder sogar
Gesang aus Songs entfernen Es gibt auch
Musikempfehlungen. KI wird häufig verwendet Musik zu
empfehlen, die
auf den Hörgewohnheiten,
Vorlieben und sogar der Stimmung der Nutzer basiert ,
Vorlieben und sogar der Stimmung Wir haben auch Musikgenerierung. Mus Net von Open AI ist ein
Beispiel für Musikgenerierung. Modelle wie
Mus enet von OpenAI können vierminütige
Musikkompositionen mit
zehn verschiedenen Instrumenten
erzeugen und
Stile von Country über
Mozart bis hin zu den Beatles kombinieren Stile von Country über
Mozart bis hin zu den Beatles Es gibt auch Musikverbesserungen. Audio Studio kann beispielsweise verwendet
werden, um bestehende Musik zu verbessern oder zu
ändern. Dies kann durch Dinge wie das
Hochskalieren der Audioqualität, das
Ändern des Tempos
oder das Hinzufügen von Effekten geschehen Und es gibt auch eine Trennung von
Musikquellen. Wir können auch KI-Modelle verwenden um einzelne
Instrumente, Gesang oder andere Komponenten
von einem Mix- oder Master-Track Metas DMax ist ein Beispiel für ein Tool zur Trennung von Musikquellen Zusammenfassend lässt sich sagen, dass der Bereich
der generativen KI vielfältig,
faszinierend und
voller Potenzial ist ,
faszinierend und
voller Potenzial Die Bandbreite der Aufgaben, die
sie erfüllen kann ,
von Takes to Take über
Takes bis hin zu Bildern, Audio zu Take und sogar
komplizierten Aufgaben wie Verbesserung und
Generierung von
Musik ist wirklich bemerkenswert Es ist ein Bereich, der sich
ständig weiterentwickelt und die
Grenzen dessen, was wir für möglich gehalten haben, Während wir weiter
forschen und innovativ sind, wird
die Liste der Anwendungen nur noch erweitert Generative KI ist der Schlüssel zu vielen Durchbrüchen
und Fortschritten, die eine Reihe von
Sektoren und die Art und Weise, wie
wir mit Technologie interagieren, revolutionieren könnten die Art und Weise KI weiter Wer weiß, welche erstaunlichen
Möglichkeiten wir entdecken könnten, wenn wir
diese aufregende Ära der erforschen. Der Schlüssel liegt darin, neugierig zu bleiben, weiter zu forschen und uns eine Zukunft
vorzustellen
, in der wir auf vertrauenswürdige,
verantwortungsvolle und ethische Weise mit
KI-Systemen interagieren können verantwortungsvolle und
9. L2V4 – Prompt Engineering: Lassen Sie uns über ein
faszinierendes Thema im Bereich der generativen KI sprechen, das
Prompt generativen KI sprechen, das
Prompt Wie der Name schon sagt, dreht sich bei
generativer KI alles um
Systeme, die Ergebnisse generieren, egal ob es sich um Text, Bilder oder jede andere Art von Wie Sie im nächsten
Abschnitt dieses Kurses sehen werden, sind
große Sprachmodelle oder LLMs, das Kraftpaket der generativen KI, darauf ausgelegt, menschenähnlichen
Text auf der Grundlage
von Eingabeaufforderungen zu generieren Eingabeaufforderungen generieren nicht nur
menschenähnliche Texte, LLMs generieren nicht nur
menschenähnliche Texte, sondern helfen auch dabei,
unsere Eingabeaufforderungen in Ausgaben für andere Arten
von Inhalten
wie Bilder und Videos zu übersetzen unsere Eingabeaufforderungen in Ausgaben für andere Arten
von Inhalten wie Das heißt, je besser
unsere Eingabeaufforderungen sind, desto wahrscheinlicher ist es, dass wir mit jedem generativen KI-Tool qualitativ
hochwertigere Ergebnisse erzielen qualitativ
hochwertigere Ergebnisse Heute werden wir
einige wichtige Aspekte im Zusammenhang mit diesen
Eingabeaufforderungen untersuchen einige wichtige Aspekte im Zusammenhang mit diesen
Eingabeaufforderungen Wir werden klarstellen, was
genau eine Aufforderung ist und welche Rolle sie bei
der Gestaltung der Ausgabe des Modells Wir werden zwischen
Prompt Design und
Prompt Engineering unterscheiden und dann verschiedene Methoden
der Prompt Engineering vorstellen. Abschließend werden wir auf
die Grenzen von Prompt
Engineering eingehen , um
Ihnen ein realistisches Verständnis
und eine realistische Vorstellung von
diesem spannenden Prozess zu vermitteln. Lassen Sie uns also anfangen. Also, was ist eine Aufforderung? Eine Aufforderung ist im Wesentlichen
ein Textstück , das einem generativen
KI-Modell als Eingabe gegeben wird. Aber es sind nicht irgendwelche Takes. Es dient einem grundlegenden Zweck. Diese Eingabeaufforderungen sind Ihre
Kommunikationsverbindung zum Modell. Sie steuern das KI-Modell und
steuern die Generierung seiner Ergebnisse. Das Modell nimmt Ihre
Eingabeaufforderung auf, verarbeitet sie
und liefert eine Ausgabe, die den
Anweisungen der Eingabeaufforderungen
entspricht Mit anderen Worten,
diese Eingabeaufforderungen sind Ihr Werkzeug zur Steuerung
der Modellausgabe. Stellen
Sie sich eine Aufforderung als Anleitung zum
generativen KI-Modell vor,
wie ein Regisseur, der einen Schauspieler
leitet Je präziser und
klarer Ihre Anweisungen sind, desto besser ist die Leistung, die Sie vom Schauspieler erwarten
können. In ähnlicher Weise ermöglichen gut
gestaltete Eingabeaufforderungen dem Modell, qualitativ
hochwertigere und spezifischere Ergebnisse Denken Sie daran, dass der Schlüssel in
der Qualität und dem Design
Ihrer Eingabeaufforderungen liegt , und hier kommen
die Konzepte von Prompt-Design und
Prompt-Engineering ins Spiel, auf
die wir jetzt eingehen werden Wie bereits erwähnt, spielt
die Qualität der Eingabeaufforderung eine entscheidende Rolle bei der
Bestimmung der Qualität
der Ergebnisse eines
generativen KI-Modells Hier kommen zwei Konzepte ins
Spiel Prompt Design
und Prompt Engineering. Prompt-Design bezieht sich auf
die Erstellung von Eingabeaufforderungen , die spezifisch für die Aufgabe sind , die das Modell
ausführen soll Wenn Sie beispielsweise
möchten, dass das Modell einen Text
vom Englischen ins Französische
übersetzt, wird
die Aufforderung auf Englisch verfasst und es wird angegeben, dass die gewünschte
Ausgabe auf Französisch erfolgen soll Im Wesentlichen geht es
darum,
Eingabeaufforderungen zu erstellen ,
die die gewünschte Ausgabe generieren Auf der anderen Seite
haben wir schnelles Engineering. Bei diesem Prozess geht es eher darum die Leistung
des Modells zu
verbessern. Es beinhaltet Strategien wie Nutzung von
domänenspezifischem Wissen, die Bereitstellung von Beispielen für
das gewünschte Ergebnis
oder die Einbeziehung von
Schlüsselwörtern, von denen bekannt ist, dass sie für ein bestimmtes
generatives KI-Modell
wirksam Sie sehen also,
beide Konzepte drehen sich zwar um das Erstellen von Eingabeaufforderungen, dienen aber unterschiedlichen Zwecken. Prompt-Design geht es darum,
Eingabeaufforderungen auf Aufgaben zuzuschneiden, während Prompt Engineering Sie schließen sich jedoch nicht
gegenseitig aus. In der Praxis erfordert die Erstellung einer effektiven Aufforderung
häufig sowohl für die jeweilige Aufgabe
konzipierte als auch
eine bessere Leistung. Schauen wir uns nun einige der Techniken an,
die beim
Prompt-Engineering eingesetzt werden , um
die Ausgabequalität unserer
generativen KI-Modelle zu maximieren . Eine solche Methode nutzt
domänenspezifisches Wissen. Wenn Sie den
Aufgabenbereich gut kennen, können
Sie dieses
Fachwissen nutzen, um
Eingabeaufforderungen zu entwerfen , die das
Modell effektiver leiten Wenn Sie beispielsweise in der medizinischen KI
arbeiten, könnten
Sie medizinische
Terminologie und
Strukturen in Ihren Eingabeaufforderungen verwenden , um die Genauigkeit
zu erhöhen Eine andere Methode besteht darin,
Schlüsselwörter zu verwenden, von denen bekannt ist, dass sie
für ein bestimmtes Modell wirksam Genau wie bei der
Suchmaschinenoptimierung, bei der bestimmte Keywords
dazu beitragen, Seiten höher zu
platzieren, können bestimmte Keywords
das Modell effektiver steuern. Die Auswahl der Keywords
würde auf
den Trainingsdaten des Modells
und seinen erlernten Mustern basieren . Mit Modellen wie
Bart oder Chat-GPT können
Sie das Modell direkt
nach
diesen Schlüsselwörtern fragen und erfahren, können
Sie das Modell direkt
nach
diesen Schlüsselwörtern fragen und erfahren wie sie
zur
Optimierung Ihrer Eingabeaufforderung verwenden Wir sollten auch
fortgeschrittene Strategien in Betracht ziehen ,
wie etwa Rollenanweisungen, Eingabeaufforderungen und
Gedankenketten Role Prompting ist eine Technik bei der wir das GNAI-Modell anweisen eine bestimmte Rolle oder
Persona
zu übernehmen ,
bei der wir das GNAI-Modell anweisen, eine bestimmte Rolle oder
Persona
zu übernehmen und gleichzeitig das Ergebnis zu generieren. Sie könnten
das Modell zum Beispiel anweisen, so zu reagieren, als ob es ein Historiker der die Ursachen
des ersten Weltkriegs
erklärt Das Modell verwendet dann
seine Trainingsdaten , um eine Antwort zu generieren, die auf diese
Person abgestimmt ist Eingabeaufforderung wird dagegen vor
der Bei der Eingabeaufforderung wird dagegen vor
der
eigentlichen Anweisung ein Bild des Kontextes vermittelt Sie können Beispiele für
die gewünschte Ausgabe angeben. Auf diese Weise kann das Modell als Richtschnur dienen,
indem es eine Referenz oder einen Entwurf
der Erwartungen enthält Wenn Sie beispielsweise
eine Zusammenfassung eines Dokuments wünschen, können Sie zusammen mit
dem Originaltext
einige Beispiele für
Zusammenfassungen angeben zusammen mit
dem Originaltext
einige Beispiele für
Zusammenfassungen Oder wenn Sie nach einer
Filmkritik suchen, könnten Sie nicht einfach sagen, schreiben Sie eine Rezension zu
Film X,
sondern sagen:
Stellen Sie sich vor, Sie haben gerade
den spannenden Film X
in einem überfüllten Kino zu
Ende gesehen den spannenden Film X
in einem überfüllten Schreiben Sie eine Rezension des Films. Dieser zusätzliche Kontext kann das Modell dazu
anleiten,
emotionalere
und kontextsensivere Ergebnisse zu erzielen . Es gibt verschiedene
Arten von Eingabeaufforderungen:
Null-, Eins- und
Wenigschussabfrage Zero Shot Prompting stellt
das Gen-AI-Modell ohne Übersetzen Sie beispielsweise diesen
englischen Satz ins Französische. Der Chat ist umfangreich. Hier stellen wir
eine Aufgabe vor, ohne
ein konkretes Beispiel dafür zu geben,
wie sie ausgeführt werden sollte One Shot Prompting bietet ein einziges Beispiel zur Orientierung Fahren Sie beispielsweise mit
der folgenden Geschichte fort. einmal in
einem weit entfernten Land, es war eine mutige Nacht. Und dann geben wir ein Beispiel für eine Fortsetzung
der Geschichte. Das Modell
versucht dann, die Geschichte im
Stil
des von uns bereitgestellten Beispiels fortzusetzen . Und wir haben nur wenige Eingabeaufforderungen, die auch als
Multi-Shot-Prompting bezeichnet Hier stellen wir mehrere
Beispiele zur Verfügung, um das Modell zu unterstützen. Ein Beispiel wäre,
das Model zu bitten ,
eine Produktrezension zu erstellen, eine Reihe von
Produktbewertungsbeispielen
vorausgeht Das Model wird versuchen,
eine Bewertung zu verfassen , die den von uns bereitgestellten
Beispielen ähnelt Und nicht zuletzt
beinhaltet die Anregung von
Gedankenketten die Bereitstellung einer Argumentation oder
Argumentation für das GNAI-Modell Anstatt einer direkten
Frage oder Anweisung geben
Sie eine Reihe von Gedanken, die zu der Frage führen Anstatt zum Beispiel zu fragen, was die Ursachen
der globalen Erwärmung sind, würden
Sie sagen, dass wir in den letzten Jahrzehnten
einen Anstieg der
globalen Temperaturen
gesehen haben in den letzten Jahrzehnten
einen Anstieg der
globalen Temperaturen . Diese Veränderung, die oft als
globale Erwärmung bezeichnet wird, scheint von verschiedenen Faktoren
beeinflusst zu werden. Was sind diese Ursachen? Diese Strategien können den Umfang und
die Relevanz
des Modellergebnisses erhöhen und damit die Leistungsfähigkeit
einer geschickten und zeitnahen Konstruktion
erneut unter Beweis stellen geschickten Denken Sie daran, dass es sich dabei nicht um
eigenständige Methoden handelt, sondern dass sie häufig kombiniert werden können, um eine aussagekräftige
Eingabeaufforderung zu Nachdem wir uns mit diesen Techniken vertraut gemacht
haben, wollen wir uns nun den Grenzen
des Prompt-Engineerings zuwenden. Prompt
Engineering eröffnet zwar spannende Möglichkeiten
zur Feinabstimmung der Ergebnisse eines
generativen KI-Modells, aber es ist wichtig zu
bedenken, dass es sich nicht einen Zauberstab handelt, der immer perfekte Ergebnisse
garantieren kann. Es gibt bestimmte Einschränkungen
und Einschränkungen , deren wir uns bewusst sein
müssen. Erstens
sind generative KI-Modelle zwar leistungsstark, aber nicht allmächtig Sie werden mit einer
Vielzahl von Daten trainiert, was
jedoch nicht bedeutet, dass
sie in der Lage sind, jede Frage
genau zu beantworten
oder jede von Ihnen gestellte Aufgabe zu erfüllen. Das
Modell ist beispielsweise nicht Inhalte
außerhalb
des Stichtags für Schulungen zu
generieren außerhalb
des Stichtags für Schulungen oder
zukünftige Ereignisse genau vorherzusagen Zweitens hängen die Genauigkeit
und Relevanz der Ergebnisse
des Modells in
hohem Maße von
der Qualität und Klarheit
Ihrer Aufforderung Selbst eine
perfekt ausgearbeitete Aufforderung führt jedoch möglicherweise nicht immer aufgrund
der inhärenten Unvorhersehbarkeit
der KI-Modelle
möglicherweise nicht immer zum erwarteten Ergebnis inhärenten Unvorhersehbarkeit
der KI-Modelle Drittens können
Modelle selbst bei akribischer
Prompt-Entwicklung manchmal
Ergebnisse erzeugen, die
sachlich falsch oder unsinnig sind Das liegt daran, dass diese
Modelle
Antworten auf der Grundlage von Mustern generieren , die
sie während des Trainings gelernt haben, und sie verstehen den
Inhalt nicht Und schließlich erfordern bestimmte Aufgaben
möglicherweise ein Maß Spezifikation oder
fachspezifischem Wissen
, das über das Training des
Modells hinausgeht Ein
generatives KI-Modell für allgemeine Zwecke möglicherweise nicht in der Lage, hochspezialisierte
Inhalte präzise
zu generieren oder auf hochtechnische Anfragen
in Bereichen wie Recht, fortgeschrittene Mathematik oder bestimmten medizinischen
Teildisziplinen Prompt Engineering
ist zwar ein leistungsstarkes Instrument, aber es ist wichtig, sich
dieser Einschränkungen bewusst zu sein , um
realistische Erwartungen aufrechtzuerhalten und
generative KI-Modelle
effektiver zu nutzen generative KI-Modelle
effektiver In Ordnung, lassen Sie uns die Dinge zusammenfassen. Heute haben wir die Welt
der Eingabeaufforderungen in
generativen KI-Modellen erforscht Eingabeaufforderungen in
generativen KI-Modellen Wir haben etwas über
Prompt-Design und
Engineering gelernt und verschiedene Methoden wie
Shot Prompting,
Roll Prompting und Chain
of Thought Prompting besprochen verschiedene Methoden wie
Shot Prompting,
Roll Prompting und Chain
of Thought Prompting Denken Sie daran, dass Prompt Engineering kein
Wundermittel ist. Es ist ein Tool, und wie jedes Tool hat
es seine Grenzen. Experimentieren Sie also damit,
Ihre eigenen Eingabeaufforderungen zu erstellen , und
erkunden Sie die Möglichkeiten Danke fürs Zuschauen. Wir
sehen uns beim nächsten Mal.
10. L3V1 – LLMs: Willkommen zur Einführung in große
Sprachmodelle. Große Sprachmodelle,
kurz LLMs, sind eine Untergruppe von Deep Learning Sie überschneiden sich mit
generativer KI, die ebenfalls Teil
von Deep Learning ist Wir haben bereits erklärt, dass
generative KI eine
Art künstlicher Intelligenz ist ,
die neue Inhalte
wie Text, Bilder,
Audio und synthetische Daten erzeugen kann wie Text, Bilder,
Audio und synthetische Daten Aber was sind große
Sprachmodelle? Wenn wir den Begriff
große Sprachmodelle verwenden, beziehen
wir uns auf große
allgemeine Sprachmodelle, die wir vorab
trainieren und dann verfeinern können trainieren und dann verfeinern um sie an unsere Bedürfnisse für
bestimmte Zwecke anzupassen. Aber was meinen wir mit „
vortrainiert“ und „fein abgestimmt“? Denken Sie über den Prozess
der Hundeerziehung nach. Normalerweise unterrichtest du deinen Hund grundlegenden
Befehlen wie Sitzen, Beruhige dich und Bleib Diese Befehle
reichen normalerweise für das tägliche Leben aus und
helfen Ihrem Hund, sich in der Nachbarschaft gut zu benehmen Wenn Sie jedoch von
einem Hund verlangen, dass er eine besondere Rolle spielt, z. B. ein
Sicherheitshund, ein Blindenhund oder ein Polizeihund, zusätzliche spezifische
Ausbildung erforderlich. Das gleiche Prinzip gilt für
große Sprachmodelle So
wie die
spezielle Ausbildung Hunde
auf
ihre einzigartigen Rollen vorbereitet, Feinabstimmung eines vorab trainierten
großen Sprachmodells ermöglicht die
Feinabstimmung eines vorab trainierten
großen Sprachmodells es ihm,
bestimmte Aufgaben effizient
und genau auszuführen , sei es Stimmungsanalyse
oder maschinelle Übersetzung Das Modell kann in der gewünschten Domäne auf
Excel abgestimmt werden. Diese Modelle werden breit gefächert
geschult und
darauf vorbereitet, Standardaufgaben
wie
die Textklassifizierung zu bewältigen Standardaufgaben
wie
die , eine weit verbreitete Aufgabe der
Verarbeitung natürlicher Sprache, bei der Text auf der
Grundlage seines Inhalts in organisierte Gruppen eingeteilt Beantwortung von Fragen, eine wichtige Aufgabe bei der Verarbeitung
natürlicher Sprache, bei der das Modell darauf trainiert wird, Anfragen genau zu verstehen und
zu beantworten, wobei im Wesentlichen
die menschliche Fähigkeit simuliert zu verstehen Zusammenfassung von Dokumenten,
bei der das Modell die Aufgabe eine präzise und flüssige Zusammenfassung eines großen Textes zu erstellen, die Essenz und die Grundideen
beizubehalten und Grundideen branchenübergreifend
Texte zu generieren, menschenähnlichen Text zu
erstellen
, der auf
eine bestimmte Branche zugeschnitten werden kann, sei es das Verfassen von E-Mails
in der Unternehmenskommunikation, Erstellen von
Produktbeschreibungen in E-Commerce oder die Erstellung von
Patientenberichten Diese Modelle können
verfeinert werden, um
spezielle Herausforderungen
in verschiedenen Sektoren,
darunter Einzelhandel, Finanzen
und Unterhaltung, zu lösen spezielle Herausforderungen
in verschiedenen Sektoren,
darunter Einzelhandel, , wobei vergleichsweise kleinere
feldspezifische Datensätze Im Einzelhandel können
sie beispielsweise
für personalisierte
Produktempfehlungen auf der
Grundlage von Textdaten verwendet werden Produktempfehlungen auf der
Grundlage von Textdaten Im Finanzbereich können
sie dabei helfen, Markttrends anhand
von Finanzberichten
vorherzusagen Oder in der
Unterhaltungsbranche könnten
sie bei der Erstellung von
Drehbüchern oder bei der Empfehlung von
Inhalten helfen und damit die Flexibilität und breite Anwendbarkeit
großer Sprachmodelle unter Beweis stellen Lassen Sie uns das Konzept
weiter in drei Hauptmerkmale
großer Sprachmodelle unterteilen Große Sprachmodelle sind umfangreich, universell einsetzbar und vorab
trainiert und fein abgestimmt. Lassen Sie uns jeden
von ihnen einzeln besprechen. Der Begriff groß bezieht sich
auf zwei Dinge. Erstens weist er auf
die enorme Größe des Trainingsdatensatzes hin ,
der manchmal die
Größenordnung von Petabyte erreicht Zweitens weist es auf die enorme Anzahl der beteiligten
Parameter Im Bereich des
maschinellen Lernens werden
diese Parameter oft
als Hyperparameter bezeichnet Im Wesentlichen dienen diese
Parameter als Gedächtnis und Wissen, das die Maschine
beim Modelltraining gewinnt Sie beschreiben häufig die
Fähigkeiten eines Modells bei der Bewältigung einer Aufgabe
wie der Textvorhersage Durch die Anpassung dieser Parameter können
wir die Leistung
des Modells für
genauere Vorhersagen optimieren Leistung
des Modells für
genauere Vorhersagen Allgemein bedeutet
, dass die Modelle
leistungsstark genug sind , um
alltägliche Probleme zu lösen Dieses Konzept basiert auf
zwei Gründen. Erstens
weist die menschliche Sprache einen universellen Charakter auf, unabhängig von der spezifischen
Aufgabe, auf die sie angewendet wird. Zweitens müssen wir die begrenzten
Ressourcen berücksichtigen. Nur eine begrenzte Anzahl
von Organisationen der Lage, diese
riesigen Sprachmodelle zu trainieren, die umfangreiche Datensätze
und eine enorme
Menge an Parametern erforderlich und eine enorme
Menge an Parametern Warum lassen wir diese
Organisationen also nicht
grundlegende Sprachmodelle entwickeln, die andere nutzen können Das bringt uns zum
letzten Aspekt der großen Sprachmodelle, Vorbereitung
und Feinabstimmung Im Wesentlichen bedeutet dies,
dass ein umfangreiches Sprachmodell zunächst
anhand eines umfangreichen Datensatzes, der ein breites Spektrum an
sprachlichen Mustern
und Kenntnissen
erfasst,
für breite Anwendungsfälle vorab trainiert anhand eines umfangreichen Datensatzes, der ein breites Spektrum an
sprachlichen Mustern
und Kenntnissen
erfasst, für breite wird. Nach dieser Phase vor dem
Training wird
das Modell dann anhand eines
relativ kleineren,
spezialisierteren Datensatzes auf
bestimmte Ziele
abgestimmt anhand eines
relativ kleineren,
spezialisierteren Datensatzes auf
bestimmte Ziele relativ kleineren,
spezialisierteren Datensatzes auf Dieser zweistufige Prozess stellt sicher, dass das Modell eine breite
Wissensbasis beibehält und
gleichzeitig in der Lage ist, ein
tiefes Verständnis zu
entwickeln und Vorhersagen
zu treffen, die für ein bestimmtes Gebiet oder eine bestimmte Aufgabe Damit schließen wir unsere Einführung in
große Sprachmodelle ab. Im nächsten Video werden
wir einige
der Vorteile der Verwendung von LLMs erörtern der Vorteile der Verwendung von LLMs
11. L3V2 – LMM-Vorteile: In diesem Video werden wir die verschiedenen Vorteile der Verwendung großer
Sprachmodelle, kurz
LLMs,
untersuchen Verwendung großer
Sprachmodelle, kurz
LLMs Wir werden sehen, wie diese
beeindruckenden KI-Modelle für eine
Vielzahl von Aufgaben verwendet werden
können, wie sie mit
minimalen Trainingsdaten funktionieren
und wie sie sich weiter verbessern
, und wie sie sich weiter verbessern mehr Daten und
Parameter hinzugefügt werden Wir werden auch erörtern, wie LLMs an unterschiedliche
Lernszenarien anpassen, selbst wenn nur minimale
Vordaten vorhanden Hoffentlich können
wir anhand der Diskussion
dieser Vorteile erkennen, warum LLMs im Bereich
der künstlichen Intelligenz
einen großen Fortschritt Bereich
der künstlichen Intelligenz Einsatz von LLMs bietet viele klare
und wirkungsvolle Vorteile Der Einsatz von LLMs bietet viele klare
und wirkungsvolle Vorteile
. Sie sind nicht auf eine einzige Aufgabe
beschränkt. Ein Modell allein ist ein Multitasking-Kraftpaket, das viele verschiedene Rollen erfüllt Diese hochentwickelten LLMs, die auf einer
enormen
Datenmenge trainiert
werden und Milliarden von Parametern entwickeln, sind in der Lage, eine Vielzahl von Aufgaben zu bewältigen Zum Beispiel zeichnen sie sich durch hervorragende Antworten
auf Fragen aus. LLMs können ihre
umfangreichen Trainingsdaten durchsuchen um die geeignetsten
und genauesten Antworten auf eine Vielzahl von Fragen
zu finden eine Vielzahl von Fragen
zu Sie sind in der Lage,
Kontext, Ambiguität
und sogar sprachliche Unklarheiten zu verstehen, was sie bei der Beantwortung von Fragen sehr effektiv
macht Das Modell generiert eine Antwort Kontext, dem
Ton und der Komplexität der Anfrage
entspricht, und liefert präzise und
kontextuell In Bezug auf die Textgenerierung glänzen
LLMs wirklich. Sie können qualitativ hochwertigen
Text erstellen, der kohärent,
kontextuell angemessen
und bemerkenswert menschlich ist kontextuell angemessen
und bemerkenswert menschlich Egal, ob es darum geht, eine
Nachricht zu generieren, ein Gedicht zu schreiben oder sogar
eine fesselnde Geschichte zu erfinden, LLMs Sie können auch bei Aufgaben
wie der Erstellung von Inhalten, beim Schreiben und
sogar bei der Fertigstellung von Entwürfen behilflich Durch die Berücksichtigung der gegebenen Eingaben und die Nutzung ihrer umfangreichen
Wissensbasis können
sie Texte erstellen, können
sie Texte erstellen die nicht nur
grammatikalisch korrekt sind, sondern auch reich an Inhalten die den
Anforderungen
verschiedener Anwendungsfälle Große Sprachmodelle eignen sich auch hervorragend zur
Sprachübersetzung Dank ihrer
umfangreichen Trainingsdaten können
sie
Texte präzise von einer
Sprache in eine andere übersetzen einer
Sprache in eine andere dabei die semantische Bedeutung
und den Kontext des
Originaltextes beibehalten und den Kontext des
Originaltextes Sie arbeiten nicht nur mit
häufig gesprochenen Sprachen, sondern können auch mit
weniger verbreiteten Sprachen umgehen,
was sie zu einem unschätzbaren
Werkzeug für die interkulturelle Kommunikation macht . Darüber hinaus können sie verschiedene Dialekte, Umgangssprache und informelle Sprache
verstehen und sich
an diese anpassen, wodurch sichergestellt wird, dass die Übersetzungen
korrekt,
lesbar und wodurch sichergestellt wird, dass die Übersetzungen
korrekt, natürlich klingen. LLMs sind auch ein leistungsstarkes Tool wenn Sie können Ideen generieren, alternative
Perspektiven
vorschlagen
und zur kreativen Problemlösung beitragen Egal, ob Sie
nach einer einprägsamen Überschrift, einer einzigartigen Marketingstrategie
oder einer neuen Handlung für einen Roman suchen, diese Modelle können je nach dem Kontext,
den Sie ihnen bieten,
zahlreiche Möglichkeiten eröffnen Kontext,
den Sie ihnen bieten Durch das Training mit einer
Vielzahl von Daten haben
sie gelernt, vielfältige und innovative Ideen
zu entwickeln , die Sie
weiter inspirieren
und Ihr
Projekt voranbringen können und Ihr
Projekt voranbringen Nicht nur das,
sie können auch Kritik und
Verbesserungsvorschläge zu bestehenden Ideen äußern und als künstlicher
Brainstorming-Partner
agieren, als künstlicher
Brainstorming-Partner
agieren zur Verfügung steht Und es gibt noch viel mehr. Neben der Aufgabe, die wir bisher
besprochen haben, verfügen
LLMs über eine
Fülle weiterer Funktionen Sie können beispielsweise in der Stimmungsanalyse
verwendet werden, um
festzustellen, ob ein Text
eine positive,
negative oder neutrale Stimmung vermittelt negative oder Sie können bei der Zusammenfassung
langer Textteile helfen. LLMs können auch
in Nachhilfesystemen eingesetzt werden und bieten Erklärungen
für komplexe Themen in einer Vielzahl von Fächern Die Möglichkeiten sind
endlos und werden ständig erweitert, da sich diese Modelle ständig
weiterentwickeln und verbessern Ein weiterer großer Vorteil
großer Sprachmodelle
ist ihre Fähigkeit mit
minimalen Trainingsdaten, die auf ein bestimmtes Problem
zugeschnitten sind, beeindruckende
Leistungen zu erbringen ein bestimmtes Problem
zugeschnitten sind, beeindruckende
Leistungen zu Sie können qualitativ hochwertige
Ergebnisse liefern, selbst wenn mit einer kleinen Menge an
domänenspezifischen Daten
versorgt Aufgrund dieser Qualität eignen sie sich
hervorragend für Lernszenarien mit
wenigen oder gar keinen Ergebnissen Lassen wir uns hier nicht
verwirren. Lassen Sie mich erklären,
was der Unterschied zwischen Schusslernen
und Schussabgabe ist Wie wir in dem Video zum Thema
Prompt Engineering besprochen haben
, besteht die Möglichkeit, vor der
eigentlichen Anweisung einen
Überblick über den Kontext zu geben vor der
eigentlichen Anweisung einen
Überblick über den Kontext Dieser zusätzliche Kontext kann das Modell dazu
anleiten, emotionalere
und kontextsensivere Ergebnisse zu erzielen und kontextsensivere Ergebnisse Wir haben auch gesagt, dass es
verschiedene Arten von
Eingabeaufforderungen gibt :
Null-, Eins- und
Wenigschussabfrage Zero Shot Prompting stellt
das GNAI-Modell das GNAI-Modell Eingabeaufforderung
für ein einzelnes Bild bietet ein einziges Beispiel, und bei wenigen Eingabeaufforderungen stehen mehrere Beispiele zur
Verfügung, um das Modell
zu unterstützen Im Zusammenhang mit
maschinellem Lernen
bezieht sich
Few Shot Learning auf Szenarien, bezieht sich
Few Shot Learning auf Szenarien in denen ein Modell
anhand eines begrenzten Datensatzes trainiert wird Dieser Prozess ist besonders
vorteilhaft in Situationen denen große Mengen an Trainingsdaten nicht
verfügbar oder praktikabel sind. Andererseits bezieht sich
Zero Shot
auf eine noch beeindruckendere
Leistungsfähigkeit von Modellen. Dies bedeutet, dass ein
Modell Konzepte oder Aufgaben identifizieren und
verstehen kann Konzepte oder Aufgaben identifizieren und
verstehen , für die es nicht
explizit trainiert wurde. Es ist wie ein intelligentes
System, das
logische Annahmen treffen und
Lösungen auf der Grundlage der gewonnenen
Erkenntnisse liefern kann logische Annahmen treffen und
Lösungen auf der Grundlage der gewonnenen
Erkenntnisse liefern ,
selbst wenn es mit
völlig neuen Szenarien konfrontiert wird. Wir können also sehen, dass
LLMs dank
ihrer Ausbildung auf riesigen Datensätzen auch in
Null-Shot-Szenarien hervorragende Leistungen erbringen können dank
ihrer Ausbildung auf riesigen Datensätzen auch in
Null-Shot-Szenarien ihrer Ausbildung auf riesigen Datensätzen Sie können mit neuen
Situationen umgehen, indem sie
ihr umfangreiches Wissen nutzen , um angemessene Reaktionen
abzuleiten, auch ohne
in ihren Trainingsdaten
direkt auf
das spezifische Szenario gestoßen in ihren Trainingsdaten
direkt auf
das spezifische Szenario Im Wesentlichen können LLMs
schnell an eine
Vielzahl von Aufgaben angepasst werden , auch wenn diese
Aufgaben außerhalb des spezifischen Bereichs liegen , für
den
das Modell
ursprünglich trainiert wurde Diese Anpassungsfähigkeit eröffnet
eine Vielzahl von Möglichkeiten diese Modelle
in verschiedenen Bereichen
und Anwendungen einzusetzen in verschiedenen Bereichen
und Ein wesentlicher Vorteil von LLMs ist ihre stetige
Verbesserung, da wir Datenmenge und die Anzahl der Parameter
erhöhen ,
die für ihr Training eine
Rolle spielen Stellen Sie sich zum Beispiel den
Weg von GPT 3,5 mit 175 Milliarden Parametern zu GPT 4 mit geschätzten
170 Billionen Der exponentielle Anstieg
der Parameterzahl führte zu einer deutlichen Verbesserung der Fähigkeiten, des
Verständnisses und der Präzision des Modells Dieser Wachstumstrend deutet darauf hin, dass LLMs noch weiter entwickeln können wir
die Grenzen der
verfügbaren Daten und
Rechenressourcen immer verfügbaren Daten und
Rechenressourcen GPT four
übertrifft GPTs
3.5 aufgrund seiner größeren Anzahl von Parametern deutlich 3.5 aufgrund seiner größeren Anzahl von Parametern Es zeichnet sich durch ein besseres Verständnis
von Kontexten und Nuancen aus, liefert genauere
Antworten und
schneidet besser bei Übersetzungs
- und schneidet besser bei Übersetzungs Darüber hinaus ist GPT four besser in der
Lage,
komplexe Anweisungen zu verstehen,
ohne sie in kleinere Schritte
zerlegen
zu müssen , seine
überlegene Fähigkeit zur
Anpassung an
Null-Shot- und
Wene-Schuss-Lernszenarien Anpassung an
Null-Shot- und
Wene-Schuss-Lernszenarien Und der vierte Vorteil von LLMs besteht darin, dass
sie durch die Interaktion
in natürlicher Sprache den Zugang zu
KI für jeden verbessern, sie durch die Interaktion
in natürlicher Sprache den Zugang zu
KI für jeden verbessern der über
einen einfachen Computer verfügt, sodass keine
speziellen technischen Fähigkeiten erforderlich Egal, ob Sie ein Student sind, der Hilfe bei den Hausaufgaben
sucht, ein Autor, der Inspiration benötigt, oder ein Geschäftsinhaber, der
Markttrendanalysen sucht,
LLMs sind hier, LLMs sind hier Ihre Fähigkeiten zur Spracherkennung und zur Synthese
menschlicher Stimmen
eröffnen Möglichkeiten für Menschen, die möglicherweise
Schwierigkeiten beim Tippen haben, oder sogar für Personen, die
nicht lesen und Darüber hinaus
beseitigen ihre hochwertigen
Übersetzungsfähigkeiten Sprachbarrieren, sodass diese leistungsstarken
Tools für
Menschen mit unterschiedlichen
demografischen Merkmalen und Hintergründen nutzbar Menschen mit unterschiedlichen
demografischen Merkmalen und Hintergründen Im Wesentlichen verändern LLMs
die Art und Weise, wie wir
mit Technologie interagieren, und bieten einem breiten
Anwenderspektrum weltweit komplexe KI-Fähigkeiten einem breiten
Anwenderspektrum Zusammenfassend lässt sich sagen, dass große
Sprachmodelle Barrieren überwinden und KI für alle zugänglich
machen Mit ihren vielseitigen
Fähigkeiten und ihrem sich ständig weiterentwickelnden Potenzial revolutionieren
LLMs die Art und Weise, wie wir mit Technologie interagieren wir in die Zukunft blicken, sind
wir sicher, dass diese
Modelle
unser Leben und unsere Arbeit auf
unvorstellbare Weise weiter verbessern unser Leben und unsere Arbeit auf
unvorstellbare Weise Im nächsten Video
schauen wir uns drei Beispiele für
die LLMs Palm
und Lambda von Google und
GPT von Open AI etwas genauer drei Beispiele für
die LLMs Palm
und Lambda von Google und
GPT von Open AI an. Wir
sehen uns im nächsten
12. L3V3 – Beispiele für LLMs: In diesem Video sehen wir uns
einige Beispiele für große
Sprachmodelle an einige Beispiele für große Wir gehen auf die Details
von drei hochmodernen LLMs ein, Palm, Lambda
und GPT, und wir werden auch einige andere LLMs
besprechen, die sich im Bereich
der generativen KI als vielversprechend erwiesen haben Beginnen wir also mit Palm,
was für
Pathways Language Model steht Palm ist ein Sprachmodell mit 540 Milliarden
Parametern von Google AI
entwickelt wurde. Es basiert auf einem riesigen
Datensatz von Texten und
Code und kann eine
Vielzahl von Aufgaben ausführen,
darunter die Beantwortung von Fragen, Inferenz in
natürlicher Sprache, Codegenerierung, Übersetzung
und Zusammenfassung Es nutzt das
Pathways-System von Google, wodurch es
an
einem riesigen Datensatz
aus Text und Code trainiert werden kann einem riesigen Datensatz
aus Text Mit 540 Milliarden Parametern ist
Palm eines der größten
Sprachmodelle der Welt Es handelt sich um ein Transformatormodell mit hoher Dichte,
das
ausschließlich auf Decoder beschränkt ist, was bedeutet, dass
es speziell für Aufgaben zur Erzeugung natürlicher
Sprache
konzipiert wurde Palm kann bei
den meisten Aufgaben eine
Leistung mit
wenigen Schlägen auf dem neuesten Stand der Technik erreichen , was bedeutet, dass es anhand weniger Beispiele lernen kann was bedeutet, dass es anhand weniger Beispiele lernen kann, eine neue Aufgabe
auszuführen Dies macht Palm zu einem leistungsstarken Tool für eine Vielzahl
von Anwendungen. Was ist also das Pathways-System? Das Pathway-System ist eine
KI-Architektur, die
hochwirksam bleibt und
gleichzeitig
über verschiedene
Bereiche und Aufgaben hinweg generiert . Es ist in der Lage,
ein einzelnes Modell effektiv auf
mehreren TPU V-Four-Pods zu trainieren , denen es sich um
maßgeschneiderte Beschleuniger für
maschinelles Lernen von Google handelt maßgeschneiderte Beschleuniger für
maschinelles Lernen Auf diese Weise kann das
Pathway-System viele Aufgaben gleichzeitig erledigen
, ein besseres
Verständnis der Welt vermitteln
und schnell neue Aufgaben erlernen Pathway-Systems
erreicht dies durch den Einsatz einer Reihe von Techniken,
einschließlich Modellparallelität dieser Technik können
mehrere Modelle gleichzeitig mit denselben
Daten trainiert
werden Dies kann
die Trainingsgeschwindigkeit
und Effizienz des
Pathway-Systems verbessern . Datenparallelität. dieser Technik können
mehrere Kopien
desselben Modells mit unterschiedlichen Datensätzen trainiert
werden Dadurch kann die Genauigkeit des
Pathway-Systems verbessert werden, da es aus einer größeren
Datenvielfalt
lernen und maschinelles Lernen ermöglicht aus einer größeren
Datenvielfalt
lernen wird Diese Technik ermöglicht es dem
Pathway-System,
seine Trainingsparameter
automatisch zu optimieren Dadurch kann
die Leistung des
Pathway-Systems verbessert werden, indem verhindert wird, dass es sich
zu stark an die Trainingsdaten anpasst Das Pathway-System befindet sich
noch in der Entwicklung, hat
aber das Potenzial, die Art und Weise, wie wir KI-Modelle
entwickeln und einsetzen, zu revolutionieren Indem es Modellen ermöglicht wird,
verteilte Berechnungen
für Beschleuniger
zu orchestrieren , können
Pathway-Systeme es
einfacher machen,
große komplexe KI-Modelle zu erstellen und zu trainieren große komplexe KI-Modelle , die eine Vielzahl
von Aufgaben bewältigen können Lassen Sie uns als Nächstes über Lambda, Googles
weiteren LLM, sprechen. Lambda steht für
Sprachmodell für Dialoganwendungen. Lambda ist eine Familie
neuronaler Sprachmodelle, die von Google
AI entwickelt wurden Es ist
dialogorientiert und verfügt über bis zu 130 Milliarden Parameter, anhand eines Datensatzes
von 1,56 Billionen Wörtern
vortrainiert wurden Lambda verfolgt drei Hauptziele Qualität, Sicherheit
und Diese Ziele werden anhand
von Kennzahlen wie Sensibilität,
Spezifität, Interesse und Informativität gemessen von Kennzahlen wie Sensibilität,
Spezifität, Interesse und Informativität Spezifität, Interesse und Informativität Lambda ist so konzipiert, dass es informativ und
umfassend ist und
gleichzeitig sicher und fundiert umfassend Es ist in der Lage,
verschiedene kreative
Textformate wie Gedichte,
Code, Skripte, Musikstücke,
E-Mails, Briefe und vieles mehr zu generieren verschiedene kreative
Textformate wie Gedichte,
Code, Skripte, Musikstücke,
E-Mails, Briefe und vieles mehr Es wird sein Bestes geben, um alle Ihre Anforderungen zu
erfüllen. Lambda hat das Potenzial, die Art und Weise, wie wir mit Computern
interagieren, zu revolutionieren Es kann verwendet werden, um
natürlichere und ansprechendere
Dialogerlebnisse zu schaffen natürlichere und ansprechendere
Dialogerlebnisse und Benutzern
hilfreichere und
informativere Unterstützung zu bieten hilfreichere und
informativere Wie bereits erwähnt, Lambda
drei Hauptvorteile Ein natürlicher und
fesselnder Dialog. Lambda kann einen natürlichen und ansprechenden
Dialog mit Menschen Es kann den
Kontext einer Konversation verstehen
und auf eine Weise reagieren, und auf eine Weise reagieren die
sowohl informativ als auch interessant ist Zweitens: hilfreiche und
informative Unterstützung. Lambda kann Benutzern hilfreiche und
informative Unterstützung Es kann Fragen beantworten, kreative Textformate
generieren
und Anweisungen befolgen Und drittens, sicher und mit Bodenhaftung. Lambda ist so konzipiert, dass es
sicher und geerdet ist. Es basiert auf einem riesigen
Datensatz aus Text und Code
und ist in der Lage,
zwischen sicheren und unsicheren Inhalten zu unterscheiden zwischen sicheren und unsicheren Inhalten Und jetzt kommen wir
zu OpenAIs GPT, Abkürzung für Generative
Pre GPT ist eine Art Deep-Learning-Modell, das verwendet wird, um menschenähnlichen Text zu
generieren Es wurde von OpenAI,
einem gemeinnützigen Forschungsunternehmen, entwickelt und von Microsoft finanziert GPT verwendet eine
Transformator-Architektur, bei der es sich um eine Art
neuronales Netzwerk handelt, das sich
gut für Aufgaben zur Verarbeitung natürlicher
Sprache eignet Parameter für die
neueste Version von GPT, GPT 4
,
sind nicht bekannt,
aber sie ist wahrscheinlich
viel größer als Die Parameter für die
neueste Version von GPT, GPT 4
,
sind nicht bekannt,
aber sie ist wahrscheinlich
viel größer als
die 3,575 Milliarden GPT-Parameter. Das bedeutet, dass GPT 4 besser in der Lage ist , Sprache zu
lernen GPT four hat sich auch
bei der Bewertung von Fähigkeiten
wie der Anwaltsprüfung als kompetent
erwiesen bei der Bewertung von Fähigkeiten
wie der Anwaltsprüfung als In einer kürzlich durchgeführten Studie erzielte
GPT Four bei
der Anwaltsprüfung, einer standardisierten
Prüfung, die in vielen
Ländern für die Zulassung zur Anwaltskammer
erforderlich ist,
das 90. Perzentil vielen
Ländern für die Zulassung zur Anwaltskammer
erforderlich ist,
das für die Zulassung zur Anwaltskammer
erforderlich GPT ist ein leistungsstarkes Tool, das für eine
Vielzahl von Aufgaben verwendet werden
kann,
darunter das Generieren von Text, das
Beantworten von Fragen,
das Übersetzen für eine
Vielzahl von Aufgaben verwendet werden
kann,
darunter das Generieren von Text, das
Beantworten von Fragen,
das Übersetzen von Sprachen und vieles mehr. Zusätzlich zu dem, was
wir bisher besprochen haben, gibt es noch andere LLMs, die
unsere Sichtweise
auf KI verändern und
die Zukunft dieses Bereichs mitgestalten Lassen Sie uns
einige davon kurz besprechen. Die erste ist eine Tournee mit
NLG von Microsoft, einem größeren Sprachmodell auf verschiedenen
Internettexten trainiert wurde in der Lage ist
,
zusammenhängende Absätze und
sogar ganze Artikel zu schreiben zusammenhängende Absätze und
sogar ganze Artikel Burt by Google, ein revolutionäres, auf
Transformatoren basierendes Modell , das anhand
eines großen Textkorpus vortrainiert und auf verschiedene Aufgaben der Verarbeitung natürlicher
Sprache
abgestimmt bietet ein hohes Maß an
Verständnis von Kontext
und Transformer XL, ein vom Brain-Team von
Google entwickeltes
Sprachmodell , das auf innovative Weise langfristige
Abhängigkeiten in Sequenzen
handhabt die Leistung von
Aufgaben wie Textgenerierung und Übersetzung
erheblich verbessert Aufgaben wie Textgenerierung Es gibt auch Excel Net
, eine Erweiterung
von Transformer XL, entwickelt von Google Brain und der
Carnegie Melon University Es verwendet eine auf Permutationen basierende
Trainingsmethode, um
einige Einschränkungen von BIRT zu überwinden und es übertreffen Electra ist ein hocheffizienter Trainingsansatz,
der von Google Research
entwickelt wurde weniger Rechenleistung für eine
ähnliche oder sogar bessere
Leistung benötigt ähnliche oder sogar bessere
Leistung Wir haben Megatron Transformer, ein von Nvidia
entwickeltes Modell auf Transformatorbasis, das entwickelt
wurde, um sehr
große Sprachmodelle
mit Milliarden von Parametern zu trainieren mit Es nutzt die
Parallelverarbeitungsfunktionen moderner
GPUs . Und wir haben Ama von meta
eingeführt.
Lama ist ein grundlegendes, Lama ist ein grundlegendes, kleineres und dennoch
leistungsstarkes Es wurde entwickelt, um den
Zugang zur KI-Forschung zu erweitern und
benötigt weniger
Rechenleistung und Ressourcen, um neue Ansätze zu
testen und bestehende neue Ansätze zu
testen Lama kann auch
in verschiedenen Größen mit 7000000000-65 Milliarden Parametern erhältlich sein. In diesem Video haben wir uns mit den
aufregenden Fortschritten
bei großen Sprachmodellen befasst bei großen Sprachmodellen dabei auf Palm und Lambda von Google
AI
sowie GPT von OpenAI konzentriert sowie Wir haben auch andere
bemerkenswerte Modelle auf diesem Gebiet hervorgehoben,
wie Touring Energy, BRT, XLnt und Mega BRT Wir haben erörtert, wie diese LLMs mit Parametern, die
Hunderte von Milliarden erreichen können, das Multitask-Lernen
neu definieren und
unsere Interaktion mit Computern durch einen ansprechenden Dialog revolutionieren unsere Diese Modelle haben ihre
außergewöhnlichen Fähigkeiten bereits bei
Aufgaben wie der Textgenerierung und
sogar bei praktischen Prüfungen
wie der Anwaltsprüfung
unter Beweis gestellt Aufgaben wie der Textgenerierung und
sogar bei praktischen Prüfungen
wie , und sie werden immer besser.
13. L3V4 – Foundation-Modelle: In diesem Video erfahren Sie mehr
über Basismodelle,
die, wie der Name schon sagt, eine
Grundlage für
generative KI-Modelle Konkret stellen wir
zunächst eine Definition für Basismodelle
bereit und erklären, was sie sind. Anschließend werden wir
über Plattformen sprechen, die verschiedene Arten
von Fundamentmodellen
bereitstellen, wobei Schwerpunkt auf dem Modellgarten
von Vertex
AI Am Ende des Videos werden verschiedene Arten
von Fundamentmodellen
erörtert Was sind nun Fundamentmodelle? Lassen Sie uns Bart bitten,
uns bei der Beantwortung der Frage zu helfen. Es enthält drei
verschiedene Entwürfe. Grundmodellen handelt es sich große, vortrainierte
neuronale Netze, für eine Vielzahl von
Aufgaben wie natürliche
Sprachverarbeitung,
Computer Vision und
Spracherkennung fein abgestimmt werden
können Aufgaben wie natürliche
Sprachverarbeitung, Computer Vision und
Spracherkennung Foundation-Modelle sind umfangreiche
Sprachmodelle, die auf
riesigen Datensätzen trainiert wurden und für
eine Vielzahl nachgelagerter
Aufgaben wie Übersetzung, Beantwortung von
Fragen
und Zusammenfassung fein abgestimmt werden
können eine Vielzahl nachgelagerter
Aufgaben wie Übersetzung, Beantwortung von Fragen
und Zusammenfassung Bei Foundation-Modellen handelt es sich umfangreiche, vorab trainierte Modelle für
maschinelles Lernen an eine Vielzahl
von Aufgaben wie die Verarbeitung natürlicher
Sprache,
Computer Vision und Robotik angepasst werden
können von Aufgaben wie die Verarbeitung natürlicher
Sprache, Computer Vision und Bei Basismodellen handelt es sich also um
umfangreiche KI-Modelle, die an eine Vielzahl von
Aufgaben
angepasst werden können an eine Vielzahl von
Aufgaben
angepasst und qualitativ
hochwertige Ergebnisse liefern können. Auch wenn KI-Modelle für uns
nicht brandneu sind,
haben etwas
ganz anderes diese Basismodelle etwas
ganz anderes
an sich. Sie sind mit
mehreren Schlüsselmerkmalen ausgestattet , die sie von anderen unterscheiden. Sie stellen eine deutliche Veränderung gegenüber den KI-Modellen dar, die wir
in früheren Generationen gesehen haben. Fundament-Modelle sind nicht
auf eine einzelne Aufgabe beschränkt. Sie sind multitaskingfähig. Ein einziges
Basismodell kann
eine Vielzahl von Aufgaben
sofort bewältigen , wie
z. B. Zusammenfassung, Beantwortung von Fragen
oder Klassifizierung Sie können verschiedene
Modalitäten von Datentypen verarbeiten, darunter Bilder, Text,
Code und vieles mehr Mit minimalem oder gar keinem
Training können Basismodelle
sofort einsatzbereit Sie können auch auf
bestimmte Anwendungsfälle zugeschnitten werden , wobei nur
eine Handvoll Beispieldaten verwendet werden. Da sie in der
Regel mit riesigen Mengen unterschiedlicher Daten trainiert
werden , können
diese Modelle
allgemeine Muster und
Repräsentationen erlernen , die dann auf verschiedene
Bereiche und Aufgaben angewendet
werden können . Bisher
war der Zugang zu Basismodellen schwierig. spezielle Fähigkeiten im Bereich
maschinelles Lernen
und Rechenressourcen
erforderlich Einsatz in der Produktion waren spezielle Fähigkeiten im Bereich
maschinelles Lernen
und Rechenressourcen
erforderlich. Aber mit der jüngsten Welle von Fortschritten in der generativen KI ändern sich die Dinge
dramatisch Nehmen wir zum Beispiel Vertex AI, eine vollständig verwaltete Plattform für
maschinelles Lernen Google
Cloud verfügbar ist Wenn Sie bereits
mit den Tools von Google Cloud vertraut sind, wissen
Sie bereits, dass Sie mit Vertex
AI auf verschiedene Modelle für
maschinelles Lernen zugreifen, diese
erstellen, experimentieren ,
bereitstellen und verwalten können Dinge wie traditionelle
Datenwissenschaft, maschinelles Lernen, MLPs oder einfach die Erstellung
einer KI-gestützten Vertex AI ist so ausgestattet, dass es all diese
Workloads unterstützt. Das ist ziemlich cool und so, aber hier werden die Dinge
wirklich interessant Vor Kurzem hat Google Cloud
zwei wichtige Tools angekündigt , die es uns
ermöglichen , noch mehr Model Garden
und Generative AI Studio zu erstellen. Diese Tools machen
Basismodelle einem viel
breiteren Publikum zugänglich, auch ohne viel Erfahrung mit Codierung und ML-Entwicklung. Der letzte Abschnitt dieses
Kurses ist der Einführung der KI-Tools der Google
Cloud Generation gewidmet Einführung der KI-Tools der Google
Cloud Generation werden wir mehr über
generative KI-Studios sprechen In diesem Abschnitt werden wir mehr über
generative KI-Studios sprechen. Konzentrieren wir uns in diesem Video also
nur auf den Modellgarten. Wo genau befindet sich
der XAI Model Garden? Es ist ein zentraler Ort
, an dem Sie sowohl die
branchenführenden Modelle von Google
als auch beliebte
Open-Source-Modelle
oder den integrierten
EmplopstoLing-Support von Google Cloud für
Unternehmen erkunden und mit
ihnen interagieren als auch beliebte
Open-Source-Modelle
oder den integrierten
EmplopstoLing-Support und mit von Google Cloud für
Unternehmen Es beherbergt sowohl traditionelle Modelle für
maschinelles Lernen als auch grundlegende Modelle für generative KI-Anwendungen. In Model Garden finden Sie eine Reihe von Modellen
aus Google Cloud,
Google Research und
verschiedenen externen Quellen, eine Vielzahl
von Datenformaten So sieht Model
Garden von Vertex AI also Ihnen viele verschiedene
einsatzbereite Modelle für Unternehmen einsatzbereite Modelle Model Garden bietet Ihnen viele verschiedene
einsatzbereite Modelle für Unternehmen und ermöglicht es Ihnen ,
je nach Ihrem Anwendungsfall, Ihrer ML-Kenntnisse
und
Ihrem verfügbaren Budget das am
besten geeignete Modell auszuwählen je nach Ihrem Anwendungsfall, Ihrer ML-Kenntnisse
und
Ihrem verfügbaren Budget das am ML-Kenntnisse
und
Ihrem verfügbaren Budget Bitte
beachten Sie, dass wir Model Garden von
Vertex AI als Beispiel für
eine Plattform verwenden , die Google Cloud für
verschiedene generative KI- und
andere
Tools und APIs für maschinelles Lernen bereitstellt verschiedene generative KI- und
andere
Tools und APIs für maschinelles Lernen Es gibt auch andere
Unternehmen, die
ihre eigenen Versionen von
Model Garden haben ihre eigenen Versionen von
Model Garden Beispielsweise bieten Amazon Sagemaker, IBM Watson Assistant und
Vida Clara, Data IKAI,
Open AI Chat GPT API, Microsoft Azores
Machine Learning, Microsoft Azores
Machine Learning, Data Robot AI und Databricks
LakehousePlatform Tools und IBM Watson Assistant und
Vida Clara, Data IKAI,
Open AI Chat GPT API,
Microsoft Azores
Machine Learning,
Data Robot AI und Databricks
LakehousePlatform Tools und APIs sowohl für traditionelle Modelle des maschinellen Lernens als auch für generative KI-Grundmodelle. sowohl für traditionelle Modelle des maschinellen Lernens als auch für generative KI-Grundmodelle. Es gibt verschiedene Arten
von Basismodellen, darunter Textgenerierung
und -zusammenfassung, Chat und Dialog,
Codegenerierung und -vervollständigung, Bildgenerierung und
-änderung sowie Einbettungen. Lassen Sie uns nun einen genaueren Blick auf jeden von
ihnen werfen. Textmodelle. Diese Modelle helfen Ihnen bei der Ausführung Aufgaben in
natürlicher Sprache,
ohne oder mit wenigen Eingabeaufforderungen Sie können Aufgaben
wie Zusammenfassung, Extraktion von
Entitäten und Informationen, Ideengenerierung und vieles mehr Ein
Journalist könnte beispielsweise
Textmodelle für die Zusammenfassung
großer Artikel oder Berichte verwenden Textmodelle für die Zusammenfassung großer Artikel oder Ein akademischer Forscher
könnte
spezifische Informationen
aus einem riesigen Korpus von Papieren extrahieren spezifische Informationen , oder ein Unternehmer
könnte das Modell in einer Brainstorming-Sitzung verwenden, um neue Ideen oder Perspektiven zu entwickeln. Wie bereits erwähnt,
funktionieren
diese Modelle sofort nach dem Auspacken effektiv Wenn Sie jedoch möchten, dass das Modell bestimmten
Spezifikationen
entspricht, können
Sie
strukturierte Beispiele als
Richtschnur für die Reaktion angeben . Dies ermöglicht ein
maßgeschneidertes Erlebnis, das auf Ihre spezifischen
Bedürfnisse und Ziele Als Nächstes konzentrieren wir uns auf den Dialog. Diese Modelle basieren
ebenfalls auf Text, wurden
jedoch so abgestimmt
, dass sie eine natürliche Konversation ermöglichen. Dialogmodelle ermöglichen es Ihnen, Konversationen
mit mehreren Runden
zu führen und dabei den Kontext
während der gesamten Interaktion beizubehalten. Stellen Sie sich ein Szenario in einem
Kundenservicecenter vor:
Ein KI-Chatbot, der auf
diesen Dialogmodellen basiert ,
kann Kunden dabei helfen sich an die vorherige Wendung
der Konversation zu erinnern und
kontextsensitive Antworten Er kann Fragen beantworten, Informationen
zusammenfassen oder Benutzer sogar durch
komplexe Verfahren führen oder dabei genau auf Ihre spezifische Domäne
abgestimmt sein Diese Modelle können Ihnen dabei helfen,
leistungsstarke Tools zu entwickeln , die das Benutzererlebnis erheblich
verbessern,
unabhängig davon, ob sie in einem Browser,
einer mobilen App oder anderen
digitalen Schnittstellen eingesetzt einer mobilen App oder anderen
digitalen Schnittstellen Weiter zur
Vervollständigung und Generierung von Code. Diese Modelle fungieren als Ihr
leistungsstarker Programmierassistent. Sie können einen Prom in natürlicher
Sprache geben, um einen
Code zu beschreiben, den Sie schreiben möchten, oder Sie können
das Modell verwenden , um einen Code automatisch zu
vervollständigen Es gibt sogar Erweiterungen
für IDEs, die
einen Teil des Codeausschnitts als
Eingabe verwenden und dann
die wahrscheinliche Fortsetzung bereitstellen können einen Teil des Codeausschnitts als Eingabe verwenden und dann
die wahrscheinliche Fortsetzung bereitstellen Stellen Sie sich vor, Sie arbeiten an einem
komplexen Softwareprojekt. Es kann Ihnen helfen, die
lästigen Aspekte des Codierens zu vermeiden, sogar beim
Debuggen Ihres Codes helfen, sodass Sie sich als
Entwickler mehr auf
die kreative Problemlösung
und weniger auf Syntax
oder Routinecode konzentrieren die kreative Problemlösung und weniger auf Syntax
oder Lassen Sie uns nun in die Bilderzeugung
eintauchen. diesen Modellen können
Sie Bilder gemäß
Ihren Spezifikationen generieren und bearbeiten. Darüber hinaus können Sie
diese Modelle für
medienbezogene Aufgaben
wie Klassifizierung,
Objekterkennung und mehr verwenden diese Modelle für
medienbezogene Aufgaben . Darüber hinaus beinhalten solche Modelle
in der Regel Mechanismen zur Moderation von
Inhalten, um verantwortungsvolle
KI-Sicherheitspraktiken zu gewährleisten Stellen Sie sich vor, Sie bauen
eine E-Commerce-Plattform auf. Ein Modell zur Objekterkennung kann Artikel
in den Produktbildern
automatisch kennzeichnen, während ein Modell
zur Bilderzeugung neue Produktbilder auf der
Grundlage von Beschreibungen
erstellen kann . Die
Funktion zur Inhaltsmoderation würde sicherstellen, dass alle nutzergenerierten Inhalte Richtlinien Ihrer
Plattform entsprechen, wodurch nicht
zuletzt die Benutzererfahrung verbessert wird Lassen Sie uns über Einbettungen sprechen, was vielleicht etwas komplex klingt
, aber es ist tatsächlich ein
wirklich cooles Lassen Sie es mich Ihnen erklären. Stellen Sie sich vor, Sie haben einen riesigen Obstkorb und
möchten diese aussortieren. Sie könnten sie nach Farbe,
Größe, Gewicht oder sogar Geschmack sortieren . In ähnlicher Weise müssen
wir in der Welt der Daten oft Dinge sortieren
oder kategorisieren Aber die Dinge, mit denen
wir es zu tun haben sind Wörter oder
Phrasen, keine Früchte Hier kommen die
Einbettungen ins Spiel. Sie sind wie ein einzigartiger Ausweis
für jedes Wort oder jede Phrase, aber statt einer Karte ist
es eine Liste von Zahlen, die wir einen Vektor nennen Diese Zahlenliste erfasst die Essenz dieses
Wortes oder dieser Phrase. Bedeutung ist der Kontext und seine
Beziehungen zu anderen Wörtern. Durch Einbettungen können wir unstrukturierte Daten,
wie z. B. ein langes Buch oder
einen Twitter-Feed,
verstehen wie z. B. ein langes Buch oder
einen und
dieses Verständnis nutzen, um beispielsweise
Empfehlungsmaschinen zu unterstützen oder Werbung effektiver auszurichten Denken Sie zum Beispiel an
den Bereich E-Commerce. Ein Einbettungsmodell kann
verwendet werden , um
Empfehlungsmaschinen zu unterstützen, die Nutzer anhand ihres Browserverlaufs den
Produkten
zuordnen
, an denen sie
am wahrscheinlichsten interessiert sind anhand ihres Browserverlaufs den
Produkten
zuordnen
, an denen sie
am wahrscheinlichsten interessiert Oder im digitalen Marketing können
diese Modelle die Systeme zur gezielten Ausrichtung von
Anzeigen verbessern und so hochgradig
personalisierte Werbung ermöglichen Sie können auch für
komplexe Klassifizierungsaufgaben,
Suchfunktionen und
viele andere Anwendungen verwendet werden. Zusammenfassend lässt sich sagen, dass
Fundamentmodelle einen bedeutenden
Fortschritt in der KI-Technologie
darstellen. Sie bieten eine leistungsstarke,
anpassungsfähige Basis , die
sofort für
eine Vielzahl von Aufgaben verwendet werden kann . Mit Plattformen wie Model Garden von
Vertex AI sind
diese Tools
zugänglicher als je zuvor, sodass erweiterte
KI-Fähigkeiten einer viel größeren Anzahl von Benutzern zur Verfügung
stehen Von Aufgaben in natürlicher Sprache über
Multi-Turn-Dialoge,
Code-Implementierung,
Bildgenerierung
und -modifikation bis Multi-Turn-Dialoge,
Code-Implementierung, Bildgenerierung
und -modifikation semantischen
Informationsextraktion die potenziellen Anwendungen
dieser Modelle sind riesig ob es darum geht, den
Kundenservice mit KI-Chatbots zu verbessern, Entwickler mit
automatisch generiertem Code zu
unterstützen oder
Empfehlungsmaschinen zu unterstützen — grundlegende Modelle
prägen die Zukunft der Mit Basismodellen und
der Leistungsfähigkeit generativer KI prognostizieren
wir nicht nur Wir bauen es.
Im nächsten Video sehen
wir einige der
erstaunlichen Anwendungen, die verschiedene Arten von
generativen KI-Modellen bieten.
14. L3V5 – LLM-Entwicklung: Lassen Sie uns darüber sprechen, wie große
Sprachmodelle entwickelt werden. In diesem Video bieten wir zunächst
einen Vergleich zwischen der LLM-Entwicklung und der
traditionellen Entwicklung des
maschinellen Lernens Anschließend werden wir
über drei Hauptarten
von LLMs sprechen und am Ende ein Konzept namens Chain
of Thought Reasoning
erörtern und erläutern, wie dieses Konzept dazu beitragen kann,
bessere Aufforderungen für LLMs zu entwerfen Lassen Sie uns zunächst die
Entwicklung von LLMs
unter Verwendung bereits vorhandener Modelle mit dem traditionellen Ansatz
der maschinellen Lernentwicklung
vergleichen unter Verwendung bereits vorhandener Modelle mit dem traditionellen Ansatz
der In der LLM-Welt gibt es keine Voraussetzung
für technisches Fachwissen oder umfangreiche
Schulungsbeispiele, und raten Sie mal, was? Sie können das
Modelltraining auch vergessen. Es dreht sich alles um die
Kunst des schnellen Designs, klar, präzise und voller
nützlicher Informationen Andererseits erfordert herkömmliches
maschinelles Lernen, dass Sie die Ärmel hochkrempeln und sich
eingehend mit Schulungsbeispielen und
Modelltraining befassen und manchmal sogar Grundkenntnisse über
Hardware und Rechenleistung
benötigen Hardware und Rechenleistung Es gibt drei
Haupttypen von LLMs:
generisch, befehlsgesteuert und dialoggesteuert Jedes dieser Modelle erfordert seinen eigenen Aufforderungsstil Generische Sprachmodelle funktionieren wie die automatische Vervollständigung Ihres Smartphones anhand der Sprachmuster der Trainingsdaten das
nächste Wort
voraus anhand der Sprachmuster der Trainingsdaten das Modelle, die
auf Anweisungen abgestimmt
sind, reagieren dagegen auf
spezifische Anweisungen, egal ob es darum geht, einen Text zusammenzufassen, ein
Gedicht im
Stil eines berühmten Dichters zu verfassen
oder eine Stimmungsanalyse einer Aussage anzubieten Diese Modelle folgen
den Anweisungen, die in der
Eingabe enthalten Schließlich haben wir Modelle entwickelt, die auf den
Dialog abgestimmt sind. Dabei handelt es sich um eine Untergruppe von Modellen, die
speziell für den
interaktiven Kontext entwickelt wurden, ähnlich wie bei einem Chat mit einem Bot Schauen wir uns also Beispiele für diese drei Arten an und
sehen sie uns in Aktion an Bevor wir uns mit Beispielen für
verschiedene Arten von LLMs befassen, wollen wir eine
Definition für Token geben Ein Token ist eine Dateneinheit
, die das Modell verarbeitet. Es kann ein Wort
oder ein Teil eines Wortes sein. Wir beginnen mit den
generischen Sprachmodellen. Sie sind ziemlich einfach. Ihre Hauptaufgabe besteht darin,
das nachfolgende Wort anhand
des Kontextes der
Trainingsdaten vorherzusagen das nachfolgende Wort anhand . Nehmen wir ein einfaches Beispiel. Die Katze hat darauf gesessen und jetzt wollen
wir wissen, was das wahrscheinlichste nächste Wort ist uns
das Modell sagt, und
das ist diese Antwort Genau wie es die Funktionen zur
automatischen Vervollständigung Ihres Telefons vermuten lassen
würden Es ist ein faszinierender
Einblick, wie KI nachahmen
kann, wie wir
auf natürliche Weise kommunizieren Kommen wir nun zu Modellen, die auf Anweisungen
abgestimmt sind.
Diese Modelle glänzen, wenn es
darum geht, Antworten zu generieren Sie orientieren sich den
Anweisungen in der Eingabe,
unabhängig davon, ob es sich
um die Aufforderung handelt, einen Text zusammenzufassen, ein Gedicht
in
einem bestimmten Stil oder sogar
eine Textstimmung zu klassifizieren Es ist, als hätten Sie Ihren
eigenen digitalen Assistenten, der
immer bereit Ihre
Anweisungen präzise auszuführen Und schließlich haben wir Modelle, die auf
Dialekt abgestimmt sind. Dabei handelt es sich um spezielle Modelle, die auf Anweisungen abgestimmt Sie
warten jedoch nicht nur auf Anweisungen. Sie sind darauf trainiert, ein Hin- und
Her-Gespräch zu führen. Sie können
ihnen normalerweise in Form von Chatbots begegnen ihnen normalerweise in Form von Chatbots Wenn Sie jemals einem
virtuellen Assistenten eine Frage gestellt haben, haben Sie wahrscheinlich
mit einem solchen Modell interagiert Es geht darum,
eine natürliche
Konversationsinteraktion zu ermöglichen eine natürliche
Konversationsinteraktion Jetzt ist es an der Zeit,
ein interessantes Konzept zu untersuchen, die Gedankenkette Dabei handelt es sich um eine Beobachtung, dass Modelle
genauere Antworten liefern, wenn
sie zunächst einen Argumentationsweg oder
eine Kette von Argumenten generieren , die zur Antwort
führen Betrachten wir ein einfaches Beispiel. Roger hat fünf Tennisbälle
und kauft zwei weitere Dosen mit
jeweils drei Bällen Wie viele Bälle hat
Roger jetzt? Anfänglich könnte das Modell Schwierigkeiten haben,
die richtige Antwort zu geben. das Problem jedoch ein zweites Mal vorgestellt wird, ist es
wahrscheinlicher, dass
das Modell mit
der richtigen Antwort abschließt. Die Argumentationskette
trägt dazu bei,
das Verständnis und die
Reaktionsfähigkeit
großer Sprachmodelle zu verbessern das Verständnis und die
Reaktionsfähigkeit großer Sprachmodelle Zusammenfassend lässt sich sagen, dass die
Entwicklung und der Einsatz umfangreicher Sprachmodelle
spannende neue Wege in der
Welt des maschinellen Lernens eröffnen spannende neue Wege in der
Welt des maschinellen Lernens Während wir diese Technologien weiter verbessern und
verfeinern, erwarten
wir eine Zukunft, in fortgeschrittene
Sprachverständnis durch KI
unsere Interaktion mit
digitalen Plattformen drastisch verändert unsere Interaktion mit Jetzt, da wir verstehen,
wie LLMs entwickelt werden, ist
es an der Zeit, herauszufinden, warum es
wichtig ist,
sie für bestimmte Aufgaben zu optimieren und wie wir
LLMs effizient abstimmen können Wir sehen uns im nächsten Video.
15. L3V6 – Tuning von LLMs: In diesem Video werden wir
darüber sprechen, wie wichtig es ist,
LLMs für bestimmte Aufgaben zu optimieren und
wie Es ist ein interessanter
Gedanke,
ein Modell zu haben , das
mit allem umgehen kann In der Praxis sind LLMs
jedoch mit einer Reihe von
Einschränkungen verbunden Um ihre
Zuverlässigkeit und Effizienz zu erhöhen, müssen
LLMs auf
bestimmte Aufgaben und spezifische Fachkenntnisse abgestimmt werden . Genau wie ein Profisportler seinen Sport
spezialisiert hat, müssen
diese Modelle
ihre Fähigkeiten verfeinern, um ihre Leistung zu verbessern Beginnen wir mit einem
einfachen Aufgabenbeispiel. Beantwortung von Fragen. Dies ist eine Unterdomäne der Verarbeitung
natürlicher Sprache, bei der es darum geht, beantworten Fragen, die in der
Alltagssprache gestellt werden,
automatisch zu Diese Q&A-Systeme sind Code in der Lage, eine Reihe von Fragen zu beantworten, von
sachlichen bis hin zu
meinungsbasierten dank ihrer
umfassenden Ausbildung
zu Text und
Code in der Lage, eine Reihe von
Fragen zu beantworten, von
sachlichen bis hin zu
meinungsbasierten dank ihrer
umfassenden Ausbildung
zu Text und
Code in der Lage, eine Reihe von
Fragen zu beantworten, von
sachlichen bis hin zu
meinungsbasierten Fragen. Die geheime
Zutat für diesen Modellerfolg
ist Bedenken Sie Folgendes. Wenn Sie ein QA-Modell
für den Kundensupport, das
Gesundheitswesen oder die Lieferkette
entwickeln , wird
Fachwissen zu
einer wichtigen Anforderung. Im Kundensupport könnte ein
auf die
Domain abgestimmtes LLM aufschlussreiche Informationen zu Abonnements und Diensten
liefern aufschlussreiche Informationen zu Abonnements und Diensten
liefern und
so sicherstellen, dass Ihre Kunden einen
effizienten KI-gestützten Service erhalten effizienten KI-gestützten Im Bildungsbereich können
diese Modelle
detaillierte Informationen
über Kurse,
Studiengebühren oder
akademische Richtlinien bieten detaillierte Informationen
über Kurse, Studiengebühren oder
akademische Richtlinien Im Gesundheitswesen könnten sie
als
Instrumente zur Selbstverwaltung von Patienten dienen und wichtige
gesundheitsbezogene Informationen
liefern. Einzelhandelsunternehmen
könnten von
besseren KI-Chatbots und
Produktvisualisierungen profitieren und das
Kundenerlebnis verbessern Und im Bereich des
Lieferkettenmanagements könnten
LLMs
wertvolle Logistikinformationen
und Einblicke in den Bestand bieten wertvolle Logistikinformationen
und Und vergessen wir nicht
die großen Technologieunternehmen. Sie könnten diese Modelle verwenden, um ihren Kunden erstklassigen technischen
Support zu
bieten. Jeder Sektor hat seine
eigenen Anforderungen, und die Abstimmung eines LLM gemäß diesen
Spezifikationen kann die Effektivität
des Modells drastisch verbessern Generative
Q&A-Modelle können zwar
ihre
Wissensbasis nutzen , um
Fragen zu beantworten , ohne dass
spezifische Fachkenntnisse erforderlich sind, Feinabstimmung dieser Modelle auf
domänenspezifisches Wissen erhöht ihre
Genauigkeit und Zuverlässigkeit
erheblich Das ist so, als würde man dem Modell
eine detaillierte Karte des Geländes zur Verfügung stellen , auf dem
es navigieren soll Nehmen wir als Beispiel Vertex AI. Es bietet aufgabenspezifische
Basismodelle , die bereits auf
eine Vielzahl von Anwendungsfällen abgestimmt sind Nehmen wir an, Sie möchten die Meinung
Ihrer Kunden zu
Ihrem Produkt oder Ihrer Dienstleistung besser verstehen Ihrer Kunden zu
Ihrem Produkt oder Ihrer Dienstleistung besser Vertex AI verfügt über ein Aufgabenmodell
zur Stimmungsanalyse, das genau
das Richtige für diese Aufgabe ist Vielleicht sind Sie im Einzelhandel
oder in der Immobilienbranche tätig und müssen
Belegungsanalysen durchführen Auch dafür gibt es ein
aufgabenspezifisches Modell. Diese Modelle, die
für bestimmte Aufgaben entwickelt wurden,
zeigen, wie wichtig Tuning Sie sind
effizienter, zielgerichteter und effektiver bei ihren
jeweiligen Aufgaben Die Fähigkeit, ein Modell auszuwählen und zu
verwenden, das
Ihren spezifischen Bedürfnissen entspricht,
kann die Gesamteffektivität
Ihrer KI-Lösungen erheblich verbessern Okay, jetzt ist es an der Zeit,
formal zu definieren, was
wir mit Tuning meinen Tuning bezieht sich auf den Prozess der Anpassung eines vorab
trainierten Modells an eine spezifischere Aufgabe,
z. B. eine Reihe von benutzerdefinierten Anwendungsfällen oder neue Domäne, indem
es anhand neuer Daten trainiert wird. Feinabstimmung wird erreicht, indem das Modell mit
neuen Daten
trainiert wird,
die für die jeweilige Aufgabe relevant sind. Wenn wir beispielsweise im juristischen
oder medizinischen
Bereich tätig sind , würden
wir
Trainingsdaten aus
diesen Bereichen sammeln , um
unser Modell entsprechend abzustimmen. Aber was ist Feinabstimmung? Stellen Sie sich Feinabstimmung als eine hochpräzise
Anpassung des Modells vor. Sie bringen Ihren eigenen Datensatz mit
und trainieren das Modell neu, was sich auf alle
Gewichte im LLM auswirkt Dies kann eine armut- und
ressourcenintensive Aufgabe und erfordert das Hosten Ihres
eigenen Feinabstimmungsmodells Und das kann es für viele Anwendungsfälle
unpraktisch machen. Es ist jedoch wichtig zu wissen
, dass ein Feinabstimmungsmodell ein hohes Maß
an Genauigkeit und Spezifität
verfügt Nehmen wir ein Beispiel aus
der Praxis, um die Leistungsfähigkeit
der Feinabstimmung zu veranschaulichen Stellen Sie sich ein Modell der
Gesundheitsstiftung vor, das
umfassend anhand einer
Vielzahl von Gesundheitsdaten geschult wurde . Es kann verschiedene
Aufgaben problemlos ausführen und medizinische Fragen
beantworten, medizinische Bilder
analysieren, Patienten mit ähnlichen
Erkrankungen
finden und vieles mehr. Der Grund für
diesen Erfolg ist Feinabstimmung mit
domänenspezifischem Wissen. Auf diese Weise wird das Unternehmen eher zu einem Spezialisten
als zu einem Generalisten, präzise
und zuverlässige Ergebnisse
im Gesundheitswesen
liefert . Dieser Prozess unterstreicht
das enorme Potenzial und die Vielseitigkeit der Feinabstimmung verwandelt ein einheitliches
Modell in ein hochspezialisiertes Tool zur
Bewältigung komplexer
Gesundheitsszenarien Feinabstimmung ist eine hervorragende
Möglichkeit , die Leistung eines Modells zu steigern, aber ähnlich wie die Renovierung
eines ganzen Hauses kann
sie teuer und
nicht immer praktikabel sein wir also tun, wenn wir nach
einer effizienteren Möglichkeit suchen Was können wir also tun, wenn wir nach
einer effizienteren Möglichkeit suchen, große
Sprachmodelle
zu optimieren Ein Ansatz, den wir verfolgen sollten, sind parametereffiziente
Tuning-Methoden, kurz PETM Stellen Sie sich PETM so vor, dass Sie Ihrem Modell
ein neues Gesicht
geben , anstatt es komplett zu
renovieren Normalerweise passen
wir bei der Feinabstimmung alle
Parameter des Modells an, was kompliziert
und zeitaufwändig ist Bei PETM
konzentrieren wir uns jedoch darauf,
nur eine kleine Teilmenge
dieser Parameter zu ändern nur eine kleine Teilmenge
dieser oder sogar einige neue
hinzuzufügen Vielleicht fügen wir
dem Modell einige
zusätzliche Ebenen hinzu oder fügen
zusätzliche Informationen hinzu Herauszufinden, wie dies am
besten geht, ist
unter Forschern immer noch ein heißes Thema Die wichtigste Erkenntnis dabei ist, dass
PETM wie eine Abkürzung ist. Es hilft uns, die Notwendigkeit
zu vermeiden, das gesamte Modell neu zu schulen, was uns Zeit,
Mühe und Ressourcen spart Außerdem vereinfacht es sogar die
spätere
Verwendung dieser Modelle , da wir nur
das Basismodell verwenden und unsere zusätzlichen Teile hinzufügen Wir sind nun
am Ende
unserer Erkundung der Welt
der großen Sprachmodelle angelangt . In diesem Abschnitt haben wir
wertvolle Einblicke in LLMs gewonnen , beginnend mit einer Einführung in ihre Struktur und Funktion Wir haben die zahlreichen
Vorteile der Verwendung von
LLMs erörtert und einige
Beispiele dafür bereitgestellt,
darunter Palm, Lambda Wir haben auch über den
Prozess der LLM-Entwicklung gesprochen und
hervorgehoben, wie er sich von der traditionellen Entwicklung des maschinellen Lernens
unterscheidet des maschinellen Lernens
unterscheidet Und vor allem haben wir die Bedeutung der Optimierung
von LLMs
unterstrichen Wir untersuchen, wie es ihre
Zuverlässigkeit und Genauigkeit
verbessert Wir haben gesehen, wie
domänenspezifisches Wissen erheblich verbessern
kann ihre Leistung erheblich verbessern
kann,
und wir haben mehr über effiziente Optimierungsmethoden wie parametereffiziente
Optimierungsmethoden gelernt. Im nächsten Abschnitt werden
wir
uns mit vier wichtigen
Tools in Google Cloud vertraut machen , mit denen wir auf unsere eigenen generativen
KI-Anwendungen
erstellen
können generative KI-Modelle zugreifen
und diese verfeinern und .
16. L4V1 – App-Blatt: Lassen Sie uns über Apshet sprechen eine innovative
No-Code-Plattform von Google, die die nutzt, um die App-Entwicklung weltweit generativer KI nutzt, um die App-Entwicklung weltweit zu transformieren Stellen Sie sich eine Welt vor, in der jeder, unabhängig von seinen
Programmierkenntnissen, schnell datenzentrierte Apps
für Google Workspace
erstellen kann datenzentrierte Apps
für Google Workspace
erstellen Genau dafür wurde
Apsheet entwickelt. Erinnern Sie sich an den langwierigen Prozess der traditionellen App-Entwicklung, von der Konzeptualisierung bis zur Ausarbeitung von
Projektspezifikationen
und von der
Zusammenarbeit im Team bis zur Programmierung, und von der
Zusammenarbeit im Team bis zur Programmierung, es war ein Mit Apsheet wurde der Lebenszyklus der
App-Entwicklung jedoch drastisch vereinfacht. Mit Apsheet wurde der Lebenszyklus der
App-Entwicklung jedoch drastisch vereinfacht. Was früher Monate
gedauert hat,
kann jetzt in
Tagen oder sogar Stunden erledigt werden, sodass Sie Zeit für
wertvollere Das Schöne an Apshet
ist seine Vielseitigkeit. Es ermöglicht Ihnen,
Apps für mehrere Plattformen zu erstellen,
einschließlich Desktop-, Mobil
- und Chat-Anwendungen Apsheet bietet eine Reihe von Anwendungen, die so
unterschiedlich sind wie Ihre spezifischen Bedürfnisse Es kann sein, dass Sie ein Lager
verwalten und eine optimierte Lösung
für die Inventarverfolgung
benötigen Vielleicht organisieren Sie
eine große Firmenveranstaltung und benötigen ein detailliertes Tool zur
Veranstaltungsplanung, oder vielleicht führen Sie eine umfangreiche, vielfältige
Marketingkampagne und benötigen eine App, um
die vielen beweglichen Teile zu koordinieren Vom
Kundenbeziehungsmanagement die Koordination der Lieferkette, Personalplanung bis hin zum
Projektmanagement Apsheet ist anpassungsfähig genug , um Ihren spezifischen Bedürfnissen gerecht zu Seine Flexibilität und Vielseitigkeit öffnen die Türen zu
unzähligen Szenarien machen es zu einer idealen Plattform für Entwicklung maßgeschneiderter
datenzentrierter Apps Solange Sie eine
klare Vorstellung davon haben, was Sie benötigen, und Sie
es in natürlicher Sprache erklären können, kann
Apsheet Ihnen helfen, diese
Idee in eine Anwendung umzusetzen Lassen Sie uns also tiefer eintauchen. Vor Kurzem hat Apshet
neue Funktionen eingeführt alle auf generativer KI basieren Jetzt können Sie Ihre Idee innerhalb weniger Minuten
in eine voll funktionsfähige
App verwandeln , und zwar in natürlicher
Sprache Sie möchten beispielsweise
eine App zur Erfassung von
Reisekosten erstellen . Alles, was Sie tun müssen, ist, apset Ihren Prozess zu
beschreiben. Aphet übernimmt dann das Stellen von
Folgefragen , um die
Anforderungen Ihrer App besser zu verstehen Sobald Apsheet
genügend Informationen gesammelt hat, zeigt
es eine Vorschau
der Tabellen für Ihre App und
bietet sogar Beispieldaten, mit denen
Sie diese testen können Anschließend erstellt Upseet
die Starter-App für Sie. Sobald die App fertig ist, können
Sie sie starten, ausprobieren und alle erforderlichen
Anpassungen vornehmen Interessanterweise
können Sie weiterhin
natürliche Sprache verwenden, um
die gewünschten Änderungen zu spezifizieren, und Apsheet hilft
Ihnen dabei, Ihre App zu verfeinern Eine App in
natürlicher Sprache ohne Programmierung
zu erstellen , das ist die Magie von Apsheet Es ermöglicht jedem,
schnell und
effizient Anwendungen
für sein Unternehmen zu entwickeln schnell und
effizient Anwendungen
für sein Unternehmen zu Schauen wir uns also an, wie Apsheet generative KI
nutzt, um dies
zu ermöglichen Wenn der Benutzer mit Apheet
interagiert, Dialogflow und generative KI zusammen, unterstützt von einem individuell geschulten LLM, arbeiten
Dialogflow und generative KI zusammen,
unterstützt von einem individuell geschulten LLM, um die für die Erstellung der App erforderlichen Informationen bereitzustellen arbeiten
Dialogflow und generative KI zusammen,
unterstützt von einem individuell geschulten LLM, um die für die Erstellung der App erforderlichen Informationen bereitzustellen
. Dialect Flow sammelt
wichtige Informationen über das Geschäftsproblem des Benutzers, anhand derer
Apsheet eine Starter-App Apsheet Apsheet versucht,
diese App so weit wie möglich an
die ideale Lösung
des Benutzers anzupassen wie möglich an
die ideale Lösung
des Benutzers Nachdem Direct Flow
die erforderlichen Informationen gesammelt hat, sendet
Apsheet eine
Anfrage an das LLM, um
Unterstützung bei der Generierung
des für die App benötigten Datenmodells und der Ansichten Wenn das LLM
das richtige Schema bereitstellt, verwendet
Apsheet alle
gesammelten Informationen, in nur wenigen Minuten eine Starter-App
zu erstellen Die bereitgestellte App umfasst
eine umfassende Datenbank, eine intuitive App-Oberfläche
und alle spezifischen Konfigurationen, und alle spezifischen Konfigurationen die
während der Interaktion geäußert wurden,
wie z. B. Benachrichtigungseinstellungen wie z. B. Sobald die Starter-App fertig ist, können
Benutzer weiterhin mit
Apsheet
zusammenarbeiten , um die App zu verfeinern und weiter
zu verbessern Je nach
Komplexität der Anfrage kann
Apsheet während dieser Interaktion
sowohl Dialogflow als auch
LLM verwenden LLM Die Kombination aus
Dialect Flow und LLM erweitert
die Fähigkeiten von Apheet, sodass es
selbst die komplexesten Anfragen zur Anwendungsentwicklung bearbeiten selbst Sie können diese beiden Technologien sogar individuell anpassen
. Für den Dialektfluss können Sie ihn so
anpassen, dass er Ihnen bei der
Erstellung von Benutzeroberflächen für Konversationen hilft . Hier erfahren Sie, wie Sie das machen. Zunächst erstellen Sie einen
Dialekt-Flow-Agent. Definieren Sie dann Ihre benutzerdefinierte
Absicht und Entitäten. Sobald das erledigt ist, hilft Ihnen die
Dialect Flow API dabei,
diesen Agenten in
Ihre Anwendung zu integrieren diesen Agenten in
Ihre Anwendung Im Wesentlichen passen Sie eine
ausgeklügelte Technologie an Ihre spezifischen
Bedürfnisse an Für das LLM können Sie mit dem generativen
KI-Studio von Vertex ein Modell
entwerfen Ihrer Anwendung , das den
individuellen
Anforderungen Diese Plattform bietet eine
Reihe grundlegender Modelle
von Google Cloud, die Sie an Ihre Bedürfnisse anpassen
können Sie können dies erreichen, indem Sie die Eingabeaufforderungen nach
Bedarf
formulieren und anpassen und die
Modelle anhand Ihrer eigenen Daten verfeinern Zusammenfassend lässt sich sagen, dass
Appset durch Nutzung generativer
KI-Technologien,
insbesondere von Googles
Dialect Flow
und einem speziell geschulten LLM, die
Nutzung generativer
KI-Technologien,
insbesondere von Googles
Dialect Flow
und einem speziell geschulten LLM, es jedem
Einzelnen ermöglicht,
datengesteuerte Apps
ohne Programmiererfahrung und in sehr kurzer Zeit zu entwickeln datengesteuerte Apps
ohne Programmiererfahrung und in sehr kurzer ohne Programmiererfahrung Es hat sich zu einer
leistungsstarken Plattform entwickelt, die
es Benutzern ermöglicht, verschiedene Apps in natürlicher Sprache zu generieren verschiedene Apps Damit
ist dieser Abschnitt über vier leistungsstarke
generative KI-Tools Google Cloud
verfügbar sind. Im nächsten und letzten
Abschnitt dieses Kurses werden
wir versuchen, diese Tools zu verwenden, um mithilfe
der Möglichkeiten generativer KI
unsere eigene Anwendung zu erstellen .
17. L4V2 – Gen-App-Builder: Der Jen App Builder über die Vertex-KI von Google
Cloud
verfügbar ist verbindet
meisterhaft grundlegende Modelle mit der Stärke von Such
- und Konversations-KI und ermöglicht es einem neuen
Nutzerkreis, innovative generative
KI-Anwendungen in
kürzester Zeit und ohne Programmierkenntnisse zu innovative generative
KI-Anwendungen in kürzester Zeit Der menschenähnliche und ansprechende Charakter von
Online-Interaktionen bietet Nutzern die
Möglichkeit,
ihre Verbindungen zu ihrem potenziellen Publikum zu verbessern ihre Verbindungen zu ihrem Für Unternehmen bedeutet dies eine bessere Kommunikation
mit Kunden, Mitarbeitern und Partnern. Mit Jen App Builder Erstellung dieser leistungsstarken
GN AI-Anwendungen keinerlei Codierung erforderlich. Denken Sie darüber nach, Ihren
personalisierten digitalen Assistenten, maßgeschneiderte Suchmaschinen, Wissensdatenbanken,
Bildungsanwendungen und vieles mehr Mit Jen App Builder
haben Sie die Möglichkeit, solche Visionen zum Leben zu erwecken Der Jen App Builder verfügt über eine benutzerfreundliche
Drag-Drop-Oberfläche, die den Prozess des Designs und der Entwicklung von
Apps
wesentlich reibungsloser
macht Designs und der Entwicklung von
Apps
wesentlich reibungsloser Es verfügt über einen visuellen
Editor, mit dem Sie
Ihre App-Inhalte
einfach erstellen und ändern können Ihre App-Inhalte
einfach erstellen und ändern Die integrierte
Suchmaschine ermöglicht es
Benutzern, Informationen
in der App zu finden, während die
Konversations-KI-Engine Interaktionen
in natürlicher Sprache
ermöglicht Der Jen App Builder bietet also die Flexibilität,
ein unternehmensweites Sucherlebnis,
ein Konversations- oder
Chat-Erlebnis oder sogar beides zu erstellen ein unternehmensweites Sucherlebnis, ein Konversations- oder
Chat-Erlebnis oder sogar beides Der Prozess ist einfach. Sie beginnen mit dem Aufbau
einer Inhaltsquelle
, bei der es sich um ein
Word-Dokument oder
eine Tabelle mit
Informationen über Ihr Unternehmen handeln kann eine Tabelle mit
Informationen über Ihr Unternehmen Als Nächstes wählen Sie die Funktionen Sie
in Ihre App integrieren möchten Dies kann Suche,
Chat oder beides sein. Und wenn Sie fertig sind, klicken Sie
einfach auf Erstellen. Aber warte, es gibt noch mehr. dieser App können
Sie auch generierte Antworten steuern und anpassen oder Standardantworten erstellen. Wenn das nicht ausreicht, haben Sie jederzeit Zugriff auf eine
detaillierte Kontrolle über die Antworten mit Optionen zur
Steuerung der Antwortart, zur Festlegung verbotener Begriffe und zur
Deaktivierung generierter
Antworten, falls erforderlich Aber mach dir keine Sorgen. Auch wenn
generierte Antworten deaktiviert sind, kann
Ihre GAI-gestützte App dank der Suchtechnologie von
Google immer noch
komplexe Fragen beantworten dank der Suchtechnologie von
Google immer noch
komplexe Fragen Jen App Builder kann auch Transaktionen im
Namen des Benutzers abschließen Transaktionen im
Namen des Benutzers Durch die Integration
vorstrukturierter Abläufe für gängige Anwendungsfälle
wie die Überprüfung Bestellstatus oder die
Erläuterung von Rechnungen können
Sie
diese Funktionen mühelos
mit nur einem einzigen Klick zu Ihrer App hinzufügen . Sie beschränken sich
jedoch nicht
nur auf die Bereitstellung vordefinierter
Funktionen Mit Hilfe
einer einfachen graphischen Oberfläche können Sie
Ihren individuellen
Transaktionsfluss erstellen , um die Geschäftslogik auf hoher Ebene
zu skizzieren Wenn Sie es vorziehen,
können Sie sogar die auf
Eingabeaufforderung basierende
Flow-Erstellung verwenden , um
Ihre Logik in einer
einfachen natürlichen Sprache zu erklären . Sobald Sie mit
Ihren App-Konfigurationen zufrieden sind, Sie sie testen. Und wenn alles gut aussieht, integrierten Integrationen von
Jen App Builders einen reibungslosen Start Ihrer App auf
Ihrer Website oder auf beliebten
Messaging-Plattformen Es bietet auch Konnektivität
mit Telefoniepartnern. Um Ihre neue App bereitzustellen, benötigen
Sie lediglich den
Widget-Bereitstellungscode. So einfach ist das. Sie können also sehen, dass Sie mit
Jen App Builder
Ihre Konversation oder Suche ganz einfach auf
einer Website veröffentlichen oder eine Verbindung zu
beliebten Messaging-Apps herstellen können Ihre Konversation oder Suche ganz einfach auf
einer Website veröffentlichen oder eine Verbindung zu beliebten Messaging-Apps herstellen Jen App Builder nutzt die
Leistungsfähigkeit der KI und ermöglicht es Ihnen, Chatbots zu erstellen, die
Aufgaben wie die Beantwortung
domänenspezifischer Fragen, die
Verarbeitung von Multimedia-Eingaben
und die Bereitstellung
multimodaler Antworten übernehmen können Aufgaben wie die Beantwortung
domänenspezifischer Fragen, Verarbeitung von Multimedia-Eingaben und die Bereitstellung Diese Chat-Bots können
Benutzer zu relevanten Inhalten führen und generative KI-Antworten
auch ohne spezifische
Domänenkenntnisse
liefern auch ohne spezifische Und sie können
Transaktionen abschließen, Informationen mithilfe von KI
zusammenfassen
und haben die
Flexibilität, Konversationen bei
Bedarf zu unterbrechen und wieder aufzunehmen Mit Jen Apbilder entwickeln
Sie
digitale Unterstützung, die die Standards für Online-Interaktionen neu definiert Standards Zusammenfassend lässt sich sagen, dass
bei Jen Abuilder die Stärken der
aktuellen Gründungsmodelle von Google, Unternehmenssuche und
der Konversations-KI, zusammenkommen Es ermöglicht Ihnen,
mühelos
fortschrittliche Anwendungen zu entwickeln fortschrittliche Anwendungen Die benutzerfreundliche Oberfläche und der visuell
ansprechende Editor ebnen den Weg für die Erstellung und Änderung von App-Inhalten Mit Funktionen, die von
integrierten Suchmaschinen über
eine Konversations-KI-Engine bis hin zu eine Konversations-KI-Engine einer benutzerfreundlichen
und
intuitiven Oberfläche reichen, bietet
Jen App Builder ein umfangreiches Toolkit für Erstellung
responsiver Sie können Chatbots
erstellen, die multimediale Eingaben, multimodale Antworten und
domänenspezifische Fragen Und mit der Fähigkeit,
Transaktionen abzuschließen und Konversationen zu unterbrechen
und wieder aufzunehmen, sind
diese Chatbots mehr
als nur Sie sind für
die Bewältigung der komplexesten Aufgaben
und Interaktionen konzipiert die Bewältigung der komplexesten Aufgaben
und Interaktionen lassen sich gleichzeitig
einfach veröffentlichen und mit Ihrer Website oder
beliebten Messaging-Apps verbinden Fahren wir nun mit
dem nächsten interessanten App Builder fort dem nächsten interessanten App Builder auf dem Google
Cloud App Sheet
verfügbar ist.
18. L4V3 – Maker Suite: Maker SID ist ein intuitives
browserbasiertes Tool, das entwickelt wurde, um schnelles und
benutzerfreundliches Prototyping
mit Palm to Model zu ermöglichen mit Palm Die Integration von
Maker SUID mit Palm-API bedeutet, dass wir jetzt auf die API zugreifen
können über eine benutzerfreundliche
grafische Oberfläche Die Palm-API ist ein Tor zu den großen Sprachmodellen
und generativen KI-Tools von
Google und ermöglicht ein zeiteffizientes
und leicht zugängliches Prototyping dieser Plattform können
Sie Modelle
schnell testen und
mit verschiedenen Eingabeaufforderungen experimentieren Sie können damit Ihre Eingabeaufforderungen erstellen
und verfeinern, Ihrem benutzerdefinierten Datensatz synthetische Daten
hinzufügen, innovative Einbettungen generieren und Ihre benutzerdefinierten
Modelle mühelos anpassen Und wenn Sie sich
etwas einfallen lassen, mit dem Sie zufrieden sind, bietet
Make Your Suite Ihnen die Möglichkeit,
es in Python-Code umzuwandeln, sodass Sie
das Modell mithilfe der Palm-API aufrufen können. Palm API und Maker Suite sind das perfekte Duo für die
generative KI-Entwicklung. Palm API ist Ihr
Ausgangspunkt für den Zugriff auf die LLMs von Google und
gibt Entwicklern
die Freiheit, Modelle zu verwenden , die
für verschiedene Aufgaben optimiert Auf der anderen Seite bietet
Maker Suite
eine intuitive Oberfläche, über die Sie mit dem
Prototyping und der Erstellung
Ihrer einzigartigen Apps beginnen Prototyping und der Erstellung
Ihrer einzigartigen Lassen Sie uns nun einen
Einblick in die Maker Suite werfen und sehen, wie wir
in wenigen Minuten mit dem Prototyping mit
großen Sprachmodellen beginnen können in wenigen Minuten mit dem Prototyping mit
großen Sprachmodellen So sieht es also in der
Maker Suite aus. Schauen wir uns dieses
Menü auf der linken Seite an. Hier können wir neue Eingabeaufforderungen erstellen. Wie wir sehen können, gibt es
drei verschiedene Arten von Eingabeaufforderungen, mit denen wir Textansagen,
Datenaufforderungen und Chat-Eingabeaufforderungen
erstellen können Datenaufforderungen und Chat-Eingabeaufforderungen Wir haben auch Zugriff
auf unsere Bibliothek, die aktuelle Seite, die gerade geöffnet
ist Wenn Sie sich ApiKey holen, können
wir hier sehen, dass wir die Möglichkeit haben,
einen API-Schlüssel für ein neues Projekt zu erstellen einen API-Schlüssel für ein neues Projekt Und es sind auch andere
Quicklinks verfügbar. Es gibt eine Anleitung für den
Einstieg. Es gibt eine Galerie mit Eingabeaufforderungen, der Sie verschiedene
Arten von Eingabeaufforderungen erkunden können Es gibt eine API-Dokumentation und weitere Informationen zu Datenschutzbestimmungen und
Nutzungsbedingungen Kehren wir nun zu
unserer Bibliothek zurück und probieren
verschiedene Eingabeaufforderungen aus Die erste ist eine
Textaufforderung. Lass es uns versuchen. Hier gibt es also interessante
Dinge zu entdecken. Das Erste, was auffällt,
sind diese Beispielaufforderungen. Es gibt einige Beispiele
, die uns helfen sollen,
eine bessere Vorstellung davon zu bekommen , wie diese
Eingabeaufforderungen aussehen könnten Wenn Sie auf Lehrbücher
achten, können
wir außerdem feststellen, dass uns einige
Beispiele zur Verfügung gestellt werden Lasst uns einige davon lesen. Kategorisieren Sie einen Apfel als
Obst oder Gemüse. Schreiben Sie eine JavaScript-Funktion
und erklären Sie sie mir. Paraphrase, es
sieht so aus, als würde es gleich regnen und viele
andere Beispiele Es zeigt nur, welche Art
von Eingabeaufforderungen Sie als Beispiele für
eine Textaufforderung
verwenden können als Beispiele für
eine Textaufforderung
verwenden Schauen wir uns nun eines der Beispiele an,
die hier bereitgestellt
werden Schauen wir uns
gelegentliche Überlegungen an. Die Aufforderung wäre also,
dies in eine zufällige E-Mail umzuschreiben, und dann geben Sie
einen Text für eine Ich kann auf Ausführen klicken und jetzt kann ich sehen, dass
das Sprachmodell eine Antwort auf meine Aufforderung
erstellt hat Lassen Sie uns die andere Art
von Aufforderung untersuchen, die Datenaufforderung. Hier können wir also sehen, dass es zwei verschiedene Teile
gibt. Die erste ist eine Tabelle zum
Schreiben unserer Prompt-Beispiele. Und der zweite Teil soll uns
helfen, unsere Eingabeaufforderung zu testen. Schauen wir uns also ein Beispiel an
und sehen, wie es aussehen würde. Versuchen wir es mit Gegensätzen. In den Beispielen sehen wir,
dass wir
vier verschiedene Beispiele dafür
bereitstellen , was jede
dieser Eingaben als Ausgabe
erhalten sollte Wenn unsere Aufforderung also darin besteht, ein Wort oder eine Phrase
mit entgegengesetzter Bedeutung zu finden, können wir Beispiele angeben,
z. B. wenn die Eingabe stark ist, sollte
die Ausgabe schwach sein. Wenn die Eingabe dick ist, sollte
die Ausgabe dünn
sein und so weiter. Nachdem wir diese Beispiele bereitgestellt
haben, können wir unsere Eingabeaufforderung testen. Jetzt fragen wir nach dem Sprachmodell. Wenn die Eingabe falsch ist, was wäre die Ausgabe? Und wenn die Eingabe schnell ist, was sollte die Ausgabe sein? Und wenn wir jetzt laufen, sehen
wir, dass
das Sprachmodell
als Antwort auf falsch richtig erzeugt,
und wenn
es um schnelle Eingaben geht, erzeugt
das Sprachmodell langsam. Wir können sehen, dass
das Sprachmodell für jede Eingabe das Gegenteil als Ausgabe erzeugt. Lassen Sie uns die dritte Art
von Aufforderung untersuchen, die Chat-Aufforderung. Hier können wir auch sehen
, dass es zwei Teile gibt. Es gibt einen Teil zum Schreiben unserer Prompt-Beispiele und einen weiteren Teil zum
Testen unserer Prompts. Schauen wir uns also einige
dieser Beispiele an. Lass uns versuchen, mit einem Alien zu chatten. Im Beispiel bieten
wir also einen gewissen Kontext. Sei ein Außerirdischer, der auf einem der
Jupitermonde lebt , und führe
ein Beispielgespräch Wenn der Benutzer sagt,
wie geht's, sollte
das Modell sagen:
Mir geht es gut und so weiter Wenn Sie
weitere Beispiele hinzufügen möchten, haben
wir hier unten die Möglichkeit. Und jetzt können wir unser Modell testen. Als Antwort sagen wir, ich würde es gerne besuchen.
Was sollte ich tun? Aber das Modell bietet eine Antwort, die
relevant ist und
die Konversation fortsetzt. Wir können weiter mit
dem Modell interagieren , indem wir
weitere Eingabeaufforderungen schreiben Im Folgenden haben wir auch einige Optionen
zum Tunen des Modells. Die erste ist
eine Textvorschau derselben
Aufforderung, an der wir gerade arbeiten. Egal, ob es sich um eine
Tabellenaufforderung oder eine Chat-Eingabeaufforderung handelt, wir können immer
auf die Textversion
derselben Aufforderung zugreifen . Mit der anderen
können wir unser Modell verfeinern. Wir können wählen, welche Art
von Modell wir verwenden möchten. Wir können die Temperatur festlegen
, die den Grad der
Zufälligkeit oder Kreativität
des Modells definiert , und wir können auch
die Anzahl der Ausgaben anpassen , die das
Modell erzeugen soll Es sind auch einige
erweiterte Einstellungen verfügbar. Um es noch einmal zusammenzufassen: Zunächst wählen
wir unseren
Prompt-Typ aus und geben einen Prompt wählen
wir unseren
Prompt-Typ aus und geben einen Prompt
mit Beispielen
und Anweisungen Unabhängig davon, welche Art von Aufforderung Sie verwenden, haben
Sie immer die Möglichkeit
, sie in Textform zu sehen Wenn Sie die Ausgabe
des Modells testen müssen, können Sie mit
Make Your Suit ganz einfach Eingabeaufforderungen auf
unterschiedliche Weise
wiederverwenden, indem Sie
Testeingaben in Ihren Eingabeaufforderungen verwenden Wir haben auch die Flexibilität, mit den
Modellparametern
herumzuspielen Zum Beispiel gibt es die Option, die
Temperatureinstellung
zu optimieren, was das Zufallselement
der
Modellantworten beeinflusst Zufallselement
der
Modellantworten Ein höherer Wert führt hier
oft zu unerwarteteren oder
sogar kreativeren Ergebnissen Wir können auch
zusätzliche Anpassungen an Parametern
wie Stoppsequenzen, Anzahl der Ausgänge usw. vornehmen. Und schließlich, wenn Sie mit Ihrer Aufforderung
zufrieden sind, können
Sie sie speichern, teilen und sogar in verschiedene
Entwicklerumgebungen
exportieren. Zum Speichern Ihrer Eingabeaufforderungen bietet
Maker Suite eine Funktion zur
Eingabeaufforderungsbibliothek, die als sicherer
Speicherplatz für all Ihre Eingabeaufforderungen dient sie für
zukünftige Referenzen leicht abrufbar
macht Sie können Ihre
Eingabeaufforderungen auch auf Ihrem Google Drive speichern. Das Teilen Ihrer Aufforderung ist so
einfach wie das Klicken auf die Schaltfläche Teilen Und wenn Sie
Ihre Arbeit in eine
Entwicklerumgebung exportieren möchten , einfach auf die Schaltfläche Code abrufen. Sie können Ihre Eingabeaufforderungen
in dem für Sie passenden Format exportieren. Python- oder JavaScript-Code, JSON-Objekte oder sogar
als CURL-Befehl Ihre Arbeit in Maker Suite,
einschließlich der Einstellungen, Anweisungen und Testbeispiele
, in
diesem Codeausschnitt gespeichert Zusammenfassend lässt sich sagen, dass
die Kombination aus Palm API und Make
Your Suite
einen unglaublich bequemen
und benutzerfreundlichen Ansatz
für das Prototyping mit
großen Sprachmodellen bietet einen unglaublich bequemen
und benutzerfreundlichen Ansatz Prototyping mit
großen Sie legen die Macht der
generativen KI in Ihre Hände und
bieten Ihnen die Flexibilität, zu experimentieren, zu optimieren
und zu verfeinern, bis Sie
die perfekte
KI-gestützte Anwendung entwickelt haben die perfekte
KI-gestützte Wir sehen uns im nächsten.
19. L4V4 Generatives KI-Studio: Da die Begeisterung für
generative KI zunimmt, können
wir sehen, dass ihre
Fähigkeit,
den
Prototyping-Prozess von Anwendungen zu beschleunigen , ein entscheidender Faktor ist Wenn Sie Zugriff auf
die richtigen Tools wie
das Generative AI Studio
und andere
GNAI-Funktionen haben die richtigen Tools wie
das Generative AI Studio , die jetzt über
Vertex AI in Google Cloud
verfügbar sind , können
Sie im Handumdrehen experimentieren, anpassen und neue Ideen perfektionieren Und mit Snap meine ich Minuten oder Stunden
statt Wochen und Monate Das Erstellen einer App ist
so einfach wie
das Öffnen des generativen KI-Studios
im Vertex AI-Bereich
der Google Cloud Console Wählen Sie die Modalität aus, mit der
Sie arbeiten möchten, wählen Sie Ihr bevorzugtes
Format und geben Sie
Ihre Eingabeaufforderung ein und passen Modellparameter an, um zusätzliche Kontrolle zu Mit Generative AI Studio
haben Sie die Möglichkeit, generative KI-Modelle zu
erforschen und anzupassen , die perfekt in Ihre
Google Cloud-Anwendungen passen Sie können
diese Anwendungen sogar in Ihre
Website oder mobile App einbetten . In diesem Video
werden wir das
generative AI Studio untersuchen, das auf Vertex AI
verfügbar ist Lassen Sie uns vorher kurz sehen, welche anderen Tools auf Vertex
AI verfügbar sind So sieht die KI in
Vertex aus. Wenn wir das
Menü auf der linken Seite erweitern, können
wir alle Tools sehen
, die uns zur Verfügung stehen Wir können sehen, dass
wir Zugang zu einem
Modellgarten, einer Werkbank
und Rohrleitungen Wir haben auch ein
generatives KI-Studio, das wir in Kürze
sprechen werden Darüber hinaus verfügen wir über
Tools für Datenmanagement, Modellentwicklung sowie
Modellbereitstellung und -nutzung. Generative AI Studio unterstützt
Entwickler bei der Erstellung und Bereitstellung von
Modellen, indem es
Tools und Ressourcen bereitstellt, die den Einstieg erleichtern. Mit Generative AI Studio können Sie schnell eine Vielzahl von
Google-Grundmodellen
durch Eingabeaufforderungen und
Optimierungen testen und
anpassen Google-Grundmodellen
durch Eingabeaufforderungen und
Optimierungen testen und . Außerdem können Sie Ihre optimierten Modelle einfach
bereitstellen In Generative Va Studio können
Sie auf die grundlegenden Sprach -,
Vision- und
Sprachmodelle von
Google zugreifen -,
Vision- und
Sprachmodelle Die Verfügbarkeit
einiger Modalitäten ist unterschiedlich. Sie können beispielsweise sehen, dass Zeitpunkt der
Aufnahme dieses Videos ich zum
Zeitpunkt der
Aufnahme dieses Videos keinen
Zugriff auf Vision-Modelle habe Konzentrieren wir uns also auf
Sprache und Sprache. Konzentrieren wir uns vorerst auf Sprache. Sie können entweder im Menü links auf die
Sprache oder auf die Schaltfläche „Öffnen“ unten
im Sprachfeld klicken. Wenn Sie eine
bessere Vorstellung davon bekommen möchten, wie Sie GN AI Studio
für verschiedene Zwecke verwenden
können, sollten
Sie sich die Galerie mit
den Eingabeaufforderungen ansehen. Bevor wir uns also mit den
verschiedenen Arten von Eingabeaufforderungen befassen, wir einen Blick auf
die Galerie der Eingabeaufforderungen Hier sehen wir eine Vielzahl
von Beispielaufforderungen, die vordefiniert
sind, um die Modellfunktionen zu
demonstrieren Die Beispielaufforderungen sind nach Aufgabentypen
wie Zusammenfassung,
Klassifizierung und Extraktion
kategorisiert wie Zusammenfassung,
Klassifizierung und Extraktion Schauen wir uns ein Beispiel an. Wenn Sie die Beispielaufforderung öffnen, können
Sie sehen, dass die Eingabeaufforderungen mit einem bestimmten
Modell und bestimmten Parameterwerten
vorkonfiguriert sind mit einem bestimmten
Modell und bestimmten Parameterwerten
vorkonfiguriert Sie können also einfach auf
Senden klicken und das Modell veranlassen, eine
Antwort zu generieren Um direkt mit
den Sprachmodellen zu arbeiten, haben
wir drei Möglichkeiten. Interagiere mit dem Modell in freier Form oder mit
strukturierter Aufforderung, interagiere mit dem
Agenten als Chatbot oder erstelle ein maßgeschneidertes Modell , das besser
für unsere Testfälle geeignet ist Lassen Sie uns den Text oder die
Codeaufforderung in einem
freien Format untersuchen Codeaufforderung in einem
freien Format Lassen Sie uns also versuchen, Ihre eigenen Eingabeaufforderungen zu entwerfen und zu
testen. Hier kann ich dem Modell
eine Aufforderung geben und es bitten, eine Antwort
zu Ich habe hier gerade einen langen
Artikel bereitgestellt und bitte das Model,
eine kurze Zusammenfassung für
den folgenden Artikel bereitzustellen . Für verschiedene Arten von Ansagen kann
ich auch
mein Mikrofon verwenden und direkt
mit dem Model sprechen Auf der rechten Seite können wir
auch sehen, dass es
einige Einstellungen gibt , mit denen wir das Modell konfigurieren
können Wir können wählen, welche Art
von Modell wir verwenden möchten. Hier haben wir zwei
Sprachmodelle und zwei DE-Modelle. Wir können die Temperatur
für das Modell festlegen, die den Grad der
Zufälligkeit oder Kreativität bestimmt Wir können auch das Token-Limit festlegen, das die maximale Textmenge bestimmt,
die von einer Eingabeaufforderung ausgegeben Top K ändert, wie das Modell
Token für die Ausgabe auswählt. Top P ändert, wie das Modell
Tokens für die Ausgabe auswählt, und wir können auch verschiedene
Sicherheitsfilter-Schwellenwerte festlegen Jetzt können wir das Modell bitten , eine Antwort auf unsere Aufforderung
zu Klicken wir auf Senden. Und wir können sehen, dass
das Modell
den langen Artikel
in drei Zeilen zusammenfasst den langen Artikel
in drei Zeilen Wenn Sie
nur ein paar Eingabeaufforderungen ausführen möchten, steht Ihnen
eine strukturierte Vorlage
für Eingabeaufforderungen zur Verfügung, die Ihnen die Arbeit
erleichtert , indem sie ein Formular mit Kontext und Beispielen bereitstellt Für strukturierte
Eingabeaufforderungen kehren wir zu unserem Beispiel für die
Weinklassifizierung
zurück Wir können dem Modell einen gewissen
Kontext geben, der
angibt, wie das
Modell reagieren soll Wir können dem Modell auch mehrere
Beispiele geben. Diese Beispiele helfen dem Modell zu verstehen, wie eine angemessene Reaktion des
Modells aussieht. Wir haben auch unsere Einstellungen
auf der rechten Seite. Wir haben auch die Möglichkeit,
weitere Spalten für
komplexere Beispiele hinzuzufügen . Und um das Modell zu testen, geben
wir einen Input, sei es, indem wir ihn in
den Eingabebereich schreiben oder direkt
mit dem Modell sprechen. Und wenn ich auf Senden klicke, generiert
das Modell
eine Antwort für mich. Wir können jede
strukturierte Aufforderung problemlos in eine freie Form umwandeln. Und so sieht es aus. Sie können wählen, ob Sie einen Text- oder
Code-Chat
initiieren möchten, um eine
Konversation mit dem Model zu beginnen. Sie können Kontext
und Beispiele für
Interaktionen angeben , um die Konversation weiter zu
lenken. Alle Einstellungen für die Modellkonfiguration sind auch hier
verfügbar. Versuchen wir es jetzt mit einer Chat-Aufforderung. In der Chat-Eingabeaufforderung haben wir
die Möglichkeit, dem Modell einen
Kontext zu geben
, der es darüber informiert,
wie es reagieren soll Wir können auch
Beispiele angeben, damit das Modell versteht, wie eine angemessene Antwort aussehen
würde Wenn der
Benutzer dies beispielsweise sagt, sollte
das Modell dies sagen. Wir haben auch die Möglichkeit, weitere Beispiele für
das Modell
bereitzustellen. Nachdem wir genügend
Kontext und Beispiele bereitgestellt
haben, können wir
mit dem Agenten chatten. Wenn Sie also fragen, wie viele Planeten es im Sonnensystem
gibt, liefert
das Modell eine
angemessene Antwort. In ähnlicher Weise können wir
andere Fragen stellen, und das Modell liefert immer wieder angemessene und
genaue Antworten, die mit den von uns angegebenen
Beispielen
übereinstimmen. Sehen wir uns nun an, wie wir mithilfe
unserer eigenen Datenbank
ein optimiertes Modell erstellen können . Wir haben die Möglichkeit
, ein Modell
so zu optimieren , dass es
für unsere Anwendungsfälle besser gerüstet ist. Schauen wir es uns an. Hier können
wir also unseren
JSON-Datensatz auswählen und einen Speicherort für
den Datensatz in der Cloud
festlegen. Nachdem wir den Datensatz bereitgestellt
haben, können wir die Modelldetails optimieren, und danach
können wir das Modell auf der
Grundlage unseres Datensatzes
und unserer Einstellungen optimieren . Um zu entscheiden,
welches Modell für unsere spezifischen Anwendungsfälle am besten geeignet ist, können
wir uns die
Google-Bibliothek mit Basismodellen ansehen, die
in Model Garden verfügbar ist. In Model Garden können Sie Modelle nach Modalität,
Aufgabe und anderen Funktionen
untersuchen ,
Aufgabe und anderen Funktionen Ihnen viele verschiedene einsatzbereite Modelle, Model Garden bietet Ihnen viele verschiedene
einsatzbereite Modelle, sodass
Sie
je nach Anwendungsfall, Ihrer Expertise im Bereich
maschinelles Lernen
und
Ihrem verfügbaren Budget das am besten geeignete Modell auswählen je nach Anwendungsfall, Ihrer Expertise im Bereich
maschinelles Lernen
und
Ihrem verfügbaren Budget das am besten geeignete Modell Expertise im Bereich
maschinelles Lernen
und
Ihrem verfügbaren Budget Okay, Zeit,
sich die Sprachmodelle anzusehen. Jetzt ist es an der Zeit,
die Sprachmodelle zu untersuchen. Wir können die Sprache
entweder aus dem Menü auf
der linken Seite oder durch Klicken auf
Öffnen unter dem Sprachfeld auswählen . Hier haben wir zwei
verschiedene Optionen Text zu einer Rede
oder Sprache zu Text. Gehen wir zu Text-to-Speech. Hier können wir entweder
den Text bereitstellen oder direkt
mit dem Modell sprechen. Nachdem wir den Text bereitgestellt haben, haben
wir einige Optionen, um
verschiedene Sprachen auszuwählen oder
die Sprachgeschwindigkeit festzulegen. Wenn alles gut aussieht, können
wir auf Senden klicken. Und jetzt haben wir eine synthetisierte KI-Stimme, die diesen Text für uns lesen
kann Das Erstellen einer App ist
so einfach wie
das Öffnen des generativen KI-Studios
im Vertex AI-Bereich
der Google Cloud Wählen Sie die Modalität aus, mit der
Sie arbeiten möchten, und wählen Sie Ihr bevorzugtes Format Für erweiterte Funktionen
wie die Unterstützung längerer Audiodaten können
wir Speech Studio verwenden ,
und so sieht die
Umgebung aus Wir haben auch Sprache-to-Text. Hier können wir entweder
eine Audiodatei hochladen oder unsere eigene Stimme
aufnehmen. Und nachdem wir dem Modell die
Sprache gegeben
haben, können wir sehen, dass es daraus Text
macht. Jetzt habe ich meine
Stimme aufgenommen und auf
Senden geklickt . Und hier ist meine
Rede in Text umgewandelt. Wir können das
Speechs-Studio auch für
Speech-to-Text-Anwendungen verwenden . Beide Funktionen,
Speech-to-Text und
Text-to-Speech , sind
im Sprachstudio verfügbar. Nachdem Sie
Ihr Modell angepasst
haben , stehen Ihnen einige Optionen zur Verfügung. Sie können die Aufforderung in der
Eingabeaufforderungsgalerie speichern. Sie können die Lösung auch auf der Plattform
für
maschinelles Lernen von
Vertex AI für Produktion und Verwaltung einsetzen Plattform
für
maschinelles Lernen von
Vertex AI für Produktion und Verwaltung Oder Sie können
Ihre neu optimierten Modelle direkt
in Ihre Website
und Anwendungen implementieren Ihre neu optimierten Modelle direkt in Ihre Website
und Anwendungen Zusammenfassend lässt sich sagen, dass
wir über das Generative AI-Studio von Vertex
AI auf Sprach-, Seh
- und Sprachmodelle zugreifen können - und Sprachmodelle Mithilfe von Sprachmodellen sind
wir in der Lage, generative
KI-Sprachmodelle zu testen , zu
optimieren und einzusetzen Wir können auch auf
die Palm- oder Cody-API
für Inhaltsgenerierung,
Chat, Zusammenfassung,
Code und mehr zugreifen die Palm- oder Cody-API
für Inhaltsgenerierung, Chat, Zusammenfassung,
Code und Mit Vision-Modellen können
wir mithilfe
der Imagine-API
Textanweisungen schreiben , um
neue Bilder zu generieren , um
neue Bilder Wir können auch neue
Bereiche für ein vorhandenes Bild generieren. Und mit Sprachmodellen können
wir Sprache mithilfe der Chirp-API in
Text umwandeln Wir können auch
Sprache aus
Text synthetisieren , indem wir das Universal
Speech Model oder USM von Google verwenden Damit ist dieses Video über
generative Va Studio
auf Vertex AI
20. Demo- App-Blatt-Demo: In unserem
Einführungsvideo zu Apsheet
haben wir gesehen, dass wir mit
Apsheet benutzerdefinierte Apps
erstellen können ,
ohne Vor Kurzem hat Google
GNAI-Funktionen hinzugefügt, denen wir
direkt erklären können , welche
Art von App wir benötigen erstellt Grundlage
dieser
Erklärung wird uns
eine Starter-App Wir können die Starter-App dann nur noch weiter
modifizieren und anpassen , indem wir mit Apheet
chatten Betrachten wir das
folgende Beispiel. Anne Gray ist
Managerin in einem Unternehmen und eine
ihrer Aufgaben besteht darin
, die
Reiseanfragen ihrer Mitarbeiter Diese Anfragen können aus E-Mails,
Chats oder Besprechungen
stammen , was ziemlich
überwältigend sein kann Sie fragt sich, ob die
generative KI-Funktion in Apsheet
ihr helfen kann, ihre
Abläufe zu rationalisieren , indem sie eine
Lösung für die Genehmigung und
Nachverfolgung Um es auszuprobieren,
beschließt sie,
die Apsheet-Chat-App zu erkunden , die auf Google Chat
verfügbar ist Mal sehen, wie es funktioniert. Um auf
diese Chat-Funktion zuzugreifen, gehen
wir zu chat.google.com Dann wählen wir Apps entdecken
und suchen die Apshet-Chat-App. Lassen Sie uns nun sehen, wie der Prozess aus
Anns Sicht aussehen
würde Auf der ersten Seite können wir sehen, dass Apsheet
den Benutzer begrüßt und ihn
auffordert, eine Beschreibung einer App oder
eines
Geschäftsproblems
einzureichen , das er lösen möchte Zum Beispiel durch die
Beschreibung eines Workflows. diesem Zweck
beschreibt An kurz , was sie
benötigt — etwas, um den Prozess für Manager zu vereinfachen Reiseanfragen
entgegenzunehmen und zu genehmigen Sie ergänzt die Beschreibung, indem sie notiert, welche Art
von Daten sie auch im Auge behalten muss.
Nach Eingabe der Aufforderung antwortet
Ushid mit einem
allgemeinen App-Schema Von Anns erster Aufforderung an hat
Upshd erkannt, dass die App über
einen Genehmigungsablauf verfügen sollte, und bittet sie, auszuwählen, wie
die Benachrichtigungen zur Genehmigungsanfrage gesendet werden sollen Wie wir sehen können,
stehen hier verschiedene Optionen zur Verfügung, wobei vorerst
nur E-Mail ausgewählt wird Als Nächstes schlägt
Apshet einige Bildschirme vor, sie vielleicht hinzufügen möchte, ein Formular, über das Benutzer neue Anfragen
einreichen können, eine Reiseübersicht, bevorstehende Reisen und
einige andere Ansichten Diese Bildschirme sind im Grunde das Rückgrat von
Annes App-Schema Es beschreibt, worum es in ihrer
App geht. Sie möchte keinen M
Travel-Bildschirm in ihrer App haben,
also deaktiviert sie ihn, um ihn aus der App zu entfernen,
und klickt dann auf App Apsheet nun
weiß, was für Ann's
Travel Request App
zusammengestellt werden muss, bestätigt
es die Tabellen, die in der
Apsheet-Datenbank erstellt werden
könnten Diese Datensätze werden auf
der Grundlage der Bildschirme oder App-Ansichten
erstellt , die sie Upsheet erstellt zwei Tabellen zur
Unterstützung von Schema, Travel und Team Wir haben noch keine
Daten in unsere App eingegeben, daher
werden all diese Tabellen leer sein Wenn wir keine
Daten in der App haben, wie können wir
dann testen,
ob alles funktioniert? Daran dachte ich auch verärgert. Nach dem Erstellen der Tabellen bietet
Upseet die Möglichkeit, Beispieldaten in die App
aufzunehmen Anne ist bereit, die
App zu testen, also entscheidet sie sich für Ja. Und schließlich fordert apseet
Anne auf, einen
Namen für ihre App zu wählen A nennt dieses Symbol
Reisen, und das war's. nächste Antwort von
Apshet ist ein Link zu einer voll funktionsfähigen Vorschau der App, die gerade erstellt
wurde wir eine Pause und schauen wir zurück auf das, was
wir bisher getan haben Durch nur ein paar Fragen
und Antworten war
apseet in der Lage, Anns Anfrage,
die in
natürlicher Sprache verfasst war, zu beantworten, und ich habe
verschiedene Lösungen empfohlen, einschließlich der Bildschirme, die ihre App-Nutzer sehen müssen Die Dinge, die sie tun müssen, und der Ort, an dem die
Daten gespeichert werden sollen Es wurde sogar die
E-Mail-Benachrichtigung für Benutzer eingerichtet. Das Erstellen einer App in
natürlicher Sprache
ohne Codierung ist eine Magie, die
jetzt in App Sheet Realität ist Es ermöglicht vielen neuen
Benutzern,
Anwendungen schnell
und effizient zu entwickeln Anwendungen schnell
und Im weiteren Verlauf hat Anne die
Möglichkeit, entweder eine Vorschau der App anzuzeigen,
die für sie erstellt
wurde, oder zur Anpassung in den
Ashoot-Editor einzutauchen Sie entscheidet sich dafür, zuerst einen kurzen
Blick auf die Vorschau zu werfen. Während sie durch den
App-Emulator auf ihrem Desktop navigiert, erkundet
sie die von Apsis generierten Ansichten
, angefangen bei neuen Reisen über Reisen pro Benutzer bis hin zu bevorstehenden Reisen In dieser letzten Ansicht werden
sowohl eine Karte als auch eine Liste
zukünftiger Reisen angezeigt , die alle mit
den Beispieldaten gefüllt sind, für die sie
sich zuvor entschieden hat Bisher scheint alles in Ordnung zu
sein. Ann bemerkt jedoch, dass eine Ansicht, die sie im Sinn hatte, in der App
fehlt. Sie hat eine besondere
Ergänzung im Sinn, nämlich einen Bildschirm, der
alle Reiseanfragen in
einem umfassenden Dashboard zusammenfasst der
alle Reiseanfragen in
einem umfassenden Dashboard dem Finanzteam
eine Antwort auf häufig gestellte Fragen
bietet eine Antwort auf häufig gestellte Fragen Wie hoch sind die Gesamtkosten für die Reisen der
einzelnen Mitarbeiter? Im Editor und bemerkt, dass die generative KI-Funktion, die sie zuvor
verwendet hat , auch hier
verfügbar ist. Sie tippt ihre Anfrage
für ein neues Dashboard ein, und in kürzester Zeit
nimmt Abscht ihre Anfrage entgegen, analysiert sie und schlägt die notwendigen Komponenten
für diese Sie schlägt eine neue berechnete
Spalte für ihre Teamtabelle und gibt eine Vorschau auf das Diagramm , das
die aggregierten Daten darstellen wird, genau wie sie es
zuvor getan hat, und möchte jeden Teil der vorgeschlagenen
Änderungen überprüfen Also schaut sie sich das Vorschaudiagramm an.
Und es sieht gut aus. Dann überprüft sie die neue Spalte in der Datenbank, um sicherzustellen, dass
alles in Ordnung ist Sie verwendet den
bereitgestellten Link, um
die vorgeschlagene Änderung in der Genehmigungstabelle in
der ASHEET-Datenbank zu sehen die vorgeschlagene Änderung in der Genehmigungstabelle in der ASHEET-Datenbank wirft einen kurzen Blick auf die
Zahlen und bestätigt, dass die neue Ansicht und die
Datenänderungen ihren Erwartungen entsprechen Sie genehmigt die Änderungen
im Apsheet-Editor
und das war's Ihre App ist jetzt live und
einsatzbereit und sie hat das Gefühl, dass sie das
hat, was sie braucht Ihr Vertrauen in die Tabellen und Spalten, die Apseet für sie
geschaffen hat, ist hoch Da sie mit der
Funktionalität ihrer App zufrieden ist, sie die Beispieldaten,
stellt die App bereit und
gibt sie an ihr Team Jetzt kann ihr Team
diese verbesserte Version
der App sehen und damit beginnen,
ihre Reiseanfragen einzureichen Ein paar Wochen später,
während Anne im Intranet ihres Unternehmens einem bestimmten Formular sucht, kommt ihr eine
Idee Anne geht zurück zum Herausgeber. weiß, wie oft ihr
Team Google Chat verwendet, erwägt
sie, die Apsheet-Chat-App
ohne Code zu nutzen Auf diese Weise könnte
ihr Team
das erforderliche Formular einfach per
Chat mit Symbol Travel abrufen das erforderliche Formular einfach per
Chat mit Anne geht zurück zum
Editor und aktiviert Symbol Travel als Chat-App für die internen Bereiche ihrer Domains Dieser Schritt ermöglicht es
Annes Kollegen ,
ihren Google-Chatbereichen,
Gruppenchats oder sogar
privaten Konversationen symbolische Reisen hinzuzufügen . Jetzt ist es an der Zeit, die Einstellungen durchzugehen
. Standardmäßig
zeigt die Symbol
Travel Chat App den Benutzern eine Liste aller zugänglichen
App-Ansichten an. Anne entwickelt diese
Chat-Version jedoch speziell
für Endbenutzer. Die Mitarbeiter, die die App
hauptsächlich verwenden
möchten , um Reiseanfragen
einzureichen. Sie wählt nur die für ihre Benutzer erforderlichen
App-Ansichten aus, was bedeutet, dass sie
alles außer Anfrageformularen löschen muss . Als Nächstes fügt sie eine
Willkommensnachricht für ihre Benutzer hinzu, die einen gewissen Kontext zur
Interaktion
mit dem Chat bietet . Sie beschließt,
einen Slash-Befehl einzufügen. Durch das Hinzufügen dieses Befehls öffnet die Chat-App
jedes Mal, wenn ein Benutzer den Schrägstrich NETRIP sofort das
Reiseantragsformular Aphit bietet auch einen
intelligenten Suchbefehl. Dieser Befehl würde es
ihren Teamkollegen ermöglichen, die Pipeline zur
Verarbeitung natürlicher Sprache von
Aphts zu verwenden Pipeline zur
Verarbeitung natürlicher Sprache von
Aphts ihre App
nach Daten oder Ansichten
zu durchsuchen Sie entscheidet sich jedoch dafür, die Dinge
einfach zu halten und deaktiviert den Ihre letzte Aufgabe besteht darin, eine Automatisierung
einzurichten, Benutzer
benachrichtigt werden, wenn sich der Status ihrer Reisegenehmigung ändert Auf dieser Seite können Sie mithilfe
einer grafischen Oberfläche
den richtigen Ablauf erstellen . Auf diese Weise kann sie
die Grundlage für die
erforderliche Automatisierung schaffen die Grundlage für die
erforderliche Automatisierung Sobald sie fertig ist,
benennt sie ihre Automatisierung, optimiert einige Details
darüber, wann sie ausgeführt werden
soll und wie Antworten Threads zusammengefasst werden
sollen, und kehrt zum Chat-App-Builder zurück,
um die Dinge abzuschließen Dank Apshts ohne Code wird die
Chat-App bereitgestellt
und sie muss sich nicht um
weitere Konfigurationen
kümmern, damit ihre App oder deren
Automatisierung Upshet kümmert sich
mit einem einzigen die
gesamte Konfiguration der Google
Cloud-Plattform Klick um die
gesamte Konfiguration der Google
Cloud-Plattform
hinter den Kulissen Jetzt ist sie
bereit, ihre
Chat-App mit dem Team zu teilen .
Und da ist es. Die Chat-App ist jetzt
live und kann von
ihrer gesamten Organisation installiert und verwendet werden. Nehmen wir nun an, Jeffrey Clark, ein Mitglied von Anns Team,
beschließt, die App zu verwenden Jeffrey benötigt eine Genehmigung für seine Reisepläne, um die Räumlichkeiten
des Kunden zu besuchen Er hat
die Symbol Travel Chat App bereits installiert und schreibt
daher den Schrägstrich
New Trip Command, schreibt
daher den Schrägstrich
New Trip Command um das
Reiseantragsformular aufzurufen Jeffrey gibt alle
notwendigen Details zu seiner bevorstehenden Reise in
das Formular ein und klickt auf Senden Von Annes Seite aus kann sie sehen, dass Jeffreys Anfrage fast augenblicklich
auftaucht Die neue
Genehmigungsanfrage löst eine E-Mail-Benachrichtigung an
Marcus Jeffreys Manager Marcus erhält eine E-Mail mit Einzelheiten zu Jeffreys Nachdem er die
Einzelheiten der Einreichung geprüft hat, genehmigt
Marcus das Formular direkt
von seinem
Gmail-Konto aus Innerhalb weniger Sekunden bemerkt
Jeffrey eine
Chat-Benachrichtigung von Symbol Travel Die Nachricht ist die Bestätigung der
Reisegenehmigung. Herzlichen Glückwunsch Jeffrey
und gute Reise. Abschließend haben wir
die Leistungsfähigkeit der
generativen KI-Funktion von App Sheets gesehen die Leistungsfähigkeit der
generativen KI-Funktion von App Sheets Es half Ann, eine Lösung
für die Verwaltung der Reiseanfrage
ihres Teams in natürlicher
Sprache und ohne Code zu entwickeln und
anzupassen Reiseanfrage
ihres Teams . An hat
eine geschäftliche Herausforderung effizient gelöst und eine
App für
Reiseanfragen entwickelt, die genau auf die Bedürfnisse ihres Teams zugeschnitten ist. Die nahtlose Integration mit Google Chat und der
reibungslose Ablauf, der sich in
Jeffreys Reiseanfrage und der schnellen
Genehmigung von
Marcus zeigt Jeffreys Reiseanfrage und , unterstreichen die Zugänglichkeit
und Effizienz der Plattform Das ist die Stärke von
No-Code-Entwicklung. APSheetsGenerative KI revolutioniert die
No-Code-Entwicklung und macht sie zugänglich,
effizient und intuitiv