Transkripte
1. Prod-Ready-Promo: Was wäre, wenn ich Ihnen sagen würde: Anstatt Zehntausende von Dollar
auszugeben jemand die
Fragen
Ihrer Kunden 8 Stunden am Tag,
fünf Tage die Woche,
in der nächsten 1 Stunde beantwortet Fragen
Ihrer Kunden 8 Stunden am Tag, , könnten
Sie lernen, wie
man einen Chatbot baut der die Leistungsfähigkeit großer
Sprachmodelle
nutzt, um dasselbe mit höherer Genauigkeit zu
tun, und zwar 24 Stunden am Tag, sieben Tage die Woche,
365 Tage Ich bin Professor Reza und
unterrichte Studenten und
Doktoranden
Themen zu Informatik und
künstlicher Intelligenz. Ich habe auch Tausende von Online-Studenten, die über KI forschen, und ich habe mit
renommierten Instituten
wie DEM MIT Media Lab, der
Carnegienon University, der
Harvard University
und der University of California in San Diego zusammengearbeitet renommierten Instituten
wie DEM MIT Media Lab, der
Carnegienon University, der
Harvard University
und der University of California in San und Und diese Werke
wurden an
Orten wie
ACM und Spring Nature veröffentlicht Orten wie
ACM Ich werde all
diese Erfahrungen und alles
andere, was ich
bisher gelernt habe, nutzen diese Erfahrungen und alles
andere, was ich
bisher gelernt habe, , um Ihnen zu zeigen, wie
Sie mithilfe umfangreicher
Sprachmodelle
einen
Kundenservice-Chatspot erstellen können, der
Ihnen hilft, die Fragen
Ihrer Kunden zu einen
Kundenservice-Chatspot erstellen können, der
Ihnen hilft, jeder Tageszeit zu beantworten jeder Tageszeit In der nächsten Stunde werden wir uns damit
befassen, was große
Sprachmodelle sind, und wir werden über viele
verschiedene Themen
sprechen , die
damit zusammenhängen, wie PNetEngineering und Ethik der Verwendung großer Sprachmodelle. Ich werde über
verschiedene Plattformen sprechen , die für
jeden Anwendungsentwickler
oder jeden, der
lernen möchte, wie man
Anwendungen mit
großen Sprachmodellen entwickelt, sehr nützlich sein jeden Anwendungsentwickler
oder jeden, der
lernen möchte, wie man
Anwendungen mit
großen Sprachmodellen entwickelt, Anwendungen mit
großen Sprachmodellen Wir werden
über Plattformen wie
Hugging Face und Technologien
wie Hugging Face und Technologien Radio zur Erstellung einfacher
Benutzeroberflächen für Python-Programme Und ich begleite Sie
bei allen Schritten zur
Erstellung eines LLM-basierten
Chatbots, der Daten aus Ihren
Geschäftsdokumenten
abrufen und
alle Fragen Ihrer Kunden beantworten kann Daten aus Ihren
Geschäftsdokumenten
abrufen und
alle Fragen Ihrer Kunden beantworten alle Fragen .
Interessieren Sie sich dafür? Also begleite mich im nächsten Video
und ich werde dir sagen, wie.
2. Lesson1Video1- LLMs Vorteile und Anwendungen: In diesem Video werden
wir untersuchen, was große Sprachmodelle
sind Am Ende dieses Videos werden
Sie die wichtigsten Funktionen
und Vorteile von LLMs
sowie einige
bemerkenswerte Anwendungen kennenlernen sowie einige
bemerkenswerte Anwendungen LLMs sind eine Art
Deep-Learning-Modell, das auf riesigen
Texturdatensätzen abgebildet wird Dann sind sie genau auf bestimmte Aufgaben abgestimmt
. Sie werden aufgrund
zweier ihrer
Hauptmerkmale als groß bezeichnet . Zum einen werden sie anhand
enormer Datenmengen
in der Größenordnung von Ptabtes trainiert enormer Datenmengen
in der Größenordnung von Ptabtes Dadurch verfügen sie über ein breites
Sprachwissen. Und zweitens haben sie eine
Vielzahl von Parametern. Wir sprechen von
Billionen von Parametern. Dadurch verfügen sie über ausgeprägte
Argumentationsfähigkeiten, einschließlich
Sprachverständnis und Sprachgenerierung Kurz gesagt, ihr
umfangreiches Vortraining,
ergänzt durch eine umfangreiches Vortraining,
ergänzt durch aufgabenspezifische
Feinabstimmung, macht sie zu unglaublich vielseitigen und
leistungsstarken KI-Systemen LLMs durchlaufen zwei Hauptphasen. einen Phase vor
dem Training nimmt das Modell riesige, unterschiedliche Datensätze wie
Wikipedia oder Common Crawl
auf, um ein umfassendes
Sprachverständnis aufzubauen Zwei Feinabstimmungen. Das vorab trainierte Modell
wird dann mithilfe
kleinerer
feldspezifischer Datensätze für spezifische Anwendungen angepasst mithilfe
kleinerer
feldspezifischer Datensätze für spezifische Anwendungen kleinerer
feldspezifischer Datensätze für spezifische Dieser Twister-Prozess ermöglicht es LLMs, sowohl
Fachwissen aus
ihrer allgemeinen Vorschulung
als auch spezielle Präzision
aus ihrer Feinabstimmung zu gewinnen ihrer allgemeinen Vorschulung
als auch spezielle Präzision aus ihrer Lassen Sie uns nun einige
der wichtigsten Vorteile und
Funktionen von LLMs untersuchen der wichtigsten Vorteile und
Funktionen von LLMs Erstens können sie
nuancierte Sprachen verstehen und
bemerkenswert menschenähnliche Texte erstellen bemerkenswert menschenähnliche Texte Zweitens zeichnen sie sich durch
Aufgaben wie Übersetzung,
Zusammenfassung, Stimmungsanalyse und Beantwortung von Fragen aus. Drittens können sie nur dann auf
bestimmte Aufgaben abgestimmt
werden , wenn sie anhand eines kleinen
Datensatzes trainiert Viertens werden sie durch
mehr Daten und
größere Modellgrößen besser . Und fünftens machen
sie KI durch ihre
generativen Fähigkeiten auch
für Personen mit begrenztem
technischem Wissen zugänglicher . LLMs sind die neuen Triebwerke , die
verschiedene Branchen verändern können Schauen wir uns einige Beispiele an. Im Gesundheitswesen
können sie verwendet werden, um Erkenntnisse aus Krankenakten oder
Forschungsarbeiten Im Bildungswesen sind sie in der
Lage, Studierenden
personalisierte Nachhilfe und
Feedback zu bieten personalisierte Nachhilfe und
Feedback zu Im Finanzbereich können Sie LLMs verwenden, um Gewinnberichte zu
analysieren
und Markttrends vorherzusagen Und im Unterhaltungsbereich helfen uns
LLMs bei Generierung kreativer Inhalte
wie Geschichten oder Und nicht
zuletzt können
sie im Einzelhandel dazu verwendet
werden, Produkte auf der Grundlage von
Kundendaten und Bewertungen zu empfehlen Produkte auf der Grundlage von
Kundendaten und Da sich
LLMs ständig
weiterentwickeln, liegen viele spannende Möglichkeiten vor uns Ihre Vielseitigkeit ermöglicht bahnbrechende KI-Anwendungen
in verschiedenen Sektoren Zusammenfassend lässt sich sagen, dass große
Sprachmodelle eine Revolution der
KI-Fähigkeiten
darstellen Ihr umfangreiches
Vortraining, gefolgt von einer
speziellen Feinabstimmung verleiht ihnen außergewöhnliche
sprachliche Fähigkeiten Dies ermöglicht
transformative Auswirkungen auf Branchen, vom
Finanzwesen bis hin zum Bildungswesen Da diese Modelle immer leistungsfähiger
werden, sieht
die Zukunft für die
Demokratisierung der KI
durch vielseitige,
akzeptable
Großsprachmodelle vielversprechend Demokratisierung der KI
durch vielseitige, akzeptable
Großsprachmodelle
3. L1V2– Prompt Engineering verstehen: In diesem Video geht es um
Prompt Engineering, seine Rolle beim Einsatz von LLMs und darum, wie man Prompt
effektiv
und verantwortungsbewusst einsetzt wie man Prompt
effektiv
und Am Ende dieses Videos erfahren
Sie mehr über
die verschiedenen Arten von Eingabeaufforderungen und Methoden
zur Optimierung sowie Zunächst, was genau ist
Prompt Engineering? Es bezieht sich auf die
strategische Optimierung der Eingabeaufforderungen, die wir in KI-Systeme
einspeisen Wir tun dies mit dem Ziel, die Leistung
dieser Modelle zu verbessern Prompt Engineering verwendet
spezielle Techniken um möglichst genaue,
relevante und nützliche
Ergebnisse zu erzielen . Bei Prompt Engineering geht es darum unsere
Absicht klar zu
kommunizieren. Aufforderungen spielen eine entscheidende Rolle
bei der Gestaltung des Verhaltens eines
KI-Systems Wir können sie als Schnittstelle zwischen
uns und KI-Modellen betrachten,
die uns helfen, unsere Absichten
klar zu kommunizieren und dem Modell Anweisungen
zu geben Sie fragen sich vielleicht, warum schnelles
Engineering wichtig ist. Nun, ohne
strategische Unterstützung müssen
Modelle
mehrdeutige oder vage Anweisungen interpretieren Dies birgt die Gefahr, dass Ergebnisse nicht hilfreich oder
sogar gefährlich sind. Auf der anderen Seite ermöglichen
durchdachte
Eingabeaufforderungen eine
genauere Steuerung, um das volle Potenzial der KI
auszuschöpfen der KI
auszuschöpfen Möglicherweise haben Sie auch den Begriff
Prompt-Design gehört. Es gibt einen wichtigen
Unterschied zwischen Prompt-Design und
Prompt-Engineering. Prompt Design beinhaltet die
Anpassung von Eingabeaufforderungen an bestimmte Aufgaben wie
Übersetzung oder Zusammenfassung Prompt Engineering verwendet
spezielle Strategien , um die Leistung des
Modells zu optimieren Ich kann Techniken
wie Fachterminologie,
effektive Stichwörter,
Beispiele und
andere Techniken einbeziehen effektive Stichwörter,
Beispiele und , um
die Genauigkeit und
Relevanz des Modells zu erhöhen . Schauen wir uns nun einige
verschiedene Arten von Eingabeaufforderungen an. Aufforderung zur Eingabe von Anweisungen. Dies sind einfache Aufforderungen mit
Direktiven. Fassen Sie diesen Text beispielsweise kurz zusammen oder übersetzen Sie die
Passage ins Französische Es gibt auch eine Eingabeaufforderung nach Schlüsselwörtern, zu die
Verwendung hilfreicher Hinweise gehört Erläutern Sie zum Beispiel die wichtigsten Ereignisse in der
Reihenfolge ihres Auftretens Es gibt auch Domain-Prompting. Es verwendet
domänenspezifisches Wissen und
technische Terminologie Diagnostizieren Sie beispielsweise diesen medizinischen Fall anhand der
klinischen Sprache oder bewerten Sie diesen Rechtsvertrag anhand rechtlicher
Rahmenbedingungen und Bedingungen Wir bieten auch Rollenanweisungen an. Diese Art der Aufforderung weist das Model an, eine Persona anzunehmen Reagieren Sie beispielsweise als Experte in der Rolle
eines Wirtschaftswissenschaftlers. Gedankenkette, die zur Folge hat. Sie unterteilt eine komplexe Aufforderung in eine logische Reihe
von Aktionen oder Aufgaben Fassen Sie beispielsweise kurz die wichtigsten Punkte
des Artikels zusammen. Erläutern Sie dann die Perspektive des
Autors. Geben Sie abschließend Ihre
kritische Analyse an. Wir haben auch Shot-Prompting. Eingabeaufforderung bietet eine
kontextbezogene Einrichtung vor Wir haben null Schuss, ein Schuss und nur wenige Bei Zero Shot Prompting geben
wir keine Beispiele an Schreiben Sie zum Beispiel ein
kurzes Gedicht über die Natur. In einer kurzen Aufforderung wird ein Beispiel gegeben Hier ist zum Beispiel ein
kurzes Gedicht über Bäume, und dann stellen wir
ein kurzes Gedicht zur Verfügung Dann schreiben wir jetzt weiter ein
kurzes Gedicht über den Ozean. In Fus Shot Prompting werden
mehrere Beispiele bereitgestellt Hier sind zum Beispiel zwei
kurze Gedichte über das Wetter, und dann machen wir weiter und stellen dem Model zwei kurze
Gedichte zur Dann machen wir weiter. Schreiben Sie jetzt ein kurzes
Gedicht über Schnee. FusiaPmpting ist eine leistungsstarke Technik. LLMs sind ziemlich gut darin, Mustern zu folgen. Tatsächlich habe ich
eine Freundin, die Claude
mit ihren alten Gedichten versorgte
und sie bat, Gedichte in ihrem
eigenen, einzigartigen Stil zu schreiben Sie war davon ziemlich beeindruckt. Wenn Sie also KI auch für Poesie
verwenden
möchten, sollten Sie sich wahrscheinlich Claude
ansehen. Gutes Prompt-Engineering kann uns viel Macht
geben, und mit großer Leistung geht auch
große Verantwortung einher. Schauen wir uns also einige der verantwortungsvollen und
ethischen Praktiken im Bereich Prompt Engineering an. Berücksichtigen Sie mögliche Vorurteile
und Einschränkungen von LLMs. Validieren Sie risikoreiche Ergebnisse wie rechtliche oder
medizinische Informationen Diese sollten von Fachexperten validiert
werden. Stellen Sie sicher, dass Sie
vor der Bereitstellung
sorgfältig iterieren, um die Eingabeaufforderungen zu optimieren Wir möchten eine App nicht in die
Produktionsphase bringen, bevor wir sie ordnungsgemäß
getestet Prompt
Engineering hat
natürlich seine eigenen Einschränkungen. Schauen wir uns an, was einige
dieser Einschränkungen sind. Erstens
ist schnelles Engineering kein Allheilmittel. Es kann uns beispielsweise nicht
vor
allen unvorhersehbaren
Modellverhaltensweisen schützen , die immer noch auftreten können. Zweitens könnten
einige Aufgaben selbst mit
der besten Aufforderung die
Möglichkeiten des Modells übersteigen Wir sollten uns auch daran erinnern,
dass , um die Eingabeaufforderung zu optimieren wir das Modell verstehen Es ist sehr schwierig,
ein effizientes Modell zu entwickeln ,
wenn wir nicht wissen, wie das Modell funktioniert und welche Art von Aufforderung für dieses Modell
besser funktioniert. Und nicht zuletzt müssen die Ergebnisse unabhängig davon, wie gut
ausgeklügelt unsere Eingabeaufforderungen sind, immer noch einer
abschließenden menschlichen Validierung unterzogen werden,
insbesondere in Bereichen, in denen viel auf dem
Spiel steht Zusammenfassend lässt sich sagen, dass uns das strategische
Prompt-Engineering ermöglicht,
KI-Systeme besser zu steuern und ihr Potenzial auszuschöpfen, während wir gleichzeitig
verantwortungsbewusst sowohl die
Leistungsfähigkeit als auch die Grenzen von
Prompt Engineering anerkennen,
können wir
effektiv, verantwortungsbewusst
und Prompt Engineering anerkennen,
können wir effektiv, verantwortungsbewusst
4. L1V3– Wie LLMs eingesetzt werden: In diesem Video werden wir untersuchen, wie große
Sprachmodelle Am Ende dieses Videos erfahren
Sie, wie sich die
LLM-Entwicklung vom herkömmlichen
maschinellen Lernen
unterscheidet Untersuchen Sie die drei
verschiedenen Arten von LLMs
und besprechen Sie das Konzept der
Gedankenkette, und besprechen Sie das Konzept der
Gedankenkette um bessere LLM-Aufforderungen zu
entwerfen Okay, lassen Sie uns tiefer eintauchen. Herkömmliches maschinelles Lernen erfordert umfangreiches
technisches Fachwissen, umfangreiche Trainingsdaten,
komplexes Modelltraining und einige Hardwarekenntnisse für die Verwaltung von
Rechenressourcen. LLM-Entwicklung konzentriert sich stattdessen auf die Erstellung effektiver Eingabeaufforderungen, ohne dass technische Der Schwerpunkt liegt eher auf klaren, präzisen und informativen
Anweisungen als den Details und Nuancen des Modelldesigns und der
Schulung Es gibt drei
Hauptkategorien von LLMs, die auf
ihrer Funktionalität basieren:
generisch, befehlsspezifisch und
dialektspezifisch Generische Sprachmodelle. Diese Modelle sagen
die nachfolgenden Wörter
wie eine automatische Vervollständigungsfunktion voraus wie eine automatische Vervollständigungsfunktion Ihre Vorhersagen
basieren ausschließlich auf sprachlichen Mustern, die sie in ihren Trainingsdaten
finden Modelle, die auf Befehle abgestimmt sind,
generieren Antworten auf der
Grundlage spezifischer Anweisungen die in die Eingabeaufforderungen
eingebettet Sie können Gedichte zusammenfassen, Gedichte
verfassen, Stimmungen
analysieren
und vieles mehr Modelle, die auf Dialekte abgestimmt sind,
sind spezielle Untergruppen von LLMs, die sich auf
Konversationsinteraktionen konzentrieren, was wir Das ist die Art von LLM, die
ich in diesem Kurs vorführen wollte Ein interessantes Konzept im LLM ist das
Denken in der Kette Beim Gedankenkettendenken generiert
das Modell eine Argumentationskette, bevor es zu
einem Abschluss kommt Es ähnelt der Art und Weise, wie wir ein Problem
in kleinere Teile
zerlegen , um es besser
zu verstehen Um eine bessere Vorstellung zu bekommen, fragen
wir Chat GPT nach einem
Beispiel Also habe ich CHAT
GPT gefragt. Nennen Sie mir ein Beispiel dafür
, wie ein LLM eine komplexe Aufforderung
mithilfe von
Gedankenketten
verarbeiten kann eine komplexe Aufforderung
mithilfe von
Gedankenketten
verarbeiten mithilfe von
Gedankenketten Dies ist die Antwort
, die es gegeben hat. Die Aufforderung lautet also, stellen Sie sich eine Stadt vor, in der alle Gebäude aus
transparentem Material
bestehen. Wie würde sich dies auf das
Leben der dort lebenden Menschen,
den Energieverbrauch
der Gebäude
und die gesamte Stadtgestaltung auswirken den Energieverbrauch
der Gebäude ? Das würde also im Hintergrund
passieren. Das LLM würde
das Problem in
kleinere Teile zerlegen und versuchen , es aus einer
anderen Perspektive zu betrachten In diesem Beispiel
könnte es sich um die Beziehung zwischen transparenten Gebäuden
und Privatsphäre oder Licht und Energieverbrauch oder Ästhetik und
städtischer Atmosphäre oder Sicherheit handeln Nach Berücksichtigung
all dieser Perspektiven geht
das Modell also weiter und
liefert eine endgültige Antwort. In diesem Beispiel
unterteilt das
LLM die Aufforderung in verschiedene Aspekte, z. B. Datenschutz, Energieverbrauch,
Ästhetik und Sicherheit Anschließend analysiert es die Auswirkungen auf die Menschen und die
Stadtgestaltung für jeden Aspekt
und kombiniert schließlich
all diese Informationen, und kombiniert schließlich
all diese Informationen um eine
umfassende Antwort Schauen wir uns nun einige wichtige Überlegungen zur
Erstellung effektiver LLM-Eingabeaufforderungen Erstellung effektiver LLM-Eingabeaufforderungen Frame-Eingabeaufforderungen als klare,
präzise Anweisungen , die auf das Modell zugeschnitten sind. Nutzen Sie die
Stärken und Grenzen des Modells. Beginnen Sie mit einfachen Eingabeaufforderungen, erhöhen Sie die
Komplexität schrittweise und experimentieren Sie weiter, um
optimale Formulierungen und
Strukturen zu erlernen , die besser funktionieren Zusammenfassend lässt sich sagen, dass sich die
LLM-Entwicklung vom
herkömmlichen
maschinellen Lernen dadurch unterscheidet , dass
gut gestaltete Eingabeaufforderungen Vorrang vor gut gestaltete LLMs gibt es in drei
Hauptvarianten:
generisch, anweisungsgesteuert und dialektgesteuert Und es ist wichtig zu wissen, dass Konzepte wie die logische Argumentation die Fähigkeit
von LLM
verbessern,
genauere und
kohärentere Antworten
zu generieren , indem die einzelnen Schritte
eines Problems oder Arguments
systematisch
durchgearbeitet eines
5. L1V4- Was produktionsbereit bedeutet: In diesem Video werden wir
die kritischen Komponenten
für die Entwicklung einer
produktionsbereiten LLM-basierten Anwendung untersuchen ,
einer Anwendung mit echter Zuverlässigkeit
und Skalierbarkeit Am Ende dieses Videos erfahren
Sie mehr über
Anwendungsleistung, Skalierung, Zuverlässigkeit
und Sicherheit Die Bereitstellung von LLM-gestützten Apps erfordert mehr als
nur die KI selbst Um
produktionsreife LLM-Anwendungen zu entwickeln, sind
bestimmte Schlüsselpraktiken Erstens
muss die Anwendung effizient sein. Das bedeutet, dass sie den Verkehr
und die Nutzung in der
realen Welt bewältigen kann , ohne dass sie
langsamer wird oder abstürzt frühzeitiger Stresstest der
App hilft uns dabei, hohe Auslastung zu
simulieren und
Leistungsengpässe zu finden Zweitens geht es um Skalierbarkeit. Die Infrastruktur
sollte je nach Bedarf automatisch
nach oben
oder unten skaliert werden. Die Verwendung von Cloud-Hosting und Containern ermöglicht eine schnelle
Skalierung von Anwendungen. Drittens muss die App
zuverlässig und stabil sein. Es sollten gründliche
Tests durchgeführt werden, um Moore zu erkennen, Produktion
sollte überwacht werden, um Abstürze nachzuverfolgen Ein robustes Fehlerbehandlungssystem stellt sicher, dass die App alle Fehler ordnungsgemäß
behandelt Viertens die einfache
Bereitstellung und Aktualisierung. Automatisierte Pipelines
ermöglichen beispielsweise schnelle und
wiederholbare Fünftens ist die betriebliche Transparenz. Das können wir durch
Metriken und Protokollierung erreichen. Diese Protokolle geben uns
Einblick in Nutzungsmuster und Fehler. Und schließlich ist Sicherheit ein Muss. Daten sollten verschlüsselt
und zugriffskontrolliert sein. Tests wie
Schwachstellentests identifizieren Risiken und Schutzmaßnahmen wie
Ratenbegrenzung schützen vor Angriffen Die
Hugging-Phase-Plattform bietet viele dieser Funktionen sofort
einsatzbereit und
erleichtert so die Entwicklung
produktionsreifer Anwendungen Hugging Face-Modelle sind im Hinblick auf Leistung und
Skalierbarkeit optimiert Die Inferenz-API bewältigt
Datenverkehrsspitzen problemlos und Sicherheitsfunktionen wie
Authentifizierung
und Authentifizierung Und aus diesem Grund haben wir die Demo für Discourse
auf
Hugging Pase laufen lassen Demo für Discourse
auf
Hugging Zusammenfassend lässt sich sagen, dass
die Befolgung der besten
Bereitstellungspraktiken zu einer LLM-gestützten Anwendung führt ,
die effizient,
skalierbar, zuverlässig, bereitstellbar,
beobachtbar und sicher ist skalierbar, zuverlässig, bereitstellbar,
beobachtbar Dies erfordert zwar zusätzlichen
technischen Aufwand, ist
aber für die tatsächliche Produktionsreife unerlässlich
. Und mit sorgfältiger Technik und Plattformen wie Hugging Face ist die
produktionsreife KI
6. L2V1– Sich mit der HuggingFace-Plattform vertraut machen: In diesem Video werde ich über die Hugging
Face-Plattform sprechen Hugging Face ist eine
Community wie Github, aber Ihr bemerkenswertestes Produkt
ist die Transformers-Bibliothek. Diese Bibliotheken bieten viele verschiedene Funktionen
wie Klassifizierung, Übersetzung und Beantwortung von
Fragen. Es gibt auch viele von Benutzern bereitgestellte Modelle, die für die Bild-,
Video- und Tongenerierung verwendet werden
können . Hugging Face ist eine
Open-Source-Plattform,
was bedeutet, dass Entwickler
aus der ganzen Welt zu diesen
Modellen und Datensätzen beitragen und
all diese neuen KI-Technologien, verbessern können die jetzt verfügbar sind
, Mit diesem Ansatz senkt Huggingface
die Markteintrittsbarriere
für die Entwicklung intelligenter Anwendungen für Hugging Face besteht also aus drei verschiedenen
Komponenten, die zwar unterschiedlich, aber auch miteinander verbunden sind Wir haben also Modelle. Wir haben
Datensätze und wir haben Leerzeichen Schauen wir uns Modelle an. Bei diesen Modellen handelt
es sich also um vorab trainierte Modelle für maschinelles Lernen
und umfangreiche Sprachen, die Benutzer
in ihren eigenen Arbeitsbereich klonen und dort anpassen
oder sogar verbessern können. Es gibt auch ein Repository
mit Datensätzen, das für
das Training und die
Bewertung der Modelle verwendet wird Benutzer können auch Beiträge leisten und ihre eigenen Datensätze
zur Plattform
hinzufügen Wir haben Spaces, die relativ neue Ergänzung zur Hugging
Face-Plattform Mithilfe von Spaces können Benutzer interaktive
Webanwendungen erstellen, teilen und erkunden Diese Bereiche bieten die
Möglichkeit, in
Echtzeit mit den Modellen zu interagieren , die auf Hugging Face verfügbar sind Und ähnlich wie bei den Modellen können
Sie jeden
dieser Bereiche klonen und nach Belieben anpassen oder verbessern Einen Workspace auf
Huggingface zu erstellen ist ziemlich einfach. Du
musst also nur eine Anmeldung erstellen und dann können
wir mit einer E-Mail
und der Festlegung eines Passworts ein Konto können
wir So sieht mein
Workspace aus. Ich kann zu meinem Profil gehen und
alle Räume,
Modelle und Datensätze sehen, die ich habe Hier habe ich also
keine Modelle oder Datensätze, aber es gibt ein paar Bereiche, mit
denen ich herumgespielt habe Eigentlich
ist dieser FAQ-Chatbot die Anwendung, die ich Ihnen in diesem Kurs vorführen
werde Im Moment
befindet sich dieser Bereich also im Ruhezustand, weil all
diese Bereiche und alle Modelle
aktuelle Hardware verwenden Wenn wir sie also nicht nutzen, gehen
sie in den Ruhezustand, um Kosten zu
sparen, und zwar sowohl bei HuggingFace als auch
bei uns selbst In jedem der Bereiche haben
wir die Möglichkeit, die Dateien
auszuchecken Dies ist also das
Repository des Bereichs, und wir können jeden dieser Bereiche ändern und
anpassen indem wir den Code in
der App Dot Py-Datei bearbeiten. Es gibt auch eine
Community-Funktion. In dieser Community-Funktion können
wir neue Diskussionen erstellen und mit
anderen Entwicklern interagieren. Wir können von ihnen lernen und auch unseren
Entwicklerkollegen helfen. Und wir können auch auf die
Umgebung für unseren Bereich zugreifen. Und hier haben wir die Möglichkeit , die
Hardware, die wir verwenden, zu verbessern. Wir haben eine Auswahl an
verschiedenen CPUs und GPUs
und können auch festlegen, und können auch festlegen wie viel Speicher wir für unseren Speicherplatz verwenden
möchten Es gibt auch weitere Einstellungen
wie das Neustarten des Speicherplatzes oder Ändern seiner Sichtbarkeit
von privat auf öffentlich oder
umgekehrt Wir können auch verschiedene
Variablen wie verschiedene APIs festlegen, die wir in
den zukünftigen Videos
in dieser Lektion eingehen werden den zukünftigen Videos
in dieser Lektion Abschließend
haben wir Ihnen in diesem Video die
Huggingfas-Plattform vorgestellt
und über die Bedeutung von
Open Source für
die schnelle
Entwicklung von KI-Anwendungen gesprochen Open Source für
die schnelle
Entwicklung von KI-Anwendungen Und wir haben auch einige
Komponenten von Hugging Pace behandelt, bei
denen es sich um Modelle, Datensätze und Räume handelt.
7. L2V2- Weboberflächen mit Gradio erstellen: In diesem Video werden wir
Radio erkunden, eine Python-Bibliothek, die
interaktive Demos
mit nur wenigen Codes in Python ermöglicht mit nur wenigen Codes in Python Ich werde Sie durch verschiedene Komponenten führen, die in einer Funkschnittstelle verwendet
werden können , und ich werde Ihnen einige
eng anliegende Gesichtsräume als
reale Beispiele dafür zeigen , wozu
diese Schnittstellen in der Lage sind Lassen Sie uns anhand eines Hello
World-Beispiels erklären, wie Gradio funktioniert Hier auf der Gradio-Website finden
wir Anweisungen
zur Installation Es ist ziemlich einfach. Es ist nur mit einer Befehlszeile möglich. Ich werde hier
überspringen, weil ich mich auf das konzentrieren
möchte, was
diese Oberfläche bietet. Wenn wir uns den Code hier ansehen, sehen
wir, dass wir eine Schnittstelle
haben,
eine Gradio-Schnittstelle, die eine Texteingabe
und eine Textausgabe
hat Wie wir hier sehen können, gibt es
eine Eingabe namens Name
und es gibt eine Ausgabe, die die Ausgabe für uns generieren
kann Wenn ich hier also meinen Namen eingebe
und dann auf Senden klicke, wird eine
Begrüßungsnachricht angezeigt. Die Schnittstellenklasse
, die Sie verwenden,
hat also drei verschiedene Parameter.
Schauen wir sie uns an. Die erste ist also FN, das ist die Funktion, die
die Benutzeroberfläche umschließt. Wir haben auch Ein- und Ausgänge. Jeder dieser Ein- und Ausgänge kann
unterschiedlichen Typs sein. Sie können beispielsweise Text,
Bild, Audio, Video und mehr sein. Wir können auch
unterschiedliche Attribute
für jede der Komponenten festlegen . So können
wir zum Beispiel hier
in diesem Lehrbuch zwei Zeilen
statt einer haben Also hier
hat dieses Eingabe-Lehrbuch eine Höhe von zwei
Zeilen statt Wir können auch mehrere
Eingaben und Ausgabekomponenten haben. Hier
haben wir zum Beispiel eine Grit-Funktion, die unterschiedliche Eingaben
und unterschiedliche Ausgaben hat So sieht die
Schnittstelle aus. Wir haben eine Texteingabe. Wir haben eine Checkbox-Eingabe und eine weitere Eingabe,
nämlich einen Schieberegler zum
Einstellen der Temperatur. So kann ich die Temperatur einstellen. Ich kann hier meinen Namen eingeben. Ich kann hier meinen Namen eingeben. Und sagen wir, es ist nicht Morgen. Wenn ich also auf Senden klicke, heißt
es: Guten Abend, Reza Heute sind es 70 Grad. Und unten gibt es
eine weitere Ausgabe, die eine Umrechnung von
Fahrenheit in Celsius ist Wir können auch
Bildkomponenten verwenden. So sieht der Code
dafür aus. Im Moment gibt
die Komponente, die für
das Bild verwendet
wird, in der
Radio-App Komponente, die für
das Bild verwendet
wird einen Fehler aus, aber
das ist kein Problem. Deshalb haben wir ein umarmtes Gesicht. Schauen wir uns also eine Schnittstelle für die
Umarmung an, die eine Bildkomponente verwendet Dieser Raum wird also
Illusionsdiffusion genannt. Und was er bewirkt, ist, dass
ich
auf der Grundlage eines dieser Muster, also sagen wir, wir
wählen dieses Muster, also sagen wir, wir
wählen dieses Muster, auf der
Grundlage der Aufforderung, die wir hier eingeben
, eine optische Täuschung erzeugen kann . Lassen Sie uns hier also
dieselbe Eingabeaufforderung verwenden. Lass uns ein mittelalterliches Dorf bauen. Und ich klicke auf Ausführen. Jetzt entstand
das Bild
eines mittelalterlichen Dorfes, das
diesem Muster der optischen Täuschung folgt . Wenn ich also von hier herauszoome, ist es jetzt
hoffentlich
einfacher für Sie, das Muster auf
dem erstellten Bild zu erkennen. In Ordnung, zurück zu Gradio. Eine weitere Funktion, die wir in Gradio
verwenden können, sind Chatbots. So sieht der Code aus. In diesem Chatbot generieren
wir also nur
eine zufällige Antwort, die entweder Ja oder Nein
lauten würde Aber im realen Szenario werden
wir ein
umfangreiches Sprachmodell verwenden, um auf der
Grundlage der Eingabeaufforderungen des Benutzers die richtigen Antworten zu generieren Also, hier kann
ich zum Beispiel Hallo sagen, es sagt,
nein, sagen wir, wie geht es dir? Im Moment erhalten wir also nur
eine zufällige Antwort mit Nein oder Ja ,
weil das die einzige Antwort ist , die der Chatbot generieren kann Später können wir ein
Lodge-Sprachmodell hinzufügen, das uns hilft,
eine tatsächliche Chat-Interaktion
mit dem Benutzer zu generieren eine tatsächliche Chat-Interaktion
mit dem Benutzer In Gradio können wir die Blockfunktion nutzen
, die uns mehr
Flexibilität und Kontrolle bietet Traditionell können wir also entweder eine Schnittstelle oder
eine Chat-Oberfläche
verwenden , um
über die Radiobibliothek mit einem Modell zu interagieren Mithilfe von Blöcken können wir jedoch
verschiedene Blöcke erstellen und in
jeden dieser Blöcke
unterschiedliche Komponenten einfügen . Es ermöglicht
komplexere Interaktionen zwischen verschiedenen
Komponenten in Gradio Schauen wir uns ein
Beispiel für die Verwendung von Blöcken an. Also hier erstellen wir einen Block. In diesem Block
haben wir zwei Textfelder. Wir haben eine Schaltfläche, und
wir können der Klickfunktion der Schaltfläche
auch
eine Funktion zuweisen . Wenn also
auf diese Schaltfläche geklickt wird, die Grid-Funktion aufgerufen, wird
die Grid-Funktion aufgerufen,
und sie übergibt diese
Parameter an die Funktion Jetzt können wir also sehen, dass sich all diese Komponenten in einem Block
befinden Und so können wir unseren Blöcken
mehr Komplexität verleihen. In diesem Code können wir also sehen,
dass wir einen Block erstellen, aber wir erstellen auch
zwei verschiedene Tabs. Und in jeder dieser Registerkarten haben
wir unterschiedliche Komponenten. Schauen wir uns also an, wie die
Oberfläche aussieht. Jetzt haben wir also einen Block, und hier gibt es eine Registerkarte und
hier eine weitere Registerkarte. Auf dieser Registerkarte haben wir also ein Eingabebild und eine
Ausgabebildkomponente. Aber im ersten Schritt haben wir einen Eingabetext und
einen Ausgabetext. Unten
haben wir auch ein Akkordeon-Menü. Wir können es schließen und öffnen. Und hier können wir nach Bedarf
weitere Komponenten hinzufügen. Das war also ein kurzer
Überblick darüber, was Radio uns bieten kann. Schauen wir uns nun einige Beispiele für echte Auszeichnungen
in Hugging
8. L2V3– Aufbau der FAQ Chatbot-Erste Schritte: In diesem Video beginnen wir mit dem Aufbau eines
Kundensupport-Chatbots Wir werden die Dateien durchgehen, die benötigt werden, um den
Space auf Inning Face auszuführen, und wir werden auch den Python-Code
überprüfen wir benötigen, damit dieser
Chatbot für uns funktioniert So sieht unser Chatbot für
Kundenservice-Assistenten Chatbot für
Kundenservice-Assistenten Um diesen Bereich in
unserem eigenen Arbeitsbereich zu haben, können
wir entweder
auf die drei Punkte hier klicken und dann auf Repository
klonen, oder wir können einen neuen Bereich eröffnen Dafür müssen wir also in unseren Workspace
gehen. Und von hier aus kann ich auf
mein Profilbild klicken und zu
„Neuer Bereich“ wechseln. Ich kann den
Namen des Bereichs und die Lizenz
auswählen, die ich möchte. Wir müssen uns auch für ein SDK,
ein Software Development Kit, entscheiden . In unserem Fall
wollen wir also Radio verwenden. Wir haben die Möglichkeit, die Hardware für
unseren Raum
auszuwählen und zu entscheiden ,
ob sie öffentlich oder privat
sein soll. Sobald wir fertig sind, können wir auf Create Space
klicken. Ich habe diesen Bereich bereits, also muss ich
ihn nicht erstellen. Lass uns darauf zurückkommen. Schauen wir uns jetzt diesen
Chat-Bot an und sehen, wie er funktioniert. Lass uns Hallo sagen. Ja, sicher. Hallo da. Ich bin der Chatbot vom
Imaginary Mechanics Shop. Ich bin hier, um
alle Fragen zu unseren Dienstleistungen
zu beantworten .
Wie kann ich Ihnen helfen? Also lass es mich fragen. Erzählen Sie mir
von der Geschichte des Ladens. Und der Chatbot bietet
einige Informationen darüber, wann die Werkstatt gegründet wurde und wie viele Jahre die Mechaniker dort gearbeitet
haben Fragen wir nach den
Betriebszeiten. Und es wird
entsprechend den
Öffnungszeiten des Ladens angemessen reagieren . Welche Dienstleistungen bieten Sie an? Es informiert uns also über verschiedene Dienstleistungen, die sie
anbieten, wie z. B. Änderungen ,
Bremsreparaturen,
Reifenwechsel usw. In Ordnung. Gehen wir jetzt in
die Akten und schauen ,
was wir brauchen
, damit dieser Chat funktioniert Die erste Datei
, die wir
sehen wollen, sind also die Git-Attribute Diese Datei konfiguriert Git
Large File Storage oder LFS
, eine Erweiterung von
Git, mit der Sie große
Dateien und binäre Assets
effizient verwalten Diese Konfiguration
kann für
eine Vielzahl von
Dateitypen und Pfaden verwendet werden , insbesondere für
Binärdateien und große Datensätze, die häufig beim maschinellen Lernen, in der
Datenwissenschaft und in der
Softwareentwicklung
verwendet werden Datenwissenschaft und in der
Softwareentwicklung Dies trägt dazu bei, die
Größe des Git-Repositorys
überschaubar zu halten , und verbessert
die Leistung beim Klonen und Die nächste Datei ist die CSV-Datei der
imaginären Mechanikerwerkstatt. Hier können wir also
verschiedene Fragen
und Antworten zu unserer
imaginären Mechanikerwerkstatt sehen und Antworten zu unserer
imaginären Mechanikerwerkstatt Dies ist die Datei, die das Large-Sprachmodell als Referenz verwenden
wird, und es wird in der Lage sein, alle Fragen zu
beantworten, die auf
der Grundlage der in dieser Datei
enthaltenen Informationen beantwortet werden
können der Grundlage der in dieser Datei
enthaltenen Informationen Wir haben auch eine
Readme-Datei, die verschiedene Informationen
über die Anwendung,
die
Versionen des Software Development Kits und den Autor
enthält . Die Anforderungen an die TXT-Datei werden häufig
in Python-Projekten verwendet , um eine Liste von
Abhängigkeiten anzugeben, die installiert werden
müssen, damit das
Projekt ordnungsgemäß ausgeführt werden kann. Jede Zeile in der Datei
gibt ein Paket und optional eine Version oder einen Bereich akzeptabler Versionen
für dieses Paket an. Und schließlich
gibt es noch die App-Pi-Datei, die den gesamten
Code enthält, den wir benötigen, um die Anwendung
im riesigen Phasenraum
auszuführen Lassen Sie uns also tiefer in
den Python-Code selbst eintauchen. Am Anfang
importieren wir verschiedene Bibliotheken. Wir importieren Radio
für die Benutzeroberfläche. Wir importieren Open AI für
das große Sprachmodell, das unseren Chatbot unterstützt, und wir importieren auch OS, CSV und JSON für die Dateiverwaltung Wir stellen die
API auch verschlüsselt ein. Das hat mit der Sicherheit zu tun , da wir nicht möchten, dass unser API-Schlüssel
im Code sichtbar ist. Ich werde dies im
nächsten Video erklären, wenn ich über
bewährte Verfahren bei der Entwicklung von
LLM-gestützten Anwendungen spreche bewährte Verfahren bei der Entwicklung von
LLM-gestützten Anwendungen Zuallererst möchten wir den Eingabepfad für die CSV-Datei
definieren Das Large-Sprachmodell
weiß also , wo auf diese Datei zugegriffen werden kann. Dann initialisieren wir eine leere
Liste, um die Daten zu speichern. Dann öffnen wir die
CSV-Datei zum Lesen. Wir erstellen ein CSV-Reader-Objekt iterieren durch die CSV-Daten und
hängen sie an die Liste an Als Nächstes konvertieren wir die Liste der Wörterbücher Unsere Antwortfunktion ist die Funktion, die die Nachricht
vom Benutzer
entgegennimmt und
auf der Grundlage des eingegebenen Textes
eine korrekte Antwort generiert auf der Grundlage des eingegebenen Textes
eine korrekte Antwort Also haben wir unsere JSON-Datei eingerichtet. Wir stellen eine Richtlinie für den Chatbod bereit, um ihm zu
sagen, wie er sich verhalten und
wie er Fragen beantworten soll Dies ist auch ein weiterer
Teil, auf den ich
im nächsten Video
näher eingehen werde ,
da er mit der schnellen
Bearbeitung und der Sicherstellung zu tun hat dass unser Chatbod Um dann eine Antwort zu
erzeugen, rufen
wir openai dot completion
dot create auf und hier können
wir entscheiden, welche
Engine wir Also hier verwenden wir
Take Deven G 03. Wir identifizieren, was unsere Eingabeaufforderung ist, und wir können verschiedene
Einstellungen für das Modell festlegen Zum Beispiel setze ich
das maximale Token auf 300 und die
Temperatur auf 0,1. Als Nächstes extrahieren und
drucken wir den generierten Text. Und am Ende
erstellen wir einen Funkblock. In diesem Block
haben wir also den Chatbot. Wir haben ein Textfeld
für die Nachricht des Benutzers und wir haben einen klaren Boden Immer wenn der Benutzer auf Senden klickt, rufen
wir die
Antwortmethode auf, indem wir
die Nachricht und den
Chatbot-Verlauf bis zu diesem Zeitpunkt weitergeben die Nachricht und den
Chatbot-Verlauf bis zu diesem Zeitpunkt Und um all das zu
starten, schreiben
wir einfach Demo Dot Launch Zusammenfassend haben
wir in diesem Video mit dem Aufbau
eines Kundensupport-Chatbots begonnen Wir haben die Dateien durchgesehen, die zum Ausführen des Speicherplatzes auf
HigingFace
benötigt werden, und
den Python-Code überprüft , den wir für die
Erstellung der Anwendung benötigen
9. L2V4- Abschließen und Bereitstellen des FAQ Chatbot: In diesem Video zeigen
wir Ihnen, wie Sie einen Chatbot auf einem
skalierbaren Endpunkt bereitstellen Wir werden auch besprechen, wie
Sie ethische Überlegungen
und andere
bewährte Produktionspraktiken
auf Ihre Chatbot-Entwicklung anwenden und andere
bewährte Produktionspraktiken auf Ihre Chatbot-Entwicklung Dazu müssen wir die Einstellungen-App in unserem Bereich aufrufen Wir können sehen, dass wir Optionen für
verschiedene
Prozessoreinheiten und Speicher
haben . Es gibt auch Optionen zum Neustarten oder
Neustarten des Indem wir die Sichtbarkeit des
Raums ändern, können
wir wechseln, ob wir
den Raum privat oder öffentlich machen Lassen Sie uns mehr über
den API-Schlüssel und
andere vertrauliche
Informationen sprechen , die
auf unserer
Hugging Face-Plattform gespeichert werden müssen auf unserer
Hugging Face-Plattform gespeichert werden Wenn Ihre App also
Umgebungsvariablen benötigt , z.
B.
geheime Schlüssel oder Token, geheime Schlüssel oder Token, nicht in Ihrer Anwendung fest codieren
. Stattdessen können Sie auf
die Einstellungsseite
Ihres Bereichs gehen und eine
neue Variable oder ein neues Geheimnis hinzufügen Verwenden Sie Variablen, wenn
Sie unsensible
Konfigurationswerte und Geheimnisse zum
Speichern von Zugriffstoken, API-Schlüsseln oder anderen
sensiblen Werten oder Anmeldeinformationen speichern müssen. In der Einstellungen-App haben
wir auch andere Optionen wie Umbenennen oder Übertragen
dieses Bereichs Wir können auch
die Funktion für
Community-Beiträge aktivieren
oder deaktivieren die Funktion für
Community-Beiträge oder den Bereich löschen, wenn du ihn
nicht mehr haben möchtest Ein weiterer interessanter Punkt in
ihren Einstellungen sind Webhooks. Webhooks in Hugging Face
können Sie also automatisierte Antworten
oder andere Aktionen einrichten , die durch bestimmte Ereignisse
auf der Hugging Face-Plattform
ausgelöst werden könnten durch bestimmte Ereignisse
auf der Hugging Face-Plattform
ausgelöst auf der Hugging Sie können einen
Webhook einrichten, um
Ihr System zu benachrichtigen , wenn eine neue Version
eines Modells
auf Hugging Face verfügbar ist oder wenn ein Trainingsjob, den Sie auf der Plattform
gestartet haben, abgeschlossen gestartet Webhooks sind wie
automatische Erinnerungen, die uns helfen
, bewährte Verfahren zu befolgen Sie agieren hinter den Kulissen, um unsere Arbeit zu
überprüfen, wann immer
wir Änderungen vornehmen, und stellen
sicher, dass alles
zusammenpasst Sie können eine reibungslose und
erfolgreiche Zusammenarbeit ermöglichen ,
indem sie uns Zeit sparen, unser Projekt konsistent halten
und das gesamte Team
über neue Änderungen auf dem Laufenden halten. Schauen wir uns nun
einige schnelle technische
Verfahren an , die
unseren Chatbots helfen, richtig zu handeln und relevante Antworten zu
geben Okay, also in der Punkt-Pi-Datei der
App und wir stellen einige
Chatbot-Richtlinien Lass es uns aufschlüsseln. Das ist also die
Aufschlüsselung der Richtlinien. Sehen wir uns an, wie diese
Anweisungen
dem Chatbot helfen , angemessene
und relevante Antworten Das erste
, was wir tun möchten, ist, dem Chatbot eine Rolle zu geben Wir können also sagen, dass Sie ein
Konversations-Chatbot sind als Mechaniker in der Werkstatt für imaginäre Mechaniker
agieren Dann müssen wir ihm eine Funktion geben. Ihre Hauptfunktion
besteht darin,
alle Fragen , d. h.
die vom Benutzer
bereitgestellten Nachrichten, reibungslos zu beantworten. Beantworten Sie Anfragen, die sich ausschließlich auf den Inhalt
des
bereitgestellten Dokuments
beziehen , das sich in der von uns erstellten
JSON-Datei befindet. Um dem Chatbot zu helfen, können
wir auch ein Beispiel geben Der Benutzer kann
das Wort für Sie als
Vertreter des Shops verwenden das Wort für Sie als
Vertreter des Shops Wenn der Nutzer also fragt: Reparieren
Sie platten Reifen, sollte
Ihre Antwort etwa lauten:
Ja, wir reparieren platten Reifen in
der imaginären Mechanikerwerkstatt Wir sollten auch
Einschränkungen für den Chatbot festlegen. Ihre Antworten haben Einschränkungen. Nehmen Sie nicht an Diskussionen teil beantworten Sie keine Fragen zu
illegalen Aktivitäten, expliziten Inhalten
oder anderen Themen, die nichts mit der Mechanikerwerkstatt
oder der Reparatur von Autos im Allgemeinen zu tun Halten Sie sich ausschließlich an die
Informationen in der dafür vorgesehenen Datei und Fragen, die
anhand dieser Informationen beantwortet werden können Wir können Ihnen auch
Anweisungen für den Umgang mit unangemessenen
oder nicht verwandten Anfragen Sie sollten in der Lage sein,
unangemessene oder themenfremde Fragen zu
beantworten Wenn die Frage
völlig vom Thema abweicht, teilen Sie den Benutzern
höflich mit,
dass Sie nur
Hilfe und
Antworten geben können Hilfe und
Antworten die imaginäre Mechanikerwerkstatt beziehen Unterlassen Sie es, sich mit
irrelevanten oder unangemessenen Themen zu beschäftigen irrelevanten Wenn die Frage
nicht zum Thema gehört, Sie
aber keine Antwort haben, geben Sie
bitte eine kurze
Antwort auf die Frage
und bitten Sie den Benutzer,
den Shop anzurufen, um weitere Informationen zu Und schließlich können wir
dem Chatbot sagen , wie der Ton
der Interaktion sein soll Behalten Sie Respekt und
Professionalität bei. Stellen Sie sicher, dass die Interaktionen
höflich, konstruktiv
und themenbezogen sind , und sorgen Sie für eine professionelle und
respektvolle Benutzererfahrung Die Bereitstellung dieser Anweisungen
hilft uns dabei, einen Chatbot zu erstellen , der beim Thema bleibt und angemessene
Antworten gibt Abschließend
haben wir in diesem Video untersucht, wie
der Chatbot auf einem
skalierbaren Endpunkt eingesetzt werden Wir haben auch gelernt, wie Sie
ethische Überlegungen
und andere
bewährte Produktionsmethoden
auf Ihre Chatbot-Entwicklung anwenden und andere
bewährte Produktionsmethoden auf Ihre Chatbot-Entwicklung
10. L3V1 – Wichtige ethische Fragen in LLM-Anwendungen: In diesem Video werden wir die Risiken
untersuchen, die mit dem Einsatz ethischer und
verantwortungsvoller KI-Systeme verbunden Einsatz ethischer und
verantwortungsvoller Am Ende dieses Videos erfahren
Sie mehr über die wichtigsten
ethischen Risiken bei der
Erstellung serienreifer Anwendungen mithilfe von LLMs Die Themen, die wir
in diesem Video behandeln, sind Vorurteile, unsichere Reaktionen, Probleme mit Transparenz
und Erklärbarkeit sowie die Risiken falscher Erwartungen Ein großes Problem sind
mögliche Verzerrungen in den Trainingsdaten, die im Verhalten des
Modells kodiert werden Modelle, die mit Text
aus dem Internet trainiert wurden, können versehentlich schädliche Stereotypen in Bezug
auf Rasse,
Geschlecht oder
andere Merkmale verstärken schädliche Stereotypen in Bezug
auf Rasse,
Geschlecht oder
andere Merkmale versehentlich schädliche Stereotypen in Bezug
auf Rasse,
Geschlecht oder
andere Merkmale verstärken. Dies könnte zu
diskriminierenden Ergebnissen führen, die die reale Welt falsch wiedergeben. Dies könnte zu
diskriminierenden Ergebnissen führen, die die reale Welt falsch wiedergeben. Ein weiteres Problem ist
die Wahrscheinlichkeit LLMs gelegentlich toxische,
unsichere oder wahrheitswidrige Inhalte
erzeugen ,
die auch als Halluzinationen bezeichnet werden Ohne angemessene
Kontrolle könnte dies gefährliche Folgen für die reale Welt haben. Es gibt auch Probleme
mit Transparenz
und Erklärbarkeit großen neuronalen
Netzwerkmodellen Es kann unklar sein,
warum ein LLM aus menschlicher Sicht
ein bestimmtes Ergebnis oder
eine bestimmte
Empfehlung hervorbringt ein bestimmtes Ergebnis oder eine bestimmte
Empfehlung hervorbringt Dieser Blackbox-Charakter macht es schwierig, die Ergebnisse des
Modells zu überprüfen Darüber hinaus kann die menschenähnliche Natur von
Konversationsmodellen dazu führen, dass Benutzer einem KI-System unangetastetes Vertrauen
oder eine unangebrachte Bindung an ein KI-System Umgang mit
den Erwartungen an die Fähigkeiten des Systems ist eine wichtige Aufgabe bei der Präsentation unserer serienreifen
LLM-gestützten Während meiner Doktorarbeit, als ich
das Vertrauen zwischen
Menschen und künstlichen Agenten untersuchte , fand
ich heraus, dass das
allgemeine Vertrauen in einen Agenten, einschließlich des Grads
der Vergebung
des Benutzers gegenüber diesem Agenten,
wenn ein Fehler passiert
ist, erheblich von
der anfänglichen Wahrnehmung und den
Erwartungen dieses Agenten abhängt von
der anfänglichen Wahrnehmung und den
Erwartungen dieses Agenten Um also bei Ihren Benutzern einen guten
Start zu haben, ist
es wichtig, zu setzen,
wenn Sie ihnen Ihre
Anwendung vorstellen realistische Erwartungen zu setzen,
wenn Sie ihnen Ihre
Anwendung vorstellen. Anerkennung dieser Risiken und wahrscheinlich weiterer Risiken, deren wir uns vielleicht nicht bewusst sind, bedeutet,
dass
wir als KI-Praktiker die ethische Verpflichtung
haben diese Art
von Herausforderungen proaktiv durch
Forschung, Design und Tests
anzugehen von Herausforderungen proaktiv durch
Forschung, Design und Und für neue
Entwickler ist es wichtig, nach
potenziellen Risiken und
ethischen Richtlinien Ausschau zu potenziellen Risiken und
ethischen Richtlinien von
KI-Wissenschaftlern erstellt wurden Zusammenfassend lässt sich sagen, dass einige
potenzielle Risiken bei LLM-gestützten Apps Voreingenommenheit,
unsichere Reaktionen, Probleme mit Transparenz
und Erklärbarkeit sowie falsch informierte
Erwartungen sind unsichere Reaktionen, Probleme mit Transparenz
und Erklärbarkeit sowie falsch informierte LLM-gestützten Apps Voreingenommenheit,
unsichere Reaktionen, Probleme mit Transparenz
und Erklärbarkeit sowie falsch informierte
Erwartungen sind. Mit Sorgfalt und Sorgfalt können
wir die
Leistungsfähigkeit von LLMs für immer nutzen .
11. L3V2 – Strategien zur Minimierung von KI-Risiken: In diesem Video werden wir
Strategien zur
Minderung von Verzerrungen und zur Sicherheit untersuchen Strategien zur
Minderung von Verzerrungen und zur Am Ende dieses Videos werden
Sie
gesunde
Anwendungspraktiken zur Behebung von
Vorurteilen und Sicherheitsproblemen
während des gesamten
Entwicklungszyklus kennenlernen Anwendungspraktiken zur Behebung von Vorurteilen und Sicherheitsproblemen während des gesamten
Entwicklungszyklus Zu den Methoden, die wir behandeln
werden , gehören die Kuratierung verschiedener Datensätze, die
Überwachung des Schulungsprozesses, Kennzeichnung unangemessener
Ergebnisse und Verhaltensweisen,
sicherheitsorientiertes, zeitnahes
Engineering Bevor Sie mit dem Training eines LLM beginnen, ein wichtiger Schritt darin,
einen vielfältigen Datensatz
sorgfältig zu kuratieren , der zum Trainieren des Modells
verwendet werden soll Daten sollten aus
seriösen Quellen stammen und auf schädliche Inhalte überprüft werden Um Vorurteilen entgegenzuwirken, können
wir Funktionen wie
Diversitätsfilter verwenden , um verzerrte Verteilungen zu
entfernen Wir können auch erweiterte Daten verwenden,
was eine weitere
Technik ist, um
unterrepräsentierte
Perspektiven in den Datensatz aufzunehmen unterrepräsentierte
Perspektiven Als Nächstes kann das Modell
während der
Trainingsphase auf Fairness
zwischen verschiedenen
demografischen Gruppen hin überprüft werden zwischen verschiedenen
demografischen Gruppen hin während Wir können Algorithmen
zur Minimierung von Verzerrungen verwenden, denen
Modellparameter angepasst werden können um die gerechte Leistung zu verringern Bei den eingesetzten Modellen Techniken wie
Likelihood-Ratcheting und können
Techniken wie
Likelihood-Ratcheting und
Filter zur Kennzeichnung von
Inhalten die Entstehung von
verzerrten oder toxischen Ergebnissen erkennen und reduzieren Es ist wichtig zu
wissen, dass die Überwachung nicht nur für die Trainingsphase bestimmt
ist Eine kontinuierliche Überwachung hilft dabei die neu auftretenden Probleme zu
identifizieren , die angegangen werden müssen. Darüber hinaus vermittelt
das auf Sicherheit ausgerichtete
Prompt-Engineering dem Modell akzeptable
Verhaltensnormen und leitet es zu einem wohlwollenden
Verhalten an, wenn Entwickler können sich auf Leitfäden für
Entwickler beziehen , die ihnen
bei der Einführung
dieser gesundheitsfördernden Praktiken helfen Und nicht zuletzt sind Tests auch eine
sehr wichtige Phase zur Minderung von Verzerrungen Es sollte während
des gesamten
Entwicklungszyklus durchgeführt werden , um
die Modellergebnisse auf Verzerrungen und
Sicherheitsprobleme zu untersuchen die Modellergebnisse auf Verzerrungen und , bevor wir die Anwendung
für die Produktion
freigeben Darüber hinaus können Audits durch externe Forscher
eine weitere Kontrollebene bieten, was bei Anwendungen, bei
denen
viel auf dem Spiel steht, von entscheidender Bedeutung ist Zusammenfassend lässt sich sagen, dass kein
Ansatz perfekt ist, aber die Kombination von bewährten Verfahren wie der Kuratierung verschiedener Datensätze, der
Überwachung des Schulungsprozesses, der Kennzeichnung unangemessener
Ergebnisse und Verhaltensweisen, sicherheitsorientiertes
Prompt-Engineering und Tests hilft uns dabei, die für ethische
und repräsentative LLM-Anwendungen
erforderlichen Kontrollen und Abwägungen zu schaffen für ethische
und repräsentative LLM-Anwendungen
erforderlichen
12. L3V3– Förderung der Transparenz in KI-Systemen: In diesem Video wird untersucht,
wie Transparenz und Erklärbarkeit Am Ende dieses Videos werden
Sie verschiedene
Strategien zur Verbesserung
der Transparenz und
Erklärbarkeit Ihrer Anwendungen kennenlernen der Transparenz und
Erklärbarkeit Wir werden uns mit der
Transparenz von Trainingsdaten, lokalen Erklärungstechniken,
Vertrauenswerten, Benutzertests und
menschlicher Aufsicht Große Sprachmodelle können beeindruckend
menschenähnliche Ergebnisse
liefern, aber das Innenleben neuronaler Netze komplex und ähnelt einer
Blackbox Ein Ansatz zur Erhöhung Transparenz besteht darin,
einen Überblick
darüber zu verschaffen welche Trainingsdaten und
-parameter zum Trainieren des Modells verwendet wurden gemeinsame Nutzung von Modellkarten
ist daher eine bewährte Methode um Informationen über den Entwicklungsprozess bereitzustellen. Eine weitere Möglichkeit, die
Transparenz zu erhöhen,
sind Methoden, die als
lokale Erklärungstechniken bekannt sind. Sie können den Benutzern helfen zu verstehen welcher Teil der
Eingabe, beispielsweise die
Benutzereingabe, eine wichtige Rolle
dabei gespielt hat , zu dem
bereitgestellten Ergebnis zu gelangen. Durch Hervorheben oder Verweisen
auf bestimmte Bereiche der Eingabe,
die
einen großen Einfluss auf
das Ergebnis des Modells hatten , können sich die
Benutzer ein
klares Bild
davon machen , warum das Modell auf eine bestimmte Art und
Weise reagiert hat. Wir können uns auch auf bestimmte Antworten verlassen, um
für mehr Transparenz zu sorgen. Anhand von Konfidenzwerten
können wir Aufschluss
darüber geben
, wann das Modell
wahrscheinlich eine Schätzung vornimmt, und wann es sich bei einem Output sehr sicher ist Und es gibt Benutzertests, deren Hilfe Fälle identifiziert werden können, in denen die Logik des Modells vage ist und
die Erwartungen nicht erfüllt Die Protokollierung dieser
Fälle kann
als Leitfaden für zukünftige
Modellverbesserungen dienen als Leitfaden für zukünftige
Modellverbesserungen Letztlich sollten wir nicht vergessen, dass menschliche Aufsicht immer noch
erforderlich ist , um die Gründe des
Modells zu überprüfen und falsche Entscheidungen offen zu treffen. ohne
Leitplanken sollten keine vollständige Autonomie erhalten LLMs Okay, wir haben gesehen, dass uns
diese Techniken
dabei helfen können , das Modell
transparenter zu gestalten. Wir sollten beachten, dass jede
Erklärung auf den
technischen Hintergrund des Publikums
zugeschnitten sein sollte . Für Entwickler könnten
detaillierte technische Erklärungen vorzuziehen
sein. Für Endbenutzer reichen jedoch in der Regel vereinfachte
Interpretationen
der in der Regel vereinfachte
Interpretationen
der Absicht des Modells aus. Zusammenfassend lässt sich sagen, dass Transparenz und Erklärbarkeit dazu beitragen, ein dauerhaftes Vertrauen
aufzubauen und
sicherzustellen, dass unsere App wie
beabsichtigt funktioniert Funktionen wie
Einblick in Trainingsdaten,
lokale Erklärungstechniken, Konfidenzwerte, Benutzertests und menschliche
Aufsicht helfen dabei, transparentere und erklärbarere
LLM-Anwendungen erklärbarere
13. L3V4- Techniken zur Aufrechterhaltung des Vertrauens der Nutzer: In diesem Video werden wir
einige der Herausforderungen
beim Aufbau
vertrauenswürdiger Interaktionen zwischen
menschlichen Benutzern und
LLM-Anwendungen untersuchen einige der Herausforderungen
beim Aufbau vertrauenswürdiger Interaktionen zwischen menschlichen Benutzern und Wir werden
wichtige Tipps zur
Wahrung des Benutzervertrauens und zur Einhaltung der
Kommunikationsnormen durchgehen Wahrung des Benutzervertrauens und zur Einhaltung der
Kommunikationsnormen Wie bereits erwähnt, Festlegung von
Erwartungen von entscheidender Bedeutung Wir müssen die Möglichkeiten
und Grenzen
des Modells klar Möglichkeiten
und Grenzen
des Modells damit die Nutzer verstehen,
wann sie
den Ergebnissen vertrauen und wann sie
menschliche Erkenntnisse einholen sollten. Wir sollten sicherstellen, dass
wir nicht zu viel versprechen. Die Benutzeroberfläche selbst trägt ebenfalls zur Vertrauensbildung
bei. Menschenähnliche
Designelemente, beispielsweise die Verwendung eines menschenähnlichen Avatars
oder einer Stimme, können
Benutzer dazu verleiten , zu glauben, dass
das System
intelligenter ist ,
als es wirklich ist Minimalistische Benutzeroberflächen
helfen den Benutzern, sich auf die Aufgabe zu konzentrieren. Schaffung eines
einheitlichen Charakters und einer einheitlichen Stimme für das
Modell hilft dabei, die Erwartungen der Nutzer
in Einklang zu bringen und verwirrende Persönlichkeitsveränderungen
zu vermeiden Wir können von
Benutzertests profitieren, um diese problematischen
Inkonsistenzen zu identifizieren Darüber hinaus vermeidet die Einhaltung der
erwarteten
Kommunikationsnormen jegliche Verwirrung Um einen
produktiven Dialog zu fördern, sollte
das System
Konventionen wie
Abwechselung, Klärung mehrdeutiger Anfragen
oder Eingeständnis seiner Unwissenheit folgen Abwechselung, Klärung mehrdeutiger Anfragen
oder Eingeständnis seiner Unwissenheit Transparenz ist ebenfalls sehr wichtig
. Transparenz: Durch
die Offenlegung der Rolle des LLM und die Bereitstellung von Informationen über
seine Schulungsdaten erhalten die Nutzer einen angemessenen Kontext Außerdem trägt die Erläuterung seiner Grenzen
dazu bei, glaubwürdiges Vertrauen aufzubauen Und das Zulassen von
Benutzerfeedback hilft dabei Vertrauensverlust
oder Kommunikationsprobleme zu
identifizieren. Wir sollten die
Interaktionen kontinuierlich überwachen und in
zukünftigen Iterationen
Benutzerfeedback berücksichtigen,
um die Beziehung im Laufe der Zeit zu verbessern Zusammenfassend lässt sich sagen, dass
LLM-Entwickler mit durchdachtem
Design und Transparenz
Systeme entwickeln können, denen die Benutzer vertrauen Diese Überlegungen
reduzieren das Risiko unbeabsichtigter Folgen
und Verzerrungen bei Priorisierung dieser
Faktoren ist entscheidend für Entwicklung vertrauenswürdiger und universell einsetzbarer Ich hoffe, Ihnen hat
dieser kurze Kurs mit
mir gefallen und Sie fanden den
Inhalt wertvoll Hoffentlich sehe ich dich bald in einem weiteren spannenden generativen
KI-Kurs. Erkunden Sie weiter.