Transkripte
1. Einführung in den Kurs: Hallo an alle und willkommen zu diesem Kurs. In diesem Kurs werde ich Ihnen die Programmiersprache R von Anfang an bis zu
einem Ort beibringen , an dem wir Experten werden und unsere Datenprobleme ständig lösen können. Jetzt ist R die Sprache der Daten, daher ist es für Data Science und Analyse von entscheidender Bedeutung. Für diesen Kurs müssen
Sie jedoch kein Experte sein. Sie können ein absoluter Anfänger sein, der
nur daran interessiert ist, etwas über Data Science zu lernen. Oder eine X-Bar, die Ihre tägliche Analyse durch Lernen erleichtern möchte. Jetzt wird r heutzutage aus einer Vielzahl von Gründen sehr populär. Hauptsächlich, weil sich die Menschen mehr für die Verfolgung von Data Science interessiert haben. Mit dem aktuellen Wachstum von Big Data und Machine Learning in fast allen Branchen geht
die Nachfrage nach Daten weiter und daher steigt die Nachfrage nach Analysten weiter. Und dies eröffnet viele Möglichkeiten, in verschiedenen Sektoren und verschiedenen Bereichen
arbeiten zu können . Und mit dem aktuellen Klima haben die
Menschen den Wunsch, aus der Ferne arbeiten zu können und
freiberuflich arbeiten zu können, um ein bisschen mehr Flexibilität bei der Rückkehr zu haben. Mit Data Science und Analyse ist
dies definitiv etwas, das Sie verfolgen können. Nun, warum ist wichtig sind, ist eine der Hauptsprachen der Data Science. Eine andere Hauptsprache ist Python. Aber Python ist eine sehr generische Sprache, die für viele verschiedene Dinge verwendet werden kann. Und es ist wirklich die Sprache der Programmierer. Geliehen. R ist die Sprache der Datenwissenschaftler und Statistiker. Einer der Hauptgründe, warum R großartig ist, ist, dass es kostenlos und Open Source ist. Und das bedeutet, dass unsere großen Communities daran arbeiten und das sehr unterstützende Gemeinschaften, die Ihnen helfen können, wenn Sie
Fragen oder Probleme mit einer Analyse haben . Und sie arbeiten auch kontinuierlich an der Herstellung von Paketen. Pakete sind etwas, das Sie installieren können, und sie sind für sehr spezifische Datenprobleme bestimmt. Es macht das Lösen viel einfacher. Ich werde drei Pakete gehen und zukünftige Videos müssen diese installieren und wie man diese benutzt. Was der ADH wirklich gut macht, ist die Datenvisualisierung. Und das ist etwas, dem keine andere Programmiersprache überhaupt nahe kommt. Und die Datenvisualisierung ist für die Data Science sehr wichtig, insbesondere weil wir uns mit Diagrammen und Diagrammen und Daten beschäftigen. Das ist also etwas, das wirklich gut ist und jetzt, wenn Sie sich für Data Science oder R interessieren, und Sie denken, dass dies für Sie nützlich sein könnte, dann schauen Sie sich diesen Kurs
definitiv an und ich hoffe, es gefällt Ihnen. Danke.
2. Lektion 1: Installieren von R und Rstudio: Hallo an alle und willkommen zu diesem Video. Dies wird eine kurze Einführung in unser Herunterladen von R und RStudio sein und mit den Grundlagen unserer Funktionen verbunden sind und wie es aussieht. Okay, um unsere herunterzuladen, gehen
wir einfach zur R-project dot org. Wir kommen hierher, um R und das Pentagon herunterzuladen, unser Land, in dem wir uns befinden, wir klicken auf den entsprechenden Link und es wird uns brauchen, um eine E2 zu haben. Oder wir könnten einfach zur Cloud gehen, die uns je nach Land automatisch auf den Server weiterleitet. Also klickst du hier rüber und dann sammeln wir beim Herunterladen diejenige ,
die für unsere Computer gedacht ist oder ob wir ein Windows
oder einen Mac verwenden und den LaCo-Download erneut herunterladen, sonst noch etwas? Okay, sobald wir R heruntergeladen haben, ist
es wichtig, eine gute IDE oder Plattform zu haben, um es auszugehen. Und meiner Meinung nach ist RStudio wirklich gut. Also kommen wir einfach hierher, um dich nach do.com Produkten zu fragen, RStudio. Und es gibt zwei Versionen von RStudio. Es gibt die Open Source- oder kostenlose Version
und die vorherige Version, die mit einem Preis geliefert wird. Und um ehrlich zu sein, ist die vorherige Version wirklich nicht erforderlich es
sei denn, es ist eine große Institution oder Firma in diesem Saisonspiel. Für Einzelpersonen, unabhängig davon, was sie kostenlos
verwenden, sollte man mehr als genug für ihre Bedürfnisse sein. Also klickst du einfach hier rüber. Und noch einmal klicken wir auf die kostenlose Version. Und wir haben je nach Computer heruntergeladen, egal ob wir ein Windows oder einen Mac oder einen der relevanten verwenden. Und wir verbinden uns. Okay, sobald wir noch F-Branche haben, sieht es
so aus. Es mag ein bisschen kompliziert und fummelig erscheinen, aber es ist sehr einfach und einfach zu bedienen. Es hat vier Quadranten. Und der erste, hier würden wir unseren Code eingeben, Ihr Recht, was wir wollen. Und der Code, er würde hier ausgegeben werden. Je nachdem, was wir nennen, werden wir hier unten sehen. Dieser dritte Quadrant, welche Umgebung leer ist,
zeigt, dass hier alle Funktionen oder Objekte aufgeführt werden, die wir erstellt haben. Jetzt mag das jetzt etwas fremd erscheinen Funktionen und Objekte. Aber sobald wir anfangen, Got zu benutzen, wird
es zur zweiten Natur. Fange an, diese Wörter zu benutzen. Es ist sehr einfach. Und zwei Jahre unter Berg 10 stehen. Okay, also sieht der vierte Quadrant wahrscheinlich sehr vertraut mit den Titeln der Datei und diesen verschiedenen Ordnern aus, die wir haben. Das ist also im Grunde das, was es ist. diesem ersten Tab haben wir unsere Dateien als Plots. Also alle Plots, die wir hier auf dem ersten Quadranten erstellen, können
wir es hier sehen. Jetzt Pakete. Die Haare, ich habe kurz darüber gesprochen. Aus diesem Grund haben wir Pakete installiert, um uns mit unserem Coach und Manager einfacher zu helfen. Und natürlich kannst du dann die Hilfe und den Betrachter benutzen. Jetzt werden wir auf all das ausführlich eingehen, aber dies ist nur ein grundlegender Überblick darüber, wie RStudio aussieht. Es ist also nicht so beängstigend, wenn du es zum ersten Mal öffnest. Und natürlich können
wir diese Quadranten bewegen, je nachdem, wie es Ihnen gefällt, was wir mehr verwenden, was wir mehr sehen. Und es ist wirklich sehr benutzerfreundlich und die Dichte ist, wie wir es in zukünftigen Videos herausfinden werden. Okay, also danke, dass du dir dieses Video angeschaut hast. Ich hoffe, das war nützlich und wir sehen uns im nächsten.
3. Lektion 2: Daten und Projekte: Hallo an alle und willkommen zurück zu diesem Kurs. Wenn wir also eine kurze Einführung in die Installation von R und
RStudio und einen kurzen Blick auf die verschiedenen Quadranten gehabt hätten und was sie tun. In dieser Lektion konzentrieren
wir uns also auf den Import von Daten, die
Projekte erstellen , und einige kleine Manipulationen von Daten. Okay? Um Daten zu importieren und zu verwenden,
ist es am besten, ein Projekt zu erstellen. Jetzt, wenn wir ein Projekt in zu schweren Shows erstellen, bringen Sie den Tag bei, an dem wir einen neuen Film hinzufügen, alles bleibt an einem Ort. Um ein Projekt zu starten, gehen
wir hier rüber und erstellen ein Projekt. Wir geben ihm einen Namen. Projekt 1. Nicht sehr einfallsreich, aber es macht den Job. Erstellen Sie jetzt Projekt, okay, warten
wir einfach, bis das geladen wird. Okay? Also lass mich das einfach nochmal reparieren. Okay? Also hat es dieses Projekt hier in unserem Ordner erstellt. Jetzt hat es das nicht nur in RStudio erstellt, hat dies auch auf unserem Computer erstellt. Wenn ich also zu meinen Akten gehe, wirst
du dieses Projekt dort sehen. Okay, das ist also mein Laptop-Foto, und es hat das bereits automatisch für mich auf meiner Festplatte erstellt. Ich musste nicht herkommen und Schöpfer. Wenn ich also ein Projekt in Ostia mache, erstelle
automatisch zwei für mich in meinen eigenen Ordnern. Wenn ich also hierher komme, um eins zu projizieren, komm hier rein und das ist der obere Ordner für das Projekt. Jetzt kann ich einfügen, was ich will und jetzt habe ich bereits Daten kopiert, die ich möchte. Und ich habe die Haare eingeklebt ist Hey, ich möchte das umbenennen, um den Umgang zu erleichtern. Nur Theta eins. Lassen Sie uns den Umgang mit uns einfacher machen. Okay? Daten eins oder das sind also die Datei, die ich erstellt habe. Jetzt entscheide ich mich für CSV, weil es viel einfacher ist, damit umzugehen. Es ist sehr effizient. Jetzt können Sie dies auch mit Excel-Tabellen oder irgendetwas anderem tun. Und das zeige ich dir in zukünftigen Videos. Aber im Moment mache ich einfach den CSV. Und nur um dies zu klären, können
Sie Ihre Excel in eine CSV-Datei herunterladen oder ändern. Das kann auch gemacht werden. Okay, jetzt wo wir wieder da sind, können wir
jetzt sehen, dass die Daten, die wir in unseren Ordner eingefügt haben, bereits hier aufgetaucht sind. Dies wird jedoch nicht genau in RStudio importiert, sondern
wird nur angezeigt, weil es sich in diesem Ordner befindet. Jetzt können wir es importieren, indem wir entweder von hier aus darauf klicken oder es importieren,
Hey, ich denke, der beste Weg, dies zu tun, ist, Code zu schreiben und ihn per Code zu importieren. Eine Möglichkeit wäre also CSV zu lesen. Es zeigt sich also automatisch. Geh dorthin, du schreibst den Titel dessen, was du importieren möchtest. In diesem Fall sind es Daten eins, theta ein Punkt CSV. Und wir kontrollieren Enter und Erbe. Das sind meine Daten, die ich hatte und jetzt liest es sie für mich. Das sind also alle Namen. Das Alter in Jahren, Geschlecht, Größe in Metern. Wie Sie sehen können, ist alles aufgetaucht. Dies ist jedoch nicht sehr nützlich, da wir die Daten nur gelesen haben. Die beste Möglichkeit, diese Daten zu nutzen, besteht darin, sich in ein Objekt zu verwandeln. Also kann ich den anderen Titel geben. Ich kann es alles nennen, aber ich gehe wieder mit Daten eins, um es mit diesem Pfeilzeichen leicht zu fühlen. Und lass mich das einfach lesen. Okay. Wie Sie sehen können, wird es hier oben angezeigt. Nun, wie gesagt, wann immer wir ein Objekt erstellen, oh, oder, weißt du, irgendwelche Funktionen, wird es in unserer Umgebung auftauchen. Es gibt also unsere Umgebung und was wir jetzt gemacht haben, ist ein Objekt neu erstellt. Dies ist der Titel der Objektdaten eins, und wir haben ihm etwas zugewiesen, und das ist diese Datei. Wir haben diese Datei in Daten eins zugewiesen. Um die Daten anzuzeigen, können Sie einfach hier unten
klicken und Sie können alles sehen. Neun Beobachtungen für Variablen. Es sind also vier Spalten und neun Zeilen, wie wir hier sehen können. Okay, also wurde das leicht erstellt. So importieren Sie Daten. Es ist sehr einfach und sehr einfach. Und so haben wir ein Objekt geschaffen. Es ist also sehr einfach zu bedienen und einfach. Jetzt werden wir weitermachen und diese Daten weiter manipulieren. Also die Manipulationen oder desto schneller
werden wir verwenden, wenn sie ziemlich einfach sein werden. Nur die Grundlagen davon. So
können wir das zum Beispiel tun. Okay? So neu richtig, hatte Daten auf eine Art und Weise. Es gibt uns die ersten sechs Beobachtungen, die wir haben, und alle Daten von dort. Jetzt, wie Sie können, haben wir
natürlich Schwanz und dann machen wir Daten. Eins. Ja, und natürlich Control Enter. Nun ist es sehr wichtig, dass wir uns über unseren Titel wirklich im Klaren sind, denn im Moment identifizieren sie keine Daten mit Kleinbuchstaben t, Kleinbuchstaben d, weil wir ursprünglich einen größeren Fall haben, dann ist dies der einzige Weg würde es erkennen. Wenn ich also das gesamte Kapital T ändere und versuche, die Liste zu laufen. Wie Sie sich erinnern, wird das Laufen kontrolliert. Plazenta wird uns den Summer sechs geben. Okay, das war also ganz einfach auf die Köpfe und Schwänze unserer Daten zu schauen. Nun, wir können auch die Daten selbst nachschlagen. Wenn also VJ, VJ Day 21 und wir auf Control Enter klicken, erhalten
wir dies automatisch hier. Diese Daten für uns, unsere Daten werden hier in einer sehr schönen Tabelle dargestellt und wir können gut sichtbar sein. Jetzt werden wir darauf zurückkommen. Und du kannst zurückwechseln, wann immer wir wollen. Es ist viel sauberer als das zu sagen, weil dies wirklich nur versucht, neun Beobachtungen und vier Variablen so
effizient wie möglich zu speichern . Okay? Also können wir wieder hierher kommen. Okay, jetzt wo wir das gemacht haben, versuchen
wir, Daten von hier zu extrahieren. Zum Beispiel möchten wir zuerst das Objekt schreiben, das wir ansprechen möchten. Das wären also Daten eins und was wir aus ihnen herausholen wollen. Also möchte ich zum Beispiel sehen. Die erste Zahl, die Sie immer eingeben werden, wäre die RI. Welche Rolle möchte ich ansprechen? Ich möchte die dritte Zeile und ich möchte sehen, welche Spalte, sagen
wir die erste Spalte. Und ich kontrolliere Enter. Nun, Zach, das gibt mir die Informationen. Zach aber, Rest davon ist Charlie Query,
David, Emily, Molly, und welche Art von Buch? Was wir wirklich gemacht haben, ist nur die dritte Reihe, wenn wir hierher zurückkehren, dass wir schnell sind. Zach. Das ist also richtig. Wenn wir nun ein bestimmtes Datum haben wollen, anstatt ein bestimmtes Datum zu unterbringen, können wir eine ganze Reihe haben. Also können wir das tun, indem
wir zum Beispiel die zweite Reihe nach unten ziehen , aber wir wollen, wir können das leer lassen. Sie können die Spalte also leer lassen. Und dann wird es uns die ganze Reihe geben. So wie es hier der Fall ist. Begonnen werden Emily 26 weiblich 175, Emily 26, weiblich 175. Und genauso können wir das für Theta eins tun. Wir können es tun, lass das leer. In der vierten Spalte D haben
wir allein eine vierte Spalte. Sieh einfach nach. Ja. Sie können also Control Shift Enter und es gibt uns alle Daten aus der vierten Spalte. Also wenn man es nur vergleichen soll, hier ist es. Und das haben Sie, und das sind nur einfache Manipulationen, wie Sie
bestimmte Daten aus unserem was auch immer extrahieren können. Okay, es gibt also muslimische Daten, anstatt sie nur wie
dieses spezifische Linien-Nachfrageniveau zu schreiben , und Sie sprechen mit jemandem, der tun kann, wenn wir Daten eins machen. Das ist also unser Objekt, das wir ansprechen wollen, das Dollarzeichen. Und dann inhaliere, wir können die spezifische Variable auswählen, von der wir die Informationen wünschen. Zum Beispiel will ich die Agenda. Und wenn ich auf Control Enter klicke, es mir alle verschiedenen, die mir diese bestimmte Variable geben. Oh ja, diese bestimmte Kolumne. Also weiblich-weiblich, wenn ich einfach hier klicken und es mit DNA vergleichen kann, und wir gehen einfach zum Geschlecht. Frauen, drei Männer bis Frauen, drei Männer und Frauen, männlich, weiblich. Es gibt ihm eine ganze Kolumne. Jetzt können wir das auch für alle anderen Variablen tun. Also Dollarzeichen und wählen Sie dann irgendeine und es sollte Ihnen diese Informationen geben, die Sie berücksichtigen. Dies war also eine sehr einfache Möglichkeit, Daten zu extrahieren. Ich hoffe, dieses Video war nützlich. Um es zusammenzufassen, hatten
wir einen wichtigen AKA-Daten, die ein Projekt erstellen und ein Objekt erstellen. Wie wir also hierher gekommen und dann Daten mit verschiedenen Methoden extrahiert haben, ist nicht der Head Tail, der dann bestimmte Daten und dann eine bestimmte Variable extrahiert. Ich hoffe also, dass das nützlich war und ich freue mich darauf, Sie in meinem nächsten Video zu sehen. Danke.
4. Lektion 3: Pakete: Hallo an alle und willkommen zu diesem Kurs. So werden wir heute weiter erfahren, was wir sind, und wir haben bereits eine kurze Einführung in das, was R ist, wie R und RStudio installiert und wie man Daten importiert, ein Projekt
erstellt und einige kleine Manipulationen von Daten enthält. Heute konzentrieren wir uns auf Pakete. Ich habe es schon kurz erwähnt. Diesmal werden wir etwas tiefer gehen. Pakete sind also kleine Codebündel oder vorprogrammierte Funktionen. Wir können, wir können sie installieren und verwenden, um so spezifische Probleme, sehr spezifische statistische Probleme und Daten so zu manipulieren, wie wir es wünschen. So einfach, wenn wir sie durchgehen und klarer verstehen. Okay, so schnell wollen wir ein Paket installieren, Pakete
speichern, sehr einfachen Code, den wir schreiben. Lasst uns Pakete installieren. Und wir öffnen Klammern, Sprachzeichen, und dann schreiben Sie den Namen des Pakets, das wir installieren möchten. Jetzt will ich Tidyverse. Und wegen der Vertikalen, installiert sind, muss ich es nicht installieren. Sobald Sie also nicht in RStudio gespeichert haben, müssen
Sie es nicht erneut installieren. Aber jedes Mal, wenn wir es verwenden möchten, müssen
wir
die Tidyverse Control Shift der Bibliothek schreiben die Tidyverse Control Shift der Bibliothek oder Tidyverse benötigen. Und natürlich habe ich die Redezeichen verpasst. Okay. Also wird es hier auftauchen. möchte bedauern, dass wir beide nicht nur einmal
verwenden müssen und Zahlungen aufheben wollen. Es ist bereits ein Effekt. Okay? Der Grund, warum ich tidyverse installieren möchte, ist, dass es nicht nur ein Paket ist. Tidyverse ist eine sehr mächtige Sammlung von Paketen. Es verwendet viele verschiedene Pakete, wie de playa, GG Plot zwei, sehr gut für die Datenvisualisierung, aber Sie werden dies durchstehen, wenn wir weiter in unseren Kurs gehen. Sobald Sie Tide of uns installiert haben, haben
wir Zugriff auf eine Reihe von Paketen. Heute konzentrieren wir uns hauptsächlich auf Pakete, die sich auf Datenmanipulation beziehen. Die spezifischen Funktionen, auf die wir uns konzentrieren werden, besteht beispielsweise darin, bestimmte Variablen aus dem gesamten Datensatz
auszuwählen. Filtern bestimmter Daten, die wir aus einem großen Datensatz haben möchten. Daten beispielsweise
in einer bestimmten Reihenfolge anordnen , mutieren und zusammenfassen. Um diese Manipulation durchzuführen, müssen
wir also Zugriff auf Daten haben. Und wenn Sie meine vorherige Lektion gesehen haben, haben
wir bereits ein Objekt erstellt. Wir haben unsere Daten in ein Objekt verwandelt, das wir hier sehen können. Das sind also unsere Daten, die wir heute verwenden werden, und wir werden diese Daten manipulieren. Okay, jetzt, da wir eine kurze Einführung hatten, werden
wir zunächst unsere Daten verwenden und sehr
auswählen, eine ganz bestimmte Variablen auswählen. Zunächst schreiben wir Daten auf, die unser Objekt sind,
und es sind diese Daten, mit denen wir es zu tun haben. Und was wir verwenden, heißt Rohrantrieb. Also Control Shift plus M und bezieht diese drei Zeichen zusammen. Und was dieser Punkt ist, bringt Daten irgendwie auf einen Pfad und lässt sie
wie ein Filtrationssystem durchlaufen , was wir mit ihnen machen wollen. Was wir also tun werden, ist zum Beispiel, Sie nur wenige Variablen wie IEEE nur eine auswählen, den Namen und die Höhe. Also jetzt, da ich die Kontrolle erledigt habe und wir haben speziell nur den Namen und die Höhe aus all diesen Daten. Wir haben nur die Namen und die Höhe. Sehr einfach zu bedienen. Natürlich können wir weitere Variablen hinzufügen, z. B. willst du auch Alter? Und dazu haben wir jetzt einen Namen erhöhtes Alter. Es ist also sehr einfach zu bedienen. Wir haben die Daten gerade auf das eingegrenzt, was wir konkret wollen. Das ist also nur eine Auswahl. Was wir auch tun können, ist die Daten zu filtern. Um die Daten zu filtern, ist
es derselbe Prozess. Wir kommen zu Daten eins. Und wieder benutzen wir den Rohrantrieb. Jetzt schreiben wir Filter und wir machen das Alter von 24 Jahren. Wenn ich das also durchmache, gibt
es mir die Informationen für jeden, der unter 24 Jahre alt ist. Es fühlt sich also in meinen Daten an, genau nach dem zu suchen, wonach ich suche. Also wenn ich das auf irgendeinen Tag ändere, ist es acht. Wenn ich es in etwas ändere, das länger als 24 Jahre älter als 20 Jahre ist, geben mir
alle den Rest der Daten. Wenn wir jetzt hinüberschauen, haben wir
das jetzt, weil wir es mehr
oder weniger getan haben , als wir David in keinen von
ihnen bekommen haben, weil es nicht gleich war, weil David
bereits 24 ist und wir es nicht getan haben hol ihn als einen unserer Datensätze. Es ist also sehr wichtig, auf diese Dinge zu achten. Das nennt man also Filtern unserer Daten. Und natürlich können wir noch mehr dazu beitragen. Zum Beispiel können wir tun und und und Höhe. Also lasst uns das versuchen. Es ist also jeder im Alter von über 24 Jahren und einer Breitenhöhe über 1,7. Es hat uns also alle Datensätze für sie gegeben. Wir können dies in Kombination verwenden, damit Sie es
auswählen können und wir wollen nur den Namen, das Alter und die Größe. Und dann können wir den Begriff für die spezifischen Daten nachfüllen, damit wir so etwas wie Janda nicht bekommen. Wenn wir die Agenda nicht rausholen wollen, wollen
wir die Namen nicht. Wir könnten das tun und mich den Namen herausnehmen lassen. Jetzt wollen wir nur die Größe und das Alter der Menschen, aber wir wollen auch filtern. Zum Beispiel, warum
ich es schon einmal getan habe, um zu zeigen, wie man verschiedene Funktionen kombiniert. So kann ich altern und ich kann wieder 24 machen, Größe. Auch hier kann ich 1.71.7 machen. Und lass uns das machen. Das gibt mir die gleichen Daten, aber wir haben gerade den Namen entfernt. Wir wollten also nur, dass das erhöhte Alter sieht, wie viele Daten wir zum Beispiel haben. So kombinieren wir auch verschiedene Funktionen. Wer würde sich also hier die Auswahl von Daten und Filtern ansehen? Was wir jetzt auch tun können, ist es zu arrangieren. Wenn ich mir zum Beispiel genau die gleiche Funktion ansehe, die wir gemacht haben, können
wir dies arrangieren. Und um es zu arrangieren. Und wir können wie Arrangeur nach Höhe tun. So hat es dafür gesorgt, dass wir von der kleinsten zur größten Seite gehen. die gleiche Weise können wir das tun, arrangiert
der Iterator von hoher TBA es zum Beispiel ab dem Alter. Und das, denn von 2006 bis Titan II sind
dies natürlich nur die Daten, die wir bereits für Alter über 24 Jahre und eine Körpergröße über 1,7 gefiltert haben. Okay? Wir haben also bereits das Auswählen, Filtern und Arrangieren übergegangen. Jetzt werden wir die mutierten Daten durchgehen. Auch hier verwenden wir den Rohrantrieb, daher werden unsere Daten durch einen Rohrantrieb verlaufen. Und zum Beispiel wollen wir es mutieren, sagen wir, wir wollen die Höhe ändern und wir wollen das mal um eine 100 machen. Weil die Höhe in Metern liegt, wenn ich mal ein 100-prozentiges Bild habe, hängt
das davon ab, worauf Sie achten möchten. Zum Beispiel ist es wirklich einfach, wenn Sie die Einheiten von etwas wie Heroin ändern
oder die Höheneinheiten von Metern auf Zentimeter ändern möchten. Und hier ist es. Es sind dieselben Daten, aber wir haben eine andere, wir haben eine andere Zeile, eine andere, tut uns leid, wir haben eine andere Variable, die die Meter mal 100 ist. Wie Sie sehen können, hat sich der Titel hier geändert, weil den Titel in Höhe
geändert hat, Meter mal 100. Würde es uns also die Zentimeter geben und es gibt uns jedermanns Höhe in Zentimetern. Das macht es sehr einfach, mit Daten zu arbeiten, die Sie nur in einer bestimmten Einheit wünschen. Dies ist etwas, das wir können, wissen Sie, dies ist ein sehr kleines Beispiel, aber wir können es für komplexere Funktionen verwenden. Und um sich damit vertraut zu machen, müssen Sie, wissen
Sie, etwas erfahrenere Suche, etwas mehr Online-Sachen wie eine andere Art von Websites, um zu sehen, welche anderen Mutationen wir tun können. Weil dies wirklich ein Thema ist, über das wir einfach weiter lernen müssen. Wir können nicht alle Funktionen von auswendig lernen, aber wir müssen sie immer erforschen. Okay? Die letzte Funktion, auf die ich mich konzentrieren möchte, ist die Zusammenfassung der Daten eines Rohrantriebs. Fassen Sie zusammen. Okay? Was das tut, ist, dass es mir eine bestimmte Variable gibt. Zum Beispiel fasst die mittlere Höhe die gesamte Variable, alle Variablen oder die gesamte Höhenvariable zusammen. Und es gibt es mir als, weißt
du, einen Median, den Median, den ich maximal machen kann. Es gibt mir also die höchste Höhe, die es gibt, und das sind 1,82. Und wenn wir dies mit unseren Daten vergleichen, machen
wir dies manuell. Warum kann der Median nicht? Es sollte das Gleiche sein. Das ist also, wie ich bereits erwähnt habe, zusammengefasst, dies einige sehr kleine und sehr grundlegende Beispiele für die Manipulation von Daten sind. Verstehen Sie
komplexere Funktionen oder komplexere Codes, die wir mit tidyverse oder anderen Funktionen verwenden können. Wir müssten uns mehr Nachforschungen anstellen und
nachschlagen , je nachdem, was wir in unseren Daten benötigen und was wir manipulieren. Weil es unzählige Pakete gibt, die wir für unsere Daten verwenden können, um ein zu erstellen, es einfacher und überschaubar für uns zu
machen. Okay, jetzt stellt sich die Frage, woher holen wir die Pakete und wo finden wir was wir brauchen? Der einfachste Weg, dies zu tun, besteht darin, auf die Website von uns selbst zu gehen. Okay, jetzt bin ich wieder auf der Website, vor der Ben, hey, buffoonery oder downloaden. Wenn wir hier
rübergehen, geh zurück zur automatischen. Sie können hier sehen, dass es eine Option für Pakete gibt. Und sobald wir hier klicken, wird uns eine Tabelle der verfügbaren Pakete angezeigt, sortiert nach Veröffentlichungsdatum oder nach Namen. Und dann hey, wir können zum Beispiel genau nach dem
suchen, was wir wollen. Es ist also ein bisschen so etwas, aber so werden wir finden, was wir wollen, und dann
können wir es herunterladen, je nachdem, was wir brauchen,
das spezifische Paket, das wir für unsere Daten wünschen, für die Art von Manipulation, die wir wollen. Okay, also hoffe ich, dass das nützlich war. Es war eine kurze Einführung in die Installation von Paketen und einige spezifische Manipulationen mit dem tidyverse-Paket oder de playa, das das spezifische Paket in tidyverse war, das wir verwendeten. Und wirklich das noch einmal, wir erforschen und lernen und haben Spaß damit. Also hoffe ich, du hast etwas gelernt und wir sehen uns in meiner nächsten Lektion. Danke.
5. Lesson 4: Schattierungen: Hallo an alle und willkommen zurück zu diesem Kurs. Also werden wir uns weiterhin Pakete ansehen. Wir hatten bereits das Glück,
Tidyverse zu installieren und Tide of uns zu nutzen, um Daten zu manipulieren. Heute werden sie so sein, als wäre eine App für die Datenvisualisierung
abwechslungsfrei . Jetzt können wir damit Daten
auf viele verschiedene Arten visualisieren, von Histogrammen über Boxplots bis hin zu Zeilendiagrammen. Aber genau heute werden wir uns Scatter-Plots ansehen. Daher habe ich Richtlinien, wie
Sie ein Streudiagramm erstellen und mithilfe von Daten, die wir haben, Änderungen daran
vornehmen können. Und in zukünftigen Videos konzentrieren
wir uns auf verschiedene Arten der Datenvisualisierung, um
ein Streudiagramm mit schnellem und Zugriff auf Daten zu erstellen . Also bringe ich Schwärze Iris nichts an. Dies sind Daten, die mit tidyverse existieren. Wenn Sie dies also verwenden, können
wir dies einfach anhängen und ansehen. Okay, das ist in Ordnung. Jetzt kann ich die Steuerbehörde ansehen. Das ist sehr vorsichtig, alle
Feststelltaste zu sein , weil sehr kleiner Unterschied und eine sehr große Änderung im Code vornehmen. Jetzt sind dies nur Daten, die existieren und wir werden
heute so investieren , um eine Scatter-Plot von okay zu erstellen, so wie ich bereits in einer
der Anfang und der ersten Lektion gesagt habe, glaube ich, was wir haben jetzt sind nur Daten, aber wir müssen dies in ein Objekt verwandeln, das wir verwenden können. Weil es nur täglich Holz hat, ist
es wirklich schwer zu manipulieren. Also werde ich jetzt einen Titel IRS machen, das ist das Objekt, das ich will und eine RI erstellen. Und dann möchte ich dem Thema etwas zuweisen. Also werde ich dem Iris zuweisen. Jetzt wollen die meisten Leute diesen Namen ändern,
dieses Objekt hat im Leben etwas
anderes benannt , um es so zu halten, wie es ist, aber es erleichtert die Verwendung und Verständigung. Okay, also haben wir dieses Objekt aus
150 Beobachtungen von fünf Variablen erstellt . Wir werden dieses Objekt also mit
diesen Daten verwenden , um unser Streudiagramm zu erstellen. Und es ist sehr einfach. Wir würden GG-Verschwörung machen. Jetzt verwenden wir GG Plot, da es sich ein bestimmtes Paket innerhalb von tidyverse handelt, das für die Datenvisualisierung verwendet wird. Also die Daten, die wir wollen, Iris und V, oder? Was die Statik angeht, und dann öffnen wir Klammern und wie Sie hier sehen können, zeigt uns x und y schnell. Was wir also als unsere X-Achse wollen
und was wir uns alle Y-Achsen haben wollen, setzen
wir es in der gleichen Reihenfolge ein. Ich möchte also, dass meine Musterlänge mein x und meine Blütenblattbreite meine Y-Achse ist. Also gebe ich das einfach in der gleichen Reihenfolge in meine Klammern ein. Blütenblattlänge, ja. Und dann Blütenblattbreite. Okay. Control, Enter auf einem Plot wird hier angezeigt. Wenn Sie nun sehen können, dass es
keine Punkte in geometrischen Punkten für die Daten gibt , haben
sie sie gerade als x und y dargestellt. Um dies einzubeziehen, können
wir einen Geompunkt hinzufügen. Und lasst uns das laufen lassen. Und hier sind wir. Es hat uns auch die geometrischen Punkte für die Daten gegeben. Okay, das ist also wirklich die Grundlagen zum Erstellen eines Scatter-Plots. Wir mischen GG Plots, das Paket, das Sie verwenden möchten. Wir planen, ich lasse die Daten, die wir wollen, dann eine Statik, AES, unser x und y. Und dann um zu sagen, dass wir auch die Datenplots wollen. Und das können wir auch ein bisschen ändern. Zum Beispiel können wir hinzufügen, dass wir wollten die Größe jedes Plots
beispielsweise fünf sein sollte, und dann diese viel größer laufen lassen. 3, ich denke, es ist besser. Okay? So können wir kleine Anpassungen vornehmen, wie wir möchten. Okay? Für diese spezifischen Daten funktioniert
diese Zeile nicht, weil sie
nicht verbunden ist. Es sind andere Blütenblätter oder verschiedene Blumen, die wir verwenden und es macht keinen Sinn, Align hip zu verwenden. Jetzt fügen wir eine Linie hinzu, wenn Sie ein Liniendiagramm erstellen
möchten, aber dies ist ein Streudiagramm, daher
brauchen wir es nicht unbedingt. Also bin ich einfach glücklich, es so zu lassen. Lass mich einfach meine Konsole reinigen. Und es taucht mit anderen Zeilen auf. Wie ich weiß,
können wir dies ein bisschen komplexer gestalten,
indem wir zum Beispiel eine Farbe hinzufügen, indem wir zum Beispiel eine Farbe hinzufügen die nicht nur durch eine zufällige Farbe bestimmt wird. Wenn ich also bin, dann ist Farbe gleich Spezies. Und lass das laufen. Okay, in unseren Daten
hatten wir drei verschiedene Arten von Arten. Was sie nun getan haben, ist, dass
die verschiedenen Arten in
verschiedene Farben getrennt die verschiedenen Arten in wurden, indem sie einfach
die einfache Art von Farbe gleich Spezies hinzufügen . Es ist also eine sehr gute Möglichkeit unsere Daten zu
analysieren und das Lesen zu erleichtern. Also vorher waren es nur verschiedene Punkte und überall
nur verschiedene Punkte und
verschiedene Scatter-Plots. Auf diese Weise können wir bestimmte Daten sehen, die wir ansprechen möchten, nicht zuhören, wir haben dies getan. Wir können weiter manipulieren,
indem wir Änderungen an der Größe
der verschiedenen Punkte vornehmen, anstatt die Größe nur drei, sagen wir 50, zu machen. Vermisse das. Ich kann hierher kommen und ich kann sagen, dass die Größe
beispielsweise dadurch bestimmt werden soll, was wir wollen? Hey, die Locard-Daten waren spezifisch, wir wollen zum Beispiel Kelchblätterlänge. Ich möchte, dass das bestimmt wird, um die Größe der spezifischen Plots zu bestimmen. Also kann ich das machen. Da ist es. Und lass mich diesen Test machen. Es hat also auch einen anderen Schlüssel, den es erstellt hat. Die unterschiedliche Länge ist also, die unterschiedliche Größe des Grundstücks, wie wir sehen können. Dies ist also eine sehr gute Möglichkeit,
verschiedene Datenvariablen in ein Streudiagramm einzubringen . Wir können die Farbe,
die Größe des Punktes
und wie, wie Sie die Daten darstellen, ändern die Größe des Punktes
und wie, . Das ist gut und leicht zu lesen, aber es gibt eine andere Möglichkeit die Daten der verschiedenen Arten
darzustellen, oder wir können das trennen, was Sie wollen. Lass mich dir das einfach zeigen. Wenn ich also einfach hierher gehe und ein Plus hinzufüge, kann
ich Vermögenswerte machen. Jetzt kauft es sich selbst ein oder Sie können es einfach eintippen. Gerade jetzt. In was soll es eingebrochen werden? Zum Beispiel wollte ich mich ausdrücklich mit Arten auseinandersetzen. Okay, lass uns das einfach ausführen. Okay, so wie wir diese Daten sehen können, ist
dies nicht mehr nur
durch die verschiedenen Farben der Art oder
die Kelchblattlänge getrennt durch die verschiedenen Farben der Art oder
die Kelchblattlänge und die Größe des Punktes wird für jeden ein
eigenes Streudiagramm erstellt verschiedene Arten. Okay, also hoffe ich, dass das nützlich war. Wir haben uns überlegt, wie man ein Streudiagramm erstellt, die Größe der spezifischen Daten ändern und sie etwas
zuweisen kann, wenn wir die Blattblänge gemacht haben, die Farbe etwas Bestimmtem
zuweisen, eine andere erstellen streuen Sie Plots im selben Diagramm. Es war also eine kurze Einführung in Scatter-Plots. Und dies gibt Ihnen das Vertrauen ein bisschen mehr
zu tun, um eine gute Datenvisualisierung zu untersuchen. Es ist eine sehr aufregende Gegend, in der man sein kann. Und mit unserer Datenvisualisierung werden
verschiedene Graphen so gut dargestellt. Ich denke, das ist definitiv einer der besten Punkte von uns Ich denke, ich hoffe, ihr habt etwas
gelernt und wir sehen uns in meiner nächsten Lektion. Danke.
6. Lektion 5: Bar: Hallo an alle und willkommen zurück zu diesem Kurs. Wir werden weiterhin etwas über Datenvisualisierung lernen. Und das vorherige Video haben wir über Streuplots erfahren. Und dieses Video konzentriert sich auf Balkendiagramme oder Balkendiagramme. Das erste, was wir wissen müssen, ist, dass es zwei verschiedene Arten von Balkendiagrammen gibt. Wenn ich das einfach hier aufschreibe, Geom Bar, kommt es in der Kopfzeile. Es gibt zwei Arten von Balkendiagrammen. Für eine kurze Erklärung der Unterschiede im Balken,
Geombalken , ist die Höhe des Balkens proportional zu den Fällen in dieser Gruppe. Während wir in G on Call hier wählen, welcher Wert die Höhe darstellen soll. In geom call geben wir ihnen zwei Werte, einen x und y, und schmuddelig und Bob, wir geben ihnen einen Wert. Und abhängig von der Anzahl dieser Werte, so hoch wird der Boss in der Gm-Balke sein. Dies wird viel besser erklärt, wenn ich Ihnen Beispiele für beides zeige. Okay? Um also nur Geom, Geombar oder
Geom zu erklären , sind sie beide Balkendiagramme. Und um diese zu erstellen, verwenden
wir erneut das Paket tidyverse, das wir auch zum Erstellen von Scatter-Plots verwendet haben. Und vor allem die GG-Handlung. Also wenn ich das einfach hier schreibe, j plus GG Plot und dann das Datum, das wir wollen. Jetzt haben wir es bereits vorher besprochen, dass Irisdaten dann tidyverse enthalten sind, und wir haben bereits in der vorherigen Lektion ein Objekt erstellt. Also beziehen wir uns nur darauf, dass ich hier benutze. Also Iris und ein Stat x. Dann öffnen wir das und wir atmen ein, wir
setzen diese eine Variable ein, weil wir Zink-Geom-Bar sein werden, wir können nur eine Variable malen. Zum Beispiel möchte ich mir die Spezies genau ansehen. Wie viele verschiedene Arten von Arten befinden sich auf der Bühne? Wenn ich mir diese Daten anschaue, wie Sie sehen können, gibt es hier verschiedene Arten von Arten. Ich möchte also einen Blick darauf werfen, wie viele dieser verschiedenen Arten von Arten wir haben. Wie Sie sagen, hey, so wie es bereits ist, würde
der Code nicht wissen, welche Art von Funktion er ausführen soll, es sei denn, wir tun
tatsächlich plus g, m Unterstrich bar. Und natürlich öffne und schließe Klammern. Und schwerer Kerl. Okay, das ist also kein gutes Beispiel, denn die verschiedenen Arten aller 50, 50, 50. Es zeigt also nicht wirklich den Unterschied zwischen ihnen, weil es keinen Unterschied gibt, wenn es die Daten erhält, wie Sie sehen können, es gibt 150, also 50 von jeder Spezies. Dies ist jedoch immer noch eine gute Möglichkeit, Ihnen den Unterschied
zwischen den verschiedenen Möglichkeiten zu zeigen , wie wir Daten in einem Balkendiagramm darstellen können. Einige kleine Manipulationen, die wir zum Beispiel machen können,
ist, dass wir Unterstriche hinzufügen können. Und natürlich bin ich plus Klammern gegangen. Okay? Also ist es, wir haben es gerade umgedreht, also haben wir die Achse geändert, wie es vorher war. Dies ist sehr nützlich, wenn Sie viele Daten haben und Sie nicht möchten, dass all dieses Schreiben auf der X-Achse zu bündelt ist. Wenn Sie dies also,
die Schriften auf der Y-Achse, setzen , können
Sie viele verschiedene Arten von vielen verschiedenen Balkendiagrammen haben. Kann verschiedene Balken für das Balkendiagramm sein. Ich schätze, eine andere Manipulation, die wir nicht machen können, ist, dass wir
den Titel der verschiedenen Achsen ändern können . Das können wir durch denke plus labs machen. Und dann unser x, was immer wir hier hineinsetzen, Komma und dann y, was immer Sie in die Redezeichen setzen, Komma, dann Titel. Okay? Bei unserer X-Achse ist
zu beachten, dass dies, obwohl dies wie unsere X-Achse aussehen mag, immer noch die Y-Achse ist. Wir haben es gerade umgedreht. Die Achse selbst hat sich nicht geändert. Wenn wir dies also ändern wollen, ist
dies immer noch die Y-Achse und wir möchten dies vielleicht nennen, zum
Beispiel unser x anstelle von Arten, unser Name es zum Beispiel SP. Und was den Titel angeht, nicht sicher, also vielleicht einfach keine. Und lass uns das einfach machen. Okay. Hier ist seine Artennummer und kein Titel, weil wir nicht auf eins gegeben haben. Okay, das war also eine kurze Einführung in den Geombalken, bei dem es sich um eine Art von Balkendiagramm handelt. Die andere Art von Beobachter, die wir uns ansehen werden, ist ein Geom-Anruf. Okay, also eine Sache, die wir wissen müssen Fujian ist, dass wir ihm zwei Variablen geben müssen, und x und das y. Um das zu tun, müssen wir
also manipulieren, dass unsere Daten
zu einer der Lektionen zurückkehren , die wir am Anfang hatten Daten manipulieren und diese in die Tat umsetzen. Also möchte ich zum Beispiel die Iris-Daten verwenden. Und ich möchte Shift M steuern, es durch den Filter führen. Und dann zum Beispiel, wenn ein Clip für Clip auf die Schule nach Arten. Alle Daten, die wir haben, werden also nach Arten gruppiert. Und noch einmal können wir es durch die Pfeife nehmen und wir können zum Beispiel zusammenfassen, und wir können zum Beispiel zusammenfassen. Jetzt möchte ich hier eine neue Variable erstellen, zum Beispiel PM und gleich dem Median der Blütenblattlänge. Okay? Jetzt, da wir diesen alten Lauf geschaffen haben und das ist es, was wir für die verschiedenen Arten
bekommen, waren sie mittellang, so dass wir nur eine Zahl für jede bekommen. Es wird die Willen der Balkendiagramme für uns viel einfacher machen. Deshalb mache ich so kleine Daten und natürlich die zweite Überarbeitung der Datenmanipulation, die wir in unseren früheren Lektionen gelernt hatten. Jetzt sind diese Daten an sich nicht so nützlich, daher müssen wir dies in ein Objekt verwandeln, um den Umgang mit ihnen einfacher zu machen. Also SB für Arten und PL 4 Blütenblätter Länge. Also können wir das machen und lassen Sie uns das machen. Und hier sind wir. Wir haben ein anderes Objekt mit drei Beobachtungen von zwei Variablen erstellt. Okay, jetzt wo wir diese Daten haben, können
wir dies in einem Balkendiagramm plotten. Also lasst uns GG offene Klammern plotten. Jetzt die Daten, die Sie verwenden möchten, nämlich SP, PL, denn dies sind die Daten, die wir hier haben. Und AES. Nun, wie ich bereits sagte, eine G-on-Call verwenden und die Gm-Bar mit Jiang Call entfernen, werden wir ihnen t-Variablen geben. Hier müssen wir also zwei verschiedene Variablen setzen und Sie haben bereits zwei Variablen. Das wären also Arten, ja, und pl. Okay? Wie Sie sehen können, ist nichts aufgetaucht weil wir ihnen keine Funktion zum Arbeiten gegeben haben. Denken Sie also immer daran, ein G auf Abruf zu stellen, wenn Sie B18 anrufen oder Geombar möchten, Gm bar. Okay? Jetzt haben wir die mittleren Blütenblattlängen für alle drei verschiedenen Arten von Arten, wie wir es hier haben. Eine Sache heute Abend ist, dass wir Geom namens HIPAA haben. Wenn wir dies auf Bar in G geändert haben, wird
es nicht funktionieren. Sie erhalten eine Fehlermeldung, da hier angegeben wird, dass sie nur ein x über y haben kann. Wir können nicht voreingenommen haben, wenn wir Gm bar haben, weshalb Sie G auf Abruf verwenden würden. Also ja, das ist wieder aufgetaucht. Jetzt können wir auch hier wieder dieselben Manipulationen anwenden. Dreht sich also noch einmal um, um es einfach zu machen, wenn es viele verschiedene Datenvariablen gibt, die verschiedenen Arten von Arten, die es einfacher machen würden, geschrieben zu sehen, anstatt überhaupt das Konto hier oben. Okay. Aber ich will nicht unbedingt, also ziehe ich das weg. Und wieder einmal können wir Labors verwenden, um ihm einen Titel zu geben. Zum Beispiel möchte ich, dass x high ist. Es ist nicht sehr praktisch. Aber vergessen Sie als Beispiel nicht die Sprachzeichen. Und dann wäre der Titel x. Jetzt ist dies definitiv nicht das, was der Graph zeigt. Dies nur um zu zeigen, dass wir die Variable,
die Titel dieser verschiedenen x,
y und den Titel des gesamten Balkendiagramms ändern können die Titel dieser verschiedenen x, . Weil das nicht sehr praktisch ist. Also lasst uns das einfach entfernen, was wir ernennen lassen und zeigen, dass sich dies ändern kann. Und das können wir sehr leicht ändern. Und wir werden wieder einen eigenen PR- und Artentitel annehmen. Okay, also das waren Balkendiagramme und Balkendiagramme, ich hoffe, dass es nützlich war. Wir haben die beiden verschiedenen Typen besprochen. Wie man sie plottet, wie man Änderungen an ihnen vornimmt, wie man den Titel ändert. Wenn Sie mehr darüber erfahren möchten, ist es nur eine Frage, damit herumzuspielen, um ehrlich zu sein. Es ist also ein großartiger Ort, um von dort aus zu beginnen. Und ich hoffe, du hast etwas gelernt. Wir sehen uns in meiner nächsten Lektion. Danke.
7. Lektion 6: Mehr Datenvisualisierung: Hallo an alle und willkommen zurück zu diesem Kurs. Dies wird also unsere letzte Lektion zur Datenvisualisierung sein. Wir haben uns bereits die Datenvisualisierung in Bezug auf Scatter-Plots und Balkendiagramme angesehen. Heute werden wir einen kurzen Blick auf die anderen Arten von Datenvisualisierungen wie Histogramm, Boxplots und Liniendiagramme werfen. Okay, also fangen wir an, wie wir es normalerweise tun. Gg plotten Klammern, unsere Daten,
IRS, ABS-Klammern und die Daten, die spezifische Variable, die sie ansprechen sollen. Dafür schneller als wir ein Histogramm erstellen werden. Und das Histogramm können wir nur in
eine Variable einfügen , die uns das Histogramm präsentieren sollte. Also hier drin würde ich Blütenblattlänge. Und wie gesagt, müssen
wir die Funktion ausdrücken, die wir brauchen. Es wäre also GO-Unterstrich-Histogramm. Und das läuft das. Okay, das ist also unser Histogramm. Jetzt
essen natürlich diejenigen, die mit Histogramm vertraut sind, wenn Sie die Bandbreite ändern möchten, wenn Sie die Bandbreite ändern möchten, Süßigkeiten, die wir können. Wie ein Inhere schon sagt, dass es mit der Standardeinstellung verschwunden ist. Dann hey, wir gehen mit, um uns umziehen zu wollen. Es müsste in die Klammern gehen. Ben. Dann breite, und ich werde mit einem gehen, der das läuft. Okay, und das Erbe. So können wir dies natürlich ändern, wie wir möchten, was
für unsere Daten geeignet ist , und präsentieren es auf die effizienteste und effektivste Weise. Also 2s eindeutig nicht gut. Wir können sogar mit 0.5 gehen. Okay, also danke euch allen. Danke fürs Zuhören. Wir können damit herumspielen, um es auf das zu ändern, was für unsere Daten am besten ist. So würden wir also ein Histogramm erstellen. Eine andere Art von Daten und ein Fokus auf das Erstellen von Boxplots. Also GG Plot, IRS ein VS. Und bei Boxplots müssen wir in zwei verschiedenen Variablen bezahlen. So möchte ich zum Beispiel die Art und dann die Kelchblätterlänge. Und natürlich sollte ich ihm eine Funktion geben, um ein Boxplot, Geom-Unterstrich-Boxplot zu erstellen. Okay, Harris sagt also, dass dies den Boxplot für die verschiedenen Arten von Arten zeigt. Ein Boxplot gilt für die unterschiedliche Kelchblattlänge. Dies wäre also unser Interquartilbereich, Q12 und 3, und unsere höchsten
und niedrigsten Werte für jede verschiedene Spezies. Und sie haben hier auch eine Anomalie für uns gemacht. Okay, das ist also eine sehr einfache Möglichkeit, einen Boxplot zu zeichnen. Je mehr wir Erfahrung machen und damit beginnen, desto mehr können Sie Änderungen vornehmen, aber das wird Erfahrung und Zeit und wie viel von der Forschung darüber recherchiert werden. Okay, also der dritte Tippen auf eine kurze Berührung ist ein Liniendiagramm. Also GG Plot, IRS, wie zum Beispiel, möchte ich Blütenblattlänge und Blütenblattbreite machen. Okay? Jetzt setzen wir die Funktion ein, und in diesem Fall möchte ich eine G-M-Unterstrich-Zeile. Und lasst uns das laufen lassen. Okay, also hat es uns diese Zeile gezeigt. Husten. Das ist natürlich nicht ideal, denn in einem Liniendiagramm würden
wir erwarten, dass wir eine Daten haben. Es wäre eine Daten für jede X- und Y-Achse. Und wenn wir unsere Daten betrachten, dies nicht die besten Daten, um ein Liniendiagramm zu zeichnen. Aber wir haben die Idee bekommen, wie wir uns daran beteiligen können, was zu ändern ist. Nun sind es, wie wir sehen können, es dieselben Prinzipien. Geom-Boxplot, Geom-Histogramm, Geom-Linie. Und es gibt viele weitere Funktionen, auf die wir an Land stoßen können. Also habe ich, das war nützlich und ich hoffe, dass es Ihnen mehr als nur gesagt hat wie
Sie diese verschiedenen Aspekte nutzen da Sie das Vertrauen haben, etwas über sich selbst zu erfahren. Weil ich denke, dass das das Wichtigste beim Lernen über Programmierung ist. Und Lernen liegt vor allem daran, dass ständig Pakete entwickelt werden. Wenn Sie also etwas Bestimmtes suchen, müssen
Sie graben und das Paket finden, das Sie benötigen. Es ist wirklich wichtig, dass wir die Fähigkeit beherrschen, zu suchen und zu recherchieren und zu finden, was wir wollen. Okay, also danke euch allen. Danke fürs Zuhören.