Angewandte Data Science – 1: Übersicht | Kumaran Ponnambalam | Skillshare

Playback-Geschwindigkeit


  • 0.5x
  • 1x (normal)
  • 1.25x
  • 1.5x
  • 2x

Angewandte Data Science – 1: Übersicht

teacher avatar Kumaran Ponnambalam, Dedicated to Data Science Education

Schau dir diesen Kurs und Tausende anderer Kurse an

Erhalte unbegrenzten Zugang zu jedem Kurs
Lerne von Branchenführern, Ikonen und erfahrenen Experten
Eine Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Schau dir diesen Kurs und Tausende anderer Kurse an

Erhalte unbegrenzten Zugang zu jedem Kurs
Lerne von Branchenführern, Ikonen und erfahrenen Experten
Eine Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Einheiten dieses Kurses

9 Einheiten (1 Std. 44 Min.)
    • 1. Über angewandte Data

      8:12
    • 2. Was ist Data Science – eine

      11:51
    • 3. Was ist die Data Science – Zwei

      10:44
    • 4. Was ist die Data Science – drei

      12:55
    • 5. Was ist die Data Science – vier

      9:31
    • 6. Anwendungsfälle für Datenwissenschaft.

      7:47
    • 7. Data – Einrichtung

      11:46
    • 8. Data – Datenerfassung – Data

      11:57
    • 9. Data – Analyse und Produktion

      19:16
  • --
  • Anfänger-Niveau
  • Fortgeschrittenes Niveau
  • Fortgeschrittenes Niveau
  • Alle Niveaus

Von der Community generiert

Das Niveau wird anhand der mehrheitlichen Meinung der Teilnehmer:innen bestimmt, die diesen Kurs bewertet haben. Bis das Feedback von mindestens 5 Teilnehmer:innen eingegangen ist, wird die Empfehlung der Kursleiter:innen angezeigt.

1.099

Teilnehmer:innen

--

Projekte

Über diesen Kurs

Dieser Kurs ist Teil der „Angewandte Data "Applied auf SkillShare präsentiert von V2 Maestros. Wenn du den gesamten Kurs durchgehen möchtest, melde dich bitte für alle anderen Kurse und führe sie in der angegebenen Sequenz durch.

Dieser Kurs konzentriert sich auf den Überblick über die Datenwissenschaft. Darin erklärt, wie die Data Science von Datenelemente durch Beziehungen und Vorhersagen funktioniert. Dann geht es durch die Phasen eines Data Science Projekt

Triff deine:n Kursleiter:in

Teacher Profile Image

Kumaran Ponnambalam

Dedicated to Data Science Education

Kursleiter:in

V2 Maestros is dedicated to teaching data science and Big Data at affordable costs to the world. Our instructors have real world experience practicing data science and delivering business results. Data Science is a hot and happening field in the IT industry. Unfortunately, the resources available for learning this skill are hard to find and expensive. We hope to ease this problem by providing quality education at affordable rates, there by building data science talent across the world.

Vollständiges Profil ansehen

Kursbewertungen

Erwartungen erfüllt?
    Voll und ganz!
  • 0%
  • Ja
  • 0%
  • Teils teils
  • 0%
  • Eher nicht
  • 0%
Bewertungsarchiv

Im Oktober 2018 haben wir unser Bewertungssystem aktualisiert, um das Verfahren unserer Feedback-Erhebung zu verbessern. Nachfolgend die Bewertungen, die vor diesem Update verfasst wurden.

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Nimm an prämierten Skillshare Original-Kursen teil

Jeder Kurs setzt sich aus kurzen Einheiten und praktischen Übungsprojekten zusammen

Mit deiner Mitgliedschaft unterstützt du die Kursleiter:innen bei Skillshare

Lerne von überall aus

Ob auf dem Weg zur Arbeit, zur Uni oder im Flieger - streame oder lade Kurse herunter mit der Skillshare-App und lerne, wo auch immer du möchtest.

Transkripte

1. Über angewandte Data: Hey, willkommen zum Kurs sind Datenzeichen mit unserem Dies ist Ihr Lehrer, Cameron Parnham gehören aus Video Mastro's Let's Go Through und verstehen, worum es bei diesem Kurs geht. Das Ziel des Kurses ist es, Studenten zu ausbilden, um vollwertige Datenpraktiker zu werden. Daher konzentrieren wir uns darauf, Menschen zu Praktizierenden zu machen, die in Ereignisdaten ausführen können, da das Projekt von Anfang an Daten bis hin zur Transformation, Laden in ein endgültiges später unser Ziel und dann Durchführung von Organanalysen auf schließlich Erreichen einiger Geschäftsergebnisse aus dieser Analyse, was tun Sie Was Sie, indem Sie diesen Kurs nehmen, ist Sie verstehen das Konzept und die Konzepte der Datenzeichen, Sie verstehen die verschiedenen Phasen in der im Lebenszyklus von einer Data Science -Projekt entwickeln Sie Fähigkeiten, um unsere ANDI nutzen zu können, sind in allen Phasen von ANALITICO direkt von explorativen Datenanalyse bis hin zur Direktive pro Stunde. Es dauert bis zum Modellieren der Zehe. Schließlich die Vorhersage mit maschinellen Lernalgorithmen lernten die verschiedenen Data Engineering-Tools und Techniken über die Datenerfassung und Bereinigung von Daten auf Transformation Daten. Erworbene Kenntnisse über den Freund Machine Learning Techniken auf auch lernen, wie Sie sie verwenden können und vor allem, dann können Sie sie zu einem vollwertigen Data Science Praktiker werden und wer kann sofort beitragen Daten aus dem realen Leben. Wissenschaftsprojekte nichtzu erwähnen, dass Sie dieses Wissen zu Ihrem Interview bringen wollen , damit Sie eine Position in Data Science bekommen können. Terry war diese Praxis, die wir dieses besondere Ding von Theorie gegen Praxis, Daten, Zeichen, Prinzipien, Tools und Techniken berühren wollten Praxis, Daten, Zeichen, Prinzipien, Prinzipien, . Bild aus verschiedenen Schildern und Ingenieurdisziplinen. Nein, sie kommen aus Informatik, Informatik , Information, Information, Terry Wahrscheinlichkeit und begann Sticks, künstliche Intelligenz und so eine auf theoretische Studie von Daten Zeichen es konzentrieren sich auf diese wissenschaftliche Grundlage und Argumentation aus den verschiedenen Mission Learning Gardens. Es konzentriert sich auf den Versuch zu verstehen, wie diese Mission Salgados Arbeit in einem tiefen Sinn lernen kann, um Ihre eigenen Algorithmen auf zu entwickeln. Entwickeln Sie Ihre eigene Implementierung dieser Algorithmen, um einen echten Ball Probleme vorherzusagen. Nur einer wohnt in viel weg in unseren Gleichungen und formell über Entbehrungen und Argumentation. Während der Pakt ist auf der Spitze spät an einem Teil der Daten, Wissenschaft konzentriert sich auf ein Spiel die Werkzeuge, Prinzipien und Techniken, um Geschäftsprobleme zu lösen bekommen den Fokus auf den Versuch, vorhandene Techniken und Werkzeuge und Bibliotheken zu verwenden auf wie Sie diese nehmen und ein Spiel sie wirklich Probleme zu arbeiten und kommen mit Geschäft verdient. Dieser konzentriert sich auf ein angemessenes Verständnis der Konzepte und Kenntnisse darüber, was die Tools und Bibliotheken zur Verfügung stehen, wie Sie diese Tools und Bibliotheken verwenden können, um reale Probleme zu lösen . Dieser Kurs konzentriert sich also auf die Praxis aus späteren Zeichen, und deshalb heißt es Applied Data Science Neigung der Kurse. Diese Datenwissenschaft ist ein transdisziplinäres Thema, und es ist ein komplexes Thema. Es geht nicht vor allem um drei technische Bereiche, auf die man sich konzentrieren muss. Es gibt also Mathematik und Statistiken, die Mission Learning ist. Und es gibt Programmierung auf diesem Kurs ist darauf ausgerichtet. Wissen Sie, Programmierung orientiert sich an bestehenden Software-Profis. Es ist stark auf Programmierung und Lösungsaufbau fokussiert. Es hat begrenzt und verlangte erforderliche Explosionsbelastung. Die Mathematik und Statistiken auf sie deckt Überblick Off Machine Learning Konzepte gibt Ihnen artikulieren Verständnis davon, wie diese maschinelles Lernen alle bewacht sie Bücher. Aber der Fokus liegt auf der Verwendung des vorhandenen Tools zur Entwicklung der realen Welt Lösung. In der Tat, 90 95% andere Arbeit, die später Wissenschaft Zeit. Nur tun in der realen Welt ist die Praxis der Datenwissenschaft. Nicht wirklich, Terry, von größerer Wissenschaft und dieser Kurs ist bestrebt, die Dinge einfach und sehr leicht zu verstehen. Also haben wir das definitiv sehr einfach gemacht. Wir haben uns von einigen der komplexen Konzept ferngehalten. Entweder haben wir versucht, den Ton nach unten Diese komplexen Konzepte sind einfach von ihnen ferngehalten , so dass es leicht für das Verständnis für Menschen aller Ebenen aus Wissen im Bereich der Datenwissenschaft macht . Es ist also eine Art von einem großen Krankenschwester Kurs. Wenn ich sagen darf, dass die Kernstruktur es geht durch die Konzepte des größeren Sinnes zu Beginn, was genau ist ihre zugeordnet? Wie funktioniert Data Science? Es untersucht den Lebenszyklus der Datenheiligen mit ihren verschiedenen Lebenszyklusstadien. Es geht dann in einige Grundlagen der gestarteten Sticks, die für die Durchführung von Datenzeichen erforderlich sind. Es geht dann in unsere Programmierung. Es Frage nach vielen Beispielen, wie Sie unsere Programmierung für verschiedene Phasen in Data Science Projekt verwenden würden . Die verschiedenen Stufen in Daten gesendet verletzt Data Engineering, Teil Aufwand. Welche anderen Dinge, die Sie normalerweise dort tun, die eine der Best Practices im Bereich der wellenförmigen Daten entwickeln, deckt es diese Bereiche ab. Schließlich gibt es den Modellierungs- und Predictive Analytics-Teil, in dem wir in die Mission Learning oder Gott Adams einbauen . Wir betrachten auch Endo und Anwendungsfälle für diese maschinellen Lernalgorithmen, und es gibt auch einige fortgeschrittene Themen, die wir ansprechen. Schließlich gibt es ein Ressourcenbündel, das als Teil dieses Kurses kommt, und dieses Ergebnisbündel enthält grundsätzlich alle Datensätze. Die Daten reichten das Beispielgericht Beispiel Mantel auf jene Art von Dingen, die wir tatsächlich als Teil dieses Kurses unterrichten, der in den Beispielen behandelt wird, alle von ihnen sind im Ressourcenbündel angegeben . Also kenne ich nicht das Ressourcenbündel, das alle Daten enthält, die Sie benötigen, und alle Kernbeispiele , die Sie benötigen, damit Sie dieselben Dinge selbst experimentieren können. Richtlinien für Studenten, das Fasten dieser Zehe verstehen ihre Daten. Saints ist ein komplexes Thema. Es braucht erhebliche Anstrengungen, um es zu verstehen. Stellen Sie also sicher, dass, wenn Sie stecken bleiben, überprüfen und entlasten Sie die Videos und Übungen tut. Er rief Hilfe aus anderen Büchern über Landempfehlungen und Supportforen an. Wenn Ihre Anfragen 1000 Bedenken tun, und das ist eine private Nachricht, und das ist eine private Nachricht,haben wir diese Frage gestellt, und wir werden wirklich glücklich sein. Toe reagierte das so schnell wie möglich. Wir sind ständig bemüht, unsere Kurse zu verbessern, daher ist jede Art von Feedback, das Sie haben, willkommen. Bitte geben Sie Feedback durch private Nachrichten sind zwei E-Mails am Ende des Kurses . Wenn Sie den Kurs mögen, geben Sie eine Rezension. Bewertungen sind hilfreich für andere neue potenzielle Studenten, um diesen Kurs zu nehmen und Maxim Disc diejenigen von anderen zukünftigen Kursen von We Do Mastro zu erwarten , wollen wir das einfach für unsere Schüler Beziehung mit dem anderen zu machen. Wir tun Master-Kurse sind Kurse auf Data Science konzentriert, wirklich ein Themen im Grunde, Technologien, Prozesse, Werkzeuge und Techniken der Daten Heiligen auf. Wir wollen unsere Kurse so weit wie möglich autark machen, nicht wahr? Also, was das bedeutet, ist, wenn Sie ein bestehender, wir tun Master Student sind, werden Sie sehen einige Inhalte und Beispiele in allen Kursen wiederholt. Wir wollen uns zu einer Vision machen Also, anstatt das zu sagen, irgendein Punkt in dem Kurs? Okay, Mädchen, sieh dir despotisch an wie andere Kurse. Registrieren Sie sich für den anderen Kurs und erfahren Sie mehr darüber. Wir wollen uns lieber auf diesen Kurs selbst konzentrieren. Bewahren Sie zwei Dinge im selben Kurs auf. Es sei denn, das andere Konzept ist ein riesiges Konzert. Das selbst von separatem Kurs. Wir wollen nach Indien sie als Teil dieses Kurses selbst. So können Sie einige Inhalte sehen, die in allen Kursen wiederholt werden. Schließlich hoffen wir, dass dieser Kurs Ihnen hilft, Ihre Karriere voranzutreiben. Also viel Glück. Glückliches Lernen auf Bleiben Sie nicht in Kontakt. Vielen Dank. 2. Was ist Data Science – eine: Hallo. Dies ist Ihr Lehrer, Cameron auf in diesem Abschnitt. Wir werden sehen, was Datenzeichen ist. Data Science ist etwas, von dem wir viel gehört haben. Aber woraus besteht Data Science genau? Was? Worum geht es eigentlich? Also werden wir zwei Dinge in der Sitzung an dann sehen. Das erste, was über Wasser Daten, und die zweite 1 ist wollen ist lernen. Also werden wir einige Definitionen aus dem Wasser sehen. Dinge stellen eine Datenwissenschaft dar. Also einige der Dinge, die Sie in dieser Sitzung sehen werden, sind vielleicht Dinge, die Sie sagen könnten , sind offensichtlich Dinge, die inhärent sind. Ich glaube, Sie haben es gewohnt, aber es ist ein guter Zeh. Werfen Sie einen zweiten Blick auf die Definitionen von jedem von ihnen, weil sie eine Menge an einem Datenzeichen bedeuten . Sie bilden in der Tat das Fundament der Data Science. Also lassen Sie uns hier alle diese Definitionen durchgehen. Das erste, was wir beginnen über das, was Data Saints ist, David Signs ist die Fähigkeit, Wissen aus Daten zu extrahieren. Wir haben etwas namens Daten. Und dann gibt es etwas so rohes und dann schauen Sie sich die Daten an und Sie extrahieren Wissen ,Wissen könnte über diese Information in seinem Signal nachgedacht werden. , Es gibt verschiedene Begriffe, die für taube Menschen Wissen verwendet werden, aber im Grunde könnte etwas, das Sie aus Daten extrahieren, das nützlich ist. Und dann nutzst du dieses Wissen, um das Unbekannte vorherzusagen. Sie lernen also etwas über die Vergangenheit aus Daten, und dann verwenden Sie diese Informationen, um vorherzusagen, was in der Zukunft passieren wird. Und darum geht es bei Datenzeichen. David Sames. Eines der Mädchen ist es, Geschäftsergebnisse mit der Macht der Daten zu verbessern, können Sie Vorhersagen tun, aber was ist der Nutzen aus? Die Verwendung davon ist, dass Sie die Datenzeichen verwenden möchten, um Geschäftsergebnisse zu verbessern, und Sie werden die Geschäftsergebnisse mit Daten verbessern. Und darum geht es bei Data Science. Das gibt es nicht. Mitarbeiter sind Technologien. Theorien werden aus verschiedenen Bereichen gezogen, die nicht auf einen einzigen Bereich beschränkt sind. Also haben Sie Mathematik in ihren Statistiken, Informationstechnologiedaten. Wenn die cleveren Technologien Programmiersprachen, verwenden wir tatsächlich eine Vielzahl von verschiedenen Techniken und Theorien und Bereiche. Wenn es um Data Science geht Und was ist ein Data Scientist? Ein anderer Wissenschaftler ist ein Praktizierender, der den Praktizierenden von Datenschildern abhält. Wann ist ein Praktizierender aus? Ihre Da wir über jemanden sprechen, der die Theorien und Theorien und alle Technologien und die Fähigkeiten von Datenzeichen verwendet , um ein besseres Geschäftsergebnis zu erzeugen, hat Andan zugewiesen dies typischerweise ah, oder sollte Know-how in einem Data Engineering Wissen Ticks Statistiken über DA jede andere in der Geschäftsdomäne. Auch auf typischerweise signierten Daten. Dies untersucht komplexe geschäftliche Probleme und nutzt Daten zur Bereitstellung von Lösungen. Das Wichtigste hier ist also ODA verwendet, um Lösungen oder Daten bereitzustellen, ist der Treiber für einen Data Scientist. Also lassen Sie uns in einige der Definitionen von Daten gehen. Worüber reden wir hier genau? Wenn wir Daten sagen, was sind die verschiedenen Dinge, die Sie tun, lernen, wenn Sie über Daten sprechen. Also werden wir hier wieder durch einen Satz von Definitionen gehen. Sie mögen für Sie offensichtlich sein, aber es geht um zu sagen, werfen Sie einen zweiten Blick auf alle von ihnen. Das erste, worüber wir reden werden, ist, was NDP genannt wird. Eine Entität ist eine Sache, die existiert, die in Data Science forschen und vorhersagen würde. Eine Entität ist also eine Sache, ein Objekt, etwas, das in der realen Welt existiert, an der wir arbeiten werden. So haben Sie ein Data Science Problem in den Daten sendet Problem. Sie haben eine Reihe von Entitäten, die Sie cara bolzen. Du recherchierst sie. Sie erhalten Daten über diese Entitäten und arbeiten dann an ihnen, um Ihnen Vorhersagen zu machen. Entitäten haben immer einen Geschäftskontakt. Es gibt einen geschäftlichen Kontext, bei dem es sich um das Geschäftsproblem handelt, das Sie lösen möchten, in dem die Indiedy existiert. So Beispiel für eine Entität wie ein Kunde, ein Kunde außerhalb eines Unternehmens ist eine Entität. Kunde ist ein Unternehmen, das am beliebtesten eingegeben A. Ich würde sehen, über wen wir eine Menge Forschung machen und Prognosen machen. Eine Person in einem Krankenhaus ist eine andere Einheit. Jetzt sehen Sie, dass der Kunde eines Unternehmens und der Patient des Krankenhauses tatsächlich auf dieselbe Person zeigen, aber sie haben unterschiedliche Geschäftskontakte. Unterschiedliche Geschäftskontakte bedeuten also dieselbe Person. Wir kümmern uns um verschiedene Informationen über die Person, die die Person könnte verschiedene Dinge als Kunde tun , im Gegensatz zu dem, was er als Patient tun würde. Entitäten können auch nicht-lebende Dinge sein. Wie zum Beispiel ein Auto. So Karte ist auf dergleichen, dass nicht aus nicht-lebendigen Dingen, auf denen Sie auch Informationen sammeln und Sie sagen, Dinge gehen auf den nächsten Punkt voraus. Es sind Eigenschaften, was Eigenschaften sind. Jede Entität hat eine Reihe von Eigenschaften, so dass diese Eigenschaften angeboten Entität, die Informationen über die Identität ist uns. Wir nennen sie vielleicht statische Informationen, weil sie irgendwie an die Entität gebunden sind, wie Name, Telefonnummer, Alter. Das sind alle Merkmale, oft Entität auf Immobilien haben auch wieder einen geschäftlichen Kontext, um verschiedene Geschäftskontakte zu tun . Sie quadra über verschiedene Merkmale für die gleiche Entität oder die bestimmte Person Platz in diesem gegebenen Geschäftskontext. Zum Beispiel, wenn die Kundenmerkmale Sie über unsere Alterseinkommensgruppe Geschlechterbildung für einen Patienten stören würden , verdoppeln Sie sich Ihr Körper wieder über AIDS, so dass sich das Merkmal namens Alter wiederholt. Aber jetzt haben Sie eine andere Reihe von Eigenschaften, vor allem als Patient wie Blutdruck, Gewicht, Familiengeschichte. Also wieder gibt es einen geschäftlichen Kontext der Geschäftsanforderung, treibt, welche Eigenschaften Sie an Bord eines Unternehmens wieder stören. Autos. Wenn Sie sich Autos ansehen, sprechen Sie über machen Modelljahr des Motortyps des Motors wie Vierzylinder oder Sechszylinder auf der Windnummer des Autos. Also das sind alle Beispiele von Eigenschaften. Du könntest sie auch US-richtiges Stück nennen. Zum Beispiel, Eigenschaften, die ich dachte, dass einer von euch die Mühe gemacht hat, ist das, was Umwelt ist? Umwelt verweist auf das Ökosystem, in dem die Entität exes Funktionen sind. Entität existiert nicht in einem Vakuum. Es gibt eine Umgebung, in der eine Entität existiert. Also in dieser Umgebung oder anderen Einheiten, andere Entitäten desselben Typs andere Entitäten eines anderen Typs, wie ein Patient und im Krankenhaus vorhanden sein, zusammen mit anderen Entitäten aus dem gleichen DeBlanc mit anderen Patienten. Das kann auch andere Entitätstypen sein, wie Ärzte und Krankenschwestern, Entitäten, die nicht lebende Dinge sind, wie Krankenwagen, ein Entitätsdatensatz. Ein System, das zur Überwachung von Patienten verwendet wird, könnte eine Entität sein. Also unter diesen, alle diese Entitäten existieren in einer Umgebung so Umgebung. Die Schattenimmunitäten auf mehreren Entitäten existieren in der gleichen Umgebung, Umwelt wirkt sich auf ein heutiges Verhalten aus, so dass das Wichtigste ist. Dasselbe Entität kann sich anders verhalten in verschiedenen Umgebungen sind auch für die gleiche Umgebung unter unterschiedlichen Bedingungen, Erfahrung in der Umgebung. Die gleiche Entität könnte auch hier sein . Freundliche Beispiele für Salbung Knoblauch für einen Kunden, das Land, die Stadt, Welt in der Nähe. Der Kunde wohnt in Persisch wieder, dass vielleicht die Stadt das Klima mit Krankenhaus, wo der Patient ist derzeit in für ein Auto. Ist es. Aber die Karte wird hauptsächlich für Stadtfahrten auf Autobahnfahrten verwendet, die die Umgebung wird , dass Klimaautos unter verschiedenen Wetterbedingungen wie Herz unterschiedlich funktionieren . Ob keine Schneebedingungen war, haben Autos ein anderes Verhalten. All dieser Fall ist, was Sie sehen, ist, dass die Umgebung beeinflussen, wie die Indeedy verhält jetzt kommt und sogar, was ungleichmäßig, ungleichmäßig ist . Es gibt eine bedeutende Geschäftstätigkeit, an der das Unternehmen beteiligt ist. Entitäten sitzen nicht einfach dort. Es tut etwas. Wenn jemand etwas mit der Identität tut, ist das, was man eine sogar einige Geschäftstätigkeit nennt und sogar wieder passiert außer Umwelt. Du, eine Einheit wie ein Perser, gehst ins Krankenhaus und ins Krankenhaus. Die Entität wird behandelt, wenn es keine aufgesetzten s gibt, die von dem gegebenen Patienten verabreicht werden . Dann haben Sie einige Ergebnisse aus diesen Tests. All das sind Evens. Beispiel aus uneben. Vielleicht ist der Kunde, der einen Website-Kunden sucht, der ein Geschäft macht, besuchen Sie einen Kunden, der einen Verkaufsanruf von einem Unternehmen erhält, um etwas zu verkaufen. All das sind Gleichgewichtige in den Mädchen aus Portionen. Es ist wie die Ärzte. War es ein Bluttest für ein Auto? Der smart tut das Laut geht der Vergleichstest. Wie, wenn Sie zu einem dieser Auto bezogenen Websites gehen, sehen Sie, dass sie wie Vergleichstests tun. Alle von ihnen sind Even, an denen eine Entität beteiligt Verhalten. So macht auch etwas dort auf Entität beteiligt. Aber was bedeutet Verhalten? Was macht die Entität in der gegebenen? Auch das ist das Verhalten der Entitäten. Also sogar eine Einheit geht, tut etwas auf Wasser. Das Beste darin, gegeben ist sogar, was er das Verhalten der Entität beendete. Er könnte ein anderes Verhalten in verschiedenen Umgebungen und verschiedenen Situationen auf , zum Beispiel, zum Beispiel, in dem Fall, aus einem Kunden, einen Anruf in einem Telefonanruf Wasser, wo der Kunde Gespräche ist das Verhalten der Kunden. Die Klicks Raum für einen Website-Besuch wie die Links die jeweiligen benutzerdefinierten Website-Besucher klicken, wenn er auf der Website surft, die eine andere Art von Verhalten hat? Nein, die Antwort. Der Kunde muss sein Angebot sagen. Ich habe Jahre gesehen. Nein, der Kunde hat glücklich gesagt. Alle von ihnen sind verschiedene Verhaltensweisen von den Kunden Patienten keine cr beleuchtet und Krankenschwester Krämpfe die Tränke beschweren sich über etwas. Die Patienten, wissen Sie, schlafen ein, zeigen jede Art von Bs, jede Art von Symptomen. Alle von ihnen sind Verhaltensweisen des Patienten und Autos mögen gute Beschleunigung, die Stoppstrecken, alle von ihnen repräsentieren als eine Form des Verhaltens von den Entitäten. Nein, das sind alles, was diese Dinge, die Sie in der realen Welt sehen, wie die Entitäten gleicht und Verhalten auf Jetzt kommt Einführung Zehe Daten 3. Was ist die Data Science – Zwei: Einführung der Daten. Nein, es gibt etwas, das als Ergebnis bezeichnet wird. Was ist also ein Ergebnis? Das Ergebnis oft Aktivität als signifikant für das Unternehmen. So haben Sie Ereignisse in den Evens. Es gibt Entitäten und es ist anders in verschiedenen Gleichgewichten verhalten. Aber alle diese Gleichgewichte haben in der Regel eine Form aus Ergebnis, die mit dem Geschäft auf Ergebnis wichtig ist , ist ein Ergebnis oft Aktivität das Ergebnis einer Geschäftstätigkeit, zum Beispiel, so auf Ergebnisse können Wert sein. Ergebnisse sind Werte, oder? So können Ergebniswerte entweder Anlagebarren sein wie ja, nein, dass der bestimmte jemand einen Test gemacht hat. Sie haben unser Scheitern bestanden. Es ist ein Anlagebarren. Berlin ist im Grunde ja oder nein auf Band von Daten. Das alte kann wie ein kontinuierlicher Wert wie ein numerischer Wert sein. Jemand hat einen Blutdrucktest für den Blutdruck gemacht. Wert ist ein kontinuierlicher Wert. Kann überall von 100 Dollar unter liegen. Das ist kontinuierlicher Wert oder es kann eine Form einer Klassifikation sein. Klassen. Grundsätzlich hat jemand eine Rezension abgenommen. Eine Rezension eines Films Onda über, dass Sie gab, könnte eine Klasse wie ausgezeichnete, sehr gute Gruppenmesse sein. Aber das ist eine Art Klassifikationen sind Typ, die, wie die Ergebnisse können aus jedem dieser verschiedenen Bänder sein. Beispiele für Ergebnisse in den Mädchen des Kunden, wo der Kunde einen Verkauf zu tun, ist ein Anlagebarren zum Verkaufswert. Wie viel sie es gekauft haben, als ein kontinuierlicher Wert weitergeht, was bedeutet, dass der Wert oder dass Sie ein Geschenk sind, ist im Grunde irgendwo zwischen 0 und 100 oder 2000. Es ist ein kontinuierlicher Wert Patient, die Mädchen der Patienten. Das Ergebnis kann die Blutdruckmessung sein, die ein kontinuierliches Ergebnis auf der Diabetespfeife ist. Depression ist identifiziert uns in der Klasse wie Diät A Diabetes sind Typ B sterben, aber diese ist es eine Klasse. Im Falle von Autos, die Smog Ebenen ist eine Klassifikation. Die Höhe der kleinen Globuli wie ABC. Es gibt eine Klassifizierung, die Geschäfte stoppt. Das passiert, weil Sie einen Test für ein Auto machen, was eine sogar auf ihnen ist. In diesem Fall messen Sie die Bremswege, wenn Sie die Bremsen blockieren und wie viel Abstand es dauern würde, um zu stoppen, kommen zu einem vollen Stopp. Das ist ein kontinuierliches Ergebnis. Die kluge Vergangenheit, unsere Misserfolge gibt es einen Tyrann und Ergebnis. Die Art des Autos. Nehmen wir an, dass eine Sport-Ecke der Familie Limousine, die eine Art Klassifikationen ist, Also sind dies verschiedene Ergebnisse, die als Ergebnis einiger passieren. Trotzdem sind die Ergebnisse abgeschaltet. Aber das Wichtigste in Data Science, denn normalerweise weist tatsächlich das zu, was Sie als Ergebnisse in der Zukunft vorherzusagen versuchen. Hast du jemals mehr darüber gesehen? Später? Jetzt kommt, was man als Beobachtung nennt. Was ist also eine Beobachtung? Eine Beobachtung ist eine Messung. Es ist oft an meinem Vorsitzenden. Trotzdem messen Sie etwas über ein sogar als signifikant vom Unternehmen. Also messen und messen Sie im Grunde wichtige Dinge und Unebenheiten, die für das Geschäft , über das wir reden, wichtig sind . Es erfasst Informationen über die Entitäten und Ball. Also gegeben, auch meine keine mehrere Entitäten beteiligt die Eigenschaften der Entitäten, die BA neugierig der Entitäten, die Informationen über die Umgebung, in der die sogar auf die Ergebnisse passiert. Also auf Beobachtung ist Information über all diese Dinge, die passiert und ungleichmäßig. Sie gehen im Grunde und sammeln alle diese Informationen und in irgendeiner Form auf Beobachtung aufgezeichnet wird typischerweise das System off-record genannt. Wenn Sie also überall hin gehen, sehen Sie, dass die Leute die anderen Tage Informationen aufzeichnen, um sie in Zeitschriften, Logbüchern und so etwas aufzuzeichnen. Nein, alles ist automatisiert, computerisiert. Es gibt Scanner, die diese Informationen automatisch scannen, wenn jemand in den Computer eintritt, die für Morde sind. Es heißt das System aus Rekord am Beispiel der Beobachtungen sind, im Fall von Kunden, gibt es eine Telefonkarte Rikard. Es wird auch CDSS in der Telefonabteilung genannt. Bei der Transaktion wie eine Kauftransaktion geht jemand in den Laden auf ghosted durch etwas, das er geht an den Point off Sale Zähler auf die Transaktion dort aufgezeichnet wird. Unser, ähm, E-Mail-Angebot. Eine E-Mail kommt zu Ihnen, einige Produkte zu einem gewissen Wert anbietet. Kein aufregendes. Sie kaufen etwas, also sind alle Beobachtungen. Wenn Sie einen Patienten betrachten, wiederholt Dr. Bissett das Testergebnis, eine Datenerfassung von einem Überwachungsgerät. All dies sind Beobachtungen, verschiedene Arten von Beobachtungen. Und schließlich schauen wir uns das Auto an. Im Falle eines Autos ein wilder Ricard eine Beobachtung. Das Auto geht für Umfragen und das Ende. Ihre Ergebnisse aus dem Mechaniker werden im Serviceprotokoll protokolliert. Ein kluger als Ergebnis, ist eine Beobachtung. Also alle diese eine RAB Ablenkungen in irgendeiner Form und Recorder erfasst und speichern. Also endlich bekommen wir Daten, was bedeutet ein Datensatz? Adela sagte, als eine Sammlung von Beobachtung. So wird jede Beobachtung, Aufzeichnungen und sogar über das Zentrum von Entitäten eine Sammlung von Beobachtungen für ein Unternehmen zu einem Datensatz. Acht. Beobachtung in einem Datensatz ist in der Regel ein Datensatz in dieser Woche. Nennen Sie es niedriger logischer Datensatz, der physische Datensatz aussehen kann gegeben werden. Beobachtung kann in mehreren Formen aufgezeichnet werden. Mehrere Benutzeroberflächen, die wie Master-Detailbeziehungen sein könnten. Alles, was in Ordnung ist, aber hier sprechen wir von einer logischen Aufzeichnung, die eine Beobachtung darstellt. In der Regel würden Sie Beobachtungen haben, die einen Efeu wie eine Transaktionsidee, Testideen-Seriennummer haben, so etwas. Also an einem Tag sagte ich, dass die Sammlung von losen Beobachtungen jeder Datensatz eine Reihe von Attributen hat , die Eigenschaften zeigen, Verhaltensergebnisse. Wenn Sie sich also das Excel Arbeitsblatt ansehen, sehen Sie, dass in der Regel jede Regel wie ein Datensatz in einer Beobachtung darstellen würde. Das Excel Arbeitsblatt selbst ist, eine Daten gesagt. An jeder Tür war eine Beobachtung auf jeder Spalte ist im Grunde Attribut, das auf eine der Eigenschaften der Entitäten zeigt . Die Verhaltensweisen sind alles kommt Adresse, die strukturiert werden kann Leser Expedia, Polizeiakten, Tabellenkalkulationen Es kann unstrukturiert sein. Außerdem sind Twitter-Feeds ein Beispiel für unstrukturierte Daten in Zeitungsartikeln. Sie werden nicht als halb strukturiert wie E-Mail bezeichnet. Also, ein Data Scientists, beschäftigen Sie sich in der Regel mit verschiedenen Arten von Daten wie Strukturdaten. Unstrukturierte Daten sind jemand Strukturdaten und Züchter SanDisk wählen und arbeiten an Daten sagte, dass das Brot und Butter für einen Datenwissenschaftler ist Datendaten und mehr Daten über Daten gesammelt wird, wie Datensätze gesammelt, gespeichert, an Prognosen bearbeitet werden, werden basierend auf den Datensätzen gemacht. Also, haben sie gesagt, ist der Kern von Data Science. Ah, was sind strukturierte Daten? Das Beispiel, das Sie auf der rechten Seite sehen, ist ein Beispiel für Strukturdatendaten, bei denen die Attribute beschriftet und deutlich sichtbar sind. Sie sehen, dass jedes Attribut in diesem besonderen Sie Jungs separat beschriftet, wie wenn bereit, wenn der Name Währung ich d beobachten Nummer. Alles ist Lobel. Es ist deutlich sichtbar, ob es in der U. Yverwendet wird U. Y , ob es in der Datenbank gespeichert wurde. Es gibt, was Sie eine Struktur Datendaten nennen, die getrennt beschriftet und gespeichert werden. Es war leicht durchsuchbar in, zusätzlich, glaubwürdig, weil sie separat auch in neuen do Speicher in einer Datenbank, ihrem Schüler, verschiedenen Spalten gekennzeichnet hatten ihrem Schüler, . So ist es ein lebenswichtiges Recht und SQL-Anweisung toe Abfrage Diese Daten. Es kann natürlich natürlich Ihre Geschichte leicht in Terrible Tabellen sein, vielleicht, vielleicht, wie Datenbanktabellen oder Excel Arbeitsblätter, ist es einfach, Strukturdaten im Allgemeinen zu speichern. Unstrukturierte Daten hingegen nicht beschriftet. Also wird es wie kontinuierliche Tex geben, wie Sie auf der rechten Seite sehen, ist ein Textland über einen Meister drei ein Auto. Dies ist also die kontinuierlichen Bestände, in denen die Attribute nicht distant beschriftet sind, sondern ihre Präsenz in den Daten. So Dinge, die hervorgehoben werden, ein glühender Sie sehen, sind verschiedene Attribute wie kompakt kompakt ist die Art der Auto Hodge Taschen, eine Art des Autos. Ein 6-Gang-Getriebe ist der Übergang des Gerichtsgebäudes, so dass alle von ihnen in den Daten vorhanden sind, aber nicht deutlich kennzeichnen. So nennen Sie uns das. Unstrukturierte Daten weiterhin Sticks. Es gibt keine weit, aber auf Ihre Tochter versteckt sind in die nächste eingebettet. Und ruhig, natürlich, wird nicht einfach sein, wenn es zu erwerben. Wir sprechen mehr über keine visuelle Inspektion, aber wir sprechen darüber, Computerprogramme zu schreiben, um Informationen zu extrahieren. Diese werden nicht einfach sein. Jetzt kommt die dritte Farm mit nur halb strukturierten Daten. Was Sie hier sehen, ein Beispiel hier ist eine E-Mail. Also, was in der E-Mail ist Teil der Daten ist strukturiert und ein Teil der Daten ist in Struktur. In den E-Mails sehen Sie also , dass einige meine Tribute deutlich gekennzeichnet sind. Wie, wissen Sie, die von Adresse 200 cc Subjekt ihr Bestes in Lobel und als separate Spalten verfügbar sind, sind separate Stücke von Informationen, während andere vielleicht hat er nicht innerhalb der endear texted Verwendung auch nicht. So sind Sie sowohl strukturiert als auch strukturiert ein, das im Falle einer halbstrukturierten Daten verwechselt wird. Einige Beispiele für einige Lehrerdaten könnten auch wie ein Beispiel sein. Dokumente sind halbstrukturierte Daten. Einige Informationen sind im Attribut einige Informationen im syrischen Teil der externen Dokumente verfügbar. Das sind alle Beispiele von jemandem Strukturdaten so zusammengefasst. Was? Was haben wir gesehen? In Bezug auf Daten haben wir eine Entität Merkmale gesehen, Umgebung, sogar Verhalten Ergebnisse auf Beobachtungen und schließlich, Datensatz. Das sind also die wichtigsten , Fundamente,auf denen Daten und es gibt und nur aufbauen. Also ist es gut für Sie, jeden von ihnen zu kennen und zu verstehen. Dies vervollständigt diesen Teil aus dem Abschnitt. Wir werden weiter auf mehr A. Keine der Präsentation. Danke. 4. Was ist die Data Science – drei: Hallo. Dies ist Ihr Lehrer Cameron hier ein weiter auf Wasser Daten Zeichen. Wir werden darüber sprechen, was im Data Science Sprachgebrauch lernt. Was ist Lernen, auf dem Wissen aus Daten zu entdecken? Das erste, was wir als das, was ist eine Beziehung Beziehung wieder zu beachten ist, bildet eine der Grundlagen von Data Science auf, wenn wir über Beziehungen mit sprechen über Beziehungen zwischen Attributen sprechen. Also nach Buttes in einer Daten, die Beziehungen zeigen, das heißt, Sie haben eine Nichtbeobachtung. Sie haben einen Satz Beobachtungen in einem Datensatz auf Attribute, die Sie in diesen Beobachtungen sehen zeigen, was Beziehungen genannt werden, Beziehungen, Beziehungen, Modell der realen Welt und haben keine logische Erklärung. Wenn wir Modell sagen, sind die Beziehungen der realen Welt im Grunde etwas, das in der realen Welt geschieht. Es ist nicht etwas aus dem Blauen, dass man etwas im Datensatz sehen würde. Die Daten sagten. Was auch immer Daten Sie haben, die Beziehung, die zeigt, ist etwas, das in der realen Welt existiert. Zum Beispiel, Alter und Blutdruck. Die Beziehung zwischen ihnen ist, dass im Alter steigt, die Neigung zu höherem Blutdruck steigt. Je höher dein Alter. Je höher könnte Ihr Blutdruck sein. Es gibt immer eine logische Erklärung, die damit verbunden ist. Der Grund im medizinischen Bereich, sagen sie, ist, dass, wenn Sie mehr Gewicht sind, offensichtlich erlauben Sie mehr Fett Sie Larmore verstopfte Arterien, was zu einem höheren Blutdruck führen würde. Es gibt also etwas, das in der realen Welt passiert, und es gibt eine logische Erklärung dafür. Eine Erklärung ist ein sehr wichtiger Teil der Datenwissenschaft. Wenn Sie Ihre Beziehung sehen, sollten Sie in der Lage sein zu erklären, warum es passiert, denn dort können wir sagen, ob die Beziehung zufällig ist oder dass es zufällig passiert ist. Es existiert so etwas. Bei Attributen A und B kann die Beziehung ähnlich sein, wenn ein auftritt auch auftritt. Sie haben zwei Attribute und so sein, wann immer eine aktuelle Bienen auch zustimmen, Nehmen wir an, wann immer ein Verkauf passiert, etwas anderes passiert auch, wie wenn ein Segel von einem Handy passiert. Ein Segel von einer Handyhülle ist auch passiert. Also Dinge, die zusammen passiert, wenn ein weil B nicht auftritt, mag die negative Beziehung nicht . Wenn Sie und Ihre Art von gegenseitig ausschließender gegenseitiger Exklusivität ist wieder eine Art Beziehung. Die 3. 1 wurde sehr hoch, wird auch nach oben gehen. Das ist also unter dieser Art von Beziehung und wo ein Erhöhungen abnimmt. Das ist also wie eine andere negative Beziehung. Wenn Sie also zwei Attribute sind, zeigen die Werte aus diesen Attributen die Werte, die in diesen Attributen zu sehen sind, jede von dieser Art von Beziehung. Nicht alle Entitäten werden Beziehung zeigen, die immer einige Entitäten sein wird, in denen Sie einige Beziehungen sehen, jemand es ist, keine Beziehung überhaupt zeigen. Andere Golden Learning ist es, nach Entitäten zu suchen, die zusammen zeigen eine Form von Beziehung auf Beziehungen können mehrere Attribute beinhalten zu mögen. Wenn ein vorhanden ist und erhöht werden, wird es abnehmen, so dass mehrere Aktivitäten zusammen eine Form von Beziehung aufweisen könnten . Das ist also eine Art Überblick. Off-Wasser-Beziehungen sind jetzt. Lassen Sie uns gehen und sehen, was sind einige der Beispiele aus für Beziehungen wie jeder. Nehmen Sie einen Kunden, wie im Alter steigt, Ausgaben Kapazität steigt, so gibt es eine Beziehung. Es wird auf die Einnahmen des Kunden altern, so dass im Alter steigt, Ausgabekapazität steigt. Es gibt eine logische Erklärung, dass, wenn das Alter steigt, möglicherweise die Person mehr Geld verdient, so dass die Ausgabekapazität auch hoch ist. Wenn wir nun über Beziehungen und Datenwissenschaft sprechen, sind dies keine sehr konkreten Beziehungen. Weißt du, es ist nicht buchstäblich wie ein Bursche, dass sie die ganze Zeit passieren. Nun ist diese Art von Dingen, wie 100% freundliche Beziehung ist gut. Aber was wir hier sehen, ist insgesamt, im Allgemeinen, Art von Beziehungen, wie wenn Alter wegen der Ausgabekapazität. Koza. Nicht alle Kunden, nicht alle Formenkunden werden mehr schicken, aber die meisten von ihnen, das ist es, worüber wir als Beziehung sprechen. Der andere ist unser Brötchen. Kunden kaufen Mehr Internet-Bandbreite Es besteht eine Beziehung zwischen dem Standort des Kunden auf den Bandbreiten-Patches, aber ein Kunde wieder, möglicherweise, weil er mehr surft und Sie den Patienten erneut betrachten. Es gibt viele Beziehungen, die Sie sehen können. Wie alle Perser haben mehr Prävalenz von Diabetes. Es besteht die Beziehung zwischen Alter und Krankheitsniveau. Patienten haben in der Regel einen höheren Cholesterinspiegel. Das heißt, die Beziehung zwischen Gewicht und Kopf. Wirklich wieder, es gibt wissenschaftliche Gründe, warum diese Dinge passieren. Du würdest ein Auto nehmen. Die Beziehung zwischen der Anzahl der Zylinder und der Laufleistung, die es so mehr gibt, tut Linda, es sei denn, die Kilometerleistung. Weil es mehr Brennen passiert, wenn es mehr Zylinder gibt. Sportwagen haben jetzt höhere Versicherungsraten. Dies ist keine schnellere Beziehung, aber Sie werden dies als eine Geschäftsbeziehung wie Sportkarte sehen. Immer wenn die Autos aus einem Trotz Typ einen Sportwagen, ist es Versicherungsraten sind in der Regel höher. So gibt es eine Lotion zwischen der Art des Autos auf die Versicherungen Preise, etwas Dinge über Beziehungen. Eines der Dinge, die Sie stören möchten, ist die Benussi Beziehung zwischen zwei Attributen. Ist die Beziehung konsistent? Sind die zufälligen Beziehungen können auch als Muster gesagt werden, Muster, was Sie in Datenmustern des Verhaltens sehen. Manchmal kann das Verhaltensmuster konsistent sein, weil es die ganze Zeit passiert. Sie können wiederholt, wenn es die ganze Zeit passiert, können Sie ein solches Verhalten in der Zukunft tatsächlich vorhersagen. Aber da es zufällige Muster geben könnte, Ereignis diese Beziehung. Auch, wenn es nebenbei bemerkt ist, es einfach zufällig passiert. Dies könnte keine logische Erklärung für einen Vorfall sein, dass Verhalten ein Vorfallsmuster . Wenn Sie also eine Beziehung sehen, ist es sehr wichtig, dass Sie sicherstellen, dass die Beziehung konsistent ist. War ist zufällig. Konsistente Beziehungen sind das, was Sie für Data Science benötigen. Beziehungen werden uns auch Korrelationen genannt, das heißt, der technische Begriff, den Sie sehen werden, werden verwendet. Korrelation zwischen zwei sind Entitäten sind zwei Attribute ist, wenn mit dem, was sehen Sie, als wenn ein nach oben geht und nach oben geht, Es geht nach oben. Und Biscoe nicht Austin Das ist Körper Korrelationen genannt. Ist das der mathematische Begriff, über den du sprichst, wenn du über Beziehung sprichst? Es ist und schließlich könnte man Menschen sprechen über Signale und Rauschen Wenn es um Data Science Signale geht , sind nichts anderes als konsistente Muster konsistent. Beziehungen, die Sie in Daten sehen Narcisse. Zufällige Muster sind Zwischenfälle Beziehungen. Sie Tag in Daten. Also, wenn Sie über diese Begriffe gehört haben, Signal und Lärm dort, nichts über Beziehungen, Beziehungen, die sinnvoll sind, war seine Beziehungen, die durch Zufall geschehen, die nicht vorhersehbar sind, die nur zufällig sind. Das ist also der Unterschied. Aber Signale und schön jetzt kommt, was bedeutet Lernen Wir reden über Mission Learning und dieses Lernen und das Lernen und alle Formen des Lernens. Also, was genau ist das Lernen? Lernen bedeutet, dass man über Beziehungen lernt. Das ist das Wichtigste, was Sie über Daten wissen möchten. Ihre Heiligen haben Missionslernen. Hier lernen bedeutet, dass Sie nur versuchen, über Beziehungen zwischen diesen Attributen zu erfahren . Darum geht es beim Lernen. Es beinhaltet die Einnahme einer Domäne wie ein Bleib Bein Krankenhaus Domino Geschäft. Machen Sie es nichts dagegen, die Entitäten und die Attribute zu verstehen, die die Domäne darstellen können Daten über alle zum Verständnis von Beziehungen sammelt. Da diese Attribute sind, ist dieses Verständnis der Beziehungen zwischen diesen Attributen, worum es beim Lernen geht. So Modelle ist das Ergebnis des Lernens. Also, was tun Sie, nachdem Sie etwas erfahren haben, ist, dass Sie Modell darüber jetzt bauen? Dieses Lernen, wenn Sie sprechen hier lernen passieren die ganze Zeit im menschlichen Gehirn wurden konsequent Daten innerhalb eines menschlichen Wesens menschlichen Gehirns sammeln, konsequent kontinuierlich über Dinge lernen und kontinuierlich Modelle aufbauen. Wir haben diese Modelle das ganze Flugzeug ohne unser Wissen verwendet. Unterbewusst lernen wir kontinuierlich über Dinge, was wir hier in Bezug auf Datenwissenschaft sprechen , ist nur das Lernen dieser Art aus in einen richtigen Prozess auf das Lernen geschieht außerhalb des menschlichen Gehirns in Missionen gemacht. Das ist, was, als ein kleiner Unterschied zwischen Lernen, das im menschlichen Gehirn geschieht, und Lernen, das mit Missionen passiert, ist eher ein Prozess zu warten. Es gibt mehr Daten aus ihm, und es gibt mehr davon, es zu tun. Also, was ist eine moderne? Ein Modell ist eine vereinfachte, angenäherte Darstellung eines realen Phänomens. Es gibt also ein wirklich gutes Phänomen. Es passierte. Und wenn Sie ein Modell machen, versuchen Sie zuerst eine vereinfachte Moral zu erstellen. Du versuchst nicht, zu viele Dinge in das Modell zu stecken. Sie versuchen nur, die wichtigsten Dinge über die reale Welt Phänomen auf dann nehmen, Aufbau einer einfach Kampf Darstellung auf annähernd re Präsentation aus der realen Welt Phänomen. Sie können tatsächlich auf Rechnung so komplexe Modelle gehen, wie er eine Person halten wollte, aber in der Regel Pin Menschen bauen Modelle. Sie wollten vereinfacht werden, so dass es alle wichtigen Faktoren herausbringt, die Sie jemals stören wollen und ignoriert alles, was Sie sich nicht stören wollen. Also ist es eine einfache Tatsache annähert die Präsentation von einem realen Weltphänomen. Es erfasst die Schlüsselattribute, die Schlüsselattribute der Entitäten auf ihren Beziehungen auf Let's Say, ein Beispiel für ein Modell könnte ein mathematisches Modell sein. Ein mathematisches Modell ist etwas, das die Beziehungen wie eine Gleichung darstellt. So können Sie eine Gleichung schreiben, die Beziehung zwischen den Attributen wie zum Beispiel, können Sie kommen. Aber das ist eine formelle, die ich von irgendwo auf der Welt bekommen habe. Du bist ein Bauernhof. Liebe, wie Sie den Geist tun können. Blutdruck. Das ist eine Gleichung. Also ein schwarzer Druck Rekord von 56 plus das Alter einer Person in der 560,8 plus Gewicht der Unterdrückung in 2,14 plus Israel Niveau der Unterdrückung in 2.9 Also was sehen Sie hier ist, dass Sie versuchen, den Blutdruck aus dem einen Attribut des Blutdrucks zu berechnen drei weitere Attribute H Gewicht und LDL. Nun, dies ist ein ungefährer Wettbewerb des Blutdrucks. Es wird nie geben Ihnen den genauen Wert ein groß, aber es könnte sein. Es könnte ungefähr in der Nähe des realen Weltwerts sein Also hier ist eine Formel, die ein mathematisches Modell zeigt , wie ein Blutdruck Zeh verwandt werden kann. Drei weitere Attribute. Gewicht, Alter und Ellie Niveaus. Dies könnte ein anderes Modell sein, bei dem auf ein Entscheidungsbaum-Modell geklickt wird. Es ist wie ein logisches Modell, in dem Sie eine Reihe von Fragen zu der Reihe von Fragen stellen , die Sie stellen. Sie fügen Fragen zu verschiedenen Attributen ein und kommen dann, basierend darauf, mit einem Ergebnis, wie Sie wollen, Sie sehen möchten. Sie wollen so etwas wie den Kauf einer Musik Stadt vorhersagen und für diesen Gedanken, dass Sie mit einem Entscheidungsmodell wie diesem kommen können , wenn Alter aus den Kunden. Legende 25 über Geschlecht der Kunden verschickt von Beyonce Eine Stadt namens Ja, So dass Sie verwendet, um Attribute Geschlecht und Alter auf basierend auf ihnen, Sie versuchen, mit dem Ergebnis vorherzusagen, die mit dem Kalender Kunden von Beyonce CDR. Nicht Dies ist eine andere Art von Sterblichen. Acura. Ihre Modelle hängen von der Stärke der Beziehungen zwischen den Attributen ab. Manchmal ist die Beziehung zwischen den Attributen sehr stark, so dass Sie vorhersagen können, wie mit 100% Garantie, dass Okay, wenn ich das sehe. Ich bin sicher, dass das das Ergebnis sein wird. Manchmal ist Genauigkeit nicht so viel. In diesem Fall möchten Sie möglicherweise mehrere Attribute NC kombinieren, wenn Sie den Genauigkeitsgrad erhöhen können. Manchmal gibt es überhaupt keine Beziehung, oder? So kann es in jeder Form oder jeder Art von variierendem Maßstab sein, den Sie dort bekommen könnten. Aber Modell insgesamt ist eine vereinfachte angenähert die Präsentation von etwas, das in der realen Welt geschieht. 5. Was ist die Data Science – vier: Sobald Sie ein Modell haben, können Sie Vorhersagen machen, sodass ein Modell verwendet werden kann, um unbekannte Attribute vorherzusagen. Einfaches Beispiel. In diesem Jahr haben wir bereits gesehen, dass es eine Formel gibt. Blutdruck gleich der 56 plus Mittel 2.8 plus warten, 2.14 plus früher, Linda wies ein +09 So haben Sie hier eine Formel, die für Attribute Blutdruck bezieht, Alter groß und LDL wissen, was das bedeutet, dass, wenn Sie wissen, drei aus diesem für Attribute, können Sie den Fuß vorhersagen, so das ist, was wir uns nennen. Vorhersage. Wenn Sie also einen Computer seifen, können Sie sagen, dass Sie sagen können, vorherzusagen, wenn er ein Compute ist, Sie garantieren 100% Genauigkeit, die Sie wissen, dies ist die Formel, wenn Sie Ihre meist annähernd malen. So haben Sie hier vier Attribute drei oder vier Attribute. Wenn ich drei von ihnen kenne, kann ich diese Formel Zeh wirklich bekommen. Berechnen Sie, was auch immer danach, aber ich will Oh, wenn wir drei von ihnen kennen, kann ich vorhersagen, die 4. 1 Dies ist, was Sie Vorhersage nennen. Die Vorhersage aus einer Modell-Doppelgleichung kann als einfacher Vorhersagealgorithmus betrachtet werden. Einfache Sache auf Dilatation. Übersprungen können viel komplexer sein, was zu komplexeren Modellen und Vorhersagealgorithmen führt. Also, was Sie sehen, dass die Gleichungen sind sehr einfach finden Modell von uns oder etwas wirklich einfaches als ein Problem wird komplexer, jeder ein wenig später, komplexer, lernen komplexere Modelle auf komplexere Vorhersage-Algorithmus. Darum haben wir das alles gelernt. Lernen geht es um Daten, Sets, Beziehungen, Modellierung und Vorhersage. Lassen Sie uns also darüber reden, was ich uns auf das Ergebnis vorhersage. Wenn Sie also über unsere Daten sprechen 100, spüre ich, dass Sie über Prädiktoren und Ergebnisse sprechen . Also, was sind sie? Ergebnisse sind Attribute, die Sie vorhersagen möchten. Unabhängig davon, welche Attribute Sie vorhersagen möchten, werden sie als Ergebnisse bezeichnet, wie in der Formel des Jahres zuvor. Wir wollen den Blutdruck vorhersagen. Es wird das Ergebnis genannt. Senatoren sind Attribute, die Sie verwenden möchten, um das Ergebnis vorherzusagen, also haben Sie eine Reihe von Attributen. Was willst du vorhersagen? Das Ergebnis? Alles andere, die Sie verwenden, um das Ergebnis vorherzusagen, unsere Auto-Prädiktoren, so dass Sie möglicherweise 10 Attribute in Ihren Daten, sagte einer von ihnen kann Ihr Ergebnis sein, und drei andere können Ihre Praxis sein. Ich meine, nicht alle Attribute haben eine Beziehung zum Ergebnis. Attributieren Sie nur diejenigen, die eine gute Beziehung zum Ergebnis haben. Variablen werden offensichtlich Prädiktor, so dass Prädiktoren und Ergebnisse und offensichtlich Prädiktoren und Ergebnisse eine Form der Beziehung zeigen, weil das alles ist, was Sie Ergebnisse von ihnen Prädiktoren vorhersagen können . Beim Lernen geht es darum, Modelle zu entwickeln, die verwendet werden können, um Ergebnisse vorherzusagen, was die Ausgabe mit den Prädiktoren ist, das ist das Säugling. Hier sind einige Beispiele, die wir zu den gleichen drei Beispielen zurückkehren werden. Im Fall eines Kunden sind die Prädiktoren Alter, Einkommen, Reichweite und Standort auf. Das Ergebnis kann sein, Wird der Kunde Ihren Schutz kaufen oder nicht ein Patient? Die Drucker können Alter, Blutdruck und Gewicht auf dem Organ sein. Ist der Patient, der stirbt? Aber sie konnten nicht am Beispiel eines Autos wie die Prädiktoren sein, vielleicht verwenden Sie Dinge wie Zylinder, Anzahl der Zylinder und Beschleunigung auf. Vielleicht wollen Sie vorhersagen, wo das Auto sein wird. Ein Sportwagen ist ein Familienauto. Das sind also, was Sie uns Prädiktoren und Ergebnisse nennen. Eines der wichtigsten Dinge, über die Sie wissen möchten, ist Menschen waren Einreichungen. Menschen verstehen Beziehungen und vorhersagen, die ganze Zeit, die im menschlichen Gehirn passiert ohne sogar Woche, wir sind bewusst, abgebrochen. Wir sammeln immer Daten, wir halten, Wir verstehen Beziehungen. Wir bauen immer wieder Modelle in unseren Köpfen. Wir prognostizieren die ganze Zeit, jederzeit, wenn Sie produzieren, vorhersagen Sie. Okay, ich denke, das wird passieren. Es bedeutet, dass Sie ein Modell verwenden, das Sie in Ihrem Kopf gebaut haben, um etwas vorherzusagen, was Sie sagen. Ich glaube, es kann passieren. Es ist ein Wochen-Model. Sagen Sie, ich bin 100% sicher, dass das passieren wird. Es ist ein sehr starkes modernes, aber der Mensch kann nur mit der nächtlichen Datenmenge umgehen, richtig. Aber zum Beispiel zum Beispiel werde ich Ladenbesitzer behalten. Du hast sie gesehen. Sie wissen über ihren besten Kunden der langjährigen Kunden. Sie wissen, was ihre Kunden mögen und was die Kunden wollen. Andi, wann immer ein Kunde kommt, spricht er ihn normalerweise an. Mein Name und die sofort wissen, was diese Kunden wollen. Selbst wenn der Kunde darum bittet, werden sie groß, gestorben. Ähm, und es wären sie. Aber der Mensch kann nur verarbeiten, füllen Sie die Menge der Daten, so dass sie über die Präferenzen von 100 Kunden wissen . Nicht mit 10 Millionen von ihnen. Was passiert dann? Dann kommen Maschinen ins Spiel, richtig? Wir wollen all das allgemeine in Kundeninformationen in Computern speichern. Andi Lassen Sie die Computer lernen, über die Präferenzen auf Hilfe Sie. Die Missionen kommen ins Spiel, wenn die Anzahl der Entitäten auf den Daten Langeweile groß ist , und ihre Einkommen Mission lernen, wenn Sie 100 oder arbeiten mit Ihrem Computer Zeh, sammeln Sie alle Daten, tun Sie alle das Lernen, bauen alle Modelle. Ondo. Die Vorhersage. Das ist, wo wir es kommen, wird Mission Learning. Das ist, wenn es Mission Learning, Predictive Analytics und Data Signs wird . Also, was bedeutet Daten Heiligen, Entitäten, Beziehungen, Modellierung und Vorhersage. Was ist also Daten-Cent? Es geht darum, ein Problem in einer bestimmten Domäne auszuwählen. Das Verständnis der Problemdomäne, die Entitäten und die Attribute und das Verhalten und die Evens Sammeln von Datensätzen, die die Entitäten repräsentieren, sammeln wir alle Daten, die Sie benötigen, und dann entdecken Sie Beziehung aus der Reiter. Das ist es, was man lernen nennt, wenn Computer dies tun. Es heißt Mission Dunning. Erlaubnis. Lernen ist nicht etwas, obwohl es in der Welt nichts geht. Es ist alles an Bord von Missionen. Lernen über bestimmte Dinge sind die Entdeckung von Beziehungen aus den lesen acht als und dann bauen Modelle. Die Präsidentenbeziehung. Der Sterbliche kann wie ein mathematisches Modell sein. Es kann ein Entscheidungsbaum-Modell sein. Es kann andere Arten von komplexen Modellen zu geben, und was wir in wirklich bauen Modelle ist, dass wir vergangene Daten verwenden, wenn Sie über die Proteste wissen . Du kennst das Auto, die Ergebnisse. So kennen Sie die Werte der Krater. Sie kennen die Werte der Ergebnisse. Andan mit diesen Werten, etablieren Beziehungen aus den Beziehungen, die Sie Modelle erstellen. Und sobald Sie eine moderne erstellt haben, können Sie dann mit der Vorhersage beginnen Sie können mit der Vorhersage für die aktuellen oder zukünftigen Daten beginnen, wenn Sie die Prototypen kennen. Aber Sie kennen die Ergebnisse nicht, also nutzen Sie die Vergangenheit, um die Build-Modelle zu lernen, und dann prognostizieren Sie die Futures, wenn Sie nichts über die Ergebnisse wissen. Hier ist ein Beispiel dafür, was Website-Käufer im Falle von größeren Zeichen tun würde. Das ist kein Beispiel, das Problem wäre, vorherzusagen, dass der Käufer Ihr Smartphone auf das kaufen wird, was sie dagegen tun werden. Du bekommst die Geschichte der Porträts aller Käuferinnen, richtig? Sie sammeln Käufermerkmale wie Alter, ein geschlechtsspezifisches Einkommensniveau. Sie sammeln saisonale Informationen, wenn sie kaufen, wie, welche Art von Dingen, die sie im Winter kaufen, war ein Sommer. War das Halloween? Was ist ein Schwung von Mittwoch? Du sammlst all diese 11 Daten, die da sind. Dann bauen Sie Modelle. Sie bauen Modelle, die über Beziehungen sprechen, darüber, was aufgeht oder was Ton kommt. Wenn der Kunde kauft, kauft der Kunde nicht. Also haben Sie im Grunde versucht, die anderen Attribute, die Sie kennen, so das Ergebnis zu lassen. So sehen Sie sich alle Werte aus den anderen Attributen, wenn die Kunden kaufen, Was bedeutet, dass Werte der Attribute, wenn die Kunden nicht kaufen? So sehen Sie, dass eine Dame den Wert aus auf einem Tribut Alter es ist größer als 25. Der Kunde kauft den Wert des Alters Blei weniger als 25. Der Kunde beißt nicht. Es kommt eine Beziehung. Versuchen wir, diese Beziehung zu nutzen, um ein Modell zu bauen und dann versuchen Sie vorherzusagen, was immer dann ist, wenn Sie einen Kunden sehen, der älter als 25 ist. Ja, der Kerl wird das kaufen. Also machen Sie Vorhersagen. Also, wenn eine Atombombe Käufer Surfen vorhergesagt, der Käufer kaufen, verwenden Sie das Modell und prognostizieren in Echtzeit. Aber der Kunde wird ein Produkt kaufen oder nicht auf. Okay, was ich mit der Produktion machen werde, jetzt, wo Sie wissen, dass die Kunden kaufen werden, nicht kaufen werden , ist, dass Sie einige Aktionen tun können, wie Sie Childhelp anbieten wollen. In diesen Tagen, wann immer Sie auf eine Website gehen, Sie sehen, dass ein kleines Pop-up kommt und sagen: Wollen Sie mit Ihrem Live-Agent reden? So sind Live-Agenten teuer. Sie sind Menschen. Sie zahlen ihnen eine Menge Geld, also wollen Sie nur Leben, Alter und Hilfe anbieten . Also Käufer, von denen Sie denken, werden Ihr Produkt kaufen, damit Sie eine intelligente Entscheidung treffen können , welchen Käufer Sie wollen. Ich will live Agent. Basierend auf dieser Vorhersage ist dies ein Beispiel dafür, wie Datenzeichen für Sie funktionieren würden. Vielen Dank 6. Anwendungsfälle für Datenwissenschaft.: so hallo. Das ist dein Ausbilder Cameron hier. Und wir werden uns einige der Anwendungsfälle für Data Science ansehen. Sie sehen nicht, wie die Welt von der späteren Wissenschaft profitiert. Der Einsatz von Data Science wächst exponentiell. Seit einigen Jahren ist jeder Tag exponentiell gewachsen. Ich verbreitete mich über mehrere Domänen und, wie Geschäftszeichen sind Finanzen und unpersönliches Leben. Auch auf eine jüngste Fortschritte in der Rechenleistung. In Bezug auf die Hardware, in Bezug auf Off-Software, eine Menge aus öffnet oder so weit in die Welt kommen, wie das Ganze dope Ökosystem auf prädiktive Algorithmen. Die Kombination all dieser Elemente hat es sehr kostengünstig für Sie gemacht, Data Science in den kommerziellen Gebrauch anzuwenden . Okay, lassen Sie uns einige der Beispiele für die Verwendung von Data Science sehen. Der erste Buchstabe beginnt mit Finanzen für Finanzen. Alle an Bord verdienen Geld, um Geld zu sparen. So Betrug Reduktion. Reduktion von Kreditkarten-Betrug ist eine sehr wichtige Anwendung unserer Daten. Die Wissenschaft wird benutzt. Was also passiert in Kreditkarten-Betrug ist, dass Kreditkarten-Betrug zeigen Tönung bestimmte Muster, in denen sie passieren, wenn Sie auf Transaktionen, die mit Kreditkarten-Betrug verbunden sind . Sie zeigen ein Muster, Art aus einer Beziehung zwischen den verschiedenen Entitäten und ihren Attributen. Und es sind diese Muster, die im Wesentlichen im historischen später festgehalten werden. Sie werden verwendet, um Modelle aus fruchtbaren und Transaktionen zu bauen. Die historischen Daten haben also gute Transaktionen und Betrugsgeschäfte, und dort, dann verwendet, um Modelle zu erstellen, wie eine betrügerische Transaktion aussehen wird. Also, wenn ein neuer Kriminalitätsabschnitt auftritt , ist diese Transaktion sofort erhöht. Mit Computern, mit dem Modell zu kommen, was er uns eine Betrugs-Score nannte. Eine Fraud Gericht Schule sagt Ihnen grundsätzlich, ob die bestimmte Transaktion ein Betrug ist, betrügerische Transaktion oder nicht. Es ist eine Schule, vielleicht ab 1 200, wenn es erzielte Ursachen, vor allem Schwelle. Es wird sofort als Requisite gekennzeichnet. Mögliche betrügerische Transaktion Es ist. Dann werden einige Maßnahmen ergriffen, wie die Anrufe an den Kreditkarteninhaber als Zehe fragen gemacht werden. Ob nicht alle diese Transaktionen macht. Manchmal wird die Kreditkarte sofort für weitere Transaktionen gesperrt, bis sie die Überprüfung vornehmen . So gibt es einige Aktionen wie diese bisher ergriffen, die Richtung ist eine sehr wichtige Anwendung für die spätere Wissenschaft in der Finanzwelt. Die zweite Anwendung, die Sie sehen würden, ist über den Einzelhandel, So werden Sie sehen, dass, wenn Sie zu einer Website gehen und Ihren Einkauf und legen Sie einige Artikel sofort in Ihren Warenkorb, Sie sehen einige Empfehlungen kommen. Wie im Fall einer Maison würden Sie sofort eine Empfehlung wie Artikel sehen, die häufig zusammengebracht werden. Wie machen sie diese Empfehlungen ist wieder? Gegenstände zeigen Muster, wie ihr Freak zusammengebracht hat, wie Handys und Zubehör-Bücher, einige Gegenstände, die häufig zusammen gekauft werden. Sie zeigen diese Affinitätsmuster. So basierend auf, dass die Rechnung, was Affinitäten natürlich zwischen den Artikeln genannt werden. Also zwischen allen Para fünf Versuche, die eine Affinitätsbewertung zugeordnet ist. Je höher, definitiv genannt wird, desto häufiger wurden diese Gegenstände zusammengebracht. Also, was passiert als nächstes? Immer wenn einer von denen, die ich versuchte, sofort von einem neuen Käufer gekauft, Punkte mit hoher Affinität zu diesem Artikel, wie sie, sofort empfohlen. So haben Sie die Videos Kurs verwendet, um mehr Artikel an die Sharper zu empfehlen, mit der Idee, dass, wenn die Power-Shopper haben sie Zehe zusammen gekauft. Vielleicht ist das, wie der nächste Laden. Aber es wird auch tun und diesen Wert mehr Cross-Selling und absolut Contact Center zu tun . So haben wir Contact Center, die traditionell für den Kundenservice verwendet wurden. Die Verwendung von Kontakten und es ist heute gewachsen, um Kuppel oder Verkäufe eine Menge off, mehr High-End-Vertrieb und Support, und sie begannen auch mit Datenzeichen, um ihre Leistung zu verbessern. Und wie haben oder haben sie das tun, ist dies Sie haben begonnen, Farben zu erzielen. weniger Agenten betrifft, so dass frühere Interaktionen verwendet werden, um Farben auf ihrem Wert in Bezug darauf, wie viel der Geschäftswert war, ah, Krieg Art der Farbe platzen viel der Geschäftswert war, ah, ah, . Sie sind, wie viel Geschäft sie bereits mit dem Unternehmen gemacht haben, das sie verwenden. Das hieß die Farben. Sie entschuldigen auch Kurs für Agenten auf der Grundlage der Fähigkeit, hochverkaufte Organe zu verkaufen . War ein niedrig verkaufter Agent oder Agenten, die die Fähigkeit, eine bestimmte Art von Problem zu behandeln , wie Agenten, die Probleme in dem spezifischen Produkt behandeln können, sind bestimmte Art von lassen und , Netzwerkproblem war ein Telefon Problem, dass Dinge wie Was also getan hat, ist, dass sie versuchen, die richtigen Farben mit dem richtigen Agenten zu mak. Basierend auf diesem Kurs auf Idee ist, wenn Sie vielleicht Recht haben, rufen Sie uns mit den richtigen Agenten. Es wird Ihre Geschäftsergebnisse zu optimieren und dann Aufzeichnungen mit so Auto anrufen. Sie sehen, dass, wenn Sie mit einem Contact Center sprechen, sie immer sagen, dass Ihr Anruf zu Qualitätszwecken aufgezeichnet wird und was sie mit diesen Anrufaufzeichnungen tun , ist, dass sie maschinelles Lernen Algorithmen auf diesen Aufzeichnungen, um die Qualität des Call on Outcome zu verstehen und sie für zukünftige Verbesserungen zu nutzen . Und schließlich betrachten wir die Gesundheitsversorgung jetzt Vorhersage von Krankheitsoperatoren ein Freund gewesen. Abstauben Sache, die passiert ist Floke ist, dass Sie Krankheitsausbrüche vorhersagen können, indem Sie sich ansehen was die Menschen in Google suchen und was sie twittern und twittern. Also Datensatz dieser Sammler aus öffentlichen Domänen wie Google-Sucher und Twitter-Feeds und Sachen wie diese auf diesen Daten ist immer mit den Standortinformationen verknüpft. Also, wenn Sie etwas über googeln, wissen Sie, wo Sie etwas hinstellen. Der Standort von Mario tun, dass immer gesammelt wird, und dann werden diese Informationen dann gesammelt. Wie das, was Sie über unser Wasser, dass Sie googeln Airboat zusammen mit dem Standort Toe, kommen mit Pat. Und so tun Menschen solche Fragen zu einer bestimmten Krankheit von einem bestimmten Ort aus . Dieser Artikel wollte, dass auf je mehr der Moment, in dem Sie beginnen, einige Muster von der Zehe zu sehen, die Menschen twittern mehr über eine bestimmte Krankheit spezifischen Ort. Das ist eine Möglichkeit, dass es dort einen Ausbruch gibt. Diese Art von Informationen wird jetzt verwendet, um mit der Vorhersage zu beginnen, dies sind Objekte. Was ist das Gute daran, Vorhersagen über Krankheitsausbrüche zu machen, ist, dass die Regierung proaktiver gestalten kann. Sie sehen, dass dies beginnt die Zehe oder bricht eine bestimmte Lokalität. Die Regierung kann sofort beginnen, ihre Ressourcen zu marshalen, um eine vorbeugende Versorgung zu schicken . Ähm, oder viele schicken mehr Ärzte. Sachen wie, dass es organisieren kann, wie ein paar Tage im Voraus auf verhindern mehr oder Klammer, die in der gleichen Gegend geschieht . Also nicht zugewiesen hilft, unsere zumindest zu verwalten diese Krankheitsausbrüche zu verhindern. Also, dies sind einige der interessanten Anwendungen in Data Scientists ist wie eine sehr wenige beliebte Anwendung. Das ist in der Tat eine Menge, die dort auf duh passiert. Ich hoffe, dass Sie in der Lage sein werden, etwas mehr Lesen und Industrie und alle von ihnen zu tun. Ah, und in naher Zukunft, danke. 7. Data – Einrichtung: Hallo. Dies ist Ihr Lehrer, der hier üblich ist. Ich bin in diesem Abschnitt. Wir werden sehen, worum es bei den Signatur-Projekten im Lebenszyklus von Daten geht. Wir werden also über Data Science-Projekte sprechen, was ihre Aktivitäten sind, wie sie sequenziert werden. Beginnen wir also mit einigen einleitenden Anmerkungen. Data Science Bemühungen sind typischerweise Ex-Uranus-Projekte. Wenn also eines der vielen Unternehmen geschäftlich alles andere als Datenzeichen tun will, erstellen sie normalerweise Projekte, wie Leute Software bauen wollen. Sie erstellen Software-Projekte für Projekt. Sie setzen von einigen objektiven, etwas Gold und dann gehen über sie zu exekutieren. Ähnlich wie, sie hatten andere Zeichen. Die Bemühungen werden auch als Projekte ausgeführt. Also eine Sache, die hier zu beachten ist, dass Data Science Projekt sollte wie Forschungsprojekte betrachtet werden . Sie sind nicht wie Bauprojekte, die sie nicht sind. Sie haben keine Dinge wirklich sicheren Stein, dass Sie einfach gehen und ausführen und weg von ihm. Das sind Forschungsprojekte. Es gibt eine Menge von Denken beteiligt. Es gab eine Menge aus Überarbeitung Board und bis Sie das Ziel zu erreichen, so sollten sie als Forschungsprojekte betrachtet werden , nicht wie Software bauen und betreiben Art von Projekten. Die Projekte beginnen überschwemmt wie alle anderen Projekte, die sie an den Projekten machen. Haben Gesichter und Aktivitäten auf Übergang geschieht zwischen Gesichtern und Aktivitäten, und es hat Projekte gesendet beinhalten eine Menge von hin und her zwischen den Gesichtern. Dann ist es Morgenstern, wie wirklich von Wasserfall-Modell. Es ist eher wie ein iteratives Modell, wenn Sie das mit etwas im Zusammenhang mit der Softwareentwicklung verknüpfen möchten . Also in diesem Abschnitt werden wir darüber sprechen, welche Daten Heiligen, Projekt-Gesichter und Aktivitäten sind. Was ist die Bedeutung jeder dieser Aktivitäten, wie ihr Übergang Art von einem zum anderen, und auch einige der besten Praktiken? Werden wir nur über sie reden? Hier ist also ein Überblick über den Leser. Wissenschaftsprojekte und -aktivitäten, die Sie dort sehen, gibt es, wie vollständige, breite Kategorien oder Etappen im Leser. Da Projekt, das die Menge der Phase ist, gibt es die Data Engineering Gesicht die Analyse Gesicht auf der Produktionsphase in der mittleren Phase, Sie nur Vorbereitung das Team mit so, was sie zu tun haben. den Daten, die jahrelang verletzt werden, geht es darum, Daten und das Training von Daten auf die gute Art und Weise mit Daten zu arbeiten . Formleiste. Sie können die dritte Stufe machen, die die analytische Stufe ist. Alex ist also alles darum, die Daten zu erkunden und einige aussagekräftige Informationen oder die Fed zu bekommen . Also es geht um Lernen und Vorhersagen auf Sobald Sie das Analytics-Gesicht machen und Art von Empfehlungen finden, können Sie dann in die Produktionsphase gehen, wo ich tatsächlich einige Datenprodukte erstelle, die dann alles tun, was Sie nur in einer automatisierten Weise und in einer wiederholbaren Art und Weise auf hält produzieren Sie Ergebnisse, die Sie wünschen. Ich gehe nur zur ersten Aktivität Gesicht, die die Menge der Phase ist. Das erste, was Sie in einem Unschuldsprojekt wollen, ist das, was Sie als Zielsetzung für das Innocence Projekt nennen . Jeden Tag wird und sollte das Essenzprojekt ein Gold haben. Wenn jemand will. Was für ein Dutzendes Projekt, das so ist, Okay, schauen wir uns die Daten an und sehen, was Sie daraus herausbekommen können. Dieses Projekt ist zum Scheitern verurteilt. Data Science Project sollte ein bestimmtes Gold haben, das ich tue, damit das Team nachgehen kann. Also die Bemühungen des Teams werden alle auf das Erreichen dieses Ziels konzentriert sein, und die Aktivitäten werden auch darauf basieren, was Sie so Raum erreichen wollen. Aber es gibt, dass Projekte ohne Ziele Fahrer sind, unsere Autos ohne Fahrer. Also, wenn jemand dazu kommt und dir das sagt, okay, okay, wir werden tun, was es seit tragischer Zeit hat. Schauen Sie sich einfach die Daten an und sehen Sie, was wir uns einfallen können. Das Projekt geht nirgendwo hin. Das war also die Erfahrung von vielen, vielen Menschen, die versuchen, zu tun. Sie projiziert nicht einige der Beispiele von Gold, die unser Bein setzen. Es gibt keine Vorhersage, welche Kunden in den nächsten drei Monaten abwandern werden. Das ist eine Zielgruppe, die behandelt, dass wir über unser Unternehmen bekommen und dann gruppieren sie auf der Grundlage der Stimmung aus den Tweets identifiziert Patienten, die eine Möglichkeit haben einen Herzinfarkt in den nächsten drei Monaten. Also wirst du die Kunden vorhersagen, Joan, wirst du die Stimmung der Tweets vorhersagen? Willst du Patienten vorhersagen, die Herzinfarkte haben werden? Die Mädchen können so etwas sein, aber das Wichtigste ist, ein gut definiertes Ziel zu haben, bevor Sie mit Ihrem Projekt beginnen . Die zweite sehr wichtige Sache, auf die Sie sich konzentrieren möchten, ist das Verständnis der Problemdomäne . Im Gegensatz zu Softwareprojekten, sogar in Softwareprojekten, würde ich sagen, dass das Verständnis der Geschäftsdomäne ein Zoo ist. Gute Sache im Fall über Data Science Projekt, ist es notwendig, dass alle Teammitglieder einige grundlegende Verständnis haben, was das Geschäftsproblem verbleibende ist alles über. Also, wenn wir sagen, dass wir es brauchen, sprachen wir über ein Problem, das kommt. Wir sprechen über die Geschäftsgrundlagen, wie Sie im Finanzgefühl der Sierra fühlen oder im medizinischen Bereich sind, verstehen Sie einige Grundlagen über das Geschäft, verstehst du? Worum geht es bei diesem Geschäft? Wie verdient das Geschäft Geld? Einer der Geschäftsprozesse, die daran beteiligt sind, was ist der Workflow für einige der wichtigsten Performance-Metriken im Unternehmen? Und das ist sehr sogar in einem größeren Data Science Teams. Es gibt immer jemand, der uns angerufen hat, der Export nichts ausmacht. Ich habe nichts dagegen. Export ist ein sehr kritischer Teil von einem Data Science-Team, so dass große Teams in der Regel einen Domain-Experte haben, der vielleicht kein technischer Typ ist, ist kein statischer Sit als Kerl, kein Programmier-Typ, ist nur jemand, der das Geschäft kennt. Halten Sie ihn im Team, um Ihnen beim Verständnis des Problems zu helfen. Domain-Einsendungen? Nein, das ist eine wichtige Sache. Missionen nur edle Zahlen und Strings. Sie machen nur Müll in Müll. Sie brauchen Menschen, um diese Zahlen und Stärke jede Bedeutung zu assoziieren. Die Mission Don't Missionen verstehen das Geschäft nicht. Der Mensch versteht das Geschäft in der Datenwissenschaft. Es ist wichtig für Sie, alles zu verstehen und zu validieren, was da kommen wird und das nur von Menschen getan werden kann, und für die Menschen, um das zu tun, brauchen sie Verständnis des Problems. Wissen über die Domäne hilft den Teams, die Entitäten, die Beziehung, die Muster, jede Art von Wissenserkennung, die Sie benötigen, um sie zu validieren zu verstehen Beziehung, die Muster, . Und die Verletzung kann nur getan werden, wenn Sie wissen, was das Problem nichts ausmacht, ist alles über einen Erwachsenen. Auf diesem Verständnis des Problems hilft domain Ihnen, alle Annahmen zu validieren. Noch wichtiger ist , identifizieren Sie Fehler also die Daten haben einige Dinge. Woher wissen Sie das? Was ist, wenn Sie zum Beispiel einen Tag Dan suchen, und sagen wir, das Alter der Person zeigt sich 600 Jahre. du es dir ansiehst, weißt du, dass es nicht falsch ist, weil es niemanden gibt, der 600 Jahre alt ist. Aber Sie können das nur tun, weil Sie wissen, das Domain-Alter ist ein sehr häufig verwendete Begriffe. Jeder versteht, worum es geht. Was? Was ist mit so etwas wie Cholesterinspiegel? Woher wissen Sie, was ein gültiger Cholesterinspiegel ist? Was ist kein gültiges fragwürdiges? Wenn jemand einen illegalen off 1000 hat, ist das möglich? Ist es eine normale Zahl in die hohe Zahl Ist keine eingeladene Nummer? Sie können nur feststellen, ob Sie die Domain kennen, und deshalb ist Domain-Experte für Sie nach dem Verständnis der Domain erforderlich. Die nächste Phase ist das Verständnis der Daten, die mit den Daten verknüpft sind. Wir haben genug über Daten und einige der anderen Abschnitte gesehen. Hier, zurück dazu, Geschäftsprozesse auf Buchflüssen generieren Daten. Viele Daten, einige erfasst, einige nicht erfasst. Aber wo immer die Daten erfasst werden, gibt es mehrere Dinge wie die Anwendungsdaten 100, die Sie in verschiedenen Eintragsanwendungen tun , die Berichte Es gibt Visualisierungen. Es gibt automatisierte Daten aus Da unsere Datenfeeds, gibt es Web-Klicks, die Sie in einem Browser erhalten. Jeder Klick ist auch einer der Datenfüße, dass unsere Point of Sale Transaktion, die aufgezeichnet wurden und es gibt Social Media unsere Datenfeeds. Außerdem handelt es sich dabei um Geschäftsdaten, die über mehrere Quellen generiert werden. Sie wurden in mehreren Systemen gespeichert. Einige sind im kooperierenden Netzwerk. Der Sommer entwickelt sich weiter. Es gibt überall Daten, die Sie verwenden möchten. Die Daten natürlich strukturiert, können natürlich strukturiert, unstrukturiert oder halbstrukturiert sein. Auch dies haben wir schon gesehen, dass Daten unterschiedliche Ursprünge haben. Gibt es eine Art von verschiedenen Celli Und sie könnten viele logische Beziehungen, Beziehungen haben , natürlich, oder den Schlüssel zu jeder Art von Diner Management Verständnis, Daten verstehen, welche Daten Sie haben, ist ein sehr wichtige Sache für einen Datenwissenschaftler. Was willst du? Verstehen Sie die Daten? Sie werden die Quelle der Daten nicht verstehen. Wie reabel sind die Daten, ist es, dass sie an der Maschine erzeugt werden, oder werden sie von den Menschen eingegeben ? Menschen Ist das eine Möglichkeit von jemandem? Mann? Beim Hochladen der Dateneingabe werden Zeichnungsdaten eingefügt und davon weggenommen, weil wir wie gut die Daten, die Sie für Ihre Analyse verwenden werden, das ist, was in die Mine geht, wie gut Ihre Vorhersagen sein werden. Daten müssen also gültig sein, um sicherzustellen, dass diese Daten nicht von jemandem betrieben werden. Aus anderen Gründen müssen Sie verstehen, welche Art von Verarbeitungs- und Transformationsschritten für die Daten ausgeführt werden . Amore hat angeblich einige Daten, die von jemandem während der Passage verworfen wurden weil sie dachten, dass es nicht wichtig ist, da einige doppelte Daten zur Verarbeitung machen . Verlieren Sie einige Daten, weil Sie eine Zusammenfassung durchführen oder nicht? All diese Dinge, die Sie von alten Lolita verstehen müssen, wie die Führer zu anderen Studenten Enterprise-Datenbanken Wolken Neuf diese Feeds, wie die Daten zwischen diesen verschiedenen Quellen von Daten synchronisiert werden . Weißt du, wenn jemand und als Daten an Ort und Stelle eines Tages es vielleicht auch an Ort und Stelle sein könnte, so was? Sie sind wirklich miteinander synchronisiert. Was ist die Beziehung, die innerhalb der Daten vorhanden ist? Ich weiß. Mal sehen, was für Dinge? Wie die Fremdschlüsselbeziehung zwischen den Daten, sollte das i d hier mit dem I d dort und so etwas übereinstimmen. Bestellung von Erstellung, wenn Bestellung, Sie wissen, verwenden Sie wie die erste Bestellung etwas wie, Okay, auf der Agent zuerst geht und geben Sie etwas in System kann. Dann geht er, und Kinder sind nach System. Dann tut er etwas Eindringliches. Steve, hier hilft Ihnen das Verständnis Ihres Geschäftsprozesses zu verstehen, wie die Daten in welcher Reihenfolge erstellt werden. Auch das Verständnis von Daten hilft dem Team, mögliche Quellen aus Ihren prädiktiven Mustern zu identifizieren . Und wo bekommen Sie diese Muster von Rio immer verletzen, wenn Sie einen Teil sehen , ob es gültig ist oder nicht. Daher ist es wichtig für Sie zu verstehen, wie der Tag kommt und wie er geschaffen wurde . Verstehen Sie Ihre Muster selbst. Manchmal können die Muster aufgrund des Gebäudes erstellt werden. Es wurde auch geschaffen. Also Dinge, die an dieser Stelle wirklich komplex sind zu erklären. Aber ein Verständnis der Daten im Allgemeinen ist eine gute Sache für einen Data Scientist 8. Data – Datenerfassung – Data: Die nächste Phase, über die wir sprechen werden, ist die Daten dauerhaft Gesicht, wo Sie Ihre getan immer einrichten und Data Engineering. Es ist die ganze schmutzige Arbeit, die Sie tun müssen, um die Daten von verschiedenen heute in das Formular zu bekommen wir sein wollten. Es tut also überall da draußen. Therapie nicht verwaltet. Du musst die Daten zusammenbringen. Holen Sie sich Ihre Handlung zusammen, holen Sie alle Daten zusammen, schlagen Sie sie zusammen, legen Sie sie alle an einem einzigen logischen netten Ziel, wo Sie dann jede Ihrer weiteren Analyse durchführen können . Die erste Stufe in der Datentechnik ist die Datenerfassung. Also, wo Ihre Aufgabe ist es, Tochter aus verschiedenen Datenquellen zu erwerben, dass sie Unternehmensdatenbasis sein können , wie vielleicht in einer Artikeldatenbank auf meinen Fortsetzungsdatenbanken sitzen, muss es jetzt möglicherweise durch bewölkte Pfeiler getan werden. Es gibt eine Menge von Verpflichtungen in der Cloud. Sie geben Ihnen ein P. A ist in der Cloud wie Salesforce, zum Beispiel müssen Sie gehen und Daten über den AP abrufen. Augen lesen. Ich komme vielleicht zu einem Scanner und füttert Sensor-Feeds wie Barcode-Barcode-Scanner. Es kann über soziale Medien kommen, vielleicht haben Sie einen Download. Soziale Medien wie Twitter und Facebook. Alle von ihnen sind Datenquellen. Jeder von ihnen präsentiert eine andere Art von Anwendungsfall in einer anderen Art von Herausforderung für Sie . Manchmal kommen die Daten möglicherweise auch in Echtzeit. Es könnte in der Masse kommen. Es könnte kommen, introvertiert. Eine Daten auch. Also all das schafft verschiedene Probleme für Sie. Eines der wichtigsten Dinge an der Datenerfassung ist Vernunft. Überprüfen Sie die Überprüfung und stellen Sie sicher, dass Sie alle Daten haben, die Sie benötigen. Und es gibt keine Daten, die in der Transportschicht verloren gehen. Eso die Gerberei. Testprüfung ist ein wichtiger Bestandteil der Datenerfassung. Es ist ein sehr umständlicher und zeitaufwendiger Schritt, um einzurichten, warum es umständlich ist. Einmal aufwändig, die Einrichtung nicht zu sagen, dass die erfasste Einrichtung einzurichten ist, weil, wenn Sie all diese Datenquellen haben , was kommt, aber das ist Dinge wie Sicherheit. Es gibt Leute, die diese Datenbanken besitzen. Es sind Sicherheitsrichtlinien involviert. Es sind Freigaberichtlinien involviert. Sie werden also viel Zeit damit verbringen, Verbindungen zu den Missionen herzustellen, die für die Menschen involviert sind , die die Missionen kontrollieren, kann wirklich die Zeit zum ersten Mal frustrierend sein. Weil ich denke, die Datenwissenschaftler, wenn Sie wirklich nah sind, richtig, größer, dass wir den Himmel mögen. Wenn Sie bereits Angeklagte Abteilung an der Tür sind. Esos Es ist auch 90 Abteilung. Möglicherweise haben Sie nicht viele Probleme, aber Sie sind nicht in der Energieabteilung, Sie oder vielleicht ein Konzert und Sie sind in einer anderen Abteilung auf Ihre Daten sitzen dort und Unternehmensdatenbasis. Es sitzt in der Wolke. Dann wird es umso umwerfender Gespräch mit allen Menschen in Wall ihnen erklärt warum welche Daten Sie brauchen, was Sie brauchen, was Sie die Daten brauchen und was Krieg ehemalige Redakteure und bekommen sie zu teilen die Daten auf gehen durch alle organisatorische Mist wird eine Menge Zeit und Mühe beteiligt . Das ist also eine sehr umständliche, frustrierende Dies ist der Tag, an dem sie an Ihrem gearbeitet haben, um die Datenbereinigung durchzuführen. Sobald Sie die Daten erhalten haben, mussten Sie sie reinigen. Warum haben Sie den Reiniger? Weil Daten unterschiedliche Sauberkeit und Vollständigkeit aufweisen. Nicht alle Daten, die Sie erhalten werden, sind saubere und vollständige Strukturdaten von Unternehmensanwendungen wie, wissen Sie, die in der Datenbank sitzen, sind tatsächlich sauber und vollständig, so dass Sie nicht die sehr darüber . Diese bereits sauber, bereits abgeschlossen in der ersteren. Willst du, dass sie das sind? Keine Probleme, aber Daten, die Sie aus dem Internet von Social Media von Voice Transcript bekommen alle von ihnen benötigen möglicherweise erhebliche Bereinigung. Wissen Sie, es hat schmutzig unvollständig auf allen Arten von mehreren Formaten auf Nehmen wir an, wenn Sie sich einen der Twitter-Feeds ansehen , wissen Sie sind keine vollständigen Sätze, dass viele Abkürzungen und Parkins von Dingen Junkin sitzen da, sie sind alle müssen aufgeräumt, untersucht und Daten fehlen. Das ist ein weiterer wichtiger Punkt. Was ist mit fehlenden Daten? Möglicherweise fehlen Ihnen Attribute. Collins sind vielleicht fehlende Werte für bestimmte Attribute. Wie willst du mit ihnen umgehen? Willst du ihnen einen Wert geben? Denn wenn Sie zum Beispiel so etwas wie ein Haupt dort platzieren , versteht Ihr Missions-Lernalgorithmus nicht, dass irgendwelche Insassen unter diesem Wert denken , wenn Sie Null als Wert für eine Zahl setzen. Dein Garten würde es nehmen. Okay, Null ist ein Wert. Wie sagst du es dir? Mission Learning Algorithmus Null bedeutet und nicht verfügbar Ein anderer, wo sagt, dass es einen gewissen Wert hat . Es ist nicht leicht zu tun. Viele Male müssen Sie einen Ersatz setzen und bevor sie dort sterben, und sie haben Einfluss auf Ihre Mission Lernalgorithmen. fehlende Datenverarbeitung ist also eine sehr wichtige Entscheidung, die hier getroffen werden muss. Reinigungsbeispiel sind, als würden Sie Datumsformate genau dort normalisieren. Manchmal realisieren ein imam dd dd mm Öl über mm wirklich alle Arten von ehemaligen wissen. Sie wollen eine normale Leichtigkeit und Standards sie Zehe 14 Monate, bevor Sie mit der Standardisierung auf Dezimalstellen beginnen können . Manchmal kommen die Daten auf 1.23 Manchmal wird es verwendet, um das exponentielle Format für eine Zahl zu verwenden . Und alles, was Strategie sein muss, ist wieder unter dem Klassiker. Eins ist der Nachname. Vorname war der Vorname Nachname. Wie man Namen in den Daten dargestellt. Also wirst du wissen, was Bauern sie sind. Sie alle müssen wie standardisiert sein. Es gibt einen Teil des Reinigungsprozesses auf. Noch wichtiger ist, wenn Sie wie Textfeeds von irgendwo bekommen, müssen Sie eine Menge Säuberung für Text durchführen, der eine ganze Minenräumung selbst ist. Was machen Sie mit der Textbereinigung? Das ist alles, was getan werden muss, bevor Sie die Daten für jede andere Analyse verwenden können. Datentransformationsdaten nach einer Bereinigung müssen möglicherweise Klemmen auf der Zehe sein. Ein anderer Former sind unterschiedliche Formen, bevor Sie es verwenden. Der Grund für die Datentransformation ist also extrahierte Informationen aus Daten, während unnötiges Gepäck verworfen wird. Was bedeutet unnötiges Gepäck ist gegen den Geist von dem Mädchen mit dem, was Sie suchen die Daten. Wenn Sie also keine Daten benötigen, benötigen wir keine Details. Sie können sie zusammenfassen und all das unnötige Gepäck entdecken, das ihre typische unterstützte Verarbeitung und Zusammenfassung von Moores ist. Sie versuchen, Sommer assoziierte logische Aktivitäten. Levels auf Transformationen helfen, den Tag zu reduzieren. Es gibt Anzeichen auf vielen Labyrinth für die Verarbeitung verwendet Idee. Warum wollen Sie Oh, also eine Transformation ist, dass Sie es mit diesen Daten in eine Form wollen, die Sie sich fragen, besser verstehen können , wie Sie eine Zahl aus dem Kurs in einen logischen Datensatz reduzieren können, die die ganze Sache, die von Beispielen passiert, die Sie hier sehen möchten, ist, dass Besucher zu einer Website kommt und er klickt auf eine Zahl von den Seiten in der Website. Du fragst dich vielleicht, dass jemand alle in einer einzigen Platte ist. Aber wenn das alles ist, was wir brauchten, sollten Sie einige Sprachübersetzungen zwischen mehreren Sprachen durchführen. Wenn es einen medizinischen Sensor gibt, dass das kommt, sagen wir, es gibt einen Sensor, der Ihren Blutdruck jede Sekunde erfasst und Sie und Blutdruckmessung sendet . Vielleicht möchten Sie es nach Intervall zusammenfassen. Sie können ein 30-Minuten-Intervall nehmen und dann Zusammenfassungen und sagen in diesem 30-Minuten-Intervall, was ist der maximale Handel? Was ist die Mindestbewertung? Was ist der durchschnittliche Lesen Dinge wie das und fassen Sie es zusammen. Außerdem kann ich jemanden von Ihrem Anwendungsfall abhängen, welche Art von Transformation Sie tun möchten und es zusammenfassen. In diesem Fall kommt Zusammenfassungen Nach der Transformation Daten und Dishman. Verschönerung geht es darum, später einige zusätzliche Attribute hinzuzufügen, die die Qualität der Informationen verbessern . Sie möchten Ihren Daten weitere Informationen hinzufügen, die Ihre Analyse wesentlich verbessern können. Also, welche Art von Informationen, die Sie hinzufügen können? Ah, zum Beispiel, Sie können Informationen, die demographischen Informationen aus einer Kundendatenbank zu einem Point of Sale Transaktionsdatensatz . Also wird die Verkaufsstelle nur Ihren Kundennamen, Ihre Kreditkartennummer und welche Produkte er mitgebracht hat. Jetzt können Sie die Kunden demographische Informationen von 1/3 Partei, dass ich wie einer dieser Kunden Hilfe sein , Sie wissen, Familienstand, Bildung, Bildung, Einkommensniveaus. Und Sie können das an diese Daten anhängen. Sobald Sie hatte ich gesagt, dass zu den Daten, als was er tun kann, ist, können Sie eine Analyse , welche Produkte Menschen kaufen wie Menschen. Nehmen wir an, Milch, Wer kauft Milch andere Menschen, die männlich oder weiblich sind, ist die Menschen, die über 20 fair unter 25. Sie können all diese Art von Analyse durchführen, sobald Sie können. Endlose lästige Daten zu unserer Tradition. Informationen. Dinge wie Sie können keine logischen Gruppierungen von Patienten aus der Vergangenheit Anamnese, wie Sie die frühere Krankengeschichte eines Patienten an seinen aktuellen Besuch anhängen können. Dann können Sie sehen und sehen, Sie wissen, wie Menschen mit der Vergangenheit Krankengeschichte spar. Verschiedene Art von Krankengeschichte, durchführen, sind, sind zu Fuß Dinge, die Sie mit ihnen tun. Daher ist ermutigende Daten ein sehr wichtiger Schritt. Durch das Hinzufügen von mehr Daten aussagekräftigeren Daten erhalten Sie bessere Einblicke in die Daten, die Sie dort haben. Und wenn du mit allen fertig bist, gehst du den Fuß. Behalten Sie Ihre Daten, aber Sie speichern Ihre Daten bei Bedarf. Ein vernünftiger Modeprozess. Die Daten werden in einer zuverlässigen, abrufbaren Datensynchronisation gespeichert. Sie wollen also alle Ihre Tochter verarbeiten und sie in einem schönen wiederbeschrifteten abrufbaren Daten setzen . Synchronisieren Sie alle Leberinformationen, die in einem einzigen Look-Datensatz erfasst werden, so weit wie möglich. Sie haben Daten, die aus mehreren verschiedenen Quellen stammen. Das Beste, was Sie tun können, ist, wenn Sie sie alle Organisten als logischen Datensatz erhalten können, wie einen einzigen langen Datensatz, der alle Informationen enthält, die Sie benötigen. Du solltest nicht viel von Fremdschlüssel-Dingen machen. Sie wollen lieber Zehe de sie normalisieren und sie alle in der gleichen Aufzeichnung und setzen sie alle zusammen. So wird Ihnen die weitere Befragung und Analyse sehr einfach gemacht. Ein Beispiel wäre wie eine kleine Seelen-Transaktion. Sie können die Point-of-Sale-Daten verwenden. Sind der Kunde demographische Informationen, um es auf den Artikelmerkmalen, wie Sie den Artikel haben, der gekauft wird, können Sie sagen, Art des Artikels. Es ist Tagebuch in einem funktionierenden, aktualisiert Hat Sachen wie das und Sie können auch hinzufügen, wie Vertriebsmitarbeiter Performance-Informationen, so dass Sie dann neue Analyse einer Sales Associates Leistung basierend auf dem Produkt, das verkauft wird basierend auf der Kundendemografie und solchen Dingen. So können Sie alle in einer einzigen Platte zusammenfassen und speichern wollen. Das ist der Schritt, der die Datenpersistenz aufgerufen hat und schließlich Skalierung der Abfrageleistung sind ziemlich wichtige Faktoren. Natürlich. Es ist gut im Schlepptau. Die Datenarchitekturdomäne, in der sich die Data Architects befindet. Die Arbeit ist für Architekten. Aufgabe ist es, Ihre Daten zu entwerfen, so zu singen, dass es alle Daten halten kann, die Sie haben und hat eine vernünftige Skalierung. Es hat eine gute Qualität Leistung und all das, um Sie im nächsten Schritt zu helfen, die die analytischen Schritte Daten natürlich ist, können Sie sie als flache Dateien, traditionelle SQL-Datenbanken speichern . Und dann, natürlich, heute haben Sie alle Big Data-Technologien wie Hadoop auf Hard Open seine Datenbanken, wie Hedge-Basis, die Sie Ihre Daten speichern möchten. Das vervollständigt das zweite Gesicht eines Data Science-Projekts. 9. Data – Analyse und Produktion: Hallo. Dies ist Ihr Dozent Cameron hier auf den Data Science Lebenszyklus fortzusetzen. Diese Gedankenphase ist ein Betäubungsmittel, bei dem Sie versuchen, aus den Daten zu lernen und Ihre Vorhersagen zu machen . Der erste Schritt in der Analyse ist, was man als Erforschung von drei Datenanalysen R E d A. In in Schussform bezeichnet. Eine sehr berühmte Kurzform in der Datenwissenschaft. Was wirst du tun, wenn e t. A. ist? Sie möchten einzelne Attributmuster verstehen, die Sie ein Alter als Attribute nehmen . Sie werden Dinge wie die Bereichsminimalwerte, Maximalwerte, die Frequenzverteilung, mich, solche Dinge nicht verstehen Maximalwerte, die Frequenzverteilung, mich, . Das nächste, was Sie wollten, war eine Beziehung zwischen den Attributen zu verstehen, wie das, was die Beziehung zwischen Alter und Sie kaufen Muster Beziehung zwischen Einkommen auf da Geschlecht, Dinge wie das. Wie wirkt sich eine Änderung in der einen auf die andere aus? Mit anderen Worten, Sie drehen sich alles um Beziehungen in diesem Gesicht, das Sie tun wollen. Einige Diagramme versuchen, eine Analyse durchzuführen und mehr darüber zu verstehen, was Sie in den Daten sehen . Dann tust du das. Argumentation ist das Verhalten erklärbar? Was auch immer Beziehungen in Mustern Sie in den Daten sehen, gibt es eine Erklärung dafür, warum es so ist, dass es nicht tut. Wenn Sie keine Erklärung als möglich finden, gibt es eine Möglichkeit. Oft besser. Oder vielleicht ist es ein neues Muster. Das ist etwas, das Sie besprechen und dann herausfinden wollen, dass Sie es sind. Schauen Sie sich unsere Spieler an und dann entscheiden, was Sie mit ihnen gehen wollen, ob sie einschließen oder ausschließen, ähm, sind abhängig von Knochen. Was zum Ausreißer Valley West. Und es ist ein Anwendungsfall von Anwendungsfall Basis. Sie entscheiden, was Sie ohne Spieler tun möchten. Mögliche Fehler in der Verarbeitung können Sie nur finden, aber ausgenutzt und zuhört. Das ist ein sehr guter Nutzen aus dem Prozess. Nehmen wir noch einmal ein Beispiel für die Wartezeiten des Patienten. Wir haben gerade ein paar Sklaven besprochen. In dem Moment, in dem Sie von acht wie 600 sehen, wissen Sie sofort, dass da etwas nicht stimmt . Es liegt ein möglicher Fehler vor. Es war auch das, was Sie nennen Spieler annehmen, es gibt ein paar Patienten, die ein 70 75 Jahre alt sind . Jeder andere ist wie 40 Lektion für 40 Jahre alt, die vielleicht wollen Sie entscheiden und beseitigen diese beiden Platten ohne Spieler. Das ist eine mögliche Verarbeitung unserer Kunden. Willst du auf dich gehen? Natürlich wollen Sie verstehen Beziehung zwischen dem Patienten Warten und auf der Diabetes-Ebene , den Cholesterinspiegel auf der Familiengeschichte und so etwas. Und schließlich, Sie verletzen Ihre Ergebnisse mit den Domain-Experten Wenn sagen, Hey, das ist, was ich in den Daten zu sehen. Hat dieses Gel mit dem, was Sie bereits über etwas Neues wissen, Sie wollen mit ihnen reden und verstehen, wie die Dinge sind. Der nächste Schritt ist die Inferenzanalyse. Was tun Sie in der Inferenzialanalyse ist die Suche nach Signalen. Wissen Sie, Sie suchen nach Mustern, Sie suchen nach Konsistenz in den Rücken und Sie suchen nach Korrelationen. Sie suchen nach Argumentation. Das ist eine Art Überlappung mit einem Vertrag nach unten zu erkunden. Es sei denn, dies ist tiefer und fokussierter und methodischer, als Sie hier in Französisch in der Analyse tun , dann überprüfen Sie und sehen, ob die Muster konsistent und reproduzierbar sind. Was Sie mit konsequent meinen, ist, dass Sie den gleichen Teil Monat für Monat sehen? Sie sehen, dass das eine ist, wenn die Rate steigt, sehen Sie, dass der Cholesterinspiegel steigt, passiert es für Ihre Patienten? Jeden Monat bekommen Sie jeden Monat eine neue Patientengruppe und Sie sehen immer das gleiche Muster. Siehst du das gleiche Muster? Sehen wir uns Städte in verschiedenen Ländern über verschiedene Rassen an, all das als Teil der Inferenzialanalyse. Und dann machen Sie einige statistische Tests, um zu sehen, dass die Ergebnisse, die Sie mit den Daten sehen , sagten, dass Sie haben. Kann das auf die indische Bevölkerung extrapoliert werden, wie Sie Daten aus San Francisco haben können das gleiche, und das ist mit Ergebnissen, die gleiche sein, wenn Sie es extrapolieren, so dass sie und ihre uns aus der ganzen Welt sind sie Wird anders sein? Es sind alles, was Sie tun, als Teil der verstoßenden Analyse wieder. Und nehmen wir ein Beispiel für Patienten. Warte, war der Diabetes. Sie machen das alles in Französisch In Analyse, als könnten Sie schnelle Daten aus einem Staat nehmen, dass Kalifornien die Analyse durchführt und dann sehen, wie Kalifornien mit New York vergleicht wenn man R Calif sieht. Sind die dann schauen Sie Rassen. Schauen Sie sich asiatische Amerikaner zu asiatischen Amerikanern in Kalifornien zeigte die gleiche Muster Lage Amerikaner in der New York. Unsere Spende American zeigte das gleiche Muster wie Afroamerikaner. Schlimmer sind andere Menschen. Also machen Sie all diese Art von Segmentierung und dann machen Sie all diese Profiling während der inferentiellen Analyse auf, kommen Sie davon und schätzen alle Ihre Ergebnisse während dieses Prozesses ? Sobald Sie wissen,, Inferenzialanalyse die nächsten Stufen Modellierung. Dies ist, wo alle Ihre Mission lernen alle Wächter ins Spiel kommt, sind Sie spielen früh Immersion lernen alle Gärten, Modelle zu bauen, was Sie im Modellbau tun, ist Ihr typischerweise versucht, mehrere Modelle mit verschiedenen Algorithmen auf verschiedene Datensätze. Dies sind alle Techniken, die es gibt und Missionslernen. Es gibt einige Techniken, wie Sie Ihre Datensätze und die mehrere Substanz segmentieren und sie dann verwenden können, um Modelle zu erstellen und Modelle zu testen. Dann, wie verschiedene Algorithmen verwendet werden können, ist die ganze Domäne außerhalb der Mission Learning dreht sich alles um. Wenn Sie einen Kurs in Mission Learning nehmen, war es nur eine Linie, die Bohnen explodieren durch den gesamten Kurs. Du natürlich testen, musst natürlich testen,dass deine Modelle wieder verrückt waren. Ihre Methoden dafür, wie Sie das in maschinellem Lernen tun Schließlich bin ich. Wenn ich Ihre beste Leistung Modelle, wenn wir sagen, beste Leistung, wir sprechen über Genauigkeit. Wir sprechen über die Reaktionszeit und die eingesetzten Ressourcen, so dass Sie wieder einige Kompromisse machen müssen. Doch was Ihr leistungsfähiges Modell betrifft, sagen wir ein Modell gegen Sie. 80% Genauigkeit auf es dauert eine Minute laufen. Das ist ein weiteres Modell, das Ihnen 85% Genauigkeit gibt, aber es dauert eine Stunde Torrent. Welches ist dir wichtiger? Sind die mehr aufgehängt für die 85 oder 80? Seltsam. Ist es in Ordnung, dass Sie eine 80% ige Genauigkeit haben, aber eine angemessene Reaktionszeit haben? Also haben wir davon gehört. Sehen Sie sich all diese drei Dinge an, wie die Genauigkeit, die Reaktionszeit und die verwendeten Ressourcen. Die erforderliche Rechenleistung. Ein Gebäude Modelle Andi. Dann zu sagen, was Ihr bestes Modell sein wird, so dass Sie am Ende bauen, so einfach wie ein Entscheidungsbaum oder eine Gleichung sein könnte . Es können Komplexe gefragt werden. Das neuronale Netz für hängt vom Problem und den betreffenden Daten ab. Also, aber am Ende des Prozesses haben Sie ein Modell, das Sie basierend auf den verschiedenen Algorithmen und den verschiedenen Versuchen,die Sie kennen , affray, 1.000.000-Modelle auswählen die Sie kennen , affray, . Dann gehen Sie und machen Sie alle Ihre Produktionen mit neuen Daten wieder, die ungünstig haben Sie die Vorhersage testen können, testen Sie Ihre Modelle wieder, ein Teil der Mission Lernkurse, die Sie sehen werden. Sie müssen Ihre Modellgenauigkeit weiterhin validieren. Also nehmen Sie einfach an, ein Modell zu bauen, das einmal getestet wurde und weg von ihm. Aber du wirst es versuchen. Befriend-Modelle sind manchmal sogar eine Kombination aus verschiedenen Modellen und dann sehen, welche Ihnen die bestmögliche Genauigkeit gibt. Sie werden versuchen, dass meine Leute Reifen und Variationen in diesem Prozess der Verhandlung sind . Maris wieder die beste Zeit, wenn Sie Ihre verwenden können Es gibt eine Menge davon ist, warum ich es das Forschungsprojekt nennen . Zu Beginn werden Sie eine Menge Forschungsjahr Tray von verschiedenen Dingen zu tun und sehen, welche am besten für Ihr spezifisches Projekt funktioniert , eine Reaktionszeit, Ressourcenforschung, alle mechanisch, vor allem, wenn Sie Vorhersagen in Echtzeit wie eine Web-Suche machen müssen. Sharper hat gerade in Ihre Website gekommen und ist Surfen durch Ihre Website machen Klicks, und Sie wollen eine Vorhersage in Echtzeit. Aber die Käufer, die kaufen, sind es nicht. Diese Entscheidungen wurden wie in Echtzeit getroffen, wissen Sie, innerhalb einer Sekunde mit möglichst minimalen Ergebnissen. Also sind Sie ein Pick Ihre Algorithmen. Auf dieser Grundlage möchten Sie weiterhin Verbesserungen messen. So, wie Sie arbeiten oder verschiedene Kombinationen aus der Produktion von Wächtern der traditionellen Regierungen haben zwei Teile. eine ist das Modellbauteil und das zweite ist das Vorhersageteil. Also müssen Sie sich beide ansehen und sehen, ob es bei beiden besser ist. Manchmal dauert einige Produktion von gottverdammten mehr und das Build-Modell, aber sie können sehr schnell sein, die Produktionsteile von verschiedenen Dingen dort zu machen. Also wieder, Sie müssen alle Ihre Algorithmen messen, wie sie funktionieren, und dann vergleichen sie sie weiter und sehen dann, welcher der beste ist, den Sie wählen möchten . Vielleicht haben Sie sogar Simulationen. Assimilation kann so einfach sein wie mathematische Simulationen, oder Sie können Software erstellen, die bestimmte Anwendungsfälle ähneln kann. Assimilation wird verwendet, um zu überprüfen, ob Wasser unterdrücken Ihren Garten sagte, dass in dieser gegebenen Situation dies das Ergebnis sein könnte. So Einheit ist dort ähnlich, dass, ähnlich, diese Umgebung. Es kann ähnlich wie die NDP ihre Umgebung macht und dann sehen, ob das Ergebnis, das Sie vorhersagen, das ist, was Sie bekommen werden. Simulationen sind also komplexe Software. Manchmal bauen Leute sie nicht, um die Vorhersagen zu validieren. Sobald Sie alle diese Modell auf der Produktion aufbauen, der letzte Schritt, den Sie in diesem Fall tun, hat sich mit einem Satz Empfehlungen kommen. Was machst du hier? Ist das am Ende dieses Projekts, eine Empfehlung muss den Projekteigentümern zur Verfügung gestellt werden Okay, auf was Sie getan haben, was sind die Algorithmen zu verwenden und wo sind die erwarteten Vorteile? Also alle von ihnen, wenn Sie zusammen in einer schönen Präsentation und präsentieren ihre Zehe die Produkt-Besitzer und hier kommt, um ein anderes Wissenschaftsprojekt zu fangen gemacht haben keine Empfehlungen, um es die Daten zu machen , die keine erklärbare Muster. Wir haben darüber gesprochen, dass alles darum geht, aus Beziehungen zu lernen. Wenn die Daten, die Sie haben kein Muster aufweisen, beliebiges Muster zwischen dem Ergebnis auf einer anderen Variablen. Wenn das Ergebnis aus den Daten, die Sie haben, nicht vorhersehbar ist, gibt es nichts, was Sie Desai vorhersagen können. So einfach. Das bedeutet nicht, dass die Daten seit Projekt ein Fehler ist. Sie können ein Produkt mit Schüttelfrost haben. Schauen wir uns unsere Kundendatenbank an und sehen, ob wir die Kundenabwanderung am Ende des Projekts vorhersagen können . Wir, damit Sie kommen und sagen können: Basierend auf den Daten, die wir haben, können wir Kunden Chung nicht vorhersagen, dass es nicht bedeutet, dass das Essence-Projekt ein Fehler ist . Das neurowissenschaftliche Projekt funktioniert nur, wenn die Daten belastet sind, so dass es nicht standardmäßig aus den Daten. Wissenschaftler, wenn Ihre Daten nicht schuld, sind irgendwelche Muster, natürlich, ist der Vater der Daten Scientist ist die Daten hat Muster und der Data Scientist nicht, sie zu finden. Aber die Daten haben keine Muster. Es ist nicht die Schuld der Datenwissenschaftler, also ist dies eine weitere wichtige Sache zu beachten. Manchmal werden unerwartete Muster entdeckt, die zu anderen Vorteilen führen, so dass Sie vielleicht den Dodi mit besonders Ziel im Auge betrachten. Als ob Sie sich die Kreditkundenabwanderung ansehen. Aber das sehen Sie vielleicht. Okay, ich sehe ein paar nette Muster. Diese Muster könnten verwendet werden, um etwas anderes vorherzusagen. So wie Sie diese Daten zum Beispiel verwenden, um Störungen vorherzusagen . So könnte ein Data Science-Projekt diese Seite schießen einen Nebenvorteil. Du könntest also sagen, OK, ich sehe dieses schöne Muster hier. Vielleicht müssen wir tiefer eingraben. Dann gehen Sie einen weiteren Tag erstellen, Dutzende Projekt dafür, und dann weiter unten, dass Teile von der Tür. Ein wissenschaftliches Projekt würde auch mit diesen Vorteilen kommen. In der Tat können viele von ihnen während des Prozesses auftreten, sobald Sie anfangen, die Daten zu betrachten. Und natürlich natürlich machen Sie endlich eine Präsentation zu den Empfehlungen. Sagte den Stakeholdern, die letzte der Dinge, die Sie wollen, nicht. Hier sind die Iterationen, die erforderlich sind, obwohl die Schritte weniger sind, als sie hier in der Reihenfolge durchgeführt werden sollen. Sie gehen immer hin und her zwischen diesen Schritten auf, die vielleicht platzen auf Zwischen- oder am Ende, Analyse und Feedback Also, nachdem Sie alle Ihre Analyse zu tun, haben Sie mit dem Domain-Experten geschrien. Sie haben mit den anderen Projektbeteiligten geschrien. Sie kommen möglicherweise mit etwas Feedback zurück, das Sie zwingen kann, wieder weiterzumachen, und wiederholen Sie dann die Analyse auf neues Licht, das auf die Daten, die Sie haben, geteilt wurde. So können die Menschen unterschiedliche Ziele haben, verschiedene Prospektoren, die Ihnen neue Auslöser geben könnten, um zurück zu gehen und die Daten zu betrachten, die ein Kommentar ist. Indien unterzeichnet das Produkt darin, dass ihre Antwort auf die Ergebnisse in den Daten auf dann kann es ihn in mehreren Analyseteilen nehmen. Wenn Sie haben, dann kommt das letzte Gesicht, das die Produktion Gesicht oder die Produktion Vereisung Gesicht ist. Wir implementieren nur kontinuierliche Prozesse, die Sie zwei Anwälte sind die ganze Arbeit, die Sie in den früheren Gesichtern getan haben . Ondo beginnen, etwas auf einer kontinuierlichen Basis Jahr zu tun. Also, hier kommt, was man Building date up Produkte nennt. Also, was ist das Datum? Ein Produkt und das Produkt ist eine Anwendung, die mit Daten arbeitet, etwas aus Daten heraushält und es verwendet, um ein bestimmtes Ziel zu erreichen. Es ist einfach, wie diese Bestellung Später Produkt. Also einmal eine Datenmodellierung und Vorhersage. Kranke bewachte sich selbst, gestrafft. Weißt du, was genau du tun musst, dann bekommst du besser ein Produkt. Also, was ist das bessere Produkt ist im Grunde Produktion izing, wissen Sie, das Gericht die Quartiere nicht mehr und kein Drehen von als 80. Du kannst nichts. Du machst 1/4. Diese Produktionsqualität wird alle Fehlerprüfung an Ort und Stelle mit all der Verwaltung und Überwachung an Ort und Stelle, die tun kann, dass alle Schritte, über die wir gesprochen haben, tun. Alle Schritte zur Dateninjektion. Sie geben uns also automatisieren das Abrufen von Datenfeeds aus all Ihren Datenquellen und dann müssen Sie diese Anwendungen automatisieren, um regelmäßig zu laufen. Schauen Sie sich die Daten an, die eingehen, und es beginnt die Reinigung der Daten, Transformieren der Daten, Persistenz der Daten. Dann wird Ihr ganzer Analysecode eintreten. Andre wird sich die Daten regelmäßig ansehen und mit dem Bau von Modellen beginnen. Also alle von ihnen sind Tochterprodukte in einem Wort, sie müssen regelmäßig laufen und ständig produzieren, ständig Daten erhalten und diese Modelle produzieren. Und, natürlich, der Produktionsteil Nach Marken Echtzeit, wissen Sie, bash für welche Art und Weise es laufen muss. Und das ist wieder ein weiteres Datenprodukt, das Eltern regelmäßig verwenden. Je mehr Modell das Modell, das gebaut wurde, um Vorhersagen zu machen, wann und wo es erforderlich ist . So bauen dort Luftschutz, der letzte Teil, der mehr so ist, ist sehr es ist eher wie Software, die dieses Motorsoftware-Projekt stammt . Eigentlich, wenn Sie sagen wollen, weil Sie genau wissen, dass die Abteilung, die sie bereits in ein Softwareprodukt umwandelt, würden Sie nur brauchen, um Qualität Software-Strenge sowohl in der Entwicklung als auch im Testen darauf kann die Bereitstellung von Enterprise-und Cloud-Modellen sein, hängt davon ab, dass später das Produkt tun soll. Natürlich ist das Wichtigste hier auch, dass Sie operationalisierte Datenfeeds erhalten müssen. Die Daten-Feeds aus allen Radarquellen. Nein, sie müssen fortgeführt werden. Wenn ich fortlaufend sage, ist es augenblicklich. Du kriegst sie immer so, wie sie passieren. Manchmal bekommst du das täglich. Tu das, Adams. Manchmal wissen Sie, einmal ein V 15 Minuten und Reisen 30 Minuten Druckbare Verteidigung hängt von Ihrem Anwendungsfall, aber es muss operationalisiert werden, so dass dort, dass immer wieder kommen regelmäßig. Sie haben nicht jeden Tag mit jemandem zu arbeiten, um die Daten zu bekommen. Hier ist alles automatisiert. Und natürlich haben wir geredet. Wie wir Arzt grenzt, es s Produkte führen alle die Reinigung Transformation unter Berichterstattung jede Berichterstattung ist eine wichtige Sache, die Sie hier tun wollen und schließlich ziehen alle Daten notwendig sein könnte . Weißt du, wenn du Gator begangen hast, wird das eine Menge Daten sein, besonders wenn du das Recht in das Formular umwandelst, das alle Rohdaten benötigt. Weißt du, du willst sie vielleicht 10 Tage, 15 Tage lang behalten und sie dann rauswerfen. Damit sind alle Schritte abgeschlossen, die Sie in einem typischen Data Science-Projekt zu tun haben. Aber es gibt immer etwas namens, ah kontinuierliche Verbesserung. Sobald Sie ein Datenprodukt bereitgestellt haben, sind dies immer Änderungen in der Unternehmensumgebung, die sich auf Ihr gesamtes Lernen in der Produktion auswirken können . Das ist also etwas zum Träumen. Denken Sie daran, alles, was Sie als Datenprodukt erstellt haben. Keine Algorithmen, die Algorithmen zu Modellen, die sie gemacht haben, dass ihre Genauigkeit sinken könnte, weil Änderungen in Geschäftsumgebung und auch die Lern- und Produktionsmaterial muss der Wert sein, periodisch in ungefähren Intervallen um sicherzustellen, dass sie weiterhin ihre Karriere-Ebenen zeigen, die sie ursprünglich über Minto haben auf Revalidierung müssen passieren, wenn ihr Geschäftsprozess-Gen , Sie wissen, dass es eine Änderung etwas im Geschäftsprojekt-Prozess, wo die Entitäten verhalten sich verändert die Welt, die Umwelt. Und Richard wird uns ändern. Also offensichtlich haben Sie ein sehr, sehr getan alles, was Sie hier tun. Das muss also unter dem Kinderprojekt sein, das Maker in seinem Projekt gemacht hat, sind ein Verbesserungsprojekt, das regelmäßig auftauchen muss, um zu validieren. Was du getan hast, ist alles in Ordnung. Ein besseres Modell der Force-Agenda sollte im Gange sein. Nein, das ist wichtig. Wir können einfach nicht wollen und aufhören, wir tun, um kontinuierlich zu sein. In jemandem für das, was wir bisher gesehen haben, folgen Data Science-Projekte einem Lebenszyklus. Data Science Projekte sind Forschung ihre Projekte. Es gibt eine Menge Experimente und manchmal nicht verstehen. Das ist also etwas. Deshalb nennen wir es immer wieder. Es ist ein Forschungsprojekt Signal in den Ergebnissen ihres Vaters, nicht die Wache kommt. Duda ist wichtiger als die Algorithmen selbst. Mehrere Iterationen können erforderlich sein, bevor vernünftige Ergebnisse erzielt werden. Das ist eine andere Sache, die Sie sich erinnern möchten. Es gibt also keine sehr ernste Phase in einem Data Science-Projekt, wo denkt, dass getan werden oder getan werden sollte. So helfen. Das war hilfreich für Sie. Vielen Dank für Ihr Zuhören, aber