Möchtest du Data Scientist werden? | Kumaran Ponnambalam | Skillshare

Playback-Geschwindigkeit


  • 0.5x
  • 1x (normal)
  • 1.25x
  • 1.5x
  • 2x

Schau dir diesen Kurs und Tausende anderer Kurse an

Erhalte unbegrenzten Zugang zu jedem Kurs
Lerne von Branchenführern, Ikonen und erfahrenen Experten
Eine Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Schau dir diesen Kurs und Tausende anderer Kurse an

Erhalte unbegrenzten Zugang zu jedem Kurs
Lerne von Branchenführern, Ikonen und erfahrenen Experten
Eine Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Einheiten dieses Kurses

17 Einheiten (3 Std. 2 Min.)
    • 1. Was geht in diesem Kurs in diesem Kurs vor

      5:38
    • 2. Über V2 Maestros

      2:07
    • 3. Was ist Datenwissenschaft – Teil Einheit.

      11:51
    • 4. Was ist die DataScience – Teil 2

      10:44
    • 5. Was ist die Data Science Teil

      12:55
    • 6. Was ist die Data Science Teil

      9:31
    • 7. Anwendungsfälle für Datenwissenschaft.

      7:47
    • 8. Data – Einrichtung

      11:46
    • 9. Data – Datenerfassung – Data

      11:57
    • 10. Data – Analyse und Produktion

      19:16
    • 11. Erforderliche Fähigkeiten für Datenwissenschaft, Teil 1

      12:48
    • 12. Erforderliche Fähigkeiten für Datenwissenschaft, Teil 2

      10:48
    • 13. Rollen in der Datenwissenschaft

      11:56
    • 14. Herausforderungen für einen Data Scientist

      14:27
    • 15. Aufbau deines your

      14:55
    • 16. Suche nach Möglichkeiten

      13:02
    • 17. Schlussbemerkung

      0:49
  • --
  • Anfänger-Niveau
  • Fortgeschrittenes Niveau
  • Fortgeschrittenes Niveau
  • Alle Niveaus

Von der Community generiert

Das Niveau wird anhand der mehrheitlichen Meinung der Teilnehmer:innen bestimmt, die diesen Kurs bewertet haben. Bis das Feedback von mindestens 5 Teilnehmer:innen eingegangen ist, wird die Empfehlung der Kursleiter:innen angezeigt.

1.321

Teilnehmer:innen

--

Projekte

Über diesen Kurs

Datenwissenschaft ist als die sexieste, die eine ganz besondere Aufgabe des 21. Jahrhunderts ist. Es ist ein hybrides Feld, das einzigartige Fähigkeiten benötigt. Du hast überall alles darüber gehört, aber nicht sicher ist, was genau die Aufgabe ist und ob deine gute career ist. Dieser Kurs zielt darauf ab, dich über dich zu informieren und dich zu lernen

  1. Was ist das Leben eines Data sein?
  2. Welche Fähigkeiten müssen erforderlich sein, um eine eins zu werden

Data und Abstieg sind teuer, es ist eine gute Idee, zu wissen, was du dir anfängst, bevor du dein Geld spending

Triff deine:n Kursleiter:in

Teacher Profile Image

Kumaran Ponnambalam

Dedicated to Data Science Education

Kursleiter:in

V2 Maestros is dedicated to teaching data science and Big Data at affordable costs to the world. Our instructors have real world experience practicing data science and delivering business results. Data Science is a hot and happening field in the IT industry. Unfortunately, the resources available for learning this skill are hard to find and expensive. We hope to ease this problem by providing quality education at affordable rates, there by building data science talent across the world.

Vollständiges Profil ansehen

Kursbewertungen

Erwartungen erfüllt?
    Voll und ganz!
  • 0%
  • Ja
  • 0%
  • Teils teils
  • 0%
  • Eher nicht
  • 0%
Bewertungsarchiv

Im Oktober 2018 haben wir unser Bewertungssystem aktualisiert, um das Verfahren unserer Feedback-Erhebung zu verbessern. Nachfolgend die Bewertungen, die vor diesem Update verfasst wurden.

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Nimm an prämierten Skillshare Original-Kursen teil

Jeder Kurs setzt sich aus kurzen Einheiten und praktischen Übungsprojekten zusammen

Mit deiner Mitgliedschaft unterstützt du die Kursleiter:innen bei Skillshare

Lerne von überall aus

Ob auf dem Weg zur Arbeit, zur Uni oder im Flieger - streame oder lade Kurse herunter mit der Skillshare-App und lerne, wo auch immer du möchtest.

Transkripte

1. Was geht in diesem Kurs in diesem Kurs vor: Hallo. Willkommen zu dieser Präsentation hier. Dies ist Ihr Dozent, Cameron auf in diesem Abschnitt der Präsentation, wir werden sehen, worum es bei diesem Kurs um ein Data Scientist geht. Also lasst uns ins Rollen gehen. Die Nachfrage nach Data Science und Data Scientist wächst von Tag zu Tag. Es gilt als der sexieste Job aus dem 21. Jahrhundert. Weißt du, das neueste Buswort und das Ende Du hörst über diesen Spaß überall im Internet,auf im Internet, all deinen Kindern auf all deinen E-Mails, wann immer du redest, von wem du sprichst und es ist das Herz und das Geschehen Feld in Software, hat es erhebliche prognostizierte Nachfrage nach Arbeitsplätzen auf der ganzen Welt bekommen. Berücksichtigen Sie jede Art von Artikel? Unser Newsletter, der über die prognostizierten Stellenanforderungen im Bereich I T informiert. Sie sehen, dass Daten zuweisen eine der am höchsten bewerteten Jobs auf der ganzen Welt ist. Für die gegebene Zukunft war jeder daran interessiert, eins zu werden, würde eine Menge Bus um diese Leute sehen , die über OK reden, ich will kein Datenwissenschaftler sein. Ich möchte auch Datenzeichen machen. Aber das Problem ist, dass es viele Fragen gibt. Sie sind nicht da in deinem Kopf. Und was sind das für Fragen? Was genau ist ein Data Scientist? - Sie? Dies ist ein ziemlich einzigartiger Begriff. Ein Datenwissenschaftler. Es ist nicht wie ein Programmierer sind ein Architekt oder ein Designer. Aber Sie sehen, wie Wissenschaftler ins Spiel kommen, in der ich fühle, also sind Sie irgendwie neugierig , was so einzigartig an dem Job Data Scientist ist. Was sind die Rechenzentren? Wer? Wie sieht ein Rechenzentrum jeden Tag der Arbeit aus? Wird er eine Menge Programmierung machen und unsere Menge an Analyse und Design wird Dokumentationspräsentationen schreiben? Wirst du nur Projekte verwalten? Sie wissen nicht, welche Fähigkeiten und Schulungen erforderlich sind? Data Science ist eine brandneue Fertigkeit, die an Ort und Stelle kommt. Das bist du definitiv nicht. Sind nicht darüber in Ihrem Bachelor- oder Master-Abschluss gelernt. Also haben Sie Dr. Weir ein paar Fähigkeiten, um eins zu werden. Also, was sind die Fähigkeiten? Welche Herausforderungen stellt sich ein Data Scientist gegenüber? Und das ist sowohl eine gute als auch eine schlechte Sache. Manchmal Daten jede Art von mir Job bietet einzigartige Herausforderungen, und einige Leute lieben sie. Manche Leute hassen sie. Was geben Ihnen die Jobdaten, die das signiert haben? Wie fordert es Sie heraus? Und dann wirst du es lieben oder nicht? es gut zu mir? Dies ist die große Frage, die jeder im Kopf hat, dass Sie sehen wollen, ob dieses Job-Profil wird für Sie passen So dass, sobald Sie ein Jet Data Wissenschaftler werden, werden Sie immer noch daran interessiert sein, den Job für eine lange Zeit fortzusetzen. Wie erwirbst du die erforderlichen Fähigkeiten? Das ist eine weitere Herausforderung. Wie gehen wir und erwerben die Fähigkeiten? Das sind brandneue Fähigkeiten. Also, wie bekommst du sie, Andi? Endlich nach Jobs suchen? Was sind die Website? Weißt du, wie willst du nach Jobs und solchen Dingen suchen? Was ist also das Ziel von diesem Kurs? Ist dies die Antworten auf alle Ihre Fragen sind derzeit über das Internet verstreut. Es gibt so viele Mid Bits im ganzen Web. Ein Boot über das, was ein zuweist, ist, wie ich aussehen würde wie einer der Herausforderer. Welche Fähigkeiten gibt es? Aber diese sind Es gibt schwer, endgültige Antworten zu finden, weil es so viel Voreingenommenheit gibt und was die Leute über eine Menge von persönlichen Meinungen schreiben, kommen an Ort und Stelle. Also, wie haben Sie den Kurs eigentlich entworfen? Bietet Ihnen einen Ort, um alle von ihnen zu bekommen, und das ist das Ziel des Kurses ist es, alle von ihnen zusammen in einem Gericht zu setzen, so dass Sie durch sie gehen können, dann eine fundierte Entscheidung treffen, ob Sie ein Daten werden wollen Wissenschaftler oder nicht. Der Kurs erklärt das Gebiet der Data Science und was es braucht, um die Fähigkeiten dafür aufzubauen . Und dann ist es das Ziel, Ihnen zu helfen, zu entscheiden, ob Sie wieder ein Rechenzentrum werden wollen. Die erste Frage ist, wenn Sie Data Scientist werden wollen, und wenn Sie sich entscheiden, einer zu werden, wie können Sie so werden? Es gibt eine if-Frage, und es gibt eine Frage, die basierend auf diesem Kurs beantwortet wird. Das ist also das Ziel von diesem Kurs, das erwartete Publikum für den Kurs. Jeder, der darüber nachdenkt, in Datenschilder Software-Profis zu gelangen, wird die erste Kategorie von Menschen sein, die daran interessiert sind, hier Projektmanager zu bekommen, weil plötzlich sie sehen, dass Data Science Projekte in ihre Bild. Mathematiker auf, dann ein Business-Domain-Experte. Welcher Diskurs ist nicht. Das ist das Nächste. Ich werde nicht streiten. Um ganz klar zu sein, unser Freund ist, dass es kein technisches Training gibt, das als Teil der Partitur präsentiert wird . Ich gab Ihnen nur genug Informationen, um eine Entscheidung zu treffen. Wenn Sie Datenwissenschaftler sein wollen oder nicht, und es gibt keine Software-Fähigkeiten in diesem Kurs gedacht, ich hoffe, dieser Kurs wird für Sie Paarung sein und Ihnen helfen, eine Entscheidung zu treffen. Also viel Glück auf DA Lassen Sie uns weiter reden, Danke. 2. Über V2 Maestros: Hallo. Hi. Willkommen bei uns zu Mastro ist, dass ihre Wissenschafts-Experten. Dies ist also eine Einführung in unser Unternehmen und Ausbilder, wer wir sind. tun wir. Mastro ist eine Schulungsorganisation, die sich voll auf die Ausbildung von Data Science engagiert. Wir konzentrieren uns nicht auf andere Fähigkeiten, die rein auf Datenzeichen fokussiert waren. Wir haben uns auf Erstellung von bereitstellbaren Daten konzentriert. Wissenschaftskompetenzen konzentrierten sich auf bereitstellbare Data Science-Fertigkeiten, die Menschen in ihrer täglichen Arbeit einsetzen können . Durch Online-Schulungen hatten wir uns auch darauf konzentriert, unsere Schulungen über Online-Medien anzubieten. Unser Ziel ist es, Datenschilder Praktiker zu entwickeln, die Geschäftsleute in kommerziellen Organisationen liefern können . Wir stehen nicht in der Theorie. Wir stehen nicht auf Forschung. Wir sind im Schlepptau, entwickeln Data Science Praktiker, die in kommerzielle Organisationen gehen können, um ihre Fähigkeiten zu nutzen , um Unternehmen zu liefern. Wir verfügen über bedeutende Branchenerfahrung in der Data Science-Praxis. Also über den Ausbilder und das bin ich. Mein Name ist Cameron Porno Emblem. Ich bin ein erfahrener Data Science Leader mit einer Leidenschaft für den Unterricht erlaubten Unterricht, erlauben, Kurse machen und Fähigkeiten mit anderen Menschen machen. Ich habe 22 Jahre Erfahrung in der Softwareentwicklung insgesamt auf Ich habe in Mission gelernt, ihre Basis Cloud-Systeme auf Projektmanagement-Domänen zu lernen. - Onda. Ich habe Erfahrung in der Lehre von Data Science durch Online-Kurse. Bevor Sie sich meine blawg bei gemeinsamen p m dot blocks part dot com ansehen können, würden Sie mehr Details über mich zu einigen der Forschungsarbeiten finden, die ich getan habe. Also danke für die Teilnahme an diesem Kurs und Hilfe. Das wird für euch von Interesse sein, auf und aus Wert. Vielen Dank. 3. Was ist Datenwissenschaft – Teil Einheit.: Hallo. Dies ist Ihr Lehrer, Cameron auf in diesem Abschnitt. Wir werden sehen, was Datenzeichen ist. Data Science ist etwas, von dem wir viel gehört haben. Aber woraus besteht Data Science genau? Was? Worum geht es eigentlich? Also werden wir zwei Dinge in der Sitzung an dann sehen. Das erste, was über Wasser Daten, und die zweite 1 ist wollen ist lernen. Also werden wir einige Definitionen aus dem Wasser sehen. Dinge stellen eine Datenwissenschaft dar. Also einige der Dinge, die Sie in dieser Sitzung sehen werden, sind vielleicht Dinge, die Sie sagen könnten , sind offensichtlich Dinge, die inhärent sind. Ich glaube, Sie haben es gewohnt, aber es ist ein guter Zeh. Werfen Sie einen zweiten Blick auf die Definitionen von jedem von ihnen, weil sie eine Menge an einem Datenzeichen bedeuten . Sie bilden in der Tat das Fundament der Data Science. Also lassen Sie uns hier alle diese Definitionen durchgehen. Das erste, was wir beginnen über das, was Data Saints ist, David Signs ist die Fähigkeit, Wissen aus Daten zu extrahieren. Wir haben etwas, das Daten genannt wird. Und dann gibt es etwas so rohes und dann schauen Sie sich die Daten an und Sie extrahieren Wissen ,Wissen könnte über diese Information in seinem Signal nachgedacht werden. , Es gibt verschiedene Begriffe, die für taube Menschen Wissen verwendet werden, aber im Grunde könnte etwas, das Sie aus Daten extrahieren, das nützlich ist. Und dann nutzst du dieses Wissen, um das Unbekannte vorherzusagen. Sie lernen also etwas über die Vergangenheit aus Daten, und dann verwenden Sie diese Informationen, um vorherzusagen, was in der Zukunft passieren wird. Und darum geht es bei Datenzeichen. David Sames. Eines der Mädchen ist es, Geschäftsergebnisse mit der Macht der Daten zu verbessern, können Sie Vorhersagen tun, aber was ist der Nutzen aus? Die Verwendung davon ist, dass Sie die Datenzeichen verwenden möchten, um Geschäftsergebnisse zu verbessern, und Sie werden die Geschäftsergebnisse mit Daten verbessern. Und darum geht es bei Data Science. Das gibt es nicht. Mitarbeiter sind Technologien. Theorien werden aus verschiedenen Bereichen gezogen, die nicht auf einen einzigen Bereich beschränkt sind. Also haben Sie Mathematik in ihren Statistiken, Informationstechnologiedaten. Wenn die cleveren Technologien Programmiersprachen, verwenden wir tatsächlich eine Vielzahl von verschiedenen Techniken und Theorien und Bereiche. Wenn es um Data Science geht Und was ist ein Data Scientist? Ein anderer Wissenschaftler ist ein Praktizierender, der den Praktizierenden von Datenschildern abhält. Wann ist ein Praktizierender aus? Ihre Da wir über jemanden sprechen, der die Theorien und Theorien und alle Technologien und die Fähigkeiten von Datenzeichen verwendet , um ein besseres Geschäftsergebnis zu erzeugen, hat Andan zugewiesen dies typischerweise ah, oder sollte Know-how in einem Data Engineering Wissen Ticks Statistiken über DA jede andere in der Geschäftsdomäne. Auch auf typischerweise signierten Daten. Dies untersucht komplexe geschäftliche Probleme und nutzt Daten zur Bereitstellung von Lösungen. Das Wichtigste hier ist also ODA verwendet, um Lösungen oder Daten bereitzustellen, ist der Treiber für einen Data Scientist. Also lassen Sie uns in einige der Definitionen von Daten gehen. Worüber reden wir hier genau? Wenn wir Daten sagen, was sind die verschiedenen Dinge, die Sie tun, lernen, wenn Sie über Daten sprechen. Also werden wir hier wieder durch einen Satz von Definitionen gehen. Sie mögen für Sie offensichtlich sein, aber es geht um zu sagen, werfen Sie einen zweiten Blick auf alle von ihnen. Das erste, worüber wir reden werden, ist, was NDP genannt wird. Eine Entität ist eine Sache, die existiert, die in Data Science forschen und vorhersagen würde. Eine Entität ist also eine Sache, ein Objekt, etwas, das in der realen Welt existiert, an der wir arbeiten werden. So haben Sie ein Data Science Problem in den Daten sendet Problem. Sie haben eine Reihe von Entitäten, die Sie cara bolzen. Du recherchierst sie. Sie erhalten Daten über diese Entitäten und arbeiten dann an ihnen, um Ihnen Vorhersagen zu machen. Entitäten haben immer einen Geschäftskontakt. Es gibt einen geschäftlichen Kontext, bei dem es sich um das Geschäftsproblem handelt, das Sie lösen möchten, in dem die Indiedy existiert. So Beispiel für eine Entität wie ein Kunde, ein Kunde außerhalb eines Unternehmens ist eine Entität. Kunde ist ein Unternehmen, das am beliebtesten eingegeben A. Ich würde sehen, über wen wir eine Menge Forschung machen und Prognosen machen. Eine Person in einem Krankenhaus ist eine andere Einheit. Jetzt sehen Sie, dass der Kunde eines Unternehmens und der Patient des Krankenhauses tatsächlich auf dieselbe Person zeigen, aber sie haben unterschiedliche Geschäftskontakte. Unterschiedliche Geschäftskontakte bedeuten also dieselbe Person. Wir kümmern uns um verschiedene Informationen über die Person, die die Person könnte verschiedene Dinge als Kunde tun , im Gegensatz zu dem, was er als Patient tun würde. Entitäten können auch nicht-lebende Dinge sein. Wie zum Beispiel ein Auto. So Karte ist auf dergleichen, dass nicht aus nicht-lebendigen Dingen, auf denen Sie auch Informationen sammeln und Sie sagen, Dinge gehen auf den nächsten Punkt voraus. Es sind Eigenschaften, was Eigenschaften sind. Jede Entität hat eine Reihe von Eigenschaften, so dass diese Eigenschaften angeboten Entität, die Informationen über die Identität ist uns. Wir nennen sie vielleicht statische Informationen, weil sie irgendwie an die Entität gebunden sind, wie Name, Telefonnummer, Alter. Das sind alle Merkmale, oft Entität auf Immobilien haben auch wieder einen geschäftlichen Kontext, um verschiedene Geschäftskontakte zu tun . Sie quadra über verschiedene Merkmale für die gleiche Entität oder die bestimmte Person Platz in diesem gegebenen Geschäftskontext. Zum Beispiel, wenn die Kundenmerkmale Sie über unsere Alterseinkommensgruppe Geschlechterbildung für einen Patienten stören würden , verdoppeln Sie sich Ihr Körper wieder über AIDS, so dass sich das Merkmal namens Alter wiederholt. Aber jetzt haben Sie eine andere Reihe von Eigenschaften, vor allem als Patient wie Blutdruck, Gewicht, Familiengeschichte. Also wieder gibt es einen geschäftlichen Kontext der Geschäftsanforderung, treibt, welche Eigenschaften Sie an Bord eines Unternehmens wieder stören. Autos. Wenn Sie sich Autos ansehen, sprechen Sie über machen Modelljahr des Motortyps des Motors wie Vierzylinder oder Sechszylinder auf der Windnummer des Autos. Also das sind alle Beispiele von Eigenschaften. Du könntest sie auch US-richtiges Stück nennen. Zum Beispiel, Eigenschaften, die ich dachte, dass einer von euch die Mühe gemacht hat, ist das, was Umwelt ist? Umwelt verweist auf das Ökosystem, in dem die Entität exes Funktionen sind. Entität existiert nicht in einem Vakuum. Es gibt eine Umgebung, in der eine Entität existiert. Also in dieser Umgebung oder anderen Einheiten, andere Entitäten desselben Typs andere Entitäten eines anderen Typs, wie ein Patient und im Krankenhaus vorhanden sein, zusammen mit anderen Entitäten aus dem gleichen DeBlanc mit anderen Patienten. Das kann auch andere Entitätstypen sein, wie Ärzte und Krankenschwestern, Entitäten, die nicht lebende Dinge sind, wie Krankenwagen, ein Entitätsdatensatz. Ein System, das zur Überwachung von Patienten verwendet wird, könnte eine Entität sein. Also unter diesen, alle diese Entitäten existieren in einer Umgebung so Umgebung. Die Schattenimmunitäten auf mehreren Entitäten existieren in der gleichen Umgebung, Umwelt wirkt sich auf ein heutiges Verhalten aus, so dass das Wichtigste ist. Dasselbe Entität kann sich anders verhalten in verschiedenen Umgebungen sind auch für die gleiche Umgebung unter unterschiedlichen Bedingungen, Erfahrung in der Umgebung. Die gleiche Entität könnte auch hier sein . Freundliche Beispiele für Salbung Knoblauch für einen Kunden, das Land, die Stadt, Welt in der Nähe. Der Kunde wohnt in Persisch wieder, dass vielleicht die Stadt das Klima mit Krankenhaus, wo der Patient ist derzeit in für ein Auto. Ist es. Aber die Karte wird hauptsächlich für Stadtfahrten auf Autobahnfahrten verwendet, die die Umgebung wird , dass Klimaautos unter verschiedenen Wetterbedingungen wie Herz unterschiedlich funktionieren . Ob keine Schneebedingungen war, haben Autos ein anderes Verhalten. All dieser Fall ist, was Sie sehen, ist, dass die Umgebung beeinflussen, wie die Indeedy verhält jetzt kommt und sogar, was ungleichmäßig, ungleichmäßig ist . Es gibt eine bedeutende Geschäftstätigkeit, an der das Unternehmen beteiligt ist. Entitäten sitzen nicht einfach dort. Es tut etwas. Wenn jemand etwas mit der Identität tut, ist das, was man eine sogar einige Geschäftstätigkeit nennt und sogar wieder passiert außer Umwelt. Du, eine Einheit wie ein Perser, gehst ins Krankenhaus und ins Krankenhaus. Die Entität wird behandelt, wenn es keine aufgesetzten s gibt, die von dem gegebenen Patienten verabreicht werden . Dann haben Sie einige Ergebnisse aus diesen Tests. All das sind Gleichgewichtige. Beispiel aus uneben. Vielleicht ist der Kunde, der einen Website-Kunden sucht, der ein Geschäft macht, besuchen Sie einen Kunden, der einen Verkaufsanruf von einem Unternehmen erhält, um etwas zu verkaufen. All das sind Gleichgewichtige in den Mädchen aus Portionen. Es ist wie die Ärzte. War es ein Bluttest für ein Auto? Der smart tut das Laut geht der Vergleichstest. Wie, wenn Sie zu einem dieser Auto bezogenen Websites gehen, sehen Sie, dass sie wie Vergleichstests tun. Alle von ihnen sind Even, an denen eine Entität beteiligt Verhalten. So macht auch etwas dort auf Entität beteiligt. Aber was bedeutet Verhalten? Was macht die Entität in der gegebenen? Auch das ist das Verhalten der Entitäten. Also sogar eine Einheit geht, tut etwas auf Wasser. Das Beste darin, gegeben ist sogar, was er das Verhalten der Entität beendete. Er könnte ein anderes Verhalten in verschiedenen Umgebungen und verschiedenen Situationen auf , zum Beispiel, zum Beispiel, in dem Fall, aus einem Kunden, einen Anruf in einem Telefonanruf Wasser, wo der Kunde Gespräche ist das Verhalten der Kunden. Die Klicks Raum für einen Website-Besuch wie die Links die jeweiligen benutzerdefinierten Website-Besucher klicken, wenn er auf der Website surft, die eine andere Art von Verhalten hat? Nein, die Antwort. Der Kunde hat sein Angebot zu sagen. Ich habe Jahre gesehen. Nein, der Kunde hat glücklich gesagt. Alle von ihnen sind verschiedene Verhaltensweisen von den Kunden Patienten keine cr beleuchtet und Krankenschwester Krämpfe die Tränke beschweren sich über etwas. Die Patienten, wissen Sie, schlafen ein, zeigen jede Art von Bs, jede Art von Symptomen. Alle von ihnen sind Verhaltensweisen des Patienten und Autos mögen gute Beschleunigung, die Stoppstrecken, alle von ihnen repräsentieren als eine Form des Verhaltens von den Entitäten. Nein, das sind alles, was diese Dinge, die Sie in der realen Welt sehen, wie die Entitäten gleicht und Verhalten auf Jetzt kommt Einführung Zehe Daten 4. Was ist die DataScience – Teil 2: Einführung der Daten. Nein, es gibt etwas, das als Ergebnis bezeichnet wird. Was ist also ein Ergebnis? Das Ergebnis oft Aktivität als signifikant für das Unternehmen. So haben Sie Ereignisse in den Evens. Es gibt Entitäten und es ist anders in verschiedenen Gleichgewichten verhalten. Aber alle diese Gleichgewichte haben in der Regel eine Form aus Ergebnis, die mit dem Geschäft auf Ergebnis wichtig ist , ist ein Ergebnis oft Aktivität das Ergebnis einer Geschäftstätigkeit, zum Beispiel, so auf Ergebnisse können Wert sein. Ergebnisse sind Werte, oder? So können Ergebniswerte entweder Anlagebarren sein wie ja, nein, dass der bestimmte jemand einen Test gemacht hat. Sie haben unser Scheitern bestanden. Es ist ein Anlagebarren. Berlin ist im Grunde ja oder nein auf Band von Daten. Das alte kann wie ein kontinuierlicher Wert wie ein numerischer Wert sein. Jemand hat einen Blutdrucktest für den Blutdruck gemacht. Wert ist ein kontinuierlicher Wert. Kann überall von 100 Dollar unter liegen. Das ist kontinuierlicher Wert oder es kann eine Form einer Klassifikation sein. Klassen. Grundsätzlich hat jemand eine Rezension abgenommen. Eine Rezension eines Films Onda über, dass Sie gab, könnte eine Klasse wie ausgezeichnete, sehr gute Gruppenmesse sein. Aber das ist eine Art Klassifikationen sind Typ, die, wie die Ergebnisse können aus jedem dieser verschiedenen Bänder sein. Beispiele für Ergebnisse in den Mädchen des Kunden, wo der Kunde einen Verkauf zu tun, ist ein Anlagebarren zum Verkaufswert. Wie viel sie es gekauft haben, als ein kontinuierlicher Wert weitergeht, was bedeutet, dass der Wert oder dass Sie ein Geschenk sind, ist im Grunde irgendwo zwischen 0 und 100 oder 2000. Es ist ein kontinuierlicher Wert Patient, die Mädchen der Patienten. Das Ergebnis kann die Blutdruckmessung sein, die ein kontinuierliches Ergebnis auf der Diabetespfeife ist. Depression ist identifiziert uns in der Klasse wie Diät A Diabetes sind Typ B sterben, aber diese ist es eine Klasse. Im Falle von Autos, die Smog Ebenen ist eine Klassifikation. Die Höhe der kleinen Globuli wie ABC. Es gibt eine Klassifizierung, die Geschäfte stoppt. Das passiert, weil Sie einen Test für ein Auto machen, was eine sogar auf ihnen ist. In diesem Fall messen Sie die Bremswege, wenn Sie die Bremsen blockieren und wie viel Abstand es dauern würde, um zu stoppen, kommen zu einem vollen Stopp. Das ist ein kontinuierliches Ergebnis. Die kluge Vergangenheit, unsere Misserfolge gibt es einen Tyrann und Ergebnis. Die Art des Autos. Nehmen wir an, dass eine Sport-Ecke der Familie Limousine, die eine Art Klassifikationen ist, Also sind dies verschiedene Ergebnisse, die als Ergebnis einiger passieren. Trotzdem sind die Ergebnisse abgeschaltet. Aber das Wichtigste in Data Science, denn normalerweise weist tatsächlich das zu, was Sie als Ergebnisse in der Zukunft vorherzusagen versuchen. Hast du jemals mehr darüber gesehen? Später? Jetzt kommt, was man als Beobachtung nennt. Was ist also eine Beobachtung? Eine Beobachtung ist eine Messung. Es ist oft an meinem Vorsitzenden. Trotzdem messen Sie etwas über ein sogar als signifikant vom Unternehmen. Also messen und messen Sie im Grunde wichtige Dinge und Unebenheiten, die für das Geschäft , über das wir reden, wichtig sind . Es erfasst Informationen über die Entitäten und Ball. Also gegeben, auch meine keine mehrere Entitäten beteiligt die Eigenschaften der Entitäten, die BA neugierig der Entitäten, die Informationen über die Umgebung, in der die sogar auf die Ergebnisse passiert. Also auf Beobachtung ist Information über all diese Dinge, die passiert und ungleichmäßig. Sie gehen im Grunde und sammeln alle diese Informationen und in irgendeiner Form auf Beobachtung aufgezeichnet wird typischerweise das System off-record genannt. Wenn Sie also überall hin gehen, sehen Sie, dass die Leute die anderen Tage Informationen aufzeichnen, um sie in Zeitschriften, Logbüchern und so etwas aufzuzeichnen. Nein, alles ist automatisiert, computerisiert. Es gibt Scanner, die diese Informationen automatisch scannen, wenn jemand in den Computer eintritt, die für Morde sind. Es heißt das System aus Rekord am Beispiel der Beobachtungen sind, im Fall von Kunden, gibt es eine Telefonkarte Rikard. Es wird auch CDSS in der Telefonabteilung genannt. Bei der Transaktion wie eine Kauftransaktion geht jemand in den Laden auf ghosted durch etwas, das er geht an den Point off Sale Zähler auf die Transaktion dort aufgezeichnet wird. Unser, ähm, E-Mail-Angebot. Eine E-Mail kommt zu Ihnen, einige Produkte zu einem gewissen Wert anbietet. Kein aufregendes. Sie kaufen etwas, also sind alle Beobachtungen. Wenn Sie einen Patienten betrachten, wiederholt Dr. Bissett das Testergebnis, eine Datenerfassung von einem Überwachungsgerät. All dies sind Beobachtungen, verschiedene Arten von Beobachtungen. Und schließlich schauen wir uns das Auto an. Im Falle eines Autos ein wilder Ricard eine Beobachtung. Das Auto geht für Umfragen und das Ende. Ihre Ergebnisse aus dem Mechaniker werden im Serviceprotokoll protokolliert. Ein kluger als Ergebnis, ist eine Beobachtung. Also alle diese eine RAB Ablenkungen in irgendeiner Form und Recorder erfasst und speichern. Also endlich bekommen wir Daten, was bedeutet ein Datensatz? Adela sagte, als eine Sammlung von Beobachtung. So wird jede Beobachtung, Aufzeichnungen und sogar über das Zentrum von Entitäten eine Sammlung von Beobachtungen für ein Unternehmen zu einem Datensatz. Acht. Beobachtung in einem Datensatz ist in der Regel ein Datensatz in dieser Woche. Nennen Sie es niedriger logischer Datensatz, der physische Datensatz aussehen kann gegeben werden. Beobachtung kann in mehreren Formen aufgezeichnet werden. Mehrere Benutzeroberflächen, die wie Master-Detailbeziehungen sein könnten. Alles, was in Ordnung ist, aber hier sprechen wir von einer logischen Aufzeichnung, die eine Beobachtung darstellt. In der Regel würden Sie Beobachtungen haben, die einen Efeu wie eine Transaktionsidee, Testideen-Seriennummer haben, so etwas. Also an einem Tag sagte ich, dass die Sammlung von losen Beobachtungen jeder Datensatz eine Reihe von Attributen hat , die Eigenschaften zeigen, Verhaltensergebnisse. Wenn Sie sich also das Excel Arbeitsblatt ansehen, sehen Sie, dass in der Regel jede Regel wie ein Datensatz in einer Beobachtung darstellen würde. Das Excel Arbeitsblatt selbst ist, eine Daten gesagt. An jeder Tür war eine Beobachtung auf jeder Spalte ist im Grunde Attribut, das auf eine der Eigenschaften der Entitäten zeigt . Die Verhaltensweisen sind alles kommt Adresse, die strukturiert werden kann Leser Expedia, Polizeiakten, Tabellenkalkulationen Es kann unstrukturiert sein. Außerdem sind Twitter-Feeds ein Beispiel für unstrukturierte Daten in Zeitungsartikeln. Sie werden nicht als halb strukturiert wie E-Mail bezeichnet. Also, ein Data Scientists, beschäftigen Sie sich in der Regel mit verschiedenen Arten von Daten wie Strukturdaten. Unstrukturierte Daten sind jemand Strukturdaten und Züchter SanDisk wählen und arbeiten an Daten sagte, dass das Brot und Butter für einen Datenwissenschaftler ist Datendaten und mehr Daten über Daten gesammelt wird, wie Datensätze gesammelt, gespeichert, an Prognosen bearbeitet werden, werden basierend auf den Datensätzen gemacht. Also, haben sie gesagt, ist der Kern von Data Science. Ah, was sind strukturierte Daten? Das Beispiel, das Sie auf der rechten Seite sehen, ist ein Beispiel für Strukturdatendaten, bei denen die Attribute beschriftet und deutlich sichtbar sind. Sie sehen, dass jedes Attribut in diesem besonderen Sie Jungs separat beschriftet, wie wenn bereit, wenn der Name Währung ich d beobachten Nummer. Alles ist Lobel. Es ist deutlich sichtbar, ob es in der U. Yverwendet wird U. Y , ob es in der Datenbank gespeichert wurde. Es gibt, was Sie eine Struktur Datendaten nennen, die getrennt beschriftet und gespeichert werden. Es war leicht durchsuchbar in, zusätzlich, glaubwürdig, weil sie separat auch in neuen do Speicher in einer Datenbank, ihrem Schüler, verschiedenen Spalten gekennzeichnet hatten ihrem Schüler, . So ist es ein lebenswichtiges Recht und SQL-Anweisung toe Abfrage Diese Daten. Es kann natürlich natürlich Ihre Geschichte leicht in Terrible Tabellen sein, vielleicht, vielleicht, wie Datenbanktabellen oder Excel Arbeitsblätter, ist es einfach, Strukturdaten im Allgemeinen zu speichern. Unstrukturierte Daten hingegen nicht beschriftet. Also wird es wie kontinuierliche Tex geben, wie Sie auf der rechten Seite sehen, ist ein Textland über einen Meister drei ein Auto. Dies ist also die kontinuierlichen Bestände, in denen die Attribute nicht distant beschriftet sind, sondern ihre Präsenz in den Daten. So Dinge, die hervorgehoben werden, ein glühender Sie sehen, sind verschiedene Attribute wie kompakt kompakt ist die Art der Auto Hodge Taschen, eine Art des Autos. Ein 6-Gang-Getriebe ist der Übergang des Gerichtsgebäudes, so dass alle von ihnen in den Daten vorhanden sind, aber nicht deutlich kennzeichnen. So nennen Sie uns das. Unstrukturierte Daten weiterhin Sticks. Es gibt keine weit, aber auf Ihre Tochter versteckt sind in die nächste eingebettet. Und ruhig, natürlich, wird nicht einfach sein, wenn es zu erwerben. Wir sprechen mehr über keine visuelle Inspektion, aber wir sprechen darüber, Computerprogramme zu schreiben, um Informationen zu extrahieren. Diese werden nicht einfach sein. Jetzt kommt die dritte Farm mit nur halb strukturierten Daten. Was Sie hier sehen, ein Beispiel hier ist eine E-Mail. Also, was in der E-Mail ist Teil der Daten ist strukturiert und ein Teil der Daten ist in Struktur. In den E-Mails sehen Sie also , dass einige meine Tribute deutlich gekennzeichnet sind. Wie, wissen Sie, die von Adresse 200 cc Subjekt ihr Bestes in Lobel und als separate Spalten verfügbar sind, sind separate Stücke von Informationen, während andere vielleicht hat er nicht innerhalb der endear texted Verwendung auch nicht. So sind Sie sowohl strukturiert als auch strukturiert ein, das im Falle einer halbstrukturierten Daten verwechselt wird. Einige Beispiele für einige Lehrerdaten könnten auch wie ein Beispiel sein. Dokumente sind halbstrukturierte Daten. Einige Informationen sind im Attribut einige Informationen im syrischen Teil der externen Dokumente verfügbar. Das sind alle Beispiele von jemandem Strukturdaten so zusammengefasst. Was? Was haben wir gesehen? In Bezug auf Daten haben wir eine Entität Merkmale gesehen, Umgebung, sogar Verhalten Ergebnisse auf Beobachtungen und schließlich, Datensatz. Das sind also die wichtigsten , Fundamente,auf denen Daten und es gibt und nur aufbauen. Also ist es gut für Sie, jeden von ihnen zu kennen und zu verstehen. Dies vervollständigt diesen Teil aus dem Abschnitt. Wir werden weiter auf mehr A. Keine der Präsentation. Danke. 5. Was ist die Data Science Teil: Hallo. Dies ist Ihr Lehrer Cameron hier ein weiter auf Wasser Daten Zeichen. Wir werden darüber sprechen, was im Data Science Sprachgebrauch lernt. Was ist Lernen, auf dem Wissen aus Daten zu entdecken? Das erste, was wir als das, was ist eine Beziehung Beziehung wieder zu beachten ist, bildet eine der Grundlagen von Data Science auf, wenn wir über Beziehungen mit sprechen über Beziehungen zwischen Attributen sprechen. Also nach Buttes in einer Daten, die Beziehungen zeigen, das heißt, Sie haben eine Nichtbeobachtung. Sie haben einen Satz Beobachtungen in einem Datensatz auf Attribute, die Sie in diesen Beobachtungen sehen zeigen, was Beziehungen genannt werden, Beziehungen, Beziehungen, Modell der realen Welt und haben keine logische Erklärung. Wenn wir Modell sagen, sind die Beziehungen der realen Welt im Grunde etwas, das in der realen Welt geschieht. Es ist nicht etwas aus dem Blauen, dass man etwas im Datensatz sehen würde. Die Daten sagten. Was auch immer Daten Sie haben, die Beziehung, die zeigt, ist etwas, das in der realen Welt existiert. Zum Beispiel, Alter und Blutdruck. Die Beziehung zwischen ihnen ist, dass im Alter steigt, die Neigung zu höherem Blutdruck steigt. Je höher dein Alter. Je höher könnte Ihr Blutdruckniveau sein. Es gibt immer eine logische Erklärung, die damit verbunden ist. Der Grund im medizinischen Bereich, sagen sie, ist, dass, wenn Sie mehr Gewicht sind, offensichtlich erlauben Sie mehr Fett Sie Larmore verstopfte Arterien, was zu einem höheren Blutdruck führen würde. Es gibt also etwas, das in der realen Welt passiert, und es gibt eine logische Erklärung dafür. Eine Erklärung ist ein sehr wichtiger Teil der Datenwissenschaft. Wenn Sie Ihre Beziehung sehen, sollten Sie in der Lage sein zu erklären, warum es passiert, denn dort können wir sagen, ob die Beziehung zufällig ist oder dass es zufällig passiert ist. Es existiert so etwas. Bei Attributen A und B kann die Beziehung ähnlich sein, wenn ein auftritt auch auftritt. Sie haben zwei Attribute und so sein, wann immer eine aktuelle Bienen auch zustimmen, Nehmen wir an, wann immer ein Verkauf passiert, etwas anderes passiert auch, wie wenn ein Segel von einem Handy passiert. Ein Segel von einer Handyhülle ist auch passiert. Also Dinge, die zusammen passiert, wenn ein weil B nicht auftritt, mag die negative Beziehung nicht . Wenn Sie und Ihre Art von gegenseitig ausschließender gegenseitiger Exklusivität ist wieder eine Art Beziehung. Die 3. 1 wurde sehr hoch, wird auch nach oben gehen. Das ist also unter dieser Art von Beziehung und wo ein Erhöhungen abnimmt. Das ist also wie eine andere negative Beziehung. Wenn Sie also zwei Attribute sind, zeigen die Werte aus diesen Attributen die Werte, die in diesen Attributen zu sehen sind, jede von dieser Art von Beziehung. Nicht alle Entitäten werden Beziehung zeigen, die immer einige Entitäten sein wird, in denen Sie einige Beziehungen sehen, jemand es ist, keine Beziehung überhaupt zeigen. Andere Golden Learning ist es, nach Entitäten zu suchen, die zusammen zeigen eine Form von Beziehung auf Beziehungen können mehrere Attribute beinhalten zu mögen. Wenn ein vorhanden ist und erhöht werden, wird es abnehmen, so dass mehrere Aktivitäten zusammen eine Form von Beziehung aufweisen könnten . Das ist also eine Art Überblick. Off-Wasser-Beziehungen sind jetzt. Lassen Sie uns gehen und sehen, was sind einige der Beispiele aus für Beziehungen wie jeder. Nehmen Sie einen Kunden, wie im Alter steigt, Ausgaben Kapazität steigt, so gibt es eine Beziehung. Es wird auf die Einnahmen des Kunden altern, so dass im Alter steigt, Ausgabekapazität steigt. Es gibt eine logische Erklärung, dass, wenn das Alter steigt, möglicherweise die Person mehr Geld verdient, so dass die Ausgabekapazität auch hoch ist. Wenn wir nun über Beziehungen und Datenwissenschaft sprechen, sind dies keine sehr konkreten Beziehungen. Weißt du, es ist nicht buchstäblich wie ein Bursche, dass sie die ganze Zeit passieren. Nun ist diese Art von Dingen, wie 100% freundliche Beziehung ist gut. Aber was wir hier sehen, ist insgesamt, im Allgemeinen, Art von Beziehungen, wie wenn Alter wegen der Ausgabekapazität. Koza. Nicht alle Kunden, nicht alle Formenkunden werden mehr schicken, aber die meisten von ihnen, das ist es, worüber wir als Beziehung sprechen. Der andere ist unser Brötchen. Kunden kaufen Mehr Internet-Bandbreite Es besteht eine Beziehung zwischen dem Standort des Kunden auf den Bandbreiten-Patches, aber ein Kunde wieder, möglicherweise, weil er mehr surft und Sie den Patienten erneut betrachten. Es gibt viele Beziehungen, die Sie sehen können. Wie alle Perser haben mehr Prävalenz von Diabetes. Es besteht die Beziehung zwischen Alter und Krankheitsniveau. Patienten haben in der Regel einen höheren Cholesterinspiegel. Das heißt, die Beziehung zwischen Gewicht und Kopf. Wirklich wieder, es gibt wissenschaftliche Gründe, warum diese Dinge passieren. Du würdest ein Auto nehmen. Die Beziehung zwischen der Anzahl der Zylinder und der Laufleistung, die es so mehr gibt, tut Linda, es sei denn, die Kilometerleistung. Weil es mehr Brennen passiert, wenn es mehr Zylinder gibt. Sportwagen haben jetzt höhere Versicherungsraten. Dies ist keine schnellere Beziehung, aber Sie werden dies als eine Geschäftsbeziehung wie Sportkarte sehen. Immer wenn die Autos aus einem Trotz Typ einen Sportwagen, ist es Versicherungsraten sind in der Regel höher. So gibt es eine Lotion zwischen der Art des Autos auf die Versicherungen Preise, etwas Dinge über Beziehungen. Eines der Dinge, die Sie stören möchten, ist die Benussi Beziehung zwischen zwei Attributen. Ist die Beziehung konsistent? Sind die zufälligen Beziehungen können auch als Muster gesagt werden, Muster, was Sie in Datenmustern des Verhaltens sehen. Manchmal kann das Verhaltensmuster konsistent sein, weil es die ganze Zeit passiert. Sie können wiederholt, wenn es die ganze Zeit passiert, können Sie ein solches Verhalten in der Zukunft tatsächlich vorhersagen. Aber da es zufällige Muster geben könnte, Ereignis diese Beziehung. Auch, wenn es nebenbei bemerkt ist, es einfach zufällig passiert. Dies könnte keine logische Erklärung für einen Vorfall sein, dass Verhalten ein Vorfallsmuster . Wenn Sie also eine Beziehung sehen, ist es sehr wichtig, dass Sie sicherstellen, dass die Beziehung konsistent ist. War ist zufällig. Konsistente Beziehungen sind das, was Sie für Data Science benötigen. Beziehungen werden uns auch Korrelationen genannt, das heißt, der technische Begriff, den Sie sehen werden, werden verwendet. Korrelation zwischen zwei sind Entitäten sind zwei Attribute ist, wenn mit dem, was sehen Sie, als wenn ein nach oben geht und nach oben geht, Es geht nach oben. Und Biscoe nicht Austin Das ist Körper Korrelationen genannt. Ist das der mathematische Begriff, über den du sprichst, wenn du über Beziehung sprichst? Es ist und schließlich könnte man Menschen sprechen über Signale und Rauschen Wenn es um Data Science Signale geht , sind nichts anderes als konsistente Muster konsistent. Beziehungen, die Sie in Daten sehen Narcisse. Zufällige Muster sind Zwischenfälle Beziehungen. Sie Tag in Daten. Also, wenn Sie über diese Begriffe gehört haben, Signal und Lärm dort, nichts über Beziehungen, Beziehungen, die sinnvoll sind, war seine Beziehungen, die durch Zufall geschehen, die nicht vorhersehbar sind, die nur zufällig sind. Das ist also der Unterschied. Aber Signale und schön jetzt kommt, was bedeutet Lernen Wir reden über Mission Learning und dieses Lernen und das Lernen und alle Formen des Lernens. Also, was genau ist das Lernen? Lernen bedeutet, dass man über Beziehungen lernt. Das ist das Wichtigste, was du über Daten wissen willst, die Heilige tun. Ihre Heiligen haben Missionslernen. Hier lernen bedeutet, dass Sie nur versuchen, über Beziehungen zwischen diesen Attributen zu erfahren . Das ist es, worum es beim Lernen geht. Es beinhaltet die Einnahme einer Domäne wie ein Bleib Bein Krankenhaus Domino Geschäft. Machen Sie es nichts dagegen, die Entitäten und die Attribute zu verstehen, die die Domäne darstellen können Daten über alle zum Verständnis von Beziehungen sammelt. Da diese Attribute sind, ist dieses Verständnis der Beziehungen zwischen diesen Attributen, worum es beim Lernen geht. So Modelle ist das Ergebnis des Lernens. Also, was tun Sie, nachdem Sie etwas erfahren haben, ist, dass Sie Modell darüber jetzt bauen? Dieses Lernen, wenn Sie sprechen hier lernen passieren die ganze Zeit im menschlichen Gehirn wurden konsequent Daten innerhalb eines menschlichen Wesens menschlichen Gehirns sammeln, konsequent kontinuierlich über Dinge lernen und kontinuierlich Modelle aufbauen. Wir haben diese Modelle das ganze Flugzeug ohne unser Wissen verwendet. Unterbewusst lernen wir kontinuierlich über Dinge, was wir hier in Bezug auf Datenwissenschaft sprechen , ist nur das Lernen dieser Art aus in einen richtigen Prozess auf das Lernen geschieht außerhalb des menschlichen Gehirns in Missionen gemacht. Das ist, was, als ein kleiner Unterschied zwischen Lernen, das im menschlichen Gehirn geschieht, und Lernen, das mit Missionen passiert, ist eher ein Prozess zu warten. Es gibt mehr Daten aus ihm, und es gibt mehr davon, es zu tun. Also, was ist eine moderne? Ein Modell ist eine vereinfachte, angenäherte Darstellung eines realen Phänomens. Es gibt also ein wirklich gutes Phänomen. Es passierte. Und wenn Sie ein Modell machen, versuchen Sie zuerst eine vereinfachte Moral zu erstellen. Du versuchst nicht, zu viele Dinge in das Modell zu stecken. Sie versuchen nur, die wichtigsten Dinge über die reale Welt Phänomen auf dann nehmen, Aufbau einer einfach Kampf Darstellung auf annähernd re Präsentation aus der realen Welt Phänomen. Sie können tatsächlich auf Rechnung so komplexe Modelle gehen, wie er eine Person halten wollte, aber in der Regel Pin Menschen bauen Modelle. Sie wollten vereinfacht werden, so dass es alle wichtigen Faktoren herausbringt, die Sie jemals stören wollen und ignoriert alles, was Sie sich nicht stören wollen. Also ist es eine einfache Tatsache annähert die Präsentation von einem realen Weltphänomen. Es erfasst die Schlüsselattribute, die Schlüsselattribute der Entitäten auf ihren Beziehungen auf Let's Say, ein Beispiel für ein Modell könnte ein mathematisches Modell sein. Ein mathematisches Modell ist etwas, das die Beziehungen wie eine Gleichung darstellt. So können Sie eine Gleichung schreiben, die Beziehung zwischen den Attributen wie zum Beispiel, können Sie kommen. Aber das ist eine formelle, die ich von irgendwo auf der Welt bekommen habe. Du bist ein Bauernhof. Liebe, wie Sie den Geist tun können. Blutdruck. Das ist eine Gleichung. Also ein schwarzer Druck Rekord von 56 plus das Alter einer Person in der 560,8 plus Gewicht der Unterdrückung in 2,14 plus Israel Niveau der Unterdrückung in 2.9 Also was sehen Sie hier ist, dass Sie versuchen, den Blutdruck aus dem einen Attribut des Blutdrucks zu berechnen drei weitere Attribute H Gewicht und LDL. Nun, dies ist ein ungefährer Wettbewerb des Blutdrucks. Es wird nie geben Ihnen den genauen Wert ein groß, aber es könnte sein. Es könnte ungefähr in der Nähe des realen Weltwerts sein Also hier ist eine Formel, die ein mathematisches Modell zeigt , wie ein Blutdruck Zeh verwandt werden kann. Drei weitere Attribute. Gewicht, Alter und Ellie Niveaus. Dies könnte ein anderes Modell sein, bei dem auf ein Entscheidungsbaum-Modell geklickt wird. Es ist wie ein logisches Modell, in dem Sie eine Reihe von Fragen zu der Reihe von Fragen stellen , die Sie stellen. Sie fügen Fragen zu verschiedenen Attributen ein und kommen dann, basierend darauf, mit einem Ergebnis, wie Sie wollen, Sie sehen möchten. Sie wollen so etwas wie den Kauf einer Musik Stadt vorhersagen und für diesen Gedanken, dass Sie mit einem Entscheidungsmodell wie diesem kommen können , wenn Alter aus den Kunden. Legende 25 über Geschlecht der Kunden verschickt von Beyonce Eine Stadt namens Ja, So dass Sie verwendet, um Attribute Geschlecht und Alter auf basierend auf ihnen, Sie versuchen, mit dem Ergebnis vorherzusagen, die mit dem Kalender Kunden von Beyonce CDR. Nicht Dies ist eine andere Art von Sterblichen. Acura. Ihre Modelle hängen von der Stärke der Beziehungen zwischen den Attributen ab. Manchmal ist die Beziehung zwischen den Attributen sehr stark, so dass Sie vorhersagen können, wie mit 100% Garantie, dass Okay, wenn ich das sehe. Ich bin mir sicher, dass das das Ergebnis sein wird. Manchmal ist Genauigkeit nicht so viel. In diesem Fall möchten Sie möglicherweise mehrere Attribute NC kombinieren, wenn Sie den Genauigkeitsgrad erhöhen können. Manchmal gibt es überhaupt keine Beziehung, oder? So kann es in jeder Form oder jeder Art von variierendem Maßstab sein, den Sie dort bekommen könnten. Aber Modell insgesamt ist eine vereinfachte angenähert die Präsentation von etwas, das in der realen Welt geschieht. 6. Was ist die Data Science Teil: Sobald Sie ein Modell haben, können Sie Vorhersagen machen, sodass ein Modell verwendet werden kann, um unbekannte Attribute vorherzusagen. Einfaches Beispiel. In diesem Jahr haben wir bereits gesehen, dass es eine Formel gibt. Blutdruck gleich der 56 plus Mittel 2.8 plus warten, 2.14 plus früher, Linda wies ein +09 So haben Sie hier eine Formel, die für Attribute Blutdruck bezieht, Alter groß und LDL wissen, was das bedeutet, dass, wenn Sie wissen, drei aus diesem für Attribute, können Sie den Fuß vorhersagen, so das ist, was wir uns nennen. Vorhersage. Wenn Sie also einen Computer seifen, können Sie sagen, dass Sie sagen können, vorherzusagen, wenn er ein Compute ist, Sie garantieren 100% Genauigkeit, die Sie wissen, dies ist die Formel, wenn Sie Ihre meist annähernd malen. So haben Sie hier vier Attribute drei oder vier Attribute. Wenn ich drei von ihnen kenne, kann ich diese Formel Zeh wirklich bekommen. Berechnen Sie, was auch immer danach, aber ich will Oh, wenn wir drei von ihnen kennen, kann ich vorhersagen, die 4. 1 Dies ist, was Sie Vorhersage nennen. Die Vorhersage aus einer Modell-Doppelgleichung kann als einfacher Vorhersagealgorithmus betrachtet werden. Einfache Sache auf Dilatation. Übersprungen können viel komplexer sein, was zu komplexeren Modellen und Vorhersagealgorithmen führt. Also, was Sie sehen, dass die Gleichungen sind sehr einfach finden Modell von uns oder etwas wirklich einfaches als ein Problem wird komplexer, jeder ein wenig später, komplexer, lernen komplexere Modelle auf komplexere Vorhersage-Algorithmus. Darum haben wir das alles gelernt. Lernen geht es um Daten, Sets, Beziehungen, Modellierung und Vorhersage. Lassen Sie uns also darüber reden, was ich uns auf das Ergebnis vorhersage. Wenn Sie also über unsere Daten sprechen 100, spüre ich, dass Sie über Prädiktoren und Ergebnisse sprechen . Also, was sind sie? Ergebnisse sind Attribute, die Sie vorhersagen möchten. Unabhängig davon, welche Attribute Sie vorhersagen möchten, werden sie als Ergebnisse bezeichnet, wie in der Formel des Jahres zuvor. Wir wollen den Blutdruck vorhersagen. Es wird das Ergebnis genannt. Senatoren sind Attribute, die Sie verwenden möchten, um das Ergebnis vorherzusagen, also haben Sie eine Reihe von Attributen. Was willst du vorhersagen? Das Ergebnis? Alles andere, die Sie verwenden, um das Ergebnis vorherzusagen, unsere Auto-Prädiktoren, so dass Sie möglicherweise 10 Attribute in Ihren Daten, sagte einer von ihnen kann Ihr Ergebnis sein, und drei andere können Ihre Praxis sein. Ich meine, nicht alle Attribute haben eine Beziehung zum Ergebnis. Attributieren Sie nur diejenigen, die eine gute Beziehung zum Ergebnis haben. Variablen werden offensichtlich Prädiktor, so dass Prädiktoren und Ergebnisse und offensichtlich Prädiktoren und Ergebnisse eine Form der Beziehung zeigen, weil das alles ist, was Sie Ergebnisse von ihnen Prädiktoren vorhersagen können . Beim Lernen geht es darum, Modelle zu entwickeln, die verwendet werden können, um Ergebnisse vorherzusagen, was die Ausgabe mit den Prädiktoren ist, das ist das Säugling. Hier sind einige Beispiele, die wir zu den gleichen drei Beispielen zurückkehren werden. Im Fall eines Kunden sind die Prädiktoren Alter, Einkommen, Reichweite und Standort auf. Das Ergebnis kann sein, Wird der Kunde Ihren Schutz kaufen oder nicht ein Patient? Die Drucker können Alter, Blutdruck und Gewicht auf dem Organ sein. Ist der Patient, der stirbt? Aber sie konnten nicht am Beispiel eines Autos wie die Prädiktoren sein, vielleicht verwenden Sie Dinge wie Zylinder, Anzahl der Zylinder und Beschleunigung auf. Vielleicht wollen Sie vorhersagen, wo das Auto sein wird. Ein Sportwagen ist ein Familienauto. Das sind also, was Sie uns Prädiktoren und Ergebnisse nennen. Eines der wichtigsten Dinge, über die Sie wissen möchten, ist Menschen waren Einreichungen. Menschen verstehen Beziehungen und vorhersagen, die ganze Zeit, die im menschlichen Gehirn passiert ohne sogar Woche, wir sind bewusst, abgebrochen. Wir sammeln immer Daten, wir halten, Wir verstehen Beziehungen. Wir bauen immer wieder Modelle in unseren Köpfen. Wir prognostizieren die ganze Zeit, jederzeit, wenn Sie produzieren, vorhersagen Sie. Okay, ich denke, das wird passieren. Es bedeutet, dass Sie ein Modell verwenden, das Sie in Ihrem Kopf gebaut haben, um etwas vorherzusagen, was Sie sagen. Ich glaube, es kann passieren. Es ist ein Wochen-Model. Sagen Sie, ich bin 100% sicher, dass das passieren wird. Es ist ein sehr starkes modernes, aber der Mensch kann nur mit der nächtlichen Datenmenge umgehen, richtig. Aber zum Beispiel zum Beispiel werde ich Ladenbesitzer behalten. Du hast sie gesehen. Sie wissen über ihren besten Kunden der langjährigen Kunden. Sie wissen, was ihre Kunden mögen und was die Kunden wollen. Andi, wann immer ein Kunde kommt, spricht er ihn normalerweise an. Mein Name und die sofort wissen, was diese Kunden wollen. Selbst wenn der Kunde darum bittet, werden sie groß, gestorben. Ähm, und es wären sie. Aber der Mensch kann nur verarbeiten, füllen Sie die Menge der Daten, so dass sie über die Präferenzen von 100 Kunden wissen . Nicht mit 10 Millionen von ihnen. Was passiert dann? Dann kommen Maschinen ins Spiel, richtig? Wir wollen all das allgemeine in Kundeninformationen in Computern speichern. Andi Lassen Sie die Computer lernen, über die Präferenzen auf Hilfe Sie. Die Missionen kommen ins Spiel, wenn die Anzahl der Entitäten auf den Daten Langeweile groß ist , und ihre Einkommen Mission lernen, wenn Sie 100 oder arbeiten mit Ihrem Computer Zeh, sammeln Sie alle Daten, tun Sie alle das Lernen, bauen alle Modelle. Ondo. Die Vorhersage. Das ist, wo wir es kommen, wird Mission Learning. Das ist, wenn es Mission Learning, Predictive Analytics und Data Signs wird . Also, was bedeutet Daten Heiligen, Entitäten, Beziehungen, Modellierung und Vorhersage. Was ist also Daten-Cent? Es geht darum, ein Problem in einer bestimmten Domäne auszuwählen. Das Verständnis der Problemdomäne, die Entitäten und die Attribute und das Verhalten und die Evens Sammeln von Datensätzen, die die Entitäten repräsentieren, sammeln wir alle Daten, die Sie benötigen, und dann entdecken Sie Beziehung aus der Reiter. Das nennt man lernen, wenn Computer dies tun. Es heißt Mission Dunning. Erlaubnis. Lernen ist nicht etwas, obwohl es in der Welt nichts geht. Es ist alles an Bord von Missionen. Lernen über bestimmte Dinge sind die Entdeckung von Beziehungen aus den lesen acht als und dann bauen Modelle. Die Präsidentenbeziehung. Der Sterbliche kann wie ein mathematisches Modell sein. Es kann ein Entscheidungsbaum-Modell sein. Es kann andere Arten von komplexen Modellen zu geben, und was wir in wirklich bauen Modelle ist, dass wir vergangene Daten verwenden, wenn Sie über die Proteste wissen . Du kennst das Auto, die Ergebnisse. So kennen Sie die Werte der Krater. Sie kennen die Werte der Ergebnisse. Andan mit diesen Werten, etablieren Beziehungen aus den Beziehungen, die Sie Modelle erstellen. Und sobald Sie eine moderne erstellen, können Sie dann mit der Vorhersage beginnen Sie können mit der Vorhersage für die aktuellen oder zukünftigen Daten beginnen, wenn Sie die Prototypen kennen. Aber Sie kennen die Ergebnisse nicht, also nutzen Sie die Vergangenheit, um die Build-Modelle zu lernen, und dann prognostizieren Sie die Futures, wenn Sie nichts über die Ergebnisse wissen. Hier ist ein Beispiel dafür, was Website-Käufer im Falle von größeren Zeichen tun würde. Das ist kein Beispiel, das Problem wäre, vorherzusagen, dass der Käufer Ihr Smartphone auf das kaufen wird, was sie dagegen tun werden. Du bekommst die Geschichte der Porträts aller Käuferinnen, richtig? Sie sammeln Käufermerkmale wie Alter, ein geschlechtsspezifisches Einkommensniveau. Sie sammeln saisonale Informationen, wenn sie kaufen, wie, welche Art von Dingen, die sie im Winter kaufen, war ein Sommer. War das Halloween? Was ist ein Schwung von Mittwoch? Du sammlst all diese 11 Daten, die da sind. Dann bauen Sie Modelle. Sie bauen Modelle, die über Beziehungen sprechen, darüber, was aufgeht oder was Ton kommt. Wenn der Kunde kauft, kauft der Kunde nicht. Also haben Sie im Grunde versucht, die anderen Attribute, die Sie kennen, so das Ergebnis zu lassen. So sehen Sie sich alle Werte aus den anderen Attributen, wenn die Kunden kaufen, Was bedeutet, dass die Werte der Attribute, wenn die Kunden nicht kaufen? So sehen Sie, dass eine Dame den Wert aus auf einem Tribut Alter es ist größer als 25. Der Kunde kauft den Wert des Alters Blei weniger als 25. Der Kunde beißt nicht. Es kommt eine Beziehung. Versuchen wir, diese Beziehung zu nutzen, um ein Modell zu bauen und dann versuchen Sie vorherzusagen, was immer dann ist, wenn Sie einen Kunden sehen, der älter als 25 ist. Ja, der Kerl wird das kaufen. Also machen Sie Vorhersagen. Also, wenn eine Atombombe Käufer Surfen vorhergesagt, der Käufer kaufen, verwenden Sie das Modell und prognostizieren in Echtzeit. Aber der Kunde wird ein Produkt kaufen oder nicht auf. Okay, was ich mit der Produktion machen werde, jetzt, wo Sie wissen, dass die Kunden kaufen werden, nicht kaufen werden , ist, dass Sie einige Aktionen tun können, wie Sie Childhelp anbieten wollen. In diesen Tagen, wann immer Sie auf eine Website gehen, Sie sehen, dass ein kleines Pop-up kommt und sagen: Wollen Sie mit Ihrem Live-Agent reden? So sind Live-Agenten teuer. Sie sind Menschen. Sie zahlen ihnen eine Menge Geld, also wollen Sie nur Leben, Alter und Hilfe anbieten . Also Käufer, von denen Sie denken, werden Ihr Produkt kaufen, damit Sie eine intelligente Entscheidung treffen können , welchen Käufer Sie wollen. Ich will live Agent. Basierend auf dieser Vorhersage ist dies ein Beispiel dafür, wie Datenzeichen für Sie funktionieren würden. Vielen Dank 7. Anwendungsfälle für Datenwissenschaft.: so hallo. Das ist dein Ausbilder Cameron hier. Und wir werden uns einige der Anwendungsfälle für Data Science ansehen. Sie sehen nicht, wie die Welt von der späteren Wissenschaft profitiert. Der Einsatz von Data Science wächst exponentiell. Seit einigen Jahren ist jeder Tag exponentiell gewachsen. Ich verbreitete mich über mehrere Domänen und, wie Geschäftszeichen sind Finanzen und unpersönliches Leben. Auch auf eine jüngste Fortschritte in der Rechenleistung. In Bezug auf die Hardware, in Bezug auf Off-Software, eine Menge aus öffnet oder so weit in die Welt kommen, wie das Ganze dope Ökosystem auf prädiktive Algorithmen. Die Kombination all dieser Elemente hat es sehr kostengünstig für Sie gemacht, Data Science in den kommerziellen Gebrauch anzuwenden . Okay, lassen Sie uns einige der Beispiele für die Verwendung von Data Science sehen. Der erste Buchstabe beginnt mit Finanzen für Finanzen. Alle an Bord verdienen Geld, um Geld zu sparen. So Betrug Reduktion. Reduktion von Kreditkarten-Betrug ist eine sehr wichtige Anwendung unserer Daten. Die Wissenschaft wird benutzt. Was also passiert in Kreditkarten-Betrug ist, dass Kreditkarten-Betrug zeigen Tönung bestimmte Muster, in denen sie passieren, wenn Sie auf Transaktionen, die mit Kreditkarten-Betrug verbunden sind . Sie zeigen ein Muster, Art aus einer Beziehung zwischen den verschiedenen Entitäten und ihren Attributen. Und es sind diese Muster, die im Wesentlichen im historischen später festgehalten werden. Sie werden verwendet, um Modelle aus fruchtbaren und Transaktionen zu bauen. Die historischen Daten haben also gute Transaktionen und Betrugsgeschäfte, und dort, dann verwendet, um Modelle zu erstellen, wie eine betrügerische Transaktion aussehen wird. Also, wenn ein neuer Kriminalitätsabschnitt auftritt , ist diese Transaktion sofort erhöht. Mit Computern, mit dem Modell zu kommen, was er uns eine Betrugs-Score nannte. Eine Fraud Gericht Schule sagt Ihnen grundsätzlich, ob die bestimmte Transaktion ein Betrug ist, betrügerische Transaktion oder nicht. Es ist eine Schule, vielleicht ab 1 200, wenn es erzielte Ursachen, vor allem Schwelle. Es wird sofort als Requisite gekennzeichnet. Mögliche betrügerische Transaktion Es ist. Dann werden einige Maßnahmen ergriffen, wie die Anrufe an den Kreditkarteninhaber als Zehe fragen gemacht werden. Ob nicht alle diese Transaktionen macht. Manchmal wird die Kreditkarte sofort für weitere Transaktionen gesperrt, bis sie die Überprüfung vornehmen . So gibt es einige Aktionen wie diese bisher ergriffen, die Richtung ist eine sehr wichtige Anwendung für die spätere Wissenschaft in der Finanzwelt. Die zweite Anwendung, die Sie sehen würden, ist über den Einzelhandel, So werden Sie sehen, dass, wenn Sie zu einer Website gehen und Ihren Einkauf und legen Sie einige Artikel sofort in Ihren Warenkorb, Sie sehen einige Empfehlungen kommen. Wie im Fall einer Maison würden Sie sofort eine Empfehlung wie Artikel sehen, die häufig zusammengebracht werden. Wie machen sie diese Empfehlungen ist wieder? Gegenstände zeigen Muster, wie ihr Freak zusammengebracht hat, wie Handys und Zubehör-Bücher, einige Gegenstände, die häufig zusammen gekauft werden. Sie zeigen diese Affinitätsmuster. So basierend auf, dass die Rechnung, was Affinitäten natürlich zwischen den Artikeln genannt werden. Also zwischen allen Para fünf Versuche, die eine Affinitätsbewertung zugeordnet ist. Je höher, definitiv genannt wird, desto häufiger wurden diese Gegenstände zusammengebracht. Also, was passiert als nächstes? Immer wenn einer von denen, die ich versuchte, sofort von einem neuen Käufer gekauft, Punkte mit hoher Affinität zu diesem Artikel, wie sie, sofort empfohlen. So haben Sie die Videos Kurs verwendet, um mehr Artikel an die Sharper zu empfehlen, mit der Idee, dass, wenn die Power-Shopper haben sie Zehe zusammen gekauft. Vielleicht ist das, wie der nächste Laden. Aber es wird auch tun und diesen Wert mehr Cross-Selling und absolut Contact Center zu tun . So haben wir Contact Center, die traditionell für den Kundenservice verwendet wurden. Die Verwendung von Kontakten und es ist heute gewachsen, um Kuppel oder Verkäufe eine Menge off, mehr High-End-Vertrieb und Support, und sie begannen auch mit Datenzeichen, um ihre Leistung zu verbessern. Und wie haben oder haben sie das tun, ist dies Sie haben begonnen, Farben zu erzielen. weniger Agenten betrifft, so dass frühere Interaktionen verwendet werden, um Farben auf ihrem Wert in Bezug darauf, wie viel der Geschäftswert war, ah, Krieg Art der Farbe platzen viel der Geschäftswert war, ah, ah, . Sie sind, wie viel Geschäft sie bereits mit dem Unternehmen gemacht haben, das sie verwenden. Das hieß die Farben. Sie entschuldigen auch Kurs für Agenten auf der Grundlage der Fähigkeit, hochverkaufte Organe zu verkaufen . War ein niedrig verkaufter Agent oder Agenten, die die Fähigkeit, eine bestimmte Art von Problem zu behandeln , wie Agenten, die Probleme in dem spezifischen Produkt behandeln können, sind bestimmte Art von lassen und , Netzwerkproblem war ein Telefon Problem, dass Dinge wie Was also getan hat, ist, dass sie versuchen, die richtigen Farben mit dem richtigen Agenten zu mak. Basierend auf diesem Kurs auf Idee ist, wenn Sie vielleicht Recht haben, rufen Sie uns mit den richtigen Agenten. Es wird Ihre Geschäftsergebnisse zu optimieren und dann Aufzeichnungen mit so Auto anrufen. Sie sehen, dass, wenn Sie mit einem Contact Center sprechen, sie immer sagen, dass Ihr Anruf zu Qualitätszwecken aufgezeichnet wird und was sie mit diesen Anrufaufzeichnungen tun , ist, dass sie maschinelles Lernen Algorithmen auf diesen Aufzeichnungen, um die Qualität des Call on Outcome zu verstehen und sie für zukünftige Verbesserungen zu nutzen . Und schließlich betrachten wir die Gesundheitsversorgung jetzt Vorhersage von Krankheitsoperatoren ein Freund gewesen. Abstauben Sache, die passiert ist Floke ist, dass Sie Krankheitsausbrüche vorhersagen können, indem Sie sich ansehen was die Menschen in Google suchen und was sie twittern und twittern. Also Datensatz dieser Sammler aus öffentlichen Domänen wie Google-Sucher und Twitter-Feeds und Sachen wie diese auf diesen Daten ist immer mit den Standortinformationen verknüpft. Also, wenn Sie etwas über googeln, wissen Sie, wo Sie etwas hinstellen. Der Standort von Mario tun, dass immer gesammelt wird, und dann werden diese Informationen dann gesammelt. Wie das, was Sie über unser Wasser, dass Sie googeln Airboat zusammen mit dem Standort Toe, kommen mit Pat. Und so tun Menschen solche Fragen zu einer bestimmten Krankheit von einem bestimmten Ort aus . Dieser Artikel wollte, dass auf je mehr der Moment, in dem Sie beginnen, einige Muster von der Zehe zu sehen, die Menschen twittern mehr über eine bestimmte Krankheit spezifischen Ort. Das ist eine Möglichkeit, dass es dort einen Ausbruch gibt. Diese Art von Informationen wird jetzt verwendet, um mit der Vorhersage zu beginnen, dies sind Objekte. Was ist das Gute daran, Vorhersagen über Krankheitsausbrüche zu machen, ist, dass die Regierung proaktiver gestalten kann. Sie sehen, dass dies beginnt die Zehe oder bricht eine bestimmte Lokalität. Die Regierung kann sofort beginnen, ihre Ressourcen zu marshalen, um eine vorbeugende Versorgung zu schicken . Ähm, oder viele schicken mehr Ärzte. Sachen wie, dass es organisieren kann, wie ein paar Tage im Voraus auf verhindern mehr oder Klammer, die in der gleichen Gegend geschieht . Also nicht zugewiesen hilft, unsere zumindest zu verwalten diese Krankheitsausbrüche zu verhindern. Also, dies sind einige der interessanten Anwendungen in Data Scientists ist wie eine sehr wenige beliebte Anwendung. Das ist in der Tat eine Menge, die dort auf duh passiert. Ich hoffe, dass Sie in der Lage sein werden, etwas mehr Lesen und Industrie und alle von ihnen zu tun. Ah, und in naher Zukunft, danke. 8. Data – Einrichtung: Hallo. Dies ist Ihr Lehrer, der hier üblich ist. Ich bin in diesem Abschnitt. Wir werden sehen, worum es bei den Signatur-Projekten im Lebenszyklus von Daten geht. Wir werden also über Data Science-Projekte sprechen, was ihre Aktivitäten sind, wie sie sequenziert werden. Beginnen wir also mit einigen einleitenden Anmerkungen. Data Science Bemühungen sind typischerweise Ex-Uranus-Projekte. Wenn also eines der vielen Unternehmen geschäftlich alles andere als Datenzeichen tun will, erstellen sie normalerweise Projekte, wie Leute Software bauen wollen. Sie erstellen Software-Projekte für Projekt. Sie setzen von einigen objektiven, etwas Gold und dann gehen über sie zu exekutieren. Ähnlich wie, sie hatten andere Zeichen. Die Bemühungen werden auch als Projekte ausgeführt. Also eine Sache, die hier zu beachten ist, dass Data Science Projekt sollte wie Forschungsprojekte betrachtet werden . Sie sind nicht wie Bauprojekte, die sie nicht sind. Sie haben keine Dinge wirklich sicheren Stein, dass Sie einfach gehen und ausführen und weg von ihm. Das sind Forschungsprojekte. Es gibt eine Menge von Denken beteiligt. Es gab eine Menge aus Überarbeitung Board und bis Sie das Ziel zu erreichen, so sollten sie als Forschungsprojekte betrachtet werden , nicht wie Software bauen und betreiben Art von Projekten. Die Projekte beginnen überschwemmt wie alle anderen Projekte, die sie an den Projekten machen. Haben Gesichter und Aktivitäten auf Übergang geschieht zwischen Gesichtern und Aktivitäten, und es hat Projekte gesendet beinhalten eine Menge von hin und her zwischen den Gesichtern. Dann ist es Morgenstern, wie wirklich von Wasserfall-Modell. Es ist eher wie ein iteratives Modell, wenn Sie das mit etwas im Zusammenhang mit der Softwareentwicklung verknüpfen möchten . Also in diesem Abschnitt werden wir darüber sprechen, welche Daten Heiligen, Projekt-Gesichter und Aktivitäten sind. Was ist die Bedeutung jeder dieser Aktivitäten, wie ihr Übergang Art von einem zum anderen, und auch einige der besten Praktiken? Werden wir nur über sie reden? Hier ist also ein Überblick über den Leser. Wissenschaftsprojekte und -aktivitäten, die Sie dort sehen, gibt es, wie vollständige, breite Kategorien oder Etappen im Leser. Da Projekt, das die Menge der Phase ist, gibt es die Data Engineering Gesicht die Analyse Gesicht auf der Produktionsphase in der mittleren Phase, Sie nur Vorbereitung das Team mit so, was sie zu tun haben. den Daten, die jahrelang verletzt werden, geht es darum, Daten und das Training von Daten auf die gute Art und Weise mit Daten zu arbeiten . Formleiste. Sie können die dritte Stufe machen, die die analytische Stufe ist. Alex ist also alles darum, die Daten zu erkunden und einige aussagekräftige Informationen oder die Fed zu bekommen . Also es geht um Lernen und Vorhersagen auf Sobald Sie das Analytics-Gesicht machen und Art von Empfehlungen finden, können Sie dann in die Produktionsphase gehen, wo ich tatsächlich einige Datenprodukte erstelle, die dann alles tun, was Sie nur in einer automatisierten Weise und in einer wiederholbaren Art und Weise auf hält produzieren Sie Ergebnisse, die Sie wünschen. Ich gehe nur zur ersten Aktivität Gesicht, die die Menge der Phase ist. Das erste, was Sie in einem Unschuldsprojekt wollen, ist das, was Sie als Zielsetzung für das Innocence Projekt nennen . Jeden Tag wird und sollte das Essenzprojekt ein Gold haben. Wenn jemand will. Was für ein Dutzendes Projekt, das so ist, Okay, schauen wir uns die Daten an und sehen, was Sie daraus herausbekommen können. Dieses Projekt ist zum Scheitern verurteilt. Data Science Project sollte ein bestimmtes Gold haben, das ich tue, damit das Team nachgehen kann. Also die Bemühungen des Teams werden alle auf das Erreichen dieses Ziels konzentriert sein, und die Aktivitäten werden auch darauf basieren, was Sie so Raum erreichen wollen. Aber es gibt, dass Projekte ohne Ziele Fahrer sind, unsere Autos ohne Fahrer. Also, wenn jemand dazu kommt und dir das sagt, okay, okay, wir werden tun, was es seit tragischer Zeit hat. Schauen Sie sich einfach die Daten an und sehen Sie, was wir uns einfallen können. Das Projekt geht nirgendwo hin. Das war also die Erfahrung von vielen, vielen Menschen, die versuchen, zu tun. Sie projiziert nicht einige der Beispiele von Gold, die unser Bein setzen. Es gibt keine Vorhersage, welche Kunden in den nächsten drei Monaten abwandern werden. Das ist eine Zielgruppe, die behandelt, dass wir über unser Unternehmen bekommen und dann gruppieren sie auf der Grundlage der Stimmung aus den Tweets identifiziert Patienten, die eine Möglichkeit haben einen Herzinfarkt in den nächsten drei Monaten. Also wirst du die Kunden vorhersagen, Joan, wirst du die Stimmung der Tweets vorhersagen? Willst du Patienten vorhersagen, die Herzinfarkte haben werden? Die Mädchen können so etwas sein, aber das Wichtigste ist, ein gut definiertes Ziel zu haben, bevor Sie mit Ihrem Projekt beginnen . Die zweite sehr wichtige Sache, auf die Sie sich konzentrieren möchten, ist das Verständnis der Problemdomäne . Im Gegensatz zu Softwareprojekten, sogar in Softwareprojekten, würde ich sagen, dass das Verständnis der Geschäftsdomäne ein Zoo ist. Gute Sache im Fall über Data Science Projekt, ist es notwendig, dass alle Teammitglieder einige grundlegende Verständnis haben, was das Geschäftsproblem verbleibende ist alles über. Also, wenn wir sagen, dass wir es brauchen, sprachen wir über ein Problem, das kommt. Wir sprechen über die Geschäftsgrundlagen, wie Sie im Finanzgefühl der Sierra fühlen oder im medizinischen Bereich sind, verstehen Sie einige Grundlagen über das Geschäft, verstehst du? Worum geht es bei diesem Geschäft? Wie verdient das Geschäft Geld? Einer der Geschäftsprozesse, die daran beteiligt sind, was ist der Workflow für einige der wichtigsten Performance-Metriken im Unternehmen? Und das ist sehr sogar in einem größeren Data Science Teams. Es gibt immer jemand, der uns angerufen hat, der Export nichts ausmacht. Ich habe nichts dagegen. Export ist ein sehr kritischer Teil von einem Data Science-Team, so dass große Teams in der Regel einen Domain-Experte haben, der vielleicht kein technischer Typ ist, ist kein statischer Sit als Kerl, kein Programmier-Typ, ist nur jemand, der das Geschäft kennt. Halten Sie ihn im Team, um Ihnen beim Verständnis des Problems zu helfen. Domain-Einsendungen? Nein, das ist eine wichtige Sache. Missionen nur edle Zahlen und Strings. Sie machen nur Müll in Müll. Sie brauchen Menschen, um diese Zahlen und Stärke jede Bedeutung zu assoziieren. Die Mission Don't Missionen verstehen das Geschäft nicht. Der Mensch versteht das Geschäft in der Datenwissenschaft. Es ist wichtig für Sie, alles zu verstehen und zu validieren, was da kommen wird und das nur von Menschen getan werden kann, und für die Menschen, um das zu tun, brauchen sie Verständnis des Problems. Wissen über die Domäne hilft den Teams, die Entitäten, die Beziehung, die Muster, jede Art von Wissenserkennung, die Sie benötigen, um sie zu validieren zu verstehen Beziehung, die Muster, . Und die Verletzung kann nur getan werden, wenn Sie wissen, was das Problem nichts ausmacht, ist alles über einen Erwachsenen. Auf diesem Verständnis des Problems hilft domain Ihnen, alle Annahmen zu validieren. Noch wichtiger ist , identifizieren Sie Fehler also die Daten haben einige Dinge. Woher wissen Sie das? Was ist, wenn Sie zum Beispiel einen Tag Dan suchen, und sagen wir, das Alter der Person zeigt sich 600 Jahre. du es dir ansiehst, weißt du, dass es nicht falsch ist, weil es niemanden gibt, der 600 Jahre alt ist. Aber Sie können das nur tun, weil Sie wissen, das Domain-Alter ist ein sehr häufig verwendete Begriffe. Jeder versteht, worum es geht. Was? Was ist mit so etwas wie Cholesterinspiegel? Woher wissen Sie, was ein gültiger Cholesterinspiegel ist? Was ist kein gültiges fragwürdiges? Wenn jemand einen illegalen off 1000 hat, ist das möglich? Ist es eine normale Zahl in die hohe Zahl Ist keine eingeladene Nummer? Sie können nur feststellen, ob Sie die Domain kennen, und deshalb ist Domain-Experte für Sie nach dem Verständnis der Domain erforderlich. Die nächste Phase ist das Verständnis der Daten, die mit den Daten verknüpft sind. Wir haben genug über Daten und einige der anderen Abschnitte gesehen. Hier, zurück dazu, Geschäftsprozesse auf Buchflüssen generieren Daten. Viele Daten, einige erfasst, einige nicht erfasst. Aber wo immer die Daten erfasst werden, gibt es mehrere Dinge wie die Anwendungsdaten 100, die Sie in verschiedenen Eintragsanwendungen tun , die Berichte Es gibt Visualisierungen. Es gibt automatisierte Daten aus Da unsere Datenfeeds, gibt es Web-Klicks, die Sie in einem Browser erhalten. Jeder Klick ist auch einer der Datenfüße, dass unsere Point of Sale Transaktion, die aufgezeichnet wurden und es gibt Social Media unsere Datenfeeds. Außerdem handelt es sich dabei um Geschäftsdaten, die über mehrere Quellen generiert werden. Sie wurden in mehreren Systemen gespeichert. Einige sind im kooperierenden Netzwerk. Der Sommer entwickelt sich weiter. Es gibt überall Daten, die Sie verwenden möchten. Die Daten natürlich strukturiert, können natürlich strukturiert, unstrukturiert oder halbstrukturiert sein. Auch dies haben wir schon gesehen, dass Daten unterschiedliche Ursprünge haben. Gibt es eine Art von verschiedenen Celli Und sie könnten viele logische Beziehungen, Beziehungen haben , natürlich, oder den Schlüssel zu jeder Art von Diner Management Verständnis, Daten verstehen, welche Daten Sie haben, ist ein sehr wichtige Sache für einen Datenwissenschaftler. Was willst du? Verstehen Sie die Daten? Sie werden die Quelle der Daten nicht verstehen. Wie reabel sind die Daten, ist es, dass sie an der Maschine erzeugt werden, oder werden sie von den Menschen eingegeben ? Menschen Ist das eine Möglichkeit von jemandem? Mann? Beim Hochladen der Dateneingabe werden Zeichnungsdaten eingefügt und davon weggenommen, weil wir wie gut die Daten, die Sie für Ihre Analyse verwenden werden, das ist, was in die Mine geht, wie gut Ihre Vorhersagen sein werden. Daten müssen also gültig sein, um sicherzustellen, dass diese Daten nicht von jemandem betrieben werden. Aus anderen Gründen müssen Sie verstehen, welche Art von Verarbeitungs- und Transformationsschritten für die Daten ausgeführt werden . Amore hat angeblich einige Daten, die von jemandem während der Passage verworfen wurden weil sie dachten, dass es nicht wichtig ist, da einige doppelte Daten zur Verarbeitung machen . Verlieren Sie einige Daten, weil Sie eine Zusammenfassung durchführen oder nicht? All diese Dinge, die Sie von alten Lolita verstehen müssen, wie die Führer zu anderen Studenten Enterprise-Datenbanken Wolken Neuf diese Feeds, wie die Daten zwischen diesen verschiedenen Quellen von Daten synchronisiert werden . Weißt du, wenn jemand und als Daten an Ort und Stelle eines Tages es vielleicht auch an Ort und Stelle sein könnte, so was? Sie sind wirklich miteinander synchronisiert. Was ist die Beziehung, die innerhalb der Daten vorhanden ist? Ich weiß. Mal sehen, was für Dinge? Wie die Fremdschlüsselbeziehung zwischen den Daten, sollte das i d hier mit dem I d dort und so etwas übereinstimmen. Bestellung von Erstellung, wenn Bestellung, Sie wissen, verwenden Sie wie die erste Bestellung etwas wie, Okay, auf der Agent zuerst geht und geben Sie etwas in System kann. Dann geht er, und Kinder sind nach System. Dann tut er etwas Eindringliches. Steve, hier hilft Ihnen das Verständnis Ihres Geschäftsprozesses zu verstehen, wie die Daten in welcher Reihenfolge erstellt werden. Auch das Verständnis von Daten hilft dem Team, mögliche Quellen aus Ihren prädiktiven Mustern zu identifizieren . Und wo bekommen Sie diese Muster von Rio immer verletzen, wenn Sie einen Teil sehen , ob es gültig ist oder nicht. Daher ist es wichtig für Sie zu verstehen, wie der Tag kommt und wie er geschaffen wurde . Verstehen Sie Ihre Muster selbst. Manchmal können die Muster aufgrund des Gebäudes erstellt werden. Es wurde auch geschaffen. Also Dinge, die an dieser Stelle wirklich komplex sind zu erklären. Aber ein Verständnis der Daten im Allgemeinen ist eine gute Sache für einen Data Scientist 9. Data – Datenerfassung – Data: Die nächste Phase, über die wir sprechen werden, ist die Daten dauerhaft Gesicht, wo Sie Ihre getan immer einrichten und Data Engineering. Es ist die ganze schmutzige Arbeit, die Sie tun müssen, um die Daten von verschiedenen heute in das Formular zu bekommen wir sein wollten. Es tut also überall da draußen. Therapie nicht verwaltet. Du musst die Daten zusammenbringen. Holen Sie sich Ihre Handlung zusammen, holen Sie alle Daten zusammen, schlagen Sie sie zusammen, legen Sie sie alle an einem einzigen logischen netten Ziel, wo Sie dann jede Ihrer weiteren Analyse durchführen können . Die erste Stufe in der Datentechnik ist die Datenerfassung. Also, wo Ihre Aufgabe ist es, Tochter aus verschiedenen Datenquellen zu erwerben, dass sie Unternehmensdatenbasis sein können , wie vielleicht in einer Artikeldatenbank auf meinen Fortsetzungsdatenbanken sitzen, muss es jetzt möglicherweise durch bewölkte Pfeiler getan werden. Es gibt viele Verpflichtungen in der Cloud. Sie geben Ihnen ein P. A ist in der Cloud wie Salesforce, zum Beispiel müssen Sie gehen und Daten über den AP abrufen. Augen lesen. Ich komme vielleicht zu einem Scanner und füttert Sensor-Feeds wie Barcode-Barcode-Scanner. Es kann über soziale Medien kommen, vielleicht haben Sie einen Download. Soziale Medien wie Twitter und Facebook. Alle von ihnen sind Datenquellen. Jeder von ihnen präsentiert eine andere Art von Anwendungsfall in einer anderen Art von Herausforderung für Sie . Manchmal kommen die Daten möglicherweise auch in Echtzeit. Es könnte in der Masse kommen. Es könnte kommen, introvertiert. Eine Daten auch. Also all das schafft verschiedene Probleme für Sie. Eines der wichtigsten Dinge an der Datenerfassung ist Vernunft. Überprüfen Sie die Überprüfung und stellen Sie sicher, dass Sie alle Daten haben, die Sie benötigen. Und es gibt keine Daten, die in der Transportschicht verloren gehen. Eso die Gerberei. Testprüfung ist ein wichtiger Bestandteil der Datenerfassung. Es ist ein sehr umständlicher und zeitaufwendiger Schritt, um einzurichten, warum es umständlich ist. Einmal aufwändig, die Einrichtung nicht zu sagen, dass die erfasste Einrichtung einzurichten ist, weil, wenn Sie all diese Datenquellen haben , was kommt, aber das ist Dinge wie Sicherheit. Es gibt Leute, die diese Datenbanken besitzen. Es sind Sicherheitsrichtlinien involviert. Es sind Freigaberichtlinien involviert. Sie werden also viel Zeit damit verbringen, Verbindungen zu den Missionen herzustellen, die für die Menschen involviert sind , die die Missionen kontrollieren, kann wirklich die Zeit zum ersten Mal frustrierend sein. Weil ich denke, die Datenwissenschaftler, wenn Sie wirklich nah sind, richtig, größer, dass wir den Himmel mögen. Wenn Sie bereits Angeklagte Abteilung an der Tür sind. Esos Es ist auch 90 Abteilung. Möglicherweise haben Sie nicht viele Probleme, aber Sie sind nicht in der Energieabteilung, Sie oder vielleicht ein Konzert und Sie sind in einer anderen Abteilung auf Ihre Daten sitzen dort und Unternehmensdatenbasis. Es sitzt in der Wolke. Dann wird es umso umwerfender Gespräch mit allen Menschen in Wall ihnen erklärt warum welche Daten Sie brauchen, was Sie brauchen, was Sie die Daten brauchen und was Krieg ehemalige Redakteure und bekommen sie zu teilen die Daten auf gehen durch alle organisatorische Mist wird eine Menge Zeit und Mühe beteiligt . Das ist also eine sehr umständliche, frustrierende Dies ist der Tag, an dem sie an Ihrem gearbeitet haben, um die Datenbereinigung durchzuführen. Sobald Sie die Daten erhalten haben, mussten Sie sie reinigen. Warum haben Sie den Reiniger? Weil Daten unterschiedliche Sauberkeit und Vollständigkeit aufweisen. Nicht alle Daten, die Sie erhalten werden, sind saubere und vollständige Strukturdaten von Unternehmensanwendungen wie, wissen Sie, die in der Datenbank sitzen, sind tatsächlich sauber und vollständig, so dass Sie nicht die sehr darüber . Diese bereits sauber, bereits abgeschlossen in der ersteren. Willst du, dass sie das sind? Keine Probleme, aber Daten, die Sie aus dem Internet von Social Media von Voice Transcript bekommen alle von ihnen benötigen möglicherweise erhebliche Bereinigung. Wissen Sie, es hat schmutzig unvollständig auf allen Arten von mehreren Formaten auf Nehmen wir an, wenn Sie sich einen der Twitter-Feeds ansehen , wissen Sie sind keine vollständigen Sätze, dass viele Abkürzungen und Parkins von Dingen Junkin sitzen da, sie sind alle müssen aufgeräumt, untersucht und Daten fehlen. Das ist ein weiterer wichtiger Punkt. Was ist mit fehlenden Daten? Möglicherweise fehlen Ihnen Attribute. Collins sind vielleicht fehlende Werte für bestimmte Attribute. Wie willst du mit ihnen umgehen? Willst du ihnen einen Wert geben? Denn wenn Sie zum Beispiel so etwas wie ein Haupt dort platzieren , versteht Ihr Missions-Lernalgorithmus nicht, dass irgendwelche Insassen unter diesem Wert denken , wenn Sie Null als Wert für eine Zahl setzen. Dein Garten würde es nehmen. Okay, Null ist ein Wert. Wie sagst du es dir? Mission Learning Algorithmus Null bedeutet und nicht verfügbar Ein anderer, wo sagt, dass es einen gewissen Wert hat . Es ist nicht leicht zu tun. Viele Male müssen Sie einen Ersatz setzen und bevor sie dort sterben, und sie haben Einfluss auf Ihre Mission Lernalgorithmen. fehlende Datenverarbeitung ist also eine sehr wichtige Entscheidung, die hier getroffen werden muss. Reinigungsbeispiel sind, als würden Sie Datumsformate genau dort normalisieren. Manchmal realisieren ein imam dd dd mm Öl über mm wirklich alle Arten von ehemaligen wissen. Sie wollen eine normale Leichtigkeit und Standards sie Zehe 14 Monate, bevor Sie mit der Standardisierung auf Dezimalstellen beginnen können . Manchmal kommen die Daten auf 1.23 Manchmal wird es verwendet, um das exponentielle Format für eine Zahl zu verwenden . Und alles, was Strategie sein muss, ist wieder unter dem Klassiker. Eins ist der Nachname. Vorname war der Vorname Nachname. Wie man Namen in den Daten dargestellt. Also wirst du wissen, was Bauern sie sind. Sie alle müssen wie standardisiert sein. Es gibt einen Teil des Reinigungsprozesses auf. Noch wichtiger ist, wenn Sie wie Textfeeds von irgendwo bekommen, müssen Sie eine Menge Säuberung für Text durchführen, der eine ganze Minenräumung selbst ist. Was machen Sie mit der Textbereinigung? Das ist alles, was getan werden muss, bevor Sie die Daten für jede andere Analyse verwenden können. Datentransformationsdaten nach einer Bereinigung müssen möglicherweise Klemmen auf der Zehe sein. Ein anderer Former sind unterschiedliche Formen, bevor Sie es verwenden. Der Grund für die Datentransformation ist also extrahierte Informationen aus Daten, während unnötiges Gepäck verworfen wird. Was bedeutet unnötiges Gepäck ist gegen den Geist von dem Mädchen mit dem, was Sie suchen die Daten. Wenn Sie also keine Daten benötigen, benötigen wir keine Details. Sie können sie zusammenfassen und all das unnötige Gepäck entdecken, das ihre typische unterstützte Verarbeitung und Zusammenfassung von Moores ist. Sie versuchen, Sommer assoziierte logische Aktivitäten. Levels auf Transformationen helfen, den Tag zu reduzieren. Es gibt Anzeichen auf vielen Labyrinth für die Verarbeitung verwendet Idee. Warum wollen Sie Oh, also eine Transformation ist, dass Sie es mit diesen Daten in eine Form wollen, die Sie sich fragen, besser verstehen können , wie Sie eine Zahl aus dem Kurs in einen logischen Datensatz reduzieren können, die die ganze Sache, die von Beispielen passiert, die Sie hier sehen möchten, ist, dass Besucher zu einer Website kommt und er klickt auf eine Zahl von den Seiten in der Website. Du fragst dich vielleicht, dass jemand alle in einer einzigen Platte ist. Aber wenn das alles ist, was wir brauchten, sollten Sie einige Sprachübersetzungen zwischen mehreren Sprachen durchführen. Wenn es einen medizinischen Sensor gibt, dass das kommt, sagen wir, es gibt einen Sensor, der Ihren Blutdruck jede Sekunde erfasst und Sie und Blutdruckmessung sendet . Vielleicht möchten Sie es nach Intervall zusammenfassen. Sie können ein 30-Minuten-Intervall nehmen und dann Zusammenfassungen und sagen in diesem 30-Minuten-Intervall, was ist der maximale Handel? Was ist die Mindestbewertung? Was ist der durchschnittliche Lesen Dinge wie das und fassen Sie es zusammen. Außerdem kann ich jemanden von Ihrem Anwendungsfall abhängen, welche Art von Transformation Sie tun möchten und es zusammenfassen. In diesem Fall kommt Zusammenfassungen Nach der Transformation Daten und Dishman. Verschönerung geht es darum, später einige zusätzliche Attribute hinzuzufügen, die die Qualität der Informationen verbessern . Sie möchten Ihren Daten weitere Informationen hinzufügen, die Ihre Analyse wesentlich verbessern können. Also, welche Art von Informationen, die Sie hinzufügen können? Ah, zum Beispiel, Sie können Informationen, die demographischen Informationen aus einer Kundendatenbank zu einem Point of Sale Transaktionsdatensatz . Also wird die Verkaufsstelle nur Ihren Kundennamen, Ihre Kreditkartennummer und welche Produkte er mitgebracht hat. Jetzt können Sie die Kunden demographische Informationen von 1/3 Partei, dass ich wie einer dieser Kunden Hilfe sein , Sie wissen, Familienstand, Bildung, Bildung, Einkommensniveaus. Und Sie können das an diese Daten anhängen. Sobald Sie hatte ich gesagt, dass zu den Daten, als was er tun kann, ist, können Sie eine Analyse , welche Produkte Menschen kaufen wie Menschen. Nehmen wir an, Milch, Wer kauft Milch andere Menschen, die männlich oder weiblich sind, ist die Menschen, die über 20 fair unter 25. Sie können all diese Art von Analyse durchführen, sobald Sie können. Endlose lästige Daten zu unserer Tradition. Informationen. Dinge wie Sie können keine logischen Gruppierungen von Patienten aus der Vergangenheit Anamnese, wie Sie die frühere Krankengeschichte eines Patienten an seinen aktuellen Besuch anhängen können. Dann können Sie sehen und sehen, Sie wissen, wie Menschen mit der Vergangenheit Krankengeschichte spar. Verschiedene Art von Krankengeschichte, durchführen, sind, sind zu Fuß Dinge, die Sie mit ihnen tun. Daher ist ermutigende Daten ein sehr wichtiger Schritt. Durch das Hinzufügen von mehr Daten aussagekräftigeren Daten erhalten Sie bessere Einblicke in die Daten, die Sie dort haben. Und wenn du mit allen fertig bist, gehst du den Fuß. Behalten Sie Ihre Daten, aber Sie speichern Ihre Daten bei Bedarf. Ein vernünftiger Modeprozess. Die Daten werden in einer zuverlässigen, abrufbaren Datensynchronisation gespeichert. Sie wollen also alle Ihre Tochter verarbeiten und sie in einem schönen wiederbeschrifteten abrufbaren Daten setzen . Synchronisieren Sie alle Leberinformationen, die in einem einzigen Look-Datensatz erfasst werden, so weit wie möglich. Sie haben Daten, die aus mehreren verschiedenen Quellen stammen. Das Beste, was Sie tun können, ist, wenn Sie sie alle Organisten als logischen Datensatz erhalten können, wie einen einzigen langen Datensatz, der alle Informationen enthält, die Sie benötigen. Du solltest nicht viel von Fremdschlüssel-Dingen machen. Sie wollen lieber Zehe de sie normalisieren und sie alle in der gleichen Aufzeichnung und setzen sie alle zusammen. So wird Ihnen die weitere Befragung und Analyse sehr einfach gemacht. Ein Beispiel wäre wie eine kleine Seelen-Transaktion. Sie können die Point-of-Sale-Daten verwenden. Sind der Kunde demographische Informationen, um es auf den Artikelmerkmalen, wie Sie den Artikel haben, der gekauft wird, können Sie sagen, Art des Artikels. Es ist Tagebuch in einem funktionierenden, aktualisiert Hat Sachen wie das und Sie können auch hinzufügen, wie Vertriebsmitarbeiter Performance-Informationen, so dass Sie dann neue Analyse einer Sales Associates Leistung basierend auf dem Produkt, das verkauft wird basierend auf der Kundendemografie und solchen Dingen. So können Sie alle in einer einzigen Platte zusammenfassen und speichern wollen. Das ist der Schritt, der die Datenpersistenz aufgerufen hat und schließlich Skalierung der Abfrageleistung sind ziemlich wichtige Faktoren. Natürlich. Es ist gut im Schlepptau. Die Datenarchitekturdomäne, in der sich die Data Architects befindet. Die Arbeit ist für Architekten. Aufgabe ist es, Ihre Daten zu entwerfen, so zu singen, dass es alle Daten halten kann, die Sie haben und hat eine vernünftige Skalierung. Es hat eine gute Qualität Leistung und all das, um Sie im nächsten Schritt zu helfen, die die analytischen Schritte Daten natürlich ist, können Sie sie als flache Dateien, traditionelle SQL-Datenbanken speichern . Und dann, natürlich, heute haben Sie alle Big Data-Technologien wie Hadoop auf Hard Open seine Datenbanken, wie Hedge-Basis, die Sie Ihre Daten speichern möchten. Das vervollständigt das zweite Gesicht eines Data Science-Projekts. 10. Data – Analyse und Produktion: Hallo. Dies ist Ihr Dozent Cameron hier auf den Data Science Lebenszyklus fortzusetzen. Diese Gedankenphase ist ein Betäubungsmittel, bei dem Sie versuchen, aus den Daten zu lernen und Ihre Vorhersagen zu machen . Der erste Schritt in der Analyse ist, was man als Erforschung von drei Datenanalysen R E d A. In in Schussform bezeichnet. Eine sehr berühmte Kurzform in der Datenwissenschaft. Was wirst du tun, wenn e t. A. ist? Sie möchten einzelne Attributmuster verstehen, die Sie ein Alter als Attribute nehmen . Sie werden Dinge wie die Bereichsminimalwerte, Maximalwerte, die Frequenzverteilung, mich, solche Dinge nicht verstehen Maximalwerte, die Frequenzverteilung, mich, . Das nächste, was Sie wollten, war eine Beziehung zwischen den Attributen zu verstehen, wie das, was die Beziehung zwischen Alter und Sie kaufen Muster Beziehung zwischen Einkommen auf da Geschlecht, Dinge wie das. Wie wirkt sich eine Änderung in der einen auf die andere aus? Mit anderen Worten, Sie drehen sich alles um Beziehungen in diesem Gesicht, das Sie tun wollen. Einige Diagramme versuchen, eine Analyse durchzuführen und mehr darüber zu verstehen, was Sie in den Daten sehen . Dann tust du das. Argumentation ist das Verhalten erklärbar? Was auch immer Beziehungen in Mustern Sie in den Daten sehen, gibt es eine Erklärung dafür, warum es so ist, dass es nicht tut. Wenn Sie keine Erklärung als möglich finden, gibt es eine Möglichkeit. Oft besser. Oder vielleicht ist es ein neues Muster. Das ist etwas, das Sie besprechen und dann herausfinden wollen, dass Sie es sind. Schauen Sie sich unsere Spieler an und dann entscheiden, was Sie mit ihnen gehen wollen, ob sie einschließen oder ausschließen, ähm, sind abhängig von Knochen. Was zum Ausreißer Valley West. Und es ist ein Anwendungsfall von Anwendungsfall Basis. Sie entscheiden, was Sie ohne Spieler tun möchten. Mögliche Fehler in der Verarbeitung können Sie nur finden, aber ausgenutzt und zuhört. Das ist ein sehr guter Nutzen aus dem Prozess. Nehmen wir noch einmal ein Beispiel für die Wartezeiten des Patienten. Wir haben gerade ein paar Sklaven besprochen. In dem Moment, in dem Sie von acht wie 600 sehen, wissen Sie sofort, dass da etwas nicht stimmt . Es liegt ein möglicher Fehler vor. Es war auch das, was Sie nennen Spieler annehmen, es gibt ein paar Patienten, die ein 70 75 Jahre alt sind . Jeder andere ist wie 40 Lektion für 40 Jahre alt, die vielleicht wollen Sie entscheiden und beseitigen diese beiden Platten ohne Spieler. Das ist eine mögliche Verarbeitung unserer Kunden. Willst du auf dich gehen? Natürlich wollen Sie verstehen Beziehung zwischen dem Patienten Warten und auf der Diabetes-Ebene , den Cholesterinspiegel auf der Familiengeschichte und so etwas. Und schließlich, Sie verletzen Ihre Ergebnisse mit den Domain-Experten Wenn sagen, Hey, das ist, was ich in den Daten zu sehen. Hat dieses Gel mit dem, was Sie bereits über etwas Neues wissen, Sie wollen mit ihnen reden und verstehen, wie die Dinge sind. Der nächste Schritt ist die Inferenzanalyse. Was tun Sie in der Inferenzialanalyse ist die Suche nach Signalen. Wissen Sie, Sie suchen nach Mustern, Sie suchen nach Konsistenz in den Rücken und Sie suchen nach Korrelationen. Sie suchen nach Argumentation. Das ist eine Art Überlappung mit einem Vertrag nach unten zu erkunden. Es sei denn, dies ist tiefer und fokussierter und methodischer, als Sie hier in Französisch in der Analyse tun , dann überprüfen Sie und sehen, ob die Muster konsistent und reproduzierbar sind. Was Sie mit konsequent meinen, ist, dass Sie den gleichen Teil Monat für Monat sehen? Sie sehen, dass das eine ist, wenn die Rate steigt, sehen Sie, dass der Cholesterinspiegel steigt, passiert es für Ihre Patienten? Jeden Monat bekommen Sie jeden Monat eine neue Patientengruppe und Sie sehen immer das gleiche Muster. Siehst du das gleiche Muster? Sehen wir uns Städte in verschiedenen Ländern über verschiedene Rassen an, all das als Teil der Inferenzialanalyse. Und dann machen Sie einige statistische Tests, um zu sehen, dass die Ergebnisse, die Sie mit den Daten sehen , sagten, dass Sie haben. Kann das auf die indische Bevölkerung extrapoliert werden, wie Sie Daten aus San Francisco haben können das gleiche, und das ist mit Ergebnissen, die gleiche sein, wenn Sie es extrapolieren, so dass sie und ihre uns aus der ganzen Welt sind sie Wird anders sein? Es sind alles, was Sie tun, als Teil der verstoßenden Analyse wieder. Und nehmen wir ein Beispiel für Patienten. Warte, war der Diabetes. Sie machen das alles in Französisch In Analyse, als könnten Sie schnelle Daten aus einem Staat nehmen, dass Kalifornien die Analyse durchführt und dann sehen, wie Kalifornien mit New York vergleicht wenn man R Calif sieht. Sind die dann schauen Sie Rassen. Schauen Sie sich asiatische Amerikaner zu asiatischen Amerikanern in Kalifornien zeigte die gleiche Muster Lage Amerikaner in der New York. Unsere Spende American zeigte das gleiche Muster wie Afroamerikaner. Schlimmer sind andere Menschen. Also machen Sie all diese Art von Segmentierung und dann machen Sie all diese Profiling während der inferentiellen Analyse auf, kommen Sie davon und schätzen alle Ihre Ergebnisse während dieses Prozesses ? Sobald Sie wissen,, Inferenzialanalyse die nächsten Stufen Modellierung. Dies ist, wo alle Ihre Mission lernen alle Wächter ins Spiel kommt, sind Sie spielen früh Immersion lernen alle Gärten, Modelle zu bauen, was Sie im Modellbau tun, ist Ihr typischerweise versucht, mehrere Modelle mit verschiedenen Algorithmen auf verschiedene Datensätze. Dies sind alle Techniken, die es gibt und Missionslernen. Es gibt einige Techniken, wie Sie Ihre Datensätze und die mehrere Substanz segmentieren und sie dann verwenden können, um Modelle zu erstellen und Modelle zu testen. Dann, wie verschiedene Algorithmen verwendet werden können, ist die ganze Domäne außerhalb der Mission Learning dreht sich alles um. Wenn Sie einen Kurs in Mission Learning nehmen, war es nur eine Linie, die Bohnen explodieren durch den gesamten Kurs. Du natürlich testen, musst natürlich testen,dass deine Modelle wieder verrückt waren. Ihre Methoden dafür, wie Sie das in maschinellem Lernen tun Schließlich bin ich. Wenn ich Ihre beste Leistung Modelle, wenn wir sagen, beste Leistung, wir sprechen über Genauigkeit. Wir sprechen über die Reaktionszeit und die eingesetzten Ressourcen, so dass Sie wieder einige Kompromisse machen müssen. Doch was Ihr leistungsfähiges Modell betrifft, sagen wir ein Modell gegen Sie. 80% Genauigkeit auf es dauert eine Minute laufen. Das ist ein weiteres Modell, das Ihnen 85% Genauigkeit gibt, aber es dauert eine Stunde Torrent. Welches ist dir wichtiger? Sind die mehr aufgehängt für die 85 oder 80? Seltsam. Ist es in Ordnung, dass Sie eine 80% ige Genauigkeit haben, aber eine angemessene Reaktionszeit haben? Also haben wir davon gehört. Sehen Sie sich all diese drei Dinge an, wie die Genauigkeit, die Reaktionszeit und die verwendeten Ressourcen. Die erforderliche Rechenleistung. Ein Gebäude Modelle Andi. Dann zu sagen, was Ihr bestes Modell sein wird, so dass Sie am Ende bauen, so einfach wie ein Entscheidungsbaum oder eine Gleichung sein könnte . Es können Komplexe gefragt werden. Das neuronale Netz für hängt vom Problem und den betreffenden Daten ab. Also, aber am Ende des Prozesses haben Sie ein Modell, das Sie basierend auf den verschiedenen Algorithmen und den verschiedenen Versuchen,die Sie kennen , affray, 1.000.000-Modelle auswählen die Sie kennen , affray, . Dann gehen Sie und machen Sie alle Ihre Produktionen mit neuen Daten wieder, die ungünstig haben Sie die Vorhersage testen können, testen Sie Ihre Modelle wieder, ein Teil der Mission Lernkurse, die Sie sehen werden. Sie müssen Ihre Modellgenauigkeit weiterhin validieren. Also nehmen Sie einfach an, ein Modell zu bauen, das einmal getestet wurde und weg von ihm. Aber du wirst es versuchen. Befriend-Modelle sind manchmal sogar eine Kombination aus verschiedenen Modellen und dann sehen, welche Ihnen die bestmögliche Genauigkeit gibt. Sie werden versuchen, dass meine Leute Reifen und Variationen in diesem Prozess der Verhandlung sind . Maris wieder die beste Zeit, wenn Sie Ihre verwenden können Es gibt eine Menge davon ist, warum ich es das Forschungsprojekt nennen . Zu Beginn werden Sie eine Menge Forschungsjahr Tray von verschiedenen Dingen zu tun und sehen, welche am besten für Ihr spezifisches Projekt funktioniert , eine Reaktionszeit, Ressourcenforschung, alle mechanisch, vor allem, wenn Sie Vorhersagen in Echtzeit wie eine Web-Suche machen müssen. Sharper hat gerade in Ihre Website gekommen und ist Surfen durch Ihre Website machen Klicks, und Sie wollen eine Vorhersage in Echtzeit. Aber die Käufer, die kaufen, sind es nicht. Diese Entscheidungen wurden wie in Echtzeit getroffen, wissen Sie, innerhalb einer Sekunde mit möglichst minimalen Ergebnissen. Also sind Sie ein Pick Ihre Algorithmen. Auf dieser Grundlage möchten Sie weiterhin Verbesserungen messen. So, wie Sie arbeiten oder verschiedene Kombinationen aus der Produktion von Wächtern der traditionellen Regierungen haben zwei Teile. eine ist das Modellbauteil und das zweite ist das Vorhersageteil. Also müssen Sie sich beide ansehen und sehen, ob es bei beiden besser ist. Manchmal dauert einige Produktion von gottverdammten mehr und das Build-Modell, aber sie können sehr schnell sein, die Produktionsteile von verschiedenen Dingen dort zu machen. Also wieder, Sie müssen alle Ihre Algorithmen messen, wie sie funktionieren, und dann vergleichen sie sie weiter und sehen dann, welcher der beste ist, den Sie wählen möchten . Vielleicht haben Sie sogar Simulationen. Assimilation kann so einfach sein wie mathematische Simulationen, oder Sie können Software erstellen, die bestimmte Anwendungsfälle ähneln kann. Assimilation wird verwendet, um zu überprüfen, ob Wasser unterdrücken Ihren Garten sagte, dass in dieser gegebenen Situation dies das Ergebnis sein könnte. So Einheit ist dort ähnlich, dass, ähnlich, diese Umgebung. Es kann ähnlich wie die NDP ihre Umgebung macht und dann sehen, ob das Ergebnis, das Sie vorhersagen, das ist, was Sie bekommen werden. Simulationen sind also komplexe Software. Manchmal bauen Leute sie nicht, um die Vorhersagen zu validieren. Sobald Sie alle diese Modell auf der Produktion aufbauen, der letzte Schritt, den Sie in diesem Fall tun, hat sich mit einem Satz Empfehlungen kommen. Was machst du hier? Ist das am Ende dieses Projekts, eine Empfehlung muss den Projekteigentümern zur Verfügung gestellt werden Okay, auf was Sie getan haben, was sind die Algorithmen zu verwenden und wo sind die erwarteten Vorteile? Also alle von ihnen, wenn Sie zusammen in einer schönen Präsentation und präsentieren ihre Zehe die Produkt-Besitzer und hier kommt, um ein anderes Wissenschaftsprojekt zu fangen gemacht haben keine Empfehlungen, um es die Daten zu machen , die keine erklärbare Muster. Wir haben darüber gesprochen, dass alles darum geht, aus Beziehungen zu lernen. Wenn die Daten, die Sie haben kein Muster aufweisen, beliebiges Muster zwischen dem Ergebnis auf einer anderen Variablen. Wenn das Ergebnis aus den Daten, die Sie haben, nicht vorhersehbar ist, gibt es nichts, was Sie Desai vorhersagen können. So einfach. Das bedeutet nicht, dass die Daten seit Projekt ein Fehler ist. Sie können ein Produkt mit Schüttelfrost haben. Schauen wir uns unsere Kundendatenbank an und sehen, ob wir die Kundenabwanderung am Ende des Projekts vorhersagen können . Wir, damit Sie kommen und sagen können: Basierend auf den Daten, die wir haben, können wir Kunden Chung nicht vorhersagen, dass es nicht bedeutet, dass das Essence-Projekt ein Fehler ist . Das neurowissenschaftliche Projekt funktioniert nur, wenn die Daten belastet sind, so dass es nicht standardmäßig aus den Daten. Wissenschaftler, wenn Ihre Daten nicht schuld, sind irgendwelche Muster, natürlich, ist der Vater der Daten Scientist ist die Daten hat Muster und der Data Scientist nicht, sie zu finden. Aber die Daten haben keine Muster. Es ist nicht die Schuld der Datenwissenschaftler, also ist dies eine weitere wichtige Sache zu beachten. Manchmal werden unerwartete Muster entdeckt, die zu anderen Vorteilen führen, so dass Sie vielleicht den Dodi mit besonders Ziel im Auge betrachten. Als ob Sie sich die Kreditkundenabwanderung ansehen. Aber das sehen Sie vielleicht. Okay, ich sehe ein paar nette Muster. Diese Muster könnten verwendet werden, um etwas anderes vorherzusagen. So wie Sie diese Daten zum Beispiel verwenden, um Störungen vorherzusagen . So könnte ein Data Science-Projekt diese Seite schießen einen Nebenvorteil. Du könntest also sagen, OK, ich sehe dieses schöne Muster hier. Vielleicht müssen wir tiefer eingraben. Dann gehen Sie einen weiteren Tag erstellen, Dutzende Projekt dafür, und dann weiter unten, dass Teile von der Tür. Ein wissenschaftliches Projekt würde auch mit diesen Vorteilen kommen. In der Tat können viele von ihnen während des Prozesses auftreten, sobald Sie anfangen, die Daten zu betrachten. Und natürlich natürlich machen Sie endlich eine Präsentation zu den Empfehlungen. Sagte den Stakeholdern, die letzte der Dinge, die Sie wollen, nicht. Hier sind die Iterationen, die erforderlich sind, obwohl die Schritte weniger sind, als sie hier in der Reihenfolge durchgeführt werden sollen. Sie gehen immer hin und her zwischen diesen Schritten auf, die vielleicht platzen auf Zwischen- oder am Ende, Analyse und Feedback Also, nachdem Sie alle Ihre Analyse zu tun, haben Sie mit dem Domain-Experten geschrien. Sie haben mit den anderen Projektbeteiligten geschrien. Sie kommen möglicherweise mit etwas Feedback zurück, das Sie zwingen kann, wieder weiterzumachen, und wiederholen Sie dann die Analyse auf neues Licht, das auf die Daten, die Sie haben, geteilt wurde. So können die Menschen unterschiedliche Ziele haben, verschiedene Prospektoren, die Ihnen neue Auslöser geben könnten, um zurück zu gehen und die Daten zu betrachten, die ein Kommentar ist. Indien unterzeichnet das Produkt darin, dass ihre Antwort auf die Ergebnisse in den Daten auf dann kann es ihn in mehreren Analyseteilen nehmen. Wenn Sie haben, dann kommt das letzte Gesicht, das die Produktion Gesicht oder die Produktion Vereisung Gesicht ist. Wir implementieren nur kontinuierliche Prozesse, die Sie zwei Anwälte sind die ganze Arbeit, die Sie in den früheren Gesichtern getan haben . Ondo beginnen, etwas auf einer kontinuierlichen Basis Jahr zu tun. Also, hier kommt, was man Building date up Produkte nennt. Also, was ist das Datum? Ein Produkt und das Produkt ist eine Anwendung, die mit Daten arbeitet, etwas aus Daten heraushält und es verwendet, um ein bestimmtes Ziel zu erreichen. Es ist einfach, wie diese Bestellung Später Produkt. Also einmal eine Datenmodellierung und Vorhersage. Kranke bewachte sich selbst, gestrafft. Weißt du, was genau du tun musst, dann bekommst du besser ein Produkt. Also, was ist das bessere Produkt ist im Grunde Produktion izing, wissen Sie, das Gericht die Quartiere nicht mehr und kein Drehen von als 80. Du kannst nichts. Du machst 1/4. Diese Produktionsqualität wird alle Fehlerprüfung an Ort und Stelle mit all der Verwaltung und Überwachung an Ort und Stelle, die tun kann, dass alle Schritte, über die wir gesprochen haben, tun. Alle Schritte zum Einspritzen von Daten. Sie geben uns also automatisieren das Abrufen von Datenfeeds aus all Ihren Datenquellen und dann müssen Sie diese Anwendungen automatisieren, um regelmäßig zu laufen. Schauen Sie sich die Daten an, die eingehen, und es beginnt die Reinigung der Daten, Transformieren der Daten, Persistenz der Daten. Dann wird Ihr ganzer Analysecode eintreten. Andre wird sich die Daten regelmäßig ansehen und mit dem Bau von Modellen beginnen. Also alle von ihnen sind Tochterprodukte in einem Wort, sie müssen regelmäßig laufen und ständig produzieren, ständig Daten erhalten und diese Modelle produzieren. Und, natürlich, der Produktionsteil Nach Marken Echtzeit, wissen Sie, bash für welche Art und Weise es laufen muss. Und das ist wieder ein weiteres Datenprodukt, das Eltern regelmäßig verwenden. Je mehr Modell das Modell, das gebaut wurde, um Vorhersagen zu machen, wann und wo es erforderlich ist . So bauen dort Luftschutz, der letzte Teil, der mehr so ist, ist sehr es ist eher wie Software, die dieses Motorsoftware-Projekt stammt . Eigentlich, wenn Sie sagen wollen, weil Sie genau wissen, dass die Abteilung, die sie bereits in ein Softwareprodukt umwandelt, würden Sie nur brauchen, um Qualität Software-Strenge sowohl in der Entwicklung als auch im Testen darauf kann die Bereitstellung von Enterprise-und Cloud-Modellen sein, hängt davon ab, dass später das Produkt tun soll. Natürlich ist das Wichtigste hier auch, dass Sie operationalisierte Datenfeeds erhalten müssen. Die Daten-Feeds aus allen Radarquellen. Nein, sie müssen fortgeführt werden. Wenn ich fortlaufend sage, ist es augenblicklich. Du kriegst sie immer so, wie sie passieren. Manchmal bekommst du das täglich. Tu das, Adams. Manchmal wissen Sie, einmal ein V 15 Minuten und Reisen 30 Minuten Druckbare Verteidigung hängt von Ihrem Anwendungsfall, aber es muss operationalisiert werden, so dass dort, dass immer wieder kommen regelmäßig. Sie haben nicht jeden Tag mit jemandem zu arbeiten, um die Daten zu bekommen. Hier ist alles automatisiert. Und natürlich haben wir geredet. Wie wir Arzt grenzt, es s Produkte führen alle die Reinigung Transformation unter Berichterstattung jede Berichterstattung ist eine wichtige Sache, die Sie hier tun wollen und schließlich ziehen alle Daten notwendig sein könnte . Weißt du, wenn du Gator begangen hast, wird das eine Menge Daten sein, besonders wenn du das Recht in das Formular umwandelst, das alle Rohdaten benötigt. Weißt du, du willst sie vielleicht 10 Tage, 15 Tage lang behalten und sie dann rauswerfen. Damit sind alle Schritte abgeschlossen, die Sie in einem typischen Data Science-Projekt zu tun haben. Aber es gibt immer etwas namens, ah kontinuierliche Verbesserung. Sobald Sie ein Datenprodukt bereitgestellt haben, sind dies immer Änderungen in der Unternehmensumgebung, die sich auf Ihr gesamtes Lernen in der Produktion auswirken können . Das ist also etwas zum Träumen. Denken Sie daran, alles, was Sie als Datenprodukt erstellt haben. Keine Algorithmen, die Algorithmen zu Modellen, die sie gemacht haben, dass ihre Genauigkeit sinken könnte, weil Änderungen in Geschäftsumgebung und auch die Lern- und Produktionsmaterial muss der Wert sein, periodisch in ungefähren Intervallen um sicherzustellen, dass sie weiterhin ihre Karriere-Ebenen zeigen, die sie ursprünglich über Minto haben auf Revalidierung müssen passieren, wenn ihr Geschäftsprozess-Gen , Sie wissen, dass es eine Änderung etwas im Geschäftsprojekt-Prozess, wo die Entitäten verhalten sich verändert die Welt, die Umwelt. Und Richard wird uns ändern. Also offensichtlich haben Sie ein sehr, sehr getan alles, was Sie hier tun. Das muss also unter dem Kinderprojekt sein, das Maker in seinem Projekt gemacht hat, sind ein Verbesserungsprojekt, das regelmäßig auftauchen muss, um zu validieren. Was du getan hast, ist alles in Ordnung. Ein besseres Modell der Force-Agenda sollte im Gange sein. Nein, das ist wichtig. Wir können einfach nicht wollen und aufhören, wir tun, um kontinuierlich zu sein. In jemandem für das, was wir bisher gesehen haben, folgen Data Science-Projekte einem Lebenszyklus. Data Science Projekte sind Forschung ihre Projekte. Es gibt eine Menge Experimente und manchmal nicht verstehen. Das ist also etwas. Deshalb nennen wir es immer wieder. Es ist ein Forschungsprojekt Signal in den Ergebnissen ihres Vaters, nicht die Wache kommt. Duda ist wichtiger als die Algorithmen selbst. Mehrere Iterationen können erforderlich sein, bevor vernünftige Ergebnisse erzielt werden. Das ist eine andere Sache, an die Sie sich erinnern möchten. Es gibt also keine sehr ernste Phase in einem Data Science-Projekt, wo denkt, dass getan werden oder getan werden sollte. So helfen. Das war hilfreich für Sie. Vielen Dank für Ihr Zuhören, aber 11. Erforderliche Fähigkeiten für Datenwissenschaft, Teil 1: Hallo. Das ist dein Lehrer, Cameron hier. Willkommen zur Session über Beta-Sign-Fähigkeiten und -Rollen. Es geht also um Halter. Was und welche Fähigkeiten sind für sie erforderlich. Lassen Sie uns also über die Fähigkeiten sprechen, die erforderlich sind, um ein Data Scientist zu sein. Und Sie hätten viele Diagramme wie diese darüber sehen sollen, welche Art von Fähigkeiten für Data Science im Internet erforderlich sind . Es geht also darum, was der Testament sagt. Sie sprechen über Hacker-Fähigkeiten, Mathematik und Statistik und Wissen, Mission Learning, inhaltliche Expertise, wissenschaftliche Methodik. Ah, Hacker-Denkweise, Domain-Expertise, Spezialisierung, Spezialisierung, fortschrittliches Computing. Also hörst du all diese Begriffe überall, und du fragst dich vielleicht, auf welchen anderen echten Schulen ich aufbauen muss, weg von wo du herkommst. Die meisten von euch werden aus einem 90-Hintergrund kommen. Also, was ist das? Musst du lernen? Also lassen Sie uns durch Gewässer gehen erforderlich. Hier sind sie Heilige Praktizierende im Allgemeinen brauchen eine breitere, wo 80 off Fähigkeiten als jeder Profi. Also, das ist etwas, das Sie verstehen wollen und akzeptieren Sie die Tatsache, dass, wenn Sie eine Idee Profi haben , können Sie in einem verwandten Lee engen Feld innerhalb der rechten engen Fähigkeiten Satz arbeiten, und Sie sollten ziemlich in Ordnung mit. Aber wenn Sie ein Data Science Praktiker sein wollen, müssen Sie eine breitere, wo 80 der Schädel sind Computerkenntnisse, die Sie benötigen A in der Regel fällt in zwei Hauptbereiche. Sie müssen Luft-Programmiersprache kennen. Außerdem sind es Arbeitsbänke und Werkzeuge, die damit verbunden sind, und Sie müssen eine Datenbanktechnologie kennen, die sogar mehrere Dinge kennt. Ja, das war mehr als gut, aber nein. Für den Anfang, Sie wollen mindestens eine Programmiersprache beherrschen, und eines Tages dieser Technologie, werden wir sehen, was sie in der kommenden und kommen Matt. Statistiken über maschinelles Lernen Konzepte sind auf einer grundlegenden Ebene erforderlich, so dass Sie alle sie zu einer anderen Schule lernen müssen, die Sie benötigen könnten Unsere Visualisierungen Fähigkeiten, Soft Skills und Management-Schulen sind also lassen Sie uns beginnen, durch jeder von ihnen. Beginnen wir jetzt mit der umstrittensten Fähigkeit, die ich nennen würde, dass Mathematik und Statistik umstritten ist , vielleicht ein zu viel Wort zu verwenden. Aber der Grund, warum ich es benutze, ist jedes Mal, wenn Leute sich den Datensatz der Schule für Data Science ansehen, und sie sehen Mathematik und Statistiken. Es schiebt sie irgendwie ab, die Ah gemacht haben, viele Leute, die Ingenieurwesen machen, sie könnten einen Kurs haben und Stöcke auf DNA angefangen haben. Nicht viele Leute mögen diesen Kurs, aus welchem Grund auch immer, dass Leute, die das wirklich geliebt haben und es gibt Leute, die es nicht mögen. Und so in dem Moment, in dem sie etwas wie Statistik und Mathematik als Voraussetzung für Datenheiligen auftauchen , beginnen sie sich zu fragen, ich bin ein I t Profi. Warum sollte ich wissen, Statistiken und verrückt? Ich habe mich noch nie mit diesen Themen vertraut gemacht. Ich sage nicht, dass wir alle alle sind. Vielleicht sind mindestens die Hälfte von uns nicht wohl. Vielleicht ist das die Natur des Themas und die Natur der Menschen. Was auch immer der Grund sind die Fragesteller. Muss ich es lernen? Weißt du, wie sehr genervt ist, Daten zu werden? Wissenschaftler lassen uns zuerst die Frage ähnlich wie bei jedem anderen technischen Verständnis eines verrückten Konzepts als wesentlich für Datenheilige ansprechen. Eine Mathematik ist auch das Fundament des Ingenieurwesens auf vielen anderen Fächern. Also ist es gut, eine Matte zu kennen. Ah, Konzept, das Sie für ihre Zeichen verstehen müssen, sind Dinge wie zentrale Tendenz wie Mittelmittelmodus, Varianz, Standardabweichung. Ah, wahrscheinlich eine Regression auf einige inferentielle Statistiken. Ah, so ziemlich, wenn Sie jede Art von Buch über Statistiken nehmen, sind grundlegende Service Sticks. Es sollte all diese abdecken. Das Problem ist, dass jedes dieser Bücher zeigt Ihnen Formel nach Ackerland Reform Land. Das ist, wenn man verwirrt wird und man dort frustriert. Natürlich, einige Bücher, die sich nur auf Theorie und Northern konzentrieren all die Formel, die Sie vielleicht nach ihnen gehen wollen . Du hast es in dem Fall getan. Kompetenzen auf Expertenniveau werden nur für Spezialisten benötigt. Wenn Sie ein Statistiker war ein Teil des Teams, dann müssen Sie diese Exportstufe Schulen auf andere Weise. Wissen Sie, Grundschulen sind in Ordnung. Der Grund dafür ist, dass viele dieser benötigten Techniken bereits als Bibliotheken in verschiedenen Programmiersprachen implementiert sind . Sie werden also nicht viel Offcoat lesen, umsetzen eines davon. Sie werden keinen Code schreiben, um Rechen-, Mittel- und Standardabweichung abzuschließen . Das sind bereits Tools, die ihre Bibliotheken geliefert haben, die es tun. Sie müssen nur das Konzept verstehen und in der Lage sein, diese Bibliotheken aufzurufen, um die Arbeit zu erledigen. Die Empfehlung hier hat die Grundlagen gelernt. Es ist immer hilfreich. Es ist gut, einen Status zu haben. Sechs. Hintergrund Wenn Sie sich im Bereich Data Science befinden, sind unsere Missions-Lernkonzepte der Schlüsselbereich für die raider-Wissenschaft. Eine Sache, die Sie erkennen wollen, und das ist etwas, über das viele Leute verwirrt sind. Praktiker von Datenzeichen implementieren die Algorithmen nicht. Wenn ich sage implementieren, werden sie nicht sitzen und Code schreiben, um die tatsächlichen Algorithmen zu implementieren. Sie benutzen sie nur. Es ist sehr ähnlich zu sagen, wissen Sie, Betriebssysteme. Nicht jeder in der I d Feel wird sitzen und schreiben Betriebssystem genannt Sie sind nicht. Sind sie nicht. Jeder wird schreiben, entwickeln ihr eigenes Betriebssystem. Es gibt wenige Betriebssysteme, die Sie haben es einige Leute, die sie genannt haben, Aber die meisten von uns werden nur sitzen und verwenden Sie das Betriebssystem in der gleichen Informationen lernen Ihre Eröffnungsreise gehen und sitzen und implementieren Emission Learning Court. Sie sitzen meistens und werden sie benutzen. Das ist also eine Unterscheidung, die du verstehen willst. Wenn Sie sehr daran interessiert sind, maschinelles Lernen Art von Gericht zu schreiben, können Sie sich darauf konzentrieren, ein akademisches Feld oder so etwas zu sein. Der Wrack typische Praktiker wird nicht tun, dass mehrere Algorithmen. Exurban Mission. Lernen. Es gibt also verschiedene Arten von Algorithmen, die auf unseren verschiedenen Domänen basieren, wie ihre auf Matt basierenden Algorithmen wahrscheinlich in Statistiken und neuronalen Netzwerken sein. Informationen Terry. Viele von ihnen. A. Keiner von ihnen ist, ah, am besten für alle Fälle. Deshalb haben mehrere Gartenzäune, jeweils unterschiedlich ausgeführt werden. Sie bieten die beste Leistung in verschiedenen Anwendungsfällen, so dass Sie nicht alle von ihnen auf Sie werden immer noch erfunden. Es gibt die grundlegenden Algorithmen, und jeder versucht, einen Hybrid zu finden, besonders in der akademischen Welt. Es gibt viele von ihnen sind Erfinder und implementieren Verständnis dafür, was diese Mission Lernalgorithmen ziemlich obligatorisch ist. Mindestens die grundlegenden neun oder 10 Algorithmen, die Sie haben, ist ein Militär bei der Implementierung, die verschiedene Programmiersprachen der Bibliothek zur Verfügung stellt. Also alle von ihnen, meistens sind alle diese Algorithmen verfügbar s Bibliotheken, in der Tat, wenn Sie so etwas wie Gibt es mehrere Bibliotheken mehrere Implementierungen voneinander? Mission Lernkonzepte verfügbar, so dass es keinen Dreck für die Implementierung ist nur Sie müssen wissen, wie diese Artikel Buch bekam. Lage sein, die Bibliotheken zu nennen und sie Unterschiede zwischen einem Mädchen zu verwenden. Und das ist eine wichtige Sache, die Sie lernen müssen. Über Mission. Lernen ist das, was diese Algorithmen sind. Wie unterscheiden sie sich voneinander? Was sind die Vorteile und Mängel und welche Anwendungsfälle tun ihre Arbeit und sie funktionieren nicht ? Wie sind die Genauigkeitsstufen, wie ihre Leistungsniveaus sind? Diese anderen, die Sie nicht verstehen, weil das hilft Ihnen, die beste alle Wache Unmöglich wählen . Wann immer Sie ein Data Science Projekt auf die Empfehlung ist obligatorisch. Sie müssen lernen, sie zu benutzen. Es gibt keine Möglichkeit, dass Sie davon weggehen, es sei denn, Sie wollen sich nur auf den Datentechnik-Teil konzentrieren , der unsere Datenschilder auf die andere Technologie übergehen. Beginnen wir mit der Datenbanktechnologie. SQL. Wenn wir sagen, es ist cool, geht es nur um das Schreiben. SQL Statesman in Ordnung, Anfragen Extrahieren von Daten einfügen Daten und die verschiedenen Werkzeuge und Arbeitsbänke, die verfügbar sind, um zu verwenden. S Kuba auf Daten manipulieren. Es ist die stabilste, beliebteste und am weitesten verbreitete. Ermordet. Vier. Data ST Also, ja, SQL ist eine sehr beliebte Schulen für Datenzeichen. Kenntnisse zum Lesen von SQL sind obligatorisch. Ich würde sagen, Sie können Datenwissenschaftler sein, ohne vollständige SQL-Anweisungen zu kennen. Sie wissen, es ist eine der sehr obligatorischen Fähigkeiten, die Sie benötigen, kommt in der Regel mit einem Datenbankprodukt wie Artikel, meine Fortsetzung und Microsoft SQL. Sie wissen, es gibt immer und zugehörige Datenbank-Produkt und mit den Daten wird rezitieren, auch wenn das Ende eher produzieren gehen zu wohnen und so etwas wie ein hartes up-System, die Sozio, die vielleicht noch sitzen in einer Fähigkeit Basis, unsere Werkzeuge und gebrochen nur Alben in diesem Jahr. Dies ist eine sehr ausgereifte Technologie, Also offensichtlich gibt es eine Reihe von Werkzeugen, und wir sind sicher, dass Werkzeuge und Arbeitsbänke zur Verfügung, die Ihr Leben viel einfacher macht. Wenn es um Analytik und Mutualisierung geht. den Unzulänglichkeiten gehören der Umfang der wird für sehr groß sein, mit Vermögenswerten auf den Umgang mit unstrukturierten Daten. Die beiden Hauptgründe, warum 100 ins Bild kam. Das sind die beiden Gründe, warum die Menschen gegangen sind und harte Technologie entwickelt haben. Und das ist, weil ich weiß, dass Sq diese Mängel hatte. Die Empfehlung ist, dass Sie brauchen, wenn Sie mit den USA arbeitenwollen arbeiten So gibt es keine Möglichkeit, darüber am nächsten Tag zu wiegen. Die beste Technologie, um die Sie sich kümmern möchten, ist das Huddle Ökosystem. Nun, sq, Lernen von SQL ist vielleicht einfach gemacht werden. Sie wissen vielleicht schon, dass dies getötet wurde, aber wie funktioniert eine ziemlich neue Technologie, die es seit ein paar Jahren gibt? Es ist die beliebteste Technologie, wenn es um Problemdomänen geht. Wo es große Datengeschlecht gibt, gibt es größere Wüsten, und das sind gibt, gibt es größere Wüsten, unstrukturierte Daten. Das ist der Hauptgrund, warum die gesamte Hedge-t von US fünf System auf der Karte produzierte Technologie ins Bild kam. Die Werkzeuge, die hier in Ihrem Suchbereich erste Karte gelernt werden, produzieren hohe H Basis Impala. Es gibt ein paar von ihnen, dann werden sie immer noch erfunden. Meine Hoffnung ist die Mission Learning Library, die mit gekauert kommt, und sie hat einen begrenzten Skate-Off-Satz von sehr skalierbaren Algorithmus, so dass es sehr funktional ist. Aber die Benutzerfreundlichkeit ist nicht so gut Mit meiner Haube ist es Open-Source-Technologie, und es macht es sehr einfach, es Open-Source-Technologie anzupassen, und Sie können leicht heruntergeladen und solide und verwenden Sie es, wenn Sie wirklich nächstes System sind. Dies ist ein anderes Hauptproblem. Dies ist das Hauptproblem mit Hard Up ist, dass es nicht einfach die Verwendung Wenn ich sagte, nicht einfach verwandte Lee, wenn im Vergleich zu anderen Dingen wie SQL, nicht eine Stadt verwenden braucht es erhebliche Programmierung leisten für jede Art von Arbeit und Sie Blick auf hart und es ist Werkzeuge. Es gibt nur die Gerichtsvorschriften, die dort verfügbar sind. Die Benutzeroberflächen sind nicht so toll. Die Ausgänge sind nicht so groß. Sie müssen viel lesen nach jeder Art von Arbeit mit der Hoffnung Ökosystem zu tun, die Werkzeuge und Fuck, aber nur entwickeln sich. Leute kommen gerade über die Werkzeuge und Arbeit Sex und immer noch entdecken Technologie dort und sind immer noch in Arbeit an der Qualifikationsentwicklung, Rick, mehr erhebliche Zeitaufwand und Ressourcen Investitionslimit, die Sie nicht haben können nur einen Laptop auf Sie. Sie wollen sitzen und lernen all Ihre harte up Technologie hart bis trans nur auf der nächsten. Wenn Sie eine grundlegende Lennox-basierte Hot Up installieren möchten, was sie die eine Box einrichten, die Sie haben. Bradley's haben, wie eine Datenbank von Speicher auf Ihrer Box, damit es jede Art von vernünftiger Reaktionszeit Körper mit einfachen Dingen hat . So gibt es einige Ergebnisse Investitionszeit, und wir verbringen ein Vermögen. Die meisten gemeinten Requite hier. Wenn Sie über das ketzerische System auf der Empfehlung erfahren möchten, ist prüfen, ob Sie sich wohl fühlen, bevor dies geschieht, diese Technologie. Also überprüfe, bevor du sagen willst, ich wollte tief in diese Technologie eintauchen und mehr darüber erfahren . Es beinhaltet erhebliche Zeit, Mühe und Ergebnisse Investitionen für Sie, um diese Technologie zu lernen, also denken Sie daran, was 12. Erforderliche Fähigkeiten für Datenwissenschaft, Teil 2: Programmiersprachen. Die erste Programmiersprache, die wir über uns sprechen wollen, ist es die beliebteste Sprache für sie zuweist eng gefolgt von Python Am meisten ist dies die beliebteste Sprache für die gehörlose Wissenschaft es begann. Es begann als Programmiersprache für Statistiker, vor allem für statistische Arbeiten. Sind gibt es seit etwa seit einiger Zeit, wie mehr als 10 Jahren. Aber ab spät, es hat sich von nur eine Programmiersprache für Statistiker entwickelt. Unterstützen viele Bibliotheken und Tools. Das ist über alle Phasen des Datenverständnisses, wenn sie sagen, auch nur von Daten, die von späterer Akquisition Zehe Abendessen Transformation Toe Analyse versucht , Realisierung zu wünschen, dass es all das tun kann. Es gibt viele gute Bibliotheken zur Verfügung, macht es sehr einfach zu bedienen, die sehr minimal ist. Nach beteiligt in unserer. Es hat auch eine Workbench, wo man einfach es mag wie CN-Programm Art der Sache. Sie schreiben einfach eine Codezeile sofort, führen Sie sie aus und sehen die Ergebnisse auf der anderen Seite. Sie können Ihren Mantel Schritt für Schritt verdoppeln. Es ist erstaunlich. Es ist eine wirklich gute. Guter Raum, um Data Science zu machen. Art von Arbeit wirklich gut mit Daten. , Das einzige Problem,das Sie haben, wird später dazu kommen. Es ist offen. Quelle sind Schlangen sind die Werkzeuge, Ideen und Bibliotheken sind auch offen. Quelle. Es gibt eine sehr gute Unterstützung Öko-System im Web, zunächst gehen alle Arten von Hilfe im Web finden. Es ist ein ausgezeichneter Satz von Bibliotheken. Macht jeden Job in diesem Sinne so hervorragend, auf die einzige Einschränkung und die einzige Einschränkung ist die Skalierbarkeit. Und das ist eine große, große, große Einschränkung. Seine Glaubwürdigkeit in Bezug darauf, wie viele Daten ich verarbeiten kann. Die Menge an Daten, die ich verarbeiten kann, ist die Menge an Speicher, die Sie auf Ihrer Mission haben. Es muss alle Daten und Speicher laden und nur, dass es verwenden kann. Das ist die größte Einschränkung, weil von denen nur während der experimentellen Gesicht aus ihrer Wissenschaft verwendet werden . Aber Sie erhalten die Daten, die sich die Daten ansehen, ein kleines Stück Daten nehmen und Natalia-Algorithmen ausprobieren. Hier wird Kunst eingesetzt. In dem Moment, in dem du in die Produktion kommst. Wenn Sie so riesig haben, haben Sie die Aufzeichnung Ihr Ding in einer anderen Programmiersprache, die stehlen kann. Das ist also eine Einschränkung. Große Einschränkung für unsere Aber are ist eine sehr wichtige Fähigkeit für Data Science, weil oft Sie nur sitzen und mit Daten arbeiten, später mit Daten zu kämpfen. Daher ist unser ein großartiges Werkzeug dafür, und Sie werden sehen, dass wir die Top-Schule in irgendeiner der Data Science bezogenen Jobanforderungen sind. Empfehlung ist wählen Sie unsere unseren Kampf auf einem von ihnen. Wenn Sie beide großartig lernen wollen, aber Sie müssen immer irgendwo anfangen. So tun unser Kampf auf die nächste Programmiersprache ist, natürlich, beißen auf ebenso beliebt wie unsere für Datenzeichen. Es kommt also mit meinem anderen Hintergrund, aber es ist wieder gleichermaßen beliebt. Es ist die Tagesordnung. Item hat eine allgemeine Programmiersprache, die mehr als nur mehr tun kann als Datenzeichen wie es kann. Sie können eine Webanwendungen mit ihm erstellen. Sie können viele Dinge tun, die ich unter ihren Zeichen mit Brighton tun würde. Es ist also eine sehr endlich ausgereifte Sprache, die da ist. Es ist natürlich natürlich Open Source darauf einfach für die Programmierung, umfangreiche Bibliothek Hocker und Pakete und die Skalierbarkeit von meinem Zug hängt von dem Paket verwendet wird. Es ist irgendwie auch eine unkomplizierte Programmiersprache. Es geht, um dich zu programmieren. Sie müssen skalierbar bauen, ertragen werden, verwenden Sie ein Paket, das vier Skalierbarkeit sind. Also gibt es nichts anderes auf der Empfehlung hier ist, dass Juden auf einen von ihnen beißen . Gehst du zu Joe? Jemand, der eigentlich beide sehr ähnlich aussehen. Wenn Sie anfangen, sie zu verwenden, es wird nicht etwas sein Wenn Sie bereits einen Hintergrund haben und pytorch gehen mit Kuchen Zeit sind Sie wollen unsere wählen Sie Ihre was auch immer Sie bequem mit No einige kleine Forschung und dann Saft Was auch immer Sie sind bequem mit SAS, Stata, SPS s und mein Club der Zahra setzen Produkte, die auf dem Markt verfügbar sind, die ähnliche tut, während diese Data Science Lated Arbeit Bänke ist unsere Alternativen zu unserer und kämpfen auf. Sie haben ausgezeichnete Unterstützung für unsere Babys Data Science Funktionen wie den Erwerb der Dunkelheit, Umwandlung ihrer Liebling begann Stickle Analyse maschinelles Lernen alle von ihnen das einzige Problem mit ihnen sind ein großes Problem mit Zahlen. Sie sind nicht Open Source ihr Produkt, das kaufen muss, und es gibt sehr teure Produkte. Das ist also derjenige, der Grady-Nutzung einschränkt. Diese Produkte gibt es seit einiger Zeit, aber sie sind nicht neue Produkte auf ihre sehr teuer auf ihre Unternehmen, die keinen Stand dort in ihnen haben , und sie sind mit ihnen ihre dominante. Aber die Verwendung wurden verwandt, Lee erklärt wegen der Entstehung von anderen Open-Source-Wasser-Neckers. Das ist es, was in diesem Bereich passiert. Die Empfehlung hier ist, dass nur lernen, wenn Ihre Organisation es bereits verwendet. Ich würde nicht empfehlen, dass Sie direkt in sie gehen, ohne zu lernen, sind von Zeit zu Zeit, es sei denn, die Qual Ihrer Organisation verwendet es bereits und Sie wurden gelernt. Also gibt es die Empfehlung, die ich habe. Andere Leute haben vielleicht unterschiedliche Meinungen, aber das ist die Empfehlung, die ich so viel für die technischen Sachen, das Hauptwissen, eine sehr wichtige Schlüsselfertigkeit, die wir an anderen Orten gesehen haben. Wie, wenn wir uns den Lebenszyklus von Data Science angesehen haben. Wenn Sie sich ansehen, welche Datenzeichen wir sehen, ist das Domänenwissen eine sehr kritische Fähigkeit. Es gibt alle Zahlen und Zeichen. Missionen können sie nur knirschen, aber sie können nicht interpretieren. Das Dummy-Wissen ist entscheidend, um zu verstehen, was der Leser sagt und einmal Mädchen, dass man nicht nur bauen, sondern trainieren kann. Du wirst keine Schulungen zur Verfügung haben, um es zu benutzen. Bauen Sie auf mein Wissen und Schwerter sind dumbing. Es war etwas, an dem dein Hund bellte. Du musst auf dem Job lernen und Escalon bauen. Die Empfehlungen Augen, dass, wenn Sie auf einer bestimmten Domäne gearbeitet haben, Sie in einem Unternehmen arbeiten, das die Sierra, die in einer Finanzierung zu minen oder medizinischen Bereich ist, irgendwie mehr darüber erfahren und auf ihm aufbauen. Ich meine, verwenden, was die Firma ausgenutzt hat, dass Sie Dr. People haben, die die Domäne gut kennen und dort einige Fähigkeiten aufbauen. Wenn Sie ein frischer aus dem College sind und Sie in Data Science einsteigen möchten, ist die Empfehlung, dass sich kein Fokus mehr auf Daten andauernde Art von Jobs zu Beginn, die in erster Linie Programmiersprache Programmierung, Jobs zum Extrahieren Sie sterben. Und ich weiß, Säuberungsdaten und so etwas und dann auf dem Job Build Domain lange Sprachkenntnisse, Präsentationsfähigkeiten gehen eine andere sehr wichtige Sache. Ihre Fähigkeit zu gehen schuhllos Joe Dan Präsident führt zu einer überzeugenden Art und Weise ist ein Hersteller Big Break Fähigkeit in Data Science, so dass Sie sitzen und tun können alle die Arbeit, die Sie auf ihre in und mit Daten wollen . Aber das Wichtigste ist schließlich die Projektbeteiligten davon überzeugt, was man Zach findet und dass man nur mit guten Präsentationsfähigkeiten machen kann. Sie müssen wissen, dass es nicht nur darum geht, gute Daten zu erhalten. Sie müssen auch wissen, wie Sie die Daten von Menschen überzeugend präsentieren können. Das ist eine sehr wichtige Fähigkeit. Ich sehe nicht, dass Sie gehören keine der grafischen Paket von Microsoft Office, natürlich, dann grafische Bibliotheken und kämpfen auf unserer oder einem der Werkbänke. JavaScript. Es gibt eine Menge von Werkzeugen für die Präsentation, die verfügbar ist , und natürlich ist es gut zu lernen. Ich tue sie nicht. Und wieder, Sie werden möglicherweise nicht zu einem bestimmten Training auf diesen gehen. Vielmehr lernen Sie sie als Teil anderer Schulungen, wie unser Kampf weiter oder sogar wie Microsoft Office. Unsere Data Science Projekte finden in der Regel Mängel bei anderen Menschen, die an der Mutter arbeiten. Wenn Sie sich Daten und Ihre Sprüche ansehen, dass es hier eine Möglichkeit gibt, sich zu verbessern. Die erste Frage ist, warum wird Ihnen diese Gelegenheit nicht ausgesetzt? Leo. Wer war der Typ, der an dieser Domäne arbeitet und warum ist das? Warum geht es bei diesem Mädchen nicht um diese Gelegenheit? Offensichtlich ist es eine Art Fehler bei der Arbeit von jemand anderem zu finden. Wenigstens versuchen einige Leute so zu denken, und sie werden nicht defensiv. Daher ist es sehr wichtig für Sie, eine Präsentationsfähigkeiten zu haben, in der Sie mit Menschen auf eine Weise sprechen können , dass es ihnen nicht weh tut, nicht dazu bringt, dass sie sich zurückfühlen und ihnen das sagen. Ok, okay. So sind die Daten. Nein, nein, es ist nicht deine Schuld, die bisher nicht entdeckt wurde. Aber wir entdecken jetzt etwas hier. Wir werden es verbessern. Es ist eine ziemlich wichtige Fähigkeit, der Präsident, dass es nicht unterschätzt werden kann. Wie viel diese Fähigkeit ist für Sie erforderlich, besonders wenn Sie ein Senior dort, ein Wissenschaftler oder eine konzertante Art von Person sind . Sonstige nichttechnische Schulen. Das wirst du nirgendwo lernen. Aber denken Sie daran, dass Sie diese auf der Arbeit Teamarbeit mehr als erforderlich und mehr als das Unregelmäßigkeitsteam bauen müssen , wo Sie brauchen. Aber ich glaube, Sie arbeiten mit nicht technischen und nicht kooperierenden Dingen. Das wirst du oft finden. Es gibt viele nicht-technische Leute, die ihre Wissenschaft in Frage stellen werden, wissen Sie, wir haben einen Arbeiter dabei. Es könnte nicht kooperierende Teenager geben. Du musst lernen, mit ihnen zu arbeiten. Du brauchst eine Startup-Denkweise. Das ist, wo sie immer sagen, Hacker, wenn sie sicher sind, erwarten keine reibungslosen Prozesse und gut festgelegten Anforderungen. Weißt du, sie werden ihren Kommentar nicht aufbauen, und ich stimme zu. Glatte Prozessoren. Es wird ein Problem geben. Die Dinge werden sich sehr dynamisch ändern, und Sie sollten damit arbeiten können. Du brauchst einen Hacker Montag 50, weil du die Daten hacken musst, um Informationen daraus zu bekommen. Sie sollten sich in Aufregung wohl fühlen. Es wird Aufruhr mit Daten geben. Viele Leute sprechen eine Menge Dinge auf diese Weise, die so verwendet, um bequem Konto, aber das kann eine Aufregung haben und in der Lage sein, Ihren Empfang zu bekommen. Sie können keine reibungslosen Prozesse erwarten, besonders bei Datenzeichen. Sie müssen in der Lage sein, mit Frustration umzugehen, besonders wenn Sie die Signale nicht sehen. Sie möchten die Genauigkeitsstufen je Vorhersage sehen. Algorithmen sind nicht bis zu der Marke. Ja, das wird eine Menge Frustration, an der du arbeiten wirst. Sie sollten endlich in der Lage sein, mit Kritik umzugehen. Die Leute werden auf der Arbeit die Daten, die Forscher Theorie der Beweise, alles kritisieren . Seien Sie also bereit, mit Kritik umzugehen. Das ist alles, was geht. Dies ist eine riesige Reihe von Fähigkeiten, die für die anderen Zeichen erforderlich sind. Einige können Sie durch Training bekommen, einige können Sie nicht durch Training bekommen und die einige, die Sie brauchen, um auf dem Job zu lernen. Danke. 13. Rollen in der Datenwissenschaft: Hallo. Das ist dein Lehrer Cameron hier. In dieser Präsentation handelt es sich also um die verschiedenen Rollen, die Sie in Data Science über sehen werden. Sie hören, ein Software-Profi ist ein Titel generieren. Wenn Sie also sagen, dass jemand ein Software-Profi ist, ist es ein generierter Titel, den Sie jemanden anrufen können. Dies ist Angebot Programmierer aus. sei denn, so etwas, es ist ein generierter Titel, und so ist es. Als Wissenschaftler über neue Stadtdaten Scientist, verweist es auf eine breite Kategorie von Rollen und Verantwortlichkeiten. Wie du sagen würdest, jemand ist ein weicher Profi. Ein Softwareprofi kann je nach Fähigkeiten unterschiedliche Rollen in einem Team spielen. Interessante Erfahrungen wie Design-Tests, Architekturmanagement. ESO ist Data Scientist, so dass das zugewiesene Datum auch wieder verschiedene Rollen spielen kann, basierend auf ihren Fähigkeiten. Interessante Erfahrung. Dies ist also etwas, das Sie vielleicht erkennen möchten, dass der Data Scientist eine sehr allgemeine Rolle unserer Kategorie ist , und es gibt eine Menge von Unterzeilen und Unterkategorien, in denen Sie tatsächlich in intelligenten Teams arbeiten könnten . Jeder, jeder, jeder macht alles oder nur eine Person macht alles. In großen Teams gibt es unterschiedliche Rollen und Verantwortlichkeiten. So später unterzeichnet uns ist eine breite Kategorie in Bezug auf Rollendefinition. Also, welche anderen Videos? Scharen. In der Datenwissenschaft beginnen wir mit der ersten Rolle, die der Datentechniker alt ist. Die Data Engineering-Rollen Verantwortlichkeiten sind Code zu schreiben Das Essen dort wird viel außerhalb des Gerichts lesen Ein meist gefangener Versuch Daten schreiben Code für Datenerfassung, Persistenz, Operationalisierung, alles zu tun mit der Datentransformation. All das wird in der Regel von einem Datentechniker die Daten zurückgegeben und Sie wissen, Soldaten, um den Analysten zu helfen. Es gibt eine bemerkenswerte Analysten Wir werden sehen, helfen dem Analysten mit dem Aufbau von prädiktiven Algorithmen. Helfen Sie den Führern auf der Liberalen. Wir werden sehen, Helfen Sie dem Führer mit Berichten und Visualisierung. Dieser Typ ist also wie der Handelman für das Team, das viel umwerfende Arbeit macht, oft integrative Arbeit, um den anderen Rollen zu helfen. Eso die Fähigkeiten und Erfahrungen, die für einen Datentechniker erforderlich sind, ist im Grunde würde ein I P. Grad 0 bis 5 Jahre Erfahrung nennen . Das ist also wie die Junior-Programmierer Art von Person in Ihrem Team. Die erforderlichen Fähigkeiten sind unser Kampf gegen SQL und Big Data, um an der Position zu beginnen, und dies ist der Schub, in dem , wenn Sie ein frischer sind , wenn Sie, wie ein oder zwei Jahre Erfahrung, können Sie erwarten, in diese Art von Frage zu bekommen. Dies erfordert keine Art von Domain-Erfahrung, aber wir. Du arbeitest an der Rolle, die du diese Domain-Erfahrung aufbaust, Mädchen, das dir in anderen zukünftigen erweiterten Regeln helfen wird. Die nächste Welt, die wir sehen werden, ist, dass oft Analyst die Analysten wieder, Ich sage, es ist eine Rolle, die es genannt werden könnte Die freundliche in verschiedenen Jobs sind in verschiedenen Unternehmen, aber er hatte die Rolle verantwortungsvoll getrennt hier Rolls Name. Ich habe uns Analysten gegeben, die es vielleicht wieder etwas anderes genannt hat. Die Hauptaufgaben sind das Streiten mit den Daten. Betrachten Sie also die Daten und sehen Sie ah, arbeiten Sie Dinge, die Sie mit diesen Daten zu tun haben, besuchen Sie, welche Art von Transformationen notwendig sind, welche Art von Reinigung ist notwendig? Die Analysen Streit mit den Daten, es sei denn, die Daten Toe in verschiedenen Mustern, so der Analyst tut, die Erkundung eines behandelten Analysten, ist es, unsere Datenmuster und Beziehungen auf ziemlich vorhersehbaren Beziehungen zu identifizieren. Sachen wie das Bauen von Hoden, prädiktiven Algorithmen, schauen Sie sich die verschiedenen Algorithmen an. Ich habe versucht, sie für die Daten zu verwenden und zu sehen, welche Art von Genauigkeit Sie bekommen und spielen unsere eigenen, verwitterten und dann schließlich die Empfehlungen, wie Sie die Daten verwenden können, um einige gute Vorhersagen zu erzeugen. So ist dies eine Art von der fleischigen Rolle fleischig technischen gerollt. Und es gibt Anzeichen, dass Treffen technische und mit einer sehr kritischen Rolle, wie Sie die Fähigkeiten und Erfahrung für diese erforderlich sehen, erzählte uns wie eine Idee oder ein Master-Abschluss , sogar ein Doktorat. Sie werden eine Menge von Datenwissenschaftlern Profile sehen, die nach einem Doktortitel fragen, um 20 Jahre Erfahrung zu bekämpfen , wie eine riesige Menge an XB-Vorfall, wo dies eher wie ein Software-Architekt ist . Unsere Senior Analyst Art einer Position Babys, Programmierung oder statistischen Hintergrund ist für nicht Analysten erforderlich. Am wenigsten Datenbank- und Programmierungsstatistiker kommen auch, um diese Rolle zu spielen, nachdem sie einige einige abholen einige Programmierkenntnisse. Unser Kampf auf SQL und Big Data wieder, der Standard setzte Fähigkeiten, die für einen Tag erforderlich sind, dass Wissenschaftler, die erhebliche Domänenerfahrung für Analysten sein müssen, es sei denn, dass müssen, um erfolgreich in ihrer Arbeit zu sein . Ich sah, das ist Theodore Definition für Analyst. Die so etwas wie eine wichtige technische Rolle, wie der technische Leiter des Architekten, eine Art Rolle, wenn man jemanden anruft, ist. Und es sei denn, die Data Science Welt, die nächsten Rollen, die jemals Statistiker, das ist eine sehr spezialisierte Rolle. Die Verantwortlichkeiten hier gehören zu empfehlen, ich werde Adams bewachen, und Strategien sagten, dass Entscheidungen nicht das in kleinen Team sind. Sie sind in der Regel in großen Teams, die versuchen, wirklich komplexe Probleme zu lösen. Also werden sie es sein, es sei denn, die Algorithmen selbst zu entwickeln und dann bei Bedarf neue Algorithmen zu entwickeln. Wenn sie neue Strategien entwickeln, wenn sie erforderlich sind, um die Probleme zu lösen , machen sie eine Menge von Inferenzanalyse, die eher wie alle Ihre statistischen Tests auf den Daten ist, um zu sehen, ob die Schlussfolgerungen gut halten werden. Der Grad der statistischen Validierung auf sie sind in der Regel nicht in kleinen Teams gefunden. Sie fanden in der Regel in ziemlich großen Teams gewidmet Statistiker Art von Person. Die Fähigkeiten, die für einen Statistiker benötigt werden, sind wie ein statistischer Abschluss, in der Regel ein Doktorandenkämpfer. 20 Jahre Erfahrung sind winzig, ist, was sie in der Regel Familie mit sein, nur Manipulation von Daten. Nicht wirklich jede Art von Programmierarbeit sind auch mehr wie eine Werkbank Art von Sache verwendet . Anstatt wie ein Programmierer zu sein. Signifikante Domain-Erfahrungen, die für einen Statistiker benötigt werden, werden sein Gold besser machen . Die letzte Rolle, die Sie betrachten werden, ist, dass von einem Führer, der Führer ist eher wie ein Projektmanager sind der Teamleiter oder Engineering-Manager . Weißt du, wie auch immer du es nennen willst, dieser Typ ist der Manager von all den anderen Leuten, die im Dekan arbeiten , ihre Verantwortung? A. erster Linie unser Projektmanagement, ein Management des gesamten Projekts kaufen in von Stakeholdern, die andere, die wir mit den Stakeholdern sprechen werden, um den Kauf auf, was unsere Vorhersagen das Team ist gehen, um zu produzieren. Menschen und Erwartungsmanagement sind große Arbeit mit Menschen, die beide innerhalb des Dämons außerhalb des Teams, um die Dinge zu erledigen. Das Management der Erwartungen an Data Science ist auf dem Deck. Kritische Arbeit, dass sie eine Visualisierung zu tun haben, ist eine Verantwortung für sie. Sie hatten derjenige, der die Präsentationen auf Glocke Lob und so etwas vorbereiten wird , so dass dies wieder Jungs sind, sagte ich, wie Projektmanager im Team, ihre Fähigkeiten sind wie ein beruflicher Abschluss. Selbst MBS Conduit Projektmanager mit Projektmanagement-Zertifizierung. Cando das mit jemandem wie einer 90. Hintergründer. Zeug wie diese kämpfen 20 Jahre Erfahrung Wieder einmal kommen sie von einem Management. Künstler bieten Engineering-Hintergrund. Dies ist eine Gelegenheit für Menschen, die Nein sind. 90 Leute, jemand mit einem MBE oder etwas, um in Data Science zu kommen und hier etwas zu tun. Das Projektmanagement geht natürlich ruhig an. Ja, auf Domain-Erfahrung ist bevorzugt. Es ist gut, dass der Anführer Zeh wieder etwas dunkle Unerfahrenheit hat, bin ich nicht. Sie werden sehen, Menschen für jeden Dole Leute kombiniert Rollen und tun den Job . Dies ist nur um zu verstehen, was die Rollen, Verantwortlichkeiten und Qualifikationsanforderungen sind. Zusätzliche Straße, die Sie vor allem in großen Teams finden, sind Test- und Validierungsteams. Dasselbe, wo Sie Qualitätssicherungsteams in der Softwareentwicklung haben. Sie haben unsere Tests in Verletzungsteams durchgeführt, deren Aufgabe es ist, Testfälle für Daten dauerhafte Aufgabe auszuführen, da Publisher ähnlich wie Software-Engineering-Qualitätssicherungsprüfer sind eine weitere wichtige Sache, die Sie in Ihrem Team wünschen könnten. Dies sind im Grunde Senior Domain Experimente und Spezialisten. Ihre Aufgabe ist es, die Ergebnisse und Empfehlungen zu überprüfen, um sie im Grunde zu kommen, weil es Domänenexperten handelt. Wenn Sie mit Erkenntnissen kommen, können sie eine Überprüfung sie nehmen und sagen, dass Ihre Empfehlungen gut sind. Andere Implementierung an anderen sind die Gibt es irgendwelche Schuss fällt in Ihren Empfehlungen sind scharfe Stürze in der Analyse Dinge, die Sie als Teil Ihrer Analyse verpasst haben könnten, auf sie sind im Grunde wie ein Teufelsfürsprecher. Es ist gut, sie als Teil Ihres Teams zu haben, wenn Sie ein großes Team haben und Sie, wenn Sie sich diese Rezensenten leisten können , dann kommt die Operation Spartan aus der neuen Go-Produktion. Wenn Sie mit all Ihren Datenprodukten in die Produktion gehen und alle Ihre Datenfeeds erhalten, brauchen Sie Personen, die diese Produktionsumgebung verwalten können, die grundsätzlich in allen Ihren Datenbanken erstellt wurde und sie eingerichtet sind. Führen Sie alle Ihre Datenprodukte als Prozessoren aus, und wenn die Behinderung tagtäglich ihre Arbeit eintritt, stellen Sie sicher, dass die Daten eingehen, wenn sie in die alle Ihre Programme pünktlich laufen . Eso-Operationen sind unter ihrem Teil von ihrem Wissenschafts-Team. In der Regel können sie Teil eines anderen Teams sein. Sie sind möglicherweise nicht Teil Ihres Data Science-Teams, aber das ist eine Rolle. Manchmal spielen die Rechenzentren selbst in sehr kleinen Teams eine solche Rolle für die Zusammenstellung des Betriebsteams. Sie können mit einer Person Dinge beginnen. Du nennst sie den Commander, weil sie alles tun. Das ist sehr du siehst, Job hat geantwortet. Er rief Datenwissenschaftler an. Wir sehen, dass es immer Stellenangebote gibt, die Data Scientists genannt werden, weil die meisten Probleme, die Sie sitzen und tun alle Dinge. Aber höchstwahrscheinlich machst du nur einen anderen Job. Nur Toto. Vier Personenteams. Die Rollen werden zwischen der Erfahrung und den Juniormitgliedern kombiniert. Der Statistiker fehlt in der Regel. Einer der Senioren ist in der Regel der Analyst Andy Project Leader auf die Junior People. Machen Sie die ganze Codierung und der Handwerker arbeiten. Letzte Teams haben ein dediziertes Mitglied für jeden Halt auf, aber es wird mehrere Mitglieder spielen eine Straße, ähnlich wie ein Softwareentwicklungsprojekt hier. So wird es von einem C-Einpersonenteam zu wirklich großen Teams übergehen und es wird immer empfohlen toe. Verfügen Sie über externe Bewertungsteams als Teil Ihrer Fähigkeiten. Husten Sie Ihr Team Set. Dies sind also die verschiedenen Rollen wünschen, verschiedene Rollen, die Sie in einer Data Science-Roll-Gruppe haben. Wenn du jemanden anrufst, das uns das Datum zugewiesen ist, wirst du im Grunde einen machen, der mehr diesen Bohrern ist. Eso Hoffnung hat Ihnen geholfen, zu verstehen, was die Rollen aus der Data Science Zeichen Wissenschaftler sind. Danke. 14. Herausforderungen für einen Data Scientist: Hallo. Dies ist Ihr Lehrer Cameron auf in diesem Abschnitt, wir werden sehen, was hinterhältige Herausforderungen für einen Data Scientist sind. Eine Diese Herausforderungen, was sind diese Herausforderungen, die einzigartig für ihre Zeichen sind? Die Herausforderung wird verletzt, werden sowohl positiv als auch negativ sein. Eine Herausforderung ist eine Herausforderung. Es wird positiv sein. Wenn Ihnen die Herausforderung gefällt und Sie an dieser Herausforderung arbeiten möchten, ist sie negativ. Wenn Ihnen die Herausforderung nicht gefällt, sich alles um Ihre Perspektive und Ihre Präferenz. Eine Herausforderung ist also eine Herausforderung. Wir locken Herausforderer in etwas, das wir lieben, eine Art von Herausforderungen, die wir nicht mögen, andere Art von Herausforderungen. Es geht also um unsere eigene Perspektive und Vorliebe. Einstieg in Data Science ist eine bedeutende Investition von Zeit und Aufwand. Sie werden eine Menge lernen viel Prepper, so dass einige sorgfältige Überlegung erforderlich ist, was Sie in Adidas und Job erwarten können. Bist du bis dahin? Sie? Sie mögen die Herausforderungen durch den Job angeboten, aber es ist immer besser, einen Freund zu kennen und dann später zu realisieren, etwas zu tun das Ihnen nicht gefällt Also was sind die verschiedenen Herausforderungen? Die erste Herausforderung? In der Tat. Unsere Wissenschaft ist die technologische Herausforderung. Es ist ein neues und sich entwickelndes Feld, vor allem denkt wie Big Data Technologien. Es ist ein neues. sich entwickelnde Feld. Data Science sind hier mehrere neue Technologien und Tools erforderlich. Nun, Dinge wie Programmiersprachen wie unsere und Pitre sind okay. Nein, die Leute kommen mit mehr Tools für Werkzeuge und Techniken, vor allem Werkzeugsets und Produkte auf einem viel höheren Niveau. Und das ist etwas, das sich immer noch entwickelt. So werden neue Optionen schnell alt, dass viele Leute, die an einer neuen Art von Technologie zur Stabilisierung dieser Technologie arbeiten , einige Jahre dauern werden. Es ist sehr ähnlich wie 24 Jahre zurück. Wenn man sich Datenbanktechnologien anschaut, mögen sie etwa 2030 Datenbankprodukte auf dem Markt. Jetzt sehen Sie, dass alles, was eine Menge von Menschen stabilisiert hat, verschwunden ist. Es ist nur wie zwei oder drei Technologien, die bleiben. Diese Art von Technologie. Stabilisierung der Datenzeichen wird ein paar Jahre dauern. Seien Sie also bereit, sich auf den Rückweg anzupassen, während Sie in Bezug auf Technologie gehen, die kontinuierliche zusätzliche Anstrengungen sein wird, um diese neuen Technologien zu erlernen und sich an sie anzupassen. So werden Sie in Ausbildung investieren und lernen viel Zeit für eine weiter. Es wird ein kontinuierlicher Prozess sein, wenn Sie gerne ständig neue Dinge lernen. Nein, das ist dein Traumjob. So lernen Sie gerne neue Dinge, neue Technologien, während sie immer wieder herauskommen. Das wird dein Traumjob sein. Die nächste Herausforderung ist, dass der jinx Fähigkeiten, die für ihre Zeichen erforderlich sind Auf der ersten, ersten,natürlich, Martin Statistiken. Also hat Martin sechs angefangen. Manche Leute lieben es. Manche Leute haben gehasst, also ist das die Herausforderung. Nicht jeder ist zufrieden mit meinen fertigen Fragen oder wenn du all diese Gleichungen benutzt hast, oder du bist nicht ganz bequem. Einige Leute sind wirklich cool, aber es ist so in den Rechenzentren, müssen Sie Grundlagen von dieser Bergstatistik lernen, und Sie müssen sie verwenden, um Ihre Arbeit zu rechtfertigen. Aber die Frage ist, sind Sie wohl damit? Wenn nicht ein Data Engineering innerhalb von Daten, Wissenschaft ist eine Art gute normannische Annahme, dass Sie wollen, um Domain Wissen verfolgen, ist ein anderes Objekt, das wir in anderen Präsentationen gesehen haben, da toe Ah White kritisch ist. Das Wissen und die Spezialisierung auf eine Domäne ist entscheidend für den langfristigen Erfolg. Für Wachstum auf, ist es eine großartige Gelegenheit, Business Seite der Dinge zu lernen, wenn Sie es mögen. Aber wenn du wieder bist, willst du einfach mehr in deine Programmierung einsteigen. Sie möchten sich nicht auf Domänenwissen konzentrieren. Dann ist das Dauern von Daten eine gute Alternative für die NATO. Sign Also mathematische Statistik und nein, mein Wissen gilt als Schlüsselfertigkeiten in einem Generator-Wissenschaftsbereich. Es liegt also an Ihnen, ob Sie diese Herausforderungen annehmen wollen, sind keine Daten selbst eine Herausforderung, bequem zu sein. Aber große Datenmengen sind von größter Bedeutung für Erfolg und Daten-Dinge. Also habe ich viele I-D-Profis gesehen, die nicht so komfortabel mit Daten arbeiten. Die Frage ist, Sind Sie mit riesigen Tabellen und Excel-Blättern und allen Arten von Daten vertraut? Sie haben einen Screenful Liebe Daten und Zahlen und Strings Sie Sind Sie bequem mit allen von ihnen? Ah, Schnäppchen. Unvollständige Daten können frustrierend sein, wenn Sie an dem Tag arbeiten, an dem der Versuch, mit Datenbalkendaten und unvollständigen Daten zu kämpfen, sehr frustrierend sein kann. Lesen einer Breda und eine richtige Form, die ein sehr sein kann, ich hatte einmal aufwändigen Prozess bewertet Ihre etwas zu tun, dass etwas fünf Minuten dauern könnte, kommt zurück und sehen, es ist nicht genug. Dann mach etwas anderes und du machst weiter. Und das könnte ein sehr zeitaufwändiger Prozess sein. Das sind also vier Daten, also datieren Sie zurück und es wird eine Herausforderung in der Datenwissenschaft sein, wenn Sie sich nicht damit wohl fühlen , nach Signalen zu suchen. Wenn Sie also diesen Analyseteil ausführen, versuchen Sie, nach Signalen innerhalb von Daten zu suchen. Sie versuchen, nach einer Beziehung zwischen verschiedenen Entitäten und Attributen zu suchen. Also, was passieren wird, dass sie nach Signalen in Daten suchen, ist wie ein Mordgeheimnis zu lösen . Das ist etwas, was Sie mit Erfahrung finden würden, dass es wie die Lösung eines Mordgeheimnisses ist. Nein, du hast dir Hinweise angeschaut. Sie suchen nach der Kleidung, die Sie versuchen, diejenigen zu verfolgen, die in der Nähe von etwas. Man sucht etwas, man findet etwas anderes, man findet vielleicht gar nichts, und man könnte es einfach lieben oder hassen, und man kann es vielleicht nicht alles lösen. Weißt du, das ist die Sache. Sie werden das geheimnisvolle Problem überhaupt nicht lösen. Aber das kann für Sie ziemlich intellektuell lohnend sein. Neugier einer Karte ist erforderlich, um ein Führer zu sein. Wissenschaftler mussten deswegen in Schwierigkeiten geraten. Das ist nur eine lange Reise. Aber das Endergebnis kann lohnend sein. Aber sie setzen sich. Suche nach Signalen könnte sehr frustrierend sein. Du könntest dir den Kopf brechen. Du könntest Schlafruhe haben, als wir mit den Daten geschehen. Warum verhält es sich nicht später nicht so, wie es sich verhalten soll? Weißt du, alles, was irgendwas sein wird. Es ist eine Herausforderung. Sie lieben es oder hassen es gibt Da Projekte Forschungstyp Projekte sind, so dass sie Projekte auf mehr Forschung Art von Projekten entwerfen, sind sie nicht gut definierte Projekte es nicht wie ein Software-Entwicklungsprojekte, wo die Anforderungen sind in Stein gesetzt. Jedes Gefühl, das Sie ich Sie genau wissen, wann das Feld uns von Beziehungen gearbeitet werden muss getan werden muss, wie es aufgezeichnet werden muss. Aber das ist nicht, wie die Bewohner Projekte sind, dass die Anforderung ist meist wie ein Ziel auf dann gehen Sie einfach nach dem Ziel und Sie ändern sich weiter. Ändern Sie Teile, sogar das Objekt. Sie könnten sich weiterentwickeln, während das Projekt weitergeht. So sind die Anforderungen nicht in Stein gesetzt. Sie werden sich im Laufe des Projekts weiter ändern. Nacharbeit ist eine Selbstverständlichkeit. Du wirst viel freie Arbeit mit Daten machen. Und das auch mit Daten, wird auch mit Daten, Verwirrung und Konflikten beim Projekt des Präsidenten profilieren. Vielleicht nicht uninteressiert an dem Sinn, dass Sie am Ende des Projekts feststellen könnten, dass es überhaupt keine Signatur in Ihrem Projekt gibt. Gut. Du hast die Fähigkeit für all diese Sachen. Betriebsprozesse, Lebenszyklusmethoden, Best Practices. Alle von ihnen entwickeln sich noch immer für Data Science. Es wird ein paar Jahre dauern, bis du ein paar solide Sachen hast. In diesem Fall ist in Betrieb Prozesse ein Leben zweite Methoden, Asprilla und Best Practices. Aber Sie tun gut in der organisierten Arbeit. Erlauben Sie, mitten im Chaos zu sein? Nein. Dies ist das Forschungsprojekt. Du willst die Art von Sachen recherchieren. Ja, hier ist ein großartiger Ort, um zu sein. Also wissen Sie das, bevor Sie in Data Science einsteigen. Die Arbeitsdampfdynamik ist mehr Grippe uriniert. Ein Wissenschaftsprojekt im Vergleich zu einem Softwareentwicklungsprojekt. den verschiedenen Gründen, die wir angegeben haben, bevor es technologische Herausforderungen geben wird, Prozessherausforderer , die Richtung ändern. All dies macht unsere Teamworkdynamik flüssiger. Es wird viel mehr Interaktionen innerhalb des Teams geben. Viel mehr Konflikte innerhalb des Teams s o b bereit für all das. Wenn Sie sich für Wissenschaft interessieren, müssen Sie ein Truppenspieler sein Zehe Arbeit in großen Projekten. Und wenn Sie ein einsamer Krieger sind, möchten Sie sich vielleicht auf kleine Projekte konzentrieren, bei denen es nur Sie sind und nur sitzen und die ganze Arbeit erledigen. Aber in großen Teams ist Arbeit wichtiger als es im Softwareentwicklungsprojekt ist, möchte ich betonen, dass die nächste Kachel sehr wichtig ist. Die Ökosysteme verstehen Daten Zeichen. Was meinen Sie mit dem Ökosystem? Ökosystem bedeutet hier die anderen Teams und Abteilungen in einer Organisation, die Sie mit den anderen Teams und Abteilungen zusammenarbeiten . Vielleicht Ihre Kunden, Sie beugen unsere Leute aus Vertrieb, mehr Marketing, Logistik, Betrieb, icty, andere Menschen im Allgemeinen. Top-Management. Das nennen wir hier das Ökosystem, und was ist die Herausforderung hier? Sie sagen, es ist ein ganz neues Gefühl und nicht jeder versteht es. die gleiche Weise lehrt der Begriff Tag selbst als so viele Bedeutungen, so viele Definitionen, es entwickelt sich immer noch. Einer der Gründe, warum ich an diesen Kurs gedacht habe, ist, weil dieses Verständnis etwas ist , das nicht Tabelle. Also, das heißt, da ist ein Ganzes. Natürlich muss er die Data Sciences von Board verstehen. Wenn dies also Ihr Fall ist, als das, was bei all Ihrem Ökosystem der Fall ist, haben die Menschen ein anderes Verständnis dafür, was Gebietsheilige für sie tun können. Einige Leute, alle haben es im Internet in den Nachrichten, Chats und so gehört. Manche Leute denken, dass es eine Lösung für unsere Probleme ist. Es ist Magie. Manche Leute Finger Bure, was unsere Also gibt es alle Arten von Meinungen auf. Menschen sind Meinungen zwischen dieser Magie und jeder Art von Meinung. Das Problem mit all dem, da ihre Erwartungen nicht so sein werden, als hätten sie andere Erwartungen als das, was Datensinn tatsächlich für sie tun kann. Das bedeutet, dass Sie wissen, jeder derzeit mehr lernt. Nicht jeder versteht Datenwissenschaft und Wasser kann zu einer echten US-Form liefern. Du sollst also geduldig sein, und du solltest Eric sie erziehen, noch frustriert werden. Das ist also eine Herausforderung für ihre Wissenschaft. Angesichts der Tatsache, dass es sich um ein neues Feld handelt, die Ökosysteme später verstehen, ist die Wissenschaft nicht völlig richtig. Die nächste Herausforderung ist natürlich die Zusammenarbeit mit anderen Teams, wie es das Geschäft ist. Was ist ein De-Conflict? Ihre Sinnes-Teams könnten aus dem Business-Team kommen, sind von der Idee, Teenager, egal welcher Ort es herauskommt, das ist immer der Konflikt mit dem anderen Team, das ist, dass ich nicht bauen ihre Dirigierung. Manchmal sind Ihre Data Science-Teams von kommen mit der Nacht sein, in diesem Fall, Was passiert ist, dass die Data Science wird viel mehr Einfluss auf die Arbeit. Dann tut ich das, als das Geschäft es vielleicht nicht mag, wenn das Data Science-Team von der geschäftlichen Seite der Dinge kommt . Die Ideen, Quinn, eine Frage, die ich ständig nach Anforderungen stellen wollte und so was, und sie werden es nicht mögen. es um diese Wissenschaft geht, ist das immer die Sache über die Siegelung eines Wennes um diese Wissenschaft geht, ist das immer die Sache über die Siegelung einesanderen Jobs, denn was auch immer getan wurde, denn was auch immer getan wurde immer wir vorhaben zu tun. mit ihren Zuweisen, tut jemand anderes bereits dort in ihren Köpfen. Wenn Sie also darüber reden, Dinge vorherzusagen, wie, was als nächstes passieren wird, gibt es Leute. Ich meine, Vorhersagen gab es immer in Unternehmen, aber Vorhersagen wurden von Menschen gemacht. Das nennen sie uns Erfahrung. Sie nutzen diese Erfahrung, um vorherzusagen, wie sich die Zukunft verhalten wird. Sie haben eine Erfahrung dient pro Verkäufer auf der Erfahrung sonst zahlen Person für gehen zu beginnen, mit dem Kunden zu sprechen und sagen, Dieser Kunde wird auf Arm kaufen Sie wissen, dass es kommt aus ihrer eigenen Erfahrung , was nichts anderes als ihre eigenen internen Daten und ihre eigenen in getan und modelliert und lernt. Nun, das würde durch einen Computer ersetzt werden, der immer diese Herausforderung sein wird, weil Sie diesen Geheimdienstmitarbeiter durch den Firmenauftrag ersetzen werden , der jetzt vorhersagen wird, ob der Kunde kaufen wird, sind nicht so. Es gibt immer einen Diebstahl eines anderen Job. Ich denke, das wird wie wir selbst passieren. Sie werden etwas Widerstand sehen. Sie werden einige negative Aktionen sehen. Ich arbeite also daran, dass Teams eine Herausforderung sein werden, wenn Sie Datenwissenschaftler sind, und dies ist die letzte Kritik. Sei also bereit und behaglich mit mehr als erwartet Kritik. Die Kritik wird vom Ökosystem kommen. Es wird von Ihrem eigenen Team aus dem Top-Management kommen, es wird Kredit sein. Es wird Kritik an Data Science selbst geben. Es wird eine Frage geben, was es tun kann, das Befragung und Kritik sein wird. Der Preis, die Arbeit, die Sie als Data Scientist leisten. Sie werden die Ergebnisse Ihres Projekts in Frage stellen. Das wird also alles sein, was immer da sein wird, bevor es zu einem Tag wird. Dieses Schild weiß nicht, wie empfindliche Possen Haut du bist. Sie sollten lernen, mit Kritik positiv fertig zu werden, also seien Sie bereit für Kritik. Es ist nicht so, als hättest du eine Ausrüstung. Drucker, der gegen noch angerufen und liefern Aspekt dieses Kommentars auf Ihrem Cent. Das wird nicht passieren. Die Leute werden über die Arbeit, die Sie tun, zu kritisieren, bis Sie wissen, dass der Deal Zyanose Sache zuweist . Es ist ein entwickelt sich. Besser verstehen es als Wissenschaft besser. Das wird ein paar Jahre dauern. Dann ist es eine sehr flüssige Situation an dieser Stelle. Du kommst jetzt darauf ein. Du hast die Fähigkeit für all das. Dies ist also eine Liste von Herausforderungen, denen Sie sich stellen könnten. Wenn Sie Datenwissenschaftler sind, liegt es an Ihnen. Beurteilen Sie sie und sehen Sie, ob Sie für all das bereit sein werden. Das wird Howard sein. Es ist und dieser Job wird so aussehen. Also erhöhen Sie das und treffen Sie eine fundierte Entscheidung. Das ist meine Empfehlung. Danke. 15. Aufbau deines your: Hallo. Das ist dein Lehrer, Cameron. In diesem Abschnitt werden wir sehen, wie Sie einen Skill Set Sie bauen können, weil gesetzt, um ein Data Scientist zu werden . Also die Fähigkeiten, auf die wir konzentrieren, haben wir dies früher in den Rollen und Fähigkeiten Anforderungen für Data Science gesehen . Sie konzentrieren sich auf einige Programmierkenntnisse wie unseren Kampf auf oder sogar Jabba Attentäter. SPS ist ormat produzieren. Worauf Sie von uns getötet haben, konzentrieren Sie sich darauf. Sie müssen sich auf eine Datenbank-Fähigkeit konzentrieren, wie s Kuba sind das Huddle Ökosystem. Und du musst etwas über Mathematik und Statistik lernen. Auch etwas über den Aufbau von Domain-Expertise. Also hast du diese Menge an Fähigkeiten, auf die du dich konzentrieren musst. Also haben Sie diese Checkliste an Ort und Stelle. Wie willst du diese Fähigkeiten entwickeln? Also vorher, willst du entscheiden, welche Rolle du spielen wirst? Ich werde wie ein einsamer Kreuzritter sein, in diesem Fall wirst du alle Fähigkeiten lernen. Werden Sie Teil des Teams sein, damit Sie sich auf eine Rolle konzentrieren können? Ich gehe, um zu tun, wie Beratung, nicht einen Vollzeitjob? Wenn Sie wieder eine Beraterperson sind. Man muss lernen, Meister, viele Fähigkeiten sollen. Wenn Sie einen Vollzeitjob suchen, können Sie sich wieder auf eine Schule konzentrieren. Du musst deine Rolle wählen. Ob Sie wie ein Datentechniker sein werden, war nicht weniger in Richtung Statistiker. Was ist der Anführer? Sie? Können Sie nur basierend auf Ihrer Erfahrung oder Ihre Es ist Liebe fehlt es alle, sondern auch an Bord . Welche Art von Dingen, die Sie sich auf das erste konzentrieren wollen, was Sie tun wollen und die Welt in Ihren Fähigkeiten, die ausnutzt, was Sie bereits haben. Wenn Sie seit einiger Zeit im Ich fühle mich, haben Sie bereits einige technische Fähigkeiten aufgegriffen. Sie wissen, dass Sie Fähigkeiten in der Entwicklung von SQL-Datenbanken haben, wie zum Beispiel die Entwicklung von Programmen, die mit Datenbanken arbeiten. Datenbankmanagement, wie eine DB, eine Art Off-Arbeit. Vielleicht tun Sie das auch schon, also versuchen Sie, sie zu nutzen, sie verwenden und zu projizieren. Sie gehen zu Interviews, Programmierkenntnisse bei der Gestaltung von Architekten, Fähigkeiten, solche Sachen. Ich erinnere mich, wenn Sie auf Datenzeichen schauen, Jobanforderung, dass , sagen wir, 10 Jahre Erfahrung in Data Science, Sie wissen so etwas. Sie bekommen nie einen solchen Menschen. Sie haben also Zehe, wissen Sie, diese Schulen, die Sie bereits haben, und projizieren sie als Teil Ihrer Daten. Wissenschaftsschulen, Domänenschulen. Wenn Sie in einer Domäne gearbeitet haben angepasst, wissen Sie, Sie waren in einer Finanzfirma arbeiten Versuchen Sie, etwas mehr über Finanzen zu lernen und sagen , dass. OK, ich kenne diese Domain. Sachen wie das. Versuchen Sie, mehr über Ihr Wohnheim zu lernen und bauen Sie Ihre Schulen, dass in Ihrer Domäne dies nicht etwas ist , Sie gehen allein in einem Schulungskurs. Sie müssen also Ihre derzeitige Berufserfahrung nutzen, um diese Art von Fähigkeiten aufzubauen und dann schließlich Managementschulen, wenn Sie Beratung machen , wenn Sie Projektmanagement durchgeführt haben, wenn Sie Lieferung wie Sie sind wie ein 90 Manager auf Engineering-Manager, all diese Fähigkeiten werden ins Spiel kommen und Ihnen in Ihrem Job helfen, ein Data Scientist zu sein . Wenn Sie also etwas von diesen tun, wird Ihnen das viel Erfahrung geben und mit Teams arbeiten, die sich mit verschiedenen Abteilungen verbinden, mit Menschen arbeiten, ihre Sorgen machen und sie dann zu Uppal Zeug und so was. Also wird alles ins Spiel kommen, wenn Sie Data Science machen werden. Versuchen Sie also, all diese Fähigkeiten zu nutzen, die Sie bereits Baufertigkeiten haben. Was ist Ihr Typ? Du weißt, was für eine lernende Person du bist. Verschiedene Menschen haben Komfort Level mit verschiedenen Arten von Lernen. Weißt du, Dinge wie Selbststudium. Schlimmer ist geführte Studien. Manche Leute machen gerne Selbststudium. Manche Leute mögen es, in einem Führer und einer Umgebung zu sein. Manche Leute versuchten, durch Lesen zu lernen. Manche Menschen versuchen, durch Zuhören zu lernen. Weißt du, es gibt Gewinnoptionen, die Leute online haben. Was ist sein Klassenzimmer? Wieder eine Art Umgebung. Unterschiedliche Komfortniveaus für verschiedene Personen. Also, die waren, wenn Sie wählen, welche unsere Farm off Studie üblich. Seien Sie bereit für viele Hände auf Übungen. Wissen Sie, Datenzeichen beinhalten einen Abfluss und die nächsten Phasen, die Paare, die sie erledigen, werden Sie eine Menge Spaß haben. Mit all diesen Übungen benötigen Sie definitiv technische Hilfe. Wissen Sie, Web ist eine großartige Ressource, um technische Hilfe zu erhalten. Es gibt viele Farmen da draußen, wo Sie gehen können, Fragen zu stellen und Hilfe zu erhalten, wenn Sie eine dieser Studien machen. Versuchen Sie, ein gutes Buddy-System zu bauen, mit dem Sie sprechen und, Sie wissen, interagieren und Dinge verstehen können. Körpersystem ist ein guter Weg, um Daten zu lernen, Wissenschaft, ihre Sinne, nicht Liebe oder so etwas wie Es gibt ein Mastering Java-Buch, das Sie lesen gehen und Ihre Familie mit , dass es nicht so einfache Werkzeuge sein wird. natürlich zu Ihnen, Das passtnatürlich zu Ihnen,basierend auf dem Kontinent. Flexible Bi Onda, die Anleitung, die im Kurs zur Verfügung steht. Was auch immer Sie wissen, machen Sie eine Bewertung, was Sie brauchen, und wählen Sie dann basierend darauf. Also schauen wir uns das Selbststudium an. Was sind die Vorteile des Selbststudiums? Es ist billig. Es war flexibel. Tun Sie es zu Ihrer eigenen Zeit, und vor allem können Sie Ihren eigenen Lehrplan erstellen, in dem Sie die Dinge wählen können, die Sie lernen möchten , und ignorieren Sie die Dinge, die Sie nicht wollen, allein. Die Herausforderung ist, wie das ist, ein neues Feld. Wissen Sie, die Führer sind beendet. Silber ist ein brandneues Feld. Ein Buch wird nicht Suffix. Es ist nicht so, als hätte ich wie ein Meister im Java-Buch genommen, und dann bin ich fertig damit. So wird es nicht in vielen Büchern sein. Tracking zum Erfolg erfordert viel Disziplin auf viel Ausdauer. Andi, du wirst irgendwo brauchen, um Fallstudien und Projektarbeit zu bekommen. Wissen Sie, wenn Sie selbst studieren, das ist nicht etwas, was Sie bekommen, wenn Sie ein Buch lesen, Sie wissen, finden Weg zu einem Projekt schlechter und bekommen einige Hände auf Übungen, was Rechenzentren alle an Bord, wenn Sie einen geführten Kurs nehmen, dass Brundage, natürlich, wird ein Mentoring und Führung sein. Da dies ein brandneues Feld ist, denke ich, dass sie sich immer noch entwickeln. Diese Art von Mentoring und Anleitung kann wirklich unbezahlbar sein. Forecasters Wiegen und Komfort Abschluss. Wenn Sie eine gated Küste haben, hat es seine eigene geplant. Es ist auf Aufgaben. Sie mussten Dinge abschließen, Ihre Tests nehmen, und das macht viel mehr Disziplin, die in der Regel erscheinen Studentennetz, wer kann mit wem Sie arbeiten können, um Dinge zu erledigen und mehr zu lernen. Die Herausforderungen, natürlich, auf abgestuften Kursen werden es teuer sein. Sie müssen sich Zeit für sie nehmen, und einige Themen können eine Herausforderung gegen künstlerische. Weißt du, da könnte ein paar Themen drin sein, aber du willst nicht allein. Sie sind nicht bequem zu lernen, aber Sie müssen es tun, weil es ein Teil des Kurses ist. Es wird bestimmte Dinge geben, die Sie bereits wissen, aber Sie sollten es lieben, sie wegen des Teils des Kurses zu tun. Wenn Sie also Ihr eigenes Selbststudium machen, können Sie wählen, was Sie in einem geführten Kurs lernen möchten. Du bist ein Schwein, alle, weißt du. Das ist also eine Herausforderung. So ist eine der Lernmöglichkeiten dort, um mit Abschlüssen und Zertifikaten zu beginnen, für drei Universitäten. Viele Universitäten kommen mit Abschlüssen und Zertifikaten für Datenzeichen, wie manche es nennen. Sie unterschrieben einige Leute nennen es und alles, was es braucht Daten, und ich werde eine Menge von verschiedenen Namen zu diesen Graden und Zertifikaten geben. Aber alle Universitäten erkennen, dass ihr Rechenzentrum ein sehr bevorstehendes Feld mit dem Schmalz aus der Traktion von Studenten sein wird. Also versuchen sie, einen dort zu finden. Es ist verfügbar Geburt im Klassenzimmer. Mehr fragen Sie nach weniger im normalen Online-Modus. Es war ein vollständiger, frischer Lehrplan. Die Professoren und sie sind dabei. Die Universitäten unterrichten sie. Es gibt Anerkennung für diese Abschlüsse und Zertifikate, was gut ist. Sie können sagen, ich habe einen Abschluss oder ein Zertifikat von dieser Anerkennung. Soll ich sagen, ich habe es zum Selbststudium gebracht. Das ist immer ein großer Unterschied. Es braucht viel Kalenderzeit, vor allem ist es Teilzeit. Es braucht die Zeit und leisten sich Abschlüsse und Zertifikate zu bekommen. Weißt du, es wird nicht einfach sein. Es ist sehr teuer. Wissen Sie, dass die Universitätskurse sehr teuer sind. Ich muss viel Geld ausgeben, um sie zu bekommen. Dies ist also etwas, das Sie basierend auf Ihrer Ressourcenverfügbarkeit berücksichtigen möchten. Die nächste Option ist M. O. C. Alle online, massiv offenen Kurse, die da draußen kommen. Dies ist die neue Form des Lernens, die sich in den letzten Jahren entwickelt hat. Auf Data Science ist wieder oben auf dieser Liste, dass coursera bietet die Spezialisierung zertifizierte Daten Zeichen. Nachdem Dame überprüft, hörte ich, dass die in Pro Tops und 14, wenn der Diskurs begann. Es gibt 2,8 Millionen Anmeldungen für mindestens einen Kurs mit dem Zertifikat, das massiv ist . Udacity und Edicts bieten auch Partituren und die Gerichte, und sie sind Zeichen Dies ist sehr billig. Die ganzen Coursera-Kurse, wie $500 auf, machen alle Wahrheitsdetails. Alle von ihnen sind weniger als $1000. Sie können eine vollwertige Zertifikate erhalten. Sie werden von einer wirklich coolen Universität unterstützt. Das ist also gut. Aber vor allem die so Studie und Peer Hilfe. Ja, da draußen gibt es ein paar Vorträge. Ja, aber vieles davon wird PM-Studie sein und sich selbst helfen. Das ist, wie Sie am meisten gewünscht, so wieder, es sei denn, sie und überprüfen Sie sie und sehen, ob Sie sie tun wollen . Als nächstes kommt der Online-Marktplatz, wo es eine Menge von Websites gibt, die Ihnen eine Reihe von Angeboten auf Kurse Online-Kurse. An dieser Stelle möchte ich sagen, dass Veto Mastro auch wir kommen mit unseren eigenen Kursen über Data Science. Also überprüfen Sie aus der gleichen Website. Hier sind zwei c. Suchen Sie nach den Kursen. Also wieder, ein kleines Marketing hier für unser eigenes Unternehmen, das wir wissen, werden auch Online-Kurse zu Data Science machen . Also auf dem Online-Marktplatz gibt es eine Reihe von Angeboten, die billig, billiger. Es ist flexibel nach Ihrem Zeitplan. Er hat Zugang auf der ganzen Welt. Also, wenn Sie ein Reisender sind, spielt keine Rolle. Sie können überall hingehen und lernen, dass, wenn Sie ein weiterer Teil der Welt auf ist nicht wichtig, Sie können es immer noch lernen. Ah, die Probleme damit, da es eine begrenzte Mentorschaft tut, wissen Sie, dass Sie allein sind. Andi, stellen Sie sicher, dass Sie die Bewertungen lesen und fragen Sie nach Meinungen zu den verschiedenen Optionen, die auf dem Online-Marktplatz wieder verfügbar sind , etwas, das Sie tun möchten. Eine sorgfältige Überlegung dafür gibt es eine neue Option, die als Bootcamp-Option bezeichnet wird . Es gibt eine neue Kategorie von Training, die kommt vorbei. Es gibt ein paar Firmen, die dieses Buch Lager Art der Ausbildung anbieten. Es ist eine intensive auf Hände Training, die für ein paar Wochen oder ein paar Monate , die wirklich Essen Fletch Projekt, die als Teil dieser Bootcamps angeboten werden, aber das Problem ist, dass Sie erhebliche Zeitinvestitionen zu machen. Einige dieser Bootcamps sind wirklich, wie Vollzeit eso Sie haben eine Scheidung wie 34 Wochen in das Boot Camp. Sie können nichts anderes tun, so dass diejenigen, die ich Verpflichtungen, die erforderlich sind. Also sind Sie auf allen von ihnen, wenn Gott eine Grafik ist und kostet, natürlich, natürlich, aber es ist eine gute Option für jemanden, der neu ist, ich d. Weil Sie ziemlich schnell einige wirklich programmierende Riel-Projekterfahrung haben, und das ist etwas, das Sie auf Ihrer Schätzung zeigen können. US-Zeh. Sie haben ein Online-Boot Camp Art von Projekt gegen etwas, das Sie gerade etwas gelesen oder eine vollständige und nur und Zertifikat. Es hat mehr Wert auf diese Weise wieder, Sie haben den Zugang beurteilen die Eignung von dieser Art von Training, Machen Sie Ihr eigenes Ding. Das letzte, was richtig ist, kommt gut. Ich werde all diese Dinge lernen, aber wie willst du deine Fähigkeiten üben? Wissen Sie, die Leute fragen Sie immer nach Erfahrung und woher werden Sie diese Erfahrung bekommen ? Sie können es von überall lernen. Es gibt viele Möglichkeiten zu lernen. Aber es gibt sehr begrenzte Möglichkeiten, für Sie gute Erfahrung unter Fähigkeiten, die Sie lernen den ersten Platz, um dafür zu suchen, wie in Ihrer eigenen Organisation, sehen, ob Ihre aktuelle Organisation einige Möglichkeiten für ihre Sinn. Das ist ein froher Ort für Sie, mehrere Gründe zu starten, wenn Sie bereits in der Organisation sind , so dass Sie durch die Organisation auf Get Some laufen Get einige Aktivitäten hier getan. Und zweitens sind Sie bereits mit dem Teig vertraut. Meine, deine Familie. Mit diesem Geschäft kennen Sie das Unternehmen und genau, wie Ihr Unternehmen das Geschäft erledigt. Jetzt sind das alles Vorteile für Sie. Sie wissen, dass Sie das als Vorteil nutzen können, um an einem Data Science-Projekt teilzunehmen. Ihre Firma hat es. Sie haben Erfahrung mit dem Unternehmen, und das macht eine große Fähigkeit für Data Science, so dass Sie das Gute in ein besseres Sinnes-Team verwenden können. Wenn Ihr Unternehmen eine gründet, ist die andere Option, dass Sie Ihr unter Dutzenden Projekt starten und Ihren Bars oder jemandem, der bereit ist zu hören, sagen , dass Sie etwas ausprobieren möchten, von dem Sie wissen, dass Sie etwas mit den Daten ausprobieren möchten dass Sie bereits haben Und sehen, ob Sie etwas klar vorhersagen können Ihr eigenes Data Science-Projekt und versuchen zu sehen, ob Sie etwas für Ihr Unternehmen finden können . Das ist ein großartiger Ort, um Fähigkeiten für Data Science zu praktizieren. Es gibt eine offene Wettbewerbe zur Verfügung. Es gibt eine Reihe von Websites, die tatsächlich Gastgeber eine Menge offener Wettbewerbe, obwohl sie kommen mit einigen Leuten bieten Datensätze an diese Unternehmen, so dass sie oft diesen Datensatz für den öffentlichen Verbrauch. Und sie stellen auch ein Problem Statement auf, dass Jeder auf der ganzen Welt an ihnen teilnehmen kann . Lösen Sie sie. Es gibt einige Anreize und Preise für sie. Das Gute daran ist, dass dies reale Szenarien sind Probleme, die Sie zu lösen versuchen. Sie können von diesen Websites und Kagel Crowd auf unserem X k d d Cup Hacker-Rang lernen. Sie können sich die bestehenden Wettbewerbe ansehen. Sie können sich die Einreichung ansehen, die diese Leute andere Leute getan haben, und lernen, wie sie die Probleme lösen. Sie können am selben Datensatz üben und sehen, was Sie finden können. Sie können auch an diesen Wettbewerben teilnehmen, um zu sehen Haben Sie durchgeführt? Dies sind alles großartige Optionen für Sie, um Ihre Fähigkeiten zu üben, die Sie so immer von ihnen gebaut haben . Aber es gibt, dass die Leute gehen, um zu fragen Haben Sie Ihre Fähigkeiten praktiziert, dass Ihre praktische Erfahrung und das sind ein paar Orte. Aber Sie können gehen und bauen es Zweckmäßigkeit so höher diese Präsentation war nützlich für Sie in Bezug auf haben Sie Ihre Fähigkeiten zu bauen. Danke. 16. Suche nach Möglichkeiten: Hallo. Das ist dein Lehrer, Cameron. In diesem Abschnitt werden wir uns ansehen, indem wir Möglichkeiten finden, in der Datenwissenschaft zu arbeiten. Samstags fangen wir mit Datenwissenschaftlern an. Sie haben vielleicht schon von bestellt gehört, aber Rechenzentren Gehälter gehen durch das Dach auf. Das ist eine Tatsache, nicht nur ein Hype. Ihre Gehälter sind hoch für Daten. Wissenschaftler, Europa und Asien liegen später zurück. Die Wissenschaft nimmt in Europa immer noch auf. In Asien USA typischerweise an der Spitze der Technologie. Jede Technologie beginnt normalerweise in den USA . . Es beginnt im Silicon Valley. Es beginnt in der neuen sind Sie Homosexuell Bereich und dann beginnen, sich über uns zu verbreiten und dann dauert es einige Zeit, bis es in Ihre offene. Isha, Die größeren Zeichen nehmen in Europa in Asien immer noch zu, und Währungsquoten spielen auch einen Faktor in Bezug auf die Löhne, die in verschiedenen anderen Ländern angeboten werden . Eine gute US-Umfrage Gehaltsbefragungen von Birkenwerken dot com zur Verfügung. Sie passierten in einer sehr guten Gehaltsbefragung für Abendessen Wissenschaftler in den USA Die Gehaltsbefragung erzählt Ihnen über verschiedene Berufskategorien, verschiedene Fähigkeiten, die auf verschiedenen Gebieten erforderlich sind als wir und welche Art von Vernunft sich der Befehl näherte Gehaltserhebung nehmen Sie einen Blick auf sie. Die Gehälter sind in der Regel besser als andere I D Disziplinen. Dies ist eines der höchsten bezahlten Gehälter innerhalb der Idee. Domain für Datenschilder Manager, natürlich. Bist du eins besser drauf? Es ist eine großartige Gelegenheit. Wenn Sie ein erfahrener professioneller Übergang von einem regulären sind, würde ich während einer Wissenschaft arbeiten. Die Data Science Gehälter sind gut auf. Neue Möglichkeiten sind Hund kommen. Das ist also etwas Erfahrenes. Professionelle Shooter wahrscheinlich betrachten den Übergang in Data Science. Also, was sind die Chancen in verschiedenen dummen verschiedenen Ländern? Geographien und Start mit Die USA USA ist das führende Land für Data Scientists Software und wo Unternehmen auf ihre Aufstiegs-Expertise aufbauen. Große Unternehmen wie Lincoln und Google und Facebook und Amazon. Jetzt haben diese Leute pro in die Welt Was Sie mit Datensinn tun können. Sie haben riesige Datenzeichendampf und riesige Investitionen und Datenwissenschaft auf ihre gemachten Millionen von Dollar mit Datenzeichen bereits, und sie haben der Welt gezeigt, wie Datenzeichen im Geschäft verwendet werden können. Jetzt gibt es eine Reihe von neuen Saucen-Startups, die kommen. Sie konzentrieren sich auf irgendeine Form von Datenzeichen. Wissen Sie, einige der Unternehmen, die für Datenzeichen als Service sind, einige für Werkzeuge und Technologien. Also gibt es eine Menge Arbeit los in Datenzeichen in der U geht interplace. Andere kommerzielle Unternehmen beginnen, Datenzeichen zu nutzen, um ihre Geschäftsergebnisse zu verbessern . Sie sehen, was die großen Unternehmen wie LinkedIn und Google und Facebook getan haben. Sie versuchen zu sehen, ob sie wieder das Gleiche mit ihrem Dota machen können . So haben unsere Unternehmen Investitionen, viel Geld und Charakter investiert, viele Daten im Laufe der Jahre. Sie versuchen also zu sehen, ob sie spätere Zeichen verwenden können, um etwas mit den Daten zu tun, die sie bereits haben, und damit beginnen, Geschäftsergebnisse vorherzusagen. Wir sind also das Reduktionsland für Data Science. An dieser Stelle sprechen Beratungs- und Outsourcing-Jobs nur Beratung. Ja, es gibt viel mehr Möglichkeiten in der Beratung mit kommt in ihre Zeichen, weil viele Unternehmen versuchen, zuerst ein Gefühl Art von Sache zu tun, versuchen, einen Berater zu bekommen, um die Daten zu sehen und zu sehen, ob es Möglichkeiten gibt sie anfangen, in ihr eigenes Ding auf Outsourcing zu investieren, ist eine Art von Abholung. Menschen sind nicht in der Umkippung Outsourcing, die so viel in ihrer Wissenschaft sind, aber es könnte später kommen. Outsourcing ist nur aufholen. Unsere Frage ist, wenn Sie in Europa wohnen, wissen Sie, was sind Ihre Chancen? haben gearbeitet. In der Tat sind Heilige. Im Allgemeinen hinkt Europa die USA um etwa ein paar Jahre in Bezug auf die Einführung von Technologien. Also beginnt jede neue Technologie typischerweise in den USA USA und dann langsam Mostow, Europan, Isha, eine Technologie-Annahme nimmt nur auf. Es gibt viel sporadisches Interesse an Gefahrenzeichen über Radius-Unternehmen, die Sie tun können, können eine beträchtliche Zunahme dieser Chancen auf der Linie erwarten. In ein paar Jahren können Sie sehen, viel mehr interessante Daten Sinn Unternehmen machen viel mehr Investitionen und Daten Zeichen auf viel mehr Stellenmöglichkeiten kommen für Datenzeichen in ganz Europa, erwarten Chancen in der Finanzen, Banken-, CRM- und Wissenschaftssektoren, diejenigen der Bereiche, in denen Sie einige viel Wachstum in der Datenwissenschaft in Europa sehen würden beginnen wieder auf unsere Daten Saints Angebote aufzubauen. Aber die gute Nachricht ist, dass es natürlich viele Angebote von Weber gibt, die jeder von überall auf der Welt lernen kann . Bildung sollte also kein Problem für die Menschen in Europa sein. Die Jobmöglichkeiten werden mit der Zeit anfangen zu sinken. Also, das sind die Neuigkeiten. Was ich eine Pazifik-Australien ausgeben würde, ist führend in beiden Chancen und Gehälter, wenn es um Datenzeichen geht tatsächlich der Ausländer für Data Science in der Region Asien-Pazifik . Singapur zeigt viel Versprechen, und es gibt Anzeichen, die ein großes Interesse an diesem kleinen Gebiet zu sein scheinen. Business Arrests zeigen Interesse daran, Data Science-Teams aufzubauen und einige Data Science Arbeit zu erledigen , so dass Sie in Singapur Möglichkeiten für Datenzeichen finden werden. China fängt langsam an, die Technologieeinführung Teil des Geschäfts aufzuholen. Sie haben noch nicht viel von der geschäftlichen Akzeptanz gesehen, nur eine Technologie, eine Technologie-Einführung, die von Kurs zu wachsen beginnt , werden Sie mehr Chancen in China sehen. Indien verbrennt eine bedeutende Talentbasis, denn es gibt Anzeichen dafür, dass Marktplätze in Indien abschalten , die ihre Wissenschaftskurse ausschalten. Die Studierenden haben Interesse gezeigt und diese Kurse abgeholt. Offshore-Unternehmen bauen Insel und Vorfreude auf Arbeiten. Viele Unternehmen investieren indisch, USA und Stil, und und Aufbau eines Breda's in Sterling auf und und Indien wird weiterhin toe ein großer Off-Source-Ressourcen-Anbieter sein , wie sie in i d sind. So werden Sie sehen, ein beträchtliche Talent Playoff. Talentiert. Was? Wir und das Europa in den kommenden Jahren aus Indien. Das ist, wie, ah, die verschiedenen Geographien in Bezug auf ihre Data Science-Möglichkeiten heute größer sind. Wo finden Sie Jobs? Wissen Sie, Beginnen wir mit was sind Sie die Positionen, für die die Leute fragen? gibt es Natürlich mehr technische Arbeitsplätze als Führungspositionen. Türzuweisungen werden immer noch im Sprachgebrauch betrachtet. Oft sind I D Team im Engineering-Team, so dass der Regelmäßigkeitsmanager des Engineering-Managers in der Regel weiterhin die Data Science-Teams zu verwalten , so dass es mehr technische Jobs als Management-Positionen. An dieser Stelle, Titel für die Jobs sehr wie ihre Zuweisungen Advanced Knowledge nimmt Data Engineering, Datenmanagement, Predictive Analytics. Diese Menge schneidet verschiedene Arten von Titeln ab. Die Titel, die sie herauskommen. Was für Sie wichtig ist, ist, in die Jobanforderungen zu schauen, um zu verstehen, was die genaue Rolle ist. Schauen Sie sich also die Jobanforderungen an und sehen Sie, was es ist. Was der Job Sie von Ihnen verlangt zu verstehen, was genau diese Rolle sein wird. Es gibt also viele Namen, die auf der ganzen Welt verwendet werden. Datenwissenschaftler. Hübsche Mittag. Also, wissen Sie, nicht viele haben mehr als zwei Jahre Erfahrung. Also was das bedeutet, ist, dass, wenn jemand nach Data Science Jerious Öffnung fragt, er nicht viel Erfahrung finden wird. Die Leute spielen dafür. Bildung und Begeisterung könnten also großartige Alternativen zum Erleben sein. Weißt du, du kannst dich immer noch bewerben, und du weißt, dass du daran interessiert bist, etwas Neues zu lernen. Du weißt, dass es interessant sein könnte, dich zu rekrutieren. Das werden nicht viele Menschen sein, die mehr als zwei Jahre Erfahrung in der Datenwissenschaft haben . Obwohl die Position etwa sieben Jahre und 10 Jahre Erfahrung in Data Science erfordert . Sie werden nicht so leicht jemanden mit dieser Art Erfahrung finden. Was für andere Job-Sakes? Freitag können Sie gehen, um nach Jobs für die Heiligen zu suchen. Internet wird weiterhin die beste Suchoption für Chancen sein. Kein Internet ist in der Tat fast wie das Hinzufügen von 90% der Arbeit. So gerade heute passieren über das Internet und alle regulären allgemeinen beliebten Job-Websites tun Cataldo die Spezialisierung. Du weißt, wo immer. Wo auch immer Sie nach Jobs für 80 gesucht haben, können Sie dorthin gehen und nach ihrem Leben und Jobs suchen . Es gibt nichts Besonderes daran. Eine hier gilt als ein Harz gilt als eine der Kategorien große Kategorien innerhalb I . D. Jobs, damit Sie dorthin gehen und nach der Spezialisierung suchen können. Ich werde hier nicht mehr darüber sprechen, welche Job-Größe Websites zu verwenden. Vielleicht sind Sie bereits Familie mit vielen dieser Job-Websites, also gehen Sie und verwenden Sie, was auch immer Sie sich wohl fühlen. Sie sollten in der Lage sein, nach ihnen zu suchen. Es gibt einige spezialisierte Websites, auf denen Sie signierte spezifische Aufträge von Daten finden können. Dies sind Websites, dedizierte Datenwissenschaft, so, wie Daten signiert, zentrale Ladung und Cody Nuggets sind einige Website, die ich die Datenwissenschaft gewidmet. So viele Daten Menschen, die für Data Science Profis suchen, machen ein Spiel auf dieser Website. Sie haben kein Jobforum, in dem sie auf einen Teller gehen. Also tun, was Sie könnten überprüfen Sie diese Väter, weil sie bieten Daten Cent exklusive Jobs in diesen Websites, Bildung und Ausbildung. Sehr gute Jobs, über die wir sprechen, wenn diese Aus- und Weiterbildung, Ausbildung der Bildung, Jobs wie ein Professor und Ayla Zeichen sind ein Dozent und Daten Zeichen Lehrer. Und es gibt Anzeichen, auch diese fangen an zu holen. Das ist also eine weitere Gelegenheit für Sie, sich zu bewahren, das Östrogen in Phantasie zu schützen. Aber Beratungsplätze sind dagegen, eso abzuholen. Sie könnten auch für diese Art von Jobs suchen, wissen Sie, Beratung für Datenzeichen, temporäre Jobs in einem Vertrag Job. Sie fangen auch an, abzuholen. Aber sie sind immer noch in einer Art Phantasie, wenn es um ihre Zeichen geht. Der beste Ort, um nach einem Data Science-Job zu suchen, ist heute Ihr derzeitiges Unternehmen. Das ist meine persönliche Meinung. Warum ist Ihr jetziges Unternehmen der beste Ort, um nach einem Dutzenden Job zu suchen, weil Sie bereits wissen, dass es meins tut. Unternehmen und Organisation. Domain Geschick und Know-how ist eine sehr wichtige Fähigkeit, wenn es um Abendessen Schilder geht. Und Sie haben bereits diese Erfahrung für Ihr derzeitiges Unternehmen, den großartigen Ort, um , Ihre neu entwickelten Fähigkeiten zu spielen,die Sie durch eine Ausbildung gegangen sind. Wenn du etwas Geschicklichkeitsset aufstellst, brauchst du einen Platz, um es zu spielen. Ihr derzeitiges Unternehmen ist ein großartiger Ort für ein Flugzeug. Wie kannst du das machen? Ist Sie anbieten können, in einem sinnvolleren Projekt zu arbeiten. Weißt du, wenn du Leute hast, kannst du mit einigen Leuten reden, und das hast du. Sie können selbst eine Gelegenheit erfinden, mit Ihren Leuten sprechen. Dein Manager. Es ist Manager bei Sagen das. Okay, ich denke, ich kann Data Science zu etwas hier verwenden. Ich kann einige Daten verwenden, die wir hier haben, und versuchen, die Daten zu betrachten und zu sehen, ob es etwas gibt , das ich eine Art Geschäftsmöglichkeit finden kann, eine Art von Implementierung des Geschäfts. Ich kann mit Predictive gehen und andere Tage, die Sie in Ihrem eigenen Unternehmen tun können, das ist großartig weil Sie einen Job in Ihrem Unternehmen finden können, um Ihr Ding zu tun. Sie werden einige Erfahrung auf Ihrem Unternehmen wird auch profitieren angeboten. Und Sie werden sich , leisten oder nicht in Ihrem Unternehmen,wenn es um Technologie geht. Also sind all diese großartig für dich. So schaffen Chancen, wenn Sie können, innerhalb Ihres eigenen Unternehmens, so können Sie ich nur für Projekte Geschlecht. Deine Manager kontrollieren. Welche Datenwissenschaft kann das Geschäft verbessern. Zeigen Sie mögliche harte Einnahmen sind Kosteneinsparungen in Projekte, und das ist am wichtigsten, ihre Zeichen. Der Vorteil, den Sie projizieren werden, aber Datenwissenschaftler müssen so etwas wie harte Einnahmen und harte Kürzungen sein. Kostenersparnis Hast du ein Projekt? Sie sind sicher ein paar Dollarzahlen. Die Leute werden sich interessieren. Sie können genug zu einem Projekt sagen. Sie können ein kleines Projekt machen. Weißt du, das kostet vielleicht nicht viel Geld. Wenn Sie vorhandene Ressourcen verwenden, zeigen Sie einige Einnahmen auf def. Diese Einnahmen. Denken Sie Beweise oder Tabak? Ja, Ihre Firma könnte in Datenzeichen wachsen. Zumindest erhalten Sie eine Gelegenheit, in dem realen Projekt zu arbeiten und etwas zweckmäßig zu bekommen. Ihre derzeitige Firma ist also ein tolles Bett, wenn es darum geht , , Ihre eBay-Fähigkeiten zu nutzen und etwas Zweckmäßigkeit zu gewinnen. Ich hoffe, diese Präsentation waas nützlich für Sie. Danke. 17. Schlussbemerkung: der Lehrer, Cameron, hier haben wir zum Ende der wollen ein Data Scientist Kurs sein ein großes Dankeschön für Sie für die Anmeldung für den Kurs und als Student gekommen. Wir hoffen, dass dieser Kurs für Sie nützlich ist. Wir fügen Lese einen Master mit einem Kurs Ziel gesetzt, um Sie auf was zu erziehen? Das Feld der Daten Zeichen Alle an Bord. Und ich glaube, das haben wir erreicht. Also danke für Ihre Zeit. Wir hoffen, dass dies uns Dies war eine lohnende Erfahrung für Sie. Wenn Sie den Kurs nicht mögen, machen Sie bitte die positive gemeinsame für den Kurs auf, bitte empfehlen Sie den Kurs den Leuten, die Sie kennen, damit alle anderen davon profitieren können . Freuen Sie sich nicht auf weitere Kurse zu Datenschildern von Vito Mastro. Dies ist Ihr Lehrer ruhiger und abmelden. Vielen Dank durch