Azure Data Factory für Anfänger

Eshant Garg

Erhalte unbegrenzten Zugang zu allen Kursen

Lerne von Branchenführern, Ikonen und erfahrenen Experten

Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Erhalte unbegrenzten Zugang zu allen Kursen

Lerne von Branchenführern, Ikonen und erfahrenen Experten

Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Einheiten dieses Kurses

- 1.
  
  Willkommen und Voraussetzung
  
  1:47
- 2.
  
  Datenlebenszyklus
  
  3:41
- 3.
  
  Azure Lösungen
  
  3:36
- 4.
  
  Was ist Azure Data Factory
  
  4:37
- 5.
  
  Schlüsselkomponenten der Data Factory
  
  4:46
- 6.
  
  Pipeline - 4 Schritte
  
  2:13
- 7.
  
  Demo Einführung
  
  0:57
- 8.
  
  Azure Data Lake Storage Gen 2 Konto erstellen
  
  6:26
- 9.
  
  Azure SQL Data Warehouse bereitstellen
  
  6:10
- 10.
  
  Bereitstellung von Datenfabrik
  
  1:39
- 11.
  
  Kennst du Azure Data Factory UI
  
  8:21
- 12.
  
  ETL
  
  11:07
- 13.
  
  Berechtigungen
  
  3:00
- 14.
  
  Data
  
  9:57

Anfänger-Niveau

Fortgeschrittenes Niveau

Jedes Niveau

214

Teilnehmer:innen

Projekte

Über diesen Kurs

In diesem Kurs werden wir Azure Data Factory und einige der anderen Dienste erforschen, die wir für die Erstellung der Data Factory Lösung verwenden.

Wir werden diskutieren

Was ist Azure Data Factory?
Es sind wichtige Komponenten wie verknüpfte Dienste, Aktivitäten oder Pipeline,
wie funktioniert es?
Es sind Vorteile und wie du den Workflow planen und überwachst.

wir werden auch eine Demo zur Verwendung von Data Factory durchlaufen, in der wir Daten aus Azure Data Warehouse in Data Lake Gen 2 Storage verstellen und transformieren

Grundsätzlich werden wir also einen Workflow erstellen, der automatisiert, um Daten aus einer bestimmten Quelle zu übernehmen, etwas zu transformieren und dann die Ausgabe an einem anderen Speicherort abspeichern und von wo aus es für die weitere Analyse abgeholt werden kann.

Triff deine:n Kursleiter:in

Eshant Garg

Kursleiter:in

Vollständiges Profil ansehen

Skills dieses Kurses

Entwicklung Sonstiges zur Entwicklung Data Science

Level: Beginner

Praxisnahes Kursprojekt

Um diesen Kurs zu üben, brauchst du nur Azure

Vergessen Sie nicht, Ressourcen nach der Demo zu löschen.

Karan Tulaskar 3 Likes

Kursbewertung

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Nimm an prämierten Skillshare Original-Kursen teil

Jeder Kurs setzt sich aus kurzen Einheiten und praktischen Übungsprojekten zusammen

Mit deiner Mitgliedschaft unterstützt du die Kursleiter:innen auf Skillshare

Lerne von überall aus

Ob auf dem Weg zur Arbeit, zur Uni oder im Flieger - streame oder lade Kurse herunter mit der Skillshare-App und lerne, wo auch immer du möchtest.

Transkripte

1. Willkommen und Voraussetzungen: Hallo und willkommen zu dieser Sitzung auf einer George Data Factory. Mein Name ist der Shang Good. Und ich werde ein Kerl als der Forscher sein, ein George es eine Fabrik und einige andere Dienste, die wir verwenden werden, um Data Factory-Lösung zu bauen . Wir werden diskutieren, was ein Jude hat eine Fabrik, seine Schlüsselkomponente Etikettierung Dienstleistungen, Aktivitäten oder per Flugzeug, wie es funktioniert, seine Vorteile und wie Sie tun und überwachen Workflow. Wir werden auch durch Demo gehen, um Data Factory zu verwenden, in der wir Daten von einem George Data Warehouse in datenbeinschonende Speicherung verschieben und transformieren werden. Also im Grunde sehr Workflow entwickelt, der mich automatisch ,um Daten aus einer bestimmten Quelle zu nehmen , , eine Transformation zu machen, und dann werden wir die Ausgabe einige andere Geschichten speichern, Ort, von dem es für abgeholt werden kann die Analyse. Um diesen Kurs abzuschließen, werde ich dafür sorgen, dass Sie Aktivitäten in die Hand bekommen. Ich werde Sie nicht nur belehren, sondern Sie werden auch eine Chance bekommen, das selbst zu versuchen. Und dazu brauchst du nur eine Joseph Fiction. Und das Joy-Abonnement könnte eines sein, das Sie bereits haben, oder Sie können sich für eine kostenlose Testversion anmelden . Außerdem ist es gut, mit Menschenkonzepten vertraut zu sein. Am Ende dieses Kurses haben Sie ein solides Fundament auf einem George es beeinflusst Baum. Fangen wir von vorn an, General. 2. Datenlebenszyklus: Lasst uns diesen Schnee, der kleine Lebenszyklus. Im Leben Amerikas gibt es viele sieben Etappen. Daten können aus vielen internen und Aktionen und Quellen stammen. Es können Überzeugungsdaten aus Anwendungen sein oder vielleicht Protokolldaten aus dem System für fast kontinuierlichen Stream von Daten von Geräten wie ich denke, im Hals Off Things und all diese verschiedenen Quellen produzierten die gleiche Art von Daten, aber in verschiedenen Kommentare, weil sie die unterschiedliche basierte Kommunikation haben können. Also der Punkt ist in guten Daten sagen, aber bilden es wirklich anders. Die erste ein Formular. Wir brauchen eine Art von Geschichten. Werfen Sie das Leben zweite aus Daten, wo wir Daten in verschiedenen Phasen außerhalb des Lebenszyklus speichern können, dann viele etwas zu verbinden und die Daten aus verschiedenen Quellen greifen. Es ist eine Beckensammlung. Dann muss er vielleicht die Daten vorbereiten. Wenn es darum geht, Daten aus verschiedenen Quellen zu erhalten, alle Systeme, haben sie möglicherweise eine etwas andere Form. Es liegt daran, dass Quellen vermissen die Daten anders gestohlen haben. Zum Beispiel kann dieselbe Spalte unterschiedliche Genehmigungen in verschiedenen Quellen haben. Einige von ihnen können auf dem Stream haben. Einige von ihnen haben wir die Nummer einige erlaubt die Metallwerte und einige können auch zulassen, dass der Rohling verlieren wird. So haben wir eine saubere die Daten, bevor wir wirklich beginnen können, in die tatsächliche aufgenommen, weil Geschichten, die wir den Beruf oder eine anfängliche Transformation nach der anfänglichen Transformation zu tun haben , konvertieren Daten in konsistente ehemalige hey tatsächlich in den Speicher vorhanden war. Dann denken Sie über die Verarbeitung nach, wenn der Prozess, den wir tatsächlich die Daten transformieren und Transformation verschiedene Dinge bedeuten kann. Aber letztendlich passierten wir, transformierten diese Straßendaten in eine Struktur und normalisieren zweite. Größer in einer Weise, dass es die Forderung des ersteren bedeutet off und System, weil diese und Systeme wirklich gehen, um die Analyse zu tun, alle Interpretation. So gibt es viele Menschen Phasen, die die Daten, die wir durchlaufen, und einige davon können sogar Zyklen, die mich mehrmals zur Verarbeitung und Transformation gehen lassen. Tatsächlich in dieser Welt sehr oft noch nicht, wissen wir in dieser Welt sehr oft noch nicht,was die geschäftlichen Fragen sind, die wir in Zukunft stellen werden und welche Daten wir brauchen, um diese Fragen zu beantworten. Also ist die Idee, alle Daten zu behalten, so dass wir später wieder kommen und Einheit wie erworben. Wir analysieren ständig das spätere, das wir vom Vikar lernen, die kontinuierliche Retune eines Modells und nehmen weitere Veränderungen in der Transformation vor. Das ist also ein genereller Prozess, aber wirklich der wichtigste Teil Was wir hier tun, ist, dass wir Daten von der Quelle erhalten, die Senior und schließlich in das Ziel versinken, und all die Bits dazwischen , die nicht in einer Methode passieren und der Moment, der nützlich für das gleiche, so dass wir diese Analyse von in Form ausführen können, so dass wir die Intelligenz, die mein Geschäft tatsächlich führen zu bekommen. 3. Azure Solutions: in dieser Lektion möchte ich den Rand der Lösungen vorstellen, die unsere Familie Technologien lebten wir in seiner um den Kontrollfluss und den Datenfluss, ob Kontrolle langsam. Wir hatten eine Job-Datenfabrik. Das sorgt dafür, dass Orchestrierung und sie tut. Dann haben wir die eigentlichen Datenflusslösungen. Dies sind Adjudicator Brüche über den Rand der tatsächlich innerhalb oder eines der Dienste alle Funktionen zu besitzen. Die spätere zumindest der Kontrollfluss ist die Orchestrierung, die sie ausmacht Aktivitäten. Eine spätere Etage ist der Fluss aus dem tatsächlichen später innerhalb der Aktivität, wenn der Kaltstrom gebildet werden sollte , zum Beispiel mindestens eine Aktivität . Nehmen wir an, wenn Sie den Blockbrecher nehmen und ihn buchstäblich jetzt senden möchten, ist dies ein Datenfluss. Nun, innerhalb dieser Aktivität, werden sie verschiedene Schritte potenziell sein. Zum Beispiel müssen wir Daten aus Block erhalten. Dies ist Schritt eins und dann eine wichtige Daten nur, die Schritt toe sein wird. Und zwischen diesem Schritt werden sie wahrscheinlich zuordnen, um bestimmte Werte aus dem Blob zu nehmen und sie auf bestimmte Dateien innerhalb buchstäblich zu treffen . In ähnlicher Weise gibt es in der Nähe der anderen Aktivitäten Vielleicht gibt es einen Transformationsdatenfluss, der die Daten aus den Daten Lee nimmt . Und das ist eine Transformation, zum Beispiel, vielleicht soziale Gelenke für die Daten, aber älter oder verschmilzt mit anderen Dingen, die es tun kann. Aber der entscheidende Punkt ist, dass es die Rohdaten in Performer transformiert und die Struktur, die von der Endanalyselösung weiter genutzt werden kann. Und das ist ein erfolgreicher , der durch einen grünen Pfeil dargestellt wird. Dann sind sie auch Failure Flow, die durch den Roten Pfeil dargestellt wird. Wenn es also einen Fehler in der vorherigen Aktivität gibt, dann würde die Orchestrierung oder der Kontrollfluss jetzt verschoben, um es ein leitendes FBI zu nennen. Also im Grunde können wir das. Wir sind darauf, einen vollständigen Fluss aus den verschiedenen Aktivitäten zu haben, die den End-to-End-Lebenszyklus von den Daten abschließen . Nein, die Orchestrierung schlechten Kontrollfluss ist verantwortlich für die Beanspruchung dieser Schönheiten, die jede Hand einen Datenfluss in ihnen. Dann gibt es verschiedene Arten von Datenfluss. Zum Beispiel das Rendern von Daten Pose. Dies integriert sich in der Regel mit Dingen wie Power Equity, und das ist alles über Datenberuf, Hinzufügen von Spalten, Spalten aufteilen oder vielleicht einen vollständigen No Name nehmen und es wird Vorname und Nachname ändern , dann sind sie nichts dagegen. Zum Beispiel verbinden sich Schwerter Marges Einsatz oder das Aggregat Suchen Sie all dies und alle ähnlichen Transformationen. Also haben wir die unterschiedliche Transformation auf unterschiedlicher Basis verwendet, wie, zweitens, diese streitenden Datenflüsse nahe dem Anfang, als es die Daten im Brief vorbereitete. Und dann denke ich an die Mapping-Datenflüsse, die tatsächlich den Führer transformieren, ihn in eine Form bringen, die wir für diese Analyse benötigen. 4. Was ist Azure Data Factory: Sie werden eine Fabrik ist ein verwalteter Datenempörungsdienst, der in der agilen Cloud lebt . Ein George es wirkt Baum ist wie eine Gesellschaft ist alles Agent Job implode außer dass ein Judit beeinflussen Baum Es gibt viel speichern alle Daten von sich selbst oder es hat keine Transformation von selbst. Wenn Sie jemals auf S s Augen oder in Komitee Mädchen gearbeitet haben, alle anderen idealen Werkzeuge. Sie hatten ihre eigenen Transformationsfunktionen, aber Idee einfach mit anderen Quellen verbinden Destination und Übertragungsdienste Quellen und Zielverbindung könnte in vor Ort oder in Kleidung sein und es verbunden verschiedene andere Transformationsfunktionen Komponenten Alle Dienste außerhalb der Cloud wie sie verwenden gleich , hoch oder Schwein alle anderen Dienste wie das und die erforderliche Arbeit zu erledigen. Also, was bedeutet es? Ein Job bietet viele Technologien, die Ihnen dabei helfen, den Wert Ihrer Daten zu steigern. Zum Beispiel gibt es einen Jury Blob Storage, der billigere Cloud-Storys bietet. Sie speichern Ihre Daten. In der vorherigen Sitzung haben wir eine Datenleck-Analyse diskutiert, die wir zum Massieren und Transformieren Ihrer Daten verwenden. Und es gibt ein Juwel Geheimnis Ihres Hauses, das skalierbares relationales Data Warehousing bietet das Sie verwenden können, Ihr Geschäft zu verstehen, und es gibt viele andere Anpassungsdienste, die für verschiedene Zwecke verfügbar sind. Sie können diese Ajo-Services nach Bedarf kombinieren und anpassen, um sowohl die Struktur als auch unstrukturierte Daten zu analysieren . Aber es gibt keinen wichtigen Aspekt von Data Analytics, den keiner von ihnen angesprochen hat, nämlich Datenintegration. Data Indication bedeutet also, Daten aus der Quelle zu extrahieren, dann eine Transformation durchzuführen und sie dann in ein Data Warehouse für die Datenanalyse zu laden . Und wenn jede dieser Aufgaben mental erledigt werden kann, ist es sinnvoller, sie zu automatisieren und ein Judita Factory Service hilft Ihnen, diese Aufgabe zu automatisieren . Denken Sie an Data Factory. Wird es in einem Orchester in einem Orchester dirigiert? Dirigent spielt nicht die Musik, aber er verlässt die Gruppe von Musikern, die Musik auf verschiedenen Bühnen Off Symphony produzierten. Der Dirigent hat ein großes Bild aus dem ganzen einfach, und es ist ein Weg von der Musik große Leistung, aber die eigentliche Musik wird von indirekten Musikern gespielt. In ähnlicher Weise führt das betroffene Datum nicht die eigentliche Arbeit aus, die zum Transformieren der Daten erforderlich ist, sondern weist andere Dienste wie Datenbrüche oder Datenlink-Analysen an, die Daten so vorzubereiten und zu transformieren, dass es sich um Datenlink-Analysen oder Datenbrüche, die die tatsächliche Arbeit ausführt, nicht die Data Factory Data Factory, Mittlere E orchestrieren oder Übersee die Ausführung aus Arbeit. Eine Jury Data Factory ist also ein Service in einem Job, den Sie verwenden können, um Ihren Big Data-Workflow zu übernehmen und ihn in einer so genannten Pipeline zu kapseln. Und diese Pipeline umfasst alle erforderlichen Aktivitäten Kopieren und verarbeiten Sie die Daten und bringen Sie sie an den Ort, an dem Sie sie benötigen. Und Sie können diese Aktivität tun, so dass Ihre durch geplante Ereignisse auf, wenn Behandlung, wiederkehrende Basis, wenn Sie wiederholt die gleiche beste Transformation zu Ihren Daten auf regelmäßige tun . Dies ist Data Factory ist nicht lt oder Extrahieren von Last- und Transformationswerkzeugen. Also, wie unterscheidet es sich von einem Deal? Es ist eine Größe. Sie erwarten, dass die später transformierten Daten mit Transformationen der Gebäudegesellschaft und laden die Daten im Ziel Es gibt in der Data Factory. Sie extrahieren einfach die Daten aus der Quelle und laden sie in das Ziel. Und die Transformation erfolgt im Target-Datenspeicher 5. Schlüsselkomponenten der Datenfabrik: Justin, wie geht es euch beiden? Machen wir uns mit einigen der wichtigen Idiotenkomponenten vertraut. Diese Komponenten arbeiten zusammen, um die Plattform bereitzustellen, auf der Sie die Arbeit mit Schritten zum Verschieben und Transformieren der Datenlink-Dienste entwerfen können . Lose Services sind nichts anderes als nur ein Verbindungsstrom, eine Verbindungsinformationen definiert, die für die Data Factory benötigt wird, um eine Verbindung mit externen Quellen herzustellen. Dies kann einen ganzheitlichen Datenbanknamen enthalten. Ordner-Anmeldeinformationen suchen UTC. Abhängig von der Art des Auftrags kann jeder Datenfluss einen oder mehrere Link-Dienste haben, z. B. Kursivgeschichten. Verknüpfungen Umfragen haben eine Verbindungsdehnung angegeben, um eine Verbindung mit den alten Daten herzustellen. Lick Studenten Konto zu der Zeit war Aufnahme. Die Ideen der Schule können sich mit mehr als 80 verschiedenen Datenquellen verbinden. Grundsätzlich hat es ein Capital T, um fast alle möglichen Datenquellen zu verbinden. Lassen Sie uns es die Struktur der Daten darstellt. Es spitz einfach Zehe einen Unterschied. Daten, die Sie in Ihren Aktivitäten verwenden möchten, wie in allen Ausgabedaten sagt, können einen Tabellennamen enthalten. Schließlich, Datenstruktur, ein Sektor, Aktivitäten der Gegenwart und Aktion, um auf Ihre Daten durchzuführen. Der Verarbeitungsschritt in der Pipeline könnte dies Datenbewegungstransformationen oder Steuerungsflussaktionen Aktivitätskonfigurationen sein , die besagten Dinge wie Datenbankabfrage, Speicher, Genauigkeitsname enthalten Speicher, . Es gibt Standorte an. Es Sektor und Aktivität kann Jiro oder mehr Eingabedaten nehmen sagt, und produzieren eine oder mehrere oder setzen Datensätze. Idiotische Aktivitäten konnten verglichen werden. Toa bewerten Augen Datenfluss Aufgabe Opulenz wie Aggregat-Skriptkomponente. sei denn, Sie können beispielsweise eine Kopieraktivität verwenden, um Daten aus einem Datenspeicher, einem anderen Datenspeicher zu kopieren . In ähnlicher Weise können Sie die hohe Aktivität verwenden, die das Hoch darstellt, das bereits an der Kante oder den Kanten innerhalb des Clusters vorhanden ist, der den gesamten Analysator noch tiefer transformiert hat. Wir haben drei Arten von Aktivitäten angenommen. Holen Sie sich eine Frau Aktivität, abschrecken Stadt Unterwerfung Aktivität und Kontrolle Aktivitäten. Mein Plan ist ein logisches Brooklyn außerhalb von FDP, das eine Reihe von Prozessen wie das Extrahieren von Daten, Umwandeln und Laden in eine Datenbank Data Warehouse oder irgendeine Art von Geschichten durchführt Daten, . Zum Beispiel, wenn ich planen kann eine Gruppe von Aktivitäten in nur Daten enthalten kommen erstaunliche Astri und dann ein Funken eine Abfrage innerhalb Azure Gate Oblates Toaster. So partitionieren Sie die Daten. Die Data Factory kann ein oder mehrere Doppelebenen haben, und jeder nach Plan würde eine oder mehrere Aktivitäten enthalten . Verwendung von Pipelines macht es viel einfacher, Personen logisch verwandte Aktivitäten zu tun und zu überwachen . Der Vorteil aus diesem ist, dass die Pipeline und ermöglicht es Ihnen, die Aktivitäten als Satz zu verwalten versichern die Verwaltung jeder einzeln. Die Menschen Erbsen in einer Pipeline können zusammen geändert werden, um sie sequentiell zu öffnen. Nun, sie können nicht unabhängig parallel operieren. Zum Beispiel, wenn mein Plan eine Gruppe von Aktivitäten enthalten könnte, die Daten aus lokalen kopieren, könnte dies buchstäblich und dann gleiche Kredi verwenden, könnte diese Daten transformieren und schließlich die Daten in ein Data Warehouse laden. Zahlen repräsentieren die Einheit aus Verarbeitung, dass kleine Köpfe, wenn eine Rohrlandausstellung gestartet werden musste, weil sie repräsentieren, dass sie Konfiguration für Pipelines. Sie enthalten Konfigurationseinstellungen. Lasst uns anfangen und enden. Hat diese Situation, wenn Sie sehen, Zahlen sind nicht militärischen Teil von Abia Umsetzung, sie sind nur erforderlich, wenn Sie von Plänen müssen automatisch ausgeführt werden oder auf ist einige wirklich tun sollten 6. Pipeline Workflow – 4 Schritte: Ich denke, ein Jordache dieses Baumes führt typischerweise die Berufung durch. Vier Schritte das Netz und sammeln. Der größte Schritt besteht darin, alle erforderlichen verschiedenen Quellen aus Daten zu verbinden und die Daten nach Bedarf an einen zentralen Ort zu verschieben war so geheime Verarbeitung. Aber die Datenfabrik. Sie können die Kopieraktivität in einer Daten verwenden, indem Sie die Daten aus Buch vor Ort spielen und Cloud-Quelle später speichern mit Zentralisierungsdaten in der Cloud Corker gespeichert, dass Frau, zum Beispiel, können Sie Daten in Ajo Datalink-Stories sammeln und Transformieren Sie die Daten später mithilfe eines George Vitelic Analytics-Abschlussdienstes. Sie können auch Daten in einem Jordan-Block Geschichten sammeln und es wenig transformieren, indem Sie eine agile tatsächlich in ihrem Pastor verwenden. 2. 5 ist transformieren und bereichern. Sobald Daten in einer zentralisierten Daten vorhanden sind, die in der Cloud gespeichert sind, sie mit kompetenten Diensten wie üblichen Inside do Data Lit Analytics und Machine Learning transformiert . Denken Sie daran, Data Factory ist Justin Orchestra und es kann keine Transformationsaktivität selbst durchführen . Veröffentlichen, nachdem die Daten des Herrn in eine sinnvolle Reform umgewandelt wurden. Laden Sie die Daten in verschiedene Plots, Geschichten wie ein George es von ihrem Haus. Perkins Option durch FBI und Analytics-Tools und andere Anwendungen wollte. Nach erfolgreicher Bereitstellung außerhalb der Pipeline können Sie einmit den Xun-Fähigkeiten und Pipeline für Erfolg und Misserfolg. Wir können einen Auftrag in einer Fabrik Pipelines mit einem Job-Monitor AP überwachen Ich veröffentliche L als Monitor-Protokolle und andere Integritäts-Panel in der Kante des Portals. 7. Demo Einführung: Willkommen in diesem Modul. In diesem Duell werden wir einige Hände auf Aktivität tun. Zuerst werden wir bei Ihrem Datenspeicher ein schonendes Konto erstellen und ein George Storage Explorer Toe Zugangsdatum ngentle Konto verwenden . Dann werden wir sequel Data Warehouse und Data Factory bereitstellen, was ziemlich einfach und unkompliziert ist. Nun, danach gehen wir durch die Data Factory. Du, ich und wir werden verschiedene Menüoptionen verstehen. Und dann werden wir die Kopieraktivität in Ihrer Datenfabrik verwenden. Also werden wir nach Möglichkeiten suchen, Daten aus ihrem Haus zu nehmen wird Pipeline sein, um die Ausgabe in einigen anderen Geschichten zu verschieben und zu speichern. Ort, an dem wir es für die Analyse abholen können, werden sie auch einen Blick auf Data Factory Monitoring-Optionen nehmen. Vielen Dank. 8. Azure Data Lake Storage Gen 2 Konto: in dieser Demonstration werde ich Ihnen beibringen, wie Sie ein Azure Data Lake-Speicher-schonendes Konto erstellen. Gehen wir wieder zu den alten Gottesdiensten. Alles, was Sie direkt auf Speicherkonto von hier zugreifen können. Wenn Sie sich das Azure-Portal ansehen, gibt es eine separate Quelle namens Data Lake Storage. Gen Eins. Aber Sie erstellen Geschichten sanfte Konto. Wir mussten zuerst Storys Konto erstellen, da dies eine Eigenschaft aus dem allgemeinen Version zwei Speicherkonto ist. werden wir in einer Minute sehen. Microsoft konzentriert sich heutzutage auf Data Lake-Speicher schonend, weil sanft ist hart. Der Ort weg. Jen Eins. Lassen Sie uns ein Story-Konto erstellen. Klicken wir auf diese Schaltfläche und lassen Sie mich mein Abonnement und meine Quellgruppe auswählen. Lassen Sie mich eine neue Ressourcengruppe erstellen. Gib mir RG Story. Es ist Gentoo. Geben Sie den Namen des Speicherkontos an. Ich setze nur eine Nummer ein, um es global zu schaffen. Einzigartig. Nimm meinen Grund zu Hause. Das Neue an sanften Datenlink-Stories ist, dass Sie alle Storys, Kontoeigenschaften und Funktionen wie Leistungsüberschuss, zwei Jahre und Replikation nutzen Storys, Kontoeigenschaften und Funktionen wie Leistungsüberschuss, können. Ich werde erweiterte Leistung Allzweck-Version zwei auswählen. Lokal, die Rendon Geschichten und halten Überschuss hier. Die nächste Stufe wird uns die Konnektivitätsangelegenheit bringen. Ich lasse es standardmäßig öffentlich und Punkt an diesem Punkt, wir gehen neben der Vorschauseite. Lassen Sie uns es vor der Einstellung für die Sicherheit als aktivieren Block weichen Lead wir tatsächlich ignorieren wollen , weil der Punkt hier in der Tat aus diesem Story-Konto mit dem traditionellen Blutdienst ist , werden wir auf den hierarchischen Namen Space-Eigenschaft, indem Sie die Daten nebenan spiegeln . Es ist sanft von Behinderten zu aktivieren. Und wie Sie sehen, wenn Sie Gentoo aktivieren, deaktiviert es automatisch Datenschutzoption Dies alles, was Sie tun müssen, um ein Story-Konto ein Data Lake Storage sanfte Konto wieder machen . Ich musste kein normales Story-Konto Daten-See-Speicher machen, sanftes Konto. Alles, was Sie tun müssen, ist, diese Option zu aktivieren. Das war's. Die Ansicht in create wird nicht bedeuten, zu lange zu dauern. Aber trotzdem kann ich das Video bis dahin pausieren. Alles klar, die Bereitstellung ist abgeschlossen. Und wenn wir jetzt zu den Ressourcen gehen, Ich möchte Ihnen einen Unterschied zu dem, was Sie gewöhnen Zehe zeigen, wahrscheinlich die Arbeit mit den allgemeinen Zweck Geschichten. Sie haben vielleicht bemerkt, dass unter Dienst stattdessen nur ein Blob-Service ausgeschaltet ist. Es wird jetzt Daten wie sanftes Dateisystem genannt. Du zeigst dir die Verteidigung. Ich habe ein anderes Konto für allgemeine Geschichten, das Sie im allgemeinen Konto sehen. Es heißt Blob Services hier, aber weil die nicht in der Lage, Genitalgeschichten wird es Daten spät, sanfte Dateisystem genannt . Von nun an wird das Konto dieser Geschichte Daten wie Geschichten mit jedem BFS-kompatiblen Feuersystem sein . Also setzen Sie diesen Punkt. Wenn wir Umfragen ausgewählt haben, können wir ein Dateisystem erstellen, was ich jetzt tun werde. Ich nenne es Gento File System. Okay, und denken Sie daran, was Sie schaffen, ist sanft. Dateisystem ist kein Block und Abendessen. Es ist ein echter Ordner hin und wieder. Wenn wir in das Dateisystem gehen, erhalten wir eine Aufforderung, einen George Storage Explorer zu verwenden. Ajo Stories Explorer ist ein kostenloses Tool von Microsoft, das auf Windows Mac und Limits verfügbar ist und, wie der Mittelwert vorschlagen bietet eine grafische Umgebung zum Durchsuchen und Ausführen von Aktionen gegen einen George Speicherkonten. Wenn Sie es noch nicht haben, bitte don Lord und die Installation ist sehr einfach und unkompliziert. Diese Toolfamilie verwendet ein Konto, um sich zu authentifizieren, um einen Job zu erhalten, und zeigt dann das Abonnement an, das dieses Konto hat. Dann werden die Storys in dem ausgewählten Abonnement Konten. Unter meinen Abonnement-Story-Konten können wir mein Konto für sanfte Geschichten aufwenden, das derzeit als BLS sanfte identifiziert wird. Ich würde annehmen, dass letztendlich das Storage Explorer-Ding in diesem Knoten grün wird , den wir jetzt von Blockcontainern , den Dateisystemen betrachten , denn das sollte es sein. Und wenn wir das Dateisystem Notiz jetzt auswählen, dass wir direkten Upload alle tun können, können wir einen ketzerischen Ordnerraum organisieren. Also werde ich dies später einen neuen Ordner abrufen und diesen Ordner als Teil des Workflows verwenden . Ihre Ansicht kann hier veraltet sein. Willst du auffrischen? Wir sind bereit, hierher zu gehen. 9. Bereitstellen von Azure SQL Data: s Erstellen und Joe Sequel Data Warehouse. Zusätzlich zu Search a sequel Data Warehouse in allem, können Sie es auch in der Datenbank als auch in der Analyse finden. Klicken wir auf Fortsetzung, Get other house und fügen Sie New is Instruments hinzu und lassen Sie mich Ihnen zeigen, wie der Deployment-Workflow funktioniert. Ich werde New Resource Group für das Data Warehouse erstellen, und ich werde auch die Munim zu meinem Datum Ihres Hauses geben. Ich bin alles, was nur eine zufällige imaginäre Zahl am Ende, nur um den Namen global einzigartig zu machen. Lassen Sie uns einen neuen virtuellen Server erstellen wird ein Cluster sein. Nennen wir es tun die blauen s 108 Es sie dann einfach konventionell mit einem starken Passwort. Wir können uns darauf vorbereiten, diesen Rat darüber zu geben, wie stark die Hirten sein müssen. Lassen Sie mich meinen nächstgelegenen Standort finden, die Holy Show für den Zugang zu Data Warehouses aus unseren Schulen. Aber diese große Box hier wird all Ihre Dienste erlauben. Mit anderen Worten, Microsoft I P-Adressen, die diesen Diensten zugeordnet sind, ist der Zugriff auf den Server. Möglicherweise müssen Sie auch die Folge-Data-Warehouse-Firewall ändern, erlauben Sie Ihrem Client. Ich denke, von wo aus Sie auf der Welt sind. Zusätzlich zu anderen öffentlichen I p adressiert alle Schreibadressen Bereich. Ich zeige Ihnen die ganze Verwirrung. Es ist die Data Warehouse-Einheit ist die Recheneinheit, die zu einem Joe Folgedatum Ihres Hauses verwendet wird. Wählen wir unsere Leistungsstufe für Produktionsarbeitslasten aus. Wir sollten auf sanfte und nicht jen eins sein. Und ich kann mein System hier unten 200 klären, weil ich gerade in einer Test-Demo-Umgebung von dieser live in der realen Welt arbeite . Ihr Ziel ist es, Ihr Haus in einer Weise zu pune, dass Sie nicht mehr bezahlen, als Sie brauchen. Aber Sie erhalten auch Ihre Rechenleistung, um Ihre Service-Level-Vereinbarungen zu erfüllen. Also lassen Sie uns hier bewerben und dann zum nächsten gehen. - Was? Ihre Datenquelle. Wir können uns ein Backup holen oder wir tun Nein, eigentlich, was wir tun können Simple. wird uns das Abenteuer Arbeit Datum geben, jedes Haus, jedes Haus, einfaches Data-Warehouse. Ich wähle das, und es nimmt alle Koalition auf, die ich auswählen werde. Wir gehen Zehen-Tags und wir werden keine Steuer hier verwenden, wird zum nächsten gehen. Wir sehen unsere geschätzten Kosten, sind aber hier. Du siehst Obertöne und dann sind wir wirklich komplett. Ich finde, dass es in der Regel dauert die 10 Minuten aus Fieber für Microsoft bereitgestellt ein Lager gut zurück. Sobald die Bereitstellungen abgeschlossen sind,können sie zu den Ressourcen wechseln, die sie das Data Warehouse anhalten oder fortsetzen können, um das Gebäude anzuhalten und fortzusetzen. Sobald die Bereitstellungen abgeschlossen sind, können sie zu den Ressourcen wechseln, die sie das Data Warehouse anhalten oder fortsetzen können, um das Gebäude anzuhalten und Sie werden immer noch für die Geschichten in Rechnung gestellt, aber zumindest entstehen für den Computer keine Kosten. Wir suchen in unserer Umgebung nach Feuerball. Wir können auf Feuerbälle und virtuelle Netzwerke kommen, und das ist, wo ich erwähnte, dass Sie den Zugriff erlauben können, um Dienste anzupassen und Ihr Auto erkennt die Öffentlichkeit I p mit Ihrem Client-Gerät verbunden. Und dann können Sie anwenden I p Adressbereiche Öffentliche I T Adressbereich ist hier toe. Konnektivität zu diesem Server zulassen. Kommen wir zurück auf die Übersichtsseite, weil wir das nicht in diesem Hosting aus dem Data Warehouse sein werden . Lassen Sie mich das in meine Zwischenablage kopieren und dann, wie Sie zu diesem Datum jedes Haus verbinden. Typischerweise habe ich das Sequel Server Management Studio verwendet, das als separater Down Lord verfügbar ist. Lassen Sie uns eine Verbindung zu der Fortsetzung Server-Datenbank-Engine machen, und für die sieben Mann werde ich in der voll qualifizierten Mann von einem Server gefischt wird Fortsetzung wählen . Mehrere Authentifizierung und ich werde die gleichen Anmeldeinformationen liefern, die ich beim Erstellen des Datums des Hauses gebe. Das wird Oh, es zeigt einen Fehler, dass Ihr Client I p Adresse, hat keinen Zugriff auf diesen Server. Also gehen wir zurück zu einem kleinen Haus, feuern virtuelle Netzwerke und fügen unseren lokalen Client AP lenken und versuchen Verbindung mit Management Studio so schwer. Ich weiß es. Erinnerst du dich an die Fortsetzung? Mehrere Data Warehouse ist die gehostete Plattform im Service. Wenn Sie also mit der rechten Maustaste auf den virtuellen Server klicken, gibt es keine Eigenschaften. Ich erinnere mich, als ich überrascht war, als ich das erste Mal sah, dass es keine Eigenschaften gab, aber denken Sie daran, Sie haben es mit Schwarz von Ist der Service hier zu tun? Wir erklärten Datenbanken und dann Daten. Sehr DW 108, die wir erstellt haben. Wir haben eine Liste von Tabellen, die Microsoft in diesem einfachen Data Warehouse integriert hat. Das ist sehr erleichtert. Die Weisheit wird jetzt hier sein. Vielen Dank 10. Datenfabrik: Lassen Sie uns unsere Datenfabrik jetzt erstellen. Zu diesem Zeitpunkt müssen Sie vertraut sein. Es ist ziemlich einfach und unkompliziert. Sie können entweder Datenfabrik suchen Oh, werden aus der Datenbank ausgewählt und klicken Sie voraus. Geben Sie ihm den Namen. Wählen Sie Abonnement und Ressourcengruppe im Abonnement aus. Lassen Sie es uns einfach geben. RG Unterstrich B A. Okay, ich werde ah Version zwei von Data Factory verwenden, um die Vorteile der neuesten Funktionen zu nutzen. Version zwei ist eine neue Abwasch Data Factory. Eines der größten Features aus Version zwei ist die Integration von S S S S und Steuerung Flow Functional . Überwachung ist auch eine Editierverbesserung Inversion toe macht es integriert mit auf Ihrem Monitor. Okay, lassen Sie mich das nächste Match von meinem Standort wählen. Jetzt haben wir hier die Möglichkeit, Quellpunktesteuerung zu integrieren. Wir sind versichert, dass sie ups. Das werde ich in diesem Fall nicht tun. Und dann klicken wir, erstellen Sie die Zehe, stellen Sie die Fabrik 11. Lerne mit Azure Data Factory UI: Gehen wir in die Datenfabrik, und was wir hier haben, ist nur die Steuerungsebene für den Service. Und wenn ich das Wesentliche verheimliche Schmerzen, sehen wir einen Link zum Autor und überwachen Erfahrung. Dies wird sehr tatsächlich von Arbeiten in einer George Data-Fabrik durchgeführt. Lassen Sie uns auf diese klicken, und wenn Sie bemerken, dass es ein separates Fenster geöffnet hat und Toe ADF Punkt als Ihr Punkt com, das Produkt, das Zehe diese über wenige Seite, die viele schnelle Links oder Verknüpfungen hat. Wir werden die Kopierdaten Operation Toe kopieren unsere Tabelle aus Ihrer Fortsetzung Data Warehouse. Später werden wir näher eingehen. Aber in der Zwischenzeit hat diese Seite auch Videos und eine Reihe von Tutorials geholfen. Beginnen wir damit, sich mit den USA vertraut zu machen . Das Hauptmenü enthält drei Optionen Data Factory, die Sortierung Hauptbildschirm ist, die ein paar interessante Verknüpfungen enthält. Das Hauptmenü enthält drei Optionen Data Factory, die Sortierung Hauptbildschirm ist, Das Autoren-Panel ist, wo wir neue Pipelines erstellen und verbringen die meiste Zeit, und schließlich, das Monitor-Panel dort können wir durch geplante Ausführung überwachen. Ordnung, im Hauptbildschirm haben wir fünf Möglichkeiten. Lasst uns eins nach dem anderen durchgehen. Pipeline erstellen ist nur ein kurzer Rock, der uns zum Autorenfenster führt und automatisch eine leere Pipeline erstellt . Für uns. Nach Ebene aus einer Vorlage erstellen öffnet den Vorlagenkatalog. Dort können wir Pipeline aus einer Sammlung von ziemlich finden Vorlagen erstellen, die uns helfen können, mit unterschiedlichen Szenarien zu beginnen. Schnell kopieren Data Tool bietet eine Schnittstelle, die den Prozess der Aufnahme von Daten in den Datenspeicher optimiert . Wir erfahren mehr über die kopierte es ein Werkzeug in den kommenden Lektionen. Konfigurieren Sie SS Eyes Integration kann provisorisch als Ihre SS iess Integration um die Zeit und schließlich haben wir die Einrichtung Gericht Repository. Es ermöglicht uns, ein Call-Repository für Ihre Data Factory einzurichten und eine integrierte und die Entwicklung auf Release-Erfahrung zu beenden. Lassen Sie uns nun etwas Zeit damit verbringen, etwas über das Autoren-Panel zu lernen, wenn wir eine neue Pipeline erstellen. Dies ist das Panel, in dem wir die meisten Überstunden in der Werksressource verbringen. Sie können eine Liste von Pipelines, Datensätzen und Datenflüssen in einer Data Factory finden. Durch Klicken auf die drei Punkte in den Pipeline-Umfragen, können wir neue Bedeutung neue mir neu zugreifen, die es uns ermöglicht, entweder eine neue Pipeline von Grund auf oder von einer Vorlage zu erstellen , finden wir ähnliche viele Optionen sowohl auf, dass Datensätze und -Daten floats Dienste. Wir werden hier auf dieses kleine Pluszeichen klicken, und dies wird eine neue Pipeline erstellen. Beachten Sie, dass es eine Option für eine Pipeline aus der Vorlage gibt und hier rechts können Sie Arm-Vorlagen importieren. Dies kann die Verwendung und Wiederverwendung dieser Pipelines im Laufe der Zeit und wieder erleichtern. A. Ihre Datenfabrik ist ein kaltes freies Orchestrierungs-Tool. So, zum Beispiel, von unter Verschieben und Transformieren, können wir einfach Drag & Drop diese Kopierdatenoperation auf die Steuerfläche und dann wählen Sie diesen Kopiervorgang unten. Sie werden verschiedene Ängste im Zusammenhang mit der ausgewählten Aktivität in diesem Fall zum Kopieren von Daten sehen. Da dies Cooperator ist, haben wir Quelle mit anderen Worten, Beeren Ihre Daten kommen aus und dann denken Verizon Daten gehen und wir haben andere Einstellungen und geistig die Optionen. Wenn Sie auf die Ansichtsquelle klicken, die bewertet wurde, werden alle Ihre Daten Factory-Pipelines in Jason geschrieben . Die Idee aus einer Pipeline ist, dass wir verschiedene Aktivitäten miteinander verknüpfen können. Wir können einen ganzen Workflow Haar mit dieser Verbindung Link in grün erstellen, Übrigens, Ich kann mit der rechten Maustaste auf diesen Link klicken und wählen Sie den Lead. Es wird verschwinden, und wenn ich darauf klicke, kann ich die Ausgabetaste hören. Wir können eine Aktivität auf wunden eigenen Erfolg, Misserfolg, Abschluss hinzufügen Misserfolg, oder überspringen, so dass wir die nächste Aktivität wählen können. Wenn diese Aktivität abgeschlossen ist, wählen wir die nächste Aktivität aus. Wenn Sie sich nicht genau sicher sind, wo es ist, können wir hier eine Suche durchführen. In diesem Fall fügen wir noch einmal eine Funktion hinzu. Nur Drachentropfen. Sie können sehen, wie einfach das funktioniert, und Sie können die Arbeit validieren. Man kann die gesamte Pipeline kalt betrachten, dann sollte es nur Buell für auch als ausgelöste Unterdrückung und so weiter. Wie bereits erwähnt, betrachten wir Record Repository Toe, ermöglichen eine kontinuierliche Integration und Bereitstellung von Ihrer Data Factory. Und hier haben wir unsere Vorlage mir neue Option. Es erlaubt uns einfach, Arm-Vorlagen mit Pipeline-Definitionen zu importieren und zu exportieren. Das Verbindungsfenster hostet eine Liste von zuvor erstellten Links, Services und Integrationslaufzeiten, und hier ist die Standard- oder Integrationslaufzeit, die wir zuvor gesehen haben. Und schließlich, lassen Sie mich Ihre Aufmerksamkeit auf die Triggerabschnittsstelle von Pipeline-Ausführungsauslösern lenken. Wir haben momentan keinen Auslöser, daher ist diese Liste leer. Ich schließe alle Wasserhähne, verwerfe meine Änderungen und gehe zum nächsten Element. Nehmen wir uns eine Minute Zeit, um das Monitorpanel und alle Funktionen, die es bietet, zu überprüfen. Das Dashboard-Bedienfeld enthält Informationen zu Pipeline und Aktivität. Ausführung im Bereich „Pipeline Grants“ Wir können die Pipeline-Ausführung überwachen, und es ist sehr nützlich, um sicherzustellen, dass die Pipeline tatsächlich ordnungsgemäß funktioniert. Im Bedienfeld „Trigger Grants“ wird eine Liste von Pipelineausführungen angezeigt, die automatisch ausgelöst wurden . Die Anzeige läuft Zeitfenster zeigt die Liste aus Integrationslaufzeiten zur Verfügung oder das Ergebnis ist, dass die Ford Integration Runtime und schließlich, in der Alerts und Metric Panel, können wir Alert-Regeln erstellen, um ihre Fabrik-Pipeline proaktiv. Nun, da wir mit dem Datumseffekt in die USA ein bisschen vertraut sind , Lassen Sie uns unsere erste Pipeline erstellen , Lassen Sie uns unsere erste Pipeline erstellen 12. ETL Operation: in dieser Demonstration möchte ich Ihnen beibringen, wie Sie Ihre Datenfabrik verwenden, um eine Kopieraktivität durchzuführen. In diesem Fall werden wir Datenangebot Tabelle aus Data Warehouse-Beispieldatenbank in unsere Daten extra kopieren . Es ist ein sanftes Konto. Also kommen wir einfach zurück auf die Übersichtsseite und klicken Sie auf Daten kopieren und es startet diese Kopie Daten Vagina. Lassen Sie uns diese Aufgabe und den Namen jetzt geben. Hier können wir zu ihnen Aufgabe nur einmal wählen, oder wir können eine wiederverwendbare Pipeline erstellen, indem Sie diese Option wählen und wählen Sie ein tun sollte. Selbst wenn Sie sich entscheiden, nur einmal zu begrenzen, wird es nicht nach Willan gelöscht und beendet. Wir können es manuell sogar so oft in der Zukunft wollen wir oder erstellen einen Auslöser und so weiter und so weiter. Aber wenn Sie nach links schauen, haben wir sechs Schritte und es führt uns ein Licht durch, ohne etwas über die zugrunde liegende AP A oder Sicherheit verstehen zu müssen . Es gibt eine riesige Bibliothek von Verbindungshaaren. Sie sind in Gruppen organisiert, Haare wie Ihre Datenbankdatei und akzeptieren. Lassen Sie uns eine neue Verbindung in der neuen Link-Dienst in allen Typ Data Warehouse gezurrt zu filtern, und wir werden diese bei Ihrer Fortsetzung Data Warehouse Link Service Objekt auswählen. Der Link-Dienst ist genau das, wonach er sich anhört. Es wird ein wiederverwendbares Objekt sein, das eine Verbindung zu einem Satz erstellt und autorisiert, zu dem ein Satz eine Jury Quelle sein kann oder eine Jury Quelle oder vielleicht eigene Räumlichkeiten bekannt ist. Ressource. Lassen Sie mich ihm einen Namen geben. Die Anzeigelaufzeit ist der Computer früher. Lass es uns weiterleben, bevor wir uns für zwei Ergebnisse begeben. Dies wird häufiger in einem Hybrid-Szenario Problem, in dem Sie möglicherweise die Mietdauer vor Ort bereitstellen müssen, die als selbst gehostete Operation bezeichnet wird. Als Faras-Authentifizierung, können wir tun, Benutzer oder geben alte, aber vorher müssen wir zuerst wählen, wie wir in diese Ressource zu bekommen. Wählen wir das Abonnement und Data Warehouse-Server neu erstellt. Die Datenbank ist das einfache Datum Ihres Hauses. Die Authentifizierungstyp Optionen sind Dienstprinzip, verwaltete Identität oder Fortsetzung. Ich gehe weiter und wähle einfach eine Fortsetzung Authentifizierung mit dem gleichen Konto aus, das wir beim Erstellen von Data Warehouse erstellt haben . Es gibt eine Reihe von optionalen Verbindungsumkreis, den Sie hinzufügen können, die wir in diesem Fall nicht verwenden werden. Wir werden die Verbindungsverbindung testen. Erfolgreiches Finish. Also haben wir unseren Quelldatenspeicher erstellt und wieder wird dies wiederverwendbares Objekt sein, das wir in anderen Pipelines verwenden können. Also lasst uns als nächstes gehen, und wir haben in das Data Warehouse gezapft und hier sehen wir schwere Notwendigkeit, eine Tabelle zu wählen, die wir kopieren möchten, damit wir eine oder mehrere Tabellen auswählen können. Haare. Wir wollen bim Produkttabelle wählen. Also lassen Sie uns eine Suche nach Produkt machen. Also wähle ich den Stall aus. Und wenn wir den Splitbalken aufrufen, können wir eine Vorschau von den Daten sehen. Und in der Registerkarte Schema können wir die Spalten und die Datentypen sehen. Klicken wir auf Weiter. Also noch eine Sache, lass mich vorhin gehen. nicht nur vorhandene Tabellen auswählen, Beachten Sie, dass Sienicht nur vorhandene Tabellen auswählen,sondern auch eine Abfrage zusammen bestimmte Daten schreiben können, die Sie in dem Job verwenden möchten . Aber wir werden einfach alles vom Tisch nehmen. Also wieder klicken wir auf Weiter. Der Zieldatenspeicher haben wir noch nicht erstellt, Also lassen Sie uns neue Verbindung neu erstellen, und dieses Mal lassen Sie uns eine Suche nach Daten lecken Speicher machen. Denk dran, es gibt Gen Eins und, Ah, Gentoo. Wir beschäftigen uns nicht mit allgemeinen Haaren. Wir haben bereits ein Konto für sanfte Geschichten erstellt. Also lasst uns das auswählen. Und wieder einmal werden wir eine Auswahl aus unserem Abonnement für die Authentifizierung Angelegenheit machen. Wieder einmal werden wir den Kontoschlüssel wählen. Wir haben unseren Speicherkontonamen ausgewählt. Geben wir einen Namen. Auch diesen verlinkten Service. Okay, und jetzt beste Verbindungsverbindung erfolgreich. Guter Deal. Also lasst uns klicken. Fertig stellen. So weit, so gut Der Klick. Als nächstes werden wir in unsere Daten extra Gin Toe Konto tippen und Toe durchsuchen. Wählen Sie aus, welchen Ordner wir suchen. Also zuerst mit der Liste aus Dateisystemen, lassen Sie uns darauf klicken und wählen Sie dann den Ordner Ausgabedaten und klicken Sie auf Auswählen. Wir müssen einen Ausgabedateinamen angeben. Ich nenne es einfach für Kanal. Keine CSP für maximale Eroberung von Verbindungen. Lasst uns auch sagen. Klicken wir auf Weiter. Hier können wir das Dateiformat anpassen. Es ist ah, zwei kommagetrennte Werte zu deportieren. Ich werde alles von der Standardeinstellung lassen, aber die Quintessenz ist, dass Data Factory Ihnen hier viel Flexibilität bietet. Klicken Sie auf die nächste vierte. Doren's Also, was möchten Sie passieren, wenn beim Verschieben von Daten, die Sie über die Aktivität möchten, ein Problem auftritt , sobald eine inkompatible Zeile vorhanden ist? Oder willst du die Reihe überspringen? Oder möchten Sie entkommen und geliebt sie, damit Sie sie später verfolgen können? Ich werde die Standardoptionen hier führen. Außerdem werde ich an dieser Stelle Performance-Einstellungen auf die zuvor leben und auf Weiter klicken. Hier ist unser Jemand Bildschirm, und wenn wir auf „Weiter“ klicken, geht es tatsächlich aus und läuft die Pipeline. Wie Sie sehen können, wenn ich auf Monitor Data Factory klicken, es bringt uns zum Mond Interview und lassen Sie uns auf Aktualisieren und wir können sehen, dass die Straße ist es gelungen. Gut. Kommen wir zurück zum Speicher Explorer, kommen Sie in den Ausgabedaten-Ordner und sicher genug, sehen wir unser Produkt Punkt CSP. Lassen Sie mich mit der rechten Maustaste klicken und diese Zehe Mein Backstop herunterladen. Eine weitere Sache, wenn Sie nicht alle unsere Aktivitäten in Geschichten Explorer nicht bemerkt haben , damit unten unten an der Unterseite. Okay, lassen Sie uns Excel öffnen, nur um eine schnelle Vernunft zu überprüfen. Oh, es scheint, als hätte ich vergessen, die Säule aufzuheben. Kopfzeilen. Damit beginnen noch keine Eierstöcke. Was an Data Factory schön ist, ist, dass wir zurückgehen und die Job-Eigenschaften bearbeiten können, um die Spaltenüberschrift einzuschließen. Wir können Pipeline ändern und Grün drauf. Das werde ich in einer Minute tun. Zwischenzeit Lassen Sie uns in derZwischenzeiteinen kurzen Blick auf die Daten werfen, die wir sehen können. Es gibt etwas mehr als 500 Rose im Datensatz. Nun gehen wir zurück zur Data Factory-Schnittstelle. Und wenn Sie auf die Erfahrung des Autors zurückgehen, hier ist unsere Pipeline. Es ist genau hier, damit wir die erforderlichen Änderungen vornehmen können. Lassen Sie uns zu den Zielverbindungen gehen und schwere siehe Option. Erste Rolle als Hitter in einem Billet veröffentlichte Änderungen veröffentlichen bedeutet Verkauf. Und dann wieder, wir können gehen, um Tab zu überwachen und haben nicht den Job. Wenn erforderlich, können wir aktualisieren und wir sehen, dass unsere Aufgabe wieder abgeschlossen ist. Gehen wir zurück zum Speicher-Explorer. Okay, wir sehen diese sportliche Zeit. Es bedeutet, dass neue Datei auf der alten Datei über sie hat. Laden wir es herunter. Und jetzt öffne es. Jetzt sehen wir, dass wir jetzt die Kopfzeilen haben. Vielen Dank 13. Berechnen: während einer letzten kleinen Operation konnten wir digitale erpresst nahtlos authentifizieren. Wenn Sie jedoch auf ein Problem mit dieser Konnektivität stoßen, müssen Sie möglicherweise Data Factory explizite Berechtigungen für dieses Daten-Repository erteilen. Mal sehen, was wir damit meinen. Gehen wir zurück zu den Portalhaaren. Der General Porter. Gehen wir zurück zu unserer Datenfabrik. Und wenn Sie zu den Eigenschaften gehen, können Sie hier Identitätsobjekt verwalten sehen. Ich würde in einfachen Worten sein. Verwaltete Identität wird von in Ihren Diensten verwendet, um andere Edge oder Dienste zu authentifizieren, die Ihre Steve Director-Authentifizierung unterstützen. Die Manage Identity ist registriert. Sie sind ein Beauty-Verzeichnis und stellt diese sehr spezifische Datenfabrik dar. Wir können diese Manage Identity direkt für Data Lake Storage, sanfte Authentifizierung verwenden. Es ermöglicht diese bezeichnete Fabrik Toe xs und kopieren Sie Daten in und von Ihrem Data Lake Speicher. Sanft. Wir können diese Verwaltung Identitäts-Toe Rolle basierte Zugriffssteuerung weniger hinzufügen. Also werde ich das in meine Zwischenablage kopieren und dann zurück in den Storage Explorer. Wir können der Data Factory-Berechtigung sowohl auf Dateisystemebene als auch auf Ordnerebene erteilen. Um dies zu tun, können wir mit der rechten Maustaste auf das Dateisystem klicken und gehen, um überschüssige in der Zugriffssteuerungsliste zu verwalten . Unten unten können wir in diesem Objekt einfügen, das ich aus der Datenfabrik d und dann dem Konto geben, was auch immer Ausmaß überschüssig direkt im Dateisystem ist. Und manchmal habe ich herausgefunden, dass man es an zwei Orten tun muss. Sie müssen dies sowohl auf Dateisystemebene als auch außerhalb der Ordnerebene tun. So können Sie mit der rechten Maustaste auf den Ordner klicken und genau das gleiche tun hier. Wir können es in das Objekt einfügen, das ich von der Edgell-Ressource d. In diesem speziellen Fall ist es eine Fabrik getan und geben Sie es, was auch immer Niveau off überschüssige Sie nicht geben werden. Dies wird Ihnen helfen, die Data Factory nahtlos mit anderen Quellen zu verbinden. In diesem Fall Geschichte intento. Vielen Dank. 14. Data: in dieser Lektion. Ich wollte eine grundlegende Demonstration durchlaufen, wie wir die Überwachung mit einer George Data-Fabrik durchführen würden . Also, was genau brauche ich, um Familie für die Überwachung zu überwachen? Wir denken an den Auslöserprinzen. Die Aktivität führt die Pipeline-Durchläufe und dann diese Abfragen aus. Im Laufe der Zeit werden sie im Mittelpunkt unserer Data Factory Monitoring-Lösung stehen. Und es gibt zwei Möglichkeiten, die Überwachung in der Datenfabrik zu überwachen und die Überwachung mit einem Job-Monitor wird beide diskutieren. Also, erstens haben wir tatsächlich eine Überwachung innerhalb der Data Factory-Benutzeroberfläche, während wir diese Pipelines entwickeln , dass die größere kann sehr nützlich sein. Dies ermöglicht es mir, meine Pipeline zu betreiben. Ich kann Breakpoints haben. Ich kann genau sehen, was passiert, aber das überwacht nicht wirklich seine abgesonderte Entwicklererfahrung. Diese Diskutierungsfunktion ist hilfreich, um genau zu sehen, was im Inneren passiert, und das kann als Entwickler sehr nützlich sein. Aber die Masse aus über die Überwachung wird über die Überwachungsschnittstelle kommen. Es beginnt tatsächlich mit einem Dashboard. Dieses Dashboard zeigt standardmäßig die letzten 24 Stunden an, aber ich kann dieses Zeitfenster ändern, um mir die Pipeline-Ausführungen anzuzeigen. Ich würde Misserfolge sehen. Ich werde diese Prozentsätze sehen. Ich werde auch Details zu den Aktivitäten sehen. Ich werde auch Daten über die Trigger sehen. Dies gibt mir nur einen sehr schnellen Überblick darüber, was in der Umgebung passiert. Ich kann Details zu allen Triggerläufen sehen, wenn ich Trigger habe. Ich sehe tatsächlich, dass Details über diese Ausführungen und Ausführung auf sollte handeln oder vielleicht sogar basieren. Aber was mir wirklich wichtig ist, dass mit dem Flugzeug hier läuft, kann ich den Namen aus der Pipeline sehen. Wenn ich verschiedene Pipelines in meiner Umgebung habe, schließe ich diese kleine Filterschaltfläche ab und kann dann ändern, um nur bestimmte Pipelines zu sehen , die ich verfügbar habe. Ich kann nach ihnen suchen. Ich kann die verschiedenen Aktionen sehen, die für die Pipeline verfügbar sind. Ich kann die durchgeführte Aktivität anzeigen. Ich kann wirklich darüber lesen. Ich kann sehen, wann es begonnen wurde, ich kann die Dauer sehen, die es dauerte. Wie es ausgelöst wurde, der Status, wenn es irgendwelche Terrameter oder Einladungen gab, und noch einmal, diejenigen, die ich filtern könnte, ist gut, Sie werden auch sehen, dass ich einen Gesamtfrachter hier zur Verfügung habe. Ich könnte einige der Details ändern, die mir angezeigt werden, wenn ich nur das späteste Datum sehen möchte , das ich ändern kann. Wenn es also eine gibt, die mir besonders wichtig ist, kann ich in die Details eintauchen. Wenn ich also die kleine Pipeline mag, die ich mit dem Spiel kann, kann ich den Aktivitätslauf ansehen. Sehen Sie, ich werde wählen, dass ich jetzt mehr aus dem Detail sehen kann. Ich kann den Aktivitätsnamen, die Art der Aktivität sehen . In diesem Fall war es eine Art von Kopie. Diese gesamte Pipeline ist das, was ich mir ansehe. Jetzt kann ich alle Aktivitäten sehen, die Teil davon waren. In diesem Fall war es nur eine Aktivität innerhalb der Pipeline. Aber ich würde jede einzelne Aktivität sehen, die diese Pipeline bildete, abhängig von ihrem Typ. Ich könnte hier zum Beispieldie genauen Importe sehen zum Beispiel . Ich kann die genaue Ausgabe, die Menge der Datenleitung, die Menge der Gator geschriebenen Dauern wieder sehen die Menge der Datenleitung, , den Start, die Dauer der Offenheit, diese spezielle Aktivität innerhalb der Pipeline. Dann bin ich da, wo es vom Beispiel gelaufen ist. Der Hinweis einmal in diesem Fall, ist, dass die Festung und ich könnte auch dieses kleine Paar Brille haben diese. Zeig mir die Details. Also hier kann ich sehen, dass es aus kam. Und deine Fortsetzung? Data Warehouse. Es ging in deinem Laden auf die Zehe. Es Gentoo, und ich kann die genauen Details sehen. folgt die Zahl. Lesen. Nummer aus. Rose aufgeschrieben. Ich kann den Durchsatz, die Kopiertradition und die Details sehen . Verknüpfe es damit, damit ich großartig in die angegebene um diese bestimmte Aktivität hineinkommen kann. Fertig. Das ist also ein Schlüsseltyp aus der Überwachung, die wir durchführen werden. Ich kann den Status von meiner Integration sehen, wenn ich mal hier nur die Automatik zur Laufzeit verwende . Wenn ich zusätzliche Laufzeiten hätte, vielleicht vor Ort, vielleicht diese SS I Jahre, würde ich diese auch sehen. Und noch einmal kann ich Details über die falsche Zeit sehen, Details über die Aktivität, Waffen, die diese Integration tatsächlich pünktlich nutzen. In meinem Fall wird es alle sein, die ich in meiner Umgebung habe. Wenn ich wieder nach oben gehe, kann ich mir auch die Details ansehen. Ich kann den Status sehen. Es ist aus geben Sie einen jur und die Gründe gehen, um automatisch zu lösen. Und noch einmal, ich könnte gehen und in Aktivitäten eintauchen außer Tre. Dies ist also die wichtigsten Arten von Überwachung, die ich innerhalb der Datenfabrik tun werde. Dies gibt mir die Einsicht, wie meine Pipeline läuft, mein Trigger die Aktivität läuft und dann die Integration ausführt. Manchmal gibt es jetzt auch Metriken. Wenn ich in diese eintauche, wenn ich auf diese Schaltfläche Metriken klicke, es jetzt nur gehen, um mich direkt zurück zum azurblauen Portal zu springen. Dort sind die Metriken meist egoistisch. Das führt uns zu Teil zwei von der Demonstration. Monitoring mit auf Ihrem Monitor. Hier schaue ich mir mein Alter oder das Datum der Fabrik an. Der Autor und Monitor ist, wie ich tatsächlich in die George es beeinflussen Sie, X. Wenn ich nach unten scrollen, dann werde ich meine Metriken sehen. Und von hier aus können Sie eine Reihe von wichtigen Dingen sehen, die uns um gescheiterte Aktivitäten kümmern. Dunns Phil Pipeline führt ausgefallene Triggerläufe aus, Integration einmal verfügbarer Speicher, überlegene Position, überlegene Position, maximal zulässige Entitätsanzahl. Und für all diese verschiedenen Kritiker,sehen Sie, sehen Sie, ich kann tatsächlich eine Warnung für sie erstellen, so dass das sehr nützlich sein könnte. Und wenn ich eine faire Nummer sehe, kann ich darauf aufmerksam machen. Und im Falle eines Scheiterns kann ich zu Datenfaktor ux gehen und für die Details sehen und untersuchen, damit ich diese Dinge verwenden kann , um die Metriken zu erhalten. Ich könnte das verwenden, um den Alarm auszulösen , der mich dann dazu bringt, in die Schnittstelle einzutauchen und genau zu sehen, was passiert . Und dann haben wir, ah, unsere Diagnoseeinstellungen, damit ich all diese Daten, die Metriken und die Details über die verschiedenen Aktivitäten durch geplante Läufe oder die Triggerläufesenden kann die Metriken und die Details über die verschiedenen Aktivitäten durch geplante Läufe oder die Triggerläufe . Ich kann ihnen Zehe eins von diesen drei Zielen schicken, Geschichten, Konto, Konto, sogar Zehe oder Look Analytics. Und als ich ihn zum Sperren und Militates schickte, konnte ich das anpassen. Wie lange möchte ich diese Protokolle aufbewahren? Vielleicht möchte ich sie für eine bestimmte Dauer behalten. Ich kann das durch die Log Analytics-Feuerprobe tun. Vielen Dank.

Azure Data Factory für Anfänger

Eshant Garg

Schau dir diesen Kurs und Tausende anderer Kurse an

Schau dir diesen Kurs und Tausende anderer Kurse an

Einheiten dieses Kurses

1.

Willkommen und Voraussetzung

1:47

2.

Datenlebenszyklus

3:41

3.

Azure Lösungen

3:36

4.

Was ist Azure Data Factory

4:37

5.

Schlüsselkomponenten der Data Factory

4:46

6.

Pipeline - 4 Schritte

2:13

7.

Demo Einführung

0:57

8.

Azure Data Lake Storage Gen 2 Konto erstellen

6:26

9.

Azure SQL Data Warehouse bereitstellen

6:10

10.

Bereitstellung von Datenfabrik

1:39

11.

Kennst du Azure Data Factory UI

8:21

12.

ETL

11:07

13.

Berechtigungen

3:00

14.

Data

9:57

Über diesen Kurs

Triff deine:n Kursleiter:in

Eshant Garg

Skills dieses Kurses

Praxisnahes Kursprojekt

Kursbewertung

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Lerne von überall aus

Ähnliche Kurse

Transkripte