Komplette Python Regular Expressions Masterclass! Vom Anfänger zum Fortgeschrittenen

Naser Jamal, Computer Engineer

Erhalte unbegrenzten Zugang zu allen Kursen

Lerne von Branchenführern, Ikonen und erfahrenen Experten

Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Erhalte unbegrenzten Zugang zu allen Kursen

Lerne von Branchenführern, Ikonen und erfahrenen Experten

Wähle aus einer Vielzahl von Themen, wie Illustration, Design, Fotografie, Animation und mehr

Einheiten dieses Kurses

- 1.
  
  Warum regelmäßige Ausdrücke?
  
  2:31
- 2.
  
  Einführung - Verifizieren der Benutzer E-Mail mit Regex
  
  6:23
- 3.
  
  Methoden zur Suche nach Übereinstimmungen
  
  3:42
- 4.
  
  Methoden für Match
  
  3:30
- 5.
  
  Nützliche Daten extrahieren
  
  16:22
- 6.
  
  Sortieren ungeordneter Datendatei
  
  12:53

Anfänger-Niveau

Fortgeschrittenes Niveau

Jedes Niveau

Teilnehmer:innen

Projekte

Über diesen Kurs

In dieser Python lernen wir alles über regelmäßige Ausdrücke (Regex) in Python.

Regelmäßige Ausdrücke sind nicht so schwer zu meistern wie sie anfangs scheinen, also schnalle dich für eine 100% praktische Lernreise !

WAS DU LERNEN WIRST:

Du lernst die Grundlagen der regelmäßigen Ausdrücke in Python von Grund auf her.
Du wirst in Python von Anfänger zu Fortgeschrittenem in den pattern gehen.
Du kannst diese Fähigkeiten anwenden, um reale Probleme zu lösen.

Warum würdest du diesen Kurs nehmen?

Möchtest du Aufgaben automatisieren, die Stunden in Sekunden dauern würden?
Möchten Sie Ihre Python anheben, ohne zu viel Zeit zu verbringen?
Hast du schon einmal vom Thema Regelmäßige Ausdrücke verwirrt und wolltest einen detaillierten step-by-step
Möchtest du in der Lage sein, grundlegende bis fortschrittliche pattern mit Pythons unglaublicher Leistung zu erledigen?

Anforderungen

Programmierkenntnisse sind nicht erforderlich.
Keine Notwendigkeit Python zu installieren, kannst du Online verwenden.
Windows / Linux / MacOS Betriebssystem

Regelmäßige Ausdrücke können für die Mustersuche verwendet werden, von der Validierung von E-Mails bis hin zur Anpassung jeder Sequenz einer Zeichenfolge. Es ist ein sehr leistungsfähiges Werkzeug für die passenden Textmuster Dieser Kurs deckt alle deine Bedürfnisse ab, um ein vollständiges Verständnis für den regelmäßigen Ausdruck zu haben! Wir lernen all das in Schritt für Schritt mit dem Prozess!

Triff deine:n Kursleiter:in

Naser Jamal

Computer Engineer

Kursleiter:in

Hello, I'm Naser.

I try to simplify complicated programming topics and present them into short and bite-sized videos!

Vollständiges Profil ansehen

Skills dieses Kurses

Entwicklung Programmiersprachen Python

Level: All Levels

Praxisnahes Kursprojekt

In diesem Projekt wollen wir ein Programm erstellen, das Folgendes ausführt:

liest die txt-Datei: email_list.txt
extrahiert nur die E-Mails mit @hotmail @yahoo @gmail Domain.
Speichert die extrahierten E-Mails in Dateien namens

named:hotmail_list.txt
yahoo_list.txtgmail_list.txt

also wollen wir Folgendes tun:

Sammeln alle @hotmail E-Mails und speichern sie in einer Datei namens hotmail_list.txt
Sammeln alle @yahoo und speichern sie in einer Datei namens yahoo_list.txt
Sammeln alle @gmail E-Mails und speichern sie in einer Datei namens gmail_list.txt

Ich habe die email_list.txt und die Lösung dieses Projekts Included

findest die email_list.txt die für die class "Sortieren ungeordneter Datendatei abgibt" verwendet wird.

Das Beste aus Glück!

- Naser Jamal

Kursbewertung

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Nimm an prämierten Skillshare Original-Kursen teil

Jeder Kurs setzt sich aus kurzen Einheiten und praktischen Übungsprojekten zusammen

Mit deiner Mitgliedschaft unterstützt du die Kursleiter:innen auf Skillshare

Lerne von überall aus

Ob auf dem Weg zur Arbeit, zur Uni oder im Flieger - streame oder lade Kurse herunter mit der Skillshare-App und lerne, wo auch immer du möchtest.

Transkripte

1. Warum regelmäßige Ausdrücke?: Hallo und willkommen bei der kompletten Python-Masterclass für reguläre Ausdrücke. Dieser Kurs ist vollständig aktualisiert und interaktiv mit praktischem Lernen , um Sie von 0 zum Helden zu führen und Python RegEx zu lernen. Warum reguläre Ausdrücke? Python ist eine der am schnellsten wachsenden beliebtesten Programmiersprachen der Welt und wird voraussichtlich in Zukunft noch mehr wachsen. Wenn Sie also Ihre Karriere als Programmierer oder Datenwissenschaftler aufbauen und sich vom Rest der Masse abheben möchten, wenn Sie nur eine technische Fähigkeit oder den regulären Ausdruck von Scalar lernen nur eine technische Fähigkeit . Was kann man also mit regulären Ausdrücken machen? Sie können Aufgaben automatisieren, die in Sekundenschnelle erledigt werden. Sie können erweiterte Schaltflächenanpassungsaufgaben mit Pythons unglaublicher Leistung Sie können Daten nach Ihren eigenen Bedürfnissen lesen, salzen und umschreiben. Und das Beste daran ist, dass es innerhalb weniger Codezeilen so einfach und unkompliziert ist, dass Sie Aufgaben erledigen können, die Stunden dauern würden, um sie manuell zu erledigen. Und jetzt lasst uns unser Programm ausführen und sehen, wie es aussieht. Dies sieht viel lesbarer aus und ist viel einfacher zu arbeiten. Öffnen wir die erste Datei daneben und kombinieren sie zusammen. Der Unterschied ist Tag und Nacht. Das haben wir gemacht. Und welche 15 Codezeilen abzüglich des Abstands. Es hätte lange gedauert, es manuell zu sortieren. Und es besteht auch die Möglichkeit menschlicher Fehler, die die gesamte Datenbank für uns ausführen könnten. Stattdessen lassen wir die Maschine mit wenigen Codezeilen die Arbeit erledigen und eliminieren die Möglichkeit, lassen wir die Maschine mit wenigen Codezeilen die Arbeit erledigen und eliminieren die einen Wert von zwei zu verpassen und einen Schneeballeffekt zu erzeugen , der unsere Daten ausführt. Für wen ist dieser Kurs? Anfänger, die noch nie Programmierer aus verschiedenen Sprachen programmiert haben. Programmierer sind kein grundlegender Python, sondern wollen ihre Fähigkeiten verbessern. Wie sind die tatsächlichen Kosten? Werfen wir zuerst einen Blick darauf. Ich gebe Ihnen eine kurze Einführung, wie Medikament X in Ihr Python-Programm verwenden können. Dann schreiben wir unser erstes Muster um die E-Mail des Benutzers mit RegEx zu überprüfen. Dann werfen wir einen Blick auf verschiedene Suchmethoden und passen Objekte an und zeigen, wie sie funktionieren, indem wir Probleme lösen. Dann lernen wir, nützliche Daten zu extrahieren, und wir werden ein Tool verwenden, das Bandmuster viel und viel einfacher macht . Schließlich werden wir eine reale Übung haben, in der wir eine Datei erhalten, in der wir aufgefordert werden, Werte in einer bestimmten Reihenfolge zu sortieren dann die neue sortierte Liste und eine andere Datei zu schreiben. All dies und mehr werden wir zeitnah durchgehen . Diese Klasse soll kurz, prägnant und direkt auf den Punkt kommen. Sie könnten theoretisch weniger Zeit und mehr Zeit mit praktischer Erfahrung verschwenden. Worauf wartest du also? Es ist an der Zeit, dass Sie Ihre Programmierkenntnisse auf die nächste Stufe heben, sich heute anmelden und wir sehen uns im Kurs. 2. Einführung - E-Mail von Benutzern mit Regex überprüfen: Hallo und willkommen zurück zu meinem Video. Heute werden wir uns reguläre Ausdrücke ansehen. Reguläre Ausdrücke oder Regex können verwendet werden um zu prüfen, ob eine Zeichenfolge ein bestimmtes Muster enthält. Es ist ein mächtiges Werkzeug, um Muster in einem Text zu finden. Werfen wir einen Blick darauf. Nehmen wir zum Beispiel an, wir möchten die E-Mail des Benutzers mit RegEx überprüfen. Das erste, was wir tun müssen , um RegEx zu verwenden , ist der Import des RE-Moduls. Nehmen Sie nun an, dies ist die E-Mail-Adresse, die wir überprüfen möchten. Jetzt erstellen wir eine Schaltfläche und legen die Regeln für die Schaltfläche fest, die wir überprüfen möchten. Jetzt müssen wir die E-Mail-Adresse in vier Teile aufteilen , um ein besseres Verständnis für den ersten Teil zu haben , der Snap oder Benutzer-ID erhält, sie kann A bis Z und 0 bis neun enthalten. Am Anfang verwenden wir die Karotte oder das Zirkumflex-Symbol , um das zu initialisieren. Wir möchten eine Zeichenfolge abgleichen , die mit folgendem beginnt. Und um dieses Muster zu beenden, verwenden wir das Dollarsymbol. Aber natürlich möchten wir weitere Condition Store-Strings hinzufügen . Du wirst es jetzt nicht beenden, das zweite, was wir eintippen , a bis Z und 0 bis neun. Dies bedeutet, dass dieser Teil der Zeichenfolge einen beliebigen Buchstaben in einer beliebigen Zahl enthalten kann. Jetzt geben wir ein Plussymbol ein, das angibt, dass dies ein - oder mehrmals auftreten kann. Der Name des Empfängers kann auch Symbole wie Punkt, Unterstrich und Strich enthalten . Periodenunterstrich und Strich. Wir verwenden den umgekehrten Schrägstrich, um unsere Sonderzeichen, den Punkt, den Unterstrich und den Strich zu definieren . Wir verwenden das Fragezeichen hier da diese Symbole entweder 0 oder höchstens eins verwendet werden können , wenn sie zweimal auftreten, was bedeutet, dass es sich um eine ungültige E-Mail handelt. Deshalb mussten wir das mit einem Fragezeichensymbol angeben . Nun, nach diesen Symbolen, können Sie auch beliebige Zeichen von A bis Z und 0 bis neun haben . Nach den von uns angegebenen Symbolen, dem Unterstrich und dem Strich der Periode, können wir Buchstaben von a bis Z oder Zahlen von 0 bis neun haben . Genau so. Auch hier werden wir das Plus-Symbol verwenden, da sie mehr als einmal auftreten könnten. Jetzt müssen wir das Add-Symbol schreiben, das hier auftritt. Nach dem Add-Symbol haben wir Dinge wie At Hotmail oder Gmail und so weiter und so weiter. Es können also beliebige alphanumerische Zeichen sein. Nach der Anzeige kommt Hotmail die Frist. müssen wir also angeben. Jetzt nach Ablauf der Zeit kommt Dinge wie.com.net. Normalerweise haben sie eine Länge zwischen zwei und drei Zeichen. müssen wir also angeben. Jetzt werden wir das Dollarsymbol verwenden, um unsere Zeichenfolge zu beenden. Nachdem unser Muster abgeschlossen ist, möchten wir vom Benutzer Eingaben erhalten indem wir ihn auffordern, seine E-Mail einzugeben. Jetzt werden wir eine F-Schleife erstellen , um den Button zu überprüfen, würden sie uns benutzen? Und so wird die re.search-Methode zwei Argumente annehmen. Der erste ist der Button, den wir erstellt haben. Die zweite ist die Eingabe des Benutzers oder die Zeichenfolge, die wir überprüfen möchten. Lassen Sie uns also unser Programm ausführen und sehen, wie es aussieht. Geben wir also dieselbe E-Mail-Adresse ein. Also glaube ich, der Fehler, den ich gemacht habe, war, hier einen Platz zu verlassen. Und wenn ich den Platz entferne, funktioniert es gut. Eine hochtypische Phonetik statt genetischer Map. Mal sehen, ob wir absichtlich eine ungültige E-Mail eingegeben haben , wie generisch. Und dann habe ich eine andere einfache und gültige E-Mail benutzt. Nun, wie es aussieht, funktioniert unser Programm gut. Werfen wir einen Blick auf ein anderes Beispiel. Sagen wir, wir möchten nach einer bestimmten Schaltfläche in der folgenden Zeichenfolge suchen. Es scheint also, dass Kapital A zweimal wiederholt wurde. Und wir wollen dieses Muster in unserem eigenen Sinne prüfen. Um das zuerst zu tun, definieren wir unseren Button. Hier. Wir werden die Compile-Methode verwenden. Wir könnten die Suchmethode auch wie im vorherigen Beispiel verwenden . R hier bevor unsere Zeichenfolge bedeutet, dass roher String, Python, roher String umgekehrter Schrägstrich als ein wörtliches Zeichen behandelt . Dies ist nützlich, wenn wir eine Zeichenfolge haben, die einen umgekehrten Schrägstrich enthält . Ich möchte nicht, dass sie als Escape-Zeichen behandelt wird . Sehen wir uns also den Unterschied zwischen regulären Strings und rohen Strings an. Der erste , der eine reguläre Zeichenfolge ist, behandelte den Backslash n als Escape-Zeichen. In diesem Fall wird es verwendet, um eine neue Zeile zu beginnen. Und wie Sie es jedoch sehen können, in der zweiten Zeichenfolge, die eine rohe Zeichenfolge ist, die Benutzer des Backslash-Schrägstrichs ignoriert und als ein wörtliches Zeichen behandelt . Wenn wir Backslash n durch Backslash x ersetzen, haben wir einen Pfeil und die reguläre Zeichenfolge da Backslash x keinen Zweck hat. Aber unsere rohe Zeichenfolge ignorieren wir das und drucken genauso wie es ist. Gehen wir also zurück zu unserer Testzeichenfolge. Jetzt erstellen wir ein Objekt. Also tippen wir den Button ein, den wir verwenden werden. Jetzt werden wir die find-Methode verwenden. Innerhalb der definierten ETL-Methode geben wir unsere Tests schrumpfen ein. Jetzt haben wir ein Objekt namens Matches erstellt , das wir mit genügend Flow iterieren können. Wie Sie sehen können, zeigt es zwei Vorkommen einer Weile, die ihre Position zeigen. Außerdem wird die Groß- und Kleinschreibung beachtet, was bedeutet, dass es die Kleinbuchstaben nicht aufgenommen hat. Wir können unseren Code auch kürzer machen, indem wir r e verwenden, finden Sie Eta sofort. Zum Beispiel. Jetzt geben wir den Button ein, nach dem wir suchen möchten, nämlich a0. Und dann das zweite Argument werden wir die Zeichenfolge übergeben, die wir testen möchten. Wie Sie sehen können, werden dieselben Ergebnisse mit weniger Codezeilen zurückgegeben . Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir sehen uns im nächsten. 3. Methoden zur Suche nach Matches: Hallo und willkommen zurück zu meinem Video. Heute schauen wir uns Methoden an , um nach Übereinstimmungen zu suchen. Im letzten Video haben wir also an diesem Beispiel gearbeitet, das „find better“ verwendet hat. Es gibt andere Methoden, um nach Übereinstimmungen zu suchen, wie zum Beispiel Übereinstimmung, Suche und Suche nach allen. Finde es also, um ein Objekt mit der Position der Zeichenfolge zurückzugeben , nach der wir gesucht haben. Find all gibt jedoch zum Beispiel nur eine Zeichenfolge zurück. Also das ist es, was alles findet. Was ist mit der Match-Methode. Die Match-Methode sucht nur am Anfang der Zeichenfolge nach der Schaltfläche und gibt beispielsweise nur das erste Vorkommen zurück. Wie Sie sehen können, hat es das zweite Vorkommen von a nicht zurückgegeben. Jetzt ändern wir die Schaltfläche. Wir wollen danach suchen nach etwas anderem als zum Beispiel, wie Sie sehen können, es ist keine Rückgabe. Obwohl fünf Neuntel Acht in unserer Saite aufgetreten sind, aber weil es nicht am Anfang war, ist es keine Rückkehr. Was ist mit der Suche? Suche funktioniert sehr ähnlich, um besser zu finden. Es gibt jedoch nur das erste Vorkommen des Musters zurück , zum Beispiel. Also die vier gängigsten Übereinstimmungsmethoden, oder finden Sie eine bessere Suche, finden alle und stimmen überein. Werfen wir einen Blick auf dieses Beispiel. Wir haben die folgende Zeichenfolge , die 3$ für das Shirt angibt, wir würden RegEx nicht verwenden, um zu überprüfen ob die Saite mit einer Ziffer beginnt. In diesem Fall sind es drei. Und wenn das der Fall ist, drucken wir diese Ziffer aus. Also lasst uns zuerst RE importieren. Und dann erstellen wir eine Zeichenfolge und legen diesen Text hinein. Jetzt möchten wir einen Button erstellen , nach dem wir suchen möchten. Und wir werden rohe Strings benutzen. Wie üblich geben wir unseren Button Backslash t ein. Backslash d bedeutet eine Ziffer, was genau das ist, was wir hier haben. Jetzt, da wir eine Schaltfläche erstellt haben, erstellen wir ein Übereinstimmungsobjekt. Hier würden wir unseren Button übergeben , dann werden wir unsere Zeichenfolge übergeben. Jetzt können wir einfach F sagen, was bedeutet, wenn S wahr ist, dann druckt das Folgende. Sie könnten fragen, dass Zitat mit Punktgruppe übereinstimmt, Gruppe ist eine Methode des Übereinstimmungsobjekts. Und was es einfach tut, ist, dass es die übereinstimmende Zeichenfolge zurückgibt, die in diesem Fall drei ist. Wir werden uns die Match-Methoden im nächsten Video genauer ansehen . Aber im Moment wird die Gruppe die Nummer drei für uns zurückgeben. Lassen Sie uns also unser Programm ausführen und sehen, wie es aussieht. Selbst wenn wir diese Zahl auf fünf ändern, wird sie fünf zurückgeben. Wenn wir also die Gruppenmethode nicht verwenden, werden wir das bekommen. Du bekommst das vollständige Übereinstimmungsobjekt. Wir wollten nur die Saite Fünf. Deshalb verwenden wir die Punktgruppen-Methode. Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir sehen uns im nächsten. 4. Methoden für Match: Hallo und willkommen zurück zu meinem Video. Im letzten Video haben wir also gesehen, wie wir mit der Rückkehr ein Objekt finden , das wir mit einer ausreichenden Schleife iterieren konnten . Dieses Objekt selbst hat also seine eigenen Methoden und wir werden uns sie ansehen. Das sind die Methoden beginnen und wachsen und überspannen. Wie Sie sehen können, wenn wir das Ergebnis drucken, wird dieses Objekt zurückgegeben. Wir können die Spanne hier nur drucken, indem wir dafür span verwenden, wir verwenden Match-Punkt-Span. Wenn wir jetzt unser Programm ausführen, erhalten wir ein Tupel, das unsere Spanne enthält, dass dies nützlich sein kann , wenn wir genau ausdrucken möchten , wo unser Muster aufgetreten ist. Wie Sie beispielsweise sehen können, sieht dies für den Benutzer besser lesbarer aus. Wenn wir den Typ dieser Match-Punkt-Span-Methode ausdrucken, werden wir herausfinden, dass es sich nur um eine Tabelle die die Position enthält, was unsere Übereinstimmung stattgefunden hat. Wir können die Start- und Endposition unserer Zeichenfolge auch mit Start und Ende drucken . Also lasst uns einen Blick darauf werfen. Match dann Komma Match. Um also die Ganzzahlen unserer Start- und Endposition zurückzugeben , könnten wir so etwas tun. Und wenn wir seinen Typ ausdrucken, werden wir herausfinden, dass es sich nur um eine ganze Zahl handelt. Wenn wir schließlich nur die übereinstimmende Zeichenfolge drucken möchten , verwenden wir eine Gruppe. Und wie erwartet erfahren wir, wenn wir seinen Typ drucken, dass es sich um eine Zeichenfolge handelt. Zusammenfassend stimmt also mit einem Objekt überein, das die Spanne enthält , in der das Match-Schrägstrich-Muster aufgetreten ist. Und es enthält auch die Zeichenfolge, die übereinstimmt. Wir können auf einzelne Komponenten dieser Übereinstimmung zugreifen , indem wir die Methoden verwenden, die wir durch die Startmethode durchlaufen haben , um eine ganze Zahl an der Startposition zu erhalten , in der das Muster begonnen hat. Methode, um eine ganze Zahl zu erhalten, die Endposition, an der die Schaltfläche endete. Gruppenmethode, um die übereinstimmende Zeichenfolge zu erhalten. Und schließlich die Span-Methode, um eine Tabelle zu erhalten , die die Start- und Endposition der Schaltfläche enthält . Das war's also für die Grundlagen. Und im nächsten Video werden wir uns ansehen, wie wir nützliche Daten mit rotem X für Datenwissenschafts - oder Dokumentationszwecke extrahieren können nützliche Daten mit rotem X für Datenwissenschafts . Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, dass wir uns im nächsten sehen werden. 5. Extrahieren Nützlicher Daten: Hallo und willkommen zurück zu meinem Video. Heute werden wir lernen, nützliche Daten zu extrahieren und unsere Fähigkeiten für reguläre Ausdrücke auf ein ganz neues Niveau zu heben. In diesem Video verwenden wir ein Tool oder eine Website namens beg x, eins zu eins. Es ist ein sehr leistungsfähiges Tool, das uns nicht nur mehr über RegEx beibringt, sondern auch den Prozess vereinfacht und den folgenden visualisiert. Zuerst klicken wir auf Bifan als unsere Programmiersprache , mit der wir arbeiten. Nehmen wir nun an, wir haben die folgende Zeichenfolge. Wenn wir uns die Zeichenfolge ansehen, haben wir zwei Zahlen. Eine ist eine Telefonnummer und die andere ist eine zweistellige Nummer , die das Unternehmen sofort verkauft. Was wir über Telefonnummern wissen , ist, dass sie aus zehn Ziffern bestehen, so dass sie leicht von der anderen Nummer hier unterscheiden . So können wir unseren RegEx so einstellen, dass er extrahiert wenn er eine zehnstellige Sequenznummer findet. Wenn wir also zur Registerkarte „Kurzübersicht“ gehen, könnten wir die Syntax finden, die wir benötigen, falls wir sie vergessen. Hier heißt es also umgekehrter Schrägstrich d bedeutet eine beliebige Ziffer oder mit anderen Worten eine beliebige Zahl. Also lasst uns weitermachen und das benutzen. Wie Sie sehen können, wann, wenn wir Backslash d eingeben, sind das die Übereinstimmungen, die wir erhalten. Es stimmte im Wesentlichen mit jeder Ziffer überein, die wir haben. Was wir nun mit zwei aufeinanderfolgenden Ziffern übereinstimmen möchten , können wir an Backslash-Tage binden. Jetzt stimmt es mit zwei Ziffern überein. Bevor wir also 12 Spiele hatten, haben wir jetzt sechs. Da es jetzt nicht mit jeder einzelnen Ziffer übereinstimmt , stimmt es nur zwei Ziffern zusammen als eine. Und wenn wir diese drei umgekehrten Schrägstriche eingeben, erhalten wir nur zwei Übereinstimmungen mit drei aufeinanderfolgenden Ziffern. Und wie Sie sehen können, werden 20 Millionen nicht übereinstimmen, weil es sich um eine zweistellige Zahl handelt und so weiter und so weiter. Man könnte also denken, wenn Izzy, wenn eine zehnstellige Telefonnummer, die zehn Ziffern ist, könnten wir einfach zehn Backslash bleiben , diese beiden mit dieser Sequenz übereinstimmen. Technisch gesehen liegen sie nicht falsch und das würde zum Beispiel gut funktionieren. Wir haben also 345678910. Wenn wir uns die Spiele ansehen, werden wir das bekommen. Offensichtlich gibt es anspruchsvollere Möglichkeiten, dies zu tun. Zum Beispiel könnten Sie zur Registerkarte „Kurzübersicht“ wechseln. Gemeinsame Token werden einen Ausdruck finden , der genau drei von a, also genau drei Vorkommen des Buchstabens a nacheinander aussagt , also genau drei Vorkommen . Versuchen wir es also zu unserem Vorteil zu nutzen. Also brauchen wir von Anfang an kein, wir wollen stattdessen einen Backslash d. Also geben wir umgekehrten Schrägstrich d ein und dann geben zwischen zwei geschweiften Klammern zehn statt drei ein. Dies gab uns die gleichen genauen Ergebnisse mit viel weniger Codierung. Natürlich könnten manche sagen: Nun, Telefonnummern, es wird zum Beispiel in einem anderen Format dargestellt. Wenn wir also Telefonnummern extrahieren wollen sind sie eindeutig in zwei verschiedenen Formaten. Wir könnten folgendes tun. Speichern wir zuerst unseren Ausdruck hier drüben und wir werden später darauf zurückkommen. Also beginnt einer der Schläger, unser Knopf, den wir kombinieren möchten, mit einer Klammer. Wenn wir jedoch bis zu einem regulären Ausdruck ein Paket eingeben, würden wir auf ein Problem stoßen. Und das liegt daran, dass die Klammer ein Sondercharakter ist und eine Bedeutung für unser Programm hat. Wie Sie sehen können, wenn wir uns den Kurzbezugsschritt ansehen, stellen wir fest, dass die Klammer verwendet wird, um alles in geschlossener Klammer zu erfassen, in diesem Fall wird als Sonderzeichen bezeichnet. Um also einen Sondercharakter zu verwenden, müssen wir ihm entkommen. Und wie entkommen wir dem? Wir geben einfach einen umgekehrten Schrägstrich davor ein. Zum Beispiel. Wie Sie sehen können, funktioniert das gut und es hat unsere Tasche hier entdeckt. Also lasst uns weitermachen. Also haben wir drei Ziffern nach der Klammer, lasst uns sterben. Aber in unserem Button drei Ziffern. Und wie Sie sehen können, hat es die Nummer erkannt. So, bisher so gut. Und wieder haben wir eine Klammer, aber wir können die Klammern sofort eingeben. Wir müssen ihm mit Backslash entkommen. Jetzt haben wir ein Strichsymbol. Dann haben wir drei Ziffern und dann einen einfachen Bindestrich und schließlich vier Ziffern. Wie Sie sehen können, entspricht es unserem Telefonnummernformat. Wir sind also fertig mit diesem Ausdruck, aber wir haben immer noch unseren ersten Ausdruck , der Backslash d zehn ist. Wie sagen wir unserem Programm, dass es einfach nach diesem Button oder diesem Muster suchen soll , könnten wir das vertikale Balkensymbol verwenden. Wenn wir also die Suche hier eintippen oder diese alternative Übereinstimmung erhalten, entweder a oder B. Also verwenden wir das Einfache. Dann fügen wir unseren Ausdruck hier ein. Und wie Sie sehen können, haben beide entdeckt. Es heißt also, entweder suche nach diesem Muster oder nach diesem Button. Wenn wir dies also in unserem Python-Programm verwenden möchten, könnten wir Folgendes tun. Also importieren wir zuerst unsere Acht-Use-Droge X. Dann machen wir eine Zeichenfolge , die unseren Text enthält. Jetzt erstellen wir einen Taktstock. Und wir nennen das Beste den Button, den wir erstellt haben. Jetzt werden wir find all verwenden, um zuerst unser Muster einzugeben. Dann den Text, den wir abgleichen möchten. Jetzt drucken wir einfach Match. Schauen wir uns die Ergebnisse an. Wie Sie sehen können, funktioniert es einwandfrei. So können wir RegEx immer eins zu eins verwenden, um unseren Ausdruck zu erstellen und zu testen, bevor wir ihn hier auf Python anwenden. Es macht die Dinge viel einfacher, weil er den Prozess für uns visualisiert und uns zeigt was in Echtzeit abgeglichen wird. Jetzt haben wir für Stufe zwei diesen riesigen Textblock und wir möchten die Titel daraus extrahieren. Die Titel hier sind also unser Ziel und unsere Chance. Und wir wollen die Dosis extrahieren. Um zu beginnen, können wir Note tippen , weil sie mit nichts beginnen. Und dann gibt es ein Leerzeichen, dann eine Zahl. Jetzt haben wir Notiz eins und n2 erfasst, aber wir möchten immer noch den Text erfassen , der danach kommt. Wenn Sie genau hinsehen, werden Sie feststellen, dass der Titel damit endet hier und hier eine neue Zeile erstellt wird. Und wir wissen, dass eine neue Zeile in Python Backslash bedeutet. Wir wollen alle Texte erfassen bis wir auf eine neue Zeile stoßen. Die Frage bleibt, wie geben wir das in regulären Ausdruck ein? Wenn wir also hier zum Schnellreferenzstopp schauen, heißt es ein beliebiges Zeichen außer a, B oder C. Also lasst uns ein neues Dokument öffnen, mit dem Sie experimentieren können. Nehmen wir an, wir haben den folgenden Text und wir möchten sagen, dass alle Zeichen außer dem Prozentzeichen, dem Gleichheitszeichen, übereinstimmen alle Zeichen außer . Also geben wir folgendes ein. Wie Sie sehen können, stimmte es mit allem außer diesen Samples überein. Und um eine Sequenz zu machen, fügen wir am Ende unseres Ausdrucks ein Pluszeichen hinzu. Jetzt heißt es ein oder mehrere Charaktere bis Sie auf eines dieser Zeichen stoßen. Das bedeutet also das Pluszeichen. Ein oder mehrere Vorkommen eines beliebigen Zeichens, das Sie angeben. Gehen wir nun zurück zu unseren Texten, wenden wir an, was wir gelernt haben. Okay, jetzt haben wir eine Nummer, dann haben wir ein Leerzeichen. Also fügen wir ein Leerzeichen hinzu. Dann versuchen wir diesen Ausdruck. Alles außer einer neuen Linie. Es entspricht nur dem ersten Zeichen und stoppt. Stattdessen wollten wir einen oder mehrere Charaktere einfangen. Dafür verwenden wir das Pluszeichen. Und wenn wir zum Schnellreferenztyp und -typ einer oder mehrerer Personen gehen , können wir das Pluszeichen dafür verwenden. Wir könnten auch das Sternzeichen verwenden, was 0 oder mehr Vorkommen bedeutet. Und es würde uns die gleichen Ergebnisse liefern. Wenn wir jetzt zu den Spielinformationen gehen, können wir sehen, dass es funktioniert, aber wir sind immer noch nicht fertig, weil wir die Titel erfassen wollen und nicht einer und zwei Knoten nicht Teil unserer Titel sind. Dafür werden wir Klammern verwenden. Wie Sie sehen können, heißt es alles eingeschlossen. Wenn wir also zu unserem Ausdruck gehen, ist dies genau der Ausdruck in dem der Titel hier erfasst wurde. Lasst uns also Klammern um diesen Ausdruck legen. Nun, was es tut, ist, dass Gruppen diese Ergebnisse für uns erfasst werden. Was passiert, ist, dass es mit diesen anderen Ergebnissen wie Knoten eins und Knoten zwei übereinstimmt . Verwenden wir das also in unserem Python-Code. Und um diesen riesigen Textblock einzufügen, verwenden wir drei einfache Anführungszeichen, um den umgekehrten Schrägstrich n oder neue Zeilen in unserem Text zu berücksichtigen. Anstelle dieser alten Methode werden wir also drei Anführungszeichen verwenden, 123, dann werden wir unseren Text stützen, und dann verwenden wir weitere drei Anführungszeichen. Kopieren wir nun unseren regulären Ausdruck , den wir geschrieben haben, und stützen wir ihn auf Muster. Wie Sie sehen können, wenn wir das Programm ausführen, es nur den Titel zurück, der für uns ohne einen, nicht zwei ist . Und jetzt haben wir für Stufe drei einen relativ kleinen Textblock. Wir werden jedoch viele Informationen darüber extrahieren. Wenn wir uns also die nützlichen Informationen hier ansehen, können wir sehen, dass die Einnahmen im folgenden Format bereitgestellt wurden . Geschäftsjahr FY dann gefolgt von dem Jahr, in diesem Fall ist es 2021 oder 2020 und dann ein Raum und dann der Gerichtssaal in diesem Jahr. In diesem Fall ist dies Q1 und dies ist Q4. Wir wissen also, dass es in einem Jahr nur vier Viertel geben kann, Q1, Q2, Q3 und Q4. Es kann kein Q5 geben. Also behalten wir das im Hinterkopf. Auf jeden Fall beginnt unser Muster mit FY. Geben wir also FY ein. Dann gibt es offensichtlich vier Ziffern, was in diesem Fall das Jahr ist. Und wie machen wir das? Wir verwenden Backslash d. Und dann geben wir zwischen den geschweiften Klammern vier ein. Dieser Ausdruck bedeutet also f y gefolgt von vier Ziffern oder Telefonnummern. Bisher so gut. Und dann gibt es ein Leerzeichen danach, vor dem ersten und vierten Quartal. Das müssen wir in unserem regulären Ausdruck angeben. Geben wir also ein Leerzeichen ein. Dann gibt es eine Warteschlange. Jetzt folgt der Warteschlange eine Ziffer. Wir können jedoch nicht einfach slash d eingeben , da dies Dinge beinhalten würde , wie die in diesem Fall falsch sind. Wir möchten also sicherstellen, dass unsere Ziffern zwischen eins und vier liegen . Wie machen wir das? Wenn wir uns die Schnellreferenz-Registerkarte ansehen, gibt es diese Option, die ein einzelnes Zeichen von a, B oder C angibt. Sie können explizit die Zahlen angeben, die Sie einschließen möchten, nämlich 1234. Aber es gibt einen besseren Ansatz. Wir könnten diese Option im Schnellreferenzstempel verwenden , der ein Zeichen im Bereich von a bis Z angibt. Jetzt könnten wir stattdessen eins bis vier eingeben, und es würde uns dieselben Ergebnisse mit weniger Codierung liefern. Also lasst uns jetzt unser Muster und Python testen, wir nennen mich Ich liebe Text und stützen es auf diesem Ding Namenstext. Und dann kopieren wir unser Muster und basieren es im Muster, unserem Python-Programm. Und jetzt führen wir das Programm aus, um die Ergebnisse zu sehen. Was wäre, wenn einer der Flüge Kleinbuchstaben wäre, das aber trotzdem erreichen wollen, könnten wir folgendes tun. Lags ist gleich Fall ignorieren. Wenn wir nun die Ergebnisse drucken, wie Sie sehen können, stimmt sie mit den Kleinbuchstaben f, y überein. Angenommen, wir möchten das Geschäftsjahr nicht einbeziehen, das für das Geschäftsjahr steht. Einfach, wir könnten die Klammern verwenden, um erfassen und behalten Sie nur die Teile, die wir wollen. Wenn wir zum Beispiel unser Programm ausführen, können wir es sehen, es hat nur die Teile erfasst, die innerhalb der Klammern angegeben sind. Gehen wir also eins zu eins zu eins zu RegeX zurück. Wir werden in der Lage sein, das Jahr und ihre Quartale zu erreichen. Wir möchten jedoch immer noch die Einnahmen dieses Sets hier abgleichen. Und nehmen Sie an, wir hatten andere Zahlen und unsere Texte, die wir vermeiden möchten, zum Beispiel. Also lasst uns unseren Ausdruck hier speichern. Wir wollen diese Nummer nicht erfassen. Wir wollen nur die Zahlen erfassen , die mit einem Dollarzeichen beginnen. Wir können jedoch nicht einfach das Dollarzeichen eingeben , da es sich um ein Sonderzeichen handelt. Das bedeutet das Ende einer Zeichenfolge, wie Sie auf der Registerkarte „ Kurzreferenz“ unten sehen können. Da es sich also um ein Sonderzeichen handelt, wissen wir, dass wir den umgekehrten Schrägstrich verwenden müssen, um diesem Sonderzeichen zu entkommen, bevor wir es verwenden. Jetzt stimmt es mit dem überein, was wir wollen. Jetzt haben wir danach eine Ziffer, also können wir Backslash d eingeben. Danach gibt es jedoch einen Dezimalpunkt, also verwenden wir stattdessen eckige Klammern. Dann haben wir ein Dezimalzeichen da es sich um ein Sonderzeichen handelt, wie Sie im Schnellreferenzstopp sehen können. Wir müssen den umgekehrten Schrägstrich verwenden, bevor wir ihn verwenden. Jetzt schließen wir unsere eckige Klammer. Jetzt müssen wir ein Plus setzen, was ein oder mehrere Vorkommen bedeutet. Wenn der Gewinn des Unternehmens aus irgendeinem Grund 10,4 Milliarden betrug, zählt es immer noch zwei Ziffern vor dem Dezimalpunkt, da wir dies mit dem Pluszeichen angegeben haben . Fügen wir nun diesen regulären Ausdruck und unser Python-Programm ein und sehen, ob es funktioniert. Jetzt nehmen wir den Knopf. Lasst uns das entfernen. Lassen Sie uns jetzt unser Programm ausführen. Und wenn wir das Dollarzeichen nicht wollen, könnten wir natürlich immer die Klammern verwenden, um zu erfassen, was wir wollen. Angenommen, wir wollen hier das Jahr, das Quartal und den Gewinn davon abgleichen . Wie machen wir das mit Drug X? Nun, wir haben bereits einen regulären Ausdruck gemacht , der dem Jahr und dem Quartal entspricht. Also lasst uns das zuerst benutzen. Jetzt, nach dem Quartal, jeder Charakter, bevor wir das Dollarzeichen erreichen. Also geben wir ein beliebiges Zeichen außer dem Dollarzeichen ein. Und jetzt müssen wir ein Pluszeichen hinzufügen, um ein oder mehrere Vorkommen zu erfassen. Jetzt stimmt es alles zusammen, bis es gekontert ist, ein Dollarzeichen. Das wollen wir also. Jetzt kehren wir zu dem regulären Ausdruck zurück, den wir zuvor erstellt haben , um dem Anhang zu entsprechen und fügen ihn in unseren Ausdruck ein. Wie Sie sehen können, passt es genau zu dem, was wir wollen. Aber man könnte sagen, nun, wir wollen nicht unbedingt, dass die Texte dazwischen waren, und es war einfach, dass Sie die Klammern verwenden können , um genau zu erfassen, was wir wollen. Jetzt erfasst es nur diese Ergebnisse. Gehen wir also zurück zu unseren Python-Programmen , wie es aussieht. Wie Sie sehen können, funktioniert es wie vorgesehen. Und wenn Sie das Dollarzeichen nicht einschließen, könnten wir es natürlich einfach in unseren erfassten Ausdruck aufnehmen. Schauen Sie sich die Art an, zum Beispiel in Milliarden dargestellten Einnahmen. Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir sehen uns im nächsten. 6. Sortieren von ungeordneten Datendateien: Hallo und willkommen zurück zu meinem Video. Heute schauen wir uns an, wie wir eine unsortierte Textdatei mit RegEx sortieren können . Das ist also die Akte, die wir uns ansehen werden. Der Dateiname ist Datenliste. Ich habe es auf meinem Desktop gespeichert. Wenn wir die Datei öffnen, haben wir drei verschiedene Arten von Daten, Namen, E-Mail und Telefonnummern in dieser Liste. Der FirstName gehört hier zur ersten E-Mail und gehört hier zur ersten Nummer. In ähnlicher Weise gehört der zweite Name zur zweiten E-Mail und zur zweiten Nummer und so weiter und so weiter. Jetzt ist das Problem, dass sie nicht nebeneinander aufgeführt sind. Ich habe diese Werte nacheinander nebeneinander. Wenn Sie dies manuell tun und den Vornamen neben die erste E-Mail in der ersten Nummer platzieren würden, würde es natürlich Vornamen neben die erste E-Mail in der ersten Nummer platzieren würden, ewig dauern. Wie strukturieren wir diese Liste mit wenigen Codezeilen? Gehen wir also in unser Python-Programm und schauen uns an, RegEx zu verwenden. Das erste, was wir tun wollen, ist unser Array zu importieren. Dann möchten wir diese Datei öffnen. Wenn Sie eine detailliertere Erklärung zum Umgang mit Dateien in Python wünschen , können Sie meine Klasse zum Thema Dateibehandlung überprüfen. So öffnen wir eine Datei in Python. So würden Sie eine Datei öffnen, wenn sie im selben Verzeichnis wie Ihre Python-Datei gespeichert würde. Unsere Datei wird jedoch auf unserem Desktop gespeichert. Wir müssen den Speicherort in unserem Programm angeben , um den Speicherort unserer Textdatei zu ermitteln. Wir gehen einfach zu dem Speicherort, an dem sie sich befindet, klicken dann mit der rechten Maustaste auf Eigenschaften. Und hier ist der Ort, einfach in unser Python-Programm einfügen wird. Jetzt müssen wir diese Backslashes ändern, zwei Schrägstriche. Wie Sie jetzt sehen können, zeigt es keine Erwachsenen. Jetzt lesen wir diese Datei und speichern ihren Inhalt in dieser Variablen namens „Inhalt“. Das nächste, was wir tun möchten, ist Muster zu erstellen, die mit den Daten übereinstimmen, die wir haben. Glücklicherweise haben wir bereits Schaltflächen erstellt, die mit E-Mails und Telefonnummern übereinstimmen, daher verwenden wir diese einfach, da sie funktionieren. Das sind die gleichen, die wir in den vorherigen Klassen verwendet haben. Dies ist also die Schaltfläche , die mit E-Mails übereinstimmt, und dies ist die Schaltfläche, die mit den Telefonnummern übereinstimmt. Es gibt jedoch einen geringfügigen Unterschied. Wenn man sich die Zahlen anschaut, ähneln sie unseren, in denen sie mit Klammern beginnen, dann gibt es drei Zahlen, aber anstelle eines Bindestrichs haben sie hier ein Leerzeichen. Lassen Sie uns dies also durch Leerzeichen gestrichelt ersetzen. Und dann haben sie drei Zahlen. Wir haben drei Zahlen und dann einen Strich. Und dann für Zahlen. Das sollte also mit den Zahlen in unserer Liste übereinstimmen, gut. Diese beiden Tasten sollten also gut funktionieren. Eine weitere Schaltfläche, die wir erstellen müssen, ist das Namensmuster, das mit den Namen in der Liste übereinstimmt , die wir nicht erstellt haben. Wir haben jetzt von Grund auf neu erstellt. Wenn wir uns also die Listennamen ansehen, haben wir im Wesentlichen Großbuchstaben von A bis Z und dann jeden Kleinbuchstaben von A bis Z, dann ein Leerzeichen. Dann noch einmal ein Großbuchstabe von A bis Z und dann Kleinbuchstaben von I2C. Das scheint also ziemlich einfach zu sein. Lass es uns machen. Ich bin also Doug x Begriffe, so sieht es aus. Diese Schaltfläche ist also in zwei Teile geteilt, den FirstName und LastName. Und sie sind durch ein Leerzeichen dazwischen getrennt. Der FirstName ist ein beliebiger Buchstabe von Großbuchstaben a bis Kapital Z, jedoch nur einmal vorkommt, dann jeder Buchstabe von Kleinbuchstaben a bis z. Dieses Mal haben wir ein Pluszeichen hinzugefügt , da es ein- oder mehrmals auftreten kann. Wenn wir uns also unsere Liste ansehen, haben wir hier nur einen Großbuchstaben und dann mehrere Kleinbuchstaben. Und das sagen unsere Knöpfe. Ein Großbuchstabe und dann eine beliebige Anzahl von Kleinbuchstaben. Dann haben wir ein Leerzeichen dazwischen. Und dann wieder derselbe Knopf, ein Großbuchstabe und dann eine beliebige Anzahl von Kleinbuchstaben. Jetzt haben wir unsere Muster bereit. Lassen Sie uns eine Suchmethode wählen. Wir könnten find all gebrauchen, oder wir könnten den find-editor verwenden. Aber ich denke, finde S, das in diesem Fall besser geeignet ist. Lassen Sie uns also für jedes Vokalmuster einen guten Schuldner erstellen. Also haben wir hier einen Fonds geschaffen. Es ist ein Objekt namens E-Mails, gab ihm die Schaltfläche, die mit E-Mails übereinstimmt. Und geben Sie dann die Zeichenfolge an, mit der wir ihn abgleichen möchten. In diesem Fall wird unsere Zeichenfolge oder unsere Texte in dieser Variablen namens Inhalt gespeichert, die aus unserer Textdatei führt. Das Gleiche gilt für Telefone und Namen. Wenn wir also den Find-Editor verwenden würden, wie wir es normalerweise tun, dies die Ergebnisse, die wir erhalten. So verwenden wir normalerweise find better. Hier ist das Objekt, über das wir iterieren möchten, und wir sagen, dass für jedes Element und jede E-Mail jedes Element gedruckt wird. Lassen Sie uns also unser Programm ausführen und sehen, wie es aussieht. Wie Sie es für die Zehner, das vollständige Objekt, sehen können , benötigen wir nur die Zeichenfolge oder die übereinstimmende E-Mail. Dafür verwenden wir die Methode der Punktgruppe. Lassen Sie uns unser Programm ausführen. Jetzt gibt es nur noch die Strings zurück. Aber wir sind immer noch nicht fertig. Dies wird uns im Wesentlichen dieselbe Datei gegeben , die wir bereits haben, in der die E-Mails an einem Ort aufgeführt sind und die Namen in einer anderen aufgeführt sind. Wie listen wir sie nebeneinander auf? Sie könnten vorschlagen, dass wir eine weitere for-Schleife für die Telefone und Namen erstellen könnten . Kopieren wir zum Beispiel einfach dieses Telefon ein. Handys hier. Entschuldigung. Und dann dasselbe für Namen, für Namensnamen. Dann setzen wir den Namen hier. Lass es uns also laufen lassen und sehen, wie es aussieht. Es. Im Wesentlichen sieht es genauso aus wie dieselbe Datei, die wir haben, die nicht funktioniert. Entweder. Man könnte vorschlagen , diese vier Lappen vielleicht untereinander zu legen. Wenn wir also das Leerzeichen hier entfernen, markieren Sie die Tabulatortaste und entfernen Sie das hervorgehobene Feld und drücken Sie Stop. Okay, also jetzt ineinander, Mal sehen, wie es aussieht. Jetzt ist es noch schlimmer, weil es die erste E-Mail als die Telefonnummer und dann die Namen gedruckt als die Telefonnummer und dann die hat und es ist nur ein Durcheinander. Aber keine Sorge, das ist ein spezifisches Werkzeug dafür. Im Wesentlichen wollen wir E-Mail, Telefon und Namen iterieren. Gleichzeitig wollen wir E-Mails nicht selbst iterieren als Schriften selbst, die Namen selbst. Wir wollen sie alle in derselben for-Schleife iterieren. Dafür verwenden wir ETL-Tools, um Editor-Tools zu verwenden. Zuerst müssen wir es importieren, keine Sorge, wir müssen nichts installieren. Es kommt standardmäßig mit Python. Wie Sie sehen können, wird mir vorgeschlagen, dass es mir gesagt hat, lasst uns jetzt ein wenig herauszoomen. Schließ das. Okay, jetzt wo wir es importiert haben, werden wir es so benutzen. Also geben wir für den Namen ein, weil wir über den Namen iterieren möchten. Und wir möchten auch per E-Mail iterieren. Und wir wollen auch über die Schrift iterieren. Und dann geben wir gzip ein. Und dann füge die Objekte ein, über die wir iterieren werden. Oh mein Gott, was ist los? Also Namen, E-Mails, Telefone. Oh, tut mir leid. Also für Namen in Namen und für E-Mail, in E-Mails und zum Spaß und Handys. Das funktioniert also genau wie eine reguläre for-Schleife für uns, außer dass wir jetzt über mehrere Objekte iterieren können. Jetzt drucken wir unsere Ergebnisse aus. Drucken Sie den Namen Punktgruppe und senden Sie uns dann eine E-Mail an die Gruppe. Dann habe ich das endlich gefunden. Es ist also sehr ähnlich wie wir über ein Objekt mit einer regulären for-Schleife iterieren würden . Das einzige, woran man sich erinnern sollte, ist, all die Objekte einzubeziehen , über die wir iterieren möchten, innerhalb der Zip-Klammer. Lassen Sie uns nun unser Programm ausführen und sehen, wie es aussieht. Das sieht genau so aus, wie wir es wollten. Aber auch hier sind wir immer noch nicht fertig. Wir möchten diese Ergebnisse in eine Datei schreiben. Anstatt sie einfach hier im Terminal zu drucken. Dafür öffnen wir eine neue Textdatei im Schreibmodus und nennen sie sortierte Daten. Also ist f gleich offen. Dann geben wir hier den Namen der Datei ein. Du nennst es sortiert TXT und dann ein Komma. Und hier geben wir den Modus an. Wir werden den W-Modus verwenden, was bedeutet Bytes Motor. Nun ja, es heißt Schreibmodus, aber diese Open-Funktion erstellt eine Datei für uns, wenn sie nicht existiert, und wenn sie existiert, wird sie den Inhalt dieses Objekts überschreiben. Wenn wir es also so lassen, wie es ist, wird dies die Datei hier in unserem Workspace erstellen. Wir erstellen es auf unserem Desktop nebenan oder in der Originaldatei dafür, oder in der Originaldatei dafür, geben wir denselben Speicherort an, an dem sich unsere Datei befindet. Also werden wir diese Dislokation behandeln und sie hier einfügen. Jetzt öffnen wir diese Datei, wir schreiben jetzt hinein. Lassen Sie uns also unsere for-Schleife ändern , um zu schreiben statt zu drucken. Also geben wir F ein, was ist der Name der Datei, dots, oder? Und das war's. Jetzt könnten wir hier einen Fehler bekommen. Das liegt daran, dass die Schreibmethode nur einen Parameter annimmt, aber wir haben hier drei Parameter platziert. Legen wir sie also in eine F-Zeichenfolge. Also f, dann beginnen wir eine Zeichenfolge. Und diese Zeichenfolge werden wir diese Variablen mit dem Namen Punkte platzieren , cool. Dann mailen Sie der Gruppe eine E-Mail. Dann hat endlich seine Gruppe gefunden. Dann beenden wir unsere Zeichenfolge mit einem weiteren doppelten Anführungszeichen. Jetzt sollten wir eingestellt sein, aber bevor wir unser Programm ausführen, vergessen wir nicht, unsere Datei zu schließen. Also geben wir def ein, was der Name unserer Datei ist. Lassen Sie uns also unser Programm ausführen und sehen, wie es aussieht. Wir sollten eine Datei sehen, die auf unserem Desktop erstellt wurde. Weil es nichts Determinantes , weil wir nichts gedruckt haben. Aber wenn Sie hier bemerkt haben, heißt es sortierte Daten, dies ist die Datei, die wir erstellt haben. Lass es uns öffnen und schauen uns mal an. Es ist irgendwie die Daten für uns sortiert, aber nicht genug. Wir müssen eine neue Leitung platzieren, nachdem wir den Namen, die E-Mail und das Telefon gedruckt haben. Also hier, nachdem wir Namen, E-Mail und Telefon geschrieben haben , um danach eine neue Leitung zu erstellen. Und jetzt lasst uns unser Programm ausführen. Und mach dir keine Sorgen, wenn wir unser Programm erneut ausführen, es wird keine neue Datei erstellen. Stattdessen wird es unsere vorhandene Datei überschreiben. Lassen Sie uns also das Programm ausführen und einen Blick auf unsere Datei werfen. Beachten Sie, dass unsere Kommas diese Werte trennen, das liegt daran, dass wir sie in unserer f-Zeichenfolge beibehalten haben , wie Sie sehen können. Wenn Sie es also vorziehen, sie nicht zu haben, können Sie diese Kommas entfernen und Ihr Programm läuft einwandfrei. Ich denke jedoch, dass es einfacher ist, mit Daten zu arbeiten , wenn sie durch Kommas getrennt sind. Optional könnten wir unsere Daten kennzeichnen. Hier geben wir also Namen ein, dann einen Doppelpunkt, dann einen Doppelpunkt, dann endlich an und dann einen Doppelpunkt. Und jetzt lasst uns unser Programm ausführen und sehen, wie es aussieht. Dies sieht viel lesbarer aus und ist viel einfacher zu arbeiten. Öffnen wir die erste Datei daneben und vergleichen sie miteinander. Der Unterschied ist Tag und Nacht. Und das haben wir gemacht. Und welche 15 Codezeilen abzüglich des Abstands. Es hätte lange gedauert, es manuell zu sortieren. Und es besteht auch die Möglichkeit menschlicher Fehler, die die gesamte Datenbank für uns ausführen könnten. Stattdessen lassen wir die Maschine mit wenigen Codezeilen die Arbeit erledigen und eliminieren die Möglichkeit, lassen wir die Maschine mit wenigen Codezeilen die Arbeit erledigen und eliminieren die ein oder zwei Werte zu verpassen und einen Schneeballeffekt zu erzeugen , der unsere Daten ausführt. Lassen Sie uns also unseren Code zusammenfassen, den wir importiert haben, oder ein Medikament X und Editor-Tools, um über mehrere Objekte zu iterieren. Wir öffnen dann die Datei, aus der wir die Daten lesen werden, und geben ihren Speicherort und öffneten sie als f. Dann haben wir eine Variable erstellt und Inhalt gleich F, F eingegeben, was unsere Datei ist, der Leckerbissen. Diese Inhaltsvariable liest also unsere Textdatei. Dann haben wir ein Muster für unsere E-Mail, unser Telefon und unseren Namen erstellt. Dann haben wir eine E-Mail-Findung an einem Objekt erstellt und ihm das Muster gegeben, das es verwendet. Die E-Mails verwenden also den E-Mail-Button und wir haben sie mit Inhalten abgeglichen, die die Daten und unsere TextFile enthalten. Gleiches gilt für Schriften und Namen. Dann haben wir eine neue Datei erstellt und im W-Modus oder im Schreibmodus geöffnet und benennen sie sortierte Daten. Und dann haben wir eine for-Schleife erstellt , die über drei Objekte, Namen, E-Mails und Telefone iteriert . Und dann beschriften wir sie, während wir sie in unsere Textdatei schreiben , um sie leichter zu lassen. Nachdem wir dann in unsere Akte geschrieben hatten, haben wir sie geschlossen. Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir sehen uns im nächsten.

Komplette Python Regular Expressions Masterclass! Vom Anfänger zum Fortgeschrittenen

Naser Jamal, Computer Engineer

Schau dir diesen Kurs und Tausende anderer Kurse an

Schau dir diesen Kurs und Tausende anderer Kurse an

Einheiten dieses Kurses

1.

Warum regelmäßige Ausdrücke?

2:31

2.

Einführung - Verifizieren der Benutzer E-Mail mit Regex

6:23

3.

Methoden zur Suche nach Übereinstimmungen

3:42

4.

Methoden für Match

3:30

5.

Nützliche Daten extrahieren

16:22

6.

Sortieren ungeordneter Datendatei

12:53

Über diesen Kurs

Triff deine:n Kursleiter:in

Naser Jamal

Skills dieses Kurses

Praxisnahes Kursprojekt

Kursbewertung

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Lerne von überall aus

Transkripte

Komplette Python Regular Expressions Masterclass! Vom Anfänger zum Fortgeschrittenen

Naser Jamal, Computer Engineer

Schau dir diesen Kurs und Tausende anderer Kurse an

Schau dir diesen Kurs und Tausende anderer Kurse an

Einheiten dieses Kurses

1.

Warum regelmäßige Ausdrücke?

2:31

2.

Einführung - Verifizieren der Benutzer E-Mail mit Regex

6:23

3.

Methoden zur Suche nach Übereinstimmungen

3:42

4.

Methoden für Match

3:30

5.

Nützliche Daten extrahieren

16:22

6.

Sortieren ungeordneter Datendatei

12:53

Über diesen Kurs

Triff deine:n Kursleiter:in

Naser Jamal

Skills dieses Kurses

Praxisnahes Kursprojekt

Kursbewertung

Warum lohnt sich eine Mitgliedschaft bei Skillshare?

Lerne von überall aus

Ähnliche Kurse

Transkripte