Transkripte
1. Warum regelmäßige Ausdrücke?: Hallo und willkommen bei
der kompletten Python-Masterclass für reguläre
Ausdrücke. Dieser Kurs ist vollständig aktualisiert und interaktiv mit
praktischem Lernen , um Sie von 0 zum
Helden zu führen und Python RegEx zu lernen. Warum reguläre Ausdrücke? Python ist eine der am
schnellsten wachsenden beliebtesten
Programmiersprachen der Welt und wird voraussichtlich in Zukunft
noch mehr wachsen. Wenn Sie also
Ihre Karriere
als Programmierer oder
Datenwissenschaftler aufbauen und
sich vom
Rest der Masse abheben möchten, wenn Sie nur eine technische Fähigkeit
oder den
regulären Ausdruck von Scalar lernen nur eine technische Fähigkeit . Was kann man also mit
regulären Ausdrücken machen? Sie können Aufgaben automatisieren,
die in Sekundenschnelle erledigt werden. Sie können erweiterte
Schaltflächenanpassungsaufgaben mit Pythons
unglaublicher Leistung Sie können
Daten nach Ihren eigenen Bedürfnissen lesen, salzen und umschreiben. Und das Beste daran
ist, dass es innerhalb weniger
Codezeilen so einfach und unkompliziert ist, dass
Sie Aufgaben erledigen können, die Stunden dauern
würden,
um sie manuell zu erledigen. Und jetzt lasst uns unser Programm ausführen
und sehen, wie es aussieht. Dies sieht viel
lesbarer aus und ist viel
einfacher zu arbeiten. Öffnen wir die erste Datei daneben und kombinieren
sie zusammen. Der Unterschied ist Tag und Nacht. Das haben wir gemacht. Und welche 15
Codezeilen abzüglich des Abstands. Es hätte lange
gedauert, es manuell zu sortieren. Und es besteht auch die
Möglichkeit menschlicher Fehler, die die
gesamte Datenbank für uns ausführen könnten. Stattdessen lassen
wir die Maschine mit wenigen Codezeilen die Arbeit erledigen
und eliminieren die
Möglichkeit, lassen
wir die Maschine mit wenigen Codezeilen die Arbeit erledigen
und eliminieren die einen Wert von zwei zu verpassen und
einen Schneeballeffekt zu erzeugen , der unsere Daten ausführt. Für wen ist dieser Kurs? Anfänger, die noch
nie
Programmierer aus
verschiedenen Sprachen programmiert haben. Programmierer sind kein grundlegender Python, sondern wollen
ihre Fähigkeiten verbessern. Wie sind die tatsächlichen Kosten? Werfen wir zuerst einen Blick darauf. Ich gebe Ihnen eine kurze
Einführung, wie Medikament X in
Ihr Python-Programm verwenden können. Dann schreiben wir
unser erstes Muster um die
E-Mail des Benutzers mit RegEx zu überprüfen. Dann werfen wir einen Blick auf verschiedene
Suchmethoden und passen Objekte an und zeigen, wie sie
funktionieren, indem wir Probleme lösen. Dann lernen wir, nützliche Daten zu
extrahieren, und wir werden ein Tool verwenden, das
Bandmuster
viel und viel einfacher macht . Schließlich werden wir
eine reale Übung haben, in der wir eine
Datei erhalten, in der wir aufgefordert werden, Werte in einer bestimmten Reihenfolge zu
sortieren dann die neue sortierte
Liste und eine andere Datei zu schreiben. All dies
und mehr werden wir zeitnah durchgehen . Diese Klasse soll kurz, prägnant und direkt
auf den Punkt kommen. Sie könnten theoretisch weniger
Zeit und mehr Zeit mit
praktischer Erfahrung verschwenden. Worauf wartest du also? Es ist an der Zeit, dass Sie Ihre Programmierkenntnisse
auf die nächste Stufe heben, sich heute
anmelden und wir
sehen uns im Kurs.
2. Einführung - E-Mail von Benutzern mit Regex überprüfen: Hallo und willkommen
zurück zu meinem Video. Heute werden wir uns reguläre Ausdrücke
ansehen. Reguläre Ausdrücke
oder Regex können verwendet werden um zu prüfen, ob eine Zeichenfolge
ein bestimmtes Muster enthält. Es ist ein mächtiges Werkzeug, um Muster in einem Text zu
finden. Werfen wir einen Blick darauf. Nehmen wir zum Beispiel an, wir möchten die
E-Mail des Benutzers mit RegEx überprüfen. Das erste, was wir tun müssen
, um
RegEx zu verwenden , ist
der Import des RE-Moduls. Nehmen Sie nun an, dies ist die
E-Mail-Adresse, die wir überprüfen möchten. Jetzt erstellen wir
eine Schaltfläche und legen die Regeln für die
Schaltfläche fest, die wir überprüfen möchten. Jetzt müssen wir
die E-Mail-Adresse in
vier Teile aufteilen , um
ein besseres Verständnis
für den ersten Teil zu haben , der
Snap oder Benutzer-ID erhält, sie kann A bis
Z und 0 bis neun enthalten. Am Anfang
verwenden wir die Karotte oder das Zirkumflex-Symbol
, um das zu initialisieren. Wir möchten eine Zeichenfolge abgleichen , die mit folgendem beginnt. Und um dieses Muster zu beenden, verwenden
wir das Dollarsymbol. Aber natürlich möchten wir
weitere Condition Store-Strings hinzufügen . Du wirst es jetzt nicht
beenden,
das zweite, was wir eintippen
, a bis Z und 0 bis neun. Dies bedeutet, dass dieser
Teil der Zeichenfolge einen beliebigen
Buchstaben in einer beliebigen Zahl enthalten
kann. Jetzt geben wir ein
Plussymbol ein, das angibt, dass dies ein
- oder mehrmals auftreten kann. Der Name des Empfängers kann
auch Symbole
wie Punkt, Unterstrich und Strich enthalten . Periodenunterstrich und Strich. Wir verwenden den umgekehrten Schrägstrich, um
unsere Sonderzeichen, den
Punkt, den Unterstrich und den Strich zu definieren . Wir verwenden das Fragezeichen hier da diese Symbole entweder
0 oder höchstens eins verwendet werden
können , wenn
sie zweimal auftreten, was bedeutet, dass es sich um
eine ungültige E-Mail handelt. Deshalb mussten wir
das mit einem
Fragezeichensymbol angeben . Nun, nach diesen Symbolen, können
Sie auch
beliebige Zeichen von A
bis Z und 0 bis neun haben . Nach den von
uns angegebenen Symbolen, dem Unterstrich und dem Strich der Periode, können
wir Buchstaben von a bis
Z oder Zahlen von 0 bis neun haben . Genau so.
Auch hier werden wir das Plus-Symbol verwenden, da sie mehr als einmal auftreten
könnten. Jetzt müssen wir das
Add-Symbol schreiben, das hier auftritt. Nach dem Add-Symbol haben
wir Dinge wie At Hotmail oder Gmail und
so weiter und so weiter. Es können also beliebige
alphanumerische Zeichen sein. Nach der Anzeige
kommt Hotmail die Frist. müssen wir also angeben. Jetzt nach Ablauf der Zeit kommt
Dinge wie.com.net. Normalerweise haben sie eine Länge zwischen
zwei und drei Zeichen. müssen wir also angeben. Jetzt werden wir das
Dollarsymbol verwenden, um unsere Zeichenfolge zu beenden. Nachdem unser Muster abgeschlossen ist, möchten
wir vom Benutzer
Eingaben erhalten indem wir ihn auffordern, seine E-Mail
einzugeben. Jetzt werden wir eine F-Schleife erstellen , um den Button zu überprüfen,
würden sie uns benutzen? Und so
wird die re.search-Methode zwei Argumente annehmen. Der erste ist der Button,
den wir erstellt haben. Die zweite ist die Eingabe des Benutzers oder die
Zeichenfolge, die wir überprüfen möchten. Lassen Sie uns also unser Programm ausführen
und sehen, wie es aussieht. Geben wir also
dieselbe E-Mail-Adresse ein. Also glaube ich, der Fehler, den ich
gemacht habe, war, hier einen Platz zu verlassen. Und wenn ich den
Platz entferne, funktioniert es gut. Eine hochtypische Phonetik
statt genetischer Map. Mal sehen, ob wir
absichtlich
eine ungültige E-Mail eingegeben haben , wie generisch. Und dann habe ich eine andere
einfache und gültige E-Mail benutzt. Nun, wie es aussieht, funktioniert
unser Programm gut. Werfen wir einen Blick
auf ein anderes Beispiel. Sagen wir, wir möchten nach einer bestimmten Schaltfläche in
der folgenden Zeichenfolge suchen. Es scheint also, dass Kapital
A zweimal wiederholt wurde. Und wir wollen dieses
Muster in unserem eigenen Sinne prüfen. Um das zuerst zu tun,
definieren wir unseren Button. Hier. Wir werden
die Compile-Methode verwenden. Wir könnten
die Suchmethode auch
wie im
vorherigen Beispiel verwenden . R hier bevor unsere
Zeichenfolge bedeutet, dass roher String, Python, roher String
umgekehrter Schrägstrich als ein
wörtliches Zeichen behandelt . Dies ist nützlich, wenn wir
eine Zeichenfolge haben, die einen
umgekehrten Schrägstrich enthält . Ich möchte nicht, dass sie als Escape-Zeichen
behandelt wird . Sehen wir uns also den
Unterschied zwischen regulären Strings
und rohen Strings an. Der erste
, der eine reguläre Zeichenfolge ist, behandelte den Backslash n
als Escape-Zeichen. In diesem Fall
wird es verwendet, um eine neue Zeile zu beginnen. Und wie Sie es jedoch sehen können, in der zweiten Zeichenfolge, die eine rohe Zeichenfolge
ist, die Benutzer des
Backslash-Schrägstrichs ignoriert und als ein wörtliches Zeichen behandelt
. Wenn wir
Backslash n durch Backslash x ersetzen, haben
wir einen Pfeil
und die reguläre Zeichenfolge da Backslash x
keinen Zweck hat. Aber unsere rohe Zeichenfolge ignorieren
wir das und
drucken genauso wie es ist. Gehen wir also zurück zu
unserer Testzeichenfolge. Jetzt erstellen wir ein Objekt. Also tippen wir den Button ein, den
wir verwenden werden. Jetzt werden wir die find-Methode verwenden. Innerhalb der definierten ETL-Methode geben
wir unsere Tests schrumpfen ein. Jetzt haben wir
ein Objekt namens
Matches erstellt , das wir mit genügend Flow iterieren
können. Wie Sie sehen können,
zeigt es zwei Vorkommen einer Weile, die
ihre Position zeigen. Außerdem wird die Groß- und Kleinschreibung beachtet,
was bedeutet, dass es die Kleinbuchstaben nicht
aufgenommen hat. Wir können unseren Code auch
kürzer machen, indem wir r e verwenden, finden Sie Eta sofort. Zum Beispiel. Jetzt geben
wir den Button ein,
nach dem wir suchen möchten, nämlich a0. Und dann das zweite Argument
werden wir die Zeichenfolge übergeben, die
wir testen möchten. Wie Sie sehen können, werden
dieselben Ergebnisse mit
weniger Codezeilen zurückgegeben . Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir
sehen uns im nächsten.
3. Methoden zur Suche nach Matches: Hallo und willkommen
zurück zu meinem Video. Heute schauen wir uns
Methoden an , um nach Übereinstimmungen zu suchen. Im letzten Video haben wir also an diesem Beispiel
gearbeitet, das „find better“ verwendet hat. Es gibt andere Methoden, um nach Übereinstimmungen
zu suchen, wie zum Beispiel Übereinstimmung,
Suche und Suche nach allen. Finde es also, um
ein Objekt mit
der Position der Zeichenfolge zurückzugeben , nach der
wir gesucht haben. Find all gibt jedoch zum Beispiel nur
eine Zeichenfolge zurück. Also das ist es, was alles findet. Was ist mit der Match-Methode. Die Match-Methode sucht nur am Anfang der Zeichenfolge nach
der
Schaltfläche und gibt beispielsweise
nur das erste
Vorkommen zurück. Wie Sie sehen können, hat es das zweite
Vorkommen von a nicht zurückgegeben. Jetzt ändern wir die Schaltfläche. Wir wollen danach suchen nach
etwas anderem als
zum Beispiel, wie Sie
sehen können, es ist keine Rückgabe. Obwohl fünf Neuntel Acht
in unserer Saite aufgetreten sind, aber weil es nicht
am Anfang war, ist es keine Rückkehr. Was ist mit der Suche? Suche funktioniert sehr
ähnlich, um besser zu finden. Es gibt jedoch nur
das erste Vorkommen
des Musters zurück , zum Beispiel. Also die vier
gängigsten Übereinstimmungsmethoden, oder finden Sie eine bessere Suche, finden alle und stimmen überein. Werfen wir einen Blick
auf dieses Beispiel. Wir haben die folgende Zeichenfolge
, die 3$ für das Shirt angibt, wir würden RegEx nicht verwenden, um zu überprüfen ob die Saite
mit einer Ziffer beginnt. In diesem Fall sind es drei. Und wenn das der Fall ist, drucken
wir diese Ziffer aus. Also lasst uns zuerst RE importieren. Und dann
erstellen wir eine Zeichenfolge und legen diesen Text hinein. Jetzt möchten wir einen Button erstellen
, nach dem wir suchen möchten. Und wir werden rohe Strings
benutzen. Wie üblich geben wir
unseren Button Backslash t ein. Backslash
d bedeutet eine Ziffer, was genau das ist,
was wir hier haben. Jetzt, da wir eine Schaltfläche erstellt haben, erstellen
wir ein Übereinstimmungsobjekt. Hier würden wir unseren Button übergeben
, dann werden wir unsere Zeichenfolge übergeben. Jetzt können wir einfach F sagen, was bedeutet, wenn S wahr ist, dann druckt das Folgende. Sie könnten fragen, dass Zitat
mit Punktgruppe übereinstimmt, Gruppe ist eine Methode
des Übereinstimmungsobjekts. Und was es einfach
tut, ist, dass es die übereinstimmende Zeichenfolge
zurückgibt, die in diesem Fall drei ist. Wir werden uns die
Match-Methoden im nächsten Video genauer ansehen . Aber im Moment wird die Gruppe
die Nummer drei für uns zurückgeben. Lassen Sie uns also unser Programm ausführen
und sehen, wie es aussieht. Selbst wenn wir
diese Zahl auf fünf ändern, wird
sie fünf zurückgeben. Wenn wir also
die Gruppenmethode nicht verwenden, werden wir das bekommen. Du bekommst das
vollständige Übereinstimmungsobjekt. Wir wollten nur die Saite Fünf. Deshalb verwenden wir die
Punktgruppen-Methode. Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir
sehen uns im nächsten.
4. Methoden für Match: Hallo und willkommen
zurück zu meinem Video. Im letzten Video haben wir also
gesehen, wie wir mit
der Rückkehr ein Objekt finden , das wir mit einer ausreichenden Schleife
iterieren konnten . Dieses Objekt selbst
hat also seine eigenen Methoden und wir
werden uns sie ansehen. Das sind die Methoden
beginnen und wachsen und überspannen. Wie Sie sehen können, wenn
wir das Ergebnis drucken, wird dieses Objekt zurückgegeben. Wir können die Spanne
hier nur drucken, indem wir dafür span verwenden, wir verwenden
Match-Punkt-Span. Wenn wir jetzt unser Programm ausführen, erhalten
wir ein Tupel, das unsere Spanne
enthält, dass dies nützlich
sein kann , wenn wir
genau ausdrucken
möchten , wo unser
Muster aufgetreten ist. Wie Sie beispielsweise sehen können, sieht
dies für den Benutzer besser
lesbarer aus. Wenn wir den Typ
dieser Match-Punkt-Span-Methode ausdrucken, werden
wir herausfinden, dass
es sich nur um eine Tabelle die die Position enthält, was unsere Übereinstimmung stattgefunden hat. Wir können die
Start- und Endposition
unserer Zeichenfolge auch mit
Start und Ende drucken . Also lasst uns einen Blick darauf werfen. Match dann Komma Match. Um also die Ganzzahlen
unserer Start- und
Endposition zurückzugeben , könnten
wir so etwas tun. Und wenn wir seinen Typ ausdrucken, werden wir herausfinden, dass
es sich nur um eine ganze Zahl handelt. Wenn wir schließlich
nur
die übereinstimmende Zeichenfolge drucken möchten , verwenden
wir eine Gruppe. Und wie erwartet erfahren
wir, wenn wir seinen Typ drucken, dass es sich um eine Zeichenfolge handelt. Zusammenfassend stimmt also mit
einem Objekt überein, das
die Spanne enthält , in der das
Match-Schrägstrich-Muster aufgetreten ist. Und es enthält auch die
Zeichenfolge, die übereinstimmt. Wir können auf einzelne
Komponenten
dieser Übereinstimmung zugreifen , indem wir die
Methoden verwenden, die wir durch
die Startmethode durchlaufen haben
, um eine ganze Zahl
an der Startposition zu erhalten , in der das Muster begonnen hat. Methode, um eine ganze Zahl zu erhalten, die Endposition, an der
die Schaltfläche endete. Gruppenmethode, um
die übereinstimmende Zeichenfolge zu erhalten. Und schließlich die
Span-Methode, um
eine Tabelle zu erhalten , die
die Start- und
Endposition der Schaltfläche enthält . Das war's also für die Grundlagen. Und im nächsten Video werden
wir uns ansehen, wie wir
nützliche Daten mit rotem X für
Datenwissenschafts - oder
Dokumentationszwecke extrahieren können nützliche Daten mit rotem X für
Datenwissenschafts . Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, dass wir uns im nächsten
sehen werden.
5. Extrahieren Nützlicher Daten: Hallo und willkommen
zurück zu meinem Video. Heute werden wir
lernen, nützliche Daten zu extrahieren und unsere Fähigkeiten für reguläre
Ausdrücke auf ein ganz neues Niveau zu heben. In diesem Video verwenden wir
ein Tool oder
eine Website namens
beg x, eins zu eins. Es ist ein sehr leistungsfähiges
Tool, das uns
nicht nur
mehr über RegEx beibringt, sondern auch den Prozess vereinfacht
und den folgenden visualisiert. Zuerst klicken wir auf Bifan als unsere Programmiersprache
, mit der wir arbeiten. Nehmen wir nun an, wir haben
die folgende Zeichenfolge. Wenn wir uns die Zeichenfolge ansehen, haben
wir zwei Zahlen. Eine ist eine Telefonnummer
und die andere ist eine zweistellige Nummer
, die das Unternehmen sofort
verkauft. Was wir über Telefonnummern wissen ,
ist, dass sie
aus zehn Ziffern bestehen, so dass
sie leicht von der anderen
Nummer hier unterscheiden . So können wir unseren
RegEx so einstellen, dass er extrahiert wenn er eine
zehnstellige Sequenznummer findet. Wenn wir also zur
Registerkarte „Kurzübersicht“ gehen, könnten
wir die Syntax finden, die wir
benötigen, falls wir sie vergessen. Hier heißt es also umgekehrter Schrägstrich
d bedeutet eine beliebige Ziffer oder mit anderen Worten eine beliebige Zahl. Also lasst uns weitermachen und das benutzen. Wie Sie sehen können, wann, wenn
wir Backslash d eingeben, sind das
die Übereinstimmungen, die wir erhalten. Es stimmte im Wesentlichen mit
jeder Ziffer überein, die wir haben. Was wir nun mit
zwei aufeinanderfolgenden Ziffern übereinstimmen möchten ,
können wir an Backslash-Tage binden. Jetzt stimmt es mit zwei Ziffern überein. Bevor wir also 12
Spiele hatten, haben wir jetzt sechs. Da es
jetzt nicht mit
jeder einzelnen Ziffer übereinstimmt , stimmt es nur zwei
Ziffern zusammen als eine. Und wenn wir diese drei
umgekehrten Schrägstriche eingeben, erhalten
wir nur zwei
Übereinstimmungen mit drei aufeinanderfolgenden Ziffern. Und wie Sie sehen können, werden
20 Millionen nicht übereinstimmen, weil es sich um
eine zweistellige Zahl handelt und so weiter und so weiter. Man könnte also denken, wenn Izzy, wenn eine zehnstellige Telefonnummer,
die zehn Ziffern ist, könnten
wir einfach zehn
Backslash bleiben , diese beiden
mit dieser Sequenz übereinstimmen. Technisch gesehen liegen sie nicht
falsch und das würde zum Beispiel gut
funktionieren. Wir haben also 345678910. Wenn wir uns die Spiele ansehen, werden wir das bekommen. Offensichtlich gibt es anspruchsvollere
Möglichkeiten, dies zu tun. Zum Beispiel könnten Sie
zur Registerkarte „Kurzübersicht“ wechseln. Gemeinsame Token werden
einen Ausdruck finden , der
genau drei von a,
also genau
drei Vorkommen
des Buchstabens a nacheinander aussagt ,
also genau
drei Vorkommen . Versuchen wir
es also zu unserem Vorteil zu nutzen. Also brauchen
wir von Anfang an kein,
wir wollen stattdessen einen Backslash d. Also geben wir umgekehrten Schrägstrich d ein und dann
geben zwischen zwei geschweiften Klammern zehn statt drei ein. Dies gab uns die gleichen genauen Ergebnisse
mit viel weniger Codierung. Natürlich könnten manche
sagen: Nun, Telefonnummern, es wird zum Beispiel in einem
anderen Format dargestellt. Wenn wir also Telefonnummern
extrahieren wollen sind
sie eindeutig in zwei
verschiedenen Formaten. Wir könnten folgendes tun. Speichern wir zuerst unseren Ausdruck hier
drüben und wir werden später darauf
zurückkommen. Also beginnt einer der Schläger,
unser Knopf, den wir kombinieren
möchten,
mit einer Klammer. Wenn wir jedoch
bis zu einem regulären Ausdruck ein Paket eingeben, würden
wir auf ein Problem stoßen. Und das liegt daran, dass
die Klammer ein Sondercharakter ist und
eine Bedeutung für unser Programm hat. Wie Sie sehen können, wenn wir uns den Kurzbezugsschritt
ansehen, stellen wir fest, dass die Klammer verwendet wird, um alles
in geschlossener Klammer zu erfassen, in diesem Fall wird
als Sonderzeichen bezeichnet. Um also einen Sondercharakter zu verwenden, müssen
wir ihm entkommen. Und wie entkommen wir dem? Wir geben einfach einen
umgekehrten Schrägstrich davor ein. Zum Beispiel. Wie Sie sehen können, funktioniert
das gut und es
hat unsere Tasche hier entdeckt. Also lasst uns weitermachen. Also haben wir drei Ziffern nach
der Klammer, lasst uns sterben. Aber in unserem Button drei Ziffern. Und wie Sie sehen können, hat es die Nummer
erkannt. So, bisher so gut. Und wieder haben wir eine Klammer, aber wir können die
Klammern sofort eingeben. Wir müssen
ihm mit Backslash entkommen. Jetzt haben wir ein Strichsymbol. Dann haben wir drei Ziffern und dann einen einfachen Bindestrich und schließlich vier Ziffern. Wie Sie sehen können, entspricht
es unserem
Telefonnummernformat. Wir sind also fertig mit
diesem Ausdruck, aber wir haben immer noch
unseren ersten Ausdruck , der Backslash d zehn ist. Wie sagen wir unserem
Programm, dass es einfach nach
diesem Button oder diesem
Muster suchen soll , könnten
wir das
vertikale Balkensymbol verwenden. Wenn wir also
die Suche hier eintippen oder diese alternative Übereinstimmung erhalten, entweder a oder B. Also verwenden wir das Einfache. Dann fügen wir unseren
Ausdruck hier ein. Und wie Sie sehen können, haben beide
entdeckt. Es heißt also, entweder suche nach
diesem Muster oder nach diesem Button. Wenn wir dies also
in unserem Python-Programm verwenden möchten, könnten
wir Folgendes tun. Also importieren wir zuerst
unsere Acht-Use-Droge X. Dann machen wir eine Zeichenfolge
, die unseren Text enthält. Jetzt erstellen wir einen Taktstock. Und wir nennen das Beste den Button,
den wir erstellt haben. Jetzt werden wir find all
verwenden, um zuerst unser Muster einzugeben. Dann den Text, den wir abgleichen möchten. Jetzt drucken wir einfach Match. Schauen wir uns die Ergebnisse an. Wie Sie sehen können,
funktioniert es einwandfrei. So können wir
RegEx immer eins zu eins verwenden, um
unseren Ausdruck zu erstellen und
zu
testen, bevor wir ihn hier auf Python anwenden.
Es macht die Dinge viel einfacher, weil er
den Prozess für uns visualisiert und uns zeigt was
in Echtzeit abgeglichen wird. Jetzt haben
wir für Stufe zwei diesen riesigen Textblock und wir möchten
die Titel daraus extrahieren. Die Titel hier sind also unser
Ziel und unsere Chance. Und wir wollen die Dosis extrahieren. Um zu beginnen, können wir
Note tippen , weil sie mit nichts
beginnen. Und dann gibt es ein
Leerzeichen, dann eine Zahl. Jetzt haben wir Notiz eins und n2 erfasst, aber wir möchten immer noch
den Text erfassen , der danach kommt. Wenn Sie genau hinsehen, werden
Sie feststellen, dass
der Titel damit endet hier und hier
eine neue Zeile
erstellt wird. Und wir wissen, dass eine neue Zeile in Python Backslash
bedeutet. Wir wollen alle Texte erfassen bis wir auf eine neue Zeile stoßen. Die Frage bleibt, wie
geben wir das in regulären Ausdruck ein? Wenn wir also hier zum
Schnellreferenzstopp schauen, heißt
es ein beliebiges Zeichen
außer a, B oder C. Also lasst uns ein neues Dokument öffnen, mit dem
Sie experimentieren können. Nehmen wir an, wir haben den
folgenden Text und wir möchten sagen, dass
alle Zeichen außer
dem Prozentzeichen,
dem Gleichheitszeichen, übereinstimmen alle Zeichen außer . Also geben wir folgendes ein. Wie Sie sehen können, stimmte es mit allem außer diesen Samples überein. Und um eine Sequenz zu machen, fügen
wir am
Ende unseres Ausdrucks ein Pluszeichen hinzu. Jetzt heißt es ein oder
mehrere Charaktere bis Sie auf
eines dieser Zeichen stoßen. Das bedeutet also das
Pluszeichen. Ein oder mehrere Vorkommen eines
beliebigen Zeichens, das Sie angeben. Gehen wir nun zurück zu unseren Texten, wenden
wir an, was wir gelernt haben. Okay, jetzt haben wir eine Nummer, dann haben wir ein Leerzeichen. Also fügen wir ein Leerzeichen hinzu. Dann versuchen wir
diesen Ausdruck. Alles außer einer neuen Linie. Es entspricht nur dem ersten
Zeichen und stoppt. Stattdessen wollten wir
einen oder mehrere Charaktere einfangen. Dafür
verwenden wir das Pluszeichen. Und wenn wir zum
Schnellreferenztyp
und -typ einer oder mehrerer Personen gehen , können
wir das Pluszeichen dafür verwenden. Wir könnten auch das Sternzeichen verwenden, was 0 oder
mehr Vorkommen bedeutet. Und es würde uns
die gleichen Ergebnisse liefern. Wenn wir jetzt zu den
Spielinformationen gehen, können
wir sehen, dass es funktioniert, aber wir sind immer noch nicht
fertig, weil wir die Titel erfassen
wollen und nicht einer und zwei Knoten
nicht Teil unserer Titel sind. Dafür werden wir Klammern verwenden. Wie Sie sehen können, heißt
es alles eingeschlossen. Wenn wir also zu unserem Ausdruck gehen, ist
dies genau der Ausdruck in dem der Titel hier
erfasst wurde. Lasst uns also Klammern
um diesen Ausdruck legen. Nun, was es tut, ist, dass Gruppen
diese Ergebnisse für uns erfasst werden. Was passiert,
ist, dass es mit
diesen anderen Ergebnissen wie
Knoten eins und Knoten zwei übereinstimmt . Verwenden wir das also
in unserem Python-Code. Und um diesen
riesigen Textblock einzufügen, verwenden
wir drei
einfache Anführungszeichen, um den umgekehrten Schrägstrich n
oder neue Zeilen in unserem Text zu berücksichtigen. Anstelle dieser alten Methode werden
wir also drei Anführungszeichen verwenden, 123, dann werden wir
unseren Text stützen, und dann verwenden wir weitere
drei Anführungszeichen. Kopieren wir nun unseren
regulären Ausdruck , den wir geschrieben haben, und
stützen wir ihn auf Muster. Wie Sie sehen können, wenn
wir das Programm ausführen, es nur den Titel zurück, der für
uns ohne einen, nicht zwei ist . Und jetzt haben
wir für Stufe drei einen relativ
kleinen Textblock. Wir werden jedoch
viele Informationen darüber extrahieren. Wenn wir uns also die
nützlichen Informationen hier ansehen, können
wir sehen, dass
die Einnahmen im
folgenden Format
bereitgestellt wurden . Geschäftsjahr FY dann
gefolgt von dem Jahr, in diesem Fall ist
es 2021 oder 2020 und dann ein Raum und dann
der Gerichtssaal in diesem Jahr. In diesem Fall ist dies
Q1 und dies ist Q4. Wir wissen also, dass es in einem Jahr nur vier Viertel geben
kann, Q1, Q2, Q3 und Q4. Es kann kein Q5 geben. Also behalten wir das im Hinterkopf. Auf jeden Fall beginnt
unser Muster mit
FY. Geben wir also FY ein. Dann
gibt es offensichtlich vier Ziffern, was in diesem Fall das Jahr
ist. Und wie machen wir das? Wir verwenden Backslash d. Und dann geben wir zwischen den geschweiften
Klammern vier ein. Dieser Ausdruck bedeutet also f y gefolgt von vier Ziffern
oder Telefonnummern. Bisher so gut. Und dann gibt es ein Leerzeichen danach, vor dem ersten und vierten Quartal. Das müssen wir in
unserem regulären Ausdruck angeben. Geben wir also ein Leerzeichen ein. Dann gibt es eine Warteschlange. Jetzt
folgt der Warteschlange eine Ziffer. Wir können jedoch nicht
einfach slash
d eingeben , da dies
Dinge beinhalten würde , wie die in
diesem Fall falsch sind. Wir möchten also sicherstellen, dass
unsere Ziffern zwischen
eins und vier liegen . Wie machen wir das? Wenn wir uns die
Schnellreferenz-Registerkarte ansehen, gibt es diese Option, die
ein einzelnes Zeichen von a, B oder C angibt. Sie können explizit die Zahlen
angeben, die Sie einschließen
möchten, nämlich 1234. Aber es gibt einen besseren Ansatz. Wir könnten diese Option im
Schnellreferenzstempel verwenden , der ein Zeichen im Bereich von a bis Z angibt. Jetzt könnten wir stattdessen
eins bis vier eingeben, und es würde uns dieselben
Ergebnisse mit weniger Codierung liefern. Also lasst uns jetzt unser
Muster und Python testen, wir nennen mich Ich liebe Text und stützen es auf diesem Ding Namenstext. Und dann kopieren wir unser Muster und basieren es im Muster,
unserem Python-Programm. Und jetzt führen wir das
Programm aus, um die Ergebnisse zu sehen. Was wäre, wenn einer der
Flüge Kleinbuchstaben wäre, das
aber trotzdem
erreichen wollen, könnten
wir folgendes tun. Lags ist gleich Fall ignorieren. Wenn wir nun die Ergebnisse drucken, wie Sie sehen können,
stimmt sie mit den Kleinbuchstaben f, y überein. Angenommen, wir
möchten das Geschäftsjahr nicht einbeziehen, das für das Geschäftsjahr steht.
Einfach, wir könnten die Klammern
verwenden, um erfassen und behalten Sie nur
die Teile, die wir wollen. Wenn
wir zum Beispiel unser Programm ausführen, können
wir es sehen, es
hat nur die Teile
erfasst, die innerhalb
der Klammern angegeben sind. Gehen wir also eins zu eins zu eins zu
RegeX zurück. Wir werden in der Lage sein, das
Jahr und ihre Quartale zu erreichen. Wir möchten jedoch immer noch die Einnahmen
dieses Sets hier
abgleichen. Und nehmen Sie an, wir hatten
andere Zahlen und unsere Texte, die wir vermeiden
möchten, zum Beispiel. Also lasst uns unseren
Ausdruck hier speichern. Wir wollen diese Nummer nicht
erfassen. Wir wollen nur die Zahlen
erfassen
, die mit einem Dollarzeichen beginnen. Wir können jedoch nicht einfach
das Dollarzeichen eingeben , da es sich um
ein Sonderzeichen handelt. Das bedeutet das Ende einer Zeichenfolge, wie Sie auf der Registerkarte „
Kurzreferenz“ unten sehen können. Da es sich also um ein
Sonderzeichen handelt, wissen
wir, dass wir den umgekehrten Schrägstrich
verwenden müssen, um diesem
Sonderzeichen zu entkommen, bevor wir es verwenden. Jetzt stimmt es mit dem überein, was wir wollen. Jetzt haben wir danach eine Ziffer, also können wir
Backslash d eingeben. Danach
gibt es jedoch einen
Dezimalpunkt, also
verwenden wir stattdessen eckige Klammern. Dann haben wir ein Dezimalzeichen da es sich um ein
Sonderzeichen handelt, wie Sie im
Schnellreferenzstopp sehen können. Wir müssen den
umgekehrten Schrägstrich verwenden, bevor wir ihn verwenden. Jetzt schließen wir unsere eckige Klammer. Jetzt müssen wir ein Plus setzen, was ein oder
mehrere Vorkommen bedeutet. Wenn der Gewinn
des Unternehmens aus irgendeinem Grund 10,4 Milliarden
betrug, zählt
es immer noch
zwei Ziffern vor
dem Dezimalpunkt, da wir dies mit
dem Pluszeichen
angegeben haben . Fügen wir nun diesen
regulären Ausdruck und unser Python-Programm ein
und sehen, ob es funktioniert. Jetzt nehmen wir den Knopf. Lasst uns das entfernen. Lassen Sie uns jetzt unser Programm ausführen. Und wenn wir das Dollarzeichen nicht
wollen, könnten
wir natürlich immer die Klammern verwenden,
um zu erfassen, was wir wollen. Angenommen, wir wollen hier das Jahr,
das Quartal und den
Gewinn davon abgleichen . Wie machen wir das mit Drug X? Nun, wir haben bereits
einen regulären Ausdruck gemacht ,
der dem Jahr und dem Quartal entspricht. Also lasst uns das zuerst benutzen. Jetzt, nach dem Quartal,
jeder Charakter, bevor wir das Dollarzeichen
erreichen. Also geben wir ein beliebiges Zeichen
außer dem Dollarzeichen ein. Und jetzt müssen wir ein Pluszeichen
hinzufügen, um ein oder mehrere Vorkommen zu erfassen. Jetzt stimmt es alles zusammen,
bis es gekontert ist,
ein Dollarzeichen. Das wollen wir also. Jetzt kehren wir zu dem
regulären Ausdruck zurück, den wir
zuvor erstellt haben , um dem Anhang zu entsprechen und fügen ihn in
unseren Ausdruck ein. Wie Sie sehen können,
passt es genau zu dem, was wir wollen. Aber man könnte sagen, nun, wir
wollen nicht unbedingt, dass die Texte dazwischen waren,
und es war einfach, dass Sie
die Klammern verwenden können , um genau zu erfassen,
was wir wollen. Jetzt erfasst es nur
diese Ergebnisse. Gehen wir also zurück zu unseren
Python-Programmen , wie es aussieht. Wie Sie sehen können,
funktioniert es wie vorgesehen. Und wenn Sie das Dollarzeichen nicht
einschließen, könnten
wir es natürlich einfach in
unseren erfassten Ausdruck aufnehmen. Schauen Sie sich die Art an, zum Beispiel in Milliarden dargestellten
Einnahmen. Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir
sehen uns im nächsten.
6. Sortieren von ungeordneten Datendateien: Hallo und willkommen
zurück zu meinem Video. Heute
schauen wir uns an, wie wir
eine unsortierte
Textdatei mit RegEx sortieren können . Das ist also die Akte, die
wir uns ansehen werden. Der Dateiname ist Datenliste. Ich habe es auf meinem Desktop gespeichert. Wenn wir die Datei öffnen, haben
wir drei verschiedene
Arten von Daten, Namen, E-Mail und
Telefonnummern in dieser Liste. Der FirstName gehört hier
zur ersten E-Mail und gehört hier zur
ersten Nummer. In ähnlicher Weise gehört
der zweite
Name zur zweiten E-Mail und
zur zweiten Nummer und so weiter und so weiter. Jetzt ist das Problem, dass sie nicht nebeneinander
aufgeführt sind. Ich habe diese Werte
nacheinander nebeneinander. Wenn Sie
dies manuell tun und den Vornamen neben
die erste E-Mail in der
ersten Nummer platzieren würden, würde
es natürlich Vornamen neben
die erste E-Mail in der ersten Nummer platzieren würden, ewig dauern. Wie strukturieren wir diese
Liste mit wenigen Codezeilen? Gehen wir also in
unser Python-Programm und schauen uns
an, RegEx zu verwenden. Das erste, was wir
tun wollen, ist unser Array zu importieren. Dann möchten wir diese Datei öffnen. Wenn Sie eine
detailliertere Erklärung
zum Umgang mit
Dateien in Python wünschen , können Sie meine
Klasse zum Thema Dateibehandlung überprüfen. So öffnen wir
eine Datei in Python. So würden Sie eine Datei
öffnen, wenn sie im selben Verzeichnis
wie Ihre Python-Datei
gespeichert würde. Unsere Datei wird jedoch auf unserem Desktop
gespeichert. Wir müssen
den Speicherort in
unserem Programm angeben , um den
Speicherort unserer Textdatei zu ermitteln.
Wir gehen einfach zu dem
Speicherort, an dem sie sich befindet, klicken
dann mit der rechten Maustaste auf Eigenschaften. Und hier ist der Ort, einfach
in unser Python-Programm einfügen
wird. Jetzt müssen wir
diese Backslashes ändern, zwei Schrägstriche. Wie Sie jetzt sehen können, zeigt es
keine Erwachsenen. Jetzt lesen wir
diese Datei und speichern ihren Inhalt in dieser
Variablen namens „Inhalt“. Das nächste, was wir tun
möchten, ist
Muster zu erstellen, die mit den Daten übereinstimmen, die wir haben. Glücklicherweise haben wir bereits
Schaltflächen erstellt, die mit E-Mails
und Telefonnummern übereinstimmen, daher verwenden wir
diese einfach, da sie funktionieren. Das sind die gleichen, die wir in den vorherigen Klassen
verwendet haben. Dies ist also die Schaltfläche
, die mit E-Mails übereinstimmt, und dies ist die Schaltfläche, die mit den Telefonnummern übereinstimmt. Es gibt jedoch einen
geringfügigen Unterschied. Wenn man sich die Zahlen anschaut, ähneln
sie unseren, in denen sie
mit Klammern beginnen, dann gibt es drei Zahlen, aber anstelle eines Bindestrichs haben
sie hier ein Leerzeichen. Lassen Sie uns dies also durch Leerzeichen
gestrichelt ersetzen. Und dann haben sie
drei Zahlen. Wir haben drei Zahlen
und dann einen Strich. Und dann für Zahlen. Das sollte also mit den
Zahlen in unserer Liste übereinstimmen, gut. Diese beiden Tasten
sollten also gut funktionieren. Eine weitere Schaltfläche, die
wir erstellen müssen, ist das Namensmuster, das mit
den Namen
in der Liste übereinstimmt , die wir nicht erstellt
haben. Wir haben jetzt von Grund auf neu erstellt. Wenn wir uns also die Listennamen ansehen, haben wir
im Wesentlichen Großbuchstaben von A bis Z und dann jeden Kleinbuchstaben
von A bis Z, dann ein Leerzeichen. Dann noch einmal ein
Großbuchstabe von A bis Z und dann
Kleinbuchstaben von I2C. Das scheint also ziemlich
einfach zu sein. Lass es uns machen.
Ich bin also Doug x Begriffe, so sieht es aus. Diese Schaltfläche ist also in zwei Teile
geteilt, den FirstName und LastName. Und sie sind durch
ein Leerzeichen dazwischen getrennt. Der FirstName ist ein beliebiger Buchstabe
von Großbuchstaben a bis Kapital Z, jedoch nur einmal vorkommt, dann jeder Buchstabe von
Kleinbuchstaben a bis z. Dieses Mal haben wir
ein Pluszeichen hinzugefügt , da es ein- oder mehrmals
auftreten kann. Wenn wir uns also unsere Liste ansehen, haben
wir
hier nur einen Großbuchstaben und dann mehrere
Kleinbuchstaben. Und das sagen
unsere Knöpfe. Ein Großbuchstabe und dann eine beliebige Anzahl von
Kleinbuchstaben. Dann haben wir ein Leerzeichen
dazwischen. Und dann wieder derselbe Knopf, ein Großbuchstabe und dann eine beliebige Anzahl von
Kleinbuchstaben. Jetzt haben wir unsere
Muster bereit. Lassen Sie uns eine Suchmethode wählen. Wir könnten find all gebrauchen, oder wir könnten den find-editor verwenden. Aber ich denke, finde S, das in diesem Fall
besser geeignet ist. Lassen Sie uns also
für jedes Vokalmuster einen guten Schuldner erstellen. Also haben wir hier einen Fonds geschaffen. Es ist ein Objekt namens E-Mails, gab ihm die Schaltfläche,
die mit E-Mails übereinstimmt. Und geben Sie dann die Zeichenfolge an, mit der
wir ihn abgleichen möchten. In diesem Fall wird unsere Zeichenfolge oder unsere Texte in dieser
Variablen namens Inhalt gespeichert, die aus unserer Textdatei führt. Das Gleiche gilt für Telefone und Namen. Wenn wir also den
Find-Editor verwenden würden, wie wir es normalerweise tun, dies die Ergebnisse, die
wir erhalten. So verwenden wir
normalerweise find better. Hier ist das Objekt, über das wir
iterieren möchten, und wir sagen, dass für jedes Element und jede E-Mail jedes Element
gedruckt wird. Lassen Sie uns also unser Programm ausführen
und sehen, wie es aussieht. Wie Sie es für die Zehner,
das vollständige Objekt, sehen können ,
benötigen wir nur die Zeichenfolge oder
die übereinstimmende E-Mail. Dafür
verwenden wir die Methode der Punktgruppe. Lassen Sie uns unser Programm ausführen. Jetzt gibt es nur noch die Strings
zurück. Aber wir sind immer noch nicht fertig. Dies wird uns im Wesentlichen dieselbe Datei gegeben ,
die wir
bereits haben, in
der die E-Mails an
einem Ort aufgeführt sind und die Namen in einer anderen aufgeführt
sind. Wie listen wir sie
nebeneinander auf? Sie könnten vorschlagen, dass
wir
eine weitere for-Schleife für
die Telefone und Namen erstellen könnten . Kopieren wir zum Beispiel einfach dieses Telefon ein. Handys hier. Entschuldigung. Und dann dasselbe für
Namen, für Namensnamen. Dann setzen wir den Namen hier. Lass es uns also laufen lassen und
sehen, wie es aussieht. Es. Im Wesentlichen
sieht es genauso aus wie dieselbe Datei, die wir
haben, die nicht funktioniert. Entweder. Man könnte vorschlagen , diese vier Lappen vielleicht
untereinander zu legen. Wenn wir also das Leerzeichen hier entfernen, markieren Sie die Tabulatortaste
und entfernen Sie das
hervorgehobene Feld und drücken Sie Stop. Okay, also jetzt
ineinander, Mal sehen, wie es aussieht. Jetzt ist es noch schlimmer, weil
es die erste E-Mail
als die
Telefonnummer und dann die
Namen gedruckt als die
Telefonnummer und dann die hat und es ist nur ein Durcheinander. Aber keine Sorge, das ist ein
spezifisches Werkzeug dafür. Im Wesentlichen wollen
wir E-Mail, Telefon und Namen
iterieren. Gleichzeitig wollen
wir E-Mails nicht
selbst
iterieren als
Schriften selbst, die Namen selbst. Wir wollen sie
alle in derselben for-Schleife iterieren. Dafür verwenden wir
ETL-Tools, um Editor-Tools zu verwenden. Zuerst müssen wir es importieren, keine
Sorge, wir
müssen nichts installieren. Es kommt standardmäßig mit Python. Wie Sie sehen können, wird mir
vorgeschlagen, dass es mir gesagt hat, lasst uns
jetzt ein wenig herauszoomen. Schließ das. Okay, jetzt wo wir es importiert haben, werden wir es so benutzen. Also geben wir für den Namen ein, weil wir über
den Namen iterieren möchten. Und wir möchten auch per E-Mail
iterieren. Und wir wollen auch über die Schrift
iterieren. Und dann geben
wir gzip ein. Und dann füge die Objekte ein, über die
wir iterieren werden. Oh mein Gott, was ist los? Also Namen, E-Mails, Telefone. Oh, tut mir leid. Also für Namen in Namen
und für E-Mail, in E-Mails und zum
Spaß und Handys. Das funktioniert also genau wie eine
reguläre for-Schleife für uns, außer dass wir jetzt
über mehrere Objekte iterieren können. Jetzt drucken wir unsere Ergebnisse aus. Drucken Sie den Namen Punktgruppe und senden Sie uns dann eine E-Mail an die Gruppe. Dann habe ich das endlich gefunden. Es ist also sehr
ähnlich wie wir über ein Objekt
mit einer regulären for-Schleife
iterieren würden . Das einzige, woran man sich erinnern sollte, ist, all die Objekte
einzubeziehen , über die
wir iterieren möchten, innerhalb
der Zip-Klammer. Lassen Sie uns nun unser Programm ausführen
und sehen, wie es aussieht. Das sieht genau so aus,
wie wir es wollten. Aber auch hier sind wir immer noch nicht fertig. Wir möchten diese
Ergebnisse in eine Datei schreiben. Anstatt
sie einfach hier im Terminal zu drucken. Dafür öffnen wir eine neue Textdatei im Schreibmodus und nennen sie sortierte Daten. Also ist f gleich offen. Dann geben wir hier den
Namen der Datei ein. Du nennst es
sortiert TXT und dann ein Komma. Und hier geben wir den Modus an. Wir werden den W-Modus verwenden, was bedeutet Bytes Motor. Nun ja, es heißt Schreibmodus, aber diese Open-Funktion erstellt eine Datei für uns,
wenn sie nicht existiert, und wenn sie existiert, wird
sie den
Inhalt dieses Objekts überschreiben. Wenn wir es also so lassen, wie es ist, wird
dies die
Datei hier in unserem Workspace erstellen. Wir erstellen es auf unserem Desktop nebenan
oder
in der Originaldatei dafür, oder
in der Originaldatei dafür, geben
wir denselben
Speicherort an, an dem sich unsere Datei befindet. Also werden wir
diese Dislokation behandeln und sie hier einfügen. Jetzt öffnen wir diese Datei, wir schreiben jetzt hinein. Lassen Sie uns also unsere for-Schleife ändern
, um zu schreiben statt zu drucken. Also geben wir F ein,
was ist der Name der Datei, dots, oder? Und das war's. Jetzt könnten wir hier einen Fehler bekommen. Das liegt daran, dass die Schreibmethode nur einen Parameter annimmt, aber wir haben hier
drei Parameter platziert. Legen wir sie also
in eine F-Zeichenfolge. Also f, dann beginnen wir
eine Zeichenfolge. Und diese Zeichenfolge werden
wir
diese Variablen
mit dem Namen Punkte platzieren , cool. Dann mailen Sie der Gruppe eine E-Mail. Dann hat endlich seine Gruppe gefunden. Dann beenden wir
unsere Zeichenfolge mit einem weiteren doppelten
Anführungszeichen. Jetzt sollten wir eingestellt sein, aber bevor wir unser Programm ausführen, vergessen
wir nicht, unsere Datei
zu schließen. Also geben wir def ein, was der Name unserer Datei ist. Lassen Sie uns also unser Programm ausführen
und sehen, wie es aussieht. Wir sollten eine Datei sehen,
die auf unserem Desktop erstellt wurde. Weil es nichts
Determinantes , weil wir nichts
gedruckt haben. Aber wenn Sie hier bemerkt haben, heißt
es sortierte Daten, dies ist die Datei, die wir erstellt haben. Lass es uns öffnen und schauen uns mal an. Es ist irgendwie die Daten
für uns sortiert, aber nicht genug. Wir müssen
eine neue Leitung platzieren, nachdem wir den Namen, die
E-Mail und das Telefon gedruckt haben. Also hier, nachdem wir Namen,
E-Mail und Telefon geschrieben haben , um danach
eine neue Leitung zu erstellen. Und jetzt lasst uns unser Programm ausführen. Und mach dir keine Sorgen, wenn wir unser Programm erneut
ausführen, es wird keine neue Datei
erstellen. Stattdessen wird es unsere vorhandene Datei
überschreiben. Lassen Sie uns also das Programm ausführen und einen
Blick auf unsere Datei werfen. Beachten Sie, dass unsere Kommas diese Werte
trennen,
das liegt daran, dass wir sie in
unserer f-Zeichenfolge beibehalten haben , wie Sie sehen können. Wenn Sie es also vorziehen, sie
nicht zu haben, können
Sie diese Kommas entfernen und Ihr Programm
läuft einwandfrei. Ich denke jedoch, dass
es einfacher ist,
mit Daten zu arbeiten , wenn sie durch Kommas
getrennt sind. Optional könnten wir unsere Daten
kennzeichnen. Hier
geben wir also Namen ein, dann einen Doppelpunkt, dann einen Doppelpunkt, dann endlich
an und dann einen Doppelpunkt. Und jetzt lasst uns unser Programm ausführen
und sehen, wie es aussieht. Dies sieht viel
lesbarer aus und ist viel
einfacher zu arbeiten. Öffnen wir die erste Datei daneben und vergleichen
sie miteinander. Der Unterschied ist Tag und
Nacht. Und das haben wir gemacht. Und welche 15
Codezeilen abzüglich des Abstands. Es hätte lange
gedauert, es manuell zu sortieren. Und es besteht auch die
Möglichkeit menschlicher Fehler, die die
gesamte Datenbank für uns ausführen könnten. Stattdessen lassen
wir die Maschine mit wenigen Codezeilen die Arbeit erledigen
und eliminieren die
Möglichkeit, lassen
wir die Maschine mit wenigen Codezeilen die Arbeit erledigen
und eliminieren die ein oder zwei Werte zu verpassen und
einen Schneeballeffekt zu erzeugen , der unsere Daten ausführt. Lassen Sie uns also unseren Code zusammenfassen, den
wir importiert haben, oder ein Medikament X und Editor-Tools, um
über mehrere Objekte zu iterieren. Wir öffnen dann die Datei, aus der
wir
die Daten lesen werden, und
geben ihren Speicherort und öffneten sie als
f. Dann haben wir
eine Variable erstellt und
Inhalt gleich F,
F eingegeben, was unsere Datei ist, der Leckerbissen. Diese Inhaltsvariable
liest also unsere Textdatei. Dann haben wir ein Muster für
unsere E-Mail, unser Telefon und unseren Namen erstellt. Dann haben wir
eine E-Mail-Findung
an einem Objekt erstellt und ihm das
Muster gegeben, das es verwendet. Die E-Mails verwenden also den E-Mail-Button und wir haben sie mit Inhalten
abgeglichen, die die
Daten und unsere TextFile enthalten. Gleiches gilt für Schriften
und Namen. Dann haben wir eine neue
Datei erstellt und im
W-Modus oder im Schreibmodus geöffnet und
benennen sie sortierte Daten. Und dann haben wir eine for-Schleife erstellt , die über
drei Objekte,
Namen, E-Mails und Telefone iteriert . Und dann beschriften wir sie,
während wir sie in
unsere Textdatei schreiben , um sie
leichter zu lassen. Nachdem wir dann in
unsere Akte geschrieben hatten, haben wir sie geschlossen. Das war's also für das heutige Video. Vielen Dank fürs Zuschauen und ich hoffe, wir
sehen uns im nächsten.