Transcription
1. MLFirstlecture: OIR, c'est l'apprentissage automatique. Est-ce une sorte de programme d'ordinateur où nous écrivons tous les scénarios possibles ? Ajuster toutes les variables incluses sont il est juste beaucoup de données. Notre il a présenté fantaisie Visualize n'est pas Qu'est-ce que c'est ? Est-ce juste beaucoup de fonctions mathématiques ? Jouer avec les données avec le programme informatique sont C'est juste un robot. Qu' est-ce que c'est ? C' est juste un miracle qui s'est passé avec les machines ? Qu' est-ce que l'apprentissage automatique ? Pour comprendre cela réaliste un pas en arrière à moins de comprendre ce qui est programme classique ? Alors, qu'est-ce que la programmation classique ? Programmation classique en Watts algorithme sur les variables et en utilisant
ces algorithmes et ces variables v droit Les programmes classiques dans lesquels V incluent sont des
scénarios possibles . Ces algorithmes peuvent être conservés dans n'importe quel langage de programmation. Ça peut être C, C plus beytin. Et quand nous incluons tous les scénarios possibles à travers les variables, c'est notre programmation classique. Maintenant, ajoutez des données à ce mélange. Maintenant, nous écrivons un programme informatique, y compris les variables, Mais cette fois, nous avons des données. Donc, cela signifie que nous pouvons comprendre le comportement à partir des données sur. Nous pouvons faire quelque chose avec notre programmation et nos données. Maintenant, nous n'écrivons pas d'algorithmes sur les variables dont nous ne connaissons pas la valeur. Nous avons déjà des données, et nous écrivons des programmes informatiques basés sur ces données, et c'est ce qu'on appelle l'exploration de données. Nous extrayons donc les données existantes pour essayer de comprendre son comportement. Que se passe-t-il si nous combinons leurs données avec toutes ses caractéristiques ? Tout est des fonctionnalités, puis nous essayons de comprendre les modèles derrière le comportement derrière les données. Quoi d'autre peut-on déduire de ces données ? Toute la perspicacité, intelligence, tout type de comportement. Quoi d'autre peut-on prédire en fonction de l'état ? Notre travail de science des données de la trentaine ? Hesser attribue sur ce qui est Masilela Ning. Machine learning est essentiellement combinaison hors tout ce machine learning dans les murs des programmes
informatiques de données sur les fonctionnalités après les données. Alors bienvenue dans le monde au large du genou Masilela. Ça va être amusant d'apprendre à l'explorer ensemble.
2. Termes ML: bonjour avant de commencer et de faire une plongée plus profonde dans l'apprentissage automatique dernière Comprendre certains des termes sur certains des mots clés utilisés dans le monde de l'apprentissage automatique. Ces autres termes que je vais également utiliser pendant les conférences est mieux. Vous comprenez ça Maintenant, Andi, ayez la même compréhension quand j'ai utilisé ces souches. Et ces donneurs considèrent que c'est une donnée que vous avez capturée pour votre Masilela. Une analyse dans ces données ? Toutes les valeurs ici, c'est
ce qu'on appelle des observations. Quand nous voyons les observations parlaient des valeurs valeurs de données sur la prochaine partie
de frappe ici. Quand vous dites chambre salle de bains Dane, adresse l'identité off développe. Ces étiquettes sont appelées parce qu'il s'agit simplement d'une donnée tabulaire. Vous avez une étiquette. Si c'était un autre type après dur, par
exemple, s'il s'agit d'une image photo, vous n'aurez pas d'étiquettes sur lesquelles vous aurez des observations. Vous devez comprendre, sur la
base des observations ce qu'il représente exactement. n'y a pas d'étiquettes dans ces cas. Ok, la dernière, la victoire des étiquettes présente des variables indépendantes. Par exemple. Dans ce cas, si je vous dis orteil analyser ces données et prédire le prix de l'appartement avec ces caractéristiques combien de chambres il a, combien de salles de bains il a été. Et c'est ajouté la longitude et la latitude. Mais fondamentalement, l'emplacement, puis toutes ces étiquettes, toutes ces valeurs deviennent des variables indépendantes, également appelées comme prédicteurs et fonctionnalités sur le prix devient des variables cibles également
appelées prédictions. Donc, ce sont des termes très importants quand il s'agit de l'apprentissage supervisé dans l'
atterrissage Super White , il y aura des étiquettes. Il y aura des variables indépendantes et elles seront ciblées. Très abîmé. Ces variables sont regroupées en deux types différents. Si c'est quelque chose comme l'adresse, qui a des valeurs fixes comme dans une ville, il y a des adresses fixes sur lesquelles ne sont pas des nombres, qui sont ce correct nous, ? On les appelle des variables catégoriques. Ils suivent certaines catégories sur. Si c'est un nombre continu comme chambre à coucher, salle de bains, il peut y avoir n'importe quel nombre d'anciens combattants. Il peut y avoir n'importe quel nombre de salles de bains. Toute mise à jour de numéro dans l'appartement n'est pas un numéro fixe. Ces variables sont appelées variables numériques. C' est tout pour l'instant. Ce sont des termes importants. Vous devriez vous rappeler quand nous avons utilisé ces termes plus bas dans les conférences, vous devriez être en mesure de le rapporter. Ok, génial. Je te verrai ensuite. Plus tard
3. Apprentissage machine différents types de types de machines: Bonjour il viendra à cette conférence dans ce recteur. Je vais vous emmener à travers différents types d'algorithme d'auto-apprentissage musculaire. Commençons donc à un niveau très élevé. Les algorithmes d'apprentissage Maciel peuvent être séparés, sont regroupés en trois catégories distinctes. Le 1er 1 est supervisé, puis non surveillé, puis trois mesures d'exécution. Alors, comprenons. Quels sont ces algorithme supervisé est suivi. Les données vidéo peuvent être intégrées dans un mollah lointain. Si vous mettez ces données dans leur formule, vous pouvez prédire les prochaines données de mise en route huit actes qui est supervisé
son sans supervision quand vous ne pouvez pas avoir de formule sur vos données, votre date que je n'ai pas étiqueté. Vous ne pouvez pas avoir de formule. Par exemple, considéré comme les données de papa immédiat n'a pas d'étiquette attachée à elle et c'est non supervisé donc à un niveau très élevé. que cette différence entre supervisé et non supervisé dirai est une. Il peut être formulé qu'il ne peut pas être formulé sur d'autres si vos données ont l'étiquette . Donc c'est une base différente. Le renforcement est essentiellement l'essai et l'erreur a fait. La logique est dérivée d'essais et d'erreurs, sorte que vous continuez à faire certaines choses avec les données et en fonction du résultat, vous décidez que le prochain accès supervisé peut être classé plus loin dans les classifications et les
techniques de remorquage et régresser technique. Les techniques de régression sont où vous prédisiez la prochaine valeur réelle. Il peut s'agir de tout ce qui peut être un profit et une perte. Tu prédis que ça peut être ton taux d'accidents prédit. Vous pouvez prédire voiture kilométrage, tout ce où vous prédites une mort de valeur réelle étaient que le croissant vient en image. Vous allez en apprendre davantage sur rechristen linéaire sur différentes fermes, hors demandes linéaires et simple, linéaire, téméraire et multiple génétique. Écoute sur un polynôme. Très indulgent rechristen hors cours. Vous en saurez beaucoup plus à ce sujet lorsque vous apprendrez ces techniques et vous aurez main sur des projets pendant ce cours. De même dans les classifications. Et vous avez la logistique, rechristen disses, soutien d'
entrée vecteur machine déchets nuit Qué voisin le plus proche et forêt aléatoire. Les classifications est fondamentalement ce que vous prédites est oui, ne
sont pas une sorte de chose binaire. Soit vous prédites oui ou non, mais vous avez une valeur de mise en valeur et vous prédites laquelle de ces valeurs va
se produire. Donc, les classifications et c'est comme classer vos données sur votre résultat dans certaines poches , la machine de soutien Vector, voisin le plus proche
gay et forêt aléatoire. Ils peuvent être utilisés pour les classifications en tant que villas. Rechristen. Allons-y pour non supervisé. n'avez pas de données d'étiquette, vous pouvez
donc les regrouper dans différents clusters. Et il y a des algorithmes de clustering comme un moyen sont que vous pouvez suivre un type prio d' algorithmes, associés et d'algorithmes. Le renforcement, comme je l'ai dit, est une sorte d'essai et d'erreur. La logique est votre algorithme s'exécute en fonction du résultat de l'accent précédent. C' est donc aussi appelé Marco Decision Process. C' est un de l'algorithme que vous pouvez utiliser. Donc c'est tout. Nous allons approfondir chacun de cet algorithme lors de conférences futures. Génial. Je te verrai dans le prochain Lecter.
4. Jupyterinstallation: Comment allez-vous utiliser Jupiter ? Carnet de notes dans cette cour ? Jupiter Notebook est un ordinateur portable basé sur navigateur avec beaucoup
de bonnes fonctionnalités, que vous allez explorer pendant le cours dans ce recteur, vous allez installer. Télécharger sur un carnet de démarrage Jupiter. Commençons avant de commencer à télécharger sur Peter. Tu as besoin d'orteil Vérifiez si vous disposez d'un système d'exploitation 64 bits. Sont 32 bits système d'exploitation sur Windows Plate de Voici comment vous pouvez confirmer sur ou ici, j'
ai 64 bits Simple Way est Goto Google et la recherche pour télécharger Anaconda sur Il vous emmènera à www dot anaconda dot com. Fait que vous cliquez sur le système d'exploitation Windows, Mon cher sur, même si j'ai le système d'exploitation 64 bits, le bit le plus sûr est installer 32 bits 32 bits fonctionnera sur le système d'exploitation 32 bits ainsi. Un système d'exploitation 64 bits. Parfois, même avec le système d'exploitation 64 bits, vous pouvez avoir un problème si vous avez installé 64 Wheat Anaconda. C' est pourquoi je suis avec 32 bits qu'ils sont d'accord. Assurez-vous que vous savez très clairement, commençant et cliquez sur une étoile Cela prendra quelques secondes. Peut-être une minute ou deux. Ça dépend de votre ordinateur. Spit ici est installé. Et maintenant, allez aux programmes et vous verrez juste là. Anaconda. Lorsque l'anaconda s'ouvre, vous verrez les opérations de votre ordinateur portable Jupiter, et il suffit de cliquer sur le déjeuner. Impressionnant. Alors c'est toi, Peter Carnet. Il poursuit tout le combat contre d'autres réalisateurs. Je l'ai fait. Mais je l'ai fait. Si vous commencez frais, ça vous semblera vide. Tu ne verras aucun jour. Juste là. Une autre façon. Toe ouvert à Peter notebook est vous pouvez aller à nos programmes. Anaconda sur. Juste là. Vous trouvez les flics de cahier Jupiter et cliquez sur cela ouvrirait le même notable. Donc, de cette façon, vous n'avez pas à ouvrir un accordéon. Va voir Jupiter. Vous pouvez directement ouvrir. Vaincu. Très bien. Vous êtes tous prêts. Vous avez téléchargé votre ordinateur portable Jupiter, et ça marche. Je te verrai dans la prochaine lettre
5. Numpy unique Dimension unique: Bonjour il viendra à ce plus riche dans ce réalisateur, je vais vous emmener à travers numpty. Numéro être est une bibliothèque de fightin sur elle est difficile de toute science des données ? Est-ce que le projet Massie Learning ? Si vous inspirez à devenir des données, les scientifiques sont professionnels de l'apprentissage automatique. Vous ne pouvez pas ignorer Lumpy. Alors parlons. Appelons-le MP démo et c'est une bibliothèque Pitre pour importer numpty et c'est C s vide. Donc, cela va importer cette bibliothèque dans votre bloc-notes et vous pouvez utiliser t importé sur les fonctions off numpty dans votre programme avant de commencer. Il y a peu de choses que je veux que vous compreniez pour que vous et moi soyons sur la même plate-forme tante aient la même compréhension de ces systèmes. Donc d'abord, euh, c'est Dieu, c'est tueur. C' est un tueur signifie que si vous avez des valeurs comme un orteil comme des valeurs individuelles, on les appelle « tuer », est-ce
pas ? Et puis il y a un autre terme appelé Victor. Donc Victor est très célibataire Esnal, Ari comme ça. Donc, si c'est un seul centime est Ellery avec des valeurs, il est aussi appelé Victor. Et puis mes tours sont multidimensionnels. Cela signifie qu'il a plus d'un centime instantané comme il a des lignes et des colonnes, non ? Comme ça. Un orteil, puis 34 bronzage, 56 Donc voici un exemple de Matics. D' accord ? Je pourrais utiliser la distance. Comme Victor sont des métriques ou multi diamondstein. Hillary est interchangeable. Plus grand. Alors commençons maintenant. La première chose que nous allons faire, c'est que je vais vous emmener à travers des fonctions de sortie. Droit ? D' accord. Donc, le P engourdi ne concerne pas seulement Ari et les métriques, vous pouvez exécuter des fonctions numpty juste pour renvoyer une seule valeur. Par exemple, je peux juste peindre un nombre aléatoire. Comme si je dis MP fléchette aléatoire et je m t et de la nourriture, par
exemple 17 ici, il me retournera tout intérieur ? Moins de 17 ans. Très bien. Donc, voici le retour 16. Maintenant. Si je le fais à nouveau, il sera 10 3 petit remorquage. Il se sentira 15. Donc comme ça, il va continuer à me renvoyer un indigène différent, mais tout dans fastidieux, moins de 17 sur Comme ce qui l'a fait Une autre fonction appelée aléatoire. Pas à la fin, Deon. Et cela me donnera des nombres aléatoires. Comme si je continuais à courir ça, ça continuerait à me donner des nombres aléatoires. Comme maintenant, il donne moins 1.2163 ici. Il y a donc de telles fonctions disponibles dans le modèle de tueur. Aussi comme A et P peut être utilisé pour vous renvoyer un seul. Eh bien,
maintenant, il est temps de nous voir. Ah, les démons. Non. Prêt. Aussi appelé Victor sur ce point est où l'utilisation réelle hors numéro qu'il commence dans le monde de la science des données et de l'apprentissage
automatique. Avant tout retard, nous allons de l'avant et créons notre première dimension Je vais
orteil Appelez ça DNP Victors un sur pour le créer. Ari, vous avez juste à dire, n p point r a et fournir votre liste ici. Je vais au président Oneto trois pour cinq, six et sept. C' est ça. Mon tableau est vraiment, vraiment je peux juste imprimer cette zone ici comme DNP Victor. Quoi ? Et je l'ai fait. Ma région est vraiment Il est si simple de créer un quoi si j'ai déjà une liste dans fightin, Vous pouvez avoir un moins droit et moins hors valeurs. Droit ? 10 11 12 13 14 15. C' est ma liste n'est pas Ari, est-ce pas ? Et le stock ? Deux choses différentes. Mais je veux créer un moyen avec cette liste, nous sommes le moins facile est le mot clé. Donc, allons au moins un ok Maintenant, je peux facilement créer le tableau avec cette liste. Je peux dire et p point i d sur enregistrement. Il suffit de mettre cette liste d'habitude à une. C' est ça. J' ai ma zone et je peux nommer cette zone. Quoi ? Ce que je veux, je peux voir DNP Victor aussi. Si ce gars et puis imprimer D et B victors à et ceci est Mary. Et pas seulement ça, je peux faire l'inverse. En outre, je peux convertir ce tableau en liste sur le chemin de le faire c'est juste mettre cela très ici et ensuite appeler la lutte et la fonction appelée à la liste et c'est tout. La zone a été convertie orteil la liste. Maintenant, c'est une liste de sorte que vous pouvez échanger entre notre a et l'Est très facilement sans trop de problèmes. Prochaine fonction, je vais aux orteils. Donc, c'est arrivé. Et si je veux orteil upend une valeur de plus à mon vainqueur sont mon seul temps est Ellery DNP Victor un très facile. Il suffit de dire ni PNB tarte à l'envers. Andi, mets ton Es-tu là ? Mettez la valeur que vous voulez dans. Par exemple, si je veux avoir été 100 aucun problème. J' en ai 100. Je l'ai fait à ma course DNP Victor. Si je l'ai assigné à mon DNP Victor un sur, puis imprimez mon DNP meilleur. Je circuit que 100 jours avis de chasse cette cour 100 annexé à la fin de la ce que si je veux ajouter ce 100 à ce rythme FIC produire dans la zone sur par la façon, quand je l'appelle produire, il est appelé Index et le numéro d'indice qu'il commence avec zéro. L' indice partisan pour un est zéro. Ensuite, il s'agit d'un indice partisan à l'indice 20 est et trois dans l'expérience et quatre dans différents. Vous pouvez cinq woodies index et six et dans des utilisations désespérées. Tu le ferais depuis sept ans. Donc c'est comme ça qu'ils indexent. Voyons voir si je veux insert orteil afin que je vais voir et être insert de fléchettes et puis mon miel et puis je veux insérer à producen Écouter, arbre sur. Je veux insérer la valeur 10. Alors dis-moi qu'on y va vraiment. C' est zéro. C' est un, c'est à trois. Donc, le 10 devrait être ajouté après le numéro trois ici. Très bien. Oui. Alors est ajouté à Indyk numéro trois, qui est ici sur. Si je veux changer de zone, je peux juste attribuer ce nouvel insert et ensuite si je veux imprimer, pourquoi DNP victor un ? Je vais en avoir 10 juste là. Jusqu' à présent, si bien. Je ne pense pas que tu devrais avoir du mal à suivre jusqu'ici. Ça a l'air facile, non ? Très bien. Regardez ces valeurs. Ils ne sont pas commencés. Je voulais m'occuper. Et pour cinq Que faire si je veux trier très facile à dire dans P Dar Saad et passé le A D et B D et P Victor un jour Lefty ici. cours Arctic Latest assigné le vainqueur de départ à notre vainqueur. OK, et maintenant amenons ce type. Il est correctement trié. Que faire si je veux en supprimer un ? Pas de problème. Tu peux le faire. Dis juste MP Dot Day it D et B, Victor un. Et si je veux supprimer la valeur à l'index un vient de passer cet index. Alors, lequel pensez-vous qu'il va être supprimé ? C' est des corps d'index et zéro. Ce ne sont pas des explosions et une aussi devrait être supprimée, non ? Faisons ça. Disons D et B Victor un égal et puis brillant DNP Victor courir. Ici, nous allons, à Dieu dilaté. Il y a encore un funks très intéressants et une concaténation de voiture. Donc, par
exemple, j'ai un autre Victor DNP Victor trois. Quand il y en a 11, il y en a 200 ou trois. Je veux cela, Victor, Toby ajouté avec le DNP Victor et créer un nouvel acteur sont ensemble. Donc, je dis que le MP Victor quatre égale np pistolet de fléchettes que le net d et B meilleur sur DNP. Donc, ici encore, protecteur un sur DNP Victor T. Et avec cela, nous devons aussi des moyens et l'accès est égal à zéro. Et je vous expliquerai cet accès quand on parlera des diamants multiples. Non, ce serait le bon moment pour en parler pour l'instant. Il suffit de mettre l'excès appelé 20 sur. Ensuite, nous allons imprimer D et B Victor quatre. Ici vous allez le et directeur pour est communistes et offrir DNP Victor trois et DNP Victor un. droite. Donc c'est comme ça qu'ils ne peuvent pas entrer dans son travail de
fonction. C' est un très petit vainqueur. C' est très petit au début des projets de la vie réelle. Vous vous en sortirez avec des milliers d'enregistrements sur si vous voulez trouver l'index d'une
valeur particulière dans ce que des milliers de off enregistrent leur commun pour cela et c'est la fonction gêner ici. Donc, vous verrez dans p point nous sommes sur. Ensuite, vous verrez votre nom de vainqueur D et B Victor quatre, puis mettre la valeur que vous définissez. Par exemple, je mets pour 101 Cela me renverra l'index il y a 101 an. Il dit qu'il est à l'index il SolarCity 012345678101 existe à l'index encore et le type de données hors cette valeur est I nt bons informateurs et jusqu'à présent nous avons créé notre notre auto onda. Nous jouions avec cela, mais il y a d'autres façons de créer un et cela va être très utile pour U. S. Fondamentalement, lorsque vous créez une idée visuelle puisque alors voyons, c'est un DNB on obtient un et B fléchette une gamme Andi, Puis où il avait juste dire un pour orteil 10 et deux. Que va-t-il se passer ? Il créera automatiquement Ari. Voyons un D et B. Quoi ? Ici, tu y vas. Donc, il a créé que vous êtes un hors valeurs intérieures entre un et 10 avec l'intervalle éteint à ce qui signifie qu'il commence vraiment avec un et puis il passera aussi. Donc 13579 et la dernière valeur n'est jamais incluse. Ainsi, toutes les valeurs commenceront par la première valeur de la plage et seront inférieures à
la dernière valeur du loyer. Sur l'espace entre ces valeurs sera le nombre que vous avez fière de commencer à trois serait orteil Aaron génial. Ces air utiles. Que faire si je veux créer un tableau de tous les zéros ? Donc disons D et B. Tzeitel, c'est vraiment juste des zéros de points cmp. Et combien vous voulez Si je veux 10 donc ça va créer un jour avec 10 zéros. Le PNJ, vous y allez. Il a créé un tableau avec tous les zéros. Il a créé un rivet 10 valeurs et tous sont zéro. Il est affreux va de même. Je peux créer avec tous ceux ici. Si vous vous demandez où en êtes-vous, vous allez utiliser ce genre de fonctionnalités. Il sera principalement utilisé lors de la création avec le plus léger depuis. Ok, continuons sur la prochaine fonction dont nous allons parler. Et c'est une fonction très importante est couchée dans l'espace. Voyons ce que ça fait. Donc D et b couché Son rythme est égal à la ligne sombre MP cette pièce sur, Disons que je veux imprimer de 1 à 5. Il 20. Évasion sur de Sprinted. voilà, est-ce qu'on a eu ? Il imprime des valeurs comprises entre un et cinq. Les deux sont inclus qui sont 20 valeurs entre un et cinq et ils sont tous également distancés. Donc chacun d'entre eux sont séparés avec la même distance 0.20 C'est ainsi que l'espace léger fonctionne. Que faire si je veux aligner la valeur maximale dans ma région ? C' est-à-dire, il dit juste DNP. Vous pouvez simplement dire Max sur vous obtiendrez la valeur maximale Donc la valeur Max est 5.0. Correct ? De même. Si vous voulez au minimum, vous avez juste à dire moyenne d et B neuf point SB je veux dire sur la valeur minimale est un. Que faire si je veux connaître l'indice hors maximum et minimum Eh bien, au lieu de Mac, vous direz air T max. Et cela vous donnera l'index après fait nombre ici sur si vous voulez le minimum une
fois de plus. Même chose. Mais par ici, tu dis Edgy. On y va. C' est zéro. Que faire si je veux connaître la taille de ma région ? Ce n'est pas non plus si difficile. Se d et B neuf cuillères à café et juste une taille. Ici, tu y vas. Le côté de cette course, 20. Bien sûr que ça ne se développe pas, non ? J' ai oublié de te dire la chose la plus importante et la plus facile à faire. Si je veux trouver la valeur à un index spécifique, c'est facile. Ligne DNP. Soyons si je veux trouver la valeur Par exemple, cet indice 55 il vous montrerait la valeur de l'indice cinq. Que se passe-t-il si je veux la valeur de l'index de plage ? Comme si je veux une valeur de 1 à 5, donc DNP ligne SB. Je veux très de 1 à 5. Diego. Il vous donnera des valeurs de 1 à 5. C' est ainsi que vous trouverez les valeurs dans un salaire de diamant. Je pense que nous avons couvert tout ce que nous avons besoin de couvrir dans une seule dimension. Ensuite, je vais vous emmener à travers un tableau multidimensionnel
6. Numpy multidimensionnel: Parlons de mon Ari en deux dimensions. Voyons maintenant mes demandes de D. Non, mais il a aussi appelé des médecins. Commençons par créer un ari multidimensionnel hors nombres aléatoires. Donc, disons DNP aléatoire. Il est en FY sur un point aléatoire de fléchettes. Nous allons créer un tableau multidimensionnel de cinq par quatre qui a manqué cinq lignes et quatre colonnes. Conduite par quatre D et P. Benda. Très bien. Donc c'est notre Monte demande maintenant sur Rappelez-vous jamais parler d'excès. Donc, toutes les lignes ici, ils sont considérés comme excédentaires. Les colonnes zéro sont considérées comme excédentaires. Au contraire. Commence en chemin. C' est 00 C'était zéro ligne zéro colonne. C' est 10 qui gagnent la première règle. VERO COLONNE Ceci est 20 que lorsque la deuxième ligne colonne zéro. De même, celui-ci est 01 qu'avec zéro ligne première colonne, la ligne vient en premier et ensuite l'appeler. Par exemple, si je veux connaître la valeur à andro épais et la première colonne D et B aléatoire, ils contrôlent la première colonne et la mort se développent. Jiro Un orteil, deuxième rangée 01 1ère colonne. C' est la valeur, la même chose. Je peux aller un peu différent. Je pourrais dire que le DNP est revenu à la maison sur un. Il retournera la même chose que je peux mettre Row et colonne entre parenthèses séparées si je peux
les garder dans le même enregistrement avec des virgules. Que faire si je veux trouver une plage comme le 1er 1 ici est pour la ligne 2ème 1 ici est pour la colonne et je peux mentionner la plage donc je peux dire D et B Vande um je veux voir de la ligne un à la ligne trois et quatre colonnes. Je suis passé de la colonne deuxième orteil appelant qu'ils voient et que c'est bouleversé. J' ai les rangées 10 et 103 012 d'arbres de cette route à cette pièce. Droit ? Et appelle-le Toto. 401 orteil faire et quatre Rappelez-vous, les quatre n'est pas inclus. C' était donc deux et trois. Donc deux et trois d'ici à ici. Et 213 Donc ça veut dire ces valeurs, non ? Donc 31 n'est pas inclus. Donc, ce sera un et deux. Personne ne l'a écrit et l'appeler deux et trois parce que le latéralement n'est pas inclus. Tellement idiot que je fais ici. Celle-ci est sur. Écoute, c'est comme ça que ça marche. Comme si vous voulez obtenir une réparation de l'espace bouleversé sur le salaire de plusieurs diamants. C' est comme ça que tu veux. Tu devrais pleurer. Développé. ai eu. D' accord. Qu' est-ce que la taille de mon ar e ? Et si je veux connaître la taille ? C' est là que la justice est facile. Sirotez. C' est ça. Ça dit la sape de vos tableaux. Cinq et quatre. Jusqu' à présent, si bon. Que faire si je veux connaître les types de données hors de ma région ? Très bien. Dites le type d. Et c'est tout. Les données plongent. Toutes les valeurs dans ce domaine sont des fruits. Je pense que c'est une question d'Ari multidimensionnel. Passons dans certaines de nos prisons. Vous pouvez pour formé sur ces zones. Cela peut arriver sur la dimension du chanteur sont multi-dimensionnalité. Mais ce sont certains intéressants notre présence que vous pouvez effectuer. Faisons ça. Voyons nos cadeaux. Et voyons quel genre de prison on peut faire sur notre NPR. Je vais définir mon propre Ari. Je ne vais pas jouer. Ce sont des cadeaux sur ce nombre aléatoire. Multidimensionnalité. Alors allons créer mon propre ary DNP i n t Medics à n p point ami je vais créer une
multi-dimensionnalité . Vous devez casser ses records de chœur pour créer des valeurs Eddie multidimensionnelles . La croissance à l'intérieur est des enregistrements de cartes. Un à trois, puis 456 789 10 11 12 15 14 15 et ils passent ce type D et B et les médecins. Ok, donc c'est ma zone multidimensionnelle. Je vais faire beaucoup de choses sur notre présence,
le 1er 1 que j'aime. C' est certains que je peux voir, et cela va me donner le total de toutes les valeurs dans ce domaine ici 1 20 Donc c'est le total de toutes les valeurs dans cette ville. Que faire si je veux toe savoir laquelle de ces valeurs sont créées ? Les gentils payés parlent bien. Par exemple, je veux voir Veach de ces valeurs sont supérieures à sept D et B. C'est copier ceci et plus grand que bientôt. Ici vous allez, pour toutes les valeurs où il n'a pas plus que 78 réimpression tombe et les valeurs qui sont plus grandes que, disons, un, il imprimera vrai intéressant, non ? Que faire si je veux créer un R e avec les valeurs de ceci ? Très. Mais les valeurs qui sont plus grandes que, disons une, par
exemple, cette ville dit juste que c'est un 2ème 1 sur. Ah, n'oublie pas que c'est tout à fait des records. Et puis ce disque, et puis je vais dire, a
connecté ce plafond sur une impression moins. Donc, ce n'est pas Ari que de convertir ça en un jour. Pourquoi tu dois faire, c'est que tu dois dire l'original Ari à l'intérieur que tu as mis ce gars. Ok, maintenant, vois, tu as cette filiale. Nos valeurs David sont supérieures à sept. Cette commande est un ID obsolète. Mais je voulais juste que tu puisses faire ça. Que faire si je veux changer toutes ces valeurs ? Donc, au lieu de n'importe qui à Eh bien, je veux attribuer 100 Par exemple, ça s'appelle une diffusion. Tout ce que j'ai à faire, c'est que je dis,
ici et là, j'ai besoin de savoir ce qui suit dont je parle. Alors rappelez-vous, 012 et 3. Donc je parle de la règle numéro 3. Donc ça veut dire la règle numéro trois. Ce serait qu'il est tout à fait records. Règle numéro trois et puis de quel Collins je parle de 0012 comme de zéro à. Alors, qu'est-ce que je vais mettre ici ? zéro à la dernière. Eh bien, voilà dans le loyer. La deuxième valeur ne contacte pas. Donc, je dirais trois ok, égal 100 et puis moins imprimé. D' accord. Ici, tu y vas. Que ça a changé 200. C' est la radiodiffusion. C' est ainsi que vous pouvez changer les valeurs dans Larry multidimensionnel. Que faire si je veux ajouter 50 toe toutes ces valeurs juste à 52 il qui est également facile. Il suffit de voir ça à 50 ans. C' est comme tous les autres sont persistants. Dites juste ajouter 50 comme ça sur imprimé à nouveau. Ici, tu y vas. Cinquante, bien développé.
7. Fonctions statistiques Numpy: comme prochaine partie de cette amusante Jenny off exploding numpty, nous allons orteil explorer certaines fonctions
statistiques. C' est funk des testicules ? Puisque vous pouvez jouer sur les 9 heures , je vous ai déjà vendu un prochain que je vais aller orteil. Alors, c'est tendre, sournois. Et donc vous dites juste entraver l'art, STD et passer votre nom dessus calculera un sournois standard et sur votre saint. Donc, pour ce sont un écart-type est 37.31 De même, vous pouvez effectuer plusieurs autres fonctions statistiques. Par exemple, si je veux voir la route Esquire hors de chacune de cette valeur, je peux dire MP fléchette Oui, Q rt, puis pastie nom de papa ici, il donnera son calme a écrit chacune de ces valeurs. De même, vous pouvez faire le journal. Donc, au fait, si vous ne comprenez pas beaucoup les détails derrière ce que sont ses téléviseurs tendres et qu'est-ce que le journal ? Ne vous inquiétez pas. Nous le couvrirons dans les futurs cours pour l'instant. Rappelez-vous juste que ce sont les fonctions statistiques MP que vous pouvez faire en utilisant la bibliothèque de combat de
M. P. P.M. P a lavé le potentiel, et cela mis Insel augmente de tous les jours. Lorsque vous continuez, faites le projet en temps réel en tant que professionnel de l'apprentissage automatique. Je vous demande de vous tenir au courant de ce qui se passe dans les bibliothèques comme le député Kaylan Banda Matt a apporté vivant Be on Seaborn ces cinq bibliothèques Air qui vont être votre vie. Alors restez-vous au courant de ces bibliothèques et tenez-vous informé de ce qu'elles étaient. De nouvelles améliorations se produisent dans ces bibliothèques. Quelles que soient les fonctions qui se déprécient, quelles que soient les nouvelles fonctions qui sont ajoutées. Artem, tu en as fini avec engouement. Je vous verrai la prochaine conférence.
8. Pandas: Bonjour, là. Maintenant que vous avez installé Jupiter notebook, nous allons faire deux choses ensemble. Nous allons créer un nouveau cahier Jupiter sur nous allons explorer une très importante bibliothèque d'apprentissage automatique Beytin appelée Wanda. Voici votre cahier Jupiter. Allez à nouveau et cliquez sur Combattre. Et trois. Voici à quoi ressemble Jupiter Notebook. C' est ce qu'on appelle la vente. Vous pouvez en ajouter autant que vous le souhaitez. Vous pouvez supprimer si vous ne le souhaitez pas. Andi. La première chose que nous ferons, c'est d'écrire ce qu'il s'agit. Disons que bundle, Andi, allez à la voile type de cellule et faites-le Marta Markdown est comme des commentaires sur ce sera utile lorsque vous imprimez le cahier complet. Arvin Terminates est en train de regarder ce carnet Mark par ici Vous pouvez voir frapper. Lisez ce message. C' est très bien. Et maintenant, nous allons importer la bibliothèque Pandas pour PD sur Dans le même temps, nous allons importer une bibliothèque très importante Numpty si vous êtes nouveau pour acheter des articles, juste comprendre. Ce sont des bibliothèques très importantes que vous allez utiliser dans l'apprentissage automatique. Donc nous avons trouvé en particulier est ce que vous allez explorer orteil dans cette conférence que vous allez
passer quelque temps dans ce victor orteil. Comprendre quoi ? C' est la Bibliothèque des fondateurs. Qu' est-ce que tu peux faire ? En utilisant cette bibliothèque, vous avez importé les bibliothèques importantes Suivant, moins droit. Une petite cour. Nous allons créer un cadre de données pandas qui est comme créer une table dans l'apprentissage automatique comme entrée a fait des citations, il va être et sur maintenant va zones orteils, par
exemple, Les villes est un très simple, très off nombres pour six, puis neuf et vous fait commencer ici près. heure de cette année va être enseignante. Jusqu' à présent, si bon. On a vu une pause. Obtenez ici sur alors Way moins les colonnes Les problèmes vont être simples. Restez simple pour l'instant. Le voir Construisons cette cour très simple sur Vous êtes prêt à courir. Vous pouvez y mettre fin maintenant cliquez sur ce. Il vous demandera Arias PDG, Vous voulez redémarrer orteil le cardinal ? Parce qu'ici, vous voyez qu'il n'y a pas de chiffres parce que le colonel n'a pas commencé. Donc, astuce sur ce sur il va commencer ça. Et là, vous avez les chiffres juste ici. Oh, tu veux un et deux maintenant ça fait partie du pays ? Ça fait partie du cahier maintenant. Conditions normales. Ce premier détecteur et ça. Allez. Et cette commande est notre bloc de données. C' est exactement ce que nous avons donné cette année. 123456789 Sur les colonnes ABC sur ce ici est appelé Index. Nous allons jouer avec cette lettre,
mais pour l'instant, comprenez, comprenez, nous venons de créer un bloc de données sur la toux par jour de congé numéros. Maintenant, créons une autre donnée à partir de et cela va être un peu différent de ce qu'il est maintenant. Donc, dans la nouvelle vente, eh bien, ici si vous allez, vous obtenez plus d'options. Ils insèrent, insérer la vente, évoluer sont insérés en dessous. Donc, je vais l'insérer ci-dessous. Et puis ici, ils ont deux égaux BD sur ce sortir de leur pays de temps et sombre. Aujourd'hui va aussi être celui-ci. Disons quêtes dernièrement pas oublier Syntex. Ok, et écoute, disons qu'il va être et qu'on habite où alors ? 15 14 15 19 15 15 15 Sur elle dit encore une règle 19 Ne pas très bien ici. Donc, c'est la fin. Cette fois, nous allons à une chose de plus importante. Nous allons nommer notre indice au Texas égal à ce qu'ils ne le sont pas. 1234 lignes. J' ai besoin de quatre à Nexis. Il a dit Andi comme avant qu'on ait besoin d'orteils Colonne Neymar Gardez le nom de colonne semble une tante B. Je vois. Ça a l'air bien. Oui, je ne sais pas
beaucoup. Oh, oui, on a plus que nécessaire au Texas. Il y a 1234 règles. Donc B Q R s pour ok maintenant rallyes. Et nous y voilà. On a le nouveau bloc de données. Indiquez un cadre. Les indices sont assyriens le nomme BQ Arias. Ce ne sont pas des nombres numériques. Il est basé sur ce que nous avons appelé que j'ai fait avant nous plus Nous allons suivre un peu de bien. Citant standard sur les insertions vers le haut, certains ont marqué quelques commentaires qui seront utiles. Lettre, ils disent que dans le troisième sceau implique ici. On va voir 15 états de James,
celui-là, on doit aller à la vente et dire qu'il est marqué par le père Mark sur les ventes. Il n'y a pas de chiffres Seuls les tribunaux de la cour militaire ont les chiffres parce qu'ils doivent suivre certaines exécutions dans l'ordre. Bon travail. À ce jour, les Afghans ont créé deux ensembles de données. DF Andi doivent jouer vers le bas, Andi, le prochain Come on est le Si vous venez d'exécuter cette commande, vous verrez toutes les colonnes comme ABC et type de données type de données de toutes ces colonnes avec objet avec SSPT de colonnes 30 de deux colonnes. Il sera aidé sur la façon dont Quel indice ? Si vous dites l'index, vous voyez, c'est sa gamme de jours 0 à 3 et les étapes un que c'est juste un nouvel index médical sont créés. Il commence zéro dessus, incrémente d'un. Et si je faisais des cerfs trop sombres là-dedans ? Qui ici ? Il a des noms indexés, BQ, arias et, bien
sûr, type de
données avec objet. Le vrai plaisir commence maintenant quand nous allons couper et couper ces données en dés, s'asseoir en utilisant Panda. Ce qu'on va faire maintenant, il découpe faire ça sur un mais on a à voir avec ça. Ce n'est qu'un commentaire. On avait un bon type de cellule de vente sur le Dr et il n'y a pas de chiffres. Encore une fois, il suffit de cliquer sur ceci et directement ci-dessous. Ok, ici. C' est une chose très importante que vous allez utiliser dans Masilela Et si je veux de l'espace ? Appelez-le. Si vous êtes index sont numériques comme ça, vous pouvez simplement dire le f serré. Je les regarde une que nous expliquons cette partie dans les index de combat. Ils commencent zéro. Donc, si vous en sauvez un, il va orteil imprimer la deuxième pièce. Maintenant, le premier nous allons voir que cliquez contre Et ici vous allez Il va imprimer 456 Parce que nous avons donné un. Et si je dis que je regarde ? Zéro Il va être le 1er 1 123 Et si je veux juste Tokyu ? Mon nom d'index, pas le numéro d'index. Dans ce cas, vous verrez DF trop bas sur. Par exemple. Je veux juste payer ma chambre P. Dans ce cas, vous direz loc local pas je loc dans pas Index Loc. Vous direz votre Lucy et vous donnerez le nom de l'index. En passant, vous pouvez déf cliquer sur le contrôle. Entrez sur votre garder sur vous pour faire la même chose que vous faites avec la couleur surround
ici . ABC 10 11 12 sur c'est le Speedo. De cette façon, vous pouvez directement obtenir un groupe de freak de vitesse. Jusqu' à présent, si bien. Maintenant, vous savez comment ami une rangée de haut-parleurs spate. Que diriez-vous de vouloir un sous-ensemble de ces données, par
exemple ? Je ne veux que cette partie. 10 11 13 14 16 17 Seulement cette partie. Je veux créer un sous-ensemble. C' est bien lui, allons-y. J' avais une nouvelle cellule. Maintenant, nous allons créer un sous-ensemble. Une fois que tu pars, on va à la qualité de trois. La commande est trop sombre que je serais dans ce cas. Il y a deux arguments. Le premier argument contient le nombre après ceux que vous voulez dans ce bouleversement. Commencez par zéro sur leurs noms. Arbre fait de même Vous ne voulez que deux colonnes zéro et fait que vous avez comme ici vous obtenez un e et b rappelez-vous, soyez un. Oui, c'est cette étape ? 10 11 13 14 et 16 17 trois Doit and do colonnes maintenant seulement 50. Et vous avez créé une subvention sur le F deux et vous donnez le nom du fonds ne
s'arrête pas ici. Il y a beaucoup de ces commandes à exploser avant que je ressens. Cela cerise sur le découpage après ses atouts que nous vous expliquons un aspect de plus que vous
utiliserez dans Massillon. Et si je
disais, vous quatre et le F à ce que je regarde ? Alors je dis, OK, 0 à 3. Mais ici, j'ai dit qu'ils étaient chers pour ce qui est arrivé Santee dans ce commandement. Je dis de ne pas inclure la dernière colonne en disant mon nid dans. Je vois ne pas inclure celui-là. Si je pense que moins deux n'incluent pas les deux dernières colonnes. B et C. Ils font ça ? Oui, il a juste Carlo frais. Et si je vois moins un ? Le seul prince le dernier ? Allez, si je vois la dernière étude, si je dis moins un, ça veut dire que je ne suis pas un début avec zéro à moins un. Je dis juste moins un. Il suffit de mettre moins un. Cela signifie qu'il va juste prendre la grande colonne. Voir 1ère 3 portes 12 15 18 à 15. 18. Mais sur la dernière couleur. Voici quelques-unes des façons amusantes en utilisant vous pouvez créer un sous-ensemble de données plus grand sur. C' est ce que vous allez utiliser dans Massillon. Nous n'avons pas fini. C' est le plus important sur la partie critique de Panda, que vous allez utiliser à Wasilla. Le genou est ce que je donnerais pour le dernier qui est de lire les combats. Alors mettons le marché ici. Carte sur. Tu vois, ça va être en panne. Tu penses ? Fonda Tu pourrais lire n'importe quel combat avec qui tu peux sortir deux ans. Nous avons finalement converti à partir du site Web. Vous pouvez t html cinq, euh, à la ville facile. Vous venez de donner sur DVD point Tétine es trois. Dooney et nous ici pour se battre sur J'ai See est moi à ce lien. Et c'est là que le fichier CSC est stocké. C' est la seule commande que vous devez lire là-bas. Tu le vois ? Je suis juste plutôt désordonnée. Et voilà. Vous voyez ? C' est oui, on fait un dossier là-dessus. Nous avons un côté sur juste avec un. Allez. Le fichier complet est juste ici à ce fichier est dans cet ensemble de données. Tu l'as récupéré ? C' est ça. Maintenant, l'ensemble du cadre de données de la jeunesse CS 35 Banda appelé le Si elle est sur. Peu importe ce que vous êtes la présidence exécutée ici, vous pouvez effectuer sur le si elle d si elle Si vos données à jouer autour maintenant et vous allez être faire toute cette découpe, découpe,
indexation sur toutes ces choses faisant Massillon sur ce genre de données. Donc, en ce que vous alliez orteil lire un combat avec beaucoup de données en utilisant panda sur. Ensuite, après cela, vous ferez est de former des conducteurs et trancher et couper en dés toutes ces analyses sont que vous pouvez voir toutes ces opérations sur les données en utilisant Panda, lumpy et d'autres bibliothèques. Mais le panda est la bibliothèque la plus importante quand il s'agit de lire le fichier sur instruction, découpage et le découpage de ces données plus grandes. Je te verrai à la prochaine conférence. Au revoir. Mais n'allez nulle part, Head. Le plus important de la partie la plus excitante de Brenda que j'ai gardée pour la dernière sur qui est de lire les cinq. Lorsque vous faites de l'apprentissage automatique, vous devez d'abord lire les données à ce sujet. La première chose que vous allez utiliser Fonda. Alors continuons tout en menant les données. Vous lisez les données et vous transférez vers elles dans une renommée de données. Tu sais déjà pour lui. Donc, si c'est mes données à partir de maintenant sur la commande à lire. Le fichier est BT point Reid, je vais lire CS trois fichier. Donc ça va être la porte de la police pour voir si nous si vous lisez accepté, serait accepté. Donc, comme ça, il y a des commandes pour lire divers combats. Vous pouvez obtenir une excellente qualité que nous pouvons détecter. Dossier. Tu pourrais manger des œufs. émeraude. Vous pouvez y trouver n'importe quel type de fichier. Allez pour ça. Si on arrive ici,
c'est un type de données open source. Si on arrive ici, Jamais pour toi. Vous pouvez presque immédiatement. Donc je vais lire ce que nous avons déposé cette année à cette date. Je vais être dit dans cette renommée de données. Et j'ai dit, tu n'as rien à faire. Allons assez état un asseoir sur beaucoup ici. Vous avez ces données dans le bloc de données ? D Si c'est activé maintenant, quelle que soit notre présence que vous effectuez ici sur le bloc de données, vous pouvez effectuer le même type de notre présence sur les données à partir de ce est la première étape tout apprentissage automatique. Vous devez d'abord lire les données sur. Ensuite, vous commencez à découper, à découper et à analyser les données. D' accord ? Nous en avons presque fini avec cette conférence. Nous avons exploré assez de détails dans Panda sur. Notre dossier est prêt. Il est temps de dire le combat. Alors vas-y. Combattez. Sue est allumée. Ensuite, ici, vous pouvez obtenir le nom. Ils ont dit que ça devient mon combat. Il y a plusieurs bonnes choses sur des choses très utiles sur vous, Peter. Mais je vais vous en parler en temps voulu. Une chose très importante que je veux vous dire maintenant est que vous pouvez télécharger ce
fichier entier Shtml comme un pdf sont n'importe quoi par exemple. Je peux télécharger ce sht, etc. Si j'ouvre. Voici comment les combattants maintenant je peux voir dans ce combat à n'importe qui sur David. J' ai jour tous les commentaires. Gold a raisonné que l'achèvement de la course à froid est juste là. Mais c'est votre carnet complet. Vous pouvez dire avec n'importe qui que vous pouvez, en fait, mettre le bon espoir. Nous le ferons en temps voulu. C' est une beauté de Jupiter. Donc, tout est à propos de Panda sur Jupiter sur. Je te verrai dans les prochaines conférences.
9. DataExploration Seaborn2: Comment est-ce que je suis assis dans un restaurant et je pense, si j'ai une données sur les clients de cette rhétorique et combien ils sont sur la facture sur combien ils ont la douleur comme un pourboire. Quelques informations sur ces clients comme leur sexe, qu'ils
soient fumeurs ou non, science hors de la taille de la fête, Combien de clients mangent ensemble ? Puis-je trouver un motif ? Et puis-je dire qui paie plus avec les fumeurs, payer plus ou les non-fumeurs paient plus sur ce que le serveur aimait ? Les serveurs deviennent plus profonds. Va trouver une sorte de perspicacité dans le fait qu'ils vont au monde hors date que je marque n'est pas l'exploration
des données est une des étapes les plus importantes pour tous les scientifiques de données ? À moins que vous compreniez vos données, vous ne pouvez pas faire grand-chose avec elles et mordre et épouses. Plusieurs bibliothèques pour l'exploration de données Matt Part et See Bon sont celles qui sont les
plus utilisées dans ce plus riche. Je vais vous emmener à travers la bibliothèque Seaborn. Disons qu'ils ont attaqué la prison en utilisant les bibliothèques « Go on Lesson 40 ». Bien sûr, la première bibliothèque va être financer la beauté de la Terre à l'importation Si bon SNP Nous allons importer dumpy comme et être trois bibliothèques principales est notre pain et le beurre hors de tout scientifique de données. Ensuite, nous allons orteil importer l'ensemble de données principalement toutes les bibliothèques, comme en voir une comme une bibliothèque comme un mordeur. Balade à la bibliothèque. Leur propre ensemble de données à des fins de dégustation était que nous importons des trempettes de cartes détestées de la côte. Il y a les conseils égaux oui, dans ce noir. Vos données disent, sur l'ensemble de données. Le nom est des conseils sur. Suivant. Nous allons créer le bloc de données de Fonda pour ces données. Tu sais déjà que c'est de la crème et ils l'ont mis. Voyons d'abord. Peu de rôles après les données étaient bons à jouer. Jusqu' à présent, si bien. Ok, on va le faire. Ta maladie. Oh. Oui. Ce serait une maladie. Ok, donc voilà. Ce sont les données qui disent que nous allons travailler sur un siège de données très simple. Il a vu le montant total de la facture payé profond six hommes ou femmes sur la question de savoir si la personne qui a payé ce total sera le montant et le restaurant Table Mountain était un fumeur ou non. Quelle date était-ce ? C' est un mort un jour. Et à quelle heure il était ? C' était un dîner pour le déjeuner ? quelle heure il était. Quelle est la taille de la fête ? 2345 Ok, donc très simple Data est tout. Voyons combien de données y a-t-il dans ces données ? Asseyez-vous si d Dr See, il va à Sue est détesté à leurs 44 rangs. Et bien sûr, il y a sept colonnes. Pas très grand. Maintenant, nous avons ces données. C' est très facile à comprendre. Quel genre de détritus ? Mais quand vous étiez un scientifique de données sur vous êtes aller toe prédire conseil Alors il ne s'agit pas seulement regarder ces données. Andi, pense OK, maintenant je comprends que tu dois comprendre le comportement des données que c'était aussi suffisant. Les données sur la profondeur est affectée par Billy rebond total par un fumeur sont par jour après V voiture par temps, très déjeuner ou dîner. Notre côté de la partie, Ces choses que vous devez comprendre et cette compréhension de ces aspects après qu'il est appelé exploration de
données sur. C' est là que Seaborn est utile. Donc, tout d'abord, ce que vous devez faire dans de tels cas est de comprendre la distribution des données. Et pour ce faire, vous devez tracer le graphique de distribution. Dis simplement oui. Ennis Dart Dist ! Blot sur Def ! Le DF. Alors considérons l'objet entier. Vous hors de ces exercices, nous voulons orteil prédire la profondeur en fonction de certaines autres variables. Donc notre variable cible est profonde et il y a certaines caractéristiques variables dépendantes comme Billy mon propre sexe parlé. Oui, je sais quelle date est l'heure et la taille. Donc, la première chose que je vais faire est de comprendre que ces deux personnes après conseil dans cet
ensemble de données si c'est la distribution normale, est-ce que ce n'est pas normal. Distribue. Exécutons cette commande sur. Ici, tu y vas. C' est que le district n'était pas hors des données profondes sur il ressemble à une distribution normale. Si vous voyez une courbe de cloche comme celle-ci, c'est une distribution normale, plus ou moins. Ok, alors passons plus à côté. Je vais comprendre Veach hors de ces très du monde, affecter la bande autour le plus. Et pour comprendre que la meilleure chose est ce qu'on appelle la carte de la chaleur. La prochaine, nous allons dessiner la carte. Mais avant de dessiner la carte thermique, nous avons d'abord les orteils, assurez-vous que ces choses sont coordonnées. Alors allez, car c'est coordonné métriques Equus d si sombre pourrait le relier. Ensuite, on va aller aux pieds. Créez une carte de chaleur à ce sujet. Mesure corrélée. OK, touche la carte. Les médecins de base sur ça. Donc, c'est un tueur à succès. Il ne semble pas très informateur parce qu'il manque les chiffres ici pour ajouter le nombre que
vous dites un art qu'il a coûté à travers ici River. Maintenant, il y a des chiffres. Regardez le pourboire et ici. Vous voyez, bien
sûr, bout à bout sera un là Darvill trois l'un à l'autre. Mais parmi la facture totale et la taille, vous pouvez voir que le montant total de la facture affecte le plus que le côté sur. Pourquoi n'avons-nous pas obtenu d'autres variables comme celle-ci ? Est fumeur jour et tout cela parce que ce sont variable catégoriquement. Lorsque vous effectuez l'analyse des données scientifiques sur ces données, la première chose que vous ferez est de convertir cette variable catégorique en
variables médicales . Lorsque vous faites réellement ce genre d'analyses sur ces données, toute cette colonne sera des nombres. C' est pour ça qu'ils ne viennent pas ici. Mais le point est le nouveau dans l'analyse de la carte thermique. Vous comprendrez que votre variable cible est le plus affectée par la caractéristique de blé. Quand êtes-vous pouvez dire variable indépendante sur. Dans ce cas, il semble que le total affecte vraiment plus que le site. ai eu. Nous devons donc informer Merson de nos données. Jusqu' à présent, c'est la distribution normale sur le total. Vraiment montant sont fixes, le plus profond que la taille de la pièce. Très bien. Jusqu' à présent, si bien. Nous allons créer plus d'essence de visualisation sur qui nous donnera plus à l'intérieur à travers les données. Donc, à côté de visualiser est et nous allons créer est une intrigue. Je pense que le point mort est partie ? Et ici, nous allons être fiers. Notre axe X va être la facture totale. Pourquoi exes va être sur nos données. DF est très simple, Ok. Et ou ici ? Très bien. Donc on a sorti l'intrigue. Total Bill était si raide, mais ce n'est pas très clair. Je veux dire, ce n'est pas très instructif. Ajoutons quelques critères supplémentaires pour obtenir une information appropriée. Nous allons ajouter du temps de couleur. Ok, voyons voir. On y va maintenant. On a deux parcelles en fonction de l'heure. Eh bien, c'est l'heure du déjeuner ou du dîner. Bien. Prenons du travail. Non. Dites qui va fumer, nous aurons plus d'informateurs. Et en fonction de l'endroit où la personne Wasit fume ou non. Ok, maintenant on a différentes couleurs basées sur un fumeur. Oui ou non. On voit un modèle. Je vois un schéma linéaire ici dans les deux cas. Jusqu' à présent, si bien. Ajoutons de la taille. Aussi la taille de ces fléchettes. Ici, il sera plus grand sont les plus petits basés sur la prochaine fissure quotidienne. Chaque mention ici nous avons convaincu dans la taille des critères. On a une colonne ici, non ? Donc, en fonction de la taille de la fête
Visi, les différentes tailles hors du médecin. Et voilà. Plus la taille de la fête est grande, plus
les chiens sont grands ici. Donc, sur la base de ce graphique maintenant, je comprends que c'est un schéma linéaire car le total va augmenter, la quantité de tipi augmente. Et il y a certains Parton liés à savoir si les possibilités, fumeur ou non. Mais nous ne pouvions pas faire grand-chose ici pour comprendre que partiellement en main le jour pour créer une ligne
régressante basée sur les critères, qu'il
s'agisse d'une fumée ou non. Et faites ça aussi. Disons que les plus minces sont ici,
euh, euh, amenés et une fois de plus vraiment commencer avec X est la loi de torture. Très bien. Pourquoi est égal à profond ? Andi a fait, euh quête. Tu as un Ok, donc ils régression linéaire qu'on connaissait déjà, non ? Nous avons besoin d'un peu plus d'information. N' est-ce pas ? Ajoutez ces critères par rapport au temps égal. Donc nous devrons maintenant des graphiques basés sur le temps libre, le jour ou ici. OK, on a deux graphiques prêtés pour le dîner. Encore une fois. C' est toujours le même comportement, ce soit pour le déjeuner ou le dîner Italie près rebaptisé. Je veux comprendre s'il y a une différence de comportement en fonction de savoir si la personne
fumeur Wasit ou non, Ajoutons ceci. Ha ha ! Maintenant, je comprends que Regardons ça. Donc, le prouvé est une personne fumeur sur l'origine ah ici est non fumeur et il ya un modèle La personne qui nous fume Si le montant de la facture est moins, il donne re littéralement motif. Mais j'ai demandé La quantité de billy augmente le kun profond par le fumeur radi utilise par rapport à la personne avec Artie fumant. Donc maintenant, nous avons eu un très bon aperçu dans ces données basé sur si la personne est un fumeur ou pas jusqu'à présent, nous avons compris normal ces deux seins, le montant de pourboire est plus basé sur la volonté totale maintenant. Nous comprenons que si le montant de la facture est élevé, il est préférable de ne pas fumer. Si vous êtes à la recherche d'un bon conseil, nous allons plus. Ajoutons un peu plus avec leurs idées. Et cette fois, nous allons dessiner quelque chose qui s'appelle l'intrigue de chat. Nous avons compris qu'il y avait une différence de comportement. Y a-t-il une différence de comportement dans la quantité de tipi basée sur le jour de la semaine ? Pour comprendre cela, dessinons un autre type de chat. Ils disent X égal aujourd'hui. Andi, euh, pourquoi égal profond et données égal cher Lester et ce n'est pas fini mais moins Renate ou ici nous avons quelque chose. Ce n'est pas très propre. Alors mettons gentil Donc, dans ce lieu de sol, un rôle très important sur ici. Je vais dire gentil un peu. Faites-le. Tu vois mieux maintenant ? Cela me dit que le vendredi fait ah liste nombre de gens communion Onda pointe à Monte. Pas si élevé, mais le jeudi, la gamme de personnes qui sont donnés au dollar T, par
exemple, qui est élevé le samedi, ce peu confortable, mais la quantité profonde augmente comme peut-être beaucoup de gens viennent sur Sorties samedi et dimanche. Beaucoup de gens viennent, un regard de plus à l'intérieur. Ce sont le genre d'analyse que nous pouvons obtenir en fonction de différents types hors-graphique. Comme je l'ai dit, l'intrigue de chat de ce genre joue ici un rôle très important. Je peux changer l'orteil gentil Wilen, par
exemple,
ici, il aura l'air différent. Oh, ici. Donc le même genre d'information, mais c'est un coffre-fort différent. Mais de même, je ne peux pas changer la barre d'orteil sur ce sera. Donc, un autre type de bar de Ted Sieben est une très bonne bibliothèque de quand il s'agit d'
exploration à ce jour . Il y a plusieurs questions d'étiquettes à l'aide desquelles vous pouvez visualiser vos données et vous pouvez en obtenir un aperçu. Donc, avant de commencer à appliquer l'algorithme sur la formation, votre modèle et tout cela vous aide à comprendre les données avant que je ne termine. Si vous allez sur Google ici,
euh, voyez, voyez, Bond Battle and Library. C' est le site pour cette bibliothèque sur certains des exemples que j'ai bientôt ici était du site et vous pouvez aller explorer plus loin qui ont de très bons exemples ici. C' était à propos de la bibliothèque Seaborn. Et comment explorer vos données en utilisant cela ? Une bibliothèque. Je te verrai à la prochaine conférence.
10. Prétraitement des données: après l'expérience des données, et la face suivante est le pré-traitement des données. Rappelez-vous, les données que vous regardez vous sont lues en tant qu'humain. Mais quand vous envoyez ces données pour Messine et que vous devez les rendre lisibles sous stable par une machine sur machine, seulement les choses en termes de nombres, il ne comprend pas les variables catégoriques, les variables comme nous avions dans notre ensemble de données précédent, comme le déjeuner féminin masculin à l'heure du dîner, ce
genre de variables catégoriques qu'il ne comprend pas. Donc, à la partie du pré-traitement, vous devez le convertir en chiffres. Mais ce n'est qu'un élément de pré-traitement. Vous devez faire certaines autres choses dans le cadre du pré-traitement de vos données avant transmettre aux algorithmes d'apprentissage automatique. Alors commençons. Nous commencerons par importer des bibliothèques très importantes. 1er 1 bien sûr, est engourdi comme le député, et alors ne pas oublier nous étang comme PD sur Let's import Savon Très bon. Maintenant que vous avez importé toutes les bibliothèques importantes jusqu'à présent, laissez-nous d'abord à fort. Nos données à ce sujet seront la même ville de données que vous êtes dans la conférence précédente. Les cadeaux nous l'ont fait de, Oui, bibliothèque
de tennis. C' est là-bas. Oui. Puis je commence à charger à l'école. L' a fait sur le nom de l'ensemble de données. C' est approfondi. Ensuite, nous allons créer Banda Data Frame sur les données correspond à OPD fléchette, euh, libre sur, bien
sûr, Juste mettre des conseils ici qu'il a un nom. J' ai laissé le printemps de la tête des records de frappe. Donc les cartes Hayderi unifiées de l'ami des données pour que nous ayons le terrain que nous avons la
famille de données . Nous allons faire ce super bon travail nous a fait ? Il est prêt dans le cadre de pré-traitement. La première chose que nous faisons est de nous assurer qu'il n'y a pas de valeurs nulles comme il n'y a pas de
valeurs vides dans l'une de ces entités sont les variables cibles faire cela ? C' est un D des données vidéo de Nom est Non. Donc, ce sera oui et non ne l'a pas fait. Donc, il dit 000 Cela signifie qu'il n'y a pas d'enregistrements indiquent un cadre qui n'a pas de valeurs, donc tous ont une certaine valeur. Très bien. S' il existe une colonne qui n'a aucune valeur, vous devez prendre une décision. Comment pensez-vous que cette colonne comme si vous mettez un nombre rouge sont vous juste ignorer leur carte. Cela dépend du cas par cas. Normalement, ce n'est pas une statistique que vous ignorez cet enregistrement, mais certains cas, il n'est pas suggéré que vous êtes populaire avec la valeur moyenne. Donc, vous devez étudier les données au cours de leur impôt progressif sur, puis décider. Comment pensez-vous que les données manquantes ? Et nous allons le faire pour leur vers le bas dans notre projet. Pour l'instant. Rappelez-vous, il ne devrait pas y avoir quoi que ce soit. Non, allons-y plus. prochain visage est orteil, comprendre quel genre ? Après cela, vous avez décrit vos données et ici il le fera. Donc, vous l'analyse statistique de vos données comme combien y a-t-il à 44 lignes ? Y a-t-il le moyen de sortir de la date ? J' ai étalé l'athéisme sur tous les autres détails. Genre. Faites-vous dans 1.3 que avec la date du moteur les détails se rapprochent pas très loin les uns des autres. C' est juste garder juste que la valeur moyenne de BP 2.99 mais vous pouvez obtenir le même type d'analyse. L' analyse statistique pour toutes les variables profondes est votre variable cible, Mais vous pouvez également obtenir ces entités pour chaque variable chaque entité, chaque variable cible dans ce bloc de données. Et pour ce faire, dites votre renommée de données, puis décrivez et ici vous travaillez. Il vous donne l'analyse statistique de tous les nouveaux médicaux s'est très bien passé. Allons passer à autre chose, mon ami. Voici le vrai plaisir. Le traitement des données réelles un début avec une carte de bibliothèque encore à l'échelle de, euh, donc c'est K un point être traité à partir de cette bibliothèque sit off. Vous importez le fonds puisque vous avez besoin de la première chose que vous devez faire est de convertir toutes ces variables
catégoriques en nombres. Et pour cela, c'est l'étiquette en quarts. Voyons ce que ça fait. Oui, c' est ça. D' accord. Étiquette Gorder le F est égal à leur ordre de travail. Ok, on a la distance et maintenant moins au tribunal. Les caractéristiques Commençons par le sexe. Ici, vous voyez un mâle femelle. Convertissez-le en un nombre numérique, qui est appelé y compris ainsi de suite. Le commun pour cela, c'est le travail. En quart sur disco Teoh, Dark fit soulignait la transformation sur DF sur le même. Donc la colonne de sexe va être transformée en utilisant l'étiquette en quart. Laissons ça et asseyez-vous pour le coup de point F. Et voilà. Ça a changé de sexe masculin. Il est devenu zéro et un sur. Sur cette base, vous pouvez dire qu'il a remplacé la femelle par zéro et l'envoyer un. Maintenant, l'algorithme d'apprentissage incontournable peut comprendre cette colonne. De même, nous avons toutes les autres variables. Faisons ça. Un fumeur dessus c'est plus, n'est-ce pas ? Je comprends. Si vous êtes doué dans le combat, vous comprendrez cela. Au lieu de cela, après avoir écrit ET individuellement, je pourrais utiliser une boucle et je pourrais le faire facilement en une seule ligne à venir. Mais je ne veux pas que tu te compliques. Tu peux faire mieux avec Martin ? Je ne te considère pas comme un combat comme un expert pour le moment. C' est pourquoi je me concentre davantage sur ce que vous pouvez faire dans l'apprentissage automatique avec des
commandes très simples . Même si c'est plus d'une nuit de congé, vous pouvez honnêtement l'améliorer pour le dans votre vie réelle en utilisant le combattant nos
outils prisonniers comme le bleu et tout ça. Bien sûr, il a dû apprendre à mordre, mais pour devenir un scientifique des données, vous n'avez pas besoin d'être expert après avoir combattu alors écoutez un. Oh, ici. Très bien. Maintenant, vous voyez, toutes ces variables sont remplacées par des valeurs numériques. Il est encore la trame de données encore Banda état de lui et il détient toujours la même structure. Juste que les valeurs,
les variables catégoriques Arctic placé avec des nombres. Et maintenant, votre algorithme de machine comprendra le genre de pré-traitement que vous devez
faire avant de décider. Enregistré dans le Richter précédent quand nous parlions de la carte de chaleur, nous avons vu que la carte de succès ne considérait que peu de colonnes, comme le total des bandes construction profonde et la taille sur elle ne tenait pas compte des variables catégoriques . Maintenant, nous avons converti ces variables catégoriques en remorquage. Les nombres numériques moins créent la même carte de chaleur maintenant, et voyons ce qui se passe. Ok, donc quelqu'un à cette fois où nous allons orteils créer notre quantité de frappes sont soulignés. Mon assiette, c'est Cornelius et les métriques étaient sécurité parce que le DF fléchette Cory, écoutez et il est de créer la carte thermique et les données, bien
sûr. Sentez nos médecins. Non, parce que et voilà. Maintenant, il a toutes les fonctionnalités qui est juste. Il a tout. Et à ce stade, si vous regardez cela,
vous voyez, vous voyez, pour les pourboires total facture a le plus grand nombre. Donc, la pointe est encore est affectée le plus par la fille. William me semble logique parce que si vous êtes torturé, le montant est élevé. Votre montant sera élevé sur la raison pour laquelle il est affecté négativement par le jour et l'heure sur la facture
totale totale, la variabilité suivante la plus affectée est la taille. Il est affecté par six et un fumeur aussi positivement. Mais le fumeur est celui qui affecte l'Italie netting Vous diviserez vos données en fonction des valeurs
présentées et de la variable cible Ici. La variable cible est le tiptoe obtient un nom de variable cible. Pourquoi sur vous allez orteil avoir des plongeages dans ces cible variable dentelle blanche imprimé y point frappé Et ici vous allez Tous les conseils sont là sur le repos hors du champ Vous allez mettre comme une caractéristique que si x sur juste ADF sur votre bon orteil. Déposez la variable cible active. C' est un qui avec vous Considérez tous ceux Vous êtes juste en déposant un hors du champ et qu' il est profond et repos après bloc de données. Vous attribuez comme l'avenir qui vient de comprendre cela et cette impression votre point supplémentaire frappé Très bon. Quand c'est génial. Maintenant tu as ton ex. Tu as ton pourquoi ? Sur la prochaine, vous allez bout diviser vos données complètes dans le remorquage. Les données de formation sur la formation de données testées que je vais être utilisé par vos données de train orteil moderne lui-même afin qu'il puisse décider le meilleur coefficient sont basés sur moderne pour vous. Et une fois qu'il a décidé meilleur modèle à utiliser basé sur le train mieux il utilisera les
données de test orteil Goûtez ce modèle si vous
êtes confus, ne vous inquiétez pas, il deviendra clair quand nous faisons le projet. Mais pour l'instant comprendre ? J' ai dit que les personnes qui évaluent les étapes à suivre divisent vos données en données d'entraînement et les testent. Donc, nous allons faire que jusqu'à présent est la division rotateur dans le remorquage ? Rencontres. Mettez-vous sur testé. Tu allais importer un cours à partir de la bibliothèque
Killer ? Oui. Skillon Dark meurtre L'importation de la victime Dean, je respecte juste quand vous allez vous dire 16 choix. Pourquoi avez-vous pourquoi ? Dist demande Stain dist ! C' est des knicks de botte. Ou ici. Vous allez dire que la taille de Desta comme sur la taille de données souvent complète. Combien vous voulez mettre pour tester combien vous voulez mettre l'entraînement des orteils ? C' est à vous de décider et il est soumis aux données. Mais normalement, comme une chute, on voit que les gens suivent 80 20. Ils ont mis 80 % de données pour l'ensemble d'entraînement et 20 % de données. Père pour les testicules. Il Donc, nous allons trouver deux très bons moins imprimés ce printemps. Les cassettes disent que vous n'avez pas à apporter la complète. Tu ne viens pas ici. Donc c'est un gros. C' est 2 40 photos, non ? Imprimons la théière Data Street. Ok, je pense qu'ils sont assez bons Mort, vraiment ? Il peut il est assez de données dans les données de test et Tren, par
exemple, l'extra et a gagné 95 lignes et des colonnes sûres. Bien sûr, il y a eu donc 123456 Et il s 1 95 rangs divisés en 44 rangs en 1 95 aller l'
entraînement des orteils et 49 aller tester. De même, pour la garniture blanche, il a mis 1 95 lignes de formation des orteils et 49 à Donc, c'est à peu près ce que vous faites dans le
pré-traitement des données ? Y a-t-il d'autres complications comme l'étiquette incluse ne suffira pas. Vous avez remorqué utiliser un cœur par quart. Parce que si vous utilisez l'étiquette en trimestre seulement alors cela nous donne des numéros gentils. Qu' est-ce qu'on peut regarder de différentes manières, non ? Si c'est zéro et un, vous pouvez aussi dire que zéro a une préférence plus élevée que celle qui n'est pas correcte, est-ce pas ? De la même façon, il pourrait y avoir d'autres données. Donc orteil, se remettre de ce genre d'analyse biaisée sont compliques est ce que l'apprentissage automatique sont grands de mon orteil d'entraînement. Vous allez faire un cœur par trimestre, bien que certaines choses que nous ferons notre pendant le projet. Je ne veux pas compliquer les choses en ce moment. Il s'agit du traitement des données de base. Tu fais pour plus de trucs. Projet d'apprentissage automatique. Pour l'instant, il
s'agit de pré-traitement des données dans l'apprentissage automatique pour vous. Oh, avant d'aller laisser entrer le nom ici avec la foudre. fait, euh trois. Il est génial. Je te verrai dans éclectique
11. SimpleLinearRegressionExplanation: Bonjour, là. C' est le bon moment pour parler d'un autre type d'algorithme d'apprentissage automatique lorsque nous parlons d'algorithmes d'apprentissage automatique. Le premier 1 pour commencer est une diminution linéaire simple. Qu' est-ce qui régresse ? Vous triez d'abord, comprenez le sens de régressif. Si vous regardez dans le dictionnaire anglais, la signification de régresser. La signification statistique off régressive est une mesure après relation entre la valeur
moyenne une variable sur les valeurs correspondantes d'autres variables. Alors, restons-en à ça. C' est une relation avec la valeur moyenne d'une variable, avec la valeur correspondante hors autre vidéo. Plus encore, chez les électeurs précédents, vous avez exploré les données sur le prétraitement des données. En ce qu'il a vu ce graphique éteint. Pourquoi son ex était-ce un complot dispersé ? Dans le cas hors données Tibbs asseoir DeVivo étapes autour d'un dilemme total ex waas. La prochaine étape de l'algorithme d'apprentissage automatique est orteil. Prédire un comportement basé sur ces points sur l'embarcation. Vous devez prédire ce qui s'est passé ensuite. La façon dont ce point ressemble ressemble à ça va être un croissant linéaire re. Donc, si je dessine une ligne, on pourrait prédire la tendance. Tout ça va suivre. Le point critique ici est de comprendre que Veach Line est une ligne correcte. Dans ce cas, la ligne peut être soit cette ligne. Est-il peut avec cette ligne ou il peut. Avec cette terre, il est toujours en ligne droite. Tout cela semble correct. Comment savons-nous qu'un rituel est optimal ? Lequel est la meilleure ligne ? Lequel poursuit la tendance ? façon la plus optimale de savoir qu'il ya quelque chose appelé mathématique moins Esquire . Cela signifie que vous prenez une de ces lignes et ensuite vous dessinez des lignes verticales à partir de votre ligne de tendance afin que le vainqueur réel soit comme votre plus large sur. Ensuite, vous pouvez effacer cette différence et prendre un écuyer après la différence. Pour chacun de ces points et prendre un total de cela. Le total off qui est choeur après différence. compagnies aériennes vidéo ont le moins total qui a obtenu le moins Esquire. Approximative n'est pas la ligne, au moins total est la ligne correcte et la lumière la plus optimale. Donc c'est comme ça que je décrive en mots quand il s'agit de machine learning, vous devez le formuler,
et c' est la formule derrière laquelle vous devez trouver les coefficients cette rangée occupée, ce V zéro et Beavan est ce que vous avez dû trouver orteil dessiner la lumière optimale sur ce est la formule
mathématique pour trouver ce bizarro et même dans la description du sélecteur, vous trouverez le lien. Très vous pouvez aller et lire les détails derrière comment ce pilote mathématique Formule 1. Mais pour ce recteur, comprenons que c'est une formule mathématique. Vous devez nourrir votre orteil d'apprentissage musculaire. Être capable de calculer les coefficients de bizarro et de Beaven sur, puis trotté à maligne. Comment on a fait ? Je suis tranquille ? Il est oui, x y biais xx Quelle est leur façon de sexe ? Oui, X Y est le puissant Bricusse. Et après la différence entre XX est et pourquoi exes hors de votre tendance Un point réel sur ? Oui, sauf est Esquire de la différence de la valeur X entre la ligne de train et le point réel . Et c'est votre Beaven. Une fois que vous obtenez le Beaven, le B zéro est facilement occupé. Soulevez y moins B un dedans. Vous comprendrez cela en termes plus de trois ans lorsque nous allons droit par 10 programme avec cette formule sur. Nous allons utiliser cela pour le programme mordre pour tracer la ligne de train pour le même état de données sur montant
total de la facture et des falaises. Je te verrai à la prochaine conférence.
12. SimpleLinearRegressionProgram le programme: Bonjour là. Bienvenue orteil cette conférence. Maintenant que vous comprenez ce qui est une régression linéaire simple sur les formules mathématiques l'impliquant , Laissez-nous écrire notre premier combat et programme, qui va mettre en œuvre un algorithme de régression linéaire simple sur ce sujet. On va à partir de zéro. Nous allons écrire l'algorithme complet dans notre combat et notre programme. En tant que data scientist, vous n'avez normalement pas à le faire car il y a des bibliothèques de niveau. Vous n'avez qu'à appeler cette bibliothèque, et nous le ferons. Vas-y. Mais passons par cette conférence sur Laissez-nous faire cela par nous-mêmes afin que vous compreniez et appréciez les complexités ainsi que vous comprendrez un combattant enchantant. Alors commençons le premier cap, bien
sûr. Écrivez ce que vous voulez continuer, alors. Prochaine étape. Tu le sais déjà. Oui, tu as raison. Importer la bibliothèque soit un Tempe sous PT Matt Block et je ne suis pas un à Dft sur l'importation personnes sur son dans un état d'aube, non ? huit prochaines instructions sur la première fonction que nous allons écrire est de trouver les falaises. C' est ce bizarro et Beaven. Et voici notre premier Fox et trouver Griff, il passera X et écrira. Avec cette fonction, il nous retiendra rapidement et selon peut être sacrément taille. Cette commande va nous donner la taille de l'ensemble de données sur. Ensuite, vous allez trouver la valeur moyenne Victor. Étendez le chemin. Cela ont des commandes GNB normales que vous avez déjà appris est quand nous parlions de normal et les bibliothèques. Donc, je n'ai pas orteil délibéré à ce sujet à nouveau. Vous savez déjà que ces choses entravent l'art signifie tout à fait sur. Ensuite, nous allons orteil, calculer le oui XX et oui, x Y je me souviens que le B est égal. Faites x y par xx et ici nous allons calculer oui, x y et oui, XX s ex femme. Disons que cela va être et Pete sont certains de X en y moins et c'est la taille ici en moyenne X en moyenne droite sur. De même, s XX va être MP chien pouce off. Si X et X moins yen en je veux dire sur x deux, je veux dire hors et maintenant il est temps de calculer le coefficient. Super. Alors qu'est-ce que c'est ? B un est égal à s ex femme par S. XX sur occupé. Qui va être égal ? Je veux dire pourquoi ? Moins même en moyenne X ? Tu te souviens de la définition de Grayson libre ? Retournez et vérifiez ce qu'après David est assez régressant et vous comprendrez ce que nous
faisons ici. D' accord ? Sur leur fonction va nous retourner B zéro. Andi. Très bien. On a le coefficient. Donc la prochaine fonction va être beaucoup comploter leurs regrets dans la vie. Ok, écrivons notre tracé constant des orteils. Très chrétien comme Donc nous allons appeler un BLT. Le soulignement régresse sur cette ligne de pointage ici. On va passer X. Et b la zone qui aidera le visiteur et être en mesure de parti aligné La ligne régressive dont
vous avez besoin définir la valeur X mis en marche. Pourquoi ? Valeurs et les coefficients B zéro et être pair. Ce sont toutes des arrestations. Ce ne sont pas des valeurs individuelles. Le bétail est coupable. Donc tu vas au sang. Le est bloqué. Premier cours X. Pourquoi la couleur ? Allons le est m. Ok sur puis marqueurs. Voyons si notre favori de la famille sur la taille de la Marcus a laissé leur technique ok et puis je prédis, non ? Ceci est la valeur prédite désactivée. Pourquoi ? Parce que sur votre ligne de train, les valeurs
Divi sont des valeurs prédites, n'est-ce pas ? Alors pourquoi devis b zéro coefficient b plus Beavan sur leur nous voulons et puis X Et maintenant il est temps de tracer E Grayson, vous avez X. Vous avez y poétique et ont été prédites valeurs. Et vous avez bizarro et être quand vous êtes rapide depuis maintenant vous pouvez bloquer l'année de tir Teeter plot X y tresse et il est une couleur Son sur la base a été livré lance Tito voisins étaient carte morte sur barbu sont pourquoi vous avez eu droit. Et puis le produit pour donc vous avez juste à voir construit sur. Donc très bonne vidéo aux fonctions Vous voulez calculer le coefficient sur d'autres Pour tirer les regrets dans la vie Nous avons terminé maintenant nous avons juste à écrire la fonction principale et appeler ce péage. C' est très facile. Maintenant, nous allons écrire le oh, a fait cette sous-rubrique cherchant à hacher ici. D' accord. Et ils voient Margo très bon sur il est temps d'appeler la fonction principale Très bon. C' est vrai. La fonction principale. Je ne peux plus tenir mon excitation. Ok, méchant sur nous allons utiliser les mêmes conseils. Ensemble de données. Je sais que vous êtes très excité à ce sujet. Alors allons-y. Finissons,
Seigneur,
Il Seigneur, a dit plongeon sur l'Inde. PD fréquent. Non, j'ai fait de la crème profonde. C' est tout un plongeon. Vos conseils et apportons la tête pour que nous sachions que nous avons bien compris. D' accord. Prochaines sont nos hors des raisons choisit le F Alors qu'est-ce que X ? Parce qu'il s'agit d'une régression linéaire simple. Nous ne pouvons avoir qu'une seule variable indépendante ou nous allons dire à sa fille Bill pourquoi il va devenir DF. Et ensuite, on va appeler notre femme estimée, c'est
quoi ça ? Va ici. Trouvez rapidement pour être égal. Trouve la tombe sur Jim Path X et juste sur. Puis bloqué l'endroit en ligne. Et on est là. Nous allons appeler notre bière D rigoureux et fonction de ligne. Andi X Y. et on est maintenant normal si ça m'a bien fermé, on a fini. Laissons-le maintenant. Et nous y voilà. Digress de l'heure. Et neuf. Donc c'est ce qu'il faut. Remorquage créer un algorithme dans l'orteil de combat. Avoir vos regrets simples de ligue dans la vie. Je sais ce que tu penses. Tu dois penser. Mais j'ai dit que tu ne l'avais pas fait. Nous combattons un orteil expert, devenons des scientifiques des données. Est-ce que Massie apprend ? Professionnel ? En fait, j'avais raison. Vous n'avez pas besoin d'écrire cet algorithme à partir de zéro. Ils vous attendent déjà. Il y a des bibliothèques de combat qui sont déjà conservées qui ont déjà ce
bâtiment d'algorithme . Tu dois juste appeler cette bibliothèque. Je vous conduirai à travers une telle bibliothèque. En fait, vous avez déjà vu cette bibliothèque quand on parlait d'économiser. Il existe diverses bibliothèques de ce type. Mais regardons celui-là. C' est mon préféré. C' est Farsi croit rechristen linéaire sur elle est fournie par Sieben. Donc ils disent dans l'année. Kristen, tu vois C pion ce soir, bébé ou ici, tu dois juste en monter un. Allez, vous devez écrire juste un simple Come on. Prenons le même jour le fait ici. Ok, cette fois, il y en a un sur la simple commande de faire toutes ces choses est la dissonance. Commencez un membre, le bloc ex record, bière totale des
orteils. Et pourquoi aller au fond sur la date ? Je pourrais orner le téléphone. Juste ce 19 Allez et vous aurez le même dur. Ici, tu y vas. Exactement la même ligne de régression linéaire. La ligne simple, mais juste une commande et qui est la beauté hors bâtiment, combat et bibliothèque au cours de ce cours étaient très possibles. Nous allons utiliser la construction de bibliothèques déjà ou niveau fightin pour vous. Andi, c'est ça. C' est la fin de cette conférence. Suivant. Plus tard, on va utiliser quelque chose. Vous pouvez vous rapporter au monde réel mieux que ces conseils base de données sur. Allez-vous utiliser un simple rebaptisé linéaire sur cet exemple du monde réel ? données du monde réel sont assis. Et après cela, nous allons passer à différents algorithmes et jouer avec différents combats et bibliothèques sont donc je vais vous voir dans la prochaine conférence.
13. Démo de profondeur de surface de surface linéaire simple étape 1: Bonjour. Il viendra à cette conférence dans ce Lecter. Nous allons mettre en œuvre un régressage linéaire simple. Mais cette fois, nous allons utiliser la bibliothèque fournie par fightin. Nous n'allons pas écrire notre propre algorithme. Nous allons utiliser la morsure et la bibliothèque fournie, et nous allons mesurer le score. Le score des performances pour ce modèle pour s'assurer qu'il fonctionne. Commençons. La première cassette, comme vous
le savez, définit ce que nous allons faire. Alors, allons-y. Le titre. Simple en toi, Chris. Et vous l'avez fait ? Andi Et oui, je sais ce que j'allais faire. C' est sur la prochaine. Importer moins les bibliothèques d'importation. Non, B hey peut être importé. Fonda's a pitié de l'importation. Si bon comme dans la Terre et demandé, mais pas moins très important. Importer un complot fou ici. Ivy ne soit pas une façon. La pureté du sang est grande. Maintenant, nous convenons, récupérez notre ensemble de données. Données alimentaires Marché de l'État Verrouiller la source après jour. Est-ce que c'est ça ? Vous trouverez dans la description de cette conférence. Il suffit de télécharger ces données. Asseyez-vous quelque part sur votre ordinateur et puis vous tolérez cette commande pour que le bloc
de données pandas lise ce combat, sera un fichier texte e d dot Même si c'est un fichier texte, vous direz quand même le soulignement CS trois de Billy Darcy sont et mettez la partie où vous avez dit le fichier Le nom du fichier est Bill DJ stories, pas txt. Livrer les mangeurs. Tu devrais mettre comme mon stress de base. Oui, et plus et fermez-le. C' est ça. Sur désespérée Deif tête pour s'assurer qu'il est là dans le tohave à moins de louer il très bon. Donc, ils meurent là, il est fondamentalement les données sur les hauteurs du bâtiment ou des histoires sensibles ces autres années sur DA Ceci est juste un recueille assez de données Et c'est l'ensemble de données qu'ils ont créé pour diverses années. Vous voyez comment Maney a opté pour des raisons qu'il y a d après les moutons 60. Donc il y a 60 observations qu'ils ont Ah, c'est vrai. De 9 19 années 90 à plusieurs autres années, ils ont effectivement criminalisé hauteur hors des bâtiments étaient des histoires sexy. Quelle est la première chose que vous Jake dans l'exploration de données ? Prendre la sécurité est également une partie après la règle fiscale ne l'est pas. Nous avons déjà commencé. Détecter que les
planchers planchers ont explosé. Ok, donc maintenant nous sommes dans dicter explicitement Step. J' ai déjà vérifié le coffre-fort et je sais qu'il y a 60 observations. Ensuite, nous allons vérifier s'il y a des valeurs nulles. Et venez pour que DF n'est pas sur si génial. Il y a des valeurs normales. Le Hyatt, des histoires ? Les données que nous allons jouer sont déjà des données numériques. Donc, nous n'avons pas orteil encoder. C' est un ist. Si nous n'avons pas à faire ensuite, nous allons voir quel genre de légumes et il a. Il devrait avoir des distributions normales et pour nous d'utiliser Lini recrée un algorithme et une commande pour que vous le savez déjà. Oui, assez pour que ce soit Eban dist apporté dessus. T h t et ensuite être médecin. Très bien. Ici, tu y vas. Il a l'air de distributions très normales. Il y a quelques anomalies ici, mais on peut l'ignorer pour l'instant. Alors, qu'est-ce que c'est ? Regarde, distribution
normale. Bonne nouvelle. Maintenant que nous savons que c'est un Wilson normalisé, nous allons vérifier le genre de relation entre la hauteur, des histoires ? Aping la plus fraîche qui est de dessiner. Je disperser les produits étaient bons. Disons point ou deux. Et ici, nous allons la relation dispersée. Il ressemble à une diminution linéaire normale et
simple de la hauteur augmente avec leurs histoires afin que nous puissions jouer autour et utiliser une régression linéaire simple. Ok, je pense qu'on a assez d'informations sur les données. Maintenant, on peut passer à la face suivante. C' est le prétraitement des données. Ils ont jusqu'au traitement. Peut-être qu'on est balisés. Mais après le pré-traitement ont d'abord commencé à prier les données à partir des données dans l'oeuf et pourquoi nous allons prédire le nombre d'étages que le bâtiment peut avoir sur la
base de sa hauteur. Donc, la variable X va être cachée. Et alors pourquoi va être le nombre d'étages ? Toi jusqu'à présent, si bon Vous avez attrapé les X et Y avant de passer à autre chose et avant de diviser ce X et la femme sont là pour former et dater la date car il faut les convertir en NPR A. À ce stade, ils sont dans l'État de Banda. Un cadre pour que vous puissiez utiliser s Kaylan algorithme de régression linéaire simple. Vous devez les convertir orteil np ery sur. Il est très facile juste orteil fermer cette année, puis dire des valeurs. Je fais tout à fait la même chose pour l'autre croisière et dire des valeurs. Jusqu' à présent, si bien. Ensuite, nous allons exploiter l'ensemble de données dans les données de train et de test En l'état, la douleur et le goût le découragent de sa sélection de modèle Kalen Dart. Importer le grain décalé et ramasse maintenant 10 x Juste pourquoi la douleur ? Pourquoi ça va être Dean ? Goût Desperate X et pourquoi plat pour sauver Il va être 0.2 sur un état aléatoire va être zéro sur ce pick-Chain X. Juste pourquoi l'équipe ? Pourquoi juste dans ce voyage ? Très bien. Donc on a les données ici. C' est bon. Donc, au lieu de tout louer, nous aurions pu juste décider de l'éducation aux médias d'Etat. Non, si 48 étaient 48. Eh bien, génial. Jusqu' à présent, si bon à côté d'être va faire le modèle de sélection de données pré traitement est tour. Il est temps de choisir le moderne, et c'est là que la partie critique de sélection actuelle de l'alcool Italie étoiles basé sur ce que nous avons vu jusqu'à présent est une distribution simple. Et il y a une relation rechristen linéaire entre la peau. Toutes les histoires. Si l'on augmente la valeur de l'autre augmente également, donc c'est une génétique simple, vraiment, puisque c'est donc nous allons utiliser un modèle de régression linéaire simple. Et le modèle de régression linéaire simple va orteil viennent de SK. Apprendre de Eskil, Puis sombre, années
maigres Mordor il a déménagé et dans l'air, Grèce, ici. Ils sont toujours là. Cliquez dessus se ferme encore dans la raison. Ok, donc maintenant la prochaine chose est de vider le moderne dans le mortier. Pourquoi avons-nous besoin de traiter dans le mortier ? Une idée ? Pensez-y. Il est quelque chose de religion orteil calculer le coefficient et blanc trompeur.
14. Démo de profondeur de surface de surface linéaire simple étape 2: Pourquoi devons-nous fournir des données de formation ? Mettez le pied ce modèle ? Pensez-y. Oui, tu l'as. L' algorithme est là, mais chaque simple, n'importe quel regret et a ses propres coefficients. Pourquoi intercepter et son propre Beaven ? Le Ruby occupé quand nous parlions de droit sur cet arabe occupé même peut être calculé uniquement sur la base des données. C' est pourquoi vous fournissez des données de formation, ledit orteil ce modèle afin qu'il puisse calculer les péchés graves pour vos données. On va apporter à ces Griff et on va faire ce poisson épinglé depuis l'interception sur le commun car c'est l'interception linéaire sur le prochain est Print Griff et
voyons l'officiant grave même sur vous pouvez obtenir le conseil ingley presque malade, pas démissionner si grave à l'école. Voyons voir ici nous avons les valeurs voleur que j'intercepte dans ce cas est moins 2.5 sur la tente
falaise est 0.7 il donc votre modèle est prêt. Votre bibliothèque beytin a tendu ça avec vos données et il a retourné le coefficient sur intéressé. Cela signifie qu'il a obtenu cette diminution ici y égale moins 2,55 65 plus zéro. Tu le supposes pour une mort supplémentaire, Equis. Et il a dérivé pour vos données. Ensuite, nous allons tester ces coefficients orteils, ce modèle linéaire, quiz
vertigineux et en fournissant le testé est que c'est pourquoi nous divisons L'ensemble de données du train était de former le modèle afin qu'il puisse calculer les coefficients et goûté tel qu'il est pour le tester . Que ce coefficient que mon interception qu'il a calculé, vous donne les valeurs correctes à gauche. Avec ça, nous allons prédire les valeurs y. Pourquoi demander le pain dans l'année zik dot Predict sur X dissed. Nous devons voir la question Maintenant, nous fournissons des données X ici et ça va nous donner le Y à
ce sujet . Pourquoi ? Nous allons nous appeler. Pourquoi prédire Licitra Et alors nous serons en mesure de comparer cette capacité. Dart nous disperse. Ils se dispersent sur Next nous allons orteils tracer la ligne régressante avec X juste et pourquoi
bien joué et donc ce Let's run from here Go ! Ils disent que la couleur est égale au rouge Maintenant, nous avons ce blanc valeurs prédites Cette ligne rouge est basée sur la raison pour laquelle les valeurs prédites et ça a l'air très
bien, non ? Il va entre les fléchettes dispersées. On dirait qu'il est capable de prédire le comportement. Si ce n'est pas très clair avec un graphique, nous allons à la pointe, comparez les valeurs. Comparons la raison pour laquelle les valeurs prédites avec les valeurs de test blanches. Et puis nous le saurons. OK, alors disons que le F va être BD fléchettes a fait, euh, thème. Nous allons avoir des valeurs réelles, c'est pourquoi le test et que nous allons nous comparer avec la valeur prédictive
prévue va être. Pourquoi Underscore prédit ici pret sur. Maintenant, amenons à ce cher téléphone et comparons 70 à 69 sur ce grand étaient Teddy voulait 2130 54 55. C' est assez proche. Les valeurs prédictives sont assez proches des valeurs réelles. Vous savez ce que ce faire à part graphique qui nous fera qui lui donnerait une plus grande clarté, donc je dois égal à la tête F un point ont 15 portes sur cette parcelle. Il ils ne doivent pas tracer genre est bar sur. Alors, ce sont les chiffres. Cinq est 16 10 sur la prochaine juste mettre la mesure et mineure obtenir des lignes à la même chose pour les lignes
mineures. Pour les lignes mineures. Oui, une mine. C' est là, Andi dessus. Une sorte ici. Maintenant, vous pouvez comparer. C' est très propre en ce moment. Vous pouvez voir le réel ci-dessous. Les bleus sont des valeurs réelles. Et notre personne n'est pas prévisible. Oui, plutôt bien aussi. On dirait que notre modèle fonctionne. Il est capable de prédire les histoires sur le bâtiment en fonction de sa hauteur, mais ce n'est que les 15 points de données comparés. Comment pouvons-nous être sûrs que l'ensemble moderne pour les 60 enregistrements 60 observations est très efficace et qu'il va orteil prédire correctement pour les données futures. Alors, comment pouvons-nous aplanir votre que le modèle de données que nous avons créé les coefficients et la raison l'
interception est devenue de lui et les secrets et nous sommes venus de lui fonctionne effectivement bien pour l' pour laquellel'
interception est devenue de lui et les secrets et nous sommes venus de lui fonctionne effectivement bien pour l'
ensemble des données de 60 observation. Donc, pour ce faire, il y a quelque chose qui s'appelle les métriques. Vous pouvez toujours calculer les performances de votre modèle pour Matic. Vous allez importer les orteils, la métrique est admise. Donc, si
vous tuez, vous allez importer des médecins de son meurtre des artistes modernes. Nous étions, je parlais de sa voiture sont à son noyau. C' est aussi appelé modèle Score que nous allons utiliser sont à l'école de ses médecins tueurs. C' est tuer l'importation de garde sont deux points soulignés. Nous allons faire en sorte que leurs quelques mots signifient des significations plus tardives absolues. Plus silencieux. Ils sont pour escorter. Imprimantons pour marquer d'abord. Le sprint est terminé avec l'école, et le commun pour cela est notre de souligner le score sur alors, ou ici vous mettez le blanc juste une valeur. Et alors pourquoi prédit ? Eh bien, très bien. Moins imprimé. Le score de l'artère est de 84%. Pas mal. Ce n'est pas un accident. Vous pouvez toujours améliorer cela, mais 84% du score décent. Et cela dépend aussi du type de données. Si vous parlez à un spécialiste des données, il y a une opinion partagée à ce sujet. Certains hors des données. Les scientifiques croient que lorsqu'il s'agit de régression linéaire, modèle n'est pas seulement l'art avec la cour, qui en fait source la performance hors de votre modèle. Vous devez également regarder les significations plus calme et racine signifie Il est tout à fait une liste. Calculer que sur le très à calculer qui est, vous allez juste appeler ce début métrique signifie repos absolu et la fierté de l assemblé. Pourquoi dissed sur le chemin ? Je veux dire, absolu plus tard est 4.1. Ok, ensuite on va imprimer les orteils. Je veux dire, c'est calme. Autre sur Encore une fois, il va être fait six points signifie qu'il l'a acquis si pourquoi dist sur le chemin un peu. Je veux dire, c'est la qualité 31, quand c'est impoli de dire c'est calme. L' inquiétude en PDR a annulé le sens de chef d'escouade. Donc, ce sont la métrique par laquelle vous pouvez enregistrer l'intérieur. La performance moderne est bonne ou pas. Ce sont tous en termes statistiques et je vais mettre électorale mettre une planification détaillée de produit chacun après oh avant le plus N'oublions pas de sauvegarder le carnet avec les
noms propres . Au fait, vous avez confiné chacun de ces cahiers quoi que j'écris ici, tous ces cahiers Jupiter sont là sur mon espoir. Je vais également mettre le lien orteil le lever sur la description de certaines des conférences. Très bien. Je te verrai à la prochaine conférence
15. Introduction à plusieurs regression linéaires: Bonjour là. Bienvenue dans la régression linéaire multiple. Félicitations pour la finition. Simple. Leader la régression et moderne dans le modèle de régression linéaire simple. Vous avez compris que les données sont dispersées. La variable indépendante sur variable dépendante peut être reliée par une équation Très dépendante . Variable est orteil égal. Pourquoi intercepter plus coefficient sur variable indépendante ? C' est une formule très simple pour tenir dans les données si votre projet sur lequel notre étude de cas sur laquelle vous
travaillez n'a qu'une variable indépendante sur vous prédites notre variable dépendante basée sur une seule variable indépendante sur la question semble linéaire. Alors tu as de la chance. Vous pouvez faire rechristen linéaire simple et obtenir votre assistant NL. Obtenez vos prédictions sous, mais généralement vous pourriez finir dans des projets comme celui-ci. Je prends l'exemple hors prix de la maison ici, donc le prix de la maison dépend de diverses caractéristiques. L' un des futurs pourrait être le revenu familial. Quel est le revenu familial des personnes qui quittent cette localité ? À mesure que le revenu familial augmente, l'abordabilité augmente, de sorte que le prix du logement pourrait être élevé dans cette localité. Le revenu familial moyen est élevé, donc les prix peuvent être cachés. C' est la sagesse des merveilles. Deuxième caractéristique. Ça dépend peut-être de ses commodités. S' il y a de très bonnes prestations de travail, alors oui, les prix des maisons pourraient grimper. De même. Crime il si le taux de criminalité est élevé dans cette localité que les prix de la maison baisse maintenant, Considéré cela maintenant vous avez une variable dépendante sur trois indépendant, très capable de jouer autour qui est appelé rechristen linéaire multiple. Comment allez-vous prédire le pourquoi Maintenant vous devez avoir une formule dans laquelle vous pouvez adapter toute cette variable
indépendante à travers leur formule. Vous en arriverez une ligne droite qui prend en compte toute cette
variable indépendante et la formule pourrait ressembler à ceci. Pourquoi la variable dépendante est égale à zéro l'interception y sur puis celle qui est le coefficient de la variable une entité sur la fonction Coefficient Manuel de l'entité et le coefficient entité à la valeur pour la fonction trois et la valeur en vedette trois. C' est donc un croissant de linéarité multiple. C' est les étendues assez simple régression linéaire. Mais la régression linéaire simple n'avait qu'un jeu de pied variable autour d'une variable indépendante . En cas de régression linéaire multiple, vous aurez plus d'une variable indépendante à jouer, mais c'est toujours un modèle linéaire. Il est encore des nombres continus et il est encore linéaire, régresse et moderne dans le monde réel. Vous pourriez avoir quelque chose comme ça. Vous pourriez avoir un nuage de dispersion. Pourquoi, vous âles x Il y a des points est dispersés points basés sur différentes valeurs d'entités. Donc, vous obtiendrez une donnée avec beaucoup de fonctionnalités sur. Basé sur cette fonctionnalité, vous devez prédire la variable dépendante, puis vous devez en venir. Est formule à travers vos données de formation, Vous allez calculer ce bizarro B un b deux b trois, les coefficients de ces caractéristiques et puis vous dériver cette formule. Une fois que vous avez dérivé la formule basée sur les données d'entraînement, alors vous êtes bon d'aller ainsi sur notre flux. Même chose. Mais la seule différence est à l'est d'une variable indépendante une caractéristique. Eh bien, avez-vous plusieurs fonctionnalités ? Eh bien, si les orteils jouent autour de sorte que vous obtiendrez un coefficient multiple. J' espère que vous avez une distinction claire entre la régression linéaire simple et multiple sur la façon dont régression linéaire
multiple et fonctionne. Passons à autre chose et faisons un peu Hanson et ensuite vous obtiendrez l'exportateur de l'affaire orteil cette régression linéaire
multiple. Je te verrai à la prochaine conférence
16. Démo Udemy Step1 avec MLR Demo Demo Udemy: Bonjour là. Bienvenue orteil Cette conférence sur la coalescence concrète vous faites un très bon progrès. Je suis très contente pour toi. Maintenant que vous comprenez la régression linéaire simple, il vous sera facile de corréler les choses et de comprendre plusieurs requêtes linéaires après notre ce ne sont que quelques variables plus indépendantes. Droit ? Sont si bons. Alors commençons. Tu le sais déjà ? Oui. Importer la bibliothèque. Alors faisons ça. Très première importation numpty que MP I je pouvais exactement rythmé de façon erratique. Mais je mange avec vous pour que vous suiviez cela et que vous tapez à la même vitesse que je tape. Je veux que vous suiviez chaque étape, et je veux être avec vous. C' est pour ça que je ne copierai pas et ne colle pas des choses ici. Je l'écris avec toi. Ok, mon pote, faisons-le. Vous nous mettez des liens comme beauté importation Beeban comme une phrase sur l'importation Matt sang l I B fléchette B A sang comme la beauté. Laissons-le pour m'assurer que je n'ai pas eu d'accord. Ça a l'air bien. Ensuite, vous allez toel importer l'ensemble de données dans Director précédent, vous comprenez déjà Où sont les données se trouvent et comment l'obtenir. Une fois que vous avez cet ensemble de données est indiqué sur votre ordinateur, vous pouvez le lire dans un état panda. Un cadre de musique ? Oui. Lire. Soulignement. CSP est parti avec ça, L'éthique à PD sombre beat a souligné CS que nous connaissons ici, mettre notre sur. Mettez la structure complète du répertoire, y compris le nom du fichier ou ici la définition est arto entravée ? Nos données sur ce fichier n'ont pas été cachées. Donc vous allez écrire un hater de commande n'est pas égal. Le compteur journalier va être en arrière. Slash s et plus écrire des lettres. Exécutez ça. Je veux te montrer quelque chose. Écoute, Andy, si ce n'est pas touché, qu'est-ce que tu as ? Vous obtenez les données. Mais l'en-tête. Regarde ça. Il est dit 012345 Si vous voulez garder le nom orteil ce haineux, vous pouvez le donner juste ici. Jessalyn nomme Commande sur. Mettez vos noms ici. Les noms vont être le 1er 1 est mon éperon. Cylindres gallons. Le prochain est le déplacement. Ce placement sur puis nous hospitaliser. Notre prochain, c'est le poids. Tout ce que j'ai fait écouter puis plus l'année Martin ici sur la vérification, mais ensuite le nom de la carte. Je pense que c'est fini. C' est prêt à le faire à nouveau. On va bien maintenant. On a tous les noms, non ? Impressionnant. Donc c'est quelque chose de nouveau que vous avez appris par rapport au réalisateur précédent qui a réfléchi
après lui . Vous pouvez mettre le frappeur comme nul si vous n'avez pas dirigé votre jeu de données. Et puis vous pourriez fière les noms de ces en-têtes en utilisant les noms. Allez. Bien. Celui-ci, WAAS Data Import. Ce que dans l'état, nous commençons maintenant. Exploration des données. Tu l'as eu. Les données supplémentaires montrent. n'est pas la première chose que nous allons faire, c'est découvrir la forme des données sur ça, n'est-ce pas ? Il y a 3 98 enregistrements sur neuf colonnes, 88 entités et une cible. Donc totalement si vous regardez cette puissance. Oh, désolé. Je me suis trompé d'esprit. Que récurrents ce sage Il y aura confusion. Tellement bien. Maintenant, on l'a. Ouvrons les données. Et lorsque vous ouvrez les données et que vous regardez ces données, vous verrez certaines valeurs hors de la puissance ont des points d'interrogation. La première chose est de se débarrasser de ces valeurs plus tard qu'il existe différentes stratégies. Toe, se
débarrasser de ce genre après qu'il soit orteil supprimé sont de remplacer ces points d'interrogation par la valeur moyenne de notre moyenne. Eh bien, il y a différentes façons de le faire. Mais pour cette conférence sur juste pour comprendre, je vais le supprimer et nous allons jouer avec l'ensemble de données restant. Supprimons ça. Nous allons exécuter cette commande. Notre bloc de données DF équivaut à deux points DF, car nous allons supprimer quelques observations. Bien sûr. Donc DF avez-vous la question de puissance de cheval fléchette dans le plus proche d'entendre Liberace a fait accord sur moins jolie de la tête sombre. Il n'a pas aimé certains L'utilisation de données de l'objet n'a pas d'attribut. Dur, Bob. Mais je l'ai toujours sur Haas. Mais d'accord, on recommence. Véhicule. Nous nous sommes débarrassés des bassins d'après, qui a un point d'interrogation dans le pouvoir passé. Revoyons le coffre. De de Dieu est maintenant 3 92 Cela signifie qu'il y avait six rangées de données lire le travail de question en valeur de
puissance, et nous venons de se débarrasser d'eux. Ok, laisse plus. Si vous regardez ces données, la puissance, c'est très compréhensible. La valeur de puissance sera numérique, mais parce que certains hors des valeurs étaient point d'interrogation dépendent d'un état d'une trame avec Quand il a pris les données de l'ensemble de données ici, il peut ne pas avoir considéré la puissance du cheval comme un orteil numérique. Trouve ça. Nous allons exécuter cette commande DF dart appliquer la carte. Qui ici ? Tu vas dire que c'est bon. Andan. Regarde ça. Il dit MPT sont vrai que Mme ils sont Toutes les valeurs sont numériques chiffres Israël cylindre . Oui. Déplacement numérique Americal Patasse Power. Regarde sa chute. C' était la date jusqu'à la trame n'a pas considéré la puissance comme un chiffre. Alors, qu'est-ce qu'on fait ? Nous devons convertir dame toe numérique ceci à cette barre de hachage d f avec point pd pour souligner Medic DF une fois de plus la puissance harsh la fonction de thon Medic dans Banda Aceh Data frame class Nous
convertissons la puissance en une colonne numérique. Ok, allons continuer. Laissez autour de la même commande à nouveau. C' est en cours d'exécution. Donc, cela est devenu un vrai nombre seulement rempli restant, ce qui n'est pas un roman, Lewis Carnie. Autre que cela, tous les autres champs sont numériques. Qui est maintenant ? Voyons si l'un d'entre eux n'a pas de puits, non. Tout cela est une partie après impôt fluorescent. Vous savez déjà que ce D de fléchette n'est pas sur un gazon de contrôle ou ici aucun d'entre eux n'a aucune valeur. Est-ce que Shem ur a bonne chance. Nous en avons fini avec le Basie coché sur les données dans leur exploration de cravates. Mais voici la partie amusante. Lorsque vous avez tant de variables orteil jouer autour de tout, ces variables peuvent ne pas être nécessaires dans votre modèle de données, vous devez comprendre deux choses très importantes au cas où vous en auriez autant, nous les appelons indépendants et nous nous attendons à ce qu'ils soient Notley liés les uns aux autres. Donc, tout d'abord, nous allons savoir si l'une de ces variables est liée les unes aux autres. Cela signifie que si une autre croissance augmente également en valeur, vous avez envoyé des relations types existent parmi la variable indépendante. Alors nous n'avons pas besoin de ces variables. On n'a pas besoin de pauvres durs. Ces variables dans nos données plus modernes. Nous n'avons besoin que d'un seul. C' est donc ce qu'on appelle multi génie. Et c'est ce que nous allons savoir si une de nos variables indépendantes a une
génialité coolMutti génialité cool
17. Démo Udemy Step2 avec MLR Demo Demo Udemy: Ok, donc il existe une question très simple de trouver Metical dans la charité, il existe différents modèles. Diverses questions sont de trouver multi l'alité Colin. Nous allons vérifier à eux un que je considère comme un modèle simple sur lequel on appelle
trouver le Cory écoute parmi ces variables indépendantes. Donc, si vous juste un d de noyau sombre et alors cela vous donne une mesure ici sur, vous pouvez très bien voir comment ces variables sont-elles liées les unes aux autres ? Donc, si vous regardez les cylindres, il est très étroitement aligné et dépendant du déplacement, tante Horsepower sur vit. Donc ces trois variables, elles sont très liées les unes aux autres. Cylindres, cylindrée, puissance sur vit. Donc ici, on a une linéarité multicœur. Il y a une autre question sur ce qui est appelé le calcul des variantes gonfle et le facteur moins à celui-là. Alors maintenant, au très puits, nous savons que les cylindres déplacent un hôpital et attendent. Ils sont très liés les uns aux autres. Et nous avons une alité multi corden sur nos données. Donc maintenant, nous allons travailler orteil sur les variantes facteur d'inflation aussi carte V i. F. Radiance en place et efficace le I f. carriérisme
fille. Alors, de quoi avons-nous besoin pour calculer les variantes ? Gonfle et facteur d'abord et avant tout, nous devons importer les fonctions requises à partir de la bibliothèque requise gauche avec cela. Donc, dans cette commande, à partir de stats modèle point commence à partir des variantes d'importation d'influence périphériques, facteur
d'inflation. Voici les funks, et nous allons utiliser divers gonflages et facteurs. Donc, une fois que vous importez
la fonction, la prochaine chose à considérer est que nous allons calculer les variantes dans la chair et le facteur parmi les variables
indépendantes. Donc, la première chose est, nous n'avons pas besoin de variable dépendante comme mpg. Et deuxièmement, pour le calcul, la variante, altruisme et le facteur. Nous devons d'abord convertir toutes les variables dans Tippett Dent en nombres numériques. Il ne peut pas rester, c'est drôle, Merrick. Alors faisons que le premier D f un est égal à d f point Obtenir de nouvelles données médicales. Ok, alors notre X va aller Toby dier téléphone dot drop Alors quoi ? Quels sont les attributs ? On va lâcher ? Nous avons déjà discuté de MPG. Nous allons supprimer MPD parce que c'est une variable dépendante dans Edison Toe que je suggère que nous abandonnons l'origine ici parce que je ne pense pas que cela va contribuer beaucoup au modèle. Comment l'origine de la voiture Neymar va orteil contribuer au modèle hors MPT quand nous avons
tant d'autres variables à jouer autour comme Displacement Hospital ? S' il a réellement écouté Marty Donc, débarrassons-nous de cela maintenant, alors nous allons
dire que le cours d'accès n'est pas C'est juste une commande très simple pour se débarrasser de tous les attributs de vos données de, jusqu'à présent, si bon. Mais nous allons l'exécuter pour nous assurer que nous avons importé la fonction correcte sur Nous avons eu ce droit. Faisons ça. Nous l'avons bien maintenant vient la partie amusante de variantes gonfle VFr infecté pour ce que nous allons faire est de créer un instantané hors bloc de données classe pd dot équipe ici Tandon v i e. F. Soyez un effet. croupes plus boiteuses. Nous allons appeler que les variantes de fonction en place et affectées sur les valeurs
X. Nous devons passer chaque valeur X un à la fois, et c'est pourquoi nous allons exécuter une sorte de pièce lointaine de chose ici pour moi dedans dans X fléchettes. Ip un. Je l'ai bien eu. fonctionnalités de Nate BF sont égales ex colonnes ancrées sur cette carte VF ronde, mais ok, nous allons lancer ceci. D' accord ? J' ai quelque chose qui ne va pas. Ce qu'il est VF caractéristiques étaient X. Oh, encore une fois, Typo ! Non pas que nous le faisons. Ok, maintenant on va regarder ça. Le Tumblr Elise. Toute valeur avec VF supérieure à 10, vous devriez vous débarrasser d'eux. Commencez par celui qui a la valeur la plus élevée ici. Il a le plus haut. Eh
bien, je vais d'abord enlever le poids. Ok, on recommence et on dit ce qu'il a disparu. Ensuite, nous avons encore plus modèle encore qui a étudié sur les cylindres. Les cylindres ont une valeur plus élevée. Ensuite, nous allons enlever les cylindres. Très bien. On s'approche. Il nous reste avec toi, en fait. Arison sur Marder. Marder a une valeur plus élevée. Alors, allons chercher une aiguille. Marty Model ici. Qu' est-ce qu'on a maintenant ? Déplacement et puissance. Débarrassons-nous de l'hôpital. On se rapproche, tu vois ? En fait repose et est déjà moins de 10. Donc c'est bon d'y aller. Ok, sortons de l'hôpital. Ainsi dit que nous avons fait tant de choses pour le pouvoir des cœurs. Gortari s'est débarrassé de cette question Waas l'a convertie en valeur numérique. Mais hé, maintenant on n'a pas besoin de ça drôle, non ? D' accord. D' accord. Faisons ce cul. Hum, donc enfin, nous avons deux déplacements de variables indépendants à, en fait récents, et ceux-ci vont faire partie de notre modèle de données. Regarde ça. C' est ce qu'on appelle l'exploration de données. Lorsque vous comprenez vos données, votre vie devient très facile. Nous avons commencé avec huit variables indépendantes, mais maintenant, quand il s'agit de créer notre modèle, nous savons que nous n'avons pas besoin de six. Nous allons seulement avoir besoin de désactiver ces variables indépendantes critique MPG. Bon travail avant de conclure leur raison de l'OLP fiscale et passer à la lettre de pré-traitement de données à une autre chose. Dessinons. J' ai dispersé le tracé de ce déplacement variable deux indépendant et réel surgi sur. Voyons voir, il y aurait un orteil gauche plus lourd que je connais ici. Nous allons utiliser la fonction « save on » appelée « Bear plot ». Pierre Brock, c'est la première fois que tu l'utilises jusqu'à ce que tu l'adores. Bear large TF un sur X. Ça va, Toby, Ce placement Andi activités sur pourquoi nous allons être notre MPG. La petite taille est le point C un et sauver la beauté. Roshal, tu l'as levé. Augmentons la taille. Il a l'air très petit. Ok, maintenant on a bien compris. Ouais, ils ressemblent à un croissant linéaire re. Eh bien, oui. Ils ressemblent à un bon ajustement pour plusieurs rechristen linéaires comme ceci. Écoute, comportement
de Selenia. Cela a aussi l'air gentil, comportement
terriblement proche. Je peux tracer une ligne ici, et jolie, mais on dirait qu'un énorme est tendre. Davidson est là. Arbre polynomial baptisé pourrait être un meilleur ajustement, mais,
hey, hey, nous avons eu une régression linéaire multiple élue sur je pense que la régression linéaire multiple et convient bien pour les deux hors d'eux. Notre fonctionnalité sélectionne n'importe quelle étape n'a pas été terminée jusqu'à présent. Ce que nous avons fait, c'est que la cour a lu la génialité multi core. Cela signifie que nous avons pris connaissance des variables indépendantes qui étaient très liées les
unes aux autres. Nous devons encore porter sur. Nous devons encore décider laquelle de ces variables a le plus d'impact sur votre
produit fiable . Vous pourriez commencer par, par
exemple, 15 20 à des récompenses, et vous êtes laissé avec ces récompenses diffusées sont peut-être 56 au rapport après avoir été mis pied médical dans la charité. Maintenant, vous devez exécuter ceux restants à triples dans un tour de sélection et de processus plus et il ya différents processus de sélection sont niveau dans plusieurs modèles de régression linéaire qui vous aidera à savoir si la portée parmi les autres indépendants être prises en compte pour vos données finales. Mortier un de ces critères est appelé en arrière. Alamin n'est pas allumé. C' est un que nous allons utiliser pour ce mortier. Il y en a divers. Il y a des élections bien pires. Il y a des éliminations arriérées et ce sont des greniers bide. Nel l une minute depuis que je vais expliquer chacun d'eux.
18. MLR Demo Udemy Step3: OK d'utiliser l'élément en arrière, n'est-ce pas ? D' abord avoir toe importer les fonds requis à partir des bibliothèques requises sur Nous allons l'
importation toe . Y at-il martyrs point a p a. Donc, à ce stade, si vous regardez cela, nous avons attrapé une formule, qui est pourquoi égal B zéro plus est à venir. Ce b zéro presse Beaven excellent plus B deux supplémentaires quand Pourquoi est en fait notre mpg égal peu
occupé va être une constante sur puis être même coefficients sur celui-ci va être ce placement sur une fois de plus Beato Un autre quip depuis ou ici et celui-ci voilà qui va être. En fait, ce n'est pas pour faire des éliminations en arrière et travailler. Nous devons mettre la variable indépendante ici aussi, elle ne peut pas être juste pour être à travers, donc la façon dont cela fonctionne nous devons d'abord dire que mpg est égal à p zéro en un Et ensuite ces valeurs ici. Donc ça devient notre formule. Donc, cela signifie que nous devons avoir une fonctionnalité supplémentaire ajoutée à cette table et cette fonctionnalité a une seule valeur Soto Ajouter qu'il y a une commande très simple. Nous allons dire que X est égal à sm fléchette à constante et c'est tout. Il va ajouter une ligne constante avec la valeur un pour X, nous allons imprimer X et puis vous comprendrez. Oh, ici. Donc, il a ajouté une constante de carte de fonctionnalité supplémentaire, et il transporte ce bien avec 1111 contenu, déplacement accélère. Et c'est bon d'aller ensuite ou ici. Nous allons continuer dans ce seulement entrons. Ce type, la Grèce, monsieur. Sans sol. C' est le nom qu'on va donner à l'instant. On va créer. On peut mettre n'importe quel nom ici. Et je voudrais oui, démarrage
similaire Quayle s Y sur X, nous allons l'adapter. Et maintenant on va imprimer le résumé, accord ? Et faisons ça très bien. Alors, qu'est-ce qu'on cherche là-dedans ? Nous recherchons que cette valeur soit supérieure au trait d'union. T sur n'importe quelle valeur d'entité. Plus de 0,5 est significativement avec son pointé de cinq. Donc il y a une grande théorie sur quoi ? C' est P et je vais écrire un bloc là-dessus. Andi, je vais le mettre comme une de la conférence. Si vous voulez comprendre ce qui est ce qu'il hypothèse nulle et comment ce travail. Vous pouvez passer par ça. Mais pour l'instant, comprenez la chose que nous cherchons ici est pour n'importe quelle valeur future que celle-ci ici soit supérieure à D ne devrait pas être supérieure à 10,5 si elle est supérieure à 0,5 ce qui est le cas ici pour Arisen réel. Utilisé pour se débarrasser de cette fonctionnalité que je connais ici, regardez la seule condition. Le nombre est grand. Un. Trouvez ce numéro de condition ici. Cela pourrait indiquer qu'il ya une forte Metical en réalité sont d'autres nouveaux problèmes médicaux . Cela signifie que même après tous ces exercices ici, nous ne pouvions pas nous débarrasser d'un récit rafraîchissant. Il est très fort, vraiment sincère, entre les déplacements s'accélère. Et, comme nous l'avons vu dans Cory raison ici, déplacement et effectivement écouter, ils étaient très liés. 0.95 C'est un chiffre très élevé, mais on n'a pas pu s'en débarrasser quand on a calculé Ivy. Mais ou ici quand nous faisons ce résumé, il
est, indique toujours que vous devriez vous débarrasser accélère et pour votre modèle final. Alors faisons ça. Laissons la lecture. En fait surgi sur. Rendons ce type. Disons x égal à ex sombre goutte. Ok, laisse 22e bien sûr, sont artistes Choir va descendre. La raison pour laquelle notre ville fantôme carrée vous ajoutez plus de variables. Artiste va tout à fait monter si vous réduisez le nombre de variables. Voiture d'artiste a couru vers le bas. C' est pourquoi nous disons dans le monde de la science des données que lorsqu'il s'agit de comprendre si votre modèle de
données fonctionne ou non,
ce n'est pas seulement le nôtre. Il y a diverses autres choses. Même je vais carré jusqu'à 0,6 Il pourrait être un bon moderne parce que cela dépend de beaucoup d'autres facteurs . Orteil Ok, laisse un. Donc, il n'y a pas de pic plus tard que le budget de Fife ainsi que conditionné descend. Donc cet avertissement est que la course a disparu, donc il semble que nous avons un bon moderne. Maintenant, nous avons le jeu des orteils avec un seul déplacement variable. Regarde ça. Nous avons commencé avec huit variables indépendantes. Mais quand il s'agit de créer notre modèle et notre orteil passant, cela modéliser la vitesse variable un effet fort sur notre variable cible. nous reste qu'un seul et qu'il déplacement. C' est le mot qui a été retiré de leur impôt. Florissant, vous êtes sur la bonne partie, mon cher ami, moins nous voulons déjà une partie profonde de plus grandes personnes assis parce que nous avons notre X et Y Ready Maintenant nous avons orteil créer notre ensemble d'entraînement à la date de test nous il qui est très similaire à ce que vous avez fait en simple rechristen linéaire à partir de s échelle et non modèle sélectionne. Um les jours de plan d'importation est retourné. Ex train X dist. Pourquoi l'adolescente ? Pourquoi dist le goût Quest Train est flagrant. X y goût La taille est égale au point Onda. Ce jour sera nul. Oui, étant ce prolongement, je vois ex dist. Darcy. Pourquoi 10 ? Pourquoi ? Juste une pointe sombre. Euh, pourquoi Justice ? Oui, on a bien compris. 3 13 pour le train supplémentaire et 79 4 ponts test. Jusqu' à présent, si bien. Maintenant, entre notre modèle de SK appris Dart dans l'importation moderne Dean Assez bon sur l'année
propre Souligné Rick égal à 18 année grâce. Et sur un très bon suivant. Nous allons aux pieds dans le modèle et c'est similaire à ce que nous avons fait dans Simple dans Eric. Écoute, Asham, notre mannequin est entraînée maintenant, nous allons prédire le chemin suivant. Nous allons prédire y sur la base du test X. Et c'est à venir ici. Très bon X. Pourquoi prédit là ? Et maintenant, comparons les dévaluations Lifton. Comprenons à quel point nous sommes proches dans notre prédiction comparés les valeurs de Y proie sur. Pourquoi tester comme nous l'avons fait dans le modèle linéaire ? A gauche avec ça. Ok, j'ai fait cette commande. Ou ici 28 29 22 26 12 13 38. Et là, je pense que ça a l'air plutôt bon. Dans peu d'endroits, il est loin, comme 38 28 mais peu d'endroits, il est très proche. 28. 29 sur 12. 13 33 29. Pas mal. 1920 n'étaient pas mauvais. Ouais, ça me
semble plutôt bien. Nous allons imprimer une distance et tracer la valeur de goût Y sur par les prédictions et la valeur sur qui nous
donnera une assez bonne idée hors. Comment pouvons-nous prédire les valeurs Y à l'heure actuelle ? J' espère que vous savez déjà comment tracer les perturbations et le sang. Je sais que tu choisis. C' est donc le Sénat. Commencez le goût pas sur le sang. Notre Pourquoi juste Nous allons dire que la couleur est égale si elles sont et voisine il cite des
valeurs en fait . Et disons qu'on ne veut pas de son télégramme. Donc son Equus, les fonds et faisons la même chose pour l'essuyer. Mais cette fois, on va trop loin. J' ai prié que nous allons donner la couleur verte et nous allons mettre l'étiquette comme
valeurs prédites aan den. Ici, ce serait un peu, et si oui, il est apparu. Dido est bon. Voyons voir. Eh bien,
ici, je pense qu'on l'a assez près, non ? Regardez ça jusqu'au MPC 10. Nous sommes très proches les uns des autres, mais puis après cela, il y a quelques variantes augmentées. Et après ça, nous avons un match proche. C' est donc un moderne raisonnablement bon que nous avons travaillé sur nous avons développé. C' est un très bon modèle sur des données du monde réel. N' oubliez pas, c'est une véritable étude de cas réalisée par l'université et nous sommes en mesure de prédire très près sur ce modèle est assez bon modèle sur lequel nous avons travaillé. Tu devrais être fier de toi. Je te verrai à la prochaine conférence
19. PolynomialLinearRegressionIntroduction: Bonjour. Il y avait Come toe ce Lecter sur rechristen linéaire polynôme. Félicitations pour compléter simple rechristen linéaire Vous comprenez déjà. régression linéaire simple signifie qu'il n'y a qu'une seule variable indépendante sur elle est
orteil obscurci . La variable dépendante du propriétaire de la ferme dépend. La variable est égale à. Pourquoi intercepter plus le coefficient de Beaven en variable indépendante ? C' est un fermier ici. Qu' est-ce que la régression linéaire multiple ? La régression linéaire multiple est l'extension tout simplement presque. Grissom. Ici, il y a plus d'une valeur d'entité jeu orteil, alors pourquoi dépend directement des valeurs d'entité ? Mais il y a plus d'une valeur de fonctionnalité, et c'est pourquoi il y a plus d'un tout à fait approprié dans le cas où un parti, ni moi, un rechristen indulgent. Pourquoi la variable dépendante n'est pas seulement directement liée à l'entité, mais elle est également basée sur la valeur exponentielle de l'entité. Par exemple, regardez cette ligne. Ce n'est pas une ligne droite est une ligne de carte. Si vous correspondez à cette ligne de fille dans une formule, il ressemblera à ceci. Pourquoi je pourrais faire B zéro. C' est pourquoi entrer Tip plus B un café envoyé dans oui plus B deux dans X est calme. Donc ce n'est pas seulement X, c'est X en X, et c'est pour ça que vous avez attrapé cette ligne d'or. Si vous êtes des points dispersés ressemblent à ceci, alors cette ligne se traduira par le remorquage. Ligne incurvée. Mais c'est toujours une ligne. C' est pourquoi il est appelé linéaire. Mais ça s'appelle polynôme parce que nous sommes ici. Votre variable dépendante est une variable indépendante polynôme. J' espère que vous avez compris la différence entre la régression linéaire polynomiale sur d'autres
digresses linéaires . Comme la raison génétique simple et multiple. Il deviendra plus clair lorsque vous ferez le projet de fils de main. Tu vas aller aux pieds Voir à la prochaine conférence. Je te verrai à la prochaine conférence.
20. Enregistrement en direct de Regression linéaire polynomial 2: Bonjour là. Réponse. Vous êtes très excité par le modèle de régression linéaire polynomiale, et je ressens la même chose. Vous allez utiliser le même bloc-notes du modèle de régression linéaire multiple. Ouvrez ce cahier avant de commencer le polynôme. Vraiment d'accord ? Crescent, je veux que tu fasses encore une chose, et c'est de tracer un nuage de dispersion complet. Vous expulser au complet. Pourquoi les valeurs prédites en utilisant une régression linéaire multiple. Alors faisons ça. Disons-le. Scatter block sur un Pierre de fléchette est dispersé. On va mettre X. Pourquoi ? Et ils disent que la couleur va être. Ils disent bleu. Ok, suivant. Donc, c'est la valeur X et y complète. Ensuite, on va le dire. Scatter une fois de plus X Et maintenant, nous allons mettre les rivaux prédits, pas les renouveaux si ensemble prédits par les valeurs Très orteil copié. Ça d'ici. Mettez-le ici sur Interred Off X. On va dire x sur la couleur. Disons qu'il va l'être, mais il sur Let's un point barbare et si oui vous le faites. Ici, vous allez la ligne rouge waas Les valeurs prédites et ce bleu sont les valeurs réelles. Tu te souviens ? Je vous ai dit au début que cela ressemble plus à une diminution linéaire polynôme dans ce que je voulais dire pour nous au lieu de créer une si grande ligne. Si vous regardez ces points dispersés, ils ressemblent plus à une lumière de voiture de ligne de carte. Donc si on met juste une ligne comme ça, un Colin qui sera un meilleur ajustement, alors juste une ligne droite. Et cette ligne de voiture vient de Paul dans notre repas. Rechristen linéaire. C' est ce qu'on va faire maintenant. Toute l'exploration de données que nous avons fait en plusieurs linéaires, imprudents, et nous allons continuer avec la même chose. On ne va pas refaire tout ça. Nous allons supposer que le meilleur modèle va être la variable indépendante sera déplacement sur. On va aller aux pieds. Prédire le mpg afin que l'exploration des données ne soit pas nécessaire. Nous continuerons d'où nous vivions pour lui. Mlr que dans plusieurs linéaires. Écoute. Et maintenant, nous allons faire le traitement de données de pré-traitement lointain polynôme linéaire regretté Lefty Data trois traitement pour Polly Norm Year encore. Grissom. Ok, nous devons d'abord importer la bonne bibliothèque. Sk Len pas, mais il traite. Et à partir d'ici, nous allons importer des orteils Polly ni Mia classe de fonctionnalités. Ok, Ensuite, nous allons créer l'instance à partir de cette classe. Appelons ça Polly Bali ni plats de repas. On a l'instance. Et maintenant X Polly va être Bali Dart fit, Transform picks. Voyons voir, on a bien compris jusqu'à présent. Donc tu dois exécuter le cahier complet, d' accord ? Oui, oui. Ici aussi. Allons-y. Voyons voir. On dirait une sorte de nouveau. C' est tuer, pas reprocher. Inspirer quelque chose. C' est bon. D' accord. Bien. Maintenant le prochain, ça va voir cet ex poly. Qu' est-ce qu'il contient maintenant ? Donc, disons que B d coeur a fait, euh, frame x export est C'est pour ça que je le convertisse en données pour qu'il aille mieux. Ah
, mieux comprendre ce printemps, les premiers funérailles ici. Passons un peu de temps à comprendre ce zéro. C' est une valeur constante. 111 On ne va pas s'inquiéter à ce sujet. Celui-ci est la valeur de déplacement, la valeur de
déplacement est la valeur zéro, n' est-ce
pas ? R. Il avait besoin d'un téléviseur 73 50 et faire les mêmes valeurs, donc c'était exact. Mais ce qu'il est La deuxième colonne ajoutée par le pré-traitement de la fonction polynôme. Tu comprends ça ? C' est tout simplement Esquire hors de ces valeurs ici, 94249 est tout à fait après 807 à porter à 50. Cette chorale de 3 50 Rappelez-vous, quelle était une question pour le Miller ? Régression linéaire multiple. Régression linéaire multiple. Waas. Pourquoi égale B zéro en un après cela, plus B un en X maintenant polynôme qualité éplucheur normalement Nicolas et demande et est devenu Pourquoi égal à zéro en un plus être un dans X. Donc, il est là dans un orteil décent qu'il a ajouté Beato dans deux X est calme ici, donc il a élargi l'équation. En passant, lorsque nous créons l'instance des caractéristiques polynomiales, nous devons passer un décret et si vous ne passez pas décret, cela suppose aussi. Donc, disons qu'il a supposé degré quant à. Mais si je dis trois, voyons ce qui se passe ici. Il va mettre exponentiellement. Ça va mettre X 3 ici, donc on n'y va pas. Nous allons juste nous limiter à deux degrés dans le prochain Lector, je vais vous dire le mystère derrière ça, euh sur le mystère derrière ce diplôme. Pourquoi est-ce important ? Alors comprenez que la question a changé. Maintenant, il n'est plus limité à n'en être qu'un. Excellent. Il a ajouté B deux x esquire. Et si vous augmentez le degré, il continuera à s'étendre qu'il va s'affaiblir. Soyez trois rayons X plus à trois. Appuyez avant sur l'excès de quatre. Comme ça. Donc, jusqu'à présent si bon. Vous comprenez ce qui s'est passé en ce moment, vous avez la valeur X et la valeur excédentaire du chœur. Non. Ok, donc c'est ton ex poly. Donc les gens de données à travers les choses tournent ce qui est ensuite ? Ensuite, nous avons orteil adapter ces demandes linéaires orteil et moderne. Donc on appellera ça plus d'aneth. Coupe Polly Dark sur X polly. Pas tout à fait raison. Donc, les pieds de départ de qualité expertement et puis à droite. D' accord. C' est donc notre modèle polynôme. Nous nous adaptons avec experte et blanc. Et maintenant, nous allons appeler notre Lynn Neary Grayson. Donc, nous allons créer une instance hors. Même régression linéaire classe mathématique année maigre rechristen ici. Et puis on va s'adapter à ça avec notre ex poly et rival donc x souligne Polly. Et quand ils voient ça, c'est bien. Ok, donc notre modèle est en forme maintenant maintenant, nous pouvons vous, Theis, et prédire la valeur y. Alors voyons pourquoi. Prédiction. Ok, alors pourquoi souligner ? Disons que Polly met ça va être terre. Faites cela quand vous savez, commencez à prédire les mêmes s que vous avez fait pendant la régression linéaire et ou ici nous allons
chemin des orteils la valeur de X polly, qui est ici la transformation du corps duff. Droit ? Donc juste mais le X Party Eh bien ici. D' accord. Sur la mort Notre Pourquoi Polly perroquet qui a également bien passé sur une comparaison moins développé la bonne valeur
réelle avec pourquoi la valeur prédite en utilisant Corey diminution normale et orteil moderne comparer que nous avions les tribunaux et nous sommes ici. On va utiliser le même. Oh, ici, bébé. Donc, nous allons dire cette fois que vous avez à faire, vous devez sur celui-ci deviendra notre y Prié à la place, j'ai prié Il sera y Polly prié sur la place off. Pourquoi tester ? Nous allons utiliser la façon complète. Très bien. Regarde ça. 18 15 59 15 14 18 15 16 15 Celui-ci a l'air d'une meilleure prédiction m'a dit qu'il deviendrait plus clair quand nous trottions. Scatter plot. Alors dessinons. Ils dispersent l'intrigue à nouveau est gardé à part. Cela va être vu et maintenant à ce que nous suivons sont de simples prédictions. Donc ça va être d'accord sur la couleur avec Ruthie taux. Disons vert peint à la main. Très bien. Regarde ça. Notre nouveau polynôme re Crescent a apporté la ligne incurvée. Celui dont je parlais et qui semble mieux que la ligne droite. La prédiction. Parce que la nature des points de dispersion ici, il a l'air d'or. Et celui-là, la ligne de la carte. Je pense que ça donne une meilleure prédiction. Que diriez-vous de regarder notre score ? Voyons voir ça. Voyons s'il y a une amélioration dans notre score. Donc, nos compagnies de pointage des orteils, Oui, K très bon. Puis imprimez à son cœur. Mais, euh et ça va être notre pour souligner son noyau. Alors pourquoi les valeurs réelles ? Donc, moi et puis protégé Wells ici sur Nike Ways Gauche imprimé, les sont à marquer pour éplucheur. Probablement un stagiaire normal regrette sur celui-ci ici sera pourquoi, Ok, allons faire ça. Oh, ici. Donc, il y a une amélioration dans notre vers son noyau. Donc, le sont de marquer quatre mlr a été pointé pour elle et pour pilier pour la même date qu'il est 40.68 il donc ce statut, il semble un meilleur ajustement pour polynôme rebaptisé, puis jumiller. C' est donc la vie de la science des données. Lorsque vous obtenez les données, vous pouvez faire leurs poussées fiscales et comprendre les données. Mais vous ne savez peut-être toujours pas quel algorithme s'adaptera mieux à ces données. Et c'est la pratique que vous finirez par faire. Vous allez vous faire adapter à un algorithme. Obtenez votre êtes à marquer, obtenir ses prédictions, et puis vous allez essayer un autre enregistré. Et puis cet algorithme pourrait donner un meilleur écrivain que l'algorithme précédent. Cela signifie que vous allez de l'avant. Vous vous améliorez. Et c'est ce que nous avons fait dans cet exercice. Nous avons essayé de prédire l'efficacité énergétique. Utilisation de régression linéaire multiple. Nous avons 64% sont à marquer et la prédiction waas assez bonne. Mais nous l'avons amélioré en utilisant rechristen linéaire polynomial. Donc pollen normalement proche imprudente et pour nous obtenir un meilleur résultat 10
régression linéaire multiple pour cet ensemble de données. Très bien. Je te verrai la semaine prochaine
21. Intro KNN KNN intro: Bonjour là. Bienvenue toe K algorithme voisin le plus proche. Avant de faire une plongée plus profonde dans K et un algorithme que nous vous emmenons à travers une
distinction très importante entre différents notre rythme. Sur Il y a des modèles paramétriques et non paramétriques. Vous avez déjà traversé une régression linéaire simple, régression linéaire
multiple et un grenier lini polynôme. Écoutez dans le précédent électif sur un rassemblement de comportement remarqué est qu'ils ont tous la question orteil suivre sur. Sur la base de cette équation, ils dérivent la variable dépendante. Pourquoi ? C' est donc la question délicate du paramètre. Il y a déjà une formule qu'ils suivent. L' ensemble de données d'entraînement est approprié que les coefficients de formule sont dérivés et parient sur ce coefficient. La question est complète sur le reste des données comme les données de test. Nos données futures sont basées sur cet équipement. Sur cette base, D y est dérivé. C' est ainsi que fonctionnent les modèles paramétriques. Ensuite, il y a des modèles non paramétriques. modèles non paramétriques n'ont pas une telle question. Ils analysent le comportement des données, et en fonction de ce comportement après les données, ils prédisent la variable dépendante. C' est donc la différence entre les modèles paramétriques et non paramétriques. La désintégration et le modèle est un modèle non paramétrique. Cela signifie qu'il n'y a pas de formule fixe. Notre équation qu'ils suivent très bien maintenant que vous comprenez que Cayenne est un ascenseur moderne non paramétrique, comprendre comment peut et fonctionne. Donc, disons que vous meniez une campagne marketing sur la base de certains paramètres, certaines fonctionnalités de vos clients, peut-être âgés, hommes ou femmes, leur emplacement, leur revenu familial. Peut-être sur la base de ce que vous avez découvert un comportement avec une partie est votre produit, sont-ils pas. Mais c'est ton produit. Donc si c'est oui et non. Et si vous tracez un graphique, c'est
ce que vous obtenez. Tous les points du jour sont le point inutile. Maintenant, considérez qu'il y a un nouveau client nouvelle personne sur les réseaux sociaux, notre partout où vous exécutez le camping marketing et vous devez prédire où cette personne achètera votre produit ou non. Donc fondamentalement, vous devez prédire bizarre. À ce stade, ces données appartiennent. Est-ce que ça appartient ici ? Ce qui est oui, mais est-ce que ça appartient ici ? Ce qui est non Comment l'algorithme Non, nous sommes de trier ce point appartient à. C' est là que le cayenne et l'algorithme entrent en jeu. Imaginez les vacances et l'algorithme fonctionne. Il décide d'écarter ce point en fonction de ses voisins. Mais la question est combien de personnes veulent considérer ? Et c'est le Cavell. Par exemple, si je vois, je veux considérer trois voisins autour de lui solidité de que trois voisins sur puis la majorité conduit que ce n'est pas dans ce cas. Il y a deux points du côté oui, un point du côté nord. Donc, ce point deviendra s que, avec ce client que vous analysez, il va orteil acheter votre produit qui serait avec une prédiction Qu'est-ce que Iphigenie Ce gato cinq les prédictions et les changements parce que maintenant il ya trois points sur le côté nord et deux points sur le site F. Maintenant, ce point devient pas papa signifie que la prédiction est que ce client ne va pas orteil partie s votre produit. Donc, basé sur le câble, la prédiction change. Il y a une logique que Tobie a suivie. Est-ce que j'ai ça ? A donné une boucle et il va atterrir est alors que nous allons passer par le projet Hansen dans la prochaine conférence. C' est un autre orteil ? Considérez que nous disons à l'algorithme orteil considérer gay comme cinq. Mais comment l'algorithme saura-t-il quels points voisins prendre en compte ? K est cinq de cette façon, il considérera cinq points voisins, mais quel point voisin à considérer. Nous disons ces points à considérer donc ils considèrent ces thèses et ce
point de combat aussi reconsidérer ces cinq points de thèse dont cinq points à considérer et c'est là
que la logique de calcul de la distance entre ce point, le point prédit et le point voisin vient en Peter. Il y a trois logique distincte notre capacité de considérer cette distance 1er 1 est que vous effacez la distance, il faudra X un après ce point avec le X un hors du point voisin trouver une différence Est choeur différent similaire violent à ce stade et pourquoi je suis allé après point
voisin et il va prendre un total off qu'il fera que pour chaque hors les valeurs ici et pour lesquelles vous étiez communistes Et il trouve cette valeur comme le plus bas leurs dents, le communisme hors combat voisins il considérera donc de toute évidence, dans ce cas, il constatera que cette fille et cette chorale seront les plus faibles pour ce communisme. Donc, considérez combien de compétence et il doit faire Il doit d'abord trouver la différence pour chacun des points de données. Et puis il doit trouver ce nombre unique un point basé sur le K pour lequel cette distance est la plus basse. C' est beaucoup de calcul. Et ça doit faire pour mettre les pieds les voisins gaulois. Et c'est pourquoi sélectionner K est un rôle très important dans K et un algorithme. Et bien sûr, vous comprendrez que lorsque vous faites les mains sur le projet pour l'instant, je pense que vous savez comment ce cayenne cool et chose fonctionne, comment il calcule la distance, comment il découvre quels voisins considérer. Donc c'est une après logique pour calculer la distance distance distance euclidienne et il y a plusieurs autres logiques comme celle-ci. Donnez-moi économiser la distance sur Manhart et la distance ont une distance de sécurité est maximale sur les valeurs
absolues sur les distances de Manhattan le total après bien absolu, utilisez la différence. Ok, génial. Je pense que vous comprenez K et assez. Je vous verrai la prochaine conférence
22. KNNRegression Étape Étape KNNRegression KNNRegression 1: Bonjour. Il en viendra à cela. Richter. Félicitations pour avoir terminé la régression linéaire simple. Régression linéaire multiple sur régression linéaire polynomiale. Vous auriez déjà remarqué que j'ai le même cahier ouvert. Donc, nous allons orteils continuer à utiliser le même cahier. Même date que sur. Nous allons améliorer les orteils sont de marquer fondamentalement notre prédiction en utilisant un autre algorithme sur cette fois, il est appelé gay. Régression du voisin le plus proche Un algorithme K voisin le plus proche. Je vais aller au résultat pour re croissant à Celeste classifications ici. Dans ce cas, nous avons une donnée continue. Nous allons donc utiliser l'analyse du nouveau croissant pour prédire la valeur du MPC. Je vais l'appeler K.
Et maintenant, avant de commencer Cayenne et l'algorithme, laissez-moi faire encore une chose. Nous avons terminé notre précédent Lecter ici, où nous avons comparé l'art pour marquer Millar et Peeler. Dernière amélioration. Ces lettres avaient la moyenne racine est tout à fait erreur à cela parce que c'est un autre critère visa comparer parfois la moyenne racine est tout à fait erreur est plus important que l'artiste a marqué. Alors c'est pour ça qu'on le compare tous les deux. Alors faisons ça. Donc, d'abord, nous allons l'importation des orteils de cette moyenne d'importation des médecins sombres est calciné il sur. Nous aurons également besoin de mis est route tranquille Sq partie. Très bien. Nous avons déjà ouvert notre pour marquer plus tard. Sprint la route. Je veux dire, c'est calme, n'est-ce pas ? Oh, mon Dieu. Sur ce qui va être est tout à fait chemin pour venir ici. C' est content d'être radié. Je veux dire, est calme il des deux puits. De même. Donc c'est loin, euh, beaucoup sur,
genre, genre, chemin orteil. La même chose pour B A r se lève b l r. Ce sera pourquoi mon corps Brit. Ok, on y va. Donc nous avons obtenu notre score et la moyenne racine est assez rare pour un homme dans un peu PR ici. Donc, il y a une amélioration dans notre score ainsi que le quart de minutes racine. Très bien. Maintenant, nous pouvons commencer le K et l'algorithme. Nous allons utiliser le même ensemble de données sur. Nous verrons s'il y a des améliorations. En utilisant K et un algorithme pour utiliser K et un algorithme, nous devons d'abord importer le voisin gay. Agresseur importait de la bibliothèque s Kellan de s kailyn dot Tous les voisins importent ok ? Des voisins gays, des agresseurs. Et puis créer une instance pour K et n voisin, le kraisser importait. Cayenne et égal orteil Gay voisin nettoyant. Oui. Pourriez-vous le faire instance hors que Oh, ici nous allons mettre dans des voisins égaux à neuf sur. Ne vous inquiétez pas, je vais vous expliquer. Quelle est la signification de cette valeur sur Pourquoi choisissons-nous neuf pour l'instant ? Il suffit de mettre les voisins finaux un appel à neuf sur la prochaine. Nous allons adapter le gain et avec l'extrême sur à juste titre en valeur, a-t-il expliqué. Et blanc. Ok, donc on a le martyr. Nous avons notre Cayenne et notre modèle en forme. Allons autour. Ça a l'air bien sur la prochaine, on va aller aux pieds. Prédire le renouveau. Maintenant c'est un crédit WHYY. Et c'est bien, mais ça va, et puis ça s'arrête. Obtiens et, euh, prédis-le. Et ça va être X juste vraiment facile, non ? Souvent, nous avons Pourquoi prédire les valeurs ? Ensuite, nous allons comparer la mort réelle par rapport à la valeur prédictive juste ici. Ils sont trop de trois D sur trois. Oh, ici. 18 15 15 14 18 15 16 15 13 14. Ça me semble plutôt bien. Mais comment faire avec un certain que c'est mieux que le dernier ? La précédente dont je me souviens. La première chose que nous allons faire est de créer un nuage de points. Étendez. C' est un nuage de points. Esto ça. Ok, la porte Fear T est dispersée x sur. Pourquoi dans ce cas va être prévisible dans deux jours et je partirai X et colorier ces essayant de, disons, je vais dire, mettre Nestea en place. Wow, je pense que celui-ci, les points jaunes sont plus étroitement alignés avec les valeurs réelles. Les points bleus comparaient à la ligne verte bouclée, qui était pour la qualité normalement. Deitrich, écoute sur la ligne droite du raid, qui était pour plus de gens linéaires, diminution dans Let's run nos numéros. Nous allons courir notre à sa cour et racine signifiant Squire erreur. Et voyons s'il y a des améliorations à cela. Droit. Alors faisons ça. D' accord. Cette année, voici, alors. Ouais, tu vois ? D' accord. Et puis d'accord. Et puis prédire. Merci. Très bonne leçon. C' est ça. Ok, comparons
maintenant. Alors, on ne marque pas le cap ? Il y a l'amélioration dans le cas off pl r 12.68 chez les enfants au large de Kane, et il est des points sur cinq en même temps, erreur carrée moyenne
racine a diminué de quatre points traiter off 3.8 il. C' est donc certainement une amélioration. Donc Kienan nous donne une meilleure prédiction et moderne, alors. Mlr RP. Félicitations, vous déménagez à Derickson séché. Une chose que je veux souligner orteil si vous regardez ce gamin et ce n'est pas une ligne d'état et c' pourquoi il n'est pas appelé régression linéaire. La régression linéaire est simple. Diminution linéaire de notre multiple dans Ieroklis sont Pol Anomalie proche imprudente et qui vous donne
réellement une ligne. Soit il est appelé ligne sont en ligne droite, mais son cas hors canon parce qu'il est basé sur les points voisins les plus proches. Ce n'est pas une ligne droite, c'est juste prédictif. Je valeurs que ce soit sur les points voisins les plus proches et c'est pourquoi il ressemble à un nuage en ligne avec les points réels. Et peut-être que c'est pourquoi il donne une meilleure prédiction dans ce cas. Droit ? Donc, vous allez dans la bonne direction, mon cher ami. Maintenant, vous devenez des scientifiques des données maintenant, vous savez, quand vous obtenez une donnée comment jouer avec elle et comment obtenir de mieux en mieux dans votre prévision. Mais avant de conclure, je me souviens que je parlais de ces voisins égaux à neuf. Andi, je t'ai dit que je t'expliquerai à ce sujet.
23. KNNRegression Étape 2: dans la face de concept, vous comprenez déjà L'algorithme K voisin fonctionne sur la base des voisins. Comme si je considère un point ici, il est basé sur il ya les voisins sur elle calcule la distance. Mais entre ce point et le voisin et puis il décide, d'
où appartient ce point ? Le nombre ici indique à l'algorithme combien de points vous devriez considérer comme voisin. Donc, si je donne neuf, ça veut dire que l'algorithme va se mettre au point. Considérez neuf points dans son quartier. Il considérerait neuf points, et il arrivera avec les valeurs prédites. Vous pouvez commencer avec celui sur aller sur, mais le vacay et et et jamais l'algorithme fonctionnent cette racine signifiant Squire Edgar ici devient très élevé si Cavell qui est faible. Mais cela ne signifie pas que si vous gardez un câble intéressant, Houthis continuera à descendre. Il y a le point actif. Tu dois comprendre. Et comment ai-je trouvé ça ? Numéro neuf. Allons passer par ça. Je vais vous expliquer. Comment ai-je trouvé leur numéro neuf ? C' est très facile. Faisons une cassette vidéo pour écrire quelques lignes de la morsure et de la cour et nous comprendrons. Donc, disons que pour K dans la plage 20, nous allons exécuter la même logique comme prédire la valeur y. Mais au lieu de juste passer et voisin comme neuf, nous allons passer et voisin du numéro un au numéro 19 et voir comment l'ensemble de la
route d'Esquire miniter est en train de changer. Donc à gauche avec ça. Ok, égal Tok plus un sur. Puis il suffit de copier la même chose ici, puis mon prié sur l'impression de sprint Ok, valeur, qui est cette année. Ok, alors
le MSC sur notre ambassade est juste là. Très bon moins que ce Jusqu'à présent câble un est cinq points il. Il commence à 5.1 c'est le plus haut. Eh bien, alors ça continue à baisser. Regarde ça donne descendant, bas, bas, bas, bas, vers le bas jusqu'au huit et neuf et puis ça augmente après ça. Donc, si je traçais un graphique de ceux-ci, ce serait clair. Alors tracons un graphique pour tracer le métier. J' ai besoin de toutes ces erreurs doit bien dans certains np Désolé de me laisser créer un vide d'abord
, puis ajouter cette valeur d'erreur en cela. Voyons voir,
j'ai tous ces saules. Voyons voir, Oui, j'ai les valeurs. Maintenant, je peux dessiner le produit. Longue. Se produire, Lord Worlds, point
rapide flux de données chaud Emma C. Et puis juste point de l'intrigue fille apporté. Ici, tu y vas. Ça a commencé avec plus de 5,5 ici. 5.8, à droite. Continuez à descendre avec la grotte beaucoup de 2.5 descend Et puis après environ huit ou 9 18 places à nouveau, droite, donc vous pouvez choisir soit huit ou neuf et c'est la valeur optimale pour cela. Je suis allé pour la nuit. C' est ainsi que vous obtenez la valeur optimale pour K à Cayenne et Al Qaida.
24. KNNClassifierDemoUdemy Step1: Bonjour là. Bienvenue, Richter. Commençons par la voiture et l'acceptabilité sur. Prédire sa participation basée sur K puis classificateur. Ça va être amusant. Donc, la première chose est que nous allons donner un bon nom orteil notre carnet et nous l'appellerons d'accord . Et ensuite classe. Ici. Ok, Suivant. Très vite. Nous allons importer toute l'importation de bibliothèque requise grumeleuse. Je ne peux pas être amusant d'importer. Est-ce que Aziz Pd t Bond vote point Et ensuite nous allons orteil dictateur important basé sur les précédents élus Vous comprenez les données sur j'espère que vous avez une histoire. Tournez votre ordinateur maintenant nous allons Toe importer que les données orteil un bloc de données sur le
père commun qu'il est. Ce sont mes données du nom DF B d tarte qui mangent point pitié Lire CSP et puis notre et puis donner votre nom de fichier ou ici Si je nom est carte, notre fichier de données n'a pas de hit, donc nous allons appeler en-tête comme aucun mètre quotidien dans le fichier est Kama et puis nous allons donner des noms à la colonne qui est nommé aux attributs sur le nom va être juste ici porte de maintenance. Écoute, ça ferait 50 voitures. Ok, DF a frappé la fléchette. Vétéran. Très bien. Donc on a nos données. Inde Dur. Honte sur ou ici. La prochaine chose, c'est que
nous allons voir la forme des données. Comment B sont nos données ? 1728 lignes et sept colonnes. Très bien sur la voiture. Ou voici notre cible. Variable sur. Il y a 123456 variables indépendantes. Donc, comme vous le voyez ici, ce sont toutes des variables catégoriques. Nous devons les convertir en variables numériques et comment le faire. Tu le sais déjà. Il y a inclus donc on va faire l'étiquette en courtisant. Alors quoi, tu vas importer de s Kaylen ? Ne vous occupez pas de la main-d'oeuvre importée en quota, et ensuite nous serons au tribunal. Chacun de ces champs le d. f. Achat égal à avant cela, nous devons créer une instance hors étiquette en trimestre, non ? C' est une classe, donc elle a besoin d'une instance pour la recréer. Premier sur le coup. Ok, donc j'ai un point de pieds et cette cour se transforme. Et vous aussi ? Nous faisons la même chose pour d'autres domaines dio I m D Le suivant va être les portes jour en personne et regarder, c'est botte 50. Car est une variable cible. Donc on ne va pas au tribunal pour le sprint maintenant, tu as été touché ? Très bien. Tous sont encodés maintenant. Jusqu' à présent, si bien. Si vous voulez voir l'unique Quellos dans la variable cible de voiture, c'est un très facile Vous pouvez simplement exécuter cette ligne de cour. Est-ce que vous, Dieu sur juste voir Unique. Ce sont leurs valeurs uniques dans les variables cibles. Donc, vos voitures vont être séparées entre l'acceptabilité faible moyenne inacceptable. Acceptable. Très bon et bon. Droit ? Vous avez remorqué Segregate que ses voitures de groupe parmi ces mêmes fois hors. Acceptable. Il y a donc plus de 1728 enregistrements. Ton orteil. Prédire ces classifications à la date future nous Si vous avez ces six au pire niveau après voiture, vous devriez être en mesure de prédire si elle est parmi l'une des sept catégories hors course. Ok, donc on en a plus dans les corporatistes. Nous allons donc nous assurer que toutes les six valeurs d'entités sont des valeurs numériques maintenant. Donc, nous allons faire que DF fléchette Appliquer la carte et être fléchette est vraiment pas touché. Ok, si vrai. Vrai, vrai, vrai, vrai et autre Cela est attendu. Nous n'avons pas dans la carte de la cour, donc il sera par défaut. Mais tous les puits futurs sont vrais. Donc, toutes les entités sont des valeurs numériques maintenant Très bon. Il est temps de définir nos x et y. donc disons X égal à d f point drop Qu'est-ce que cela faisait tomber carte ? Parce que c'est une cible que nous étions. Et pourquoi vous êtes égal orteil ? Bien, bien. Donc, nous devons trouver nos x et y suivant Nous allons tot Définir nos données d'entraînement. Asseyez-vous de votre compétence et la sélection de modèle sombre Importer je veux dire dished son esprit. Bien. Maintenant ex train dished, non ? Jean, Pourquoi goûter un rapide à et est retourné X y taille dished En conséquence, nous allons faire 20% taille du texte et je ne sais pas à la place allé visiter Baker Athm. Jusqu' à présent si bon suivant. Avant que nous appelons réellement le Cayenne et classificateur et passé ce train et les données de test orteil le classificateur Nous devons trouver la valeur optimale de K. Rappelez-vous que nous avons fait cet exercice pendant la journée et et en régression. Nous devons faire la même chose pour trouver la valeur optimale hors gay que vous pouvez utiliser ici. Laisse-le faire. Je vais voir ici. Trouvez une valeur optimale. Ok, commençons à partir de c'est Gail et point Neighbors Import nom de clé, Sucette de
naissance de Mad Import. Sq. Nos dents ont eu la route d'Eskil et pas d'importation médicale. Je veux dire, c'est calme. C' est très bien. Commençons. Je vais dire pourquoi un orteil égal, ici, on le voit. Transformez cela, nous devons faire parce que pour ce gâteau imprudent, même les variables cibles doivent être encodées. Il ne peut pas s'agir d'une variable de catégorie. Donc c'est pour ça que je vais mettre les pieds sur l'étiquette, y compris pour la voiture que j'aurai vraiment ? Mais aussi Ok, donc il y a mon étiquette incluse. Sur la prochaine, je vais orteil créer un vide NPR e r Timothy, et commençons pour K dans la gamme 20. Ok équivaut à K plus un. Tu l'as déjà fait. Si vous le souhaitez, vous pouvez copier et coller à partir du carnet précédent programme qui gagne des degrés et bloc-notes même ouvrir et copier à partir de là. Donc, je vais créer une instance à partir d'une croix de voisin ici vous allez. Donc c'est l'exemple Maintenant sur un vaisseau voisin. Et quand on crée l'instance, on a dépassé le numéro et voisin, tu te souviens ? Oh, ici. On va le passer pour passer. C' est K sur maintenant, K puis point fit Nous allons à la fois x et corbeau et calculons la racine e. La moyenne est une erreur. Nous allons orteil une peinture l'orteil de valeur. Celui-ci ici, ceci est nécessaire au cas où vous voulez tracer un graphique. Si vous ne voulez pas photographier, alors vous n'avez pas besoin de mettre les orteils se développe dans cette zone vide. Mais Lester, ça veut dire, c'est des mangeurs d'écumes. Pourquoi même alors Cayenne et sont jolie sur. Et nous allons sur la voie X bien ici. C' est donc notre espace vide. Maintenant, nous allons apporter cette valeur de clé d'impression, et ce sera notre câble ici. Et puis Adam Aceval. Andi, ça va être ce type. Pas mal. D' accord. Et voyons si on a bien compris. Très bien, Lettie. Donc, il est soit sept r huit. Donc, à elle, il est le plus bas et ensuite donner de plus en plus après que l'on regarde et les familles. Donc je vais oublier ça. Commençons par des valeurs. Donc on a eu la Cayenne et la valeur. Alors formons notre modèle de données. Kienan va être k Il porte classificateur et dans ils valent va être C un Très bon. Et puis k n point Si elle et nous allons passer notre échange et l'écrire athm Une fois que vous
avez notre modèle de données pieds sur les données d'entraînement assis. Nous sommes prêts à prédire. Alors pourquoi Break va être gay et prédire l'ex détresse. Bon travail. Maintenant, il suffit de mesurer la précision de notre modèle de SK Len Import Medics sur, puis sprint la précision que je ne pouvais pas marquer pourquoi et puis K puis prédire et ex Bon travail. Très bien. Nous avons obtenu une précision de 93% 93% précision sur K et algorithme classifié. Tu devrais être fier de toi.
25. KNNClassifierDemoUdemy Step2: très bien. Laissez-nous tracer la valeur y le bien réel. Oh, et pourquoi prédit Eh bien, et confirmer à quel point ils sont si proches de tracé. La première chose que nous devons est d'abord, nous devons convertir les deux actes et pourquoi dans notre actuellement X et y ese panda immédiatement après, convertisons-les en MP trois maintenant. Ok, donc ça va convertir X et Yorteil. NPR est très bon maintenant que vous les avez convertis remorquage loin. On peut commencer à les tracer. Donc, disons quatre x e. pourquoi e Dans Jeep X Ray l'obscurité. Il doit être en remorquage. Ça a été dur. XY Nous allons tracer autant d'abord, ça va prendre un certain temps parce que ça va tracer les orteils. Scatter apporté pour chaque point au large X e et y e Très bon. Faisons le peu avec le marqueur fantaisie va être Oh, et la taille va être la taille s. Il est une taille quatre va être remis à gauche. Avec cela laissé à une chose de plus cette couleur mettre. Je pense qu'il y a des valeurs originales, allons
donc comme nous l'avons fait dans le secteur privé. Donne-lui juste des calories. Groupe. Bon travail. Maintenant, nous allons imprimer les valeurs prédites. Donc, ce sont vraiment des valeurs X et Y. moment, nous allons orteil imprimer les valeurs prédites afin que nous allons voir les œufs et au lieu de ça pourquoi il va être ici que en et prédire Ben y Et ils ont commencé à voir ici. Tu vois bonjour et l'inst off. Oh, on va dire « star ». Et nous allons réduire la taille trop à nouveau pour qu'elle parte sur le réel et ensuite nous verrons PST sombre. Alors va prendre un certain temps. Ici, tu vas voir une étoile jaune. Ce sont des valeurs prédites et les points bleus. Ce sont des valeurs réelles et vous voyez des valeurs prédites en plus de chaque valeur réelle. Donc ça marche bien. 24 faible. Ils n'avaient aucune valeur prédictive pour tous les autres cas. Il prédit parfaitement bien. Et c'est pour ça que vous avez obtenu cette précision de 93%. J' ai donc des devoirs pour toi. Que s'est-il passé avec la faible valeur ? Pourquoi d prédiction Waas pas là pour la faible valeur. Il suffit de regarder les données et je pense que vous trouverez une réponse. J' attends votre réponse. S' il vous plaît un message. Je te verrai dans X Director
26. LogisticRegressionIntroduction Introduction: Bonjour, là. plus grand bâton régression est l'un de mes favoris sur l'une des raisons pour lesquelles il est mon préféré est les mathématiques dans le monde en elle. Si vous avez oublié vos mathématiques de niveau secondaire, alors il pourrait être un peu difficile pour vous de comprendre cela. Donc, je vais d'abord vous emmener aux mathématiques de base dont vous avez besoin pour comprendre
rechristen artistique . Ne vous inquiétez pas, je ne vais pas prendre beaucoup de temps. Je vais seulement vous expliquer ce que vous devez comprendre. Le plus grand croissant de la Victoire. Alors parlons. Celle-là. Nous comprenons tous 10 à la mise hors tension deux est égal à 200. Il est très difficile d'oublier jusqu'ici. J' espère donc que nous comprendrons tous cela. Et il n'a pas besoin d'autres explications sur si je dis déconnecter 100 à la meilleure 10. Ça veut dire que je dis ce que le 10 va faire 100. Et la réponse, bien
sûr, est orteil, comme nous l'avons vu ici. Et dans ce cas, hors journal, où la base 10 est Dieu logarithmes communs. Et si j'écris juste le journal de 100 ? Je n'écris pas 10. Ensuite, ce qui se passe dans de tels cas, le rythme est supposé être nombre Do point Même 11 il qui est e sur. Ce genre de rythme lager est appelé logarithmes naturels et il est possible dans s Ln 100 C'est tout. C' est les mathématiques de base dont je parle maintenant que la théorie sur la même fosse gauche déplacer un orteil Comprendre rechristen artistique. Avant de sauter sur la régression logistique, faisons un pas en arrière à ce sujet. Comprendre ? Qu' avons-nous fait dans la régression linéaire rechristen Illini. Et nous avons vu cette formule pourquoi il a appelé Toe B zéro plus Beaven fille Être un Nixon non ? Et nous comprenons que le côté droit de cette équation est le nombre continu le x un x deux x arbre et au-delà. Ce sont nos nombres continus sur le résultat de cette sainte question avec le coefficient est un nombre continu et le résultat sera également un nombre continu que vous
avez travaillé sur le cas est hors prédire l'efficacité énergétique. Très Il y avait des variables indépendantes comme qui étaient diverses caractéristiques de la voiture et vous êtes venu avec le rendement de carburant protégé qui était un nombre continu. Donc entrée sortie de braise continue, nombre
continu. Venons à rechristen logistique plus grande raison Tikrit. Même si le nom dit une grande raison, c'est en fait Ah classifications arboretum et par classifications. Et je veux dire que le résultat n'est pas un nombre continu. Alors commençons du bon côté. C' est la même chose. C' est toujours le même nombre continu. Donc, le résultat du site soit un nombre continu. Mais sur le côté gauche, parce que ce sont les classifications et la technique, le résultat doit être un résultat binaire en cas de plus grande prison décrétée. Donc résultat binaire signifie des valeurs comme oui, non, droit. Wrong 01 Donc ce genre hors de résultat, la ville complexe ici est comment obtenir un résultat Banbury avec les nombres continus ? Et c'est là que tout le plaisir derrière les mathématiques est. Commencez en cas de régression logistique. Pourquoi est rempli de quelque chose comme ça ? Verrouillez B par un moins B. Et celui-ci ici, c'est une probabilité. P signifie probabilité sur tout ça. Sois par un moins. B est appelé art hors résultat art. Donc, sur le journal de cette valeur, rappelez-vous, il n'y a pas de base avec le 10. C' est donc une loi naturelle. Oui. Donc celui-ci est un verrou naturel. Et donc la formule est changée Maintenant pourquoi est remplacé par le journal B par un par P. Donc c'est une formule ici. Cela signifie verrouiller nos gens un par p où p la probabilité est appelée y. Et si je l'élargis encore, alors je viens mieux avec cette formule que P probabilité est égale à un par un plus e couru à moins y. Donc c'est maintenant la partie très intéressante. Pourquoi ai-je fait tout ça ? Parce que dans cette formule, quelle que soit la valeur pour laquelle je mets, j'aurai toujours une probabilité. Valeur et probabilité. La valeur sera toujours comprise entre zéro et un. Donc, cela signifie que je peux toujours obtenir le résultat de ceci comme un nombre continu, qui sera ma femme. Mais au moment où je mets que pourquoi dans cette équation, je vais obtenir la probabilité avec laquelle
sera est entre zéro et un. Tu ne me crois pas ? Ok, faisons ça. J' ai mis plusieurs rivaux ici dans cette formule et c'était mon résultat. C' était ma valeur P. Vous pouvez expérimenter avec plus de valeurs Y sur ce était l'artisanat. Alors maintenant, j'ai un métier. Sont des valeurs de probabilité se terminant de 0 à 1 qu'il s'agit de mes valeurs de propriété, et ce sont des valeurs y. Donc probablement table qui est de 0 à 1 nuit. Mon métier ressemble à ça. Et puis je peux suivre une formule simple que si ma valeur de probabilité est inférieure à 0,5, je dirai pas plus de 0,5. Je dirais oui. Et ici, j'ai changé mon résultat de nombre continu à bine. 80 résultat oui et non. Et c'est pour ça que j'aime rechristen autistique. Les mathématiques de base a fait un résultat de nombre continu toe un résultat binaire. Donc nous allons venir à la plus grande tique régressant. Je te verrai dans le prochain Lecter.
27. LogisticsRegressionDemoUsethisone LogisticsRegressionDemoUsethisone Step1: Bonjour. Il viendra à cette conférence sur le Congrès. Coalescence. Le fait que vous soyez dans cette conférence indique que vous avez terminé une
analyse de régression sur le gain et le classificateur. Nouveau costume vous félicitant. Vous faites de bons progrès. Alors commençons. On va d'abord aux orteils. Importer toute la bibliothèque avec droit ? Vivre à ça. Mais avant ça,
donnons un nom à notre carnet, pas au bâton. Jour de Grayson. Plus d'étudiants pour que je me souvienne. D' accord. Et maintenant importer la bibliothèque. Une chose que je dois dire : Pourquoi êtes-vous avec moi ? S' il vous plaît pratiquer toute cette commande et tapez-la. Ne copiez pas et collez la raison pour laquelle j'insiste sur votre type il parce que vous êtes tellement développé l'habitude. Tu devrais te souvenir de tout ce commandement par cœur. Parce que lorsque vous allez pour une entrevue pour la science des données, notre travail d'apprentissage automatique, notre travail d'apprentissage automatique,
il y a de très fortes chances qu'ils demandent Good. Donc, ils vont vous donner un problème. Et ils vous demanderont de développer un algorithme et vous n'aurez peut-être pas le privilège de copier et coller là. C' est pourquoi utiliser toutes ces conférences. Je suis en train de taper ici. Suivez-moi et développez l'habitude et tapez chaque commande. Ces choses dont vous devriez vous souvenir par cœur maintenant. Ok, j'ai fait ça plusieurs fois, donc je vais aller très vite ici au port no. P I m p Import Bond PD Matt bloqué et je ne sois pas un prat comme ph d. Ok, ensuite, nous allons lire notre combat B d chien, mais manger. Oui, nous ici Q t l'a viré avec quand vous ne savez pas que le dossier. Tu devrais peut-être combattre la banque pleine. Darcy, nous et la banque. Il est, sans doute, CS trois, la pleine a environ 400.000 cartes D. C' est trop grand pour vous d'expérimenter. Tu peux le faire. Mais si vous le faites sur votre propre ordinateur, plusieurs choses comme l'analyse et le si vous écrivez tracent un graphique. Ces choses seront très lentes. Donc, c'est pourquoi je suggère utilisé cette banque et son CSP sans doute, qui n'a que 4000 voitures sur un quotidien effectué dans ce cas, est même Colin. Ok, ils disent qu'on a bien compris. Jusqu' à présent, alors ça. Oui. Quelque chose ne va pas. Oh, ici. C' est la même chose. D' après la vérité, on y va. 21 colonnes. Donc, il y a 20 valeurs fœtales. Et pourquoi ici, c'est notre variable cible. Oui. Non, il aura les valeurs. Oui et non. Donc, il est dit, où est-ce que cela implique ? Mais la banque ? Était-ce produit ou non ? Jusqu' à présent, si bien. Maintenant, ils commencent l'attaque. Florissant l'a fait, qu'
est-ce qu'on fait ? La première chose. La première chose est qu'on a vérifié la gorgée de nos données de point 4119. Ces 21 colonnes sont affichées. Ensuite, nous allons voir les leçons du trimestre. Oh, ici, voyons. Âge. Euh, plutôt bien. Aucune corrélation avec une colonne. Ne ressuscité semble assez bonne campagne. Plutôt bien. Trois jours, mais c'était un bon prix. Divers. Et il semble que ça dépend d'eux avant et celui-ci. Mais nous savons que cela implique variable. Très récemment, Cela va être basé sur les gars employés ou non. Donc je pense que ça devrait être bien. On n'a pas à faire ça, je crois. Quoi ? Ça a l'air bien. On peut faire le deuil maintenant. Quels sont les sujets ? Flores et a l'air bien. Je pense que nous pouvons aller au pré traitement des données maintenant sur les personnes de données. Donc je pense que la première chose que nous allons faire si étiqueter au tribunal tous ces deux. Mais avant que cette lettre sépare nos x et Y parce que nous allons étiqueter au tribunal seulement X. Ils indépendants Très sur Pas pourquoi. Ok, donc c'est très facile. Pourquoi va être cette variable cible ? Pourquoi ici ? Alors pourquoi est très blanc ZDF de cette façon ? Et X va être tout. Mais pourquoi ? Droit ? Ok, tu as point drop ? Pourquoi l'axe il va un bon. On a X et Y. Et la prochaine chose, on va étiqueter les orteils au tribunal. Donc, à partir de là est Galen dot pré-traitement importation au travail dans un quart un cou. Bien sûr, nous allons créer une instance hors étiquette en quart. Jusqu' à présent, si bon. Il y a donc 21 colonnes, dont 20 sont des valeurs en vedette. Nous devons donc inclure 20 colonnes ici. Je ne vais pas les radier un par un. Au lieu de
cela, cette fois, je vais utiliser un loin jusqu'à présent par Dean Range blend off Dark column Donc cela
retournera 21 parce qu'il y a 21 colonnes. Ok, donc cette pente va courir 20 fois. Ça commence. J' ai l'air ouais. BC dot Fit Ne forme pas ex dot J'aime celui-ci. Est-ce que Lettie ? On a codé les colonnes. Ça a l'air bien, mais regardez les valeurs. 12 1 puis pour 24 jours en 1 56 Donc ils sont tous sur une échelle différente. Mettons-les sur la même échelle, non ? Donc ils font ça à partir de Oui. Kailyn sombre pré-traitement importer standard. Il se lève. Et nous sommes là aussi. D' abord, nous allons créer orteil à l'instance Off the tender is killer class. Oui. D d c l à Stander obtenir, euh et ensuite on va se transformer. Ah, oui. Est-ce qu'il point Fit Transform X peu dedans. Plutôt bien, mais tu te donnes le coup maintenant c'est tendre. Le tueur a converti ce X en remorquage comme vous vous battez. Voir ici maintenant il est un Il n'est plus un lien. Un Etat Afrim. C' est pourquoi très je mets la tête, il lui a donné Soto voir d'abord quelques parce que nous devons d'abord converti en bloc de données. On l'a fait de Shame X et puis ou ici on le voit. Ça coulerait ici. D' accord. Très goto. Je les aime. Regarde. Même échelle. Maintenant, il y en a autour d'un. Moins d'un sont dans le coin. On a l'air bien. Maintenant, c'est le bon moment que Toe partage nos données en entraînement et en goûte. C' est ça. Faisons ça.
28. LogisticsRegressionDemoUsethisone LogisticsRegressionDemoUsethisone Step2: de la mort. Guillen dot Murder Collecte importation entre le goût C'est un peu X dentiste. Pourquoi ? Pourquoi le goût va être le goût de train ce split x et Y dist soupirs va être le même point orteil sur un fait aléatoire. Si Fido est bon, amenons cette cassette en Egypte en échange de je vois. Je viens juste de l'adolescence ? Non. Pourquoi ? Juste très bien. Nous avons X train f goût à juste titre et le plus léger. Maintenant, il est temps de tiene de mortier de Oui killen dot années maigres Importer pas autiste Grayson . Et nous ne créer d'abord il est chance hors logistique rechristen Autistic Non, juste chatouillement griffon. Et puis on va s'adapter aux orteils. Tu sais, je vois que le « dark fit » sur le x 10, à droite. Très bien. Donc, notre modèle est en accord avec les données d'entraînement sur. Maintenant ce mortier juste d et je prédis pourquoi le commerce de soulignement va être la fléchette de la mer jaune. Prédire les choix Dist ! Génial. Donc, nous avons eu notre prédiction. Maintenant, Lay fait une grande précision sur nos valeurs y. Comment l'équité considéré ainsi de si tuer les médicaments d'importation imprimer, il pourrait avoir des tiques de mitaines C. Ne pas que ça pourrait isi C'est bien. Pourquoi tante, faisons tourner notre Mer Jaune, pas prédire X sont ici. Donc, au lieu de juste mettre X test, nous allons prédire l'ONU complète X et par rapport à la valeur réelle y 91% Je dois dire que c' est un très bon score demandes logistiques orteil et convient très bien pour cet ensemble de données levage. Voir les valeurs réelles suffisantes de l'entreprise avec les valeurs prévues.
29. LogisticsRegressionDemoUsethisone LogisticsRegressionDemoUsethisone Step3: très bien. Nous allons donc créer une nouvelle donnée de D F. Trois avec des valeurs réelles sur prédites. BD Dot Data Fame. La valeur réelle va être Pourquoi ne pas perdre sur les valeurs prévues vont être ce gars Elsie , prédire cet acte et il va continuer ici. Ensuite, nous allons imprimer les trois, réel et prédit sont accouplement. Si je dis 1ère 15$, tout correspond. Alors pourquoi ne pas écrire quelque chose pour que nous puissions comparer le réel et prévu pour tous les 4119 2 voitures ? Listo, que nous allons écrire une petite pipe et la cour pour comparer nos valeurs réelles avec les valeurs prédites pour chaque carte 4119 D sur elle nous donnera le nombre d'enregistrements pour lesquels n'a pas d'importance avec les valeurs prédites. Alors commençons. abord, nous allons mettre notre compteur à zéro, et ensuite, nous allons courir un loin pour moi en changeant le jour de trois, qui va revenir 4100 fois ici. Donc je vais courir de 0 à 4119. C' est pour tout ce qui a écrit sur. Nous allons comparer réelle avec le prédit donc donner de trois fléchettes idoc I zéro, qui est en fait n'est pas équipé pour faire vous avez trois noir j'aime, Je veux qui est prédit puis incliner le compteur par un. Et à la fin, on va battre le compteur. Alors allons courir ce puits ici 3 56 enregistrements. Donc, cela signifie sur 4119 seulement 3 56 3 cartes ne sont pas atteints avec la valeur prédictive. Donc, le réel ne correspond pas avec prévu pour 3 56 règles C'est très moins pour 4119. Donc vous avez un très bon meurtre. Bien sûr, je comprends ces 3 56 qui auraient pu calculer le poids sur la monnaie aussi. Mais je voulais juste que vous puissiez aussi écrire une bouchée et aller faire la même chose sur les personnes recherchées. Un combat frénétique au tribunal est que vous pouvez réellement voir tous ces regards où ces puits n'
a pas été rencontré. Vous pouvez imprimer tous ces DF trois. Je regarde ici et vois tous ces coûts. Bonne coalescence congrès une fois de plus, vous avez terminé la logistique régressant sur Avec le taux de
succès de 91%, vous avez été en mesure de prédire si les clients ont acheté le produit de
dépôt bancaire ne sont pas. Vous pouvez utiliser la même chose, même logique dans d'autres données. Asseyez-vous également des ensembles de données et pratiquez-le. Bon travail. Je te verrai dans les prochaines conférences.
30. Machine vectorielle: Bonjour là. Bienvenue à cette conférence. Continuons à travailler sur ces mêmes sources de données. La source de données Nous avons travaillé pendant la logistique rechristen A très dans un waas banquier essayant vendre un dépôt bancaire orteil leurs clients sur DA Nous avions une source de données sur 4119 hors de leurs leçons sur. Sur cette base, nous essayions de prédire si le client protesterait ou non le produit du dépôt bancaire . Pendant le plus grand croissant de Victory, nous avons pu prédire jusqu'à la précision de 91% sur 4119. On a 3 56 prédisent le syndrome. Travaillons sur le même ensemble de données et voyons si nous pouvons obtenir une certaine amélioration Si nous
suivons la machine vectorielle de support. Ok, commençons d'abord nous avons besoin d'importer la machine vectorielle de support. Donc, à partir de l'échelle et pas Oui, VM Comport. Oui, on voit. Et ensuite, nous devons créer l'instance hors. Oui, on voit. Donc oui, nous voyons classificateur. Bien sûr que vous pouvez donner n'importe quel nom ici, non ? Tu le sais, non ? Oui, nous voyons alors je ne pourrais jamais ce procès e près du colonel d'abord. Donc des années maigres, puis aléatoires. L' état zéro activé. Alors on va l'adapter. Oui, on voit. Classy Fire dot Fit libre pour être ex train sur blanc tendance. Très bien. Jusqu' à présent, si bon. Donc on a le Ah, oui. Vous voyez, Classé défini. Et nous avons équipé les données d'entraînement. Maintenant que notre modèle est formé, obtenons la valeur prédictive. Pourquoi enchérir ? Oui, on voit Grassy pour les cheveux égaux Oui, on voit Classy feu fléchette, je prédis. Et on va passer X dist ! Très bien. On a ça. Les prochaines lettres. Découvrez l'exactitude cette fois et nous l'avons déjà ici. Alors qui énergie avec la même chose ? Nous n'avons pas besoin d'importer à nouveau des médecins parce qu'il est déjà importé dans ce cahier que nous avons fait dire mes joues, et puis juste parler de ce gars ici. Euh, pourquoi ? Et la barre voir le texte ST FX. Tu n'as pas plus X 9164 Voyons ce que Wasit avant 9135 Donc petite pièce de menthe ? Pas peut-être, en fait. Oui, donc il y a des améliorations, mais pas beaucoup. Maintenant, voyons comment Maney parce que notre est toujours faux. La dernière fois dans la logistique est d'accord. Et c'était 3 56 et cette fois, je ne vais pas écrire la même logique cette fois. On va utiliser des matières confuses. Faisons ça. Ok, donc de la terre DSK, pas des médecins Import confus Matics ici. Disons C Ah, l'eau. Oui, on voit. Je n'ai pas ffconfondu les médecins égaux confondre et mes tours. Et ici, nous allons passer les orteils. Pourquoi ? Et le rival prédit Lou. Donc ce type, ils voient de leur mieux ici. Ok, et puis on a jamais imprimé nos médecins confus. Ok, j'
espère que je n'ai fait aucun type de lesbienne. Ok, Hashem. Donc, 2 72 plus 72. Donc, environ 3 44 voitures à tort sont toujours là. Sur 4119. Donc 3 44 mauvaises prédictions. Il y a donc une amélioration. La dernière fois, il était 3 56 Cette fois, il est seulement 3 44 Donc 14 Ah, meilleures prévisions maintenant, par rapport à la dernière fois orteil une certaine amélioration dans le prochain Lecter. Nous allons utiliser le colonel différent, pas un linéaire mais un RB de Colonel sur. Nous verrons s'il y a une amélioration
31. Machine vectorielle: Bonjour là. Bienvenue à cette conférence. Continuons à travailler sur ces mêmes sources de données. La source de données Nous avons travaillé pendant la logistique rechristen A très dans un waas banquier essayant vendre un dépôt bancaire orteil leurs clients sur DA Nous avions une source de données sur 4119 hors de leurs leçons sur. Sur cette base, nous essayions de prédire si le client protesterait ou non le produit du dépôt bancaire . Pendant le plus grand croissant de Victory, nous avons pu prédire jusqu'à la précision de 91% sur 4119. On a 3 56 prédisent le syndrome. Travaillons sur le même ensemble de données et voyons si nous pouvons obtenir une certaine amélioration Si nous
suivons la machine vectorielle de support. Ok, commençons d'abord nous avons besoin d'importer la machine vectorielle de support. Donc, à partir de l'échelle et pas Oui, VM Comport. Oui, on voit. Et ensuite, nous devons créer l'instance hors. Oui, on voit. Donc oui, nous voyons classificateur. Bien sûr que vous pouvez donner n'importe quel nom ici, non ? Tu le sais, non ? Oui, nous voyons alors je ne pourrais jamais ce procès e près du colonel d'abord. Donc des années maigres, puis aléatoires. L' état zéro activé. Alors on va l'adapter. Oui, on voit. Classy Fire dot Fit libre pour être ex train sur blanc tendance. Très bien. Jusqu' à présent, si bon. Donc on a le Ah, oui. Vous voyez, Classé défini. Et nous avons équipé les données d'entraînement. Maintenant que notre modèle est formé, obtenons la valeur prédictive. Pourquoi enchérir ? Oui, on voit Grassy pour les cheveux égaux Oui, on voit Classy feu fléchette, je prédis. Et on va passer X dist ! Très bien. On a ça. Les prochaines lettres. Découvrez l'exactitude cette fois et nous l'avons déjà ici. Alors qui énergie avec la même chose ? Nous n'avons pas besoin d'importer à nouveau des médecins parce qu'il est déjà importé dans ce cahier que nous avons fait dire mes joues, et puis juste parler de ce gars ici. Euh, pourquoi ? Et la barre voir le texte ST FX. Tu n'as pas plus X 9164 Voyons ce que Wasit avant 9135 Donc petite pièce de menthe ? Pas peut-être, en fait. Oui, donc il y a des améliorations, mais pas beaucoup. Maintenant, voyons comment Maney parce que notre est toujours faux. La dernière fois dans la logistique est d'accord. Et c'était 3 56 et cette fois, je ne vais pas écrire la même logique cette fois. On va utiliser des matières confuses. Faisons ça. Ok, donc de la terre DSK, pas des médecins Import confus Matics ici. Disons C Ah, l'eau. Oui, on voit. Je n'ai pas ffconfondu les médecins égaux confondre et mes tours. Et ici, nous allons passer les orteils. Pourquoi ? Et le rival prédit Lou. Donc ce type, ils voient de leur mieux ici. Ok, et puis on a jamais imprimé nos médecins confus. Ok, j'
espère que je n'ai fait aucun type de lesbienne. Ok, Hashem. Donc, 2 72 plus 72. Donc, environ 3 44 voitures à tort sont toujours là. Sur 4119. Donc 3 44 mauvaises prédictions. Il y a donc une amélioration. La dernière fois, il était 3 56 Cette fois, il est seulement 3 44 Donc 14 Ah, meilleures prévisions maintenant, par rapport à la dernière fois orteil une certaine amélioration dans le prochain Lecter. Nous allons utiliser le colonel différent, pas un linéaire mais un RB de Colonel sur. Nous verrons s'il y a une amélioration
32. SVM RBF: Bonjour. Il reviendra. Donc la dernière fois, nous avons utilisé la zone linéaire charnelle de Lini. Colonel Sveum. Et nous avons obtenu 91% de précision et nous avons eu 44 dossiers. Toujours prédire mal. Eh bien, maintenant nous allons utiliser le colonel RBF, et voir s'il y a des améliorations. Alors allons-y. Copier. Cette année, pas ce type. Copié, c'est bien. Ici, nous sommes rapportés le spc. Donc, nous n'avons pas à l'importer à nouveau. Et si vous rouvrez ce cahier, bien
sûr fait chaque course ici Andi utilisé Sélectionnez ce gars. Ok, ok. Disons son état désactivé. Oui. Tu vois, classificateur, laisse-moi terminer ici, ok ? Et maintenant, au lieu de linéaire, nous allons dire rbf sur. Je vais nommer ça différemment. Euh, ça pourrait être si et puis un de plus soulignait. Je le serais si et c'est tout. D' accord. Très bien. Donc, l'instance de classificateur Rbf a été créée sur Faisons la prédiction maintenant soulignée R B si sur elle, donnez sur Dixon. D' accord. Nous avons eu notre prédiction sur la date mesurer l'exactitude. Très bien. Donc, cette fois, c'est mieux. C' est un 93%. La dernière fois, c'était 91%. On a donc obtenu une amélioration de 2%. Voyons voir, nos métriques déroutantes sont toute amélioration du nombre de prédictions erronées. Ah, c'
est ça. Pourrais-je l'être ? Oui, sur. OK, là. Tu vois ? 27 51. Alors fais 70 le. Oh, il y a une énorme amélioration que l'amélioration ? Environ 66 enregistrements. Oui. Donc maintenant, le nombre total de sens des critiques rondes est descendu à 78 par rapport à 3 44
Nom . Il y a une amélioration de 64 cartes D. C' est un groupe. Bonne amélioration sur il y a un assez off 50 93%. Donc, il semble que je serai de Colonel est mieux adapté dans ce cas de données, puis le Lee près de Cannon Art dans les six plus grands de plus. Donc, la conclusion est jusqu'à maintenant nous étions en utilisant RV du Colonel pour ces données. Ok, très bien. Nous allons continuer à regarder d'autres algorithmes. Onda. Bonne mélodie. C' est donc je te verrai à la prochaine conférence
33. Probabilité totale de BayesThereom: Bonjour là. Bienvenue, à ce Richter. Il est temps de parler de basé ici, mais avant de faire une plongée plus profonde à Beith ici, hum, examinons les bases sont la probabilité, et cela vous aidera à rafraîchir vos connaissances hors probabilité sur. Après cela, nous allons étendre le même problème. Deux. Basé ici. Commençons. Considérons que vous avez deux boîtes. Boîte un avec au genre de balles, neuf boules rouges et cinq boules bleues, puis boîte faire avec encore une sorte de boules. Quatre. Boule rouge sur 11 boules bleues. Jusqu' à présent, si bien. Maintenant, vous êtes en train de choisir à propos de vous ne savez pas à partir de la boîte de rythme. Tu viens de ramasser tout. Et maintenant, tu dois trouver la probabilité que tu aies choisi cette balle dans la Box 1 et ensuite quoi ? Il est probable que vous choisissiez une balle bleue dans la boîte 1. De même, quelle est la probabilité que vous choisissiez une boule rouge de Box à être ? Quelle est la probabilité de quelques ramasser une balle bleue de la boîte à ? Ce sont donc quatre options qui auraient pu arriver. Vous avez peut-être choisi une boule rouge de boxe ou une balle bleue pour Ambac. L' un d'entre eux est le ballon rouge, de Bach à l'orteil global de la boîte avant. On va aller aux pieds. Trouver la probabilité de chacun d'entre eux dans une affaire très simple. Alors commençons. D' abord. Nous devons même faire de l'événement. Celui que nous pouvons choisir dans cette boîte sont même orteils. On peut choisir le patron épaissi. Donc, deux possibles, même vous pouvez choisir parmi ces livres sont de cette boîte. Il n'y a que deux boîtes. Donc la possibilité que quelques ramasser la balle de la Box un est un par deux. Parce qu'il n'y a que deux événements possibles. n'y a que deux boîtes, donc le nombre total de combinaisons possibles est de sortir de cela. Si vous choisissez dans la case un, la probabilité que cela se produise est un par deux. De même, la
probabilité de cueillir de la boîte à est un par deux. Laissez-nous pleurer quelle est la probabilité de cueillir boule rouge de la boîte quand il y a neuf
boules rouges et il y a 14 nombre total de pièces, donc probablement quelques ballons rouges cueillant de la boîte un est neuf par 14. De même, la probabilité. Quelques balles bleues de cueillette de la boîte 1/8 cinq par 14. De même, probablement hors cueillette grande balle de la boîte à manger quatre par 15 Nombre total de pièces est 15 Redwall quatre donc quatre par 50 et probablement une boule bleue de cueillette de Bach à est l A. Gagné par 15. Jusqu' à présent, si bien. Maintenant, commençons à calculer les probabilités. Commencez par le 1er 1 sans doute choisir une boule rouge de la boîte un, sorte que ce serait même multiplié par P. R. Même PR, même si vous choisissez boule rouge, compte tenu de la première boîte compte tenu de la premier événement est arrivé, sorte qu'il est appelé P sont considérés, même arrivé. Et qui est, si vous multipliez p même et P R conditionné même arrivé,
cela vous donnera la probabilité de choisir boule rouge de la Box un afin que serait gagné par deux. Multiplié par neuf par 14. Ce serait neuf par 28 32% de probabilité. Qu' est-ce qui est probablement hors de toi ? Tu as encore choisi la balle bleue de la Box un ? Un par deux sur cinq par 14 cinq par 28 18% environ 18% de la même façon probablement hors de cueillir une
boule rouge de la boîte à un par deux en quatre par 15 pour par 2013% Probabilité sur la probabilité de ramasser une balle bleue de la boîte à ainsi un par deux dans le remorquage, Loon par 15 37 %. Donc, ces réponses à la question derrière chaque probabilité. Maintenant, vous pouvez calculer n'importe quel type de probabilité possible. Donc, quand vous choisissez une balle, vous savez quelles autres propriétés en dehors de la cueillette d'une boule rouge sont des ballons bleus de l'une ou l'autre des boîtes après ? Alors, qui a le maximum de probabilité ? La probabilité mexicaine est que ce statut ? 1 %. C' était le maximum de probabilités. Vous finirez par ramasser une boule bleue à l'orteil de la boîte. Ça fait une probabilité de bombe. Si je le dois. Quel argent sur ce, alors je vais mettre mon argent sur celui-ci parce que celui-ci a des chances plus élevées de se produire 37% . Donc, c'est un arrière-plan de base hors probabilité. Comment le probablement le fonctionne. Ok, quelle est la probabilité totale que vous choisissiez une propriété de fille crédible. Donc, cette demi-probabilité de choisir Redwall à partir de la boîte un et cette probabilité WAAS de cueillir boule rouge de la boîte à si la probabilité totale sont cueillir boule rouge est pointue appuyez 0,13 point 45 sur. Rappelez-vous ces événements mutuellement exclusifs de l'armée ? Cela signifie que vous ne pouvez pas mettre votre main dans les deux boîtes ensemble et il y a deux boîtes Donc lorsque vous mettez votre main à l'époque, vous ne pouvez mettre votre main que dans une seule boîte. Droit ? Donc, le deuxième événement ne dépend pas du premier événement. Ils sont mutuellement exclusifs événement. Donc, c'est pourquoi si vous devez calculer quelle est la probabilité totale de choisir une
boule rouge dans l'une ou l'autre des boîtes ? Ce serait un point pour cinq. Ce serait au total de ce Prestes. De même, la probabilité
totale de choisir une balle bleue sera de 0.1 il plus 0.37 point +55 Et
voici la meilleure partie de la partie que nous attendions tous. Considérez ces mêmes que vous avez la boîte un et aboyer trop même nombre. Offrez-lui des balles et des boules bleues. Exactement. Même situation. Mais la question est différente. La question est que tu as choisi une boule rouge. Andi, quelle est la probabilité que ce mur rouge soit de la seconde ? C' est une situation intéressante. Tu as déjà une boule rouge. Vous n'aviez pas besoin de découvrir la probabilité que cette boule rouge soit de boîte à Et ce genre de probabilité est appelée probabilité de e à l'orteil pair, considérant si la boule rouge de sorte que la paroi rouge qui est déjà considérée comme une boule rouge est déjà considéré Vous avez déjà inquiet. Maintenant, nous devons trouver une probablement sur cette boule rouge étant du parc à, Alors voyons ce que nous avons fait dans le problème précédent. Donc, dans le problème précédent, on a découvert différents types de probabilités, non ? Propriété off Si je ramasse toute probabilité de leur être de la boîte une boîte à sur la probabilité
de cela étant lu à partir de la boîte un bleu de la boîte sur notre rouge de l'orteil de bach et bleu de l'
orteil de Bach sur ce qu'un total, probablement TF qu'étant lu étaient, dit Prue. Maintenant, nous devons trouver la probabilité que cette balle soit que Redwall soit de deuxième boîte sur ce genre de propriété est calculée en utilisant basé ici. Besteed um dit que P F E à R est égal à p f e. Deux probabilités de e deux et probablement TF envisagent Ito par probabilité totale de coeur , et vous avez déjà calculé ces valeurs. Probablement F E deux est un par deux propriété de notre que la cueillette rival Tia cueillette Redwall de deuxième boîte Waas quatre par 15 sur Porter Probabilité hors de la balle de taux de cueillette soit hors boîtes Waas 45% Droit sur. C' est ainsi que si vous pouvez créer, il descendra à quatre par 13,5. Donc, la technologie 2%. Répondez donc à cette question que si vous avez une boule rouge, la probabilité que cette balle soit de la boîte à 30% sur ce genre de question hors est répondue en utilisant basé ici. Donc, c'est basique basé ici.
34. Introduction à Naive Bayes Theorem: Bonjour là. Bienvenue au District. Donc vous avez appris à vous baser ici ? Dans la conférence précédente. Comment est-ce basé ici ? Um appliqué dans l'apprentissage automatique pour répondre à cette question. Dernier regard sur cet exemple, cet exemple contient des données sur 1000 fruits. Ça peut être une banane ardente. Y a-t-il un autre type de fruits là-dessus ? Les fruits sont identifiés en fonction des caractéristiques comme si elle est longue sont si elle est douce , ne
sont pas à elle ou si elle est L o r pas. Regarde. Donc vous avez ces trois fonctionnalités sur vous avez les cours. Considérons trois classes. Si vous avez reçu au hasard les caractéristiques comme long, doux et bas, serez-vous en mesure de dire quel genre de fruit il s'agit ? Que ce soit la banane, orange sont tout autre type de fruit et c'est un problème que nous allons résoudre en utilisant basé ici. Mais si vous avez remarqué ou ici est appelé base de couteaux, pas appelé base. La raison pour laquelle il est appelé Ni basé parce que quand il s'agit d'utiliser basé ici, um, dans l'apprentissage automatique, il y a un grand A, un peu de soleil fait et il ya un peu de soleil est que les caractéristiques ne sont pas liés orteil l'autre et c' est pourquoi on l'appelle ma base, car en supposant que les fonctionnalités de vos données ne sont pas liées les unes aux autres, si quelque chose qui ne se produit pas très souvent, et c'est pourquoi on l'appelle couteau. Donc, quand il s'agit de l'apprentissage Massie, il s'appelle maintenant basé ici, passons à autre chose. Donc, une fois de plus, vous avez 1000 observations sur les fruits, la
banane, orange et tout autre type de fruits sur ces fruits sont identifiés par les caractéristiques longues, douces et basses. Et si vous êtes donné un long doux sur un bas comme une caractéristique, serons-nous en mesure de dire si elle est orange banane sont tout autre type de nourriture ? Et c'est un défi que nous allons résoudre en utilisant la nuit basée ici. C' est donc le défi ici. J' ai un fruit aléatoire, ce qui est faux, doux et un faible prédire si elle est orange, banane sont d'autres sortes pour résoudre ce problème. La première chose à faire est de résumer ces données dans ces données. Vous voyez, là les classifications et, par
exemple, est orange sur elle. Zéro sur sont un basé sur si l'orange est un bas, doux le long. Donc, dans ce cas, cet ardent waas un regard. Donc c'est Marcus un Pour les autres, c'est zéro. De même pour la banane C'est une longue cette banane était longue, douce et amoureuse. Donc c'est notre marque. Le meilleur pour ici Il y a une autre banane qui est longue mais pas douce et pas beaucoup. Peut-être que ce n'est pas mûr correctement comme ça il y a 1000 enregistrements. Donc convient pour résoudre ce problème à venir la probabilité que nous avons d'abord de résumer les données résumées le décompte de chacun de ces en fonction des classifications, les classifications est que nous allons être notre blanc sur toutes ces fonctionnalités est ce qui se passe Pour être notre X. Donc, nous allons un Voici les données quelqu'un Maintenant j'aide ces données J'ai entendu ces classifications Donc trois classifications que j'ai est banane sont dans d'autres Ces trois classes sont comme nos trois événements. Donc d'abord vous vingt, disons banane chips banane Si je cueille un fruit, quelle est la probabilité ? C' est de la banane. C' est 500 par milliers, non ? Il y a le quart 1000 aliments sur ces 500 sont de la banane. Donc, la probabilité qu'elle soit banane est de 501 001 par deux. Allons-y un. Qu' est-ce qui est probablement après que cette banane soit longue ? Donc 400 par 504 par 5. De même, quelle est la probabilité ? Après la banane étant douce, il assis Marana 3 50 par 500. Quelle est la probabilité après que la banane soit faible ? Bonjour 4 50 par 500 ? De même, quelle est la probabilité que ça soit orange ? C' est facile 300 par 1000. De même, vous devez calculer la probabilité de cela. ne fait pas longtemps qu'il n'y a pas de propriété hors cours qui ne sont pas gentils ? 1 50 par 300 gagné par deux probabilités de ce sont tout être une histoire d'amour terminé avec 301. Donc, c'était toutes les oranges sont de couleur jaune. Ok, un, disons d'autres fruits. Si je cueille un fruit, quelle est la probabilité que ce soit un autre type de fruit ? C' est un sur cinq. Et alors quelle est la probabilité que cet autre type de nourriture soit long 100 par 200 ? Quel est probablement tout ce genre de fruit qui est sucré ? 1 50 par 200. Quelle est la probabilité que cet autre type de fruit soit Hello ? 50 par 200. Donc un par quatre. Très bien. On a cette probabilité en ce moment. Calculons la probabilité de fille E. J' ai pris un repas. Quelle est la probabilité que ce fruit soit long ? Comment calculez-vous ça ? Vous multipliez ce BB en remorque. Pierre, sois alors B o en remorque. Être hors l avec conditionnelle probablement hors autre probablement hors l avec des conditions autres. Et c'est comme ça que vous allez avoir la probabilité que ce fruit que vous avez choisi soit un
fruit long . Et ici, il s'agit d'en trouver cinq. De même la probabilité de ce fruit étant un fruit sucré est ceci est comment vous allez tuer Clip sur il vient à trouver 65 et probablement de cette nourriture étant l un aliment. C' est 0,8. Donc c'est notre probabilité totale. Si je ramasse des fruits, quelle est la probabilité que ce fruit soit long ? Sont être doux sont être un faible Donc nous avons obtenu l'individu Probablement être hors de chacun de ces possibilités sont Maintenant vient notre question avec laquelle nous commençons cette conférence. La question est, si vous choisissez un long fruit sucré et l o, quelle est la probabilité d'être banane sont ardents sont autres. Fondamentalement, nous devons prédire si je prends un costume et un fruit bas, que sera-t-il ? Que ce soit la banane ne sont pas d'autres types de nourriture. Ce genre de pain. Dixon, tu peux utiliser des couteaux à base de lui. Voyons comment vous avez déjà vu que dans le sérum basé, nous allons utiliser la même formule même logique sur étendu à l'ère basée sur la nuit et résoudre ce problème. Donc probablement ils cueillent une banane comme parler le long sucré sous un aliment faible Long, doux et bas. Quelle est la probabilité que ce soit une banane ? Vous avez vu cette ferme basée ici ? C' est la même formule. La formule dit Pebe en B l par B et ensuite être doux avec conditionné. C' est une banane. Puis la propriété d'un bas avec la condition est la banane, puis divisé par probablement hors
propriété Long de doux et probablement de pourquoi c'est la probabilité de torture. Et si vous faites cela, si vous mettez toutes ces valeurs dans la formule, vous obtenez une probabilité de 0,97. Être banane est 0.97 Laissez quelqu'un de même, quelle sera la probabilité d'être orange la propriété de ce étant Oren sera zéro parce que la propriété hors ne sont pas longues. Est zéro donc hors cours Ce n'est pas un ardent parce que probablement hors sont en être long, qui est l'un des critères dans ce et la classe est zéro, Donc ce n'est pas sont en costume. Quelle est la propriété hors d'elle étant autre pied même. Mettez la formule ici sur mettre les valeurs probablement d'être n'importe quel autre fruit est 0.7 Alors qui est le gagnant ? La Vénus est une banane. C' est ainsi que vous pouvez prédire les classifications et tout nouveau fruit. Si vous savez que les caractéristiques sont que les fonctionnalités de fruits hors du point, Considérez cela comme un ensemble de données juste là. Est-ce qu'il a 1000 dossiers ? Si vous ajoutez une nouvelle donnée et que vous connaissez la fonctionnalité des données en utilisant la nuit basée ici, um, vous pouvez classer très Est-ce que les données appartient ici. Nous avions trois classifications et nous avions trois fonctionnalités à jouer et nous avons pu prédire que de nouveaux points de données appartiennent à des classifications toe vit en utilisant la nuit basée ici. Ensuite, nous allons parler de comment et où dans l'apprentissage automatique cette ère basée sur la nuit est utilisée. Nous allons parler d'exemples du monde réel où le héros de nuit basé Il est un très utile sur la façon dont il est utilisé. Je te verrai à la prochaine conférence.
35. GaussianNB: Bonjour. Il viendra orteil cette conférence sur les mains sur la pratique hors nuit basée ici, euh, dans Massillon e neuf basé ici, um, peut être étendu à Massillon sous plusieurs formes sur l'une de la ferme d'usage commun est appelé Abeilles de nuit gardienne. Cause Ian basé sur le couteau suppose que les entités de vos données suivent la distribution normale. Vous avez déjà tracé la distribution sur les données de la fonctionnalité dans les conférences précédentes dans les mains précédentes sur la pratique est en utilisant Seaborn et vous savez comment ni la modestie Wilson
ressemble . Donc, si vos données, vos entités correspondent à des distributions normales, alors vous pouvez utiliser le classificateur basé sur Goshen NY pour classer vos données dans cette conférence dans cette main sur le nectar. C' est ce que vous allez faire. Alors commençons pour ça. Je n'ai pas déjà écrit le programme du département pour cette fois, je vais passer par tout le tribunal des brevets que j'ai écrit sur ce cahier de Jupiter. Le code python dans ceci est déjà là. J' ai dit, c'est aussi cette conférence pour que vous puissiez la prendre et que vous pouvez l'écrire vous-même. Alors commençons. Bien sûr, le premier, vous devez importer toutes les bibliothèques importantes pandas MP. Matt a apporté P un complot Seaborn et s Kaylan Matics. Droit. D' accord. Une fois que vous importez toutes les bibliothèques suivantes, vous allez à la pointe. Lisez la banque. Des fléchettes supplémentaires ? Oui, on a déposé en remorquage. bloc de données Pandas imprimé le F a été touché. Ce sont les mêmes données que vous avez utilisé dans les mains précédentes sur les pratiques Ne gain et les incendies classe et autres classifiés Vous allez utiliser les mêmes données. Asseyez-vous. Voyez s'il y a des améliorations avec Gaussian Bay Classé. Droit ? Donc, comme vous l'avez fait avant, créez le lien un état après lui et imprimez juste la hanche. Très bien. 21 colonnes, corriger. Voyons les corrélats et encore une fois. Rappelez-vous, en cas de nuit basée ici, um, l'hypothèse est et le plus important Ah, certains facilité envoyé que les caractéristiques ne sont pas du tout dépendent les uns des autres. Ils sont complètement indépendants. C' est pourquoi Laissez-nous passer en revue le Coriolis et encore une fois sur mélanger votre dépendance parmi les fonctionnalités est supprimée. Donc Randy de après la cour sur Examinons ceci maintenant ou ici si vous voyez cette année. Oh, Bharti um est 0.94 lié à impliquer qu'ils étaient là très liés les uns aux autres, donc vous devez en retirer un de eux. Alors je vais aller au déménagement. Vous savez, bombe, celui-là sur la prochaine est par ici, implique qu'ils avaient raison, pas vrai. C' est 0.97 lié à ce type. Ok, alors que l'un était aussi aller orteil enlevé. Ok, alors passons à autre chose. Supprimons ces deux fonctionnalités du bloc de données. Exécutez cette commande sur. Nous allons diriger le Corey. Écoutez à nouveau sur je pense que cette fois ça a l'air mieux. Je ne vois plus de fonctionnalités fortement corrélées, donc nous pouvons nous voulons que nous puissions continuer avec ces fonctionnalités sur. Il est temps de définir votre chemin et de définir votre ex. Et maintenant la même chose que nous avons à faire étiquette y compris sur ce est le même combat à la cour Urine dans les conférences précédentes. La même chose ici. Faites le niveau. Selon une impression moins après cela. Voyons à quoi ressemble notre X après ça, juste ici. Ok, ils étaient dedans. Selon est fait. Les sorties sont un et sont les seuls contient les nombres, donc le niveau, y compris ceux Bon sur la prochaine. Un standard est un tueur ici. Laissez-nous imprimer le X à nouveau voir si elle est bonne. Oui. Toutes les valeurs sont plus ou moins. On dirait que tout a écaillé les haricots. Bien sur. Maintenant, c'est ce dont nous parlions. Toutes les fonctionnalités doivent suivre. District normal n'était pas si j'ai écrit c'est plus programme ici très dans. Je fais une boucle pour toutes les colonnes. Donc si vous buvez cette porte de sortie Sape, si je vais ici, disons que je vois X ne sirote pas. Je comprends ça. 4119 croissance et 80 colonnes. Donc 18 fonctionnalités directement sur. J' ai les orteils dessiner cette intrigue pour tous les 18 sur eux pour m'assurer que le tout suivant notre modestie n'était pas sur. C' est pour ça que je fais cette boucle. Si je dis Xscape un qui gagne, il sera 18 ici. Je dirige ce toit pour la portée de ce nombre de colonnes. Ainsi, les enfants pour chaque colonne sur elle feront la perturbation de la mer et le complot. Tout de suite, je suis en poursuite. Ça a amené ici. Si vous regardez, tous suivent une distribution normale comme celle-ci. Cette gorgée biblique indique une situation normale à Wilson. Donc on est bon d'y aller ensuite. Comme toujours, nous appellerions la sélection de compétences et de mortier sur les testicules contaminés Pleat, Nous allons orteil diviser les données dans l'entraînement et la taille de test site va être point toe . Jusqu' à présent si bon sur ou ici via dans la marche gaussienne nb droite,
Donc, de s Kellan Dark Knight importation base prudence Et nous avons créé instance au large Gaussien et nous avons ensuite nourrir les données de coloration de l'étendue et blanc est allé à gaussien nb très bon. Une prochaine, nous allons prédire ou ici passé les données de test et prédire les valeurs y sur ici Nous calculons la précision. Malheureusement, la précision est 88% ce qui est inférieur 10 désintégration dans et et d'autres algorithmes Nous avons suivi dans Richter
précédent. Mais néanmoins, vous avez l'idée de comment Gaussian et nous pouvons être utilisés pour de tels problèmes . Personne de nous aurons les mains futures sur la pratique est où nous allons utiliser Gaussian et nous Andi, avec le taux de précision élevé sur ce est juste la vie réelle. C' est ce qui se passe dans la vraie vie. Vous appliquez beaucoup d'algorithmes beaucoup de classifications sur la base de la précision que vous saurez quel algorithme correspond va remorquer ces données sur. C' est exactement ce que nous faisons ici en ce moment. Vous savez comment est entré et nous pouvons être utilisés pour ce genre après qu'il est très dedans. Vos fonctionnalités étaient une distribution normale. Donc, parce que vous êtes des entités ont suivi des distributions normales. Nous avons essayé d'utiliser Gaussien et être sur ce est l'enregistrement de précision dans la prochaine conférence. Nous allons orteils utilisés sont différents types hors base de nuit, deux problèmes différents et voir à quel point la précision vient. Ok, je te verrai à la prochaine conférence.
36. MultinormailNaiveBayes: Bonjour là. Félicitations pour avoir appris sur le sérum bête. Andi complète une pratique sonore de la main la nuit gaussienne. Pissé. J' espère que vous comprenez maintenant la beauté derrière ny basé ici. Hum, et comme il est facile à utiliser, comme vous l'avez vu, la base gaussienne est maintenant utilisée pour ven vos fonctionnalités Suivez la distribution gaussienne simple. Il y a une autre pièce de couteau très intéressante et qui est multi Namir nuit. Beth. Dans ce cas, les caractéristiques suivent simple Martina simple distribution sur ce type de classifications. DeMartino mia classifications basées sur la nuit est le plus approprié pour les fonctionnalités qui représentent compter nos pays. Donc, ce type de classification est utilisé en cas de cas. Par exemple, une classification de document. Juste incroyable. Il y a un document et vous voulez orteil. Comprendre ? C' est quoi ce document ? De quoi ça parle, non ? Une façon de le faire est de lire le monde entier dans leur document, puis de connaître la fréquence de chaque monde. Donc, si elle utilise, par
exemple, les mondes politiques plusieurs fois, alors il est document lié à la politique. Si elle utilise religieux étaient trop de fois. Et ce sont des documents liés à la religion. De même, vos courriels peuvent être filtrés car les courriels de spam ne sont pas normaux. E-mail basé sur le contenu. Il y a quelque chose comme des meurtres G. Donc ce sont les cas pour Martino Me. Une base de nuit ici est une beauté, et vous pouvez sentir l'excitation chez ma femme. Tout ce que je vous ai expliqué jusqu'à présent, lisant les mots dans le document et puis en découvrant combien de fois ce mot est utilisé dans ce que leurs documents et en créant un vainqueur de tout ce qui est Dieu, traitement du langage
naturel. Et c'est mon sujet préféré. Je ne peux pas m'empêcher de t'y emmener. Donc, le traitement du langage naturel est une chose très excitante à apprendre dans Massie, prêt de la langue sur elle a besoin de ses propres six, et c'est pourquoi je m'arrête ici comme premier cours de classificateur basé sur la nuit, nous allons continuer à apprendre multi couteau normal base. Ensuite, nous parlons de traitement du langage naturel. NLP dans les six prochains et je vous verrai là-bas