Introduction à l'intelligence ArtificiaI, à l'apprentissage automatique et au python | Timur K. | Skillshare
Recherche

Vitesse de lecture


  • 0.5x
  • 1 x (normale)
  • 1.25x
  • 1.5x
  • 2x

Introduction à l'intelligence ArtificiaI, à l'apprentissage automatique et au python

teacher avatar Timur K., Teacher, Life-Long Learner, Traveller

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

    • 1.

      Introduction

      4:13

    • 2.

      Histoire de l'intelligence artificielle

      11:28

    • 3.

      Différence entre l'IA, l'apprentissage automatique et le Deep Learning

      13:29

    • 4.

      Apprentissage automatique supervisé ou non supervisé

      8:40

    • 5.

      Régression linéaire et prévisions des prix plats dans Excel

      5:29

    • 6.

      Problèmes de classification dans le Machine learning

      4:14

    • 7.

      Clustering dans l'apprentissage automatique

      3:59

    • 8.

      Méthodes d'ensemble dans le Machine Learning

      3:57

    • 9.

      Sacage et renforcement

      2:47

    • 10.

      Vote majoritaire et moyennes dans Ensembling

      2:13

    • 11.

      Forêts aléatoires

      2:21

    • 12.

      Configuration de Python. Distributive Anaconda

      4:05

    • 13.

      Commandes de base dans Python

      7:08

    • 14.

      Instruction if

      6:20

    • 15.

      Tandis que l'énoncé

      7:02

    • 16.

      Prévoir des prix plats avec une régression linéaire en Python

      14:00

    • 17.

      Prévoir le PIB du pays sur la base des prix du pétrole

      6:28

    • 18.

      Prédire les survivants du titanic : tâche de classification

      13:16

    • 19.

      Réseau neuronal - créez votre propre réseau neuronal pour classifier les images

      21:58

    • 20.

      Réseaux neuronaux pour l'analyse de texte

      4:55

    • 21.

      Réseaux neuronaux pour l'analyse du sentiment (revues de films IMDB)

      9:42

  • --
  • Niveau débutant
  • Niveau intermédiaire
  • Niveau avancé
  • Tous niveaux

Généré par la communauté

Le niveau est déterminé par l'opinion majoritaire des apprenants qui ont évalué ce cours. La recommandation de l'enseignant est affichée jusqu'à ce qu'au moins 5 réponses d'apprenants soient collectées.

669

apprenants

1

projets

À propos de ce cours

Apprenez à comprendre les algorithmes d'intelligence artificielle et d'apprentissage automatique, et à apprendre les bases de la programmation Python

L'intelligence artificielle est déjà devenue une partie indispensable de notre vie quotidienne, que ce soit lorsque nous naviguons sur Internet, que nous magasinons en ligne, que nous regardons des vidéos et des images sur les réseaux sociaux, ou même lorsque nous conduisons une voiture ou utilisons nos smartphones. L'IA est largement utilisée dans la médecine, la prévision des ventes, l'industrie spatiale et la construction.

Étant donné que nous sommes entourés de technologies d'intelligence artificielle partout, nous devons comprendre comment ces technologies fonctionnent . Et pour une telle compréhension au niveau de base, il n'est pas nécessaire d'avoir une formation technique ou informatique.

***

Dans ce cours, vous apprendrez les concepts fondamentaux de l'intelligence artificielle et de l'apprentissage automatique. Vous vous familiariser avec leurs principaux types, algorithmes et modèles qui sont utilisés pour résoudre des problèmes complètement différents. Nous créerons même des modèles ensemble pour résoudre des exemples concrets spécifiques dans Excel - pour ceux qui ne veulent rien programmer. Et pour ceux qui veulent se familiariser avec Python, un langage de programmation qui résout plus de 53 % de toutes les tâches d'apprentissage automatique aujourd'hui, vous trouverez dans ce cours des conférences pour vous familiariser avec les bases de la programmation dans cette langue.

**

Ce cours peut devenir une sorte de tremplin pour votre développement de carrière dans le domaine de l'IA et de l'apprentissage automatique. Ayant maîtrisé ce cours court, vous pourrez choisir le domaine particulier dans lequel vous souhaitez développer et travailler plus avant.

Il convient de souligner que les spécialistes de l'IA et du Machine Learning sont aujourd'hui parmi les plus rémunérés et recherchés sur le marché (selon diverses estimations, il y a environ 300 000 experts de l'IA sur le marché mondial aujourd'hui, alors que la demande pour eux est de plusieurs millions).

**

Après avoir terminé ce cours, vous pourrez communiquer librement sur des sujets liés à l'intelligence artificielle, à l'apprentissage automatique et en profondeur et aux réseaux neuronaux.

***

Passez une heure à étudier ce cours pour obtenir de nouvelles ou améliorer les compétences existantes et élargir vos horizons en utilisant les connaissances acquises.

Rendez-vous dans le cours !

Rencontrez votre enseignant·e

Teacher Profile Image

Timur K.

Teacher, Life-Long Learner, Traveller

Enseignant·e

I'm an MA graduate with degrees in International Relations and World Economy. Learning foreign languages, travelling and working in cosmopolitan environments has always been indispensable part of my life.

My work experience includes working on challenging projects for government and private sectors (security products, banking, investment) across 5 continents, including Africa, Middle East, South-East Asia and Americas, and internship at the UN Office in Geneva, Switzerland.

I'm totally passionate about psychology, craftsmanship, motivation, skills, and languages - I speak English, Russian, French, Turkish and little Arabic, I also started learning Hungarian a while ago:). I'm keen on reading, sports, football, and playing the guitar.

I'm always eager to learn new... Voir le profil complet

Compétences associées

IA et innovation Bases de l'IA
Level: All Levels

Notes attribuées au cours

Les attentes sont-elles satisfaites ?
    Dépassées !
  • 0%
  • Oui
  • 0%
  • En partie
  • 0%
  • Pas vraiment
  • 0%

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Introduction: Bonjour, tout le monde, et je suis heureux de voir à l'intérieur de ces cœurs l'intelligence artificielle, l'apprentissage automatique, l'apprentissage profond, réseaux neuronaux et le Big Data. Tous ces termes et technologies sont de plus en plus utilisés ces jours-ci. 40 ans à peine, nous ne pouvions lire ces choses que dans certains livres ou magazines futuristes, alors que maintenant, nous les comprenions ou non, elles deviennent déjà une partie importante de notre vie quotidienne. Lorsque la recherche de nouvelles, les agrégateurs de nouvelles sur Internet nous montrent exactement les nouvelles qui pourraient nous intéresser le plus . La même chose se produit sur les réseaux sociaux sur les services de musique YouTube, où nous montrons exactement les vidéos, chansons ou images que vous aimerez probablement. Les ordinateurs peuvent déjà reconnaître notre discours, et la traduction automatique de Google translate fonctionne beaucoup mieux qu'il y a seulement cinq ans . Les techniques de reconnaissance de l'image et de l'environnement sont utilisées dans les voitures autonomes qui conduisent déjà autour, sont très villes dans le nombre de voitures autonomes, est en augmentation, obtenir un espace énorme, et presque tous les constructeurs automobiles développent ces technologies. En outre, IA est utilisé par les banques pour décider de la solvabilité d'un possible service de vente de guerre guerre et marketing dans les entreprises l'utilisent pour prédire les ventes et faire des recommandations plus personnalisées pour chaque client. D' énormes budgets sont consacrés à la publicité ciblée, qui est de plus en plus ciblée. Grâce aux technologies d'apprentissage automatique. E. Je devient particulièrement pertinent en médecine, où les réseaux neuronaux peuvent détecter la présence de maladies graves beaucoup plus précisément que les médecins les plus professionnels. Comme vous pouvez le voir, la gamme d'utilisation de l'IA est très étendue, et ces technologies sont déjà utilisées dans de multiples industries et puisque la gamme d'utilisation couvre presque tous les domaines, cela nécessite un grand nombre de spécialités qui sont bien arrondies dans la façon dont fonctionnent leurs algorithmes d' intelligence divisionnaire et d'apprentissage automatique. Et c'est pourquoi aujourd'hui, quiconque veut développer son porteur a besoin d'un prêtre, d'une compréhension de base, de la toux, toux, intelligence artificielle et de l'apprentissage automatique. Selon diverses estimations, il n'y a qu'environ 300 000 experts en IA dans le monde, sont des seulement 10 000sont desprofessionnels très solides qui travaillent sur des projets à grande échelle. On estime que dans un avenir très proche, la demande pour ces spécialistes passera à 30 millions de personnes et continuera à croître à l' avenir, ce qui signifie que c'est pour Maintenant, il ya une énorme pénurie d'experts qui comprennent et sont en mesure de travailler avec les technologies de l'IA et de l'apprentissage automatique. De nombreux géants technologiques tels que Google, Netflix, Alibaba, Tencent, Facebook se sont plaints du manque de spécialiste de haute classe et les salaires pour ces postes vacants sont l'un des plus élevés sur le marché aujourd'hui, en particulier avec deux ou trois ans d'expérience dans le domaine du Big Data. Et l'IA peut recevoir plus de 150 000$ par an en Amérique, Europe et en Chine, et le meilleur spécialiste a appris d'un million de dollars par an et plus. Inutile de dire sur les nombreuses start-up dans le domaine de l'IA, qui sont lancées chaque semaine et attirent d'énormes tours d'investissements, ceux pour résumer A est déjà utilisé dans nos vies par de nombreuses entreprises et services. Parfois, même quand nous ne l'avons pas remarqué. En général, il rend notre expérience hors contrat inclure la qualité environnante, plus personnalisé et pratique. Il y a beaucoup de domaines et d'industries où l'on peut mettre en pratique le Norwich, et il y a une pénurie évidente de spécialistes dans ce domaine, et ils seront demandés au cours des deux prochaines décennies, du moins dans cette voie, vous donnerez l'idée de base de ce qu'un I et une voiture d'apprentissage automatique vous disent à propos de ses principales plongées. Algorithmes, que les modèles vous montrent où chercher des données pour l'analyse et la pratique avec vous. Comment résoudre de vrais problèmes d'apprentissage automatique. Nous allons également vous fournir une brève introduction à porter le par téléphone, qui est un langage de programmation utilisé pour construire la plupart des machines dans les caresses. Après avoir passé ce cours, vous serez en mesure de communiquer librement sur ces sujets, et vous serez en mesure de construire vos propres modèles prédictifs C simples à l'intérieur du cours. 2. Histoire de l'intelligence artificielle: au cours des dernières années, les termes « intelligence artificielle », machine learning », réseaux neuronaux  », « big data » sont peut-être devenus l'un des sujets les plus discutés dans le monde entier aujourd'hui. Sur les gens paresseux ne parlent pas d'un I. Cependant, il faut se rappeler que l'intelligence artificielle n'est pas quelque chose que vous et cette discipline a été autour depuis plusieurs décennies. C' est au milieu du XXe siècle que les scientifiques ont commencé à réfléchir à la question de savoir si machines peuvent avoir de l'intelligence. Retour en 1950, le mathématicien anglais bénévolat a proposé ce test auditif, dont le but était de déterminer si une machine peut penser et tromper une personne, lui faisant croire qu'il communique avec la même personne que lui-même et non avec l' ordinateur. La même année, l' écrivain de science-fiction I Sock Icing Off a présenté les trois lois de la robotique, dans lesquelles il a indiqué quelle devrait être la relation entre les humains et les robots. En 1955, un groupe de scientifiques a organisé un séminaire où ils ont discuté de l'avenir de l'informatique. L' un des présents était John McCarty, qui a d'abord inventé le terme intelligence artificielle IA. Par conséquent, il est 1955 qui est considéré comme l'année de la naissance d'un I. Trois ans plus tard, le même McCarty a créé le langage de programmation moins, qui est devenu le langage principal pour travailler avec le pour les deux suivants années. En 1956, l'ingénieur Artur Samil a créé le premier ordinateur auto-étranger au monde capable jouer aux dames. Les dames ont été choisies en raison du fait qu'ils avaient des règles élémentaires, et en même temps, si vous vouliez les gagner, alors vous devez suivre une certaine stratégie. Cet ordinateur, créé par Samil Learn on Simple books, décrira des centaines de jeux avec des bons et des mauvais mouvements dans la même année. En 1956, Helber Simon Alan, You Oh et Clifford Chou ont créé un programme intitulé The Logic Theories. On croit que c'est l'un des premiers programmes avec un I. Les théories logiques ont fait un bon travail avec la gamme limitée de problèmes,par exemple, par exemple, problèmes de géométrie et a même été en mesure de prouver l'égalité, littérale théorie du triangle , hum, plus élégamment que leur tendance. Russell. Dans l'année suivante, 1957 front krosen lot est venu avec Perceptron, qui était un système d'apprentissage qui a agi non seulement en conformité avec des algorithmes et des formules donnés , mais aussi basé sur l'expérience passée. Il est important de noter ici que Perceptron a été le premier système à utiliser des réseaux neuronaux. Même alors, les scientifiques ont compris que certains problèmes sont vendus par une personne très rapidement alors qu'ils prennent beaucoup de temps à partir d'un ordinateur. Par conséquent, ils ont pensé que peut-être il est nécessaire de reproduire la structure du cerveau humain afin d'enseigner le travail de l'orteil de l'ordinateur aussi rapidement. Ils appellent les éléments les plus simples des neurones Perceptron parce qu'ils se comportent de la même manière que les neurones du cerveau humain. Le modèle informatique du Perceptron a été mis en œuvre en 1960 sous la forme du premier ordinateur plus récent, qui a été nommé Mark un. Presque en même temps, un puissant institut a fondé un laboratoire. Donnons un exemple ici. La question. Comment les petits enfants apprennent-ils ? On leur montre une sorte d'objet, et ils disent que c'est un taureau et c'est un cube. Après tout, nous n'avons pas expliqué à l'enfant que le Cube a tous les angles de 90 décrets et tous les côtés sont égaux et la balle a le concept de radios de diamètre, par conséquent, la coque simple regarde beaucoup de similaires objets. Beaucoup de balles différentes et d'autres objets une machine à écrire, une table, un avion de nous obtenir. Et après un certain temps, l'enfant commence à distinguer indépendamment tout cet objet, même s'ils sont une couleur différente ou légèrement différente dans leur forme. Lorsque l'algorithme informatique apprend d'un grand nombre d'exemples, c'est ce qu'on appelle l'apprentissage automatique. L' intelligence artificielle, à son tour, signifie que l'algorithme d'apprentissage des exemples peut résoudre divers problèmes intellectuels. Alors passons à travers ça dans la prochaine décennie. C' est en 1961 que General Motors introduit le premier robot dans son processus de fabrication de voitures. En 1965, le premier enfant né ELISA, a été inventé. ELISA était supposé imiter un psychothérapeute qui demandait au patient son état et suggérait des solutions possibles ou tout simplement pouvait sympathiser avec l'interlocuteur. Il s'est avéré que la conversation avec les gens ELISA éprouvent les mêmes émotions et sentiments qu'avec une vraie personne. En 1974, le premier véhicule sans pilote a été inventé dans le laboratoire de l'Université de Stanford. Il deviendra bientôt le prototype des modèles d'angle suivants en 1978 Douglas Lynn et créera le système de guerre Your Risk Else. Le système a non seulement clarifié les schémas déjà connus, mais en a également proposé de nouveaux. Quelques années plus tard, vous risquez un appris à résoudre des problèmes tels que plus faire l'évolution biologique, Nettoyage du service de produits chimiques, placer des éléments sur les circuits intégrés et ainsi de suite. Vous êtes Iskan est un ensemble de règles logiques. Si alors Yuri colle et règle qui fonctionne dans de nombreux cas, mais pas dans tous. Il vous permet de prendre rapidement une décision lorsqu'il n'y a aucun moyen de procéder à une analyse complète de la situation. Par exemple, comment distinguer savoureux de la nourriture insipide ? S' il y a du sucre que c'est délicieux, Cela fonctionne, mais pas toujours. Par exemple, le vendre ou la viande frite ou le sucre est également pas toujours reste profond. Par exemple, rencontrer des bâtonnets de sucre Yuri peuvent être compliqués ou complétés. Par exemple, fruits ou une combinaison de produits peuvent devenir soit délicieux. La machine elle-même a appris à les inventer par expérience. Nous donnons l'exemple, de sorte que l'algorithme et il trouve déjà des modèles. La machine peut trier le look plus d'options que les gens. Si les clients ne l'aimaient pas, alors c'est peut-être une mauvaise combinaison de canard avec des pommes. Quoi ? n'y a pas assez de source. Passons donc à la fin du XXe siècle, Carnegie Mellon a créé en 1989 un véhicule sans pilote utilisant des réseaux neuronaux. En 1988, l'ordinateur de pensée profonde joue contre Kasparov, Jess Champion, mais perd pour lui après huit ans. Ils ont un autre jeu dans le jeu. Kasparov est plus fort que l'ordinateur, mais juste le leader de l'année. En 1997, le bleu A I D hautement mis à niveau d'IBM défait Gary Kasparov et devient le premier ordinateur. La victoire contre l'actuel champion du monde d'échecs, De Boop, a travaillé de nombreux pas en avant et essayer de trouver le mouvement le plus préféré. Les scènes de 2000 ordinateurs ont toujours surperformé les humains. En 1999 Sunny annonce le chien Aibo, dont les compétences et le comportement se développent au fil du temps dans la même année. Pour la première fois, M.I. M.I. T a montré une IA émotionnelle appelée Kiss signifiait qui peut reconnaître les émotions des gens et y répondre. Selon propre. En 2000 et deux, la production de masse de Autonomous My Robot aspirateurs commence, qui peut se déplacer autour de la maison sur leur propre, évitant les obstacles En 2000 et neuf Google a rejoint la course des entreprises pour développer leur propre véhicule sans pilote en 2011. assistants virtuels intelligents comme Siri, Google Now et Cortana apparaissent en 2014. Alexa, d'Amazon, les rejoindra et en 2017 au moins de Yandex. Rappelez-vous, nous avons parlé du test de Turing, qui a été inventé par le bénévolat en 1950. Il était destiné à comprendre si un je peux tromper une personne et le convaincre que ce n'est pas un ordinateur devant lui par la personne. Donc, en 2014, l'ordinateur bateau enfant Eugene Guzman a passé ce test, forçant 1/3 du jury à croire que l'ordinateur était contrôlé par une personne, pas un I. En 2016 le Google Deepmind avec une IA appelée Alphago vaincu il ya champion Go Game est beaucoup plus compliqué que les échecs. Il y a plus d'options à l'intérieur du jeu et néanmoins, aller est devenu le deuxième jeu dans lequel les gens ne peuvent plus gagner. En 2017 offert plus de 10 ans de tentatives et de palpeurs. Les deux équipes ont développé indépendamment leurs propres modèles IA, Deep Stack et Liberties ordinateurs, qui ont été en mesure de battre les professionnels du poker. Contrairement à aller à la poitrine où tout est soumis à des règles strictes. Le facteur humain vient à l'avant dans le poker parce que le poker est en grande partie un jeu psychologique basé sur les émotions, communication non verbale, la capacité de bluffer et de reconnaître les bluffs. Un des participants à un jeu de poker avec ces ordinateurs décrivent ses impressions comme suit. C' est comme jouer avec quelqu'un qui voit toutes vos voitures. Je ne blâme pas le réseau neuronal pour la pleine plaque. C' est juste que c'est vraiment si bon. En 2015 malade démasquant Sam Altman président Off Y Combinator a fondé Open I pour créer une intelligence artificielle ouverte et amicale. En 2017, l'Open I une équipe de développement a décidé de s'entraîner en Serial Network dans la plus grande fille Eastport Game, aussi. Dans ce jeu, des équipes de cinq personnes jouent, et ils utilisent de nombreuses combinaisons de plus de 100 héros. Chacun d'eux a son propre ensemble de compétences. En deux semaines, le réseau neuronal a pu apprendre et vaincre plusieurs des meilleurs joueurs du monde une seule humeur, et maintenant ses créateurs se préparent à sortir une version pour le mode principal. Cinq par cinq. Nous nous sommes rapprochés de nos jours au début de 2018. Les algorithmes de Taliban Microsoft surprennent la personne dans le test de compréhension de lecture en Mars 2018 un petit robot qui similaire Rubik Cube en seulement votre 20180.38 secondes. Le record parmi les gens avant cela était de 4,69 secondes. L' une des percées les plus importantes dans le développement de l'IA, qui peut apporter de nombreux avantages à l'humanité, a été qu'en mai 2018 l'intelligence artificielle est devenue meilleure que les gens pour reconnaître le cancer de la peau . En plus de reconnaître les maladies chez les patients, un algorithme est utilisé aujourd'hui pour étudier le pliage des protéines. Ils essaient de trouver le remède pour la maladie d'Alzheimer et la maladie de Parkinson est également utilisé pour réduire consommation d'énergie et pour créer de nouveaux matériaux révolutionnaires. L' intelligence artificielle est également activement utilisée dans les affaires. Les banques l'utilisent pour approuver des prêts aux entreprises de détail, les utiliser pour des campagnes publicitaires plus ciblées et des offres pour leurs clients. Pourquoi exactement à notre époque ? R. J'ai commencé à prendre parler si rapidement. Il y a deux raisons à cela. Tout d'abord, maintenant une énorme quantité d'informations est produite dans le monde tous les deux ans. La quantité d'informations que le monde double. Et comme nous le savons, IA tire des leçons des données disponibles et la deuxième raison est la présence d'une forte puissance de calcul. Aujourd'hui, nos ordinateurs sont assez forts pour pouvoir traiter d'énormes problèmes à partir d'informations dans un temps assez limité. Nous avons donc examiné un bref historique du développement d'un I. Dans l'une des conférences Full Inc, nous allons voir ce que l'on peut attendre du développement à l'avenir. 3. Différence entre AI, Machine learning et Deep Appren: aujourd'hui, les termes « intelligence artificielle », apprentissage automatique », deep learning », réseaux neuronaux » et « big data » sont très courants ou sont utilisés de façon interchangeable. Et bien qu'ils soient vraiment très connectés, regardons ce que chacun de ces concepts signifie et comment ils diffèrent les uns des autres. Tout d'abord, pour le raccourcir, IA est un secteur assez large, dont l'endurance couvre à la fois l'apprentissage automatique peut L'apprentissage automatique Deep Learning fait partie intégrante de l'IA, et le Deep Learning est un partie intégrante de l'apprentissage automatique. L' intelligence artificielle implique qu'un ordinateur peut effectuer des tâches similaires qu'une personne peut effectuer et les entendre Africain bientôt. Ce n'est pas seulement sur les actions mécaniques. Par exemple, prendre peut guérir certains objets mais des tâches qui nécessitent une pensée intellectuelle. C' est quand vous devez prendre la bonne décision,par exemple, par exemple, que nous pouvons être trop dans les échecs ou pour reconnaître ce qui est montré dans l'image ou pour comprendre ce qui a été dit par l'orateur et donner la bonne réponse. Pour le faire. L' ordinateur reçoit beaucoup de fruits ou d'algorithmes en suivant lequel il peut résoudre de tels problèmes intellectuels. Je peux être faible ou il est aussi appelé étroite ai qui est quand la machine ne peut faire face à un type limité de test mieux qu'une personne,par exemple, par exemple, reconnaître ce qui est dans l'image ou jouer aux échecs et jumeau. Maintenant, nous en sommes à ce stade même du développement d'un I. L'étape suivante est l'IA générale. Quand le peut résoudre n'importe quel problème intellectuel ainsi que la personne dans la phase finale. Est une forte intelligence artificielle. Lorsque la machine fait face à la plupart, demande beaucoup mieux qu'une personne. Comme nous l'avons déjà dit, intelligence artificielle est un domaine assez vaste de connaissances. Il n'a pas fermé les soins suivants s traitement du langage naturel lorsque l'ordinateur doit comprendre ce qui est écrit et donner la réponse correcte et pertinente. Cela comprend également les traductions de texte et même la compilation de texte complexe par des ordinateurs, systèmes d'experts ou des systèmes informatiques qui, de même, la capacité d'une personne à prendre des décisions principalement en utilisant les règles si alors. Plutôt que d'utiliser une sorte de discours froid, l'ordinateur doit reconnaître ce discours des gens et être en mesure de parler ensuite un ordinateur vision informatique devrait reconnaître certains objets dans l'image ou quand ils se déplacent. La robotique est également très populaire zone d'un. I. La création de robots qui peuvent effectuer Il y a des fonctions, y compris le déplacement peut communiquer, surmonter les obstacles, planification automatisée. Habituellement, il est utilisé par des robots autonomes et des véhicules aériens sans pilote lorsqu'ils ont besoin d' apprentissage automatique pour effectuer des infections de séquence, surtout quand cela se produit dans un espace multidimensionnel et quand ils doivent résoudre des problèmes complexes . Et enfin, l'apprentissage automatique est apparu après que nous avions essayé pendant longtemps de rendre nos ordinateurs plus intelligents, leur donnant de plus en plus de règles et de règlements. Cependant, ce n'était pas une bonne idée car cela a pris beaucoup de temps et nous ne pouvions pas trouver de règles pour chaque détail et pour chaque situation. Et puis les scientifiques sont venus avec l'idée. Pourquoi ne pas essayer les algorithmes qui apprennent indépendamment en fonction de leur expérience ? C' est ainsi que naquit l'apprentissage automatique. C' est alors que les machines peuvent apprendre à partir de grands ensembles de données au lieu d' instructions explicitement écrites . Et Truls Machine Learning est l'ère de l'IA, où nous formons notre algorithme en utilisant des ensembles de données, ce qui le rend meilleur, plus précis et plus efficace avec l'apprentissage automatique. Nos algorithmes sont formés sur les données, mais sans instructions pré-programmées, c' est-à-dire que nous donnons à la machine un grand ensemble de données et disons les bonnes réponses. Et puis la machine elle-même crée des algorithmes qui satisferaient ces réponses. Et avec chaque nouvelle quantité supplémentaire de données, les mitrailleuses plus loin et continue d'améliorer sa prévision. Précision. Si nous prenons la poitrine dans la programmation traditionnelle ou dans un programme appelé A, je donnerais à la machine l'ensemble des règles logiques et basé sur eux, il apprend à jouer dans l'exemple de la machine. L' apprentissage est quand nous donnons à la machine l'ensemble des exemples de jeux passés qu'il prend, leur rappelle et analyse pourquoi certains joueurs swing et d'autres dont les étapes conduisent au succès et veulent vaincre. Et sur la base de ces exemples, la machine elle-même crée des algorithmes et des règles sur la façon de jouer aux échecs pour gagner. Dans un exemple, supposons que nous devons comprendre comment le prix d'un appartement se comportera lors de la modification certains paramètres. Par exemple, en fonction de la zone, la distance du nombre de métro d'histoires de la maison et ainsi de suite. Nous ne chargeons pas les données de différents appartements dans l'ordinateur, créons un modèle par lequel il sera possible de prédire les prix en fonction de ces facteurs, nous mettons régulièrement à jour les données, et notre algorithme sera formé sur la base de ces nouvelles données, et chaque fois qu'il améliorera sa précision de prédiction. Le Deep Learning est le sous-secteur de l'apprentissage automatique, où l'ordinateur apprend mais apprend un peu différemment de la machine standard . Apprendre. Deep Learning utilise des réseaux neuronaux, qui représentent des algorithmes répétant la logique des neurones humains dans le cerveau. De grandes quantités de données meilleures pour ces réseaux neuronaux et dans la sortie ont reçu les réponses à la tâche. Les réseaux neuronaux sont beaucoup plus difficiles à comprendre l'apprentissage automatique inhabituel, et nous ne pouvons pas toujours comprendre quels facteurs ont plus de poids au début. Mais l'utilisation de réseaux neuronaux aide également à résoudre des problèmes très compliqués. Parfois, les réseaux neuronaux sont même appelés la boîte noire parce que nous ne pouvons pas toujours comprendre ce qui se passe à l'intérieur de ces réseaux. Supposons que votre ordinateur évalue dans quelle mesure un essai est écrit. Si vous utilisez l'apprentissage profond, l'ordinateur vous donnera la décision finale que l'essai est bon ou non, et probablement la réponse serait très similaire à la façon dont une personne l'évaluerait. Mais vous ne serez pas en mesure de comprendre pourquoi une telle décision a été prise, parce que déplorant utilise plusieurs niveaux hors réseaux neuronaux, ce qui rend très difficile à interpréter. Vous ne saurez pas quelle note du réseau neuronal a été activée et comment les neiges se comportent ensemble pour atteindre ce résultat. Où est si utiliser l'apprentissage automatique, par exemple, l'algorithme hors d'un arbre de décision ? Ensuite, vous pouvez voir quel facteur a joué un rôle décisif dans la détermination de la qualité de leur mot de passe. Ainsi, les réseaux neuronaux sont connus depuis le 20ème siècle, mais à cette époque ils n'étaient pas si profonds. n'y avait qu'une ou deux couches, et ils n'ont pas donné de bons résultats que d'autres algorithmes hors apprentissage automatique. Par conséquent, pendant un certain temps, réseaux neuronaux se sont fanés en arrière-plan. Cependant, ils sont devenus populaires récemment, surtout depuis 2000 et six ans, lorsque d'énormes ensembles de données et de fortes capacités informatiques sont apparus en particulier les cartes graphiques et les processeurs puissants, qui est devenu capable de créer des couches plus profondes à partir des réseaux neuronaux et de faire des calculs plus rapidement et plus efficacement. Pour les mêmes raisons. Le Poulenc est assez cher parce que, d'une part, il est difficile de collecter des données volumineuses sur des éléments spécifiques et, d'autre part, les capacités informatiques sérieuses des ordinateurs sont également coûteuses pour le raccourcir. Comment déplorer la bizarrerie suppose-t-elle ? Notre tâche est de calculer combien d'unités de transport et quel transport particulier il est . Des autobus, camions, voitures ou des bicyclettes traversent chaque jour une certaine route afin de distribuer des voies pour différents types de véhicules. Pour ce faire, nous devons apprendre à notre ordinateur à reconnaître les types de transport. Si nous devions résoudre ce problème avec l'aide de l'apprentissage automatique, nous écririons un algorithme qui indiquerait l'heuristique correcte des voitures, des bus, bus, camions et des bicyclettes. Par exemple, si le nombre de roues est à alors c'est une bicyclette. Si la longueur d'un véhicule est supérieure à 56 mètres, alors il s'agit d'un camion ou d'un bus. S' il y a beaucoup de fenêtres, alors c'est un bus insolent. Mais comme vous le savez, il y a beaucoup de gens. Par exemple, le bus peut être teinté, et il sera difficile de comprendre où sont les fenêtres ou un camion peut ressembler à un bus ou vice versa. En Floride, camionnettes ressemblent à certains petits camions, et il peut être difficile pour l'ordinateur de faire la distinction entre une bicyclette et une moto. Par conséquent, une autre option pour résoudre ce problème est de télécharger un grand nombre d'images avec différents types de transport dans notre ordinateur et apparemment lui dire quelles images représentent le vélo, voiture, camion ou bus. L' ordinateur lui-même commencera à sélectionner les caractéristiques par lesquelles il peut déterminer quel type de transport est représenté et comment ils peuvent être distingués les uns des autres. Après cela, nous allons télécharger d'autres images et tester comment l'ordinateur fait face à la tâche. Si cela fait une erreur, nous lui dirons que vous avez fait une erreur ici. Ce n'est pas un camion, c'est de nous. Le stagiaire informatique reviendra à ses algorithmes. Ceci est appelé par le chemin retour propagation et y apporter quelques changements, et nous allons recommencer dans un cercle jusqu'à ce que l'ordinateur commence à deviner ce qui est montré dans l' image avec une précision de prédiction très élevée. C' est ce qu'on appelle l'apprentissage profond basé sur les réseaux neuronaux. Comme vous le comprenez, cela peut prendre beaucoup de temps, peut-être plusieurs semaines, en fonction de la complexité de la tâche. Il nécessite également beaucoup de données. Il est souhaitable qu'il y ait au moins des millions d'images, et toutes ces images devraient soit être marquées, car cela devrait être fait par une personne, mais cela prendra beaucoup de temps. D' accord. Donc, pour résumer, Deep Learning est une branche de l'apprentissage automatique, et ils relèvent tous deux de la définition plus large de l'intelligence artificielle Machine Learning utilise des algorithmes pour apprendre des données et prendre des décisions éclairées ou des prédictions sur la base de ce qu'il a appris. Deep Learning fait de même puisqu'il s'agit également d'une variante de l'apprentissage automatique. Mais ce qui est différent, c'est que l'apprentissage profond utilise des algorithmes, qui sont structurés en plusieurs couches pour créer un réseau neuronal artificiel capable d'apprendre et de prendre des décisions intelligentes. Machine Lauren peut être utilisé avec de petits ensembles de données et sur de petites quantités de données. tourbillon machine et l'apprentissage profond ont une précision de prédiction presque similaire, mais avec des quantités croissantes de données. Deep Learning est également une précision de prédiction beaucoup plus grande dans l'apprentissage automatique. Nous avons dit nous-mêmes les caractéristiques sur lesquelles nos algorithmes seront basés dans l'exemple avec la détermination du prix d'un appartement, nous indiquons nous-mêmes les paramètres quand dépendra le prix. Par exemple, la distance de métrage de l'âge du métro de la zone de la maison et ainsi de suite. Et dans l'apprentissage profond, l'ordinateur ou on pourrait dire réseau neuronal lui-même, par essai et erreur vient avec certains paramètres et le poids dont dépendra notre sortie . En ce qui concerne les algorithmes de temps libre, l'apprentissage profond prend généralement plus de temps que l'apprentissage automatique, déchiffrement ou l'interprétation de leurs algorithmes hors machine learning est plus facile parce que nous voyons quel périmètre joue un rôle important dans la détermination de la sortie. Par exemple, dans la détermination dimensionnelle du prix d'un appartement, nous pouvons voir que le poids de la séquence dans le prix est, disons, 60% en deep learning. Déchiffrer exactement ce qui a conduit à un tel résultat peut parfois être très difficile car il y a plusieurs couches hors réseaux neuronaux et de nombreux paramètres que l'ordinateur peut considérer importants, mais que nous ne voyons pas nécessairement. C' est pourquoi, comme nous l'avons dit plus tôt, l'apprentissage profond est parfois appelé les livres noirs, car nous ne savons pas quels paramètres ont été considérés comme importants par la machine dans le deep learning. Par conséquent, l'utilisation de la commission déplorante pendant dépendra également du but de votre tâche. Par exemple, si vous avez besoin de comprendre pourquoi l'ordinateur a pris telle ou telle décision quel facteur a joué un rôle important, alors vous devrez faire est l'apprentissage automatique au lieu de l'apprentissage profond. Puisque le déploiement nécessite beaucoup plus de données ainsi que des capacités informatiques plus puissantes de l'ordinateur, et en général, il faut plus de temps à apprendre. Il est également plus cher que l'apprentissage automatique. Ainsi, si nous résumons l'ensemble de la conférence, puis partout où la reconnaissance de la parole ou de l'image est utilisée robotique, texte ou parole, interprétation ou traduction cartes graphiques fonds signifiait conduire appel véhicules prédiction de certains paramètres basés sur les données disponibles. Tous ces exemples contiennent les éléments I parce que l'IA est un concept très large qui couvre tous ces domaines. Quand un ordinateur imiter la pensée et le comportement d'une personne dans les cas où nous au lieu de donner à l'ordinateur des instructions écrites et la vérité pour résoudre le problème, nous lui donnons un ensemble de données dans l'ordinateur, apprend de ces données, trouver quelques modèles dans les données et basé sur ces Lauren peut alors faire des prédictions. De tels cas sont appelés machine learning, et l'une des méthodes d'analyse peut. Trouver des modèles dans les données par ordinateur est appelé déplorant, qui utilise plusieurs couches de réseaux neuronaux artificiels, ce qui rend de tels calculs d'une part, plus efficace mais d'autre part, plus difficile à déchiffrer. J' espère que le court été a été utile. Mais si vous avez encore des difficultés à comprendre ces concepts hors machine, Gordon peut déplorer. N' hésitez pas à me demander dans la section commentaires de ce cours et n'hésitez pas à continuer à regarder les scores pour eux. Rendez-vous dans les prochaines conférences. 4. Apprentissage automatique supervisé et non supervisé: Si vous étiez intéressé par le sujet de l'intelligence artificielle et de l'apprentissage automatique, vous avez peut-être déjà rencontré de tels concepts un apprentissage supervisé et un apprentissage non supervisé . Dans cette vidéo, nous allons apprendre comment ces deux noms diffèrent. Tout d'abord, ce sont les deux types d'apprentissage automatique. Deuxièmement, l'apprentissage supervisé n'implique pas nécessairement que quelqu'un se tient derrière l'ordinateur et contrôle chaque action. L' apprentissage résumé signifie que nous avons déjà préparé les données pour d'autres travaux sur l' ordinateur, c' est-à-dire que chaque objet a une étiquette. L' étiquette distingue le sujet des autres objets ou lui donne un nom ou une valeur numérique . Et l'ordinateur peut trouver des vétérans entre les entités hors objets dans leurs noms en fonction ces préparés ou, comme on les appelle données étiquetées. L' apprentissage supervisé comprend deux principaux types de tâches. Progression et classification. Regardons un exemple typique de problème de surclassification. Ceci est un exemple de l'ensemble de données sur les fleurs irlandaises introduit par le statisticien et biologiste britannique Ronald Fisher dans son article de 1936, ces ensembles de données sont déjà devenus classiques et sont souvent utilisés pour illustrer le travail de très statistique algorithmes. Vous pouvez le trouver par la patinoire indiquée sur l'écran ou simplement par Googling enfants sur Internet. Alors regardons ça dans la nature. Il existe trois types de fleurs d'iris. Ils diffèrent les uns des autres en termes de taille du pétale et des échantillons. Les caractéristiques des fleurs sont énumérées dans le tableau. Les colonnes indiquent la longueur et la largeur du pétale, ainsi que la longueur et la largeur des échantillons. Le dernier maïs montre l'un des trois types de cerises irlandaises Sentosa, Iris, Virginia et Iris Vertical sont ces noms Off types sont des étiquettes pour notre détail. Sur la base de ces, les données ont dit, nous avons besoin de construire règle de déclassification qui détermine le type de fleur en fonction de sa taille. C' est la tâche hors classification de plusieurs classes, car il existe des classes gratuites trois types de fleurs d'Ari. Dans l'algorithme de classification, nous divisons nos iris en trois types, fonction de la longueur et de la largeur de la bataille et des échantillons. La prochaine fois, si vous venez, vous traversez, c'est de la farine. Avec l'aide de notre modèle, nous pouvons immédiatement prédire à qui appartient ces fleurs. Pourquoi considérons-nous cet exemple comme un apprentissage supervisé ? Parce que pour chaque fleur dans notre formation données dit. Nous avons une étiquette, ce soit irlandais, Sentosa, IRS, Virginia Iris particulier, qui est, Nous agissons comme un enseignant et nous enseignons notre modèle jusqu'à ce que si vous voyez que la science de la pétale est tel et tel, et les échantillons sont tels et tels, alors c'est l'iris pour Jessica. Et si la science est telle et telle, alors c'est Iris, où la suite ou cela s'appelle l'apprentissage supervisé. Ou parfois il est appelé Learning Curve un enseignant lorsque nous montrons à notre modèle toutes les réponses, en fonction des caractéristiques que le modèle porte sur ces données et de créer une formule ou algorithme qui nous aidera à l'avenir à prédire le type d'un nouveau fleur en fonction de sa taille. En plus des problèmes de classification, que nous venons de mentionner avec l'exemple des fleurs de l'artiste, il existe un autre type d'apprentissage supervisé. C' est ce qu'on appelle la régression dans les problèmes de classification. Nous avons plusieurs classes d'objets où est dans des problèmes de régression. Nous n'avons qu'une seule classe, mais chaque objet est différent des autres, et nous devons prédire le nombre concret ou la valeur concrète d'un nouvel objet pour les objets en fonction de ses caractéristiques et en fonction de l'ensemble de données qui fournira à notre ordinateur. L' exemple classique de la progression est quand nous prédisons le prix d'un appartement, en fonction relie les séquences. Nous avons donc une sorte de table avec les données de différents départements. Dans une colonne est la vidéo, et une autre est le prix de ces appartements. Ceci est un exemple très simplifié de progression, évidemment, que le prix d'un appartement dépendra de nombreux autres facteurs, comme l'emplacement, qualité du bâtiment, le nombre d'histoires et ainsi de suite. Mais néanmoins, cela démontre clairement ce qu'est la régression. Donc, dans la dernière colonne, nous avons les prix réels ou réels pour les appartements. On nous a donné des images. Pourquoi est-ce un apprentissage supervisé ? Parce que nous, en tant que professeur, montrons à notre modèle que si vous voyez que les images sont telles et telles, alors le prix sera sergent. Tel le prix X comme étiquette pour chaque objet de notre ensemble de données et chaque fois que Diddy l'a étiqueté , est , un cas d'apprentissage supervisé. Sur la base de ces données, le modèle apprend et produit ensuite un algorithme basé sur lequel nous pouvons prédire quel sera le prix de l'appartement en fonction d'une séquence donnée, afin de résumer dans l'apprentissage supervisé. Le point clé est que nous avons étiqueté des données dans notre ensemble de données. Autrement dit, nous chargeons des données avec des réponses dans notre modèle, ce soit la classe à laquelle appartient l'objet ou qu'il s'agisse d'un nombre spécifique, comme dans le cas de la tarification de l'appartement, en fonction de la séquence basée sur cette le modèle apprend et crée un algorithme qui peut faire des prédictions. Bon, alors passons à autre chose. Le deuxième type d'apprentissage automatique est l'apprentissage non supervisé. C' est alors que nous permettons à notre modèle d'apprendre indépendamment et de trouver des informations qui peuvent ne pas être visibles pour une personne. Contrairement aux modèles d'apprentissage supervisé qui sont utilisés dans l'apprentissage sans surprise, dérivent des modèles et tirent des conclusions basées sur des données non étiquetées. Rappelez-vous, nous avons eu un exemple avec des fleurs d'iris. Donc, dans les ensembles de données que nous avons donnés à l'ordinateur, il y avait des réponses quel type de virus nous avons, en fonction de l'un ou de l'autre côté de la pédale et des échantillons et dans les données non étiquetées. Nous avons des objets et leurs caractéristiques, mais nous n'avons pas de réponse à quel genre ou classe ils appartiennent. Par conséquent, les années quatre-vingt ont appelé sans étiquette sur l'apprentissage supervisé, les types moyens de tâches ou le regroupement et la réduction dimensionnelle. Vous savez que la réduction dimensionnelle de l'affichage signifie que nous supprimons les fonctionnalités inutiles ou redondantes de notre ensemble de données afin de faciliter les classifications de nos données et de les rendre plus compréhensibles pour l'interprétation. Et maintenant regardons un exemple de rétrécissement croisé dans les problèmes de clustering. Nous avons un ensemble de données d'objets et nous devons identifier sa structure interne. Autrement dit, nous avons besoin de trouver des groupes hors objets dans ces données dit qui sont les plus similaires les uns aux autres et diffèrent des autres groupes hors objets du même jour à définir, par exemple, pour trier tous les véhicules dans classe tous les véhicules semblables à une bicyclette dans un groupe ou un groupe et semblable à un autobus dans un groupe distinct. De plus, nous ne disons pas à l'ordinateur ce que c'est. Il doit comprendre par lui-même, pour trouver des signes similaires et identifier des objets similaires dans un groupe particulier. Par conséquent, cela est appelé Apprentissage Sans un enseignant étaient apprentissage non supervisé parce que nous n'avons pas abord dit à l'ordinateur à quel groupe tel ou ces objets appartiennent, Ces tâches peuvent être très utiles pour les grands détaillants, par exemple, s'ils veulent comprendre qui sont faits à leurs clients, supposons qu'il y ait un grand supermarché, et pour faire des promotions ciblées pour ses consommateurs, il faudra les diviser en groupes ou grappes. Et s'ils ont maintenant des ventes pour le bien du sport, seulement ils enverront les publicités. Pas tous les consommateurs, mais seulement ceux qui ont déjà les deux sports va dans le passé. C' est la principale différence entre l'apprentissage supervisé et l'apprentissage non supervisé. C' est dans l'apprentissage supervisé ? Nous utilisons des données d'étiquette où chaque objet est marqué et appartient à une classe particulière ou a une valeur numérique spécifique. Et sur la base de ces données d'étiquette, notre modèle de factures et l'algorithme qui nous aide à prédire les résultats sur de nouvelles données et en réponse à augmenter l'apprentissage, les données que nous avons sont sans étiquette ou non marquée dans l'ordinateur lui-même, trouver certains et les entités communes, et diviser tous les objets en différents groupes similaires au sein d'un groupe et différents des objets des autres groupes. Il existe deux principaux types de tâches d'apprentissage supervisé, qui sont les classifications lorsque nous divisons nos rencontres avec les classes et la progression lorsque nous faisons une prévision miracle basée sur des données antérieures. Les principaux types de tâches hors apprentissage non supervisé comprennent le regroupement lorsqu'un ordinateur divise nos rencontres, les groupes ou les groupes et la réduction dimensionnelle, ce qui est nécessaire pour une démonstration plus pratique de grandes quantités de données. Eh bien, considérez chacune de ces tâches plus en détail dans les fractures suivantes. 5. Régression linéaire et prédisant les prix à plat dans Excel: donc l'un des algorithmes d'apprentissage automatique les plus populaires est la régression. Il s'agit d'une tâche de prédire un attribut spécifique, souvent objet en utilisant les données disponibles et d'autres attributs de l'objet. Par exemple, nous pouvons prédire le poids d'une personne en fonction de sa taille, où nous pouvons prédire le prix des départements en fonction de la distance du métro pour la zone de l'appartement. Dans cet épisode, nous allons voir comment nous pouvons résoudre notre problème d'agression dans un fichier Excel ordinaire. Prenons un exemple avec la prédiction de la côte d'un appartement, en fonction des images de cornets. Chaque tâche d'apprentissage automatique a besoin de données, plus il y a de données, mieux c'est. Donc, c'est un agent que nous avons une table Excel avec des données dans une colonne, la zone de l'appartement dans l'autre, le prix de cet appartement. Nous nous plairons à ces données sur l'artisanat, et en principe, nous pouvons remarquer qu'il y a une certaine dépendance linéaire, ce qui est tout à fait hors de ceux parce que plus la zone, le cœur, le coût de l'appartement. Bien sûr, il est clair que beaucoup plus de facteurs influeront sur le prix d'un appartement tels que la distance du centre-ville et le nombre mental d'histoires, âge de la maison et ainsi de suite, mais pour des raisons de simplicité, avec également un secteur, la zone de l'appartement. Donc, notre tâche est d'apprendre à prédire le prix pour faire ces vraiment la formule, ce qui peut nous donner le prix prévu en fonction de la superficie de l'appartement. Dans les cas où nous voyons Alina relation, la formule suivante est généralement utilisée, ce qui est pourquoi est égal à un X Plus B dans lequel, pourquoi physique au prix et X est la zone. En fait, la dépendance peut ne pas être nécessairement linéaire. Cela peut être un remède ou avoir un regard très étrange. Donc, pour avoir un travail formel concret, nous devons trouver les coefficients A et B. Comment peut-on les trouver ? Le poids le plus simple et classique, que vous avez probablement appris sur les leçons d'algèbre ou de statistiques, est la méthode des moindres carrés. En fait, cette méthode a été inventée il y a 200 ans, et maintenant des solutions plus efficaces sont apparues, mais néanmoins, la méthode la moins mauvaise est encore tout à fait pertinente et est utilisée assez souvent en régression problèmes. La méthode la moins carrée est lorsque vous trouvez une formule dans laquelle la somme des écarts carrés est la plus petite du désir aux rivaux. Voyons à quoi cela pourrait ressembler dans Excel. Donc, nous avons une table avec un certain nombre d'appartements là-bas, superficie et le prix. Mais sa place ces données sur l'artisanat et voir les points avec les échecs correspondants. Nous voyons qu'il y a une sorte d'indépendance à plus la zone, le cœur, le coût de l'appartement. Dessinons une ligne dans Excel. Vous pouvez le faire comme suit. Nous cliquons sur le graphique. Un signe plus apparaît sur le site. Cliquez dessus et cochez pour afficher la ligne de tendance. Ok, la ligne est visible, mais comment pouvons-nous trouver la formule spécifique ou efficace jusqu'à présent pour pouvoir prédire les prix pour les nouveaux appartements ? En théorie, vous pouvez faire de longs calculs et résoudre cette équation Ici dans Excel, utilisant des calculs de métriques, Cependant, cela peut être fait beaucoup plus facile en deux semaines. Encore une fois, astuce sur le signe plus Quicken options supplémentaires. Et ici, nous mettons une tique pour montrer la formule. Ok, on y va. Maintenant, nous pouvons voir notre formel, hum, au sommet de l'embarcation. Pourquoi est égal à 0,715 x plus. Vous êtes un 0.8111 Donc 0.7 est notre coefficient A et 0.81 est notre coefficient B. Vous pouvez également voir qu'il y a une lettre sont carrés en dessous de la formule. Il est synonyme de valeurs R au carré. Cet indicateur prend les échecs de 0 à 1 et implique la vallée de 0 à 100%. Si la valeur est un, cela signifie que notre ligne ou sont formule 100% décrit correctement le ratio pour les indicateurs dans nos clés. Le rapport du prix et de la superficie. Comme vous pouvez le voir sur ce graphique, l'indicateur est carré est votre 0,976 ce qui est un indicateur assez élevé qui suggère que notre formel est très efficace. Selon propre. Maintenant, nous pouvons prédire les prix en fonction de la zone connue cette formule et les coefficients. Nous substituons simplement la zone de quelques nouveaux appartements et voyons ce que le prix devrait être conformément à notre formule. Comme vous le comprenez, cette formule changera également chaque fois que vous entrez de nouvelles données sur des appartements réels de prix réels . Il va changer et s'ajuster de manière à correspondre au mieux à tous les objets de notre échantillon. Vous pouvez personnaliser votre agression ancienne de sorte que les anciens prix affectent votre formule moins parce que ce sont ceux qu'ils sont moins pertinents dans le nouvel appartement. Les prix auraient plus attendre votre échantillon, donc pour résumer, dans les problèmes d'agression, nous prédisons la valeur numérique spécifique d'un attribut particulier en utilisant les données disponibles et d'autres attributs, et nous faisons tout cela à l'aide d'une formule que nous tirons d'un ensemble existant de données réelles. 6. Problèmes de classification dans le machine learning: classifications est un grand groupe de tests qui sont utilisés assez souvent, je dirais est ouvert sa régression ou même plus souvent, comme nous pouvons le comprendre à partir de la spécification de nom est utilisé afin d'attribuer un objet à une certaine classe. Par exemple, la frontière sera-t-elle capable de répéter seule ou non ? Ou est-ce un docker qui prend la photo, ou est-ce que l'entreprise va faire faillite ou non ? Et ainsi de suite ? Si nous comparons avec la régression dans la régression, nous n'avons pas de classes. Nous prédisons simplement une valeur miracle. Par exemple, lors de la conférence précédente, nous avons prédit les prix sur les appartements et les problèmes de déclassification. Le nombre de classes est limité. Nous fournissons les noms des classes à l'ordinateur, et l'ordinateur détermine à laquelle de ces classes appartient le nouvel objet. Regardons quelques mots clés, quand les défenses de classification peuvent être utilisées. Aujourd'hui, de nombreuses banques utilisent des algorithmes de classification pour déterminer s'il faut approuver un prêt à un emprunteur ou non. Dans ce cas, il y a généralement deux classes. La première classe est un crédit qui vaut le travail de Bora, et la deuxième classe est un Bora potentiellement peu digne de confiance. Travaillez maintenant imaginez, et votre client vient à la banque et veut prendre seul la façon dont les banques déterminent à quelle eau de la frontière Christ appartient l'une ou l'autre, surtout si elles n'avaient pas d'expérience antérieure en interaction avec lui. C' est vrai. Ils regardent une grande base de données de leurs clients et tirent des conclusions sur quelle classe de guerres mondiales . Ce nouveau client est plus similaire au fonctionnement de ces algorithmes de classification. Le banc a des dizaines, voire des centaines de milliers de données de leurs clients, et ils savent lequel des clients paient à temps et atteindre, retarder le paiement ou même devenir insolvable. Ils regroupent ces données sur la base de données. Par exemple, celui qui est prêt n'excède pas 30% sur son revenu mensuel, généralement basé régulièrement sur celui qui a déjà un autre long retard orphelin. Et il y a beaucoup de chaînes psychologiques basées sur cette information. L' ordinateur de la banque a construit un modèle de spécification, sorte que l'ordinateur construit un modèle. Ensuite, le directeur de la banque demande trop peu un questionnaire à un nouveau client. Ensuite, il entre toutes ces données dans le modèle, et l'algorithme donne une réponse. Ce nouveau client est des emprunteurs dignes de crédit ou potentiellement non dignes de confiance. Le modèle peut même indiquer avec quelle probabilité ce nouveau client sera susceptible de retarder seul et s'il va appâter à tous ces jours. La notation de crédit roi la plupart des banques est effectuée automatiquement, même sans l'implication de la banque. Les clients spécialisés remplissent simplement une demande en ligne, et l'ordinateur donne automatiquement ou non l'approbation. Dans les cas complexes et litigieux, un gestionnaire de banque est bien sûr. Wolf, dans cet exemple de problèmes de constipation, a été mentionné dans les conférences précédentes où nous avons mentionné les fleurs irlandaises. Il s'agit également d'une tâche typique de cation de question. Nous avons des classes gratuites de fleurs, et nous devons apprendre à prédire à quelle classe appartient une fleur. Selon la taille de ses pétales et échantillons, problèmes de déclassification peuvent être résolus en utilisant différentes méthodes. Les plus couramment utilisés sont la régression logistique de l'arbre de décision suivante et ne confondez pas avec la régression linéaire habituelle que nous avons déjà mentionnée. Et nous prédisions une valeur numérique spécifique. régression logistique est un peu différente. En utilisant des algorithmes, nous trouvons la ligne qui divise notre ensemble de données en classes, puis une forêt aléatoire, ensembles et un support de mendicité, machine vectorielle et des voisins aigus oreilles. Nous examinerons ces questions plus en détail dans les fractures suivantes. En attendant, en un mot. Dans les problèmes de constipation, nous prédisons à quel Christ et objet appartient. Le nombre de places est limité. C' est, par exemple, d'approuver. Seul ou pas. La photo montre un bus, voiture ou un vélo, et ainsi de suite. De nos jours, les problèmes de classification sont de plus en plus utilisés dans de nombreuses industries, peut-être même plus souvent que les problèmes de régression, et par conséquent, il est une bonne idée d'apprendre cette question méthodes Gatien. 7. Le clustering dans le machine Apprentissage: est l'un des principaux types d'apprentissage automatique non supervisé dans les tâches de clustering. Nous avons un ensemble de données, et nous devons comprendre sa structure interne. Nous divisons les données en groupes ou clusters de manière à ce qu'à l'intérieur de chaque cluster, nous ayons éléments qui sont les plus semblables les uns aux autres, mais qui diffèrent des éléments des autres groupes. Vous avez peut-être une question raisonnable. Quelle est la différence entre les classifications et les problèmes de regroupement ? Je vais essayer de l'expliquer avec un exemple. Imaginez que nous ayons une table avec les caractéristiques des planètes et des étoiles. Et grâce à chaque objet, nous avons une réponse, que ce soit une planète ou une étoile. Les réponses sont les étiquettes, qui sont utilisées dans l'apprentissage automatique supervisé. Basé sur ces étiquettes, l'ordinateur construit un modèle qui peut prédire dans inutile. Pourtant, le corps est une planète ou une étoile. Ceci est un exemple de problème de classification parce que nous avons un nombre limité et prédéfini de classes qui sont des étoiles et des planètes, et nous prédisons à quelle classe appartient le nouvel objet. Mais imaginez que nous n'avons pas eu de réponses. Quels sont ces objets dans l'espace ? Nous n'avions que leurs caractéristiques, telles que le poids, la température, la composition et ainsi de suite. Dans ce cas, l'ordinateur avec juste divisé des objets bien en deux groupes, en fonction de leurs caractéristiques similaires et différentes. Notre ordinateur dirait qu'il y a deux clusters évidents qui diffèrent les uns des autres, et il serait de notre tâche d'appeler ces deux clusters d'une manière ou d'une autre par la suite parce que le clustering est un exemple d'apprentissage automatique non supervisé dans lequel nous n'avons pas de balises ou des réponses pour chaque objet. Dans notre ensemble de données, nous divisons simplement tous les objets en groupes, et nous n'essayons pas de prédire quoi que ce soit. En ce qui concerne les nouveaux objets, nous divisons simplement les objets existants en clusters. Dans quels autres types de cas avons-nous besoin d'utiliser le clustering, un des utilisateurs les plus actifs de la classe ? Bague pour les détaillants et les grands magasins, qui veulent savoir qui sont leurs clients ? Prenons, par exemple, un grand magasin qui veut faire des promotions ciblées pour ses consommateurs. Il devra les diviser en groupes ou en groupes. Par exemple, les consommateurs peuvent être divisés en groupe familial de groupes suivants. Ils ont tendance à mordre des articles ménagers et bon avec les enfants. Les athlètes qui souvent par les produits sportifs et les jardiniers de nutrition sportive et ainsi de suite. Et la prochaine fois, quand il y a une vente, la promotion du magasin d'articles de sport enverra les messages de problème à propos de cette promotion. Pas tous ses clients, mais seulement ceux qui ont déjà les deux articles de sport dans le passé. La boisson de classe est également très activement en utilisant les réseaux sociaux. Il est fait principalement pour diviser les utilisateurs en groupes en fonction de leur intérêt pour ces transfuges, puis leur offrir des vidéos, des images,des utilisations et d'autres contenus plus appropriés et pertinents images, afin qu'ils passent plus de temps dans ces APS. Deuxièmement, cela se fait par la publicité ciblée plus efficacement pour la rendre plus ciblée. Précisément pour les groupes hors utilisateurs, il pourrait être le plus intéressé par les produits annoncés. smartphones utilisent également des algorithmes de clustering pour séparer les photos et les vidéos dans différents dossiers, par exemple, en fonction de la date de l'endroit où les photos prises afin que les utilisateurs puissent trouver ces photos plus facilement Ces jours-ci. Smartphones peuvent même distinguer ce qui est représenté sur la photo, et ils peuvent séparer les photos en fonction de ce qui est vu, ce soit des gens paysages pour la maison en biologie, clés de salle de classe utilisées afin de séparer nouvellement découvert les représentants des royaumes animaux et végétaux dans les espèces existantes, en fonction de leurs caractéristiques. Très souvent, des algorithmes de clustering sont utilisés dans la recherche génétique, en particulier pour la notation gentleman. Toute biologie évolutionnaire, donc dans le regroupement, ne prédit pas quelque chose. Mais nous distribuons simplement les objets existants dans différents groupes ou groupes en fonction leurs caractéristiques et caractéristiques similaires. Il nous aide à comprendre l'infrastructure de notre ensemble de données dans l'orteil mandalas, travailler plus efficacement avec notre plus tard. 8. Méthodes d'ensemble dans le machine Apprentissage: Bonjour, là. Supposons que nous ayons un certain algorithme et qu'en principe, il s'acquitte bien de ses tâches. Mais que se passe-t-il si nous voulons améliorer la précision des prédictions de nos algorithmes ? Dans ce cas, nous allons utiliser des méthodes supplémentaires et plus avancées. Dans les prochaines conférences, nous allons en apprendre quelques-unes, notamment des ensembles, des ensachements et de la forêt aléatoire. Méthodes d'ensemble. Dans l'apprentissage automatique, nous utilisons une combinaison de plusieurs algorithmes différents pour résoudre le même problème afin d'améliorer la précision de la prédiction. L'utilisation d'ensembles dans l'apprentissage automatique est basée sur le théorème du jury Condorcet, publié dès le XVIIIe siècle. Selon ce théorème, si nous avons un jury et que chaque membre du jury a une opinion indépendante, c'est-à-dire que ses réponses sont indépendantes et que la probabilité de la bonne décision pour chaque membre du jury est supérieure à 50. pour cent, alors la probabilité de prendre la bonne décision par les anciens jurés s' approchera de 100 % à mesure que le nombre de membres du jury augmente. La même chose s'applique dans le cas contraire. Si la probabilité de prendre la bonne décision est inférieure à 50 pour cent, alors une augmentation du nombre de jurés, la probabilité de prendre la bonne décision tendra à 0. Un autre exemple illustrant est l'exemple dit de la sagesse de la foule. En 1906, la ville de nettoyage a accueilli une peur qui comprenait de nombreux événements de divertissement différents. Et c'est l'un de ces événements, environ 800 personnes ont participé à un concours pour deviner le poids d'un bool. Aucun des visiteurs de l'exposition n'a pu deviner le poids exact du taureau. Mais le statisticien Francis Galton a calculé que la moyenne arithmétique de toutes les hypothèses diffère de moins de 1 % du poids réel du taureau. Le taureau a attendu cent deux cent sept livres, et la moyenne arithmétique était de 1198 livres. Cela a conduit à une conclusion surprenante que si une personne ne peut pas donner la bonne réponse, alors si vous collectez des données auprès de nombreuses personnes et que vous les faites moyennes, vous obtenez un résultat très bon et très proche du vrai. La sagesse de la foule est aujourd'hui utilisée dans de nombreux secteurs. Par exemple, lorsque le joueur demande au public d'aider la célèbre émission de télévision Who Wants to Be a Millionaire. Et même toute l'idée derrière la création d' une Wikipédia ou de Yahoo Answers ou de services similaires. Ils sont tous basés sur les informations fournies par un grand nombre d'utilisateurs. Et si nous considérons que la plupart des utilisateurs fournissent des informations au mieux de leur connaissance, alors avec chaque nouvel utilisateur, la fiabilité et l'exactitude de ce contenu et des informations augmenteront et la qualité des informations aura tendance à améliorer. Les scientifiques des données ont donc décidé d'appliquer ce théorème du jury Condorcet et l'idée de la sagesse des foules dans l'apprentissage automatique afin d'améliorer la précision des algorithmes. Supposons que nous ayons plusieurs algorithmes. Nous savons qu'un algorithme est exécuté sur un segment de données et que l'autre est erroné sur le segment de données. Donc, si nous combinons les résultats, nous pouvons montrer qu'ils sont combinés. L'erreur tombera car ils s'annulent mutuellement. Ainsi, lors de l'utilisation de la méthode de l'ensemble, le résultat combiné de plusieurs modèles est presque toujours meilleur en termes de précision de prédiction par rapport à l'utilisation d'un seul modèle. Prenons un autre exemple. Une histoire amusante sur un groupe de personnes aveugles et d'un éléphant. Dans l'histoire, on demande à plusieurs aveugles de toucher un éléphant et de dire comment on dirait que quelqu'un touche ses oreilles, quelqu'un touche son tronc et que quelqu'un touche sa queue ou ses jambes. Pour chacune de ces personnes, l'idée de l'apparence de l'éléphant sera différente. Cependant, si nous combinons les opinions pleines d'entre elles, nous aurons une idée très complète de ce à quoi ressemble un éléphant. C'est un exemple d'ensemble en combinant différents modèles ensemble qui améliorera la précision de notre prédiction. 9. Bagging et stimulent: Les méthodes de classification des ensembles un peu plus avancées comprennent l'ensachage, boosting, la forêt aléatoire et l'empilage. ensachage est synonyme d'agrégation bootstrap. Supposons que nous ayons un grand jeu de données. Nous commençons à extraire aléatoirement des objets de l'ensemble et à en créer des jeux de données plus petits. En conséquence, nous obtenons plusieurs nouveaux jeux de données plus petits, qui, en termes de structure interne, seront très similaires à notre jeu de données d'origine, mais en même temps seront légèrement différents. Certains objets se trouvent dans plusieurs nouveaux jeux de données. C'est-à-dire qu'ils vont se croiser et c'est normal. Ensuite, nous entraînerons nos algorithmes sur ces nouveaux jeux de données plus petits. Et cette méthode tend à améliorer notre précision. Supposons que nous soyons une entreprise pharmaceutique et que nous ayons des données sur 10 000 patients et leurs réactions à un nouveau médicament que nous avons inventé. Pour certains patients, le médicament fonctionne très bien. Pour d'autres, cela ne fonctionne pas du tout. Nous avons un arbre de décision et après avoir formé notre algorithme, nous obtenons un modèle qui donne les bonnes prévisions dans 75 % des cas. Ce n'est certainement pas mal, mais 25 pour cent de l'erreur de prédiction reste un écart assez important. Par conséquent, nous divisons notre jeu de données sur les patients, plusieurs jeux de données plus petits. Par exemple, chacun contenant 2000 patients. Ensuite, nous entraînons nos algorithmes sur chaque nouveau jeu de données. Ensuite, nous regroupons les algorithmes obtenus dans le modèle final, qui fera désormais les prévisions correctes dans plus de 80 % des cas. mendicité est généralement utilisée lorsque la variance de l'erreur de la méthode de base est élevée. mendicité est également utile dans les cas où l'échantillon initial n'est pas aussi volumineux Par conséquent, nous créons de nombreux échantillons aléatoires à partir du jeu de données d'origine. Bien que les éléments de ces jeux de données Sub puissent être dupliqués en règle générale, les résultats après l'agrégation sont plus précis que les résultats basés uniquement sur le jeu de données d'origine. boosting est un autre moyen de créer un ensemble d'algorithmes lorsque chaque algorithme ultérieur cherche à compenser les lacunes des algorithmes précédents. Au début du premier algorithme est formé sur l'ensemble de données. Et chaque algorithme suivant est construit sur les échantillons dans lesquels l'algorithme précédent a commis une erreur. De sorte que les observations qui ont été mal prédites par le modèle précédent reçoivent plus de poids. Ces dernières années, le boosting est resté l'une des méthodes d'apprentissage automatique les plus populaires sur les réseaux neuronaux. Ses principaux avantages sont la simplicité, la flexibilité et la polyvalence. L'un des exemples les plus populaires de l'algorithme de boosting est l'algorithme adaptatif Adaboost développé par Shapiro et fluide à la fin des années 90 du siècle dernier. 10. Vote et moyennage de la majorité dans Ensembling: Les ensembles peuvent être visualisés de différentes manières. Les méthodes les plus simples sont le vote majoritaire ou la moyenne et la moyenne pondérée. Le vote majoritaire signifie que chaque modèle fait une prédiction pour chaque instance de test. Et le résultat final de la prédiction sera celui qui sera le plus courant ou qui recevra plus de la moitié des votes. Si aucune prédiction ne représente plus de la moitié des prévisions mondiales que dans ce cas, nous pouvons conclure que la méthode de l'ensemble n'était pas un bon choix pour faire des prédictions, et nous devrions probablement choisir une autre méthode. Prenons l'exemple suivant. Supposons que nous voulions acheter un nouveau téléphone. Nous avons le choix entre des modèles américains, chinois et coréens. Si nous n'utilisions pas la méthode de l'ensemble, par exemple, nous venions au magasin, demanderions au PDG résistant ce que vous recommanderiez et prendrions ce modèle. Si nous utilisons un ensemble, avant de choisir quel téléphone acheter, nous allons d'abord mener un sondage avec différentes personnes, avec tous les amis, voir les avis des utilisateurs sur Internet, l' utilisation de modèles sur YouTube et les experts. recommandations. Si nous choisissons la méthode de vote majoritaire. Dans ce cas, nous choisirons le modèle de formulaire recommandé par la plupart des gens. La méthode suivante est la simple moyenne. Supposons que nous ayons un portail cinématographique et que nous attribuions une note de un à dix pour chaque film. Ou bien les utilisateurs qui ont regardé le film soumettent leurs évaluations. Ensuite, nous obtenons une note moyenne basée sur toutes ces données. Par exemple, deux personnes ont donné une note de 76 personnes, n'est-ce pas ? À huit, 12 personnes à 99 personnes ont obtenu une note maximale de 10. Par conséquent, le score moyen est de 8,96. Et la méthode suivante est la moyenne pondérée. Encore une fois, prenons l'exemple de classement des films. Ici, nous pouvons donner différents groupes de vos poids différents. Par exemple, les critiques de films professionnels ont reçu un poids d'un. Les utilisateurs qui sont sur la plateforme depuis longtemps reçoivent un poids de 0,75. Les utilisateurs finaux qui se sont inscrits sur, nous avons récemment reçu un poids de 0,5. Ensuite, nous tirons une moyenne pondérée à partir de leurs estimations. Nous obtenons ainsi une meilleure évaluation car on suppose que les critiques de cinéma et les cinéphiles habituels connaissent mieux les films. 11. Forêts aléatoires: Les algorithmes forestiers aléatoires sont très souvent utilisés dans des problèmes d'apprentissage automatique, et ils peuvent être utilisés dans un large éventail de tâches, clustering, de régression et de classification. La forêt aléatoire est construite de la même manière que la mendicité, mais c'est une version légèrement compliquée. La similitude avec la mendicité est que nous créons plusieurs jeux de données plus petits à partir de notre grand jeu de données initial initial. La différence est que dans le prêt, nous utilisons toutes les fonctionnalités lors de la création d'algorithmes. Et dans la forêt aléatoire, nous ne sélectionnons au hasard que quelques entités sur la base desquelles nous construirons chaque arbre individuel. Nous avons eu un exemple avec une entreprise pharmaceutique où nous devions comprendre si notre nouveau produit médical aurait un effet sur des personnes présentant des caractéristiques différentes, en particulier l'âge, le sexe, taux de cholestérol et le sang pression. Lors de l'ensachage, nous créons des sous-échantillons et construisons un arbre de décision pour chaque sous-échantillon basé sur tous les attributs d'une forêt aléatoire Nous créerons également des sous-échantillons. Mais pour chaque sous-échantillon, nous ne prendrons au hasard que certaines caractéristiques, pas toutes. Par exemple, le sexe et l'âge unidirectionnels, ou seulement le taux de cholestérol de l'agent. Ensuite, comme d'habitude, nous allons agréger nos résultats et, en règle générale, nous obtiendrons une précision encore plus grande des prédictions de nos algorithmes. En ce qui concerne les problèmes de classification, nous choisirons notre modèle final par vote majoritaire. Et dans les problèmes de régression, nous utiliserons la moyenne. Cependant, la forêt aléatoire présente un inconvénient important. L'interprétation des prédictions devient très difficile car nous avons de nombreux arbres sur des structures et des profondeurs différentes. Et chaque arbre utilise une combinaison différente de fonctionnalités. Par conséquent, dans les cas où la transparence sur les clés décisionnelles est nécessaire, forêt aléatoire n'est pratiquement pas utilisée. Par exemple, dans la notation de crédit lorsque les banques décident d'accorder ou non un prêt à un emprunteur. Dans ce cas, nous devons savoir pourquoi notre modèle a donné ces décisions ou leur décision. Et si nous utilisons la forêt aléatoire, elle devient incompréhensible. Ainsi, une forêt aléatoire ressemble à une boîte noire. Il prédit très bien, mais pratiquement il n'explique rien. d'autres termes, on ne sait pas très bien sur quoi ces prédictions sont fondées. Cependant, pour les canards où une grande précision de prédiction est nécessaire. La forêt aléatoire est l'un des algorithmes préférés. 12. Configuration Python. Anaconda distributive: Il y a beaucoup de langages de programmation. Mais le transfecteur et historiquement, Brighton est devenu la norme en chef de machine, analystes candidats est. De nombreuses bibliothèques ont été collectées pour python. Bien sûr, d'autres langues peuvent également être utilisées, comme notre scaler ou C Sharp. Mais nous allons nous concentrer sur Python parce que c'est probablement le plus populaire et le plus simple pour apprendre. Il y a un côté merveilleux appelé Anaconda. De ce côté, vous pouvez télécharger non seulement Python mais aussi diverses bibliothèques pour cela, qui sont utilisées par les scientifiques de données ainsi que tous ceux qui sont engagés dans l'apprentissage automatique . Qu' est-ce qu'un mensonge ? Toutes les bibliothèques mordantes sont des solutions prêtes à l'emploi, c'est-à-dire des modèles avec des modèles de code. Ils ont été créés de sorte que les programmeurs n'ont pas à retirer le même code à chaque fois qu'ils ouvrent simplement le fichier, insérez vos données et obtenir le résultat souhaité, Alors considérez-les comme des dépositaires hors modèles de cour. Donc, le sur un préservatif comprend tous les outils de base pour l'écriture de code, l'analyse de données et diverses bibliothèques qui peuvent aider dans ce processus. Le premier instrument est Jupiter Notebook. C' est un environnement dans lequel écrire du code et testé. Ensuite, nous avons diverses bibliothèques. Les dépenses E les plus populaires. Il s'agit d'une bibliothèque pour travailler avec des données tabulaires. Il est très similaire à Excel. La deuxième bibliothèque est beaucoup de sommeil. Il est utilisé pour visualiser les données, créer des graphiques et des graphiques. La première bibliothèque est médium. Apprenez. Il contient les algorithmes d'apprentissage automatique de base. Avec l'aide de l'apprentissage psychique, vous pouvez utiliser des algorithmes tels que la régression linéaire, réseaux neuronaux simples et des arbres de décision, et un tenseur de bibliothèque supplémentaire plein. Il est utilisé pour travailler avec des réseaux neuronaux de diverses architectures, alors téléchargeons Brighton. La dernière version indécise peut être téléchargée pour Windows, Mac OS et Kleenex. Après le téléchargement peut un préservatif, vous voyez le raccourci Anaconda Navigator, soit sur le bureau ou dans le menu Démarrer. Cliquez dessus et cette fenêtre apparaîtra. Nous serons surtout intéressés par le cahier Jupiter, et ne pas que vous ne devriez pas le confondre avec la lampe Jupiter. Donc, après le bloc-notes Quicken Contributor, un navigateur s'ouvrira et une telle fenêtre apparaîtra. Jupiter vous permet de créer des cahiers, qui sont des fichiers avec le code python que vous pouvez immédiatement exécuter et tester où vous pouvez créer, saisir et faire d'autres choses. Créons un dossier et nommez-le. Maintenant, Dans ce dossier, nous créons un fichier pour un soi-disant bloc-notes, et vous écrirez du code dans les cellules de ce bloc-notes. Dans les résultats conservés suivants, nous allons commencer à apprendre les bases de la programmation Python, commandes les plus élémentaires pour l'introduction initiale. Si, pour une raison quelconque, vous ne voulez pas installer Python ou Anaconda distributive, peut-être qu'il n'y a pas assez d'espace dans leur ordinateur ou pour une autre raison, vous pouvez également utiliser les services Google Collapse. C' est l'environnement que Google loue à vous et où vous pouvez également coder en python sans installer kid sur votre ordinateur. Autrement dit, c' est un système prêt à l'emploi sur lequel vous pouvez immédiatement commencer à travailler. Autrement dit, votre environnement de Microsoft fonctionne de la même manière. Si vous avez un compte Microsoft, vous pouvez utiliser leurs points et blocs-notes dans un environnement Azure sans rien installer . Bon, alors, dans le prochain épisode, nous allons apprendre quelques commandes de base dans Brighton 13. Commandes de base dans Python: Donc, si vous pire à propos de Python, c'est un langage assez pratique pour ceux qui commencent tout juste à apprendre la programmation, je dirais qu'il a un Syntex légèrement plus simple. n'y a pas de demi-deux-points et le commun me semble plus simple. Et il n'a pas besoin de surveiller constamment de sorte que tous les supports sont ouverts notre fermé et sorte que tous les modèles sont correctement empilés et ainsi de suite. Regardons le plus simple en commençant par téléphone. Tout d'abord, comme il beaucoup de langues. Si vous mettez le symbole de hachage, alors vous pouvez écrire n'importe quoi. Il sera considéré comme un commentaire et qui peut être reproduit comme froid. Habituellement, ces commentaires sont nécessaires pour que vous compreniez vous-même pourquoi vous avez écrit tel ou tel code lorsque vous examinerez quand d'autres programmeurs le regarderont afin qu'ils puissent également comprendre pourquoi vous avez roulé le manteau de cette façon et non autrement. Ensuite, le commentaire d'impression affiche ce que vous avez écrit entre parenthèses sur le cri. S' il s'agit d'un texte, vous devez le mettre entre guillemets pour exécuter le commentaire. Vous pouvez appuyer sur Maj plus Entrée. Pyfrom est dans n'importe quel langage de programmation, vous pouvez effectuer des opérations mathématiques, par exemple, à déduire, multiplier ou diviser. Si nous imprimons $100.300 changement de prix, entrez et nous obtenons 400. Nous pouvons également déclarer les arrivées en écrivant une lettre ou un nom, puis en mettant la marque égale . Par exemple, A est égal à un guillemets Hill a world. Et puis nous pouvons imprimer cette arrivée en écrivant anti entre parenthèses A. Ou nous pouvons dire que maintenant la lettre A sera le numéro 100 la lettre B sera le numéro de 313. Et avec l'aide de la commande d'impression affichée là, certains sur l'écran ou tout autre numéro d'élection mathématique peuvent également être comparés les uns aux autres. Vous savez peut-être aussi que si vous voulez déclarer l'arrivée, il a mis un signe égal. Et si vous comparez aux rivaux les uns avec les autres et demandez où l'un est égal à l' autre, alors nous avons utilisé pour égaler les marques ensemble. Et si vous voulez comparer cela, les deux nombres sont inégaux, nous mettons un point d'exclamation, et une marque égale est avec n'importe quel langage de programmation. Il existe différents types d'objets en python. Quels types d'objets sont les plus communs ? On peut les diviser en deux fois. objets mutables et immuables dont la valeur peut changer sont appelés mutables. Où sont les objets dont la valeur est immuable une fois qu'ils sont créés ? Sont appelés immuables. La mutabilité d'un objet est déterminée par son temps. Les types immuables incluent le flotteur entier. variétés logiques ont également appelé ses milliards qui est, par exemple, tour chutes et la force. beaux types comprennent les prêtres, ensemble et les dictionnaires qui est, le long du chemin. On peut les changer. Voyons comment nous pouvons vérifier à quelle heure appartient l'objet. Nous pouvons utiliser la fonction type pour connaître la classe d'arrivée. De plus, comme vous pouvez le voir, contrairement à C Sharp ou Java, par exemple, le langage python est également caractérisé par le fait que lorsque vous déclarez si vous arrivez vous-même, n'avez pas besoin de initialement sûr quel type d'arrivée vous allez maintenant déclarer par téléphone se comprend. Vous venez d'essayer le nom de l'arrivée et ensuite le donner à valeur. Par conséquent, par téléphone est classé est une langue typée dynamiquement. Si nous avons écrit en C Sharp ou Java, qui indiquerait d'abord quel type d'arrivée il serait, et par téléphone. Nous déclarons simplement une comédie musicale à 10 et par téléphone lui-même, comprend que dans ce cas, le type d'arrivée est un entier et le garde de cette façon. De quoi d'autre nous pourrions avoir besoin. Il y a une telle idée que le formatage de sortie et le travail avec des chaînes. C' est une fonction très pratique qui nous permet de ne pas écrire de nouveau constamment du code, mais de le modéliser en quelque sorte , par exemple, , par exemple,afin de ne pas écrire le nom chaque fois que nous voulons que notre manteau remplace le nom chaque fois que nous en avons besoin. Il peut être conçu de différentes manières, en fonction du python que vous avez installé. Voici les principales options de sortie, par exemple, nom, musique, musique, orteil team ou et imprimer. Bonjour plus nom est le moyen le plus difficile quand nous ajoutons simplement le mot Bonjour et le nom de la variété, s'il vous plaît sachez que notre phrase est enfermée entre guillemets et ne pas oublier de laisser un espace après le mot bonjour et avant la seconde entre guillemets et le nom de l'arrivée doit être sans guillemets. La deuxième et la première option sont en utilisant la lettre supplémentaire F ou le mot quatre mois est bien, un crochets solidement. Ainsi, si nous voulons changer le nom du cépage, nous n'aurons plus besoin d'écrire une nouvelle ligne de code. Il remplacera automatiquement le nouveau nom et une autre fonction de base. Voyons quelle version de python nous utilisons dans leurs importations voit et puis imprimer et entre parenthèses cesser la version et juste pour le plaisir. Voyons quelle version désactivée par téléphone est utilisée sur Google effondrement. Donc, dans cette conférence, nous apprenons comment imprimer comment effectuer des opérations mathématiques et comment comparer les nombres les uns avec les autres, comment déclarer les différentes arrivées et quels types d'objets ils peuvent se rapporter, comment utiliser pour une entrée minute et comment savoir quelle partie de la vie et nous utilisons maintenant . Rendez-vous dans la prochaine conférence, où nous allons apprendre quelques commandes plus basiques par téléphone 14. Instruction if: pour les connaissances de base de la programmation par téléphone. Nous avons également besoin d'apprendre les soi-disant opérateurs pour contrôler le flux de commandes. Ceux-ci comprennent le cas échéant tout et quatre opérateurs. Commençons par le premier opérateur, s'il est utilisé pour vérifier les conditions. Si la condition est vraie, alors nous exécutons le If. Si la condition n'est pas vraie, alors nous exécutons le bloc else, ce qui signifie que nous disons à l'ordinateur si une condition se produit, puis exécutons une certaine recommandation. Si la condition n'est pas vraie, alors nous exécutons le bloc else, ce qui signifie que nous disons à l'ordinateur si une condition se produit, Sinon, exécutez une autre commande. Voyons donc à quoi ressemble l'instruction if sur un exemple concret. Maintenant, nous allons vérifier si les chiffres donnés sont égaux ou de l'ordre, comme nous le savons d'après le cours scolaire, même les nombres sont ceux pour lesquels le reste, lorsqu'il est divisé par 20 et pour les anciens chiffres, le reste, lorsqu' il est divisé par deux, est un par fonds. Il y a une personne que l'opérateur montre le reste sur diviser un nombre par autre nombre. Par exemple, si nous écrivons 25% à, alors nous en obtiendrons un, parce que si vous le faites je 25 par deux, vous obtenez 12 et le reste est un. Si nous écrivons 26% à alors vous obtiendrez zéro parce que 26 est divisé par deux sans le reste. Essayons d'autres numéros. Donc, n'écrivons pas une formule qui nous donnera la réponse. Si le numéro saisi est égal au numéro de commande est égal à laisser le numéro. Par exemple, le nombre 22, si le pourcentage de nombre aussi, est égal à zéro impression. Le numéro est même imprimé autrement. Le nombre est autre dans ce cas signifie que dans tous les autres cas, si le reste n'est pas égal à zéro, alors vous devez donner la réponse que le nombre est ancien. Vérifions le manteau sur différents numéros. Super, tout cadavre. Maintenant, si vous voulez également écrire le numéro qu'il a fourni dans votre entrée, vous pouvez également utiliser l'ancienne fonction. Il ressemble comme suit. Nous avions des crochets solidement à la ligne d'impression après le numéro du monde et après les guillemets , mettre un point ancien et essayé le nombre entre parenthèses. C' est le numéro que nous avons indiqué. Le début sera automatiquement démarré entre crochets bouclés. Le nombre est égal à 22 si le nombre pour cent à l'impression physique 20. Le nombre de crochets bouclés est pair période. Ancien et en parentis est le numéro d'autre. Imprimer le nombre de crochets bouclés est ancienne période ancienne et entre parenthèses nombre . Si vous obtenez un chèque jamais qu'il a utilisé purement parenthèses après le numéro du monde et également mettre la marque de période avant quatre mois, essayez de vérifier les chiffres juste en changeant votre numéro d'arrivée. Ajoutons une condition de plus ici. Par exemple, si nous saisissons zéro, beaucoup diraient si zéro est un nombre pair ou impair. Écrivez simplement que lors de la saisie de zéro, nous obtiendrons que vous avez entré zéro s'il vous plaît sous un nombre différent. Donc, quand nous ajoutons une nouvelle condition, nous utilisons un opérateur feuille. Un numéro de feuille est zéro impression que vous avez saisie zéro. Essayez un numéro différent, mais regardez ce qui se passe. Nous sommes toujours donnés que votre est pair. C' est parce que Python exécute les commentaires dans l'ordre qui est. abord, le programme lit la première ligne et divise notre nombre par deux. Et comme nous le savons en divisant zéro par deux, nous obtenons zéro, c'est-à-dire. Le reste est aussi nul, donc il nous donne la première commande que le nombre est égal. Que pensez-vous peut être fait pour éviter cela et que lorsque vous divisez par zéro, il nous donne le commentaire dont nous avons besoin. Prenez un court taureaux, arrêtez la vidéo et pensez-y. Vous pouvez même l'essayer vous-même sur votre ordinateur. Donc, comme vous l'avez probablement deviné, qui va juste balayer les lignes, Thirst va mettre le vent à vérifier. Que la réponse Tom Berry, zéro ou non, et alors seulement nous allons vérifier ce que reste nous avons. D' accord, alors. Donc voici une autre tâche que vous allez maintenant faire vous-même. Vous devrez écrire une chèvre dans laquelle nous indiquons la vitesse de la voiture. Et si la vitesse est inférieure ou égale à 60 kilomètres par heure, alors nous devons écrire. Soyez prudent sur les routes, et si la vitesse est de plus de 60 kilomètres par heure, alors nous écrirons. Veuillez respecter la limite de vitesse. 100 par heure est facultative. Il n'est pas nécessaire d'indiquer dans le froid juste la vitesse en chiffres et maintenant poser la vidéo et vous pouvez essayer de terminer la tâche. Alors, comment allez-vous ? Avez-vous réussi à écrire ce manteau et testé ? La cour ressemblera à ces vitesses est égale à 61 ici, nous pouvons réellement écrire n'importe quel nombre si la vitesse est inférieure ou égale à 60. Imprimez, faites attention sur la route. Si la vitesse est supérieure à 60. Imprimer, s'il vous plaît respecter la limite de vitesse ici en principe. Dans la deuxième ligne de code, nous pouvons utiliser soit une déclaration de plus, soit une autre instruction. n'y a pas de différence réelle. Vérifions les différentes vitesses et vérifions la vitesse de 16. Comme vous pouvez le voir, tout fonctionne si vous voulez. Vous pouvez essayer de penser à d'autres exemples pour vous-même et de les pratiquer à la maison, par exemple, essayant d'écrire le code s'il est possible de vendre de l'alcool ou des cigarettes à un acheteur, en fonction de son âge et en remerciement conférence sera poursuivre nos accords avec d'autres commandements dans Bytom. 15. Pendant qu'il est déclaré: l' opérateur de flux de contrôle suivant est l'instruction wild. Il nous permet d'effectuer les cycles répétés de tâches. Wild Statement fonctionne comme suit Alors que la condition suivante est remplie, il est nécessaire d'exécuter la commande suivante. L' exemple le plus simple est lorsque nous demandons à l'ordinateur d'afficher tous les numéros de 1 à 50 la cour ressemblera à ceux-ci. D' abord, nous déclarons son arrivée engourdie et c'est égal à un. Ensuite, nous écrivons que si notre variable est inférieure ou égale à 50, nous allons afficher ce nombre en utilisant la commande print se terminant la ligne suivante. Nous donnons la commande d'augmenter ce nombre par exécution à chaque cycle suivant. Le signe plus et égal signifie que nous donnons notre variable et vous valeur par l'agent Kwan Treat. Ces deux lignes, qui sont écrites sous tandis que l'impression et augmentées d'arrivée d'une, sont appelées une itération pour une passe hors de la boucle. Ils ne sont exécutés que si la déclaration sauvage est vraie. À l'intérieur d'un cycle, il peut y avoir n'importe quel nombre d'affections et même des cycles supplémentaires à l'intérieur du cycle principal. Alors que la déclaration est très souvent utilisée dans les jeux informatiques, dans le transfert de données et dans de nombreux autres cas en règle générale. À l'intérieur de l'instruction Wild, il y a un cépage qui change sa valeur à l'intérieur de la boucle car s'il reste toujours le même, même,le groupe sera constant et infini. Essayons de faire une autre tâche similaire. Essayez d'écrire le code en utilisant l'opérateur while de sorte que maintenant on vous donne des nombres dans la direction opposée de 52 0 mais de sorte que les nombres ne vont pas dans l'ordre. Mais après un chiffre, c' est 50 48 46 ainsi de suite. Mettez la vidéo en pause et essayez d'écrire ce froid, donc je pense que vous avez réussi à le faire. La cour ressemblera à ces maintenant musical à 15 alors que maman est plus ou égale à zéro. Imprimer Nam dans la ligne suivante, engourdi, moins égal à ok et créer. Que devons-nous savoir d'autre quand on parle de cette déclaration sauvage ? Tout d'abord, comment l'arrêter ? Parce que les cycles peuvent durer éternellement. Nous avons déjà dit que vous pouvez l'arrêter en spécifiant une restriction au tout début , par exemple, alors que le nombre est inférieur à 15. Mais que faire si nous n'avons pas de nombres, Mais au lieu de cela nous avons des mots où Nous avons des nombres, mais ils changent dans l'ordre aléatoire. Que devrions-nous faire dans cette situation ? Dans ce cas, nous pouvons avoir besoin de la commande Break, qui arrête le groupe. Comment ça ressemble ? Prenons un exemple similaire. Tapez des numéros de 1 à 10. Nous avons dit que le numéro d'arrivée est égal à un maintenant pour commencer la boucle constante que nous pouvons imprimer. Bien que vrai , le commentaire affiche le nombre lui-même. Dans la ligne suivante, nous ajoutons un au nombre à chaque fois. Et puis nous utilisons la déclaration if, qui aurait déjà appris dans la conférence précédente. Donnez le nombre est 10. Le commentaire de pause va interrompre notre cycle, et après le cycle, il s'est arrêté. Vous pouvez écrire la phrase, par exemple, fait. Non la marge du bord de la ligne parce que la phrase faite doit être retournée au même niveau est l'instruction while d'origine et ensuite elle ne sera exécutée qu'après la fin du cycle sauvage . Alors passons maintenant. La fonction suivante est comment faire en sorte que l'ordinateur nous demande quelque chose et ensuite utiliser ce qui est entré pour l'opération. Pour ce faire, nous aurons besoin de la fonction d'entrée supposons que nous voulions jouer à un jeu appelé Guess My Age soif fournirait à l'ordinateur notre véritable âge. Et puis l'ordinateur demandera à la personne de le deviner. Selon la réponse que nous tapons, l'ordinateur continuera à nous demander ou nous dira que nous avons deviné cet âge. bonne façon. Comment pouvons-nous implémenter ce jeu en quelques lignes de code ? Nous avons d'abord dit l'âge variétal, qui est n'importe quel nombre qui n'est pas égal à notre âge réel. Ensuite, nous écrivons alors que la vérité, ce qui signifie fondamentalement que nous donnons la commande d'exécuter le cycle pour toujours. Ensuite, la déclaration si même les âges 13 et c'est l'âge que nous avons deviné est vrai. Ensuite, sur la ligne suivante, nous tapons break, ce qui signifie que nous brisons la boucle. Et si cela si l'instruction ne fonctionne pas, alors nous écrivons âge égal à et puis la formule suivante int entrée et obtenir l'âge. Ce premier signifie que maintenant l'âge variétal aura une valeur que l'utilisateur entre en réponse à l'expression porte âge. Le travail en début signifie qu'il sera un entier. C' est un nombre sur la ligne suivante et au même niveau que la déclaration sauvage que nous écrivons, vous l'avez deviné. Cette phrase ne sera exécutée que lorsque la boucle while se casse parce que si les âges ne sont pas devinés, l'ordinateur continuera à exécuter le cycle et demandera d'obtenir l'âge encore et encore. Essayons-le comme vous pouvez voir tout bizarreries. La seule chose ici est d'insérer un petit espace après l'âge du monde. Encore une chose, vous pouvez demander, Pourquoi on écrit alors que la vérité ? Qu' est-ce que ça veut dire ? Ceci est fait pour définir une boucle constante, en fait au lieu du monde vrai. Après un certain temps, vous pouvez mettre n'importe quelle instruction vraie , par exemple, tandis qu'un est inférieur à deux et l'ordinateur exécutera cette boucle while tant qu'un est inférieur à deux. C' est toujours et donc juste coutume dans de tels cas d'écrire simplement, alors que vrai, donc ce que nous avons appris dans cet épisode, la boucle while comment il peut être arrêté en utilisant le initialement spécifié, contraint ou à l'aide de la commande break. Nous avons également examiné comment capturer et utiliser ce que l'utilisateur a tapé à l'aide de la commande d'entrée donc maintenant quelques devoirs pour vous. En utilisant l'instruction wild, essayez d'écrire le code de sorte que l'ordinateur continue à demander à Cue le mot de passe jusqu'à ce que vous l'ayez correctement saisi . Et si vous avez entré le mot de passe correct, l'ordinateur affiche la phrase Bienvenue. Un petit indice dans la ligne où vous allez capturer le mot de passe entré par l'utilisateur. Faites attention au type d'arrivée, si votre mot de passe sera un numéro ou un set off lettres. 16. Prédire les prix à plat avec la régression linéaire en Python: dans cet épisode, nous allons apprendre à prédire les prix des appartements en utilisant python et simple dans un modèle de régression. Rappelez-vous que nous avons fait la même tâche en soi. Donc, nous allons utiliser le même fichier et voir à quoi il ressemble dans mon iPhone à la fin de l' épisode. Je vais aussi vous donner une autre tâche à faire, c'est vos devoirs. Ici, nous avons un fichier Excel qui nous indique le prix d'un appartement, en fonction de sa superficie. Comme vous le savez, il s'agit d'une corrélation très simplifiée. Nous comprenons tous que le prix de l'appartement est influencé par un très grand nombre de facteurs en dehors de la zone, comme la ville. Quel âge est l'emplacement du bâtiment du centre-ville et de la station de métro la plus proche, état du nombre d'histoires forfaitaires et ainsi de suite. Mais pour des raisons de simplicité, nous ne prenons qu'un seul facteur. La zone, parce qu'il est évidemment l'un des facteurs les plus importants, et la corrélation est assez forte lorsque nous faisons de telles prédictions, où il y a une dépendance linéaire ou que nous devons faire est de placer nos valeurs sur le graphique et tracer une ligne entre eux qui reflète le plus précisément la corrélation. Et quand nous avons une telle ligne, nous pouvons prédire quel sera le prix, en fonction de n'importe quelle zone. Mais vous pouvez demander pourquoi la ligne ressemble à ça parce qu'elle ne passe pas par tous les points. Est-ce la meilleure ligne qui décrit la corrélation entre le prix et la superficie ? Comme nous l'avons déjà dit dans l'une de nos précédentes conférences sur la régression ? Afin de trouver la ligne qui décrit notre dépendance telle que je caractérise possible, nous utilisons la formule. Pourquoi est-il égal à un X Plus B dans nos clés ? Pourquoi est le prix et X est la région ? Et pour trouver les coefficients, nous utiliserons la méthode la plus classique, qui est la méthode des moindres carrés. La méthode des moindres carrés est la méthode. Lorsque vous trouvez la formule enrichie, la somme des écarts carrés de nos valeurs réelles est la plus petite de la ligne que nous construisons . Voyons comment cela fonctionnera. Fife dans un premier temps formera notre modèle en utilisant les données disponibles sur les appartements avec des prix réels, puis il fera des prévisions pour d'autres partenaires avec une zone différente. Rappelez-vous quand nous avons installé python sur leur cou sur le site, nous avons dit qu'Anaconda contient également diverses bibliothèques pour l'apprentissage automatique. Ils étaient des experts modèle, dorment sur et d'autres. Ces bibliothèques contenaient des modèles de code prêts à l'emploi pour divers algorithmes d'apprentissage automatique. Par conséquent, la première chose que nous devrions faire est trop importante. C' est des bibliothèques dans notre carnet de bisons à Jupiter. Bundle est nécessaire pour travailler avec des données tabulaires comme Excel. Maintenant acheter facilite les opérations mathématiques par téléphone et sera nécessaire pour visualiser notre date sur des graphiques et des graphiques. Et une autre bibliothèque importante est l'apprentissage psychique. Il contient des algorithmes de base, hors machine learning à partir de l'apprentissage psychique. Nous allons importer l'algorithme de régression linéaire. Suivant. Ce que nous devons faire est de télécharger notre fichier Excel dans notre bloc-notes Jupiter. Nous devons télécharger ce fichier dans le dossier où se trouve notre bloc-notes Python. Cliquez sur le téléchargement et téléchargez le fichier dans ce plus complet. Maintenant, nous avons besoin de télécharger ces fichiers Excel dans notre par le bloc-notes en utilisant le code suivant PD cupidité, Excel et dans Barrington dit que le nom du fichier que vous avez ici signifie le bloc de données que nous créons. Vous pouvez lui donner n'importe quel autre nom que vous voulez et avec le D de commentaire. Nous pouvons maintenant afficher ce tableau. En passant, si vous avez un incendie avec l'extension CSC, qui est également commun lorsque vous travaillez avec des tables, alors vous devrez utiliser le code pedido Treat CSE et le nom du fichier. Visualisons maintenant les données de cette table sur le graphique. Pour ce faire, nous aurons besoin d'eux vers le haut bibliothèque Creep, qui étaient également importants au début de sorte que le tribunal sera pour cent mois dormera en ligne, puis la ligne suivante. Plt ne se dispersent pas et dans parentis est la zone DF Kalmadi de prix dans BLTS getter entre parenthèses , nous indiquons d'abord l'axe X, puis il y a axes y. Super. Nous pouvons voir nos valeurs sur le graphique. En passant, nous pouvons faire des points d'une couleur différente en mangeant dans la fonction de dispersion coupable, la couleur du monde et la couleur dont nous avons besoin entre guillemets. Nous pouvons également, si vous voulez changer des points à d'autres Aikens, par exemple, des avantages ou des étoiles ou même des flèches. Pour ce faire, utilisez le marqueur de mot dans la fonction skater. Qu' est-ce qu'on manque d'autre ? Donnons vos noms à nos X et Y xs. Plt point exe. étiquette dans le parent est la zone mètre carré et l'étiquette y adulte BLT entre parenthèses. Prix 1 000 000 roubles. Super. Maintenant, ça ressemble à un vrai tableau. Ok, donc maintenant on peut commencer à entraîner le modèle de voiture. Nous avons déjà importé un modèle linéaire de la bibliothèque médium Lauren. Créons un cépage appelé chiffon, et ce sera notre modèle d'agression plus mince. Le frein est égal à orteil linéaire. Point du modèle de soulignement Régression linéaire. Parentis n'est pas la capitalisation dans la régression linéaire du travail. Si vous entrez des lettres minuscules, le tribunal ne fonctionnera pas. Ensuite, nous devons former ce modèle en utilisant les données que nous avons. En gros, nous devons montrer notre modèle tous les prix en fonction de la région. Et nous vous demanderons de calculer la meilleure formule de régression linéaire qui décrit la corrélation entre le prix et la zone. Nous utilisons donc la fonction pieds pour charger dans notre modèle. Nos données, lorsque l'air et les prix entre crochets doubles, nous donnons les valeurs hors sont des facteurs dans notre cas, la zone et après coma, les réponses dans nos clés, les prix. En fait, il peut y avoir plusieurs facteurs. Et puis on écrirait chaque facteur après le coma. Très bien, voici la confirmation que le modèle a été formé, et maintenant il peut faire des prédictions. Comme vous pouvez le voir, la toux de train, un modèle ne prend que quelques secondes, et dans l'apprentissage automatique dans la formation générale n'est qu'une partie de l'affaire. Ce qui est encore plus important, c'est de préparer les données pour la formation, choisir le bon modèle, puis d'interpréter correctement les résultats. Ok, passons à autre chose. Et essayons de prédire combien coûtera un appartement pour 38 mètres carrés. Corriger, prédire et en parentis est 38. Excellent. Et si 120 mètres, comparons avec notre prédiction faite en excel. Ils sont très similaires avec une grande précision. Donc, nous avons mentionné qu'une agressions plus maigreuses sont basées sur la formule. Pourquoi physique X plus B dans notre crépuscule, cet algorithme de régression azkadellia utilisé pour trouver de tels coefficients A et B, il donnera l'écart minimum de nos valeurs par rapport à la ligne que nous construisons. Voyons quels coefficients sont le modèle a pour le coefficient huit. Nous écrivons un trait de soulignement de point d'épave cueva, et pour le coefficient b, nous écrivons un trait de soulignement d'interception rectal. Ainsi, notre modèle est comme suit le prix de l'appartement est votre un 0,71 fois la superficie et plus 0,8111 Vérifions quelle formule nous avions. Un excellent. Comme vous pouvez le voir des résultats très similaires. Ils sont juste peu autour. En Excel. Vérifions encore. Nous multiplions 120 mètres par le premier coefficient et ajoutons le second coefficient à manger. Et oui, nous avons exactement le nombre qui nous a été donné dans la prédiction ci-dessus. Au fait, nous pouvons tracer la ligne qui montre nos prédictions. Nous utilisons l'algorithme de régression linéaire, donc nous aurons une ligne droite pour le voir dans notre graphique. Copions le code que nous avons utilisé ci-dessus pour obtenir le graphique. Et dans la dernière ligne, ed graphique de points BLT et en parentis est DF ère virgule Greg. Prédire la zone DF. Ce manteau signifie que nous tracons la ligne sur laquelle aura une zone le long de notre X X est, et le long accès blanc aura des prix que notre modèle a prédit. Faites attention au nombre de crochets et de parentis est il est très facile de se tromper lorsque vous entrez dans ce froid. Eh bien, comme nous pouvons le voir, cette ligne décrit le meilleur et assez bien étroit, léger écart par rapport aux vraies valeurs, mais ils seront inévitablement de la part de la police. Nous pouvons dire avec certitude que c'est la meilleure option sur toutes les lignes droites possibles pour ces points. Alors continuons et soutenons cela. Nous avons un feu avec des appartements dans lesquels nous savons qu'ils sont de la région mais ne connaissent pas les prix. Nous devrons sentir la deuxième colonne en utilisant les prix que notre modèle prédit. Nous allons d'abord télécharger ce fichier dans notre cahier Jupiter. Pour ce faire, ce fichier doit se trouver dans le même dossier que votre bloc-notes. Maintenant, utilisez la commande de lecture Excel pour télécharger le fichier dans notre bloc-notes Python. Il s'appelle cette nouvelle table avec de nouveaux appartements. Pred du monde prédit. Maintenant, affichons notre table. Il y a 10 lignes dans le tableau, et lorsque les fichiers sont trop longs, nous pouvons simplement demander à l'ordinateur d'afficher les premières lignes en utilisant la tête. Félicitez ou nous pouvons même indiquer combien de lignes de la table nous voulons afficher. Par exemple, la tête imprimée et l'inférence libre est rose libre. Ensuite, nous utilisons notre modèle existant pour faire des prévisions pour ces nouveaux appartements. Nous utilisons notre modèle rouge et l'envoi de la zone, ou pour un nouvel appartement, prédire rectal et in parentis est imprimé. D' accord. Comme vous pouvez le voir, ce sont les réponses avec les prix prévus. Grand maintenant sont crépuscule est de faire une autre colonne dans ce tableau afin que nous puissions insérer ces prix prédits là pour faire ces premiers. Sauvegardons nos prix prévus. Est-ce qu'un p variétal vous crée maintenant colonne et insère ces prix là pour le faire ? Nous écrivons simplement le nom de notre table de preds. Puis entre crochets et entre guillemets. Le nom de la nouvelle colonne prédit les prix. Et après cela, nous avons attribué à cette colonne, il y avait des prix prédits que nous avons reçus ci-dessus. Comme vous vous en souvenez, nous les avons désignés avec la lettre B. Excellent. Maintenant, il est juste de voir ces fichiers dans Excel Prayer pour dire d'exceller. Terminer le courant est de Laissez ce soit le fichier que vous. Maintenant, ce fichier devrait apparaître dans notre dossier dans Jupiter. Ici, c'est. Nous l'ouvrons très bien. La seule chose qu'il a aussi exporté. La colonne d'index qui est la première colonne, ce qui n'est pas nécessaire. Nous pouvons supprimer ici dans excel ou à nouveau pour le code. Il est supprimé, comme ces index physique aux chutes. Vérifions à nouveau, créez l'index est apparu. Alors, ce que nous avons vécu dans ces épisodes ? Tout d'abord, lorsque vous travaillez avec Machine Learning Project devra presque toujours importer des bibliothèques avant le début de chaque projet. Les bibliothèques les plus courantes sont pandas lump, je pourrais poliment, psychique apprendre et d'autres. Ils vous permettent de travailler avec des données tabulaires, visualiser la date sur des graphiques et d'utiliser des modèles prêts à l'emploi sur différentes machines Lauren Calgary pouces. Ensuite, nous avons appris à charger des fichiers Excel dans notre bloc-notes Jupiter et à visualiser des données tabulaires sur un graphique. Nous avons également appris à former notre modèle en utilisant les données disponibles et en utilisant l'algorithme de régression linéaire. Et nous étions là pour prédire les différents pour de nouvelles données. Et nous avons également appris à créer de nouvelles colonnes dans les tables par téléphone et à y entrer nos données prédites , puis à les enregistrer dans un fichier Excel sur notre ordinateur. J' aimerais maintenant vous donner quelques devoirs pour consolider ce que nous avons appris. Nous savons tous qu'une part substantielle du budget des fractures est constituée des revenus provenant de la vente d'énergie, pétrole et d'invités. Ça fait partie de nos devoirs. Prédisons la dépendance du PIB de la Russie sur les prix du pétrole. Pour ce faire, nous utiliserons les données des 15 dernières années. Je me suis préparé à déposer pour vous dans Excel. Il est attaché à cette conférence. Si quelqu'un est intéressé, j'ai pris les données du site Web de la Banque mondiale. Il y a beaucoup d'informations statistiques sur l'économie et d'autres aspects de la vie dans différents pays, ainsi que sur les sites Web qui est dot com. Le feu ressemble à ça. Nous avons le PIB sur la Russie, une colonne et les prix du pétrole. Dans une autre colonne, vous devrez le télécharger dans votre nouveau cahier de Jupiter, afficher ces datations et de l'artisanat, puis former le modèle et ensuite essayer de prédire notre PIB en fonction des différents prix du pétrole. Eh bien, c'est tout pour l'instant. Ils ont obtenu un fichier Excel pour la tâche de prédire les prix du département ainsi que le fichier Excel sur le pétrole. prix et le PIB sont tous les stades. Il y a une ressource à cette conférence. J' espère que vous avez apprécié cet épisode en voyant les prochains 17. Prédire le PIB du pays en fonction des prix du pétrole: Alors, comment sont vos progrès ? Avez-vous réussi à former le modèle pour prédire le PIB des broyeurs, en fonction des prix du pétrole, nous allons voir comment sont cool de ressembler à l'endroit, création de votre fichier et vous le nommez. La première chose que nous faisons est d'importer les bibliothèques dans notre projet. Ensuite, ouvrons le fichier Excel avec la crise pétrolière et le PIB. Rappelez-vous que ce fichier doit être situé dans le même dossier est votre bloc-notes Python. Bon, commençons à construire un graphique en les utilisant ou tweetant modèle. Nous avions les noms de l'accès, du prix du pétrole et du PIB de la Russie en milliards de dollars. Donc, le graphique semble assez réaliste, comme nous pouvons le voir avec le même prix du pétrole. Mais à différentes années, le PIB était légèrement différent. Peut-être est-ce dû à l'effet que la Russie a pu diversifier son économie ou pour d' autres raisons. Ensuite, créons notre modèle de régression linéaire, et avec l'aide du commentaire des pieds, nous allons le former en utilisant les données sur les prix du pétrole dans le PIB de la Russie. On y va. Nous avons la confirmation que notre modèle a été formé. Maintenant, nous pouvons faire des prédictions. Prédisons d'abord pour toutes les années et comparons à quel point les échecs prévus sont proches des valeurs réelles. Eh bien, c'est certainement plutôt d'environ 200 à 400 milliards de dollars. Qu' est-ce que cela signifie probablement ? Eh bien, nous pouvons admettre qu'il y a une certaine corrélation entre le PIB et les prix du pétrole, mais cette corrélation est loin d'être très forte. Bien sûr qu'ils devraient être finis. Il y a parce que l'économie russe n'est pas encore complètement dépendante de Lee sur les prix de l'énergie . Il y a beaucoup d'autres facteurs qui devraient être pris en compte. Mais ce que nous pouvons voir avec certitude, c'est que la baisse des prix du pétrole, le PIB plus faible, tend à être dit en passant, on peut le comparer avec des pays importateurs de pétrole, par exemple l' Inde ou le Japon, la Corée du Sud ou l'Allemagne. Comment les prix du pétrole les ont-ils influencés ? S' ils sont importateurs nets de pétrole, cela signifierait probablement que les prix du pétrole bon marché seraient meilleurs pour eux. Mais c'est juste une hypothèse que vous avez contestée, au fait. Alors continuons maintenant. Nous pouvons construire une ligne qui montrera à quoi ressemble notre modèle avec le commentaire BLT. Ne mettez pas comme vous pouvez le voir, le patineur est plutôt Deke nous allons prédire en utilisant quelques prix concrets. Par exemple, quel sera le PIB si le prix est de 10$ pour les collèges gratuits et de 70 milliards ? Eh bien, c'est assez petit pour la Russie. Et qu'en est-il du prix est de 150$ près de 3 000 milliards de dollars ? C' est beaucoup mieux, au fait. Maintenant, nous avons fait des prévisions basées sur Lee sur le prix du pétrole, mais nous pouvons aussi en co-indépendance sur l'année dans notre modèle. Après tout, regardons à nouveau notre détail initial. Vous voyez, en 2000 et cinq ans et 2017 le prix du pétrole était le même, environ 54$. Mais le PIB est complet avec le front en 2000 et cinq, seulement 764 milliards de dollars. Et en 2017 déjà plus de 1,5 billion de milliards près de deux fois plus, qui signifie que vous êtes en ce moment. L' économie russe est probablement devenue moins dépendante des prix du pétrole. Alors, comment pouvons-nous former notre modèle pour prédire basé sur les rivaux sont modèle dans ce cas, Will Lucas suit Pourquoi est égal à un X plus B plus C où est notre PIB X est le prix du pétrole, et qui est l'année et A, B et C sont de nouveaux coefficients miracles. Et maintenant, comment le spécifions-nous dans notre code ? En fait, très symbole. Rappelez-vous, nous avions une ligne de code que nous avons utilisée pour former le modèle Nous ajoutons simplement aux pieds de l'épave à l'intérieur des crochets doubles. Un autre facteur. Le mot année. guillemets, nous appuyons sur Entrée. Ok, le modèle a été formé, et maintenant prédisons d'abord toute la série pour toutes les années. Tu vois, c'est déjà beaucoup mieux l'inexactitude. La propagation est seulement quelques-uns fait, et donc des milliards. Essayons de prédire quel sera le PIB. Par exemple, en 2025. Et si le prix du pétrole est de 100$ juste, prédire et dans les dossiers, 2025 virgule, 100 près de 2 billions 700 milliards de dollars presque un vraiment plus que maintenant. Ok, je pense que c'est pour une agression plus faible. Si vous avez des questions, s'il vous plaît n'hésitez pas à poser dans les commentaires ou écrire directement. Vous pouvez également essayer de trouver des données, par exemple, de différents taux de change ou cours des actions, et essayer de créer et de former un modèle basé sur ces données afin de faire des prévisions pour l'avenir 18. Prédire les survivants en titanic : Chargé de classification: Bonjour, tout le monde dans cette conférence, nous allons résoudre un problème de classification. Nous allons prédire quels passagers ont survécu dans l'accident du Titanic. Pour commencer, rappelons ce que les clés de la machine de tâche de classification. Comme son nom l'indique, classification est utilisée pour attribuer un objet à un coût particulier. Par exemple, dans nos clés, qui classent le meilleur chanteur est soit un survivant ou non. classification peut être utilisée, par exemple, pour comprendre si le message entrant est un spam ou non, ou pour comprendre si la banque doit accorder le prêt à une frontière possible s'il n'y a que deux classes, alors le problème s'appelle l'achat d'une reclassification. S' il y a plusieurs classes, alors il s'agit d'une classification à plusieurs classes. Si nous comparons avec la régression, alors dans la progression, nous n'avons pas de classes. Nous prédisons simplement une valeur numérique. Par exemple, dans les épisodes précédents, nous avons prédit le coût d'un appartement avec le volume du PIB au large de notre pays. Il y a un nombre spécifique, et dans la classification, le nombre de réponses ou de classes est limité. Nous fournissons nous-mêmes ces classes à l'ordinateur, et l'ordinateur détermine à laquelle de ces classes appartient le nouvel objet. Alors passons à la résolution du problème de classification des couleurs. D' abord, nous devons télécharger. Les données sur les survivants du Titanic seront enregistrées sur le site Web de Kegel. C' est un site très utile ici. Vous pouvez trouver beaucoup d'exemples pour l'apprentissage automatique avec des explications et des solutions par d'autres utilisateurs. Ensuite, nous devons télécharger ce fichier dans notre dossier où nos fichiers pour Jupiter sont stockés. Très bien, créons une femme, un cahier dans Jupiter et appelons-le. Maintenant, soyons importants. Fonda et les bibliothèques de Mumbai Grande. Alors téléchargeons tous les fichiers avec les survivants en détention dans notre carnet FIFA, données sont égales à P D Door Treat CSC et entre parenthèses Titanic. TSV Maintenant, voyons à quoi ressemble notre feu. Comme vous pouvez le voir. Voici les données pour 891 passagers. Nous avons l'âge de leur sexe. Quelle classe de donner aux occupés Et le problème le plus important pour nous est que la colonne a survécu. Comme vous pourriez le deviner. Cela signifie que le présent votre a survécu et zéro que malheureusement, il n'a pas appelé cela ranimé. Appelez-le notre colonne cible et prenons quatre autres colonnes, ce qui, à notre avis, influencé si le messager pouvait être sauvé ou assez. Ces colonnes seront l'âge, le sexe, sexe, classe de cabine et la peur des billets. Appelons-les Training Collins. Sachez que nous saisissons les noms de charbon exactement tels qu'ils sont indiqués dans le fichier. Autrement dit, je veux dire, lorsqu'il y a des lettres majuscules, il est nécessaire d'entrer des lettres majuscules. Sinon, les données ne seront pas lues, mais ce n'est pas le cas. Créez les rivaux. Il stockera les données qui démarrent ces colonnes ex données physiques orteils et entre parenthèses , formation scolaire et pourquoi est-il appelé une donnée ? Et entre parenthèses colonne Stargate. Un autre point très important dans l'apprentissage automatique est que vous comprenez lorsque nous créons des modèles, non seulement les algorithmes corrects sont importants, mais aussi la qualité des données sur lesquelles nous les formons. Cela signifie que dans nos données, il ne devrait pas y avoir d'espaces ou de valeurs qui ne peuvent certainement pas être là. Par exemple, se sentant appelé l'écurie, ils pourraient simplement oublier orteil entrer dans le villian certaines cellules où soudainement la valeur de l'âge a été transféré à une cellule avec une juste par erreur. Par conséquent, dans les grands projets, quand il s'agit de grandes quantités, ces données sont très strictement vérifiées. Donc, dans notre cas. Que pouvons-nous faire pour vérifier la qualité de la datation de notre projet ? Au moins, nous pouvons vérifier que nous n'avons pas de cellules vides. Ceci est fait en utilisant la formule X suivante entre parenthèses. Sex dot est maintenant parenthèses, pas quelques briquettes, et nous le faisons pour toutes les colonnes. Il s'est donc avéré que dans la colonne des âges il y a 177 passagers dont l'âge n'est pas à Dickie , que ferons-nous si nous enlevons tous ces 177 messagers ? Ceux-ci peuvent grandement affecter notre sélection car néanmoins est déjà un nombre assez important . Alors, qu'est-ce qu'on peut faire ? Nous pouvons leur donner la valeur moyenne ou moyenne pour ces colonnes. Il y a une fonction spéciale dans le panda qui alimente ces cellules vides avec des valeurs moyennes ou moyennes . Dans la colonne, nous allons utiliser les valeurs médianes First. On nous a donné un petit avertissement, mais on peut l'ignorer en toute sécurité. Vérifions si toutes les cellules dans chaque colonne Arfield à nouveau. On passe à autre chose maintenant ? Pas du tout. Nous devons faire une autre manipulation dans notre modèle de tueur. Nous ne pouvons pas utiliser une arrivée de force comme un Dorival catégorique. Ce que je veux dire qui se développe dans la colonne de genre passager sont indiqués comme le monde masculin ou féminin. Notre modèle ne sera pas en mesure de les utiliser pour la formation. Il ne peut utiliser que les données miraculeuses. Par conséquent, ce que nous allons faire. Nous allons simplement renommer le Swartz en zéros et en uns. Remplaçons les femmes par le numéro un et les hommes par le numéro zéro. Pour ce faire, nous devrons créer un dictionnaire. Le dictionnaire est quand vous dites qu'un meribel signifie un autre dorival, comme dans un vrai dictionnaire, où vous avez des traductions pour la quatrième langue d'une langue à l'autre. Le dictionnaire vu par téléphone vous solidement parenthèses et à l'intérieur, nous devons arriver qu' ils sont séparés par un deux-points. Appelons notre dictionnaire, creusons l'orteil physique purement parenthèses email, côlon, zéro virgule femelle Et maintenant nous allons remplacer les noms, mâle et femelle, avec des nombres zéro et un avec le formule suivante. Ce travail Lambda signifie juste que nous allons remplacer nos mots comme dans un miroir, comme indiqué dans notre dictionnaire. Vous pouvez ignorer qu'il s'agit de Corning. Ils ne nous empêchent pas de poursuivre notre travail. Plus tard, je vais vous montrer comment faire pendant leur congé. Alors vérifions avec notre Coolum le sexe des passagers. On dirait que maintenant Eh bien, maintenant est votre envoi une fois sont partout. C' est ce dont vous avez besoin. Vérifions encore notre rencard. Comme vous vous en souvenez. Pour l'ensemble de données d'entraînement, nous n'avons laissé que quatre colonnes. L' âge, le sexe, la classe de Karen et la peur. Ce qui est trop important dans l'apprentissage automatique, c'est de diviser notre ensemble de données en deux parties. La première est la partie formation va former notre modèle sur cette partie, et la seconde partie est une partie test de l'ensemble de données. Nous l'utiliserons pour vérifier dans quelle mesure notre modèle fait sa précision. Donc, nous allons important le modèle, qui va diviser notre ensemble de données en échantillon d'entraînement et échantillon de test de son modèle de point de couleur . Sélection de soulignement Importer le train souligné. Test souligne s'il vous plaît. Ce sont des indicateurs standard que nous prenons la taille de l'échantillon de test est 1/3 ou, si vous le souhaitez, vous pouvez le prendre 20 ou 30% et l'indicateur d'état aléatoire est 42. Vous pouvez les considérer comme des indicateurs par défaut de base, donc maintenant nous devons former notre modèle sur notre ensemble d'entraînement notre modèle sera basé sur l'algorithme de machine vectorielle de support plus faible qui divise linéairement nos données en différents groupes. L' idée de cette question est que nous essayons de trouver une telle ligne ou si nous avons plusieurs classes comme un hydroplane, la distance à partir de laquelle à chaque classe est maximale. Une telle ligne droite ou hyper plan est appelé l'hyper plan de séparation optimal. Les points étaient, comme vous pouvez le dire, des représentants de classes ou de vecteurs qui, comme se ferme à la séparation Keiper nettoyer nos vecteurs de support froid. C' est d'où vient le nom de cette méthode. Ce qui est bon à propos de la programmation par téléphone, c'est qu'il a beaucoup de bibliothèques et de trading fait des modèles qui contenaient déjà toutes ces méthodes. Autrement dit, nous n'avons pas besoin de composer et de calculer nous-mêmes toutes ces formules. Nous importons simplement le modèle dont nous avons besoin dans notre projet. Alors importons. L' algorithme ECM est notre par l'ordinateur portable et CO sont modèle pred de SK Lauren Import SPM. La devise de Fred est égale à siendo weiner s V C. Maintenant, nous allons former notre modèle avec notre ensemble d'entraînement et les pieds fonctionnent très bien. On nous a confirmé que le modèle est à nouveau formé. Ignorez ces modifications violettes. Il est maintenant temps de faire des prédictions sur l'échantillon de test. Le fait que entre parenthèses est indiqué zéro appel sur 10 signifie que nous prédisons les 10 premières valeurs de notre échantillon de test. Eh bien, nous voyons des zéros et des uns, ce qui veut dire si le Bessinger a survécu ou non. Mais comment savoir si le modèle a correctement prédit ces échecs ? Pour ce faire, nous utilisons la fonction score, comme vous pouvez le voir, près de 77% ce qui n'est pas mauvais pour notre premier modèle. En passant, vous pouvez exécuter ce manteau à nouveau, et il recevra une précision un peu différente, parce que lorsque la machine divise votre échantillon en échantillons d'entraînement et de test, elle ne les entraîne pas. Nous orteils à chaque fois. La précision sera un peu différente. Aussi, rappelez-vous où nous avons trouvé 177 cellules vides avec l'âge, nous avons inséré le vieillissement médian eux. Quelle sera la précision si nous insérons l'âge moyen en utilisant le commentaire moyen et voir quel sera le résultat ? Pourtant, c'est un peu différent, c'est tout. Pour l'instant. Le code python pour cette tâche est, comme d'habitude, attaché à cette conférence, mais en tout cas, essayez de taper et d'exécuter ce tribunal vous-même pour consolider le matériel que vous avez appris. 19. Réseau Neural - Créez votre propre réseau neural pour classifier les images: Bonjour, tout le monde. Je suis heureux de vous dire qu'à la fin de cet épisode, vous allez construire votre propre réseau neuronal qui sera en mesure de reconnaître des images de vêtements. Pour cette tâche utilisera un ensemble de données appelé faciale Menacé. Il contient 70 000 images de différents types de vêtements, tels que des shorts en T, des pantalons, des chaussures, chaussures, sacs, pulls, sniggers de code et ainsi de suite. Tout spécialiste de l'apprentissage automatique commence sa formation. Avec ces ensembles de données. C' est la norme dite pour les spécialités de formation. Rappelons-nous que les réseaux neuronaux se composent de plusieurs couches. Les données de nos images clés sont fournies à la couche d'entrée. Ensuite, ces données passent à travers plusieurs couches de neurones. Au cours de ce processus, leur assigné certains poids, puis nous avons une couche de sortie qui devrait donner des réponses. Dans notre cas, la couche de sortie nous dira ce qui est montré dans l'image. En termes d'apprentissage automatique, les étoiles se rapportent à des problèmes de classification. Une image est fournie à la couche d'entrée hors de notre réseau neuronal, et la couche de sortie détermine à quelle classe appartient cette image, qu'il s'agisse d'une chaussure de code, T-shirt ou d'un autre vêtement. Il y a 10 de ces crises. Dans cet ensemble, ces données sont ouvertes et peuvent être librement téléchargées et utilisées pour créer notre réseau neuronal . Il a été créé par le salon, la société située à Berlin, et l'ensemble comprend 70 000 images différentes hors vêtements. Dans l'une des conférences précédentes sur la déploration, nous avons mentionné que les réseaux neuronaux, afin d'être bien formés, viande autant de données que possible. Par conséquent, 70 000 images en principe est un bon nombre. Vous pouvez télécharger cet ensemble de données sur les sites web get top ou Kegel. Nous avons mentionné lors de conférences précédentes que lorsque nous formons nos modèles, nous divisons la tête de nos données en deux parties. L' échantillon d'entraînement et l'échantillon de test et donc ils sont définis est également divisé en deux parties. La première partie consistant en la toux. 60 000 images, seront utilisées pour la formation, et la deuxième partie de 10 000 images sera utilisée pour les tests Afin de comprendre comment notre modèle a été formé, Ces ensembles de données contient deux fichiers. Le premier fichier avec des images dans le second fichier avec des étiquettes de classe, c'est-à-dire avec les bonnes réponses. Toutes les images ont une taille de 28 x 28 pixels et sont exécutées dans des tons de crème et le pixel d'image de grande intensité différents sur une échelle de 0 à 255 où zéro est une grosse cellule complètement blanche et 255 est une forte couleur craig. Et puisque ces images sont si simples, c'est seulement 28 par 28 pixels et dans les tons de Cray. Cela vous permet de travailler avec eux et d'être avec des réseaux neuronaux, même si votre ordinateur n'est pas trop puissant. Donc, nous l'avons déjà mentionné à la mode. La police a dit plus tard. Il y a 10 classes hors vêtements ici. Vous pouvez le voir sur l'écran. Ils sont numérotés de 0 à 9 dans la cour de Queen, lorsque nous soumettons telle ou telle image à notre réseau neuronal, mais recevront le numéro de classe auquel il appartient zéro si c'est un T-shirt, cinq de ces chaussures et ainsi de suite. Alors, quel type de données d'entrée sera introduit dans notre réseau neuronal ? Comme nous l'avons déjà dit, Tout d'abord, 28 par 28 pixels. Si vous multipliez ensemble, il est 784 sélectionne les cellules, et d'autre part, il est la densité des nuances de gris dans chaque pixel de densité varie de 0 à 255. Nous comprenons essayé que l'ordinateur reçoit toutes les informations en termes numériques, ce qui explique pourquoi notre réseau neuronal recevra. Chaque image est un ensemble de 784 pixels, et chaque grande cellule aura un nombre spécifique de 0 à 255 en fonction de l'intensité des nuances de fou. Bon, alors, passons à autre chose. L' architecture de Notre réseau neuronal sera très simple. Il sera composé de seulement trois couches. La couche en entrée, une couche cachée et la couche en sortie. Le calque d'entrée ne transformera nos images bidimensionnelles qu'en une seule dimension. Chaque couche suivante sera composée de centaines et 28 neurones, et ce nombre peut effectivement être changé. Par exemple, vous pouvez faire 512 ou 800 la couche de sortie sera composée de 10 neurones. Parce que nous avons 10 classes différentes de clous de girofle, nous allons utiliser un réseau neuronal de danse, qui signifie que tous les neurones du joueur actuel seront connectés à tous les neurones de la couche précédente. Chacun des 128 neurones du calque principal recevra les valeurs de tous les 784 pixels l'image et de chacun des 10 Urinson. La couche de sortie nous donnera la probabilité que cette image représente la classe donnée de vêtements. La probabilité sera reflétée dans la plage de 0 à 1. Rappelons-nous comment un réseau neuronal peut faire de telles prédictions et comment tout fonctionne. Nous utiliserons d'abord des concepts tels que les poids, la propagation du dos et huit livres, comme une urine humaine. La tâche, souvent neurone artificiel, est d'obtenir des informations, traiter d'une certaine manière et de les transmettre au neurone suivant et aux connexions de ces neurones dans l'intelligence artificielle qui reçoivent des données d'entrée, le traiter, puis fournir les données de sortie. Ces structures sont appelées réseaux neuronaux, donc nous avons déjà mentionné que chaque neurone reçoit une image au format de 784 cellules de pointe , et chaque pixel a une valeur miracle, en fonction de l'intensité de couleur que est grossièrement parlant. Chaque neurone reçoit une zone spécifique ou une combinaison d'informations numériques. Ensuite, au début, chaque neurone ou aucun plongeon est donné une sorte d'ami et attendez. C' est significatif, ou combien de la valeur du neurone correspond à l'une ou l'autre image, et de cette façon il est distribué au hasard. Je tiens à souligner à nouveau que dans la première étape, la suite est juste formée après cela, lorsque ces valeurs sont transférées à la couche de sortie parce que nous savons réellement ce qui est montré dans l'image. Parce que nous avons des réponses à chaque image, nous disons à un réseau neuronal si la prédiction était vraie ou fausse. Donc, si le réseau prédit correctement que le poids de cette défaillance pour cette connexion entre les neurones dans différentes couches augmente. Et si notre modèle a fait une fausse prédiction, nous réduisons le poids, et cela est rappelé propagation. Autrement dit, nous avons renvoyé des informations aux couches les plus récentes et nous disons d'augmenter ou de diminuer le poids, selon que la prévision a été faite correctement ou non. Et ce mouvement, portes changeantes équivaut à sécuriser constamment d'avant en arrière pendant l'entraînement. Quand toutes les données ont dit, c'est-à-dire, toutes les images vont pour cette procédure. On l'appelle un, un livre qui supporte l'entraînement hors réseaux neuronaux. Plusieurs huit livres sont généralement utilisés, par exemple, 10 ou même 100. C' est les mêmes images ou courir 100 fois à travers toutes les couches à chaque fois, changeant le poids des neurones et les rendant plus précis, réduisant ainsi l'erreur de prédiction. Voyons donc comment vous pouvez créer et former un tel réseau neuronal incurieux dans le tensorflow. Ce sont les bibliothèques par téléphone qui sont conçues pour fonctionner avec les réseaux neuronaux. Oui, et avant de commencer, je veux faire une réservation tout de suite que nous allons résoudre ce projet dans l' effondrement de Google . Nous avons déjà mentionné dans la première conférence sur téléphone qu'il s'agit d'un environnement cloud de Google, qui offrent la possibilité de tester des projets d'apprentissage automatique directement dans le navigateur. Pourquoi décidons-nous de choisir Google collapsus maintenant ? Parce que pour résoudre ce problème avec les réseaux neuronaux, nous avons besoin du tenseur pour la bibliothèque et de la caresse mon audio. Et si vous voulez les installer sur votre ordinateur, cela peut souvent être très problématique. Et il y a beaucoup d'erreurs avec différentes versions ou compatibilité avec l'art graphique et d'autres erreurs. Où est si vous traitez avec Google effondrement ? Vous n'avez pas besoin d'installer quoi que ce soit, vous créez simplement un ordinateur portable et commencez immédiatement le codage . Par conséquent, en principe, si vous le souhaitez, vous pouvez essayer de télécharger tensorflow sur votre ordinateur. Cela peut être fait en utilisant le peep. Installez tensorflow commande sur le Anaconda Common Flynt dans une telle fenêtre noire, mais étaient très forte probabilité. Vous pouvez rencontrer certaines difficultés lors de l'importation ultérieure de ces modèles dans votre projet. Et si de telles erreurs d'installation font un remède ici, vous pouvez voir les erreurs les plus typiques et comment elles peuvent être vendues. Par conséquent, pour l'amour de la simplicité. Et afin d'éviter ces difficultés avec l'installation de tensorflow sur l'ordinateur local, nous allons montrer comment le faire dans un effondrement de Google, et ici vous êtes certainement ne devrait pas avoir de problèmes. En outre, ce appelé Framework de Google vous donne la possibilité d'utiliser plus de rhum que ce qui est disponible sur votre ordinateur. Ok, nous allons commencer et a été créé, vous savez, livre dans Google effondrement. Maintenant, au tout début, nous devons importer les bibliothèques et Mondial Sweeney. Tout d'abord, nous allons importer toutes les bibliothèques principales. Nous n'aurons pas besoin, ici et mois derniers pieds travailler avec des cerises et de visualiser nos dessins. Comme nous l'avons mentionné, Tensorflow et Cara sont nécessaires pour construire des réseaux neuronaux. L' ensemble de données de la police de mode est déjà disponible dans les soins nous parce qu'il est l'un de ces ensembles de données populaires sur lesquels les anciens scientifiques de données apprennent les réseaux neuronaux. Ensuite, nous importons le modèle séquentiel. Il s'agit d'un modèle de réseau neuronal dans lequel les couches s'éteignent. Ensuite, nous allons importer le lecteur de type dense, ce qui signifie que nos couches seront entièrement interconnectées. Et enfin, qui importent également divers utilitaires qui aideront à traduire nos données dans l'ancien adapté pour nous soigner. Donc, comme nous avons déjà des données importantes sur les patients au début, nous pouvons maintenant charger les données dans notre projet. Comme nous l'avons dit lors de conférences précédentes sur l'apprentissage automatique, nos ensembles de données seront divisés en deux parties de formation et des échantillons de test. Et chacune de ces parties contiendra la partie X. sont les images et partie pourquoi cela dehors Les réponses à quelle classe ces sont cette image appartient. Ils sont également connus sous le nom d'étiquettes. Les noms de lieux ne sont pas inclus dans l'ensemble de données. Alors écrivons-les nous-mêmes. Okey, alors, quelle est la suite ? Maintenant, nous devons préparer le traitement de nos données avant de créer un réseau neuronal, et avant de le faire, Voyons d'abord à quoi ressemblent nos images dans les crochets gagne ou l'index de 0 à 59,999. Parce que nous avons 60 000 images dans l'ensemble d'entraînement, certaines images sont assez faciles à comprendre, et d'autres sont presque incompréhensibles sur le côté de l'image. Vous pouvez également voir les valeurs d'intensité de pixels comprises entre 0 et 255. Si le grand donc est aussi sombre que possible. Il a une valeur de zéro anticorps aussi léger que possible. Il a une valeur de 255. Donc, après avoir vu nos images maintenant, nous allons faire la normalisation des données. Qu' est-ce que ça veut dire ? Cela signifie que pour améliorer les algorithmes d'optimisation utilisés dans la formation réseaux neuronaux, nous divisons l'intensité de chaque pixel de l'image par 255 afin que l'intensité soit maintenant comprise entre 0 et 1, et nous allons le faire à la fois pour l'ensemble d'entraînement et le tester. Vérifions ça. Super. Maintenant, le pixel de densité est de 0 à 1, et il sera plus facile pour les réseaux de neurones de travailler avec de telles valeurs par la façon dont nous pouvons représenter plusieurs images sur un écran à une. Pour ce faire, vous devez écrire quelques lignes de code. Nous allons montrer les 25 premières images cinq dans un troll, et nous allons également afficher les noms de leurs classes en dessous d'eux. air fabuleux, a l'air fabuleux,si vous voulez, vous pouvez faire les images en noir et blanc, donc c'est génial. Nous avons préparé les données, puis nous pouvons commencer à créer un réseau neuronal dans les réseaux neuronaux. Le livre de construction principal est le linéaire, et la partie principale de la déploration est de combiner des couches simples. Incurieux, tout comme dans la machine étaient Inc En général, les réseaux neuronaux sont appelés modèles, et comme nous l'avons déjà mentionné, nous allons utiliser ce type séquentiel de modèle, qui signifie que notre vont dans l'ordre un par un. Donc, créons un modèle séquentiel. Le premier calque, qui est indiqué comme aplatir, convertit le format des images à partir d'une zone bidimensionnelle où chaque image était une zone de 28 par 28 pixels dans une zone unidimensionnelle de 28 par 28. C' est maintenant l'image va entrer dans le neurone est une chaîne de 784 cellules de pic à côté aller à des couches trop denses. La première couche dense est la couche d'entrée entièrement connectée. Ici, nous devons décider combien de neurones auront dans cette couche. En fait, beaucoup d'expériences ont déjà été faites lorsque ces données ont été définies, et l'une des prédictions les plus réussies a été la couche d'entrée de 128 neurones. Bien que si vous le souhaitez, vous pouvez faire 512 ou 800 neurones à votre discrétion. Ensuite, nous montons la fonction d'activation. Dans notre cas pour la couche d'entrée principale, nous spécifions la fonction d'activation réelle vous. Il a montré une bonne efficacité dans de tels réseaux neuronaux simples, puis la dernière couche est la couche de sortie dense. Il aura 10 neurones exactement comme le nombre de nos classes. La fonction d'activation sera la fonction « soft marks ». Cette fonction nous permet de revenir et très souvent estimer la probabilité dont certains est un. Chaque note sur l'urine contiendra une estimation qui indique la probabilité que l' image actuelle appartient à l'une de nos 10 classes. Avant de former le modèle, nous devons faire quelques réglages plus mineurs. C' est ce qu'on appelle la compilation mortelle. Lors de la compilation du modèle, nous avons spécifié les paramètres d'entraînement. C' est pour l'optimiseur. Dans notre cas, nous utilisons le S G D, qui signifie descente en gradient stochastique. Cet optimiseur est très populaire pour résoudre des problèmes hors reconnaissance d'image. Utilisation de réseaux neuronaux en plein air instantanément Si vous le souhaitez, vous pouvez utiliser Adam Optimizer. La fonction d'erreur est indiquée par le paramètre de perte dans notre modèle. Au lieu de la vérité standard moyenne écart carré, nous allons utiliser l'entropie croisée catégorique. Cette fonction d'erreur fonctionne bien dans les problèmes de classification. Quand il y a plus de deux classes dans le paramètre S est la qualité. Nous indiquons l'exactitude. C' est la proportion par rapport aux bonnes réponses. Une fois le modèle compilé, nous pouvons imprimer ses paramètres en utilisant la fonction de résumé du modèle. En principe, tout est prêt. Nous allons sortir est préparé. Nous avons créé et compilé un réseau neuronal. Maintenant, nous pouvons commencer son entraînement. L' entraînement hors réseaux neuronaux se fait comme dans d'autres tâches d'apprentissage automatique avec l' aide de la fonction des pieds. Et comme nous avons un problème de classification qui appartient à l'apprentissage supervisé, nous passons à cette fonction. À la fois l'échantillon d'entraînement, prochain train et les réponses ou les étiquettes. Pourquoi s'entraîner ? Nous devons également spécifier le périmètre. Le numéro d'une boîte, comme nous l'avons mentionné précédemment. Un livre e est quand notre chef entier a dit la base pour un réseau de neurones. Nous indiquons 10 8 livres, ce qui signifie que nous allons former notre réseau neuronal 10 fois sur l'ensemble des données, dit. Autrement dit, sur les 60 000 photos, vous pouvez demander combien de livres sont nécessaires. La réponse dépendra très largement des différents ensembles de données. Mais le principe de base est que plus nos villes de données sont diversifiées, plus il est souhaitable d'utiliser plus de huit livres, et aussi vous devriez probablement prendre en compte la mise hors tension de votre ordinateur. Si vous avez une très grande quantité de données et qu'elles sont toutes très différentes, alors chacun un livre prendra plus de temps. Par conséquent, pour une raison de simplicité, nous n'utiliserons que 10 8 livres. Vous pouvez utiliser plus de livres électroniques si vous le souhaitez. Cela prendra juste plus de temps, et la qualité ne sera probablement pas significativement meilleure pour que nous puissions voir que notre formation a commencé. Voici le premier, un livre, puis de la ligne de chacun un livre qui fonctionne toujours est indiqué à travers le paramètre perdu et la précision des prédictions. Comme nous pouvons le voir pendant que notre réseau neuronal est en cours de formation, c' est-à-dire avec chaque livre suivant, l'erreur diminue. Où est la prédiction ? Augmentation de la précision. Donc le dernier livre a pris fin, et cela signifie que l'entraînement de notre réseau neuronal est également terminé. Nous voyons que la précision est légèrement inférieure à 90%. Eh bien, pour un réseau neuronal composé de toux, seulement deux couches principales, ces qualités plutôt bonnes. Vérifions maintenant quelle précision aurait sur l'échantillon de test. Rappelez-vous que pour l'entraînement, nous avons utilisé 60 000 images de l'échantillon d'entraînement et 10 000 images étaient dans un échantillon de test, et notre réseau neuronal ne les a pas vues. Par conséquent, voyons quelle sera la précision de la prédiction sur ces images de test. Comme vous pouvez le voir, la qualité de la prédiction est légèrement inférieure, mais toujours assez élevée. Alors, félicitations à vous, vous avez construit et formé votre tout premier réseau neuronal. Maintenant, après avoir terminé l'entraînement, nous pouvons utiliser notre réseau neuronal pour prédire ce qui est montré dans les images. Pour ce faire, nous utilisons la méthode de prédiction hors de notre modèle. Nous allons prédire sur les images de l'échantillon d'entraînement sur lequel notre modèle a été formé. Donc, nous écrivons X train entre parenthèses et maintenant nous allons imprimer ce que notre modèle va prédire entre crochets. Nous mettons l'index hors de l'image qui commence par l'image avec l'index zéro afin que nous puissions voir 10 valeurs différentes, chaque valeur représentant la probabilité de notre image appartenant à chacune de nos 10 classes, chaque valeur et a ensuite un moins huit ou moins neuf, ce qui signifie qu'ils sont dans le décret moins neuf qui est, après un zéro. Nous avons quelques zéros de plus, et c'est la probabilité est proche de zéro et une seule valeur avec le moins un degré, vous voyez 9.90 quelque chose moins un. Cela signifie 0,99 centaines, ce qui est très proche d'un. Et comme vous vous en souvenez dans nos clés, le numéro un représente 100% de probabilité. Ainsi, notre modèle nous avons une probabilité de près de 100% prédit que ces images correspondent à ces classes au cas où il est difficile pour vous de trouver lequel sur les vallées de notre sortie est le maximum que nous pouvons utiliser la fonction ARG marks à partir de la bibliothèque de numéros. Il donne juste la valeur maximale. Et donc on nous donne la valeur maximale avec l'indice neuf. Maintenant, vérifions et tirons la bonne réponse de nos étiquettes. Donc sont de répondre pour cette image s'est avéré être la même que ce qui a été prédit par notre modèle. Cela signifie que notre modèle fonctionne. Vous pouvez tester avec d'autres images. Il suffit de remplacer le nombre dans l'index par n'importe quel autre numéro de notre échantillon de 60 000 images . Dansons le numéro 12. Ok, ça nous dit que c'est une classe avec Index 5. Regardons l'image. Qu' est-ce que c'est ? C' est une sandale. En fait, si vous ne voulez pas chercher les images à chaque fois, nous pouvons simplement imprimer le nom de la classe en insérant l'index d'image Corey's Point Inc. C' est créer mes félicitations. Vous voyez, une fois de plus, j'espère que vos réseaux neuronaux fonctionnent parfaitement. Et maintenant, c'est résumé ce que nous avons couvert. Nous avons importé l'ensemble des données dit avec des images, les divisés en échantillons de formation et de test. Ensuite, nous optimisons un peu ces images. Après cela, nous avons créé l'architecture pour un réseau neuronal, qui dans notre cas peut voir mis en place seulement trois couches compilé le modèle, ce qui signifie que nous spécifions les paramètres de formation. Ensuite, nous avons formé notre réseau neuronal à l'aide de l'exemple de culture et avons finalement testé huit sur notre échantillon de test. Maintenant, vous pouvez essayer de prédire d'autres images dans les échantillons du concours de formation. Vous pouvez également ajuster un peu le modèle. Par exemple, vous pouvez utiliser un autre optimiseur, Disons, Adam, ou changer le nombre de huit livres et ainsi de suite. En passant, sur le Keg, un site Web, il y a différents Gershon d'autres types de réseaux neuronaux avec différents nombres hors couches et différentes architectures pour la mode. Ces projets, par conséquent, vous pouvez regarder et essayer de faire un autre réseau neuronal pour ces ensembles de données. J' espère que cette leçon a été utile et a contribué à une meilleure compréhension de ce que sont les réseaux neuronaux , comment les former et les utiliser, en particulier pour la reconnaissance d'images. Si vous avez des questions, vos commentaires et je suis impatient de vous voir dans nos nouvelles conférences et cours, 20. Réseaux neuronaux pour l'analyse de texte: Bonjour, là. Dans cette conférence, nous allons apprendre à utiliser les réseaux de neurones pour analyser du texte. Nous allons également créer notre propre réseau neuronal qui analysera les critiques de films et comprendra si leurs vues sont positives ou négatives. Mais avant de passer à la partie pratique de la création de notre réseau de neurones, voyons à quel type de tâches d'analyse de texte les réseaux de neurones sont utilisés aujourd'hui. Tout d'abord, pour la classification des textes. Les réseaux neuronaux formés nous aident à définir à quel sujet ou à obtenir R3, le texte donné fait référence. Par exemple, les articles de presse peuvent être classés dans des domaines tels que la politique et l'économie, sport, le mode de vie, etc. L'une des tâches les plus populaires aujourd'hui est évidemment la traduction automatique d'une langue à l'autre. Si vous comparez, par exemple, la traduction de Google Translate, utilisée il y a cinq ou sept ans, et la traduction qu'elle donne aujourd'hui, vous remarquerez qu'il s'agit de traductions complètement différentes dans conditions de qualité. Aujourd'hui, la traduction automatique est réalisée avec une très haute qualité, grâce à l'utilisation de réseaux neuronaux aux architectures complexes. Il est également important pour de nombreuses entreprises et marques d'aujourd'hui comprendre comment leurs clients et utilisateurs les traitent, afin de comprendre la fidélité de la marque parmi les clients. Et les réseaux de neurones sont utilisés aujourd'hui pour déterminer le sentiment émotionnel des textes, tels que des commentaires ou des critiques. Qu'ils soient positifs, négatifs ou neutres. La tâche est appelée analyse du sentiment. De nombreuses marques utilisent l'analyse des sentiments sur les réseaux sociaux pour comprendre le niveau de réputation de leur marque. tâches de génération de texte sont également populaires aujourd'hui lorsque les réseaux de neurones peuvent générer et créer du texte complètement nouveau et communiquer avec les utilisateurs, par exemple via des chatbots. Comme nous pouvons le constater, les réseaux de neurones peuvent être utilisés dans diverses tâches liées à l'analyse de texte. Et les réseaux de neurones vous montrent les meilleurs résultats dans telles tâches par rapport à d'autres algorithmes d'apprentissage automatique. Très bien, maintenant, quelques mots sur la façon dont nous allons utiliser les réseaux neuronaux pour analyser des textes. abord, nous allons utiliser les bibliothèques Keras et TensorFlow, que nous avons déjà utilisées lors de conférences précédentes pour créer des réseaux de neurones afin de classer les images. Ils ont des modules préinstallés qui faciliteront notre formation. Deuxièmement, rappelez-vous qu'un réseau de neurones ne peut fonctionner qu'avec chiffres et que le texte est un ensemble de caractères et de symboles. Par conséquent, nous devrons transformer notre ensemble de symboles, mots et de phrases en un ensemble de chiffres. Cela peut se faire de différentes manières. Et troisièmement, pour créer des réseaux neuronaux, nous utiliserons la plateforme collaborative Google, une plateforme cloud gratuite de Google, où des bibliothèques d'apprentissage automatique populaires sont déjà préinstallées. Et vous obtenez également gratuitement des GPU assez puissants sur cette plateforme. Les performances de Google Collab sont bien supérieures à celles de la plupart des cartes graphiques qui peuvent être installées sur un ordinateur portable personnel ou un ordinateur sur lequel Google fournit ces ressources informatiques gratuitement, travaillant avec une machine problèmes d'apprentissage. Voyons donc comment nous pouvons représenter le texte sous une forme numérique adaptée à un réseau neuronal. Nous nous souvenons que les données d'entrée dans le réseau de neurones ne peuvent être que des nombres. Et le réseau de neurones ne peut fonctionner qu'avec des chiffres. Il y a diverses opérations mathématiques avec eux. Par conséquent, lorsque nous utilisons un réseau de neurones pour analyser des textes, nous devons transformer nos données textuelles en un ensemble de chiffres. Lors de la conférence précédente, lorsque nous analysons des images de vêtements, tout était assez simple, car nous pouvons numériser chaque image sous forme de chiffres correspondant à des intensités de pixels allant de 0 à 255. Si nous travaillons avec des données sous une forme catégorique, par exemple, c'est x d'un homme ou d'une femme. Alors tout ici est également un symbole. Rappelez-vous que lorsque nous avons analysé lequel des passagers a survécu sur Titanic, nous avons remplacé les sexes des passagers masculins et féminins par des zéros et des autres. C'est-à-dire que nous avons transformé les mots en chiffres. Lorsque nous traitons de textes complexes, c'est un peu plus compliqué ici. Nous convertissons également le texte en un ensemble de nombres, et ce processus est appelé vectorisation. Voyons comment cela se fait. Dans un premier temps, nous divisons le texte en parties distinctes, chacune étant présentée séparément numériquement. C'est ce qu'on appelle la tokenisation, où chaque partie distincte est un jeton. Et il peut y avoir plusieurs options pour diviser les balises en jetons. Nous pouvons diviser le texte en caractères distincts tels que des lettres, des chiffres, signes de ponctuation, et donner une valeur numérique à chacun de ces caractères séparément. Ou nous pouvons diviser le texte en mots et donner maintenant un nombre ou un ensemble numérique à des caractères individuels, mais à des mots entiers. Ou maintenant, il existe également une approche lorsque le texte est divisé en phrases entières et que chaque phrase est donnée sous la forme d'un nombre distinct ou d'un ensemble de chiffres. Dans notre cas, nous allons diviser le texte en mots séparés. La prochaine étape sera la vectorisation, où chaque jeton sera converti en un ensemble de nombres, soit par encodage simple, soit par vecteur, une présentation au format d'un codage à chaud, soit par vecteur dense. 21. Réseaux Neural pour l'analyse des sentiments (critiques des films IMDB): Maintenant que nous avons appris un peu comment les réseaux neuronaux sont utilisés pour analyser le texte. Essayons de construire notre propre réseau neuronal. Dans cet épisode, nous allons créer et utiliser un réseau neuronal pour déterminer si les critiques de films sur IMDB sont positives ou négatives. Ce site Web contient des informations sur la plupart des films. Il s'agit des coûts de description, des bandes-annonces et, bien sûr, des critiques des téléspectateurs. Comme nous l'avons déjà mentionné, la tâche de l'analyse des sentiments est très populaire dans le monde moderne. De nombreuses entreprises et marques veulent savoir comment leurs clients et utilisateurs les traitent en fonction de leurs commentaires sur les forums et les réseaux sociaux. L'ensemble de données des critiques de films de l'IMDB est très populaire parmi ceux qui étudient l'apprentissage automatique et les réseaux de neurones. Vous pouvez télécharger le jeu de données à partir de ce site Web. Sinon, nous pouvons le télécharger immédiatement depuis les bibliothèques de Keras en utilisant une seule ligne de code. Les développeurs des opérateurs ont déjà prétraité les avis et, par conséquent, il nous sera plus facile de travailler avec cette base de données. Ce jeu de données est donc divisé en deux parties, 25000 avis pour la formation et 25000 d'utilisation pour les tests. Le nombre de critiques positives et négatives est le même. Et cet ensemble de données ne comprend que des critiques positives et négatives. Les examens neutres n'ont pas été inclus dans cet ensemble de données. Afin de ne pas compliquer l'entraînement, avis qui ont été notés sept étoiles ou plus sur 10 ont été jugés positifs. Bien que j'ai utilisé qui ont été notés, quatre étoiles sont inférieures. Considérez cela négatif. Le jeu de données se présente comme suit. Dans une colonne, nous pouvons voir que j'ai utilisé, et dans la colonne suivante, ils font rage positif ou négatif. Cet ensemble de données représente un apprentissage supervisé, car pour chaque examen, nous avons la bonne réponse. 0 signifie négatif, un positif. En machine learning, cette tâche est connue sous le nom tâche de classification binaire, car nous n'avons que deux classes, soit négatives ou positives. Très bien, alors nous avons fait la partie théorique et nous nous familiarisons avec le jeu de données. Passons maintenant à la formation pratique. Tout d'abord, et importons les bibliothèques nécessaires, Keras et TensorFlow. Keras inclut des outils pour les jeux de données populaires des groupes de travail codant les jeux de données de la BDIM. Nous connectons également la bibliothèque NumPy pour vectoriser nos données et visualiser métaboliquement les résultats de notre formation. Donc, avec cette ligne de code, nous chargeons un ensemble d'examens de la BDIM. Entre parenthèses. Nous indiquons que nous chargeons le kit de formation GAN x train et y train et le set d'essai x test, y test. Nous indiquons également le nombre maximal de mots uniques que nous utiliserons pour analyser le texte. Parce que si nous ne limitons pas ce nombre , le nombre de mots uniques dans les 50 000 avis sera énorme et il sera plus difficile et beaucoup plus long pour notre réseau de neurones d'analyser un ensemble de données volumineux. Par conséquent, nous limiterons notre jeu de données à 10 000 mots utilisés le plus souvent dans l'ordre des États-Unis. Les guerres moins courantes ne seront pas incluses dans cet ensemble de données. Voyons comment Keras a chargé les données. Prenons un peu de réutilisation. numéro neuf, nous voyons qu'au lieu du texte de la revue, nous avons un ensemble de chiffres. Chacun de ces chiffres représente un mot tiré de la critique originale. Autrement dit, il y a une symbolisation au niveau des mots. Chaque numéro correspond à un mot. Comme nous l'avons déjà dit, les développeurs des aidants ont déjà traduit des mots en chiffres et ont ainsi préparé ces jeux de données pour nous. Voyons maintenant quel est le format des bonnes réponses. Comme nous l'avons mentionné au début, un signifie positif pour vous et 0 signifie qu'ils ont utilisé négatif. Jetons un coup d'œil à d'autres points de vue. Le jeu de données IMDB utilise le codage par fréquence de mots. Cela signifie que dans le texte, chaque mot est remplacé par un nombre correspondant à la fréquence de son occurrence dans ce texte, le mot le plus courant est remplacé par un. Un mot légèrement moins commun est remplacé par deux, et ainsi de suite. Nous pouvons télécharger le dictionnaire utilisé pour le codage en appelant la méthode d'index de mots IMDB. Il s'agit d'un dictionnaire Python dans lequel la clé est un mot et la valeur est une fréquence à laquelle ce mot apparaît dans les avis. Et comme nous le voyons, ce sont exactement les chiffres utilisés dans les critiques plutôt que dans les mots. Plus le nombre est important, moins le trimestre correspondant apparaît fréquemment dans les avis. Mais créons un dictionnaire inverse qui déterminera le mot par numéro. Cela se fait à l'aide du code suivant. Dans le cycle, nous allons passer en revue tous les éléments de l'index de mots et nous créerons un index de mots inversés de dictionnaire dans lequel la clé sera le nombre et la valeur sera le mot correspondant à ce nombre. Ok, maintenant, saisissons 30 mots qui sont les plus courants dans nos critiques. Comme vous pouvez le deviner, ces mots seront probablement conjonctions, des prépositions et des articles variés. Et les mots les plus populaires que nous utilisons le plus souvent dans notre discours quotidien. Maintenant, utilisons notre dictionnaire inverse pour décoder quelques commentaires. Bon, nous pouvons maintenant voir ce qui a été écrit à leur avis. Ou bien, comme nous l'avons vu, nos critiques sont maintenant représentées par des séries de chiffres compris entre 0 et 9 599. Mais pour faciliter le fonctionnement de notre réseau de neurones, nous allons représenter leurs vues sous forme de vecteur au format d'un codage à chaud unique. En gros, maintenant, chacun de vous sera un vecteur dont la taille sera de 10 000. Dans ce vecteur ne contiendra que des zéros et des zéros dans les positions qui correspondent aux mots présents dans cette revue. Pour créer de tels vecteurs, nous utiliserons la fonction séquences vectorisées. La fonction que nous passons des séquences, c' est-à-dire notre test d'index de train x jeu de données, et les dimensions souhaitées des vecteurs, dans notre cas 10 000. Avec leur ligne de résultats, nous avons créé un vecteur contenant tous les zéros pour chaque position de mot. Ensuite, en utilisant le cycle, nous passons en revue tous les éléments de la séquence. Et pour chaque mot présent dans la revue, nous avons indiqué la valeur correspondante à un mot et nous retournons le résultat. Nous allons maintenant utiliser cette fonction pour traiter le jeu de données d'entraînement et le jeu de données de test. Bon, alors, et maintenant voyons à quoi ressemblent nos jeux de données. Passons en revue le numéro 19. Auparavant, nos critiques ressemblaient à des tableaux avec des chiffres qui représentaient des mots. Maintenant, notre critique est un tableau avec seulement des zéros et des zéros. En utilisant la fonction Len, nous pouvons vérifier que la durée de chaque examen est maintenant de 10 000, comme nous l'avons indiqué. Et cela correspond au nombre maximum de mots que nous utilisons pour l'analyse. Nous pouvons également examiner la forme de l'ensemble de notre ensemble d'entraînement. Comme vous pouvez le constater, il y a 25000 commentaires et chacun d'entre eux fait 10 000 éléments. Eh bien, maintenant que nous avons préparé nos données, construisons notre réseau neuronal qui classifiera, examinera et déterminera si leurs avis sont positifs ou négatifs. Nous allons créer le modèle séquentiel, qui comportera trois couches denses. Les premiers joueurs auront 16 neurones et la couche de sortie n'aura qu'un seul neurone car nous avons une tâche de classification binaire. termes, nous n'avons que deux cours car il s'agit pas seulement de deux types d'avis et nous en choisissons un. Si la sortie est 0, la rétroaction est négative. Si c'est le cas, les commentaires sont positifs. Au lieu de trois couches, vous pouvez en utiliser davantage. Vous pouvez également modifier le nombre de neurones dans les première deuxième couches et voir comment le résultat change en tant que fonction d'activation. Dans les couches 1 et 2, nous allons utiliser une fonction de relu semi-doublure. Et dans la couche de sortie, une fonction sigmoïde sera utilisée. La fonction d'activation sigmoïde donne la valeur comprise entre 0 et 1, ce qui correspond parfaitement aux tâches de classification binaire. Après avoir créé le modèle, nous allons compiler notre réseau neuronal. Nous utilisons l'optimiseur de prop LMS, mais vous pouvez également utiliser l'optimiseur Adam que vous souhaitez. La fonction d'erreur est une entropie croisée binaire. Binary car nous n'avons que deux classes. La mesure de la qualité du réseau neuronal est la précision. C'est la proportion de réponses correctes. Et maintenant, nous n'avons plus qu'à former notre réseau neuronal en utilisant la méthode d'ajustement. Définissons le nombre d'époques sur 20, la taille du lot 128. Et nous allons diviser le jeu de données et en utiliser 10 pour cent comme jeu de validation. Ainsi, comme nous pouvons le constater, le pourcentage de réponses correctes dans le jeu de données d'entraînement près de 100 et dans l'ensemble de validation qui éclate en numérique, correct, sur des sources d'environ 85 pour cent. Visualisons la qualité de l'entraînement. Et maintenant, la dernière étape consiste à tester la précision du modèle sur le jeu de données de test qui n'a pas été utilisé pour l'entraînement. On peut voir que la précision est un peu inférieure à 85 %, ce qui n'est généralement pas mauvais, mais elle peut certainement être meilleure. Dans cette conférence, nous avons appris comment construire un réseau neuronal pour effectuer l'analyse des sentiments ou pour que notre modèle puisse déterminer si leur point de vue était positif ou négatif sur la base du texte de la revue. Comme nous l'avons déjà mentionné, s'agit d'un problème très populaire dans le monde moderne, et les entreprises et les marques l'utilisent pour comprendre comment ils sont consommateurs et les clients les traitent et quelle est la fidélité de leur marque. J'espère que cette conférence a été utile et j'ai hâte de vous voir dans les prochains épisodes.