Comment détecter une tromperie statistique pour une meilleure prise de décisions | Saptarshi Bhattacharyya | Skillshare

Vitesse de lecture


1.0x


  • 0.5x
  • 0.75x
  • 1 x (normale)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Comment détecter une tromperie statistique pour une meilleure prise de décisions

teacher avatar Saptarshi Bhattacharyya, Make Better Decisions

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

    • 1.

      Introduction

      2:01

    • 2.

      Biais d'échantillonnage

      8:36

    • 3.

      Taille de l'échantillon

      6:20

    • 4.

      Petits chiffres

      4:13

    • 5.

      Problème moyen

      16:35

    • 6.

      Paradox de Simpson

      14:28

    • 7.

      Corrélation d'effet

      11:31

    • 8.

      Statistiques

      8:59

    • 9.

      Données à moitié pertinentes

      7:30

    • 10.

      Vérifiez l'échelle

      2:22

    • 11.

      Comparaison par photo

      2:32

  • --
  • Niveau débutant
  • Niveau intermédiaire
  • Niveau avancé
  • Tous niveaux

Généré par la communauté

Le niveau est déterminé par l'opinion majoritaire des apprenants qui ont évalué ce cours. La recommandation de l'enseignant est affichée jusqu'à ce qu'au moins 5 réponses d'apprenants soient collectées.

54

apprenants

1

projets

À propos de ce cours

Nous vivons à l'ère de la surcharge de l'information. Nous devons utiliser constamment les données pour vérifier les preuves et vérifier la validité de nombreuses réclamations faites dans notre vie personnelle et professionnelle.

Cependant, dans la plupart des cas, nous n'avons pas le temps de vérifier les données brutes sur la base desquelles toutes les réclamations sont faites et nous n'avons pas non plus accès à celles-ci. Malheureusement, chacun profite de cette opacité et utilise diverses astuces statistiques pour plier les faits afin que leurs propres objectifs et agenda soient servis.

Des articles d'actualité, aux réclamations publicitaires, des communications d'affaires aux campagnes politiques, tout le temps que les données et les informations sont traitées et présentées de manière astucieuse et trompeuse.

Ce cours enseigne les 10 astuces statistiques les plus couramment utilisées pour cacher des faits tout en présentant des données. À la fin de ce cours, les participants pourront détecter et vaincre les astuces, examiner objectivement les preuves pour toute réclamation faite et prendre des décisions personnelles et professionnelles plus optimales.

Rencontrez votre enseignant·e

Teacher Profile Image

Saptarshi Bhattacharyya

Make Better Decisions

Enseignant·e
Level: All Levels

Notes attribuées au cours

Les attentes sont-elles satisfaites ?
    Dépassées !
  • 0%
  • Oui
  • 0%
  • En partie
  • 0%
  • Pas vraiment
  • 0%

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Introduction: Ce cours montre comment les statistiques maladie cachent la vérité afin manipuler nos décisions et comment détecter ces astuces pour prendre de meilleures décisions. Bonjour. Je suis un expert en sciences cognitives avec plus de 25 ans d'expérience aux États-Unis, en Inde, au Moyen-Orient et en Afrique du Sud. Nous vivons à l'ère de l'information. Nous devons utiliser les données pour prendre toutes les décisions. Mais pour les spécialistes du marketing, les politiciens des médias , pour tous les hommes d'affaires, chacun cache une vraie vérité derrière statistiques soigneusement construites de sorte que les données qu'ils présentent des sirops, leur propre objectif ou ordre du jour. Que pouvons-nous faire ? Eh bien, c'est assez simple. Nous devons apprendre les astuces statistiques les gens utilisent pour tromper que les gens utilisent pour tromper les autres afin de pouvoir les attraper dans l'acte et prendre de meilleures décisions. Dans ce cours, vous découvrirez les dix astuces statistiques les plus courantes par les spécialistes du marketing, les médias, les spin docteurs , les politiciens, les entreprises et d'autres personnes pour cacher les données à la vue. Ainsi, à la fin de ce cours, vous serez en mesure de prendre des décisions bien meilleures axées sur les données dans des situations personnelles et professionnelles en toute confiance. Qui peut suivre cette classe 12, à peu près tout le monde, débutants aux professionnels, en passant les chefs d'entreprise jusqu'aux étudiants. Tout le monde bénéficiera de ce cours. À la fin de ce cours, bien sûr, il y a un projet qui consiste étudier des situations pratiques minces où les gens généralement de mauvaises décisions en raison des astuces statistiques discutées dans La classe. L'objectif des élèves est de détecter d'abord l'astuce applicable, puis trouver la bonne façon de prendre des décisions. Je suppose que c'est à peu près tout. J'ai hâte de vous voir en classe et tous, oui, n'oubliez pas de mettre vos commentaires et commentaires à la fin. 2. 1 Échantillonnage de préjugés: Biais d'échantillonnage, car les statistiques peuvent parfois être un peu lourdes. Commençons donc par une ambiance plus légère avec un dessin animé. Le gars a donc créé un aliment pour oiseaux, qui est un véhicule. Et il dit, après avoir échantillonné chaque oiseau qui fréquente le trottoir à l'extérieur de ce bâtiment, nous avons conclu que ce que oiseaux aimaient vraiment ses véhicules. Cela signifie que pour décider à quoi aiment les oiseaux, tout ce qu'il a fait, c'est regarder Bard. Les trottoirs mangeaient des bagels parce que des bagels se font jeter hors de ses bâtiments. C'est une façon drôle de regarder. C'était que l'échantillonnage peut mener à une conclusion biaisée. La statistique consiste à collecter un petit nombre de candidats provenant d'une grande population est un petit nombre de candidats s'appelle échantillon. Et décider de l'importante population se basant sur la vérification avec l'échantillon. L'échantillon est représentatif de la population, les inclusions amusantes sont bonnes. Si l'échantillon est biaisé comme l'image, il y a plus de points verts que rouges dans l'échantillon par rapport à la population. Ensuite, notre conclusion basée sur un échantillon n'est pas non plus valide. Beaucoup de temps dans les enquêtes sur la vie réelle les conclusions ne sont pas valides parce que les échantillons sont biaisés. Par exemple, en fait, les diplômés collégiaux affichent toujours un salaire plus élevé que le salaire réel de ces diplômés parce que les gens retirent leur salaire à la suite de la réponse. Parfois, avant l'automne. Selon les enquêtes, les statisticiens prédisent que quelqu'un va gagner, quelqu'un d'autre gagne avec un gros glissement de terrain, comme c'était le cas lors des élections de 1932. Parce que l'échantillonnage était biaisé. Lors des sondages électoraux de 2012, il a été mené par une ligne fixe, ce qui prédisait qu' Obama perdrait. Mais Obama a gagné parce que de nombreux officiers, partisans utilisaient en fait téléphone cellulaire et ils seront donc désignés par cela. Favorise une enquête. Il est économisé que 80 % des Britanniques aiment les véhicules électriques. La première question que vous devriez poser est de savoir quelle pièce, les Britanniques. Parce que si l'échantillon est biaisé et provient d'une partie du peuple britannique, il est représentatif de cette section plutôt que de la population britannique morte. Examinons maintenant comment se produit le biais d'échantillonnage. Commençons par le cas des étudiants de l'Ivy League. Samedi moyen. déclaration publiée par une revue Selon une déclaration publiée par une revue, le salaire moyen du MBA Ivy League après cinq ans d' obtention du diplôme est de 300 000$. La question est de savoir dans quelle mesure une telle déclaration est-elle exacte ? Maintenant, la déclaration peut être très erronée et trompeuse. Pourquoi ? Parce qu'ils ne mentionnent pas la taille de l'échantillon. Ils ne mentionnent pas que s'ils ont eu un contact avec tous les diplômés parmi lesquels choisir. Ils ne mentionnent pas non plus si la liste des candidats qui ont répondu à l'endroit où elle est sélectionnée au hasard, ou s'ils ont simplement pris les réponses des personnes qui veulent répondre. Il ne parle pas non plus du nombre d' entre eux qui répondent réellement à ces questions. Si on leur pose cette question à 50 personnes et cinq répondaient. S'ils font la moyenne de ces cinq dollars et disent qu'il s'agit de milliers de dollars, c'est un cas fortement biaisé parce que cinq femmes ne sont pas représentatives. Cette question suivante est seules les personnes avec sa santé mentale ont-elles répondu, ce qui est très probablement le cas. Était-ce un échantillon représentatif ? Comme vous pouvez le constater, ils ont tellement de questions et la plupart des sondages évitent soigneusement répondre à l'une de ces questions. Vous ne pouvez donc pas faire confiance à une conclusion d'enquête salariale. Ainsi, les gens peuvent manipuler un échantillon ou simplement être bâclé, ne sont pas méthodiquement corrects lors de la collecte de l'échantillon. Et par conséquent, malheureusement, la signification de ce foyer n' est pas digne de confiance. 60 % des Indiens urbains préfèrent l'enseignement de l'ingénierie, dont 60 %, 80 % des Indiens préféraient en effet 13, dont 80 % des Indiens. Le résultat d'une étude visant à déformer échantillon doit être représentatif et aléatoire. autres termes, lors de la collecte de l'échantillon, tous les candidats devraient avoir les mêmes chances d'être sélectionnés. Bien des fois. Ce n'est pas le cas. Il y a une bataille constante pour réduire le biais d'échantillonnage en rendant l'échantillonnage aléatoire. Le biais d'échantillonnage est toujours là. Si nous voyons des affirmations comme celle-ci selon lesquelles 60 % des Indiens urbains préfèrent l'enseignement de l' ingénierie , il devrait y avoir 60 % de personnes. Ce ne serait pas 60 % des personnes qu'ils veulent demander. Pas 60 % de rabais sur notre lot, les Indiens. Lorsque l'échantillonnage aléatoire n'est pas possible, chronophage ou coûteux, c'est-à-dire un échantillonnage aléatoire, ce qui signifie chaque candidat aura les mêmes chances d'être sélectionné si cela n' est pas possible. . La meilleure chose suivante est l'échantillonnage aléatoire stratifié, où vous divisez la population en plusieurs groupes en fonction de la prévalence de ce groupe. Donc, si une population de 50 % blanche, 30 % noire, 20 % asiatique, vous prélevez un certain nombre d' échantillons provenant de la communauté asiatique, un certain nombre d'échantillons provenant de la communauté noire et un certain nombre d'échantillons provenant de communautés blanches proportionnellement à leur chiffre Parson. Et cela peut impliquer une violation. Et c'est un stratifié. Les groupes peuvent être basés sur le revenu, l'éducation, l'appartenance ethnique ou autre chose. Mais si votre connaissance de la proportion est erronée, l'échantillonnage, nous serions également biaisés. Par exemple, si un diplômé classe 30 % des femmes est de 70 % d'hommes, si la taille de votre échantillon est calculée à dix, vous pouvez sélectionner au hasard trois parmi les étudiantes et sept parmi les étudiantes. Ce ne serait pas un cas d'échantillonnage aléatoire stratifié. Cela serait quelque peu utilisable. N'oubliez pas que les sondages et commencé les résultats sont quelque peu biaisés. Le biais provient de deux sources différentes. Tout d'abord, ce sont les étapes que nous faisons dans l'entretien. âge, l'éducation, l'origine ethnique et l'expérience du personnel interrogé ont fortement influencé le résultat de l'enquête. Dans un cas, il a été constaté que, selon le personnel blanc ou noir effectuait l'entrevue avec les communautés noires, les résultats étaient assez différents. La deuxième source de biais est celle des personnes qui ont une tendance plus élevée à être sélectionnées comme échantillons sont candidats. Généralement, les personnes ayant plus d'argent, une meilleure éducation, une apparence bêta, plus d'informations et de vigilance. Les comportements plus conventionnels et les habitudes acceptables sont plus sélectionnés comme candidats pour un entretien ou un échantillon. Et par conséquent, débiaisez l'obstacle. **** et les résultats de l'enquête. 3. 2 Taille d'échantillon: Taille de l'échantillon. Dans de nombreux cas, les gens n' utilisent pas une taille d'échantillon suffisamment grande pour en tirer une conclusion. Par exemple, j'entends que des études sur les revendications publicitaires montrent qu' ici, je vais réduire ici la faute pour 80% des utilisateurs. Mais dans quelle mesure ces déclarations sont-elles crédibles ? Certains annonceurs fournissent des petits caractères qui mentionnent une petite taille d'échantillon, mais d'autres ne le font même pas. Malheureusement, pour la publicité commerciale, il n'existe aucune réglementation qui stipule que certaines tailles d'échantillons et certainement des méthodologies doivent être utilisées. Comme c'est le cas pour les produits pharmaceutiques. Par conséquent, les gens réclament toutes sortes de choses en se basant sur toutes sortes d'échantillons. Ces résultats sont principalement basés sur une petite taille d'échantillon. Et par conséquent, le bidon peut être dû à moins de chances. Ou bien, les images montrent quelques cas de leur échantillon pour montrer un bon résultat afin qu'ils puissent faire une réclamation dans une publicité. Pourtant, ils sont montrés tout le temps. Si vous lancez une pièce dix fois et que vous obtenez huit têtes, vous ne pouvez pas prétendre que l'étude montre que la chance d'obtenir des têtes dans le lancer est de 80 %. Vous devez avoir un grand nombre de tâches pour déterminer quelles sont les chances d'obtenir des têtes et celles qui seront de 50%. De même, pour établir une réclamation, vous devez avoir une taille d'échantillon suffisamment grande. La taille de l'échantillon dépendra variable des résultats et de la confiance que vous devez être dans votre réclamation. Disons que le risque de cas graves dus à une fièvre vitale n'est que de 10% chez les enfants. Vous avez sélectionné 1 000 enfants avec le bureau de la fièvre vitale. L'efficacité d'un médicament. S'agit-il d'une taille d'échantillon suffisamment grande ? Vous en avez sélectionné cent, dix cents. Vous étiez heureux que la taille de l'échantillon soit de 100000. Mais en réalité, 90 % de ces enfants vont s'améliorer. Même sans le médicament. En fait, vous testez le médicament sur seulement 10 % ou 100 enfants qui ont besoin de ce médicament parce qu'il s'agirait de l'inductance des cas graves. Il s'agit en fait d'une taille d'échantillon plus petite que ce que vous pensiez. La taille réelle de l'échantillon est un domaine numérique par intervalle de confiance et par écart type au cas par cas. Au sein de la population. Peu de facteurs sont importants estimer la taille de l'échantillon nécessaire. Leur niveau de confiance, leur intervalle de confiance, leur score Z, qui dépend du niveau de confiance, écart type et de la taille de l'échantillon, sont calculés en fonction de cela. Et je n' entrerai pas beaucoup de détails, mais il est important que nous en soyons conscients. Il existe certaines façons de calculer la taille de l'échantillon. niveau de confiance est la mesure selon laquelle vous répéterez l' expérience 100 fois, combien de fois vous obtiendrez un résultat similaire. Il est généralement utilisé car quatre-vingt-quinze pour cent sont la plupart des cas. L'intervalle de confiance est le degré d'ADR. Il est généralement utilisé comme plus moins 5 %. Le score Z est une mesure du nombre de zones d' écart-type par rapport à la moyenne en fonction du niveau de confiance que vous avez sélectionné Il existe un score Z pour l'écart type est le degré de variabilité. Si vous ne savez rien, vous pouvez utiliser 0,5. En mettant tout cela, il y a un calcul standard qui est la racine carrée du score z multiplié par l'écart type, multiplié par un écart type moins divisé par un intervalle de confiance carré. Avec un niveau de confiance de 95 % et un intervalle de 5 %, vous obtenez une taille d'échantillon de timbre de 85 %. Donc, 4,5 écarts types. Une taille d'échantillon de 400 à 500 est donc généralement suffisante pour la plupart des cas. détermination de la taille de l'échantillon est une étape critique de toute enquête statistique ou étude statistique. Parce que si cela a mal fait, ils entrent dans l'étude ou les enquêtes erronées. Il y a eu des cas colossaux de ps. Dans les années 50. Une étude sur le vaccin contre la poliomyélite chez 450 enfants ont été vaccinés et 680 ont été conservés sans vaccin dans le cadre d' une épidémie de poliomyélite, aucun des enfants n'a contracté la poliomyélite parce que le taux de contraction était juste moins de 1 %. En fait, la taille de l'échantillon nécessaire comprise entre 38 pour 1040 000 enfants. Ils pourraient donc s'attendre à ce que 300 à 400 cas de poliomyélite soient la taille de l'échantillon efficace pour tester le vaccin. Il y avait un moyen, très mal. Cela a sélectionné quatre cent cinquante et six cents, environ 1100 enfants où ils ont besoin de 30 000 à 40 000 enfants. L'estimation de la taille de l'échantillon et l'utilisation de la taille de l'échantillon de la bonne valeur sont donc de la bonne valeur sont extrêmement importantes pour toutes les études statistiques. Mais malheureusement, dans la plupart des nous voyons pour les annonceurs, pour différents produits ou même pour les politiciens, les médias et autres. Tous ces gars, presque tous ces gars ne sont pas en intérieur, utilisent une taille d'échantillon suffisante et le résultat. Aucune de ces réclamations n'est gérée. 4. 3 petits chiffres: De petits chiffres. Commençons par être d'accord. Une ville possède deux hôpitaux, l'un petit et l'autre grand. Un des deux hôpitaux en un mois, 60 % des bébés sont nés. Alors qu'il est généralement de 50 %. Lequel s'agit-il ? Le petit ou le grand hôpital ? La réponse est le petit hôpital. Parce que tout comme une petite taille d'échantillon, cas extrêmes ou inhabituels. Dans ce cas, 60 %. Les garçons sont inhabituels, 50%, Les cas inhabituels habituels sont observés dans de petites tailles d'échantillons, sont, dans ce cas, un petit hôpital. Lors de l'enquête sur les cas de cancers du rein dans plus de 3 000 comtés américains, il a été constaté que la plus forte incidence se produisait petits comtés. Fait intéressant, il a également été constaté que l'incidence la plus faible a également été observée dans les petits comtés. Cela signifie que les comtés de petite taille et moins peuplés ont eu à la fois l'incidence la plus élevée et la plus faible. C'est le cas des petits nombres. Et pourquoi cela se produit-il. Regardons un très petit comté avec juste rester chez les adultes. Comme c'est le cas seulement chez les adultes, il est très probable que le nano ait un cancer. Il affichera 0. Mais si une seule personne est annulée par hasard, elle affichera également une incidence de 10 %, ce qui est très élevé. Cela signifie que si le compte est petit, y a de fortes chances qu'il soit épargné de nombreux cas. Et juste s'il y en a quelques-uns, il y aura des cas d'incidence élevés. Les petits comtés afficheront donc une incidence élevée et faible. Les petits districts à faible population afficheront toujours des résultats extrêmes. Là où, dans les grands districts, nous vivons dans des cas entiers de population pour afficher des résultats plus moyens. Une chaîne de supermarchés a découvert que les petits magasins affichaient la fois le niveau le plus bas et le plus élevé par unité de surface et les ventes par unité de surface. La taille de l'échantillon plus petite est plus susceptible de présenter des résultats extrêmes en raison du caractère aléatoire. Et un échantillon plus large représente mieux une population. C'est pourquoi nous entendons ce que l'on appelle un grand nombre de lois dans les statistiques. Afin de tirer une conclusion, vous ne pouvez dépendre que de grands nombres et quand un grand nombre de choses mortes doit se faire la moyenne. Maintenant, comment, en cas de petit nombre, les choses obtiennent des résultats extrêmes ? Prenons un autre exemple. Imaginons les étudiants qui ont encore 100 chambres avec cinq étudiants chacun. Sur 500 étudiants au total, 25 ont obtenu un avantage lors de leur examen. Cela signifie que la plupart des chambres comptent 0 % d'étudiants avec un plus, car il n'y a que 25 étudiants plus et 100 chambres. Mais si une chambre vient de gagner un étudiant plus, elle montrera 20 % de cas d' un étudiant plus un, divisé par cinq, soit 20. La chambre a pour les étudiants par hasard qu'elle montrera 40% de cas d'un plus. Vous pouvez voir en raison du fait que les pièces sont petites, n'importe quel chiffre sera exagéré. C'est ainsi que de petits nombres existaient aux résultats. Et c'est notre loi en grand nombre qui a besoin plus grand nombre pour en tirer une conclusion. 5. 4 problème moyen: Problème moyen. une des méthodes les plus courantes des statistiques est, c'est en tant que personne qui contient beaucoup de données. La moyenne est probablement la statistique récapitulative la plus couramment utilisée. Nous aimons résumer un grand nombre de données en une seule figure. Et c'est la popularité de la moyenne. Nous entendons des déclarations comme l'économie créera 20 000 emplois par mois. C'est un chiffre moyen. Pays, nous obtiendrons 20 pouces de précipitations et d'autres moyennes ici, augmentation de salaire moyenne de 10 % par an et ainsi de suite. Mais tous ces chiffres moyens peuvent être vraiment trompeurs et ils peuvent cacher plus d'informations que le spectacle. Par exemple, certains mois peuvent ajouter 50 000 emplois, tandis que d'autres mois peuvent ajouter Justin mille emplois. Donc, quelqu'un de 20 000 personnes ne veut pas dire grand-chose. De même, certaines régions du pays peuvent être inondées. Où peut-il y avoir de la sécheresse dans d'autres parties ? Les précipitations moyennes de 20 pouces dans un pays ne signifient donc rien. De même, le salaire de certaines personnes peut doubler, alors que certains peuvent ne pas le voir augmenter du tout. Une augmentation de salaire moyenne de 10 % est donc absolument inutile en ce qui concerne l' augmentation réelle des salaires des gens. On dit qu'il ne faut pas traverser une rivière s'il fait en moyenne quatre pieds de profondeur. Parce que la rivière peut être de 20 pieds de profondeur, ajoutez quelques visages à un ou deux pieds de profondeur à d'autres endroits. Donc une moyenne pour une profondeur libre, ce qui signifie que si vous essayez de traverser la rivière en pensant que ce sera pour imprimer en moyenne, un ivrogne. L'un des cas dramatiques du problème de l'utilisation de la moyenne a été ce que les scientifiques ont découvert au cours des premières années de suivi du réchauffement climatique. À ce moment-là, les scientifiques se penchaient principalement sur l'augmentation moyenne de la température et essayaient de mettre en corrélation le fait qu' avec les camps de filtration ou de glace polaire, ils ont été surpris de constater que même si la température moyenne reste la même, plus qu'un plus grand nombre de calottes glaciaires polaires, nous sommes fondus d' une année à l'autre. Plus tard, ils ont découvert que même si la moyenne reste la même, années avec les pics de température élevés ont provoqué une plus grande demande d'yeux. La moyenne n'a pas été très utile. De même, essayez d'examiner deux cas où une personne boit une bière tous les jours pendant 30 jours. C'est donc en moyenne une bière par jour. Alors qu'une autre personne ne boit aucune bière pendant 29 jours et le 30e jour, il boit 30 ans. Dans les deux cas, la moyenne est d'une bière par jour, mais l'impact de la consommation de bière sera beaucoup plus grave, serait fatal dans le second cas de consommation de 30 bières par jour. De même, la moyenne peut être vraiment trompeuse. Un autre cas célèbre de problèmes avec les moyennes où en 1997 l'inondation de Grand Forks, la ville avait une digue de 51 pieds. niveau d'eau de la rivière était supérieur à 49 pieds, ce qui était en moyenne. Mais à certains endroits pendant une inondation, l'eau a atteint 53 pieds même si la moyenne reste pour le dîner. Mais dans ces cas ou ces déplacements, l'eau a brisé la digue, provoquant du sang dans la ville. L'utilisation des moyennes dépend des moyennes, car les moyennes des inondations dans la ville peuvent être trompeuses à bien d'autres égards. Prenons le cas de l'espérance de vie moyenne. Par exemple, sur 19 centaines, espérance de vie moyenne à la naissance était de 30 ans. Mais ces 32 ans ne veulent vraiment rien dire. Cela ne veut pas dire que tout le monde est mort à 32 ans. Beaucoup de régimes alimentaires à Bart, beaucoup de régimes de moins de cinq ans meurent pendant la guerre. Mais ceux qui ont survécu à tous ceux qui ont vécu jusqu'à 60 et 70 ans, tout comme aujourd'hui, la moyenne est apparue à 32 ans, mais ce chiffre ne veut vraiment rien dire. C'est pourquoi il n'y a pas d'entreprise moyenne. n'y a pas de fluctuation moyenne du marché boursier. n'y a pas de guerre moyenne, pas de moyenne ni d'épidémie, ni de campagne de marketing moyenne, ni de vente moyenne de livres. Dans la plupart des cas, la distribution peut être très faussée. Un monarque moyen signifie n'importe quoi. Par exemple, sur le côté gauche, vous voyez qu'il s'agit d'une inclinaison négative de la distribution où la preuve est déplacée vers la gauche et la droite, vous pouvez voir une asymétrie positive où la moyenne est Je suis passé à la lumière parce que c'est le cas. En détail vers la droite, uniquement dans le cas des moyennes de distribution normale centrale au centre. C'est donc quelque peu significatif, mais dans tous les cas réels, la distribution des valeurs est toujours faussée. Et par conséquent, moyenne ne donne pas beaucoup de sens utile. Dans le contexte du résumé statistique, trois types de moyennes sont utilisés. On les appelle moyenne, médiane et mode. moyenne est la moyenne arithmétique simple. Prenons l'exemple illustré dans le tableau à gauche. Disons que dans une pièce, il y a 20 personnes. Leurs salaires sont indiqués dans les colonnes. Leurs salaires varient entre 20 000 $ par année et 3 millions de dollars par année. Le salaire moyen est donc qu' il atténue la moyenne, qui s'élève à 248 750 Donner. Maintenant, la médiane est le salaire au milieu quand ils sont tous organisés ordre croissant ou décroissant. Dans ce cas, il s'élèvera à 56 500$. Mode est le chiffre de salaire qui se produit le plus dans ce domaine, si vous voyez 60 000 fauteurs deux fois contre tout le reste opérant une fois. Donc, 60 000$, c'est le mode. Comme vous pouvez le constater, lorsque peu de valeurs aberrantes peuvent modifier la moyenne ou la médiane, c'est un meilleur résumé. Dans ce cas, parmi 20 personnes, seules deux personnes ont un salaire très élevé, soit 1 million de dollars en 3 millions de dollars. Les autres se situent entre 20000.95000. Comme cela à des valeurs élevées ou à l'inclinaison des moyens. Voyez si quelqu'un dit que le salaire moyen des personnes présentes dans la chambre est de 248 000$, ce qui ne reflète pas la vraie nature des salaires des personnes présentes dans la pièce. Par conséquent, comparé à cette médiane, qui est de 56 000$, est une bien meilleure représentation. Dans tous les cas où quelques valeurs aberrantes peuvent fortement fausser les moyennes. La médiane est une meilleure estimation des statistiques moyennes. Mode dans ce cas également dans un peu utile, mais dans de nombreux cas, quelque chose ne peut pas se produire plus d'une fois. Ainsi, plus d'hommes peuvent être utilisés. médiane est une meilleure estimation dans de nombreux cas fortement influencés par des valeurs aberrantes élevées ou faibles. Mais dans tous les cas pratiques où la distribution est fortement asymétrique d'un côté ou d'un autre, aucune moyenne moyenne, médiane ou mode ne peut être utilisée. Prenons l' exemple du cancer. Beaucoup de temps le Dr dira à une base de cancer et qu'il vient de faire un congé de monstre ou 18 mois à vivre. Le patient ne doit pas perdre son cœur. Parce que ces 12 mois ou 18 mois pourraient être une valeur moyenne et médiane. Et cela peut être très biaisé parce qu' il peut y avoir beaucoup de gens qui meurent immédiatement ou après le tournage. C'est mon diff que le patient survit les premiers mois. Il peut s'attendre à vivre beaucoup plus longtemps. Parce que même le mode peut être fortement déplacé vers le côté droit ou vers le nombre plus élevé de mois ou d'années. Examinez le cas de la distribution C, où la moyenne et la médiane se situent vers la gauche, mais le nombre réel de personnes vivant beaucoup plus haut que la moyenne et la médiane est vers la droite. On peut même quitter 6070 ans même après avoir été détecté avec un cancer et c'est ce qui s'est produit. Prenons un autre exemple. Disons que 80 % des entreprises ont 90 millions de dollars de ventes et seulement 20 % des entreprises avaient 60 millions de dollars de cellules. Si vous calculez la moyenne, vous verrez que la moyenne s'élève à 84 millions de dollars. Mais dans ce cas, 80 % des entreprises qui sont au-dessus de la moyenne, ce qui est difficile à comprendre. C'est contre-intuitif. Mais beaucoup de cas, les moyennes fournissent un résultat de compteur, contre-intuitif et parfois contre-intuitif et parfois intentionnellement de flexion. Et ceux qui finissent par prendre de mauvaises décisions en utilisant l'ampérage. Regardez donc toujours la distribution et prenez une décision en fonction de cela. Ne décidez jamais en fonction de chiffres moyens. Les calculs moyens conduisent parfois à des informations très déroutantes et trompeuses. Par exemple, la Chine moyenne ne provient pas familles moyennes car le calcul de l' enfant moyen et le calcul de la famille moyenne ne sont pas les mêmes. Illustré cela, disons qu'il existe un village de 100 familles. Un certain nombre d'enfants par famille correspond Insérer une table à votre prochain. 100 familles sont divisées en cinq groupes de 20 familles, chacune. Premier groupe comme 0 enfants. Le deuxième groupe a un enfant. Le groupe dur a deux enfants, le groupe a trois enfants. Et le cinquième groupe a formé des enfants. Si la question est, quel est le nombre d'enfants pour une famille moyenne ? Vous devez calculer le nombre total d' enfants en multipliant la colonne de gauche à la colonne droite, ce qui entraînera 200 enfants et vous divisez 200 familles. Il donnera le nombre moyen d'enfants ou de familles, soit 200 divisé par 100 également. Mais s'il y a une question, enfant moyen vit avec des familles avec combien d'enfants ? La réponse n'est pas une dent. Cela signifie que même si la famille moyenne a deux enfants, mais les enfants moyens ne vivent pas dans une famille de boîtes à outils. C'est déroutant. Mais regardons les enfants. Les enfants. Il n'y a pas d'enfants dans le premier groupe car il y a 0 enfant. Maintenant dans le deuxième groupe, il s'agit d'un total de 20 enfants. Et ils vivaient dans une famille d'un enfant. Dans le troisième groupe qui compte 40 enfants. Ensuite, ils vivent dans une famille d'enfants. Le quatrième groupe qui compte 60 enfants, 20 multipliés par trois. Et tous ces 60 enfants vivent dans une famille de trois enfants. Dans le groupe final qui compte 80 enfants, car 20 familles multipliées par quatre enfants AT enfants. Et tous ces 80 enfants vivent dans une famille pauvre. Donc, pour calculer le nombre moyen d'enfants avec lesquels vit un enfant moyen, il faut multiplier 20 par un. Parce que 20 enfants vivent dans une famille d'enfants, 40 enfants vivent dans une famille de boîtes à outils, 60 enfants vivent dans une famille délicate et 80 enfants vivent dans une famille pauvre. Et il faut le diviser par un total d'enfants, soit 200. Et il en aurait trois. Cela signifie que l'enfant moyen vit dans une famille déclenchée, alors que les familles moyennes ajustent les boîtes à outils. De même, les employés moyens ne travaillent pas dans une entreprise moyenne. Il sera biaisé vers une plus grande entreprise. Par exemple, vous voyez ici que les enfants moyens sont biaisés envers les familles plus grandes avec plus d'enfants. De même, le citoyen moyen ne vit pas dans un pays moyen. Les citoyens moyens seront biaisés l'égard de ces pays à forte population comme l'Inde, la Chine et les États-Unis. C'est ainsi que les moyennes peuvent être vraiment déroutantes. Nous examinerons un autre exemple pour montrer comment étudiant moyen ne va pas à l'université moyenne. Parce que les étudiants moyens et collèges moyens ne sont pas calculés de la même manière. Cts pour les collèges avec des étudiants jusqu'à la table. collège est petit, compte 1 000 étudiants. collège deux compte 3 000 étudiants. cartilage compte 10 000 étudiants, et le collège compte 30 000 étudiants. Il y a 44 000 étudiants au total. La première question est quel est le nombre moyen d'étudiants par collège ? Pour le collège, 44 000 étudiants totalisent. Le nombre moyen d'étudiants par collège est donc de 44 000 divisés par quatre, soit 11 000. La deuxième question est moyenne des étudiants se fixe à l' université avec combien d'étudiants ? Ce calcul est très différent car au collège, 11 000 étudiants vont à l' université avec 1 000 autres étudiants. Au collège, 3 000 étudiants vont à l'université avec 3 000 étudiants au collège, 310 000 étudiants vont à l' université dans un rayon de 1000 étudiants. Au collège pour 30 000 étudiants va au collège de 30 000 étudiants. Ainsi, l'étudiant moyen va au collège 10 000 carrés, 30 000 carrés, 3 000 carrés, 1 mille carrés divisés par 44 000 étudiants. Il s'agit donc de 22 954. Ainsi, même si le collège moyen ne compte que 11 000 étudiants, mais un étudiant moyen va à l'université de 23 000 étudiants. De même, la population moyenne par pays est de 39 millions d'habitants car il y a environ 7,8 personnes booléennes et environ 200 garde-manger. Vous divisez ces 7,8 milliards avec 200, environ 39 millions de personnes par pays. Mais un citoyen moyen vit dans un pays où il y a beaucoup plus de gens, presque dix fois plus de gens. C'est ainsi que le pays moyen et le citoyen moyen ne sont pas la même chose. étudiants moyens et les collèges ne sont pas la même chose. Ces chiffres sont souvent utilisés intentionnellement par différents véhicules. Et ils illustrent ce chiffre moyen qui sert leurs partenaires. 6. 5 Paradoxe de Simpson: Le paradoxe de Simpson. Entre 196319 et 80, le score moyen de SAT verbal et mathématique de tous les étudiants américains a baissé de 5040 points respectivement. Ce sont de grosses gouttes. Cela a provoqué une indignation à l' échelle nationale. Et le panel présidentiel a été formé. Ils ont étudié les résultats et publié un rapport tristement célèbre intitulé Nation at Risk. Ces mesures conduisent à des mesures drastiques ultérieures, une refonte complète du système éducatif, lutte contre beaucoup d' enseignants, etc. Cependant, une enquête ultérieure a révélé qu'il est intéressant lorsque tous les étudiants étaient divisés en groupes de revenus individuels, tous les groupes ont constaté une augmentation du score SAT entre 19631980, bien qu'un groupe de tous les étudiants soit réunis. Donc, en degrés. C'est un exemple du paradoxe simple de Simpson. Et cela se voit dans de nombreux cas différents. Pour illustrer ce point, pour montrer comment cela se passe, disons qu'en 19631980, tous les étudiants pourraient être divisés en trois groupes principaux ou groupes revenus pour la classe moyenne et les riches. En 1963, plus de 70 % des élèves étaient issus de familles riches et seulement 20, 10 % provenaient de la classe moyenne et de familles pauvres. Et leurs scores moyens en mathématiques, respectivement avec 554 atteignent 500 pour la classe moyenne et 404, la moyenne globale était de 525. Ce mélange a complètement changé en 1980 car entre 6380, le nombre total d'élèves a augmenté de nombreux plis. Et tout ce qu'ils augmentent le jeu élèves pauvres et de la classe moyenne. Aujourd'hui, ils sont constitués de 40 % chacun de tous les étudiants qui réduisent la proportion d' étudiants riches à seulement 20 %. Maintenant, tous ces trois groupes, score Matt SAT était plus élevé. Pour les étudiants, le score était de 420, ce qui a été embauché par 20. Les élèves de la classe moyenne ont obtenu une note de 520 points, ce qui a été plus élevé de 20 points. score des étudiants Enrich était de 560, qui a également été embauché par dix points. Cependant, la moyenne globale de 1980, elle n'était que de 88, car la combinaison totale est maintenant différente et que plus d' étudiants étrangers et moins proportionnels atteignent les étudiants. La moyenne globale est passée de 525 en 1967 à 488 en 1980. Cependant, tous les groupes individuels ont connu une augmentation de la moyenne. Le Met est une discorde. C'est ce qu'on appelle le paradoxe de Simpson. Le paradoxe de Simpson porte le nom d'un mathématicien Edward Simpson. Il l'a découvert en 1951. Il indique parfois un résultat ou la formation observée lorsque les données sont séparées en différents groupes. Mais lorsque tous ces groupes sont rassemblés, ce résultat est formé, ceux-ci sont inversés. Il disparaît. Examinons les deux graphiques à gauche. Dans le graphique ci-dessus, vous voyez l' ensemble des données en points gris. Ici. Si vous le regardez, vous verrez qu'il s'agit d'une tendance croissante de gauche à droite. Lorsque vous divisez ces points gris en quatre couleurs différentes : vert, jaune, bleu et rouge. Pour ce qui est du vert, il s'agit d'une tendance à la baisse. Pour le jaune, il s'agit d'une tendance à la baisse de gauche à droite. Du bleu, c'est encore une tendance à la baisse. Pour le rouge, il s'agit d'une tendance légèrement croissante mais pas aussi dramatique que les points gris. Fondamentalement, tous les groupes individuels avaient montré des trains différents par rapport à tous les points lorsqu'ils sont assemblés dans un format de grille, ce qui signifie tous les points qui étaient ensemble. C'est ce qu'on appelle le paradoxe de Simpson. Le paradoxe de Simpson est présent dans nombreux domaines et il a confondu la prise de décision. Jetons un coup d'œil à quelques autres exemples. Encore une fois, il s'agit d'un exemple réel. Dans n'importe quel programme de doctorat universitaire. Il a été trouvé. Que 50 % de candidats masculins étaient acceptés ou que 8 % de femmes étaient acceptées. Cela a suscité beaucoup de débats et de discussions sur le fait d'avoir un parti pris à l'égard des femmes. Mais des recherches plus approfondies ont montré une tendance différente où tous les programmes de doctorat étaient divisés en doctorat en sciences naturelles et en doctorat en sciences sociales. Il a été trouvé pour ces deux types de programmes de doctorat différents . Plus de femmes étaient acceptées que les hommes, un candidat à un emploi de jour de parson. Mais les femmes ont principalement postulé de doctorat en sciences sociales, qui avait été comparé au programme de doctorat en sciences naturelles à un taux d'acceptation beaucoup plus faible pour les étudiants de sexe masculin et féminin. Et ce genre de biais, ce niveau d'acceptation global pour les femmes, comment cela se produit-il ? Jetons un coup d'œil à la pointe. Ainsi, 80 % des étudiants de sexe masculin ont postulé pour les sciences naturelles, 20 % pour les sciences sociales , tandis que pour les femmes, 30 % ont postulé pour les sciences naturelles et 70 % ont postulé pour Programme de doctorat en sciences sociales. Pour les hommes, le niveau d'acceptation pour les sciences naturelles 60 % et de 80 % pour les femmes. Les femmes avaient un niveau d'acceptation plus élevé pour les programmes de doctorat en sciences naturelles. De même pour le programme de doctorat en sciences sociales, les hommes avaient un niveau d'acceptation de 10 % et les femmes avaient un niveau d'acceptation double de 20 %. Mais alors que de plus en plus de femmes ont postulé au programme de doctorat en sciences sociales, qui avait un programme de doctorat en sciences naturelles beaucoup plus faible . L'acceptation globale pour les hommes était de 50 % et de 38 % pour les femmes. Encore une fois, lorsqu'on le regarde individuellement, il s'agit d'une marque unique tendance. Lorsque l'on considère l'agrégat, c'est une tendance différente et semble dépenser. Ainsi, chaque fois que vous voyez une tendance des données tout en regardant de nombreuses données ensemble, n'oubliez pas que s'il existe un moyen de diviser toutes les données en groupes significatifs, des groupes individuels peuvent afficher un drainé complètement différent, une tendance opposée à l'ensemble des données quadrillées que vous devez faire attention. On le voit dans les affaires. La recherche. Tout le temps. société a vendu Split Asean Window AC. Vérifiez les commentaires de 1000 clients de chaque produit. Donc 1 000 clients qui achètent split AC, le vérifié. Et comme il est indiqué dans le tableau à votre gauche, 800 et disons la lumière divisée AC, c' est-à-dire 80% des gens ont aimé split ac. De même, 1 000 clients qui ont acheté Windows ISE ont vérifié et soixante-quinze pour cent des personnes ont dit aimer Windows AC. Ils ont donc conclu que le fractionnement MAC est plus aimé. La chose s'est inversée lorsque les clients étaient divisés en hommes et en femmes. Donc sur 1 000 AC divisé, 900, où principaux clients, 100 où clientes femmes. Sur 900 clients masculins, 750 ont déclaré qu'ils aimaient diviser la climatisation, donc ils font les 3%. Et parmi 100 femmes clientes, 50 ont dit que la lumière divisée est de 50 %. Mais pour Window AC, sur un total de 1800 millions de clients, sur huit cent sept cent cinquante ont dit aimer Window AC, soit 88%. Deux 100 clientes ont acheté des fenêtres et des fenêtres lumineuses C et 150 et voyaient que c'est 75 %. Comme vous pouvez le constater, 83 % des hommes aimaient l'AAC divisé contre 88 % des hommes qui aimaient la fenêtre et voient, quand on ne regarde que les clients masculins, plus de clients aimaient. Window est similaire lorsque vous ne regardez que les clientes féminines, 50 % comme Split SE et soixante-quinze pour cent Light Window SE. Encore une fois, plus de clients, plus de clientes féminines, Mike , Window AC, mais plus de femmes comme la fenêtre que je vois chez les clients masculins comme fenêtre et voir. Mais lorsque vous ne rassembliez pas les clients masculins et féminins, au niveau global, vous constatez une tendance différente selon laquelle plus de gens aiment, aiment la séparation. C'est donc un autre exemple de citoyens, Benoît. Nous allons maintenant examiner quelques études de cas dans les entreprises pour voir comment paradoxe de Simpson peut être identifié comme un problème potentiel et comment y remédier. Dans une étude de marché, données ont montré qu' entre deux mille et deux mille quinze ans, les dépenses moyennes par ménage pour certaines catégories de produits diminuent 120$ en 2 de milliers à 95$ en 2015. La question est maintenant : s' agit-il d'une tendance à la baisse ? Ou devriez-vous interrompre cette gamme de produits en fonction de la rue ? La réponse est qu'en examinant cette tendance globale de toutes les données, vous ne pouvez pas prendre cette décision. La représentation de ce problème est problème paradoxe de Simpson que nous avons découvert. Et pour évaluer si certains groupes peuvent être abandonnés, vous devez prendre une décision en fonction des sous-groupes potentiels. Vous devez donc étudier en divisant la croissance totale en un sous-groupe significatif qui peut se comporter différemment. Et vérifiez si le même train est visible pour chaque sous-groupe. Individuellement, le sous-groupe pourrait être basé sur des groupes de revenu, des familles à revenu élevé, à revenu moyen et à faible revenu. Est-ce la même tendance dans tous ces groupes ? Il peut être basé sur des clients masculins et féminins ou plan de l' emplacement ou tout autre élément qui pourrait être significatif pour leurs données. Tous ces groupes individuels et montrant également une diminution des dépenses, vous pouvez alors prendre une décision. Mais il y a de fortes chances qu'il y ait d'autres facteurs qui contribuent à ce groupe global par rapport à des groupes individuels montrant une tendance différente. Si tel est le cas, vous devriez continuer avec cette gamme de produits. Jetons un coup d'œil à une autre étude de cas, qui est encore une fois un problème courant. Comment les données de vente entre 2014-2019 ont montré que le mètre carré de prix de l'immobilier a baissé de 10 % dans un CTE. Est-ce là la tendance à la baisse de l' immobilier ? Encore une fois, c'est un problème paradoxe de Simpson, car façon dont le marché immobilier peut être divisé, segmenté et regroupé en gaspillage. Pour décider s'il s'agit d'une tendance à la baisse, il faut examiner certains groupes. Vous devez effectuer une enquête en divisant le groupe entier en différents sous-groupes qui peuvent être basés sur des emplacements pour voir où vous voyez la même tendance dans tous les emplacements, selon les types de maisons, par la taille des maisons. y a de fortes chances que vous constatiez que des groupes individuels affichent une tendance différente. Peut-être que certains affichent une hausse de prix. Mais alors qu'il y a un autre facteur, la plupart des types de logements sont vendus en très grande quantité. Par conséquent, je modifie la tendance pour l'ensemble du groupe. Alors que les groupes individuels peuvent montrer une tendance différente, comme la façon dont nous résolvons le faible revenu moyen et atteignons les compétences des étudiants dans le score SAT. Ce n'est qu'après avoir examiné la tendance dans le sous-groupe que vous pouvez déterminer si cette tendance la baisse des prix immobiliers est gérée. De même, il existe de nombreux cas chaque fois que vous voyez un groupe de points de données, essayez de le diviser en différents groupes et voir si ces groupes affichent la même tendance. Parce qu'il faut faire attention au problème du paradoxe de Simpson. 7. 6 Corrélation avec l'effet de cause: Cause, effet et corrélation. Lorsque deux événements se produisent ensemble et à changement positif ou négatif dans un événement est associé à un changement similaire dans l'autre événement. dit qu'ils sont positivement corrélés. Lorsque cette relation est opposée, dit qu'elles sont négativement corrélées. Il existe de nombreux cas où les choses sont positivement corrélées. Par exemple, il existe une corrélation de 0,3. Un coefficient de corrélation est calculé et certaine façon nous n' y arriverons pas. Mais il existe un certain niveau de corrélation positive entre l'AMP des collèges et les revenus subséquents. Il existe un niveau plus élevé de corrélation entre le QI et la performance moyenne de l'emploi. Il existe un niveau beaucoup plus élevé de 0,7 corrélation entre la taille et le poids. Les personnes plus grandes sont plus lourdes. Corrélation encore plus élevée entre le score SAT mathématique de deux années consécutives. C'est donc le cas dans les cas où les choses sont positivement corrélées. Maintenant, deux problèmes communs et erreurs dans la prise de décision. Liée à la corrélation r, on parle d'erreur post-hoc. Lorsque l'événement est survenu après un événement, on dit qu'ils ont été formulés et il est dit qu'il s'agit d'un événement qui provoque un autre Richmond et a fait un cas. Un autre est *** hoc, ergo propter hoc, c'est-à-dire lorsque deux événements se produisent ensemble. L'un doit être dû autre événement qui peut ne pas être l'invité, car la corrélation ne signifie pas une causalité, deux événements sont corrélés ne signifie pas que l'un est à l'origine la fausse causalité ou pensant qu'un événement en cause faussement un autre. Sa mère de toute logistique statistique lorsque deux événements se produisent en même temps. Par conséquent, lié, mais la corrélation ne signifie pas une causalité. Si deux événements se sont produits en même temps, cela ne signifie pas que l'un en cause un autre. Tous les matins. Coq, corbeaux. Et le lever de soleil ne signifie pas que ce coq provoque le lever du soleil, se produit en même temps. Les coqs anticipent dans Sunrise et il pousse et les éléments de lever du soleil, ils sont corrélés, mais l'un ne cause pas l'autre. Il y a quelque chose qu'on appelle une corrélation fausse, car par hasard, deux événements pourraient être corrélés, mais il n'y a aucune relation. Prenons quelques exemples. Si vous tracez les ventes d'iPhone aux États-Unis et que vous plongez par les plis dans les escaliers, vous constaterez un niveau très élevé de corrélation positive car ces deux facteurs ont augmenté au fil des ans. Mais, comme nous le savons, il n'y a absolument pas de causalité réelle entre aucune relation. De même, si vous tracez la consommation de bar capita de la façon dont le sirop de maïs fructose a chuté et les dépenses dans des sports spectaculaires de spectateurs vous verrez que l'un augmente, tandis que l'autre est décroissant. Juste deux événements, il y a une corrélation erronée. De même, si vous regardez les visiteurs Universal Studio of Orlando et les ventes de voitures neuves, vous verrez les deux. Ils sont en train de descendre, mais encore une fois, ils sont en train de tomber. Et toute relation entre eux et association fausse peut être complètement coïncidence ou esprit. Il y a eu beaucoup de temps et c'est extrêmement exemple que si ces deux événements sont quelque peu liés, on peut conclure faussement, ou on peut manipuler pour montrer aux autres qu'ils sont liés. mains, l'une cause l'autre. Il faut faire attention à ça. table deux par deux est quadruple. Le tableau est un tableau statistique qui peut aider à prendre des décisions. C'est un moyen robuste de voir à quel point la corrélation et la causalité sont fortes. Donc, si quelque chose cause quelque chose, c'est par exemple, souvent vous verrez des gens vous dire que 20 personnes grippées ont pris des médicaments et se sont rétablies après cinq jours, comparativement à seulement dix personnes qui se sont bien rétablies. sans prendre de médicaments. Par conséquent, le médicament est infecté. Mais pour vérifier si médicament est efficace ou non, vous devez remplir le tableau complet du formulaire. un côté, il faut regarder les gens qui ont pris Madison plutôt que ceux qui n'ont pas pris de médicaments. Et puis de l'autre côté, il faut regarder les gens qui se sont améliorés après cinq jours contre qui ne se sont pas améliorés après cinq jours. Si un total de 30 personnes à la médecine s'est amélioré. Et Dan ne s'est pas amélioré. Et si au total 15 personnes ont pris des médicaments et dix Dieu amer et ne s'en sortaient pas mieux que vous ne pouvez conclure quoi que ce soit. Parce que la relation entre 201010 et cinq est la même. Mais si nous avions eu notre parjure, les gens qui n'ont pas pris Madison et qui se sont améliorés et 20 ne se sont pas améliorés que ce que vous pouvez dire, accord, la médecine aide. De même, vous pouvez créer différents pour, pour que la table cherche des informations supplémentaires dans lesquelles vous pouvez les brancher afin de prendre des décisions. Parfois, la causalité peut être inversée. Si papa donne un rapport qui dit que les entreprises ayant plus de femmes dans leur conseil d'administration ou plus rentables ou plus grandes que la taille. Cela peut signifier que les entreprises ayant plus de femmes sont plus rentables, ou cela peut aussi signifier que des entreprises plus rentables embauchent plus de femmes, ce qui n'est pas vraiment clair. De même, les meilleurs collèges affirment que leurs élèves obtiennent de meilleurs résultats. maintenant que les étudiants obtiennent de meilleurs résultats en raison des collèges ou des grands étudiants qui vont pas très clair maintenant que les étudiants obtiennent de meilleurs résultats en raison des collèges ou des grands étudiants qui vont dans les meilleurs collèges . Ce sont là que la causalité pourrait être inversée. Dans deux événements consécutifs, on voit souvent que l'agriculteur est à l'origine de la lettre, mais ce n'est peut-être pas le cas, qui ne durent souvent pas des décennies. Mais cette erreur est appelée « erreur post-hoc ». C'est comme une erreur liée à la corrélation. Cette blague, dit Org Men, son médecin lui a demandé d'arrêter de fumer et un autre vieil homme a dit : Oh ne fais pas ça. Un couple de mes amis vient de fumer et ils meurent. C'est une drôle de façon de dire que les mourants n' rien à voir avec l'arrêt de fumer, mais ils se sont produits après le quiz. Beaucoup de cas réels, un événement se produit complètement non phosphorylé, pas motivé par quoi que ce soit. Mais les gens ont deviné que c' était à cause d'un autre événement qui se produit avec le fameux boîtier de notre bracelet hologramme équilibré est devenu une crête mondiale entre 2007-12, des millions de dollars ont été dépensés. car les gens, y compris les sportifs, visaient le produit à améliorer leur capacité athlétique. Plus tard, des essais randomisés en double aveugle ont révélé qu' il n'y avait aucune relation entre le port de ces bracelets et les capacités athlétiques dans tous les athlètes qui s'entraînaient, gens essayaient de perdre du poids et aller mieux, plus athlétique, et il s' améliorait. Cela n'avait rien à voir avec le port de cette lutte. Mais c'est arrivé parce que les gens pensaient que le prix de ces seins mène et que Dieu était meilleur. C'était donc la causalité, la corrélation de Paul. Un autre cas de deux événements se produisant en même temps l'un à l'autre. En 1990, 30 adolescents américains qui jouaient fréquemment à qui jouaient fréquemment un certain jeu vidéo se sont suicidés. Cela a créé une alarme à l'échelle nationale, pensant que les jeux vidéo étaient à l'origine du suicide. Mais une enquête plus approfondie a révélé que taux de suicide chez les adolescents était 12 pour 100 000 alors que millions de garnitures jouaient régulièrement au jeu. Ainsi, 360 personnes étaient statistiquement sujettes à se suicider chez les personnes qui ont joué le jeu. redimensionnement de Tertius n'était pas un grand nombre. Ce genre de choses amène quelqu'un à penser que le suicide était dû à la porte. Encore une fois, une fausse causalité parce que ces deux événements se produisent en même temps. Toutes sortes d'entreprises affirment toutes sortes de corrélations entre leur amélioration générale des accidents, mais il ne s'agit pas de décennies. L'entreprise dit que c'est un shampooing qui mène à la tête. Cependant, la réalité pourrait être que les gens choisiraient ses cheveux en utilisant le shampooing en suggérant d'abord montrer la causalité inverse. produit diététique affirme comment il est utilisé Lauren le mouillé, mais les personnes qui utilisent le produit feraient dix autres choses comme faire de l'exercice, manger moins. Ceux-ci sont à l'origine de la perte de poids et non de mauvais produit. La compagnie de bière affirme que la bière améliore sa maladie. Mais il ne pourrait y avoir aucune relation , car de plus en plus de gens en bonne santé pourraient boire de la bière, donc ils ont déjà une amère dure. Mais cette causalité qu' ils prétendent parce que ce n'est peut-être qu'une folie fâcheuse. Un autre facteur important lié à corrélation est que l' affinité est présumée à tort que les pharmaciens de corrélation au-delà des données avec lesquelles elle a été établie. Par exemple, avec la pluie croissante, maïs grandit, mais au-delà d'un certain point, il devient plus court. Une fois encore. Sauvegarder les données jusqu'à un certain pouce de pluie, alors cela devrait se terminer. Mais c'est parce qu'en cas d'inondation, tout peut être détruit. De même, l'éducation est une corrélation positive avec le gain, mais jusqu'à un certain point, peut-être jusqu'à une maîtrise parce que les doctorats, moins que cette corrélation ne soit pas Judy 5 bits. De même, le bonheur des gens lui manque pour augmenter avec l' augmentation de l'argent. Mais jusqu'à un certain point. Et après cela, il se peut que cela ne change pas beaucoup ou il a peut-être diminué. C'est le cas alors des personnes les plus riches qui auraient été les personnes les plus heureuses du monde. Mais ce n'est pas le cas en même temps, si c'est le rapport de quelqu'un , je serais vraiment content. Donc, au départ, avec l' augmentation de l'argent, le bonheur rendait fou, les gens l'ont découvert. Mais après un certain niveau qui a changé en 19, assez significatif. Encore une fois, la relation , la corrélation ou la causalité peuvent exister jusqu'à un certain point qui sont vérifiés au-delà de cela, elle ne devrait pas être portée à cinq maturité. 8. 7 Statistique: Corrélation de statut. Les chiffres statistiques sont utilisés par les journalistes, les annonceurs, les soi-disant experts, les vendeurs et autres. Souvent, envoyez des messages et manipulez les gens. Ce processus est appelé corrélation de statut. Voici un exempté. Vous verriez des annonceurs dans les magasins à partir de 50%, 20 ventes sur nuages. Beaucoup peuvent penser qu'il s'agit d'un rabais total de 70 %. Mais en réalité, c'est la première dette de 50 % sur le solde, 50 % et les autres 20 % du chiffre d'affaires total s'élèvent à 50 % plus 20  % de 50 %, soit 10 %. Donc, 60 % croient qu'ils disent au total 60 % de vente. Cela aura moins d'impact. C'est pourquoi ils disent 50 % plus 2 %. Il le verra tout le temps. Ce sont deux qui manipulent ceux des gens. De même, les journalistes rapporteront qu' en une journée est fermée dans une ville ou dans un État, une telle perte économique. Ces chiffres sont toujours calculés en fonction toutes les activités économiques possibles qui peuvent éventuellement se produire en une journée, ce qui n'arrive jamais. Plus important encore, lorsqu' un jour sera fermé, la plupart de ces activités économiques seront transférées au lendemain. En fait, ils ont un impact beaucoup moins important. Mais les journalistes aimeraient vous intéresser à leurs nouvelles. C'est pourquoi ils donnent un si grand doigt pour que plus de gens lisent des nouvelles, nouvelles comme de grandes entreprises, ils n'ont pas l'intention de vous donner des informations. Les gens additionnent souvent notre âge Cindy, ils existent très bien, ça change. Par exemple, ils affirment que le coût du matériel a augmenté de 5 %, jamais de 7 %, les services publics de 13 % et le transport de 15 %. Le coût total est donc de 40 % en bits. bizarre, on peut juste y penser. On dirait que peut-être beaucoup de gens ne le font pas, mais les gens le font. Il ne s'agit pas d'un cas de corrélation de statut. Si vous réduisez le coût, vous le verrez. Par exemple, supposons que les 60 % passés du coût étaient matériels, 30 % de main-d'œuvre et cinq personnes , et 5 % de transport. Ces hausses de coûts de 5713, 15 %, augmentent essentiellement les coûts globaux de 6,5 %, un montant dérisoire. Mais très peu de gens vont le voir. Et nous verrons que l'impact total de l' augmentation des coûts explique 5 %. Les entreprises, en particulier les sociétés de conseil ou de services, constatent souvent qu'elles possèdent plus de 200 ans d' expérience combinée dans leur gestion. Il y a étrangement du papier avec des négationnistes, chaque expérience devient 200 ans d'expérience combinée. Cela ne veut rien dire. Il s'agit simplement d'une corrélation de statut montrant une figure artificiellement et complètement arbitraire qui donne l'impression qu'une entreprise a beaucoup d'expérience. Si une entreprise réduit le salaire des employés de 25 % 1 an et l'augmente de 25 % l'année prochaine. Il peut prétendre qu' il a donné aux gens là-bas et le salaire, l'étudiant en baisse de 6,25 %. Encore une fois, c'est une autre façon de rester discriminatoire. Le bénéfice net d'une entreprise est passé de 2 % l'an dernier, à 4 % cette année. On peut affirmer que le bénéfice a augmenté de deux points de pourcentage, mais cela ne semble pas bon. La meilleure façon de prétendre est que le taux de bouillon a augmenté de 102 % pour atteindre 4 %. Cela aura un impact beaucoup plus important. Mais les gens le font, les font. Une autre façon de statuer pour laisser la maladie un autre type de calcul à venir. Un doigt. Par exemple, le revenu du ménage peut être calculé en divisant le revenu total par le nombre de ménages. C'est une façon de calculer ou de multiplier le revenu moyen par habitant par le nombre moyen de personnes dans un ménage. Le deuxième chiffre donnera toujours un avantage élevé. Certaines personnes l'utilisent. Donc, si vous souhaitez montrer un faible revenu du ménage, utilisez le premier calcul si vous le souhaitez. Le revenu haut de gamme des ménages est donc le deuxième calcul. Qu'est-ce qui est légitime ? En 2021 ? médian des ménages en 168 milliers de dollars américains. La même année, le revenu médian par habitant était de 37 000$. taille moyenne du ménage était de 2,6. Si vous multipliez 37 par 2,6, vous obtiendrez 96 000$, ce qui est beaucoup plus élevé que les 68 mille. Si la moyenne est utilisée dans un revenu moyen. revenu moyen des ménages augmentera encore plus haut. façon dont vous calculez déterminera le revenu du ménage. Des personnes qui ont des choses différentes à l'ordre du jour. Nous ferons différents calculs. Prenons cet exemple de la façon dont l' indice des prix à la consommation peut être calculé différemment pour donner des chiffres différents, coûts du lait et du pain, 1.20,5 l'année dernière. Cette année, les deux génèrent 1,10$. calcul différent peut indiquer indice de prix différent et dépend votre agenda et vous calculerez ainsi. Lorsque la dernière année est utilisée comme année de référence, le lait est devenu 50 % du coût de l'année dernière. Et la marque devient 100 % du coût de l'année dernière. La moyenne est donc de 125 %, soit une augmentation de vingt-cinq pour cent. Encore une fois, si vous utilisez l' année en cours comme année de référence, qui est également mesurée dans celle-ci. L'année de la classe moyenne était de 200 % et le pain était de 50 %. Le prix moyen de l'année dernière était donc de 125 %. Cette année est l'année de référence. C'est 100 %. Celui-ci montrera donc que le prix de l'année dernière a été supérieur de vingt-cinq pour cent. Celui-ci ne montrerait pas que les prix baissent. Si vous utilisez une moyenne géométrique , elle n'affichera aucun changement. Selon la façon dont vous calculez l'indice des prix , le 1er mai montre une augmentation du prix. Cela peut maintenant montrer une baisse du prix. Et certains calculs peuvent ne montrer aucun changement dans les oiseaux, bien que les prix soient exactement les mêmes dans les trois cas. La figure de centile est une autre chose intéressante lorsque l'on examine la figure du centile, par exemple, les rangs d'élèves d'une classe de 399 centiles sont les trois premiers élèves. C'est ce qui a fait ça. 1 % des 300 étudiants, 98 % Dynes sont les trois prochains étudiants, et ainsi de suite. Il y a une grande différence entre le 99e centile, le 90e centile, comme vous pouvez constater à partir de cette distribution normale, qui est généralement le cas pour une grande partie de la figure. Mais à mesure que les rangs se ferment au milieu, il n'y a pratiquement aucune différence entre 14, 60 %. Phrase. On peut voir dans les côtés extrêmes, les percentiles sont étirés. Il y a une grande différence entre 9919, où elle se trouve, la différence entre 4060 est beaucoup plus faible. Le fournisseur a dit qu'il a augmenté prix de 20% parce que ce coût a augmenté de 20% dans le processus en a bien augmenté son dollar absolu. Ce sont toutes des façons différentes de voir à quel point de vue statistique est différent. Phrase inférieure à la moyenne. Le 1er mai dites, eh bien, Google change votre personne mourant de 40 à 60 ans, alors qu'elle changera de 1999, alors que les 90 à 99 sont beaucoup plus grands. De même, en augmentant proportionnellement prix en fonction du coût, on peut facilement augmenter leurs dollars réels. Ce sont toutes différentes façons de rejoindre Stanford. 9. 8 données en Half: Disposer de données pertinentes. Lorsque les gens ne peuvent pas prouver quelque chose directement, ils utilisent des données à moitié pertinentes comme proxy pour le prouver. Attention. Il est difficile de prouver l' efficacité du dentifrice. Les entreprises montrent comment leurs produits détruisent les germes en laboratoire. Ces deux conditions ne sont pas les mêmes. Ce qui fonctionne en laboratoire peut ne pas fonctionner à l'intérieur de notre bouche. De plus, il est souvent difficile savoir quel type de bactéries ils tuent en laboratoire. S'agit-il du même type de bactéries que nous avons dans la bouche ? Vous seriez surpris. On ne sait pas non plus quel type de dosage l'utilisation de la terre. S'agit-il d'une équipe complète pour seulement mettre à l'échelle quelques bactéries ? Aucune de ces informations n'est très claire. Mais même à ce moment-là, ils prétendent que leur publicité pour avancer est très efficace pour tuer les bactéries dans le LRMR. C'est l'utilisation de données à moitié pertinentes. Une entreprise de réfrigérateurs peut annoncer qu'elle conserve produit 50 % de frais supplémentaires. Vous le dites tout le temps, mais plus frais que quoi ? Un autre réfrigérateur. Conservez les aliments dans un liquide de refroidissement, n'est-ce pas ? l'ombre, ou simplement de la nourriture vivante sous la chaleur et l'humidité estivales. Vous serez surpris de savoir sur quoi ces 50 % sont calculés. Le syndicat affirme que 85 % des employés sont mécontents de la direction. Ils utilisent des données non pertinentes. Pour obtenir un dossier solide, Union collecte souvent tous les complexes possibles, y compris ceux qui sont très triviaux tels que pour la mise collecte souvent tous les complexes possibles, en réseau, lumières doivent être remplacées. Ainsi, et additionnez-les pour dire que quatre-vingt-cinq pour cent des employés se plaignent de la direction, ce qui n'est pas vrai. 100 % des citoyens d'un pays se plaignent de quelque chose pendant un certain temps. Mais il est injustifiable de conclure qu' une centaine de citoyens sont mécontents de leur gouvernement. Encore une fois, il utilisera des détails pertinents. Parfois, les données pertinentes deviennent extrêmement importantes. grippe espagnole en est un exemple. En 1918, l'épidémie de H1N1 est appelée grippe espagnole. Il est intéressant de noter que la grippe n'est ni originaire Espagne ni plus répandue en Espagne. Seulement parce qu'il était davantage couvert par les journaux espagnols. Parce qu'ils n'étaient pas directement engagés dans la Première Guerre mondiale. Et tous les autres pays d'Europe apprennent à mener une guerre innée. raison du fait qu'il était dans les journaux espagnols. La grippe est appelée espagnole. Les gouvernements de tous les pays sont des utilisateurs notoires de détails à moitié pertinents. Voici un exemple. Au cours de la guerre espagnole américaine en 1898, le taux de mortalité dans la Marine était de 94 000 centres. Le taux de mortalité à New York était à ce moment-là de 16 000 personnes. Les recruteurs de la Marine utilisent ce chiffre pour comparer et affirmer qu'il a été souffert d'être dans la Marine. Dan serait sur 82 personnes induites en erreur pour rejoindre la Marine. De toute évidence, le taux de mortalité des personnes âgées et malades à New York a été comparé à celui des jeunes et des personnes fortes qui étaient en train de mourir. Ils ne sont pas comparables, ils ne sont pas du tout pertinents. données pertinentes ont souvent influencé la prise de décisions. Par exemple, de 1950 à l'année est considérée plus comme l'année de la pire épidémie de poliomyélite chez nous. L'enquête a révélé que le devoir est plus sensibilisé, plus de cas où un diagnostic et un signalement et plus grand nombre de personnes se sont manifestées en raison de l'aide financière fédérale. De plus, l'année a eu plus d'enfants sensibles à ce groupe d'âge. Tous ces chiffres ont contribué à un nombre plus élevé de cas, mais le chiffre mort, qui est une meilleure mesure n'est pas hors de l'ordinaire. 1952, a été célèbre comme l'année de l' épidémie de poliomyélite aux États-Unis. Mais ils étaient tous basés sur des données à moitié aléatoires. En réalité, c'est comme n'importe quel autre district qui enregistre et signale que plus de crimes sont perçus comme plus sujets à la criminalité uniquement parce qu'ils signalent davantage que certains autres districts qui ne le sont pas reporting. Les politiciens de tous les pays des utilisateurs les plus prolifiques de données à moitié pertinentes. Parcourez toutes les données pour trouver des statistiques qui correspondent indirectement à leurs inanités. Avant d'arriver au pouvoir, certains districts ont déclaré que le faible revenu et d'autres avaient des revenus élevés. Après Bauer, certains districts ajoutent également des revenus élevés et d' autres ont un faible revenu. Les politiciens choisiront un district à faible revenu avant le pouvoir, et le district à revenu élevé après pouvoir pour montrer que leur gouvernance a augmenté les revenus. Alors que l'opposition va faire le contraire. Ils le feront dans un district à revenu élevé à faible revenu après avoir montré que le gouvernement a provoqué une baisse des revenus. C'est ainsi que les gens utilisent des données à moitié pertinentes pour faire valoir tous les points. Mais il n'est pas toujours possible de parcourir toutes les données. Mais sachez que toutes les données présentées dans les médias, les hommes, partout où les gens essaient d'influencer notre décision. y a de fortes chances qu'ils utilisent des données à moitié pertinentes pour ce faire. Nous connaissons tous les photos avant et après. Les photos avant et après montrent comment certaines pilules ont permis à quelqu'un de perdre du poids. Mais les annonceurs ne mentionnent pas toutes les autres forces la personne fait pour perdre du poids. Ce ne sont pas seulement les pilules qui causent cette perte de poids et qui sont utilisées avec des données à moitié pertinentes. Par conséquent, perdre du poids n'est pas totalement hors de propos de leur utilisation d'un produit. Cela pourrait même perdre du poids sans utiliser ce produit s'ils font de l'exercice, mangent moins et ont un mode de vie sain. Mon père sème que la moitié des données pertinentes sont utilisées chez les amputés c'est-à-dire une amélioration pour faire un point d'honneur pour influencer nos décisions. 10. 9 Vérifier l'échelle: Vérifiez la balance. Vérifiez toujours attentivement l' échelle lorsque vous examinez les données présentées dans un graphique ou un diagramme linéaire. L'une des façons les plus courantes de l'utiliser est de l'exister ou de diminuer le changement de valeurs consiste à manipuler l'échelle. Il suffit de rester en pourcentage d' augmentation du salaire peut être exacerbée de façon spectaculaire en le montrant à Lake. Et c'est le graphique inférieur qui montre une stagnation comme dans la charge supérieure. Les données Sam présentées à différentes échelles sont différentes. Et juste en regardant ce graphique linéaire, 1er mai arrive à des conclusions très différentes sans entrer dans l' ampleur des changements qui se produisent. Tant d'annonceurs dissolvent les temps, jouent avec l'échelle pour accentuer les résultats. Parce qu'ils savent que la moitié des gens seraient rustiques, c'est cette échelle. Et l'autre moitié serait tellement influencée par la représentation visuelle dramatique. Parce que la représentation visuelle est si puissante qu'ils vont ignorer cette échelle. L'objectif des annonceurs d' accentuer la différence serait servi. Les barres sont cassées dans un graphique à barres pour afficher les changements à la fois vers le haut et vers le bas. Prenons cet exemple. En 1995, les accidents de la route étaient de 7 800. En 2005, les accidents de la route ont dépassé 7 728. Mais lorsqu'il est tracé dans un graphique à barres cassé qui est cassé au niveau 7680, ce petit changement de 80, ni les accidents ne s'accentuent. Alors les gens regardent ça et disent : Oh mon Dieu, 2005 est plein d'acides inférieurs. Mais c'est simplement comme ça que les graphiques cassés à l'échelle sont utilisés pour manipuler les décisions. 11. 10 Comparaison par image: Comparaison par images. Comparaison par image. Beaucoup de temps, les gens exagèrent intentionnellement et non intentionnellement ou diminuent les données. records de grime aux États-Unis en 199098 comparés par image et réduction, semblaient dramatiques. En effet, même si la hauteur des criminels cette image est proportionnelle au volume ou non. En réalité, cette rime est passée de 15 millions à 9 millions. Mais il semble beaucoup plus bas car le volume du petit criminel est beaucoup plus petit. Il semble que la réduction de la criminalité ait été équitable. De même, la production indienne de mangue. Par rapport à la Chine. Par la hauteur de la mangue, il semble beaucoup plus haut que vraiment. La Chine s'élevait à 4,5 millions de tonnes. L'Inde est de dix-huit millions de dix, mais le volume de la plus grosse mangue est beaucoup plus élevé que quatre dixièmes, est plus proche de 1015 tonnes. C'est celui qui peut donner l'impression qu' une figure est beaucoup plus élevée en montrant deux images. De même, les ventes de véhicules automobiles en Inde sont passées de 3,2 millions en 2014 à 4,4 millions en 2019, seulement trente-sept pour cent. Mais lorsque deux voitures le montrent, la seconde est tolérante à 37 % par rapport à la première. En regardant cela, les gens auraient l'impression que les ventes de voitures augmentent beaucoup plus en 2018. Cette astuce est couramment utilisée par les annonceurs et propagandistes dont l'objectif est d'induire les spectateurs en erreur. Parce qu'une fois que cette impression est l'esprit des gens, les deux impressions de mangues de la diapositive précédente sont deux photos de criminels dans la première diapositive. Et voici deux photos de voitures. Une sorte de décide qu'elle augmente est beaucoup plus élevée même si elle est très petite.