Transcription
1. Introduction: Ce cours montre comment les statistiques maladie cachent
la vérité afin manipuler nos
décisions et comment détecter ces astuces
pour prendre de meilleures décisions. Bonjour. Je suis un expert en
sciences cognitives avec plus de 25 ans d'expérience aux États-Unis, en Inde, au Moyen-Orient
et en Afrique du Sud. Nous vivons à l'ère de l'information. Nous devons utiliser les données pour
prendre toutes les décisions. Mais pour les spécialistes du marketing, les
politiciens des médias , pour tous les
hommes d'affaires, chacun cache une vraie vérité derrière statistiques
soigneusement construites de sorte que les données qu'ils
présentent des sirops, leur propre objectif ou ordre du jour. Que pouvons-nous faire ? Eh bien, c'est assez simple. Nous devons apprendre les astuces
statistiques les gens utilisent pour tromper que
les gens utilisent pour tromper les
autres afin de pouvoir les attraper dans l'acte et prendre de
meilleures décisions. Dans ce cours, vous
découvrirez les dix astuces
statistiques les plus courantes par les spécialistes du marketing, les
médias, les spin docteurs ,
les politiciens, les entreprises et d'autres personnes pour
cacher les données à la vue. Ainsi, à la fin
de ce cours, vous serez en mesure de prendre des
décisions bien meilleures axées sur
les données dans des
situations personnelles et professionnelles en toute confiance. Qui peut suivre cette classe
12, à peu près tout le monde, débutants aux professionnels, en
passant les chefs d'entreprise
jusqu'aux étudiants. Tout le monde
bénéficiera de ce cours. À la fin de ce
cours, bien sûr, il y a un projet
qui consiste étudier des
situations pratiques minces où les gens généralement de mauvaises
décisions en raison des astuces statistiques
discutées dans La classe. L'objectif des
élèves est de détecter d'abord l'astuce applicable,
puis trouver la bonne façon de
prendre des décisions. Je suppose que c'est à peu près tout. J'ai hâte de
vous voir en classe et tous, oui, n'oubliez pas de mettre vos commentaires et
commentaires à la fin.
2. 1 Échantillonnage de préjugés: Biais d'échantillonnage, car les statistiques peuvent
parfois être un peu lourdes. Commençons donc par une ambiance
plus légère avec un dessin animé. Le gars a donc créé un aliment pour
oiseaux, qui est un véhicule. Et il dit, après avoir échantillonné chaque oiseau qui fréquente le trottoir à l'extérieur de
ce bâtiment, nous avons conclu que ce que oiseaux aimaient vraiment ses véhicules. Cela signifie que pour
décider à quoi aiment les oiseaux, tout ce qu'il a fait, c'est
regarder Bard. Les trottoirs mangeaient des bagels parce que des bagels se font
jeter hors de ses bâtiments. C'est une façon drôle de regarder. C'était que l'échantillonnage peut mener
à une conclusion biaisée. La statistique consiste à
collecter un petit nombre de candidats provenant d'une
grande population est un petit nombre de
candidats s'appelle échantillon. Et décider de
l'importante population se basant sur la vérification
avec l'échantillon. L'échantillon est représentatif
de la population, les inclusions amusantes sont bonnes. Si l'échantillon est biaisé comme l'image,
il y a
plus de points verts que rouges dans l'échantillon par rapport
à la population. Ensuite, notre conclusion basée sur
un échantillon n'est pas non plus valide. Beaucoup de temps dans les enquêtes sur la vie
réelle les
conclusions ne sont pas valides
parce que les échantillons sont biaisés. Par exemple, en fait, les diplômés
collégiaux
affichent toujours un salaire plus élevé que le salaire réel de ces
diplômés parce que les gens retirent leur
salaire à la suite de la réponse. Parfois, avant l'automne. Selon
les enquêtes, les statisticiens prédisent que quelqu'un va gagner, quelqu'un d'autre gagne
avec un gros glissement de terrain, comme c'était le cas
lors des élections de 1932. Parce que l'échantillonnage était biaisé. Lors des sondages électoraux de 2012, il a été mené par une ligne fixe, ce qui prédisait qu'
Obama perdrait. Mais Obama a gagné parce que de
nombreux officiers, partisans utilisaient en fait téléphone
cellulaire et ils
seront donc désignés par cela. Favorise une enquête. Il est économisé que 80 % des Britanniques aiment les véhicules
électriques. La première question
que vous devriez poser est de savoir quelle pièce, les
Britanniques. Parce que si l'échantillon est biaisé et provient d'une partie
du peuple britannique, il est représentatif
de cette section plutôt que de la population
britannique morte. Examinons maintenant
comment se produit le biais d'échantillonnage. Commençons par le cas
des étudiants de l'Ivy League. Samedi moyen. déclaration publiée par une revue Selon une déclaration publiée par une revue, le salaire moyen
du
MBA Ivy League après cinq ans d'
obtention du diplôme est de 300 000$. La question est de savoir dans quelle mesure une telle déclaration
est-elle exacte ? Maintenant, la déclaration peut être
très erronée et trompeuse. Pourquoi ? Parce qu'ils ne mentionnent
pas la taille de l'échantillon. Ils ne mentionnent pas que s'ils ont eu un contact avec tous les
diplômés parmi lesquels choisir. Ils ne
mentionnent pas non plus si la liste des candidats qui ont répondu à l'endroit où
elle est sélectionnée au hasard, ou s'ils ont simplement pris les réponses des personnes
qui veulent répondre. Il ne
parle pas non plus du nombre d' entre eux
qui répondent réellement à ces questions. Si on leur pose
cette question à 50 personnes et cinq répondaient. S'ils font la moyenne de ces cinq dollars et disent
qu'il s'agit de
milliers de dollars, c'est un cas fortement biaisé parce que cinq femmes
ne sont pas représentatives. Cette question suivante est seules les personnes avec
sa santé mentale
ont-elles répondu, ce qui est très probablement le cas. Était-ce un échantillon représentatif ? Comme vous pouvez le constater, ils ont
tellement de questions et
la plupart des sondages évitent soigneusement répondre à
l'une de ces questions. Vous ne pouvez donc pas faire confiance à une conclusion d'enquête
salariale. Ainsi, les gens peuvent manipuler
un échantillon ou simplement être bâclé, ne
sont pas méthodiquement corrects
lors de la collecte de l'échantillon. Et par conséquent, malheureusement, la
signification de ce foyer n'
est pas digne de confiance. 60 % des Indiens urbains préfèrent
l'enseignement de l'ingénierie, dont 60 %, 80 % des Indiens
préféraient en effet 13, dont
80 % des Indiens. Le résultat d'une étude visant à déformer échantillon doit être
représentatif et aléatoire. autres termes, lors de la
collecte de l'échantillon, tous les candidats devraient avoir les mêmes chances
d'être sélectionnés. Bien des fois. Ce n'est pas le cas. Il y a une
bataille constante pour réduire le biais
d'échantillonnage en rendant
l'échantillonnage aléatoire. Le biais d'échantillonnage est toujours là. Si nous voyons des affirmations comme
celle-ci selon lesquelles 60 % des
Indiens urbains préfèrent l'enseignement de
l'
ingénierie , il devrait y avoir 60 %
de personnes. Ce ne serait pas 60 % des
personnes qu'ils veulent demander. Pas 60 % de rabais sur notre
lot, les Indiens. Lorsque l'échantillonnage aléatoire n'est pas possible, chronophage
ou coûteux, c'est-à-dire un échantillonnage aléatoire, ce qui signifie chaque candidat aura les mêmes chances d'être sélectionné si cela n'
est pas possible. . La meilleure chose suivante est l'échantillonnage aléatoire
stratifié, où vous divisez
la population en plusieurs groupes en fonction de la
prévalence de ce groupe. Donc, si une population de 50 % blanche, 30 % noire, 20 % asiatique, vous prélevez un certain nombre d' échantillons provenant de la communauté asiatique, un certain nombre d'échantillons
provenant de la communauté noire et un certain nombre
d'échantillons provenant de communautés
blanches proportionnellement
à leur chiffre Parson. Et cela peut impliquer une violation. Et c'est un stratifié. Les groupes peuvent être
basés sur le revenu, l'éducation, l'appartenance ethnique
ou autre chose. Mais si votre connaissance de
la proportion est erronée, l'échantillonnage, nous serions
également biaisés. Par exemple, si un
diplômé classe 30 % des femmes est de 70 % d'hommes, si la taille de votre échantillon est
calculée à dix, vous pouvez
sélectionner au hasard trois parmi les étudiantes et
sept parmi les étudiantes. Ce ne serait pas un cas d'échantillonnage aléatoire
stratifié. Cela serait quelque peu utilisable. N'oubliez pas que les sondages et commencé les résultats
sont quelque peu biaisés. Le biais provient de
deux sources différentes. Tout d'abord, ce sont les étapes que
nous faisons dans l'entretien. âge, l'éducation, l'origine ethnique et l'expérience du personnel
interrogé ont fortement influencé
le résultat de l'enquête. Dans un cas, il a été constaté
que, selon le personnel
blanc ou noir effectuait l'entrevue avec les communautés
noires, les résultats étaient
assez différents. La deuxième source de biais est celle
des personnes qui ont une tendance plus élevée à être sélectionnées comme échantillons
sont candidats. Généralement, les personnes
ayant plus d'argent, une meilleure éducation, une apparence
bêta, plus d'informations et de vigilance. Les comportements plus conventionnels
et les habitudes acceptables sont plus sélectionnés comme candidats
pour un entretien ou un échantillon. Et par conséquent,
débiaisez l'obstacle. **** et les résultats de l'enquête.
3. 2 Taille d'échantillon: Taille de l'échantillon. Dans de nombreux cas, les gens n'
utilisent pas une
taille d'échantillon suffisamment grande pour en tirer une conclusion. Par exemple, j'entends que des études sur les revendications
publicitaires montrent qu' ici, je vais réduire ici la
faute pour 80% des utilisateurs. Mais dans quelle mesure
ces déclarations sont-elles crédibles ? Certains annonceurs
fournissent des petits caractères qui mentionnent une
petite taille d'échantillon, mais d'autres ne le font même pas. Malheureusement, pour la publicité
commerciale, il n'existe aucune réglementation
qui stipule que certaines
tailles d'échantillons et certainement des méthodologies doivent être utilisées. Comme c'est le cas pour les produits
pharmaceutiques. Par conséquent, les gens réclament toutes sortes de choses en se basant sur toutes
sortes d'échantillons. Ces résultats sont principalement
basés sur une petite taille d'échantillon. Et par conséquent, le bidon peut être
dû à moins de chances. Ou bien, les images montrent quelques
cas de leur échantillon pour montrer un bon résultat afin qu'ils puissent faire une réclamation
dans une publicité. Pourtant, ils sont montrés tout le temps. Si vous lancez une pièce dix
fois et que vous obtenez huit têtes, vous ne pouvez pas prétendre que l'étude montre que la chance d'obtenir des
têtes dans le lancer est de 80 %. Vous devez avoir un grand
nombre de tâches pour déterminer quelles sont les chances d'obtenir des têtes
et celles qui seront de 50%. De même, pour
établir une réclamation, vous devez avoir une taille d'échantillon
suffisamment grande. La taille de l'échantillon
dépendra variable des résultats et de la confiance que vous
devez être dans votre réclamation. Disons que le risque
de cas graves dus à une fièvre vitale
n'est que de 10% chez les enfants. Vous avez sélectionné
1 000 enfants avec le bureau de la fièvre vitale. L'efficacité d'un médicament. S'agit-il d'une taille d'échantillon
suffisamment grande ? Vous en avez sélectionné
cent, dix cents. Vous étiez heureux que la taille
de l'échantillon soit de 100000. Mais en réalité, 90 % de
ces enfants vont s'améliorer. Même sans le médicament. En fait, vous
testez le médicament sur seulement 10 % ou 100 enfants qui ont besoin de ce médicament parce
qu'il s'agirait de l'inductance
des cas graves. Il s'agit en fait d'une taille
d'échantillon plus petite que ce que vous pensiez. La taille réelle de
l'échantillon
est
un domaine numérique par intervalle de confiance et par
écart type au cas par cas. Au sein de la population. Peu de facteurs sont importants estimer la taille
de l'échantillon nécessaire. Leur niveau de confiance, leur intervalle de
confiance, leur score Z, qui dépend du niveau de
confiance, écart type
et de la taille de l'échantillon, sont
calculés en fonction de cela. Et je n'
entrerai pas beaucoup de détails, mais il est important que nous
en soyons conscients. Il existe certaines façons de
calculer la taille de l'échantillon. niveau
de confiance est la mesure selon laquelle vous répéterez l'
expérience 100 fois,
combien de fois vous
obtiendrez un résultat similaire. Il est généralement utilisé car quatre-vingt-quinze pour cent
sont la plupart des cas. L'intervalle de confiance
est le degré d'ADR. Il est généralement utilisé
comme plus moins 5 %. Le score Z est une mesure du nombre de zones d'
écart-type par rapport à la moyenne en fonction du
niveau de confiance que vous avez sélectionné Il existe un score Z pour l'écart type est
le degré de variabilité. Si vous ne savez
rien, vous pouvez utiliser 0,5. En mettant tout cela, il y a un calcul standard qui est la racine
carrée du score z multiplié
par l'écart type, multiplié par un
écart type moins divisé par un
intervalle de confiance carré. Avec un
niveau de confiance de 95 % et un intervalle de 5 %, vous obtenez une
taille d'échantillon de timbre de 85 %. Donc, 4,5 écarts types. Une taille d'échantillon de 400 à 500 est donc généralement suffisante
pour la plupart des cas. détermination de la taille de l'échantillon
est une étape critique de toute enquête statistique
ou étude statistique. Parce que si cela a mal fait, ils entrent dans l'étude
ou les enquêtes erronées. Il y a eu des
cas colossaux de ps. Dans les années 50. Une étude sur le vaccin contre la poliomyélite chez 450
enfants ont été vaccinés et 680 ont été
conservés sans
vaccin dans le cadre d' une épidémie de poliomyélite, aucun des enfants n'a
contracté la poliomyélite parce que le taux de contraction
était juste moins de 1 %. En fait, la taille de l'échantillon nécessaire comprise entre 38 pour 1040
000 enfants. Ils pourraient donc s'attendre à ce
que 300 à 400 cas de poliomyélite soient la taille de l'échantillon
efficace pour tester le vaccin. Il y avait un moyen, très mal. Cela a sélectionné quatre cent cinquante
et six cents, environ 1100 enfants où ils ont besoin de 30 000
à 40 000 enfants. L'estimation de la taille de l'échantillon
et l'utilisation de la taille de l'échantillon de la
bonne valeur sont donc de la
bonne valeur sont extrêmement importantes pour
toutes les études statistiques. Mais malheureusement, dans la plupart des nous voyons
pour les annonceurs, pour différents
produits ou même pour les politiciens, les médias et autres. Tous ces gars, presque tous ces
gars ne sont pas en intérieur, utilisent une taille
d'échantillon suffisante et le résultat. Aucune de ces
réclamations n'est gérée.
4. 3 petits chiffres: De petits chiffres. Commençons par être d'accord. Une ville possède deux hôpitaux, l'un petit et l'autre grand. Un des deux
hôpitaux en un mois, 60 % des bébés sont nés. Alors qu'il est généralement de 50 %. Lequel s'agit-il ? Le petit ou le grand hôpital ? La réponse est le petit hôpital. Parce que tout comme une
petite taille d'échantillon, cas
extrêmes ou inhabituels. Dans ce cas, 60 %. Les garçons sont inhabituels, 50%, Les cas inhabituels habituels sont
observés dans de petites tailles d'échantillons, sont, dans ce cas,
un petit hôpital. Lors de l'enquête sur les cas de cancers du rein dans plus de
3 000 comtés américains, il a été constaté que la
plus forte incidence se
produisait petits comtés. Fait intéressant, il
a également été constaté que l'incidence la plus faible
a également été observée dans les petits comtés. Cela signifie que les comtés de petite taille et
moins peuplés ont eu à la fois l'incidence la plus élevée et
la plus faible. C'est le cas
des petits nombres. Et pourquoi cela se produit-il. Regardons un
très petit comté avec juste rester chez les adultes. Comme c'est le cas seulement chez les adultes, il est très probable que le
nano ait un cancer. Il affichera 0. Mais si une
seule personne est
annulée par hasard, elle affichera également une
incidence de 10 %, ce qui est très élevé. Cela signifie que si le compte est petit, y a de
fortes chances qu'il
soit épargné de nombreux cas. Et juste s'il y en a quelques-uns, il y aura des
cas d'incidence élevés. Les petits comtés
afficheront donc une incidence élevée et faible. Les petits districts
à faible population afficheront toujours des résultats
extrêmes. Là où, dans les grands districts, nous vivons dans
des cas
entiers
de population pour afficher des résultats plus
moyens. Une chaîne de supermarchés a
découvert que les petits magasins affichaient la fois le niveau le plus bas et le plus élevé par unité de surface et les
ventes par unité de surface. La taille de l'échantillon plus petite est plus susceptible de présenter des résultats extrêmes
en raison du caractère aléatoire. Et un échantillon plus large
représente mieux une population. C'est pourquoi nous entendons
ce que l'on appelle un grand nombre de
lois
dans les statistiques. Afin de tirer une conclusion,
vous ne pouvez dépendre que
de grands nombres et quand un grand nombre de choses
mortes doit se faire la moyenne. Maintenant, comment, en cas de petit nombre, les choses
obtiennent des résultats extrêmes ? Prenons un autre exemple. Imaginons les étudiants
qui ont encore 100 chambres avec cinq
étudiants chacun. Sur 500 étudiants au total, 25 ont obtenu un avantage lors de leur examen. Cela signifie que la plupart
des chambres comptent 0 % d'étudiants avec un
plus, car il
n'y a que 25 étudiants plus
et 100 chambres. Mais si une chambre vient de
gagner un étudiant plus, elle montrera 20 % de cas d' un étudiant plus un, divisé
par cinq, soit 20. La chambre a pour les étudiants
par hasard qu'elle
montrera 40% de cas d'un plus. Vous pouvez voir en raison du fait
que les pièces sont petites, n'importe quel chiffre sera exagéré. C'est ainsi que de petits nombres
existaient aux résultats. Et c'est notre loi en grand
nombre qui a besoin plus grand nombre pour en
tirer une conclusion.
5. 4 problème moyen: Problème moyen. une des
méthodes les plus courantes des statistiques est, c'est en tant que personne qui contient beaucoup
de données. La moyenne est probablement la statistique
récapitulative la plus couramment utilisée. Nous aimons résumer un grand nombre
de données en une seule figure. Et c'est la
popularité de la moyenne. Nous entendons des déclarations comme l'économie créera 20 000
emplois par mois. C'est un chiffre moyen. Pays, nous obtiendrons 20 pouces de précipitations et d'autres moyennes ici, augmentation de salaire moyenne de 10 % par an et ainsi de suite. Mais tous ces
chiffres moyens peuvent être vraiment trompeurs et ils peuvent cacher plus d'informations
que le spectacle. Par exemple, certains mois
peuvent ajouter 50 000 emplois, tandis que d'autres mois peuvent
ajouter Justin mille emplois. Donc, quelqu'un de 20 000 personnes
ne veut pas dire grand-chose. De même, certaines régions du
pays peuvent être inondées. Où peut-il y avoir de la
sécheresse dans d'autres parties ? Les précipitations moyennes de
20 pouces dans un pays
ne signifient donc rien. De même, le
salaire de certaines personnes peut doubler, alors que certains peuvent ne pas le
voir augmenter du tout. Une
augmentation de salaire moyenne de 10 % est donc absolument
inutile en ce
qui concerne l'
augmentation réelle des salaires des gens. On dit qu'il ne faut pas traverser une rivière s'il fait
en moyenne quatre pieds de profondeur. Parce que la rivière
peut être de 20 pieds de profondeur, ajoutez quelques visages à un ou deux pieds de profondeur à
d'autres endroits. Donc une moyenne pour une profondeur libre, ce qui signifie que si vous essayez de
traverser la rivière en pensant que ce
sera pour imprimer
en moyenne, un ivrogne. L'un des cas dramatiques du problème de l'utilisation de la moyenne a été ce que les scientifiques ont découvert
au cours des premières années de
suivi du réchauffement climatique. À ce moment-là, les scientifiques se
penchaient principalement sur l'augmentation
moyenne de la
température et essayaient de
mettre en corrélation le fait qu' avec les camps de filtration
ou de glace polaire, ils ont été surpris
de constater que même si la température moyenne
reste la même, plus qu'un plus grand nombre de calottes glaciaires polaires, nous sommes fondus d'
une année à l'autre. Plus tard, ils ont découvert que même si la moyenne reste la même, années avec les pics de
température élevés ont provoqué une
plus grande demande d'yeux. La moyenne n'a pas été très utile. De même, essayez
d'examiner deux cas où une personne boit une
bière tous les jours pendant 30 jours. C'est donc en
moyenne une bière par jour. Alors qu'une autre personne
ne boit aucune bière pendant 29 jours et le 30e jour, il boit 30 ans. Dans les deux cas, la moyenne
est d'une bière par jour, mais l'impact de la consommation de
bière sera beaucoup plus grave, serait fatal dans le second cas de
consommation de 30 bières par jour. De même, la moyenne peut
être vraiment trompeuse. Un autre cas célèbre de
problèmes avec les moyennes où en 1997
l'inondation de Grand Forks, la ville avait une digue de 51 pieds. niveau d'eau de
la rivière était supérieur à 49 pieds, ce qui était en moyenne. Mais à certains endroits
pendant une inondation, l'eau a atteint 53 pieds même si la moyenne
reste pour le dîner. Mais dans ces cas ou ces déplacements, l'eau a brisé la digue, provoquant du sang dans la ville. L'utilisation des moyennes
dépend des moyennes, car les moyennes des inondations dans la ville peuvent être
trompeuses à bien d'autres égards. Prenons le cas de l'espérance de vie
moyenne. Par exemple, sur 19 centaines, espérance de vie
moyenne
à la naissance était de 30 ans. Mais ces 32 ans ne veulent
vraiment rien dire. Cela ne veut pas dire que
tout le monde est mort à 32 ans. Beaucoup de régimes alimentaires à Bart, beaucoup de régimes de moins de cinq ans
meurent pendant la guerre. Mais ceux qui ont
survécu à tous ceux qui ont vécu jusqu'à 60
et 70 ans, tout comme aujourd'hui, la
moyenne est apparue à 32 ans, mais ce chiffre ne veut
vraiment rien dire. C'est pourquoi il
n'y a pas d'entreprise moyenne. n'y a pas de fluctuation moyenne
du marché boursier. n'y a pas de guerre moyenne, pas de moyenne ni d'épidémie, ni de campagne de marketing moyenne, ni de vente moyenne de livres. Dans la plupart des cas, la distribution
peut être très faussée. Un
monarque moyen signifie n'importe quoi. Par exemple, sur le côté gauche, vous voyez qu'il s'agit d'une inclinaison négative de la distribution
où la preuve est déplacée vers la gauche
et la droite, vous pouvez voir une asymétrie positive où la moyenne est Je suis passé
à la lumière parce que c'est le cas. En détail vers la droite, uniquement dans le cas des moyennes de distribution normale centrale au centre. C'est donc
quelque peu significatif, mais dans tous les cas réels, la
distribution des valeurs est
toujours faussée. Et par conséquent, moyenne ne donne
pas beaucoup de sens utile. Dans le contexte du résumé
statistique, trois types de
moyennes sont utilisés. On les appelle moyenne,
médiane et mode. moyenne est la moyenne
arithmétique simple. Prenons l'exemple illustré
dans le tableau à gauche. Disons que dans une pièce, il y a 20 personnes. Leurs salaires sont
indiqués dans les colonnes. Leurs salaires varient
entre 20 000
$ par année et 3 millions de dollars par année. Le salaire moyen est donc qu'
il atténue la moyenne, qui s'élève à
248 750 Donner. Maintenant, la médiane est le
salaire au milieu quand ils sont tous organisés ordre
croissant ou décroissant. Dans ce cas, il
s'élèvera à 56 500$. Mode est le chiffre de salaire
qui se produit le plus dans ce domaine, si vous voyez 60 000 fauteurs deux fois contre tout le
reste opérant une fois. Donc, 60 000$, c'est le mode. Comme vous pouvez le constater, lorsque peu de valeurs aberrantes peuvent modifier la moyenne ou la médiane,
c'est un meilleur résumé. Dans ce cas, parmi 20 personnes, seules deux personnes ont un salaire
très élevé, soit 1 million de dollars en 3 millions de dollars. Les autres se
situent entre 20000.95000. Comme cela à des valeurs élevées
ou à l'inclinaison des moyens. Voyez si quelqu'un dit que le salaire
moyen des personnes
présentes dans la chambre est de 248 000$, ce qui ne reflète pas la vraie nature des salaires
des personnes présentes dans la pièce. Par conséquent, comparé à cette médiane, qui est de 56 000$, est une bien meilleure représentation. Dans tous les cas où quelques valeurs aberrantes peuvent
fortement fausser les moyennes. La médiane est une meilleure estimation
des statistiques moyennes. Mode dans ce cas également
dans un peu utile, mais dans de nombreux cas, quelque chose ne
peut pas se produire plus d'une fois. Ainsi, plus d'hommes peuvent être utilisés. médiane est une meilleure estimation
dans de nombreux cas
fortement influencés par des valeurs aberrantes
élevées ou faibles. Mais dans tous les cas pratiques où la distribution est fortement
asymétrique d'un côté ou d'un
autre, aucune moyenne moyenne, médiane ou mode ne peut être utilisée. Prenons l'
exemple du cancer. Beaucoup de temps le Dr
dira à une base de cancer et qu'il vient de faire un congé de monstre ou
18 mois à vivre. Le patient
ne doit pas perdre son cœur. Parce que ces 12 mois ou 18 mois pourraient être une valeur
moyenne et médiane. Et cela peut être
très biaisé parce qu' il peut y avoir beaucoup de gens qui meurent immédiatement
ou après le tournage. C'est mon diff que le patient
survit les premiers mois. Il peut s'attendre à
vivre beaucoup plus longtemps. Parce que même le mode peut
être fortement déplacé vers le côté droit ou vers le nombre plus élevé
de mois ou d'années. Examinez le cas
de la distribution C, où la moyenne et la
médiane se situent vers la gauche, mais le nombre réel
de personnes vivant beaucoup plus haut que la moyenne et la
médiane est vers la droite. On peut même quitter
6070 ans même après avoir été détecté avec un cancer
et c'est ce qui s'est produit. Prenons un autre exemple. Disons que 80 % des entreprises ont 90
millions de dollars de ventes et seulement 20 % des entreprises
avaient 60 millions de dollars de cellules. Si vous calculez la moyenne, vous verrez que la moyenne
s'élève à 84 millions de dollars. Mais dans ce cas, 80 % des entreprises
qui sont au-dessus de la moyenne, ce
qui est
difficile à comprendre. C'est contre-intuitif. Mais beaucoup de cas, les moyennes fournissent un résultat de compteur, contre-intuitif et parfois contre-intuitif et parfois
intentionnellement de
flexion. Et ceux qui finissent par prendre de
mauvaises décisions en
utilisant l'ampérage. Regardez donc toujours la distribution et prenez
une décision en fonction de cela. Ne décidez
jamais en fonction de chiffres moyens. Les calculs moyens conduisent
parfois à des informations
très déroutantes et
trompeuses. Par exemple, la
Chine moyenne ne provient pas familles
moyennes
car le calcul de l' enfant
moyen et le calcul de la famille moyenne ne
sont pas les mêmes. Illustré cela,
disons qu'il
existe un village de 100 familles. Un certain nombre d'enfants
par famille correspond Insérer une table à votre prochain. 100 familles sont divisées en cinq groupes de 20
familles, chacune. Premier groupe comme 0 enfants. Le deuxième groupe a un enfant. Le groupe dur a deux enfants,
le groupe a trois enfants. Et le cinquième groupe a formé des enfants. Si la question est, quel est le nombre d'enfants
pour une famille moyenne ? Vous devez calculer
le nombre total d' enfants en multipliant la
colonne de gauche à la colonne droite, ce qui entraînera 200 enfants et vous divisez 200 familles. Il donnera le
nombre moyen d'enfants ou de familles, soit 200 divisé
par 100 également. Mais s'il y a une question, enfant
moyen vit avec
des familles avec combien d'enfants ? La réponse n'est pas une dent. Cela signifie que même si la famille
moyenne a deux enfants, mais les enfants moyens ne
vivent pas dans une famille de boîtes à outils. C'est déroutant. Mais
regardons les enfants. Les enfants. Il n'y a pas d'enfants dans le premier groupe
car il y a 0 enfant. Maintenant dans le deuxième groupe, il s'agit d'un total de 20 enfants. Et ils vivaient dans une
famille d'un enfant. Dans le troisième groupe
qui compte 40 enfants. Ensuite, ils vivent
dans une famille d'enfants. Le quatrième groupe
qui compte 60 enfants, 20 multipliés par trois. Et tous ces 60 enfants vivent
dans une famille de trois enfants. Dans le groupe final
qui compte 80 enfants, car 20 familles multipliées
par quatre enfants AT enfants. Et tous ces 80 enfants
vivent dans une famille pauvre. Donc, pour calculer
le nombre moyen d'enfants avec lesquels vit un
enfant moyen, il
faut multiplier
20 par un. Parce que 20 enfants vivent
dans une famille d'enfants, 40 enfants vivent dans une famille de boîtes à
outils, 60 enfants vivent dans une famille délicate et 80 enfants vivent dans une famille
pauvre. Et
il faut le diviser par un total d'enfants, soit 200. Et
il en aurait trois. Cela signifie que l'enfant moyen vit
dans une famille déclenchée, alors que les familles moyennes
ajustent les boîtes à outils. De même,
les employés moyens ne
travaillent pas dans une entreprise moyenne. Il sera biaisé
vers une plus grande entreprise. Par exemple, vous
voyez ici que les enfants moyens sont biaisés envers
les familles plus grandes avec plus d'enfants. De même, le
citoyen moyen ne
vit pas dans un pays moyen. Les citoyens moyens seront biaisés l'égard de ces pays
à forte population comme l'Inde, la Chine et les États-Unis. C'est ainsi que les moyennes peuvent
être vraiment déroutantes. Nous examinerons un autre
exemple pour montrer comment étudiant
moyen ne
va pas à l'université moyenne. Parce que les
étudiants moyens et collèges moyens ne sont pas
calculés de la même manière. Cts pour les collèges avec des
étudiants jusqu'à la table. collège est petit, compte 1 000 étudiants. collège deux compte 3
000 étudiants. cartilage compte 10
000 étudiants, et le collège compte
30 000 étudiants. Il y a 44
000 étudiants au total. La première question est quel est le nombre moyen
d'étudiants par collège ? Pour le collège, 44
000 étudiants totalisent. Le nombre moyen
d'étudiants par
collège est donc de 44 000
divisés par quatre, soit 11 000. La deuxième question est moyenne des étudiants se fixe à l'
université avec combien d'étudiants ? Ce calcul est très
différent car au collège, 11 000 étudiants vont à l' université avec
1 000 autres étudiants. Au collège, 3
000 étudiants vont à l'université avec 3 000
étudiants au collège, 310 000 étudiants vont à l'
université dans un rayon de 1000 étudiants. Au collège pour 30
000 étudiants va au collège de 30
000 étudiants. Ainsi, l'étudiant moyen
va
au collège 10 000 carrés, 30 000 carrés,
3 000 carrés, 1 mille carrés divisés
par 44 000 étudiants. Il s'agit donc de 22 954. Ainsi, même si le collège
moyen ne
compte que 11 000 étudiants, mais un étudiant moyen
va à
l'université de 23 000 étudiants. De même, la population moyenne par pays est de 39 millions d'habitants car il y a environ 7,8
personnes booléennes et environ 200 garde-manger. Vous divisez ces 7,8
milliards avec 200, environ 39
millions de personnes par pays. Mais un citoyen moyen
vit dans un pays où il y a beaucoup plus de gens, presque dix
fois plus de gens. C'est ainsi que le pays moyen et le citoyen moyen
ne sont pas la même chose. étudiants
moyens et les collèges ne
sont pas la même chose. Ces chiffres sont souvent utilisés
intentionnellement par
différents véhicules. Et ils illustrent
ce chiffre moyen qui sert leurs partenaires.
6. 5 Paradoxe de Simpson: Le paradoxe de Simpson. Entre 196319 et 80, le score moyen de SAT verbal
et mathématique de tous les étudiants américains a baissé de
5040 points respectivement. Ce sont de grosses gouttes. Cela a provoqué une indignation à l'
échelle nationale. Et le
panel présidentiel a été formé. Ils ont étudié
les résultats et publié un rapport tristement célèbre
intitulé Nation at Risk. Ces mesures conduisent à des mesures
drastiques ultérieures, une refonte complète
du système éducatif, lutte contre beaucoup d'
enseignants, etc. Cependant, une enquête ultérieure a révélé qu'il est intéressant lorsque tous les
étudiants étaient
divisés en groupes de
revenus individuels, tous les groupes ont constaté une augmentation du
score SAT entre 19631980, bien qu'un groupe de tous les
étudiants soit réunis. Donc, en degrés. C'est un exemple du paradoxe
simple de Simpson. Et cela se voit dans
de nombreux cas différents. Pour illustrer ce point, pour montrer comment cela se passe, disons qu'en 19631980, tous les étudiants
pourraient être divisés en trois groupes principaux ou groupes revenus pour la
classe moyenne et les riches. En 1963, plus de 70 % des élèves étaient issus de familles
riches et seulement 20, 10 % provenaient de la classe moyenne
et de familles pauvres. Et leurs
scores moyens en mathématiques, respectivement avec 554 atteignent 500 pour la classe moyenne
et 404, la moyenne globale était de 525. Ce mélange a complètement changé
en 1980 car entre 6380, le nombre total d'élèves
a augmenté de nombreux plis. Et tout ce qu'ils augmentent le jeu élèves pauvres et de
la classe moyenne. Aujourd'hui, ils sont constitués de
40 % chacun de tous les étudiants qui réduisent la proportion d'
étudiants riches à seulement 20 %. Maintenant, tous ces trois groupes, score
Matt SAT était plus élevé. Pour les étudiants, le score était de 420, ce qui a été embauché par 20. Les élèves de la classe moyenne ont obtenu une
note de 520 points, ce qui a été plus élevé de 20 points. score des étudiants Enrich était de 560, qui a également été embauché
par dix points. Cependant, la
moyenne globale de 1980, elle n'était que de 88, car
la combinaison totale est maintenant différente et que plus d'
étudiants étrangers et moins
proportionnels atteignent les étudiants. La moyenne globale
est passée de 525 en 1967 à 488 en 1980. Cependant, tous les groupes
individuels ont connu une augmentation de la moyenne. Le Met est une discorde. C'est ce qu'on appelle le paradoxe de
Simpson. Le paradoxe de Simpson porte le
nom d'un mathématicien
Edward Simpson. Il l'a découvert en 1951. Il indique parfois un
résultat ou la formation observée lorsque les données sont séparées
en différents groupes. Mais lorsque tous ces
groupes sont rassemblés, ce résultat est formé, ceux-ci sont inversés.
Il disparaît. Examinons les deux
graphiques à gauche. Dans le graphique ci-dessus, vous voyez l'
ensemble des données en points gris. Ici. Si vous le regardez, vous
verrez qu'il s'agit d'une tendance croissante
de gauche à droite. Lorsque vous divisez ces points gris en quatre
couleurs différentes : vert, jaune, bleu et rouge. Pour ce qui est du vert, il s'agit d'une tendance à la baisse. Pour le jaune, il s'agit d'une tendance à la baisse
de gauche à droite. Du bleu, c'est encore
une tendance à la baisse. Pour le rouge, il s'agit d'une tendance
légèrement croissante mais pas
aussi dramatique que les points gris. Fondamentalement, tous les groupes
individuels avaient montré des
trains différents par rapport à tous les points lorsqu'ils sont
assemblés dans un format de grille, ce qui signifie tous les points
qui étaient ensemble. C'est ce qu'on appelle le paradoxe de
Simpson. Le paradoxe de Simpson est présent dans nombreux domaines et il a
confondu la prise de décision. Jetons un coup d'œil à
quelques autres exemples. Encore une fois, il s'agit d'un exemple
réel. Dans n'importe quel programme de doctorat universitaire. Il a été trouvé. Que 50 % de
candidats masculins étaient acceptés ou que 8 % de femmes
étaient acceptées. Cela a suscité beaucoup de
débats et de discussions sur le fait d'avoir un parti pris à
l'égard des femmes. Mais des recherches plus approfondies
ont montré une tendance différente où tous les programmes
de doctorat étaient divisés en doctorat en sciences
naturelles et en doctorat en sciences
sociales. Il a été trouvé pour
ces deux types
de programmes de doctorat différents . Plus de femmes étaient
acceptées que les hommes, un candidat à un emploi de jour de parson. Mais les femmes ont principalement postulé de doctorat en sciences sociales,
qui avait été comparé au programme de doctorat en
sciences naturelles à un taux d'acceptation beaucoup plus faible pour les étudiants de sexe masculin et
féminin. Et ce genre de biais, ce niveau d'acceptation global pour les femmes, comment cela se produit-il ? Jetons un coup d'œil à la pointe. Ainsi, 80 % des étudiants de sexe masculin ont postulé pour les sciences naturelles, 20 % pour les sciences sociales ,
tandis que pour les femmes, 30 % ont
postulé pour les sciences naturelles et
70 % ont postulé pour Programme de doctorat en sciences sociales. Pour les hommes, le
niveau d'acceptation pour les sciences naturelles 60 % et de 80 % pour
les femmes. Les femmes avaient un niveau
d'acceptation plus élevé pour les programmes de doctorat en sciences
naturelles. De même pour le programme de doctorat en
sciences sociales, les hommes avaient un niveau d'acceptation de 10 % et les femmes avaient un
niveau d'acceptation double de 20 %. Mais alors que de plus en plus de femmes ont
postulé au programme de doctorat en
sciences sociales, qui avait un programme de doctorat en
sciences naturelles beaucoup
plus faible . L'acceptation globale pour les hommes
était de 50 % et de 38 % pour les femmes. Encore une fois, lorsqu'on le
regarde individuellement, il s'agit d'une marque unique tendance. Lorsque l'on considère l'agrégat, c'est une tendance différente et
semble dépenser. Ainsi, chaque fois que vous voyez une tendance des données tout en
regardant de nombreuses données ensemble, n'oubliez pas que
s'il existe un moyen de
diviser toutes les données
en groupes significatifs, des groupes
individuels peuvent afficher un drainé complètement différent, une tendance opposée à l'ensemble des données quadrillées que
vous devez faire attention. On le voit dans les affaires. La recherche. Tout le temps. société a vendu Split
Asean Window AC. Vérifiez les commentaires de 1000 clients de chaque produit. Donc 1 000 clients qui achètent split AC, le vérifié. Et comme il est indiqué dans
le tableau à votre gauche, 800 et disons la lumière divisée AC, c'
est-à-dire 80% des gens
ont aimé split ac. De même, 1 000 clients qui ont acheté Windows ISE ont vérifié et
soixante-quinze pour cent des personnes ont dit
aimer Windows AC. Ils ont donc conclu que le
fractionnement MAC est plus aimé. La chose s'est inversée lorsque les clients étaient
divisés en hommes et en femmes. Donc sur 1 000 AC
divisé, 900, où principaux clients, 100
où clientes femmes. Sur 900 clients masculins, 750 ont déclaré qu'ils aimaient diviser la climatisation, donc ils font les 3%. Et parmi 100 femmes clientes, 50 ont dit que la lumière divisée
est de 50 %. Mais pour Window AC, sur un total de 1800
millions
de clients, sur huit cent
sept cent cinquante
ont dit aimer Window
AC, soit 88%. Deux 100 clientes
ont acheté des fenêtres et des fenêtres lumineuses
C et 150
et voyaient que c'est 75 %. Comme vous pouvez le constater, 83 % des hommes aimaient l'AAC divisé contre 88 % des hommes qui aimaient la
fenêtre et voient, quand on ne regarde que
les clients masculins, plus de clients aimaient. Window est similaire lorsque vous ne
regardez que les clientes
féminines, 50 % comme Split SE et soixante-quinze pour cent
Light Window SE. Encore une fois, plus de clients, plus de clientes féminines, Mike ,
Window AC, mais plus de
femmes comme la fenêtre que je vois chez les clients masculins
comme fenêtre et voir. Mais lorsque vous ne rassembliez pas
les clients masculins et féminins, au niveau global, vous constatez une tendance
différente selon laquelle
plus de gens aiment,
aiment la séparation. C'est donc un autre exemple
de citoyens, Benoît. Nous allons maintenant examiner quelques études de cas dans les
entreprises pour voir comment paradoxe de
Simpson peut être identifié comme un problème
potentiel et comment y remédier. Dans une étude de marché, données ont montré qu' entre deux mille et
deux mille quinze ans, les dépenses moyennes
par ménage pour certaines
catégories de produits diminuent 120$ en 2
de milliers à 95$ en 2015. La question est maintenant : s'
agit-il d'une tendance à la baisse ? Ou devriez-vous interrompre cette gamme de produits en
fonction de la rue ? La réponse est
qu'en examinant cette tendance globale
de toutes les données, vous ne pouvez pas prendre cette décision. La représentation
de ce problème est problème paradoxe de
Simpson
que nous avons découvert. Et pour évaluer si certains
groupes peuvent être abandonnés, vous devez prendre une décision en
fonction des sous-groupes potentiels. Vous devez donc
étudier en divisant la croissance totale en un sous-groupe significatif
qui peut se comporter différemment. Et vérifiez si le même train est visible
pour chaque sous-groupe. Individuellement, le
sous-groupe pourrait être basé sur des groupes de
revenu, des familles à revenu élevé,
à revenu moyen et à faible revenu. Est-ce la même tendance
dans tous ces groupes ? Il peut être basé sur des clients masculins
et féminins ou plan de l'
emplacement ou tout
autre élément qui pourrait être
significatif pour leurs données. Tous ces
groupes individuels et
montrant également une diminution des dépenses, vous pouvez
alors prendre une décision. Mais il y a de fortes chances
qu'il y ait d'autres facteurs qui contribuent à
ce groupe global par rapport à des groupes individuels
montrant une tendance différente. Si tel est le cas, vous
devriez continuer
avec cette gamme de produits. Jetons un coup d'œil à
une autre étude de cas, qui est encore une fois un problème courant. Comment les données de vente entre
2014-2019 ont montré que le
mètre carré de prix de l'immobilier a
baissé de 10 % dans un CTE. Est-ce là la tendance à la baisse de l'
immobilier ? Encore une fois, c'est un problème
paradoxe de Simpson, car façon dont le marché immobilier peut être divisé, segmenté
et regroupé en gaspillage. Pour décider s'il s'agit
d'une tendance à la baisse, il
faut examiner certains groupes. Vous devez effectuer une enquête en
divisant le groupe entier en différents sous-groupes qui peuvent
être basés sur des emplacements pour voir où vous voyez la même tendance dans tous les emplacements, selon les types de maisons, par la taille des maisons. y a de fortes chances que vous constatiez que des groupes individuels
affichent une tendance différente. Peut-être que certains affichent
une hausse de prix. Mais alors qu'il y
a un autre facteur, la plupart des types de logements sont vendus
en très grande quantité. Par conséquent,
je modifie la tendance
pour l'ensemble du groupe. Alors que les groupes individuels
peuvent montrer une tendance différente, comme la façon dont nous résolvons le faible revenu moyen et atteignons les
compétences des étudiants dans le score SAT. Ce n'est qu'après avoir examiné
la tendance dans le sous-groupe que vous pouvez déterminer
si cette tendance la baisse des prix
immobiliers est gérée. De même, il existe de
nombreux cas chaque fois que vous voyez un groupe
de points de données, essayez de le diviser en
différents groupes et voir si ces groupes
affichent la même tendance. Parce qu'il faut faire attention au problème du paradoxe de
Simpson.
7. 6 Corrélation avec l'effet de cause: Cause, effet et corrélation. Lorsque deux événements se produisent
ensemble et à changement
positif ou négatif dans un événement est associé à un
changement similaire dans l'autre événement. dit qu'ils sont
positivement corrélés. Lorsque cette relation
est opposée, dit
qu'elles sont
négativement corrélées. Il existe de nombreux cas où les
choses sont positivement
corrélées. Par exemple, il existe
une corrélation de 0,3. Un coefficient de corrélation
est calculé et certaine façon nous n'
y arriverons pas. Mais il existe un certain niveau
de corrélation positive entre l'AMP des collèges
et les revenus subséquents. Il existe un niveau plus élevé
de corrélation entre le QI et la performance moyenne de l'emploi. Il existe un niveau beaucoup
plus élevé de 0,7 corrélation entre
la taille et le poids. Les personnes plus grandes sont plus lourdes. Corrélation encore plus élevée entre le score SAT
mathématique de deux années
consécutives. C'est donc le cas dans les cas où les
choses sont positivement
corrélées. Maintenant, deux problèmes communs et erreurs dans la prise de
décision. Liée à la corrélation r, on parle d'erreur post-hoc. Lorsque l'événement
est survenu après un événement, on dit
qu'ils ont
été formulés et il est
dit qu'il s'agit d'un événement qui provoque un autre Richmond
et a fait un cas. Un autre est *** hoc, ergo propter hoc,
c'est-à-dire lorsque deux événements
se produisent ensemble. L'un doit être dû autre événement qui
peut ne pas être l'invité, car la corrélation ne signifie
pas une causalité, deux événements sont corrélés
ne signifie pas que l'un est à l'origine la fausse causalité ou pensant qu'un événement en
cause faussement un autre. Sa mère de toute logistique
statistique lorsque deux événements se produisent en
même temps. Par conséquent, lié, mais la corrélation
ne signifie pas une causalité. Si deux événements se sont produits en
même temps, cela ne
signifie pas que l'un en cause un autre. Tous les matins. Coq, corbeaux. Et le lever de soleil ne signifie pas que
ce coq provoque le lever du soleil, se produit en même temps. Les coqs anticipent dans Sunrise et il pousse et les éléments de
lever du soleil, ils sont corrélés, mais l'un
ne cause pas l'autre. Il y a quelque chose qu'on appelle
une corrélation fausse, car par hasard, deux
événements pourraient être corrélés, mais il n'y a aucune
relation. Prenons quelques exemples. Si vous tracez
les ventes d'iPhone aux États-Unis et que vous plongez par
les plis dans les escaliers, vous constaterez un niveau
très élevé de corrélation
positive
car ces deux facteurs ont augmenté
au fil des ans. Mais, comme nous le savons, il
n'y a
absolument pas de causalité réelle entre aucune relation. De même, si vous tracez la consommation de bar capita de la
façon dont le sirop de maïs fructose a chuté et les dépenses dans des sports spectaculaires de spectateurs vous verrez que l'un augmente, tandis que l'autre est
décroissant. Juste deux événements, il y a
une corrélation erronée. De même, si vous
regardez les visiteurs Universal Studio of Orlando et les ventes de
voitures neuves, vous verrez les deux. Ils sont en train de descendre, mais encore une fois, ils sont en train de tomber. Et toute relation
entre eux et association fausse peut être complètement coïncidence
ou esprit. Il y a eu beaucoup de
temps et c'est extrêmement exemple que si ces deux événements sont
quelque peu liés, on peut conclure faussement, ou on peut manipuler pour
montrer aux autres qu'ils
sont liés. mains, l'une cause l'autre. Il faut faire attention à ça. table deux par deux est quadruple. Le tableau est un tableau statistique qui peut aider à prendre des décisions. C'est un moyen robuste de voir à quel point la corrélation
et la causalité sont fortes. Donc, si quelque chose cause
quelque chose, c'est par exemple, souvent vous verrez des gens vous dire
que 20
personnes grippées ont pris des médicaments et se sont rétablies après
cinq jours, comparativement à seulement dix personnes qui se sont bien rétablies.
sans prendre de médicaments. Par conséquent, le
médicament est infecté. Mais pour vérifier si médicament est efficace ou non, vous devez remplir
le tableau complet du formulaire. un côté, il faut regarder
les gens qui ont pris Madison plutôt que
ceux qui n'ont pas pris de médicaments. Et puis de l'autre côté, il
faut regarder les gens qui se sont
améliorés après cinq jours contre qui ne se sont pas
améliorés après cinq jours. Si un total de 30 personnes à la
médecine s'est amélioré. Et Dan ne s'est pas amélioré. Et si au total 15 personnes
ont pris des médicaments et dix Dieu amer et ne s'en sortaient pas
mieux que vous ne pouvez
conclure quoi que ce soit. Parce que la relation entre
201010 et cinq est la même. Mais si nous avions eu notre parjure,
les gens qui n'ont pas pris Madison et qui se sont
améliorés et 20 ne se sont pas
améliorés que ce que vous pouvez dire, accord, la médecine aide. De même, vous pouvez
créer différents pour, pour que la table cherche des informations supplémentaires dans lesquelles vous pouvez les brancher
afin de prendre des décisions. Parfois, la causalité
peut être inversée. Si papa donne un rapport qui
dit que les entreprises ayant plus de femmes dans leur
conseil d'administration ou plus rentables ou plus grandes que la taille. Cela peut signifier que les entreprises ayant plus de femmes sont
plus rentables, ou cela peut aussi signifier que des entreprises
plus rentables
embauchent plus de femmes, ce
qui
n'est pas vraiment clair. De même, les meilleurs collèges affirment que leurs élèves
obtiennent de meilleurs résultats. maintenant que les étudiants obtiennent
de meilleurs
résultats en raison des collèges ou
des grands étudiants qui vont pas très clair maintenant que les étudiants obtiennent
de meilleurs
résultats en raison des collèges
ou
des grands étudiants qui vont dans les meilleurs collèges
. Ce sont là que la causalité
pourrait être inversée. Dans deux événements consécutifs, on voit souvent
que l'agriculteur est
à l'origine de la lettre, mais ce n'est peut-être pas le cas, qui ne durent souvent pas des décennies. Mais cette erreur est
appelée « erreur post-hoc ». C'est comme une erreur
liée à la corrélation. Cette blague, dit Org Men, son médecin lui a demandé d'arrêter de
fumer et un autre vieil homme
a dit : Oh ne fais pas ça. Un couple de mes amis vient
de fumer et ils meurent. C'est une drôle de façon de
dire que les mourants n' rien à voir avec l'arrêt de
fumer, mais ils se sont produits après
le quiz. Beaucoup de cas réels, un événement se produit complètement
non phosphorylé, pas motivé par quoi que ce soit. Mais les gens ont deviné que c' était à cause d'un autre
événement qui se produit avec le fameux boîtier de notre bracelet hologramme
équilibré est devenu une crête mondiale
entre 2007-12, des millions de dollars ont été
dépensés. car les gens, y compris les sportifs,
visaient le produit à améliorer leur capacité
athlétique. Plus tard, des essais randomisés en
double aveugle ont révélé
qu' il n'y avait aucune
relation entre le port de ces bracelets et les capacités athlétiques dans
tous les athlètes qui s'entraînaient, gens essayaient de perdre
du poids et aller mieux, plus athlétique, et il s'
améliorait. Cela n'avait rien à voir avec le
port de cette lutte. Mais c'est arrivé parce que les gens pensaient que le prix de ces seins
mène et que Dieu était meilleur. C'était donc la
causalité, la corrélation de Paul. Un autre cas de deux
événements se produisant en même temps
l'un à l'autre. En 1990, 30 adolescents américains
qui jouaient fréquemment à qui jouaient fréquemment un certain jeu vidéo se
sont suicidés. Cela a créé une alarme à l'échelle nationale, pensant que les jeux vidéo
étaient à l'origine du suicide. Mais
une enquête plus approfondie a révélé que taux de suicide
chez les
adolescents était 12 pour 100 000 alors que millions de
garnitures jouaient régulièrement
au jeu. Ainsi, 360 personnes étaient statistiquement sujettes
à
se suicider chez les personnes
qui ont joué le jeu. redimensionnement de Tertius
n'était pas un grand nombre. Ce genre de choses amène
quelqu'un à penser que le suicide était
dû à la porte. Encore une fois, une fausse causalité parce que ces deux événements
se produisent en même temps. Toutes sortes d'entreprises
affirment toutes sortes de corrélations entre leur amélioration
générale des accidents, mais il ne s'agit pas de décennies. L'entreprise dit que c'est un
shampooing qui mène à la tête. Cependant, la réalité pourrait être que les gens
choisiraient ses cheveux en utilisant le shampooing en
suggérant d'abord montrer la causalité
inverse. produit diététique affirme comment
il est utilisé Lauren le mouillé, mais les personnes qui utilisent le
produit feraient
dix autres choses comme faire de
l'exercice, manger moins. Ceux-ci sont à l'origine de la
perte de poids et non de mauvais produit. La compagnie de bière affirme que la
bière améliore sa maladie. Mais il
ne pourrait y avoir
aucune relation , car de plus
en plus de gens en bonne santé pourraient boire de la bière, donc ils ont déjà
une amère dure. Mais cette causalité qu'
ils prétendent parce que ce n'est peut-être qu'une
folie fâcheuse. Un autre
facteur important lié à corrélation est que l'
affinité est
présumée à tort que les pharmaciens de
corrélation au-delà des données avec lesquelles
elle a été établie. Par exemple, avec la pluie
croissante, maïs grandit, mais au-delà d'un certain point,
il devient plus court. Une fois encore. Sauvegarder les données jusqu'à un
certain pouce de pluie, alors cela devrait se terminer. Mais c'est parce qu'en cas d'inondation, tout peut être détruit. De même, l'éducation est une corrélation positive
avec le gain, mais jusqu'à un certain point, peut-être jusqu'à une
maîtrise parce que les doctorats, moins que cette corrélation ne
soit pas Judy 5 bits. De même, le
bonheur des gens lui manque pour augmenter avec l'
augmentation de l'argent. Mais jusqu'à un certain point. Et après cela, il se peut que cela ne
change pas beaucoup ou il a
peut-être diminué. C'est le cas alors
des personnes les plus riches qui auraient été les
personnes les plus heureuses du monde. Mais ce n'est pas le
cas en même temps, si c'est
le rapport de quelqu'un , je serais vraiment content. Donc, au départ, avec l'
augmentation de l'argent, le
bonheur rendait fou, les gens l'ont découvert. Mais après un certain niveau qui a changé en 19,
assez significatif. Encore une fois, la relation
, la corrélation ou la causalité peuvent exister jusqu'à un certain point qui
sont vérifiés au-delà de
cela, elle ne devrait pas être portée
à cinq maturité.
8. 7 Statistique: Corrélation de statut. Les chiffres statistiques sont
utilisés par les journalistes, les annonceurs, les soi-disant
experts, les vendeurs et autres. Souvent, envoyez des messages et
manipulez les gens. Ce processus est appelé corrélation de
statut. Voici un exempté. Vous verriez des annonceurs
dans les magasins à partir de 50%, 20 ventes sur nuages. Beaucoup peuvent penser qu'il s'agit d'un rabais
total de 70 %. Mais en réalité, c'est la première dette de
50 % sur le solde, 50 % et les autres 20 %
du chiffre d'affaires total s'élèvent à 50 % plus 20
% de 50 %, soit 10 %. Donc, 60 % croient
qu'ils disent au total 60 % de vente. Cela aura moins d'impact. C'est pourquoi ils disent 50 % plus 2 %. Il le verra tout le temps. Ce sont deux qui
manipulent ceux des gens. De même, les journalistes
rapporteront qu' en une journée est fermée dans
une ville ou dans un État, une
telle perte économique. Ces chiffres sont toujours calculés en fonction toutes les
activités économiques possibles qui peuvent éventuellement se produire en une
journée, ce qui n'arrive jamais. Plus important encore, lorsqu'
un jour sera fermé, la
plupart de ces activités
économiques seront transférées
au lendemain. En fait, ils ont
un impact beaucoup moins important. Mais les journalistes
aimeraient
vous intéresser à leurs nouvelles. C'est pourquoi ils donnent un
si grand doigt pour que plus de gens lisent des nouvelles, nouvelles comme de grandes entreprises, ils n'ont pas l'intention de vous
donner des informations. Les gens
additionnent souvent notre âge Cindy, ils existent très bien, ça change. Par exemple, ils affirment que le coût du
matériel a augmenté de 5 %, jamais de 7 %, les services publics de
13 % et le transport de 15 %. Le coût total
est donc de 40 % en bits. bizarre, on peut
juste y penser. On dirait que peut-être
beaucoup de gens ne le font pas, mais les gens le font. Il ne s'agit pas d'un cas de corrélation de
statut. Si vous réduisez le coût, vous le verrez. Par exemple, supposons que les 60 % passés du
coût étaient matériels, 30 % de main-d'œuvre et cinq personnes
, et 5 % de transport. Ces hausses de coûts de 5713, 15 %, augmentent essentiellement
les coûts globaux de 6,5 %, un montant dérisoire. Mais très peu de gens
vont le voir. Et nous verrons que l'impact total de l'
augmentation des coûts explique 5 %. Les entreprises, en particulier les sociétés de
conseil ou de services, constatent
souvent qu'elles possèdent plus de 200 ans
d' expérience
combinée dans leur gestion. Il y a étrangement
du papier avec des négationnistes, chaque expérience devient 200
ans d'expérience combinée. Cela ne veut rien dire. Il s'agit simplement d'une corrélation de statut
montrant une
figure artificiellement et
complètement arbitraire qui donne l'impression qu'une entreprise
a beaucoup d'expérience. Si une entreprise réduit le salaire des
employés de 25 % 1 an et
l'augmente de 25 % l'année prochaine. Il peut prétendre qu'
il a donné aux gens là-bas et le salaire, l'étudiant en baisse de 6,25 %. Encore une fois, c'est une autre
façon de rester discriminatoire. Le bénéfice net d'une
entreprise est passé de 2 % l'an dernier, à 4 % cette année. On peut affirmer que le bénéfice a
augmenté de deux points de pourcentage, mais cela ne semble pas bon. La meilleure façon de prétendre est
que le taux de bouillon a augmenté de 102 % pour atteindre 4 %. Cela aura un impact beaucoup
plus important. Mais les gens le font, les font. Une autre façon de
statuer pour laisser la maladie un autre type de
calcul à venir. Un doigt. Par exemple, le
revenu du ménage peut être calculé en divisant
le revenu total par le nombre de ménages. C'est une façon de
calculer ou de multiplier le
revenu moyen par habitant par le nombre moyen
de personnes dans un ménage. Le deuxième chiffre donnera
toujours un avantage élevé. Certaines personnes l'utilisent. Donc, si vous souhaitez montrer un
faible revenu du ménage, utilisez le premier calcul
si vous le souhaitez. Le revenu haut de gamme
des ménages est donc le deuxième calcul.
Qu'est-ce qui est légitime ? En 2021 ? médian des ménages
en 168 milliers de dollars américains. La même année, le revenu médian
par habitant était de 37 000$. taille moyenne du ménage était de 2,6. Si vous multipliez 37 par 2,6, vous obtiendrez 96 000$, ce qui est beaucoup
plus élevé que les 68 mille. Si la moyenne est utilisée dans
un revenu moyen. revenu moyen des ménages
augmentera encore plus haut. façon dont vous calculez
déterminera le revenu du ménage. Des personnes qui ont des
choses différentes à l'ordre du jour. Nous ferons différents calculs. Prenons cet exemple de la façon dont l' indice
des prix à la consommation peut être calculé différemment pour
donner des chiffres différents, coûts du
lait et du pain,
1.20,5 l'année dernière. Cette année, les deux génèrent 1,10$. calcul différent peut indiquer indice de prix
différent et dépend votre agenda et vous
calculerez ainsi. Lorsque la dernière année est
utilisée comme année de référence, le lait est devenu 50 %
du coût de l'année dernière. Et la marque devient
100 % du coût de l'année dernière. La moyenne est donc de 125 %,
soit une augmentation de vingt-cinq
pour cent. Encore une fois, si vous utilisez l'
année en cours comme année de référence, qui est également mesurée dans celle-ci. L'année de la classe moyenne était de
200 % et le pain était de 50 %. Le
prix moyen de l'année dernière était donc de 125 %. Cette année est l'année de référence. C'est 100 %. Celui-ci montrera donc que le prix de l'année dernière a été supérieur de vingt-cinq pour cent. Celui-ci ne montrerait pas
que les prix baissent. Si vous utilisez une moyenne géométrique
, elle n'affichera aucun changement. Selon la façon dont vous calculez
l'indice des prix , le 1er mai montre une
augmentation du prix. Cela peut maintenant montrer une
baisse du prix. Et certains calculs peuvent ne
montrer aucun changement dans les oiseaux, bien que les prix soient exactement les mêmes dans
les trois cas. La figure de centile est
une autre chose intéressante lorsque l'on examine la
figure du centile, par exemple, les rangs d'élèves d'une classe de 399 centiles sont les trois
premiers élèves. C'est ce qui a fait ça. 1 % des 300 étudiants, 98 % Dynes sont les
trois prochains étudiants, et ainsi de suite. Il y a une grande différence
entre le 99e centile, le 90e centile, comme vous pouvez constater à partir de cette
distribution normale, qui est généralement le cas
pour une grande partie de la figure. Mais à mesure que les rangs se
ferment au milieu, il n'y a pratiquement aucune
différence entre 14, 60 %. Phrase. On peut
voir dans les côtés extrêmes, les percentiles sont étirés. Il y a une grande
différence entre 9919, où elle se trouve, la différence
entre 4060 est beaucoup plus faible. Le fournisseur a dit
qu'il a augmenté prix de 20% parce que
ce coût a augmenté de 20% dans le processus en a bien
augmenté son dollar absolu. Ce sont toutes des
façons différentes de voir à
quel point de vue statistique est différent. Phrase inférieure à la moyenne. Le 1er mai dites, eh bien, Google change votre personne
mourant de 40 à 60 ans, alors qu'elle
changera de 1999, alors que les 90 à
99 sont beaucoup plus grands. De même, en augmentant
proportionnellement prix en fonction du coût, on peut facilement augmenter
leurs dollars réels. Ce sont toutes différentes
façons de rejoindre Stanford.
9. 8 données en Half: Disposer de données pertinentes. Lorsque les gens ne peuvent pas prouver
quelque chose directement, ils utilisent des données à moitié pertinentes
comme proxy pour le prouver. Attention. Il est difficile de prouver l'
efficacité du dentifrice. Les entreprises montrent comment
leurs produits détruisent les germes en
laboratoire. Ces deux conditions ne
sont pas les mêmes. Ce qui fonctionne en laboratoire peut
ne pas fonctionner à l'intérieur de notre bouche. De plus, il est souvent difficile savoir quel type de bactéries ils
tuent en laboratoire. S'agit-il du même type de bactéries que nous
avons dans la bouche ? Vous seriez surpris. On ne sait pas non plus quel type
de dosage l'utilisation de la terre. S'agit-il d'une équipe complète pour seulement mettre à
l'échelle quelques bactéries ? Aucune de ces informations
n'est très claire. Mais même à ce moment-là, ils prétendent que
leur publicité pour avancer est très efficace
pour tuer les bactéries dans le LRMR. C'est l'utilisation de données à
moitié pertinentes. Une entreprise de réfrigérateurs peut
annoncer qu'elle conserve produit 50 % de frais supplémentaires. Vous le dites tout le temps, mais
plus frais que quoi ? Un autre réfrigérateur. Conservez les aliments dans un liquide de refroidissement, n'est-ce pas ? l'ombre, ou simplement de la
nourriture vivante sous
la chaleur et l'humidité estivales. Vous serez surpris de savoir sur quoi ces
50 % sont calculés. Le syndicat affirme que 85 % des employés sont
mécontents de la direction. Ils utilisent des données non pertinentes. Pour obtenir un
dossier solide, Union collecte
souvent tous les complexes
possibles,
y compris ceux qui sont très triviaux
tels que pour la mise collecte
souvent tous les complexes
possibles, en réseau, lumières doivent être remplacées. Ainsi, et additionnez-les pour dire que quatre-vingt-cinq pour cent
des employés
se plaignent de la
direction, ce qui n'est pas vrai. 100 % des citoyens d'un pays se plaignent de quelque chose
pendant un certain temps. Mais il est injustifiable
de conclure qu' une centaine de citoyens sont
mécontents de leur gouvernement. Encore une fois, il utilisera
des détails pertinents. Parfois, les données pertinentes
deviennent extrêmement importantes. grippe espagnole en est un exemple. En 1918, l'épidémie de H1N1
est appelée grippe espagnole. Il est intéressant de noter que la grippe
n'est ni originaire Espagne ni plus
répandue en Espagne. Seulement parce qu'il était
davantage couvert par les journaux espagnols. Parce qu'ils n'étaient pas directement
engagés dans la Première Guerre mondiale. Et tous les autres
pays d'Europe apprennent à mener une guerre
innée. raison du fait qu'il était
dans les journaux espagnols. La grippe est appelée espagnole. Les gouvernements de tous les pays sont des utilisateurs
notoires de détails à
moitié pertinents. Voici un exemple. Au cours de la guerre
espagnole américaine en 1898, le taux de mortalité dans la Marine
était de 94 000 centres. Le taux de mortalité à New
York
était à ce moment-là de 16 000 personnes. Les recruteurs de la Marine
utilisent ce chiffre pour comparer et affirmer qu'il a été
souffert d'être dans la Marine. Dan serait sur 82
personnes induites en erreur pour rejoindre la Marine. De toute évidence, le taux de mortalité des personnes
âgées et malades à New York a été comparé à celui des jeunes et des personnes fortes qui
étaient en train de mourir. Ils ne sont pas comparables, ils ne
sont pas du tout pertinents. données pertinentes ont souvent
influencé la prise de décisions. Par exemple, de 1950
à l'année est considérée plus comme l'année de la pire épidémie de
poliomyélite chez nous. L'enquête a révélé que le
devoir est plus sensibilisé, plus de cas où un
diagnostic et un signalement et plus grand nombre de personnes se sont manifestées en
raison de l'aide financière fédérale. De plus, l'année a eu plus d'enfants sensibles
à ce groupe d'âge. Tous ces chiffres ont contribué à un nombre plus élevé de cas, mais le chiffre mort, qui est une meilleure
mesure n'est pas hors de l'ordinaire. 1952, a été célèbre comme l'année de l'
épidémie de poliomyélite aux États-Unis. Mais ils étaient tous basés
sur des données à moitié aléatoires. En réalité, c'est comme n'importe quel autre district
qui enregistre et signale que plus de crimes sont
perçus comme plus
sujets à la criminalité uniquement parce qu'ils
signalent
davantage que certains autres districts
qui ne le sont pas reporting. Les politiciens de tous les pays des utilisateurs
les plus prolifiques
de données à moitié pertinentes. Parcourez toutes les données pour trouver des statistiques qui
correspondent indirectement à leurs inanités. Avant d'arriver au pouvoir, certains districts ont déclaré que le faible revenu
et d'autres avaient des revenus élevés. Après Bauer, certains districts ajoutent
également des revenus élevés et d'
autres ont un faible revenu. Les politiciens choisiront un district à faible revenu avant le pouvoir, et le district
à revenu élevé après pouvoir pour montrer que leur gouvernance
a augmenté les revenus. Alors que l'opposition
va faire le contraire. Ils le feront dans un district
à revenu élevé à faible revenu après avoir montré que le gouvernement a provoqué une baisse
des revenus. C'est ainsi que les gens utilisent des données à moitié pertinentes pour
faire valoir tous les points. Mais il n'est pas toujours possible de
parcourir toutes les données. Mais sachez
que toutes les données
présentées dans les médias, les
hommes, partout où les gens essaient d'influencer
notre décision. y a de fortes chances qu'ils utilisent des données à moitié
pertinentes pour ce faire. Nous connaissons tous les photos
avant et après. Les photos avant et après montrent comment certaines pilules ont permis à
quelqu'un de perdre du poids. Mais les annonceurs ne mentionnent pas toutes les autres forces la personne fait
pour perdre du poids. Ce ne sont pas seulement les
pilules qui causent cette perte de poids et qui sont utilisées avec des données à
moitié pertinentes. Par conséquent, perdre du poids
n'est pas totalement hors de propos
de leur utilisation d'un produit. Cela pourrait même perdre
du poids sans utiliser ce produit s'ils
font de l'exercice, mangent moins et ont
un mode de vie sain. Mon père sème que la moitié
des données pertinentes sont utilisées chez les amputés c'est-à-dire une amélioration pour faire un point d'honneur pour influencer
nos décisions.
10. 9 Vérifier l'échelle: Vérifiez la balance. Vérifiez toujours attentivement l'
échelle lorsque vous examinez les données présentées dans un graphique ou un
diagramme linéaire. L'une des façons
les plus courantes de l'utiliser est de l'exister ou de diminuer le changement de valeurs consiste à
manipuler l'échelle. Il suffit de rester en pourcentage d'
augmentation du salaire peut être exacerbée de façon spectaculaire
en le montrant à Lake. Et c'est le graphique inférieur qui montre une stagnation
comme dans la charge supérieure. Les données Sam présentées à différentes
échelles sont différentes. Et juste en
regardant ce graphique linéaire, 1er
mai arrive à des conclusions très
différentes sans entrer dans l'
ampleur des changements qui se produisent. Tant d'annonceurs
dissolvent les temps, jouent avec l'échelle
pour accentuer les résultats. Parce qu'ils savent que la
moitié des gens
seraient rustiques, c'est cette échelle. Et l'autre moitié serait tellement influencée par la représentation
visuelle dramatique. Parce que
la représentation visuelle est si puissante qu'ils vont
ignorer cette échelle. L'objectif des
annonceurs d' accentuer la différence
serait servi. Les barres sont cassées dans un graphique à barres pour afficher les
changements à la fois vers le haut et vers le bas. Prenons cet exemple. En 1995, les
accidents de la route étaient de 7 800. En 2005,
les accidents de la route ont dépassé 7 728. Mais lorsqu'il est tracé dans un graphique à barres cassé qui
est cassé au niveau 7680, ce petit changement de 80, ni
les accidents ne s'accentuent. Alors les gens regardent ça et disent : Oh mon Dieu, 2005
est plein d'acides inférieurs. Mais c'est simplement comme
ça que les
graphiques cassés à l'échelle sont utilisés
pour manipuler les décisions.
11. 10 Comparaison par image: Comparaison par images. Comparaison par image. Beaucoup de temps, les gens exagèrent
intentionnellement et non intentionnellement
ou diminuent les données. records de grime
aux États-Unis en 199098 comparés par image et
réduction, semblaient dramatiques. En effet, même si la
hauteur des criminels cette image est proportionnelle
au volume ou non. En réalité, cette
rime est passée de 15 millions
à 9 millions. Mais il semble beaucoup plus bas
car le volume
du petit criminel
est beaucoup plus petit. Il semble que la
réduction de la criminalité ait été équitable. De même, la
production indienne de mangue. Par rapport à la Chine. Par la hauteur de la mangue, il semble beaucoup
plus haut que vraiment. La Chine s'élevait à 4,5 millions de tonnes. L'Inde est de dix-huit millions de dix, mais le volume de la plus grosse mangue est beaucoup
plus élevé que quatre dixièmes, est plus proche de 1015 tonnes. C'est celui qui peut
donner l'impression qu'
une figure est beaucoup plus élevée
en montrant deux images. De même, les ventes de
véhicules automobiles en Inde sont
passées de 3,2 millions en 2014 à
4,4 millions en 2019, seulement trente-sept
pour cent. Mais lorsque deux voitures le
montrent,
la seconde est
tolérante à 37 % par rapport à la première. En regardant cela, les gens auraient
l'impression que les
ventes de voitures augmentent beaucoup
plus en 2018. Cette astuce est couramment
utilisée par les annonceurs et propagandistes dont l'objectif
est d'induire les spectateurs en erreur. Parce qu'une fois que cette impression
est l'esprit des gens, les deux impressions de
mangues de la diapositive précédente sont deux photos de criminels
dans la première diapositive. Et voici deux
photos de voitures. Une sorte de décide qu'elle augmente est beaucoup plus élevée même si elle est très petite.