Transcrições
1. Introdução: Esta classe mostra como a
doença estatística esconde
a verdade para manipular nossas
decisões e como
podemos detectar esses truques
para tomar melhores decisões. Olá. Sou especialista em
ciências cognitivas com mais de 25 anos de experiência nos EUA, Índia, Oriente Médio
e África do Sul. Vivemos em uma era da informação. Precisamos usar dados para tomar todas as
decisões. Mas para profissionais de marketing,
políticos de mídia , para todos os
empresários,
todos escondem a verdade real por trás estatísticas
cuidadosamente construídas para que os dados que eles
apresentam xaropes, seu próprio propósito ou agenda. O que podemos fazer? Bem, é bem simples. Precisamos aprender os truques
estatísticos as pessoas usam para enganar outros para que possamos pegá-los no ato e tomar
melhores decisões. Nesta aula, você
aprenderá sobre os dez truques
estatísticos mais comuns são pelos profissionais de marketing, mídia, spin doctors,
políticos, empresas e outras pessoas para
ocultar dados à vista de todos. Para que, no final
desta aula, você seja capaz de
tomar decisões muito melhores orientadas por dados em situações pessoais
e empresariais com confiança. Quem pode ter essa classe
12, praticamente todos, de iniciantes a profissionais, líderes empresariais
a alunos. Todos serão
beneficiados desta classe. No final desta
aula, é claro, há um projeto
que envolve investigar
situações práticas finas quando as pessoas geralmente
tomam decisões erradas devido
aos truques estatísticos
discutidos em a classe. O objetivo dos
alunos é primeiro detectar o truque aplicável
e depois
descobrir a maneira correta de
tomar decisões. Acho que é praticamente isso. Ansioso para
vê-lo na aula e tudo, sim, não se esqueça de colocar seus comentários e
comentários no final.
2. Como de amostras: Viés de amostragem,
pois as estatísticas
às vezes podem ser um pouco pesadas. Então, vamos começar com um clima
mais leve com um desenho animado. Então o cara criou uma alimentação de
pássaros, que é veículo. E ele diz, depois de provar cada pássaro que frequenta a calçada do lado de fora
deste prédio, concluímos que o que pássaros realmente amavam seus veículos. Isso significa que, para
decidir o que os pássaros gostam, tudo o que ele fez foi
olhar para Bardo. As calçadas estavam comendo bagels porque bagels estão sendo
jogados para fora de seus prédios. Essa é uma maneira engraçada de se olhar. Foi a amostragem pode levar
a uma conclusão tendenciosa. As estatísticas são sobre a
coleta de um pequeno número de candidatos de uma
grande população é pequeno número de
candidatos é chamado de amostra. E decidir sobre
a grande população base na verificação
com a amostra. A amostra é representativa
da população, são inclusões divertidas estão certas. Se a amostra for tendenciosa como na imagem que são mais pontos verdes,
os vermelhos na amostra em comparação com
a população. Então nossa conclusão com base na
amostra também não é válida. Muito tempo em pesquisas da vida
real que conclusões não são válidas
porque as amostras são tendenciosas. Por exemplo, eu realmente, os graduados
universitários sempre
mostram um salário maior do que o salário
real que os
graduados recebem porque as pessoas aposentam o
salário na resposta. Às vezes, antes do outono. Os estatísticos
preveem com base em pesquisas, alguém ganhará, outra pessoa ganha
com um grande deslizamento de terra, como aconteceu
na eleição de 1932. Porque a amostragem era tendenciosa. Nas pesquisas eleitorais de 2012, foi conduzida por telefone fixo, que previu que
Obama perderia. Mas Obama ganhou porque
muitos oficiais, apoiadores estavam realmente usando celular e, portanto, eles
serão denotados por isso. Promove uma pesquisa. É salvo que 80% dos britânicos gostam de veículos
elétricos. A primeira pergunta
que você deve fazer é 80% de qual peça,
britânicos. Porque se a amostra for tendenciosa e se tornar de uma seção
do povo britânico, então ela é representativa dessa seção
em vez
da população
britânica morta. Agora, vamos dar uma olhada em
como o viés de amostragem acontece. Vamos começar com o caso
dos alunos da Ivy League. Média de sábados. Declaração publicada por uma revista diz que o salário médio
do
MBA da Ivy League após cinco anos de
formatura é de US $300 mil. A questão é: quão precisa
é uma afirmação como essa? Agora, a afirmação pode ser
muito errada e enganosa. Por quê? Porque eles não mencionam
qual era o tamanho da amostra. Eles não mencionam isso se tivessem um contato de todos os
graduados para escolher. Eles também não
mencionam se a lista de candidatos que responderam onde
ela é selecionada aleatoriamente, ou apenas tomaram as respostas de pessoas
que se importam em responder. Também não fala
sobre
quantos deles realmente respondem a
essas perguntas. Se for feita
essa pergunta para 50 pessoas e cinco respondidas. Se eles têm uma média de cinco e dizem que é gênero
mil dólares, esse é um caso fortemente tendencioso porque as cinco mulheres
não são representativas. Esta próxima pergunta é apenas pessoas com
oi sanidade respondidas, o que provavelmente é esse caso. Foram amostras representativas? Como você pode ver, eles têm
tantas perguntas e
a maioria das pesquisas evita cuidadosamente responder a qualquer uma
dessas perguntas. Portanto, você não pode confiar em nenhuma conclusão de pesquisa
salarial. Assim, as pessoas podem manipular a
amostra ou simplesmente ser
desleixadas, não são metodicamente corretas
durante a coleta de amostras. E, como resultado, infelizmente, o significado desses
resultados de viveiro não é confiável. 60% dos índios urbanos preferiram a
educação em engenharia, que 60%, 80% dos índios
preferiram um certo fato 13, 80% dos quais indianos. O resultado de um estudo para ser dobra qualquer amostra deve ser
representativo e aleatório. Ou seja, ao
coletar a amostra, todos os candidatos devem ter chances iguais
de serem selecionados. Muitas vezes. Esse não é o caso. Há uma
batalha constante para reduzir o viés de
amostragem, tornando
a amostragem aleatória. viés de amostragem está sempre lá. Se vermos declarações como
essa de que 60% dos
índios urbanos preferiram à educação em
engenharia deve-se 60%
das quais pessoas. Não seriam 60% das
pessoas que eles se importam em perguntar. Não 60% do nosso
pacote, índios. Quando a amostragem aleatória não é possível, demorada
ou dispendiosa, ou
seja, amostragem aleatória, o que significa cada candidato terá a mesma chance de ser selecionado se isso não
for possível . A próxima melhor coisa é a amostragem aleatória
estratificada, onde você divide
a população em vários grupos com base na
prevalência desse grupo. Então, se uma população de 50% de branco, 30% preto, 20% asiático, você coleta um certo número de amostras da comunidade asiática, um certo número de amostras
da comunidade negra e certo número
de amostras da comunidade
branca em proporção
ao dígito Parson. E isso pode envolver violação. E isso é estratificado. Os grupos podem ser
baseados em renda, educação, etnia
ou qualquer outra coisa. Mas se o seu conhecimento
da proporção estiver errado, a amostragem,
também seríamos tendenciosos. Por exemplo, se uma
pós-graduação 30% das mulheres for 70% homens, se o tamanho amostral for
calculado como dez, você pode
selecionar aleatoriamente três
das estudantes do sexo feminino e
sete dos alunos. Isso não seria um caso de amostragem aleatória
estratificada. Isso seria um pouco utilizável. Lembre-se, as próprias pesquisas e iniciaram os resultados
são um pouco tendenciosos. O viés vem de
duas fontes diferentes. Primeiro, são os passos
que estamos fazendo a entrevista. A idade, a educação, a etnia e a experiência da equipe de
entrevistas influenciaram fortemente
o resultado da pesquisa. Em um caso, verificou-se
que, com base na equipe
branca ou negra fazendo a entrevista de comunidades
negras, os resultados foram
bem diferentes. A segunda fonte de viés
são as pessoas que têm maior tendência de serem selecionadas, pois as amostras
são candidatas. Geralmente pessoas
com mais dinheiro, melhor educação, aparência
beta, mais informações e alerta. Comportamento mais convencional
e hábitos aceitáveis mais selecionados como candidatos
para entrevista ou amostra. E, como resultado,
desviés do obstáculo. **** e resultados da pesquisa.
3. Tamanho de amostra: Tamanho amostral. Em muitos casos, as pessoas não usam um
tamanho amostral grande o suficiente para fazer uma conclusão. Por exemplo, ouço enquanto os estudos de reivindicações de
propaganda mostram que aqui eu vou X reduz a
falha aqui para 80% dos usuários. Mas quão credíveis são
essas afirmações? Alguns anunciantes
fornecem letras miúdas que mencionaram um
pequeno tamanho amostral, mas alguns nem fazem isso. Infelizmente, para propaganda
comercial, não
há regulamentação
que indique que determinado
tamanho amostral e certamente metodologias precisam ser usadas. Como é o caso dos produtos
farmacêuticos. E, como resultado, as pessoas reivindicam todos os tipos de coisas com base em todos os
tipos de amostragem. Esses resultados são principalmente
baseados no pequeno tamanho amostral. E, portanto, o falso pode ser
devido a menos chances. Ou as imagens mostram alguns
casos de amostra para mostrar bons resultados para
que possam fazer uma reivindicação
em um anúncio. No entanto, eles são mostrados o tempo todo. Se você jogar uma moeda dez
vezes e receber oito cabeças, você não pode afirmar que o estudo mostra que a chance de colocar
cabeças em moedas é de 80%. Você precisa ter um grande
número de tarefas de moeda para estabelecer quais são as chances de conseguir cabeças
e quais serão 50%. Da mesma forma, para
estabelecer qualquer reivindicação, você precisa ter um tamanho amostral grande
o suficiente. O tamanho amostral
dependeria de como os resultados são
variáveis e de quão confiante você
precisa estar em sua reivindicação. Digamos que a chance
de casos graves
de febre vital seja de
apenas 10% entre as crianças. Você selecionou
mil crianças com a mesa de febre vital. A eficácia de um medicamento. Este é um tamanho amostral grande
o suficiente? Você selecionou
cem, dez centenas. Você ficou feliz que o tamanho da
amostra é 100000. Mas, na realidade, 90%
dessas crianças vão melhorar. Mesmo sem o remédio. Você está
testando o medicamento em apenas 10% ou 100 crianças que precisam deste medicamento porque seriam indutância de
casos graves. Isso é, na verdade, um tamanho
amostral menor do que você pensava. O tamanho amostral real
é
o domínio digital pelo intervalo de confiança e desvio
padrão caso a caso. Entre a população. Poucos fatores são importantes estimar o tamanho
amostral necessário. Seu nível de confiança, intervalo de
confiança, escore Z, que depende do nível de
confiança, desvio
padrão
e tamanho amostral, é
calculado com base nisso. E não vou
entrar em muitos detalhes, mas é importante que
estejamos cientes. Existem certas maneiras de
calcular o tamanho amostral. nível de confiança é a medida de que você repetirá o
experimento 100 vezes, quantas vezes você
obterá resultado semelhante. Geralmente é usado como noventa e cinco por cento
são a maioria dos casos. O intervalo de confiança
é o grau de ADR. Geralmente é usado
como mais menos 5%. O escore Z é uma medida de quantas áreas de
desvio padrão
da média com base no
nível de confiança que você selecionou, há um escore z para o desvio padrão é
o grau de variabilidade. Se você não sabe de
nada, você pode usar 0,5. Colocando tudo isso, há um cálculo padrão que é raiz
quadrada do escore z multiplicado
pelo desvio padrão, multiplicado por um desvio
padrão menos dividido pelo
intervalo de confiança ao quadrado. Com
nível de confiança de 95% e intervalo de 5%, você obtém um
tamanho amostral de selo de gênero em 85. Então, 4,5 desvios padrão. Portanto, um tamanho amostral de 400 a 500 geralmente é um tamanho
amostral bom o suficiente para a maioria dos casos. Determinar
o tamanho amostral é uma etapa crítica de qualquer pesquisa estatística
ou estudos estatísticos. Porque se isso tiver feito errado, eles entram no estudo
ou nas pesquisas erradas. Houve alguns
casos colossais de ps. Na década de 1950. Estudo da vacina contra a poliomielite em 450
crianças foram vacinadas e 680 mantidas sem
vacina como parte da estabilidade durante um surto de poliomielite, nenhuma das crianças
contraiu poliomielite porque a taxa de contração
foi apenas menos de 1%. Na verdade, o tamanho amostral necessário entre 38 por 1040
mil crianças. Assim, eles poderiam esperar
que 300 a 400 casos de poliomielite seria o tamanho amostral
efetivo para testar a vacina. Havia caminho, muito errado. Isso selecionou quatrocentos
e cinquenta e seiscentos, cerca de 1100 crianças onde são necessárias de 30 mil
a 40 mil crianças. Portanto, a estimativa do tamanho da amostra
e o uso do tamanho amostral do valor
certo é de extrema importância para
todos os estudos estatísticos. Mas, infelizmente, na maioria das afirmações que vemos
para anunciantes, para
produtos diferentes ou até mesmo para políticos, mídia e outras coisas. Todos esses caras, quase todos esses
caras não fazem parte interna, usam um tamanho
amostral adequado o suficiente e o resultado. Nenhuma dessas
reivindicações é gerenciada.
4. 3 números pequenos: Números pequenos. Vamos começar com concordos. Uma cidade tem dois hospitais, um pequeno e outro grande. Um dos dois
hospitais em um mês, 60% dos bebês nascidos pelo qual. Considerando que normalmente é 50%. Qual deles é? O hospital pequeno ou grande? A resposta é o pequeno hospital. Porque, assim como um
pequeno tamanho amostral, casos
extremos ou incomuns. Nesse caso, 60%. Os meninos são incomuns, 50%, Os casos habituais incomuns são
vistos em pequenos tamanhos de amostra, são, neste caso,
pequenos hospitais. Ao investigar casos de câncer
renal em mais de
3 mil municípios dos EUA, verificou-se que o jogo
de
maior incidência de pequenos municípios. Curiosamente, também
foi constatado que a menor incidência também
ganhou de pequenos municípios. Isso significa que municípios pequenos e
menos povoados tiveram a maior e
a menor incidência. Esse é o caso
de números pequenos. E por que isso acontece. Vejamos um condado
muito pequeno com apenas ficar em adultos. Como é apenas em adultos, é altamente provável que o
nano tenha câncer. Ele mostrará 0. Mas se apenas uma pessoa for
cancelada por acaso, ela também mostrará 10% de
incidência, o que é muito alto. Isso significa que se a conta for pequena, provável que ela
seja poupada de muitos casos. E só se tiver alguns, mostrará altos
casos de incidência. Portanto, pequenos municípios
mostrarão incidência alta e baixa. Pequenos distritos
com população baixa sempre
mostrarão resultados
extremos. Onde em distritos maiores, casos populacionais
inteiros vivemos para mostrar resultados mais
médios. Uma cadeia de supermercados
descobriu que lojas menores apresentaram menor
e maior pegada
por unidade de área e
vendas por unidade de área. Tamanho amostral menor
tem maior probabilidade de mostrar resultados extremos
devido à aleatoriedade. E uma amostra maior
representa melhor uma população. É por isso que ouvimos
algo chamado lei de grande número
em estatísticas. Para fazer qualquer conclusão, você pode depender apenas
de grandes números e quando um grande número de coisas
mortas para fora da média. Agora, como no caso de números
pequenos as coisas
obtêm resultados extremos? Vamos dar outro exemplo. Digamos que, como alunos
que ainda são 100 quartos com cinco
alunos em cada um. Do total de 500 alunos, 25 receberam uma vantagem no exame. Isso significa que muitos
dos quartos têm 0% de alunos com um
plus porque há apenas 25 a mais estudantes
e 100 quartos. Mas se um quarto acabou de
ganhar um aluno mais, ele mostrará 20% de casos de mais
um aluno dividido
por cinco, ou seja, 20. O quarto tem para os alunos,
por acaso,
mostrará 40% de casos de um plus. Você pode ver devido ao fato de
que os quartos são pequenos, qualquer figura ficará exagerada. É assim que
existiam pequenos números nos resultados. E essa é a nossa lei
de grande número precisa número
maior para
fazer uma conclusão.
5. 4 problemas médios: Problema médio. Uma das
formas mais comuns das estatísticas
é, é, como alguém
de muitos dados. A média é provavelmente a estatística
sumária mais usada. Gostamos de resumir muitos
dados em uma figura. E essa é a
popularidade da média. Ouvimos declarações como economia criarão 20 mil
empregos por mês. Isso é um valor médio. País teremos 20 polegadas de precipitação e outra média aqui, cerca de aumento salarial médio de 10% ao ano e assim por diante. Mas todos esses
números médios podem ser realmente enganosos e podem ocultar
mais informações do que o show. Por exemplo, alguns meses
podem adicionar 50 mil empregos, enquanto alguns outros meses podem
adicionar Justin mil empregos. Então alguém de 20 mil
não significa muito. Da mesma forma, algumas partes do
país podem ser inundadas. Onde pode haver
seca em algumas outras partes. Portanto, precipitação média de 20 polegadas em um país não
significa nada. Da mesma forma, o
salário de algumas pessoas pode dobrar, onde alguns podem não
vê-lo aumentar. Portanto, um
aumento salarial médio de 10% é informação
absolutamente inútil, no que diz respeito ao
entendimento do
aumento real da preocupação com os salários das pessoas. Dizem que não atravesse um rio se for, em
média, quatro pés de profundidade. Como o rio
pode ter 20 pés de profundidade, adicione algumas faces do que apenas um ou dois pés de profundidade em
outros lugares. Então, uma média para profundidade livre,
ou seja, se você está tentando
atravessar o rio pensando que
será para impressão em
média, um bêbado. Um dos casos dramáticos do problema de usar
a média foi o que os cientistas descobriram durante os anos anteriores de
rastreamento do aquecimento global. Nesse ponto, os cientistas estavam olhando principalmente para o aumento
médio temperatura e
tentando correlacionar isso com os campos de gelo filtrantes
ou polares, eles ficaram surpresos
ao descobrir que mesmo se a temperatura média
permanecer a mesma, mais do que mais calotas polares, estamos ficando derretidos ano
após ano. Mais tarde, descobriram que
mesmo que a média permaneça a mesma, anos com os altos picos temperatura causaram
mais demanda dos olhos. A média não era muito útil. Da mesma forma, tente olhar
para dois
casos em que uma pessoa bebe uma
cerveja todos os dias durante 30 dias. Então, isso é em média
uma cerveja por dia. Enquanto outra pessoa
não bebe cerveja por 29 dias e na 30ª data, ele bebe 30 anos. Em ambos os casos, a média
é de uma cerveja por dia, mas o impacto de beber
cerveja será muito mais grave, seria fatal
no segundo caso de
beber 30 cervejas por dia. Da mesma forma, a média pode
ser realmente enganosa. Outro famoso caso de
problema com médias onde em 1997 a inundação
de Grand Forks, a cidade tinha um dique de 51 pés. Mais de 49 pés
previsto o nível de água do rio, o que era uma média. Mas em alguns lugares
durante uma enchente, a água atingiu 53 pés mesmo que a média
permaneça para o jantar. Mas nesses casos ou deslocamentos, a água violou o dique, causando sangue para a cidade. O uso de médias
depende das médias porque as inundações
nas médias da cidade podem ser
enganosas de muitas outras maneiras. Vamos tomar o caso da expectativa de vida
média. Por exemplo, em 19 centenas, expectativa de vida
média
ao nascer era de 30 anos. Mas esses 32 anos não significam
nada. Isso não significa que
todos morreram aos 32 anos. Muitas dieta em bart, muitas dieta abaixo de cinco anos
morrem durante a guerra travada. Mas aqueles que sobreviveram a todos viveram até os anos sessenta
e setenta, assim como hoje, a
média chegou a ser 32, mas esse número
realmente não significa nada. É por isso que
não há empresa média. Não há flutuação média
do mercado de ações. Não há guerra média, epidemia, nem campanha de marketing média, nem venda média de livros. Na maioria dos casos, a distribuição
pode ser muito distorcida. Um monarca médio
significa qualquer coisa. Por exemplo, no lado esquerdo, você vê que é uma inclinação negativa
da distribuição
onde a evidência é movida para o lado esquerdo
e direito, você pode ver uma inclinação positiva onde a média é moveu-se
para a luz porque é. Em detalhes para a direita, somente no caso
das médias de distribuição normal central no centro. E por isso é
um pouco significativo, mas em todos os casos reais, distribuição de valores
é sempre distorcida. E, como resultado, a média não transmite
nenhum significado muito útil. No contexto do resumo
estatístico, três tipos de
médias são usados. Eles são chamados de média,
mediana e modo. média é a média
aritmética simples. Vamos levar o exemplo mostrado
na tabela à sua esquerda. Digamos que em uma sala, há 20 pessoas. Seus salários são
mostrados nas colunas. Seus salários variam
entre US $20 mil por ano e US$3 milhões por ano. Então, o salário médio é que
ele mitiga a média, que acaba por
ser 248.750 Donner. Agora, a mediana é o
salário no meio quando todos estão organizados em ordem crescente ou
decrescente. Nesse caso, ele está
chegando a ser de US $56.500. Modo é o valor salarial
que mais ocorre nisso, se você vir 60 mil vendedores ambulantes duas vezes versus todo o
resto operando uma vez. Então, US $60 mil é o modo. Como você pode ver, quando poucos outliers podem alterar a média ou a mediana
é um resumo melhor. Nesse caso, entre 20 pessoas, apenas duas pessoas têm salário
muito alto, US$1 milhão em US$3 milhões. O resto deles está
entre 20000.95000. Assim, para valores altos
ou distorcer os meios. Veja se alguém diz que o salário
médio das pessoas
na sala é de US$248 mil, isso não reflete a verdadeira natureza dos salários
que as pessoas na sala. Então, em comparação com essa mediana, que é de US $56 mil, é uma representação muito melhor. Em todos os
casos em que alguns outliers podem médias
fortemente distorcidas. A mediana é uma melhor estimativa
das estatísticas médias. O modo neste caso também
é um pouco útil, mas em muitos casos algo pode não acontecer mais de uma vez. Então, mais homens podem ser usados. mediana é uma estimativa melhor
em muitos casos que são fortemente influenciados por outliers
altos ou baixos. Mas em todos
os casos práticos em que a distribuição é fortemente
inclinada para um lado ou outro, não das médias médias, mediana ou modo podem ser usadas. Vamos dar o
exemplo do câncer. Muito tempo o Dr.
contará a uma base de câncer e que ele acabou de fazer uma licença monstro ou
18 meses de vida. O paciente
não deve perder o coração. Porque esses 12 meses ou 18 meses podem ser um valor
médio e mediano. E isso pode ser
fortemente distorcido porque pode
haver muita gente
morrendo imediatamente
ou depois das filmagens. É minha diferença que o paciente
sobrevive nos primeiros meses. Ele ou ela pode esperar
viver uma vida muito mais longa. Porque mesmo o modo pode
ser altamente movido para o lado direito ou para o maior número
de meses ou anos. Veja o caso
da distribuição C, onde tanto a média quanto a
mediana estão para a esquerda, mas o número real
de pessoas que vivem muito maior do que a média e a
mediana é para a direita. Assim, pode-se até deixar
6070 anos mesmo depois ser detectado com câncer
e isso aconteceu. Vamos dar outro exemplo. Digamos que 80% das empresas, tenham US$90
milhões em vendas e apenas 20% das empresas
tinham US $60 milhões de células. Se você calcular a média, verá
que a média
é de US $84 milhões. Mas neste caso, 80% das empresas
que estão acima da média, o que é meio
difícil de compreender. É contra-intuitivo. Mas muitos casos, as médias fornecem um contador, contra-intuitivo e às vezes intencionalmente um resultado de
flexão de barra. E pessoas que acabam tomando decisões erradas
usando amperagem. Portanto, sempre olhe para a distribuição e tome
uma decisão com base nisso. Nunca decida com base em
números médios. Cálculos médios
às vezes levam a informações
muito confusas e
enganosas. Por exemplo, a
China média não vem de famílias
médias
porque o cálculo da criança
média e o cálculo da família média não
são os mesmos. Ilustrado isso,
digamos que
haja uma aldeia com
100 famílias. Um número de filhos
por família é como Inserir uma tabela na sua próxima. 100 famílias são divididas em cinco grupos de 20
famílias, cada uma. Primeiro grupo como 0 crianças. O segundo grupo tem um filho. O grupo duro tem dois filhos para
o grupo tem três filhos. E o quinto grupo formou crianças. Se a questão for, qual é o número de crianças
para uma família comum? Você tem que calcular
o número total de crianças multiplicando a coluna da esquerda para a
coluna direita, que levará a 200 crianças e você dividirá 200 famílias. Ele dará o
número médio de crianças ou familiares, que é 200 dividido
por 100 também. Mas se houver uma pergunta, criança
média vive com
famílias com quantos filhos? A resposta não é dente. Isso significa que, embora a família
média tenha dois filhos, mas as crianças comuns não
vivem em uma família de kit de ferramentas. É confuso. Mas vamos dar uma
olhada nas crianças. Crianças. Não há crianças no primeiro grupo
porque há 0 crianças. Agora, no segundo grupo, isso é um total de 20 crianças. E eles viviam em uma
família de um garoto. No terceiro grupo
que são 40 crianças. E então eles vivem
em uma família de crianças. O quarto grupo
que são 60 crianças, 20 multiplicado por três. E todas essas 60 crianças vivem
em uma família de três filhos. No grupo final
que são 80 crianças, porque 20 famílias multiplicadas
por quatro crianças AT kids. E todas essas 80 crianças
vivem em uma família infantil pobre. Então, para calcular
o número médio de crianças com as quais uma
criança média vive, você precisa multiplicar
20 por um. Como 20 crianças vivem
em uma família de crianças, 40 crianças vivem em uma família de
kit de ferramentas, 60 crianças vivem em uma família complicada e 80 crianças vivem em uma família
pobre de bolso infantil. E você tem que
dividi-lo pelo total Kids, que é 200. E
ele ganharia três. Isso significa que a criança média vive
em uma família acionada, enquanto famílias médias
ajustam kits de ferramentas. Da mesma forma,
funcionários médios não trabalham em uma empresa média. Ele será
inclinado para uma empresa maior. Por exemplo, aqui você
vê que as crianças médias estão enviesadas para
famílias maiores com mais crianças. Da mesma forma, o
cidadão médio não vive em um país médio. cidadão médio será enviesado em relação a países
de alta população como Índia, China, EUA. É assim que as médias podem
ser realmente confusas. Veremos outro
exemplo para mostrar como o aluno
médio não
vai para a faculdade média. Porque os
alunos médios e
as faculdades médias não são
calculadas da mesma maneira. Cts para faculdades com
alunos até a mesa. faculdade é pequena, tem mil alunos. faculdade dois tem 3
mil alunos. A árvore da cartilagem tem 10
mil alunos, e a faculdade tem
30 mil alunos. Há um total de 44
mil alunos. A primeira pergunta é qual é o número médio
de alunos por faculdade? Para a faculdade total de 44
mil alunos. Portanto, o número médio
de alunos por faculdade é de 44 mil
dividido por quatro, ou seja, 11 mil. A segunda questão é metas
médias dos alunos para a
faculdade com quantos alunos? Esse cálculo é muito
diferente porque na faculdade, 11000 alunos vão para a faculdade com outros
mil alunos. Na faculdade, 3
mil alunos vão para a faculdade com 3 mil
alunos na faculdade, 310 mil alunos vão para a
faculdade dentro de 1000 alunos. Na faculdade para 30
mil alunos vai para a faculdade de 30
mil alunos. Assim, o aluno médio
vai para a
rede universitária 10 mil ao quadrado, 30 mil ao quadrado,
3 mil ao quadrado, 1 mil ao quadrado dividido
por 44 mil alunos. Então, chega a 22.954. Então, mesmo que a faculdade
média tenha apenas 11 mil alunos, mas o aluno médio
vai para a faculdade de 23 mil alunos. Da mesma forma, a população média por país é de 39 milhões porque existem cerca de 7,8 booleanos e cerca de 200 despensas. Você divide esses 7,8
bilhões com 200, você chega a cerca de 39
milhões de pessoas por país. Mas o cidadão comum
vive em um país que é lábios com muito mais pessoas, quase como dez
vezes mais pessoas. É assim que o país médio e o cidadão médio
não são a mesma coisa. Faculdades
médias de estudantes e médias não
são a mesma coisa. Muitas vezes, esses números são usados
intencionalmente por veículos
diferentes. E eles retratam
esse valor médio que atende seus parceiros.
6. 5 apoios do Simpson.: paradoxo de Simpson. Entre 196319, oitenta, a pontuação média verbal
e matemática SAT de todos os alunos dos EUA caiu
5040 pontos, respectivamente. São grandes gotas. Isso levou a uma indignação
nacional. E o
painel presidencial foi formado. Eles investigaram
os resultados e publicaram um relatório infame
chamado Nation at Risk. Isso leva a medidas
drásticas subsequentes, uma revisão completa
do sistema educacional, lutando contra muitos
professores e assim por diante. No entanto, investigações posteriores descobriram que, curiosamente, quando todos os
alunos foram
divididos em grupos de
renda individuais, todos os grupos viram um aumento na
pontuação do SAT entre 19631980, embora grupo de todos os
alunos juntos. Então, em graus. Este é um exemplo do paradoxo
simples de Simpson. E isso é visto em grandes
casos diferentes. Para ilustrar o ponto, para mostrar como isso acontece, digamos que no ano de 19631980, todos os alunos
poderiam ser divididos em três grupos principais ou grupos de
renda para
classe média e ricos. Em 1963, esmagadoramente 70%
dos alunos vieram de famílias
ricas e apenas 20, 10% vieram de famílias de classe média
e pobres. E suas
pontuações médias em Matemática, respectivamente com 554 chegam 500 para a classe média
e 404 board, a média geral foi de 525. Essa mistura mudou completamente
em 1980 porque entre 6380, o número total de alunos
aumentou muitas dobras. E todos eles aumentam o jogo de alunos pobres e de
classe média. Agora eles são
40% cada um de todos os alunos que reduzem a proporção de
alunos ricos para apenas 20%. Agora, todos esses três grupos, pontuação
Matt SAT foi maior. Para os alunos, a pontuação foi de 420, que foi contratada por 20. pontuação dos alunos de classe média foi de 520, o que foi maior em 20 pontos. Enriquecer a pontuação dos alunos foi 560, o que também foi contratado
por dez pontos. No entanto, a
média geral em 1980, foi apenas para 88 porque
o mix total agora é diferente e mais
estudante estrangeiro e alunos menos
proporcionais alcance. A média geral
desceu de 525 em 1967 em três para 488 em 1980. No entanto, todos os grupos
individuais viram um aumento na média. Met é uma Discórdia. Isso é o que se chama paradoxo de
Simpson. O paradoxo de Simpson tem o
nome de um matemático
Edward Simpson. Ele descobriu isso em 1951. Ele diz às vezes um
resultado ou o treinado visto quando os dados são segregados
em grupos diferentes. Mas quando todos esses
grupos são reunidos, esse resultado é treinado, eles são revertidos.
Ela desaparece. Vejamos os dois
gráficos à sua esquerda. No gráfico acima, você vê todos os dados
juntos em pontos cinzentos. Aqui. Se você olhar para ele, você
veria que é uma tendência crescente
da esquerda para a direita. Quando você divide esses pontos cinza em quatro
cores diferentes de verde, amarelo, azul e vermelho. Você vê para o verde, é uma tendência decrescente. Para o amarelo, é uma tendência decrescente
da esquerda para a direita. Do azul, é novamente
uma tendência decrescente. Para o vermelho, é uma tendência
ligeiramente crescente mas não tão dramática
quanto os pontos cinzentos. Basicamente, todos os grupos
individuais mostraram
trens diferentes em comparação com todos os pontos quando eles são
montados em um formato de grade, o que significa todos os pontos
que andavam juntos. Isso é o que se chama paradoxo de
Simpson. O paradoxo de Simpson está presente em muitas áreas e
confundiu a tomada de decisões. Vamos dar uma olhada em
alguns outros exemplos. Novamente, este é um exemplo da vida
real. Em qualquer programa de doutorado universitário. Foi encontrado. Que 50% dos
candidatos do sexo masculino estavam sendo aceitos ou simplesmente arrumados 8% mulheres candidatos
estavam sendo aceitos. Isso levou a muitos
debates e discussões sobre ter um viés
contra as mulheres. Mas uma investigação mais aprofundada
mostrou uma tendência diferente, onde todos os programas
de doutorado foram divididos em doutorados em ciências
naturais e doutorados em ciências
sociais. Ele foi encontrado para
esses dois tipos diferentes programas
de doutorado. Mais mulheres estavam sendo
aceitas do que homens, um candidato a emprego do dia do parson. Mas as mulheres se
candidataram predominantemente ao programa de doutorado em ciências sociais, que havia comparado ao programa de doutorado em
ciências naturais uma taxa de aceitação muito menor para estudantes masculinos e
femininos. E esse tipo de viés, essa aceitação de nível agregado para as mulheres, como isso acontece? Vamos dar uma olhada na dica. Assim, 80% dos estudantes do sexo masculino estavam se candidatando a Ciências Naturais, 20% para ciências sociais, enquanto que para as mulheres, 30% estavam
se candidatando a ciências naturais, e esmagadoramente
70% estavam se candidatando para Programa de doutorado em Ciências Sociais. Agora, para os homens, o
nível de aceitação para a ciência natural, somos 60% e para
as mulheres era de 80%. As mulheres tinham maior nível de
aceitação para programas de doutorado em ciências
naturais. Da mesma forma para o programa de doutorado em
ciências sociais, os homens tinham 10% de nível de aceitação e as mulheres tinham 20% de
nível de aceitação duplo. Mas à medida que mais e mais mulheres se candidataram ao programa de doutorado em
ciências sociais, que tinha um programa de doutorado em
ciências naturais
concorrente de aceitação muito
menor . A aceitação geral para o homem
foi de 50% e as mulheres foi de 38%. Novamente, quando
analisada individualmente, é uma marca de tendência única. Quando olhado para agregado, é uma tendência diferente e
parece e gasta. Portanto, toda vez que você vê uma tendência de dados enquanto
olha para muitos dados juntos, lembre-se de que,
se houver uma
maneira de dividir todos os dados
em grupos significativos, grupos
individuais podem mostrar um drenado completamente diferente, uma tendência oposta em comparação com todos os dados em grade que
você precisa ter cuidado. É visto nos negócios. Pesquisa. O tempo todo. A empresa vendeu janela
asean dividida AC. Verifique o feedback de 1000 clientes de cada produto. Então, mil clientes que compram AC split, o verificado. E como é mostrado na tabela
à sua esquerda, 800 e dizem que a luz se divide AC, ou
seja, 80% das pessoas
gostaram de split ac. Da mesma forma, mil clientes que compraram o Windows ISE, eles verificaram e
setenta e cinco por cento das pessoas disseram que
gostavam de janela AC. Então eles concluíram que o MAC
dividido é mais apreciado. A coisa reverteu quando os clientes foram
divididos em homens e mulheres. Assim, de 1 mil AC
split, 900, onde os principais clientes, 100
onde cliente feminino. 900, clientes do sexo masculino, 750 disseram que gostaram de AC split, então eles fazem os 3%. E entre 100 mulheres clientes, 50 disseram que a divisão de luz
é que é 50%. Mas para a janela AC, do
total de 1800
milhões de clientes, de oitocentos e
setecentos e cinquenta disseram gostavam de janela
AC, então isso é de 88%. Duas 100 eram mulheres clientes
que compraram janela e C e 150 janela de luz
e vêem que é 75%. Como você pode ver, que 83% dos
homens gostaram de dividir AAC em comparação com 88% dos homens que gostaram da
janela e vêem, quando você olha apenas para os clientes
do sexo masculino, mais clientes gostaram. A janela é semelhante quando você está olhando apenas para as clientes do
sexo feminino, 50% como SE dividido e setenta e cinco por cento de janela de
luz SE. Então, novamente, mais clientes, mais clientes do sexo feminino, Mike, janela AC, mas mais clientes do
sexo feminino gostam de janela que vejo em ambos os clientes do sexo masculino
como janela e vejo. Mas quando você não estava
colocando clientes masculinos e femininos juntos, no nível agregado, você está vendo uma tendência
diferente de mais pessoas gostando,
gostando de dividir. Então esse é outro exemplo
de cidadãos, Benedict. Agora vamos analisar alguns estudos de caso em
empresas para ver como paradoxo de
Simpson pode ser identificado como um problema em
potencial e o que fazer a respeito. Em uma pesquisa de mercado, os dados mostraram que entre o ano dois mil e
dois mil e quinze, o gasto médio
por domicílio em determinada
categoria de produto diminui de US$120 em 2 mil
a US$95 em 2015. Agora a questão é:
isso é uma tendência descendente? Ou você deve interromper essa linha de produtos
com base na rua? A resposta é
que, apenas observando essa tendência geral
de todos os dados, você não pode tomar essa decisão. A representação
desse problema é o problema paradoxo de
Simpson
que descobrimos. E para avaliar se algum
grupo pode ser descontinuado, você precisa tomar uma decisão
com base em subgrupos potenciais. Então você tem que
investigar dividindo o crescimento total em algum subgrupo significativo
que pode se comportar de forma diferente. E verifique se o mesmo trem estes estão sendo vistos
para cada subgrupo. Individualmente, o
subgrupo poderia ser baseado em grupos de renda, famílias de
alta renda, renda média e
baixa renda. É a mesma tendência
em todos esses grupos? Poderia ser baseado em clientes masculinos
e femininos ou termos de
localização ou qualquer
outra coisa que possa ser
significativa para seus dados. Todos esses
grupos individuais e também mostrando uma diminuição nos gastos, então você pode tomar uma decisão. Mas as chances são de que
possa haver outros fatores que
contribuam para
esse grupo geral versus grupos individuais
mostrando uma tendência diferente. Se for esse o caso, você deve continuar, você deve continuar
com esta linha de produtos. Vamos dar uma olhada em
outro estudo de caso, o que é novamente um problema comum. Como os dados de venda entre
20142019 mostraram que a barra de preços
medidor quadrado de imóveis
caiu 10% em um CTE. Essa é a tendência
imobiliária descendente? Novamente, este é um problema
paradoxo de Simpson porque como o mercado imobiliário pode ser dividido, segmentado
e agrupado em resíduos. Para decidir se é
uma tendência descendente, você precisa olhar para alguns grupos. Você tem que investigar
dividindo todo o grupo em diferentes subgrupos que podem
ser baseados em locais para ver onde você está vendo a mesma tendência em todos os locais, pelos tipos de casas, pelo tamanho das casas. É provável que você veria que grupos individuais estão
mostrando tendências diferentes. Talvez alguns estejam mostrando
aumento no preço. Mas enquanto algum outro fator, talvez esmagadoramente um tipo de habitação esteja sendo vendido em
uma quantidade muito grande. E, como resultado, estou mudando a tendência
para todo o grupo. Considerando que grupos individuais podem estar mostrando uma tendência diferente, como a maneira como resolvemos para baixa renda média e alcançamos
as habilidades dos alunos na pontuação SAT. Somente depois de investigar
a tendência no subgrupo, você pode concluir
se essa tendência diminuição
dos preços
imobiliários é gerenciada. Da mesma forma, há
muitos casos toda vez que você vê um grupo
de pontos de dados, tenta dividi-lo em grupos
diferentes e ver se esses grupos estão
mostrando a mesma tendência. Porque você tem que tomar cuidado o problema do paradoxo de
Simpson.
7. Correlação com efeito de causa: Causa, efeito e correlação. Quando dois eventos acontecem
juntos e em mudanças
positivas ou negativas em um evento estão associados a uma
mudança semelhante no outro evento. Diz-se que eles estão
positivamente correlacionados. Quando essa relação
é oposta, diz-se que
eles estão
negativamente correlacionados. Há muitos casos em que as coisas estão
correlacionadas positivamente. Por exemplo, há
uma correlação de 0,3. Um coeficiente de correlação
é calculado e certa forma, não
entraremos neles. Mas há um certo nível
de correlação positiva entre o GPA universitário
e a renda subsequente. Há um maior nível
de correlação entre QI e desempenho médio no trabalho. Há um nível muito
maior de 0,7 correlação entre
altura e peso. Pessoas mais altas são mais pesadas. Correlação ainda maior entre escore
matemático SAT de dois anos
consecutivos. Então, estes são nos casos em que as coisas estão positivamente
correlacionadas. Agora, duplos problemas comuns e falácias na
tomada de decisões. Relacionado à correlação r, um é chamado de falácia post-hoc. Quando o evento
decorrido aconteceu após um evento, diz-se que
eles
foram formulados e diz-se que um evento está causando outro Richmond
e fez um caso. Outro é *** hoc, ergo propter hoc, que é quando dois eventos
acontecem juntos. Um deve ser por causa de outro evento que
pode não ser o convidado, porque correlação
não significa causalidade, dois eventos estão correlacionados
não significa que um está causando a falsa causalidade ou pensando que um evento está
causando outro falsamente. Sua mãe de toda a logística
estatística quando dois eventos
acontecem ao mesmo tempo. Portanto relacionado, mas correlação
não significa causalidade. Se dois eventos aconteceram
ao mesmo tempo, não
significa que um está causando outro. Todas as manhãs. Galo, corvos. E nascer do sol não significa que
esse galo cause o nascer do sol, acontece ao mesmo tempo. Galos antecipa no Sunrise e cresce e os elementos
do nascer do sol, estão correlacionados, mas um não
está causando o outro. Há algo chamado correlação
espúria porque, por acaso, dois
eventos podem ser correlacionados, mas não há nenhuma
relação. Vamos dar alguns exemplos. Se você traçar
as vendas de iPhone nos EUA e cair causado por
dobras abaixo das escadas, você veria um nível
muito alto de correlação
positiva
porque ambos aumentaram
ao longo
dos anos. Mas há
absolutamente, como sabemos, não para isso nenhuma causalidade real entre nenhuma relação entre. Da mesma forma, se você traçar o consumo bar capita de
como o xarope de milho frutose, que caiu e gastou em esportes espetaculares para espectadores você veria que um está aumentando, enquanto outro é diminuindo. Apenas dois eventos, há
uma correlação espúria. Da mesma forma, se você
olhar para os visitantes que Universal Studio de Orlando e as vendas de
carros novos, você veria os dois. Eles estão descendo, mas novamente, eles estão apenas ficando para baixo. E quaisquer relações
entre eles e associação
espúria podem ser completamente coincidentes
ou espirituais. Já faz muito
tempo e isso é extremamente exemploso que, se esses dois eventos estiverem
um pouco relacionados, pode-se concluir falsamente, ou pode-se manipular para
mostrar aos outros que eles
estão relacionados mãos, uma está causando a outra. Você tem que tomar cuidado com isso. Tabela dois por dois são quatro vezes. Tabela é uma tabela estatística que pode ajudar a tomar decisões. É uma maneira robusta de ver quão forte é a correlação
e a causalidade. Então, se algo está causando
alguma coisa, é por exemplo, muitas vezes você verá
pessoas dizendo que 20 pessoas com
gripe tomaram remédios e ficaram bem depois de
cinco dias em comparação com apenas dez pessoas que ficaram bem
sem tomar medicamentos. Portanto, o
medicamento está infectado. Mas, para verificar se o medicamento é efetivo ou não, você precisa preencher
a tabela de formulários completos. De um lado, você tem que olhar para as pessoas que tomaram Madison versus
que não tomaram remédio. E então, do outro lado, você tem que olhar para as pessoas que
melhoraram depois de cinco dias versus não
melhoraram depois de cinco dias. Se o total de 30 pessoas para
medicina melhorou. E Dan não melhorou. E se um total de 15 pessoas
tomaram remédio e dez Deus amargo e não
melhorou do que você não pode
concluir nada. Porque a relação entre
201010 a cinco é a mesma. Mas se tivéssemos nosso perjúrio
Pessoas que não tomaram Madison e depois
melhoraram e 20 não
melhoraram do que você pode dizer, ok, remédio está ajudando. Da mesma forma, você pode
criar diferentes
para, para que a tabela procure informações
adicionais que você possa conectá-las
para tomar decisões. Às vezes, a causalidade
pode estar ao contrário. Se o pai der um relatório que
diz que empresas com mais mulheres em sua
diretoria ou mais lucrativas ou maiores que o tamanho. Isso pode significar que empresas com mais mulheres são
mais lucrativas, ou também pode significar que empresas
mais lucrativas
estão contratando mais mulheres, que é o que realmente
não está claro. Da mesma forma, as principais faculdades afirmam que seus alunos
têm melhor desempenho. Agora, se os alunos têm melhor desempenho por causa
das faculdades ou dos principais alunos estão indo para as principais faculdades não
é muito claro. Estas são as causalidades
que podem ser revertidas. Em dois eventos consecutivos, o agricultor muitas vezes é visto
para causar a carta, mas o que pode não ser o caso, que muitas vezes não são décadas. Mas essa falácia é
chamada de falácia post-hoc. É como falácia
relacionada à correlação. Essa piada, diz os homens organizados, seu médico pediu-lhe para parar fumar e outro velho
disse: Oh, não faça isso. Alguns dos meus amigos só
com o fumo e eles morrem. Esta é uma maneira engraçada de
colocar os moribundos
não tem nada a ver com
parar de fumar, mas eles aconteceram depois
do teste de fumar. Muitos casos reais, um evento acontece completamente
sem fosforilado, não impulsionado por nada. Mas as pessoas adivinharam que isso foi por causa de algum outro
evento que acontece com o famoso caso de nossa pulseira de holograma
balanceada se tornou uma crista global
entre 200712, milhões de dólares foram
gastos nele como pessoas, incluindo esportistas,
em relação ao produto estava melhorando sua capacidade
atlética. Mais tarde, ensaios randomizados
duplo-cego descobriram que não havia nenhuma
relação entre usar essas pulseiras e habilidades atléticas em
todos os atletas estavam treinando, as pessoas estavam tentando perder
peso e ficar melhor, mais atlético, e
havia melhorado. Isso não teve nada a ver com o
uso desta luta livre. Mas isso aconteceu porque as pessoas achavam que o prêmio que esses seios
levavam e que Deus melhor. Então, foi a
causalidade, a correlação de Paulo. Outro caso de dois
eventos acontecendo
ao mesmo tempo fazendo parte
de um causando o outro. Em 1990 a 30 adolescentes americanos que freqüentemente jogavam um determinado videogame
cometeram suicídio. Isso criou um alarme nacional, pensando que os videogames
estavam causando o suicídio. Mas
investigações adicionais descobriram que taxa de suicídio de
adolescentes naquela
época era 12 por 100 mil, já trim milhão jogava
o jogo regularmente. Então, 360 pessoas
estatisticamente propensas a cometer suicídio entre pessoas
que jogaram o jogo. redimensionamento de Tertius
não era um grande número. Isso leva
alguém a pensar que o suicídio foi
devido ao portão. Novamente, uma falsa causalidade porque ambos os eventos
acontecem ao mesmo tempo. Todos os tipos de empresas
reivindicam todos os tipos de correlação entre sua
ampla melhoria de acidentes, mas que não são décadas. A empresa diz que o
shampoo leva a tomar a cabeça. No entanto, a realidade pode ser que as pessoas
escolheriam o cabelo dela usando o shampoo em primeiro sugere mostrar a causalidade
reversa. produto dietético afirma como
é usado Lauren o molhado, mas as pessoas que usam o
produto estariam fazendo outras
dez coisas, como
se exercitar, comer menos. Aqueles estão causando
perda de peso e produto não ruim. Empresa de cerveja afirma que ter
cerveja melhora sua doença. Mas não pode haver
nenhum relacionamento porque mais
e mais pessoas saudáveis poderiam estar bebendo cerveja, então elas já estão
tendo amargamente duro. Mas essas causalidades que
eles estão alegando
porque poderia ser apenas uma loucura
espúria. Outro
fator importante relacionado à correlação é que a
afinidade é erroneamente assumida que a
correlação farmacêutica além dos dados com os
quais foi estabelecida. Por exemplo, com
o aumento da chuva, milho cresce mais alto, mas além de um certo ponto,
torna-se mais curto. Mais uma vez. Salvar os dados é de até
alguns centímetros de chuva, então isso deve terminar. Mas, porque se inundar, tudo pode ser destruído. Da mesma forma, a educação é uma correlação positiva
com o ganho, mas até certo ponto, talvez até o
mestrado porque PhDs, a menos que essa correlação não
seja Judy de 5 bits. Da mesma forma, a
felicidade das pessoas sente falta dele para aumentar com o
aumento do dinheiro. Mas até certo ponto. E depois disso, pode não mudar muito ou pode
ter diminuído. Esse é o caso, então,
as pessoas mais ricas que teriam sido as
pessoas mais felizes deste mundo. Mas esse não é o
caso ao mesmo tempo,
se for o relatório de alguém, o que significa, eu ficaria muito feliz. Então, inicialmente com
o aumento do dinheiro, a felicidade enlouqueceu de fato, as pessoas descobriram isso. Mas depois de um certo nível que mudou em 19,
bastante significativo. Novamente, a relação
ou correlação ou causalidade pode existir até certo ponto que
são verificados além
disso, não deve ser aumentada
para cinco maturidade.
8. 7 a batimentos: Correlação de status. Os números estatísticos são
usados por jornalistas, anunciantes, chamados
especialistas, vendedores e outros. Muitas vezes, envie mensagens e
manipule pessoas. Esse processo é chamado de correlação de
status. Aqui está um isento. Você veria anunciantes
em lojas de insano 50%, 20 venda em nuvens. Muitos podem pensar que é um desconto
total de 70%. Mas, na realidade, é a primeira dívida de
50% no saldo, 50% e outros 20%
do total de vendas é de 50% mais 20% de
50%, ou seja, 10%. Portanto, o total de 60% acredita que
dizem total de 60% de venda. Isso criará menos impacto. É por isso que eles dizem 50% mais 2%. Ele verá isso o tempo todo. Estes são dois
manipulam as pessoas. Da mesma forma, os jornalistas
informarão que em um dia é encerrado em
uma cidade ou em um estado, uma perda econômica
tão grande. Sempre esses números são, números são calculados com base em todas as
atividades econômicas possíveis que podem potencialmente acontecer em um
dia, o que nunca acontece. Mais importante ainda, quando
um dia encerrar, maioria dessas atividades
econômicas será transferida
para o dia seguinte. Eles realmente o impacto
é muito menor. Mas os jornalistas
gostariam de ter seu interesse em suas notícias. É por isso que eles dão
um dedo tão alto para que mais pessoas leiam
notícias, notícias como grandes empresas, não
tenham intenção de
lhe dar informações. As pessoas muitas vezes
somam nossa idade Cindy, existem altamente, isso muda. Por exemplo, dizem que o custo do
material subiu 5%, nunca 7%, a utilidade em
13%, o transporte em 15%. Portanto, o custo total
é de 40% em bits. Bizarro, você pode
pensar nisso. Você diria que talvez
muitas pessoas não façam isso, mas as pessoas fazem isso. Este não é um caso de correlação de
status. Se você quebrar o custo, você verá isso. Por exemplo, digamos que os últimos 60% do
custo fosse material, 30% de mão-de-obra e
utilidade para cinco pessoas e 5% de transporte. Esses 5713, 15% de aumento no custo basicamente aumenta
os custos gerais 6,5% um valor insignificante. Mas muito poucas pessoas
vão ver através disso. E veremos que o impacto total
no aumento do custo explica 5%. As empresas, especialmente empresas de
consultoria ou empresas de serviços, muitas vezes veem que têm mais de 200 anos
de experiência
combinada em sua gestão. Há estranhamente
papel com negadores, cada experiência se torna 200
anos de experiência combinada. Isso não significa nada. É apenas correlação de status que
mostra uma
figura artificialmente e
completamente arbitrária para dar
a impressão de que uma empresa
tem muita experiência. Se uma empresa cortar o salário
dos funcionários em
25% 1 ano e
aumentá-lo em 25% no próximo ano. Pode alegar que
deu às pessoas lá e o salário, o aluno caiu 6,25%. Novamente, essa é outra maneira de
se manter discriminado. O lucro líquido de uma
empresa aumentou de 2% no ano passado, 4% este ano. Pode-se afirmar que o lucro
aumentou em dois pontos percentuais, mas isso não soaria bom. A melhor maneira de afirmar é
que a taxa de caldo
aumentou 102% para 4%. Isso dará um impacto muito
maior. Mas as pessoas fazem, faça-as. Outra forma de status
para permitir que a doença seja
um tipo diferente de
cálculo. Um dedo. Por exemplo, a
renda familiar pode ser calculada dividindo
a renda total por número de domicílios. Essa é uma maneira de
calcular ou multiplicar a
renda média per capita pelo número médio
de pessoas em um domicílio. A segunda figura
sempre dará alta vantagem. Algumas pessoas usam isso. Então, se você quiser mostrar
baixa renda familiar, use o primeiro cálculo,
se quiser. Portanto, a renda
familiar high-end é o segundo cálculo.
O que são legítimos? Em 2021? Renda familiar mediana
em US$168 mil. No mesmo ano, a renda
per capita mediana foi de US$37 mil. O
tamanho médio do domicílio foi de 2,6. Se você multiplicar 37 por 2,6, você receberá US$96 mil, o que é muito
maior do que os 68 mil. Se a média for usada em
renda média. A renda média das famílias
aumentará ainda mais. Como você calcula
determinará a renda familiar. Pessoas que têm
diferentes na agenda. Faremos cálculos diferentes. Vamos tomar este exemplo de como o índice de preços
ao consumidor pode ser calculado de forma diferente para
dar números diferentes, custos de
leite e pão,
1.20.5 no ano passado. Este ano ambos causam US$1,10. Cálculos
diferentes podem mostrar um
índice de preços diferente e depende da
sua agenda e você
calculará dessa maneira. Quando o último ano é
usado como ano-base, o leite se tornou 50%
do custo do ano passado. E a marca se torna
100% do custo do ano passado. Portanto, a média é de 125%,
ou seja, um aumento de vinte e cinco
por cento. Novamente, se você usar o
ano atual como o ano base, que também é medido nele. O ano da classe média foi de
200% e o pão era de 50%. Então, o
preço médio do ano passado foi de 125%. Este ano é o ano base. Isso é 100%. Então este mostrará que o prêmio do ano passado foi vinte e cinco por cento maior. Este não mostraria
os preços caírem. Se você usar a média geométrica
, ela não mostrará nenhuma alteração. Com base em como você calcula o
índice de preços 1º de maio mostra um
aumento no preço. Agora isso pode mostrar uma
diminuição no preço. E alguns cálculos podem não
mostrar alterações nas aves, embora os preços sejam exatamente
os mesmos nos três casos. O valor do percentil é
outra coisa interessante ao examinar o
percentil, por exemplo, as fileiras de alunos em uma turma de 399 percentil são os três
melhores alunos. Isso fez isso. 1% de 300 alunos, 98% dines são os próximos
três alunos e assim por diante. Há uma grande diferença
entre o percentil 99, o percentil 90, como você pode ver nessa
distribuição normal, que geralmente é o caso
de um grande na figura. Mas à medida que as fileiras
fecham no meio, dificilmente
há
diferença entre 14, 60%. Frase. Diz que você pode
ver nos lados extremos, os percentis são esticados. Há uma grande
diferença entre 9919, onde está, a diferença
entre 4060 é muito menor. O fornecedor disse
que ele aumentou preço em 20% porque
esse custo
aumentou 20%
no processo em bem
aumentou seu dólar absoluto. Essas são
maneiras diferentes de ver quão diferente em
maneiras estatisticamente. Frase subpar. 1º de maio diga, bem, Google muda sua pessoa
morrendo por 40 a 60, enquanto eles
mudarão de 1999, enquanto o 90 para
99 é muito maior. Da mesma forma, aumentando
proporcionalmente o preço com base no custo, pode-se aumentar bem
seus dólares reais. Essas são
maneiras diferentes de Stanford.
9. 8 dados relevantes: Tenha dados relevantes. Quando as pessoas não conseguem provar
algo diretamente, elas usam metade dos dados relevantes
como proxy para provar isso. Cuidado. É difícil provar a
eficácia da pasta de dente. As empresas mostram como
seus produtos destroem germes em condições
laboratoriais. Essas duas condições não
são as mesmas. O que funciona no laboratório pode
não funcionar dentro da nossa boca. Além disso, muitas vezes não está claro que tipo de bactéria eles
estão matando no laboratório. Esses são o mesmo tipo de bactéria que
existe na nossa boca? Você ficaria surpreso. Também não está claro que tipo
de dosagem a terra usando. É uma equipe completa para
escalar algumas bactérias? Nenhuma dessas informações
é muito clara. Mas mesmo assim eles estão alegando que
seu anúncio para
avançar é muito eficaz
na morte de bactérias no LRMR. Esse é o uso de
metade dos dados relevantes. Uma empresa de
refrigeradores pode anunciar que mantém, produzir 50% mais fresco. Você diz isso o tempo todo, mas
mais fresco em comparação com o quê? Outro refrigerador. Armazenar alimentos em um refrigerante, certo? Sombra, ou apenas
comida viva sob
calor e umidade do verão. Você ficará surpreso com o que esse
50% é calculado com base em. Sindicato trabalhista diz que 85% dos funcionários estão descontentes
com a gerência. Eles estão usando dados irrelevantes. Para fazer uma entrega de
casos fortes, a União muitas vezes coleta todos os complexos
possíveis, incluindo os muito triviais,
como para redes, luzes precisam ser substituídas. Então e assim e adicione-os para dizer que oitenta e cinco por cento
dos funcionários estão reclamando contra a
gerência, o que não é verdade. 100% dos cidadãos de um país reclamam de algo
durante um período de tempo. Mas é injustificável concluir
que os cidadãos
de 100 pessoas estão
descontentes com seu governo. Novamente, ele usará detalhes
relevantes. Às vezes, os dados relevantes
se tornam extremamente proeminentes. gripe espanhola é um exemplo. Em 1918, o surto de H1N1
é chamado de gripe espanhola. Curiosamente, a gripe
não se originou na Espanha nem era mais
prevalente na Espanha. Só porque foi coberto
mais por jornais espanhóis. Porque eles não estavam diretamente
envolvidos na Primeira Guerra Mundial. E todos os outros
países da Europa aprendem travando guerra
nascida inata. Por causa do fato de ele estar
em jornais espanhóis. A gripe é chamada de espanhol. Governos de todos os países são usuários
notórios com
metade dos detalhes relevantes. Aqui está um exemplo. Durante 1898, guerra
espanhola americana, a taxa de mortalidade na Marinha
era de 94 mil centros. A taxa de mortalidade em Nova
York naquele momento era de 16 mil pessoas. Os recrutadores da Marinha
usam esse número para comparar e afirmar que foi
sofrido para estar na Marinha. Dan para estar fora de 82
pessoas enganadas para se juntarem à Marinha. Obviamente, a taxa de mortalidade de idosos e doentes em Nova York foi comparada com jovens e pessoas fortes
estavam morrendo mais. Estes não são comparáveis, não são relevantes. Muitas vezes, os dados relevantes
influenciaram a tomada de decisões. Por exemplo, em 1950
ao ano é visto mais como o ano da pior epidemia de
poliomielite em nós. Investigação descobriu que o
dever
mais conscientização, mais casos em que um
diagnosticado e relatado e mais pessoas se apresentaram devido
à ajuda financeira federal. Além disso, o ano teve mais crianças suscetíveis
para essa faixa etária. Todos esses números contribuíram para um número maior de casos, mas a figura morta, que é uma medida melhor
onde não fora do comum. 1952, ficou famoso como o ano da
epidemia de poliomielite nos EUA. Mas tudo isso foi
baseado em meio aleatório e dados. Na realidade, foi como qualquer outro distrito
que registra e relata mais crimes são
vistos como mais
propensos a crimes apenas porque eles
estão relatando mais em comparação com alguns outros distritos
que não são relatórios. Políticos em todos os países
dos usuários mais prolíficos
de metade dos dados relevantes. Analise todos os dados para encontrar estatísticas que indiretamente
se adequam às suas inanidades. Antes de chegar ao poder, alguns distritos disseram que baixa renda
e alguns tinham alta renda. Depois de Bauer, alguns distritos também adicionam alta renda e
alguns tinham baixa renda. Os políticos escolherão um distrito com baixa renda antes do poder, e o distrito
com alta renda após poder para mostrar que sua governança
aumentou a renda. Enquanto a oposição
fará o contrário. Eles vão em um distrito
com alta renda baixa renda depois para mostrar que o governo causou a queda da
renda. É assim que as pessoas usam metade dos dados
relevantes para
fazer todos os pontos. Mas nem sempre é possível
examinar todos os dados. Apenas esteja ciente, porém, que todos os dados que são
apresentados em entidades de mídia,
homens, em todos os lugares onde as pessoas estão tentando influenciar
nossa decisão. As chances são de que eles estejam usando dados metade
relevantes para fazer isso. Estamos todos familiarizados com as fotos
antes e depois. Fotos antes e depois mostram como algumas pílulas seguravam
alguém perder peso. Mas os anunciantes não mencionam todas as outras forças que a pessoa está fazendo
para perder peso. Não são apenas as
pílulas que estão causando essa perda de peso e que são usadas com
metade dos dados relevantes. Portanto, perder peso
não é completamente irrelevante
para o uso de um produto. Pode ser até perder
peso sem usar este produto se eles
estiverem fazendo exercícios, comendo menos e tendo
um estilo de vida saudável. Meu pai semear metade
dos dados relevantes é usado em amputados significando aprimoramento para fazer questão
de influenciar
nossas decisões.
10. 9 Verifique a escala: Verifique a balança. Sempre verifique cuidadosamente a
escala ao observar os dados apresentados em um gráfico ou algum
tipo de diagrama de linha. Uma das formas mais comuns
que ele usou, existimos ou diminuímos a mudança de valores é
manipulando a escala. Apenas ficar em percentual de
aumento no salário pode ser exacerbado em dramaticamente
ao mostrá-lo em Lake. E é o gráfico inferior que
mostra como uma estagnação como
está na carga superior. Os dados do Sam apresentados em diferentes
escalas parecem diferentes. E apenas
olhando para este gráfico de linhas, 1º de
maio chega a conclusões muito
diferentes sem entrar em
quanta mudança está acontecendo. Muitos anunciantes
dissolvem os tempos, está brincando com a escala
para acentuar os resultados. Porque eles sabem que
metade das pessoas
estaria em um resistente é essa escala. E a outra metade seria tão influenciada pela dramática representação
visual. Porque a
representação visual é tão poderosa que eles
ignorarão essa escala. O propósito dos
anunciantes de acentuar a diferença
seria atendido. As barras são quebradas em um gráfico de barras para exibir
mudanças para cima e para baixo. Vamos dar esse exemplo. Em 1995, os
acidentes rodoviários foram 7.800. Em 2005, os acidentes rodoviários
onde 7,728 excedem. Mas quando plotado em um gráfico de barras quebrado que
está quebrado no nível 7680, essa pequena mudança de 80 nem
acidentes é acentuada. Então as pessoas olhando para ele e dizem: Oh meu Deus, 2005 lidera
tantos ácidos inferiores. Mas é só ser assim
que
gráficos quebrados em escalas são usados
para manipular decisões.
11. 10 comparação por imagem: Comparação por fotos. Comparando por imagem. Muito tempo, as pessoas
intencionalmente e não intencionalmente exageram
ou diminuíram dados. Registros de grime
nos EUA em 199098 onde comparados por imagem e
redução pareciam dramáticos. Isso ocorre porque mesmo que a
altura dos criminosos nesta imagem seja proporcional
ao volume ou não. Então, na realidade, essa
rima caiu entre 15 milhões
em 9 milhões. Mas parece muito menor
porque o volume
do criminoso menor
é muito menor. Parece que a
redução do crime foi justa. Da mesma forma, a
produção de manga na Índia. Quando comparado com a China. Pela altura da manga, parece muito
maior do que realmente. China era de 4,5 milhões de toneladas. A Índia é dezoito milhões e dez, mas
o volume da manga maior é muito
maior do que quatro décimos, é mais como 1015 toneladas. Essa é a nossa pessoa pode
dar uma impressão de uma figura é muito maior
ao mostrar duas fotos. Da mesma forma, as vendas de
veículos automotores na Índia aumentam de 3,2 milhões em 2014 para
4,4 milhões em 2019, apenas trinta e sete
por cento aumentam. Mas quando isso é
mostrado por dois carros, o segundo é 37%
tolerante que o primeiro. Só olhando para isso, as pessoas ficariam com a
impressão de que as
vendas de carros aumentaram muito
mais em 2018. Esse truque é comumente
usado por anunciantes e propagandistas cujo objetivo
é enganar os espectadores. Porque uma vez que essa impressão
é
a mente das pessoas, as duas impressões de
mangas no slide anterior são duas fotos de criminosos
no primeiro slide. E aqui estão duas
fotos de carros. Do que um tipo de decide que eles aumentam é muito maior, mesmo que seja muito pequeno.