Como detectar decepção estatística para melhor tomada de decisão | Saptarshi Bhattacharyya | Skillshare

Velocidade de reprodução


1.0x


  • 0.5x
  • 0.75x
  • 1x (Normal)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Como detectar decepção estatística para melhor tomada de decisão

teacher avatar Saptarshi Bhattacharyya, Make Better Decisions

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

    • 1.

      Apresentação

      2:01

    • 2.

      Viés de amostragem

      8:36

    • 3.

      Tamanho da amostra

      6:20

    • 4.

      Números pequenos

      4:13

    • 5.

      Problema médio

      16:35

    • 6.

      Paradoxo de Simpson's

      14:28

    • 7.

      Correlação de efeito de causa

      11:31

    • 8.

      Disposição

      8:59

    • 9.

      Dados com metade relevância

      7:30

    • 10.

      Verifique a escala

      2:22

    • 11.

      Comparação por imagem

      2:32

  • --
  • Nível iniciante
  • Nível intermediário
  • Nível avançado
  • Todos os níveis

Gerado pela comunidade

O nível é determinado pela opinião da maioria dos estudantes que avaliaram este curso. Mostramos a recomendação do professor até que sejam coletadas as respostas de pelo menos 5 estudantes.

54

Estudantes

1

Projetos

Sobre este curso

Vivemos em idade de sobrecarga de informações Precisamos usar constantemente dados para verificar evidências e verificar a validade de muitas reivindicações feitas em nossas vidas pessoais e profissionais.

No entanto, na maioria dos casos, não temos tempo para verificar os dados crus com base nos quais todas as reivindicações estão sendo feitas, nem temos acesso a eles. Infelizmente, todos aproveitam esta opacidade e usam vários truques estatísticos para dobrar fatos, para que seus próprios objetivos e agenda sejam atendidos.

Desde artigos de notícias, até reivindicações de publicidade, desde comunicações empresariais até campanhas políticas, sempre os dados e informações são processados e apresentados de maneiras que são astutos e fraudulentos.

Este curso ensina os 10 principais truques estatísticos usados para ocultar fatos ao apresentar dados. No final do curso, os participantes serão capazes de detectar e derrotar os truques, examinar objetivamente evidências para qualquer reivindicação feita e tomar mais decisões pessoais e empresariais.

Conheça seu professor

Teacher Profile Image

Saptarshi Bhattacharyya

Make Better Decisions

Professor
Level: All Levels

Nota do curso

As expectativas foram atingidas?
    Superou!
  • 0%
  • Sim
  • 0%
  • Um pouco
  • 0%
  • Não
  • 0%

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Introdução: Esta classe mostra como a doença estatística esconde a verdade para manipular nossas decisões e como podemos detectar esses truques para tomar melhores decisões. Olá. Sou especialista em ciências cognitivas com mais de 25 anos de experiência nos EUA, Índia, Oriente Médio e África do Sul. Vivemos em uma era da informação. Precisamos usar dados para tomar todas as decisões. Mas para profissionais de marketing, políticos de mídia , para todos os empresários, todos escondem a verdade real por trás estatísticas cuidadosamente construídas para que os dados que eles apresentam xaropes, seu próprio propósito ou agenda. O que podemos fazer? Bem, é bem simples. Precisamos aprender os truques estatísticos as pessoas usam para enganar outros para que possamos pegá-los no ato e tomar melhores decisões. Nesta aula, você aprenderá sobre os dez truques estatísticos mais comuns são pelos profissionais de marketing, mídia, spin doctors, políticos, empresas e outras pessoas para ocultar dados à vista de todos. Para que, no final desta aula, você seja capaz de tomar decisões muito melhores orientadas por dados em situações pessoais e empresariais com confiança. Quem pode ter essa classe 12, praticamente todos, de iniciantes a profissionais, líderes empresariais a alunos. Todos serão beneficiados desta classe. No final desta aula, é claro, há um projeto que envolve investigar situações práticas finas quando as pessoas geralmente tomam decisões erradas devido aos truques estatísticos discutidos em a classe. O objetivo dos alunos é primeiro detectar o truque aplicável e depois descobrir a maneira correta de tomar decisões. Acho que é praticamente isso. Ansioso para vê-lo na aula e tudo, sim, não se esqueça de colocar seus comentários e comentários no final. 2. Como de amostras: Viés de amostragem, pois as estatísticas às vezes podem ser um pouco pesadas. Então, vamos começar com um clima mais leve com um desenho animado. Então o cara criou uma alimentação de pássaros, que é veículo. E ele diz, depois de provar cada pássaro que frequenta a calçada do lado de fora deste prédio, concluímos que o que pássaros realmente amavam seus veículos. Isso significa que, para decidir o que os pássaros gostam, tudo o que ele fez foi olhar para Bardo. As calçadas estavam comendo bagels porque bagels estão sendo jogados para fora de seus prédios. Essa é uma maneira engraçada de se olhar. Foi a amostragem pode levar a uma conclusão tendenciosa. As estatísticas são sobre a coleta de um pequeno número de candidatos de uma grande população é pequeno número de candidatos é chamado de amostra. E decidir sobre a grande população base na verificação com a amostra. A amostra é representativa da população, são inclusões divertidas estão certas. Se a amostra for tendenciosa como na imagem que são mais pontos verdes, os vermelhos na amostra em comparação com a população. Então nossa conclusão com base na amostra também não é válida. Muito tempo em pesquisas da vida real que conclusões não são válidas porque as amostras são tendenciosas. Por exemplo, eu realmente, os graduados universitários sempre mostram um salário maior do que o salário real que os graduados recebem porque as pessoas aposentam o salário na resposta. Às vezes, antes do outono. Os estatísticos preveem com base em pesquisas, alguém ganhará, outra pessoa ganha com um grande deslizamento de terra, como aconteceu na eleição de 1932. Porque a amostragem era tendenciosa. Nas pesquisas eleitorais de 2012, foi conduzida por telefone fixo, que previu que Obama perderia. Mas Obama ganhou porque muitos oficiais, apoiadores estavam realmente usando celular e, portanto, eles serão denotados por isso. Promove uma pesquisa. É salvo que 80% dos britânicos gostam de veículos elétricos. A primeira pergunta que você deve fazer é 80% de qual peça, britânicos. Porque se a amostra for tendenciosa e se tornar de uma seção do povo britânico, então ela é representativa dessa seção em vez da população britânica morta. Agora, vamos dar uma olhada em como o viés de amostragem acontece. Vamos começar com o caso dos alunos da Ivy League. Média de sábados. Declaração publicada por uma revista diz que o salário médio do MBA da Ivy League após cinco anos de formatura é de US $300 mil. A questão é: quão precisa é uma afirmação como essa? Agora, a afirmação pode ser muito errada e enganosa. Por quê? Porque eles não mencionam qual era o tamanho da amostra. Eles não mencionam isso se tivessem um contato de todos os graduados para escolher. Eles também não mencionam se a lista de candidatos que responderam onde ela é selecionada aleatoriamente, ou apenas tomaram as respostas de pessoas que se importam em responder. Também não fala sobre quantos deles realmente respondem a essas perguntas. Se for feita essa pergunta para 50 pessoas e cinco respondidas. Se eles têm uma média de cinco e dizem que é gênero mil dólares, esse é um caso fortemente tendencioso porque as cinco mulheres não são representativas. Esta próxima pergunta é apenas pessoas com oi sanidade respondidas, o que provavelmente é esse caso. Foram amostras representativas? Como você pode ver, eles têm tantas perguntas e a maioria das pesquisas evita cuidadosamente responder a qualquer uma dessas perguntas. Portanto, você não pode confiar em nenhuma conclusão de pesquisa salarial. Assim, as pessoas podem manipular a amostra ou simplesmente ser desleixadas, não são metodicamente corretas durante a coleta de amostras. E, como resultado, infelizmente, o significado desses resultados de viveiro não é confiável. 60% dos índios urbanos preferiram a educação em engenharia, que 60%, 80% dos índios preferiram um certo fato 13, 80% dos quais indianos. O resultado de um estudo para ser dobra qualquer amostra deve ser representativo e aleatório. Ou seja, ao coletar a amostra, todos os candidatos devem ter chances iguais de serem selecionados. Muitas vezes. Esse não é o caso. Há uma batalha constante para reduzir o viés de amostragem, tornando a amostragem aleatória. viés de amostragem está sempre lá. Se vermos declarações como essa de que 60% dos índios urbanos preferiram à educação em engenharia deve-se 60% das quais pessoas. Não seriam 60% das pessoas que eles se importam em perguntar. Não 60% do nosso pacote, índios. Quando a amostragem aleatória não é possível, demorada ou dispendiosa, ou seja, amostragem aleatória, o que significa cada candidato terá a mesma chance de ser selecionado se isso não for possível . A próxima melhor coisa é a amostragem aleatória estratificada, onde você divide a população em vários grupos com base na prevalência desse grupo. Então, se uma população de 50% de branco, 30% preto, 20% asiático, você coleta um certo número de amostras da comunidade asiática, um certo número de amostras da comunidade negra e certo número de amostras da comunidade branca em proporção ao dígito Parson. E isso pode envolver violação. E isso é estratificado. Os grupos podem ser baseados em renda, educação, etnia ou qualquer outra coisa. Mas se o seu conhecimento da proporção estiver errado, a amostragem, também seríamos tendenciosos. Por exemplo, se uma pós-graduação 30% das mulheres for 70% homens, se o tamanho amostral for calculado como dez, você pode selecionar aleatoriamente três das estudantes do sexo feminino e sete dos alunos. Isso não seria um caso de amostragem aleatória estratificada. Isso seria um pouco utilizável. Lembre-se, as próprias pesquisas e iniciaram os resultados são um pouco tendenciosos. O viés vem de duas fontes diferentes. Primeiro, são os passos que estamos fazendo a entrevista. A idade, a educação, a etnia e a experiência da equipe de entrevistas influenciaram fortemente o resultado da pesquisa. Em um caso, verificou-se que, com base na equipe branca ou negra fazendo a entrevista de comunidades negras, os resultados foram bem diferentes. A segunda fonte de viés são as pessoas que têm maior tendência de serem selecionadas, pois as amostras são candidatas. Geralmente pessoas com mais dinheiro, melhor educação, aparência beta, mais informações e alerta. Comportamento mais convencional e hábitos aceitáveis mais selecionados como candidatos para entrevista ou amostra. E, como resultado, desviés do obstáculo. **** e resultados da pesquisa. 3. Tamanho de amostra: Tamanho amostral. Em muitos casos, as pessoas não usam um tamanho amostral grande o suficiente para fazer uma conclusão. Por exemplo, ouço enquanto os estudos de reivindicações de propaganda mostram que aqui eu vou X reduz a falha aqui para 80% dos usuários. Mas quão credíveis são essas afirmações? Alguns anunciantes fornecem letras miúdas que mencionaram um pequeno tamanho amostral, mas alguns nem fazem isso. Infelizmente, para propaganda comercial, não há regulamentação que indique que determinado tamanho amostral e certamente metodologias precisam ser usadas. Como é o caso dos produtos farmacêuticos. E, como resultado, as pessoas reivindicam todos os tipos de coisas com base em todos os tipos de amostragem. Esses resultados são principalmente baseados no pequeno tamanho amostral. E, portanto, o falso pode ser devido a menos chances. Ou as imagens mostram alguns casos de amostra para mostrar bons resultados para que possam fazer uma reivindicação em um anúncio. No entanto, eles são mostrados o tempo todo. Se você jogar uma moeda dez vezes e receber oito cabeças, você não pode afirmar que o estudo mostra que a chance de colocar cabeças em moedas é de 80%. Você precisa ter um grande número de tarefas de moeda para estabelecer quais são as chances de conseguir cabeças e quais serão 50%. Da mesma forma, para estabelecer qualquer reivindicação, você precisa ter um tamanho amostral grande o suficiente. O tamanho amostral dependeria de como os resultados são variáveis e de quão confiante você precisa estar em sua reivindicação. Digamos que a chance de casos graves de febre vital seja de apenas 10% entre as crianças. Você selecionou mil crianças com a mesa de febre vital. A eficácia de um medicamento. Este é um tamanho amostral grande o suficiente? Você selecionou cem, dez centenas. Você ficou feliz que o tamanho da amostra é 100000. Mas, na realidade, 90% dessas crianças vão melhorar. Mesmo sem o remédio. Você está testando o medicamento em apenas 10% ou 100 crianças que precisam deste medicamento porque seriam indutância de casos graves. Isso é, na verdade, um tamanho amostral menor do que você pensava. O tamanho amostral real é o domínio digital pelo intervalo de confiança e desvio padrão caso a caso. Entre a população. Poucos fatores são importantes estimar o tamanho amostral necessário. Seu nível de confiança, intervalo de confiança, escore Z, que depende do nível de confiança, desvio padrão e tamanho amostral, é calculado com base nisso. E não vou entrar em muitos detalhes, mas é importante que estejamos cientes. Existem certas maneiras de calcular o tamanho amostral. nível de confiança é a medida de que você repetirá o experimento 100 vezes, quantas vezes você obterá resultado semelhante. Geralmente é usado como noventa e cinco por cento são a maioria dos casos. O intervalo de confiança é o grau de ADR. Geralmente é usado como mais menos 5%. O escore Z é uma medida de quantas áreas de desvio padrão da média com base no nível de confiança que você selecionou, há um escore z para o desvio padrão é o grau de variabilidade. Se você não sabe de nada, você pode usar 0,5. Colocando tudo isso, há um cálculo padrão que é raiz quadrada do escore z multiplicado pelo desvio padrão, multiplicado por um desvio padrão menos dividido pelo intervalo de confiança ao quadrado. Com nível de confiança de 95% e intervalo de 5%, você obtém um tamanho amostral de selo de gênero em 85. Então, 4,5 desvios padrão. Portanto, um tamanho amostral de 400 a 500 geralmente é um tamanho amostral bom o suficiente para a maioria dos casos. Determinar o tamanho amostral é uma etapa crítica de qualquer pesquisa estatística ou estudos estatísticos. Porque se isso tiver feito errado, eles entram no estudo ou nas pesquisas erradas. Houve alguns casos colossais de ps. Na década de 1950. Estudo da vacina contra a poliomielite em 450 crianças foram vacinadas e 680 mantidas sem vacina como parte da estabilidade durante um surto de poliomielite, nenhuma das crianças contraiu poliomielite porque a taxa de contração foi apenas menos de 1%. Na verdade, o tamanho amostral necessário entre 38 por 1040 mil crianças. Assim, eles poderiam esperar que 300 a 400 casos de poliomielite seria o tamanho amostral efetivo para testar a vacina. Havia caminho, muito errado. Isso selecionou quatrocentos e cinquenta e seiscentos, cerca de 1100 crianças onde são necessárias de 30 mil a 40 mil crianças. Portanto, a estimativa do tamanho da amostra e o uso do tamanho amostral do valor certo é de extrema importância para todos os estudos estatísticos. Mas, infelizmente, na maioria das afirmações que vemos para anunciantes, para produtos diferentes ou até mesmo para políticos, mídia e outras coisas. Todos esses caras, quase todos esses caras não fazem parte interna, usam um tamanho amostral adequado o suficiente e o resultado. Nenhuma dessas reivindicações é gerenciada. 4. 3 números pequenos: Números pequenos. Vamos começar com concordos. Uma cidade tem dois hospitais, um pequeno e outro grande. Um dos dois hospitais em um mês, 60% dos bebês nascidos pelo qual. Considerando que normalmente é 50%. Qual deles é? O hospital pequeno ou grande? A resposta é o pequeno hospital. Porque, assim como um pequeno tamanho amostral, casos extremos ou incomuns. Nesse caso, 60%. Os meninos são incomuns, 50%, Os casos habituais incomuns são vistos em pequenos tamanhos de amostra, são, neste caso, pequenos hospitais. Ao investigar casos de câncer renal em mais de 3 mil municípios dos EUA, verificou-se que o jogo de maior incidência de pequenos municípios. Curiosamente, também foi constatado que a menor incidência também ganhou de pequenos municípios. Isso significa que municípios pequenos e menos povoados tiveram a maior e a menor incidência. Esse é o caso de números pequenos. E por que isso acontece. Vejamos um condado muito pequeno com apenas ficar em adultos. Como é apenas em adultos, é altamente provável que o nano tenha câncer. Ele mostrará 0. Mas se apenas uma pessoa for cancelada por acaso, ela também mostrará 10% de incidência, o que é muito alto. Isso significa que se a conta for pequena, provável que ela seja poupada de muitos casos. E só se tiver alguns, mostrará altos casos de incidência. Portanto, pequenos municípios mostrarão incidência alta e baixa. Pequenos distritos com população baixa sempre mostrarão resultados extremos. Onde em distritos maiores, casos populacionais inteiros vivemos para mostrar resultados mais médios. Uma cadeia de supermercados descobriu que lojas menores apresentaram menor e maior pegada por unidade de área e vendas por unidade de área. Tamanho amostral menor tem maior probabilidade de mostrar resultados extremos devido à aleatoriedade. E uma amostra maior representa melhor uma população. É por isso que ouvimos algo chamado lei de grande número em estatísticas. Para fazer qualquer conclusão, você pode depender apenas de grandes números e quando um grande número de coisas mortas para fora da média. Agora, como no caso de números pequenos as coisas obtêm resultados extremos? Vamos dar outro exemplo. Digamos que, como alunos que ainda são 100 quartos com cinco alunos em cada um. Do total de 500 alunos, 25 receberam uma vantagem no exame. Isso significa que muitos dos quartos têm 0% de alunos com um plus porque há apenas 25 a mais estudantes e 100 quartos. Mas se um quarto acabou de ganhar um aluno mais, ele mostrará 20% de casos de mais um aluno dividido por cinco, ou seja, 20. O quarto tem para os alunos, por acaso, mostrará 40% de casos de um plus. Você pode ver devido ao fato de que os quartos são pequenos, qualquer figura ficará exagerada. É assim que existiam pequenos números nos resultados. E essa é a nossa lei de grande número precisa número maior para fazer uma conclusão. 5. 4 problemas médios: Problema médio. Uma das formas mais comuns das estatísticas é, é, como alguém de muitos dados. A média é provavelmente a estatística sumária mais usada. Gostamos de resumir muitos dados em uma figura. E essa é a popularidade da média. Ouvimos declarações como economia criarão 20 mil empregos por mês. Isso é um valor médio. País teremos 20 polegadas de precipitação e outra média aqui, cerca de aumento salarial médio de 10% ao ano e assim por diante. Mas todos esses números médios podem ser realmente enganosos e podem ocultar mais informações do que o show. Por exemplo, alguns meses podem adicionar 50 mil empregos, enquanto alguns outros meses podem adicionar Justin mil empregos. Então alguém de 20 mil não significa muito. Da mesma forma, algumas partes do país podem ser inundadas. Onde pode haver seca em algumas outras partes. Portanto, precipitação média de 20 polegadas em um país não significa nada. Da mesma forma, o salário de algumas pessoas pode dobrar, onde alguns podem não vê-lo aumentar. Portanto, um aumento salarial médio de 10% é informação absolutamente inútil, no que diz respeito ao entendimento do aumento real da preocupação com os salários das pessoas. Dizem que não atravesse um rio se for, em média, quatro pés de profundidade. Como o rio pode ter 20 pés de profundidade, adicione algumas faces do que apenas um ou dois pés de profundidade em outros lugares. Então, uma média para profundidade livre, ou seja, se você está tentando atravessar o rio pensando que será para impressão em média, um bêbado. Um dos casos dramáticos do problema de usar a média foi o que os cientistas descobriram durante os anos anteriores de rastreamento do aquecimento global. Nesse ponto, os cientistas estavam olhando principalmente para o aumento médio temperatura e tentando correlacionar isso com os campos de gelo filtrantes ou polares, eles ficaram surpresos ao descobrir que mesmo se a temperatura média permanecer a mesma, mais do que mais calotas polares, estamos ficando derretidos ano após ano. Mais tarde, descobriram que mesmo que a média permaneça a mesma, anos com os altos picos temperatura causaram mais demanda dos olhos. A média não era muito útil. Da mesma forma, tente olhar para dois casos em que uma pessoa bebe uma cerveja todos os dias durante 30 dias. Então, isso é em média uma cerveja por dia. Enquanto outra pessoa não bebe cerveja por 29 dias e na 30ª data, ele bebe 30 anos. Em ambos os casos, a média é de uma cerveja por dia, mas o impacto de beber cerveja será muito mais grave, seria fatal no segundo caso de beber 30 cervejas por dia. Da mesma forma, a média pode ser realmente enganosa. Outro famoso caso de problema com médias onde em 1997 a inundação de Grand Forks, a cidade tinha um dique de 51 pés. Mais de 49 pés previsto o nível de água do rio, o que era uma média. Mas em alguns lugares durante uma enchente, a água atingiu 53 pés mesmo que a média permaneça para o jantar. Mas nesses casos ou deslocamentos, a água violou o dique, causando sangue para a cidade. O uso de médias depende das médias porque as inundações nas médias da cidade podem ser enganosas de muitas outras maneiras. Vamos tomar o caso da expectativa de vida média. Por exemplo, em 19 centenas, expectativa de vida média ao nascer era de 30 anos. Mas esses 32 anos não significam nada. Isso não significa que todos morreram aos 32 anos. Muitas dieta em bart, muitas dieta abaixo de cinco anos morrem durante a guerra travada. Mas aqueles que sobreviveram a todos viveram até os anos sessenta e setenta, assim como hoje, a média chegou a ser 32, mas esse número realmente não significa nada. É por isso que não há empresa média. Não há flutuação média do mercado de ações. Não há guerra média, epidemia, nem campanha de marketing média, nem venda média de livros. Na maioria dos casos, a distribuição pode ser muito distorcida. Um monarca médio significa qualquer coisa. Por exemplo, no lado esquerdo, você vê que é uma inclinação negativa da distribuição onde a evidência é movida para o lado esquerdo e direito, você pode ver uma inclinação positiva onde a média é moveu-se para a luz porque é. Em detalhes para a direita, somente no caso das médias de distribuição normal central no centro. E por isso é um pouco significativo, mas em todos os casos reais, distribuição de valores é sempre distorcida. E, como resultado, a média não transmite nenhum significado muito útil. No contexto do resumo estatístico, três tipos de médias são usados. Eles são chamados de média, mediana e modo. média é a média aritmética simples. Vamos levar o exemplo mostrado na tabela à sua esquerda. Digamos que em uma sala, há 20 pessoas. Seus salários são mostrados nas colunas. Seus salários variam entre US $20 mil por ano e US$3 milhões por ano. Então, o salário médio é que ele mitiga a média, que acaba por ser 248.750 Donner. Agora, a mediana é o salário no meio quando todos estão organizados em ordem crescente ou decrescente. Nesse caso, ele está chegando a ser de US $56.500. Modo é o valor salarial que mais ocorre nisso, se você vir 60 mil vendedores ambulantes duas vezes versus todo o resto operando uma vez. Então, US $60 mil é o modo. Como você pode ver, quando poucos outliers podem alterar a média ou a mediana é um resumo melhor. Nesse caso, entre 20 pessoas, apenas duas pessoas têm salário muito alto, US$1 milhão em US$3 milhões. O resto deles está entre 20000.95000. Assim, para valores altos ou distorcer os meios. Veja se alguém diz que o salário médio das pessoas na sala é de US$248 mil, isso não reflete a verdadeira natureza dos salários que as pessoas na sala. Então, em comparação com essa mediana, que é de US $56 mil, é uma representação muito melhor. Em todos os casos em que alguns outliers podem médias fortemente distorcidas. A mediana é uma melhor estimativa das estatísticas médias. O modo neste caso também é um pouco útil, mas em muitos casos algo pode não acontecer mais de uma vez. Então, mais homens podem ser usados. mediana é uma estimativa melhor em muitos casos que são fortemente influenciados por outliers altos ou baixos. Mas em todos os casos práticos em que a distribuição é fortemente inclinada para um lado ou outro, não das médias médias, mediana ou modo podem ser usadas. Vamos dar o exemplo do câncer. Muito tempo o Dr. contará a uma base de câncer e que ele acabou de fazer uma licença monstro ou 18 meses de vida. O paciente não deve perder o coração. Porque esses 12 meses ou 18 meses podem ser um valor médio e mediano. E isso pode ser fortemente distorcido porque pode haver muita gente morrendo imediatamente ou depois das filmagens. É minha diferença que o paciente sobrevive nos primeiros meses. Ele ou ela pode esperar viver uma vida muito mais longa. Porque mesmo o modo pode ser altamente movido para o lado direito ou para o maior número de meses ou anos. Veja o caso da distribuição C, onde tanto a média quanto a mediana estão para a esquerda, mas o número real de pessoas que vivem muito maior do que a média e a mediana é para a direita. Assim, pode-se até deixar 6070 anos mesmo depois ser detectado com câncer e isso aconteceu. Vamos dar outro exemplo. Digamos que 80% das empresas, tenham US$90 milhões em vendas e apenas 20% das empresas tinham US $60 milhões de células. Se você calcular a média, verá que a média é de US $84 milhões. Mas neste caso, 80% das empresas que estão acima da média, o que é meio difícil de compreender. É contra-intuitivo. Mas muitos casos, as médias fornecem um contador, contra-intuitivo e às vezes intencionalmente um resultado de flexão de barra. E pessoas que acabam tomando decisões erradas usando amperagem. Portanto, sempre olhe para a distribuição e tome uma decisão com base nisso. Nunca decida com base em números médios. Cálculos médios às vezes levam a informações muito confusas e enganosas. Por exemplo, a China média não vem de famílias médias porque o cálculo da criança média e o cálculo da família média não são os mesmos. Ilustrado isso, digamos que haja uma aldeia com 100 famílias. Um número de filhos por família é como Inserir uma tabela na sua próxima. 100 famílias são divididas em cinco grupos de 20 famílias, cada uma. Primeiro grupo como 0 crianças. O segundo grupo tem um filho. O grupo duro tem dois filhos para o grupo tem três filhos. E o quinto grupo formou crianças. Se a questão for, qual é o número de crianças para uma família comum? Você tem que calcular o número total de crianças multiplicando a coluna da esquerda para a coluna direita, que levará a 200 crianças e você dividirá 200 famílias. Ele dará o número médio de crianças ou familiares, que é 200 dividido por 100 também. Mas se houver uma pergunta, criança média vive com famílias com quantos filhos? A resposta não é dente. Isso significa que, embora a família média tenha dois filhos, mas as crianças comuns não vivem em uma família de kit de ferramentas. É confuso. Mas vamos dar uma olhada nas crianças. Crianças. Não há crianças no primeiro grupo porque há 0 crianças. Agora, no segundo grupo, isso é um total de 20 crianças. E eles viviam em uma família de um garoto. No terceiro grupo que são 40 crianças. E então eles vivem em uma família de crianças. O quarto grupo que são 60 crianças, 20 multiplicado por três. E todas essas 60 crianças vivem em uma família de três filhos. No grupo final que são 80 crianças, porque 20 famílias multiplicadas por quatro crianças AT kids. E todas essas 80 crianças vivem em uma família infantil pobre. Então, para calcular o número médio de crianças com as quais uma criança média vive, você precisa multiplicar 20 por um. Como 20 crianças vivem em uma família de crianças, 40 crianças vivem em uma família de kit de ferramentas, 60 crianças vivem em uma família complicada e 80 crianças vivem em uma família pobre de bolso infantil. E você tem que dividi-lo pelo total Kids, que é 200. E ele ganharia três. Isso significa que a criança média vive em uma família acionada, enquanto famílias médias ajustam kits de ferramentas. Da mesma forma, funcionários médios não trabalham em uma empresa média. Ele será inclinado para uma empresa maior. Por exemplo, aqui você vê que as crianças médias estão enviesadas para famílias maiores com mais crianças. Da mesma forma, o cidadão médio não vive em um país médio. cidadão médio será enviesado em relação a países de alta população como Índia, China, EUA. É assim que as médias podem ser realmente confusas. Veremos outro exemplo para mostrar como o aluno médio não vai para a faculdade média. Porque os alunos médios e as faculdades médias não são calculadas da mesma maneira. Cts para faculdades com alunos até a mesa. faculdade é pequena, tem mil alunos. faculdade dois tem 3 mil alunos. A árvore da cartilagem tem 10 mil alunos, e a faculdade tem 30 mil alunos. Há um total de 44 mil alunos. A primeira pergunta é qual é o número médio de alunos por faculdade? Para a faculdade total de 44 mil alunos. Portanto, o número médio de alunos por faculdade é de 44 mil dividido por quatro, ou seja, 11 mil. A segunda questão é metas médias dos alunos para a faculdade com quantos alunos? Esse cálculo é muito diferente porque na faculdade, 11000 alunos vão para a faculdade com outros mil alunos. Na faculdade, 3 mil alunos vão para a faculdade com 3 mil alunos na faculdade, 310 mil alunos vão para a faculdade dentro de 1000 alunos. Na faculdade para 30 mil alunos vai para a faculdade de 30 mil alunos. Assim, o aluno médio vai para a rede universitária 10 mil ao quadrado, 30 mil ao quadrado, 3 mil ao quadrado, 1 mil ao quadrado dividido por 44 mil alunos. Então, chega a 22.954. Então, mesmo que a faculdade média tenha apenas 11 mil alunos, mas o aluno médio vai para a faculdade de 23 mil alunos. Da mesma forma, a população média por país é de 39 milhões porque existem cerca de 7,8 booleanos e cerca de 200 despensas. Você divide esses 7,8 bilhões com 200, você chega a cerca de 39 milhões de pessoas por país. Mas o cidadão comum vive em um país que é lábios com muito mais pessoas, quase como dez vezes mais pessoas. É assim que o país médio e o cidadão médio não são a mesma coisa. Faculdades médias de estudantes e médias não são a mesma coisa. Muitas vezes, esses números são usados intencionalmente por veículos diferentes. E eles retratam esse valor médio que atende seus parceiros. 6. 5 apoios do Simpson.: paradoxo de Simpson. Entre 196319, oitenta, a pontuação média verbal e matemática SAT de todos os alunos dos EUA caiu 5040 pontos, respectivamente. São grandes gotas. Isso levou a uma indignação nacional. E o painel presidencial foi formado. Eles investigaram os resultados e publicaram um relatório infame chamado Nation at Risk. Isso leva a medidas drásticas subsequentes, uma revisão completa do sistema educacional, lutando contra muitos professores e assim por diante. No entanto, investigações posteriores descobriram que, curiosamente, quando todos os alunos foram divididos em grupos de renda individuais, todos os grupos viram um aumento na pontuação do SAT entre 19631980, embora grupo de todos os alunos juntos. Então, em graus. Este é um exemplo do paradoxo simples de Simpson. E isso é visto em grandes casos diferentes. Para ilustrar o ponto, para mostrar como isso acontece, digamos que no ano de 19631980, todos os alunos poderiam ser divididos em três grupos principais ou grupos de renda para classe média e ricos. Em 1963, esmagadoramente 70% dos alunos vieram de famílias ricas e apenas 20, 10% vieram de famílias de classe média e pobres. E suas pontuações médias em Matemática, respectivamente com 554 chegam 500 para a classe média e 404 board, a média geral foi de 525. Essa mistura mudou completamente em 1980 porque entre 6380, o número total de alunos aumentou muitas dobras. E todos eles aumentam o jogo de alunos pobres e de classe média. Agora eles são 40% cada um de todos os alunos que reduzem a proporção de alunos ricos para apenas 20%. Agora, todos esses três grupos, pontuação Matt SAT foi maior. Para os alunos, a pontuação foi de 420, que foi contratada por 20. pontuação dos alunos de classe média foi de 520, o que foi maior em 20 pontos. Enriquecer a pontuação dos alunos foi 560, o que também foi contratado por dez pontos. No entanto, a média geral em 1980, foi apenas para 88 porque o mix total agora é diferente e mais estudante estrangeiro e alunos menos proporcionais alcance. A média geral desceu de 525 em 1967 em três para 488 em 1980. No entanto, todos os grupos individuais viram um aumento na média. Met é uma Discórdia. Isso é o que se chama paradoxo de Simpson. O paradoxo de Simpson tem o nome de um matemático Edward Simpson. Ele descobriu isso em 1951. Ele diz às vezes um resultado ou o treinado visto quando os dados são segregados em grupos diferentes. Mas quando todos esses grupos são reunidos, esse resultado é treinado, eles são revertidos. Ela desaparece. Vejamos os dois gráficos à sua esquerda. No gráfico acima, você vê todos os dados juntos em pontos cinzentos. Aqui. Se você olhar para ele, você veria que é uma tendência crescente da esquerda para a direita. Quando você divide esses pontos cinza em quatro cores diferentes de verde, amarelo, azul e vermelho. Você vê para o verde, é uma tendência decrescente. Para o amarelo, é uma tendência decrescente da esquerda para a direita. Do azul, é novamente uma tendência decrescente. Para o vermelho, é uma tendência ligeiramente crescente mas não tão dramática quanto os pontos cinzentos. Basicamente, todos os grupos individuais mostraram trens diferentes em comparação com todos os pontos quando eles são montados em um formato de grade, o que significa todos os pontos que andavam juntos. Isso é o que se chama paradoxo de Simpson. O paradoxo de Simpson está presente em muitas áreas e confundiu a tomada de decisões. Vamos dar uma olhada em alguns outros exemplos. Novamente, este é um exemplo da vida real. Em qualquer programa de doutorado universitário. Foi encontrado. Que 50% dos candidatos do sexo masculino estavam sendo aceitos ou simplesmente arrumados 8% mulheres candidatos estavam sendo aceitos. Isso levou a muitos debates e discussões sobre ter um viés contra as mulheres. Mas uma investigação mais aprofundada mostrou uma tendência diferente, onde todos os programas de doutorado foram divididos em doutorados em ciências naturais e doutorados em ciências sociais. Ele foi encontrado para esses dois tipos diferentes programas de doutorado. Mais mulheres estavam sendo aceitas do que homens, um candidato a emprego do dia do parson. Mas as mulheres se candidataram predominantemente ao programa de doutorado em ciências sociais, que havia comparado ao programa de doutorado em ciências naturais uma taxa de aceitação muito menor para estudantes masculinos e femininos. E esse tipo de viés, essa aceitação de nível agregado para as mulheres, como isso acontece? Vamos dar uma olhada na dica. Assim, 80% dos estudantes do sexo masculino estavam se candidatando a Ciências Naturais, 20% para ciências sociais, enquanto que para as mulheres, 30% estavam se candidatando a ciências naturais, e esmagadoramente 70% estavam se candidatando para Programa de doutorado em Ciências Sociais. Agora, para os homens, o nível de aceitação para a ciência natural, somos 60% e para as mulheres era de 80%. As mulheres tinham maior nível de aceitação para programas de doutorado em ciências naturais. Da mesma forma para o programa de doutorado em ciências sociais, os homens tinham 10% de nível de aceitação e as mulheres tinham 20% de nível de aceitação duplo. Mas à medida que mais e mais mulheres se candidataram ao programa de doutorado em ciências sociais, que tinha um programa de doutorado em ciências naturais concorrente de aceitação muito menor . A aceitação geral para o homem foi de 50% e as mulheres foi de 38%. Novamente, quando analisada individualmente, é uma marca de tendência única. Quando olhado para agregado, é uma tendência diferente e parece e gasta. Portanto, toda vez que você vê uma tendência de dados enquanto olha para muitos dados juntos, lembre-se de que, se houver uma maneira de dividir todos os dados em grupos significativos, grupos individuais podem mostrar um drenado completamente diferente, uma tendência oposta em comparação com todos os dados em grade que você precisa ter cuidado. É visto nos negócios. Pesquisa. O tempo todo. A empresa vendeu janela asean dividida AC. Verifique o feedback de 1000 clientes de cada produto. Então, mil clientes que compram AC split, o verificado. E como é mostrado na tabela à sua esquerda, 800 e dizem que a luz se divide AC, ou seja, 80% das pessoas gostaram de split ac. Da mesma forma, mil clientes que compraram o Windows ISE, eles verificaram e setenta e cinco por cento das pessoas disseram que gostavam de janela AC. Então eles concluíram que o MAC dividido é mais apreciado. A coisa reverteu quando os clientes foram divididos em homens e mulheres. Assim, de 1 mil AC split, 900, onde os principais clientes, 100 onde cliente feminino. 900, clientes do sexo masculino, 750 disseram que gostaram de AC split, então eles fazem os 3%. E entre 100 mulheres clientes, 50 disseram que a divisão de luz é que é 50%. Mas para a janela AC, do total de 1800 milhões de clientes, de oitocentos e setecentos e cinquenta disseram gostavam de janela AC, então isso é de 88%. Duas 100 eram mulheres clientes que compraram janela e C e 150 janela de luz e vêem que é 75%. Como você pode ver, que 83% dos homens gostaram de dividir AAC em comparação com 88% dos homens que gostaram da janela e vêem, quando você olha apenas para os clientes do sexo masculino, mais clientes gostaram. A janela é semelhante quando você está olhando apenas para as clientes do sexo feminino, 50% como SE dividido e setenta e cinco por cento de janela de luz SE. Então, novamente, mais clientes, mais clientes do sexo feminino, Mike, janela AC, mas mais clientes do sexo feminino gostam de janela que vejo em ambos os clientes do sexo masculino como janela e vejo. Mas quando você não estava colocando clientes masculinos e femininos juntos, no nível agregado, você está vendo uma tendência diferente de mais pessoas gostando, gostando de dividir. Então esse é outro exemplo de cidadãos, Benedict. Agora vamos analisar alguns estudos de caso em empresas para ver como paradoxo de Simpson pode ser identificado como um problema em potencial e o que fazer a respeito. Em uma pesquisa de mercado, os dados mostraram que entre o ano dois mil e dois mil e quinze, o gasto médio por domicílio em determinada categoria de produto diminui de US$120 em 2 mil a US$95 em 2015. Agora a questão é: isso é uma tendência descendente? Ou você deve interromper essa linha de produtos com base na rua? A resposta é que, apenas observando essa tendência geral de todos os dados, você não pode tomar essa decisão. A representação desse problema é o problema paradoxo de Simpson que descobrimos. E para avaliar se algum grupo pode ser descontinuado, você precisa tomar uma decisão com base em subgrupos potenciais. Então você tem que investigar dividindo o crescimento total em algum subgrupo significativo que pode se comportar de forma diferente. E verifique se o mesmo trem estes estão sendo vistos para cada subgrupo. Individualmente, o subgrupo poderia ser baseado em grupos de renda, famílias de alta renda, renda média e baixa renda. É a mesma tendência em todos esses grupos? Poderia ser baseado em clientes masculinos e femininos ou termos de localização ou qualquer outra coisa que possa ser significativa para seus dados. Todos esses grupos individuais e também mostrando uma diminuição nos gastos, então você pode tomar uma decisão. Mas as chances são de que possa haver outros fatores que contribuam para esse grupo geral versus grupos individuais mostrando uma tendência diferente. Se for esse o caso, você deve continuar, você deve continuar com esta linha de produtos. Vamos dar uma olhada em outro estudo de caso, o que é novamente um problema comum. Como os dados de venda entre 20142019 mostraram que a barra de preços medidor quadrado de imóveis caiu 10% em um CTE. Essa é a tendência imobiliária descendente? Novamente, este é um problema paradoxo de Simpson porque como o mercado imobiliário pode ser dividido, segmentado e agrupado em resíduos. Para decidir se é uma tendência descendente, você precisa olhar para alguns grupos. Você tem que investigar dividindo todo o grupo em diferentes subgrupos que podem ser baseados em locais para ver onde você está vendo a mesma tendência em todos os locais, pelos tipos de casas, pelo tamanho das casas. É provável que você veria que grupos individuais estão mostrando tendências diferentes. Talvez alguns estejam mostrando aumento no preço. Mas enquanto algum outro fator, talvez esmagadoramente um tipo de habitação esteja sendo vendido em uma quantidade muito grande. E, como resultado, estou mudando a tendência para todo o grupo. Considerando que grupos individuais podem estar mostrando uma tendência diferente, como a maneira como resolvemos para baixa renda média e alcançamos as habilidades dos alunos na pontuação SAT. Somente depois de investigar a tendência no subgrupo, você pode concluir se essa tendência diminuição dos preços imobiliários é gerenciada. Da mesma forma, há muitos casos toda vez que você vê um grupo de pontos de dados, tenta dividi-lo em grupos diferentes e ver se esses grupos estão mostrando a mesma tendência. Porque você tem que tomar cuidado o problema do paradoxo de Simpson. 7. Correlação com efeito de causa: Causa, efeito e correlação. Quando dois eventos acontecem juntos e em mudanças positivas ou negativas em um evento estão associados a uma mudança semelhante no outro evento. Diz-se que eles estão positivamente correlacionados. Quando essa relação é oposta, diz-se que eles estão negativamente correlacionados. Há muitos casos em que as coisas estão correlacionadas positivamente. Por exemplo, há uma correlação de 0,3. Um coeficiente de correlação é calculado e certa forma, não entraremos neles. Mas há um certo nível de correlação positiva entre o GPA universitário e a renda subsequente. Há um maior nível de correlação entre QI e desempenho médio no trabalho. Há um nível muito maior de 0,7 correlação entre altura e peso. Pessoas mais altas são mais pesadas. Correlação ainda maior entre escore matemático SAT de dois anos consecutivos. Então, estes são nos casos em que as coisas estão positivamente correlacionadas. Agora, duplos problemas comuns e falácias na tomada de decisões. Relacionado à correlação r, um é chamado de falácia post-hoc. Quando o evento decorrido aconteceu após um evento, diz-se que eles foram formulados e diz-se que um evento está causando outro Richmond e fez um caso. Outro é *** hoc, ergo propter hoc, que é quando dois eventos acontecem juntos. Um deve ser por causa de outro evento que pode não ser o convidado, porque correlação não significa causalidade, dois eventos estão correlacionados não significa que um está causando a falsa causalidade ou pensando que um evento está causando outro falsamente. Sua mãe de toda a logística estatística quando dois eventos acontecem ao mesmo tempo. Portanto relacionado, mas correlação não significa causalidade. Se dois eventos aconteceram ao mesmo tempo, não significa que um está causando outro. Todas as manhãs. Galo, corvos. E nascer do sol não significa que esse galo cause o nascer do sol, acontece ao mesmo tempo. Galos antecipa no Sunrise e cresce e os elementos do nascer do sol, estão correlacionados, mas um não está causando o outro. Há algo chamado correlação espúria porque, por acaso, dois eventos podem ser correlacionados, mas não há nenhuma relação. Vamos dar alguns exemplos. Se você traçar as vendas de iPhone nos EUA e cair causado por dobras abaixo das escadas, você veria um nível muito alto de correlação positiva porque ambos aumentaram ao longo dos anos. Mas há absolutamente, como sabemos, não para isso nenhuma causalidade real entre nenhuma relação entre. Da mesma forma, se você traçar o consumo bar capita de como o xarope de milho frutose, que caiu e gastou em esportes espetaculares para espectadores você veria que um está aumentando, enquanto outro é diminuindo. Apenas dois eventos, há uma correlação espúria. Da mesma forma, se você olhar para os visitantes que Universal Studio de Orlando e as vendas de carros novos, você veria os dois. Eles estão descendo, mas novamente, eles estão apenas ficando para baixo. E quaisquer relações entre eles e associação espúria podem ser completamente coincidentes ou espirituais. Já faz muito tempo e isso é extremamente exemploso que, se esses dois eventos estiverem um pouco relacionados, pode-se concluir falsamente, ou pode-se manipular para mostrar aos outros que eles estão relacionados mãos, uma está causando a outra. Você tem que tomar cuidado com isso. Tabela dois por dois são quatro vezes. Tabela é uma tabela estatística que pode ajudar a tomar decisões. É uma maneira robusta de ver quão forte é a correlação e a causalidade. Então, se algo está causando alguma coisa, é por exemplo, muitas vezes você verá pessoas dizendo que 20 pessoas com gripe tomaram remédios e ficaram bem depois de cinco dias em comparação com apenas dez pessoas que ficaram bem sem tomar medicamentos. Portanto, o medicamento está infectado. Mas, para verificar se o medicamento é efetivo ou não, você precisa preencher a tabela de formulários completos. De um lado, você tem que olhar para as pessoas que tomaram Madison versus que não tomaram remédio. E então, do outro lado, você tem que olhar para as pessoas que melhoraram depois de cinco dias versus não melhoraram depois de cinco dias. Se o total de 30 pessoas para medicina melhorou. E Dan não melhorou. E se um total de 15 pessoas tomaram remédio e dez Deus amargo e não melhorou do que você não pode concluir nada. Porque a relação entre 201010 a cinco é a mesma. Mas se tivéssemos nosso perjúrio Pessoas que não tomaram Madison e depois melhoraram e 20 não melhoraram do que você pode dizer, ok, remédio está ajudando. Da mesma forma, você pode criar diferentes para, para que a tabela procure informações adicionais que você possa conectá-las para tomar decisões. Às vezes, a causalidade pode estar ao contrário. Se o pai der um relatório que diz que empresas com mais mulheres em sua diretoria ou mais lucrativas ou maiores que o tamanho. Isso pode significar que empresas com mais mulheres são mais lucrativas, ou também pode significar que empresas mais lucrativas estão contratando mais mulheres, que é o que realmente não está claro. Da mesma forma, as principais faculdades afirmam que seus alunos têm melhor desempenho. Agora, se os alunos têm melhor desempenho por causa das faculdades ou dos principais alunos estão indo para as principais faculdades não é muito claro. Estas são as causalidades que podem ser revertidas. Em dois eventos consecutivos, o agricultor muitas vezes é visto para causar a carta, mas o que pode não ser o caso, que muitas vezes não são décadas. Mas essa falácia é chamada de falácia post-hoc. É como falácia relacionada à correlação. Essa piada, diz os homens organizados, seu médico pediu-lhe para parar fumar e outro velho disse: Oh, não faça isso. Alguns dos meus amigos só com o fumo e eles morrem. Esta é uma maneira engraçada de colocar os moribundos não tem nada a ver com parar de fumar, mas eles aconteceram depois do teste de fumar. Muitos casos reais, um evento acontece completamente sem fosforilado, não impulsionado por nada. Mas as pessoas adivinharam que isso foi por causa de algum outro evento que acontece com o famoso caso de nossa pulseira de holograma balanceada se tornou uma crista global entre 200712, milhões de dólares foram gastos nele como pessoas, incluindo esportistas, em relação ao produto estava melhorando sua capacidade atlética. Mais tarde, ensaios randomizados duplo-cego descobriram que não havia nenhuma relação entre usar essas pulseiras e habilidades atléticas em todos os atletas estavam treinando, as pessoas estavam tentando perder peso e ficar melhor, mais atlético, e havia melhorado. Isso não teve nada a ver com o uso desta luta livre. Mas isso aconteceu porque as pessoas achavam que o prêmio que esses seios levavam e que Deus melhor. Então, foi a causalidade, a correlação de Paulo. Outro caso de dois eventos acontecendo ao mesmo tempo fazendo parte de um causando o outro. Em 1990 a 30 adolescentes americanos que freqüentemente jogavam um determinado videogame cometeram suicídio. Isso criou um alarme nacional, pensando que os videogames estavam causando o suicídio. Mas investigações adicionais descobriram que taxa de suicídio de adolescentes naquela época era 12 por 100 mil, já trim milhão jogava o jogo regularmente. Então, 360 pessoas estatisticamente propensas a cometer suicídio entre pessoas que jogaram o jogo. redimensionamento de Tertius não era um grande número. Isso leva alguém a pensar que o suicídio foi devido ao portão. Novamente, uma falsa causalidade porque ambos os eventos acontecem ao mesmo tempo. Todos os tipos de empresas reivindicam todos os tipos de correlação entre sua ampla melhoria de acidentes, mas que não são décadas. A empresa diz que o shampoo leva a tomar a cabeça. No entanto, a realidade pode ser que as pessoas escolheriam o cabelo dela usando o shampoo em primeiro sugere mostrar a causalidade reversa. produto dietético afirma como é usado Lauren o molhado, mas as pessoas que usam o produto estariam fazendo outras dez coisas, como se exercitar, comer menos. Aqueles estão causando perda de peso e produto não ruim. Empresa de cerveja afirma que ter cerveja melhora sua doença. Mas não pode haver nenhum relacionamento porque mais e mais pessoas saudáveis poderiam estar bebendo cerveja, então elas já estão tendo amargamente duro. Mas essas causalidades que eles estão alegando porque poderia ser apenas uma loucura espúria. Outro fator importante relacionado à correlação é que a afinidade é erroneamente assumida que a correlação farmacêutica além dos dados com os quais foi estabelecida. Por exemplo, com o aumento da chuva, milho cresce mais alto, mas além de um certo ponto, torna-se mais curto. Mais uma vez. Salvar os dados é de até alguns centímetros de chuva, então isso deve terminar. Mas, porque se inundar, tudo pode ser destruído. Da mesma forma, a educação é uma correlação positiva com o ganho, mas até certo ponto, talvez até o mestrado porque PhDs, a menos que essa correlação não seja Judy de 5 bits. Da mesma forma, a felicidade das pessoas sente falta dele para aumentar com o aumento do dinheiro. Mas até certo ponto. E depois disso, pode não mudar muito ou pode ter diminuído. Esse é o caso, então, as pessoas mais ricas que teriam sido as pessoas mais felizes deste mundo. Mas esse não é o caso ao mesmo tempo, se for o relatório de alguém, o que significa, eu ficaria muito feliz. Então, inicialmente com o aumento do dinheiro, a felicidade enlouqueceu de fato, as pessoas descobriram isso. Mas depois de um certo nível que mudou em 19, bastante significativo. Novamente, a relação ou correlação ou causalidade pode existir até certo ponto que são verificados além disso, não deve ser aumentada para cinco maturidade. 8. 7 a batimentos: Correlação de status. Os números estatísticos são usados por jornalistas, anunciantes, chamados especialistas, vendedores e outros. Muitas vezes, envie mensagens e manipule pessoas. Esse processo é chamado de correlação de status. Aqui está um isento. Você veria anunciantes em lojas de insano 50%, 20 venda em nuvens. Muitos podem pensar que é um desconto total de 70%. Mas, na realidade, é a primeira dívida de 50% no saldo, 50% e outros 20% do total de vendas é de 50% mais 20% de 50%, ou seja, 10%. Portanto, o total de 60% acredita que dizem total de 60% de venda. Isso criará menos impacto. É por isso que eles dizem 50% mais 2%. Ele verá isso o tempo todo. Estes são dois manipulam as pessoas. Da mesma forma, os jornalistas informarão que em um dia é encerrado em uma cidade ou em um estado, uma perda econômica tão grande. Sempre esses números são, números são calculados com base em todas as atividades econômicas possíveis que podem potencialmente acontecer em um dia, o que nunca acontece. Mais importante ainda, quando um dia encerrar, maioria dessas atividades econômicas será transferida para o dia seguinte. Eles realmente o impacto é muito menor. Mas os jornalistas gostariam de ter seu interesse em suas notícias. É por isso que eles dão um dedo tão alto para que mais pessoas leiam notícias, notícias como grandes empresas, não tenham intenção de lhe dar informações. As pessoas muitas vezes somam nossa idade Cindy, existem altamente, isso muda. Por exemplo, dizem que o custo do material subiu 5%, nunca 7%, a utilidade em 13%, o transporte em 15%. Portanto, o custo total é de 40% em bits. Bizarro, você pode pensar nisso. Você diria que talvez muitas pessoas não façam isso, mas as pessoas fazem isso. Este não é um caso de correlação de status. Se você quebrar o custo, você verá isso. Por exemplo, digamos que os últimos 60% do custo fosse material, 30% de mão-de-obra e utilidade para cinco pessoas e 5% de transporte. Esses 5713, 15% de aumento no custo basicamente aumenta os custos gerais 6,5% um valor insignificante. Mas muito poucas pessoas vão ver através disso. E veremos que o impacto total no aumento do custo explica 5%. As empresas, especialmente empresas de consultoria ou empresas de serviços, muitas vezes veem que têm mais de 200 anos de experiência combinada em sua gestão. Há estranhamente papel com negadores, cada experiência se torna 200 anos de experiência combinada. Isso não significa nada. É apenas correlação de status que mostra uma figura artificialmente e completamente arbitrária para dar a impressão de que uma empresa tem muita experiência. Se uma empresa cortar o salário dos funcionários em 25% 1 ano e aumentá-lo em 25% no próximo ano. Pode alegar que deu às pessoas lá e o salário, o aluno caiu 6,25%. Novamente, essa é outra maneira de se manter discriminado. O lucro líquido de uma empresa aumentou de 2% no ano passado, 4% este ano. Pode-se afirmar que o lucro aumentou em dois pontos percentuais, mas isso não soaria bom. A melhor maneira de afirmar é que a taxa de caldo aumentou 102% para 4%. Isso dará um impacto muito maior. Mas as pessoas fazem, faça-as. Outra forma de status para permitir que a doença seja um tipo diferente de cálculo. Um dedo. Por exemplo, a renda familiar pode ser calculada dividindo a renda total por número de domicílios. Essa é uma maneira de calcular ou multiplicar a renda média per capita pelo número médio de pessoas em um domicílio. A segunda figura sempre dará alta vantagem. Algumas pessoas usam isso. Então, se você quiser mostrar baixa renda familiar, use o primeiro cálculo, se quiser. Portanto, a renda familiar high-end é o segundo cálculo. O que são legítimos? Em 2021? Renda familiar mediana em US$168 mil. No mesmo ano, a renda per capita mediana foi de US$37 mil. O tamanho médio do domicílio foi de 2,6. Se você multiplicar 37 por 2,6, você receberá US$96 mil, o que é muito maior do que os 68 mil. Se a média for usada em renda média. A renda média das famílias aumentará ainda mais. Como você calcula determinará a renda familiar. Pessoas que têm diferentes na agenda. Faremos cálculos diferentes. Vamos tomar este exemplo de como o índice de preços ao consumidor pode ser calculado de forma diferente para dar números diferentes, custos de leite e pão, 1.20.5 no ano passado. Este ano ambos causam US$1,10. Cálculos diferentes podem mostrar um índice de preços diferente e depende da sua agenda e você calculará dessa maneira. Quando o último ano é usado como ano-base, o leite se tornou 50% do custo do ano passado. E a marca se torna 100% do custo do ano passado. Portanto, a média é de 125%, ou seja, um aumento de vinte e cinco por cento. Novamente, se você usar o ano atual como o ano base, que também é medido nele. O ano da classe média foi de 200% e o pão era de 50%. Então, o preço médio do ano passado foi de 125%. Este ano é o ano base. Isso é 100%. Então este mostrará que o prêmio do ano passado foi vinte e cinco por cento maior. Este não mostraria os preços caírem. Se você usar a média geométrica , ela não mostrará nenhuma alteração. Com base em como você calcula o índice de preços 1º de maio mostra um aumento no preço. Agora isso pode mostrar uma diminuição no preço. E alguns cálculos podem não mostrar alterações nas aves, embora os preços sejam exatamente os mesmos nos três casos. O valor do percentil é outra coisa interessante ao examinar o percentil, por exemplo, as fileiras de alunos em uma turma de 399 percentil são os três melhores alunos. Isso fez isso. 1% de 300 alunos, 98% dines são os próximos três alunos e assim por diante. Há uma grande diferença entre o percentil 99, o percentil 90, como você pode ver nessa distribuição normal, que geralmente é o caso de um grande na figura. Mas à medida que as fileiras fecham no meio, dificilmente há diferença entre 14, 60%. Frase. Diz que você pode ver nos lados extremos, os percentis são esticados. Há uma grande diferença entre 9919, onde está, a diferença entre 4060 é muito menor. O fornecedor disse que ele aumentou preço em 20% porque esse custo aumentou 20% no processo em bem aumentou seu dólar absoluto. Essas são maneiras diferentes de ver quão diferente em maneiras estatisticamente. Frase subpar. 1º de maio diga, bem, Google muda sua pessoa morrendo por 40 a 60, enquanto eles mudarão de 1999, enquanto o 90 para 99 é muito maior. Da mesma forma, aumentando proporcionalmente o preço com base no custo, pode-se aumentar bem seus dólares reais. Essas são maneiras diferentes de Stanford. 9. 8 dados relevantes: Tenha dados relevantes. Quando as pessoas não conseguem provar algo diretamente, elas usam metade dos dados relevantes como proxy para provar isso. Cuidado. É difícil provar a eficácia da pasta de dente. As empresas mostram como seus produtos destroem germes em condições laboratoriais. Essas duas condições não são as mesmas. O que funciona no laboratório pode não funcionar dentro da nossa boca. Além disso, muitas vezes não está claro que tipo de bactéria eles estão matando no laboratório. Esses são o mesmo tipo de bactéria que existe na nossa boca? Você ficaria surpreso. Também não está claro que tipo de dosagem a terra usando. É uma equipe completa para escalar algumas bactérias? Nenhuma dessas informações é muito clara. Mas mesmo assim eles estão alegando que seu anúncio para avançar é muito eficaz na morte de bactérias no LRMR. Esse é o uso de metade dos dados relevantes. Uma empresa de refrigeradores pode anunciar que mantém, produzir 50% mais fresco. Você diz isso o tempo todo, mas mais fresco em comparação com o quê? Outro refrigerador. Armazenar alimentos em um refrigerante, certo? Sombra, ou apenas comida viva sob calor e umidade do verão. Você ficará surpreso com o que esse 50% é calculado com base em. Sindicato trabalhista diz que 85% dos funcionários estão descontentes com a gerência. Eles estão usando dados irrelevantes. Para fazer uma entrega de casos fortes, a União muitas vezes coleta todos os complexos possíveis, incluindo os muito triviais, como para redes, luzes precisam ser substituídas. Então e assim e adicione-os para dizer que oitenta e cinco por cento dos funcionários estão reclamando contra a gerência, o que não é verdade. 100% dos cidadãos de um país reclamam de algo durante um período de tempo. Mas é injustificável concluir que os cidadãos de 100 pessoas estão descontentes com seu governo. Novamente, ele usará detalhes relevantes. Às vezes, os dados relevantes se tornam extremamente proeminentes. gripe espanhola é um exemplo. Em 1918, o surto de H1N1 é chamado de gripe espanhola. Curiosamente, a gripe não se originou na Espanha nem era mais prevalente na Espanha. Só porque foi coberto mais por jornais espanhóis. Porque eles não estavam diretamente envolvidos na Primeira Guerra Mundial. E todos os outros países da Europa aprendem travando guerra nascida inata. Por causa do fato de ele estar em jornais espanhóis. A gripe é chamada de espanhol. Governos de todos os países são usuários notórios com metade dos detalhes relevantes. Aqui está um exemplo. Durante 1898, guerra espanhola americana, a taxa de mortalidade na Marinha era de 94 mil centros. A taxa de mortalidade em Nova York naquele momento era de 16 mil pessoas. Os recrutadores da Marinha usam esse número para comparar e afirmar que foi sofrido para estar na Marinha. Dan para estar fora de 82 pessoas enganadas para se juntarem à Marinha. Obviamente, a taxa de mortalidade de idosos e doentes em Nova York foi comparada com jovens e pessoas fortes estavam morrendo mais. Estes não são comparáveis, não são relevantes. Muitas vezes, os dados relevantes influenciaram a tomada de decisões. Por exemplo, em 1950 ao ano é visto mais como o ano da pior epidemia de poliomielite em nós. Investigação descobriu que o dever mais conscientização, mais casos em que um diagnosticado e relatado e mais pessoas se apresentaram devido à ajuda financeira federal. Além disso, o ano teve mais crianças suscetíveis para essa faixa etária. Todos esses números contribuíram para um número maior de casos, mas a figura morta, que é uma medida melhor onde não fora do comum. 1952, ficou famoso como o ano da epidemia de poliomielite nos EUA. Mas tudo isso foi baseado em meio aleatório e dados. Na realidade, foi como qualquer outro distrito que registra e relata mais crimes são vistos como mais propensos a crimes apenas porque eles estão relatando mais em comparação com alguns outros distritos que não são relatórios. Políticos em todos os países dos usuários mais prolíficos de metade dos dados relevantes. Analise todos os dados para encontrar estatísticas que indiretamente se adequam às suas inanidades. Antes de chegar ao poder, alguns distritos disseram que baixa renda e alguns tinham alta renda. Depois de Bauer, alguns distritos também adicionam alta renda e alguns tinham baixa renda. Os políticos escolherão um distrito com baixa renda antes do poder, e o distrito com alta renda após poder para mostrar que sua governança aumentou a renda. Enquanto a oposição fará o contrário. Eles vão em um distrito com alta renda baixa renda depois para mostrar que o governo causou a queda da renda. É assim que as pessoas usam metade dos dados relevantes para fazer todos os pontos. Mas nem sempre é possível examinar todos os dados. Apenas esteja ciente, porém, que todos os dados que são apresentados em entidades de mídia, homens, em todos os lugares onde as pessoas estão tentando influenciar nossa decisão. As chances são de que eles estejam usando dados metade relevantes para fazer isso. Estamos todos familiarizados com as fotos antes e depois. Fotos antes e depois mostram como algumas pílulas seguravam alguém perder peso. Mas os anunciantes não mencionam todas as outras forças que a pessoa está fazendo para perder peso. Não são apenas as pílulas que estão causando essa perda de peso e que são usadas com metade dos dados relevantes. Portanto, perder peso não é completamente irrelevante para o uso de um produto. Pode ser até perder peso sem usar este produto se eles estiverem fazendo exercícios, comendo menos e tendo um estilo de vida saudável. Meu pai semear metade dos dados relevantes é usado em amputados significando aprimoramento para fazer questão de influenciar nossas decisões. 10. 9 Verifique a escala: Verifique a balança. Sempre verifique cuidadosamente a escala ao observar os dados apresentados em um gráfico ou algum tipo de diagrama de linha. Uma das formas mais comuns que ele usou, existimos ou diminuímos a mudança de valores é manipulando a escala. Apenas ficar em percentual de aumento no salário pode ser exacerbado em dramaticamente ao mostrá-lo em Lake. E é o gráfico inferior que mostra como uma estagnação como está na carga superior. Os dados do Sam apresentados em diferentes escalas parecem diferentes. E apenas olhando para este gráfico de linhas, 1º de maio chega a conclusões muito diferentes sem entrar em quanta mudança está acontecendo. Muitos anunciantes dissolvem os tempos, está brincando com a escala para acentuar os resultados. Porque eles sabem que metade das pessoas estaria em um resistente é essa escala. E a outra metade seria tão influenciada pela dramática representação visual. Porque a representação visual é tão poderosa que eles ignorarão essa escala. O propósito dos anunciantes de acentuar a diferença seria atendido. As barras são quebradas em um gráfico de barras para exibir mudanças para cima e para baixo. Vamos dar esse exemplo. Em 1995, os acidentes rodoviários foram 7.800. Em 2005, os acidentes rodoviários onde 7,728 excedem. Mas quando plotado em um gráfico de barras quebrado que está quebrado no nível 7680, essa pequena mudança de 80 nem acidentes é acentuada. Então as pessoas olhando para ele e dizem: Oh meu Deus, 2005 lidera tantos ácidos inferiores. Mas é só ser assim que gráficos quebrados em escalas são usados para manipular decisões. 11. 10 comparação por imagem: Comparação por fotos. Comparando por imagem. Muito tempo, as pessoas intencionalmente e não intencionalmente exageram ou diminuíram dados. Registros de grime nos EUA em 199098 onde comparados por imagem e redução pareciam dramáticos. Isso ocorre porque mesmo que a altura dos criminosos nesta imagem seja proporcional ao volume ou não. Então, na realidade, essa rima caiu entre 15 milhões em 9 milhões. Mas parece muito menor porque o volume do criminoso menor é muito menor. Parece que a redução do crime foi justa. Da mesma forma, a produção de manga na Índia. Quando comparado com a China. Pela altura da manga, parece muito maior do que realmente. China era de 4,5 milhões de toneladas. A Índia é dezoito milhões e dez, mas o volume da manga maior é muito maior do que quatro décimos, é mais como 1015 toneladas. Essa é a nossa pessoa pode dar uma impressão de uma figura é muito maior ao mostrar duas fotos. Da mesma forma, as vendas de veículos automotores na Índia aumentam de 3,2 milhões em 2014 para 4,4 milhões em 2019, apenas trinta e sete por cento aumentam. Mas quando isso é mostrado por dois carros, o segundo é 37% tolerante que o primeiro. Só olhando para isso, as pessoas ficariam com a impressão de que as vendas de carros aumentaram muito mais em 2018. Esse truque é comumente usado por anunciantes e propagandistas cujo objetivo é enganar os espectadores. Porque uma vez que essa impressão é a mente das pessoas, as duas impressões de mangas no slide anterior são duas fotos de criminosos no primeiro slide. E aqui estão duas fotos de carros. Do que um tipo de decide que eles aumentam é muito maior, mesmo que seja muito pequeno.