Cómo detectar un engaño estadístico para una mejor toma de decisiones | Saptarshi Bhattacharyya | Skillshare

Velocidad de reproducción


1.0x


  • 0.5x
  • 0.75x
  • 1x (Normal)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Cómo detectar un engaño estadístico para una mejor toma de decisiones

teacher avatar Saptarshi Bhattacharyya, Make Better Decisions

Ve esta clase y miles más

Obtenga acceso ilimitado a todas las clases
Clases enseñadas por líderes de la industria y profesionales activos
Los temas incluyen ilustración, diseño, fotografía y más

Ve esta clase y miles más

Obtenga acceso ilimitado a todas las clases
Clases enseñadas por líderes de la industria y profesionales activos
Los temas incluyen ilustración, diseño, fotografía y más

Lecciones en esta clase

    • 1.

      Introducción

      2:01

    • 2.

      Sesgo de muestreo

      8:36

    • 3.

      Tamaño de muestra

      6:20

    • 4.

      Números pequeños

      4:13

    • 5.

      Problema promedio

      16:35

    • 6.

      Paradoja de Simpson

      14:28

    • 7.

      Correlación de efectos de causa

      11:31

    • 8.

      Estadística

      8:59

    • 9.

      Datos pertinentes

      7:30

    • 10.

      Comprueba la escala

      2:22

    • 11.

      Comparación por imagen

      2:32

  • --
  • Nivel principiante
  • Nivel intermedio
  • Nivel avanzado
  • Todos los niveles

Generado por la comunidad

El nivel se determina según la opinión de la mayoría de los estudiantes que han dejado reseñas en esta clase. La recomendación del profesor o de la profesora se muestra hasta que se recopilen al menos 5 reseñas de estudiantes.

54

Estudiantes

1

Proyectos

Acerca de esta clase

Vivimos en edad de sobrecarga de información. Necesitamos usar datos constantemente para verificar pruebas y verificar la validez de muchas reclamaciones hechas en nuestras vidas personales y profesionales.

Sin embargo, en la mayoría de los casos no tenemos tiempo de revisar los datos en bruto sobre los cuales se hacen todas las reclamaciones, y tampoco tenemos acceso a ellas. Desafortunadamente, todos aprovechan esta opacidad y usan varios trucos estadísticos para doblar los hechos, para que se sirvan sus propios objetivos y agenda.

Desde artículos de noticias, hasta reivindicaciones de publicidad, comunicaciones comerciales y campañas políticas, todo el tiempo en que los datos e información se procesan y se presentan de maneras astutas y engañosas.

Esta clase enseña los 10 trucos estadísticos más utilizados para ocultar hechos mientras presentas datos. Al final de la clase, los participantes podrán detectar y derrotar los trucos, examinar objetivamente las pruebas para cualquier reclamo y tomar decisiones personales y empresariales más óptimas.

Conoce a tu profesor(a)

Teacher Profile Image

Saptarshi Bhattacharyya

Make Better Decisions

Profesor(a)

Habilidades relacionadas

Desarrollo Más Desarrollo Ciencia de datos
Level: All Levels

Valoración de la clase

¿Se cumplieron las expectativas?
    ¡Superadas!
  • 0%
  • 0%
  • Un poco
  • 0%
  • No realmente
  • 0%

¿Por qué unirse a Skillshare?

Mira las galardonadas Skillshare Originals

Cada clase tiene lecciones cortas y proyectos prácticos

Tu membresía apoya a los profesores de Skillshare

Aprende desde cualquier lugar

Ve clases sobre la marcha con la aplicación de Skillshare. Progresa en línea o descarga las clases para verlas en el avión, el metro o donde sea que aprendas mejor.

Transcripciones

1. Introducción: Esta clase muestra cómo estadísticas enfermedad para ocultar la verdad con el fin manipular nuestras decisiones y cómo podemos detectar estos trucos para tomar mejores decisiones. Hola. Soy experta en ciencias cognitivas con más de 25 años de experiencia en Estados Unidos, India, Oriente Medio y Sudáfrica. Vivimos en una era de la información. Necesitamos usar datos para tomar todas las decisiones. Pero para los vendedores, políticos de medios , a todos los empresarios, todos esconden verdad real detrás estadísticas cuidadosamente construidas para que los datos que presentan jarabes, su propio propósito o orden del día. ¿ Qué podemos hacer? Bueno, es bastante simple. Necesitamos aprender los trucos estadísticos que la gente usa para engañar a otros para que podamos atraparlos en el acto y tomar mejores decisiones. En esta clase, aprenderás sobre los diez trucos estadísticos más comunes es por parte de los marketers, medios de comunicación, médicos de spin, políticos, negocios y otras personas para ocultar datos a plena vista. Para que al final de esta clase, puedas tomar decisiones mucho mejores impulsadas por datos en situaciones tanto personales como empresariales con confianza. Quién puede tomar esta clase 12, casi todo el mundo, desde principiantes hasta profesionales, los líderes empresariales hasta los estudiantes. Todo el mundo se beneficiará de esta clase. Al término de esta clase, por supuesto, hay un proyecto que implica investigar situaciones prácticas delgadas cuando la gente generalmente toma decisiones equivocadas debido a los trucos estadísticos discutidos en la clase. El objetivo de los alumnos es detectar primero el truco aplicable y luego averiguar la forma correcta de tomar decisiones. Supongo que eso es más o menos. ganas de verte en la clase y todo, sí, no olvides poner tus comentarios y retroalimentación al final. 2. 1 Bias a hacer un muestreo: El sesgo de muestreo, ya que las estadísticas pueden ser a veces un poco pesadas Así que empecemos con un estado de ánimo más ligero con una caricatura. Entonces el tipo ha creado un alimento para aves, que es vehículo. Y dice, después de degustar cada ave que frecuencia la acera fuera de este edificio, hemos concluido que lo que las aves realmente les encantaba sus vehículos. Eso significa para decidir qué les gusta a las aves, todo lo que ha hecho es mirar a Bard. Las aceras estaban comiendo bagels porque los bagels están siendo arrojados de sus edificios. Esa es una forma divertida de mirar. Fue el muestreo puede llevar a una conclusión sesgada. Las estadísticas se trata de recolectar un pequeño número de candidatos de una gran población es pequeño número de candidatos se llama muestra. Y decidir sobre la gran población en base a verificar con la muestra. El muestra es representativo de la población, son divertidas inclusiones son correctas. Si la muestra está sesgada como está en la imagen que son más puntos verdes entonces los rojos en la muestra en comparación con la población. Entonces nuestra conclusión basada en muestra tampoco es válida. Mucho tiempo en encuestas de la vida real que las conclusiones no son válidas porque las muestras son sesgadas. Por ejemplo, yo realmente, graduados universitarios siempre muestran un salario más alto que el salario real que obtienen esos egresados porque la gente retira salario en la respuesta. A veces antes del otoño. Los estadísticos predicen en base a encuestas, alguien va a ganar, alguien más gana con un gran deslizamiento de tierra, como sucedió en la elección de 1932. Porque el muestreo fue sesgado. En las encuestas electorales de 2012, se llevó a cabo por teléfono fijo, lo que predijo que Obama perdería. Pero Obama ganó porque muchos oficiales, simpatizantes estaban realmente usando teléfono celular y por lo tanto serán denotados por eso. Fomenta una encuesta. Se guarda que al 80% de los británicos les gusta el vehículo eléctrico. La primera pregunta que debes hacer es el 80% de qué pieza, los británicos. Porque si la muestra es sesgada y pasa a ser de una sección del pueblo británico, entonces es representativa de esa sección en lugar de población británica muerta. Ahora, echemos un vistazo a cómo sucede el sesgo de muestreo. Empecemos con el caso de los alumnos de Ivy League. Sábados promedio. Declaración publicada por una revista dice que el salario promedio de Ivy League MBA's después de cinco años de graduación es de $300 mil. La pregunta es, ¿qué tan precisa es una declaración como esa? Ahora la declaración puede ser muy equivocada y engañosa. ¿ Por qué? Porque no mencionan cuál era el tamaño de la muestra. No mencionan que si tuvieran un contacto de todos los egresados para seleccionar. Tampoco mencionan si la lista de candidatos que respondieron donde se selecciona aleatoriamente, o simplemente tomaron las respuestas de personas que se preocupan por contestar. Tampoco habla de cuántos de ellos realmente responden a esas preguntas. Si se les hace esta pregunta a 50 personas y cinco respondieron. Si promedian estos cinco y dicen que es género mil dólares, ese es un caso muy sesgado porque que cinco mujeres no sean representativas. Esta siguiente pregunta es, solo respondieron las personas con hi cordura, lo cual es muy probable que ese caso. ¿ Fue muestras representativas? Como se puede ver, tienen tantas preguntas y la mayoría de las encuestas evitan cuidadosamente responder a cualquiera de esta pregunta. Por lo que no puedes confiar en ninguna conclusión de encuesta salarial. gente pueda manipular muestra o simplemente ser descuidada, no son metódicamente correctas al recolectar muestra. Y como resultado, desafortunadamente, significado de este semillero resultados no son confiables. 60% de los indios urbanos prefirió la educación en ingeniería, que 60%, 80 por ciento de los indios preferían un cierto 13, 80% de los cuales indios. El resultado de un estudio para ser warp cualquier muestra debe ser representativo y aleatorio. Es decir, mientras recogen la muestra, todos los candidatos deben tener las mismas posibilidades de ser seleccionados. Muchas veces. Ese no es el caso. Existe una batalla constante para reducir el sesgo de muestreo haciendo que el muestreo sea aleatorio. El sesgo de muestreo siempre está ahí. Si vemos declaraciones como esta que 60% de los indios urbanos preferían a la educación de ingeniería uno debería como 60% de los cuales las personas. No sería el 60% de las personas a las que les importa preguntar. No 60% de en nuestro paquete, indios. Cuando el muestreo aleatorio no es posible o consume mucho tiempo o es costoso, lo que significa muestreo aleatorio, cada candidato tendrá la misma posibilidad de ser seleccionado si eso no es posible . Lo siguiente mejor es el muestreo aleatorio estratificado, donde se divide la población en varios grupos con base en la prevalencia de ese grupo. Entonces si una población de 50% blanca, 30% negra, 20% asiática, se recoge un cierto número de muestras de la comunidad asiática, un cierto número de muestras de la comunidad negra, y cierto número de muestras de comunidad blanca en proporción a su dígito Parson. Y eso puede implicar violación. Y eso es un estratificado. Los grupos pueden basarse en el ingreso, la educación, la etnia, o cualquier otra cosa. Pero si tu conocimiento de la proporción es incorrecto, el muestreo, también estaríamos sesgados. Por ejemplo, si una clase de posgrado 30% de las mujeres es 70% hombres, si sus tamaños de muestra calculan ser diez, puede seleccionar al azar tres de las alumnas y siete de las alumnas. Eso no sería un caso de muestreo aleatorio estratificado. Eso sería algo utilizable. Recuerda, sondeos propios e iniciados los resultados son algo sesgados. El sesgo proviene de dos fuentes diferentes. En primer lugar, son los pasos que estamos haciendo la entrevista. Ellos la edad, la educación, la etnia y la experiencia del personal entrevistador influyeron fuertemente en el resultado de la encuesta. En un caso, se encontró que a partir de si personal blanco o negro haciendo la entrevista de comunidades negras, los resultados fueron bastante diferentes. La segunda fuente de sesgo son las personas que tienen una mayor tendencia a ser seleccionadas ya que las muestras son candidatos. Generalmente personas con más dinero, mejor educación, apariencia beta, más información y alerta. comportamiento más convencional y los hábitos aceptables se seleccionan más como candidatos a entrevista o muestra. Y como resultado, dessesga el obstáculo. **** y resultados de la encuesta. 3. Tamaño de 2 muestras: Tamaño de la muestra. En muchos casos, las personas no usan un tamaño de muestra lo suficientemente grande como para llegar a una conclusión. Por ejemplo, escucho mientras que estudios de reclamos publicitarios muestran que aquí voy X reduce aquí la falla para el 80% de los usuarios. Pero, ¿qué tan creíbles son estas declaraciones? Algunos anunciantes proporcionan una letra que mencionó un tamaño de muestra pequeño, pero algunos ni siquiera lo hacen. Desafortunadamente, para la publicidad comercial, no existe una regulación que establezca que se cierto tamaño muestral y ciertamente deba utilizar cierto tamaño muestral y ciertamente metodologías. Al igual que es el caso de los productos farmacéuticos. Y como resultado, gente sí reclama todo tipo de cosas basadas en todo tipo de muestreo. Esos resultados se basan principalmente en el tamaño de muestra pequeño. Y de ahí que el falso pueda deberse a menos posibilidades. O las imágenes muestran algunos casos de su muestreado para mostrar buen resultado para que puedan hacer un reclamo en un anuncio. Sin embargo, se muestran todo el tiempo. Si arrojas una moneda diez veces y obtienes ocho cabezas, no puedes afirmar que el estudio muestra la posibilidad de conseguir cabezas en el lanzamiento de monedas es del 80%. Es necesario tener gran cantidad de tarea de monedas para establecer cuáles son las posibilidades de conseguir cabezas y cuáles serán el 50%. De igual manera, para establecer cualquier reclamo, es necesario tener un tamaño de muestra lo suficientemente grande. El tamaño de la muestra dependería de cuán variables son los resultados y confianza que necesita para estar en su reclamo. Digamos que la probabilidad de casos graves de fiebre vital es de solo 10% entre los niños. Has seleccionado a 1 mil niños con el escritorio vital de la fiebre. La efectividad de un medicamento. ¿ Es esto un tamaño de muestra lo suficientemente grande? Has seleccionado ciento diez cientos. Estabas feliz de que el tamaño de la muestra sea 100000. Pero en realidad, el 90% de esos niños mejorará. Incluso sin la medicina. En realidad estás probando el medicamento en solo 10% o 100 niños que necesitan este medicamento porque serían la inductancia de los casos graves. Eso es en realidad un tamaño de muestra más pequeño de lo que pensabas. El tamaño real de la muestra es dominio digital por el intervalo de confianza y la desviación estándar sobre una base de caso a caso. Entre población. Pocos factores son importantes estimar el tamaño muestral necesario. Su nivel de confianza, intervalo de confianza, puntuación Z, que depende del nivel de confianza, la desviación estándar y el tamaño de la muestra se calcula en base a eso. Y no me meteré en muchos detalles, pero es importante que seamos conscientes. Existen ciertas formas de calcular el tamaño de la muestra. Nivel de confianza es la medida de que repetirás el experimento un 100 veces, cuántas veces obtendrás resultado similar. Generalmente se usa como noventa y cinco por ciento son la mayoría de los casos. intervalo de confianza es el grado de ADR. Se usa generalmente como más menos 5%. La puntuación Z es una medida de cuántos área de desviación estándar de la media basada en el nivel de confianza que hayas seleccionado, hay una puntuación z para la desviación estándar es el grado de variabilidad. Si no sabes nada, puedes usar 0.5. Poniendo todos estos, hay un cálculo estándar que es raíz cuadrada de puntuación z multiplicado por desviación estándar, multiplicado por una desviación estándar menos dividida por intervalo de confianza al cuadrado. Con un nivel de confianza del 95% y el intervalo del 5%, se obtiene un tamaño de muestra de sello de género en 85. Por lo tanto 4.5 desviaciones estándar. Por lo que un tamaño de muestra de 400 a 500 generalmente es un tamaño de muestra lo suficientemente bueno para la mayoría de los casos. Determinar el tamaño muestral es un paso crítico de cualquier encuesta estadística o estudios estadísticos. Porque si esto ha hecho mal, ingresan a estudio o encuestas mal. Hubo algunos casos colosales de ps. En la década de 1950. Estudio de la vacuna contra la poliomielitis en 450 niños fueron vacunados y 680 se mantuvieron sin vacuna como parte de estable durante un brote de poliomielitis, ninguno de los niños contrajo poliomielitis porque la tasa de contracción fue apenas menos del 1%. En realidad el tamaño de muestra necesario entre 38 por 1040 mil niños. Por lo que podrían esperar tener de 300 a 400 casos de poliomielitis sería el tamaño de muestra efectivo para probar la vacuna. Había camino, muy equivocado. Esto seleccionó cuatrocientos cincuenta y seiscientos, alrededor de 1100 niños donde se necesitan de 30 mil a 40 mil niños. Por lo tanto, la estimación del tamaño muestral y el uso del tamaño muestral valor correcto es de extrema importancia para todo estudio estadístico. Pero desgraciadamente, en la mayoría de afirmaciones que vemos para los anunciantes, para diferentes productos o incluso para políticos, medios de comunicación y demás. Todos estos chicos, casi todos estos chicos no se internan, usan un tamaño de muestra lo suficientemente adecuado y el resultado. Ninguna de esas reclamaciones se gestiona. 4. 3 números pequeños: Pequeños números. Empecemos con los acuerdos. Un pueblo tiene dos hospitales, uno pequeño y otro grande. Uno de los dos hospitales en un mes, 60% de los bebés nacidos por el cual. tanto que típicamente es del 50%. ¿ Cuál es? El pequeño o el hospital grande? La respuesta es el pequeño hospital. Porque al igual que un pequeño tamaño de muestra, casos extremos o inusuales. En este caso, 60%. Los niños son inusuales, 50%, Los casos habituales inusuales se observan en tamaños de muestra pequeños, son, en este caso, hospital pequeño. Mientras investigaba casos de cánceres renales en más de 3 mil condados estadounidenses, se encontró que el juego de mayor incidencia de condados pequeños. Curiosamente, también se encontró que la incidencia más baja también ganó de condados pequeños. Eso significa que los condados pequeños y menos poblados tuvieron tanto la incidencia más alta como la más baja. Ese es el caso de los números pequeños. Y por qué sucede. Echemos un vistazo a un condado realmente pequeño con solo estancia en adultos. Como es solo en adultos, es muy probable que el nano tenga cáncer. Mostrará 0. Pero si solo una persona se cancela por casualidad, también mostrará un 10% de incidencia, que es muy alta. Eso significa que si la cuenta es pequeña, lo más probable es que se salve de muchos casos. Y justo si tiene unos pocos, mostrará unos altos casos de incidencia. Por lo que los condados pequeños mostrarán incidencia tanto alta como baja. Los distritos pequeños con baja población siempre mostrarán resultados extremos. Donde en distritos más grandes, los casos de población enteros vivimos fuera para mostrar resultados más promedio. Una cadena de supermercados descubrió que las tiendas más pequeñas mostraron tanto la huella más baja como la más alta por unidad de área y ventas por unidad de área. El tamaño de muestra más pequeño es más probable que muestre resultados extremos debido a la aleatoriedad. Y una muestra más grande representa mejor a una población. Por eso escuchamos algo llamado ley de gran número en estadística. Para poder llegar a cualquier conclusión, solo se puede depender de grandes números y cuando grandes cantidades de cosas muertas para promediar. Ahora, ¿cómo en caso de números pequeños las cosas obtienen resultados extremos? Tomemos otro ejemplo. Digamos como estudiantes que siguen siendo como 100 habitación con cinco alumnos en cada uno. De 500 estudiantes totales, 25 obtuvieron un plus en su examen. Eso significa que muchas de las habitaciones tienen 0% estudiantes con un plus porque solo hay 25 alumnos a plus y 100 habitaciones. Pero si una habitación acaba de ganar un estudiante plus, mostrará 20% casos de un estudiante más uno dividido por cinco, es decir 20. Habitación tiene a los estudiantes por casualidad mostrará 40% casos de un plus. Se puede ver debido a que las habitaciones son pequeñas, cualquier figura quedará exagerada. Es así como existían pequeños números en los resultados. Y esa es nuestra ley de gran número necesita mayor número para llegar a una conclusión. 5. 4.: Problema promedio. Una de las formas más comunes en que las estadísticas es, es, es como alguien de muchos datos. El promedio es probablemente la estadística de resumen más utilizada. Nos gusta resumir muchos datos en una sola figura. Y esa es la popularidad de la media. Escuchamos declaraciones como economía creará 20 mil empleos mensuales. Esa es una cifra promedio. País vamos a conseguir 20 pulgadas de lluvia y otro promedio aquí, alrededor de aumento salarial promedio de 10% por año y así sucesivamente. Pero todas estas cifras promedio pueden ser realmente engañosas y pueden ocultar más información que el show. Por ejemplo, algunos meses pueden sumar 50 mil empleos, mientras que algunos otros meses pueden sumar a Justin mil empleos. Entonces alguien de 20 mil no significa mucho. De igual manera, algunas partes del país pueden quedar inundadas. ¿ De dónde podría haber sequía en algunas otras partes. Por lo que la precipitación promedio de 20 pulgadas en un país no significa nada. De igual manera, algunas personas el salario puede duplicarse, donde hay algunos quizá no lo vean aumentar en absoluto. Por lo que un aumento salarial promedio del 10% es información absolutamente inútil en cuanto a entender el aumento real entender el aumento realde la preocupación de los salarios de las personas. Se dice que no cruces un río si es en promedio cuatro pies de profundidad. Debido a que el río puede tener 20 pies de profundidad, agrega algunas caras que solo uno o dos pies de profundidad en algunos otros lugares. Entonces un promedio de profundidad libre, es decir, si estás tratando cruzar el río pensando que será para imprimir en promedio, un borracho. Uno de los casos dramáticos del problema del uso de la media fue lo que los científicos descubrieron durante los primeros años de rastrear el calentamiento global. En ese punto, los científicos estaban mirando principalmente el aumento promedio temperatura y tratando de correlacionar que con los campos filtrantes o de hielo polares, se sorprendieron al encontrar que incluso si la temperatura promedio sigue siendo la misma, más que más casquillos de hielo polares, nos estamos derretiendo año tras año. Posteriormente, descubrieron incluso si el promedio sigue siendo el mismo, años con los altos picos temperatura causaron más demanda de ojos. El promedio no fue mucho de uso. De igual manera, solo intenta mirar dos casos en los que una persona bebe una cerveza todos los días durante 30 días. Entonces eso es promedio de una cerveza al día. tanto que otra persona no bebe ninguna cerveza durante 29 días y en fecha 30, bebe 30 años. En ambos casos, el promedio es de una cerveza por día, pero el impacto de beber cerveza será mucho más severo, sería fatal en el segundo caso de beber 30 cervezas al día. Del mismo modo, el promedio puede ser realmente engañoso. Otro caso famoso de problema con promedios donde en 1997 inundación de Grand Forks, la ciudad tuvo un dique de 51 pies. Mayor a 49 pies pronosticado nivel de agua del río, que fue un promedio. Pero en algunos lugares durante una inundación, el agua alcanzó los 53 pies aunque el promedio permanezca para la cena. Pero en esos casos o desplazamientos, el agua violó el dique, causando sangre a la ciudad. El uso de promedios depende de los promedios porque las inundaciones en los promedios de la ciudad pueden ser engañosas de muchas otras maneras. Tomemos el caso de la esperanza de vida promedio. Por ejemplo, en 19 cientos, la esperanza media de vida al nacer fue de 30 años. Pero estos 32 años realmente no significa nada. No significa que todo el mundo muriera a los 32. Muchos dieta en bart, muchas dietas menores de cinco años mueren durante librar la guerra. Pero los que sobrevivieron a todos los vivieron hasta ser sesenta y setenta, igual que hoy, el promedio salió a ser 32, pero esta cifra realmente no significa nada. Por eso no hay empresa promedio. No hay fluctuación media del mercado bursátil. No hay guerra promedio, promedio ni epidemia, ni campaña de mercadotecnia promedio, ni venta promedio de libros. En la mayoría de los casos, la distribución puede ser muy sesgada. Un monarca promedio significa cualquier cosa. Por ejemplo, el lado izquierdo, ve que es sesgo negativo de la distribución donde la evidencia se mueve hacia la izquierda y el lado derecho, se puede ver un sesgo positivo donde está el promedio se trasladó a la luz porque es. En detalle hacia la derecha, sólo en el caso de los promedios centrales de distribución normal en el centro. Y así es algo significativo, pero en todos los casos reales, la distribución de valores siempre está sesgada. Y como resultado, promedio no transmite ningún significado mucho útil. En el contexto del resumen estadístico, se utilizan tres tipos de promedios. Se les llama media, mediana y modo. media es la media aritmética simple. Tomemos el ejemplo que se muestra en la tabla a su izquierda. Digamos que en una habitación, hay 20 personas. Sus salarios se muestran en las columnas. Sus salarios varían entre $20 mil al año y 3 millones de dólares anuales. Entonces el salario medio es que mitiga el promedio, que sale a ser 248,750 Donner. Ahora, la mediana es el salario en el medio cuando todos están dispuestos en orden ascendente o descendente. En este caso, está saliendo a ser 56,500 dólares. modo es la cifra salarial que más ocurre en esto, si ves 60 mil vendedores ambulantes dos veces frente a todo lo demás operando una vez. Entonces $60 mil es el modo. Como se puede ver, cuando pocos valores atípicos pueden cambiar la media o mediana es un mejor resumen. En este caso, entre 20 personas, sólo dos personas tienen un salario muy alto, 1 millón en 3 millones de dólares. El resto de ellos están entre 20000.95000. Así a valores altos o sesgar los medios. ver si alguien dice que el salario promedio de las personas en la habitación es de 248 mil dólares, eso no refleja la verdadera naturaleza de los salarios que las personas en la habitación. Entonces en comparación con esa mediana, que es de 56 mil dólares, es una representación mucho mejor. En todos los casos donde unos pocos valores atípicos pueden promedios fuertemente sesgados. La mediana es una mejor estimación de las estadísticas promedio. Modo en este caso también en algo útil, pero en muchos casos puede que algo no suceda más de una vez. Por lo que más hombres son capaces de ser utilizados. La mediana es una mejor estimación en muchos casos que están fuertemente influenciados por valores atípicos altos o bajos. Pero en todos los casos prácticos donde la distribución está fuertemente sesgada a un lado u otro, no se puede utilizar la media media, la mediana o el modo. Tomemos el ejemplo del cáncer. Mucho tiempo el dr le dirá a una base de cáncer y que acaba de hacer una licencia de monstruo o 18 meses de vida. El paciente no debe perder el corazón. Porque esos 12 meses o 18 meses podrían ser un valor medio y medio. Y eso puede estar muy sesgado porque podría haber mucha gente muriendo inmediatamente o después de filmar. Es mi diff el paciente sobrevive los primeros meses. Él o ella puede esperar vivir una vida mucho más larga. Porque incluso el modo puede ser muy moverse hacia el lado derecho o hacia el mayor número de meses o años. Mira el caso de la distribución C, donde tanto la media como la mediana está hacia la izquierda, pero el número real de personas que viven mucho más alto que la media y mediana es hacia la derecha. Por lo que se puede incluso dejar 6070 años incluso después de detectarse con cáncer y eso ha sucedido. Tomemos otro ejemplo. Digamos que el 80% de las empresas, es tiene 90 millones de dólares de ventas y apenas el 20% de las empresas tenían 60 millones de celdas. Si calcula el promedio, verá que el promedio sale a ser de 84 millones de dólares. Pero en este caso, 80% de las empresas que están por encima de la media, lo cual es algo difícil de comprender. Es contra-intuitivo. Pero una gran cantidad de casos, los promedios proporcionan un contador, contra-intuitivo y, a veces intencionalmente, barra de flexión resultado. Y personas que terminan tomando decisiones equivocadas usando amperaje. Por lo que siempre mira la distribución y toma una decisión con base en eso. Nunca decidas en base a cifras promedio. Los cálculos promedio a veces conducen a información muy confusa y engañosa. Por ejemplo, la China promedio no proviene de familias promedio porque el cálculo del hijo promedio y el cálculo de la familia promedio no son lo mismo. Ilustrado esto, digamos que hay un pueblo con 100 familias. Un número de niños por familia es como Inserta una mesa a tu siguiente. 100 familias se dividen en cinco grupos de 20 familias, cada una. Primer grupo como 0 niños. Segundo grupo tiene un hijo. Grupo duro tiene dos hijos para el grupo tiene tres hijos. Y quinto grupo ha formado niños. Si la pregunta es, ¿cuál es el número de niños para una familia promedio? Tienes que calcular el número total de niños multiplicando columna izquierda a columna derecha, eso conducirá a 200 niños y lo divides 200 familias. Dará el número promedio de niños o familia, que es de 200 dividido por un 100 también. Pero si hay una pregunta, niño promedio vive con familias con cuántos niños? La respuesta no es diente. Eso significa, aunque la familia promedio tiene dos hijos, pero los niños promedio no viven en una familia de herramientas. Es confuso. Pero echemos un vistazo a los niños. Niños. No hay niños en el primer grupo porque hay 0 niños. Ahora en el segundo grupo, eso es un total de 20 niños. Y vivían en una familia de un niño. En el tercer grupo que son 40 niños. Y luego viven en una familia de niños. El cuarto grupo que son 60 niños, 20 multiplicados por tres. Y todos estos 60 niños viven en una familia de tres niños. En el grupo final que son 80 niños, porque 20 familia multiplicado por cuatro niños AT niños. Y todos estos 80 niños viven en una familia de niños pobres. Entonces para calcular el número promedio de niños con los que vive un niño promedio, hay que multiplicar 20 con uno. Porque 20 niños viven en familias de un solo niño, 40 niños viven en una familia de kits de herramientas, 60 niños viven en una familia complicada y 80 niños viven en una familia pobre de bolsillo infantil. Y hay que dividirlo por Kids totales, que es de 200. Y él conseguía tres. Eso significa que el niño promedio vive en una familia desencadenada, mientras que las familias promedio ajustan los kits de herramientas. Del mismo modo, los empleados promedio no trabajan en una empresa promedio. Estará sesgada hacia una empresa más grande. Por ejemplo, aquí ves que los niños promedio están sesgados hacia familias más grandes con más hijos. Del mismo modo, el ciudadano promedio no vive en un país promedio. El ciudadano promedio estará sesgado hacia esos países de alta población como India, China, EU. Así es como los promedios pueden ser realmente confusos. Vamos a ver otro ejemplo para mostrar cómo estudiante promedio no va a la universidad promedio. Porque el estudiante promedio y los colegios promedio no se calculan de la misma manera. Cts para colegios con alumnos hasta la mesa. colegio uno es pequeño, cuenta con 1 mil estudiantes. colegio dos cuenta con 3 mil estudiantes. cartílago cuenta con 10 mil estudiantes, y la universidad para cuenta con 30 mil estudiantes. Hay un total de 44 mil estudiantes. La primera pregunta es, ¿cuál es el promedio de estudiantes por colegio? Para la universidad suman 44 mil estudiantes. Por lo que el número promedio de estudiantes por colegio es de 44 mil dividido por cuatro, es decir, 11 mil. La segunda pregunta es, promedio de los estudiantes metas a la universidad con cuántos estudiantes? Este cálculo es muy diferente porque en la universidad, 11000 estudiante acude a la universidad con otros 1 mil estudiantes. En la universidad a 3 mil estudiantes va a la universidad con 3 mil estudiantes en la universidad, 310 mil estudiantes acuden a la universidad dentro de 1000 estudiantes. En la universidad para 30 mil estudiantes Va a Colegio de 30 mil estudiantes. Por lo que el estudiante promedio va a la web universitaria 10 mil al cuadrado, 30 mil cuadrados, 3 mil cuadrados, 1 mil cuadrados divididos por 44 mil estudiantes. Por lo que se trata de 22 mil 954. Entonces a pesar de que el colegio promedio tiene apenas 11 mil estudiantes, pero el estudiante promedio va a la universidad de 23 mil estudiantes. De igual manera, la población promedio por país es de 39 millones porque hay alrededor de 7.8 personas booleanas y alrededor de 200 despensas. Divides esos 7.8 mil millones con 200, llegas a alrededor de 39 millones de personas por país. Pero ciudadano promedio vive en un país que es labios con muchas más personas, casi como diez veces más personas. Así es como país promedio y ciudadano promedio no son lo mismo. Estudiante promedio y colegios promedio no son lo mismo. A menudo estas cifras son utilizadas intencionalmente por diferentes vehículos. Y representan esa cifra promedio que sirve a sus parejas. 6. Paradoja de 5 Simpson: La paradoja de Simpson. Entre 196319, ochenta, el puntaje promedio del SAT verbal y matemático de todos los estudiantes estadounidenses bajó 5040 puntos respectivamente. Estas son grandes gotas. Esto condujo a una indignación a nivel nacional. Y se formó panel presidencial. Investigaron los resultados y publicaron un infame reporte llamado Nation at Risk. Estas conducen a medidas drásticas posteriores, una revisión completa del sistema educativo, luchando contra muchos maestros y así sucesivamente. No obstante, una investigación posterior descubrió que curiosamente, cuando todos los estudiantes fueron desglosados en grupos de ingresos individuales, todos los grupos vieron un aumento en la puntuación del SAT entre 19631980, aunque grupo de todos los estudiantes armó. Entonces en grados. Este es un ejemplo de la simple paradoja de Simpson. Y esto se ve en grandes casos diferentes. Para ilustrar el punto, para mostrar cómo sucede, digamos en el año 19631980, todos los estudiantes podrían dividirse en tres grupos principales o grupos de ingresos para clase media y rica. En 1963, abrumadoramente el 70% de los estudiantes provenían de familias ricas y apenas el 20, 10% provenían de familias de clase media y pobres. Y sus puntuaciones promedio en Matemáticas, respectivamente con 554 alcanzan 500 para clase media y 404 tablero, el promedio general fue de 525. Esta mezcla cambió por completo en 1980 debido a que entre 6380, el número total de estudiantes aumentó muchos pliegues. Y todo lo que aumentan el juego de estudiantes pobres y de clase media. Ahora están constituidos 40% cada uno de todos los estudiantes que reducen la proporción de estudiantes ricos a tan solo 20%. Ahora, todos estos tres grupos, puntuación Matt SAT fue mayor. Para los alumnos el puntaje fue de 420, que fue contratado por 20. puntaje de estudiantes de clase media fue de 520, lo que fue mayor en 20 puntos. Enriquecer el puntaje de estudiantes fue de 560, que también fue contratado por diez puntos. No obstante, el promedio general en 1980, fue solo para 88 porque la mezcla total es ahora diferente y más estudiante extranjero y menos proporcional alcanzan estudiantes. El promedio general bajó de 525 en 1967 en tres a 488 en 1980. No obstante, todos los grupos individuales vieron un aumento en promedio. Met es una Discordia. Eso es lo que se llama paradoja de Simpson. La paradoja de Simpson lleva el nombre de un matemático Edward Simpson. Lo descubrió en 1951. Dice a veces un resultado o el entrenado visto cuando los datos se segregan en diferentes grupos. Pero cuando se juntan todos estos grupos, ese resultado se capacita, estos se invierten. Desaparece. Echemos un vistazo a los dos gráficos a su izquierda. En el gráfico anterior, se ven todos los datos juntos en puntos grises. Aquí. Si lo miras, verías que es una tendencia creciente de izquierda a derecha. Cuando divides estos puntos grises en cuatro colores diferentes de verde, amarillo, azul y rojo. Se ve por el verde, es una tendencia decreciente. Para el amarillo, es una tendencia decreciente de izquierda a derecha. Del azul, vuelve a ser una tendencia decreciente. Para el rojo, es tendencia ligeramente creciente pero no tan dramática como los puntos grises. Básicamente, todos los grupos individuales tenían mostrando diferentes trenes en comparación con todos los puntos cuando se juntan en un formato de cuadrícula, es decir, todos los puntos que iban juntos. Eso es lo que se llama paradoja de Simpson. La paradoja de Simpson está presente en muchas áreas y confundió la toma de decisiones. Echemos un vistazo a algunos otros ejemplos. Nuevamente, este es un ejemplo de la vida real. En cualquier programa de doctorado universitario. Fue encontrado. Que 50% aspirantes varones estaban recibiendo aceptados o simplemente ordenado 8% mujeres aspirantes estaban siendo aceptadas. Eso lleva a mucho debate y discusión sobre tener un sesgo contra las mujeres. Pero una mayor investigación mostró una tendencia diferente donde todos los programas de doctorado donde se dividieron en doctorados en ciencias naturales y doctorados en ciencias sociales. Fue encontrado para ambos tipos diferentes programas de doctorado. aceptaban más mujeres que hombres, aspirante de empleo de día de parson. Pero las mujeres predominantemente solicitaron el programa de doctorado en ciencias sociales, que había comparado con el programa de doctorado en ciencias naturales a una tasa de aceptación mucho menor tanto para estudiantes varones como femeninos. Y ese tipo de sesgo, ese nivel agregado de aceptación para las mujeres, ¿cómo sucede eso? Echemos un vistazo a la punta. Por lo que 80% de los estudiantes varones estaban solicitando Ciencias Naturales, 20% para ciencias sociales, mientras que para las mujeres, 30% estaba solicitando ciencias naturales, y abrumadoramente 70% solicitaba Programa de Doctorado en Ciencias Sociales. Ahora para los hombres, el nivel de aceptación para las ciencias naturales, somos 60% y para las mujeres fue del 80%. Las mujeres tuvieron mayor nivel de aceptación para los programas de doctorado en ciencias naturales. De igual manera para el programa de doctorado en ciencias sociales, los hombres tuvieron un nivel de aceptación del 10% y las mujeres tuvieron 20% de nivel de aceptación doble Pero a medida que cada vez más mujeres solicitaron el programa de doctorado en ciencias sociales, cual tuvo un programa de doctorado en ciencias naturales competidor de aceptación mucho menor . El aceptación general para el hombre fue del 50% y las mujeres fue del 38%. Nuevamente, cuando se mira individualmente, es una marca de tendencia única. Cuando se mira en agregado, es una tendencia diferente y parece y gasto. Entonces cada vez que veas una tendencia de datos mientras miras muchos datos juntos, solo recuerda que si hay una manera dividir todos los datos en grupos significativos, los grupos individuales pueden mostrar un drenado completamente diferente, una tendencia opuesta en comparación con todos los datos de cuadrículas que hay que tener cuidado. Se ve en los negocios. Investigación. Todo el tiempo. Empresa vendió split asean ventana AC. Ahí revisa los comentarios de 1000 clientes de cada producto. Por lo que 1 mil clientes que compran split AC, el comprobado. Y como se muestra en la tabla a su izquierda, 800 y decir la luz split AC, eso es 80% a la gente le gustó split ac. De igual manera, 1 mil clientes que compraron Windows ISE, revisaron y setenta y cinco por ciento de las personas dijeron que les gustó ventana AC. Por lo que concluyeron que MAC dividido le gusta más. El asunto se revirtió cuando los clientes se dividieron en hombres y mujeres. Por lo que de 1 mil split AC, 900, donde los principales clientes, 100 donde las mujeres cliente. De 900, clientes masculinos, 750 dijeron que les gustó split AC, por lo que hacen el 3%. Y entre 100 mujeres clientes, 50 Dijo que la división de luz es que es del 50%. Pero para ventana AC, de un total de 1800 millones de clientes, de ochocientos setecientos cincuenta dijeron que les gustó ventana AC, por lo que eso es 88%. Dos 100 fueron mujeres clientes que compraron ventana y ventana luz C y 150 y ven que es 75%. Como puedes ver, a ese 83% de los hombres le gustaba split AAC comparado 88% de hombres que les gustaba window y ven, cuando miras solo a los clientes masculinos, más clientes les gustó. Ventana es similar cuando estás mirando solo a las clientes femeninas, 50% como split SE y setenta y cinco por ciento de luz ventana SE. Por lo que de nuevo, más clientes, más clientes femeninos, Mike , window AC, pero más clientes femeninos como window veo en ambos clientes masculinos como window y ver. Pero cuando no estabas juntando tanto a clientes masculinos como femeninos, a nivel agregado, estás viendo una tendencia diferente de más gente que le gusta, gustaba dividir. Entonces ese es otro ejemplo de ciudadanos, Benedicto. Ahora veremos un par de casos prácticos en los negocios para ver cómo se puede identificar la paradoja de Simpson como un problema potencial y qué hacer al respecto. En una investigación de mercado, los datos mostraron que entre el año dos mil dos mil quince, el gasto promedio por hogar en cierta categoría de producto disminuye de $120 en 2 de mil a $95 en 2015. Ahora la pregunta es, ¿es esta una tendencia a la baja? O debe descontinuar esa línea de productos basada en la calle? La respuesta es, con solo mirar esta tendencia general de todos los datos, no se puede tomar esa decisión. La representación de este problema es el problema de la paradoja de Simpson que hemos descubierto. Y para evaluar si algún grupo puede ser descontinuado, hay que tomar una decisión basada en subgrupos potenciales. Por lo que hay que investigar dividiendo el crecimiento total en algún subgrupo significativo que puede comportarse de manera diferente. Y comprobar si el mismo tren estos siendo vistos para cada subgrupo. manera individual, el subgrupo podría basarse en grupos de ingresos, familias de ingresos altos, de ingresos medios, de bajos ingresos. ¿ Es la misma tendencia en todos estos grupos? Podría basarse en clientes masculinos y femeninos o ubicación sabia o cualquier otra cosa que pudiera ser significativa para sus datos. Todos estos grupos individuales y mostrando además una disminución en el gasto, entonces se puede tomar una decisión. Pero lo más probable es que pueda haber algunos otros factores contribuyan a este grupo general frente a grupos individuales que muestren una tendencia diferente. Si ese es el caso, entonces debe continuar con, debe seguir con esta línea de productos. Echemos un vistazo a otro estudio de caso, que nuevamente es un problema común. Cómo los datos de venta entre 20142019 mostraron que la barra de precios metro cuadrado de bienes raíces bajó un 10% en un CTE. ¿ Es esta la tendencia inmobiliaria a la baja? Nuevamente, se trata de un problema de paradoja de Simpson porque cómo el mercado inmobiliario se puede dividir y segmentar y agrupar en, en residuos. Para decidir si se trata de una tendencia a la baja, hay que mirar a algunos grupos. que investigar dividiendo a todo el grupo en diferentes subgrupos que podrían estar basados en ubicaciones para ver donde ahí se está viendo la misma tendencia en todas las ubicaciones, por los tipos de casas, por los tamaños de las casas. Lo más probable es, verías que los grupos individuales están mostrando tendencia diferente. A lo mejor algunos están mostrando aumento en el precio. Pero mientras que algún otro factor, tal vez abrumadoramente un tipo de vivienda se está vendiendo en una cantidad muy grande. Y como resultado, es decir, estoy cambiando la tendencia para todo el grupo. tanto que los grupos individuales podrían estar mostrando una tendencia diferente, como la forma en que resolvemos para los pobres ingresos medios y llegar a las habilidades de los estudiantes en la puntuación del SAT. Sólo después de investigar la tendencia en el subgrupo, se puede concluir si se gestionó esta tendencia de disminución de los precios inmobiliarios. De igual manera, hay muchos casos cada vez que se ve un grupo de puntos de datos, intenta dividirlo en diferentes grupos y ver si esos grupos están mostrando la misma tendencia. Porque hay que tener cuidado con el problema de la paradoja de Simpson. 7. Correlación con con efecto de 6: Causa, efecto y correlación. Cuando dos eventos suceden juntos y en cambio positivo o negativo en un evento se asocia con un cambio similar en el otro evento. Se dice que están correlacionados positivamente. Cuando esta relación es opuesta, se dice que están correlacionadas negativamente. Hay muchos casos que las cosas están positivamente correlacionadas. Por ejemplo, hay una correlación 0.3. calcula un coeficiente de correlación y cierta manera no nos meteremos en esos. Pero hay un cierto nivel de correlación positiva entre el GPA universitario y los ingresos posteriores. Existe un mayor nivel de correlación entre el coeficiente intelectual y el rendimiento laboral promedio. Hay un nivel mucho más alto de 0,7 correlación entre estatura y peso. Las personas más altas son más pesadas. Correlación aún mayor entre matemáticas puntuación SAT de dos años consecutivos. Por lo que estos son en los casos en que las cosas se correlacionan positivamente. Ahora, duales problemas comunes y falacias en la toma de decisiones. Relacionado con la correlación r, uno se llama falacia post-hoc. Cuando el evento paralizado ocurrió después de un evento, se dice que están formulados y se dice que es un evento está causando otro Richmond e hizo un caso. Otro es *** hoc, ergo propter hoc, que es cuando dos eventos suceden juntos. Uno debe ser por otro evento que puede no ser el invitado, porque la correlación no significa causalidad, dos eventos están correlacionados no significa que uno esté causando la falsa causalidad o pensando que un evento está causando otro falsamente. Su madre de toda la logística estadística cuando ocurren dos eventos al mismo tiempo. Por lo tanto relacionado, pero la correlación no significa causalidad. Si dos eventos sucedieron al mismo tiempo no significa que uno esté causando otro. Todas las mañanas. Gallo, cuervos. Y amaneceres no significa que este gallo cause amanecer, solo sucede al mismo tiempo. Gallos anticipa en Sunrise y crece y los elementos del amanecer, se correlacionan, pero uno no está causando al otro. Hay algo que se llama correlación espuria porque por casualidad podrían correlacionarse dos eventos, pero no hay relación alguna. Tomemos algunos ejemplos. Si trazas las ventas de iPhone en EU y te sumerges causado por los pliegues por las escaleras, verías un nivel muy alto de correlación positiva porque ambos aumentaron con el paso de los años. Pero hay absolutamente, como sabemos, no para ello ninguna causalidad real entre ninguna relación entre. De igual manera, si trazas bar consumo cápita de cómo fructosa jarabe de maíz, que ha bajado y el gasto en espectaculares deportes de espectador verías que uno está aumentando, mientras que otro es decreciente. Sólo dos eventos, hay una correlación espuriosa. De igual manera, si nos fijamos en los visitantes que Universal Studio de Orlando y ventas de autos nuevos, verías ambos. Están bajando, pero de nuevo, sólo se están volviendo abajo. Y cualquier relación entre ellos y asociación espuria puede ser completamente coincidental o espíritu. Ha sido mucho tiempo y esto se examina de manera extrema que si esos dos eventos están algo relacionados, uno puede concluir falsamente, o uno puede manipular para mostrar a otros que están relacionados manos, una está causando la otra. Tienes que estar atento a eso. Mesa de dos por dos son cuádruple. La tabla es una tabla estadística que puede ayudar a tomar decisiones. Es una forma robusta de ver cuán fuerte es la correlación y la causalidad. Entonces si algo está causando algo, es por ejemplo, muchas veces verás gente diciéndote que 20 personas con gripe tomaron medicamentos y se pusieron bien después de cinco días en comparación con solo diez personas que se pusieron bien sin tomar medicamentos. Por lo tanto, la medicina está infectada. Pero para comprobar si medicina es efectiva o no, hay que completar la tabla completa del formulario. Por un lado, hay que mirar a las personas que tomaron Madison contra quienes no tomaron medicamentos. Y luego al otro lado, hay que mirar a las personas que mejoraron después de cinco días frente a que no mejoraron después de cinco días. Si el total de 30 personas a la medicina mejoró. Y Dan no mejoró. Y si el total de 15 personas tomaron medicina y diez de Dios amargo y no se pusieron mejor de lo que no se puede concluir nada. Porque la relación entre 201010 a cinco es la misma. Pero si tuviéramos nuestro perjurio Gente que no tomó Madison y luego mejoró y 20 no mejoraron de lo que se puede decir, vale, la medicina está ayudando. De manera similar, se puede crear diferente para, para tabla para buscar información adicional que pueda enchufarlos con el fin de tomar decisiones. En ocasiones la causalidad podría estar a la inversa. Si papá da un reporte que dice que las empresas con más mujeres en su junta directiva o más rentables o más grandes que el tamaño. Puede significar que las empresas con más mujeres son más rentables, o también puede significar que las empresas más rentables están contratando más mujeres, que es lo que realmente no está claro. De igual manera, los mejores colegios afirman que sus alumnos se desempeñan mejor. Ahora no está muy claro si los estudiantes desempeñan mejor por los colegios o estudiantes mayores van a se desempeñan mejor por los colegios o estudiantes mayores van a los mejores colegios . Éstas son la causalidad podría ser revertida. En dos eventos back-to-back, menudo se ve al agricultor causar la carta, pero que puede no ser así, que a menudo no son décadas. Pero a esta falacia se le llama falacia post-hoc. Es como falacia relacionada con la correlación. Esta broma, según los hombres org, su médico le pidió que dejara fumar y otro anciano dijo: Oh, no hagas eso. Un par de mis amigos sólo con fumar y mueren. Esta es una forma divertida de poner a los moribundos no tiene nada que ver con dejar de fumar, pero sucedieron después del quiz fumando. Muchos casos reales, un evento ocurre completamente desfosforilado, no impulsado por nada. Pero la gente adivinó que eso fue por algún otro evento que sucede con el famoso caso de nuestro brazalete de holograma equilibrado se convirtió en una cresta global entre 200712, gastaron millones de dólares en ella como personas, incluidos los deportistas, hacia el producto estaba mejorando su capacidad atlética. Posteriormente, los ensayos aleatorizados de doble ciego descubrieron que no había relación alguna entre usar esas pulseras y habilidades atléticas en todos los atletas estaban entrenando, gente intentaba bajar de peso y mejorar, más atlético, y había cada vez mejor. Eso no tuvo nada que ver con usar esta lucha libre. Pero sucedió porque la gente pensó el premio esos plomo de mama y que Dios mejor. Entonces fue la causalidad, la correlación de Pablo. Otro caso de dos eventos sucediendo al mismo tiempo siendo parte como uno causando otro. En 1990 a 30 adolescentes estadounidenses que frecuentemente jugaban cierto videojuego se suicidaron. Esto creó una alarma a nivel nacional, pensando que sí los videojuegos estaban causando el suicidio. Pero una investigación adicional encontró que tasa de suicidio adolescente en ese momento era 12 por cada 100 mil ya recorte millón jugaba el juego regularmente. Por lo que 360 personas donde estadísticamente propensas a suicidarse entre las personas que jugaron el juego. redimensionamiento de Tertius no fue un gran número. Ese tipo de lleva a alguien a pensar que el suicidio se debió a la puerta. Nuevamente, una falsa causalidad porque ambos eventos ocurren al mismo tiempo. Todo tipo de empresas reclaman todo tipo de correlación entre su amplia mejora de accidentes, pero que esas no son décadas. La compañía dice que es champú lleva a tomar la cabeza. No obstante, la realidad podría ser que la gente recogería su cabello usando el champú en primero sugiere mostrar la causalidad inversa. Producto de dieta afirma cómo se usa Lauren the wet, pero la gente que usa el producto estaría haciendo otras diez cosas como hacer ejercicio, comer menos. Esos están causando la pérdida de peso y no mal producto. Empresa de cerveza afirma tener cerveza mejorar su enfermedad. Pero no podría haber relación alguna porque cada vez más personas sanas podrían estar bebiendo cerveza, por lo que ya están teniendo amargo duro. Pero esa causalidad que están reclamando porque podría ser sólo una locura espuria. Otro factor importante relacionado con correlación es que la afinidad se asume erróneamente que los farmacéuticos de correlación más allá de los datos con los que se ha establecido. Por ejemplo, con el aumento de la lluvia, maíz crece más alto, pero más allá de cierto punto, se hace más corto. Nuevamente. Guardar los datos es de hasta unos centímetros de lluvia, entonces eso debería terminar. Pero eso, porque si se inunda, todo puede quedar destruido. De igual manera, la educación es una correlación positiva con el ingreso, pero hasta cierto punto, tal vez hasta maestrías porque los doctorados, menos que esta correlación no sea Judy de 5 bits. De igual manera, la felicidad de la gente lo echa de menos para aumentar con el aumento del dinero. Pero hasta cierto punto. Y después de eso puede no cambiar mucho o puede haber sido disminuido. Ese es el caso entonces la gente más rica que habría sido la gente más feliz de este mundo. Pero ese no es el caso al mismo tiempo, si es el informe de alguien, lo malo, estaría muy feliz. Así que inicialmente con el aumento del dinero, la felicidad se volvió loca de hecho, gente se enteró de eso. Pero después de cierto nivel que cambió en 19, bastante significativo. Nuevamente, la relación o correlación o causalidad puede existir hasta cierto punto que se comprueban más allá de eso, no debería aumentarse a cinco madurez. 8. 7 Statisculation: Correlación de estatus. Las cifras estadísticas son utilizadas por periodistas, anunciantes, llamados expertos, vendedores y otros. A menudo el mensaje forma y manipular a las personas. A este proceso se le llama correlación de estatus. Aquí hay un exento. Verías anunciantes en tiendas de locos 50%, 20 rebajas en nubes. Muchos pueden pensar que es un descuento total del 70%. Pero en realidad es el primer 50% de deuda sobre el saldo, 50% y otro 20% del total de ventas es 50% más 20% del 50%, es decir 10%. Por lo que el total 60% cree que dicen total 60% venta. Eso creará menos impacto. Por eso dicen 50% más 2%. Él verá esto todo el tiempo. Estos son dos manipular las personas. De igual manera periodistas informarán que en un día se cierra en una ciudad o en un estado, una pérdida económica tan enorme. Siempre estas cifras lo son, las cifras se calculan a partir todas las actividades económicas posibles que puedan ocurrir potencialmente en un día, lo que nunca ocurre. Más importante aún, cuando un día se cierre, la mayoría de esas actividades económicas se acabarán de transferir al día siguiente. En realidad impactan es mucho menor. Pero a los periodistas les gustaría obtener su interés en sus noticias. Por eso le dan un dedo tan alto para que más gente lea noticias, noticias como grandes negocios, no tienen intención de darte información. La gente a menudo suman nuestra edad Cindy, sí altamente existió, cambia. Por ejemplo, dicen que el costo del material ha subido un 5%, nunca un 7%, la utilidad en 13%, el transporte en un 15%. Por lo que el costo total es de 40% en bits. Bizarre, solo se puede pensar en ello. Dirías que tal vez mucha gente no hace eso, pero la gente hace esto. Este no es un caso de correlación de status. Si rompes el costo, lo verás. Por ejemplo, digamos que el pasado 60% del costo fue material, 30% mano de obra y utilidad para cinco personas, y 5% de transporte. Esos 5713, 15% de aumento en costo básicamente incrementa los costos globales 6.5% una cantidad insignificante. Pero muy pocas personas verán a través de él. Y veremos que el impacto total en aumento en el costo explica 5%. Las empresas, especialmente las empresas de consultoría o empresas de servicios, muchas veces ven que cuentan más de 200 años de experiencia combinada de su gestión. Extrañamente hay papel con negadores, cada experiencia se convierte en 200 años de experiencia combinada. Eso no significa nada. Es solo correlación de status mostrando una figura artificialmente, completamente arbitraria para dar una impresión de que una empresa tiene mucha experiencia. Si una empresa reduce el salario de los empleados un 25% 1 año y lo incrementa un 25% el próximo año. Se puede afirmar que ha dado a la gente allá atrás y el salario, el estudiante bajó un 6.25%. Otra vez, esa es otra forma de permanecer discriminado. El beneficio neto de una empresa se incrementa desde 2% el año pasado, 4% este año. Se puede afirmar que el beneficio ha aumentado en dos puntos porcentuales, pero eso no sonaría bien. El mejor modo de reclamar es que la tasa de caldo ha aumentado un 102% por ciento hasta 4%. Eso dará un impacto mucho mayor. Pero la gente sí, hazlos. Otra forma de estatus para dejar que la enfermedad llegue a un tipo diferente de cálculo. Un dedo. Por ejemplo, los ingresos de los hogares se pueden calcular dividiendo el ingreso total por número de hogares. Esa es una forma de calcular o multiplicar el ingreso promedio per cápita por número promedio de personas en un hogar. La segunda figura siempre dará una gran ventaja. Algunas personas sí lo usan. Entonces si quieres mostrar bajos ingresos familiares, usa el primer cálculo si lo deseas. Por lo que el ingreso familiar de alta gama es el segundo cálculo. ¿ Qué son legítimos? En 2021? Ingresos familiares medios en US$168 mil. En ese mismo año, la renta media per cápita fue de 37 mil dólares. Un tamaño promedio de los hogares fue de 2.6. Si multiplicas 37 por 2.6, obtendrás 96 mil dólares, que es mucho mayor que los 68 mil. Si promedio se usa en un ingreso medio. ingreso promedio de los hogares subirá aún más alto. Cómo calcule determinará el ingreso de los hogares. Personas que tienen diferentes en la agenda. Haremos diferentes cálculos. Tomemos este ejemplo de cómo se puede calcular de manera diferente el índice de precios al consumidor para dar diferentes cifras, costos de leche y pan, 1.20.5 el año pasado. Este año ambos causan $1.10. Diferentes cálculos pueden mostrar diferentes índices de precios y depende tu agenda y calcularás de esta manera. Cuando se utiliza el último año como año base, la leche se ha convertido en el 50% del costo del año pasado. Y la marca se convierte en 100% del costo del año pasado. Por lo que el promedio es un 125%, es decir, de aumento de veinticinco por ciento. Nuevamente, si se utiliza el año en curso como año base, que también se mide en él. El año de clase media fue de 200% y el pan fue del 50%. Entonces el precio promedio del año pasado fue de un 125%. Este año es el año base. Este es un 100%. Por lo que éste mostrará que el premio del año pasado fue veinticinco por ciento más alto. Éste no mostraría que bajaran los precios. Si usas media geométrica, entonces no mostrará ningún cambio. En base a cómo se calcula el índice de precios 1 de mayo mostrar un aumento en el precio. Ahora eso puede mostrar una disminución en el precio. Y algún cálculo puede no mostrar ningún cambio en las aves, aunque los precios son exactamente los mismos en los tres casos. Figura percentil es otra cosas interesantes al examinar figura percentil, por ejemplo, rangos de estudiantes en una clase de 399 percentil es los tres primeros estudiantes. Eso hizo esto. 1% de 300 estudiantes, 98% dynes son los próximos tres estudiantes y así sucesivamente. Existe una gran diferencia entre el percentil 99, el percentil 90, como se puede ver en esta distribución normal, que generalmente es el caso de un grande en la figura. Pero a medida que las filas consiguen cierre en el medio, apenas hay diferencia entre el 14, 60%. Sentencia. Dice que se puede ver en los lados extremos, los percentiles se estiran. Hay una gran diferencia entre 9919, donde está, la diferencia entre 4060 es mucho menor. El proveedor dijo que ha aumentado precio en un 20% debido a que este costo ha aumentado un 20% en el proceso en amablemente incrementó su dólar absoluto. Estas son todas formas diferentes de ver qué tan diferentes en formas de estadísticamente. Sentencia de subpar. 1 de mayo decir, bueno, Google cambia a tu persona muriendo por 40 a 60, mientras que cambiarán de 1999, mientras que el 90 al 99 es mucho más grande. De igual manera, al aumentar proporcionalmente precio basado en el costo, uno puede aumentar muy bien sus dólares reales. Estas son todas formas diferentes a Stanford. 9. 8 datos relevantes: Contar con datos relevantes. Cuando la gente no puede probar algo directamente, usan la mitad de datos relevantes como proxy para probarlo. Cuidado. Es difícil demostrar la efectividad de la pasta de dientes. Empresas muestran cómo sus productos destruyen gérmenes en condiciones de laboratorio. Estas dos condiciones no son las mismas. Lo que funciona en el laboratorio puede no funcionar dentro de nuestra boca. Además, muchas veces no está claro qué tipo de bacterias están matando en el laboratorio. ¿ Son estos el mismo tipo de bacterias que hay en nuestra boca? Te sorprenderías. Tampoco está claro qué tipo de dosificación la tierra que usa. ¿ Es un equipo completo para escalar unas pocas bacterias? Ninguna de estas informaciones es muy clara. Pero incluso entonces están reclamando su anuncio para avanzar son muy efectivos en la matanza de bacterias en LRMR. Ese es el uso de la mitad de datos relevantes. Una empresa de frigoríficos puede anunciar que mantiene, producir 50% más fresco. Lo dices todo el tiempo, pero más fresco en comparación con qué? Otro refrigerador. Almacenar alimentos en un refrigerante ¿verdad? Sombra, o simplemente vivir alimentos bajo el calor y la humedad del verano. Te sorprenderá en qué se calcula este 50% con base. Sindicato laboral dice que el 85% de los empleados están descontentos con la dirección. Están usando datos irrelevantes. Para hacer una entrega fuerte caso Unión a menudo recoge todos los complejos posibles, incluidos los muy triviales como para la red, las luces necesitan ser reemplazadas. Entonces y así y sumarlos para decir ochenta y cinco por ciento de los empleados se están quejando contra la dirección, lo cual no es cierto. 100% de los ciudadanos de un país se quejan de algo durante un periodo de tiempo. Pero es injustificable concluir que una persona 100 ciudadanos están descontentos con su gobierno. Nuevamente, estará utilizando detalles relevantes. En ocasiones tienen datos relevantes se vuelve extremadamente prominente. La gripe española es un ejemplo. En 1918, el brote de H1N1 se llama gripe española. Curiosamente, la gripe ni se originó en España ni fue más prevalente en España. Sólo porque fue cubierto más por los periódicos españoles. Porque no estaban directamente comprometidos en la Primera Guerra Mundial. Y todos los demás países de Europa aprenden librando una guerra nacida connatural. Por el hecho de que estaba en los periódicos españoles. A la gripe se le llama española. Los gobiernos de todos los países son usuarios notorios de medio detalle relevante. Aquí hay un ejemplo. Durante 1898, guerra española estadounidense, la tasa de mortalidad en la Marina fue de 94 mil centros. El índice de mortalidad en Nueva York en ese momento fue de 16 mil personas. Reclutadores de Marina utilizan esta cifra para comparar y reclamar que se sufrió estar en la Marina. Dan para estar de 82 personas engañadas para unirse a la Marina. Obviamente, la tasa de mortalidad de ancianos y enfermos en Nueva York se comparó con los jóvenes y los fuertes ya estaban muriendo. Estos no son comparables, estos no son relevantes en absoluto. A menudo han influido datos relevantes en la toma de decisiones Por ejemplo, en 1950 al año se ve más como el año de la peor epidemia de poliomielitis en nosotros. Investigación encontró que deber más concientización, más casos donde se presentó un diagnosticado y reportado y más personas debido a la ayuda financiera federal. Además, el año tuvo más niños susceptibles para ese grupo de edad. Todas estas cifras contribuyeron a un mayor número de casos, pero la cifra muerta, que es una mejor medida donde no fuera de lo común. 1952, fue en famoso como el año de la epidemia de poliomielitis en Estados Unidos. Pero todos estos se basaban en medio aleatorio y datos. En realidad, fue igual cualquier otro distrito que registra y reporta más delitos se ven como más propensos a la delincuencia solo porque están reportando más en comparación con algunos otros distritos que no lo son informes. Políticos en todos los países de los usuarios más prolíficos de datos medio relevantes. Rummage a través de todos los datos para encontrar estadísticas que indirectamente se adapten a sus inanidades. Antes de llegar al poder, algunos distritos dijeron que los bajos ingresos y algunos tenían altos ingresos. Después de Bauer, algunos distritos también suman altos ingresos y algunos tenían bajos ingresos. Los políticos elegirán un distrito con bajos ingresos antes del poder, y el distrito con altos ingresos tras poder para demostrar que su gobierno incrementó los ingresos. tanto que la oposición hará lo contrario. Lo harán en un distrito con ingresos altos, bajos ingresos después de mostrar que el gobierno causó que los ingresos bajaran. Así es como la gente usa la mitad datos relevantes para hacer todos los puntos. Pero no siempre es posible mirar a través de todos los datos. Solo ten en cuenta, sin embargo, que todos los datos que se presentan en entidades de medios, hombres, en todas partes donde la gente está tratando de influir en nuestra decisión. Lo más probable es que estén utilizando la mitad de datos relevantes para hacer eso. Todos estamos familiarizados con las fotos de antes y después. Antes y después de las fotos muestran cómo algunas pastillas sostenidas alguien pierde peso. Pero los anunciantes no mencionan toda la otra fuerza que está haciendo la persona para perder el peso. No son sólo las píldoras las que está causando esta pérdida de peso y que se utiliza de datos medio relevantes. Por lo tanto, perder peso no es completamente irrelevante para su uso de un producto. Podría ser incluso perder peso sin usar este producto si están haciendo ejercicio, comiendo menos y teniendo un estilo de vida saludable. Mi papá sembrar la mitad de datos relevantes se utiliza en amputados significó mejora para tomar un punto para influir en nuestras decisiones. 10. 9 Consulta la escala: Consulta la báscula. Siempre revise cuidadosamente la escala al mirar los datos presentados en un gráfico o algún tipo de diagrama de líneas. Una de las formas más comunes que utilizó lo existimos o disminuimos el cambio de valores es manipulando la escala. Apenas permanecer en aumento por ciento en el salario se puede exacerbar En dramáticamente al mostrarlo en Lake. Y es el gráfico inferior se muestra como un estancamiento como está en la carga superior. Los datos de Sam presentados en diferente escala se ven diferentes. Y con solo mirar este gráfico de líneas, 1 de mayo llega a conclusiones muy diferentes sin entrar en cuánto cambio está sucediendo. Tantos anunciantes sí disuelven los tiempos, está jugando con la escala para acentuar los resultados. Porque saben que la mitad de la gente estaría en un duro es esta escala. Y la otra mitad estaría tan influenciada por la representación visual dramática. Porque la representación visual es tan poderosa que ignorarán esta escala. el propósito de los anunciantes serviríael propósito de los anunciantesde acentuar la diferencia. Las barras se rompen en un gráfico de barras para exhibir cambio tanto hacia arriba como hacia abajo. Tomemos este ejemplo. En 1995, los accidentes viales donde 7 mil 800. En 2005, los accidentes viales donde 7 mil 728 de exceso. Pero al trazarse en un gráfico de barras roto que se rompe en el nivel 7680, este pequeño cambio de 80 ni accidentes se acentúa. Entonces la gente lo mira y dice, Oh Dios mío, 2005 encabeza tantos ácidos inferiores. Pero es solo ser así es como se utilizan los gráficos rotos en escalas para manipular decisiones. 11. 10 comparación por imagen: Comparación por imágenes. Comparando por imagen. Mucho tiempo, las personas exageran o disminuyen datos intencionadamente e involuntariamente. Registros de Grime en EU en 199098 donde comparados por imagen y reducción parecían dramáticos. Esto se debe a que aunque la altura de los delincuentes en este cuadro sea proporcional al volumen o no. Entonces en realidad, esa rima bajó entre 15 millones en 9 millones. Pero parece mucho más bajo porque el volumen del criminal menor es mucho menor. Parece que la reducción delictiva fue justa. De igual manera, la producción india de mango. En comparación con China. Por la altura del mango, Se ve mucho más alto de lo que realmente. China fue de 4.5 millones de toneladas. India es de dieciocho millones diez, pero el volumen del mango más grande es mucho mayor que cuatro décimas, es más como 1015 toneladas. Ese es nuestro puede dar una impresión de una figura es mucho más alta al mostrar dos fotos. De igual manera, las ventas de vehículos automotores de la India aumentan de 3.2 millones en 2014 a 4.4 millones en 2019, apenas treinta y siete por ciento de aumento. Pero cuando esto lo muestran dos autos, el segundo es 37% tolerante que el primero. solo mirar esto, gente tendría la impresión de que las ventas de automóviles aumentan mucho más en 2018. Este truco es comúnmente utilizado por anunciantes y propagandistas cuyo objetivo es engañar a los espectadores. Porque una vez que esta impresión es la mente de la gente, las dos impresiones de mangos en la diapositiva anterior son dos fotos de delincuentes en la primera diapositiva. Y aquí hay dos fotos de autos. un tipo de decide que aumentan es mucho mayor aunque sea muy pequeño.