Visualización de datos y diseño de paneles para aplicaciones empresariales | Mark Chen | Skillshare

Velocidad de reproducción


1.0x


  • 0.5x
  • 0.75x
  • 1x (Normal)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Visualización de datos y diseño de paneles para aplicaciones empresariales

teacher avatar Mark Chen, Data Analytics Professional

Ve esta clase y miles más

Obtenga acceso ilimitado a todas las clases
Clases enseñadas por líderes de la industria y profesionales activos
Los temas incluyen ilustración, diseño, fotografía y más

Ve esta clase y miles más

Obtenga acceso ilimitado a todas las clases
Clases enseñadas por líderes de la industria y profesionales activos
Los temas incluyen ilustración, diseño, fotografía y más

Lecciones en esta clase

    • 1.

      Introducción

      10:00

    • 2.

      Sección 1: comparaciones

      10:27

    • 3.

      Sección 2: distribuciones

      9:46

    • 4.

      Sección 3: relaciones

      6:52

    • 5.

      Sección 4: composición

      10:54

    • 6.

      Sección 5: Contexto, desordenamiento, color

      9:18

    • 7.

      Conclusión

      2:00

  • --
  • Nivel principiante
  • Nivel intermedio
  • Nivel avanzado
  • Todos los niveles

Generado por la comunidad

El nivel se determina según la opinión de la mayoría de los estudiantes que han dejado reseñas en esta clase. La recomendación del profesor o de la profesora se muestra hasta que se recopilen al menos 5 reseñas de estudiantes.

512

Estudiantes

3

Proyectos

Acerca de esta clase

Este curso cubrirá los conceptos fundamentales para la visualización de datos con un enfoque específico en aplicaciones en el mundo de negocios. Nos centraremos en cómo seleccionar la mejor manera de visualizar un conjunto de datos para comunicar a nuestra audiencia de manera efectiva y objetiva los conocimientos empresariales. Al final del curso entenderás cómo crear paneles de negocios que se pueden aplicar a cualquier software.

A diferencia de la mayoría de los otros cursos en SkillShare, este no está diseñado para ser un "cómo hacer" para usar herramientas como Excel, Tableau, PowerBI, etc... Este curso tiene como objetivo cubrir lo que quieres lograr cuando usas estas herramientas, antes de ver otros videos en SkillShare que te enseñan cómo funcionan estas herramientas.

Conoce a tu profesor(a)

Teacher Profile Image

Mark Chen

Data Analytics Professional

Profesor(a)

Mark currently leads the Supply Chain Data Analytics team at Mountain Equipment Coop, one of Canada's most iconic brands and largest retail suppliers of outdoor recreation gear and clothing. His team supports the analytics behind inventory management by designing interactive dashboards, automating repetitive day-to-day tasks, and encouraging a more precise and data driven framework for decision making.

Prior to joining MEC, Mark was a management consultant at the Boston Consulting Group, where he pursued his passion for structured problem solving (breaking a big problem into workable business questions), robust data analytics (turning the "data" into actionable "insights" to support executive decision making), and effective communications (delivering impactful recommendations cat... Ver perfil completo

Level: Intermediate

Valoración de la clase

¿Se cumplieron las expectativas?
    ¡Superadas!
  • 0%
  • 0%
  • Un poco
  • 0%
  • No realmente
  • 0%

¿Por qué unirse a Skillshare?

Mira las galardonadas Skillshare Originals

Cada clase tiene lecciones cortas y proyectos prácticos

Tu membresía apoya a los profesores de Skillshare

Aprende desde cualquier lugar

Ve clases sobre la marcha con la aplicación de Skillshare. Progresa en línea o descarga las clases para verlas en el avión, el metro o donde sea que aprendas mejor.

Transcripciones

1. Introducción: Fundamentos de visualización de datos y diseño de tablero para aplicaciones en el entorno empresarial. Uno de su marca y yo hemos trabajado en el análisis de datos durante los últimos 20 años. Inicialmente como bioquímico, luego como consultor de gestión, y actualmente como gerente de analítica en una empresa minorista. Ahora estos pueden parecer roles muy diferentes, pero lo que tienen en común es la necesidad de contar historias, donde mi rol es encontrar la forma más efectiva, objetiva e impactante de comunicar insights empresariales a través de la visualización de datos. ¿ Y qué quiero decir con eso? Bueno, efectivo solo significa que quieres ayudar a tu público entender rápidamente las ideas clave de tu análisis, independientemente de si estás ahí o no para explicárselo. Ahora si eres un presentador fuerte, siempre puedes encontrar formas de explicar un análisis complicado, pero paseando paso a paso a tu público por él. Pero al final del día, idealmente tu dashboard o tu slide deck siempre deben diseñarse con la expectativa de que también necesita ser un producto independiente que pueda ser entendido por el usuario sin tu comentario. Objetivo significa que se quiere dar a su público el contexto suficiente para permitirles sacar las conclusiones correctas con un sesgo mínimo. Ahora a veces podrías presentar deliberadamente tus datos de una manera que enfatice el punto que estás tratando de transmitir. Pero idealmente, los datos y un grado de confianza asociados a esos datos hablan por sí mismos. Tu objetividad será apreciada, especialmente por audiencias conocedoras, y debería ayudarte a construir confianza a largo plazo con esa audiencia. Inicialmente creé este curso específicamente para mi propio equipo para asegurarme de que todos tengan el mismo nivel de conocimiento basal necesario para ser narrador ineficaz. Y luego también agregué algunos temas adicionales que encontré eran puntos ciegos muy comunes para candidatos que he entrevistado, pero que no contrataron. Si lograste hacerlo a través de este curso, mi objetivo es no solo ayudarte a pasar la entrevista, sino también tener las herramientas adecuadas para ser un analista de datos efectivo y creíble o analista de negocios. Básicamente, si tienes el título de trabajo de analista, esto es lo que esperaría que sepas un poco sobre cómo se diseña este curso. Se, este es un curso de nivel intermedio y asume algunos conocimientos básicos de formas comunes para aplicar datos. Vamos a saltar justo a los beneficios y las trampas comunes al usar, por ejemplo, parcelas de barras y gráficos circulares y cómo se comparan con opciones más sofisticadas. Entonces la expectativa es que estén familiarizados con algunas de estas parcelas más básicas, que no voy a introducir a detalle. Este curso tampoco es específico de software. Considera que el software es herramientas y ya hay mucho material por ahí. Y cómo utilizar estas herramientas de manera efectiva. Lo que cubriremos en este curso en su lugar son los conceptos fundamentales para lo que se quiere lograr utilizando estas herramientas. El objetivo es que estos conceptos sean relevantes sin importar el software que usted o su empresa elijan utilizar. Y por último, todos los ejemplos de este curso estarán fuertemente enfocados en aplicaciones empresariales, ventas, marketing, finanzas, cadena de suministro, etcétera. La visualización de datos es un tema muy amplio y bien cubierto. Entonces naturalmente no quiero crear otro curso sobre este tema. Y qué quiero crear uno que sea tan integral que tenga 100 horas de duración. lo que me voy a centrar, que no me he topado en ningún otro curso son los casos de uso que son más relevantes para el mundo empresarial. Para una discusión más general sobre la visualización de datos, recomendaría electrodos de Tamara Munzner. Eso están disponibles en YouTube. Ella hizo una profunda inmersión muy profunda sobre este tema, especialmente en cuanto a visualizaciones que son más relevantes para la academia y la investigación científica. Si lo que buscas es inspirarte en algunos grandes ejemplos de visualización de datos. Soy un enorme fan del sitio web 538 de Nate Silver, quien es un estadístico famoso por analizar las predicciones electorales. Y el capitalista visual, que es un sitio web con una tonelada de hermosas infografías, cada una de las cuales es como una obra de arte. Y si bien me enorgullezco de mi trabajo y es divertido hacer fuerza de trabajo cotidiana, ya sea un poco más llamativo. En un mundo empresarial acelerado, mi prioridad principal y mi expectativa para mi equipo, siempre estaremos ayudando a nuestros líderes empresariales a tomar mejores decisiones, más basadas en datos. Y ese va a ser mi enfoque para este curso. Y te dejaré que revises estos dos ejemplos por tu cuenta para cómo embellecer tu trabajo. De lo que cubrirá este curso. Sos el primer día en tu nuevo trabajo como analista de datos, se te ha encomendado la creación de un dashboard para apoyar una función empresarial en particular. ¿Por dónde empiezas? Bueno, el punto de partida para cualquier tipo de análisis es asegurarte de que entiendas las preguntas de negocios que estabas tratando de abordar. Y este no es un paso que puedas saltar o pasear por alto. Tampoco basta con preguntarle al usuario qué es lo que quiere porque hay un poco de exploración y emprendimiento involucrado con este paso. Al igual que la famosa cita de Henry Ford, Si hubiera preguntado a la gente lo que querían, me hubieran dicho caballos más rápidos. Entonces quieres ir bastante a fondo en este y asegurarte de entender al menos dos cosas. Uno, qué tipo de acciones con el usuario toma en base a los insights que fuiste dashboard te proporcionará. Esto, por ejemplo, te dirá ese nivel de granularidad que necesitas los datos. También quieres asegurarte de que entiendes cómo se reúne actualmente esta información para que puedas, por ejemplo, evaluar si quieres o no usar la misma fuente de datos o si hay una mejor que se pueda usar. Esta será la base de cómo diseñas este tablero. Cómo evalúas si una satisface o no los requisitos. Y esto también te ayudará más adelante con la gestión del cambio. Y la gestión del cambio es algo en lo que tuve que pensar mucho cuando era consultor externo, pero algo que encuentro a menudo se ignora cuando eras interno de la empresa. hecho de que crearas un tablero realmente impresionante, no significa que automáticamente vaya a conseguir una adopción generalizada. Todavía tienes que hacer lo necesario en marketing y demostrar al usuario cómo esto los apoya en su toma de decisiones y ¿por qué es mejor que lo que utilizan actualmente? Entender el número uno permite hacer esto. Una vez que estés seguro de que tienes una comprensión firme de la pregunta del negocio, entonces puedes proceder a analizar los datos y crear prototipos del tablero, centrándote primero en la utilidad y luego en la estética. Y la mayor parte de este curso se enfocará en el número dos, pero también incluiré algún material extra en el número tres. Pero más allá de lo que acabo de decir, no voy a hablar más del número uno, pesar de que obviamente no se puede hacer el número dos o número tres sin hacer exitosamente el número uno. Y la única razón de esto es porque ser bueno en el número uno es realmente más sobre haber experimentado en la práctica. No es realmente algo que pueda resumir discretamente en algunas diapositivas. Pero si hay interés por el número uno, por favor avísame y haré un curso separado sobre este tema. Y por último, unos cuantos condados que quiero reconocer cuando se trata de diseño de dashboard. Haré todo lo posible para compartir con ustedes lo que considero que son las mejores prácticas. Pero hay algún nivel de subjetividad. Entonces mi objetivo es siempre darte mi razonamiento detrás de estas reglas para que puedas hacer tu propia decisión sobre si seguir o no estas reglas. Y sí compro en esta idea que la mayoría de las reglas se pueden romper. Pero antes de que asistas a romper una regla, tienes que poder operar dentro de los confines de esa regla y tienes que entender plenamente la razón de esa regla. Dos es que la mayoría de tus usuarios probablemente no se van a preocupar por ti. Su atención al detalle. Probablemente nunca saben que cuando diseño un tablero, probablemente pruebo 20-30 formas diferentes de trazar un conjunto de datos y tomar una decisión sobre cuál de estas formas hace el mejor trabajo al transmitir los insights empresariales. Pero como profesionales del análisis de datos, debemos enorgullecernos de nuestro trabajo. Y seguro como gerente, esto es algo a lo que le pongo mucha atención cada vez que miro el trabajo de otra persona. Y por último, No todo lo que se necesita tramitar. A pesar de que se trata de un curso de visualización de datos, en muchas situaciones, una tabla simple podría ser en realidad la mejor en términos de claridad y sencillez. Y estas son situaciones que también señalaré más adelante en la presentación. De acuerdo, así que has completado el número uno y te sientes seguro de que entendiste las preguntas de negocios. Ahora ya estás listo para empezar a pensar en el número dos en cuanto a cómo quieres trazar estos datos. Lo primero que quieres hacer es reducir ese tipo de análisis que quieres lograr. Por ejemplo, ¿es esta una comparación de una métrica en particular a través de una cierta dimensión, como una comparación de nuestros ingresos a través de diferentes geografías, o comparar los niveles reales de inventario hoy frente a lo presupuestado al principio del año. Mostrando la forma de una distribución para algo así como el tamaño de cada categoría de producto en cuanto al número de productos dentro de ella, o la edad de su base de clientes. ¿ Esto muestra la relación o la falta de relación entre dos o más métricas y si hay o no una causa y efecto implícitos, como, ¿el giro de marketing de contratación impulsa mayores ingresos? Y por último es esto mostrando los componentes individuales de un total mayor, como ¿cuánta ganancia contribuye cada mes a nuestra ganancia anual total? Lo que podrías notar es que hay un poco de superposición entre algunas de estas preguntas de negocios. Si estás viendo un dato de series de tiempo, por ejemplo, sobre la rentabilidad mensual de tu empresa. Podría considerarse que es una pregunta de comparación o una pregunta de composición. Cómo decidas finalmente cómo trazar estos datos realmente depende del negocio y el tamaño que quieras transmitir. Entonces si quieres hacer una declaración como nuestro mes más rentable ES 5X, de nuestro mes menos rentable que quizá quieras considerar parcelas que resalten esta comparación. No obstante, si en cambio quieres hacer una declaración como el 50% de nuestra ganancia anual proviene del periodo de tiempo entre el Viernes Negro y Navidad. Entonces tal vez quieras mostrar estos datos como una composición. En el siguiente apartado, vamos a hablar de comparaciones. 2. Sección 1: Comparaciones: Sección uno, comparaciones. Cuando se trata de hacer comparaciones, tu pan y mantequilla siempre van a ser gráficos de líneas y gráficos de barras. Probablemente alrededor del 70% de lo que usarás es uno de estos dos. almuerzos siempre van a ser tu opción predeterminada para cualquier dato de series de tiempo. Y lo que quiero decir con series de tiempo es que el eje X atraviesa es algún tipo de dimensión temporal. Y una de las razones por las que los gráficos de líneas son tan ideales es que solo hay muy poco desorden de gráficos, lo que significa que hay una cantidad muy mínima de tinta necesaria para transmitir toda la cantidad de información. Por lo tanto, puedes caber mucho más en una sola página. Y en realidad son muy fáciles de entender incluso para un iones no técnicos. Por lo que esto debería poder leerlo e interpretarlo sin tu ayuda. Los gráficos de barras serán tu gráfico de elección a la hora de comparar variables discretas. Y hablaremos de lo que eso significa. Y al igual que el gráfico de líneas, también es muy fácil de entender. Pero hay un poco más de desorden de gráficos en cuanto al color de las barras. Significa que no puedes caber tantas variables en una sola página en comparación con el gráfico de líneas. Echemos un vistazo a algunos ejemplos. En este caso, estamos trazando ingresos por mes con los ingresos en el eje y y los meses que atraviesan en el eje x. En este caso, podemos usar ya sea un gráfico de líneas o un gráfico de barras. Pero mi preferencia es siempre usar el gráfico de Línea porque tus ojos están naturalmente enfocados en la parte de la gráfica que realmente importa son los marcadores. En tanto que en el gráfico de barras, tus ojos están más enfocados en el color de las barras, que no transmite ninguna información adicional más allá de lo que transmite la altura de las barras. Entonces, en otras palabras, más desorden de gráficos. En este siguiente ejemplo, estamos comparando la misma métrica de ingresos pero a través de diferentes geografías. Y en este caso no podemos usar el gráfico de Línea porque en el gráfico de Línea las líneas entre los marcadores implican continuidad. Y así sólo es útil para variables continuas, no discretas, como los estados. Es decir, si trazaste así, tu público sigue siendo bueno para entender lo que estás tratando de transmitir, pero técnicamente no es correcto usar un gráfico de líneas cuando la variable es una variable discreta. Otra consideración es cuántas variables quieres comparar en una sola gráfica. Entonces si aumentamos esto a dos gráficos, ambos son, de acuerdo. Todavía se puede ver el patrón de la estacionalidad de los ingresos entre ambas gráficas. Pero cuando aumentas esto a cinco, se pone un poco más lleno. Y aquí el gráfico de líneas tiene una ventaja sobre el gráfico de barras. En esta gráfica, se puede ver que lo primero que me llamará la atención es el hecho que la línea verde siempre está por encima de la línea roja por cada mes, excepto el mes de abril. Y ahora esto son solo datos sintéticos. Entonces no sé si esto es significativo y algo que quieras llamar, pero es sólo algo que es muy claro para el público cuando está mirando el gráfico superior. Y detalles como este están un poco más oscurecidos para el gráfico inferior. Ahora, cuando aumentas esto a 20 variables, ambos chars en realidad se ven terribles. Probablemente deberías pensar si realmente necesitas comparar los 20 como este, o si puedes encontrar una mejor manera de presentar esto. Pero en el gráfico Line, todavía se puede burlar de lo que está pasando. Pero es casi imposible para el gráfico de barras debajo. Entonces esto es sólo algo a considerar cuando estás tratando elegir entre un gráfico de líneas y un gráfico de barras. Un último ejemplo es cuando se trata de gráficos de barras, se pueden utilizar vertical u horizontalmente. La consideración principal aquí es solo ayudar a tu público Leer las etiquetas del eje más fácilmente. Entonces si tienes muy poco conjunto de nombres en el eje x y es más largo que las etiquetas en el eje y. Podría tener sentido rotarlo para que su público pueda leerlo sin inclinar su siguiente. De acuerdo, así que un poco de estudio de caso. Entonces digamos que estás apoyando a un minorista en el espacio de la electrónica. Se compilan algunos datos de ventas en su parte superior para las marcas. Y hay cuatro categorías de productos. Y quieres crear un gráfico que les ayude a comparar estos segmentos. Entonces, ¿cómo harías eso? Y por cierto, este es un ejemplo donde la mesa es realidad bastante buena en términos de claridad y sencillez. Por lo que definitivamente es una opción que va con para este ejemplo. De acuerdo, bueno, lo primero que debes decidir es si es un resumirlo en base a las categorías de productos y capa encima de eso, las marcas como los diferentes colores. O para resumirlo como marcas y hacer que las categorías de productos sean los colores. Y la otra decisión que hay que tomar es si mantenerlo absoluto, para resaltar las diferencias reales en dólares, ortonormalizarlo a un 100% con el fin de resaltar las diferencias en la composición. En realidad, hablarás con el usuario y descubrirás cuál de ellos realmente proporciona los insights más útiles y procesables para las decisiones que están tratando de tomar, o si es necesario incluir los cuatro de estas parcelas si cada una de ellas proporciona una visión necesaria. Pero también hay otra opción que es usar un Char muy amplio, también conocido como una alegre carta médica. Se trata básicamente de un gráfico 2D que permite poner tanto las dimensiones de la marca como una categoría de producto en la misma gráfica. Y otra ventaja que tiene es que enfoca la atención del público en el segmento más grande. Entonces en este caso, la visión inmediata que obtengo es que los teléfonos representan la categoría de producto más grande. Y dentro de los teléfonos, Apple domina con una cuota de mercado del 60%, mientras que las tabletas son la categoría de producto más pequeña. Y dentro de las tabletas, es una división pareja entre las cuatro marcas. Por lo que este gráfico único no solo te permite incluir todos los insights de los cuatro gráficos anteriores, también te da la relación completa entre las marcas y las categorías de productos, que no obtienes cuando las traza por separado. Lo único que falta son los valores totales en dólares, las comparaciones absolutas. Pero por lo general lo que hace la gente es incluir el gran monto total en dólares en el título o en la nota al pie de página para que el público aún pueda tener ese contexto si lo necesitan. Aquí hay otro ejemplo de un gráfico muy amplio, y esta vez sin ninguna normalización en los dos ejes. Aquí, lo que estamos haciendo es que estamos trazando estas emisiones de CO2 per cápita en el eje y. Y per cápita solo significa por persona. Y tenemos la población total de cada país en el eje x. Y la luz ante nuestros ojos siempre se va a atraer hacia lo que es el segmento más grande de la página que ocupa más espacio. Entonces en este caso, son las emisiones de Estados Unidos y de China. El principal interior que obtengo es que China es el mayor productor de emisiones de CO2 basado en el área de la gráfica. Pero sobre una base per cápita, está en medio de la manada y no es tan alto como las otras naciones desarrolladas, como Estados Unidos. Ahora si tuviéramos que trazar estos datos usando una parcela de barras regular, tienes opción. Se puede trazar las emisiones totales, en cuyo caso China se mostrará como el mayor contribuyente de emisiones. O puedes graficar las emisiones per cápita, en cuyo caso, China no se ve tan mal como los demás países. Y en realidad tal vez quieras tener esa elección si tienes una agenda que hacer sobre uno de estos puntos u otro. Pero esto se remonta a mi comentario anterior sobre la objetividad. Cuando estás trazando los datos usando el gráfico muy amplio. Eres capaz de darle a tu público ese contexto completo y permitirles hacer el juicio completo sobre ese contexto en lugar usar dirigiéndolos hacia una vista u otra. Y me gusta mucho este ejemplo y como mi único ejemplo no comercial y todo este curso. Pero echemos un vistazo a un ejemplo de negocio real. Entonces aquí estamos tomando el mismo gráfico muy amplio y estamos trazando nuestros propios márgenes unitarios en el eje y y las ventas unitarias en los excesos. Entonces esto es básicamente cuánto margen bruto que generamos por unidad de producto que vendemos. Y esto es ¿cuántas unidades vendimos? Si tienes datos como este, tienes tres formas diferentes de trazarlo y tres formas diferentes de clasificar estos productos. Si traza ventas unitarias totales, tendrías producto i como primer producto seguido del producto o. si graficas margen bruto total, seguirás teniendo producto i como el primero, pero luego es seguido por producto Y la tercera vía, que no estoy mostrando, si traza el margen bruto por unidad, obtendrías los productos en el mismo orden que este gráfico muy amplio. Ahora, cada una de estas plaza te da una visión ligeramente diferente y un ranking ligeramente diferente de los productos. O simplemente puedes mostrar todo el contexto convirtiéndolo en el gráfico muy amplio donde los insights empresariales o ese producto he generado la mayor cantidad de márgenes brutos totales. Y lo logró al vender un número muy grande de unidades. O el producto B también ha generado una cantidad muy grande de margen bruto. Y lo ha logrado al tomar un margen muy alto por unidad. De acuerdo, así que solo para resumir, caracteres muy anchos, son esencialmente un gráfico de barras sin espacios en el medio. Y gráficos de barras ligeras, se puede normalizar o no normalizar el eje. Tienes dos conjuntos de actores, lo que significa que puedes mostrar simultáneamente dos dimensiones, lo cual es una gran ventaja porque te permite brindar más contactos al público y reducir el sesgo que viene de simplemente mostrando una de estas dos dimensiones. El único inconveniente es que no es muy común. Además, por lo que la gente no está familiarizada con este gráfico, podría no ser capaz de interpretarlo muy fácilmente o muy rápidamente sin alguna ayuda y explicación de usted para orientarse. Un ejemplo más de comparación que acabo de incluir por el bien de la finalización, pero es uno del que no soy un gran fan y eso son los gráficos de radar, también conocidos como gráficos de telaraña. Lo que estamos trazando aquí son los resultados de satisfacción del cliente, que incluye algunas dimensiones como precio, calidad, selección y donde estamos comparando estos dos resultados para dos tiendas que se encuentran en Boston. Y una cosa que no me gusta de esto es el hecho de que tus ojos tienen que rastrear un poco de ida y vuelta para poder leer esta gráfica, sobre todo si estás comparando a través de ocho métricas diferentes. Y también se ve un poco raro si estás comparando a través de cuatro métricas porque entonces TI, porque al igual que un cuadrado, lo único que no me gusta de esto es que podría quedar bien. Tenemos las dos tiendas son muy diferentes entre sí, así que hay una cantidad muy alta de contraste, pero se ve un poco feo cuando hay mucha superposición entre las tiendas o si tienes muchas historias diferentes que estás probando para comparar, sí tienes la opción de trazar cada tienda por separado. Y de nuevo, para mí, Está bien si las tiendas que estás comparando son muy diferentes entre sí, como en este caso, puedo ver que Boston South, por ejemplo, tiene puntajes muy decentes en todo, sobre todo en términos de precio. Y puedo ver que Dorchester, en contraste, tiene puntajes muy pobres y todo menos por servicios. Cuando se trata de las otras tiendas, los cargos por radar no proporcionan comparaciones muy claras sin el público tenga que hacer mucho trabajo mirando de ida y vuelta. Esto es todo para comparaciones. En el siguiente apartado vamos a hablar de distribuciones. 3. Sección 2: Distribuciones: Sección dos, distribuciones. hora de mostrar distribución que tus dos opciones básicas van a ser histogramas, parcelas de dispersión, y cómo escoges entre ellas como básicamente bajando a si tu distribución es a través de una sola dimensión o de dos dimensiones. Y los histogramas son una gran opción. Una, generalmente es más fácil de leer por tu público y de hacerlo, porque básicamente estás haciendo el análisis de los datos antes de trazarlos. No se ve afectado por el tamaño de su conjunto de datos. Ahora piensa de nuevo en ese gráfico de líneas que habíamos mirado donde cuando estamos comparando dos líneas, está bien pero se complica muy rápidamente y tenemos 20. Pero debido a que estás haciendo estos invernaderos, también tienes algunas opciones que tomar, principalmente en cuanto a cómo quieres definir tus cubos. Parcelas de dispersión también fue genial en términos de fácil de entender y tener un desorden mínimo de gráficos. Puedes usarlo si estás intentando mostrar una distribución a través de dos dimensiones. Pero los insights no son tan claros como puedes mostrar para un histograma porque no estás definiendo explícitamente cuáles son estos cubos. Otra cosa a tener en cuenta, para ambos tipos de gráficos son las influencias de Outliers, que no pueden ser un pro o un estafador en caso de diagramas de dispersión. Y te mostraré lo que quiero decir en unos pocos ejemplos. Aquí te presentamos un ejemplo de un histograma donde estamos contando cuántos de nuestros clientes caen en cada uno de estos paréntesis de cuatro años de edad. Y se puede ver que tenemos cerca de 1000 clientes en el rango de edad más joven de 15 a 19 años, y que rampa hasta 2500 clientes en el rango de edad de 40 a 44 años. A lo que me refiero con esta segunda bala aquí es que aunque recopilemos más datos en este conjunto de datos y tenemos diez veces más clientes a la complejidad del gráfico se mantiene igual. Todavía vas a tener los mismos cubos a menos que tal vez estés agregando un cubo extra para los menores de 15 años sean los que son mayores de 79. Pero generalmente la complejidad del gráfico no escala con más puntos de datos porque estamos haciendo este análisis sumario sobre los datos para crear estos cubos. Sí tienes una decisión que tomar en cuanto a si quieres normalizarlo a un 100%, cual se hace muy comúnmente ya que la mayoría de las veces cuando tienes una pregunta de negocio de distribución, lo estás pensando en términos de porcentajes. Y en esta gráfica, podemos ver que alrededor del 50% de nuestros clientes tienen entre las 3254 edades y aproximadamente el 8.5% de nuestros clientes son mayores de 70 años. Y aquí hay una gráfica diferente donde estamos tratando de caracterizar cuántos de nuestros sesgos y sesgos son básicamente unidades de mantenimiento de stock, que se puede pensar como un producto único. Y ¿tenemos actualmente cuántas de estas cantidades a mano? Una de las cosas en las que debes pensar es en cuanto a cómo quieres definir los rangos para estos segmentos individuales, que he estado llamando cubos. En el valor predeterminado, tomas el punto de datos más alto que tienes en este rango y dividiste uniformemente entre los diferentes segmentos que puedes caber en el gráfico. Pero lo que se puede ver en este ejemplo es que un número muy diminuto se sesga donde tenemos realmente, realmente ocultar el recuento de unidades, realmente cambia todo lo demás en un solo cubo. Y esto no es tan útil porque básicamente estás diciendo el 99% de tus sesgos, tendrías algún lugar entre 0 a 500 unidades a la mano. Entonces lo que no puedes hacer después de echar un vistazo a los datos reales es personalizar los rangos, los cubos, para permitir que el público vea una imagen más clara de la forma de esta distribución. Y realmente no necesitas hacer cada cubo del mismo tamaño. Aquí podemos ver es que alrededor de un tercio de nuestros sesgos, tenemos 0 unidades a la mano. Ahora bien, ¿eso es intencional o simplemente hacemos un mal trabajo de mantener las cosas en stock? No lo sé. Alrededor del 45% de nuestros sesgos, tenemos en algún lugar entre una a 20 unidades a la mano. Y este sigue siendo un segmento bastante grande. Es posible que desee considerar dividir esto en segmentos más pequeños para mostrar más detalle. Y por último, todas esas cosas en la cola larga que vimos en la primera gráfica, hay alrededor de 600 sesgos donde tenemos a mano más de 5 mil unidades. Y el gráfico de la derecha es simplemente más útil que el de la izquierda porque proporciona más granularidad alrededor de una parte del conjunto de datos que realmente importa. Y ajustar el corte para los segmentos es algo que tienes que tomar una decisión sobre lo que estás tratando de hacer que tu histograma sea más efectivo y menos impactado por este pequeño número de valores atípicos. Pasando a las parcelas de dispersión. Por lo que se utilizan parcelas de dispersión si su distribución es a través de dos dimensiones diferentes en lugar de solo una. Y en este caso estamos trazando ventas en dólares en el eje Y y ventas unitarias en el eje x. Y básicamente esto es cuánto dinero ganamos frente a cuántas unidades vendemos, donde cada círculo representa un producto o un sesgo. Entonces a pesar de que la gráfica de dispersión muestra todo y una de las desventajas en comparación con histogramas es que no está definiendo explícitamente los segmentos. Por lo general tienes que llamar eso en tu descripción o estás hablando de punto. Entonces en este caso, yo diría que la mayoría de los productos producían en algún lugar entre 0 y 4 millones de dólares en ventas. Y hay dos valores atípicos importantes que producen alrededor de 18 millones de dólares. Y los productos se venden entre 0 a un 100 mil unidades con un alle mayor están en 350 unidades. Y una cosa que señalaré en cuanto a estética es que también puedes hacer que tus marcadores sean ya sea no filtrados o parcialmente transparentes para que puedas mostrar mejor la densidad en un gráfico lleno de gente. Ahora, al igual que los histogramas, parcelas de dispersión están fuertemente influenciadas por los valores atípicos. Y pondré eso como manda tanto pro como con. Realmente depende de si estos valores atípicos o de las cosas significativas que quieres llamar. Entonces aquí tomé el ejemplo anterior y acabo de agregar algunos puntos de datos más. Entonces es decir, en este de la derecha, hay un producto que trajo alrededor de 11 millones de dólares en ventas y F vendió alrededor de 1.8 millones en unidades. Y este es un conjunto de datos sintético. Entonces no sé si este producto y este comportamiento es importante o no. Pero lo que puedes ver es que básicamente aplastó todo en esta esquina y creó muchos espacios en blanco en esta gráfica. Ahora esto es genial si este punto de datos es de lo que quieres hablar, porque aquí es exactamente donde se van a enfocar naturalmente los ojos de tu público. Pero si esto no es lo más importante que quieres llamar, entonces tal vez quieras dejar fuera este valor atípico y simplemente convertirlo en una nota en la nota al pie para que en su lugar puedas acercar, en esta área que tiene la mayoría de los datos que en realidad presente. Una última nota sobre las parcelas de dispersión es que la otra decisión que debes tomar es si realmente, tiene más sentido hacerlo dos histogramas distintos si la relación entre las dos dimensiones no es tan importante en términos de su visión de negocio. Por lo que podrías mostrarnos por separado así, haciendo dos histogramas separados. Y en realidad podría quedar claro que su público lo entendiera. Pero lo que sí pierdes es esta relación entre las dos dimensiones. De acuerdo, ¿qué tal un ejemplo más complicado? Entonces digamos que quieres comparar las 52 semanas de ventas semanales para un conjunto diferente de categorías de productos. Entonces en este caso para herramientas, lo que ves es que tienes 3252 semanas en el año donde las ventas están en algún lugar entre 0 a 200 mil dólares por semana. Y las otras 20 semanas donde las ventas totales están entre $200,400 mil. Y de igual manera, se puede hacer el mismo histograma para las otras categorías de productos. Y este es un camino a seguir. Si solo tienes cinco categorías, puedes hacer estos cinco histogramas individuales y simplemente ponerlos uno al lado del otro. Pero te puedes imaginar que esto podría ponerse un poco más complicado si tienes muchas más categorías de productos que quieres comparar entre sí. Por lo que otra opción es resumir cada categoría de producto en cuanto a una parcela de caja. Y esto es típicamente lo que parece una pelea de jefes. Y también a veces se le llama una trama de caja y bigote basada en la forma. Y es similar a un histograma. Básicamente puedes definir los segmentos, pero en lugar de definirlo en base a tu propio juicio para una gráfica de caja, básicamente lo estás definiendo en términos de los cuartiles. Por lo que este es el 25% inferior de sus puntos de datos. Este es el siguiente 25% y el siguiente 25%, y este es el 25% superior de sus puntos de datos generales. Este cuadro medio se llama el rango intercuartil, que contiene el 50% medio de sus puntos de datos, y la línea define la mediana. Ahora, mucha gente también define los fines de la misma, no como el máximo y el mínimo, sino como el percentil 95 y el cinco. Y esto básicamente ayuda a hacer los bigotes No tanto tiempo. Tienes atípicos realmente, realmente extremos. Entonces, ¿cómo sería esto en nuestro ejemplo anterior? Bueno, esta es una pantalla mucho más compacta que permite hacer una comparación más directa lado a lado de múltiples distribuciones. Y en cuanto a la perspicacia inmediata, una vez que me reoriento en cuanto a cómo leer la chatarra, puedo ver que las mochilas tienen la mediana de ventas semanales más alta a lo largo del año. Las herramientas son la categoría de producto menos estacional es las ventas semanales caen dentro de un rango muy estrecho, consistente. Bueno, esquís o la categoría más estacional sin casi ventas durante la mitad del año. Y por último, durante la temporada alta, ropa de abrigo tiene las mayores ventas semanales de todas las categorías. Ahora este tipo de trama es amado por la comunidad estadística y usan mucho. Es genial para mostrar múltiples conjuntos de distribuciones 1D. Y al igual que el histograma, también estás haciendo un análisis sobre el conjunto de datos primero antes de aplicarlo. Lo que significa que la complejidad a agarrar no escala a medida que aumenta el tamaño de su conjunto de datos. El único inconveniente es que tampoco es una trama muy común fuera de la comunidad de estadísticos, lo que significa que es posible que necesites proporcionar algún acompañamiento y explicación para asegurarte de que tu público no técnico entienda un poco el insights. Esto es para nuestras distribuciones. Y en la siguiente sección vamos a hablar de relaciones ligadas al arco compuesto. 4. Sección 3: relaciones: Sección tres, relaciones. Para mostrar relaciones, vamos a volver a visitar la gráfica de dispersión y es informacionalmente más densa contraparte, la trama de burbujas. Cuando discutimos las gráficas de dispersión y las tendencias de mostrar distribuciones a través de dos dimensiones. Dijimos que podemos sustituirlo por dos histogramas separados si la relación entre estas dos dimensiones no es tan importante. Entonces aquí en este caso, el foco será esa relación. Entonces los insights empresariales serán si existe o no una relación. Y de nuevo, dos de las grandes ventajas para dispersar parcelas es que una, es fácil y comprensible y 2D es una muy alta relación de información a tinta. Las parcelas de burbujas son las mismas excepto con una dimensión adicional agregada en cuanto al tamaño de los marcadores. Además más si realmente lo quieres meter, pero no se recomienda el intercambio es que las dimensiones añadidas también agregan complejidad extra la cual tendrás que gestionar y decidir si la pregunta de negocios realmente necesario hay una complejidad extra. Y la mayoría de las veces, se pueden encontrar mejores y más claras alternativas para comunicarlo. En este ejemplo, estamos trazando el número de unidades vendidas frente al precio promedio, donde cada marcador representa nuevamente un sesgo o producto en particular. Y los seres humanos están cableados para reconocer patrones. Entonces cuando muestras una trama como esta, y sobre todo si incluyes una línea de regresión a través de ella, esencialmente estás diciendo que no solo hay una relación entre estas dos variables, sino que también estás implicando una relación causal. Ahora en la analítica turística, la causalidad no es fácil de demostrar. Y así por lo general cuando hay una relación causal potencial con la gente lo hace es que tienden a usar su intuición para decidir si esa causalidad es o no plausible. Entonces, en este caso, o estás diciendo que cuando fijas un precio más bajo para tu producto, es más probable que vendas más de él. O si eres capaz de vender un producto y a granel, eres capaz de proporcionar a tus clientes finales un precio más competitivo. Ambos escenarios parecen bastante plausibles en la vida real. Por lo que puedes mostrar esta relación como tu sitio de empresario. Y también puedes usar esta línea de regresión como una forma de modelar esta relación, pero siempre ten esa comprobación de tripa para asegurarte de que esa relación sea plausible. Un último punto es que si estás usando la gráfica de dispersión, generalmente quieres hacer la variable independiente B en el eje x y la variable dependiente en el eje y. Lo que significa que si hay una causa y efecto implícito, desea que el costo esté en el eje x y que el efecto esté en el eje y. Aquí hay otro ejemplo donde estamos viendo la respuesta promocional de diferentes clientes al mirar la relación entre el incremento por ciento en ventas que logramos con cada cliente versus la cantidad de promocionales descuento que les hemos ofrecido. Y en cuanto a estos clientes, tenemos una cohorte azul y una cohorte roja que parecen comportarse de manera muy diferente entre sí por la razón que sea. Para el color azul, puedes ver que cuando aumentas tu descuento de 0 a 40%, eres capaz de lograr y en promedio, un levantamiento de alrededor de un 160%. En tanto que entre los clientes de la cohorte roja, el levantamiento general es mucho menor y más variado. Por lo que se podría decir que las cohortes azules parecían ser más promocionales, realmente sensibles. Y la roja Guerra Fría. Y por cierto, todos los datos que estoy usando en los ejemplos de este curso, nuestros datos sintéticos, que significa que o lo traté desde cero o tomé algunos datos de mi empresa y lo modificé para anonimizarlo. En la vida real, nunca he visto datos de respuesta promocional que se vean tan claros como lo que aquí se muestra. Entonces pasando a los gráficos de burbujas, aquí te presentamos un ejemplo donde estamos evaluando las marcas en cuanto su punto de precio y su nivel de innovación, que es algo en lo que podrías pensar si trabajas en merchandising. Por lo que cada círculo es una marca y el tamaño del círculo ahora representa el tamaño de la marca en cuanto a sus ventas globales. lo que al comparar el ejemplo anterior, esto ahora incorpora una tercera variable continua como el tamaño de los marcadores. Y lo que eso hace es que nos permite hacer observaciones como esta, que la mayoría de las ventas son generadas por productos de menor precio. Al igual que si divides los de la marca entre la línea media, hay más círculos y círculos más grandes en la mitad inferior en comparación con la mitad superior. En cuanto a las relaciones, verás que también hay más burbujas en los dos cuadrados diagonales que en estos dos cuadrados. Lo que significa que tal vez los clientes están más dispuestos a pagar precios más altos por productos más innovadores. Y por último, aquí hay una cuarta variable en cuanto a las marcas norteamericanas frente a las internacionales. Y aquí podemos señalar que las marcas internacionales tienden a ser las marcas más caras y más innovadoras, y todas se sientan en esta esquina superior derecha. Aquí te mostramos otro ejemplo de una trama de burbujas solo para mostrar el hecho de que no necesariamente necesitas hacer que los ejes x e y sean las variables continuas. A veces en realidad funciona bastante bien también con variables discretas. Este estamos viendo las razones y las cantidades de devoluciones a través de diferentes categorías de productos. Ahora los retornos se están convirtiendo en un trato más grande para muchos minoristas ya que están haciendo crecer su negocio. Debido a que los segmentos de e-comm tienden a tener una mayor tasa de retornos en comparación con las compras en tienda. Por lo que es importante entender las razones estos retornos y si estas razones pueden abordarse. Entonces a partir de esta gráfica, el foco de tus ojos naturalmente será hacia dos círculos más grandes, lo cual es genial porque representan las áreas problemáticas más grandes. Y lo que no se puede interpretar es que se podría introducir nuestra mayor oportunidad de reducir los retornos, mejorando las decisiones de ajuste de nuestros clientes cuando se trata de calzado y ropa de mujer. Además, algunos de nuestros clientes también están encontrando mejores precios en otros lugares cuando se trata de esquís e instrumentos. Por lo que esto podría impulsar algunas decisiones de precios para que nuestro departamento de marketing ejecute algunas ventas o promociones. Y tal vez también haya algunos problemas adicionales cuando se trata identificación de productos entre prendas de nuestro almacén donde están recogiendo y empaquetando los productos incorrectamente. Y por último, entré en línea, trato de encontrar el ejemplo más ridículo de cuántas dimensiones puedes caber en un solo gráfico de burbujas. Y esto es lo que encontré. Por lo que hay para variables continuas y dos discretas en esta sola parcela. Y obviamente esto no es ideal. Y esto es sólo, este único tipo de obras porque ninguno de los círculos se superponen entre sí. Y la verdadera pregunta aquí es, ¿realmente necesita el público ver simultáneamente estas muchas variables? ¿ O sería más claro si simplemente dividieras la información en múltiples parcelas? Por lo que incluso en la era de tableau y Power BI, donde tienes la opción de presentar mucha información adelantado y permitir que el usuario haga clic y desglose. Este tipo de gráficos aún no se recomienda. Esto es si una relación. En el siguiente apartado vamos a hablar de composiciones. 5. Sección 4: Composiciones: Sección cuatro composiciones. Entonces para composiciones tenemos nuestro buen gráfico circular viejo y el gráfico de barras apiladas. Gráficos circulares Obtienen mucho odio, pero en realidad son bastante buenos en cuanto a ser fáciles de entender y definitivamente son efectivos. Para un resumen rápido, tienes dos datos es muy simple. Creo que la principal crítica por usar gráficos circulares es que cuando lo tienes muchos segmentos diferentes de diferentes tamaños, realmente no puedes decir sus diferencias relativas muy fácilmente en comparación con un simple gráfico de barras. No obstante, probablemente sí quieras evitar gráficos circulares explotados en 3D ya que tener algo como esto de tu parte probablemente disminuirá tu credibilidad entre la comunidad analítica. Los gráficos de barras apilados son otro básico común , de nuevo, principalmente porque son fáciles de entender, pero definitivamente hay muchas opciones más sofisticadas disponibles para esta sección también, que vamos a cubrir. Primer ejemplo. Por lo que estamos trazando la división entre ventas a precio regular versus ventas a precio promocional con descuento. Y lo hicimos un gráfico de barras apiladas y lo normalizamos para entre por ciento para que podamos enfocarnos más en las diferencias de composición y cómo eso cambia a lo largo de los años. Pero al hacerlo, estamos dejando fuera mucho contexto en cuanto a cómo están cambiando los dólares reales de ventas a lo largo de estos años. Lo que significa que hay dos escenarios potenciales que advirtieron respuestas muy diferentes. Alguna vez una flecha podría ser que nuestras ventas totales han sido relativamente planas en los últimos diez años. Y una porción cada vez mayor de nuestras ventas totales está cambiando de ventas regulares a ventas promocionales. Y una situación como esta, lo que sería un poco preocupante porque significa que nuestras promociones no están generando ninguna venta incremental. Simplemente están canibalizando nuestras ventas regulares. No obstante, también puede ser otro escenario en el que nuestras células regulares en realidad se mantienen estables y en realidad estamos incrementando el crecimiento incremental de nuestras ventas totales debido al crecimiento en promociones. Por lo que dos escenarios muy diferentes debajo. Y realmente no podemos decir cuál es cuál cuando normalizamos la trama 200% en el gráfico inicial de barras de pila normalizada. Entonces aquí hay otro ejemplo. Entonces digamos que estás a cargo de la experiencia del cliente y periódicamente les envías encuestas sobre cómo clasifican su satisfacción en esta escala de uno a diez. Una métrica muy común que a las tiendas minoristas les gusta rastrear es algo llamado Net Promotor Score, donde tomas la diferencia entre tu porcentaje de promotores y tu porcentaje de detractores y lo que te queda con se suele interpretar como la probabilidad de que sus clientes actuales recomienden sus productos o sus servicios a otros. Ahora, al igual que el ejemplo anterior, donde estás calculando una métrica de resumen y trazando eso, lo que realmente estás haciendo es optimizando para la simplicidad, pero estás negociando un poco más de ese contexto. Entonces en este caso, tomas los puntajes de NPS para estas ocho tiendas etiquetadas por sus nombres de ciudad y obtienes este ranking. Y siempre que tengas este ranking métrico único, el gráfico siempre es muy limpio y muy fácil de entender. El mejor es Fort Worth y el peor vuelco es Los Ángeles. Pero podría haber algunos detalles que se esconden detrás de esta simplicidad. Entonces si estás mirando el desglose del componente individual es, lo que podrías ver es que Filadelfia y Nueva York son un poco atípicos. El justamente tienda por la razón que sea es muy polarizante. En realidad tiene el mayor número de detractores, pero también tiene un número muy alto de promotores. Por lo que sería interesante indagar en esto y entender por qué es esta una tienda tan polarizada. Y por el contrario, Nueva York realmente no tiene tantos detractores, pero la mayoría de la gente es bastante neutral y tienen un número muy, muy bajo de promotores para equilibrar eso los rastreadores. Por lo que de nuevo, será interesante entender de amplio alcance. Entonces si tu objetivo es entender la causa raíz de los detractores, entonces la puntuación general de NPS podría no ser la mejor métrica en la que enfocar porque no quieres que tu número de promotores oculte tu número de detractores porque es el número a los tractores que son más procesables para su audiencia, para esta decisión de negocio en particular. Entonces, lo que podría hacer en su lugar es trazar los componentes individuales en un gráfico de barras apiladas. Pero se puede poner más énfasis en los detractores por uno, haciéndolos POR una métrica negativa separada de los otros dos valores. Y dos por clasificar las tiendas con base en esta métrica. Entonces en este caso, podrías terminar teniendo la tienda de Nueva York estando en medio de la manada a la tienda de Philly en el fondo de la manada. Si solo los estás clasificando en base a la puntuación de los detractores. También puedes capas encima de esta puntuación de MPS superponiendo la puntuación de NPS como marcadores de círculo. Por ejemplo estamos hablando de lo que un diagrama de gráfico. Por lo que los diagramas de Waterford es otra opción para mostrar los componentes individuales de un total. En este caso, estamos mostrando los ingresos mensuales y cómo se suman al total de ingresos anuales. Una ventaja de esta parcela es que por cada mes, también se llega a ver el total acumulado de todos los meses anteriores. Pero la compensación aquí es que hace más difícil comparar los ingresos entre cada mes. Y si esa es la perspicacia más importante, entonces podría tener sentido trazarla como una gráfica de barras regular o una gráfica de líneas para mostrar mejor esta comparación. No obstante, las cascadas son en realidad muy útiles cuando tu métrica tiene números tanto positivos como negativos porque la altura general de la gráfica no se comprime tanto en relación con el total general más grande. Y es por ello que tan comúnmente se usa para métricas financieras como el flujo de efectivo o el beneficio. Entonces en este caso, cada barra es un poco más grande y el total acumulado también es un poco más útil porque se puede ver, por ejemplo, es en este punto del mes de agosto la empresa logró un flujo de caja positivo para el resto de ese año. Y esto es algo que no puedes decir con tanta facilidad en un gráfico de barras regular. Un último ejemplo antes de terminar esta sección. Entonces digamos que te dan un conjunto de datos que tiene ventas de este año en comparación con las ventas del año pasado. La diferencia entre este año y el año pasado y la diferencia por ciento. Y esto está segmentado por categorías de productos. Y digamos que esta es una lista bastante larga de un 100 categorías de productos diferentes. Y el objetivo aquí es destacar Lo que ha estado impulsando nuestro negocio en general y dónde deberíamos enfocarnos para el próximo año. Bueno, sí quiero señalar que este es otro caso donde esta tabla es en realidad bastante buena para mostrar estos números. Y aparte de que se trata de una mesa bastante larga con un 100 categorías diferentes. Todavía puedes ordenar estas cuatro métricas y mirar la parte superior e inferior de esa lista. Pero si te inclinas a trazar esto, tienes algunas opciones que considerar. Y esto en realidad es una pregunta de entrevista. Y digo que alrededor del 50% de los candidatos que han entrevistado tienden a elegir la opción número uno, que es ignorar las métricas de diferencia derivadas y centrarse en sólo unos valores de $2 que representan este año versus el año pasado. Y trazarlos de lado a lado para que el público pueda evaluar las diferencias. Y la otra mitad de los candidatos tienden a escoger ya sea la opción dos o la opción número tres, donde estás ignorando los datos de ventas subyacentes y destacando en cambio las categorías que tienen la mayor o la menores diferencias en dólares entre este año y el año pasado. Y una cosa que podrías notar es que aquí solo estoy mostrando las categorías superior e inferior, y no estoy mostrando esa lista completa de 100 categorías. Entonces para las tres gráficas, realmente no hemos abordado el tema que tenemos una lista muy, muy larga. El segundo que podrías notar es que estas dos listas son en realidad muy diferentes entre sí, a pesar de que ambas están mostrando a los mejores ganadores en un perdedores de fondo, pintan un cuadro muy diferente en cuanto a quién el ganadores y perdedores son. Entonces cuál de ellas es más útil en cuanto a evaluar la salud general del negocio. Esa es una de las preguntas que hemos tenido que responder. Por lo que una forma de abordar ambos puntos es utilizar algo llamado mapa de árbol, donde la configuración común es hacer que el tamaño de la plaza B este año las ventas para cada categoría y sucedió sean coloreadas por el cambio de porcentaje del año pasado. El algoritmo de mapa de árbol coloca automáticamente todos tus cuadrados desde el más grande hasta el más pequeño, desde la parte superior izquierda hasta la inferior derecha. Y esto realmente ayuda a abordar el problema con colas muy largas porque los segmentos más pequeños ocuparán automáticamente menos espacio y por lo tanto menos de la atención de su público. El segundo que aborda es el hecho de que suelen ser los segmentos más pequeños los que suelen ser los valores atípicos más grandes cuando se trata de cambios por ciento. Por lo que esto también ayuda a impulsar la priorización del público al empujar su atención hacia los cuadrados más grandes que están más coloreados ya que esos son el segmento que realmente tienen el mayor impacto. Y en cuanto a impulsar el negocio en general, no los realmente pequeños en la esquina derecha, no importa lo grandes que sean esos cambios por ciento. Entonces en este caso, mi mayor comida para llevar es que la zona más significativa que estamos superando este año, nuestras mochilas de viaje, cocina, calzado de backcountry. Y donde realmente hemos infravalorado es en áreas como las bicicletas, la iluminación, y la luz de las mujeres, la ropa de abrigo de estilo de vida femenino. Y estos chicos de aquí, a pesar de que están altamente coloridos y tienen enormes cambios porcentuales en comparación con el año pasado. Podrían advertir más atención en otras partes del tablero en cuanto al crecimiento de un segmento pequeño. Pero posiblemente son menos relevantes en cuanto a proporcionar una visión general de lo que realmente está impulsando el negocio el año pasado. Volviendo a nuestra trama anterior, se puede ver esa opción dos, ya que se alinea mucho mejor con este TreeMap porque está mostrando las categorías de productos que tienen el mayor cambio de dólar en comparación con el año pasado, mientras que la mayoría de los que están aquí y la opción número tres, no están etiquetados en el mapa del árbol porque tienden a ser los realmente pequeños que terminan en la esquina inferior derecha. Por lo que los treemaps fueron una calificación para comparar dos conjuntos de variables, sobre todo si una de esas variables es una dirección antigua como las ventas, y la otra es bidireccional como los cambios en las ventas. Y este ejemplo realmente resalta las formas comunes en que he visto treemaps utilizados en los cuadros de mando y sobre todo para las empresas minoristas. En cuanto a ventajas, realmente resalta lo que es importante en cómo ocultar la larga cola de pequeños artículos que no impulsan el negocio en general. En cuanto a negativos. Creo que ya estás empezando a ver el patrón que muchas de estas parcelas menos comunes, menos convencionales podrían requerir un poco más de explicación y esfuerzo por parte del público para entenderlas y leerlas. Pero una vez que están familiarizados, en realidad ofrecen muchas ventajas sobre los gráficos de líneas y barras más convencionales. Entonces este es el final para las composiciones y ya está hecho en cuanto a seleccionar la mejor manera de trazar un conjunto de datos. Y en la siguiente sesión, lo que vamos a cubrir son cosas diversas a la hora de tratar y tablero efectivo. 6. Sección 5: Contexto, Clutter, y color: Sección cinco, contexto, desorden y color. Por lo que muchas veces el contexto que proporcionas a tu audiencia es tan importante como la información real que estás presentando. Entonces aquí hay un ejemplo que he encontrado hace muchos, muchos años, y se puede ver que está un poco anticuado, pero he usado este ejemplo muchas veces para hacer esta demostración. Por lo que yo estaba en mi auto escuchando las noticias en la radio. Y dice el noticiero, hoy en bolsa, el Dow Jones Industrial Average bajó un 102 puntos mientras que el nasdaq bajó 35 puntos. Entonces pensé, vale, así suena como que fue un día bastante malo para el dao, pero las empresas que cotizan en un azteca no le hicieron tan mal. Pero lo que no sabía fue el contexto de que Adele bajó de 8,281 puntos a 8,179 puntos, que es una caída de 1.2%, mientras que la nasdaq, ya que bajó 2.2%. Entonces para un inversionista, este cambio porcentual realmente importa mucho más. Por lo que en realidad fue mucho peor para el nasdaq que el Dow una vez que tienes este contexto. Pero también hay otra pieza del concurso, que es que el nasdaq estando lleno de acciones tecnológicas son intrínsecamente más volátiles que la duda. Entonces un plus o menos 2% de swing no está realmente fuera de lo común. Si bien el Dow cayendo 1.2% en un solo día en realidad fue un gran problema en ese momento. Entonces el punto aquí es que el contexto puede no sólo tener un pequeño efecto en la interpretación de la perspicacia, realidad puede revertir completamente la interpretación. Aquí hay otro ejemplo que se basa en nuestra mirada previa a treemap. Por lo que tenemos dos categorías de productos en una empresa minorista, ropa masculina y femenina. Y si solo miras el cambio por ciento interanual en las ventas, podrías concluir que la ropa masculina está impulsando la mayor parte del crecimiento para el negocio en general, asumiendo que ambas categorías son aproximadamente del mismo tamaño . No obstante, si tuviste el contexto de cómo se calcula este porcentaje, tu público verá que la Perla Mensa tuvo un cambio por ciento mucho mayor sobre la base de unas ventas basales mucho más bajas con respecto al año anterior. Lo cual de nuevo es un comportamiento muy común en las ventas en que eres categorías más pequeñas tendrán cambios por ciento mucho mayores. Y realmente es la más grande de la ropa de mujer aquí la que está impulsando el crecimiento tangible real del dólar. A pesar de que como porcentaje del año pasado, no parece tan dramático. Aquí hay otro sobre contratos. Entonces aquí estamos viendo dos métricas de almacén de cadena de suministro muy comunes, Dr. stock, que es cuánto tiempo tarda el almacén en recibir y encerrarte mercancía que acaba de recibir del vendedor y recoger el barco, que es cuánto tiempo se tarda en almacén para agarrar y empaquetar un producto que quieren enviar a un cliente. Entonces si eres una cadena de suministro tiene para podrías mirar estas dos fechas y tienes una idea aproximada de si estas son buenas o malas o aproximadamente promedio. Pero para alguien que no es un experto, realmente no hay un montón de contextos aquí aparte de tal vez comparar estos dos números entre sí y preguntarse por qué escogió un barco tarda casi el doble de tiempo que el Dr. acciones. Entonces para dar más contexto, tenemos algunas opciones diferentes. Podemos comparar estos dos números con tendencias históricas, como ¿cuáles fueron las métricas de la semana pasada? O si se trataba de una métrica realmente estacional, ¿cuál fue la comparación con el mismo periodo de tiempo del año pasado? También podemos compararlos con otros puntos de referencia, como el número de días. En otros almacenes más comparables o lo que se considera el estándar de la industria para estas métricas. También podemos compararlos simplemente con sus metas y sus metas. Entonces si fijamos un objetivo de las acciones holandesas de hoy que estamos muy por delante de nuestro objetivo. Pero si nuestro objetivo es algún día, entonces estamos muy rezagados. Entonces el contexto puede ser tan simple como eso. Y de nuevo, volviendo al principio mismo, nuestro objetivo es permitir a nuestro público identificar rápidamente de manera inequívoca los principales insights que les van a ayudar con sus decisiones de negocio. Una forma de hacerlo es proporcionarles los contextos adecuados que resalta siempre que algo esté fuera de lo normal. Otro tema que quiero tocar es el desorden cargado, que mencioné algunas veces a lo largo de este curso. Entonces aquí hay un ejemplo que encontré en internet donde tenemos un gráfico de barras muy coloreado que muestra la tasa anual de inflación en las tiendas de abarrotes de diferentes ciudades. Y esto es un poco de paja porque normalmente no se ven gráficos que son así de malos en términos de desorden. Pero para limpiarlo, creo que podemos aplicar algunas de las mejores prácticas que hemos cubierto, como una, hacer que los nombres de las ciudades sean más fáciles de leer al tener que las barras sean horizontales, a deshacernos del color 3D en barras, y deshacerse de la colores por completo porque realmente no transmiten ninguna información adicional que no sea ya transmitida por la longitud de las barras. Y por último, también es una buena práctica hacer que el orden de las barras también esté en un orden significativo. Ahora también hay un hombre llamado Edward Tufty que es una especie de gurú cuando se trata de visualización de datos. Y causó muchos libros sobre este tema. Y una de las cosas en las que realmente se centra más que nadie es en lo lejos que se puede llegar a la hora de minimizar el gráfico desordenado. Entonces lo que podría preferir es algo más como esto, donde te habías deshecho de todos tus ejes por completo, incluyendo las líneas de cuadrícula y el contorno de los gráficos de barras. Y en cambio solo estás mostrando la longitud de las barras como restando color para las marcas porcentuales. Su filosofía es que se quiera mostrar la menor cantidad de tinta en la página para que su público pueda enfocar su atención en sólo la tinta que realmente juega un papel crítico y transmitir información. De acuerdo, el siguiente tema va a ser breve en la selección del esquema de color. Por lo que hay un sitio web llamado ColorBrewer, que te ayuda a elegir el conjunto más óptimo de códigos RGB para colores que ofrecerán el mejor tipo de contraste y bajo diferentes escenarios. Entonces aquí, por ejemplo, están los colores predeterminados de las versiones anteriores de Microsoft Office. Y aquí te explicamos qué color brew recomendaría en cuanto maximizar ese contraste cuando tienes un gráfico de cinco colores. Y esto probablemente se esté volviendo un poco menos relevante ahora porque la mayoría de las salas de conferencias ahora están equipadas con televisores de pantalla plana, que ofrecen un contraste mucho mejor. Pero atrás en los días en que vas a dar una presentación en la oficina de tu cliente, no sabes cómo va a ser el escenario y si van a tener o no un retroproyector de calidad realmente asqueroso en una habitación eso está demasiado iluminado, entonces en este caso, quieres asegurarte de que tu público aún pueda leer los colores de tu gráfico cómodamente asegurándote de maximizar el contraste. El último tema es sólo sobre algún material de audacia sobre características de desglose. Entonces esto va a ser un poco sufrir específico, que no es la intención del curso. No una lista exhaustiva. Esta es solo una que quiero mostrar para tratar de hacer el punto que fantásticas herramientas de construcción de paneles como Tableau y PowerPoint, tienes la opción de no encajar todo en la misma página, pero puedes hacerlo interactivo así que que el público pueda obtener el panorama general y luego hacer clic hacia abajo para desglosar los detalles que les interesan. Entonces el primero es chispas. Y las chispas son básicamente sólo un Minecraft. Y Apple hace esto maravillosamente en su gorra de stock al mostrarte un pequeño gráfico para cada stock y cómo eso ha tendido a lo largo del día. Y luego si te intrigó esto, siempre puedes profundizar más, clic en una de estas acciones y obtener más detalles sobre las tendencias reales que van más allá de un día. Otro gran ejemplo es el pop-up de rollover del ratón, que se denominan tooltips en tableau. Entonces este es un mapa que ha sido coloreado por una métrica en particular. Y luego si un área en particular del mapa te interesa, entonces puedes poner el mouse sobre esa zona. Y te daré un pop-up donde puedes poner muchos más detalles, incluyendo en otra gráfica entera. Un comentario adicional que añadiré es que a pesar de que se trata un curso sobre visualización de datos y diseño de paneles, me doy cuenta de que realmente no he hablado tanto de mapas. A pesar de que estoy bastante sorprendido de lo prevalentes que están los mapas en el tablero. Y esto porque mi opinión es que a menos que la pregunta de negocios que estás tratando de abordar esté específicamente relacionada con las geografías. Al igual que si estás construyendo un tablero en términos de logística, mapas realmente no agregan ningún valor real ni perspicacia. Todo lo que hace es calambres detalles en los principales centros de población y deja mucho espacio en blanco en todas partes. Pero admito que son muy populares y al público en general tienden a amar a los Mapas sólo porque se ven realmente geniales. Un último ejemplo es un toggle es que puedes usar para cambiar a más de métrica que usas en toda una página en Power BI, Esta es una aplicación más avanzada de botones y marcadores. Entonces en este ejemplo, lo que tenemos es que tienes al público que podría preferir mirar el mismo conjunto de números pero bajo diferentes monedas. Entonces si el público no necesita hacer ninguna comparación entre estas monedas, entonces es una mejor práctica simplemente mostrar uno de estos tres conjuntos de números a la vez usando este botón para permitir a la audiencia cambiar de ida y vuelta, en lugar de triplicar la cantidad de información a página mostrando las tres monedas. Entonces el tema general entre estas tres características que quiero destacar es solo para permitirte ocultar cierta información frente a la vista principal de tu tablero, lo que luego hace que se vea mucho más limpio, pero aún así permitir al público para perforar más detalles en las áreas que les interesan. De acuerdo, entonces ese es el final para esta sección. Y en la siguiente sesión daremos un rápido recapitulamiento. 7. Conclusión: Conclusión. Muchas gracias por lograrlo a través de este mini-curso, hemos segmentado el tema de la visualización de datos en estas cuatro secciones, que voy a acreditar al profesor Andrew Abella, miramos los pros y los contras de los más formas básicas y comunes de trazar nuestros datos para abordar preguntas comerciales comunes. También echamos un vistazo a algunas de estas opciones más avanzadas y en qué situaciones vale la pena cambiar la sencillez a favor de algo más rico en información. Si bien Tenga en cuenta que nuestro objetivo es comunicar nuestras perspectivas de negocio de manera efectiva y objetiva. En cuanto al proceso para crear un nuevo dashboard y te relacionas o un análisis ad-hoc. Centramos nuestro tiempo mayormente en el paso número dos. Pero sí tengo que recalcar nuevamente que sus esfuerzos por aplicar lo que hemos cubierto en el paso número dos se verán enormemente obstaculizados si no pasan por un trabajo muy minucioso de cubrir el paso número uno. Y en mi experiencia, una de las mayores críticas para personas que están altamente capacitadas y altamente competentes en los aspectos técnicos de la analítica es que no entienden completamente las preguntas del negocio y las necesidades del negocio. Y por lo tanto, o bien crean un producto muy inferior o se escabullieron a través la gestión de cambios necesaria para asegurar que el tablero que crean se use y se adapte. Este es el primer curso que he preparado. Por lo que cualquier retroalimentación sobre el contenido o la entrega será muy apreciada. No estoy tratando de pescar por cumplidos, pero cualquier crítica constructiva me será muy útil. Incluyendo si te interesaría o no alguno de estos otros temas que he considerado, que incluyen el paso número uno, la comprensión de la pregunta empresarial, la planificación de la demanda y la previsión. Cómo crear una presentación efectiva y diapositivas de PowerPoint, que es el componente complementario de la narración. Y por último, la lista de casos prácticos que involucran los tipos más comunes de modelos de analítica de datos utilizados en el mundo empresarial, como Basket Analysis, segmentación de productos, clustering de tiendas, marketing. Muy bien, así que gracias de nuevo y felicitaciones por terminar este curso. Espero que lo hayan encontrado útil.