Transcripciones
1. Expectativas de S7L1: Está bien. Enhorabuena y bienvenidos a la sección final del curso casos prácticos. Y aquí es donde realmente vamos a empezar a divertirnos un poco. En esta sección se trata de llevar hasta este punto las herramientas que has aprendido y aplicarlas a diferentes conjuntos de datos y desafíos analíticos. Por lo que hasta ahora, nos hemos estado centrando exclusivamente en nuestros datos IMDB. Pero ahora vamos a sumergirnos en una tabla dinámica Archivo de estudios de casos, que contiene un montón de nuevos conjuntos de datos que van a profundizar, van desde datos de bolsa y redes sociales hasta registros de ataques de tiburones e incluso
rankings de burritos . Pero antes de sumergirnos, pongamos unas cuantas expectativas. Número uno. El objetivo de estos estudios de caso es demostrar cómo los conceptos cubiertos pueden aplicarse a una gama de diferentes conjuntos de datos. Estos no pretenden ser análisis integrales, sino simplemente puntos de partida para ayudarte a practicar el uso de esas herramientas en
contextos nuevos y diferentes . Número dos algunos datos pueden haber sido alterados o fabricados para facilitar las demostraciones, por lo que la mayoría de los datos que se ven son 100% reales. Pero ten en cuenta que se han hecho algunas modificaciones en ciertos casos específicamente para los efectos de este curso. Entonces, por ejemplo, ciertos campos pueden haber sido limpiados o estandarizados, o pueden haberse agregado o eliminado ciertos registros. dedo del pie ayuda a demostrar ciertos conceptos y luego, finalmente, se proporcionarán ejercicios de
tarea después de cada estudio de caso. Por lo que los ejercicios seguirán cada uno de mis casos, estudiarán introducciones y construirán sobre los conceptos específicos que cubro. Daré respuestas siempre que sea posible, pero si necesitas apoyo adicional, siéntete libre de contactar ya sea en el panel de discusión del curso o por mensajería directa. Y con eso, sigamos adelante y sumérgete.
2. Votantes de Estados de que: todo bien. Dijo que el primer caso de estudio en el que vamos a sumergirnos es para nosotros los votantes en 2012 ahora, rápido resumen de conjuntos de datos. Se trata de datos de población y registro de electores de 2012 de la Oficina del Censo de los Estados Unidos desglosados por estado y por grupo de edad. Para que puedas ver la captura de pantalla del conjunto de datos aquí en el lado derecho de la diapositiva. Y lo que he hecho aquí es formatear los encabezados de columna para indicar con qué estamos trabajando en términos de dimensiones o medidas. Entonces de nuevo, las dimensiones son tus campos categóricos. Las medidas son sus campos numéricos o cuantitativos. Entonces el N es igual a 2 55 solo indica que estamos viendo 255 registros o filas de datos en este caso, por lo que conjunto de datos bastante pequeño para arrancar las cosas. En cuanto a las dimensiones faras se refiere. Tenemos que declarar y edad y columnas A y B y luego por medidas. Tenemos población total, población ciudadana registró votantes y votantes confirmados. Y los conceptos que cubrirán en este caso práctico en particular son campos calculados y configuraciones de
valor, específicamente por ciento de columna y por ciento de padre. Entonces con eso, saltemos a sobresalir y sumergirnos. Está bien, Así que adelante y abre la mesa de pivote. Los estudios de casos se archivan y saltan a la primera pestaña. El tabulador de votantes de Estados Unidos 2012. Y desde aquí, podemos controlar A para seleccionar a Oliver Data. Voy a insertar una nueva tabla de pivote en una nueva hoja de trabajo y antes de sumergirnos, sólo
pongamos un nombre a esa hoja de pivote votante. Y en realidad quiero resaltar esta pestaña solo un claro tono de verde. De esa manera, medida que continuamos trabajando a través de los casos de estudio en este cuaderno de trabajo, quedará
claro qué pestañas son datos brutos y cuáles son pivotes. Entonces ahora, como analista, dados los datos que tenemos a mano, algunas de las preguntas que me gustaría explorar aquí son cosas como ¿Cómo se
compara la concurrencia de votantes entre estados son cierto rango de edad es más o menos probable a votar en lo general. ¿ Y estas tendencias son verdaderas a nivel nacional, o hay insights específicos que aquí podemos descubrir? Entonces, como saben, todas
estas son preguntas que las tablas pivote hacen un excelente trabajo respondiendo. Entonces vamos a ver qué se nos ocurre ahora, justo fuera del bate. Recortemos nuestros datos por estado como rosa y tirando de algunas de las métricas que nos importan. Por ahora, usemos a la población ciudadana. Ya que solo los ciudadanos pueden votar y los votantes confirmados comienzan ahí. Seguiré adelante y formatearé ambos como números, con separador de miles y sin puntos decimales. Ahí vamos. Y finalmente, ordenaré mis estados descendiendo por la población ciudadana. Entonces, como era de esperar, vemos estados grandes como California, Texas, Florida y Nueva York en la parte superior de nuestra lista. Y luego abajo en la parte inferior, obviamente están estados menos densamente poblados como los Dakotas en Alaska, Vermont y Wyoming. Entonces no hay sorpresas ahí Desde aquí. Yo quiero agregar un campo calculado porque lo que me interesa ver no es sólo el
número de ciudadanos y el número de electores confirmados, lo cual es interesante pero no del todo sorprendente. Lo que quiero hacer en realidad es calcular una relación para que pueda ver fuera de la
población ciudadana . ¿ Qué porcentaje de esos en realidad se convirtieron en votantes confirmados. Entonces se va a herramientas en un nuevo campo calculado y nombrar a este porcentaje de población votante y de nuevo, eso sólo va a igualar la proporción de votantes confirmados a la población ciudadana prensa OK, vamos a formatear esto como un porcentaje con uno punto decimal, por lo que ya podemos ver unas historias completamente nuevas comienzan a emerger aquí. Y no sólo estamos viendo una comparación estatal por estado en cuanto al número total de votantes, sino que también tiene una proporción de las poblaciones elegibles. Entonces, ¿por qué no seguimos adelante y ordenamos por nuestro nuevo porcentaje de población electoral métrica para tener una idea de dónde vemos la mayor proporción de votantes? Por lo que definitivamente algunas tendencias interesantes aquí. Vemos Distrito de Columbia o D. C. En la parte superior de la lista, con un porcentaje de población de votantes de 76.1%. Eso tiene sentido. Ya sabes, es la capital de la nación, el corazón político del país. Pero entonces también tienes estados como Mississippi en Wisconsin, que puede venir como una sorpresa para algunos ahora desplazándose hacia abajo en el otro extremo del espectro, vemos West Virginia, Hawaii, Oklahoma y Arkansas. Ahora bien, este no es necesariamente el momento o el lugar para profundizar mucho más en por qué estas tendencias son como son. Entonces lo que en realidad hace que ninguna población de Virginia Occidental tenga menos probabilidades de convertirse en
votantes en comparación con Massachusetts o Colorado, por ejemplo. Pero lo que podría ser un próximo paso realmente interesante sería sacar algunos datos adicionales del Censo de Estados Unidos que podrían empatar aquí. Entonces tal vez cosas como el ingreso per cápita o el nivel de educación o demografía adicional podrían ayudar a proporcionar algún contexto adicional y darte herramientas para entender mejor el por qué o las fuerzas motrices detrás de estos índices de votantes que estamos viendo aquí. Pero una pieza adicional de información que sí tenemos a mano es la edad. Entonces sigamos adelante y sacamos la edad de nuestra lista de campo y agregamos tu opinión como
etiquetas secundarias de rol . Y ahora, mientras miramos a través de este punto de vista, podemos ver que algunas tendencias adicionales comienzan a emerger. Entonces, por ejemplo, en nuestros estados superiores, tendemos a ver tasas realmente,
realmente fuertes de población de votantes entre las poblaciones de mayor edad, especialmente el cubo de 65 años más y luego en general, los cubos de edad más jóvenes tienden a mostrar tasas más pequeñas pero aún relativamente fuertes. Por lo que 62% en D. C dentro del rango de 18 a 24 años de edad poco menos del 64% 18 a 24 en Mississippi y luego desplazándose todo el camino hacia abajo al contrario bajo el espectro. Algo que es un poco interesante de ver es que todavía obtienes
tasas de electores relativamente fuertes de las poblaciones mayores. No del todo fuerte son los estados superiores, pero aún en los años cincuenta y sesenta. Pero cuando empiezas a mirar la demografía de menor edad, los 18 a 20 cuatro patas, que 25 a 30 cuatros ves tasas mucho, mucho más bajas aquí abajo en estados como West Virginia, Hawaii en Oklahoma. Entonces, por ejemplo, de los de 18 a 24 años en Virginia Occidental, ustedes saben que hay 100 62 mil ciudadanos que cayeron en este cubo de edad, y sólo 37 mil se convirtieron en votantes confirmados, que es una tasa de 22. 8%. Caso similar en Hawaii, 26.4 27.2 en Oklahoma, aún menor en Arkansas. Por lo que todavía bastante direccional en este punto, pero una perspicacia realmente interesante sin embargo. Ahora, lo siguiente que me gustaría explorar un poco más aquí para arrancar las cosas es la composición de la población votante, y para ello, quiero usar algunos de nuestros valores de show como cálculos. Entonces, ¿por qué no empezamos con grupo recién envejecido para empezar con estado completo fuera en los filtros? Que solo estoy viendo mis datos organizados por estos cubos de cinco grupos de edad fuera de aquí? Si nos interesa ver la distribución de la población votante específicamente, vamos a tirar de una segunda instancia de votantes confirmados aquí mismo en la columna D. Y ahora, lugar de solo mostrarlos sin ningún cálculo, vamos a mostrarlos como un por ciento del total de la columna. Ahora, lo que esto me dice es que entre todos los votantes confirmados en este conjunto de datos son dueños del año 2012. Sé que la mayor parte de esos votantes cae en el rango 45 a 64, seguido del rango 65 más al 22%. Y en el otro extremo, tienes tu menor proporción, o proporción de votantes, que caen en 18 a 24. Por lo que los votantes más jóvenes representan sólo 8.54% del total de electores confirmados a nivel nacional. Ahora es estado de arrastre de nuevo en como sus principales etiquetas de rol, y vea cómo estas tendencias miran a un nivel más granular. Entonces en este caso ahora, lugar de formatear como un porcentaje de la columna en su conjunto,
lo cual es un poco difícil de leer, ya que los porcentajes se ponen
realmente, realmente pequeños aquí, voy a cambiar ese cálculo 2% de padre y estado establecido como mi padre. Y ahora tenemos un conjunto completamente nuevo de insights al alcance de la mano para que podamos perforar en estado
por estado y ver cómo estas proporciones por rangos de edad difieren de un lugar a otro. Entonces D. C, por ejemplo, es una especie de historia interesante. Simplemente que la mayor proporción de votantes confirmados dentro de D. C en realidad provienen del cubo del 25 al 34, mientras que la mayoría de los demás estados, como Mississippi, Wisconsin, Minnesota, muestran la mayor proporción de votantes provenientes del cubo del 45 al 64. Entonces por la razón que sea, la población votante se sesga un poco más joven en D. C que en muchos de estos otros estados y luego se desplaza hacia abajo. Otra perspicacia interesante a ver aquí es que para estos estados de baja población de votantes como Oklahoma, Hawaii y West Virginia, porque pequeñas, estas proporciones son particularmente para el grupo de edad más joven de 18 a 24 años. Por lo que menos del 5% de los votantes en Hawaii cayó en el cubo del 18 al 24, y sólo el 6% en Oklahoma cayó en ese rango. Entonces, por
la razón que sea, las poblaciones más jóvenes de estos estados realmente no parecen demasiado inclinadas a salir y votar. Entonces definitivamente otra historia interesante, realmente apenas empezando a rayar la superficie en algunos de los ángulos interesantes que podemos tomar con este conjunto de datos. Entonces ese es nuestro lanzamiento para el caso de estudio de Votor Votorde los Estados Unidos. Adelante y da los ejercicios de tarea en la próxima toma de conferencista y ve qué más
puedes descubrir.
3. Salarios de San Francisco: excepto que tenemos nuestro caso salarial San Francisco Estudio Resumen rápido del conjunto de datos. Estamos viendo información salarial de empleados del gobierno de San Francisco entre los años 2011 y 2013. Por lo que poco más de 24,000 filas o registros de datos aquí, incluyendo una serie de diferentes dimensiones y medidas en el lado de la dimensión, tenemos empleados nombre al año, su empleado yo d y su título laboral. Y para las medidas tenemos pago basado, pago horas extraordinarias y otro pago. Por lo que los conceptos que cubrirán en este caso práctico en particular son la clasificación y el filtrado, agrupación de campos calculados y los diseños de tablas. Entonces, vamos a saltar. Muy bien, Así que en tu cuaderno de estudio de caso de tabla pivotante, adelante y salta a la pestaña de sueldos de San Francisco. Vamos a controlar A para agarrar todos esos datos. Vamos a insertar nueva tabla pivotante en una nueva hoja de trabajo. Sigamos adelante y simplemente renombramos ese pivote de sueldo de hoja y firmemos un color tabulador de verde claro nuevo solo para especie de diferenciar entre los datos sin procesar y los toques de pivote. Entonces lo primero es lo primero, vamos a sacar un nombre de empleado sólo para que estemos viendo datos a nivel de empleado para empezar y pueda marcar las casillas para traer todas nuestras medidas de pago basado, pago horas extras y otro pago, y Simplemente entraré y formatearé los tres campos tienen moneda, y realmente no necesito puntos decimales aquí, Así que aquí vamos. Muy bien, entonces ahora estamos formateados. También quiero insertar un nuevo campos calculados que solo llamarán pago total porque quiero ver la suma de las tres de esas medidas el sueldo base,
más cualquier pago a lo largo del tiempo que alguien ganara más cualquier otro pago también. Por lo que ahí vas Pago total, base de
Águilas más horas extras, más otras. Y ahora voy a acercarme a esto de una manera poco sesgada y solo empezar a explorar un poco la fecha y ver qué encuentro. Entonces como primer pase,ya
sabes, ya
sabes, tal vez solo ordenamos los nombres de nuestros empleados descendiendo por ese nuevo campo de pago total que acabamos crear. Queremos ver quiénes fueron los mayores asalariados durante todo este periodo de tres años. Por lo que Judy Melnick ganó 553 K en salario total durante este periodo. Mike Dreiling ganó 460 y entonces y ahora, en lugar de mirar la muestra general, quiero ver a los mejores ganados por apenas un año determinado. Así que trae año a mi caja de filtros, digamos, solo para 2013 que estaban en la mayoría. Por lo que Gary Altenburg, por ejemplo, tuvo un gran año en 2013 aquí en una paga total de poco menos de 363.000. Pero lo que es un poco interesante de Gary es que ganó 100 29 mil de sueldo base y luego otros 221,000 de lo largo del tiempo, que es enorme cantidad de pago de horas extras, sobre todo en comparación con algunos de estos otros empleados que no ganaron nada en horas extras como Amy Heart, por ejemplo, o Sharon o James Dudley. Entonces esa es una especie de tendencia interesante. Y eso es algo en lo que, como analista, como analista,
me interesa sumergirme un poco más en profundidad Así que lo que podemos hacer es en realidad agarrar el
título del trabajo y tirar de eso solo para tener una idea de lo que realmente hacen Gary y Amy. Y así cuando hacemos eso, vemos que Gary resulta que es teniente. Parece el Cuerpo de Bomberos, mientras que Amy es una especie de jefe de departamento. Ya sabes cuando supongo que eso tiene sentido si los bomberos tienden a ganar más horas extras pagan sólo por la naturaleza de su trabajo, ya
sabes, sabes, agregan por ese tipo de una perspicacia tan interesante ahí. Ahora, si sacamos el título del empleo, podemos seguir explorando esa tendencia de pago de horas extras usando otro campo calculado. Entonces lo que quiero hacer ahora es en lugar de sólo mirar el volumen de horas extras en cuanto al número de dólares, quiero mirar la tasa así a lo largo del porcentaje de tiempo, que podría calcularse igual que las horas extras pagan del total. Y esto me dará un tipo diferente de lente para mirar mis datos a través. Y hagámoslo un porcentaje con el punto decimal y ahora lo que este nuevo campo me
permite hacer. Es ordenar a mis empleados descendiendo por ese porcentaje de horas extras y ver tipo de quién está ganando el mayor trozo de su cheque de pago a partir del tiempo versus sueldo base u otro sueldo. Y en este caso, Janey Jennings está en la cima de la lista. 82.2% de su paga fue categorizada como horas extras, por lo que 33,000 de 40,358 dólares. Pero hay una especie de mucho ruido aquí en esta lista. Tengo algunos empleados que solo están ganando unos 100 o unos pocos $1000 lo que significa que
probablemente haya empleados a tiempo parcial o contratados para que podamos perforar nuestras
opciones de clasificación y filtrado . Y lo que haría en este caso es aplicarlo filtro de valor mayor que y decir OK, el pago total necesita ser mayor a 50,000 Prensa. OK, eso eliminará un poco de ruido y me dará un más manzanas a manzanas comparación de los empleados que estoy viendo ahora. Entonces una vez que lo hemos hecho ahora, Kimberly King Stitt está en la parte superior de la lista. Ganó 63% de su paga a lo largo del tiempo, y hay un buen amigo, Gary justo ahí en el número dos de la lista. Entonces obviamente, en este punto, ya
sabes, el número de caminos diferentes que podríamos tomar con este análisis son prácticamente infinitos. Incluso sólo el número de formas en que podemos filtrar y ordenar esta lista de empleados son esencialmente interminables. Entonces, por ejemplo, si quisiéramos Onley. Mira a los empleados cuyo nombre comienza con Steve. Podemos usar un filtro de etiquetas para hacer eso para que el filtro de etiquetas comience con Steve. Ahora solo estamos mirando a los Steve en nuestro conjunto de datos, pero podrías notar que ahora mi filtro de valor de 50.000 dólares ha sido sobreescrito. Entonces tengo aquí algunas personas que ganaron 14 mil. Ya sabes, nuestro 5000 y otra vez, eso es como hablamos antes en el curso, porque por defecto, las opciones de tabla
pivot solo te permitirán tener un conjunto de filtros aplicados para llamarlo. Puedo cambiar eso en mis herramientas, yendo a opciones totales y filtros. Permitir múltiples filtros por campo presiona OK, y ahora todavía tenemos nuestro filtro de etiqueta Steve. Entonces sigamos adelante y volvamos a aplicar el filtro mayor que el valor y digamos que el total paga de nuevo mayor a
50,000. De acuerdo, y ahora tenemos nuestros dos filtros aplicados. Estamos viendo el pago total de Onley mayor a 50 y en los nombres de Lee que comienzan con Steve. Ambas marcas de verificación indican que se han aplicado ambos valores. Entonces en este punto, realmente no
me importan los empleados que solo se llamen Steve, así que voy a borrar todos estos filtros del nombre del empleado. Y veamos los datos un poco de un nivel más alto. Así que saca el nombre del empleado. Asumamos cosas por título de puesto. Entonces una cosa que aquí es interesante es que cuando miras una métrica como la paga basada, ya
sabes, es tentador mirar esto y decir:
¡Oh, ¡Oh, wow! Los empleados de cuentas ganan mucho más dinero que los contadores, por ejemplo. Pero antes de hacer eso, realmente
necesitas pensar en lo que estás viendo aquí. Y en este caso, este Algunos de columna de sueldo base es una columna que resumir o sumar la base paga de cualquier empleado en el conjunto de datos que cae en cada uno de estos cubos. Entonces mi hipótesis sería que hay muchos más empleados que se están etiquetando como empleados de
cuentas que contadores, razón por la
cual vemos un sueldo base de $974,000 para los empleados de cuentas y solo 65,000 para los contadores. Y podemos comprobar eso solo arrastrando el nombre del empleado como etiquetas secundarias de rol aquí mismo a nuestra vista. Y eso es exactamente lo que está pasando aquí. Por lo que tenemos luce como 23 empleados con trabajo, título de empleado de cuenta. Y tenemos a Onley un contador, Carlito. Por lo que esta cifra 973 está sumando todos los salarios individuales de cada uno de estos 23 empleados, así que saca a los empleados. Y si sí queremos conseguir un mejor sentido de las manzanas a las manzanas ganancias por título de trabajo, cual creo que es algo interesante, Teoh, mira aquí. Lo que puedo hacer es cambiar el modo de ización de verano de alguna media del dedo del pie. Entonces en lugar de editar este, voy a tirar en una segunda instancia de ritmo base que podemos comparar. Y esta es la que cambiará la ización veraniega a un promedio y formateada como moneda . Por lo que ahora se está tomando el promedio de los 23 salarios de esos empleados y equiparando eso a 42 mil que de hecho es significativamente menor que el salario promedio contable de 65 mil 392. Tan como una aclaración sutil pero realmente, realmente importante para hacerte saber,
ya que estás interpretando números y una tabla pivotante a partir de ahí. Ahora que tenemos nuestro campo promedio en su lugar, podemos ordenar nuestros títulos descendiendo por ese promedio de sueldo base. Y ahora obtenemos una especie de lista más limpia, más precisa para hacer esas comparaciones. Por lo que vemos títulos como Jefe de Departamento, subjefe
médico forense arriba en la parte superior de la lista. Y luego a medida que se desplazaba hacia abajo, empieza a ver más títulos como Secretario general, obrero, empleado de
inventario, cajero en DSO en él así sucesivamente. Entonces ya, algún tipo interesante de hallazgos e insights burbujeando a continuación. Lo que quiero hacer en realidad es agrupar algunos de estos títulos juntos, ya que hay bastantes áreas de superposición. Entonces ordenaré alfabéticamente tipo de desplazamiento a través para ver tipo de lo que estos títulos de trabajo aire vienen a través de nosotros. Y probablemente notarás que hay un montón de variaciones de tipos similares de
títulos de empleo , así que parece que hay al menos 10 trabajos de aeropuerto con títulos ligeramente diferentes. Entonces lo que quiero hacer en este caso es crear agrupaciones que enrolle los títulos de empleo a un nivel
ligeramente superior. Llámalo categoría de empleo en contraposición a título de puesto. Entonces para darles un ejemplo, ¿por qué no empezamos con algunos de estos en la parte superior de la lista podemos pasar por títulos
relacionados con contador , clic
derecho agrupar los juntos y en lugar del Grupo uno, llámalo contabilidad. Si recuerdas por defecto. Este pivote está configurado como una vista compacta, lo que significa que tanto mi campo de título como el nuevo campo de grupo que creé están todo tipo de anidados en la misma columna. No quiero que ese sea el caso. Yo quiero poder tratar ambos campos por separado. Por lo que voy a mis herramientas opciones de diseño de informe diseño delineado formulario. Y eso acaba de estallar esos dos campos. Ahora puede editar de forma independiente mi trabajo original, campo de
título y mi nuevo campo de grupo. Entonces en lugar de empleo Título dos, llamemos a esta categoría laboral. Ahora podemos especie de simplemente continuar el proceso como lo hizo con los títulos contables. Ya sabes, tal vez quiero los admin juntos y haga clic derecho en grupo esos en lugar del Grupo dos. Llámalo admin, y luego hagamos uno más con estos trabajos aeroportuarios. Tengo algo así como 12 títulos relacionados con aeropuertos diferentes aquí. Agrupemos esos juntos y lo llamemos Aeropuerto. Ahí vamos y ahora desde que cambié el modo de esquema. Si quiero enrollar por nivel de categoría ahora, solo
podría sacar título del empleo y organizar los datos por ese nuevo campo que acabo crear. Entonces sumen los hombres en su conjunto, que incluyen los que creen cuatro rollos o títulos de empleo que caen dentro de él, ya
sabes, generaron un salario basado total de 2.273 millones y un promedio de 71,000. Ahora bien, este enfoque manual para agrupar funciona bien. Pero como nota al margen para quienes están interesados, una solución más elegante y eficiente para hacer esto sería en realidad crear una tabla de búsqueda separada que coincida con todos esos títulos de empleo a categorías específicas. Y luego, a partir de ahí, usando ya sea buscar funciones o herramientas de modelado de datos toe realmente integran esas
categorías de puestos como un nuevo campo en los propios datos brutos. Y eso me ahorraría la molestia de desplazarse manualmente y agrupar valores en el pivote. Pero eso es un tema para otro día y otro curso. Entonces ahí lo tienes. Ese es nuestro punto de partida para explorar los datos salariales de San Francisco. Adelante y juega con él. Haz algunos explorando, Da la tarea de tiro y dame un grito si tienes alguna pregunta.
4. Registros de ataque de tiburones: todo bien. Nuestro próximo caso práctico es una tonelada de diversión. Es mi favorito de todos los tiempos para este. En realidad vamos a ver los registros de ataque de tiburones registrados entre 1,902,016. Por lo que tienes poco menos de 5300 registros u observaciones en nuestro conjunto de datos. Y lo que es un poco único de este conjunto de datos es que en realidad no contiene ninguna medida. Por lo que no hay nuevas variables milagrosas ni campos cuantitativos. Es todo dimensiones. Y esto es relativamente común cuando se trata de cosas como el mantenimiento de registros, porque lo más relevante es la información contenida dentro de esos registros
a diferencia de cualquier tipo de campo cuantitativo. Entonces tenemos una tonelada de dimensiones realmente fascinantes con las que trabajar, empezando por el número de caso y la fecha en que tuvo lugar el ataque. Podemos cortar los datos por el tipo de ataque, ya sea provocado o no provocado, donde se llevó a cabo en cuanto a la zona del país y ubicación específica. En qué actividad se dedicó la víctima cuando fueron atacados, su nombre, su género, su edad, qué tipo de lesión se sufrió, si fue fatal, sí o no. Um, incluso como esta especie del tiburón y del investigador y de donde vino la fuente, Todo esto está incluido en estos registros de ataque de tiburones que tenemos a mano. Así que realmente, realmente rico conjunto de datos para usar para todo tipo de diferentes tipos de análisis. En este caso, vamos a hacer un lanzamiento rápido y algunos de los conceptos que cubrirán nuestra configuración de
valores de agrupación de fechas y gráficos dinámicos. Entonces, vamos a saltar. Muy bien, adelante y dirígete a la pestaña Tiburón Attack Records en nuestro libro de trabajo de caso de tabla pivotante. E iba a controlar un para agarrar todos esos datos e insertar un pivote en una nueva hoja de trabajo. adelante y nombremos a este pivote de tiburón y formateemos esa pestaña con un bonito Phil verde Y
Dios mío , ¿por
dónde empezamos incluso con un conjunto de datos como este? Hay tantos ángulos fríos que podemos tomar. Pero al final del día, términos generales, lo que estamos tratando de entender es el número de registros o conteo de ataques desglosados todo tipo de formas interesantes, ya
sabes, tal vez por fecha, por ubicación, por actividad de género, realmente un montón de opciones disponibles para nosotros aquí. Y como mis datos brutos están a nivel de caso, lo que significa una fila por ataque registrado, esto debería ser relativamente simple de hacer. Yo soy así es arrastrar el número de caso aquí en nuestro cuadro de valores. Como puedes ver, por defecto cuenta porque realmente no es un campo numérico ni una medida. Y en este caso, el conteo es exactamente lo que quiero. este momento, me dice
que ahí surgieron 5292 registros en mi conjunto de datos, cuales salté de vuelta a mi hoja de datos real. Puedo confirmar que se alinea con el número de filas, así que eso es exactamente lo que quiero. Y ahora es una función de desglosar este conteo y cortarlo y cortarlo en cubitos de diferentes maneras. Entonces, ¿por qué no empezamos con tendencia tomamos una cita, dragón de
campo y dos filas? Como pueden ver, es agrupación automática, cual está bien, voy a sacar cuartos y salir solo para que esté mirando los ataques por año. Entonces, debido a que los datos son un poco funky a principios de siglo,
me gustaría limitar en realidad esta vista a un corte más moderno de los datos. Entonces lo que haré aquí es solo seleccionar los últimos 12 años más o menos. Por lo que 53 4016 y luego simplemente haga clic derecho filtro mantener sólo los elementos seleccionados. Y ahí tienes. Tengo este 12 años corriendo conteo de ataques de tiburones por año. Por lo que 102 ataques en 2503 en 2006. Ahora lo que quiero hacer es en realidad simplemente tirar en un par más instancias de este campo de recuento de
número de caso para que podamos mostrar estos valores de diferentes maneras. Una segunda columna, ya
sabes, quizá quiera mostrar esto como el por ciento El total de la columna, que ahora me dice que ustedes saben que los 139 ataques en 2015 conformaron la mayor participación dentro esta muestra de 12 años, dando cuenta de poco más del 10% del impuesto registrado. Ya conoces este tercer ejemplo, podría demostrar que como total
corrido con años como mi campo base, así puedo ver cómo ha crecido el total de ataques a partir de 2005 sumando todo el camino hasta 1387 ataques
totales para el año 2016 tan solo diferentes formas de ver estos datos. Entiendo cómo se ve la tendencia a lo largo del tiempo, así que eso es bastante interesante. Qué es sacar años ahora. Pero preserva esa vista de 12 años, y ahora queremos recortar los datos de una manera diferente, Así que creo que voy a empezar con el género. Quiero ver si hay notables diferencias femeninas versus masculinas, y verás que mi tercera columna, que está mostrando valores como total corrido, ya no
es válida,
ya que este campo base de años ya no existe en mi punto de vista, para que pueda seguir adelante. Sólo saca eso. Y esta visión es interesante. Lo que me dice es que es una mala noticia ser un chico por lo que se refiere a los ataques de tiburones. Yo no diría que están siendo atacados por tiburones porque su correo, es más probable por las actividades en las que se dedican, pero bastante fascinantes. En esta ventana de 12 años, el
83% de los ataques fueron en hombres y poco menos de 17 en mujeres, así que una especie de pepita genial ahí, y podríamos ir aún más profundo, pleno género fuera y realmente mirar los ataques por edad ahora desplazándose por aquí. Algo que noté al final es que hay un cubo desconocido con una tonelada de observaciones , thes aire, solo ataques o casos donde no se proporcionó una edad o no se registró. Entonces no quiero ese campo. Puedo seguir adelante y solo de seleccionar desconocido para que solo esté mirando edades conocidas. Y este es un gran candidato para la visualización, particularmente para un gráfico de estilo hist a gram, que realmente puede mostrar la frecuencia de los ataques por edad y permitirnos entender qué edades tienden a estar más frecuentemente involucradas en tiburón ataques. Entonces simplificaré un poco esta vista y sacaré el porcentaje del
cálculo total de la columna que solo estoy viendo el recuento de número de caso, cubo y por edad. Ahora, con cualquiera de estas celdas seleccionadas yendo a mi gráfico de pivote de herramientas, y esta columna agrupada nos dará un siseado realmente agradable un efecto gramo puede entrar en analizar y deshacerse de esos botones de campo aquí. Pero echa un vistazo a esta visualización
realmente, realmente clara y poderosa que me muestra exactamente dónde tienen lugar las frecuencias más altas de ataques en cuanto a cubos de edad. Entonces en este caso, bastante claro cristalino que a partir de alrededor de los 15 años o así, la
frecuencia de los ataques es mucho mayor y todo el camino hacia unos 22 o así. Y luego empieza a bajar y luego a seguir un poco una vez que la gente llega a sus cincuenta y sesenta. Entonces, de nuevo, esto no necesariamente aborda la causalidad. Ya sabes, ¿
por qué es este el caso? Pero algunas hipótesis que podríamos empezar a tirar por ahí son que los más jóvenes tienen más probabilidades de dedicarse a actividades donde simplemente hay más probabilidades de ser atacados por un tiburón , como el surf o el cuerpo, abordaje o natación o lo que sea. Pero esa es una vista realmente interesante aquí. Y si queremos mantener esto, una opción sería simplemente copiar este pivote y crear una nueva versión en otro lugar de la hoja o en una hoja diferente. En este caso, realidad solo
voy a dejar caer este gráfico y seguir explorando estos datos. Entonces, eliminemos eso. Y ahora, más que la edad, me interesa un poco este campo de actividad. Yo quiero ver qué es lo que hacía la gente cuando fueron atacados, tipo de qué actividades llevaron a la mayoría de los ataques en la muestra. Voy a tirar de la actividad son mis etiquetas de rol. Voy a ordenar estos enviando por el número de caso de conteo. Entonces nada realmente sorprendente aquí. Es una especie de lo que esperarías. Pasaron muchos ataques mientras la gente estaba surfeando o nadando o pescando submarina. Si quisiéramos perforar en una capa más profunda, también
podríamos tirar de este fatal sí, no campo, que es un filtro binario. Se necesita un valor de saber si el ataque no fue fatal. Sí, si fuera así, podemos ver si hay alguna diferencia entre,ya
sabes, ya
sabes, los ataques
fatales que suelen ocurrir cuando la gente está nadando o surfeando versus el tipo no fatal de la misma historia aquí. nada realmente a rompedor ahí, sino sólo unas formas diferentes de cortar y dados estos datos, utilizando las dimensiones a la mano. Ahora, una última cosa a llamar aquí es que si no filtramos la columna del año, te darás cuenta de que esta columna a se estira
camino, salida. Se vuelve realmente molesto trabajar con. Estoy tan para arreglar que puedes hacer click derecho cambiar la columna con atrás a 20 o así para que esté vuelta a la vista, y la razón por la que está haciendo esto es porque aquí hay ciertas actividades que tienen muy , muy largas cuerdas y sobresale tratando de auto fit para llamarlos con para que ninguna de esas cuerdas esté siendo cortada. Pero el problema es que cada vez que realices algún ajuste a tu pivote, va a auto fit una y otra vez. Y hay que seguir cambiando la columna con una y otra vez. Entonces para arreglar eso, simplemente
pasaré a las herramientas de mesa pivote, opciones y solo diesel ECT. Auto FIT COLUMNA Ingenio en prensa de actualización. OK, y ahora cuando realices algún ajuste a tu pivote, esta columna a seguirá siendo el mismo ancho que actualmente y no se estira cada vez hagas un cambio para que
te recomiendo encarecidamente que explores un poco estos datos un poco más profundo por tu cuenta. Aquí hay algunos discos bastante increíbles. De verdad acabo de empezar a rayar la superficie de este conjunto de datos. Um, mi favorito personal hasta el momento, si saco la actividad y caigo en nombre es ah, hombre del nombre de Cosimo Pechiney, quien es una especie de caso interesante porque a juzgar por la actividad grabada, en realidad atacó a un tiburón con los puños. Pero no te preocupes. De alguna manera escapó con sólo un brazo lacerado. Um, en esa nota, ese es su interés para nuestro estudio de caso de ataque de tiburones.
5. Datos de mercado de valores: todo bien. Nuestro próximo caso de estudio es el uso de datos bursátiles, y tenemos un conjunto de datos bastante simple para trabajar aquí. Se trata de una muestra de tres meses de datos bursátiles para unas 500 diferentes
empresas cotizadas públicamente y mirando la captura de pantalla a la derecha aquí. Tenemos 29,440 observaciones con tan solo unas dimensiones y medidas simples. Entonces las únicas dimensiones con las que trabajarán aquí son fecha y símbolo y luego, para las medidas, medidas bastante estándar del mercado bursátil financiero. Tenemos el precio abierto precios altos y bajos para el día. El precio de cierre y el volumen de trading y los conceptos que cubrirán en este lanzamiento incluye algunos filtros de clasificación básicos realmente se centran en el formato condicional aquí para
usar realmente visualizaciones para contar una historia. Practicará los aspectos destacados. Las reglas de celda harán algunas demostraciones realmente geniales con barras de datos, y terminarán con algunos ajustes de valor como por ciento de diferencia de la cual es una gran herramienta para mostrar ganancias y pérdidas día a día. De una manera realmente clara. Tan sencillo, bastante rápido uno. Adelante y saltemos ya. Por lo que con tu tabla pivotante estudio de caso Libro abierto. Adelante y navega a la pestaña de datos del mercado bursátil. Y antes de crear un pivote, solo una nota al margen es que este es un extracto de datos bastante estándar. Y es de día, que
significa que este es un buen candidato para el análisis que podría volver a visitar una y otra vez y tal vez apilar más datos en como recolectar más datos en el futuro. Entonces como ese es el caso, podría no tener sentido seleccionar todo el conjunto de datos en Lee down to Road 29 4 41 porque eso significa que si agrego o apilar nuevos datos debajo, esto tendría que entrar en mis herramientas de tabla dinámica, cambiar la fuente de datos, extender la fila, hacer referencia a cualquier camino al que he agregado datos. Entonces, como, hablamos de que hay dos formas de tratar los datos que potencialmente podrían crecer con el tiempo, una de las cuales es seleccionar los encabezados de columna completos. Por lo que ahora esta referencia de tabla dinámica no tiene referencias de fila. Se extiende hacia abajo por debajo de la última fila de datos. De esa manera es que agregamos nuevos datos. Todo lo que necesitamos hacer es simplemente actualizar el pivote y el segundo enfoque para convertir este rango en una tabla porque una buena característica de las tablas es que pueden absorber nuevos datos ya se agregan debajo de su rango de datos existente. Entonces en este caso, sigamos adelante y tomemos este último enfoque. Todo lo que necesito hacer seleccionar cualquier campo o cualquier celda dentro de mi rango va a insertar tabla. Se puede ver seleccionado todo el rango contiguo que contiene datos a través de carretera 29 4 41 Y sí, mis datos sí tienen encabezados en fila uno. Esa casilla debe ser marcada. Presionar bien. Y ahí tienes. Ahora bien, si quieres dar formato a tu tabla, puedes hacerlo aquí mismo en los estilos de tabla. Pero estos son mis datos crudos. Realmente no le importa mucho cómo se ve. Pero ahora si agrego más datos más adelante, será mucho,
mucho más fácil de acomodar. Entonces con eso, volvamos a insertar gota en una tabla pivotante en una nueva hoja de trabajo, y podemos nombrar a este pivote de stock. Ahí vamos. Y solo formateemos esa pestaña con un tono verde claro. Y ahora mi objetivo aquí en general, es analizar tendencia para lo primero que puedo hacer es solo seguir adelante y agarrar fecha, meterla en mis etiquetas de rol. Es auto lo agrupa. Entonces con el campo de fecha seleccionado, realmente no quiero mes aquí. Yo solo quiero preservar la tendencia de nivel diario para poder entrar en mis herramientas analizadas y solo presionar en grupo, y eso volverá al formato original de ese campo, que en este caso, es lo que quiero. Vamos a seguir adelante y arrastrar símbolo a nuestra caja de filtros, ya que eventualmente querrá sumergirse en el rendimiento para empresas individuales. Y luego arrastraremos todos nuestros campos a nuestro cuadro de valores. Abierto, alto, bajo, cierre y volumen. Por lo general, cuando estás dando inicio a un pivote totalmente nuevo, tendrás que pasar por una ronda de formateo. Yo así que sigamos adelante y hagamos eso ahora mismo. Uniforme en todas estas 1ra 45 columnas como moneda eso precio abierto, precio
alto, precio
bajo y cerrar. Todos estos serán formateados, igual que moneda sin puntos decimales. Entonces ahí vamos y luego el volumen no es los volúmenes de divisas. Apenas la cantidad de trading que tiene lugar formato este es un número con
separador de miles y sin decimales. De acuerdo, así que esto es un poco más claro. Practicemos también nuestros encabezados de columna personalizados. Entonces si quieres deshacerte de estos, algunas de las etiquetas pueden cambiar eso aquí mismo en la barra de fórmulas. Y en lugar de solo abrir, que ya es un nombre de sentimiento, voy a usar mi truco de espacio final y formato de esa manera. Tan mismo cosa con lo alto cerca y volumen. Esto sólo hace que mi mesa sea un poco más legible. Y también para ayudar. Puedo agarrar todas esas columnas yendo a casa y solo centrar la alineación ahí. Entonces de nuevo, solo un pequeño truco de legibilidad aquí y ten en cuenta seguimos viendo la
agregación o el hijo de los precios y el volumen a través de todos los símbolos de nuestro conjunto de datos, lo que en este caso realmente no ayuda mucho. Entonces, en cambio, ¿
por qué perforamos en un solo símbolo específicamente y puedes elegir a cualquiera? Pero voy a empezar con un pl o manzana y ahora este tipo de tiene un poco más de sentido. Estamos viendo el precio real de Apple Stock día a día así como el volumen de trading Así que ahora tengo toda la información bruta que necesito para entender el rendimiento de las acciones de Apple durante esta muestra de tres años. Pero definitivamente hay algún trabajo que se debilita debido a que a añadir algo de visualización y realmente ayudan a brillar
los insights. Entonces, ¿por qué no empezamos enfatizando realmente el día a día las ganancias o pérdidas? Y para hacer eso, realmente
me voy a centrar en esta columna cercana, y lo que quiero hacer es tirar de una segunda instancia de ropa. Pero para este, en lugar de mostrarles ningún cálculo, ID me gusta mostrar esta columna como la diferencia por ciento con respecto a las fechas anteriores en mi base fielded, ítem basado en
estado es anterior y presione OK, por lo que esto me dice cómo ese precio cerrado ha tendido día a día. En este caso. 24 de agosto estuvo a la baja poco menos de cientos de punto porcentual en comparación con el 21 y la razón por la que faltan fechas porque el mercado está cerrado los fines de semana. Por lo que el 21 fue un viernes. 24th era un lunes cuando el mercado se abrió de nuevo, así que este campo definitivamente es útil, pero el problema es que sigue siendo solo un montón de números, y es un poco difícil identificar tendencias o lo que realmente está pasando y donde mi debería enfocarse aquí. Por lo que la ayuda del dedo del pie con ese formato condicional será una gran herramienta de usar. Entonces antes de que lo
hagamos, vamos a entrar en diseño y deshacernos de nuestros grandes totales Row, ya que no necesitamos eso y te darás cuenta de cómo en cualquier momento hacemos un cambio en las columnas aire tipo de reajuste automático basado en los datos. no me gusta realmente. Por lo que puedo cambiar esa opción aquí en opciones de herramientas de tabla pivotante y simplemente desmarcar esa columna con opción de ajuste automático allí presione. De acuerdo, ahora puedo como que solo personalicé el ancho de mis columnas, y éstas ya no cambiarán a medida que haga actualizaciones a mi pivote. Entonces llamemos a esto en lugar de algo de ropa, llamémoslo diariamente cambiado para que sea un consentimiento un poco más claro. Er eso Y ahora para aplicar el formato condicional, voy a controlar, cambiar hacia abajo y agarrar toda esta columna de datos yendo al formato condicional a casa. Hay pocas opciones que podrían usar aquí. Podría hacer escalas de color como de rojo a verde. Este caso y cuando use las reglas de celda de resalte porque solo quiero que estas celdas tomen dos formatos ya sea rojo o verde, basado en una ganancia o un día perdido a día. Entonces comienza con mayor que la regla de celda de resaltar y digamos, cualquier momento esta celda valores mayores que cero. Es decir, es un alza porcentual en comparación con el día anterior. Eso es algo bueno. Entonces cuando lo formatee con verde, llénelo con texto en verde oscuro y presione OK y sin cambiar la selección, voy a perforar de nuevo en mis reglas de celda de resaltado y tenía una segunda regla por menos de cero. Y eso es algo malo. Entonces formatea cualquier celda que sea menor que cero o negativo dedo del pie rojo claro, rellena con textos de color rojo oscuro
y presiona OK, y ahora es muy, muy claro. Cuales días mostraron un levantamiento para Apple, en el que día mostró un descenso. Me muestra, ya
sabes, periodos de tiempo donde son ganancias consecutivas o pérdidas consecutivas, por lo que esas historias pasan con tanta claridad con algo tan simple como una regla
celular de destaque aplicada en mi pivote. Entonces eso fue definitivamente útil. A continuación, llamemos la atención sobre este campo de volumen aquí, ya que ese es otro elemento realmente importante de los datos con los que podemos trabajar. Entonces para mostrar tendencia de volumen día a día, obviamente un montón de formas diferentes de hacer esto, podría usar un gráfico pivotante con el gráfico de columnas de carta de líneas. Pero en este caso, quiero agregar mis visuales aquí mismo a la tabla misma. Entonces para hacer eso, igual que hicimos con cerca, voy a tirar en una segunda instancia de volumen. Llamas a esta tendencia de volumen, expande bastante el ancho de esta columna. Y ahora, mismo trato aquí. Voy a controlar el cambio hacia abajo para agarrar ese formato condicional de datos de columna entero. Y ahora voy a usar algo llamado barras de datos, que esencialmente ponen en un gráfico de barras directamente dentro de las celdas del pivote. Por lo que es un dedo de la herramienta realmente bonito. Agrega visualizaciones sin crear gráficos secundarios. Entonces haremos una barra de datos azul aquí y ahora está muy, muy claro dónde ocurren esos picos y valles en cuanto al volumen de trading. Por lo que en este caso, para Apple, el día de mayor volumen fue el 21 seguido del 20. Claramente hay mucha actividad en esos días, por la razón que sea, y luego como un retoque final. Observe cómo los números aire tipo de redundante aquí. Ya que tenemos volumen ya en la columna G y se superponen con las barras, simplemente
se ve feo. Tan poco número de protesta, formato personalizado, tres semi colones consecutivos prensa bien. Y, Walla, tus números se vuelven invisibles. Y tengo esta bonita, limpia columna de barra de datos por sí sola. Entonces es genial con esto. Es que ya sabes, ahora que invirtió unos minutos y especie de construir esta plantilla aplicando estas reglas de formato
condicional, no
tengo que hacer eso una y otra vez mientras filto o clasifico o rebano y dados estos datos . Entonces, por ejemplo, en lugar de Apple, tal vez queremos mirar a Amazon a continuación. Puedes presionar, OK. Nuestro cambio diario formateando nuestras barras de datos de tendencia de volumen todas se actualizan automáticamente muy, muy fácil. Y ahora aquí veo una tendencia muy clara donde sucedió algo el día 23 que provocó que el precio de las acciones de
Amazon saltara casi 27% y que el volumen de trading explotara más o menos en comparación con cualquier otro día de la muestra. Ahora resulta que sé que las ganancias fueron liberadas el día 23 las cuales fueron realmente, realmente positivas para Amazon, lo que impulsó este juego que vemos aquí. Por lo tanto, en general, esa fue una manera muy rápida, realmente fácil de integrar algunas visualizaciones y algunas herramientas de estilo de tablero directamente dentro de nuestro puntera pivote. Ayúdanos a contar estas historias y ayúdanos a entender exactamente qué está pasando con los
propios datos brutos . Por lo que en tus ejercicios de tarea, pasarás por un proceso similar. Pero en lugar de analizar las diferencias de día sobre fecha, cavarás un poco más en los diferenciales de precios por día. Pero se aplicará la misma lógica, y con eso, ese es su rápido lanzamiento al estudio de caso bursátil.
6. Estadísticas de equipo de besos: todo bien. Para todos los fanáticos del deporte que hay por ahí, este próximo caso de estudio va a ser divertido. Uno. Vamos a ver las estadísticas del equipo de béisbol, por lo que los conjuntos de datos se resumen. Estamos viendo estadísticas de equipos de Grandes Ligas por temporada para 21 temporadas de 1995 a 2015. Entonces no una tonelada de filas de datos. Son sólo 624 observaciones, pero tenemos un gran número de dimensiones y medidas con las que tenemos que trabajar. Por lo que las dimensiones incluyen la fecha de inicio de temporada, el año ,
la liga, el nombre del equipo de división tanto abreviado como completo. Y luego algún binario. Sí, no hay banderas para indicar si el equipo ganó la división, el comodín, la liga o el mundo Siri. Por lo que esos campos de bandera binaria serán herramientas realmente útiles que podemos usar para filtrar y ordenar en términos de medidas. Aquí tienes todas tus estadísticas clásicas de beisbol. Juegos
jugados, triples, jonrones , paseos, triples ,
paseos,
ponches,bases
robadas, ponches, bases
robadas, atrapado robando y luego lanzando o estadísticas defensivas como carreras permitidas, carreras
ganadas, promedio de carrera
ganada, juegos
completos, cierres y salva. Entonces en realidad sólo vamos a estar usando un pequeño puñado de estos campos, al
menos en el caso Study, kickoff. Pero están disponibles para ti para que puedas explorar como tú elijas. Entonces conceptos cubiertos en este arranque vamos a hablar de ordenar y filtrar cosas bastante básicas vamos a usar,
um, um, tablas
pivote y rebanadoras y luego practicar de ustedes campos calculados. Así que sigamos adelante y sumérjase ya con su cuaderno de trabajo de estudio de caso de mesa pivotante abierto. Adelante y selecciona la pestaña de estadísticas del equipo de béisbol. Y simplemente tenemos un rango fijo de datos aquí para que podamos presionar el control A para agarrar todos esos datos. En realidad, no
queremos estas filas extra, así que solo selecciona uno de los campos del rango,
pulsa el control a otra vez, y eso solo te llevará a la fila 6 25 que es lo que queremos. El compresa inserte mesa pivotante en una nueva hoja de trabajo y sigamos adelante y nombremos a este beisbol, dáselo y formatearlo con un bonito tono verde claro. Y aquí vamos. Por lo que todos estos campos con los que volver a trabajar, no
vamos a cavar en todo sólo va a especie de empezar a rayar la superficie aquí. Pero como estamos viendo datos a nivel de equipo por año, sigamos adelante y llevemos a Year Dragon a nuestras etiquetas de roles. Ahora puedes ver ese marco temporal de 21 temporadas con el que nos pusimos a trabajar. Voy a tomar el nombre completo del equipo y convertirlo en un filtro aquí arriba, así que no me importan muchas de estas estadísticas de componentes por ahora. Yo solo quiero empezar analizando los registros de pérdidas de ganancias. Entonces voy a jalar en W por victorias. L por pérdidas. Haz un poco de formateo aquí. Entonces formato numérica con separador de miles, sin decimales, mismo formato exacto para pérdidas. Ahí vamos. Y hagamos nombres de cabecera personalizados aquí gana y pierde. Y tal vez te estés preguntando por qué estos dos campos son iguales en este momento. Es una gran pregunta, pero cuando lo piensas, estamos viendo datos para toda la temporada en todos los equipos y para cada partido dado, un equipo tiene que ganar, otro equipo tiene que perder, así que cada partido equivale a una victoria y una derrota ya que no hay empates en el béisbol, por lo que esto realmente no tiene mucho sentido cuando lo estamos viendo en todos los equipos . Pero cuando perforamos a un equipo en particular como los Medias Rojas, por ejemplo, ahora estamos viendo eso. Equipos particulares ganan récord de pérdidas temporada por temporada, así que quiero una mejor manera de interpretar estos registros de pérdidas de ganancias. Entonces lo que quiero hacer es agregarlo campo calculado que quiero llamar porcentaje de ganancia y que se
definirá simplemente como Vientos o W divididos por G, que es juegos jugados. Presione OK, haga clic
derecho y formatee eso como porcentaje con un punto decimal. Ahí vamos. Ahora tenemos una sola columna que tipo de captura la información en las
columnas de viento y pérdida . Es entonces cuando porcentaje 1995 los Medias Rojas porcentaje de victoria fue de 59.7%. Ahora puedo usar este campo para realmente empezar a cavar en los datos y analizarlos un nivel más profundo. Entonces, por ejemplo, para los Medias Rojas, puedo ordenar estas temporadas descendiendo por porcentaje de victoria. Decir OK 2004 fue los Medias Rojas mejor año en esta muestra en cuanto a pérdida de victoria al 60.5% 2012 fue el peor año con un porcentaje de victorias de 42.6. Ya sabes, y lo mismo va con cualquier otro equipo. Podría cambiar la selección de los Medias Rojas a los Cachorros. Ahora puedo ver que el año más fuerte de los Cachorros fue 2008 a 60.2, seguido de 2015 ya sabes, y así sucesivamente y así sucesivamente. También puede llevar equipo drag team a mis etiquetas de rol y sacar año fuera y aplicar el mismo tipo de lógica de clasificación, descendiendo por porcentaje de victoria para obtener una sensación de qué equipos tienen el
récord de derrotas de victorias más fuerte en el transcurso de la muestra entera. Entonces vemos que en general, los Yankees fueron más o menos el equipo más dominante en este periodo de 21 años, con un porcentaje promedio de victorias de 58.7. En el otro extremo del espectro, tienes equipos como los Marlins y suben al 43 40% respectivamente. Y ahora estamos viendo sólo una especie de todos los equipos dispuestos en una sola lista. Pero también podemos mostrar aquí las jerarquías ya que sí tenemos las
dimensiones de división y liga con las que trabajar. Entonces, por ejemplo, podríamos jalar en jefe de equipo de división en las etiquetas de fila y dividir las cosas por parte de los equipos de División
Central. Los equipos de la División Oriente y los equipos de la División Oeste también tiraron de liga. Agrega una capa adicional. Ahora es la Liga Americana Central, la Liga Nacional Central y así sucesivamente, así sucesivamente. Y ese tipo de simplemente da un contexto diferente a nuestras opciones de clasificación. Y nuestros porcentajes de victoria aquí porque ahora estamos mirando a estos equipos clasificados por
porcentaje de victorias dentro de cada división en particular. Y lo que es genial de esta visión es que ahora puede perforar hacia abajo a cualquier año o
temporada 2015 en particular por ejemplo, y esto simplemente visualizar es la clasificación final real al final de la temporada. Por lo que los Reales ganaron la Liga Americana Central, Blue Jays ganó la Liga Americana Este, Cardenales ganaron la Liga Nacional Central y así sucesivamente y así sucesivamente. Entonces una especie de forma genial de organizar esta vista usando una tabla pivotante. Pero sigamos adelante y arrastremos la liga y la división hacia atrás. Y por qué no jugamos con algunas de esas banderas binarias de las que hablamos para
liga de victoria de división cuando ganan comodines y ganan Series Mundiales, que verán aquí en estos cuatro campos. Entonces voy a arrastrar cada uno de estos cuatro campos a mis filtros. Ahí vamos. Y ahora lo que puedo hacer es de seleccionar mis filtros de año. Vuelvo a mirar toda la muestra y ajustar estos filtros. podía ver que todos son sí o no para decir,
OK, OK, muéstrame una lista de equipos que ganaron su liga. Por lo que L g gana es una victoria de liga. Por lo que esta es una lista de equipos que ganaron su liga en alguna temporada dentro de esta muestra. Entonces tengo a los Bravos, Medias
Blancas, Ángeles, Indios, etcétera. Y lo mismo va con cualquiera de estos. Por lo que la Serie Mundial gana. Muéstrame todos los equipos de la muestra que ganaron la Serie Mundial en una de estas temporadas. Tan bastante cool. Ahora sé qué equipos ganaron la Serie Mundial al menos una vez en estas 21 temporadas, pero también podemos arrastrar en año como así, para ver qué equipos uno más de una vez y qué años particulares ganaron Así que valen sólo 11 veces en 95 Ángeles en 2002 Yankees vemos 15 años ganaron en 98. 2009 1999. Si quiero ordenar estos, ¿qué va? Herramientas diseño informe diseño esquema esquema, que dividirá esas etiquetas de rollo. Hazlo un poco más legible también. Ahora un año consorte de más pequeño a más grande en lugar de clasificarse por porcentaje de victoria y ahora es un poco más fácil de leer. Por lo que los Yankees ganaron cinco veces en 96 98 99 2000 y 2009. Los Medias Rojas ganaron en tres ocasiones la Serie Mundial. Marlins dos veces. Gigantes tres veces, Cardenales Dos veces. Cosas bastante cool que podemos extraer simplemente realmente con algunas herramientas de clasificación
y filtrado de tabla pivot muy simples . Pero ahora volvamos a nuestra vista original de tendencia porcentual de victorias. Entonces voy a despejar equipo y D filtro o sin filtrar, ese mundo serio. Winfield. Y en lugar de mostrar tanto victorias como pérdidas junto con el porcentaje de victorias, realmente sólo necesita porcentaje de victoria en este punto. Entonces cuando saque victorias y derrotas y como hablamos, el porcentaje de victorias siempre será del 50%. Cuando estás mirando a todos los equipos enrollados, yo soy Entonces ¿por qué no seguimos adelante y seleccionamos un equipo específico cuando buscamos aquí a los Gigantes ? ¿ Filtrar sólo en los Gigantes de San Francisco? Y ahora lo que me gustaría hacer es agregar un gráfico pivotante para ayudar a visualizar esta tendencia y también potencialmente analizar algunas correlaciones interesantes también. Entonces, ya que tengo mi vista simple configurada aquí, puedo seguir adelante insertar un gráfico pivotante directamente desde mi opción de herramientas de tabla dinámica y el gráfico de columnas va a funcionar bien. Entonces inserta esa columna, grafica mi pestaña analizada. No quiero estos botones de campo que solo puedan esparcir esto fuera de él. Entonces esto hace un buen trabajo mostrando a los Gigantes ganan porcentaje. Cómo es tendencia año tras año para que podamos ver dónde han tenido temporadas fuertes, donde han tenido temporadas débiles donde tal vez están reconstruyendo al equipo, pero un bonito tipo de visualización simple pero clara aquí. Pero quiero ir un nivel más profundo y quiero que entienda lo que podría estar correlacionado con el
porcentaje de victoria . Entonces una cosa que viene a la mente y podrías tomar un enfoque diferente, pero en este caso, ¿por qué no nos fijamos en el promedio de bateo del equipo porque el promedio de bateo es un
indicador bastante bueno de habilidad de golpear, que debería, en teoría, traducirse a correr, anotado y por lo tanto vientos. Por lo que voy a seleccionar un campo de mi tabla pivotante, entrar en mis herramientas, campos, ítems y conjuntos y agregar un nuevo campo calculado para un V, G o promedio, y que se definirá como hits o H dividido por en murciélagos o un B. Así que eso es promedio de bateo. Cuando presione bien, verá que ese nuevo campo se ha agregado tanto a mi tabla como a mi tabla dinámica. Y para visualizar esto un poco más eficazmente, lo que voy a hacer es en realidad cambiar esto de una columna agrupada, cual por defecto fue diferente tipo de gráfico. Voy a ir hasta aquí hasta Combo, y quiero que mi porcentaje de victorias se muestre como columnas tal, pero quiero que el promedio se muestre como gráfico de líneas en el eje secundario. Estoy eligiendo el acceso secundario para poder editar cada uno de estos Siri y cada uno de estos ejes de forma independiente. Entonces presiona bien. Ahora estamos mostrando nuestras dos métricas o dos medidas a la vez, y ya podemos ver una correlación bastante agradable entre promedio de bateo y porcentaje de victoria . Ahora sabemos que la correlación no necesariamente prueba la causalidad, pero en este caso podemos estar bastante seguros. Al menos de manera direccional, ese rendimiento de golpear es generalmente un sólido motor de porcentaje de victoria. Entonces ahora hagamos solo unos cuantos ajustes de formato aquí en formato de clic derecho. El dato Siri es este caso en lugar de naranja. Yo como que quiero una bonita línea azul oscuro ahí, y prefiero la línea lisa para poder marcar esa casilla abajo. Y aquí tengo mi leyenda que me muestra cuáles Siri estoy visualizando como columnas en las que Siri's estoy visualizando como líneas. Entonces mi último paso, ya
sabes, solo para agregarle un poco más de interactividad es realmente insertar una rebanadora también para la tuya y de esa manera. Ahora mismo, estoy mirando sólo a los Gigantes, que se puede ver si nos desplazamos hacia abajo es el único elemento seleccionado. Pero de esa manera puedes seleccionar cualquier equipo y obtener una idea de cómo se ve la correlación y cómo el porcentaje de victorias y el promedio de bateo han tendido para cualquier equipo individual. Es posible que hayas notado que estos marcadores aparecieron formateados en naranja. Para ser honesto, no
tengo ni idea de por qué sucedió eso. Pero si tienes curiosidad o si no te gusta, te
mostraré cómo cambiarlas. Se puede volver a los datos de formato. Siri's entra en tu relleno en línea. Ahí está esta pestaña de marcador en la que puedes hacer clic en Perforar en tus opciones de marcador, y solo un poco de forma automática agregó estos raros círculos naranjas. Entonces voy a decir, Hagamos marcadores construidos con estos pequeños diamantes, talla seis y qué? Llénalos de blanco y déles un borde sólido en este azul oscuro. Y yo cerraría esto. Ahí vamos. Eso se ve un poco mejor que el naranja aleatorio, y te conformas con todo lo demás, algo así como tú eliges. Se puede poner la etiqueta con leyenda por abajo, pero obviamente las opciones de formato son esencialmente interminables aquí. Entonces ahí tienes, obviamente una tonelada de direcciones que podríamos haber ido con este conjunto de datos, pero ojalá este enfoque te dé algunas ideas y alguna inspiración para empezar a explorar estos datos por tu cuenta
7. Clasificaciones de Burrito de San Diego: está bien, Este próximo caso estudia otro de mis favoritos, San Diego Burrito Ratings. Por lo que Data dijo que tenemos aquí incluye valoraciones de burrito y reseñas de Yelp de 65 restaurantes
diferentes de San Diego en 2016. Por lo que 237 observaciones. Muestra relativamente pequeña, pero algún tipo realmente interesante de dimensiones y medidas inusuales
con las que tenemos que trabajar . En este caso, las dimensiones incluyen la ubicación, el nombre del burrito, la recomendación de fecha, quién fue el revisor y cualquier nota adicional. Y luego por las medidas. Tenemos la calificación Yelp, el costo del burrito, y luego todo un montón de 0 a 5 valoraciones a lo largo de diferentes elementos del propio burrito, por lo que esa temperatura de tortilla que rellenos que cumplen volumen, uniformidad, sinergia de salsa, lo que sea que eso signifique en calidad de envoltura. Entonces vamos a cubrir unos cuantos conceptos diferentes aquí. Uno de los más importantes es calcular usando columnas Count, uno de los conceptos desencadenantes que es realmente importante para seguir practicando. Practicaremos valores resumidos por mostrar valores como rango y luego haremos algunos trucos de formato
condicionales realmente bonitos para dar vida a estos datos. Así que sigamos adelante a sobresalir y saltemos bien. Entonces si tienes abierto tu cuaderno de estudio de caso de tabla pivotante, vamos a estar trabajando con la pestaña de calificaciones de burrito de San Diego. Y solo controlemos A para agarrar todo. Inserta una nueva tabla pivotante cayendo en una nueva hoja de trabajo que podemos nombrar burrito pivot, haga clic
derecho cambiar el color de la pestaña a verde claro. Y estamos bien para ir eso mirando a través de los campos y el conjunto de datos
con el que tenemos que trabajar aquí. Yo soy como hablamos de que podrías notar que es un poco diferente a algunos de los otros conjuntos de datos con los que hemos trabajado hasta este punto en este caso, todas nuestras medidas, con la excepción de costar nuestras calificaciones en una escala de 0 a 5. Por lo que esto nos dará una muy buena oportunidad de practicar algunas técnicas, como promedios ponderados y el uso de columnas de conteo en son campos calculados. Entonces, iniciemos este estudio de caso con un análisis de puntajes por burrito para que pueda tomar burrito, arrastrarlo aquí mismo a mis etiquetas de rol, y luego cualquier puntaje que nos importe, podemos meter en valores. Entonces tal vez no necesitamos los ocho. A lo mejor sólo nos importan algunas de estas como las temperaturas de la tortilla. Importante. Por supuesto, necesitas buenos sentimientos y luego vámonos. Sinergia suena como una buena calificación. Por lo que tenemos cuatro calificaciones diferentes tortilla, empastes
temp y sinergia. Pero ahora puedes ver que están evaluando como sumas, lo cual realmente no tiene mucho sentido aquí. Ya sabes, si tuviéramos que calificaciones para un burrito dado para un campo como Tortilla y una calificación era un 41 era un cinco. Queremos evaluar eso como un promedio de 4.5, no la suma de cuatro y cinco, que son un nueve en este caso. Por lo que ha cambiado las opciones de valores resumidos de alguna media del dedo del pie para cada uno de estos valores
resumen por promedio, y luego también lo haremos. Se ha cambiado el formato numérico para que sea un poco más legible aquí, así que solo voy a hacer un número con dos puntos decimales en lugar de un formato general. Ahí vamos. Ahora tenemos nuestras cuatro puntuaciones medias a través de thes para elementos individuales o componentes
del burrito, y ahora quiero crear algún tipo de puntuación media agregada única basada en estas calificaciones de cuatro componentes. Entonces, ¿por qué no jugamos un poquito con esto? Entra en son campos calculados y llámalo promedio Puntuación total. Ahora crees que podría tener sentido aquí en cuanto a la fórmula, podría ser abrir un paréntesis y decir Muy bien, nuestro puntaje total promedio debe ser nuestro puntaje de tortilla,
más nuestro puntaje de temp,
más nuestro puntaje de rellenos y finalmente nuestra puntuación de sinergia. Cierra la división entre paréntesis por cuatro para tomar el promedio y pulsa OK, ahora, cuando hagas esto y baje en este puntaje total promedio, verás que algunos tienen sentido. Al igual que para 619 burrito original. Simplemente selecciono los cuatro puntajes de componentes aquí abajo. Puedo ver los promedios 375 que es correcto aquí en la columna F para la adicción, el promedio tres, que es correcto. Pero entonces tengo unos como dos y uno donde el promedio debería ser 363 y estoy recibiendo 10.88 y ABA daba que debería ser 355 estoy recibiendo 24.88 ahora. Quiero que te tomes un minuto y pausas este video y solo pienses exactamente por qué se está
llevando a cabo esto . Entonces, ¿por qué estoy obteniendo puntuaciones que son mayores a cinco cuando realmente, todos
deberían promediar el promedio de estos cuatro campos. Así que tómate un minuto, piénsalo, y luego presiona play cuando creas que tienes una respuesta, acuerdo, para
que podamos averiguarlo. Esto vuelve al concepto de campo calculado, donde cualquier medida o métrica incluida en una columna calculada tiene que ser evaluada como hijo . Entonces en este momento, porque están calculados, Field está tomando estos cuatro puntajes rellenos temp de tortilla y sinergia. Es tomar las algunas de esas cuatro anotaciones y luego dividirse por cuatro. Entonces, en los casos en que sólo hay una calificación para un burrito dado, la suma será la misma que la media, por lo que un campo calculado nos dará exactamente lo que necesitamos. El problema radica en los burritos que tienen más de una revisión, y en realidad podemos ver qué está pasando ahí tirando en otra instancia de burrito, que es una dimensión y evaluándolo como cuenta en nuestro campo de valores. Y ahora, ya que eso es contar el número de veces que este burrito apareció en el conjunto de datos y porque su conjunto de datos está en el nivel de revisión. Sabemos que esto indica el número de revisiones para cada etiqueta de rol en particular. Por lo que los casos que sí evaluaron correctamente son todos los casos en los que sólo hay una revisión. En otras palabras, no
hay diferencia entre evaluar un algunos versus un promedio donde sí vemos que los puntajes totales promedio
incorrectos son para cualquier burrito que tenga más de una revisión, como dos y uno ABA daba l pasado o California y así sucesivamente y así sucesivamente. Y una cosa que es un poco interesante señalar aquí es que si tomamos, solo
voy a despejar la lista de campos de tabla pivote por un segundo para conseguir algo más de espacio. Si tomamos el puntaje total promedio de campo son calculados y lo dividimos por esta
columna de conteo , el número de revisiones, entonces de repente estamos obteniendo los números correctos. Entonces dos y uno, por instancia,
el promedio para ser 363 363 Para California, el promedio debe ser 365 365 Así que dividiendo el campo calculado que habíamos creado, que se construye sobre sumas y dividiendo ese total promedio anotar por el conteo de reseñas, terminamos con el número correcto que buscamos. Entonces si recuerdas, no
podemos agregar un operador llamado Conde de Burrito en campo son calculados porque de nuevo
necesitamos sumas no podemos usar conteos. Entonces como un trabajo alrededor, lo que necesitamos es un campo o columna en nuestros datos cuyo hijo nos da estos mismos valores. Y como Conde de burrito simplemente está contando Rose en su conjunto de datos, podemos simplemente crear una nueva columna y asignar cada fila con un valor de uno para que luego podamos unos arriba, acuerdo a estas etiquetas reales, para dar nosotros la misma respuesta. Entonces sé que suena un poco más complicado de lo que realmente es, pero déjame mostrarte a lo que me refiero. Ir a su burrito calificaciones datos crudos. Voy a insertar una nueva columna aquí, y lo llamamos número de revisiones porque sus datos están en el nivel de revisión y solo tipo de una. Aplícalo hacia abajo. Entonces cada fila es igual a una. En este caso, vuelta en nuestro pivote burrito, puede cambiar tu fuente de datos, y como está mirando solo ser a través de Q, podría simplemente cambiar ese B a un A o podría arrastrar manualmente la selección y presionar. OK, ahora, si abro mi campo esto otra vez verás este número de campos de revisión ya está disponible para mí. Entonces cuando arrastré eso justo al lado de contar de burrito, la parte del número de revisiones ahora es exactamente igual al recuento de la
dimensión burrito . Y otra vez porque ambos de estos campos o simplemente contando los de Rose simplemente haciéndolo usando una ización de verano de
conteo. El otro que acabamos de crear, lo
está haciendo a través de una cierta ización veraniega. Y este es el que ahora puedo usar como parte de mi campo calculado. Entonces saquemos burrito contado. Ya que ya no necesitamos eso y mantenemos un ojo en este puntaje total promedio en el que vamos a entrar son campo calculado, vamos a editar esta definición y básicamente lo que vamos a hacer es tomar esta
definición exacta como hemos lo calculó aquí y divida todo eso por el número de revisiones que nos darán la respuesta correcta. Entonces primero lo primero rodea todo esto con otro conjunto de paréntesis y luego divide eso por el número de críticas, presiona OK y mira cómo eso se actualiza para darnos el número exacto que estamos buscando. Entonces ahora dos y uno, 363363 California debería ser 365365 Y ahí tienes. Ahora tenemos la versión correcta del puntaje total promedio, que logramos mediante el uso de columna contable en nuestros datos brutos para permitirnos calcular ese campo correctamente. Así que sigamos adelante y arrastremos ese puntaje total promedio justo por delante después de una serie de críticas. Y ahora que tenemos especie de ese puntaje total promedio como nuestro único KP I principal o métrica clave aquí, realmente
quiero llamar la atención sobre esta columna como mi punto de comparación entre las etiquetas de fila . Entonces una forma de hacerlo es tirar en una segunda instancia de puntaje total promedio. Y en lugar de mostrar esto sin cálculo, mostremos estos valores como un rango de grande a pequeño, donde mi campo base es el nombre del burrito. Ahora puedo ver el puntaje total promedio en forma de rango fuera de esta lista completa. Por lo que dos y uno se ubica en el puesto 17 de esta lista en cuanto a la puntuación total promedio. Arizona se ubica en el cuarto lugar con el marcador para 13 California solo el queso se ubica en el tercer lugar y así sucesivamente y así sucesivamente. Y ahora ya sabes, Como siempre, tengo estos campos disponibles para opciones de clasificación para que pueda ordenar descendente por ese puntaje
total promedio . Y ahora mis burritos clasificados número uno están listados en la parte superior Colima Spirito veg fuera ambos con anotaciones de cinco. Y luego en el otro extremo del espectro, mis burritos de menor calificación como Camp A On y Chicken Asada, que obtuvieron puntajes de 25 y 238 se enumeran aquí abajo en la parte inferior de la lista. Por lo que esta columna de rango definitivamente es útil. En realidad podemos nombrarlo rango sólo para que sea un poco más claro. Pero ahora realmente tratemos de darle vida a este dato usando algún formato condicional. Por lo que quiero mover el campo de rango hacia arriba frente a mi puntuación total. Voy a controlar turno para seleccionar esta columna Total Score, y no quiero el total general. Entonces yendo a diseñar apaga los grandes totales solo turnos clics, y he seleccionado toda la columna para la puntuación total promedio Voy a entrar en mi menú de inicio , formato
condicional y en una escala de color aquí de verde a rojo, porque quiero que mis puntuaciones altas formateen verde y mis puntuaciones bajas formateen rojo. Y a medida que te desplazas hacia abajo, puedes ver especie de estos tonos de naranja y rojo a medida que las puntuaciones empeoran, sube a amarillos y verdes a medida que las puntuaciones mejoran. Y ahora, para llevar esta visualización un paso más allá, voy a seleccionar una de mis columnas de puntuación de componente y aplicar una regla de celda de resaltado. Y en este caso, todo lo que intento hacer. Es una especie de agregar un poco más de visión en qué puntajes de componentes están impulsando el puntaje total
promedio para un burrito dado. Entonces en lugar de hacer escalas de color para todas estas columnas también, lo que podría ponerse un poco ocupado, solo
voy a hacer algunos aspectos destacados. Reglas celulares. Por lo que en los casos en que la puntuación sea mayor a cuatro, resaltemos estos verdes. Ya que esa es una puntuación realmente fuerte, y luego, con la misma selección en su lugar, hagamos una regla de menos que resaltar para cualquier puntaje que sea menor a tres, que es una puntuación bastante mala con un relleno rojo y rojo oscuro textos. Todo lo demás se quedará sin formato. Entonces ahora para esa columna es mucho más fácil ver puntajes inusualmente altos o inusualmente
bajos y un poco pro tip aquí. En lugar de pasar por ese mismo proceso tres veces más, puedo tomar toda esta columna y usar un pequeño consejo en el menú de inicio llamado Format Painter. Si hago doble clic en esa herramienta ahora, he copiado este formato exacto, pesar de que es una especie de formato dinámico, condicional. Y solo puedo hacer clic en la primera celda de cada una de estas columnas y aplicar la misma lógica de
formato condicional a cada una de ellas. Y luego una vez que haya terminado, solo presiona de nuevo ese botón y ahí lo tienes. Entonces ahora tengo un visual realmente agradable que me muestra la puntuación general clasificada así como puntuaciones de componentes
individuales, ya
sabes, destacando valores inusualmente altos o bajos. Por lo que algunas tendencias interesantes aquí, ya
sabes, nuestras puntuaciones más altas tienden a ir bien en todo el tablero. Tenemos algunos casos en los que un burrito como Deborah Special lo hizo muy bien en cuanto temperatura, pero no tan bien en cuanto a llenado y viceversa. Entonces hay toneladas de historias diferentes que ahora puedes empezar a extraer simplemente
mirando las visualizaciones aquí ahora, ajuste
final que quiero hacer aquí que quizá hayas notado es que muchos de estos burritos solo tener una sola revisión, que no necesariamente es justa cuando lo estamos comparando con otros burritos que podrían tener tres o seis o 13 o incluso 60 comentarios. Entonces lo que recomendaría hacer para hacer esto un poco más de una vista de manzanas a manzanas sería seguir adelante y aplicar un filtro de valor a la columna de Burritos y elegir
mayor que para que podamos decir, Let's Onley miremos datos o burritos, donde el número de revisiones es mayor a una prensa. De acuerdo, ahora recortamos nuestra vista a más manzanas a manzanas comparación entre todos los burritos que tienen al menos dos calificaciones. Y luego, por
supuesto, puedes tipo de aplicar cualquier otra herramienta de formato que quieras. Podrías centrar lo usado para que sea un poco más legible. Podrías cambiar los encabezados de columna, sea lo que elijas. Pero lo que es genial de las tablas pivote es que ahora que he puesto todo ese trabajo para crear esta vista y plantilla realmente cool. Entonces puedo simplemente intercambiar etiquetas de rollo, agregar o cortar o datos de diferentes maneras sin tener que recrear ninguna de estas reglas de
formato. Entonces, por ejemplo, esto es lo que harás en tus deberes. Puedo sacar burrito,
y en lugar de calificarlo por burrito, puedo calificar por ubicación. Y lo único que necesita cambiar aquí es la columna Rank. Ya que eso usa un padre de burrito. Ahora mi campo base es la ubicación, y ahí lo tenemos para poder pasar por el mismo proceso que consorte mis ubicaciones, descendiendo por el puntaje total promedio. Y ahí lo tienes. Entonces al igual que habíamos analizado los burritos en un principio, ahora aplicamos muy rápidamente el mismo tipo de análisis a localizaciones. Entonces herramientas
realmente, realmente poderosas aquí para extraer toneladas de perspicacia de estos datos, y eso termina su caso Study. Kickoff. Ahora te toca ensuciarte las manos.
8. Condiciones de tiempo diario: todo bien. Nuestro próximo caso estudia las condiciones climáticas diarias, y el conjunto de datos ahí tiene que trabajar. Aquí están los datos meteorológicos diarios de Boston, Massachusetts, de enero a diciembre de 2016. Por lo que en realidad tenemos poco menos de un año completo de datos 363 filas con las que trabajar. Consiguió dimensiones como la fecha y el tipo de condiciones. Lluvia clara, nieve y luego algunas medidas para captar la temperatura máxima para el día. El promedio de temperatura, temperatura
mínima, velocidad
máxima del viento y cualquier precipitación en cuanto a pulgadas. Por lo que los conceptos que cubrirán en este lanzamiento incluyen ordenar y filtrar gráficos pivote , agrupar
fechas y calcular con conteo. Entonces vamos a saltar justo dentro. Por lo que en tu cuaderno de estudio de caso de tabla pivotante, adelante y haz clic en la pestaña Condiciones meteorológicas diarias y con cualquiera de estos valores seleccionado, solo tienes que pulsar control. A. Agarrar todo el rango de datos. Insertar pivote en una nueva hoja de trabajo. Llamaremos a este uno pivote meteorológico y formatearemos ese color tabulador con el verde claro, y ahí vamos. Entonces tenemos nuestro punto de partida, y ahora para dar inicio a las cosas, me gustaría empezar por mirar las temperaturas medias medias medias para ver cómo las cosas tienden día día y en el transcurso de meses y temporadas. Por lo que empieza jalando en fecha. Notarás que auto los agrupa dos meses. Eso está bien. Voy a empezar tirando meses en el campo de filtros para que solo esté buscando de día para empezar. Y luego, en términos de valores, tomemos la temperatura media cayendo en valores. Notaré que es por defecto al sol, que debido a que sus datos están a nivel diario. Eso en realidad nos daría la respuesta correcta, pero no queremos. Algunas de estas temperaturas ya que miramos los datos por mes o por año o en cualquier
nivel agregado o vista por lo que podemos hacer es cambiar la ización del verano a promedio. Como se puede ver, es exactamente
lo mismo que algunos a nivel diario, pero ahora se estará tomando el promedio cuando enrollemos esto dos meses o años o cualquier
otra cosa . Entonces con media temperatura aquí para ayudarme tipo de visualizar cómo se mueven las cosas, puedo seleccionar toda esta columna, en realidad deshacerme de los grandes totales y simplemente seleccionar los datos en sí, y desde aquí, lo que quiero hacer es insertar una escala de color, así que entraré en casa formatos condicionales escalas de color y me gusta este rojo a azul porque azul se siente frío y el calor de Redfield. Voy a elegir esta escala de colores específicamente y ya a medida que te
desplazas, puedes ver una especie de cómo cambia de azul a rojo y luego de vuelta al azul mientras nos dirigimos hacia la primavera, el
verano, verano, otoño y el invierno. Entonces eso es bastante cool por sí mismo, igual que un consejo de visualización. Obviamente, también
puedo aplicar opciones de clasificación aquí, así que OK, descendiendo por temp media me dirá el día más caluroso del año, que fue el 12 de agosto. Con una temperatura promedio de 86 grados. Podría desplazarme hasta el fondo o simplemente cambiar mis opciones de clasificación a ascendente para ver el estado más frío del año,
que fue el Día de San Valentín 2016 realmente frío. El promedio de la temp fue de cero grados, que en realidad es 11 grados más frío. Después el segundo día más frío, que fue el 15. Y a medida que te desplazas, es algo genial ver estas escalas de color cambiando gradualmente a medida que cambian los valores. Por lo que ahí vas. Esa es una buena manera de especie de explorar temperaturas a nivel diario. Pero ahora saquemos la fecha, metamos el mes en el cuadro. Entonces esto nos cuenta la misma historia exacta aquí, justo a un nivel más alto de granularidad. Por lo que ahora podemos ver la tendencia de nivel superior por mes, donde enero y febrero son
muy, muy frío empieza a calentarse en abril, mayo, junio, y luego se tiene julio y agosto, que son los más calientes y luego comienza a enfriarse de nuevo en el otoño rumbo a diciembre . Por lo que esta escala de color no realmente bonito trabajo visualizando los cambios mensuales de temperatura . Pero también me gustaría agregar un gráfico de líneas para ayudar a visualizar esta tendencia o mostrarla aún más claramente. Entonces vamos a pivote herramientas de tabla, gráfico de
pivote y vamos a seleccionar línea aquí y presionar OK, no
puedo deshacerme de algunas de estas características. No necesitas los botones de campo. Realmente no necesito una leyenda aquí, ya que sólo estamos mirando a uno de Siri y para el título, podríamos llamarlo temp promedio por meses. Haz que ese título sea audaz, esparcirlo un poco y ahí tienes y sabes que sólo en cuanto al formato es una especie de nit exigente. Pero en un caso como este, lo que me gustaría hacer es agregar etiquetas de datos y luego formatear un poco. Yo quiero mostrarlos en la parte superior así por encima de los puntos de datos, y quiero cambiar un poco el formato numérica, convertirlo en un número con tal vez un punto decimal, y entonces podemos cerrar eso. Entonces eso solo ayuda a especie de ver un poco más la tendencia y también dar formato a los datos que Siri va va a llenar y alinear. A mí me gusta usar una línea suave. Aquí está bien otra vez. Eso es sólo una especie de mi preferencia. No tienes que hacer nada de eso si no te gusta, pero ahí tienes. Ahora vemos un tipo muy claro de golpe hacia arriba en junio,
julio, agosto, agosto, y luego un retroceso de estudio hacia abajo octubre, noviembre, diciembre. Por lo que a partir de aquí, también
podríamos seguir adelante y añadir una línea de tiempo. Ya que sí tenemos un campo de fecha y dejamos caer una línea de tiempo en también, esencialmente, lo que esto va a hacer es que nos va a dar una especie de herramienta que podemos usar para recortar esta vista Así que momento estamos mirando los 12 meses. Pero si sólo nos importa la primera mitad del año,
por ejemplo, por ejemplo, podemos usar la línea de tiempo para especie de solo esta vista,ya
sabes, ya
sabes, tal vez solo nos preocupemos por la segunda mitad del año. Ahí lo tienes. Y se podía ver tanto la tabla como el gráfico actualizando en consecuencia. Tan bonita pequeña herramienta de visualización que podemos mirar del dedo del pie, analizar las temperaturas por mes. Obviamente, podríamos hacer exactamente lo mismo con Max temp min temp, precipitación de velocidad
del viento. Por lo que recomendaría explorar esto y tal vez probar visualizaciones similares con diferentes campos. Entonces lo siguiente que quiero demostrar justo en este lanzamiento de estudio de caso es que ahora que
tengo un buen sentido de las temperaturas medias por mes ahora, tengo curiosidad por cavar un poco más profundamente en los Temps Max y Min, y específicamente, quiero mirar la temperatura que se extiende por día. Entonces quiero ver qué días vieron las mayores diferencias entre la temp Max y la
temp de menta . Entonces, en lugar de manipular este pivote y arruinar mi gráfico, en realidad, solo voy a seleccionar toda esa tabla pivotante, copiarla y luego pegarla aquí abajo. Así preservó el trabajo que hemos hecho. Tan solo tienes una segunda instancia de la tabla pivotante con la que trabajar aquí abajo. Entonces sigamos adelante y saquemos meses. Es volver al nivel diario ahora, arrastre en la temperatura mínima y la temperatura máxima otra vez. Ya que estoy a nivel diario, realmente no importa qué estival use Modi, pero porque sé que estaré enrollando estos hasta mensualmente. En algún momento, voy a cambiar estos de sumas del dedo del pie promedios. Y quiero crear un campo calculado para darme ese spread del que estaba hablando. Voy a entrar en herramientas de tabla pivotante, campos, elementos y conjuntos. Llamémoslo tentaciones esparcirse. Y realmente, lo único que tiene sentido aquí es tomar Max menos. Los hombres presionan OK, y esto parece estar evaluando adecuadamente, al
menos a nivel diario. Por lo que para cualquier día o fecha dado, puedo ver el spread. En el 14 de febrero el mínimo fue negativo. Nueve. El máximo fue de 12 que se extiende de 21 15 spread fue de 4 a 35 que era un temp 31 y puedo usar este campo de dispersión temporal ahora como opción de clasificación. Entonces, ¿qué tipo descendente por dispersión temporal para ver qué día en nuestra muestra mostró la mayor diferencia entre temperaturas altas y bajas. Resulta que fue el 9 de marzo, donde tuvo una temperatura baja de 40 y un máximo de 77 lo que equivale a la propagación de 37 grados. Entonces esto es genial, y esto es útil. Pero ahora, digamos que quiero ver este promedio de temps repartidos por mes en lugar de por día. Ya sabes, para ver si hay un spread mayor para ciertas temporadas o si hay alguna tendencia que podría ser interesante ver a nivel mensual. Entonces cambiemos fecha con meses, y aquí vemos que nuestras temps se propagaron de repente es totalmente loco. Por lo que estamos viendo propagación de intentos de 433 grados en enero, y para este punto deberías empezar a tener una idea de por qué ocurre este tipo de error, y es porque temps spread es un campo calculado. Los campos calculados necesitan usar sumas para cualquier campo de entrada que vaya a la fórmula, y en este caso, los campos de entrada son temperatura mínima y temperatura máxima. Entonces lo que de manera realista quiero es una fórmula que diga, Resta la temperatura mínima media de la temperatura máxima media y dame esa diferencia. Entonces en este caso, realmente, lo que quiero es 39.484 menos 25.516 Así que esto realmente debería estar evaluando a 13.97 en lugar de 4 33 Pero como hablamos, no
podemos entrar en son campo calculado va a intentar spread. Y no podemos decir Dame la temp max media menos la carpa min promedio. Eso simplemente no funciona. Entonces lo que necesitamos es una columna auxiliar o nueva columna y su conjunto de datos real que tome el conteo y evaluado como un hijo que podamos usar en nuestra fórmula. Entonces sigamos adelante en las condiciones meteorológicas diarias. Sólo tienes que añadir una nueva columna después de un lo llamaremos un número de días. Dado que nuestros datos están a nivel diario, sólo
va a tomar un valor de uno. Verlo por defecto a un formato de fecha, así que vamos a cambiar eso a un número. Aplícalo hacia abajo. Entonces ahora tenemos un valor de uno en cada fila para esta nueva columna de número de días de vuelta en mi pivote, puedes seguir adelante y refrescar ese pivote. Hay número de días, y ahora lo que tenemos que hacer es convertir esa fórmula que habíamos escrito a partir de algunos de max temp y mint temp, que es la predeterminada. La única opción. Tenemos que cambiar esto al máximo promedio en los hombres promedio. Entonces para evaluar la temperatura máxima promedio, ¿puedo tomar el temperamento max la suma de Max temp y dividida por el número de días? Eso es lo mismo es tomar la carpa max promedio. Voy a hacer lo mismo aquí con paréntesis de apertura de temp mínimo dividido por el número de días y cerrarlo. Entonces ahora esto se traduce en la temperatura máxima promedio menos la temperatura promedio de los hombres. A la prensa. OK, ahí tienes. Por lo que 13.967 podría simplemente agregar ese cálculo manual en un cheque spot de nuevo, arrastrarlo hacia abajo y está justo en el punto. Entonces esa nueva fórmula que habíamos escrito usando esa columna de conteo en nuestros datos brutos hizo exactamente lo que queríamos hacer. Y desde aquí simplemente podemos formarnos en esto ya sabes, una manera más amigable de usar. Podemos incluso sacar a los hombres y a Max si elegimos. Pero ahora, como siempre, debilitar tipo basado en ese nuevo campo, decir bien en general, febrero al menos en 2016 fue el año con el mayor diferencial de temperatura promedio de poco más de 18 grados. Auras Diciembre tuvo la menor dispersión de temperatura promedio de 13.36 Así que tipo de interesante . No estoy seguro de que haya mucha tendencia aquí. Parece que los meses de verano como junio julio 10 de agosto. Para mostrar los diferenciales de temperatura bastante grandes aquí en los meses más fríos tienden a mostrar más pequeños. Hola, Febrero parece una excepción a esa regla. Um, todos modos, sólo otro ángulo interesante que podemos utilizar para analizar estos datos meteorológicos. Entonces ahí está nuestro lanzamiento para el estudio diario de caso meteorológico. Dale una oportunidad a las preguntas de la tarea y avísame si tienes alguna pregunta
9. Spartan Race de Facebook: todo bien. Nuestro próximo caso estudia uno divertido, y en realidad está mirando los datos de Facebook de la raza espartana. Entonces en este caso, tenemos 393 filas de datos que en realidad muestran las publicaciones de Facebook de la carrera espartana de agosto a octubre de 2016. Ahora tenemos unas dimensiones realmente interesantes con las que trabajar. Aquí tenemos el nombre de la página, que es raza espartana, la fecha del post copia del Post, un enlace al propio post. Qué tipo de post era, si se trataba de una foto de estado de video o de un evento, la hora en que se publicó el post y la hora del día. Por lo que
tarde, tarde, mañana, etcétera. Y en cuanto a métricas, tienes tus métricas estándar de compromiso en redes sociales como acciones, reacciones, likes y comentarios. Por lo que cubriremos algunos conceptos diferentes en este caso práctico. Haremos una revisión rápida de los valores de show, ya que con el porcentaje de columna, entraremos en campos calculados y luego haremos algunas demos con
cálculos ligeramente más avanzados utilizando columnas de recuento en los datos brutos. Así que sigamos adelante para sobresalir y bucear justo en ya en el cuaderno de trabajo de caso de la tabla de pivote , Adelante y encuentra la pestaña Post de la carrera espartana. Y con cualquiera de estas métricas o celdas seleccionadas, solo presiona control. A. Para agarrar todos esos datos,
vamos a insertar una tabla de pivote en una nueva hoja de trabajo y llamémosle Spartan Pivot y
cuando lo haga, haga clic y simplemente cambie ese color de tabulación a un bonito verde claro. Y ahora, antes de sumergirnos, solo finjamos que somos el analista de marketing de Spartan Race, y nos han encomendado comprender mejor las razas espartanas, rendimiento de
Facebook y la estrategia de publicación. Ahora bien, si ese es el caso de las métricas que realmente me importan en cuanto a los ojos de KP, aquí están estas métricas de compromiso como acciones, reacciones, gustos y comentarios. Y como tenemos unas dimensiones realmente bonitas, interesantes con las que trabajar, lo que me gustaría saber es, cómo difieren esas métricas de engagement o tasas de engagement por post copiadora, tipo de
puesto o carreras de Wen Spartan publicando ciertas cosas así que ojalá pueda usar tablas pivote y tablas pivote para extraer algunas ideas interesantes de sus datos y usar esas para ayudar a raza
espartana a optimizar su estrategia de Facebook. Entonces con eso, empecemos de nivel bastante alto y simplemente usemos cuenta de la ización del verano para tener una idea de cómo las publicaciones de carreras espartanas tienden a distribuirse de diferentes maneras. Entonces si busco cuenta, puedo tirar de cualquiera de estas dimensiones aquí. Usemos Post copy, por ejemplo, y cuando la arrastre a valores, ya que no es una medida numérica, se
va por defecto, cuenta de la cual simplemente cuenta la rosa. Entonces 393 ahí está el número total de filas en mi conjunto de datos, que es exactamente lo que quiero. Ten en cuenta que podría tirar de cualquier cosa aquí fecha de post page, y obtendría el mismo conteo de métrica porque solo estamos contando a Rose aquí. Muy sencillo. Y ahora lo que puedo hacer con este conteo es entonces tirar otro campo en mis etiquetas viales para romper esa cuenta regresiva. Por lo tanto, empecemos con fotos de enlace de eventos tipo post, estado o video. Y lo que esto me dice es el número de veces que cada tipo de publicaciones apareció en nuestro conjunto de datos para que podamos ordenarlas descendiendo por el conteo y ver que las publicaciones de video fueron las más comunes . Había 195 publicaciones específicas en video en esta muestra, seguidas de foto en 1 56 y luego realmente no muchos eventos de enlace o publicaciones de estado en absoluto. Y una cosa que podemos hacer que es muy simple. Tan solo para visualizar esta tendencia un poco mejor en un gráfico pivotante, arroja algo así como un pastel o un donut aquí también. Tan solo para visualizar estos números que estamos viendo en nuestra tabla. Y yo sólo voy a deshacerme de estos botones de campo y voy a dar click derecho a Siri. Yo quiero hacer el todo un poco más pequeño, preferencia
totalmente personal. Entonces para ustedes, yo estaba cambiando el título de este número de puestos. Desde que recuerden, el conteo es sólo contando. Las filas y filas representan publicaciones individuales. Entonces, esencialmente, lo que estamos viendo aquí es el número de publicaciones que caen en cada cubo de
etiquetas de una fila . Entonces puedo ver aquí que el video representa apenas la mitad de los posts, y la foto constituye un gran porcentaje que realmente no son muchos de estos otros tipos de post aquí. Y ahora que tengo este gráfico de donuts en su lugar, sólo
puedo intercambiar en diferentes dimensiones sin tener que reconstruir mi gráfico. Entonces, por ejemplo, tiremos del tipo de poste hacia fuera y jalemos la hora del día dentro y otra vez ordenemos estos descendentes por el conteo. Cuando lo hacemos, podemos ver que más de la mitad de los puestos se publicaron por la noche, seguido por la noche y luego por la tarde. Y realmente no muchos posts por la mañana en absoluto. Incluso se puede profundizar más de lo que esto podría tomar tiempo del día fuera, en realidad hacer nuestro de post y ordenar los que descienden por el conteo. Y aquí se puede ver que las 23 PM tipo de madrugada es un momento bastante común para publicar. Y entonces sé que es un poco difícil de leer con. Todas estas etiquetas en realidad no recomendarían usar donuts o tartas cuando tengas este dinero recortes de tus datos. Pero sólo Teoh ilustra lo que quiero decir. Tienes tiempos de volumen muy bajos a las 2347 a. M, lo cual tiene perfecto sentido. Entonces ahora que sabemos tipo de distribución de los puestos, sabemos cuándo la carrera espartana tiende a publicar con mayor frecuencia, y qué tipos de publicaciones tienden a ser más comunes ahora, como analista, el siguiente nivel de perspicacia que necesito para llegar es cómo las tasas de compromiso se descomponen en realidad de acuerdo a estas diferentes dimensiones. Por lo que realmente quiero empezar con el tipo de post. Entonces sigamos adelante y saquemos nuestro de poste de aquí. Puedes deshacerte de nuestro gráfico de rosquillas, y podemos simplemente tirar del tipo de post de nuevo a nuestras etiquetas de rol tipo de donde empezamos. Y ahora, ya que queremos empezar a mirar el compromiso real, vamos a tirar de algunos de esos campos. Ambas acciones, reacciones, gustos y comentarios. Te darás cuenta de que las acciones no cumplieron con la cuenta. Eso es probable porque hay al menos una fila en blanco en la columna. Por lo que mientras esté al tanto de que no es gran cosa, podríamos simplemente cambiar el modo de ización de verano a un algunos y luego reacciones, gustos y comentarios todos evaluados a algunos. Entonces esos están todos listos ahora. Vamos a seguir adelante y cambiar el formato numérico para agregar un separador de miles ahí, en realidad, solo para que sea un poco más legible. En realidad no tienes que hacer esto, pero como que me gusta mantener todo consistente y pulido tanto como sea posible. Entonces ahí vamos ahora. Esto es interesante. Tengo una especie de estas métricas de cuatro componentes, pero realmente quiero que una métrica me dé compromisos totales. Y como los gustos son un subconjunto de reacciones, realmente aquí sólo
hay tres componentes que me importan las acciones, las reacciones y los comentarios. Entonces sigamos adelante en herramientas, campos, ítems y conjuntos crear un campo calculado llamado Compromisos totales. Y la fórmula es una simple como tomar las acciones, más las reacciones más los comentarios. Whoops, más los comentarios. Y ahí vamos. Estamos bien para irnos. Por lo que hay compromisos totales. Y justo al bate, podemos ver que las fotos o segunda línea aquí tienden a generar una tonelada de compromisos totales, específicamente muchas reacciones y likes Los videos de Where también generan una gran cantidad de
compromisos totales . Conducen más acciones y comentarios en general. Por lo que ya empiezan a surgir algunas tendencias interesantes aquí. Pero una cosa a recordar es que este es puro volumen que estamos viendo las sumas , y está agregado a través de publicaciones. Por lo que realmente no es una comparación justa sin tener en cuenta el número real de publicaciones que caen en cada categoría, que estaban capturando aquí y la columna B. Entonces,
por ejemplo, por ejemplo, porque las publicaciones de enlace solo condujo 9000 compromisos totales. No necesariamente significa que haya menores intérpretes que las fotos o los videos, porque solo hay 31 publicaciones que cayeron en esa categoría, comparación con 156 para foto en 195 para video. Entonces, ¿qué sería un más apropiado más manzanas a las manzanas? Medida del desempeño o compromiso relativo son compromisos por puesto. Entonces lo que eso significa es que necesitamos columna contable que podamos utilizar en nuestra fórmula de
campo calculada . Ya que no podemos tomar nuestro cálculo total de compromiso y dividirnos por el recuento de post copy, eso sería exactamente lo que quisiéramos hacer. Pero desafortunadamente, estamos limitados a Lee a usar la suma de un campo dado para que no podamos dividirnos por el recuento de otra
cosa. Por lo que hemos practicado esto un par de veces. Debería ser una especie de convertirse en segunda naturaleza a estas alturas. Podemos saltar de nuevo a nuestros datos brutos. Simplemente inserta una nueva columna aquí. Lo llamaremos número de publicaciones. Ya que su fecha es a nivel de puesto, dijo que igual dedo uno. Aplícalo hacia abajo. Tan solo asegúrate de que fue todo el camino hasta el fondo. Dulce y volver a nuestro pivote y refrescar. Ahora, una cosa a gritar, verás que nuestra columna de compromiso total se rompió todo. Tiene ese error de nombre ahora. Um, a veces esto sucede. A veces no lo hace cuando sucede, sólo significa que se lanza un error de referencia después de que has refrescado un pivote para que podamos entrar en una fórmula total de compromisos y ver que perdió la referencia a esos campos, probablemente porque esas columnas cambiaron a medida que agregué mi nuevo número de columna Post en los datos brutos. Entonces no es gran cosa. Simplemente podemos redefinir este campo al igual que teníamos antes, como acciones más reacciones más comentarios. Entonces solo una cabeza arriba. A veces eso sucede. Otras veces no lo hace. No estoy seguro de por qué. Sólo sucede a veces, pero es una solución bastante fácil de hacer. Por lo que ahora que tenemos nuestra columna de número de publicaciones aquí, podemos comparar eso contra Conteo de Post Copy y confirmar que los algunos sí nos dan los mismos valores que el conteo. Por lo que este algún campo es el que podemos usar en nuestro cálculo. Puede sacar el conteo de copia posterior, y ahora es cabeza de vuelta en los campos, artículos y sets. Vamos a crear un nuevo campo calculado llamado compromisos por publicación, y eso simplemente va a igualar esa sensación de compromiso total que habíamos calculado dividido por esa nueva columna que acabamos de crear llamada Número de Mensajes y Prensa. OK, es formato esto a un número. Realmente no necesito ningún punto decimal aquí y ahora tenemos compromisos por posts que factores en el número de publicaciones, y nos da la cantidad promedio de compromiso para cada uno de estos cubos. Entonces ahora cuando ordenamos por esa nueva columna compromisos por post ahora tenemos una especie de medida más precisa, precisa,
más realista del compromiso relativo. Por lo que para
las publicaciones fotográficas, el post promedio genera 945 compromisos video en Lee 7 34 y entonces realmente sí vemos el mismo tipo de publicaciones de bajo volumen también infravaloran en términos de compromisos por puesto. Entonces ese es un hallazgo interesante, ya
sabes, en una perspicacia que podría tener en cuenta, que tiene mucho sentido. Y, ya
sabes, también ayuda a validar por qué estamos viendo tanta atención dada a las publicaciones fotográficas y de video porque, como podemos ver aquí tienden a generar una cantidad de engagement considerablemente mayor que otros tipos de publicaciones. No lo es. Podemos continuar este análisis tal vez sacando el tipo de poste y la hora del día en y clasificando la hora del día por compromisos por puesto. Ahora vemos que la mañana Onley tenía alrededor de 16 posts en la muestra, nuestro post por la mañana. Pero entre esos 16 los compromisos para post fue realmente, realmente fuertes. 909 que es superior al promedio para la tarde,
tarde en la noche o noche. Si queremos perforar aún más profundo, debilitar, tomar post copy arrastrado que en su rol secundario Aable cambiador diseño informe esquema de diseño Y ahora podemos ver qué mensajes reales condujo. Tan fuerte desempeño de thes son los 16 puestos que cayeron en ese cubo matutino. Y si los ordenamos a nivel de postes, descendiendo por compromisos por post ahora podemos ver lo correcto deshacerse de mi lista de campo solo para que
sea un poco más visible. Ahora esencialmente estamos clasificando nuestros posts por compromisos por puesto, que a este nivel es exactamente lo mismo que los compromisos totales, y podemos ver que este post, que es un post de transformación espartana, realmente superó frente a los otros capturaron 2500 compromisos totales, lo que realmente ayudó a levantar el dedo del pie el promedio general a la hora del nivel del día. Así que realmente interesante perspicacia. Una vez que perforas hasta el nivel real de los puestos y luego incluso podrías volver a entrar en tu lista de
campo, podrías tirar de la hora del día outs. Ahora estamos viendo todos los posts individuales en nuestra muestra, ordenados por compromisos por post solo para ver qué tipo de carrozas hasta lo más alto de nuestra lista. Entonces tenemos este post copy que dice que no somos 100% positivos que esté realizando full push up blah, bla, bla. Si realmente traemos enlace también, en realidad
podemos copiar ese enlace y pegarlo en un navegador para ver qué era Post en este caso. Era un oso polar haciendo Burpees. Por lo que ahí lo tenemos. Ese es nuestro lanzamiento a la carrera espartana Facebook Data caso práctico muchas
maneras realmente interesantes de profundizar en estos datos, y realmente sólo empezamos a rayar la superficie aquí. Así que adelante, explora estos datos, juega con ellos, prueba los ejercicios de la tarea y dame una oportunidad. Si tienes alguna duda
10. Envoltura y próximos pasos: Está bien. Enhorabuena. Lo lograste hasta el final del curso. Muy bien hecho. Espero que hayas aprendido algunas cosas nuevas. Espero que hayas recogido algunos consejos y trucos y herramientas en el camino. Me divertí mucho enseñando esto. Espero que te hayas sentido lo mismo de aprenderlo y solo quieras cubrir algún recurso rápido es y próximos pasos para ayudarte a decidir a dónde ir desde aquí. Entonces Número uno, si buscas convertirte en una estrella de rock de Excel absoluta, recomiendo completar la pila de análisis completa con mis otros dos cursos. Got Advanced Excel fórmulas y funciones. Tengo datos viz con gráficos y gráficos de Excel, ambos un muy completo, muy completo. Si puedes pasar por los tres, entonces serás un experto certificado en Excel y estrella del rock. Así que echa un vistazo a esos a continuación. Aquí te dejamos algunos de los siguientes recursos es si necesitas algunas preguntas de soporte adicional. El sitio web de soporte dot office dot com es realmente útil, especialmente con las cosas básicas como la sintaxis de fórmula. También puedes ir allí a checar Office 3 65 el cual recomiendo mucho. Básicamente, es un servicio basado en suscripción alrededor de 15 dólares al mes. Te dará acceso a todos los productos de oficina más recientes en tiempo real a medida que salgan . Así que de nuevo, recomiendo encarecidamente Office 3 65 Next up Stack Overflow es un sitio
realmente útil, muy buena forma para preguntas más avanzadas o preguntas específicas del proyecto. Y luego finalmente, Power Query y Power bi I. Es un libro de Rob Kali. Puedes comprarlo en Amazon, y para aquellos de ustedes que no conocen Power Query y Power pivot Power Bi I thes aire algunas y para aquellos de ustedes que no conocen Power Query y Power pivot Power Bi I thes aire algunas
herramientas y capacidades
realmente poderosas que Microsoft ha estado empezando a construir en excel
, herramientas y capacidades
realmente poderosas que Microsoft ha estado empezando a construir en excel especialmente en los últimos años. Y abrieron todo un nuevo mundo de capacidades de modelado de datos y análisis de datos que no se
puede hacer con las fórmulas celulares tradicionales. Tablas de pivote. Entonces si quieres llevar tus habilidades de analítica y B I a un nivel completamente diferente, echa un vistazo a ese libro. A ver de qué se trata todo. Muy recomendable comenzar por ahí y luego durar pero no menos importante, ya
sabes que las calificaciones de los simulacros y las revisiones son lo que mantiene vivos cursos como este. Entonces por favor, por favor avísame lo que piensas. Me encantaría saber de ti. Por último pero no menos importante, una final. Enorme. Gracias. Ustedes son los mejores. Gracias por elegir este curso. Gracias por atravesarlo todo el camino hasta el final. ¿ En serio? Apreciar que se tomen el tiempo deben estar orgullosos de lo que han logrado. Y espero verlos en el próximo.