Visualisation de données et conception de tableaux de bord pour des applications professionnelles | Mark Chen | Skillshare

Vitesse de lecture


1.0x


  • 0.5x
  • 0.75x
  • 1 x (normale)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Visualisation de données et conception de tableaux de bord pour des applications professionnelles

teacher avatar Mark Chen, Data Analytics Professional

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

    • 1.

      Introduction

      10:00

    • 2.

      Section 1 : Comparaisons

      10:27

    • 3.

      Section 2 : Distributions

      9:46

    • 4.

      Section 3 : Relations

      6:52

    • 5.

      Section 4 : Compositions

      10:54

    • 6.

      Section 5 : Contexte, embrayage, couleur

      9:18

    • 7.

      Conclusion

      2:00

  • --
  • Niveau débutant
  • Niveau intermédiaire
  • Niveau avancé
  • Tous niveaux

Généré par la communauté

Le niveau est déterminé par l'opinion majoritaire des apprenants qui ont évalué ce cours. La recommandation de l'enseignant est affichée jusqu'à ce qu'au moins 5 réponses d'apprenants soient collectées.

512

apprenants

3

projets

À propos de ce cours

Ce cours couvrira les concepts fondamentaux de la visualisation des données en mettant l'accent sur les applications dans le monde des affaires. Nous nous concentrerons sur la façon de sélectionner la meilleure façon de visualiser un ensemble de données afin de communiquer efficacement et de manière objective les informations commerciales à notre public. À la fin du cours, vous comprendrez comment construire des tableaux de bord ciblés sur les entreprises qui peuvent être appliqués à n'importe quel logiciel.

Contrairement à la plupart des autres cours sur SkillShare, celui-ci n'est pas conçu pour être un « how-to » pour l'utilisation d'outils tels que Excel, Tableau, PowerBI, etc... Ce cours est destiné à couvrir ce que vous souhaitez accomplir lors de l'utilisation de ces outils, avant de regarder d'autres vidéos sur SkillShare qui vous apprennent à le fonctionnement de ces outils.

Rencontrez votre enseignant·e

Teacher Profile Image

Mark Chen

Data Analytics Professional

Enseignant·e

Mark currently leads the Supply Chain Data Analytics team at Mountain Equipment Coop, one of Canada's most iconic brands and largest retail suppliers of outdoor recreation gear and clothing. His team supports the analytics behind inventory management by designing interactive dashboards, automating repetitive day-to-day tasks, and encouraging a more precise and data driven framework for decision making.

Prior to joining MEC, Mark was a management consultant at the Boston Consulting Group, where he pursued his passion for structured problem solving (breaking a big problem into workable business questions), robust data analytics (turning the "data" into actionable "insights" to support executive decision making), and effective communications (delivering impactful recommendations cat... Voir le profil complet

Level: Intermediate

Notes attribuées au cours

Les attentes sont-elles satisfaites ?
    Dépassées !
  • 0%
  • Oui
  • 0%
  • En partie
  • 0%
  • Pas vraiment
  • 0%

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Introduction: Principes fondamentaux de la visualisation des données et conception de tableaux de bord pour les applications dans le contexte de l'entreprise. Une de ses marques et moi avons travaillé dans l'analyse de données depuis 20 ans. Initialement en tant que biochimiste, puis en tant que consultant en gestion, et actuellement en tant que gestionnaire d'analyse dans une entreprise de vente au détail. Maintenant, ces rôles peuvent sembler très différents, mais ce qu'ils ont en commun, c'est la nécessité de raconter des histoires, où mon rôle est de trouver le moyen le plus efficace, le plus objectif et le plus efficace de communiquer des informations d'affaires par la visualisation des données. Et qu'est-ce que je veux dire par là ? Eh bien, efficace signifie simplement que vous voulez aider votre public comprendre rapidement les principaux enseignements de votre analyse, que vous soyez là ou non pour leur expliquer. Maintenant, si vous êtes un présentateur fort, vous pouvez toujours trouver des moyens d'expliquer une analyse compliquée, mais en guidant votre public étape par étape. Mais à la fin de la journée, idéalement, votre tableau de bord ou votre diapositive doit toujours être conçu avec l'espoir qu'il doit également être un produit autonome qui peut être compris par l'utilisateur sans votre commentaire. Objectif signifie que vous voulez donner à votre public suffisamment de contexte pour lui permettre de tirer les bonnes conclusions avec un minimum de biais. Maintenant, vous pouvez parfois présenter délibérément vos données d'une manière qui souligne le point que vous essayez de transmettre. Mais idéalement, les données et le degré de confiance associés à ces données parlent d'eux-mêmes. Votre objectivité sera appréciée, en particulier par des auditoires avertis, et elle devrait vous aider à établir une confiance à long terme avec ce public. Au départ, j'ai créé ce cours spécifiquement pour ma propre équipe afin de m'assurer que tout le monde a le même niveau de connaissances de base nécessaire pour être inefficace conteur. Et puis j'ai ajouté quelques sujets supplémentaires que j'ai trouvés étaient points aveugles très courants pour les candidats que j'ai interviewés, mais qui n'ont pas embauché. Si vous avez réussi à réussir ce cours, mon objectif est non seulement de vous aider à réussir l'entrevue, mais aussi d'avoir les bons outils pour être un analyste de données ou un analyste d'affaires efficace et crédible. Fondamentalement, si vous avez le titre d'analyste, c'est ce que je m'attends à ce que vous sachiez un peu sur la façon dont ce cours est conçu. Il s'agit d'un cours de niveau intermédiaire et il suppose une connaissance de base des façons communes d'appliquer les données. Nous allons sauter directement dans les avantages et les pièges courants lorsque vous utilisez, par exemple, des graphiques à barres et des graphiques à secteurs et comment ils se comparent avec des options plus sophistiquées. Donc, l'attente est que vous êtes familier avec certaines de ces parcelles plus basiques, que je ne vais pas présenter en détail. Ce cours n'est pas non plus spécifique aux logiciels. Considérez le logiciel comme des outils et il y a déjà beaucoup de matériel là-bas. Et comment utiliser ces outils efficacement. Ce que nous allons aborder dans ce cours au lieu de cela sont les concepts fondamentaux de ce que vous voulez réaliser en utilisant ces outils. L' objectif est que ces concepts soient pertinents, quel que soit le logiciel que vous ou votre entreprise choisissiez d'utiliser. Enfin, tous les exemples de ce cours seront fortement axés sur les applications commerciales, les ventes, le marketing, la finance, la chaîne d'approvisionnement, etc. La visualisation des données est un sujet très large et bien couvert. Donc, naturellement, je ne veux pas créer encore un autre cours sur ce sujet. Et qu'est-ce que je veux en créer un qui soit si complet qu'il dure 100 heures. quoi je vais me concentrer, sur lequel je n'ai rencontré aucun autre cours, ce sont les cas d'utilisation les plus pertinents pour le monde des affaires. Pour une discussion plus générale sur la visualisation des données, je recommande des électrodes de Tamara Munzner. Qui sont disponibles sur YouTube. Elle a fait une plongée très approfondie sur ce sujet, en particulier en termes de visualisations plus pertinentes pour le milieu universitaire et la recherche scientifique. Si vous cherchez à vous inspirer par de superbes exemples de visualisation de données. Je suis un grand fan du site 538 de Nate Silver, qui est une statisticienne célèbre pour l'analyse des prévisions électorales. Et le capitaliste visuel, qui est un site web avec une tonne de belles infographies, dont chacune est comme une œuvre d'art. Et bien que je sois fier de mon travail et qu'il est amusant de rendre le groupe de travail quotidien, que ce soit un peu plus flashy. Dans un monde d'affaires en pleine évolution, ma principale priorité et mes attentes pour mon équipe, nous serons toujours d'aider nos chefs d'entreprise à prendre de meilleures décisions axées sur les données. Et ce sera mon objectif pour ce cours. Et je vous laisse le soin de vérifier ces deux exemples par vous-même pour embellir votre travail. Ce que ce cours couvrira. Dès le premier jour de votre nouveau travail d'analyste de données, vous avez été chargé de créer un tableau de bord pour prendre en charge une fonction métier particulière. Par où commencez-vous ? Eh bien, le point de départ de tout type d'analyse est de s'assurer que vous comprenez les questions commerciales auxquelles vous teniez de répondre. Et ce n'est pas une étape que vous pouvez ignorer ou faire disparaître. Il ne suffit pas non plus de demander à l'utilisateur ce qu'il veut parce qu'il y a un peu d'exploration et d'entrepreneuriat impliqué dans cette étape. Comme la célèbre citation de Henry Ford, si j'avais demandé aux gens ce qu'ils voulaient, ils m'auraient dit des chevaux plus rapides. Donc, vous voulez aller assez loin là-dessus et vous assurer que vous comprenez au moins deux choses. Premièrement, quel type d'actions avec l'utilisateur prend fonction des informations que vous étiez tableau de bord fournira. Cela vous indiquera, par exemple, le niveau de granularité dont vous avez besoin des données. Vous voulez également vous assurer de comprendre comment ces informations sont actuellement collectées afin de pouvoir, par exemple, évaluer si vous souhaitez utiliser ou non la même source de données ou s'il y a une meilleure source de données qui peut être utilisée. Ce sera la base de la façon dont vous concevez ce tableau de bord. Comment vous évaluez si un satisfait ou non aux exigences. Et cela vous aidera également plus tard avec la gestion du changement. Et la gestion du changement est une chose à laquelle je devais beaucoup penser quand j'étais consultant externe, mais quelque chose que je trouve est souvent ignoré lorsque vous étiez interne à l'entreprise. Juste parce que vous avez créé un tableau de bord vraiment génial, cela ne signifie pas qu'il va automatiquement obtenir une adoption généralisée. Vous devez toujours faire le nécessaire dans le marketing et démontrer à l'utilisateur comment cela les soutient dans leur prise de décision et pourquoi est-ce mieux que ce qu'ils utilisent actuellement ? Comprendre le numéro un vous permet de le faire. Une fois que vous êtes sûr d'avoir une bonne compréhension de la question commerciale, vous pouvez procéder à l'analyse des données et prototyper le tableau de bord, concentrant d'abord sur l'utilité, puis sur l'esthétique. Et la majeure partie de ce cours se concentrera sur le numéro deux, mais j'inclurai aussi du matériel bonus sur le numéro trois. Mais au-delà de ce que je viens de dire, je ne vais pas parler plus du numéro un, même si évidemment vous ne pouvez pas faire le numéro deux ou numéro trois sans réussir le numéro un. Et la seule raison en est parce que le fait d'être bon au numéro un est vraiment plus d'avoir vécu dans la pratique. Ce n'est pas vraiment quelque chose que je peux résumer discrètement sur quelques diapositives. Mais s'il y a de l'intérêt pour le numéro un, s'il vous plaît laissez-moi savoir et je vais faire un cours distinct sur ce sujet. Et enfin, quelques comtés que je tiens à reconnaître quand il s'agit de design de tableau de bord. Je ferai de mon mieux pour partager avec vous ce que je considère comme les meilleures pratiques. Mais il y a un certain niveau de subjectivité. Mon but est donc toujours de vous donner mon raisonnement derrière ces règles afin que vous puissiez prendre votre propre décision quant à savoir s'il faut ou non suivre ou ignorer ces règles. Et j'accepte cette idée que la plupart des règles peuvent être enfreintes. Mais avant de vous présenter pour enfreindre une règle, vous devez être en mesure d'opérer dans les limites de cette règle et vous devez bien comprendre la raison de cette règle. Deux est que la plupart de vos utilisateurs ne vont probablement pas se soucier de vous. Son attention aux détails. Ils ne savent probablement jamais que lorsque je conçois un tableau de bord, j'essaie probablement de 20 à 30 façons différentes de tracer un jeu de données et de prendre une décision sur laquelle l'une de ces méthodes fait le meilleur travail pour transmettre les informations d'affaires. Mais en tant que professionnels de l'analyse de données, nous devrions être fiers de notre travail. Et à coup sûr, en tant que manager, c'est quelque chose que je porte beaucoup d'attention à chaque fois que je regarde le travail de quelqu'un d'autre. Et enfin, pas tout ce qui doit être tracé. Même s'il s'agit d'un cours de visualisation de données, dans beaucoup de situations, une table simple peut en fait être la meilleure en termes de clarté et de simplicité. Et ce sont des situations que je soulignerai également plus tard dans la présentation. Ok, donc vous avez terminé numéro un et vous vous sentez confiant que vous avez compris les questions commerciales. Maintenant, vous êtes prêt à commencer à penser au numéro deux en termes de la façon dont vous voulez tracer ces données. La première chose que vous voulez faire est de réduire le type d'analyse que vous voulez réaliser. Par exemple, s'agit-il d'une comparaison d'une mesure particulière à travers une certaine dimension, comme une comparaison de nos revenus entre différentes régions, ou une comparaison des niveaux d'inventaire réels aujourd'hui par rapport à ce qui était budgétisé au début de l'année. Affichage de la forme d'une distribution pour quelque chose comme la taille de chaque catégorie de produits en fonction du nombre de produits qu'elle contient ou de l'âge de votre clientèle. Est-ce que cela montre la relation ou l'absence de relation entre deux ou plusieurs indicateurs et s'il y a ou non une cause et un effet implicites, par exemple, le spin marketing d'embauche génére-t-il des revenus plus élevés ? Et enfin, est-ce que cela montre les composantes individuelles d'un total plus important, comme combien de profit chaque mois contribue-t-il à notre bénéfice annuel total ? Ce que vous remarquerez peut-être, c'est qu'il y a un peu de chevauchement entre certaines de ces questions commerciales. Si vous regardez des données de séries chronologiques, par exemple, sur la rentabilité mensuelle de votre entreprise. Vous pouvez considérer cela comme une question de comparaison ou une question de composition. façon dont vous décidez finalement comment tracer ces données dépend vraiment de l'entreprise et de la taille que vous souhaitez transmettre. Donc, si vous voulez faire une déclaration comme notre mois le plus rentable est 5X, celui de notre mois le moins rentable que vous pourriez vouloir considérer les parcelles qui mettent en évidence cette comparaison. Cependant, si au lieu de cela vous voulez faire une déclaration comme 50% de notre bénéfice annuel provient de la période entre le Black Friday et Noël. Vous pouvez alors afficher ces données sous la forme d'une composition. Dans la section suivante, nous allons parler de comparaisons. 2. Section 1 : Comparaisons: Section 1, comparaisons. Quand il s'agit de faire des comparaisons, votre pain et votre beurre sera toujours des graphiques linéaires et des graphiques à barres. Probablement environ 70% de ce que vous utiliserez est l'un de ces deux. Les salles de repas seront toujours votre option par défaut pour toutes les données de séries chronologiques. Et ce que je veux dire par série temporelle, c'est que l'axe X traversant est une sorte de dimension temporelle. Et l'une des raisons pour lesquelles les graphiques linéaires sont si idéaux est qu'il n'y a que très peu d'encombrement, ce qui signifie qu'il y a très peu d'encre nécessaire pour transmettre toute la quantité d'informations. Par conséquent, vous pouvez ajuster beaucoup plus sur une seule page. Et en fait, ils sont très faciles à comprendre même pour un ions non techniques. Donc, cela devrait être capable de le lire et de l'interpréter sans votre aide. Les graphiques à barres seront votre graphique de choix lorsqu'il s'agit de comparer des variables discrètes. Et on parlera de ce que ça veut dire. Et comme le graphique linéaire, c'est aussi très facile à comprendre. Mais il y a un peu plus d'encombrement des graphiques en termes de couleur des barres. Cela signifie que vous ne pouvez pas ajuster autant de variables sur une seule page que sur le graphique linéaire. Jetons un coup d'oeil à quelques exemples. Dans ce cas, nous traçons le chiffre d'affaires par mois avec le chiffre d'affaires sur l'axe des y et les mois sur l'axe des x. Dans ce cas, nous pouvons utiliser soit un graphique linéaire, soit un graphique à barres. Mais ma préférence est toujours d'utiliser le graphique linéaire parce que vos yeux sont naturellement concentrés sur la partie du graphique qui compte réellement sont les marqueurs. Alors que dans le graphique à barres, vos yeux sont plus concentrés sur la couleur des barres, qui ne transmet aucune information supplémentaire au-delà de ce qui est transmis par la hauteur des barres. Donc, en d'autres termes, plus d'encombrement de graphique. Dans cet exemple suivant, nous comparons la même mesure de revenu, mais dans différentes régions géographiques. Et dans ce cas, nous ne pouvons pas utiliser le graphique linéaire car dans le graphique linéaire, les lignes entre les marqueurs impliquent une continuité. C' est donc seulement utile pour les variables continues, pas les variables discrètes, comme les états. Je veux dire, si vous avez tracé comme ça, votre public est toujours bon de comprendre ce que vous essayez de transmettre, mais techniquement, ce n'est pas correct d'utiliser un graphique linéaire lorsque la variable est une variable discrète. Une autre considération est le nombre de variables que vous voulez comparer sur un seul graphique. Donc si on augmente ça à deux graphiques, ils le sont tous les deux, ok. Vous pouvez toujours voir le modèle de la saisonnalité des revenus entre les deux graphiques. Mais quand vous augmentez ça à cinq, il devient un peu plus bondé. Et ici, le graphique linéaire a un avantage sur le graphique à barres. Dans ce graphique, vous pouvez voir que la première chose qui va attirer mon attention est le fait que la ligne verte est toujours au-dessus de la ligne rouge pour chaque mois, sauf pour le mois d'avril. Et maintenant, ce ne sont que des données synthétiques. Donc, je ne sais pas si c'est significatif et quelque chose que vous voulez appeler, mais c'est juste quelque chose qui est très clair pour le public quand ils regardent le graphique du haut. Et des détails comme celui-ci sont un peu plus obscurcis pour le graphique du bas. Maintenant, lorsque vous augmentez cela à 20 variables, les deux caractères semblent vraiment terribles. Vous devriez probablement penser à savoir si vous avez réellement besoin de comparer tous les 20 comme ceci, ou si vous pouvez trouver un meilleur moyen de le présenter. Mais dans le graphique linéaire, vous pouvez toujours essayer ce qui se passe. Mais c'est presque impossible pour le graphique à barres en dessous. C' est donc juste quelque chose à considérer lorsque vous essayez de choisir entre un graphique linéaire et un graphique à barres. Un dernier exemple est quand il s'agit de graphiques à barres, vous pouvez les utiliser verticalement ou horizontalement. La principale considération ici est simplement d'aider votre public à lire les étiquettes de l'axe plus facilement. Donc, si vous avez très peu de noms sur l'axe des x et qu'il est plus long que les étiquettes sur l'axe des y. Il peut être judicieux de le faire pivoter afin que votre public puisse le lire sans basculer le suivant. Ok, donc un peu d'étude de cas. Disons que vous soutenez un détaillant dans le domaine de l'électronique. Vous compilez quelques données de vente sur leur top pour les marques. Et il y a quatre catégories de produits. Et vous voulez créer un graphique qui les aide à comparer ces segments. Alors, comment ferais-tu ça ? Et en passant, c'est un exemple où la table est en fait assez bonne en termes de clarté et de simplicité. Donc, c'est certainement une option qui va avec pour cet exemple. Ok, eh bien, la première chose que vous devez décider est de savoir si c'est un résumé basé sur les catégories de produits et la couche sur le dessus de cela, les marques que les différentes couleurs. Ou pour le résumer comme des marques et faire des catégories de produits les couleurs. Et l'autre décision que vous devez prendre est de le garder absolu, pour mettre en évidence les différences réelles en dollars, orthonormaliser à un 100% afin de mettre en évidence les différences dans la composition. En réalité, vous allez parler à l'utilisateur et vous découvrirez lequel d'entre eux fournit les informations les plus utiles et les plus exploitables pour les décisions qu'il tente de prendre, ou s'il est nécessaire d'inclure les quatre ces parcelles si chacune d'entre elles fournit un aperçu nécessaire. Mais il y a aussi une autre option qui est d'utiliser un Char très large, également connu sous le nom de joyeux tableau médical. Il s'agit essentiellement d'un graphique 2D qui vous permet de mettre à la fois les dimensions de la marque et d'une catégorie de produit sur le même graphique. Et un autre avantage qu'il a est qu'il concentre l'attention du public sur le plus grand segment. Donc, dans ce cas, l'aperçu immédiat que je reçois est que les téléphones représentent la plus grande catégorie de produits. Et dans les téléphones, Apple domine avec une part de marché de 60%, tandis que les tablettes sont la plus petite catégorie de produits. Et au sein des tablettes, c'est un partage uniforme entre les quatre marques. Donc, ce graphique unique vous permet non seulement d' inclure toutes les informations des quatre graphiques précédents, mais il vous donne également la relation complète entre les marques et les catégories de produits, ce que vous n'obtenez pas lorsque vous les tracez séparément. La seule chose qui manque, c'est la valeur totale en dollars, les comparaisons absolues. Mais ce que font habituellement les gens, c'est d'inclure le montant total en dollars dans le titre ou la note de bas de page afin que le public puisse toujours avoir ce contexte s'il en a besoin. Voici un autre exemple d'un graphique très large, et cette fois sans aucune normalisation sur les deux axes. Ici, nous sommes en train de tracer les émissions de CO2 par habitant sur l'axe des Y. Et par habitant signifie juste par personne. Et nous avons la population totale de chaque pays sur l'axe des x. Et la lumière sous nos yeux va toujours être attirée par ce qui est le plus grand segment de la page qui prend le plus d'espace. Donc, dans ce cas, ce sont les émissions des États-Unis et de la Chine. Le principal à l'intérieur que je reçois est que la Chine est le plus grand producteur d'émissions de CO2 sur la base de la zone du graphique. Mais par habitant, c'est le milieu du peloton et il n'est pas aussi élevé que les autres pays développés, comme les États-Unis. Maintenant, si nous devions tracer ces données à l'aide d'un barplot régulier, vous avez le choix. Vous pouvez soit tracer le total des émissions, auquel cas la Chine apparaîtra comme le principal contributeur d'émissions. Ou vous pouvez tracer les émissions par habitant, auquel cas la Chine n'a pas l'air aussi mauvais que les autres pays. Et vous voudrez peut-être avoir ce choix si vous avez un ordre du jour à faire sur l'un de ces points ou l'autre. Mais cela remonte à mon commentaire précédent sur l'objectivité. Lorsque vous tracez les données à l'aide du graphique très large. Vous êtes en mesure de donner à votre public un contexte complet et de lui permettre de porter un jugement complet sur ce contexte plutôt que les orienter vers une vue ou une autre vue. Et j'aime vraiment cet exemple et comme mon seul exemple non-commercial et tout ce cours. Mais jetons un coup d'oeil à un exemple commercial réel. Donc, nous prenons le même graphique très large et nous tracons nos propres marges unitaires sur l'axe des y et les ventes unitaires sur les excès. Donc, c'est essentiellement la marge brute que nous générons par unité de produit que nous vendons. Et c'est combien d'unités avons-nous vendues ? Si vous avez des données comme celles-ci, vous avez trois façons différentes de les tracer et trois façons différentes de classer ces produits. Si vous tracez le total des ventes unitaires, vous aurez le produit i comme premier produit suivi du produit o. Si vous tracez la marge brute totale, vous aurez toujours le produit i comme premier, mais ensuite il est suivi par le produit Et la troisième voie, que je ne montre pas, si vous tracez la marge brute par unité, vous obtiendrez les produits dans le même ordre que ce graphique très large. Maintenant, chacune de ces places vous donne un aperçu légèrement différent et un classement légèrement différent des produits. Ou vous pouvez simplement montrer l'ensemble du contexte en faisant du graphique très large où les perspectives commerciales ou le produit que j'ai généré le plus grand nombre de marges brutes totales. Et il y est parvenu en vendant un très grand nombre d'unités. Ou le produit B a également généré une très grande marge brute. Et il a atteint cet objectif en prenant une marge très élevée par unité. Ok, donc juste pour résumer, des caractères très larges, ils sont essentiellement un graphique à barres sans espace entre les deux. Et les graphiques à barres légères, vous pouvez normaliser ou non normaliser l'axe. Vous avez deux ensembles d'acteurs, ce qui signifie que vous pouvez simultanément montrer deux dimensions, ce qui est un grand avantage car il vous permet de fournir plus de contacts au public et de réduire le biais qui vient de ne montrant qu'une de ces deux dimensions. Le seul inconvénient est que ce n'est pas très commun. De plus, donc les gens ne sont pas familiers avec ce graphique, pourrait ne pas être en mesure de l'interpréter très facilement ou très rapidement sans une aide et des explications de votre part pour s'orienter. Un autre exemple de comparaison que je viens d'inclure pour l'achèvement, mais c'est un que je ne suis pas un grand fan de et qui est des cartes radar, également connues sous le nom de graphiques en toile d'araignée. Ce que nous traçons ici, ce sont les résultats de satisfaction de la clientèle, qui comprennent certaines dimensions comme le prix, la qualité, sélection et où nous comparons ces deux résultats pour deux magasins situés à Boston. Et une chose que je n'aime pas à ce sujet est le fait que vos yeux doivent suivre un peu d'aller-retour pour lire ce graphique, surtout si vous comparez entre huit mesures différentes. Et cela semble aussi un peu bizarre si vous comparez à travers quatre métriques parce que l'informatique, parce que tout comme un carré, la seule chose que je n'aime pas à ce sujet, c'est que ça pourrait paraître bien. Nous avons les deux magasins sont très différents les uns des autres, donc il y a une très grande quantité de contraste, mais il semble un peu laid quand il y a beaucoup de chevauchement entre les magasins ou si vous avez beaucoup d'histoires différentes que vous essayez pour comparer, vous avez la possibilité de tracer chaque magasin séparément. Et encore une fois, pour moi, C'est bon si les magasins que vous comparez sont très différents les uns des autres, comme dans ce cas, je peux voir que Boston South, par exemple, a des scores très décents sur tout, surtout en termes de prix. Et je vois que Dorchester, en revanche, a de très faibles scores et tout sauf pour les services. En ce qui concerne les autres magasins, les charges radar ne fournissent pas de comparaisons très claires sans le public ait à faire beaucoup de travail à faire des allers et retours. C' est ça pour les comparaisons. Dans la prochaine section, nous allons parler des distributions. 3. Section 2 : Distributions: Section deux, distributions. Quand il s'agit de montrer la distribution que vos deux options de base vont être des histogrammes, des nuages de points, et comment vous choisissez entre eux comme se résume essentiellement à savoir si votre distribution est sur une seule dimension ou deux dimensions. Et les histogrammes sont une excellente option. Premièrement, il est généralement plus facile à lire par votre public et à, parce que vous faites essentiellement l'analyse des données avant de les tracer. Il n'est pas affecté par la taille de votre jeu de données. Maintenant, pensez à ce graphique linéaire que nous avions regardé où quand nous comparons deux lignes, c'est correct, mais ça devient compliqué très rapidement et nous en avons 20. Mais parce que vous faites ces serres, vous avez aussi quelques choix à faire, principalement en termes de définition de vos seaux. Scatterplots était également excellent en termes de facile à comprendre et d'avoir un encombrement minimal des cartes. Vous pouvez l'utiliser si vous essayez d'afficher une distribution sur deux dimensions. Mais les informations ne sont pas aussi claires que vous pouvez l'afficher pour un histogramme car vous ne définissez pas explicitement ce que sont ces compartiments. Une autre chose à surveiller, pour ces deux types de graphiques est les influences des valeurs aberrantes, qui ne peuvent pas être un pro ou un escroc en cas de nuage de points. Et je vais vous montrer ce que je veux dire par quelques exemples. Voici un exemple d'histogramme où nous comptons combien de nos clients tombent dans chacune de ces tranches d'âge de quatre ans. Et vous pouvez voir que nous avons environ 1000 clients dans la tranche d'âge la plus jeune de 15 à 19 ans, ce qui ramène jusqu'à 2500 clients dans la tranche d'âge de 40 à 44 ans. Ce que je veux dire par cette deuxième puce ici, c'est que même si nous collectons plus de données sur cet ensemble de données et que nous avons dix fois plus de clients à la complexité du graphique reste la même. Vous allez toujours avoir les mêmes seaux sauf si vous ajoutez un seau supplémentaire pour les moins de 15 ans sont ceux qui ont plus de 79 ans. Mais en général, la complexité du graphique n'est pas mise à l'échelle avec davantage de points de données, car nous faisons cette analyse récapitulative sur les données pour créer ces compartiments. Vous avez une décision à prendre en ce qui concerne si vous voulez la normaliser à 100 %, ce qui est très souvent fait puisque la plupart du temps, lorsque vous avez une question commerciale de distribution, vous y réfléchissez en termes de pourcentages. Et dans ce graphique, nous pouvons voir qu'environ 50% de nos clients ont entre 3254 ans et environ 8,5% de nos clients ont plus de 70 ans. Et voici un graphique différent où nous essayons de caractériser le nombre de nos bichettes et bichettes sont essentiellement des unités de stock, que vous pouvez considérer comme un produit unique. Et avons-nous actuellement combien de ces quantités en stock ? L' une des choses que vous devez penser est en termes de comment vous voulez définir les plages pour ces segments individuels, que j'ai appelé des compartiments. Dans la valeur par défaut, vous prenez le point de données le plus élevé que vous possédez dans cette plage et vous divisez uniformément entre les différents segments que vous pouvez ajuster sur le graphique. Mais ce que vous pouvez voir dans cet exemple est qu' un très petit nombre bide où nous avons vraiment, vraiment cacher le nombre d'unités, vraiment changer tout le reste dans un seul seau. Et ce n'est pas aussi utile parce que vous dites essentiellement 99% de vos fautes, vous auriez quelque part entre 0 et 500 unités à portée de main. Donc, ce que vous ne pouvez pas faire après avoir examiné les données réelles est de personnaliser les plages, les compartiments, pour permettre à l'audience de voir une image plus claire de la forme de cette distribution. Et vous n'avez pas vraiment besoin de faire chaque seau de la même taille. Ici, nous pouvons voir est qu'environ un tiers de nos asymétries, nous avons 0 unités à portée de main. Est-ce intentionnel ou est-ce qu'on fait un mauvais boulot de garder les choses en stock ? Je ne sais pas. Environ 45% de nos inclinaisons, nous avons entre une et 20 unités en main. Et c'est encore un gros segment. Vous pouvez envisager de diviser cela en segments plus petits pour afficher plus de détails. Et enfin, tous ces trucs sur la longue queue que nous avons vu dans le premier graphique, il y a environ 600 bichettes où nous détenons plus de 5 mille unités à portée de main. Et le graphique de droite est juste plus utile que celui de gauche car il fournit plus de granularité autour d'une partie du jeu de données qui compte réellement. Et ajuster la limite pour les segments est quelque chose que vous devez prendre une décision sur ce que vous essayez de rendre votre histogramme plus efficace et moins affecté par ce petit nombre de valeurs aberrantes. Passer aux nuages de points. nuages de points sont donc utilisés si votre distribution est sur deux dimensions différentes au lieu d'une seule. Et dans ce cas, nous traçons les ventes de dollars sur l'axe Y et les ventes unitaires sur l'axe X. Et fondamentalement, c'est combien d'argent nous avons gagné par rapport au nombre d'unités que nous vendons, où chaque cercle représente un produit ou une inclinaison. Donc, même si le nuage de points montre tout et l'un des inconvénients par rapport aux histogrammes est qu'il ne définit pas explicitement les segments. Donc, d'habitude, vous devez l'appeler dans votre description ou vous parlez point. Donc, dans ce cas, je dirais que la plupart des produits ont produit quelque part entre 0 et 4 millions de dollars en ventes. Et il y a deux valeurs aberrantes importantes qui produisent environ 18 millions de dollars. Et les produits sont vendus entre 0 à un 100 mille unités avec une alle majeure sont à 350 unités. Et une chose que je vais souligner en termes d'esthétique est que vous pouvez également rendre vos marqueurs non filtrés ou partiellement transparents afin que vous puissiez mieux afficher la densité sur un graphique bondé. Maintenant, tout comme les histogrammes, nuages de points sont fortement influencés par les valeurs aberrantes. Et je vais mettre ça comme un pro et un escroc envoie. Cela dépend vraiment de ces valeurs aberrantes ou non des choses significatives que vous voulez appeler. Donc ici, j'ai pris l'exemple précédent et je viens d'ajouter quelques points de données supplémentaires. Donc, à droite, il y a un produit qui a rapporté environ 11 millions de dollars en ventes et F a vendu environ 1.8 million en unités. Et c'est un jeu de données synthétique. Donc, je ne sais pas si ce produit et ce comportement sont importants ou non. Mais ce que vous pouvez voir, c'est qu'il a essentiellement tout écrasé dans ce coin et créé beaucoup d'espaces sur ce graphique. Maintenant, c'est génial si ce point de données est ce dont vous voulez parler, car c'est exactement là que les yeux de votre public vont naturellement être concentrés. Mais si ce n'est pas la chose la plus importante que vous voulez appeler, alors vous pouvez ignorer cette valeur aberrante et simplement en faire une note dans la note de bas de page afin que vous puissiez à la place zoomer, dans cette zone qui contient la plupart des données est en fait présent. Une dernière remarque sur les nuages de points est que l'autre décision que vous devez prendre est de savoir si oui, il est plus logique de faire deux histogrammes distincts si la relation entre les deux dimensions n'est pas si importante dans termes de votre connaissance de l'entreprise. Donc vous pourriez nous montrer séparément comme ça, en faisant deux histogrammes séparés. Et il pourrait être clair pour votre public de le comprendre. Mais ce que vous perdez, c'est cette relation entre les deux dimensions. Ok, que diriez-vous d'un exemple plus compliqué ? Supposons donc que vous souhaitiez comparer les 52 semaines de ventes hebdomadaires pour un ensemble différent de catégories de produits. Donc, dans ce cas pour les outils, ce que vous voyez est que vous avez 3252 semaines dans l'année où les ventes sont quelque part entre 0 et 200 000$ par semaine. Et les 20 autres semaines où les ventes totales se situent entre $200,400 mille. De même, vous pouvez faire le même histogramme pour les autres catégories de produits. Et c'est une façon de faire. Si vous avez seulement cinq catégories, vous pouvez faire ces cinq histogrammes individuels et simplement les mettre côte à côte. Mais vous pouvez imaginer que cela pourrait devenir un peu plus compliqué si vous avez beaucoup plus de catégories de produits que vous voulez comparer les unes aux autres. Une autre option consiste donc à résumer chaque catégorie de produits en termes de boxplot. Et c'est typiquement à quoi ressemble un combat de boss. Et c'est aussi parfois appelé une boîte et un moustache en fonction de la forme. Et c'est similaire à un histogramme. Vous pouvez essentiellement définir les segments, mais au lieu de le définir en fonction de votre propre jugement pour un boxplot, vous le définissez essentiellement en termes de quartiles. C' est donc le 25% inférieur de vos points de données. Il s'agit des 25 % suivants et des 25 % suivants, et il s'agit du 25 % le plus élevé de vos points de données globaux. Cette zone du milieu est appelée plage interquartile, qui contient 50 % de vos points de données au milieu, et la ligne définit la médiane. Maintenant, beaucoup de gens définissent également les extrémités de celui-ci, non pas comme le maximum et le minimum, mais comme le 95 et le cinq centile. Et cela aide essentiellement à rendre les moustaches pas aussi longtemps. Vous avez des valeurs aberrantes vraiment extrêmes. Alors, à quoi cela ressemblerait dans notre exemple précédent ? Eh bien, c'est un écran beaucoup plus compact qui permet de faire une comparaison côte à côte plus directe de plusieurs distributions. Et en termes de perspicacité immédiate, une fois que je me réorienterai en termes de lecture de la ferraille, je peux voir que les sacs à dos ont les ventes hebdomadaires médianes les plus élevées tout au long de l'année. Les outils sont la catégorie de produits la moins saisonnière est que ventes hebdomadaires se situent dans une gamme très étroite et constante. Eh bien, les skis ou la catégorie la plus saisonnière avec presque aucune vente pendant la moitié de l'année. Et enfin, pendant la haute saison, vêtements d'extérieur ont les ventes hebdomadaires les plus élevées de toutes les catégories. Maintenant, ce type d'intrigue est aimé par la communauté des statistiques et ils utilisent beaucoup. Il est idéal pour afficher plusieurs ensembles de distributions 1D. Et comme l'histogramme, vous effectuez également une analyse sur le jeu de données avant de l'appliquer. Cela signifie que la complexité à saisir ne s'adapte pas mesure que vous augmentez la taille de votre jeu de données. Le seul inconvénient est que ce n'est pas non une intrigue très courante en dehors de la communauté des statisticiens, ce qui signifie que vous pourriez avoir besoin de fournir un accompagnement et une explication pour vous assurer que votre public non technique comprenne un peu la des idées. C' est pour nos distributions. Et dans la prochaine section, nous allons parler des relations liées à l'arc composé. 4. Section 3 : Relations: Section 3, relations. Pour montrer les relations, nous allons revoir le nuage de points et il est informationnellement plus dense, le diagramme à bulles. Lorsque nous avons discuté des nuages de points et des tendances de l'affichage des distributions à deux dimensions. Nous avons dit que nous pouvons le remplacer par deux histogrammes distincts si la relation entre ces deux dimensions n'est pas si importante. Donc ici, dans ce cas, l'accent sera mis sur cette relation. Ainsi, les perspectives commerciales seront de savoir si une relation existe ou non. Et encore une fois, deux des grands avantages des parcelles de dispersion est que l'un, il est facile et compréhensible et 2D est un très haut rapport d'information à l'encre. Les graphiques à bulles sont identiques, sauf avec une dimension supplémentaire ajoutée en termes de taille des marqueurs. Plus encore si vous voulez vraiment l'entasser, mais il n'est pas recommandé d'échanger, c'est que les dimensions ajoutées ajoutent également une complexité supplémentaire que vous devrez gérer et décider si oui ou non la question de l' entreprise vraiment nécessiter qu'il y ait une complexité supplémentaire. Et le plus souvent, vous pouvez trouver des alternatives meilleures et plus claires à la communication. Dans cet exemple, nous traçons le nombre d'unités vendues par rapport au prix moyen, chaque marqueur représentant à nouveau une inclinaison ou un produit particulier. Et les êtres humains sont difficiles à reconnaître les modèles. Donc, lorsque vous affichez un diagramme comme celui-ci, et surtout si vous incluez une ligne de régression à travers elle, vous dites essentiellement non seulement qu'il y a une relation entre ces deux variables, mais vous impliquez également une relation causale. Maintenant, dans l'analyse du tourisme, la causalité n'est pas facile à prouver. Et donc généralement, quand il y a une relation de causalité potentielle avec les gens, c'est qu'ils ont tendance à utiliser leur intuition pour décider si cette causalité est plausible ou non. Donc, dans ce cas, vous dites soit que lorsque vous définissez un prix inférieur pour votre produit, vous êtes plus susceptible d'en vendre davantage. Ou si vous êtes en mesure de vendre un produit et en vrac, vous êtes en mesure d'offrir à vos clients finaux un prix plus compétitif. Ces deux scénarios semblent assez plausibles dans la vraie vie. Ainsi, vous pouvez montrer cette relation comme votre site d'homme d'affaires. Et vous pouvez également utiliser cette ligne de régression comme un moyen de modéliser cette relation, mais toujours avoir cette vérification intestinale pour vous assurer que cette relation est plausible. Un dernier point est que si vous utilisez le nuage de points, vous voulez généralement faire la variable indépendante B sur axe des x et la variable dépendante sur l'axe des y. Ce qui signifie que s'il y a une cause et un effet implicites, vous voulez que le coût soit sur l'axe des x et que l'effet soit sur l'axe des y. Voici un autre exemple où nous examinons la réactivité promotionnelle des différents clients en examinant la relation entre le pourcentage d'augmentation des ventes que nous réalisons avec chaque client par rapport au montant des promotions rabais que nous leur avons offert. Et en ce qui concerne ces clients, nous avons une cohorte bleue et une cohorte rouge qui semblent se comporter très différemment les uns des autres pour quelque raison que ce soit. Pour la couleur bleue, vous pouvez voir que lorsque vous augmentez votre remise de 0 à 40%, vous êtes en mesure d'atteindre et en moyenne, un ascenseur d'environ 160%. Alors que parmi les clients de la cohorte rouge, la portance globale est beaucoup plus faible et plus variée. Donc vous pourriez dire que les cohortes bleues semblaient être plus promotionnelles, vraiment sensibles. Et la guerre froide rouge. Et en passant, toutes les données que j'utilise dans les exemples de ce cours, nos données synthétiques, ce signifie que je les ai traitées à partir de zéro ou que j'ai pris des données de mon entreprise et que je les ai modifiées pour les rendre anonymes. Dans la vraie vie, je n'ai jamais vu données de réactivité promotionnelle aussi claires que ce qui est montré ici. Pour passer aux graphiques à bulles, voici un exemple où nous évaluons les marques en fonction de leur prix et de leur niveau d'innovation, ce à quoi vous pourriez penser si vous travaillez dans le merchandising. Ainsi, chaque cercle est une marque et la taille du cercle représente maintenant la taille de la marque en termes de ventes globales. Donc, en comparant l'exemple précédent, cela intègre maintenant une troisième variable continue comme la taille des marqueurs. Et ce que cela fait, c'est qu'il nous permet de faire des observations comme celle-ci, que la majorité des ventes sont générées par des produits à bas prix. Comme si vous divisez la marque entre la ligne médiane, il y a plus de cercles et de cercles plus grands sur la moitié inférieure par rapport à la moitié supérieure. En termes de relations, vous verrez qu'il y a aussi plus de bulles dans les deux carrés diagonaux que dans ces deux carrés. Ce qui signifie que les clients sont peut-être plus disposés à payer des prix plus élevés pour des produits plus innovants. Enfin, il y a une quatrième variable ici en termes de marques nord-américaines par rapport aux marques internationales. Et nous pouvons souligner ici que les marques internationales ont tendance à être les marques les plus chères et les plus innovantes, et elles sont toutes dans ce coin en haut à droite. Voici un autre exemple de diagramme à bulles juste pour montrer le fait que vous n'avez pas nécessairement besoin de faire des axes x et y les variables continues. Parfois, cela fonctionne assez bien aussi avec des variables discrètes. Celle-ci, nous examinons les raisons et les quantités de retours entre différentes catégories de produits. Maintenant, les retours deviennent une affaire plus importante pour beaucoup de détaillants à mesure qu'ils développent leur activité. Parce que les segments de communication électronique ont tendance à avoir un taux de rendement plus élevé que les achats en magasin. Il est donc important de comprendre les raisons de ces déclarations et de savoir si ces raisons peuvent être abordées. Donc, à partir de ce graphique, le focus de vos yeux sera naturellement vers deux grands cercles, ce qui est génial parce qu'ils représentent les zones les plus problématiques. Et ce qui ne peut pas être interprété, c'est que notre plus grande opportunité de réduire les rendements pourrait être introduite, améliorant ainsi les décisions d'ajustement de nos clients en matière de chaussures et de vêtements pour femmes. En outre, certains de nos clients trouvent également meilleurs prix ailleurs en ce qui concerne les skis et les instruments. Cela pourrait donc conduire à certaines décisions de tarification pour notre service marketing pour effectuer des ventes ou des promotions. Et peut-être qu'il y a aussi d'autres problèmes en ce qui concerne identification des produits parmi les vêtements de notre entrepôt où ils cueillent et emballent les produits de façon incorrecte. Et enfin, je suis allé en ligne, j'essaie de trouver l'exemple le plus ridicule de combien de dimensions vous pouvez tenir sur un seul graphique à bulles. Et c'est ce que j'ai trouvé. Il y a donc pour les variables continues et deux discrètes sur ce graphique unique. Et évidemment, ce n'est pas idéal. Et c'est seulement, ce seul genre de travaux parce qu'aucun des cercles ne se chevauche les uns avec les autres. Et la vraie question ici est le public a-t-il vraiment besoin de voir simultanément ces nombreuses variables ? Ou serait-il plus clair si vous divisez simplement les informations sur plusieurs parcelles ? Ainsi, même à l'ère du tableau et de Power BI, où vous avez la possibilité de présenter beaucoup d'informations à l' avance et permettre à l'utilisateur de cliquer et d'explorer vers le bas. Ce type de graphique n'est toujours pas recommandé. C' est si une relation. Dans la section suivante, nous allons parler de compositions. 5. Section 4 : Compositions: Section quatre compositions. Donc, pour les compositions, nous avons notre bon vieux graphique à secteurs et le graphique à barres empilées. Diagrammes à secteurs Obtenir beaucoup de haine, mais ils sont en fait assez bons en termes d'être facile à comprendre et il ya certainement efficace. Pour un résumé rapide, vous avez deux données est très simple. Je pense que la principale critique pour l'utilisation de graphiques est que lorsque vous avez beaucoup de segments différents de tailles différentes, vous ne pouvez pas vraiment dire leurs différences relatives très facilement par rapport à un graphique à barres simple. Néanmoins, vous voulez probablement éviter les graphiques à secteurs explosés en 3D car avoir quelque chose comme ça dans votre part va probablement diminuer votre crédibilité au sein de la communauté analytique. Les graphiques à barres empilées sont une autre base courante, encore une fois, principalement parce qu'ils sont faciles à comprendre, mais il y a certainement beaucoup d' options plus sophistiquées disponibles pour cette section aussi, que nous allons couvrir. Premier exemple. Nous sommes donc en train de tracer la répartition entre les ventes à prix régulier et les ventes à prix réduit. Et nous en avons fait un graphique à barres empilées et nous l'avons normalisé à un pourcentage de sorte que nous puissions nous concentrer davantage sur les différences de composition et comment cela change au fil des ans. Mais ce faisant, nous laissons de côté beaucoup de contexte pour ce qui est de la façon dont les recettes réelles changent au cours de ces années. Ce qui signifie qu'il y a deux scénarios potentiels qui ont mis en garde des réponses très différentes. Une fois qu'une flèche pourrait être que nos ventes totales ont été relativement stables au cours des dix dernières années. Et une part de plus en plus importante de nos ventes totales passe des ventes régulières aux ventes promotionnelles. Et une situation comme celle-ci, ce qui serait un peu inquiétant parce que cela signifie que nos promotions ne génèrent pas de ventes incrémentielles. Ils cannibalisent simplement nos ventes régulières. Cependant, il peut aussi s'agir d'un autre scénario où nos cellules régulières restent stables et que nous augmentons réellement la croissance incrémentielle de nos ventes totales en raison de la croissance des promotions. Donc deux scénarios très différents en dessous. Et nous ne pouvons pas vraiment dire lequel est lequel lorsque nous normalisons l'intrigue 200% dans le graphique à barres de pile normalisée initiale. Voici donc un autre exemple. Donc, disons que vous êtes en charge de l'expérience client et que vous leur envoyez périodiquement des enquêtes sur la façon dont ils classent leur satisfaction sur cette échelle de un à dix. Une mesure très courante que les magasins de détail aiment suivre est quelque chose appelé Net Promoter Score, où vous prenez la différence entre votre pourcentage de promoteurs et votre pourcentage de détracteurs et ce qu'il vous reste est généralement interprété comme la probabilité pour vos clients actuels de recommander vos produits ou vos services à d'autres personnes. Maintenant, comme dans l'exemple précédent, où vous calculez une métrique récapitulative et tracez cela, ce que vous faites vraiment, c'est que vous optimisez pour la simplicité, mais vous échangez un peu plus de ce contexte. Donc, dans ce cas, vous prenez les scores NPS pour ces huit magasins étiquetés par leurs noms de ville et vous obtenez ce classement. Et chaque fois que vous avez ce classement métrique unique, le graphique est toujours très propre et très facile à comprendre. Le meilleur est Fort Worth et le pire est Los Angeles. Mais il pourrait y avoir quelques détails qui sont cachés derrière cette simplicité. Donc, si vous regardez la ventilation de chaque composant est, ce que vous pourriez voir, c'est que Philly et New York sont un peu aberrants. Le magasin juste pour quelque raison que ce soit, il est très polarisant. Il a en fait le plus grand nombre de détracteurs, mais il a aussi un très grand nombre de promoteurs. Donc, il serait intéressant de creuser là-dedans et comprendre pourquoi est-ce un magasin aussi polarisé. Et à l'inverse, New York n'a pas vraiment autant de détracteurs, mais la plupart des gens sont assez neutres et ils ont un très, très faible nombre de promoteurs pour équilibrer que les trackers. Donc, encore une fois, il sera intéressant de comprendre largement. Donc, si votre objectif est de comprendre la cause profonde des détracteurs, alors le score global NPS pourrait ne pas être la meilleure mesure sur laquelle vous pouvez vous concentrer parce que vous ne voulez pas que votre nombre de promoteurs cache votre nombre de détracteurs parce que c' est le nombre de tracteurs qui sont les plus exploitables pour votre public, pour cette décision d'affaires particulière. Donc, ce que vous pouvez faire à la place est de tracer les composants individuels dans un graphique à barres empilées. Mais vous pouvez mettre davantage l'accent sur les détracteurs par un, en les rendant par une métrique négative distincte des deux autres valeurs. Et deux en classant les magasins en fonction de cette métrique. Donc dans ce cas, vous pourriez finir par avoir un magasin de New York au milieu de la meute dans le magasin Philly au fond du peloton. Si vous les classez en fonction du score des détracteurs. Vous pouvez également superposer ce score MPS en superposant le score NPS comme marqueurs de cercle. Ex exemple, nous parlons de ce qu'un graphique diagrammes. Ainsi, les diagrammes Waterford sont une autre option pour montrer les composants individuels d'un total. Dans ce cas, nous montrons le chiffre d'affaires mensuel et la façon dont ils s'additionnent au chiffre d'affaires annuel total. Un avantage de cette parcelle est que pour chaque mois, vous pouvez également voir le total cumulé de tous les mois précédents. Mais le compromis ici est qu'il est plus difficile de comparer les revenus d'un mois à l'autre. Et si c'est l'aperçu le plus important, alors il pourrait être logique de le tracer comme un tracé à barres régulier ou un tracé linéaire pour mieux montrer cette comparaison. Cependant, les cascades sont en fait très utiles lorsque votre métrique a des nombres positifs et négatifs parce que la hauteur globale du graphique n'est pas compressée autant par rapport au plus grand total global. Et c'est pourquoi plus couramment utilisé pour les mesures financières telles que le flux de trésorerie ou le profit. Donc, dans ce cas, chaque barre est un peu plus grande et le total cumulé est également un peu plus utile parce que vous pouvez voir, par exemple, c'est à ce stade du mois d'août que l'entreprise a obtenu un flux de trésorerie positif pour le reste de cette année-là. Et c'est quelque chose que vous ne pouvez pas dire aussi facilement sur un graphique à barres régulier. Un dernier exemple avant de terminer cette section. Disons donc qu'on vous donne un jeu de données qui présente les ventes de cette année par rapport aux ventes de l'année dernière. La différence entre cette année et l'année dernière et la différence en pourcentage. Et cela est segmenté par catégories de produits. Et disons que c'est une liste assez longue de 100 catégories de produits différentes. Et l'objectif ici est de mettre en évidence ce qui a conduit notre activité dans son ensemble et ce que nous devrions nous concentrer pour l'année prochaine. Eh bien, je tiens à souligner que c'est un autre cas où cette table est en fait assez bonne pour montrer ces chiffres. Et mis à part le fait que c'est une table assez longue avec un 100 catégories différentes. Vous pouvez toujours trier ces quatre mesures et regarder en haut et en bas de cette liste. Mais si vous êtes enclin à tracer cela, vous avez quelques options à envisager. Et c'est en fait une question d'entrevue. Et je dis qu'environ 50% des candidats qui ont interviewé ont tendance à choisir l'option numéro un, qui est d'ignorer les indicateurs de différence dérivés et se concentrer sur seulement une valeur de 2$ qui représente cette année par rapport à l'année dernière. Et tracez-les côte à côte pour que le public puisse évaluer les différences. Et l'autre moitié des candidats ont tendance à choisir soit l'option deux ou l'option numéro trois, où vous ignorez les données de vente sous-jacentes et mettez en évidence les catégories qui ont le plus grand ou le les plus petites différences en dollars entre cette année et l'année dernière. Et une chose que vous pourriez remarquer est qu'ici je ne montre que les catégories supérieures et inférieures, et je ne montre pas cette liste entière de 100 catégories. Donc, pour ces trois graphiques, nous n'avons pas vraiment abordé le problème que nous avons une liste très, très longue. La deuxième chose que vous pourriez remarquer est que ces deux listes sont en fait très différentes les unes des autres, même si elles montrent tous les deux les meilleurs gagnants dans un perdant du bas, elles peignent une image très différente en termes de qui le gagnants et perdants sont. Alors lequel d'entre eux est le plus utile en termes d'évaluation de la santé globale de l'entreprise. C' est une des questions auxquelles nous avons dû répondre. Donc, une façon d'aborder ces deux points est d'utiliser quelque chose appelé une carte d'arbre, où la configuration commune est de faire la taille du carré B cette année des ventes pour chaque catégorie et est arrivé être colorisé par le changement en pourcentage de l'année dernière. L' algorithme de carte arborescente place automatiquement tous vos carrés du plus grand au plus petit, du haut à gauche au bas à droite. Et cela aide vraiment à résoudre le problème avec des queues très longues, car les plus petits segments prendront automatiquement moins d'espace et donc moins d'attention de votre public. La deuxième chose qui aborde est le fait que ce sont généralement les segments plus petits qui sont souvent les plus grands aberrants quand il s'agit de changements en pourcentage. Ainsi, cela contribue également à orienter la priorisation du public en poussant son attention vers les plus grands carrés qui sont plus colorisés car ce sont les segments qui ont réellement le plus grand impact. Et pour ce qui est de conduire l'ensemble de l'entreprise, pas les très petites dans le coin droit, peu importe l'importance de ces changements en pourcentage. Donc, dans ce cas, ma plus grande offre à emporter est que le domaine le plus important que nous surperformons cette année, nos sacs à dos de voyage, notre cuisine, nos chaussures de randonnée. Et nous avons vraiment sous-performé dans des domaines comme les vélos, éclairage et la lumière pour femmes, les vêtements d'extérieur pour femmes. Et ces gars ici, même s'ils sont très colorisés et ont des changements massifs pour cent par rapport à l'année dernière. Ils pourraient attirer plus d'attention dans d'autres parties du tableau de bord en termes de croissance d'un petit segment. Mais ils sont sans doute moins pertinents pour ce qui est de fournir une vue d'ensemble de ce qui a vraiment modéré l'entreprise au cours de la dernière année. Pour revenir à notre tracé précédent, vous pouvez voir cette option deux, car elle s'aligne beaucoup mieux avec cette TreeMap car elle montre les catégories de produits qui ont le plus grand changement en dollars par rapport à l'année dernière, alors que la plupart de ceux qui sont ici et l'option numéro trois, ils ne sont pas étiquetés sur la carte des arbres parce qu'ils ont tendance à être très petits qui finissent dans le coin inférieur droit. Ainsi, les arborescences étaient une note pour comparer deux ensembles de variables, surtout si l'une de ces variables est une direction ancienne comme les ventes, et l'autre est bidirectionnelle comme les changements dans les ventes. Et cet exemple met vraiment en évidence les façons courantes que j'ai vu arborescences utilisées dans les tableaux de bord et en particulier pour les entreprises de détail. En termes d'avantages, il met vraiment en évidence ce qui est important dans la façon de cacher la longue queue de petits objets qui ne dirigent pas l'entreprise dans son ensemble. En termes de négatifs. Je pense que maintenant vous commencez à voir le schéma selon lequel beaucoup de ces complots moins communs et moins conventionnels pourraient nécessiter un peu plus d'explications et d'efforts de la part du public pour les comprendre et les lire. Mais une fois qu'ils sont familiers, ils offrent en fait beaucoup d'avantages par rapport aux graphiques linéaires et aux graphiques à barres plus classiques. C' est donc la fin des compositions et vous avez terminé en termes de sélection de la meilleure façon de tracer un jeu de données. Et lors de la prochaine session, ce que nous allons aborder sont divers aspects quand il s'agit de traiter et de tableau de bord efficace. 6. Section 5 : Context, écraser, couleur: Section cinq, contexte, encombrement et couleur. Donc, souvent, le contexte que vous fournissez à votre audience est aussi important que l'information réelle que vous présentez. Voici donc un exemple que j'ai rencontré il y a de nombreuses années, et vous pouvez voir qu'il est un peu daté, mais j'ai utilisé cet exemple plusieurs fois pour faire cette démonstration. J' étais dans ma voiture à écouter les nouvelles à la radio. Et le diffuseur dit, aujourd'hui sur le marché boursier, la moyenne industrielle Dow Jones a baissé 102 points tandis que le nasdaq était en baisse de 35 points. Donc je me suis dit, ok, on dirait que c'était une mauvaise journée pour le dao, mais les entreprises qui sont cotées dans un Aztèque n'ont pas fait si mal. Mais ce que je ne savais pas, c'est le contexte qu'Adele est passé de 8.281 points à 8.179 points, ce qui est une baisse de 1.2%, tandis que le nasdaq, comme elle a chuté de 2.2%. Donc, pour un investisseur, ce changement de pourcentage est en fait beaucoup plus important. Donc, c'était en fait bien pire pour le nasdaq que le Dow une fois que vous avez ce contexte. Mais il y a aussi un autre élément du concours, qui est que le nasdaq étant plein de stocks technologiques est intrinsèquement plus volatil que le doute. Donc un plus ou moins 2% de swing n'est pas vraiment hors de l'ordinaire. Alors que le Dow baisse de 1,2 % en une seule journée était en fait une grosse affaire à l'époque. Donc, le point ici est que le contexte peut non seulement avoir un faible effet sur l'interprétation de la perspicacité, il peut en fait inverser complètement l'interprétation. Voici un autre exemple qui est un peu basé sur notre regard précédent sur le treemap. Nous avons donc deux catégories de produits dans une entreprise de vente au détail, vêtements pour hommes et femmes. Et si vous examinez simplement la variation en pourcentage des ventes d'une année à l'autre, vous pourriez conclure que les vêtements pour hommes sont à l' origine de la plus grande partie de la croissance de l'ensemble de l'entreprise, en supposant que ces deux catégories sont à peu près de la même taille . Cependant, si vous avez eu le contexte de la façon dont ce pourcentage est calculé, votre auditoire verra que la Mensa Pearl a connu un changement de pourcentage beaucoup plus important sur la base d'un chiffre d'affaires de base beaucoup plus faible par rapport à l'année précédente. Ce qui est encore une fois un comportement très commun sur les ventes en ce que vous êtes plus petites catégories aura beaucoup plus de changements pour cent. Et c'est vraiment le plus gros des vêtements pour femmes ici qui est à l' origine de la croissance réelle du dollar. Même si en pourcentage de l'année dernière, cela ne semble pas aussi dramatique. En voici un autre sur les contrats. Donc, ici, nous examinons deux mesures très courantes d'entrepôt de la chaîne d'approvisionnement, Dr. Stock, qui est le temps qu'il faut à l'entrepôt pour recevoir et ranger vos marchandises qu'il vient de recevoir du vendeur et de choisir le navire, qui est le temps qu'il faut à l'entrepôt pour saisir et emballer un produit qu'il souhaite expédier à un client. Donc, si vous êtes une chaîne d'approvisionnement a pour vous pourriez regarder ces deux dates et vous avez une idée approximative de savoir si ceux-ci sont bons ou mauvais ou environ moyenne. Mais pour quelqu'un qui n'est pas un expert, il n'y a vraiment pas beaucoup de contextes ici part peut-être comparer ces deux chiffres l'un à autre et se demander pourquoi choisi un navire prend presque deux fois plus de temps que le Dr stock. Donc, afin de fournir plus de contexte, nous avons quelques options différentes. Nous pouvons comparer ces deux chiffres à des tendances historiques, par exemple quelles étaient les statistiques de la semaine dernière ? Ou s'il s'agissait d'une mesure vraiment saisonnière, quelle était la comparaison avec la même période par rapport à l'année dernière ? Nous pouvons également les comparer à d'autres points de référence, tels que le nombre de jours. Dans d'autres entrepôts plus comparables ou ce qui est considéré comme la norme de l'industrie pour ces mesures. Nous pouvons également les comparer simplement à leurs objectifs et à leurs cibles. Donc, si nous fixons un objectif pour les actions néerlandaises d'aujourd'hui, nous sommes bien en avance sur notre objectif. Mais si notre cible est un jour, alors nous sommes en retard. Le contexte peut donc être aussi simple que cela. Et encore une fois, en remontant au tout début, notre objectif est de permettre à notre public d'identifier rapidement sans équivoque les principales idées qui vont les aider dans leurs décisions d'affaires. Une façon de le faire est de leur fournir les bons contextes qui mettent en évidence chaque fois que quelque chose est hors de la normale. Un autre sujet que je veux aborder est l'encombrement chargé, que j'ai mentionné à quelques reprises tout au long de ce cours. Voici donc un exemple que j'ai trouvé sur Internet où nous avons un graphique à barres très colorisé qui montre le taux d'inflation annuel dans les épiceries de différentes villes. Et c'est un peu un homme de paille parce que vous ne voyez généralement pas de graphiques qui sont si mauvais en termes d'encombrement. Mais pour le nettoyer, je pense que nous pouvons appliquer certaines des meilleures pratiques que nous avons couvertes, comme une, rendre les noms de ville plus faciles à lire en ayant à barres être horizontales, à se débarrasser de la couleur 3D en barres, et à se débarrasser de la parce qu'elles ne transmettent pas vraiment informations supplémentaires qui ne sont pas déjà véhiculées par la longueur des barres. Et enfin, c'est aussi une bonne pratique de faire en sorte que l'ordre des barres soit aussi dans un ordre significatif. Il y a aussi un homme nommé Edward Tufty qui est une sorte de gourou en matière de visualisation de données. Et il a causé beaucoup de livres sur ce sujet. Et l'une des choses sur lesquelles il se concentre vraiment plus que n'importe qui d'autre est juste jusqu'où vous pouvez aller quand il s'agit de minimiser graphique encombré. Donc ce qu'il pourrait préférer est quelque chose de plus comme ça, où vous vous êtes débarrassé de tous vos axes, y compris les lignes de grille et le contour des graphiques à barres. Et au lieu de cela, vous affichez simplement la longueur des barres en soustrayant la couleur des points de pourcentage. Sa philosophie est que vous voulez montrer le moins d' encre sur la page afin que votre public puisse concentrer son attention sur l'encre qui joue réellement un rôle critique et transmet l'information. Ok, le prochain sujet sera bref sur la sélection du jeu de couleurs. Il y a donc un site Web appelé ColorBrewer, qui vous aide à choisir l'ensemble optimal de codes RVB pour les couleurs qui offriront le meilleur type de contraste et selon différents scénarios. Donc, voici, par exemple, les couleurs par défaut des versions antérieures de Microsoft Office. Et voici ce que l'infusion de couleur recommanderait en termes de maximiser ce contraste lorsque vous avez un graphique en cinq couleurs. Et cela devient probablement un peu moins pertinent maintenant parce que la plupart des salles de conférence sont maintenant équipées de téléviseurs à écran plat, ce qui offre un meilleur contraste. Mais à l'époque où vous allez faire une présentation au bureau de votre client, vous ne savez pas à quoi ressemblera le réglage et s'ils auront ou non un rétroprojecteur de qualité vraiment merdique dans une pièce. qui est trop lumineux, alors dans ce cas, vous voulez vous assurer que votre public peut toujours lire les couleurs de votre graphique confortablement en vous assurant de maximiser le contraste. Le dernier sujet porte uniquement sur certains matériaux audacieux sur les fonctions d'exploration vers le bas. Donc, cela va être un peu souffrir spécifique, ce qui n'est pas l'intention du cours. n'est pas exhaustive. C' est juste un que je veux montrer pour essayer de faire le point que des outils de construction de tableau de bord fantastiques comme Tableau et PowerPoint, vous avez la possibilité de ne pas tout adapter sur la même page, mais vous pouvez le rendre interactif afin que l'audience peut obtenir ensemble, puis cliquez vers le bas pour explorer les détails qui l'intéressent. Donc, le premier est Sparklines. Et les sparklines sont fondamentalement juste un Minecraft. Et Apple le fait magnifiquement dans leur casquette de stock en vous montrant un petit graphique pour chaque stock et comment cela a tendance tout au long de la journée. Et puis si vous avez été intrigué par cela, vous pouvez toujours explorer plus profondément, cliquer sur l'un de ces titres et obtenir plus de détails sur les tendances réelles qui remontent plus d'un jour. Un autre bon exemple est la fenêtre contextuelle de survol de la souris, qui sont appelées info-bulles dans tableau. C' est donc une carte qui a été colorisée par une mesure particulière. Et puis si une zone particulière de la carte vous intéresse, alors vous pouvez placer votre souris sur cette zone. Et je vais vous donner un pop-up où vous pouvez mettre beaucoup plus de détails, y compris dans un tout autre graphique. Un commentaire supplémentaire que j'ajouterai est que même s'il s'agit d'un cours sur la visualisation de données et la conception de tableaux de bord, je me rends compte que je n'ai pas beaucoup parlé de cartes. Même si je suis assez surpris par la prédominance des cartes dans le tableau de bord. Et c'est parce que mon opinion est que, à moins que la question commerciale que vous essayez d'aborder ne soit spécifiquement liée à la géographie. Comme si vous construisez un tableau de bord en termes de logistique, cartes n'ajoutent pas vraiment de valeur réelle ou de perspicacité. Tout ce qu'il fait, c'est qu'il crampe les détails dans les grands centres de population et laisse beaucoup d'espaces partout ailleurs. Mais j'admets qu'ils sont très populaires et le public général a tendance à aimer Maps juste parce qu'ils ont l'air vraiment cool. Un dernier exemple est un bascule que vous pouvez utiliser pour passer à une mesure supérieure que vous utilisez sur une page entière dans Power BI Il s'agit d'une application plus avancée de boutons et de signets. Donc, dans cet exemple, ce que nous avons, c'est que vous avez le public qui pourrait préférer regarder le même ensemble de nombres mais sous des devises différentes. Donc, si le public n'a pas besoin de faire des comparaisons entre ces monnaies, alors il est préférable de simplement montrer l'un de ces trois ensembles de nombres à la fois en utilisant ce bouton pour permettre au public de basculer d'avant en arrière, plutôt que de tripler la quantité d'informations à la page en affichant les trois monnaies. Donc, le thème global entre ces trois fonctionnalités que je veux mettre en vedette est juste pour vous permettre de cacher certaines informations devant la vue principale de votre tableau de bord, qui le rend plus propre, mais permet toujours au public pour obtenir plus de détails sur les domaines qui les intéressent. Ok, donc c'est la fin de cette section. Et dans la prochaine session, nous donnerons un bref résumé. 7. Conclu: Conclusion. Merci beaucoup d'avoir réussi ce mini-cours, nous avons segmenté le sujet de la visualisation des données en ces quatre sections, que je vais attribuer au professeur Andrew Abella, nous avons examiné les avantages et les inconvénients de la plus des moyens basiques et communs pour tracer nos données afin de répondre aux questions commerciales courantes. Nous avons également examiné certaines de ces options plus avancées et dans quelles situations vaut la peine d' échanger la simplicité en faveur de quelque chose qui est plus riche en informations. Tout en gardant à l'esprit que notre objectif est de communiquer nos connaissances commerciales de manière efficace et objective. En ce qui concerne le processus de création d'un nouveau tableau de bord et vous rapportez ou une analyse ad hoc. Nous concentrons notre temps principalement sur l'étape numéro deux. Mais je dois souligner encore une fois que vos efforts pour appliquer ce que nous avons abordé à l'étape numéro 2 seront grandement entravés si vous ne parvenez pas à une tâche très approfondie consistant à couvrir l'étape numéro un. Et d'après mon expérience, l'une des plus grandes critiques pour les gens qui sont hautement formés et hautement compétents sur aspects techniques de l'analytique est qu'ils ne comprennent pas pleinement les questions de l'entreprise et les besoins de l'entreprise. Par conséquent, ils créent un produit très inférieur ou ils ont fouillé gestion du changement nécessaire pour s'assurer que le tableau de bord qu'ils créent est utilisé et adapté. C' est le premier cours que j'ai préparé. Donc, tout commentaire sur le contenu ou la livraison sera très apprécié. Je n'essaie pas de chercher des compliments, mais toute critique constructive me sera très utile. Y compris si vous seriez intéressé ou non par l'un de ces autres sujets que j'ai examinés, y compris l'étape numéro un, compréhension de la question commerciale, planification de la demande et les prévisions. Comment créer une présentation efficace et des diapositives PowerPoint, qui est la composante complémentaire de la narration. Enfin, la liste des études de cas impliquant types les plus courants de modèles d'analyse de données utilisés dans le monde des affaires, comme l'analyse de panier, la segmentation de produits, le clustering de magasins, le marketing. Très bien, alors merci encore et félicitations pour avoir terminé ce cours. J' espère que vous l'avez trouvé utile.