Transkripte
1. Einführung: Grundlagen der Datenvisualisierung und Dashboard-Designs für Anwendungen im geschäftlichen Umfeld. Einer seiner Marken und ich habe in den letzten 20 Jahren in der Datenanalyse gearbeitet. Zunächst als Biochemiker, dann als Unternehmensberater und derzeit als Manager für Analytik in einem Einzelhandelsunternehmen. Nun scheinen diese Rollen sehr unterschiedlich zu sein, aber was sie gemeinsam haben, ist die Notwendigkeit des Storytelling,
wo meine Aufgabe darin besteht, die effektivste, objektivste
und wirksamste Möglichkeit zu finden, geschäftliche Erkenntnisse durch Datenvisualisierung zu kommunizieren. Und was meine ich damit? Nun, effektiv bedeutet nur, dass Sie Ihrem Publikum helfen möchten die wichtigsten Erkenntnisse aus Ihrer Analyse
schnell zu verstehen,
unabhängig davon, ob Sie da sind, um sie ihnen zu erklären oder nicht. Wenn Sie nun ein starker Moderator sind, können
Sie immer Wege finden, eine komplizierte Analyse zu erklären, aber Ihr Publikum Schritt für Schritt durch sie zu führen. Aber am Ende des Tages
sollte
idealerweise Ihr Armaturenbrett oder Ihr Slide-Deck immer mit der Erwartung gestaltet werden, dass es auch ein eigenständiges Produkt sein
muss, das vom Benutzer ohne Ihre -Kommentar. Objective bedeutet, dass Sie Ihrer Zielgruppe genügend Kontext geben möchten, damit sie mit minimaler Voreingenommenheit die richtigen Schlüsse ziehen können. Manchmal können Sie Ihre Daten absichtlich auf eine Weise präsentieren , die den Punkt betont, den Sie zu vermitteln versuchen. Aber idealerweise sprechen die Daten und ein Maß an Vertrauen, die mit diesen Daten verbunden sind, für sich. Ihre Objektivität wird
besonders von versierten Zielgruppen geschätzt und sollte Ihnen dabei helfen, langfristiges Vertrauen zu dieser Zielgruppe aufzubauen. Ich habe diesen Kurs ursprünglich speziell für mein eigenes Team erstellt, um sicherzustellen, dass jeder über das gleiche Niveau an Grundwissen verfügt, das notwendig ist, um einen unwirksamen Geschichtenerzähler zu sein. Und dann fügte ich auch einige zusätzliche Themen hinzu, die ich gefunden habe, waren sehr häufige Blindspots für Kandidaten, die ich interviewt, aber nicht eingestellt habe. Wenn es Ihnen gelungen ist, diesen Kurs zu durchlaufen, ist
mein Ziel, Ihnen nicht nur zu helfen, das Interview zu bestehen, sondern auch die richtigen Tools zu haben, um
ein effektiver und glaubwürdiger Datenanalyst oder Business Analyst zu sein . Grundsätzlich, wenn Sie die Berufsbezeichnung eines Analysten haben, ist
dies, was ich erwarten würde, dass Sie ein wenig darüber wissen, wie dieser Kurs gestaltet ist. Es, dies ist ein Zwischenstufenkurs und
es nimmt einige grundlegende Kenntnisse der gemeinsamen Möglichkeiten, um Daten anzuwenden. Wir werden direkt in die Vorteile und die gemeinsamen Fallstricke springen, wenn Sie
zum Beispiel Balkendiagramme und
Tortendiagramme verwenden zum Beispiel Balkendiagramme und und wie sie sich mit anspruchsvolleren Optionen vergleichen. Die Erwartung ist also, dass Sie mit einigen dieser grundlegenderen Grundstücke vertraut sind, die ich nicht im Detail einführen werde. Dieser Kurs ist auch nicht softwarespezifisch. Betrachten Sie die Software als Werkzeuge und es gibt schon viel Material da draußen. Und wie man diese Werkzeuge effektiv einsetzt. Was wir in diesem Kurs behandeln werden, sind die grundlegenden Konzepte für das, was Sie mit diesen Tools erreichen wollen. Das Ziel ist, dass diese Konzepte relevant sind, unabhängig davon welche Software Sie oder Ihr Unternehmen verwenden. Und schließlich werden alle Beispiele in diesem Kurs stark auf Geschäftsanwendungen,
Vertrieb, Marketing, Finanzen, Supply Chain usw. fokussiert sein. Datenvisualisierung ist eine sehr breite und gut abgedeckte Themen. Also möchte ich natürlich keinen weiteren Kurs zu diesem Thema erstellen. Und was möchte ich eine erstellen, die so umfassend ist, dass es eine 100 Stunden lang ist. Worauf ich mich konzentrieren werde,
worauf ich in keinem anderen Kurs gestoßen bin, sind die Anwendungsfälle, die für die Geschäftswelt am relevantesten sind. Für eine allgemeinere Diskussion zur Datenvisualisierung würde
ich Elektroden von Tamara Munzner empfehlen. Die sind auf YouTube verfügbar. Sie hat einen sehr gründlichen Tiefengang zu diesem Thema gemacht,
vor allem in Bezug auf Visualisierungen, die für akademische und wissenschaftliche Forschung
relevanter sind . Wenn Sie sich von einigen großartigen Beispielen der Datenvisualisierung inspirieren lassen möchten. Ich bin ein großer Fan der 538 Website von Nate Silver, der für die Analyse von Wahlprognosen berühmt ist. Und der visuelle Kapitalisten, die eine Website mit einer Tonne von schönen Infografiken ist, von denen
jede wie ein Kunstwerk ist. Und während ich stolz auf meine Arbeit bin und es macht Spaß, alltägliche Task Force zu machen, sei es ein bisschen auffälliger. In einer schnelllebigen Geschäftswelt, meine Hauptpriorität und meine Erwartung für mein Team, werden
wir unseren Führungskräften dabei helfen, bessere, datengestützte Entscheidungen zu treffen. Und das wird mein Schwerpunkt für diesen Kurs sein. Und ich überlasse es Ihnen,
diese beiden Beispiele auf eigene Faust zu überprüfen , wie Sie Ihre Arbeit verschönern können. Was dieser Kurs abdecken wird. Sos Tag eins auf Ihrem neuen Job als Datenanalyst, Sie wurden beauftragt, ein Dashboard zu erstellen, um
eine bestimmte Geschäftsfunktion zu unterstützen . Wo fängst du an? Nun, der Ausgangspunkt für jede Art von Analysen ist sicherzustellen, dass Sie die geschäftlichen Fragen
verstehen, die Sie zu lösen versucht haben. Und das ist kein Schritt, den Sie überspringen oder überspringen können. Es genügt auch nicht, den Benutzer zu fragen, was er will, denn es gibt ein bisschen Exploration und Unternehmertum, das an diesem Schritt beteiligt ist. Wie das berühmte Henry Ford Zitat:
Wenn ich Leute gefragt hätte, was sie wollten, hätten
sie mir schnellere Pferde erzählt. Du willst also ziemlich tief auf dieses gehen und sicherstellen, dass du mindestens zwei Dinge verstehst. Erstens, welche Art von Aktionen mit dem Benutzer
basierend auf den Erkenntnissen, die Sie Dashboard waren, ausführen wird zur Verfügung gestellt. Dies wird Ihnen zum Beispiel sagen, dass die Granularität, die Sie benötigen, um die Daten. Sie möchten auch sicherstellen, dass Sie verstehen, wie diese Informationen derzeit gesammelt werden, damit Sie beispielsweise
beurteilen können, ob Sie
dieselbe Datenquelle verwenden möchten oder ob es eine bessere Datenquelle gibt. Dies ist die Grundlage dafür, wie Sie dieses Dashboard entwerfen. Wie Sie beurteilen, ob ein die Anforderungen erfüllt oder nicht. Und das hilft Ihnen später auch beim Change Management. Und Change Management ist etwas,
über das ich viel nachdenken musste , als ich ein externer Berater war, aber etwas, das ich finde, wird oft ignoriert, wenn Sie intern im Unternehmen waren. Nur weil Sie ein wirklich fantastisches Dashboard erstellt haben, bedeutet das nicht, dass es automatisch eine weit verbreitete Akzeptanz erhält. Sie müssen immer noch das Notwendige im Marketing tun und dem Benutzer zeigen, wie dies sie bei der
Entscheidungsfindung unterstützt und warum ist es besser als das, was sie derzeit verwenden? Nummer eins verstehen, können Sie dies tun. Sobald Sie zuversichtlich sind, dass Sie ein solides Verständnis der geschäftlichen Frage haben, können Sie mit der Analyse der Daten und dem Prototyping des Dashboards fortfahren, sich zuerst auf das Dienstprogramm und dann auf die Ästhetik konzentrieren. Und der Großteil dieses Kurses wird sich auf Nummer zwei konzentrieren, aber ich werde auch einige Bonusmaterial auf Nummer drei enthalten. Aber jenseits dessen, was
ich gerade gesagt habe, werde ich nicht mehr über Nummer eins sprechen, obwohl man offensichtlich nicht Nummer zwei oder
Nummer drei machen kann , ohne erfolgreich Nummer eins zu tun. Und der einzige Grund dafür ist, dass man in Nummer
eins gut ist, ist wirklich mehr darum, in der Praxis erfahren zu haben. Es ist nicht wirklich etwas, das ich diskret auf ein paar Folien zusammenfassen kann. Aber wenn es Interesse an Nummer eins gibt, lassen
Sie es mich wissen und ich werde einen separaten Kurs zu diesem Thema machen. Und schließlich ein paar Landkreise, die ich anerkennen möchte, wenn es um Dashboard-Design geht. Ich werde mein Bestes tun, um mit Ihnen zu teilen, was ich für die besten Praktiken halte. Aber es gibt ein gewisses Maß an Subjektivität. Mein Ziel ist es also immer, Ihnen meine Überlegungen hinter diesen Regeln zu geben, damit Sie Ihre eigene Entscheidung darüber treffen
können, ob Sie diese Regeln befolgen oder ignorieren wollen. Und ich verstehe diese Idee, dass die meisten Regeln gebrochen werden können. Bevor Sie sich jedoch darum kümmern, eine Regel zu brechen, müssen
Sie in der Lage sein, innerhalb der Grenzen
dieser Regel zu operieren , und Sie müssen den Grund für diese Regel vollständig verstehen. Zwei ist, dass die meisten Ihrer Benutzer sich wahrscheinlich nicht um Sie kümmern werden. Ihre Liebe zum Detail. Sie wissen wahrscheinlich nie,
dass ich beim Entwerfen eines Dashboards wahrscheinlich 20-30 verschiedene Möglichkeiten ausprobiere, um ein Dataset zu plotten und
eine Entscheidung darüber zu treffen , welche dieser Möglichkeiten
die beste Arbeit bei der Vermittlung der geschäftlichen Erkenntnisse leistet . Aber als Datenanalyse-Spezialisten sollten
wir stolz auf unsere Arbeit sein. Und
das ist sicher als Manager etwas, dem ich viel Aufmerksamkeit
schenke wenn ich die Arbeit eines anderen betrachte. Und schließlich, Nicht alles, was ausgedacht werden muss. Obwohl dies ein Datenvisualisierungskurs ist, eine einfache Tabelle
in vielen Situationen könnte
eine einfache Tabelle
in vielen Situationentatsächlich die beste in Bezug auf Klarheit und Einfachheit sein. Und das sind Situationen, auf die ich auch später in der Präsentation hinweisen werde. Okay, Sie haben die Nummer eins abgeschlossen und sind
zuversichtlich , dass Sie die geschäftlichen Fragen verstanden haben. Jetzt sind Sie bereit, über Nummer
zwei nachzudenken , wie Sie diese Daten plotten möchten. Das erste, was Sie tun möchten, ist, die Art von Analysen einzugrenzen, die Sie erreichen möchten. Zum Beispiel, ist dies ein Vergleich einer bestimmten Metrik über eine bestimmte Dimension hinweg, wie ein Vergleich unserer Umsätze in verschiedenen Regionen, oder Vergleich der tatsächlichen Lagerbestände heute mit dem, was am Anfang budgetiert wurde des Jahres. Zeigt die Form einer Distribution für etwa die Größe der einzelnen Produktkategorien in Bezug auf die Anzahl der darin enthaltenen Produkte oder das Alter Ihres Kundenstamms an. Zeigt dies die Beziehung oder die fehlende Beziehung zwischen zwei oder mehr Kennzahlen an und ob es eine implizite Ursache und Wirkung gibt,
wie zum Beispiel, bringt Hi-Marketing-Spin höhere Umsätze? Und schließlich zeigt das die einzelnen Komponenten einer größeren Gesamtsumme, wie viel Gewinn jeden Monat zu unserem jährlichen Gesamtgewinn beiträgt? Was Sie vielleicht bemerken, ist, dass es ein wenig Überschneidungen zwischen einigen dieser Geschäftsfragen gibt. Wenn Sie sich eine Zeitreihendaten ansehen, zum Beispiel über die monatliche Rentabilität Ihres Unternehmens. Sie könnten das als Vergleichsfrage oder eine Kompositionsfrage betrachten. Wie Sie letztendlich entscheiden, wie diese Daten geplottet hängt von dem Geschäft und der Größe ab, die Sie vermitteln möchten. Also, wenn Sie eine Aussage wie unser profitabelster Monat IS 5X machen wollen, die unseres am wenigsten profitablen Monats, die Sie vielleicht Plots betrachten
möchten , die diesen Vergleich hervorheben. Wenn Sie jedoch stattdessen eine Aussage machen wollen, wie 50%
unseres Jahresgewinns kommt aus dem Zeitraum zwischen Black Friday und Weihnachten. Dann möchten Sie diese Daten möglicherweise als Komposition anzeigen. Im nächsten Abschnitt werden wir über Vergleiche sprechen.
2. Teil 1: Vergleiche,: Abschnitt eins, Vergleiche. Wenn es darum geht, Vergleiche zu machen, wird
Ihr Brot und Butter immer Liniendiagramme und Balkendiagramme sein. Wahrscheinlich etwa 70% von dem, was Sie verwenden werden, ist einer dieser beiden. Lunchrooms sind immer Ihre Standardoption für alle Zeitreihendaten. Und was ich mit Zeitreihen meine, ist, dass die X-Achse quer geht, eine Art Zeitdimension ist. Und einer der Gründe, warum Liniendiagramme so ideal sind ,
ist, dass es nur sehr wenig Chart-Unordnung gibt,
was bedeutet, dass es eine sehr minimale Menge an Tinte
notwendig ist , um die volle Menge an Informationen zu vermitteln. Daher können Sie viel mehr auf eine einzelne Seite passen. Und tatsächlich sind sie sehr leicht zu verstehen, auch für eine nicht-technische Ionen. Dies sollte also in der Lage sein, es ohne Ihre Hilfe zu lesen und zu interpretieren. Balkendiagramme sind Ihre Grafik der Wahl, wenn es darum geht, diskrete Variablen zu vergleichen. Und wir werden darüber reden, was das bedeutet. Und wie das Liniendiagramm ist
es auch sehr leicht zu verstehen. Aber es gibt ein bisschen mehr Chart-Unordnung in Bezug auf die Farbe der Balken. Das bedeutet, dass Sie nicht so viele Variablen auf eine einzelne Seite anpassen können wie im Vergleich zum Liniendiagramm. Werfen wir einen Blick auf ein paar Beispiele. In diesem Fall planen wir die Einnahmen nach Monat, wobei der Umsatz auf der y-Achse und die Monate auf der x-Achse verläuft. In diesem Fall können wir entweder ein Liniendiagramm oder ein Balkendiagramm verwenden. Aber meine Vorliebe ist es immer, das Liniendiagramm zu verwenden, weil Ihre Augen natürlich auf den Teil des Graphen
konzentrieren, der tatsächlich wichtig ist, sind die Marker. Während im Balkendiagramm Ihre Augen stärker auf die Farbe der Balken fokussiert sind, was keine zusätzlichen Informationen über die Höhe der Balken hinausgeht. Also, mit anderen Worten, mehr Diagramm Unordnung. In diesem nächsten Beispiel vergleichen wir dieselbe Umsatzmetrik, aber über verschiedene Regionen hinweg. Und in diesem Fall können wir das Liniendiagramm nicht verwenden, da im Liniendiagramm die Linien zwischen den Markern Kontinuität implizieren. Und so ist es nur für kontinuierliche Variablen nützlich, nicht diskrete, wie die Zustände. Ich meine, wenn Sie so geplottet haben, ist
Ihre Zielgruppe immer noch gut zu verstehen, was Sie zu vermitteln versuchen, aber technisch gesehen ist es nicht richtig,
ein Liniendiagramm zu verwenden , wenn die Variable eine diskrete Variable ist. Eine weitere Überlegung ist, wie viele Variablen Sie in einem einzelnen Diagramm vergleichen möchten. Also, wenn wir das auf zwei Graphen erhöhen, sind sie beide, okay. Sie können immer noch das Muster der Saisonalität der Einnahmen zwischen beiden Diagrammen sehen. Aber wenn man das auf fünf erhöht, wird
es ein bisschen überfüllter. Und hier hat das Liniendiagramm einen Vorteil gegenüber dem Balkendiagramm. In diesem Diagramm können Sie sehen, dass das erste, was mir ins Auge fällt, die Tatsache ist , dass die grüne Linie für jeden einzelnen Monat immer über der roten Linie liegt, außer für den Monat April. Und jetzt sind das nur synthetische Daten. Also ich weiß nicht, ob das sinnvoll ist und etwas, das Sie nennen möchten, aber es ist nur etwas, das
dem Publikum sehr klar ist , wenn sie auf die obere Grafik schauen. Und Details wie diese sind für den unteren Graphen etwas verdeckt. Wenn Sie dies nun auf 20 Variablen erhöhen, sehen
beide Zeichen tatsächlich schrecklich aus. Sie sollten wahrscheinlich darüber nachdenken, ob Sie tatsächlich alle 20 so vergleichen müssen
oder ob Sie einen besseren Weg finden können, dies zu präsentieren. Aber im Liniendiagramm können Sie immer noch irgendwie austecken, was passiert. Aber es ist fast unmöglich für den Balkendiagramm darunter. Dies ist also nur etwas zu beachten, wenn Sie versuchen, zwischen einem Liniendiagramm und einem Balkendiagramm zu wählen. Ein letztes Beispiel ist, wenn es um Balkendiagramme geht, können
Sie sie vertikal oder horizontal verwenden. Die Hauptüberlegung hier ist, nur
Ihrem Publikum zu helfen , die Achsenbeschriftungen leichter zu lesen. Wenn Sie also sehr wenig Namen auf
der X-Achse haben und es länger ist als die Beschriftungen auf der Y-Achse. Es könnte sinnvoll sein, es zu drehen, damit Ihr Publikum es lesen kann, ohne das nächste zu kippen. Okay, also ein bisschen wie eine Fallstudie. Nehmen wir an, Sie unterstützen einen Einzelhändler im Elektronikbereich. Sie kompilieren einige Verkaufsdaten auf ihrer Spitze für Marken. Und es gibt vier Produktkategorien. Und Sie möchten eine Grafik erstellen, mit der sie diese Segmente vergleichen können. Also, wie würdest du das machen? Und übrigens, dies ist ein Beispiel, wo die Tabelle
tatsächlich ziemlich gut in Bezug auf Klarheit und Einfachheit ist . Es ist also definitiv eine Option, die für dieses Beispiel passt. Okay, gut, das erste, was Sie entscheiden müssen, ist, ob es eine zusammenfassen es auf der
Grundlage der Produktkategorien und Schicht darüber hinaus,
die Marken als die verschiedenen Farben. Oder um es als Marken zusammenzufassen und die Produktkategorien die Farben zu machen. Und die andere Entscheidung, die Sie treffen müssen, ist, ob Sie es absolut halten, um die tatsächlichen Dollarunterschiede hervorzuheben, orthonormalisieren es auf 100%, um die Unterschiede in der Zusammensetzung hervorzuheben. In Wirklichkeit werden Sie mit dem Benutzer sprechen, und Sie werden herausfinden, welche davon tatsächlich
die nützlicheren und umsetzbaren Erkenntnisse für die Entscheidungen bietet , die er zu treffen versucht, oder ob es notwendig ist, alle vier diese Plots, wenn jeder von ihnen einen notwendigen Einblick bietet. Aber es gibt auch eine andere Möglichkeit, die ist, eine sehr breite Char zu verwenden, auch als fröhliche medizinische Karte bekannt. Dies ist im Grunde ein 2D-Diagramm, mit dem Sie
sowohl die Marke als auch eine Produktkategorie Dimensionen auf die gleiche Grafik setzen können. Und ein weiterer Vorteil, den es hat, ist, dass es
die Aufmerksamkeit des Publikums auf das größte Segment konzentriert . In diesem Fall ist
die sofortige Einsicht, die ich bekomme, dass die Telefone die größte Produktkategorie darstellen. Und innerhalb von Telefonen dominiert Apple mit einem 60% Marktanteil, während Tablets die kleinste Produktkategorie sind. Und innerhalb von Tablets ist es eine gleichmäßige Trennung zwischen den vier Marken. In diesem Diagramm können Sie also nicht nur alle Erkenntnisse aus den vorherigen vier Diagrammen
einbeziehen, sondern auch die vollständige Beziehung zwischen Marken und Produktkategorien, die Sie nicht erhalten, wenn Sie sie separat darstellen. Das einzige, was fehlt, sind die gesamten Dollarwerte, die absoluten Vergleiche. Aber in der Regel, was Leute tun, ist, den Gesamtbetrag des Dollars in den Titel
oder die Fußnote aufzunehmen , so dass das Publikum immer noch diesen Kontext haben kann, wenn sie es brauchen. Hier ist ein weiteres Beispiel für ein sehr breites Diagramm, und dieses Mal ohne Normalisierung auf den beiden Achsen. Was wir hier tun, ist, dass wir diese CO2-Emissionen pro Kopf auf der Y-Achse planen. Und pro Kopf bedeutet nur pro Person. Und wir haben die Gesamtbevölkerung jedes Landes auf der x-Achse. Und Licht vor unseren Augen wird immer zu dem gezogen, was
das größte Segment auf der Seite ist, das den größten Platz beansprucht. In diesem Fall sind es also die Emissionen aus den Vereinigten Staaten und aus China. Das wichtigste im Inneren, das ich bekomme, ist, dass China der größte Produzent von CO2-Emissionen ist, basierend auf der Fläche des Diagramms. Aber auf Pro-Kopf-Basis, es ist Mitte des Rudels und es ist nicht so hoch wie die anderen entwickelten Nationen, wie die Vereinigten Staaten. Wenn wir nun diese Daten mit einem regulären Barplot plotten würden, haben Sie die Wahl. Sie können entweder die Gesamtemissionen plotten .
In diesem Fall wird China als größter Emissionsbeitrag angezeigt. Oder Sie können die Pro-Kopf-Emissionen darstellen, in diesem Fall sieht China nicht so schlecht aus wie die anderen Länder. Und Sie könnten tatsächlich diese Wahl haben, wenn Sie
eine Agenda haben , um über einen dieser oder den anderen Punkte zu sprechen. Aber das geht auf meine frühere Bemerkung zur Objektivität zurück. Wenn Sie die Daten mithilfe des sehr breiten Diagramms plotten. Sie sind in der Lage, Ihrem Publikum den vollständigen Kontext zu geben und es ihnen zu ermöglichen das vollständige Urteil über diesen Kontext zu treffen, anstatt sie auf die eine oder andere Ansicht zu lenken. Und ich mag dieses Beispiel und als mein einziges nicht-geschäftliches Beispiel und diesen ganzen Kurs. Aber lassen Sie uns einen Blick auf ein tatsächliches Geschäftsbeispiel werfen. Also hier nehmen wir das gleiche sehr breite Diagramm und wir unsere eigenen Einheitsmargen auf der Y-Achse und die Stückverkäufe auf den Exzessen aus. Das ist also im Grunde
, wie viel Bruttomarge wir pro Produkteinheit generieren, die wir verkaufen. Und das ist, wie viele Einheiten haben wir verkauft? Wenn Sie Daten wie diese haben, haben Sie drei verschiedene Möglichkeiten, sie zu plotten und drei verschiedene Möglichkeiten, um diese Produkte zu rangieren. Wenn Sie den Gesamtumsatz pro Einheit darstellen, haben
Sie Produkt i als erstes Produkt gefolgt von Produkt o. Wenn Sie die Gesamtbruttomarge darstellen, haben
Sie immer noch das Produkt i als erstes, aber dann folgt das Produkt Und der dritte Weg, den ich nicht zeige, wenn Sie die Bruttomarge pro Einheit zeichnen, würden
Sie die Produkte in der gleichen Reihenfolge wie dieses sehr breite Diagramm erhalten. Jetzt gibt Ihnen jeder dieser Plätze einen etwas anderen Einblick und eine etwas andere Rangfolge der Produkte. Oder Sie können einfach den gesamten Kontext zeigen, indem Sie es zum sehr breiten Diagramm machen, in dem die geschäftlichen Erkenntnisse oder das Produkt, das ich die meisten Bruttomargen generiert
hat. Und es erreichte dies durch den Verkauf einer sehr großen Anzahl von Einheiten. Oder Produkt B hat auch eine sehr große Menge an Bruttomarge erwirtschaftet. Und es hat dies erreicht, indem man eine sehr hohe Marge pro Einheit einnimmt. Okay, nur um zusammenzufassen, sehr breite Zeichen, sie sind im Wesentlichen ein Balkendiagramm ohne Leerzeichen dazwischen. Und Licht Balkendiagramme, können
Sie normalisieren oder nicht normalisiert die Achse. Sie haben zwei Gruppen von Schauspielern, was bedeutet, dass Sie gleichzeitig Zwei-Dimensionen zeigen können, was ein großer Vorteil ist, weil es Ihnen ermöglicht, mehr Kontakte zum Publikum zur Verfügung zu
stellen und die Vorspannung zu reduzieren, die von zeigt nur eine dieser beiden Dimensionen. Der einzige Nachteil ist, dass es nicht sehr häufig ist. Plus, so dass die Leute nicht vertraut mit diesem Diagramm, möglicherweise nicht in der Lage, es sehr leicht oder sehr schnell zu interpretieren, ohne etwas Hilfe und Erklärung von Ihnen, um sich zu orientieren. Ein weiteres Beispiel für einen Vergleich, den ich gerade aus Gründen der Fertigstellung aufgenommen habe, aber es ist eines, von dem ich kein großer Fan bin und das ist Radardiagramme, auch bekannt als Spiderweb Charts. Was wir hier planen, sind die Ergebnisse der Kundenzufriedenheit, die einige Dimensionen wie Preis, Qualität,
Auswahl enthält und wo wir
diese beiden Ergebnisse für zwei Geschäfte vergleichen , die sich in Boston befinden. Und eine Sache, die ich daran nicht mag, ist die Tatsache, dass Ihre Augen ziemlich viel hin und her gehen müssen , um diese Grafik zu lesen, besonders wenn Sie über acht verschiedene Metriken vergleichen. Und es sieht auch irgendwie seltsam aus, wenn Sie über vier Metriken vergleichen, denn dann IT, denn genau wie ein Quadrat, das einzige, was ich daran nicht mag, ist, dass es gut aussehen könnte. Wir haben die beiden Geschäfte sind sehr unterschiedlich zueinander, so gibt es eine sehr hohe Menge an Kontrast, aber es sieht irgendwie hässlich aus, wenn es eine Menge Überlappungen zwischen
den Geschäften gibt oder wenn Sie viele verschiedene Geschichten haben, die Sie versuchen zu vergleichen, haben
Sie die Möglichkeit, jeden Store separat zu plotten. Und wieder, für mich, Es ist okay, wenn die Geschäfte, die Sie vergleichen, sehr unterschiedlich zueinander sind, wie in diesem Fall, kann
ich sehen, dass Boston South, zum Beispiel, hat sehr anständige Ergebnisse über alles, vor allem in Bezug auf den Preis. Und ich kann sehen, dass Dorchester im Gegensatz dazu sehr schlechte Ergebnisse
hat und alles außer Dienstleistungen. Wenn es um die anderen Geschäfte geht, bieten
die Radarladungen keine sehr klaren Vergleiche, ohne dass
das Publikum viel Arbeit mit dem Augäpfel hin und her tun muss. Das ist es für Vergleiche. Im nächsten Abschnitt werden wir über Distributionen sprechen.
3. Teil 2: Verteilungen: Abschnitt zwei, Distributionen. Wenn es darum geht, Verteilung zu zeigen, dass Ihre beiden grundlegenden Optionen Histogramme, Streudiagramme
und wie Sie zwischen ihnen auswählen, um im Grunde darauf hinzukommen, ob Ihre Verteilung über eine einzelne Dimension oder zwei Dimensionen verteilt ist. Und Histogramme sind eine gute Option. Erstens ist es im Allgemeinen einfacher, von Ihrem Publikum zu lesen und zu, weil Sie im Grunde die Analyse der Daten durchführen, bevor Sie sie plotten. Sie wird von der Größe Ihres Datasets nicht beeinflusst. Denken Sie nun an dieses Liniendiagramm zurück, das wir uns
angesehen hatten , wo wir zwei Linien vergleichen, es ist okay, aber es wird sehr schnell kompliziert und wir haben 20. Aber weil Sie diese Gewächshäuser machen, haben
Sie auch einige Entscheidungen zu treffen, vor allem in Bezug auf, wie Sie Ihre Eimer definieren möchten. Scatterplots war auch großartig in Bezug auf leicht zu verstehen und mit minimalem Chart-Unordnung. Sie können es verwenden, wenn Sie versuchen, eine Verteilung über zwei Dimensionen anzuzeigen. Die Erkenntnisse sind jedoch nicht so klar, wie Sie für ein Histogramm anzeigen können da Sie nicht explizit definieren, was diese Buckets sind. Eine andere Sache, auf die man achten sollte,
für beide dieser beiden Arten von Graphen sind die Einflüsse von Ausreißern, die im Falle von Scatterplots kein Profi oder ein Betrüger sein können. Und ich zeige Ihnen, was ich meine, in ein paar Beispielen. Hier ist ein Beispiel für ein Histogramm, in dem wir zählen, wie viele
unserer Kunden in jede dieser vier Jahre alten Klammern fallen. Und Sie können sehen, dass wir über 1000 Kunden in der jüngsten Altersgruppe von 15 bis 19 Jahren und dass bis zu 2500 Kunden im Alter von 40 bis 44 Jahren ansteigen. Was ich mit dieser zweiten Kugel hier meine, ist, dass selbst wenn wir mehr Daten auf
diesem Datensatz sammeln und wir haben zehnmal mehr Kunden, um die Komplexität des Graphen gleich bleibt. Sie werden immer noch die gleichen Buckets haben, es sei denn,
Sie fügen vielleicht einen zusätzlichen Bucket für diejenigen unter 15 sind diejenigen, die über 79 sind. Aber im Allgemeinen wird die Komplexität des Diagramms nicht mit
mehr Datenpunkten skaliert , da wir
diese zusammenfassende Analyse der Daten durchführen , um diese Buckets zu erstellen. Sie haben eine Entscheidung zu treffen, ob Sie es auf eine 100% normalisieren wollen,
was sehr häufig getan wird, da
die meiste Zeit, wenn Sie eine Distributionsgeschäftsfrage haben, Sie darüber in Bezug auf Prozentsätze nachdenken. Und in dieser Grafik sehen wir, dass etwa 50% unserer Kunden im Alter von
3254 Jahren sind und rund 8,5% unserer Kunden über 70 Jahre alt sind. Und hier ist eine andere Grafik, in der wir versuchen zu charakterisieren, wie viele
unserer Spieße und Spieße im Grunde Lagerhaltungseinheiten sind, die Sie als ein einzigartiges Produkt betrachten können. Und haben wir derzeit wie viele dieser Mengen vorrätig? Eines der Dinge, über die Sie nachdenken müssen, ist, wie Sie die Bereiche für diese einzelnen Segmente definieren möchten , die ich Buckets aufgerufen habe. In der Standardeinstellung nehmen Sie den höchsten Datenpunkt, den Sie in diesem Bereich haben, und Sie teilen sich gleichmäßig auf die verschiedenen Segmente, die Sie in das Diagramm einfügen können. Aber was Sie in diesem Beispiel sehen können, ist, dass eine sehr winzige Zahl schieft, wo wir wirklich,
wirklich verbergen Einheitenzahl haben , wirklich alles andere in einen einzigen Bucket umschaltet. Und das ist nicht so nützlich, weil Sie im Grunde zu 99% Ihrer Spieße sagen, Sie hätten irgendwo zwischen 0 und 500 Einheiten zur Hand. Was Sie nach einem Blick auf die tatsächlichen Daten nicht tun können, ist die Anpassung der Bereiche, die Buckets, damit die Zielgruppe
ein klareres Bild von der Form dieser Verteilung sehen kann. Und Sie müssen nicht wirklich jeden Eimer die gleiche Größe machen. Hier können wir sehen, dass etwa ein Drittel unserer Spieße, wir haben 0 Einheiten zur Hand. Ist das absichtlich oder machen wir einfach einen schlechten Job, die Dinge auf Lager zu halten? Ich weiß es nicht. Ungefähr 45% unserer Spieße haben
wir irgendwo zwischen ein bis 20 Einheiten zur Hand. Und das ist immer noch ein ziemlich großes Segment. Möglicherweise möchten Sie dies in kleinere Segmente aufteilen, um mehr Details anzuzeigen. Und schließlich, all das Zeug auf dem langen Schwanz, das wir in der ersten Grafik gesehen haben, gibt es etwa 600 Spieße, in denen wir mehr als 5.000 Einheiten zur Hand haben. Und das Diagramm auf der rechten Seite ist nur nützlicher als das auf der linken Seite, da es eine größere Granularität um einen Teil des Datasets
bietet, der tatsächlich wichtig ist. Und die Anpassung der Cutoff für die Segmente ist etwas, das Sie eine Entscheidung treffen müssen, was Sie versuchen, Ihr Histogramm effektiver zu machen und weniger von dieser kleinen Anzahl von Ausreißern betroffen. Weiter zu Scatterplots. Scatterplots werden also verwendet, wenn Ihre Verteilung über zwei verschiedene Dimensionen statt nur eine verteilt ist. Und in diesem Fall planen wir Dollarumsätze auf der Y-Achse und Stückverkäufe auf der X-Achse. Und im Grunde ist das, wie viel Geld wir gemacht haben, gegen wie viele Einheiten, die wir verkaufen, wo jeder Kreis ein Produkt oder eine Schrägstellung darstellt. Obwohl das Streudiagramm alles zeigt und einer der Nachteile im Vergleich zu Histogrammen ist, dass es die Segmente nicht explizit definiert. Also, normalerweise müssen Sie das in Ihrer Beschreibung nennen oder Sie sprechen Punkt. Also in diesem Fall würde ich sagen, dass die meisten der Produkte irgendwo
zwischen 0 und 4 Millionen Dollar im Umsatz produziert . Und es gibt zwei große Ausreißer, die rund 18 Millionen Dollar produzieren. Und die Produkte werden
zwischen 0 bis 100 Tausend Einheiten mit einem großen alle sind bei 350 Einheiten verkauft . Und eine Sache, die ich in Bezug auf Ästhetik hervorheben werde ,
ist, dass Sie auch Ihre Marker entweder
nicht gefiltert oder teilweise transparent machen können, so dass Sie die Dichte besser auf einem überfüllten Diagramm anzeigen können. Nun, genau wie die Histogramme, werden
Streudiagramme stark von Ausreißern beeinflusst. Und ich werde das sowohl als Profi als auch als Betrüger setzen. Es hängt wirklich davon ab, ob diese Ausreißer oder die sinnvollen Dinge, die Sie nennen wollen oder nicht. Also hier habe ich das vorherige Beispiel genommen und ich habe nur ein paar weitere Datenpunkte hinzugefügt. Also, nämlich auf diesem auf der rechten Seite, gibt es ein Produkt, das in etwa $11 Millionen
Umsatz gebracht und F verkaufte etwa 1,8 Millionen in Einheiten. Und das ist ein synthetischer Datensatz. Ich weiß also nicht, ob dieses Produkt und dieses Verhalten wichtig ist oder nicht. Aber was Sie sehen können, ist, dass es im Grunde alles in
diese Ecke zerquetscht und viele Leerzeichen in diesem Diagramm erstellt hat. Nun ist das großartig, wenn dieser Datenpunkt das ist, worüber Sie sprechen möchten, denn genau hier werden sich die Augen Ihres Publikums natürlich konzentrieren. Aber wenn dies nicht das Wichtigste ist, das Sie nennen möchten, dann möchten Sie vielleicht diesen Ausreißer auslassen und es einfach zu einer
Notiz in der Fußnote machen , so dass Sie stattdessen
in diesem Bereich zoomen können, der die meisten Daten enthält, die tatsächlich anwesend ist. Eine letzte Anmerkung zu Streudiagrammen ist, dass die andere Entscheidung, die Sie treffen müssen, ist, ob
es tatsächlich sinnvoll ist, zwei unterschiedliche Histogramme zu erstellen, wenn die Beziehung zwischen den beiden Dimensionen in Bedingungen Ihrer geschäftlichen Erkenntnisse. So könnten Sie uns separat so zeigen, indem Sie zwei separate Histogramme erstellen. Und es könnte für Ihr Publikum klar sein, es zu verstehen. Aber was du verlierst, ist diese Beziehung zwischen den beiden Dimensionen. Okay, wie wär's mit einem komplizierteren Beispiel? Nehmen wir an, Sie möchten die 52 Wochen
wöchentlicher Verkäufe für einen anderen Satz von Produktkategorien vergleichen . Also in diesem Fall für Werkzeuge, was Sie sehen, ist, dass Sie 3252 Wochen in dem Jahr haben, wo die Verkäufe irgendwo zwischen 0 und 200 Tausend $ pro Woche liegen. Und die anderen 20 Wochen, wo der Gesamtumsatz zwischen $200.400.000 liegt. Ebenso können Sie das gleiche Histogramm für die anderen Produktkategorien erstellen. Und das ist ein Weg, um zu gehen. Wenn Sie nur fünf Kategorien haben, können
Sie diese fünf individuellen Histogramme erstellen und sie einfach nebeneinander setzen. Aber Sie können sich vorstellen, dass dies ein bisschen komplizierter wird, wenn Sie viel mehr Produktkategorien
haben, die Sie miteinander vergleichen möchten. Eine weitere Möglichkeit besteht also darin, jede Produktkategorie in Bezug auf ein Boxplot zusammenzufassen. Und das ist in der Regel, wie ein Boss kämpfen es aussieht. Und es wird manchmal auch als Box und Whisker Plot basierend auf der Form bezeichnet. Und es ist ähnlich wie ein Histogramm. Sie können die Segmente im Grunde definieren, aber anstatt sie basierend auf Ihrem eigenen Urteil für ein Boxplot zu definieren, definieren
Sie es im Grunde in Bezug auf die Quartile. Dies sind also die unteren 25% Ihrer Datenpunkte. Dies sind die nächsten 25% und die nächsten 25%, und dies sind die besten 25% Ihrer gesamten Datenpunkte. Dieser mittlere Bereich wird als Zwischenquartilbereich bezeichnet, der
die mittleren 50% Ihrer Datenpunkte enthält, und die Linie definiert den Median. Nun definieren viele Leute auch die Enden davon, nicht als Maximum und Minimum, sondern als 95 und fünf Perzentil. Und das hilft im Grunde, die Schnurrhaare nicht so lange zu machen. Sie haben wirklich, wirklich extreme Ausreißer. Wie würde das in unserem vorangegangenen Beispiel aussehen? Nun, dies ist ein viel kompakteres Display,
mit dem mehrere Distributionen direkter nebeneinander verglichen werden können. Und in Bezug auf die unmittelbare Einsicht, wenn ich mich neu orientiere in Bezug auf das Lesen der Schrott, kann
ich sehen, dass die Rucksäcke den höchsten durchschnittlichen Wochenumsatz während des ganzen Jahres haben. Die Werkzeuge sind die am wenigsten saisonale Produktkategorie wöchentliche Verkäufe fallen in einen sehr engen, konsistenten Bereich. Nun, Skier oder die saisonalste Kategorie mit fast keinen Umsatz während der Hälfte des Jahres. Und schließlich hat die
Oberbekleidung in der Hochsaison die höchsten wöchentlichen Verkäufe aller Kategorien. Jetzt wird diese Art von Handlung von der Statistik-Community geliebt und sie verwenden viel. Es ist großartig, um mehrere Sätze von 1D-Distributionen anzuzeigen. Und wie das Histogramm führen Sie auch zuerst eine Analyse für das Dataset durch, bevor Sie es anwenden. Das bedeutet, dass die zu erfassende Komplexität nicht skaliert wird, wenn Sie die Größe Ihres Datasets erhöhen. Der einzige Nachteil ist, dass es auch keine sehr häufige Handlung außerhalb der Statistikergemeinschaft ist, was bedeutet, dass Sie möglicherweise etwas begleiten und erklären müssen um sicherzustellen, dass Ihr nicht-technisches Publikum irgendwie die Einblicke. Dies ist für unsere Distributionen. Und im nächsten Abschnitt werden wir über Beziehungen sprechen, die an einen Verbundbogen gebunden sind.
4. Teil 3: Beziehungen: Abschnitt drei, Beziehungen. Beziehungen zu zeigen, werden
wir das Streudiagramm überdenken und es ist
informationell dichteres Gegenstück, das Blasendiagramm. Als wir Scatterplots und Trends der Darstellung von Verteilungen über zwei Dimensionen diskutiert. Wir haben gesagt, dass wir es durch
zwei getrennte Histogramme ersetzen können , wenn die Beziehung zwischen diesen beiden Dimensionen nicht so wichtig ist. Also hier in diesem Fall wird der Fokus diese Beziehung sein. Die geschäftlichen Erkenntnisse werden also sein, ob eine Beziehung existiert oder nicht. Und wieder, zwei der großen Vorteile für Streudiagramme ist, dass man, es ist einfach und verständlich und 2D ist ein sehr hohes Verhältnis von Informationen zu Tinte. Blasendiagramme sind identisch, außer wenn eine zusätzliche Dimension in Bezug auf die Größe der Marker hinzugefügt wird. Plus mehr, wenn Sie es wirklich einstopfen möchten, aber es wird nicht empfohlen, auszuhandeln, ist, dass die zusätzlichen Dimensionen auch zusätzliche Komplexität hinzufügen , die Sie verwalten müssen und entscheiden, ob die Geschäftsfrage wirklich notwendig, es gibt eine zusätzliche Komplexität. Und meistens können Sie
bessere und klarere Alternativen zur Kommunikation finden . In diesem Beispiel zeichnen wir die Anzahl der verkauften Einheiten im Vergleich zum Durchschnittspreis aus, wobei jeder Marker wieder eine bestimmte Schrägstellung oder ein Produkt darstellt. Und Menschen sind schwer verdrahtet, um Muster zu erkennen. Wenn Sie also ein Diagramm wie dieses zeigen, und besonders wenn Sie eine Regressionslinie darin einschließen, sagen
Sie im Wesentlichen, dass es nicht nur eine Beziehung zwischen diesen beiden Variablen gibt, sondern Sie implizieren auch eine kausale Beziehung. Jetzt in der Tourismusanalyse, Kausalität ist nicht leicht zu beweisen. Und so in der Regel, wenn es eine potenzielle kausale Beziehung mit den Menschen tun, ist sie neigen dazu, ihre Intuition zu verwenden, um zu entscheiden, ob diese Kausalität plausibel ist oder nicht. In diesem Fall sagen Sie entweder, dass, wenn Sie einen niedrigeren Preis für Ihr Produkt festlegen, Sie eher mehr davon verkaufen. Oder wenn Sie in der Lage sind, ein Produkt und eine Menge zu verkaufen, können
Sie Ihren Endkunden einen wettbewerbsfähigeren Preis bieten. Beide Szenarien scheinen im wirklichen Leben ziemlich plausibel zu sein. So können Sie diese Beziehung als Ihre Geschäftsmann-Site zeigen. Und Sie können diese Regressionslinie auch als eine Möglichkeit verwenden, diese Beziehung zu modellieren, haben
aber immer diese Darmprüfung, um sicherzustellen, dass diese Beziehung plausibel ist. Ein letzter Punkt ist, dass Sie, wenn Sie das Streudiagramm verwenden, im Allgemeinen die unabhängige Variable B auf
der x-Achse und die abhängige Variable auf der y-Achse erstellen möchten . Wenn also eine implizite Ursache und Wirkung vorliegt, möchten
Sie, dass sich die Kosten auf der x-Achse und der Effekt auf der y-Achse befinden . Hier ist ein weiteres Beispiel, bei dem wir die Reaktionsfähigkeit von verschiedenen Kunden betrachten, indem wir uns die Beziehung zwischen der prozentualen Umsatzsteigerung, die wir mit
jedem Kunden erreichen , und der Menge der Werbeaktion Rabatt, den wir ihnen angeboten haben. Und in Bezug auf diese Kunden haben
wir eine blaue Kohorte und eine rote Kohorte, die sich aus irgendeinem Grund sehr unterschiedlich zu verhalten
scheinen. Für die blaue Farbe können Sie sehen, dass, wenn Sie Ihren Rabatt von 0 auf 40% erhöhen, Sie in der Lage sind, und im Durchschnitt
eine Steigerung von etwa 160% zu erreichen . Während bei den Kunden in der roten Kohorte der Gesamtlift viel niedriger und abwechslungsreicher ist. Man könnte also sagen, die blauen Kohorten schienen mehr Beförderung zu sein, wirklich sensibel. Und der rote Kalte Krieg. Und übrigens, alle Daten, die ich in
den Beispielen in diesem Kurs verwende , unsere synthetischen Daten,
was bedeutet, dass ich sie entweder von Grund auf behandelt habe oder ich
einige Daten von meinem Unternehmen genommen und ich habe sie geändert, um sie zu anonymisieren. Im wirklichen Leben habe ich noch nie
Werbe-Reaktionsfähigkeitsdaten gesehen , die so klar aussehen wie hier gezeigt. Gehen Sie also zu Blasendiagrammen weiter, hier ist ein Beispiel, in dem wir die Marken hinsichtlich
ihres Preises und ihres Innovationsniveaus bewerten , was Sie vielleicht darüber nachdenken, wenn Sie im Merchandising arbeiten. Jeder Kreis ist also eine Marke und die Größe des Kreises
stellt nun die Größe der Marke in Bezug auf ihren Gesamtumsatz dar. Im Vergleich zum vorherigen Beispiel enthält
dies nun eine dritte kontinuierliche Variable als Größe der Marker. Und was das tut, ist, dass es uns erlaubt, Beobachtungen wie diese zu machen, dass der Großteil der Verkäufe durch preisgünstigere Produkte generiert wird. Wie wenn Sie die Marke zwischen der Mittellinie teilen, gibt es mehr Kreise und größere Kreise auf der unteren Hälfte im Vergleich zur oberen Hälfte. In Bezug auf Beziehungen werden
Sie sehen, dass es auch mehr Blasen in den diagonalen zwei Quadraten gibt als in diesen beiden Quadraten. Das bedeutet, dass Kunden vielleicht eher bereit sind, höhere Preise für innovativere Produkte zu zahlen. Und schließlich gibt es hier eine vierte Variable in Bezug auf
den nordamerikanischen gegenüber den internationalen Marken. Und wir können hier darauf hinweisen, dass die internationalen Marken dazu neigen,
die teureren und innovativeren Marken zu sein , und sie alle sitzen in dieser oberen rechten Ecke. Hier ist ein weiteres Beispiel für ein Blasendiagramm, nur um die Tatsache zu zeigen, dass Sie nicht unbedingt die x- und y-Achsen die kontinuierlichen Variablen machen müssen. Manchmal funktioniert es auch mit diskreten Variablen ziemlich gut. Hier betrachten wir die Gründe und die Mengen
der Rücksendungen in verschiedenen Produktkategorien. Jetzt werden Renditen zu einem größeren Deal für viele Einzelhändler, da sie ihr Geschäft wachsen. Weil e-comm-Segmente tendenziell
eine höhere Rendite im Vergleich zu In-Store-Einkäufen aufweisen. Daher ist es wichtig, die Gründe für
diese Rücksendungen zu verstehen und ob diese Gründe angesprochen werden können. Aus diesem Diagramm wird der Fokus Ihrer Augen natürlich auf zwei größere Kreise gerichtet sein, was großartig ist, weil sie die größten Problembereiche darstellen. Und was nicht interpretiert werden kann, ist, dass unsere größte Chance, Renditen zu reduzieren, eingeführt werden könnte,um die Entscheidungen
unserer Kunden zu
verbessern, um die Entscheidungen
unserer Kunden zu
verbessern wenn es um Schuhe und Damenbekleidung geht. Darüber hinaus finden einige unserer Kunden auch anderswo
bessere Preise, wenn es um Skier und Instrumente geht. Dies könnte also einige Preisentscheidungen für unsere Marketing-Abteilung führen, um einige Verkäufe oder Werbeaktionen durchzuführen. Und vielleicht gibt es auch einige zusätzliche Probleme, wenn es um die
Produktidentifikation von Bekleidung aus
unserem Lager geht Produktidentifikation von Bekleidung aus , wo sie die Produkte falsch entpacken und verpacken. Und schließlich ging ich online,
ich versuche, das lächerlichste Beispiel dafür zu finden wie viele Dimensionen Sie auf ein einziges Blasendiagramm passen können. Und das ist, was ich gefunden habe. Es gibt also für kontinuierliche Variablen und zwei diskrete Variablen in diesem einzelnen Diagramm. Und offensichtlich ist das nicht ideal. Und das ist nur, diese einzige Art von Arbeit, weil keiner der Kreise überlappt sich miteinander. Und die eigentliche Frage hier ist, das Publikum wirklich so viele Variablen gleichzeitig sehen muss? Oder wäre es klarer, wenn Sie die Informationen einfach auf mehrere Plots aufteilen? Selbst im Zeitalter von Tableau und Power BI, wo Sie die Möglichkeit haben, viele Informationen im
Voraus zu präsentieren und dem Benutzer das Klicken und Aufgliedern zu ermöglichen. Diese Art von Grafik wird immer noch nicht empfohlen. Dies ist, wenn eine Beziehung. Im nächsten Abschnitt werden wir über Kompositionen sprechen.
5. Teil 4: Kompositionen: Abschnitt vier Kompositionen. Für Kompositionen haben wir also unser gutes altes Tortendiagramm und das gestapelte Balkendiagramm. Tortendiagramme Holen Sie sich eine Menge Hass, aber sie sind eigentlich ziemlich gut in Bezug auf die leicht zu verstehen und es gibt definitiv effektiv. Für eine kurze Zusammenfassung, haben
Sie zwei Daten ist sehr einfach. Ich denke, die Hauptkritik für die Verwendung von Tortendiagrammen ist, dass, wenn Sie es viele verschiedene Segmente unterschiedlicher Größe haben, Sie ihre relativen Unterschiede im Vergleich zu einem einfachen Balkendiagramm nicht sehr
leicht sagen können. Dennoch möchten Sie wahrscheinlich 3D-Explosionsdiagramme vermeiden, da etwas wie dieses in Ihrem Teil wahrscheinlich Ihre Glaubwürdigkeit in der Analytics-Community verringern
wird . Gestapelte Balkendiagramme sind
wieder ein weiteres gängiges Grundnahrungsmittel , vor allem, weil sie leicht zu verstehen sind, aber es gibt definitiv auch viel anspruchsvollere Optionen für diesen Abschnitt, die wir behandeln werden. Erstes Beispiel. So planen wir die Aufteilung zwischen den Umsätzen zum
regulären Preis gegenüber dem Verkauf zu einem ermäßigten Promo-Preis. Und wir haben dies zu einem gestapelten Balkendiagramm gemacht und es so normalisiert, dass wir uns mehr auf die Unterschiede in der Zusammensetzung und wie sich das im Laufe der Jahre ändert
konzentrieren können . Aber dabei lassen wir eine Menge Kontext in Bezug auf die Veränderung der tatsächlichen Umsatzerlöse in diesen Jahren aus. Das bedeutet, dass es zwei mögliche Szenarien gibt, die sehr unterschiedliche Antworten warnten. Einmal könnte ein Pfeil sein, dass unser Gesamtumsatz den letzten zehn Jahren relativ flach
war. Und ein größerer und größerer Teil
unseres Gesamtumsatzes verlagert sich vom regulären Verkauf zu Promo-Verkäufen. Und eine Situation wie diese, was wäre ein wenig besorgniserregend, weil es bedeutet, dass unsere Aktionen keine inkrementellen Verkäufe generieren. Sie kannibalisieren einfach unsere regulären Verkäufe. Es kann jedoch auch ein anderes Szenario sein, in dem unsere regulären Zellen tatsächlich stabil halten und wir tatsächlich das inkrementelle Wachstum
unseres Gesamtumsatzes aufgrund des Wachstums der Werbeaktionen erhöhen . Also zwei sehr unterschiedliche Szenarien darunter. Und wir können nicht wirklich sagen, welches ist, wenn wir die Handlung 200% im anfänglichen normalisierten Stack-Bardiagramm normalisieren. Also hier ist ein weiteres Beispiel. Nehmen wir an, Sie sind verantwortlich für die Kundenerfahrung und senden ihnen regelmäßig Umfragen darüber, wie sie ihre Zufriedenheit auf dieser einen bis zehn Skala bewerten. Eine sehr häufige Metrik, die Einzelhandelsgeschäfte gerne verfolgen, ist etwas namens Net Promoter Score, bei dem Sie den Unterschied zwischen Ihrem Prozentsatz der Promoter und Ihrem Prozentsatz an Kritikern und dem, was Sie
noch übrig sind mit wird in der Regel als die Wahrscheinlichkeit interpretiert Ihre aktuellen Kunden Ihre Produkte oder Ihre Dienstleistungen anderen empfehlen. Nun, wie im vorherigen Beispiel, in dem Sie eine Zusammenfassungsmetrik berechnen und das plotten,
was Sie wirklich tun, ist, dass Sie aus Einfachheit optimieren, aber Sie handeln etwas mehr von diesem Kontext ab. Also in diesem Fall nehmen Sie die NPS-Punkte für diese acht Geschäfte mit ihren Stadtnamen gekennzeichnet und Sie erhalten dieses Ranking. Und wann immer Sie dieses einzelne metrische Ranking haben, ist
die Grafik immer sehr sauber und sehr leicht zu verstehen. Das Beste ist Fort Worth und das schlimmste Schweben ist Los Angeles. Aber es könnte ein paar Details geben, die hinter dieser Einfachheit verborgen sind. Wenn Sie also den Zusammenbruch der einzelnen Komponente betrachten, sehen Sie vielleicht, dass Philly und New York ein bisschen ein Ausreißer sind. Die ziemlich speichern aus irgendeinem Grund ist es sehr polarisierend. Es hat tatsächlich die höchste Zahl von Kritikern, aber es hat auch eine sehr hohe Anzahl von Promotoren. Es wäre also interessant, sich damit zu befassen und verstehen, warum das so ein polarisierter Laden ist. Und umgekehrt, New York hat nicht wirklich so viele Kritiker, aber die meisten Leute sind ziemlich neutral und sie haben eine sehr, sehr geringe Anzahl von Promotern, um die Tracker auszugleichen. Also wieder, es wird interessant sein, weit zu verstehen. Wenn Ihr Ziel es also ist, die Ursache der Kritiker zu verstehen,
dann ist die NPS-Gesamtpunktzahl möglicherweise nicht die beste
Metrik, auf die Sie sich konzentrieren sollten, weil Sie nicht möchten, dass Ihre Anzahl von
Promotern Ihre Anzahl von Kritikern verdeckt, weil Sie nicht möchten , dass Ihre Anzahl von Promotoren Ihre Anzahl von Kritikern verbergen es ist die Anzahl an Traktoren, die für Ihr Publikum am meisten umsetzbar sind, für diese besondere Geschäftsentscheidung. Was Sie stattdessen tun könnten, ist die einzelnen Komponenten in einem gestapelten Balkendiagramm zu plotten. Aber Sie können mehr Wert auf die Kritiker legen,
indem Sie sie durch eine negative Metrik getrennt von den anderen beiden Werten machen. Und zwei durch Ranking der Geschäfte basierend auf dieser Metrik. In diesem Fall könnten Sie den New Yorker Laden
in der Mitte des Rudels in Philly Store auf der Unterseite der Packung haben . Wenn Sie sie nur auf der Grundlage der Kritiker bewerten. Sie können diese MPS-Punktzahl auch
überlagern, indem Sie die NPS-Punktzahl als Kreismarkierungen überlagern. Ex Beispiel sprechen wir darüber, was ein Diagramm Diagramme. Also Waterford-Diagramme ist eine weitere Option, um die einzelnen Komponenten eines Gesamtbetrags anzuzeigen. In diesem Fall zeigen wir die monatlichen Einnahmen und wie sie sich zum gesamten Jahresumsatz addieren. Ein Vorteil dieser Handlung ist, dass
Sie für jeden Monat auch die kumulierte Summe aller vorherigen Monate sehen können. Aber der Kompromiss hier ist, dass es schwieriger macht, die Einnahmen zwischen jedem Monat zu vergleichen. Und wenn das die wichtigere Einsicht ist, dann könnte es sinnvoll sein, es als normales Balkendiagramm oder
als Liniendiagramm zu plotten, um diesen Vergleich besser zu zeigen. Wasserfälle sind jedoch sehr nützlich, wenn Ihre Metrik sowohl positive als auch negative Zahlen aufweist, da die Gesamthöhe des Graphen im Verhältnis zur größeren Gesamtsumme nicht so
stark komprimiert wird . Und das ist, warum als häufiger für Finanzmetriken wie Cashflow oder Gewinn verwendet. Also in diesem Fall ist jeder Balken ein wenig größer und die kumulative Summe ist auch ein bisschen nützlicher, weil Sie sehen können, zum Beispiel ist es an diesem Punkt im Monat August, dass das Unternehmen einen positiven Cashflow für den Rest erreicht des Jahres. Und das ist etwas, das man auf einem normalen Balkendiagramm nicht so leicht erkennen kann. Ein letztes Beispiel, bevor wir diesen Abschnitt einschließen. Nehmen wir an, Sie erhalten einen Datensatz, der in diesem Jahr Umsatz im Vergleich zum Umsatz im Vorjahr hat. Die Differenz zwischen diesem Jahr und dem letzten Jahr und die prozentuale Differenz. Und das ist nach Produktkategorien segmentiert. Und sagen wir, dies ist eine ziemlich lange Liste von 100 verschiedenen Produktkategorien. Und das Ziel hier ist es, hervorzuheben, was
unser Gesamtgeschäft vorangetrieben hat und wo wir uns für das nächste Jahr konzentrieren sollten. Nun, ich möchte darauf hinweisen, dass dies ein weiterer Fall ist, in dem diese Tabelle tatsächlich ziemlich gut ist, um diese Zahlen anzuzeigen. Und abgesehen von der Tatsache, dass dies ein ziemlich langer Tisch mit 100 verschiedenen Kategorien ist. Sie können nach diesen vier Metriken immer noch sortieren und oben und unten in dieser Liste sehen. Aber wenn Sie geneigt sind, dies zu plotten, haben
Sie ein paar Optionen zu berücksichtigen. Und das ist eigentlich eine Interview-Frage. Und ich sage, etwa 50% der Kandidaten, die interviewt
haben, neigen dazu, Option Nummer eins auszuwählen, nämlich die abgeleiteten Differenzmetriken zu ignorieren und sich auf nur ein $2-Werte zu konzentrieren, die dieses Jahr im Vergleich zum letzten Jahr darstellen. Und plotten Sie sie nebeneinander, damit das Publikum die Unterschiede beurteilen kann. Und die andere Hälfte der Kandidaten neigen dazu,
entweder Option zwei oder Option Nummer drei auszuwählen , wo Sie die zugrunde liegenden Verkaufsdaten ignorieren und stattdessen die Kategorien hervorheben, die die größte oder die kleinsten Dollar-Unterschiede zwischen diesem Jahr und dem letzten Jahr. Und eine Sache, die Sie vielleicht bemerken, ist, dass ich hier nur die oberen und unteren Kategorien zeige, und ich zeige nicht die ganze Liste von 100 Kategorien. Für alle drei dieser Diagramme haben
wir das Problem, dass wir eine sehr, sehr lange Liste haben, nicht wirklich angesprochen. Das zweite, was Sie vielleicht bemerken, ist, dass diese beiden Listen tatsächlich sehr unterschiedlich voneinander sind, obwohl sie beide zeigen die Top-Gewinner in einem unteren Verlierer, sie malen ein ganz anderes Bild in Bezug darauf, wer die Gewinner und Verlierer sind. Also, welches von ihnen
nützlicher ist , um die allgemeine Gesundheit des Unternehmens zu beurteilen. Das ist eine der Fragen, die wir beantworten mussten. Eine Möglichkeit, beide dieser beiden Punkte zu adressieren, besteht darin, etwas namens Baumkarte zu verwenden, wo die gemeinsame Einrichtung ist, die Größe des Quadrats B in diesem Jahr Verkäufe für
jede Kategorie zu machen und passiert durch die prozentuale Veränderung für das letzte Jahr koloriert werden. Der Baum-Map-Algorithmus setzt automatisch alle Quadrate vom größten bis zum kleinsten, von links oben nach rechts unten. Und das hilft wirklich, das Problem mit sehr langen Schwänzen zu lösen, da die kleinsten Segmente automatisch
weniger Platz und damit weniger Aufmerksamkeit Ihrer Zielgruppe einnehmen . Die zweite Sache, die anspricht, ist die Tatsache, dass es in der Regel die kleineren Segmente sind
, die oft die größten Ausreißer sind, wenn es um prozentuale Veränderungen geht. Dies hilft also auch, die Priorisierung des Publikums zu fördern, indem sie ihre Aufmerksamkeit auf
die größeren Quadrate lenkt, die stärker
gefärbt sind , da diese das Segment sind, das tatsächlich den größten Einfluss hat. Und was das Gesamtgeschäft anbelangt, nicht die wirklich kleinen auf der rechten Ecke, egal wie groß diese prozentualen Veränderungen sind. Also in diesem Fall ist mein größter Takeaway, dass der bedeutendste Bereich, den wir in diesem Jahr übertreffen, unsere Reise-Rucksäcke, Küche, Backcountry Schuhe. Und wo wir wirklich untertrieben sind, ist in Bereichen wie Fahrrädern, Beleuchtung und Frauenlicht, Frauen Lifestyle-Oberbekleidung. Und diese Jungs hier, obwohl sie stark gefärbt sind und
massive prozentuale Veränderungen im Vergleich zum Vorjahr haben . Sie könnten mehr Aufmerksamkeit in anderen Teilen des Armaturenbretts in Bezug auf
das Wachstum eines kleinen Segments warnen . Aber sie sind wohl weniger relevant in Bezug auf die Bereitstellung
einer Gesamtübersicht darüber, was das Geschäft im vergangenen Jahr wirklich antreibt. auf unsere vorherige Handlung zurückgehen, können
Sie diese Option zwei sehen, da sie sich viel besser an dieser TreeMap ausrichtet, weil sie
die Produktkategorien zeigt , die die größte Dollaränderung im Vergleich zum Vorjahr haben, Während die meisten von denen, die hier sind und die Option Nummer drei, sie sind nicht auf der Baumkarte beschriftet, weil sie neigen dazu ,
die wirklich kleinen sind, die in der unteren rechten Ecke enden. Treemaps waren also eine Note für den Vergleich von zwei Sätzen von Variablen, besonders wenn eine dieser Variablen eine Richtung alt ist wie Verkäufe, und die andere ist bidirektional wie Veränderungen im Umsatz. Und dieses Beispiel beleuchtet wirklich die gängigen Wege, wie ich
Treemaps in Dashboards und insbesondere für Einzelhandelsunternehmen gesehen habe . In Bezug auf die Vorteile, es wirklich hervorhebt, was wichtig ist, wie verstecken den langen Schwanz von kleinen Gegenständen, die nicht das Gesamtgeschäft treiben. In Bezug auf Negative. Ich denke, mittlerweile fängst du an, das Muster zu sehen, dass viele dieser weniger verbreiteten, weniger konventionellen Plots ein bisschen mehr Erklärung
und Mühe seitens des Publikums erfordern , sie zu verstehen und zu lesen. Aber sobald sie vertraut sind, bieten
sie tatsächlich viele Vorteile gegenüber den konventionelleren Liniendiagrammen und Balkendiagrammen. Dies ist also das Ende für Kompositionen, und Sie sind mit der Auswahl der besten Methode zum Plotten eines Datasets fertig . Und in der nächsten Sitzung werden wir
verschiedene Dinge behandeln, wenn es um die Behandlung und effektive Dashboard geht.
6. Teil 5: Kontext, Clutter, Farbe: Abschnitt fünf, Kontext, Unordnung und Farbe. So oft ist der Kontext, den Sie Ihrer Zielgruppe zur Verfügung stellen,
so wichtig wie die tatsächlichen Informationen, die Sie präsentieren. Hier ist ein Beispiel, dem ich vor vielen, vielen Jahren begegnet bin, und Sie können sehen, dass es ein wenig veraltet ist, aber ich habe dieses Beispiel oft verwendet, um diese Demonstration zu machen. Also war ich in meinem Auto und hörte mir die Nachrichten im Radio an. Und der Nachrichtensprecher sagt, heute an der Börse, der Dow Jones Industrial Average ging um 102 Punkte, während die Nasdaq fiel 35 Punkte. Also dachte ich, okay, klingt so, als wäre es ein ziemlich schlechter Tag für den Dao,
aber die Unternehmen, die in einem Azteken gelistet sind, haben nicht so schlimm gemacht. Aber was ich nicht wusste, war der Kontext, dass Adele ging von 8,281 Punkte auf 8,179 Punkte, das ist ein Rückgang von 1.2%, während die nasdaq, als sie fiel 2.2%. Für einen Investor ist diese prozentuale Veränderung eigentlich viel wichtiger. Also war es eigentlich viel schlimmer für die Nasdaq als der Dow, wenn Sie diesen Kontext haben. Aber es gibt auch ein weiteres Stück des Wettbewerbs, das ist, dass die Nasdaq voll von Tech-Aktien ist von Natur aus volatiler als der Zweifel. Ein Plus oder minus 2% des Schwungs ist also nicht wirklich ungewöhnlich. Während der Dow 1,2% an einem einzigen Tag fiel, war eigentlich eine ziemlich große Sache zu dieser Zeit. Der Punkt hier ist also, dass der Kontext nicht nur einen kleinen Einfluss auf die Interpretation der Erkenntnis
hat,
sondern die Interpretation tatsächlich komplett umkehren kann. Hier ist ein weiteres Beispiel, das auf unserem vorherigen Blick auf die Treemap basiert. So haben wir bei einem Einzelhandelsunternehmen zwei Produktkategorien, Herren- und Damenbekleidung. Und wenn man sich nur die prozentuale Veränderung des Umsatzes im Jahresvergleich anschaut, könnte
man daraus schließen, dass die Herrenbekleidung größten Teil des Wachstums für das Gesamtgeschäft
antreibt,
vorausgesetzt, dass beide Kategorien ungefähr die gleiche Größe haben . Wenn Sie jedoch den Kontext hatten, wie dieser Prozentsatz berechnet wird, wird
Ihre Zielgruppe sehen, dass die
Mensa Pearl aufgrund eines deutlich niedrigeren Basisumsatzes
im Vergleich zum Vorjahr eine viel größere prozentuale Veränderunghatte Mensa Pearl aufgrund eines deutlich niedrigeren Basisumsatzes
im Vergleich zum Vorjahr eine viel größere prozentuale Veränderung . Was wiederum ein sehr häufiges Verhalten bei den Verkäufen ist, da Sie kleinere Kategorien viel größere prozentuale Veränderungen haben werden. Und es ist wirklich die größere Damenbekleidung hier, die das tatsächliche spürbare Dollarwachstum
antreibt. Auch wenn
es als Prozentsatz des letzten Jahres nicht so dramatisch aussieht. Hier ist noch eine auf Verträgen. Hier sehen wir uns zwei sehr häufige Lieferketten-Lagermetriken an, Dr. Lager, was ist, wie viel Zeit es dauert, um Ihre Waren zu empfangen und
wegzulegen , die es gerade vom Anbieter erhalten hat, und wählen Sie das Schiff, das ist, wie viel Zeit es bis zum Lager braucht, um ein Produkt zu holen und zu
verpacken, das er an einen Kunden versenden möchte. Also, wenn Sie eine Supply Chain für Sie vielleicht an diesen beiden Daten suchen und Sie haben eine grobe Vorstellung davon, ob diese gut oder schlecht oder über Durchschnitt sind. Aber für jemanden, der kein Experte ist, gibt es hier
wirklich keine ganze Menge von Kontexten außer vielleicht, diese beiden Zahlen
miteinander zu vergleichen und sich zu fragen, warum ein Schiff ausgewählt fast doppelt so lange dauert wie Dr. Lager. Um also mehr Kontext zu schaffen, haben
wir ein paar verschiedene Möglichkeiten. Wir können diese beiden Zahlen mit historischen Trends vergleichen,
wie zum Beispiel die Metriken aus der letzten Woche? Oder wenn es sich um eine wirklich saisonale Metrik handelte, was war der Vergleich zum gleichen Zeitraum des letzten Jahres? Wir können sie auch mit anderen Benchmarks vergleichen, wie z. B. der Anzahl der Tage. In anderen vergleichbaren Lagern oder was als Industriestandard für diese Metriken angesehen wird. Wir können sie auch einfach mit ihren Zielen und ihren Zielen vergleichen. Wenn wir also ein Ziel der heutigen niederländischen Aktien setzen, dann sind wir unserem Ziel weit voraus. Aber wenn unser Ziel eines Tages ist, dann sind wir weit hinter uns. So kann der Kontext so einfach sein. es, unserem Publikum zu ermöglichen, schnell und Unser Ziel istes, unserem Publikum zu ermöglichen, schnell und
eindeutig die wichtigsten Erkenntnisse zu identifizieren
, die ihnen bei ihren geschäftlichen Entscheidungen helfen werden. Eine Möglichkeit, dies zu tun, besteht darin, ihnen
die richtigen Kontexte zur Verfügung zu stellen , die hervorgehoben werden, wenn etwas außerhalb des Normalwerts liegt. Ein weiteres Thema, das ich ansprechen möchte, ist aufgeladenes Unordnung, das ich in diesem Kurs einige Male erwähnt habe. Hier ist ein Beispiel, das ich im Internet gefunden habe, wo wir
ein sehr koloriertes Balkendiagramm haben , das
die jährliche Inflationsrate in Lebensmittelgeschäften in verschiedenen Städten zeigt . Und das ist ein bisschen wie ein Strohmann, weil man normalerweise keine Diagramme sieht, die in Bezug auf Unordnung so schlecht sind. Aber um es zu bereinigen, denke ich, wir können einige der bewährten Praktiken anwenden, die wir behandelt haben ,
wie eine, die die Stadtnamen leichter zu lesen, indem Balken horizontal sein müssen, um die 3D-Farbe in Balken loszuwerden
und die Farben insgesamt, weil sie keine zusätzlichen Informationen vermitteln, die nicht bereits durch die Länge der Balken vermittelt werden. Und schließlich ist es auch eine gute Praxis, die Reihenfolge
der Bars auch in einer sinnvollen Reihenfolge zu machen . Jetzt gibt es auch einen Mann namens Edward Tufty,
der ein Guru ist , wenn es um Datenvisualisierung geht. Und er verursachte viele Bücher zu diesem Thema. Und eines der Dinge, die er wirklich konzentriert sich auf mehr als jeder andere ist, wie weit Sie gehen können, wenn es darum geht, Diagramm überladen zu minimieren. Also, was er bevorzugen könnte, ist etwas mehr wie dieses, wo Sie alle Ihre Achsen vollständig losgeworden waren, einschließlich der Rasterlinien und der Umriss der Balkendiagramme. Stattdessen zeigen Sie nur die Länge der Balken als subtrahierende Farbe für die Prozentzeichen an. Seine Philosophie ist, dass Sie die geringste Menge an
Tinte auf der Seite zeigen möchten , so dass Ihr Publikum
ihre Aufmerksamkeit nur auf die Tinte konzentrieren kann , die tatsächlich eine entscheidende Rolle
spielt und Informationen vermittelt. Okay, das nächste Thema wird ein kurzes Thema zur Auswahl des Farbschemas sein. Es gibt also eine Website namens ColorBrewer, die Ihnen hilft, den optimalen Satz von RGB-Codes für
Farben auszuwählen , die die beste Art von Kontrast und unter verschiedenen Szenarien bieten. Hier
sind beispielsweise die Standardfarben aus früheren Versionen von Microsoft Office. Und hier ist, was Farbgebräu würde in Bezug auf die
Maximierung dieses Kontrastes empfehlen , wenn Sie eine Fünf-Farben-Grafik haben. Und das wird wahrscheinlich jetzt etwas weniger relevant denn die meisten Konferenzräume sind jetzt mit Flachbild-TVs ausgestattet, die einen wesentlich besseren Kontrast bieten. Aber in den Tagen, in denen Sie eine Präsentation im Büro Ihres Kunden halten werden, wissen
Sie nicht, wie die Umgebung aussehen
wird und ob sie
einen wirklich beschissenen, hochwertigen Overheadprojektor in einem Raum haben werden oder nicht , die zu hell beleuchtet ist, dann möchten Sie in diesem Fall sicherstellen, dass Ihr Publikum die Farben
Ihres Graphen immer noch bequem lesen kann , indem Sie sicherstellen, dass Sie den Kontrast maximieren. Das letzte Thema bezieht sich nur auf einige Kühnheit Material zu Drill-Down-Features. So wird dies ein wenig leiden spezifisch sein, was nicht die Absicht des Kurses ist. Keine erschöpfende Liste. Dies ist nur eine, die ich zeigen möchte, um zu versuchen und den Punkt zu machen , dass fantastische Dashboard-Build-Tools wie Tableau und PowerPoint, Sie haben die Möglichkeit, nicht alles auf der gleichen Seite passen, aber Sie können es interaktiv machen, so , dass die Zuschauer das Gesamtbild erhalten und dann
nach unten klicken , um die Details anzuzeigen, die sie interessieren. Also der erste ist Sparklines. Und Sparklines sind im Grunde nur ein Minecraft. Und Apple tut dies wunderschön in ihrem Stock Cap, indem Sie eine
winzige kleine Grafik für jede Aktie zeigen und wie das den ganzen Tag gestrengt hat. Und dann, wenn Sie davon fasziniert waren, können
Sie immer tiefer nach unten bohren, auf eine dieser Aktien
klicken und
mehr Details über die tatsächlichen Trends erhalten , die weiter als einen Tag zurückgehen. Ein weiteres gutes Beispiel ist das Maus-Rollover-Pop-up, das in Tableau als QuickInfos bezeichnet wird. Dies ist also eine Karte, die durch eine bestimmte Metrik gefärbt wurde. Und dann, wenn ein bestimmter Bereich der Karte Sie interessiert, dann können Sie Ihre Maus über diesen Bereich setzen. Und ich gebe Ihnen ein Pop-up, in dem Sie viele weitere Details einfügen können, auch in einer ganzen anderen Grafik. Ein weiterer Kommentar, den ich hinzufügen werde, ist, dass, obwohl es sich einen Kurs zur Datenvisualisierung und zum Dashboard-Design handelt, mir klar ist, dass ich nicht so viel über Karten gesprochen habe. Auch wenn ich ziemlich überrascht bin, wie weit Karten im Dashboard vorkommen. Und das ist, weil meine Meinung ist, dass es sei denn, die geschäftliche Frage
, die Sie zu beantworten versuchen, spezifisch mit Geographien zusammenhängt. Wie wenn Sie ein Dashboard in Bezug auf Logistik
erstellen, bieten Karten keinen echten Wert oder Einblick. Alles, was es tut, ist, dass es Details in
die großen Bevölkerungszentren verkrampft und viele Leerzeichen überall sonst hinterlässt. Aber ich gebe zu, dass sie sehr beliebt sind und das Publikum neigt dazu, Maps zu lieben, nur weil sie wirklich cool aussehen. Ein letztes Beispiel ist eine Umschaltfunktion, die Sie verwenden können, um zu über-Metrik zu
wechseln, die Sie über eine gesamte Seite in Power BI verwenden Dies ist eine erweiterte Anwendung von Schaltflächen und Lesezeichen. In diesem Beispiel haben wir also, dass Sie die Zielgruppe haben, die es vorziehen, dieselbe Anzahl von Zahlen, aber unter verschiedenen Währungen zu betrachten. Wenn das Publikum also keine Vergleiche zwischen diesen Währungen vornehmen muss, dann ist es eine bewährte Vorgehensweise, nur eine dieser drei
Zahlensätze gleichzeitig mit dieser Schaltfläche anzuzeigen , damit das Publikum hin und her wechseln anstatt die Menge der Informationen zu Seite verdreifacht, indem alle drei Währungen angezeigt werden. Das Gesamtthema zwischen diesen drei Funktionen, die ich verwenden möchte, besteht darin, dass Sie bestimmte Informationen vor der Hauptansicht Ihres Dashboards verstecken können, was es dann viel sauberer aussieht, aber immer noch das Publikum erlauben
, um weitere Details in den Bereichen zu erfahren, an denen sie interessiert sind. Okay, das ist also das Ende dieses Abschnitts. Und in der nächsten Sitzung geben wir einen schnellen Abschluss.
7. Schlussbemerkung: Fazit. Vielen Dank, dass Sie diesen Mini-Kurs durchlaufen haben, haben
wir das Thema Datenvisualisierung in diese vier Abschnitte segmentiert, die ich Professor Andrew Abella gutschreiben werde, wir haben uns die Vor- und Nachteile
der mehr grundlegende und gängige Methoden, um unsere Daten zu plotten, um allgemeine geschäftliche Fragen zu beantworten. Wir haben auch einen Blick auf einige dieser fortgeschritteneren Optionen und in welchen Situationen
lohnt es sich, die Einfachheit
zugunsten von etwas zu tauschen , das reich an Informationen ist. Sie daran, dass unser Ziel darin besteht,
unsere geschäftlichen Erkenntnisse effektiv und objektiv zu kommunizieren . In Bezug auf den Prozess zum Erstellen
eines neuen Dashboards und Sie Rapport oder eine Ad-hoc-Analyse. Wir konzentrieren unsere Zeit hauptsächlich auf Schritt Nummer zwei. Aber ich muss noch einmal betonen, dass Ihre Bemühungen, das anzuwenden, was wir in Schritt Nummer
zwei behandelt haben , stark behindert werden, wenn Sie nicht eine sehr gründliche Aufgabe
durchlaufen , Schritt Nummer eins abzudecken. Und meiner Erfahrung nach ist eine der größten Kritikpunkte für
Leute, die hoch ausgebildet und hochqualifiziert in
den technischen Aspekten von Analytics sind , dass sie die geschäftlichen Fragen und die geschäftlichen Anforderungen nicht vollständig verstehen. Und deshalb erstellen sie entweder ein sehr minderwertiges Produkt oder sie fummelten durch das notwendige Change Management, um sicherzustellen, dass
das von ihnen erstellte Dashboard verwendet und angepasst wird. Dies ist der erste Kurs, den ich zusammengestellt habe. So wird jedes Feedback über den Inhalt oder die Lieferung sehr geschätzt werden. Ich versuche nicht, auf Komplimente zu fischen, aber jede konstruktive Kritik wird für mich sehr nützlich sein. Einschließlich, ob Sie an
einem dieser anderen Themen interessiert wären,
die ich in Betracht gezogen habe Dazu gehören der Schritt Nummer eins, das
Verständnis der
Geschäftsfrage, die Bedarfsplanung und die Prognose. So erstellen Sie eine effektive Präsentation und PowerPoint-Folien, die die komplementäre Komponente des Storytelling ist. Und schließlich die Liste der Fallstudien mit den gängigsten Arten von Datenanalysemodellen, die in der Geschäftswelt verwendet werden, wie Korbanalyse, Produktsegmentierung, Store-Clustering, Marketing. In Ordnung, also nochmals vielen Dank und herzlichen Glückwunsch zum Abschluss dieses Kurses. Ich hoffe, du hast es nützlich gefunden.