6 Prinzipien einer effektiven Datenvisualisierung

Schlüsselprinzipien für die Erstellung nützlicher und informativer Diagramme



Die Datenvisualisierung ist ein wesentlicher Schritt zum Verständnis der Datenwissenschaft. Hier präsentieren und berichten Sie Ihre Ergebnisse in einem grafischen Format, das intuitiv und leicht verständlich ist.



Die Datenvisualisierung erfordert viel Arbeit, viel Reinigungs- und Analysearbeit erfordert das Destillieren und Verwandeln schmutziger Daten in wunderschöne Grafiken und Diagramme. Aber selbst mit den vorbereiteten Daten müssen Sie bestimmte Prinzipien oder Methoden einhalten, um nützliche, informative Grafiken zu erstellen.



Beim Schreiben dieses Artikels habe ich mich jedoch von Edward Tafts Buch Beautiful Evidence inspirieren lassen, das sechs Prinzipien enthält, wie Datengraphen nützlich gemacht werden können. Es sind diese Prinzipien, die nützliche Diagramme von nicht hilfreichen trennen.



Dieser Artikel ist auch stark von Roger D. Pengs explorativer Datenanalyse in R inspiriert. Er ist kostenlos bei Bookdown erhältlich und kann gelesen werden, um mehr über EDA zu erfahren.



Schauen wir uns diese Prinzipien genauer an.





Ein Beispiel für die Datenvisualisierung in Our World in Data






1. Vergleich zeigen (Kontroll- und Versuchsgruppen)



Der Nachweis von Vergleichen ist die Grundlage guter wissenschaftlicher Forschung. Beweise einer Hypothese beziehen sich immer auf etwas anderes. Nehmen wir ein Beispiel: Sie sagen: "Dunkle Schokolade verbessert die Konzentration und Lernfähigkeit." Die wichtige Frage in dieser Aussage lautet "im Vergleich zu was?" Ohne Vergleich (relative Hypothese) ist die Aussage nutzlos.



Ein Weg, um einen Vergleich zu zeigen, ist mit den Kontroll- und Behandlungsgruppen. Leute in einer Gruppe werden Schokolade essen, Leute in der zweiten Gruppe nicht. Auf diese Weise können Sie die Auswirkungen von Schokolade auf die Konzentration und Lernfähigkeit anhand von Testergebnissen oder durch Messung der Gehirnaktivität vergleichen.



Wenn Sie Diagramme für die Präsentation Ihrer Forschung erstellen, können Sie die Kontroll- und Behandlungsgruppen mithilfe des Schnurrbartfelds grafisch darstellen. Auf diese Weise erhalten die Leser eine klare Vorstellung von der Wirkung des Experiments.



Wenn Sie Diagramme zur Darstellung Ihrer Forschung erstellen, können Sie die Kontroll- und Behandlungsgruppen mithilfe eines rechteckigen Diagramms grafisch darstellen. Auf diese Weise erhalten die Leser eine klare Vorstellung von den Folgen der Behandlung.



2. Kausalität und Erklärung



Was folgt, ist eine Erklärung, die die Kausalität beim Nachdenken über die Frage zeigt, die Sie zu beantworten versuchen. Wenn Sie gezeigt haben, dass ein Effekt in der Versuchsgruppe, aber nicht in der Kontrollgruppe erzielt wird, müssen Sie aus den Beweisen eine Hypothese formulieren, warum dies so ist.



Zurück zum vorherigen Beispiel: Nehmen wir an, die Probanden in der Versuchsgruppe erzielten im Test eine höhere Punktzahl, was zeigt, dass dunkle Schokolade die Konzentration verbessert. Eine wichtige Frage: Warum ist das genau der Fall?



Diese Frage ist wichtig, da sie dazu beiträgt, andere Fragen zu stellen, die Ihre Hypothese während der gesamten Studie entweder widerlegen oder unterstützen können.



Um einen kausalen Zusammenhang oder Mechanismus aufzuzeigen, können Sie die Gehirnaktivität der Kontroll- und Behandlungsgruppen messen und die Ergebnisse grafisch darstellen, indem Sie sie nebeneinander anzeigen. Anhand des Test-Score-Diagramms und des Gehirnaktivitäts-Diagramms sehen Sie den Grund, warum die Probanden, die Schokolade genommen haben, die höheren Scores erhalten haben, d. H. Die Antwort auf die Frage, wie dunkle Schokolade die kognitive Funktion verbessert.



3. Daten mit vielen Variablen (mehr als zwei Variablen)



Die reale Welt ist komplex und die Beziehung zwischen den beiden Ereignissen ist normalerweise nicht linear. In der Forschung haben Sie also Attribute oder Variablen, die Sie messen können. Alle diese Variablen interagieren auf unterschiedliche Weise miteinander. Einige von ihnen können verwirrend sein , während andere wichtige Attribute sein können, die die Beziehung von Ereignissen erklären.



Wie Sie bereits wissen, bedeutet Korrelation keine Kausalität. Daher ist es keine gute Idee, Ihre Forschung auf nur zwei Variablen zu beschränken: Dies führt zu falschen Schlussfolgerungen. Daher sollten Sie so viele Daten wie möglich in Ihren Diagrammen anzeigen. Dies kann Ihnen helfen, Verwirrung in Ihren Daten aufzudecken.



Nehmen Sie das Simpson-Paradoxon, ein Paradoxon in der Wahrscheinlichkeitsstatistik, wenn "wenn Gruppen kombiniert werden, die Tendenz, die in verschiedenen Datengruppen auftritt, verschwindet". Um zu veranschaulichen:



  • Zwei Variablen - negative Beziehung.

  • Drei Variablen sind positive Beziehungen (x, y, z) (es gibt verwirrende Variablen).



4. Lassen Sie Tools die Analyse nicht steuern



Ein guter Geschichtenerzähler weiß, wie man die Aufmerksamkeit der Menschen auf sich zieht und gleichzeitig eine Geschichte auf produktive Weise erzählt. Der Geschichtenerzähler ist nicht auf die Geschichte selbst beschränkt, sondern kann die Geschichte auf einzigartige Weise ausdrücken, indem er verschiedene Wahrnehmungen kombiniert und mehrere Bilder einbezieht, um die Geschichte lebendig werden zu lassen.



Ebenso ist ein guter Datenvisualisierer nicht auf die vorhandenen Visualisierungstools beschränkt. Die Person, die die Daten visualisiert, kann von einer Ausdrucksform (z. B. Linien oder Kreise) zur Verwendung mehrerer Präsentationsmodi wechseln.



Anstatt beispielsweise Berichte zu erstellen, die nur Text enthalten, verwenden Sie Infografiken: Bilder, Diagramme, Wörter, Zahlen usw., um die Informationen zu bereichern. Mit einer Fülle von Informationen und Grafiken können Leser viele verschiedene Korrelationen von Beweisen an einem Ort beobachten. Denken Sie also daran, dass Sie eine Geschichte erzählen. Lassen Sie sich nicht von Werkzeugen einschränken. Lassen Sie die Analyse die Tools steuern und erstellen Sie beeindruckende, evidenzreiche Grafiken.



5. Dokumentieren Sie Ihre Diagramme mit geeigneten Beschriftungen, Maßstäben und Datenquellen



Wenn Sie sich zum ersten Mal ein Diagramm ansehen, sehen Sie zuerst den Titel und dann die Kontextbeschriftungen des Diagramms. Ohne sie sagt die Grafik nichts. Gute Berichte / Grafiken werden ordnungsgemäß dokumentiert, wobei jedem Diagramm entsprechende Maßstäbe und Beschriftungen zugewiesen sind. Die zum Erstellen der Diagramme verwendeten Datenquellen sind ebenfalls von entscheidender Bedeutung. Daher ist es empfehlenswert, den Code beizubehalten, der zum Generieren der Daten und Grafiken verwendet wurde: Dadurch können die Daten reproduziert werden. Es erhöht auch die Glaubwürdigkeit Ihrer Diagramme. Darüber hinaus können Sie durch Speichern des Codes das Diagramm bei Bedarf bearbeiten.



6. Inhalt steht an erster Stelle



Unabhängig von allen oben genannten Grundsätzen sind Ihre Grafiken ohne qualitativ hochwertige, relevante und ganzheitliche Inhalte nutzlos oder irreführend. Mit anderen Worten: "Müll drinnen, Müll draußen". Stellen Sie vor dem Melden eines Ergebnisses sicher, dass das Ergebnis interessant und wichtig ist. Egal wie schön oder visuell Ihre Grafiken sind, niemand möchte nutzlose Ergebnisse. Interessant ist eine persönliche Erfahrung oder etwas, das vom Internet inspiriert ist. Stellen Sie auf jeden Fall immer Fragen: So wird die Idee Wirklichkeit.



Fazit



Datenvisualisierung ist eine unglaubliche Fähigkeit. Sie können Daten aufnehmen und in wunderschöne Grafiken und Diagramme umwandeln, die den Menschen eine Geschichte erzählen. In einer Zeit, in der Daten exponentiell wachsen, wird es immer wichtiger, eine Geschichte mit Daten erzählen zu können. Dies ist der beste Moment, um neue Dinge zu lernen. Und eine Zusammenfassung der Prinzipien:



  1. Vergleich anzeigen.
  2. Zeigen Sie die Gründe.
  3. Mehrdimensionale Daten anzeigen.
  4. Kombinieren Sie so viele Beweise wie möglich.
  5. Beschreiben und dokumentieren Sie den Zeitplan.
  6. Stellen Sie sicher, dass Ihre Geschichte interessant ist.


Ich möchte, dass Sie diesen Artikel wegnehmen: Denken Sie immer daran, mit einer guten Frage zu beginnen, den richtigen Ansatz zu verwenden und nur die Informationen zu präsentieren, die zur Beantwortung Ihrer guten Frage erforderlich sind.



Ich hinterlasse dieses Zitat des amerikanischen Mathematikers John Tukey , der eine neue Ära der Statistik einleitete: 



Ein einfaches Diagramm brachte einem Datenanalysten mehr Informationen in den Sinn als jedes andere Gerät.


Für ein tieferes Verständnis dieser Prinzipien empfehle ich, auf das Buch von Roger D. Peng "Explorative Datenanalyse in R" zu verweisen (ich werde unten einen Link dazu hinterlassen).



Ressourcen und Links



Wenn Sie mehr über Datenvisualisierung erfahren möchten, lesen Sie diese großartigen kostenlosen Bücher:





Plattformen, die wunderschöne Visualisierungen präsentieren




Anhand dieser Ressourcen stehen Anleitungen zum Erstellen von Diagrammen zur Verfügung.




Links zu diesem Artikel




Danke fürs Lesen!



Bild






Andere Berufe und Kurse


















All Articles