Merkmale der betrachteten Klasse von Datenanalyseproblemen
Es ist notwendig, eine mehrdimensionale Zeitreihe unter folgenden Bedingungen zu untersuchen:
- Die Komplexität des registrierten Prozesses und (oder) die Einzigartigkeit der Forschungsaufgaben erlauben es nicht, die Arbeit auf die Verwendung eines vorgefertigten Algorithmus zu reduzieren. Es wird notwendig, den Prozess in Stufen zu unterteilen und die komplexe Dynamik in jeder von ihnen zu analysieren. Die Kriterien für die Abgrenzung der Stufen sind nicht so offensichtlich, dass sie ohne Datenvisualisierung angewendet werden können.
- Die Parameter sind unterschiedlicher physikalischer Natur und werden in verschiedenen Einheiten gemessen. Jede Zeitreihenkurve benötigt eine eigene Ordinatenskala.
Arbeitsmerkmale aus Sicht der Datenvisualisierungsumgebung
Das Aufteilen einer Zeitreihe in Stufen kann sowohl trivial als auch recht komplex sein. Es gibt Fälle, in denen die Grenzen der Prozessschritte beispielsweise durch den Wert der Statusvariablen bestimmt werden können. Eine solche Aufgabe kann ohne Visualisierung gelöst werden, beispielsweise mithilfe von Datenfiltern in MS Excel .
Die Identifizierung von Grenzen in komplexeren Fällen ist mit einer visuellen Suche in den Diagrammen nach mehr oder weniger objektiven Anzeichen für den Übergang des Systems in einen neuen Zustand verbunden. Gleichzeitig kann die Auswahl der Kriterien erfordern, dass ein Spezialist den Themenbereich versteht und zusätzliche Berechnungen durchführt.
Es ist anzumerken, dass selbst bei der einfachsten Unterteilung der Zeitreihen in Stufen eine vorläufige Bekanntschaft mit den Graphen eine praktische Bedeutung hat. Mit dieser Aktion können Sie mindestens sicherstellen, dass die Aufzeichnung keine offensichtlichen Mängel aufweist, bevor Sie mit der Arbeit beginnen.
Wir werden nicht einmal oberflächlich auf die Methoden eingehen, mit denen die Dynamik des Prozesses innerhalb der Grenzen einer separaten Stufe analysiert wird. Es ist wichtig, dass für viele Probleme die Analyse eine weitere Aufteilung der Reihen und die Berücksichtigung kleinerer Zeitintervalle innerhalb der Hauptstufen erfordert. Außerdem können die Zeitintervalle der Übergänge zwischen Stufen von Interesse sein.
Daher ist es bei der Lösung von Problemen der betreffenden Klasse normalerweise erforderlich, das Zeitintervall in den Diagrammen wiederholt zu ändern (die Zählung kann bis zu Hunderten betragen). Die Qualität der Implementierung dieser Aktion in der Benutzeroberfläche der Datenverarbeitungsumgebung wirkt sich erheblich auf die Effizienz der Arbeit aus.
Bestehende Systeme
Mit MS Excel können Sie eine mehrdimensionale Zeitreihe mit zwei Skalen entlang der Ordinatenachse ("Hilfsachse") erstellen. Gleichzeitig wird das Ändern der linken und rechten Grenze auf der Abszissenachse durch eine beeindruckende Reihe von Aktionen ausgeführt, einschließlich der Eingabe von Zahlen über die Tastatur.
Nach Bestätigung der Änderungen ändert keine der Skalen der y-Achse ihre Einstellungen. Für das geänderte Zeitintervall sind die vorherigen Skalen auf der Ordinatenachse oft nicht zufriedenstellend. In unserem Beispiel ist eine zusätzliche vertikale Skalierung für eine bessere Visualisierung erforderlich.
Diese Benutzeroberfläche kann für die betrachteten Aufgaben kaum als optimal bezeichnet werden.
Durch die Implementierung des WYSIWYG- Prinzips wird eine wesentlich effektivere Benutzererfahrung erzieltbei der Arbeit mit dem Grundstücksbereich. Die folgende Animation zeigt die Benutzerinteraktion mit einer solchen Schnittstelle.
Ein Beispiel ist in der Advanced Grapher- Anwendung aufgezeichnet , aber viele andere Systeme unterstützen eine ähnliche Option, z. B. die MetricsGraphics.js- Bibliothek .
Der Geschwindigkeitsgewinn im Vergleich zu MS Excel ist hier offensichtlich. Die gesamte Skalierungsaufgabe wird mit einem Klick gelöst:
- Die linke Maustaste wird an der Stelle gedrückt, die der Ecke des neuen rechteckigen Bereichs entspricht.
- Der Cursor wird in die gegenüberliegende Ecke des neuen Bereichs bewegt.
- Die linke Maustaste wird losgelassen.
Diese Option ist jedoch nicht ohne Nachteile. Die erste ist die zusätzliche Belastung für den Benutzer. In einer kombinierten Aktion wird er aufgefordert, die Werte von vier Parametern (Koordinaten der Grenzen des rechteckigen Bereichs tmin , tmax , Pmin , Pmax ) einzugeben , was ihre vorläufige Bewertung "im Kopf" erfordert. Mit der Erfahrung hat die Aufgabe akzeptable Schwierigkeiten. Da sich der Benutzer jedoch hauptsächlich für das Zeitintervall tmin und tmax interessiert , ist es sinnvoll, die Übertragung der vertikalen Skalierung auf die Maschine zu erarbeiten.
Der zweite Nachteil betrifft auch die vertikale Skalierung. Es besteht in der Unmöglichkeit, diese Schnittstelle für die Aufgaben der betrachteten Klasse zu implementieren. Das Problem ist, dass der Benutzer in unserem Fall mit einem einzigen Klick nicht 4, sondern 6, 8 oder mehr Werte eingibt, abhängig von der Anzahl der Skalen auf der Ordinate. Jede Skala der Ordinate im Diagramm erhält neue Werte für die oberen und unteren Grenzen, aber tatsächlich werden alle diese Grenzen, egal wie viele von ihnen, durch zwei Zahlen bestimmt. Diese Zahlen sind die Ordinaten der Mauszeigerposition am Anfang und Ende des Klicks. Die Aufgabe des Benutzers ist nicht nur im Vergleich zu einer eindimensionalen Reihe komplizierter. Es ist auch nicht mehr lösbar: Das allgemeine Intervall, das für jede Zeile einen akzeptablen Maßstab bietet, existiert nicht immer.
Zum Beispiel zeigt die Abbildung eines der praktischen Ergebnisse einer solchen Skalierung.
Beide Linien repräsentieren harmonische Schwingungen, jeweils drei Perioden im betrachteten Zeitintervall. Dies kann visuell erst nach zusätzlicher individueller Einstellung der Skalen festgestellt werden, da die Schwingungsamplituden im Vergleich zu den Intervallen beider Skalen vernachlässigbar sind. Eine weitere Reduzierung der angezeigten Intervalle durch das betrachtete Verfahren führt zur Verschiebung einer der Kurven außerhalb des Darstellungsbereichs.
Verbesserung der Benutzeroberfläche
Wie oben erwähnt, sollte die vertikale Skalierungsaufgabe einem Computer zugewiesen werden. Überlegen Sie dazu, wie der Benutzer es am Beispiel einer eindimensionalen Reihe löst.
In der Regel bestimmt der Benutzer nach Festlegung eines Zeitintervalls lokale Extrema, um den Wertebereich am besten darzustellen. Die optimale Lösung für die meisten Fälle besteht darin, den Wertebereich und das angezeigte Skalierungsintervall zu kombinieren (Algorithmen mit subtilerer Logik sind auch möglich, wenn der angezeigte Bereich einen kleinen Versatz über und unter dem Wertebereich aufweist; die Unterschiede zwischen diesen Algorithmen sind nicht grundlegend).
Die obige Logik hat eine ziemlich einfache Implementierung. Das Schnittstellenbetriebsdiagramm für eine eindimensionale Zeitreihe ist in der Abbildung dargestellt.
Die vertikale Koordinate des Klicks spielt hier keine Rolle: Die kombinierte Steueraktion des Benutzers definiert nur die linken und rechten Grenzen des neuen Anzeigebereichs.
Die Skalierung einer mehrdimensionalen Serie mit einer neuen Benutzeroberfläche wird durch die folgende Animation demonstriert.
Die Originaldaten und das neue Zeitintervall in diesem Beispiel entsprechen dem Beispiel vom Anfang des Artikels. Das Problem wurde durch die einfachste Aktion mit maximaler Qualität gelöst. Die Verringerung des Zeitaufwands und des intellektuellen Aufwands des Benutzers scheint offensichtlich.
Einschränkung der Anwendbarkeit
Ein anderer Ansatz zur vertikalen Skalierung ist ebenfalls möglich: Bei einigen praktischen Problemen ist die Visualisierung in einem vorgegebenen Wertebereich gerechtfertigt, der nicht von lokalen Extrema abhängt. In diesem Fall reicht es aus, die Einstellungen für die vertikale Skalierung nicht zu ändern, da dies in MS Excel implementiert ist .