Huawei DCN: Fünf Szenarien zum Aufbau eines Rechenzentrumsnetzwerks

Heute konzentrieren wir uns nicht nur auf die Produktlinie des Huawei-Netzwerks für Rechenzentren, sondern auch darauf, wie auf dieser Grundlage fortschrittliche End-to-End-Lösungen erstellt werden können. Beginnen wir mit den Szenarien, gehen wir zu den spezifischen Funktionen über, die von den Geräten unterstützt werden, und enden wir mit einem Überblick über bestimmte Geräte, die die Grundlage moderner Rechenzentren mit dem höchsten Automatisierungsgrad von Netzwerkprozessen bilden können.







Unabhängig davon, wie beeindruckend die Eigenschaften von Netzwerkgeräten sind, werden die Möglichkeiten der darauf basierenden angewandten Architekturlösungen davon bestimmt, wie effektiv die gegenseitige Integration von Hardware, Software, virtuellen und anderen damit verbundenen Technologien sein kann. Um mit der Zeit Schritt zu halten, versuchen wir, unseren Kunden umgehend moderne und vielversprechende Möglichkeiten zu bieten, die oft die gewagtesten Ideen anderer Anbieter übertreffen.







Zu den Cloud Fabric-Lösungen gehören ein Rechenzentrumsnetzwerk, ein SDN-Controller und andere Komponenten, die für ein bestimmtes Projekt erforderlich sind, einschließlich solcher anderer Hersteller.



Das erste und einfachste Szenario beinhaltet die Verwendung einer minimalen Anzahl von Komponenten: Das Netzwerk basiert auf Huawei-Hardware und Tools von Drittanbietern, um Netzwerkmanagement- und Überwachungsprozesse zu automatisieren. Zum Beispiel Ansible oder Microsoft Azure.



Im zweiten Szenario wird davon ausgegangen, dass der Kunde bereits Virtualisierung und SDN für Rechenzentren verwendet, z. B. NSX, und Huawei-Geräte als Hardware-VTEP (Vitual Tunnel End Point) in der vorhandenen VMware-Lösung verwenden möchte. Die Website dieser Firma enthält eine Liste vonHuawei-Geräte, die getestet wurden und als VTEP verwendet werden können. Schließlich ist es für niemanden ein Geheimnis, dass Hardware-Implementierungen, unabhängig davon, wie erfolgreich die VXLAN-Softwarelösungen (Virtual Extensible LAN) auf virtuellen Switches sind, hinsichtlich der Leistung effizienter sind.



Das dritte Szenario ist der Aufbau von Hosting- und Computing-Klassensystemen, die einen Controller enthalten, jedoch keine übergeordnete Plattform für die Integration aufweisen. Eine der Optionen zum Implementieren eines solchen Szenarios setzt das Vorhandensein eines separaten SDN-Controllers Agile Controller-DCN voraus. Systemadministratoren können diese Architektur verwenden, um tägliche Netzwerkverwaltungsvorgänge auszuführen. Eine erweiterte Version des dritten Szenarios basiert auf der Interaktion des Agile Controller-DCN mit VMware vCenter, die durch einen bestimmten Geschäftsprozess verbunden ist, jedoch wiederum ohne ein übergeordnetes Verwaltungssystem.



Das vierte Szenario ist bemerkenswert - die Integration in eine Upstream-Plattform, die auf OpenStack oder unserem Virtualisierungsprodukt FusionSphere basiert. Wir registrieren viele Anfragen nach ähnlichen Architekturlösungen, unter denen OpenStack am beliebtesten ist (CentOS, Red Hat usw.). Es hängt alles davon ab, welche Orchestrierungs- und Rechenressourcenverwaltungsplattform im Rechenzentrum verwendet wird.



Das fünfte Szenario ist völlig neu. Zusätzlich zu den bekannten Hardware-Switches enthält es einen verteilten virtuellen CloudEngine 1800V (CE1800V) -Switch, der nur mit einer KVM (Kernel-based Virtual Machine) betrieben werden kann. Diese Architektur beinhaltet die Kombination des Agile Controller-DCN mit der Kubernetes-Containerisierungsplattform unter Verwendung des CNI-Plugins. Somit bewegt sich Huawei mit der ganzen Weltvon der Hostvirtualisierung bis zur Betriebssystemvirtualisierung .







Mehr zur Containerisierung



Wir haben bereits den virtuellen CE1800V-Switch erwähnt, der mit dem Agile Controller-DCN bereitgestellt wird. In Kombination mit Huawei-Hardware-Switches bilden sie eine Art "Hybrid-Overlay". In naher Zukunft werden Containerskripte von Huawei Unterstützung für NAT- und Lastausgleichsfunktionen erhalten.



Eine Einschränkung der Architektur besteht darin, dass der CE1800V nicht separat vom Agile Controller-DCN verwendet werden kann. Es sollte auch berücksichtigt werden, dass ein PoD der Kubernetes-Plattform nicht mehr als 4 Millionen Container enthalten kann.



Die Verbindung zum VXLAN-Netzwerk des Rechenzentrums erfolgt über VLAN (Virtual Local Area Network). Es gibt jedoch eine Option, bei der der CE1800V als VTEP mit dem BGP-Prozess (Border Gateway Protocol) fungiert. Dadurch können BGP-Routen mit dem Backbone ausgetauscht werden, ohne dass separate Hardware-Switches erforderlich sind.







Intent-Driven Networks: Intent-Analyse-Netzwerke



Huawei führte bereits 2018 das IDN- Konzept (Intent-Driven Network) ein . Seitdem arbeitet das Unternehmen weiter an Netzwerken, mit denen Cloud Computing, Big Data und künstliche Intelligenz die Ziele und Absichten der Benutzer analysieren können.



Grundsätzlich geht es um den Übergang von der Automatisierung zur Autonomie. Die vom Benutzer zum Ausdruck gebrachte Absicht wird in Form von Empfehlungen der Webprodukte zur Implementierung dieser Absicht zurückgegeben. Diese Funktionalität basiert auf den Agile Controller-DCN-Funktionen, die dem Produkt hinzugefügt werden, um sicherzustellen, dass die IDN-Ideologie verkörpert ist.



Mit der Einführung von IDN wird es in Zukunft möglich sein, Netzwerkdienste mit einem Klick bereitzustellen, was den höchsten Automatisierungsgrad impliziert. Durch die modulare Architektur der Netzwerkfunktionen und die Möglichkeit, diese Funktionen zu kombinieren, kann der Administrator einfach angeben, welche Dienste in einem bestimmten Netzwerksegment verfügbar gemacht werden sollen.



Um dieses Maß an Steuerbarkeit zu erreichen, ist der ZTP-Prozess (Zero Touch Provisioning) unerlässlich. Huawei hat hier erhebliche Fortschritte erzielt und bietet die Möglichkeit, das Netzwerk sofort vollständig bereitzustellen.



Der weitere Installations- und Bereitstellungsprozess umfasst notwendigerweise ein Verfahren zum Überprüfen der Konnektivität zwischen Ressourcen (Netzwerkkonnektivität) und zum Bewerten von Änderungen der Netzwerkleistung in Abhängigkeit von den Betriebsmodi. In dieser Phase wird vor Beginn des eigentlichen Betriebs eine Simulation durchgeführt.



Der nächste Schritt ist die Bereitstellung und Überprüfung von Diensten durch die integrierten Huawei-Tools. Dann bleibt nur noch das Ergebnis zu kontrollieren.



Die gesamte Reise ist jetzt mit einer einzigen, umfassenden Engine abgeschlossen, die auf der iMaster NCE-Plattform basiert und den Agile Controller-DCN und das eSight Element Management System (EMS) enthält.







Derzeit kann der Agile Controller-DCN die Verfügbarkeit von Ressourcen und das Vorhandensein von Verbindungen überprüfen und proaktiv (nach Genehmigung durch den Administrator) auf Probleme im Netzwerk reagieren. Das Hinzufügen der erforderlichen Dienste erfolgt jetzt manuell. Huawei beabsichtigt jedoch, diesen und andere Vorgänge wie die Bereitstellung von Servern, die Konfiguration von Netzwerken für Speichersysteme usw. in Zukunft zu automatisieren.







Serviceketten und Mikrosegmentierung



Der Agile Controller-DCN kann Net Service Header (NSH) verarbeiten, die in VXLAN-Paketen enthalten sind. Dies ist praktisch für die Erstellung von Serviceketten. Sie beabsichtigen beispielsweise, eine bestimmte Art von Paketen auf einer anderen Route als der des Standard-Routing-Protokolls zu senden. Bevor sie das Netzwerk verlassen, müssen sie ein Gerät (Firewall usw.) durchlaufen. Dazu reicht es aus, die Servicekette mit den erforderlichen Regeln zu konfigurieren. Aufgrund eines solchen Mechanismus ist es beispielsweise möglich, Sicherheitsrichtlinien zu konfigurieren, aber auch andere Bereiche seiner Anwendung sind möglich.







Das Diagramm zeigt deutlich den Betrieb von RFC-kompatiblen Serviceketten auf Basis von NSH sowie eine Liste der Hardware-Switches, die diese unterstützen.







Die Funktionen der Service Chain-Lösungen von Huawei werden durch Mikrosegmentierungstools ergänzt, eine Netzwerksicherheitsmethode, die Sicherheitssegmente bis hin zu einzelnen Workload-Elementen isoliert. Unter Umgehung des ACL-Engpasses (Access Control List) muss eine große Anzahl von ACLs nicht manuell konfiguriert werden.







Intelligenter Betrieb



Beim Thema Netzwerkbetrieb ist eine weitere Komponente der Dachmarke iMaster NCE zu erwähnen - der intelligente Netzwerkanalysator FabricInsight. Es bietet umfangreiche Funktionen zum Sammeln von Telemetrie und Informationen über Datenflüsse im Netzwerk. Die Telemetrie wird mit gRPC erfasst und sammelt Daten bei Weitergabe, Verzögerung im Puffer und verlorenen Paketen. Das zweite große Informationsfeld wird mithilfe von ERSPAN (Encapsulated Remote Switch Port Analyzer) aggregiert und vermittelt einen Eindruck von den Datenflüssen im Rechenzentrum. Grundsätzlich geht es um das Sammeln von TCP-Headern und die Menge an Informationen, die während jeder TCP-Sitzung übertragen werden. Dies kann mit verschiedenen Huawei-Geräten erfolgen - eine Liste davon ist im Diagramm dargestellt.



SNMP und NetStream werden ebenfalls nicht vergessen, daher verwendet Huawei sowohl alte als auch neue Mechanismen, um vom Black-Box-Netzwerk in das Netzwerk zu wechseln, von dem wir buchstäblich alles wissen.







AI Fabric: Verlustfreie Smart Grids



Die von unserer Hardware unterstützten AI Fabric-Funktionen sollen Ethernet in ein Paket mit hoher Leistung, geringer Latenz und Paketverlust verwandeln. Dies ist erforderlich, um die Hauptszenarien für die Bereitstellung von Anwendungen in einem Rechenzentrumsnetzwerk zu implementieren.







In der obigen Abbildung sehen wir die Probleme, die während des Netzwerkbetriebs auftreten können:



  • Paketverlust;
  • Pufferüberlauf;
  • das Problem der optimalen Netzwerklast bei Verwendung von Parallelverbindungen.




Das Huawei-Gerät implementiert Mechanismen, um all diese Probleme zu lösen. Beispielsweise wurde auf Chipebene die Technologie der virtuellen eingehenden Warteschlangen implementiert, die gleichzeitig keine Blockierung am Eingang zulässt (HOL-Blockierung).



Auf Protokollebene gibt es einen dynamischen ECN-Mechanismus - dynamische Änderung der Puffergröße sowie schnelles CNP - schnelles Senden von Nachrichtenpaketen über ein Netzwerkproblem an die Quelle.



Das Ausgleichen der Rechte von Elefanten- und Mäusestreams unterstützt die DPP-Technologie (Dynamic Packet Prioritization), bei der kurze Daten aus verschiedenen Streams in einer separaten Warteschlange mit hoher Priorität abgelegt werden. Somit "überleben" kurze Pakete in der Umgebung langer, schwerer Ströme besser.



Lassen Sie uns klarstellen, dass die oben genannten Mechanismen direkt von der Ausrüstung unterstützt werden müssen, damit sie effektiv funktionieren.







Alle diese Funktionen werden in einem von drei Anwendungsfällen für Huawei-Geräte angewendet:



  • beim Aufbau künstlicher Intelligenzsysteme basierend auf verteilten Anwendungen;
  • beim Erstellen verteilter Datenspeichersysteme;
  • beim Erstellen von Systemen für High Performance Computing (HPC).








Ideen in "Hardware"



Nachdem wir die typischen Anwendungsfälle für Huawei-Lösungen besprochen und ihre Hauptfunktionen aufgelistet haben, gehen wir direkt zu den Geräten.



CloudEngine 16800 ist eine Plattform, die die Arbeit an 400-Gbit / s-Schnittstellen ermöglicht. Sein charakteristisches Merkmal ist das Vorhandensein eines eigenen Weiterleitungschips und eines Prozessors für künstliche Intelligenz zusammen mit der CPU, der zur Implementierung der Fähigkeiten des AI Fabric erforderlich ist.







Die Plattform entspricht der klassischen orthogonalen Architektur mit einem Luftstromsystem von vorne nach hinten und verfügt über einen von drei Gehäusetypen - 4 (10U), 8 (16U) oder 16 (32U) Steckplätze.







In CloudEngine 16800 können verschiedene Arten von Leitungskarten verwendet werden. Darunter befinden sich sowohl traditionelle 10-Gigabit- und 40-Gigabit- als auch 100-Gigabit-Gigabit, einschließlich völlig neuer. Karten mit 25 und 400 Gbit / s-Schnittstellen sind für die Veröffentlichung geplant.







Bei den ToR-Schaltern (Top of Rack) sind die aktuellen Modelle in der obigen Zeitleiste angegeben. Von größtem Interesse sind die neuen 25-Gigabit-Modelle, 100-Gigabit-Switches mit 400-Gigabit-Uplinks und 100-Gigabit-Switches mit hoher Dichte und 96 Ports.







Der derzeit wichtigste Huawei-Switch mit einer festen Konfiguration ist CloudEngine 8850. Er sollte durch das Modell 8851 mit 32 100-Gbit / s-Schnittstellen und acht 400-Gbit / s-Schnittstellen sowie der Möglichkeit, diese in 50, 100 oder 200 Gbit / s aufzuteilen, ersetzt werden ...







Ein weiterer Switch mit fester Konfiguration, CloudEngine 6865, bleibt in der aktuellen Produktlinie von Huawei. Es ist ein bewährtes Arbeitstier mit 10/25 Gbit / s Zugriff und acht 100 Gbit / s Uplinks. Fügen Sie hinzu, es unterstützt auch AI Fabric.











Das Diagramm zeigt die Eigenschaften aller neuen Schaltermodelle, deren Erscheinungsbild wir in den kommenden Monaten oder sogar Wochen erwarten. Eine gewisse Verzögerung bei der Veröffentlichung ist auf die Situation rund um das Coronavirus zurückzuführen. Auch wenn die Fragen des Sanktionsdrucks auf Huawei weiterhin relevant sind, können all diese Ereignisse nur den Zeitpunkt der Premieren beeinflussen.



Weitere Informationen zu Huawei-Lösungen und ihren Anwendungsfällen erhalten Sie ganz einfach, indem Sie sich für unsere Webinare anmelden oder sich direkt an Huawei wenden.



***.



Wir erinnern Sie daran, dass unsere Experten regelmäßig Webinare zu Huawei-Produkten und den von ihnen verwendeten Technologien veranstalten. Eine Liste der Webinare für die kommenden Wochen finden Sie hier .



All Articles