Künstliche Intelligenz und maschinelles Lernen im Webcasting: Aktuelle Trends





Hallo Habr. Mein Name ist Alexander Alpern, ich bin der CEO und Gründer der Webinar Group. Heute möchte ich Themen wie den Einsatz von Technologien für maschinelles Lernen und künstliche Intelligenz im Internet-Rundfunk, die Verarbeitung von Medieninhalten und deren Bereitstellung für den Benutzer erörtern.



Wofür ist das? Die Steigerung der Aufrufe, die Zuschauerbindung, der Informationsgehalt von Programmen sowie die Reduzierung der Netzwerklast sind nur einige der Vorteile moderner Technologien.



Pandemie + Verkehr = Probleme



Laut TeleGeography, das die weltweiten Wechselkurse des Internetverkehrs analysierte, stieg der Verkehrsverbrauch im Jahr 2020 sprunghaft an. So stieg der globale Durchschnitt von etwa 120 auf 170 Tbit / s, auf seinem Höhepunkt - 300 Tbit / s.



Bild



Im Prinzip war das Wachstum bereits ziemlich groß, aber letztes Jahr wurden alle Rekorde gebrochen - das Wachstum betrug 47%. Der Sarg öffnet sich einfach - Hunderte Millionen Menschen wurden zu Hause eingesperrt, sodass die Aktivität bei der Nutzung von Internet-Messenger, Online-Lernplattformen, Cloud-Gaming-Diensten und natürlich Videoplattformen wie YouTube dramatisch zugenommen hat.



Die am stärksten belasteten Verkehrsknotenpunkte befanden sich in Deutschland, Frankfurt (DE-CIX FRA) und in den Niederlanden in Amsterdam (AMS-IX). Im März erreichte das Peer-to-Peer-Center von DE-CIX einen Verkehrsspitzenwert von 9,1 Tbit / s .



In Russland war eine ähnliche Situation zu beobachten: Von März bis April 2020 verzeichneten Online-Kinos einen 2-4-fachen Anstieg des Verkehrsaufkommens. Der Grund ist immer noch derselbe: Aufgrund der Pandemie und Selbstisolation wurden die Menschen in ihren eigenen Wohnungen und Häusern isoliert, sodass das Internet zu einer der Möglichkeiten geworden ist, sich selbst zu unterhalten. Der mobile Verkehr wuchs im gleichen Zeitraum um 10 bis 30%, hauptsächlich aufgrund von Video-Chats und Instant Messenger.



Es kam zu dem Punkt, dass Netflix und YouTube sankenVideoqualität für europäische Benutzer. YouTube hat damit begonnen, Videos in Standardauflösung anstelle von HD anzuzeigen, und Netflix hat die Auflösung um 25% gesenkt.



Was zu tun ist?



Erhöhen Sie im Idealfall die Kapazität und den Durchsatz der Netzwerkinfrastruktur sowohl lokal als auch global. Hier ist alles kompliziert, da Anbieter von Internet, Mobilfunk und anderen Telekommunikationsdiensten nicht immer erhebliche Ressourcen investieren können.



Die zweite Möglichkeit besteht darin, Ihre Inhalte zu optimieren. Dies bezieht sich weniger auf die Verringerung der Video- oder Audioqualität als vielmehr auf andere Methoden. Wir werden sie unten betrachten.



Optimieren der Komprimierung verschiedener Videos



Netflix ist der größte Anbieter von Medieninhalten. Vor einigen Jahren führte sie die Praxis ein, verschiedene Komprimierungsprofile für verschiedene Videos unter Berücksichtigung ihrer Eigenschaften auszuwählen.



Netflix bietet eine Fülle von Videoerlebnissen, einschließlich der Komprimierung von Inhalten. Unter Verwendung seiner eigenen Entwicklungen trainierte das Unternehmen ein neuronales System, das Videoattribute auf niedriger Ebene auswertet, seine Klasse bestimmt und dann die optimalen Parameter für jede Klasse findet.



Parameter wie die Dynamik des Bildes, der Grad der Klarheit und die Gesamtkomplexität des Diagramms werden bewertet. Innerhalb weniger Minuten bewertet das System die Dynamik des Diagramms, den Grad der Klarheit und die Gesamtsättigung des "Bildes". Basierend auf den Analysedaten trifft das System eine Entscheidung zur Videooptimierung. Wenn die Show oder Sendung nicht sehr dynamisch ist, kann die Videoqualität verringert werden. Wenn sich das Bild schnell ändert, die Farben gesättigt sind und die Darstellung komplex ist, nimmt die Qualität entweder geringfügig ab oder bleibt auf dem gleichen Niveau.



Bild



Damit wird die Optimierung der Videoübertragung erreicht, die Belastung der Netzwerkinfrastruktur reduziert. Die Arbeit mit Videos wird so ausgeführt, dass das Endergebnis für Inhaltskonsumenten unsichtbar ist. Mit anderen Worten, das Publikum merkt einfach nichts. Für Kompression, die Unternehmen AnwendungenVerschiedene Codecs und Komprimierungsmodelle, einschließlich 4K VMAF , damit das Netzwerk auch beim Streaming von 4K-Videos nicht überlastet wird.



Auswahl der Videoquelle mit optimaler Qualität



Eine hohe Auflösung und damit eine große Menge übertragener Daten bedeutet nicht, dass dem Empfänger ein Video von guter Qualität geliefert wird. Ein Beispiel hierfür ist das oben veröffentlichte GIF.



Die Auswahl einer Quelle für qualitativ hochwertige Videos ist ein dringendes Problem für die Vertreiber von TV-Kanal-Paketen. Ssimwave hat eine Lösung für maschinelles Lernen entwickelt, die automatisch die Inhaltsquelle mit der höchsten Qualität auswählt.



Bild



Ein Beispiel ist die Ausstrahlung des CNN-Kanals. In einer Quelle sind die Videoparameter 1080 @ 29,97i, MPEG-2, 40 Mbit / s und in der anderen - mit 720p60, H264, 22 Mbit / s. Wie oben erwähnt, bedeutet eine hohe Auflösung für den Empfänger überhaupt keine gute Videoqualität. Die Qualität wird von einer Vielzahl von Faktoren beeinflusst, darunter Komprimierungs- und Farbformate, Dynamikbereich, Transcodierungsverfahren, Übermittlungstechnologien und Versionen von Abonnenten.



Es ist einfach unmöglich, dies alles manuell zu bewerten. Das neuronale Netz kann die Aufgabe jedoch problemlos bewältigen. Ssimwave konnte eine Lösung entwickeln, mit der Sie innerhalb von Sekunden die Übertragungsquelle mit der höchsten Qualität und dem geringsten Datenvolumen auswählen können.



Nicht nur durch den Verkehr



Maschinelles Lernen, künstliche Intelligenz und neuronale Netze helfen nicht nur, das Volumen der übertragenen Inhalte zu optimieren. Es gibt viele andere Bereiche, in denen Technologie heute einfach unverzichtbar ist.



Videokatalognavigation



Viele Unternehmen für Medieninhalte haben Kataloge - mit Spielen, Videos, Filmen und Shows. Laut Netflix achten Abonnenten bei der Auswahl eines Films zum Ansehen am ehesten auf Filmplakatsymbole. Laut dem Creative Director des Unternehmens, Nick Nelson, wird die Auswahl eines Films in 82% der Fälle durch das präsentierte Symbol / Poster bestimmt.



Je erfolgreicher das Bild ist, desto höher ist dementsprechend die Wahrscheinlichkeit, dass der Betrachter diesen bestimmten Inhalt auswählt. All dies ist nicht nur für Videos relevant, sondern auch für andere digitale Güter.



Bild



Um Nelsons Meinung zu bestätigen oder zu widerlegen, hat Accedo in Zusammenarbeit mit AWS und der British Television Corporation ITV einen A / B-Test durchgeführt, um Faktoren zu identifizieren, die die Benutzerauswahl beeinflussen. Das Fazit ist nicht allzu überraschend: Benutzer wählen einen Film aus, der sich beim Betrachten von Screenshots an ihren Emotionen orientiert. Die Auswertung des Screenshots dauert weniger als 2 Sekunden.



Dementsprechend können maschinelles Lernen und KI-Technologien verwendet werden, um Screenshots mit optimalen Conversions auszuwählen. Bei Filmen enthalten solche Screenshots normalerweise das Bild eines Helden, dessen Gesicht Emotionen ausdrückt, und meistens werden Bilder mit Antagonisten ausgewählt. Screenshots mit Heldengruppen sind weniger interessant.



Darüber hinaus half künstliche Intelligenz dabei, verschiedene Sammlungen für verschiedene Kategorien / Segmente von Zuschauern zu bilden - sowohl sozial als auch geografisch. Nun ist es nicht verwunderlich, dass Kataloge in verschiedenen Ländern oder Regionen desselben Landes unterschiedlich aussehen. Aber noch vor 10 bis 20 Jahren war die Situation anders.



Erhöhen des Informationsgehalts des Videos



Bild



Es geht darum, Multimedia-Metadaten für verschiedene Videos zu erstellen und zu strukturieren - zum Beispiel für Sportvideos. Besonders hervorzuheben ist hier IBM Watson, ein IBM-Supercomputer mit integrierter künstlicher Intelligenz. Er kann visuelle Beschreibungen in Echtzeit erstellen, Audio transkribieren und redaktionelle Notizen hinzufügen.



Diese Fähigkeiten werden bei der Arbeit mit beliebten Sportereignissen eingesetzt - zum Beispiel bei der Weltmeisterschaft, den US Open, dem Super Bowl und anderen.



AI verarbeitet den Broadcast-Stream, markiert wichtige Punkte darin und fügt Notizen und Kommentare hinzu. Ferner wird der bereits verarbeitete Strom entweder an die Redakteure des Rundfunkprogramms gesendet oder direkt an die Zuschauer.



Reduzierte Kundenabwanderung



Maschinelles Lernen und künstliche Intelligenz verhindern hervorragend die Abwanderung von Kunden. Dies geschieht, wenn das Interesse der Benutzer an den Inhalten abnimmt. Nach unseren Daten können uninteressante oder übermäßig komplexe Inhalte bei einem Viertel der Nutzer zu Abwanderung führen. Das ist viel und das sollte nicht erlaubt sein.



Um die Abwanderungsrate zu reduzieren, ist es wichtig:



  • verstehen, was Abwanderung verursachen kann
  • Analyse automatisieren
  • Verwenden Sie Prognosetools


Analytics verwendet Daten wie Benutzerinformationen, Sichtbarkeit von Inhalten, Benutzerbewertungen, Benutzerinteraktionsaktivitäten mit Support (hier können wir nicht nur über Videos, sondern auch über Online-Kurse wie in unserem Fall sprechen) und andere Daten. Auf der We.Study- Plattform beispielsweise "überwacht" das System selbst regelmäßig den Kurs und gibt spezifische Empfehlungen zur Verbesserung, damit Sie das Verhalten der Teilnehmer verfolgen und die Abwanderung vorhersagen können.



Basierend auf den Ergebnissen der Analyse können bestimmte Maßnahmen ergriffen werden - um den Inhalt und das Schulungsprogramm zu ändern, wenn es sich um Kurse handelt -, um die Interaktion mit den Benutzern zu verbessern.



Personalisierung der vorgestellten Inhalte



Bild



Alle YouTube-Nutzer wissen, welche Inhalte empfohlen werden. Je erfolgreicher die Empfehlung ist, desto höher ist die Wahrscheinlichkeit, dass der Benutzer das Video ansieht oder eine andere Art von Inhalten anzeigt.



Anschaulicher Fall - das IBM Watson-Projekt und die Iris.tv-Plattform. Den Partnern gelang es, eine optimale Personalisierung der Inhalte zu erreichen. Dazu werden die Videos zunächst durch einen Supercomputer geleitet, der Metadaten sammelt. Anschließend analysiert die Plattform diese Daten, um neue Kategorien und Titel der Filmbibliothek zu erstellen.



Mithilfe des maschinellen Lernens konnte die Plattform außerdem trainieren, die Interessen bestimmter Benutzer zu analysieren, um sicherzustellen, dass eine Person nach dem Anschauen des nächsten Programms ein interessantes Video erhält.



Was weiter?



Es gibt viele Fälle, in denen KI und maschinelles Lernen verwendet werden, sodass im Artikel nur die aufschlussreichsten Punkte aufgeführt sind. Die allgemeine Schlussfolgerung ist, dass diese Technologien zunehmend systematisch eingesetzt werden. Bisher wurden sie nur als Test verwendet. Jetzt nutzen Hunderte und Tausende von Content-Unternehmen maschinelles Lernen, um Inhalte zu optimieren, Geschäftsprozesse zu debuggen, neue Benutzer anzuziehen und alte zu behalten.



In den nächsten drei bis fünf Jahren wird die überwiegende Mehrheit der Anbieter von Medieninhalten auf moderne Technologien umsteigen, da sie die Lösung der Probleme sowohl einzelner Kunden als auch des gesamten Unternehmens ermöglichen.



All Articles