Intelligente Planung von Podcast-Anzeigen. So bauen Sie eine Hörerbasis auf und erkennen ein Publikum mithilfe eines neuronalen Netzwerks

Podcasts ist ein Kanal, der sich im Laufe des Jahres 2020 aktiv entwickelt. Das Publikum wächst und die Podcasts selbst werden immer mehr. Gleichzeitig gibt es keine einzige Zielgruppenanzeige für Hörer, und im Allgemeinen ist die Situation bei Messungen dieses Kanals nicht sehr gut. Gleichzeitig ist das gegenseitige Interesse von Podcastern und Werbetreibenden recht hoch.



Bei dentsu haben wir Podcaster entwickelt, ein Analysetool zum Messen der Podcast-Zielgruppen und zum Planen von Anzeigen darin. Wie wir mit dem Sammeln von Daten begonnen und das Problem der Publikumserkennung gelöst haben, auf welche Schwierigkeiten wir gestoßen sind und was daraus entstanden ist, erfahren Sie in diesem Artikel.



Bild



Hintergrund



Die Podcast-Planung basiert jetzt auf Daten von Verkäufern (Studios oder Fachagenturen), die sich an Podcast-Autoren wenden und nach Beschreibungen der Hörer fragen. Die Podcaster selbst erhalten Daten entweder von der Plattform, auf der der Podcast veröffentlicht wird, oder von einem externen Statistiksystem. Bei diesem Ansatz gibt es eine Reihe von Einschränkungen:



  • Podcasts können aus einer begrenzten Liste ausgewählt werden, mit der der Verkäufer Vereinbarungen getroffen hat und Daten über das Podcast-Publikum hat.
  • Es gibt keine Möglichkeit, affinitivere Podcasts auszuwählen (Affinität ist das Verhältnis einer bestimmten Zielgruppe unter den Hörern zu allen Podcast-Hörern), da in der Regel eine Beschreibung des Kerns der Hörer verfügbar ist und diese in Bezug auf das Alter für die meisten Podcasts im Allgemeinen gleich ist.
  • Podcaster selbst haben Daten zu jedem Podcast, aber weder Podcaster noch Verkäufer wissen, wie Hörer zwischen Podcasts wechseln.


Um die Planung von Podcasts intelligenter zu gestalten, haben wir versucht, ein einheitliches Analysesystem zu erstellen, das auf Daten aus der Liste der vorhandenen Podcasts und der Basis der Benutzer basiert, die diese Podcasts anhören, sowie auf der Möglichkeit, Geschlecht und Alter derselben Zuhörer zu bestimmen.



Ein Ansatz



Wir stellten schnell fest, dass wir selbst keine benutzerspezifischen Auditions erhalten könnten. Es gibt jedoch Likes / Abonnements für Podcasts: Ein ähnlicher Mechanismus funktioniert beispielsweise auf Instagram mit Bloggern, wenn eine Person einen Blogger abonniert, um seine Nachrichten zu sehen. Wir gingen davon aus, dass die gleiche Geschichte mit Podcasts passiert - Hörer abonnieren ihre Lieblings-Podcasts, damit sie schnell erreichbar sind und neuen Episoden folgen können.



Wir haben uns entschlossen, diese Hypothese auf einer beliebten Plattform zu testen, über die das Publikum Podcasts hört. Laut Tiburon ist Yandex.Music führend beim Hören von Podcasts.



Bild



Glücklicherweise hat Ya Music eine Benutzerseite, die Informationen zu Podcast-Abonnements enthält.



Ein Beispiel für ein Profil mit einem Foto und Abonnements für Podcasts



Bild



Zusätzlich zum Abonnement selbst gibt es einen Spitznamen und einen Benutzeravatar im öffentlichen Bereich. Dies ist bereits etwas, da wir tatsächlich den Kern der Podcast-Hörer sehen, dh diejenigen, die sie regelmäßig hören. Auch hier haben wir den User-Podcast-Link, den wir finden wollten.



Mechanik



Wir haben begonnen, Daten zu sammeln, nämlich Benutzer und Podcasts, die Hörer abonniert haben. Zunächst fanden wir Ya.Muzyka-Benutzer mit Podcasts zu den Daten von Dentsu-Mitarbeitern, die ihre Postfächer auf Yandex bereitgestellt hatten. Es war nicht schwierig, das Projekt zu skalieren, da wir seit mehreren Jahren mit öffentlichen Daten arbeiten.



Die gute Nachricht war, dass sich die Abonnentenbasis der Podcasts sehr schnell sammelte - in nur anderthalb Monaten haben wir über 10.000 Benutzer, die mindestens einen Podcast abonniert haben.



Es gab aber auch schlechte Nachrichten - es ist nicht immer möglich, Geschlecht und Alter anhand von Foto und Spitznamen per Auge zu bestimmen, oder vielmehr, es ist überhaupt unmöglich. Um relevante Podcasts für unterschiedliche Zielgruppen auswählen zu können, können wir für uns nicht auf Geschlecht und Alter verzichten. Unser neuronales Netzwerk hat



diese Aufgabe bewältigt, Geschlecht und Alter anhand eines Fotos zu bestimmen , dessen Genauigkeit 96% beträgt. Der Algorithmus ist einfach: Wir machen ein Foto des Benutzers J. Music, suchen nach einem Gesicht und bestimmen damit Geschlecht und Alter. Das Gesicht wird von der Gesichtserkennungsbibliothek gefunden



mit dlib. Das Herzstück unseres neuronalen Netzwerks ist ein vorab trainiertes VGGFace-Modell, das auf der ResNet-50-Architektur basiert und das wir auf Fotos von VK-Benutzern trainiert haben, die über die öffentliche API verfügbar sind. Der Datensatz besteht aus einer Million Fotografien, die zusätzlich durch Albumentationen erweitert wurden. Es ist zu beachten, dass wir zu Schulungszwecken keine Fotos von Benutzern unter 12 Jahren und über 65 Jahren berücksichtigen.



Ergebnisse



Nach dem Training haben wir festgestellt, dass wir in etwa 45% der Benutzerprofile mit Podcasts Geschlecht und Alter bestimmen können, da es viele Profile ohne Foto oder Bild, Symbol oder nur ein Foto von schlechter Qualität gibt. Aber auch dieses Ergebnis passt zu uns.



Unter Berücksichtigung der Dynamik bei der Suche nach Profilen, die Podcasts abonnieren, erwarten wir, dass in einigen Monaten die Hörerbasis 50.000 Profile umfassen wird und 22.500 davon Geschlecht und Alter haben werden.



Beispiel für ein Profil, anhand dessen wir Geschlecht und Alter nicht bestimmen können.

Bild



Aktuelle Entwicklungen ermöglichen es uns, Beispiele für affinitive Podcasts für verschiedene Zielgruppen zu erstellen.



Eine Auswahl von 20-50 Podcasts zu markenrelevanten Themen



Bild



Affinität = Zielgruppe unter Podcast-Hörern / allen Podcast-Hörern) / (alle Podcast-Hörer / alle Personen mit Podcasts)



Wir können auch einen bestimmten Podcast analysieren, wenn der Werbetreibende daran interessiert ist.

Indem wir sehen, wie viele Personen Podcasts abonniert haben, können wir Empfehlungen zum Podcast-Paket abgeben, die die größte Reichweite erzielen.



Abdeckungskurve für 50 ausgewählte Podcasts



Bild



Jeder Punkt +1 Podcast pro Mischung. Der erste Punkt ist der Podcast mit dem größten einzigartigen Publikum, der letzte Punkt ist der Podcast mit dem kleinsten einzigartigen Publikum.



Kurvenmechanik und mathematisches Modell



Zuerst nehmen wir den Podcast, der ein größeres Publikum hat, in unserem Fall Podcast 3. Nachfolgend finden Sie eine Tabelle, in der die Brute-Force-Logik offenbart wird, dh das Prinzip der Verteilung von Schlichtern auf Podcasts.



Bild



Als nächstes streichen wir die Hörer durch, die wir mit Podcast 3 erreichen, und wählen erneut den Podcast mit dem einzigartigsten Publikum aus (Podcast 4). Dies ist ein Podcast, der uns 2 neue, einzigartige Hörer bietet. Wir empfehlen daher, ihn als nächstes zu platzieren.



Bild



Wir wiederholen die Übung und es stellt sich heraus, dass wir nicht mehr einzigartige Hörer behandeln werden, dh die Platzierung in 2 von 6 Podcasts reicht aus, um alle möglichen einzigartigen Zuschauer abzudecken.



Bild



Schlussfolgerungen



Wir haben nicht alle Fragen beantwortet und suchen weiterhin nach Daten. Zum Beispiel hat Ya.Muzyka kürzlich begonnen, Informationen über die Anzahl der abonnierten Zuschauer für jeden der Podcasts zu veröffentlichen. Jetzt verstehen wir die Lautstärke der gesammelten Zuhörer aus der Summe.



Wir arbeiten an der Mechanik der Kombination von Abonnementdaten mit Daten von Websites und Podcastern, um das Modell für die Schätzung der Anzahl und Zusammensetzung der Hörer zu verfeinern. Unser Ansatz trägt jedoch bereits jetzt dazu bei, das Planungsschema für die Integration von Werbung in Podcasts zu ändern und nicht von aggregierten Daten der Verkäufer oder der Intuition des Werbetreibenden über das Podcast-Publikum, sondern vom Markenpublikum auszugehen. Und auch Podcast-Pakete zu erstellen, die speziell für dieses Markenpublikum relevant sind, und die maximale Reichweite dafür zu schaffen.



Autor Sasha_Kopylova



All Articles