So verwenden Sie ein neuronales Netzwerk, um das beste E-Mail-Versanddatum zu ermitteln und den Mailing-Umsatz um das 8,5-fache zu steigern

Um zu verhindern, dass E-Mail-Newsletter in ihren Posteingängen verloren gehen und Kunden häufiger E-Mails öffnen und Einkäufe tätigen, ist es wichtig, die richtige Sendezeit zu erraten. Mithilfe eines neuronalen Netzwerks haben wir das Kundenverhalten analysiert und das Datum des Versendens der nächsten E-Mail vorhergesagt, um dem Kunden Produkte zum Zeitpunkt des Kaufs zu empfehlen. In Tierhandlungen auf Mailinglisten zum erneuten Kauf getestet und das Ergebnis mithilfe von AB-Tests bewertet. Wir haben folgende Ergebnisse erhalten:



23-mal

mehr gezielte E-Mails über ein neuronales Netzwerk im Vergleich zu einem Auslöser



8,5-mal

mehr Einnahmen aus E-Mail-Marketing durch Zuordnung Letzter Klick



2-mal

weniger Abmeldungen



17-mal

mehr Öffnungen





Im Folgenden werden wir unsere Erfahrungen teilen und Ihnen sagen:



  • warum wir uns entschieden haben, das neuronale LSTM-Netzwerkmodell zu verwenden, um das E-Mail-Versanddatum anstelle des Algorithmus zur Erhöhung des Gradienten vorherzusagen;
  • wie das LSTM funktioniert;
  • Welche Daten verwendet das neuronale Netzwerk für das Training?
  • Welche Architektur des neuronalen Netzes wurde verwendet und auf welche Schwierigkeiten stießen sie?
  • Welche Ergebnisse wurden erzielt und wie wurden sie bewertet?


Warum haben Sie sich entschieden, den Algorithmus zur Erhöhung des Gradienten zugunsten von LSTM aufzugeben?



E-Mail-Newsletter helfen dabei, Kunden über neue Produkte zu informieren, Kunden zu reaktivieren oder personalisierte Empfehlungen anzuzeigen. Für jeden Kunden ist das Datum des besten Mailings unterschiedlich: Jemand kauft am Wochenende ein, daher ist es am besten, am Samstag eine E-Mail zu senden. und jemand hat kürzlich ein Haus für eine Katze gekauft, und es lohnt sich, so schnell wie möglich einen Brief zu senden und ihn über das Essen zu beraten. Mithilfe eines neuronalen Netzwerks konnten wir das beste Datum für das Senden einer E-Mail ermitteln und die Bedürfnisse des Kunden erraten.



Zuerst verwendeten wir Standardalgorithmen. Ein ganzes Jahr lang haben wir Zeichen aus der Geschichte der Kundenaktionen erstellt und die Gradientenverstärkung darauf trainiert, um das beste Datum für das Versenden von E-Mails vorherzusagen. Zum Beispiel:



  • berechnet, wie viele Tage vom Kaufdatum bis zum nächsten Kauf vergehen;
  • versuchte, eine Klassifizierung der Zeichen vorzunehmen und die Wahrscheinlichkeit vorherzusagen, an einem bestimmten Tag einen Brief zu senden;
  • Es wurde versucht, die Interessen des Benutzers in Abhängigkeit vom Wohnort zu ermitteln, um die Wahrscheinlichkeit zu erhöhen, dass der Brief und die Klicks angezeigt werden.


Dieses Modell lieferte jedoch nicht für alle Projekte ein stabiles positives Ergebnis, konnte keine komplexen Muster im Benutzerverhalten finden und brachte nicht genug Geld ein.



Als wir bereits daran dachten, den Algorithmus aufzugeben und das E-Mail-Versanddatum vorherzusagen, beschlossen wir, etwas Exotisches auszuprobieren und das LSTM-Modell des neuronalen Netzwerks für diese Aufgabe zu trainieren. Es wird normalerweise für die Textanalyse verwendet, seltener für die Analyse der Aktienkurse an den Finanzmärkten, jedoch niemals für Marketingzwecke. Und das LSTM hat funktioniert.



Was ist LSTM?



LSTM (Long Short Term Memory) ist eine neuronale Netzwerkarchitektur, die aus der Analyse natürlicher Sprache stammt.



Lassen Sie uns am Beispiel der maschinellen Übersetzung analysieren, wie LSTM funktioniert. Alle Buchstaben des Textes werden der Reihe nach dem Eingang des neuronalen Netzwerks zugeführt, und am Ausgang möchten wir eine Übersetzung in eine andere Sprache erhalten. Um Text zu übersetzen, muss das Netzwerk nicht nur Informationen über den aktuellen Brief speichern, sondern auch über diejenigen, die davor waren. Ein gewöhnliches neuronales Netzwerk erinnert sich nicht an das, was es zuvor gezeigt hat, und kann nicht ein ganzes Wort oder einen ganzen Text übersetzen. LSTM hingegen verfügt über spezielle Speicherzellen, in denen nützliche Informationen gespeichert sind. Daher wird ein Ergebnis basierend auf den Gesamtdaten erstellt und der Text unter Berücksichtigung aller Buchstaben in Wörtern übersetzt. Im Laufe der Zeit kann das neuronale Netzwerk Zellen löschen und Informationen vergessen, die nicht mehr benötigt werden.



Das gleiche Prinzip erwies sich als wichtig für die Vorhersage von Benutzeraktionen. Das neuronale Netzwerk berücksichtigte den gesamten Verlauf der Aktionen und lieferte relevante Ergebnisse. So wurde beispielsweise das beste Datum für das Senden einer E-Mail ermittelt.



Interne Struktur einer Schicht LSTM





Die innere Schicht des LSTM besteht aus den Operationen Addition + , Multiplikation × , Sigmoid σ und hyperbolischer Tangente tanh



Welche Daten werden vom neuronalen Netz verwendet?



Um zu erfahren, wie das beste Versanddatum für E-Mails vorhergesagt werden kann, analysiert das neuronale Netzwerk eine Reihe historischer Daten. Wir übergeben in der Reihenfolge die zwischen Aktionen und 9 Arten von Token verstrichene Zeit:



  • ein billiges Produkt kaufen,
  • Kauf eines Durchschnittspreisprodukts,
  • ein teures Produkt kaufen,
  • ein billiges Produkt ansehen,
  • Anzeigen eines Durchschnittspreisprodukts,
  • Betrachten eines teuren Produkts,
  • einen Brief erhalten,
  • einen Brief öffnen,
  • Klicken Sie auf ein Objekt im Brief.


So sieht ein typisches Beispiel für eine Eingabesequenz aus:



(view_medium, 0.5, view_cheap, 24, buy_cheap) Ein



Benutzer mit dieser Sequenz hat sich ein Produkt zum Durchschnittspreis angesehen, in einer halben Stunde ein billiges Produkt angesehen und sich für den Kauf entschieden einen Tag später ein billiges Produkt.



Die letzten fünf Benutzeraktionen sind die Zielvariable. Ihr neuronales Netzwerk hat gelernt, Vorhersagen zu treffen.



Welche Architektur des neuronalen Netzes wurde verwendet



Die ersten Versuche, das neuronale Netz zu trainieren, waren erfolglos: Es wurde umgeschult und sagte immer nur das Senden eines Briefes voraus und keine anderen Aktionen, zum Beispiel die Wahrscheinlichkeit, einen Brief zu öffnen oder zu kaufen. Da Kunden eher E-Mails erhalten als sie öffnen oder etwas kaufen, ist „E-Mail empfangen“ das häufigste Token. Das neuronale Netz erhielt gute Ergebnisse in Bezug auf Metriken, obwohl das tatsächliche Ergebnis negativ war. Schließlich macht ein Algorithmus keinen Sinn, der immer besagt, dass der Kunde einen Brief erhält - und sonst nichts.



Zum Beispiel gibt es eine Eingabesequenz von drei Token "einen Brief erhalten" und einem "Kauf von Waren". Das neuronale Netzwerk verarbeitet es und sagt eine Sequenz mit vier "Empfangsmail" -Token voraus. In 3 von 4 Fällen wird sie raten, und der Kunde wird zwar einen Brief erhalten, aber eine solche Vorhersage macht keinen Sinn. Die Hauptaufgabe besteht darin, vorherzusagen, wann ein Kunde eine E-Mail öffnen und einen Kauf tätigen wird.



Nachdem wir verschiedene Architekturen und Lernpfade getestet hatten, fanden wir heraus, was funktionierte.



Wie bei Seq2Seq-Modellen üblich, besteht das Netzwerk aus zwei Teilen: einem Encoder und einem Decoder. Der Encoder ist klein und besteht aus LSTM und Einbettungsschichten, aber der Decoder verwendet auch Selbstaufmerksamkeit und Ausfall. Im Training verwenden wir das Forcen von Lehrern - manchmal geben wir eine Netzwerkvorhersage als Eingabe für die nächste Vorhersage.



Der Codierer codiert die Eingabesequenz in einen Vektor, der nach Ansicht des Netzwerks wichtige Informationen über die Aktionen des Benutzers enthält. Im Gegensatz dazu decodiert der Decoder den resultierenden Vektor in eine Sequenz - dies ist die Netzwerkvorhersage.



Abrufen einer Vorhersage mithilfe eines LSTM-Netzwerks







Trainingszeit: Das Modell wurde ungefähr einen Tag lang auf Tesla V100 trainiert und erhielt nach Abschluss des Trainings ROC-AUC 0,74.



Wie das LSTM-Modell mit realen Daten funktioniert (Inferenz)



Um das Modell für einen Benutzer anzuwenden und herauszufinden, ob es sich lohnt, ihm einen Brief zu senden, sammeln wir einen Vektor aus seinen letzten Aktionen und führen ihn durch das neuronale Netzwerk. Angenommen, die Antwort des neuronalen Netzwerks war wie



folgt : (email_show, 10, email_open, 0.5, view_cheap, 0.5 view_medium, 15 buy_medium)



Das Modell sagt nicht nur Aktionen voraus, sondern auch, wie viel Zeit zwischen ihnen vergehen wird. Lassen Sie uns alle Ereignisse abschneiden, die später als einen Tag später eintreten. Wir werden sie am nächsten Tag verarbeiten, da während dieser Zeit möglicherweise neue Informationen über die Aktionen des Kunden angezeigt werden, die berücksichtigt werden müssen. Wir erhalten die folgende Sequenz:



(email_show, 10, email_open, 0.5, view_cheap, 0.5 )



Die Sequenz enthält ein Ansichtstoken, sodass heute eine E-Mail an den Benutzer gesendet wird.



Es ist wichtig, eine E-Mail nur zu senden, wenn ein Anzeige- oder Kauf-Token vorhanden ist und keine E-Mail empfangen wird, damit das Netzwerk die zuvor gespeicherten Trigger-Mailings nicht wiederholt. Wenn Sie beispielsweise das Anzeigen und Kaufen nicht berücksichtigen, können wir eine Sequenz nur mit Token zum Empfangen eines Briefes erhalten. Und dann dupliziert das Netzwerk die Triggereinstellungen des Vermarkters, anstatt das Öffnen einer E-Mail oder eines Kaufs vorherzusagen :



(email_show, 10, email_show, 15, email_show, 0.5)



Wie das Ergebnis bewertet wurde



Um die Leistung des Modells zu überprüfen, haben wir AB-Tests durchgeführt. Als Basis haben wir einen Algorithmus verwendet, der die durchschnittliche Zeit zwischen den Käufen eines Benutzers berechnet und nach Ablauf dieser Zeit eine E-Mail sendet. Die eine Hälfte der Benutzer erhielt E-Mails basierend auf den Basisentscheidungen, die andere - gemäß den Modellvorhersagen. AB-Tests wurden mit dem Kundenstamm der Zoohandlungen Beethoven und Staraya Farm durchgeführt .



Der Test dauerte zwei Wochen und erreichte statistische Signifikanz. Das neuronale Netzwerk hat gelernt, 23-mal mehr Benutzer zu finden, die eine E-Mail senden sollten, während die Öffnungsrate prozentual nur um 5% sank und die Anzahl der Öffnungen in absoluten Zahlen um das 17-fache zunahm.



AB-Testergebnis für das neuronale LSTM-Netzwerkmodell und Schlussfolgerungen







Das Experiment mit einem neuronalen Netzwerk anstelle eines Algorithmus erwies sich als erfolgreich. Das neuronale LSTM-Netzwerkmodell hat sich zu einem geeigneten Werkzeug für die Vorhersage des besten E-Mail-Versanddatums entwickelt. Wir haben aus eigener Erfahrung gelernt, dass es keinen Grund zur Angst gibt, nicht standardisierte Modelle zur Lösung trivialer Probleme zu verwenden.



Sergey Yudin, ML-Entwickler, Autor



All Articles