Was ist in meinem Inhalt fĂŒr Sie? Jahrhunderte alte Evolution und Grundprinzipien der Personalisierung von Inhalten

Hallo% Benutzername%! Heute werden wir ĂŒber die Geschichte der Personalisierung von Inhalten sprechen, die Prinzipien der Bildung einer „Inhaltsblase“ fĂŒr jeden von uns, sowohl basierend auf persönlichen Vorlieben als auch auf der Grundlage des digitalen Fingerabdrucks eines Benutzers. Nun, der Vortrag wird von Lydia Khramova gehalten, einer Teamleiterin fĂŒr Datenwissenschaft am QIWI und Lehrerin des Kurses „Beruf“, „Daten“, „Wissenschaftlerin“, bei Skillbox. Sie versuchte, ĂŒber die wichtigsten und interessantesten Nuancen der Inhaltserstellungsprozesse zu berichten, damit dieser Artikel fĂŒr alle verstĂ€ndlich war, nicht nur fĂŒr Spezialisten.



Der ganze Spaß ist unter dem Schnitt!



Wenn wir im morgendlichen Nickerchen durch den Feed unseres bevorzugten sozialen Netzwerks scrollen, denken wir kaum darĂŒber nach, wie der Algorithmus funktioniert. Er liefert Informationen, die fĂŒr uns interessant sind. Dank dieses und anderer Algorithmen folgt uns der Inhalt ĂŒberall hin. Wenn Sie GlĂŒck haben - es sieht aus wie eine große gemĂŒtliche Decke mit atmosphĂ€rischen Fotos und Musik, wenn Sie kein GlĂŒck haben -, reicht es mit einer nervigen und klebrigen Wolke hinter uns, die Sie beiseite streichen möchten, obwohl dies nicht immer der Fall ist.



Es scheint, dass wir nicht bemerkt haben, wann die physische Welt eine neue Dimension hatte - die Dimension des Inhalts mit ihren eigenen Regeln und Eigenschaften. Aber wir haben uns schnell daran gewöhnt.



Die FĂŒlle an Informationen lĂ€sst uns vergessen, wie wir Wissen und Erfahrung sammeln und sichten können - schließlich ist es fertig und sortiert bereits auf unserem Teller, wie eine Auswahl an Delikatessen. Aber woher kommt das alles und vor allem - wie können wir unsere Content-Umgebung beeinflussen? Und können wir?



Geschichte des Rankings und der Suche



Entgegen der landlĂ€ufigen Meinung sind Werkzeuge zum AuswĂ€hlen und Ranking von Informationen fĂŒr verschiedene nĂŒtzliche Zwecke eine ziemlich alte Erfindung. Es erschien nicht jetzt, sondern im Zeitalter halb vergessener Bibliothekskataloge.



Vor der Erfindung der Buchdruckmaschine im 15. Jahrhundert war der Bibliothekskatalog nur ein Inventar wertvoller BĂŒcher mit ihren Titeln. Es war das Erscheinen gedruckter Exemplare, das die Notwendigkeit einer Katalogisierung und bequemen Suche nach den notwendigen Werken bei Bibliothekaren und Lesern hervorrief.

Es ist ziemlich schwierig festzustellen, wer genau der Schöpfer des ersten Katalogs wurde. Einige Quellen schreiben seine Erfindung Johann Trithemius, Abt von Spongheim, Bibliothekar, Historiker und Liebhaber der Kryptographie, zu, aber die meisten erwÀhnen Gottfried Van Swieten, einen österreichischen Beamten und PrÀfekten der Wiener Reichsbibliothek.



Es war Gottfried Van Swieten, der 1780 den ersten Kartenkatalog erstellte, der modernen Bibliothekskatalogen sehr Ă€hnlich war - Karten mit dem Titel des Buches, dem Namen des Autors, dem Erscheinungsjahr und einer kurzen Beschreibung. Wir können sagen, dass der Kartenkatalog ein Vorbote moderner Suchmaschinen geworden ist - schließlich waren es tatsĂ€chlich die ersten Metainformationen - dh Informationen ĂŒber andere Informationen, die fĂŒr die Suche und Navigation erforderlich sind. NatĂŒrlich konnten Van Swietens bescheidene Karten nicht alle BedĂŒrfnisse von Lesern und Forschern befriedigen - aber sie wurden erst 1870 dank der Erfindung des amerikanischen Bibliothekars Melville Dewey ersetzt.



Dewey arbeitete lange Zeit an der Verbesserung der Effizienz der Katalogisierung und kam zu einem völlig neuen System, das auf der Klassifizierung von BĂŒchern nach Inhalten basiert, dem sogenannten Dezimalsystem. Ihre Idee basierte darauf, alle Werke in zehn Abschnitte zu unterteilen - von allgemein ĂŒber Religion, Sprache, Geographie und Geschichte. Jeder Abschnitt war wiederum in zehn Unterabschnitte usw. unterteilt, wĂ€hrend der Code aus den numerischen Indizes des Abschnitts und der Unterabschnitte gebildet wurde, die rechts als Ruhm bezeichnet wurden, zum Beispiel:

500 Naturwissenschaften und Mathematik

510 Mathematik

516 Geometrie

TatsĂ€chlich war es das erste landesweite thematische Verzeichnis, mit dem Sie alle benötigten Informationen leicht finden können. Aufgrund des Fehlens nicht numerischer Zeichen in den Themenindizes war das Dewey-System außerdem ideal fĂŒr die maschinelle Verarbeitung geeignet und ist weiterhin in Bibliotheken in den USA und Kanada gĂŒltig.



Diese Erfindung brachte die belgischen Bibliographen Paul Otle und Henri La Fontaine zu einer noch gewagteren Idee: PapierbĂŒcher durch ein System elektronischer Karten durch Informationsfragmente zu ersetzen, die es ihnen ermöglichen wĂŒrden, sie ohne die subjektive Meinung des Autors zu klassifizieren. 1934 wurde diese Idee in dem Buch "Monde" von Paul Otlet verkörpert, das nach Ansicht vieler Forscher die Schaffung des Internets vorwegnahm. Leider ist dieses Buch auf Russisch schwer zu finden, daher werde ich nur ein Zitat auf Englisch geben:

„Alles im Universum und alles vom Menschen wĂŒrde in einiger Entfernung registriert werden, wie es produziert wurde. Auf diese Weise wird ein bewegtes Bild der Welt geschaffen, ein wahrer Spiegel seiner Erinnerung. Aus der Ferne kann jeder Text lesen, vergrĂ¶ĂŸert und auf das gewĂŒnschte Motiv beschrĂ€nkt, projiziert auf einen einzelnen Bildschirm. Auf diese Weise kann jeder von seinem Sessel aus die Schöpfung als Ganzes oder in bestimmten Teilen betrachten. “



Erinnert uns an unsere RealitÀten, nicht wahr?



Leider wurden Paul Otlets Ideen zu Lebzeiten nicht Wirklichkeit und das World Wide Web wurde viel spĂ€ter geboren. Und bereits 1998 begann mit der Erfindung des PageRank-Algorithmus zur Bewertung von Internetseiten durch Sergey Brin und Larry Page die Ära des endlosen Surfens im Internet.



Informationen sind verfĂŒgbar geworden, die Suche ist bequem und einfach. Mit dem Aufkommen neuer Speicher- und Rechenleistung begann das GeschĂ€ft, Daten zu sammeln.



Das zweischneidige Schwert von Big Data



Das zunehmende Volumen an gesammelten Daten versprach neue GeschÀftsmöglichkeiten - von besseren Kundenerkenntnissen bis hin zu völlig neuen digitalen Produkten.



Die Analyse von Schmuckarbeiten zum Testen jeder Hypothese hat sich zu einer Suche nach stabilen Mustern in riesigen DatensĂ€tzen entwickelt, die Menschen und WeltphĂ€nomene beschreiben. Dieser Ansatz ermöglichte es uns, Dinge zu sehen, die vorher einfach nicht verfĂŒgbar waren, verschiedene Prozesse zu modellieren und zu optimieren, von Werbung bis zu Produktangeboten, das Kundenerlebnis in verschiedenen Bereichen zu personalisieren und es zur Freude des Kunden und des Unternehmens zu verbessern. Dieser Sprung ist meiner Meinung nach vergleichbar mit dem Übergang von einem mittelalterlichen Buchinventar zu einem kohĂ€renten System von Kartenkatalogen, bei dem jedem Objekt ein eigener Regalplatz und ein eigenes Etikett zugewiesen werden.



Dennoch ist die Arbeit mit Big Data noch nicht fĂŒr alles zum Allheilmittel geworden, und dafĂŒr gibt es mehrere GrĂŒnde.



  • , , , . , – , , , .
  • , . , , , , , .
  • , , . , – , .
  • – , , – , -.


Trotz dieser EinschrĂ€nkungen finden immer mehr Unternehmen die Ressourcen und Möglichkeiten, ihre eigenen Services bereitzustellen, um das Kundenerlebnis zu personalisieren und ihren Gewinn zu steigern. Aus einer Wissensquelle werden Daten zu einer Quelle fĂŒr die Monetarisierung, die manchmal recht aggressiv ist. In einigen FĂ€llen sind sogar Nebenwirkungen sowohl fĂŒr den Kunden als auch fĂŒr das Unternehmen möglich: von der InformationsĂŒberflutung bis zur sogenannten Inhaltsblase. Und bevor wir darĂŒber sprechen, wollen wir es herausfinden - was verbirgt sich unter der Haube der Empfehlungen?



Unter der Haube persönlicher Empfehlungen



Die meisten Modelle, die Inhalte, Produkte oder Dienstleistungen anbieten, fallen in eines von fĂŒnf einfachen Konzepten.



  1. . , – , , , .
  2. . , / , , .
  3. . , , « – » . , – , .
  4. . , – , . , – , . – , . , , 70- – .
  5. – , .


Probleme mit Empfehlungen und Neuladen



der Inhaltsumgebung Alle diese Modelle funktionieren recht gut (sogar Heuristiken!), Können aber dennoch zu unangenehmen Situationen fĂŒhren:



  • ÜbersĂ€ttigung. Viele Ă€hnliche Modelle, die auf unvollstĂ€ndigen Daten trainiert sind (schließlich verfĂŒgt jedes Unternehmen nur ĂŒber ein StĂŒck Wissen), greifen Sie mit denselben VorschlĂ€gen an. Angenommen, Sie sind ein Kaffeeliebhaber. Und so wurde Ihnen heute Morgen im nĂ€chsten CafĂ© ein wunderbar duftender Cappuccino angeboten. Der Vorschlag hat Ihre Begeisterung und Freude geweckt, die Crema aufzunehmen. Aber dann klopft ein weiterer Stoß mit einem Hauch Kaffee, einem weiteren Banner - und jetzt sind es fĂŒnfzehn. Wie viele Tassen Kaffee können Sie an einem Tag trinken?
  • – , , / , . , – .
  • – -, .
  • – , , 9 , . , , .
  • – , , , - . , .


Solche Situationen sind nicht nur fĂŒr den Kunden, sondern auch fĂŒr das Unternehmen Ă€ußerst unerwĂŒnscht, da sie den Wunsch, weiterhin mit den beworbenen Diensten zu interagieren oder ein bestimmtes Produkt oder eine bestimmte Anwendung zu verwenden, erheblich verringern können.



Ein wesentlicher Teil davon kann innerhalb des Empfehlungssystems korrigiert werden. Beispielsweise werden irrelevante Zeit oder aufdringliche Empfehlungen durch eine gut entwickelte Kommunikationspolitik und einen gut entwickelten Zeitplan beseitigt.



Sogar die Inhaltsblase kann weniger eintönig werden, wenn Sie dem Empfehlungssystem konkurrierende Algorithmen hinzufĂŒgen, die alternative VorschlĂ€ge anzeigen, oder ein zusĂ€tzliches Element der ZufĂ€lligkeit, das Ihnen etwas völlig Neues bietet und bei Interesse die Grenzen der Empfehlungen erweitert (siehe Abbildung 1).





Zahl: 1 Konkurrierende Modelle mit zufÀlligen ErgÀnzungen.



Einige der Folgen unvollstĂ€ndiger Empfehlungen mĂŒssen jedoch von uns selbst behandelt werden. Welche Methoden können Ihnen helfen, fĂŒr eine unterhaltsame Inhaltsumgebung zu kĂ€mpfen?



So verbessern Sie Ihre Inhaltsumgebung



Um den Weg zu Ihren relevanten und relevanten Inhalten zu finden, versuchen Sie, mit den Algorithmen um Sie herum zu spielen und herauszufinden, auf welche sie am besten reagieren. Aber vorher schlage ich vor, ein paar einfache Data Science-Hygieneregeln zu verabschieden, die Sie vor den nervigsten Empfehlungen bewahren.



  • – , , , . – , – , email.
  • – , .
  • – « », , - .
  • Seien Sie vorsichtig, wenn Sie fĂŒr EinkĂ€ufe bezahlen - es ist am besten, separate Zahlungsinstrumente fĂŒr alle Familienmitglieder und manchmal fĂŒr separate Zwecke zu haben.
  • Schalten Sie WLAN an Orten mit vielen öffentlichen Netzwerken regelmĂ€ĂŸig aus.


Verwenden Sie andernfalls die aktive Suche hĂ€ufiger und probieren Sie etwas Neues aus. Die meisten guten Empfehlungsmodelle verwenden nicht nur Retro-Daten (Daten ĂŒber Ihre AktivitĂ€t ĂŒber einen langen Zeitraum), sondern auch Daten ĂŒber aktuelle Aktionen, wodurch ihnen eine höhere PrioritĂ€t eingerĂ€umt wird. Nachdem Sie ein wenig mit neuen Anfragen herumgespielt haben, können Sie einen Teil des Inhalts erhalten, der Ihrer aktuellen Stimmung entspricht.



Und wenn dies nicht ausreicht, schließen Sie sich den schlanken Reihen der Datenwissenschaftler an, um das ideale Empfehlungssystem zu erstellen und alle Feinheiten von innen heraus zu lernen. Maschinelles Lernen ist ohne neugierigen menschlichen Verstand unverzichtbar!

Zu diesem Thema:







  1. www.history.ox.ac.uk/british-medieval-library-catalogues
  2. Fred Lerner, “The story of libraries, from invention of writing to the computer age”, continuum, 2006
  3. en.wikipedia.org/wiki/Gottfried_van_Swieten#As_librarian
  4. en.wikipedia.org/wiki/Dewey_Decimal_Classification
  5. Milena Tsvetkova. – – : . Scientific Enquiry in the Contemporary World: Theoretical basis and innovative approach, 2016, San Francisco, United States. pp.115-128
  6. boxesandarrows.com/forgotten-forefather-paul-otlet
  7. www.mondotheque.be/wiki/images/e/e2/Heuvel_Rayward_Facing_Interfaces.pdf
  8. Sergey Brin, Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine. — 1998.
  9. googleblog.blogspot.com/2009/12/personalized-search-for-everyone.html



All Articles