🐷 👩‍👧‍👧 🏟️ Was ist in meinem Inhalt für Sie? Jahrhunderte alte Evolution und Grundprinzipien der Personalisierung von Inhalten 🦅 😝 🕠

Hallo% Benutzername%! Heute werden wir über die Geschichte der Personalisierung von Inhalten sprechen, die Prinzipien der Bildung einer „Inhaltsblase“ für jeden von uns, sowohl basierend auf persönlichen Vorlieben als auch auf der Grundlage des digitalen Fingerabdrucks eines Benutzers. Nun, der Vortrag wird von Lydia Khramova gehalten, einer Teamleiterin für Datenwissenschaft am QIWI und Lehrerin des Kurses „Beruf“, „Daten“, „Wissenschaftlerin“, bei Skillbox. Sie versuchte, über die wichtigsten und interessantesten Nuancen der Inhaltserstellungsprozesse zu berichten, damit dieser Artikel für alle verständlich war, nicht nur für Spezialisten.

Der ganze Spaß ist unter dem Schnitt!

Wenn wir im morgendlichen Nickerchen durch den Feed unseres bevorzugten sozialen Netzwerks scrollen, denken wir kaum darüber nach, wie der Algorithmus funktioniert. Er liefert Informationen, die für uns interessant sind. Dank dieses und anderer Algorithmen folgt uns der Inhalt überall hin. Wenn Sie Glück haben - es sieht aus wie eine große gemütliche Decke mit atmosphärischen Fotos und Musik, wenn Sie kein Glück haben -, reicht es mit einer nervigen und klebrigen Wolke hinter uns, die Sie beiseite streichen möchten, obwohl dies nicht immer der Fall ist.

Es scheint, dass wir nicht bemerkt haben, wann die physische Welt eine neue Dimension hatte - die Dimension des Inhalts mit ihren eigenen Regeln und Eigenschaften. Aber wir haben uns schnell daran gewöhnt.

Die Fülle an Informationen lässt uns vergessen, wie wir Wissen und Erfahrung sammeln und sichten können - schließlich ist es fertig und sortiert bereits auf unserem Teller, wie eine Auswahl an Delikatessen. Aber woher kommt das alles und vor allem - wie können wir unsere Content-Umgebung beeinflussen? Und können wir?

Geschichte des Rankings und der Suche

Entgegen der landläufigen Meinung sind Werkzeuge zum Auswählen und Ranking von Informationen für verschiedene nützliche Zwecke eine ziemlich alte Erfindung. Es erschien nicht jetzt, sondern im Zeitalter halb vergessener Bibliothekskataloge.

Vor der Erfindung der Buchdruckmaschine im 15. Jahrhundert war der Bibliothekskatalog nur ein Inventar wertvoller Bücher mit ihren Titeln. Es war das Erscheinen gedruckter Exemplare, das die Notwendigkeit einer Katalogisierung und bequemen Suche nach den notwendigen Werken bei Bibliothekaren und Lesern hervorrief.

Es ist ziemlich schwierig festzustellen, wer genau der Schöpfer des ersten Katalogs wurde. Einige Quellen schreiben seine Erfindung Johann Trithemius, Abt von Spongheim, Bibliothekar, Historiker und Liebhaber der Kryptographie, zu, aber die meisten erwähnen Gottfried Van Swieten, einen österreichischen Beamten und Präfekten der Wiener Reichsbibliothek.

Es war Gottfried Van Swieten, der 1780 den ersten Kartenkatalog erstellte, der modernen Bibliothekskatalogen sehr ähnlich war - Karten mit dem Titel des Buches, dem Namen des Autors, dem Erscheinungsjahr und einer kurzen Beschreibung. Wir können sagen, dass der Kartenkatalog ein Vorbote moderner Suchmaschinen geworden ist - schließlich waren es tatsächlich die ersten Metainformationen - dh Informationen über andere Informationen, die für die Suche und Navigation erforderlich sind. Natürlich konnten Van Swietens bescheidene Karten nicht alle Bedürfnisse von Lesern und Forschern befriedigen - aber sie wurden erst 1870 dank der Erfindung des amerikanischen Bibliothekars Melville Dewey ersetzt.

Dewey arbeitete lange Zeit an der Verbesserung der Effizienz der Katalogisierung und kam zu einem völlig neuen System, das auf der Klassifizierung von Büchern nach Inhalten basiert, dem sogenannten Dezimalsystem. Ihre Idee basierte darauf, alle Werke in zehn Abschnitte zu unterteilen - von allgemein über Religion, Sprache, Geographie und Geschichte. Jeder Abschnitt war wiederum in zehn Unterabschnitte usw. unterteilt, während der Code aus den numerischen Indizes des Abschnitts und der Unterabschnitte gebildet wurde, die rechts als Ruhm bezeichnet wurden, zum Beispiel:

500 Naturwissenschaften und Mathematik

510 Mathematik

516 Geometrie

Tatsächlich war es das erste landesweite thematische Verzeichnis, mit dem Sie alle benötigten Informationen leicht finden können. Aufgrund des Fehlens nicht numerischer Zeichen in den Themenindizes war das Dewey-System außerdem ideal für die maschinelle Verarbeitung geeignet und ist weiterhin in Bibliotheken in den USA und Kanada gültig.

Diese Erfindung brachte die belgischen Bibliographen Paul Otle und Henri La Fontaine zu einer noch gewagteren Idee: Papierbücher durch ein System elektronischer Karten durch Informationsfragmente zu ersetzen, die es ihnen ermöglichen würden, sie ohne die subjektive Meinung des Autors zu klassifizieren. 1934 wurde diese Idee in dem Buch "Monde" von Paul Otlet verkörpert, das nach Ansicht vieler Forscher die Schaffung des Internets vorwegnahm. Leider ist dieses Buch auf Russisch schwer zu finden, daher werde ich nur ein Zitat auf Englisch geben:

„Alles im Universum und alles vom Menschen würde in einiger Entfernung registriert werden, wie es produziert wurde. Auf diese Weise wird ein bewegtes Bild der Welt geschaffen, ein wahrer Spiegel seiner Erinnerung. Aus der Ferne kann jeder Text lesen, vergrößert und auf das gewünschte Motiv beschränkt, projiziert auf einen einzelnen Bildschirm. Auf diese Weise kann jeder von seinem Sessel aus die Schöpfung als Ganzes oder in bestimmten Teilen betrachten. “

Erinnert uns an unsere Realitäten, nicht wahr?

Leider wurden Paul Otlets Ideen zu Lebzeiten nicht Wirklichkeit und das World Wide Web wurde viel später geboren. Und bereits 1998 begann mit der Erfindung des PageRank-Algorithmus zur Bewertung von Internetseiten durch Sergey Brin und Larry Page die Ära des endlosen Surfens im Internet.

Informationen sind verfügbar geworden, die Suche ist bequem und einfach. Mit dem Aufkommen neuer Speicher- und Rechenleistung begann das Geschäft, Daten zu sammeln.

Das zweischneidige Schwert von Big Data

Das zunehmende Volumen an gesammelten Daten versprach neue Geschäftsmöglichkeiten - von besseren Kundenerkenntnissen bis hin zu völlig neuen digitalen Produkten.

Die Analyse von Schmuckarbeiten zum Testen jeder Hypothese hat sich zu einer Suche nach stabilen Mustern in riesigen Datensätzen entwickelt, die Menschen und Weltphänomene beschreiben. Dieser Ansatz ermöglichte es uns, Dinge zu sehen, die vorher einfach nicht verfügbar waren, verschiedene Prozesse zu modellieren und zu optimieren, von Werbung bis zu Produktangeboten, das Kundenerlebnis in verschiedenen Bereichen zu personalisieren und es zur Freude des Kunden und des Unternehmens zu verbessern. Dieser Sprung ist meiner Meinung nach vergleichbar mit dem Übergang von einem mittelalterlichen Buchinventar zu einem kohärenten System von Kartenkatalogen, bei dem jedem Objekt ein eigener Regalplatz und ein eigenes Etikett zugewiesen werden.

Dennoch ist die Arbeit mit Big Data noch nicht für alles zum Allheilmittel geworden, und dafür gibt es mehrere Gründe.

, , , . , – , , , .
, . , , , , , .
, , . , – , .
– , , – , -.

Trotz dieser Einschränkungen finden immer mehr Unternehmen die Ressourcen und Möglichkeiten, ihre eigenen Services bereitzustellen, um das Kundenerlebnis zu personalisieren und ihren Gewinn zu steigern. Aus einer Wissensquelle werden Daten zu einer Quelle für die Monetarisierung, die manchmal recht aggressiv ist. In einigen Fällen sind sogar Nebenwirkungen sowohl für den Kunden als auch für das Unternehmen möglich: von der Informationsüberflutung bis zur sogenannten Inhaltsblase. Und bevor wir darüber sprechen, wollen wir es herausfinden - was verbirgt sich unter der Haube der Empfehlungen?

Unter der Haube persönlicher Empfehlungen

Die meisten Modelle, die Inhalte, Produkte oder Dienstleistungen anbieten, fallen in eines von fünf einfachen Konzepten.

. , – , , , .
. , / , , .
. , , « – » . , – , .
. , – , . , – , . – , . , , 70- – .
– , .

Probleme mit Empfehlungen und Neuladen

der Inhaltsumgebung Alle diese Modelle funktionieren recht gut (sogar Heuristiken!), Können aber dennoch zu unangenehmen Situationen führen:

Übersättigung. Viele ähnliche Modelle, die auf unvollständigen Daten trainiert sind (schließlich verfügt jedes Unternehmen nur über ein Stück Wissen), greifen Sie mit denselben Vorschlägen an. Angenommen, Sie sind ein Kaffeeliebhaber. Und so wurde Ihnen heute Morgen im nächsten Café ein wunderbar duftender Cappuccino angeboten. Der Vorschlag hat Ihre Begeisterung und Freude geweckt, die Crema aufzunehmen. Aber dann klopft ein weiterer Stoß mit einem Hauch Kaffee, einem weiteren Banner - und jetzt sind es fünfzehn. Wie viele Tassen Kaffee können Sie an einem Tag trinken?
– , , / , . , – .
– -, .
– , , 9 , . , , .
– , , , - . , .

Solche Situationen sind nicht nur für den Kunden, sondern auch für das Unternehmen äußerst unerwünscht, da sie den Wunsch, weiterhin mit den beworbenen Diensten zu interagieren oder ein bestimmtes Produkt oder eine bestimmte Anwendung zu verwenden, erheblich verringern können.

Ein wesentlicher Teil davon kann innerhalb des Empfehlungssystems korrigiert werden. Beispielsweise werden irrelevante Zeit oder aufdringliche Empfehlungen durch eine gut entwickelte Kommunikationspolitik und einen gut entwickelten Zeitplan beseitigt.

Sogar die Inhaltsblase kann weniger eintönig werden, wenn Sie dem Empfehlungssystem konkurrierende Algorithmen hinzufügen, die alternative Vorschläge anzeigen, oder ein zusätzliches Element der Zufälligkeit, das Ihnen etwas völlig Neues bietet und bei Interesse die Grenzen der Empfehlungen erweitert (siehe Abbildung 1).

Zahl: 1 Konkurrierende Modelle mit zufälligen Ergänzungen.

Einige der Folgen unvollständiger Empfehlungen müssen jedoch von uns selbst behandelt werden. Welche Methoden können Ihnen helfen, für eine unterhaltsame Inhaltsumgebung zu kämpfen?

So verbessern Sie Ihre Inhaltsumgebung

Um den Weg zu Ihren relevanten und relevanten Inhalten zu finden, versuchen Sie, mit den Algorithmen um Sie herum zu spielen und herauszufinden, auf welche sie am besten reagieren. Aber vorher schlage ich vor, ein paar einfache Data Science-Hygieneregeln zu verabschieden, die Sie vor den nervigsten Empfehlungen bewahren.

– , , , . – , – , email.
– , .
– « », , - .
Seien Sie vorsichtig, wenn Sie für Einkäufe bezahlen - es ist am besten, separate Zahlungsinstrumente für alle Familienmitglieder und manchmal für separate Zwecke zu haben.
Schalten Sie WLAN an Orten mit vielen öffentlichen Netzwerken regelmäßig aus.

Verwenden Sie andernfalls die aktive Suche häufiger und probieren Sie etwas Neues aus. Die meisten guten Empfehlungsmodelle verwenden nicht nur Retro-Daten (Daten über Ihre Aktivität über einen langen Zeitraum), sondern auch Daten über aktuelle Aktionen, wodurch ihnen eine höhere Priorität eingeräumt wird. Nachdem Sie ein wenig mit neuen Anfragen herumgespielt haben, können Sie einen Teil des Inhalts erhalten, der Ihrer aktuellen Stimmung entspricht.

Und wenn dies nicht ausreicht, schließen Sie sich den schlanken Reihen der Datenwissenschaftler an, um das ideale Empfehlungssystem zu erstellen und alle Feinheiten von innen heraus zu lernen. Maschinelles Lernen ist ohne neugierigen menschlichen Verstand unverzichtbar!

Zu diesem Thema:

« Data Science: »;

- «‌ ‌Data‌ ‌Scientist‌».

www.history.ox.ac.uk/british-medieval-library-catalogues
Fred Lerner, “The story of libraries, from invention of writing to the computer age”, continuum, 2006
en.wikipedia.org/wiki/Gottfried_van_Swieten#As_librarian
en.wikipedia.org/wiki/Dewey_Decimal_Classification
Milena Tsvetkova. – – : . Scientific Enquiry in the Contemporary World: Theoretical basis and innovative approach, 2016, San Francisco, United States. pp.115-128
boxesandarrows.com/forgotten-forefather-paul-otlet
www.mondotheque.be/wiki/images/e/e2/Heuvel_Rayward_Facing_Interfaces.pdf
Sergey Brin, Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine. — 1998.
googleblog.blogspot.com/2009/12/personalized-search-for-everyone.html

Was ist in meinem Inhalt für Sie? Jahrhunderte alte Evolution und Grundprinzipien der Personalisierung von Inhalten

More articles: