KI und neuronale Netze
Künstliche Intelligenz hat immer noch Schwierigkeiten mit dem Turing-Test, aber es gibt Erfolge auf diesem Gebiet.
Im Mai 2020 veröffentlichte das OpenAI-Team den neuen GPT-3-Algorithmus zur Verarbeitung natürlicher Sprache. Es ist ohne Zweifel der beste Algorithmus, der heute für diesen Zweck verfügbar ist.
Die Systemverbesserungen gegenüber der Vorgängerversion von GPT-2 sind enorm. Die Anzahl der Algorithmusparameter hat sich mehr als 100-mal erhöht. GPT-3 verwendet 175 Milliarden Parameter, während GPT-2 nur 1,5 Milliarden verwendete.
Und wenn früher ein neuronales Netzwerk Text erzeugen konnte, der nur ungefähr einem Menschen ähnelte, sind seine Fähigkeiten jetzt viel breiter.
Ein Student in seinem Apolos-Konto hat Artikel von GPT-3 veröffentlicht. Nicht sehr schwierig, im Stil eines Motivationstrainers. Und nur einer von Zehntausenden von Lesern vermutete, dass die Artikel nicht von einer Person geschrieben wurden.
![]()
Aus diesem Grund veröffentlicht OpenAI den Algorithmus nicht für den freien Zugriff. Mit seiner Hilfe können Sie das Internet einfach unter den Lawinen gefälschter Nachrichten begraben.
Die potenziellen Vorteile von GPT-3 sind enorm. Von der Schaffung einer neuen Generation von Sprachassistenten bis zur Entwicklung adaptiver Spielmechaniken, die RPG auf ein ganz neues Niveau bringen.
Haben Sie übrigens AI Dungeon ausprobiert , ein textbasiertes Spiel von GPT-3? Wenn nicht, probieren Sie es aus, es ist eine sehr interessante Erfahrung. Dieser Artikel beschreibt eine dieser Erfahrungen.
Entscheidungsintelligenz
Die Entscheidungswissenschaft ist eine relativ junge Disziplin, die wissenschaftliche Theorien zur Entscheidungsfindung untersucht. Damit Entscheidungen nicht auf der Grundlage der subjektiven Erfahrung oder Gefühle des Entscheidungsträgers getroffen werden, sondern durch die Analyse und den Vergleich von Daten.
Mit DI können Sie das Treffen von Routine- und Betriebsentscheidungen automatisieren und den Entscheidungsträger entlasten.
InferVision, Alpha Go, 2015 , 2020 . , . . 10 30 .
InferVision, 5 . , . . , , , .
Entscheidungsintelligenz basiert auf KI und tiefem Lernen. InferVision wurde beispielsweise in 100.000 Fällen geschult.
Natürlich kann AI mit der aktuellen technologischen Entwicklung in Systemen mit mehreren Varianten immer noch keine objektiv besseren Entscheidungen treffen. Es fehlen einfach die Leistungs- und Eingabedaten für die Analyse. Aber in vielen Momenten können Sie die Impulsivität, die Voreingenommenheit und die banalen Denkfehler einer Person ausschließen. Und um routinemäßige Entscheidungsprozesse zu automatisieren und einem Spezialisten Zeit für die Lösung komplexer Probleme zu sparen.
Cloud-Analyse
Cloud-Analysesysteme gab es schon früher, aber im Jahr 2020 hat die Dynamik ihrer Entwicklung stark zugenommen.
Cloud-Analysen vereinfachen die Verwendung großer Datenmengen, die häufig aktualisiert werden. Ein einheitliches Analysesystem für alle Unternehmensbereiche hilft, die Analyseergebnisse zu aktualisieren und deren Verwendung zu beschleunigen.
Echtzeitanalysen sind der nächste Schritt, den viele Unternehmen anstreben. Besser mit heißen Analyseergebnissen arbeiten, die vor einigen Sekunden erstellt wurden. Schließlich ist die gestern durchgeführte Analyse möglicherweise bereits ungenau.
Cloud Analytics ist ein vielversprechendes Tool für Unternehmensriesen, die in jeder Branche über Analytics-Abteilungen verfügen. Daher sind große Unternehmen wie IBM heute eng mit der Entwicklung solcher Systeme befasst.
Datenmarktplätze
Cloud-bezogene Analyse, aber ein separates Phänomen.
Die Datenqualität für die Analyse ist entscheidend. Wenn ein Startup nicht die Möglichkeit hat, globale Marktforschung zu betreiben, besteht die Gefahr, dass es sich blind bewegt und die tatsächlichen Bedürfnisse der Zielgruppe nicht kennt.
Aber jetzt können Analysen gekauft werden. Datenmarktplätze sind vollwertige Informationsmärkte. Die berühmte Statista ist einer der ersten derartigen Marktplätze, aber jetzt wächst die Branche in einem enormen Tempo.
Natürlich verkauft niemand personenbezogene Daten (zumindest rechtlich). Vor- und Nachnamen, Wohnadressen, Telefonnummern und E-Mails sind gesetzlich geschützt. Anonymisierte Daten können jedoch verkauft werden. Und es gibt viele nützliche Dinge für das Geschäft. Alter und Geschlecht, sozialer Status, Vorlieben, Arbeitsbereich, Hobbys, Nationalität und Hunderte anderer Parameter, die Sie im Netzwerk belassen, bis hin zur Auswahl der Gadgets für iOS oder Android. Wir erinnern uns an die alte Wahrheit - wenn etwas im Netzwerk kostenlos ist, sind Sie vielleicht selbst die Zahlung.
Der Big-Data-Markt im Jahr 2020 beläuft sich auf 138,9 Milliarden US-Dollar. Experten sagen voraus, dass es bis 2025 auf 229,4 Milliarden wachsen wird. Dies ist eine kolossale Skala, in der der Löwenanteil durch den Verkauf von Informationen und nicht durch den Bergbau besetzt sein wird.
Blockchain in der Analytik
Der Blockchain-Hype ist schon ein bisschen weg. Im Jahr 2017 wollten nur die Faulen keine eigene Kryptowährung starten, und im Jahr 2020 wird die Blockchain für pragmatischere Zwecke verwendet.
Die Kombination von Blockchain und Big Data wird als perfekte Verbindung bezeichnet. Blockchain konzentriert sich auf das Extrahieren und Aufzeichnen zuverlässiger Daten. Data Science analysiert große Datenmengen, um Entwicklungsmuster zu finden und Vorhersagen zu treffen.
Big Data ist Quantität und Blockchain ist Qualität.
Die Blockchain-Integration in die Big-Data-Analyse bietet viele potenzielle Vorteile:
- Verbesserung der Sicherheit von Daten und Analyseergebnissen.
- Aufrechterhaltung maximaler Datenintegrität.
- Verhinderung der Verwendung falscher Daten.
- Echtzeitanalyse.
- Verbesserung der Qualität von Big Data.
Blockchain für KYC (kennen Sie Ihre Kunden). Die Technologie wird von Banken und Regierungsbehörden eingesetzt. Da es jedoch keinen gemeinsamen Datenspeicher zwischen verschiedenen Organisationen gibt, muss jede von ihnen separat identifiziert werden. Blockchain löst dieses Problem.
Die in Korea eingeführte Samsung Nexleger-Plattform vereinfacht dieses Schema. Jetzt reicht es aus, das vollständige Identifizierungsverfahren nur in einer Bank oder Organisation durchzuführen. Wenn Sie ein Bankkonto erstellen müssen, das im Projektsystem enthalten ist, kann dies in wenigen Minuten erfolgen. Jetzt müssen alle Kreise der bürokratischen Hölle nur noch einmal durchlaufen - das ist alles.
Diagrammdatenbanken
Nicht die beliebteste und am weitesten verbreitete Art von DBMS. Es wurde speziell zum Speichern von Topologien entwickelt, die Knoten und ihre Beziehungen enthalten. Es ist nicht nur ein Datensatz im klassischen Tabellenformat. Ihr Wesen ist anders.
Diagramme basieren auf Beziehungen zwischen Entitäten, nicht auf Entitäten selbst.
Und das ist nur ein Klondike für das Marketing. Schließlich kann die Grafikdatenbankanalyse verwendet werden, um Meinungsführer und Influencer in sozialen Netzwerken zu analysieren, Werbung zu personalisieren, Treueprogramme durchzuführen, virale Kampagnen zu analysieren, die Suchmaschinenoptimierung zu verbessern und vieles mehr.
Mithilfe von Diagrammen können Sie komplexe hierarchische Strukturen analysieren, deren Modellierung mithilfe relationaler Datenbanken problematisch wäre.
Im Jahr 2020 wurde die Graphanalyse aktiv genutzt, um die Ausbreitung des Virus in China und darüber hinaus zu verfolgen. Die Studie basiert auf dynamischen Daten aus 200 Ländern, die es ermöglichen, die zukünftige Entwicklung der Situation in der Welt vorherzusagen und Maßnahmen zur Abschwächung der Folgen zu ergreifen. Bei Interesse ist die vollständige Studie hier .
Im Jahr 2020 hat das Interesse an Graph-DBMS erheblich zugenommen. Sie werden von Ebay, Airbnb, IBM, Adobe, NBC News und Dutzenden anderer großer Unternehmen verwendet. Und Spezialisten, die wissen, wie man gut mit Graphendatenbanken arbeitet, sind Gold wert.
Python in der Datenwissenschaft
Python erobert weiterhin den globalen Analyse- und Entwicklungsmarkt. Und seine Position wird immer stärker. Sie können mehr in diesem Artikel lesen.
Im PYPL-Ranking ist Python, das Google Trends analysiert, zuversichtlich führend.
Python belegt im GitHub-Ranking den zweiten Platz bei der Anzahl der Pull-Anforderungen: 15,9% der Gesamtzahl aller Pull-Anforderungen. Im Vergleich dazu liegt R, mit dem Python immer in der Analytik konkurriert hat, an 33. Stelle und macht nur 0,09% der Pull-Anfragen aus.
Experten mit Python-Kenntnissen in der Analytik werden mehr benötigt. Wir haben kürzlich den Data Science-Arbeitsmarkt in Russland analysiertund fanden heraus, dass in 81% der offenen Stellen Python-Kenntnisse erforderlich sind, während R (ohne Python) nur in 3% der Fälle erforderlich ist.
R bleibt eine gute Sprache für die Analyse, aber Python hat den Markt fast vollständig erobert. Wenn sie sich 2012 in ungefähr derselben Position befanden, ist Pythons Führung jetzt unbestreitbar. Und damit muss gerechnet werden.
2020 brachte Data Science viele neue Dinge, da sich das Gebiet der Big-Data-Analyse selbst jetzt aktiv entwickelt. Dies sind natürlich weit entfernt von allen erwähnenswerten Trends. Und eine separate Frage für Datenwissenschaftler: Welche beruflichen Trends haben Ihre Arbeit in diesem Jahr am meisten beeinflusst? Wir sind sehr interessiert zu hören.