Welche Sprache für die Datenanalyse verwendet werden soll, ist das abgedroschenste und schmerzhafteste Thema. Aus diesem Grund haben wir uns mit Alexei Seleznev, Leiter Analytics bei Netpeak und Autor des Telegrammkanals R4Marketing , zusammengetan und einen Vergleich von SQL-Operatoren und Verben der R-Sprache erstellt. Aus Gründen der Benutzerfreundlichkeit und Portabilität haben wir dies in Karten durchgeführt.
Wir veröffentlichen jeden Tag noch interessantere Materialien zur Programmierung und Datenanalyse in unserem Telegrammkanal und in der VK-Gruppe . Vielleicht finden Sie etwas Interessantes für sich.
Auf den Punkt!
R vs SQL
Bevor Sie einen Vergleich durchführen, müssen Sie zunächst die grundlegenden SQL-Anweisungen auffrischen. Natürlich erinnert ihr euch alle an sie, aber plötzlich ...
Wir werden die SELECT-Anweisung der DML (Data Manipulation Language) und alles, was damit zusammenhängt, betrachten:
Die SELECT-Anweisung selbst regelt, welche Felder aus der Tabelle ausgewählt werden sollen
Die FROM-Klausel zeigt auf die Tabelle, aus der die Auswahl getroffen wird
Die WHERE-Klausel filtert die Tabelle nach den Werten einer bestimmten Spalte
GROUP BY gibt Gruppierungsfelder zur Berechnung von Aggregationsmerkmalen an
Der Operator ORDER BY sortiert Tabellenzeilen nach Werten in einer Spalte
, . R? - dplyr R ( ), .
dplyr ( tidyverse) , , :
, ,
dplyr tidy data
( %>%)
, SQL dplyr:
, , dplyr . - , :) , (.. dplyr - tidyverse) . :
Tidy data
tidy data. , 100% .
, , « »:
Data Analysis:
«» , «» -.
tidy datasets dplyr !
, tidy data .
%>%
, R - %>%. , , tidyverse.
- .
, - 2 : R, SQL, - . R - , - .