"Bike Kit" oder Erstellung hausgemachter Datensätze für Analyse und maschinelles Lernen

Vor einigen Jahren interessierte ich mich kurz für maschinelles Lernen und Datenanalyse und schrieb sogar eine kurze Serie über mein Eintauchen in diese erstaunliche Welt aus der Sicht eines Anfängers.



Wie so oft beim Lernen von etwas Neuem wollte ich unbedingt mein eigenes "Fahrrad" bauen. Leider weiß ich nicht viel über Mathematik und Programmierung, so dass mein eigener Datensatz ein Kandidat für die Rolle eines "Fahrrads" wurde.



Seit diesem Moment sind mehr als zwei Jahre vergangen, und jetzt kann ich meine kleinen Erfahrungen mit Ihnen teilen.



In diesem Artikel werden wir verschiedene potenzielle Quellen für die Selbsterfassung von Daten (einschließlich nicht sehr beliebter) betrachten und versuchen, zumindest einen gewissen Nutzen aus diesem Prozess zu ziehen.





Inhaltsverzeichnis:

Teil I: Einführung

Teil II: Datenquellen

Teil III: Nutzt es?

Teil IV: Schlussfolgerung





Teil I: Einführung



Sie haben wahrscheinlich aus der Einführung erraten, dass ich kein Guru für Datenanalyse und maschinelles Lernen bin. Ich kann kaum als Pionier bei der Suche nach Quellen offener Daten bezeichnet werden. In diesem Artikel geht es daher nicht um bewährte Methoden, sondern darum, den "Juckreiz in Ihren Händen" zu stillen, falls Sie auf die Idee gekommen sind, einen eigenen Datensatz zu erstellen.



.



. . (, ), «5 ».



, « » , « » .





II:



.





. .



Kaggle. Kaggle .



, - , .



.



« » 2010- , - 2015 .



2017 . . API . , , : « , ».



.





. , API .



, , :



  • , .
  • , « ».




, . , . «, ...» , , .



, .



.



. , API .

, .



( ), .



, - () - .





« », .

, .



, , .



.





, « » , :



  • – , .
  • – . , .csv. ( ).

  • , , Sportradar API. . , .
  • , , .


,



. . .



. , .



. , . 2016 2020 GitHub.

, -, .



, , (, ).





III: ?



. , .



, :



  1. Python ( ) . , - .
  2. , .
  3. . , . , , .
  4. , . , , «», . , , , .
  5. , - .




IV:



, «», , .



, , : « », .



.



- , .




All Articles