In diesem Material möchte ich darüber sprechen, wie Sie für jemanden handeln können, der unabhängig Kenntnisse in den Bereichen DS, AI und ML erwerben möchte. Die Anwendung der hier vorgeschlagenen Lehrmethoden kann zu guten Fortschritten beim Lernen neuer Dinge führen. Außerdem werde ich hier Links zu Ressourcen teilen, die ich verwende und die ich ohne Zweifel anderen empfehlen kann.
Lerne einige mathematische Disziplinen
Mathematik, auch wenn es jemandem nicht gefällt, ist in dem für uns interessanten Bereich sehr wichtig. Ich denke, man kann mit Sicherheit sagen, dass diejenigen, die dies lesen, bereits einige der mathematischen Kenntnisse haben, die sie in der Schule erworben haben. Dies ist eine gute Basis, aber nicht nah genug für jemanden, der sich in den Bereichen DS, AI und ML entwickeln möchte. Hier muss man sich nämlich etwas tiefer mit Mathematik befassen als in der Schule. Man muss einige Dinge aus Statistik, Algebra und anderen mathematischen Disziplinen lernen. Ich würde eine Liste nützlicher mathematischer Ressourcen für DS zusammenstellen, aber dies wurde bereits in diesem Artikel für mich getan . Und sie haben es sehr gut gemacht.
Programmieren lernen
Wenn Sie gerade erst mit dem Selbstlernen beginnen, lernen Sie nicht gleich, wie man Code für maschinelles Lernen schreibt. Stattdessen lohnt es sich, grundlegende Programmierkonzepte zu erlernen, die an keine Domäne gebunden sind. Erfahren Sie, was Programmierung ist, machen Sie sich mit den verschiedenen vorhandenen Codetypen vertraut und lernen Sie, wie Sie Programme richtig schreiben. Dies ist sehr wichtig, da Sie beim Erlernen der Programmierung viele grundlegende Ideen lernen, die Ihnen während Ihrer gesamten DS-Karriere gute Dienste leisten.
Beeilen Sie sich nicht, bemühen Sie sich nicht, sofort etwas Schwieriges zu lernen. Wie gut Sie die Grundlagen verstehen, wirkt sich auf Ihre gesamte zukünftige berufliche Laufbahn aus. HierSie finden sehr gute Video-Tutorials, die Sie in die Programmierung und Informatik einführen. Sie finden nämlich die wichtigsten Dinge heraus, die Sie verstehen müssen. Nehmen Sie sich etwas Zeit für diese Frage und versuchen Sie, alles, was Sie lernen, zu verstehen.
Wählen Sie eine Programmiersprache und verstehen Sie sie richtig
Es gibt viele Programmiersprachen, die von denjenigen verwendet werden, die in den Bereichen DS, AI und ML arbeiten. Am häufigsten werden hier Python, R, Java, Julia und SQL verwendet. In diesen Bereichen können andere Sprachen verwendet werden, aber die von mir aufgelisteten werden aus einem bestimmten Grund häufiger verwendet als andere:
- Sie sind leicht zu lernen. Wenn Sie genügend Zeit einplanen, um sie zu studieren und Ausdauer und Beständigkeit beim Lernen zu zeigen, können Sie schnell genug einen bestimmten Erfolg erzielen.
- , , .
- , .
- , , , DS, AI ML.
- — .
Es ist nichts Falsches daran, mehrere Programmiersprachen zu lernen. Tatsächlich ist es nützlich, mehr als eine Sprache zu beherrschen. Aber wenn Sie lernen zu programmieren, sollten Sie sich nicht beeilen. Sie müssen versuchen, in einem bestimmten Zeitraum nur eine Sprache zu lernen, da Sie sonst sehr verwirrt werden können. Daher ist es am besten, die Sprachen einzeln zu lernen, wobei Sie besonders auf die Mechanismen achten, die für Sie bei Ihrer Arbeit nützlich sind. Ich würde vorschlagen, Python als Ihre Muttersprache zu wählen. Dies ist eine ziemlich einfache Sprache, die selbst Anfänger leicht verstehen können. Außerdem würde ich empfehlen, dass Sie zuerst die allgemeine Programmierung in Python studieren und dann zu speziellen Python-Tools für die Datenanalyse gehen.
Lernen Sie, Daten zu sammeln
Meistens gibt Ihnen niemand Daten speziell für Sie, und manchmal haben Sie möglicherweise überhaupt keine Daten. In jedem Fall müssen Sie jedoch einen Weg finden, um die Daten zu sammeln, mit denen Sie arbeiten werden. Die Organisation, für die Sie arbeiten, verfügt möglicherweise über ein gutes Datenerfassungssystem. Wenn ja, ist dies ein großes Plus für Sie. Wenn Ihre Organisation nicht über ein solches System verfügt, müssen Sie einen Weg finden, um Daten zu sammeln. Es handelt sich jedoch nicht um Daten, sondern um qualitativ hochwertige Informationen, mit denen Sie produktiv arbeiten und Ihre Ziele erreichen können. Die Datenerfassung steht mit ihrer eingehenden Analyse nicht in direktem Zusammenhang mit "Data Mining". Die Datenerfassung ist ein Arbeitsschritt, der der Analyse vorausgeht.
Offene Daten, die kostenlos genutzt werden können, finden Sie an vielen Stellen im Internet. Manchmal können die benötigten Daten mithilfe von Web-Scraping-Techniken von Websites gesammelt werden. Web Scraping ist eine sehr wichtige Fähigkeit von Datenwissenschaftlern, daher bitte ich wirklich jeden, der in den Bereichen DS, AI und ML arbeiten wird, diese Fähigkeit zu beherrschen. Hier ist eine gute Anleitung zum Web Scraping.
Daten können auch in Datenbanken gespeichert werden, sodass die anfänglichen Kenntnisse der Datenbankverwaltung und die Fähigkeiten im Umgang mit Datenbanken für Sie sehr nützlich sind. Insbesondere die Kenntnis von SQL ist hier sehr wichtig. Lernen Sie hier SQL .
Lernen Sie, Daten zu verarbeiten
Worüber ich hier sprechen werde, wird oft als Data Wrangling bezeichnet. Dieser Prozess umfasst das Löschen der vorhandenen Daten. Es verwendet eine explorative Analyse von Daten und die Entfernung aller unnötigen Daten. Dieser Prozess umfasst auch die Strukturierung der Daten in ein Formular, mit dem Sie arbeiten können. Diese Phase der Arbeit mit Daten ist die schwierigste und anstrengendste. Die Daten, auf die Sie im Lernprozess stoßen, werden bereits für die Analyse vorbereitet. Aber die Daten, auf die Sie in der realen Welt stoßen, können völlig roh sein. Wenn Sie wirklich Datenwissenschaftler werden möchten, müssen Sie die realen Daten finden und Wege finden, um sie anständig aussehen zu lassen.
Reale Daten sind fast überall zu finden. Zum Beispiel - einKaggle . Diese großartige Plattform enthält Daten von vielen Unternehmen auf der ganzen Welt. Die primäre Datenverarbeitung ist eine sehr langwierige Aktivität. Wenn Sie sie jedoch regelmäßig und beharrlich ausführen, werden Sie nach und nach feststellen, dass es sich auch um eine sehr interessante Aktivität handelt. Hier einige gute Vorträge zur Primärdatenverarbeitung.
Lernen Sie, Daten zu visualisieren
Wenn Sie ein Experte für DS, AI oder ML sind und sich in Ihrem Geschäft gut auskennen, sollten Sie nicht vergessen, dass das, was Ihnen offensichtlich erscheint, für andere völlig unverständlich sein kann. Erwarten Sie nicht, dass sie beispielsweise durch Betrachten von Zahlenspalten Schlussfolgerungen ziehen können. Das Erlernen der Visualisierung von Daten ist erforderlich, damit die Ergebnisse Ihrer Arbeit von Spezialisten aus anderen Bereichen verwendet werden können. "Datenvisualisierung" wird üblicherweise als der Prozess der grafischen Darstellung von Daten bezeichnet. Eine solche Darstellung der Daten ermöglicht es, ihren Nutzen auch für diejenigen abzuleiten, die keine besonderen Kenntnisse in den Bereichen DS, AI und ML haben.
Es gibt viele Möglichkeiten, Daten zu visualisieren. Da wir Programmierer sind, sollte unsere Hauptmethode zur Datenvisualisierung darin bestehen, den entsprechenden Code zu schreiben. Es ist schnell und erfordert keinen Kauf von Spezialwerkzeugen. Beim Schreiben von Code für die Datenvisualisierung können Sie viele kostenlose Open-Source-Bibliotheken verwenden, die für die von uns verwendeten Programmiersprachen erstellt wurden. Zum Beispiel gibt es Bibliotheken dieser Art für Python. Dies sind Matplotlib, Seaborn und Bokeh. Hier ist ein Video-Tutorial zu Matplotlib.
Eine andere Möglichkeit, Daten zu visualisieren, ist die Verwendung von Closed-Source-Tools. Zum Beispiel - Tableau... Es gibt viele dieser Tools, mit denen Sie ziemlich gute Ergebnisse erzielen können, die jedoch nicht kostenlos sind. Tableau ist eines der am häufigsten verwendeten Tools, und ich verwende es häufig. Ich würde jedem empfehlen, der mit Datenanalyse und -visualisierung befasst ist, Tableau zu lernen. Hier ist eine gute Anleitung zu diesem Tool.
Künstliche Intelligenz und maschinelles Lernen
AI und ML können als Unterabschnitte von DS betrachtet werden, da sie datengesteuert sind. AI und ML sind Technologien, die darauf basieren, Maschinen zu lehren, sich ähnlich wie menschliches Verhalten zu verhalten. Hierzu werden speziell vorbereitete Daten verwendet, die an die Maschinen übertragen werden. Computermodelle können viel darüber lehren, wozu Menschen fähig sind. Dazu werden sie geschult und zum gewünschten Ergebnis geführt. In diesem Fall können "Maschinen" als kleine Kinder ohne jegliches Wissen wahrgenommen werden. Diesen Kindern wird nach und nach beigebracht, Objekte zu identifizieren und zu sprechen. Sie lernen aus ihren Fehlern und beginnen, während sie lernen, die ihnen zugewiesenen Aufgaben besser zu lösen. Dies ist bei Autos der Fall.
KI- und ML-Technologien erwecken Maschinen mithilfe verschiedener mathematischer Algorithmen zum Leben. Die Menschheit kennt die Grenzen der Fähigkeiten dieser sich ständig verbessernden Technologien immer noch nicht. Heutzutage werden KI- und ML-Technologien häufig zur Lösung kognitiver Probleme eingesetzt. Dies sind Objekterkennung und -erkennung, Gesichts- und Spracherkennung, Verarbeitung natürlicher Sprache, Spamerkennung und Betrugserkennung. Diese Liste kann sehr lange fortgesetzt werden.
Eine detailliertere Geschichte über AI und ML verdient eine gesonderte Veröffentlichung. In der Zwischenzeit kann ich dieses Video zu allgemeinen Fragen der Anwendung dieser Technologien empfehlen . Aber hier- Stundenlanges Video-Tutorial zum maschinellen Lernen. Durch das Durcharbeiten dieser Videos können Sie ML-Kenntnisse erwerben, die dem Anfänger- oder sogar Mittelstufe-Level entsprechen. Sie lernen die vielen vorhandenen Algorithmen für maschinelles Lernen kennen, wie sie funktionieren und wie sie verwendet werden. Danach sollten Sie über genügend Wissen verfügen, um Ihre eigenen einfachen ML-Modelle zu erstellen. Hier erfahren Sie, wie das geht .
Entdecken Sie Möglichkeiten, um ML-Modelle online zu veröffentlichen
Es gibt Tools, mit denen Sie ML-Modelle im Internet veröffentlichen können. Auf diese Weise können Sie allen Zugriff gewähren. Um Modelle im Internet veröffentlichen zu können, benötigen Sie ein gutes Verständnis der Webentwicklungsprozesse. Der Punkt ist, dass "Veröffentlichen eines Modells" das Erstellen einer Webseite (oder einer Gruppe von Seiten) bedeutet, mit der Sie in einem Browser mit dem Modell arbeiten können. Darüber hinaus müssen Sie berücksichtigen, dass das Frontend des Projekts, seine Schnittstelle, Daten mit dem Backend und dem Serverteil des Projekts austauschen muss, auf dem sich das Modell selbst befindet. Um solche Projekte erstellen zu können, müssen Sie in der Lage sein, serverseitige APIs zu erstellen und diese APIs auf der Clientseite von Anwendungen zu verwenden.
Wenn Sie Modelle in der Cloud veröffentlichen möchten und Docker-Technologie verwenden möchten, benötigen Sie gute Kenntnisse im Bereich Cloud Computing und DevOps.
Tatsächlich gibt es viele Möglichkeiten, Modelle im Internet bereitzustellen. Ich würde vorschlagen, zunächst zu lernen, wie dies mit dem Python-basierten Flask-Webframework funktioniert. Hier ist ein gutes Tutorial dazu.
Finde einen Mentor
Selbstlernen ist großartig, aber nichts geht über das Lernen von Profis. Tatsache ist, dass mit diesem Ansatz das, was in der Realität verwendet wird, assimiliert wird und dass Lernen auf diese Weise durch die Praxis geht. Viele Dinge können nur durch Übung gelernt werden. Coaching hat viele Stärken, aber es sollte bedacht werden, dass nicht jeder Mentor einen signifikanten Einfluss auf Ihre Karriere oder Ihr Leben haben kann. Deshalb ist es sehr wichtig, einen guten Mentor zu finden.
Sie können beispielsweise versuchen, dieses Problem mithilfe der Notitia AI- Plattform zu lösen.... Hier werden den Studierenden persönliche Mentoren zugewiesen, die persönliche und berufliche Beiträge zur studentischen Entwicklung leisten. Mentoren bringen diejenigen, die vom Anfänger bis zum Experten in den Bereichen DS, AI und ML lernen möchten. Notia AI ist auch die günstigste Plattform ihrer Art.
Ergebnis
Denken Sie daran, dass Sie durch das Studium von Kursen, das Lesen von Artikeln und das Ansehen von Videos nicht zum Datenwissenschaftler werden. Sie müssen von einer spezialisierten Institution zertifiziert sein. Darüber hinaus erfordern einige offene Stellen bestimmte Bildungsdokumente. Investieren Sie Zeit in das Selbststudium, lassen Sie sich zertifizieren oder erwerben Sie Ihre Bildungsnachweise, und Sie sind bereit für echte Arbeit.
Was muss man Ihrer Meinung nach wissen und anstreben können, um ein wertvoller Experte auf dem Gebiet der künstlichen Intelligenz oder des maschinellen Lernens zu werden?