Maschinelles Lernen liegt außerhalb der Hype-Zone. Und es ist schwer eindeutig zu sagen, wie gut oder schlecht es ist, aber was ist absolut klar - immer mehr Menschen stellen Fragen "Wo ist das Geld?" Über ML-Projekte. Und dieser Artikel wird keine Ausnahme sein - der Hype ist vorbei, wir müssen arbeiten.
Wenn wir über den Aufbau von Prozessen sprechen, dann verwende ich persönlich sehr gerne den Begriff „Reifegrad“. Wenn Sie eine verständliche Bewertungsskala vor Augen haben, können Sie immer verstehen, wo Sie sich befinden, was Sie erwartet, Sie können Prioritäten festlegen und die Anforderungen hier und jetzt anpassen und nicht über ein Paar springen von Ebenen und machen eine Revolution, das Rad im Schnäppchen neu zu erfinden ... und es kann später nicht nützlich sein. Im Allgemeinen eine nützliche Übung aus allen Blickwinkeln.
Rein theoretisch können Sie die in CMMI, ISO / IEC 33001 beschriebenen Standardprozessreife oder deren bodenständigere IT-Beschreibung von ITIL übernehmen und auf ML verschieben. Ich habe mehrmals versucht, diese Übung in der Praxis durchzuführen, aber es stellte sich heraus, dass es sich um eine Art kugelförmiges Pferd in einem Vakuum handelte, das eine Antwort auf die aktuelle und zukünftige Frage geben konnte und gab, aber es war schwierig, eine zu zeichnen verständlicher Weg. Als ich mich umsah, beschloss ich, mich an meinen schwierigen Weg bei der Arbeit an verschiedenen ML-Projekten zu erinnern und ihn zu systematisieren, weil CMMI gut ist, aber für echte Arbeit braucht man etwas Spezifischeres und Bodenständigeres. Im Allgemeinen wurde als Ergebnis eine Beschreibung einiger grundlegender Entwicklungsstadien der Arbeit an ML-Projekten geboren. Ob sie als „Reifegrad“ bezeichnet werden können oder nicht, ist die zweite Frage, aber die oben genannten Fragen werden beantwortet, und dies ist das Wichtigste.
Kommen wir also zu den Einzelheiten. Wahrscheinlich ist die einzige Stufe, in der ich mir nichts Neues ausgedacht und es von ITIL übernommen habe, die Stufe "0" oder "abwesend". Wie sie sagen, wenn es keinen Prozess gibt, dann ist es in keiner Form, sei es über IT oder über ML. Aber im Ernst, meine 5 Ebenen / Schritte sind wie folgt:
Level 1. "Enthusiasten"
Stufe 2. "F & E"
Level 3. "Analysiere es"
Level 4. "Spezialität"
Level 5 "Automatisiere es"
Level 1 "Enthusiasten"
- ( ) . , ( ), , , , «Big Data» . Python ( R Matlab … ) -- - . .
— , . , .
2 «»
- , , , . , :
– -, .., .
– . - 80% , .
ML . — , . .
3 « »
, , , . :
. ( , ), . , .
, .. -. , . . , .
. , — , ?
4. «»
, ( , ..), - . , :
- PROD- DEV/TEST/PROD
, .. – , .
– - , - . Run the business/Change the business.
5 « »
, 4- . DataOps&MLops . DVC Feature Store . .
, :
|
1 |
2 |
3 |
4 |
5 |
|
. .
|
.
|
|
.
|
100% |
|
PC/ ( +GPU) |
PC ( on-prem) |
ML- . |
PROD DEV/TEST . . |
PROD DEV/TEST . . |
|
1-2 (Data Scientists - DS) |
3-5 :2-3 DS 1-2 DE (Data Engineers) |
5-10 : 3-6 DS 2-4 DE
|
10+ . «ML-ops».
|
25+
|
- |
1-2 |
2-4 |
5+ |
10+ |
50+ |
|
|
( , ). , , . , , .
, , :
, ML? ?
?
, ?
, ML - , — .
— ( ) . , ML — Python, R, Azure ML Studio, SPSS SAS, . 1- 5- . . . , ( ), , .
Tatsächlich ist dies jedoch ein separates Diskussionsthema (oder ein anderer Artikel, wenn es Inspiration gibt) - die Wahl des optimalen Pfades von einer Ebene zur anderen und was davon abhängt, wann und welche Software benötigt wird, welches Fachwissen benötigt wird und wo ist der Ort für das Outsourcing und natürlich - aber wie kann man den Punkt bestimmen, an dem man aufhören soll?