
Habr, hallo!
Im Labor zur Modellierung natĂŒrlicher Systeme am Nationalen Zentrum fĂŒr kognitive Entwicklung der ITMO-UniversitĂ€t erforschen wir aktiv die Verwendung des automatischen maschinellen Lernens fĂŒr verschiedene Aufgaben. In diesem Artikel möchten wir ĂŒber die Verwendung von AutoML fĂŒr eine effiziente Zeitreihenprognose sowie darĂŒber sprechen, wie dies im Open-Source-Framework FEDOT implementiert wird . Dies ist der zweite Artikel in einer Reihe von Publikationen zu dieser Entwicklung gewidmet (die ersten von ihnen gefunden werden kann hier ).
Alle Details sind unter dem Schnitt!
Automatisches maschinelles Lernen (AutoML)
Die moderne Datenwissenschaft ist zu einem sehr beliebten Teil der IT-SphĂ€re geworden. Experten sammeln Daten, bereinigen sie, probieren verschiedene Modelle aus, fĂŒhren Validierungen durch und wĂ€hlen die besten aus. Und das alles, um dem Unternehmen die Lösung zu bieten, die den gröĂten Nutzen bringt. Gleichzeitig werden einige Phasen des Erhaltens solcher Lösungen von Jahr zu Jahr mehr automatisiert. Dies gilt in der Regel fĂŒr die routinemĂ€Ăigsten Teile. Dies gibt den Experten Zeit fĂŒr wichtigere Aufgaben.
Stellen wir uns also vor, ein Spezialist steht vor der Aufgabe, ein Modell fĂŒr maschinelles Lernen zu erstellen und es in einen Webdienst zu âwickelnâ, damit genau dieses Modell nĂŒtzliche Arbeit leistet - etwas vorhersagen. Bevor Sie jedoch mit dem Training des Modells beginnen, mĂŒssen Sie mehrere Schritte ausfĂŒhren, darunter:
- Sammeln Sie Daten aus vielen Quellen und bereinigen Sie sie.
- , , ;
- , ;
- .
, , . , , , , . , - , . â MLFlow, Apache AirFlow . â - workflow management system (WMS) . .
, ?
, ââ, . ââ ML .
. , , open-source, TPOT, AutoGluon, MLJAR H2O. AutoML â , ( ) â. , . ( ) , : TPOT FEDOT.
SaaS-, DataRobot, GoogleAutoTables, Amazon SageMaker, ML , AutoML.
, AutoML : . , , . , .
, , open-source . , â ( ).
, . : , . : , , â . AutoML legacy â , ( â â) : , .
, - , â . open-source â AutoTS. ââ â AR ARIMA. ââ , ( ), . , , pmdarima.
â AutoML- . . , , H2O, . , open-source , , , . .
AutoML-?
, , . :
- (, , â , â );
- ;
- () ;
- ( -);
- in-sample out-of-sample ;
- â ?
, , , â .
AutoML . , , data-driven , .. , .. - .
AutoML, . , open-source AutoML , â FEDOT.
, , â . , , , (, ). .
, , . , , .. , , , . , , baseline .
, , (, , ).
. , , . FEDOT, , .
, FEDOT , :
- â , : (, , ) , ;
- â , . . Primary , Secondary â ;
- â , . FEDOT ( Chain).
:
, FEDOT
, , , .
. ââ, â . â . â ââ AutoML. , . , â .
FEDOT
, . FEDOT- . ? , , ? ?
! .
. â , . , . , , :

âlagged-â . FEDOT âlaggedâ. â .
1 . , . muli-target . :

. 3 lagged
. , AR ARIMA. , .
: â . â . â .

, , . â , , . , .
14 . , â .
, . , . , , jupyter notebookâ.
â . FEDOT :
- , ;
- ;
- .
, , , . . . . .
, ,
lagged-, , ridge- (. ), ââ.
, â ââ. , , .
. , , . , , . ( ) . â â . . , , , . ( ) , â .
:
! ââ . . . () (). FEDOT.
, :
(, â )
.
AutoML. FEDOT , API.
, ââ. AutoML :
- â . , , . , , ââ . ;
- â , , . , .
:
.
. : (MAE) (RMSE): MAE â 100.52, RMSE â 120.42.
, : ?
: . . 14 . 14 ( 42). in-sample .
, out-of-sample in-sample :
. in-sample out-of-sample
, 14 . 28 â 2 14 . , (out-of-sample).
, in-sample . ( ). , , .
FEDOT â 3- 14 . . . , , .
14 .
. , , .
( ). , ,
, . , , , . , .
â K- , . , . K- . â .
, , , .
, ââ ,
, â , 1000 â , 0. . (, ) . K-nn . , , : MAE â 88.19 RMSE â 177.31.
, - . 5 . , , .
: . , , . , -, ( ). : . , FEDOT , . !
FEDOT open-source â AutoTS pmdarima. Jupyter notebook , , . , . 3 , . ( - ):
| â | RMSEâCKO | |
|---|---|---|
| pmdarima | 155â1 | 196â1 |
| AutoTS | 198â22 | 236â41 |
| FEDOT | 110â14 | 170â26 |
:

, FEDOT â â.
, , AutoML. , ML-, .
AutoML FEDOT: , . FEDOT .
:
AutoML, FEDOT!
Arbeitete an dem Artikel: Mikhail Sarafanov , Pavel Vychuzhanin und Nikolai Nikitin .
