Zeitreihenprognose mit AutoML







Habr, hallo!







Im Labor zur Modellierung natĂŒrlicher Systeme am Nationalen Zentrum fĂŒr kognitive Entwicklung der ITMO-UniversitĂ€t erforschen wir aktiv die Verwendung des automatischen maschinellen Lernens fĂŒr verschiedene Aufgaben. In diesem Artikel möchten wir ĂŒber die Verwendung von AutoML fĂŒr eine effiziente Zeitreihenprognose sowie darĂŒber sprechen, wie dies im Open-Source-Framework FEDOT implementiert wird . Dies ist der zweite Artikel in einer Reihe von Publikationen zu dieser Entwicklung gewidmet (die ersten von ihnen gefunden werden kann hier ).







Alle Details sind unter dem Schnitt!







Automatisches maschinelles Lernen (AutoML)



Die moderne Datenwissenschaft ist zu einem sehr beliebten Teil der IT-SphĂ€re geworden. Experten sammeln Daten, bereinigen sie, probieren verschiedene Modelle aus, fĂŒhren Validierungen durch und wĂ€hlen die besten aus. Und das alles, um dem Unternehmen die Lösung zu bieten, die den grĂ¶ĂŸten Nutzen bringt. Gleichzeitig werden einige Phasen des Erhaltens solcher Lösungen von Jahr zu Jahr mehr automatisiert. Dies gilt in der Regel fĂŒr die routinemĂ€ĂŸigsten Teile. Dies gibt den Experten Zeit fĂŒr wichtigere Aufgaben.







Stellen wir uns also vor, ein Spezialist steht vor der Aufgabe, ein Modell fĂŒr maschinelles Lernen zu erstellen und es in einen Webdienst zu „wickeln“, damit genau dieses Modell nĂŒtzliche Arbeit leistet - etwas vorhersagen. Bevor Sie jedoch mit dem Training des Modells beginnen, mĂŒssen Sie mehrere Schritte ausfĂŒhren, darunter:







  • Sammeln Sie Daten aus vielen Quellen und bereinigen Sie sie.
  • , , ;
  • , ;
  • .


, , . , , , , . , - , . — MLFlow, Apache AirFlow . — - workflow management system (WMS) . .







, ?







, “”, . “” ML .

. , , open-source, TPOT, AutoGluon, MLJAR H2O. AutoML “ , ( ) ”. , . ( ) , : TPOT FEDOT.







SaaS-, DataRobot, GoogleAutoTables, Amazon SageMaker, ML , AutoML.







, AutoML : . , , . , .









, , open-source . , — ( ).







, . : , . : , , — . AutoML legacy — , ( “ ”) : , .







, - , — . open-source — AutoTS. “” — AR ARIMA. “” , ( ), . , , pmdarima.







— AutoML- . . , , H2O, . , open-source , , , . .







AutoML-?







, , . :

  • (, , — , — );
  • ;
  • () ;
  • ( -);
  • in-sample out-of-sample ;
  • — ?

    , , , — .


AutoML . , , data-driven , .. , .. - .







— , 2018 . FEDOT — 2020 .







AutoML, . , open-source AutoML , — FEDOT.







, , — . , , , (, ). .

, , . , , .. , , , . , , baseline .







, , (, , ).







, , . , AutoML FEDOT, .







FEDOT

. , , . FEDOT, , .







, FEDOT , :







  • — , : (, , ) , ;
  • — , . . Primary , Secondary — ;
  • — , . FEDOT ( Chain).


:



, FEDOT







, , , .







. “”, — . — . — “” AutoML. , . , — .







FEDOT



, . FEDOT- . ? , , ? ?







! .

, — : SSA , . H2O. .







. — , . , . , , :















“lagged-“ . FEDOT “lagged”. — .







1 . , . muli-target . :













. 3 lagged







. , AR ARIMA. , .









. — “US airline passengers” :













— , - . , , AutoML . , .







: — . — . ⋅.



















, , . — , , . , .







14 . , — .







, . , . , , jupyter notebook’.









— . FEDOT :







  • , ;
  • ;
  • .


, , , . . . . .









, ,







lagged-, , ridge- (. ), “”.









, — “”. , , .







,

. , , . , , . ( ) . — — . . , , , . ( ) , — .







:















! “” . . . () (). FEDOT.







, :









(, — )







.









AutoML. FEDOT , API.







, “”. AutoML :







  • — . , , . , , “” . ;
  • — , , . , .


:









.







. : (MAE) (RMSE): MAE — 100.52, RMSE — 120.42.









, : ?







: . . 14 . 14 ( 42). in-sample .

, out-of-sample in-sample :









. in-sample out-of-sample







, 14 . 28 — 2 14 . , (out-of-sample).







, in-sample . ( ). , , .







FEDOT — 3- 14 . . . , , .









14 .







. , , .









( ). , ,







, . , , , . , .







— K- , . , . K- . — .

, , , .









, “” ,







, — , 1000 ⋅, 0. . (, ) . K-nn . , , : MAE — 88.19 RMSE — 177.31.







, - . 5 . , , .







: AutoTS pmdarima

: . , , . , -, ( ). : . , FEDOT , . !







FEDOT open-source — AutoTS pmdarima. Jupyter notebook , , . , . 3 , . ( - ):







∓ RMSE∓CKO
pmdarima 155∓1 196∓1
AutoTS 198∓22 236∓41
FEDOT 110∓14 170∓26


:







, FEDOT “ ”.









, , AutoML. , ML-, .







AutoML FEDOT: , . FEDOT .







( ) .







:









AutoML, FEDOT!







Arbeitete an dem Artikel: Mikhail Sarafanov , Pavel Vychuzhanin und Nikolai Nikitin .








All Articles