Die besten Datenprodukte werden auf den Feldern geboren

Die meisten unserer Online-Bestellungen werden in Lagerräumen und nicht in Lagern abgeholt. Dies führt zu Fehlern zwischen dem, was auf der Website angezeigt wird, und dem, was wir tatsächlich in einer  Online-Bestellung zusammenstellen können .

Aufgrund der hohen Fluktuationsrate von Waren in Filialen und der Komplexität von Lagerverwaltungssystemen treten Fehler auf, die automatisch erkannt werden können. Basierend auf unseren Systemkenntnissen und dem Einsatz von Social Engineering haben wir eine Lösung vorgeschlagen, die automatisch problematische Produkte findet und deren Bestand vor der Veröffentlichung auf der Website anpasst.





Bild



,    « ».    2011 . (  ,   13, 107),       ,   Data- .



«»



   ,   ,   «».       ,  .



  •  —  .
  •  — ,     .
  •  — .
  •  — .
  •  — 5   .




,   ,      « »,  98%         .



8 000 .  , 40 000   .   , ?   ,   , ,   ,  ,  .   ,      - , , - « ».   ,   ,     -  .



-    ,  —   .



  ,     ,     Data Accelerator.  — data-,   data-driven.  Data Accelerator 126 ,   5      — « »,     .



 ,    ,   ,   . ,    .



  : Data Scientist, Data Engineer, Data Analyst, Product Owner  Scrum-.



:



  • ,     (  );
  •  eCom,    .


 , .





,    ,  ,  :   . ,   ,   3 , ,    ,   6 . , , ,    …



      ,       . . « » ,   ,   .



,  —    . ,    ,        .   ,     ,   1. , , ,    .   .  .



Bild

 — .  ,   . , , .   2500 ,   43,    .        «».



Bild



,   excel-,  ,     excel-  :   ,   .   ,  , ,   , , .



,   ,  60%   , .      ,    81%, ,  -, .



MVP.



 6 ,   proof of concept   , ,   ,  .    ,   ,   .

, , ,   ,   ,    — ,   , .    ,     , , .



«-1».



  ,   ,   : « ,   , , , ».     , , « » ,    .     4  , .



   ,   . -,   ,   , - , , .     ,       . -, ,        . ,  ,      .



ML-.



,   ML-,     6 .   ML-?



  •    Catboost,   ,     .
  •     ,        .
  •     ,     ,  ,  ,   ,  ,    .
  •   70 .
  •     ,   Permutation Importance  ,   Catboost.
  •   ,       80/20.
  •   ,     .
  • ,    ,     ,    train/valid-.
  •     DVC,    S3.


  :



  • ROC-AUC: 0.68
  • Recall: 0.77




 —    .   ,   DataLake   GreenPlum.   ,  MongoDB,  .   GreenPlum  MongoDB   opensource- Apache- Apache AirFlow  Apache NiFi.



Python-,  Kubernetes.     ,   -   Apache Kafka,   ,         Apache Kafka.



Bild



  6    ,   15%    12%,   E-com   . ,   ,   .



  ,    ,    .   ,    — ,   ,     .           .



p.s. Avito.Tech, .






All Articles