Woher kommt die ML-Bewerbung in Russland auf Landesebene?

Vorwort



Hallo!



Die Frage im Titel ist nicht rhetorisch, ich bin wirklich interessiert. Wenn plötzlich jemand die Antwort darauf weiß, schreibe bitte in die Kommentare, vielleicht habe ich versucht, von der falschen Seite zu gehen.



Ich stelle auch klar, dass ich kein Ziel habe, mich über jemanden zu beschweren. Deshalb habe ich in den Antworten der Ministerien alle Briefmarken mit den Namen und Unterschriften der verantwortlichen Beamten entfernt. Ich bin daran interessiert zu verstehen, wie dieses System funktioniert.



Wie hat alles angefangen?



Alles begann damit, dass ich Ende 2019 feststellte, dass ich in meinem bisherigen Berufsfeld für mich einen bestimmten Höhepunkt und eine gewisse Weiterentwicklung in diesem Bereich erreicht hatte:



  1. nicht interessant
  2. es ist möglich, aber es stimmt voll und ganz mit dem Pareto-Prinzip überein, bei dem ich viel Mühe aufwenden müsste, um gespenstische Aussichten zu haben, und sogar nicht so wünschenswert, wie es mir zu Beginn der Reise erschien.


Dank eines wichtigen Treffens mit Freunden wurde mir klar, dass ein langjähriger Wunsch, der aus verschiedenen Gründen übertönt ist, darin besteht, „in die IT zu gehen“, und zwar in ML, und insbesondere kann ich Erfolg haben. Ich werde nicht beschreiben, wie ich studiert habe, aber es war wirklich intensiv, produktiv und vor allem aufregend, so sehr, dass ich mich zwingen musste, mich auszuruhen. Am Ende ging ich pleite. Er kündigte seinen alten Job und widmete fast die gesamte Freizeit dem Studium.



Mit der Zeit begann ich darüber nachzudenken, einen Job in einem neuen Lieblingsgeschäft zu finden, aber dann begann die Geschichte mit Covid. Es ist auch kein Geheimnis, dass maschinelles Lernen in letzter Zeit zu einem sehr modischen Thema geworden ist und infolgedessen eine beträchtliche Anzahl von Bewerbern für die Positionen von Junioren / Auszubildenden im Bereich DS auf dem Arbeitsmarkt erschienen ist. Zusammengenommen bedeuteten diese beiden Faktoren für mich persönlich, dass ich trotz guter Ergebnisse in mehreren Kompetenzen für den Arbeitgeber nur einer von vielen Neulingen auf diesem Gebiet war, genau wie ich, und ich hatte kaum eine Chance, auch nur die Interviewphase zu erreichen.



Nachdem ich darüber nachgedacht und festgestellt hatte, dass ich mich nur durch das Vorhandensein guter Projekte positiv von den anderen unterscheiden kann, suchte ich nach einem Thema für das erste Projekt. Als ich gerade anfing, ML zu studieren, war ich voller Ideen, aber als ich das Thema des Projekts auswählte, wurden diese Ideen weniger, weil ich mich bereits ein wenig mit den Einzelheiten befasst hatte und ein wenig anders dachte: „Ja, das ist eine gute Idee, aber ein offener Lebenslauf ist es nicht Aufgrund seiner vorläufigen Ausbildung und um meine zu unterrichten, werde ich nicht genügend Ressourcen und Daten haben, nur wenn Sie nicht das GAN-Netzwerk nehmen und mit seiner Hilfe Bilder generieren. Und dann gibt es Einschränkungen für Anforderungen an die kostenlose Version der API, und um ein normales Dataset zu entladen, benötigen Sie entweder viel Zeit oder Geld "und so weiter.



Als ich mich entschied, vom anderen Ende wegzugehen, kehrte ich zu Kaggle zurück, öffnete die Datensätze, ordnete sie nach "Schärfe" und dann dämmerte es mir. Covid ist auf dem Hof! Was könnte besser sein - nicht nur ein Projekt zu machen, sondern ein Projekt zu einem Hype-Thema! Dann werden sie mich wahrscheinlich bemerken und mich mit ihren Händen wegreißen. Also dachte ich damals. Ja, schazz.



Mit Blick auf die Zukunft kann ich nicht anders, als festzustellen, dass meine Antworten auf xx trotz all meiner kleinen, aber vorteilhaften Vorteile entweder offen ignoriert oder höflich abgelehnt wurden, selbst für Stellen, für die ich von einem internen Mitarbeiter des Unternehmens empfohlen wurde. In nur einem Monat Arbeitssuche gab es ungefähr 70 Antworten von meiner Seite, und es scheint, dass 3 Interviews, nach denen ich selbst eine negative Entscheidung getroffen habe. Ich weiß nicht genau, was in jedem Einzelfall der Fall war, aber ich vermute, dass die Angelegenheit im Alter (30+) liegt, mangelnde Fachausbildung / Erfahrung und krumme Projekte.



Aber speziell diese Geschichte der Jobsuche mit einem guten Ende - mein aktueller Manager hat mich selbst auf xx gefunden, ich habe schnell die Phasen der Interviews durchlaufen und jetzt mache ich Analysen, einschließlich der Verwendung von ML, und es gefällt mir wirklich gut. Außerdem bezahlen sie mich dafür! Ich werde dies aufgrund meiner gewissen Introversion wahrscheinlich nicht ins Gesicht meines Anführers sagen, aber vielen Dank, wenn Sie dies plötzlich lesen.)



Nun, okay, ich war zu sehr in Richtung der Texte mitgerissen. Näher



Zum Geschäft



Nachdem ich alles auf demselben Caggle-Datensatz (https://www.kaggle.com/parthachakraborty/pneumonia-chest-x-ray) erhalten hatte, schrieb ich ein kleines sequentielles Netzwerk mit einer Genauigkeit von etwa 85%. Am Ende nahm ich einen Datensatz mit Lungenentzündung als Ganzes und nicht mit Lungenentzündung durch Covid, da ich keine Sets mit einer signifikanten Anzahl von Fotos von COVID-19 fand, aber zu diesem Zeitpunkt wusste ich wenig über Augmentationsmethoden.



Glücklicherweise erinnerte ich mich daran, dass ich einen Freund habe, einen Radiologen, mit dessen Hilfe ich einige Details über die Unterschiede in der Diagnose einer Lungenentzündung durch CT-Scans und Röntgenmethoden erfahren habe. Ich schickte ihm auch die vom Modell klassifizierten Bilder, die ich auf Anfrage von "Röntgenaufnahmen der mit Lungenentzündung infizierten Lunge" aus der Weite des Spinnennetzes nahm. Die Ergebnisse sind etwas schlechter als ich erwartet hatte. Auf mehreren Fotos, die das Netzwerk als bakterielle Lungenentzündung wahrnahm, gab es tatsächlich Tuberkulose, die einfach nicht in der Trainingsprobe enthalten war, aber ansonsten entsprach der Prozentsatz der Fehler model.score (X_valid, y_valid).



Ich war begeistert. Trotzdem habe ich echte Datenwissenschaft betrieben und nicht die 70. Einreichung durchgeführt, um in die Top 1% einzudringen und die Preise in Melbourne vorherzusagen. Es würde mich nicht wundern, wenn ich herausfinden würde, dass die lokalen Makler Schluckauf bekommen, wenn sie versuchen, ein Haus zu bewerten. Entschuldigung, ich konnte nicht widerstehen.



Im Allgemeinen war ich inspiriert, schickte ein neues Dutzend Antworten und ... wieder nichts.



Als mir diese Idee in den Sinn kam, kann ich nicht sagen, dass ich ausschließlich von guten Absichten wie Frieden-Frieden, Rettung der Armen und anderer geleitet wurde. Nein, mein Ziel war es, so schnell wie möglich einen Job zu finden, und dafür musste ich mich positiv von der Masse des gleichen „Ich möchte in ML sein“ abheben.



Gleichzeitig habe ich durch die Jugendkrise „Warum sind wir hier?“ Und als Atheist mein Credo für mich selbst festgelegt - dass ich die Welt zu einem besseren Ort machen will, weil Der Rest hat meines Wissens keinen wirklichen Wert in großem Maßstab. Idealistisch und naiv? Ja, das ist wahr und was ich getan habe und warum ich diesen Beitrag überhaupt schreibe, folgt aus meinen Eigenschaften.



Ich beschloss, an den Empfang des Präsidenten der Russischen Föderation einen Vorschlag von ungefähr folgendem Charakter zu schreiben (ich habe den genauen Text nicht erhalten, da er in einer speziellen Form auf der Website des Empfangs geschrieben ist): „Ich, so und so, im Rahmen der Benennung von Schlüsselbereichen durch den Präsidenten der Russischen Föderation Entwicklung des Staates, nämlich im Rahmen der Anwendung von ML in verschiedenen Bereichen des Staates, schlage ich Folgendes vor: Organisation der Sammlung und Speicherung von Röntgenbildern und Bereitstellung dieses Speichers für die Verarbeitung durch ML-Methoden und die Möglichkeit der Rückmeldung. " Als nächstes beschrieb ich kurz mein Modell und gab an, dass ich trotz meines kleinen Wissensgepäcks ein Empfehlungsmodell erstellen konnte, das mit einem Radiologen zusammenarbeiten und nützlich sein konnte. Und in Russland gibt es eine bedeutende Anzahl von DC-Enthusiasten mit einem hohen Maß an Wissen / Fähigkeiten, die nicht nur auf dem Gebiet der Medizin viel leisten können.aber auch in anderen Bereichen, in denen Sie grundsätzlich ML anwenden können.



Leider erinnere ich mich nicht an den genauen Text der Berufung, da es im März oder April war, aber die allgemeine Bedeutung ist genau die gleiche.



Bei der Entwicklung dieses Themas möchte ich jetzt hinzufügen, dass es im Prinzip notwendig ist, die größtmögliche Menge offener Daten zu sammeln, zu aggregieren und zu einem Analogon von Kaggle zu rollen, wo es auch möglich wäre, Aufgaben zu setzen, ihre Lösungen zu diskutieren und die besten zu finden. Rosstat macht bereits etwas Ähnliches in Bezug auf die Veröffentlichung von Daten, ich habe es sogar geschafft, etwas zu analysieren, aber dieses Thema muss weiterentwickelt werden.



Die Nachricht wurde registriert, über die ein separater Brief kam, aber ich war immer noch ziemlich überrascht, als ich sah, dass die Antwort kam. Die erste Antwort kam vom Gesundheitsministerium. Es war kurz und lakonisch.







Die Essenz der Antwort lautet meines Erachtens "OK, danke, nicht."



Ich dachte, dass dies das Ende der Geschichte war, aber eine andere Antwort kam vom Ministerium für Industrie und Handel. Die Antwort ist sehr detailliert und detailliert, aber ich hatte das Gefühl, dass sie entweder verzerrte Informationen erhielten oder mich einfach missverstanden haben.



















Ich habe keine finanzielle Unterstützung für die Umsetzung dieses Projekts angefordert, außerdem habe ich kein Wort geschrieben, an dem ich teilnehmen möchte (obwohl ich es natürlich nicht ablehnen würde). Nun, sie antworteten, gut, und danke dafür.



Ich hätte diese Geschichte sicher vergessen, wenn ich nicht regelmäßig auf Nachrichten wie diese oder jene (sehr frisch) oder besonders diese gestoßen wäre . Nachdem ich es gelesen hatte, lachte ich ein wenig, denn genau darüber habe ich geschrieben.



Ergebnis



Fuh, nun, die Post kam heraus.



Dies sind die wichtigsten Fragen, die ich stellen wollte.



Wer ist an der Umsetzung von ML in den "Geschäftsprozessen" des Staates beteiligt? Wer führt diese Leute?



Ist es zentralisiert oder hat jedes Ministerium seine eigenen Datenwissenschaftler? Sind sie überhaupt im Staatsapparat?



Ich habe den Text der nationalen Strategie zur Entwicklung der künstlichen Intelligenz für den Zeitraum bis 2030 gesehen, aber ich habe immer noch Dutzende von Fragen, wen kann ich stellen? Um eine vernünftige Antwort zu bekommen, natürlich.



In Anbetracht der Antworten, die ich erhalten habe, habe ich einige Zweifel, dass diese Strategie nicht nur eine Absichtserklärung, sondern ein realer Plan ist und dass dieses ganze Unternehmen nicht zur Finanzierung mehrerer „eigener“ Showcase-Haustierprojekte führen wird, auf die dann Bezug genommen wird, wobei der Erfolg der Strategie zur Kenntnis genommen wird.



Im Allgemeinen implementiert einer derjenigen, die diesen Beitrag lesen, Programme aus dieser Strategie?



Vielen Dank, dass Sie sich n Minuten Zeit genommen haben!



All Articles