Die Idee wurde vor einigen Jahren geboren und war bis zur Banalität einfach: kad.arbitr.ru - der Ort, an dem Zivil- und andere Fälle "leben" - nur ein bodenloses Lagerhaus wertvoller Informationen für eine Anwaltskanzlei. Die Akten sollten Unternehmen enthalten, die verklagt wurden und die noch nichts davon wissen, nicht bereit sind, nicht selbst vor Gericht gehen können oder wollen. Alles was bleibt ist, diese Firmen zu finden und sie zu erreichen.
Gesagt, getan. Mit Python und Grundkenntnissen der Syntax ausgestattet, beschlossen einige Anwälte, herauszufinden, was daraus werden würde.
Am Anfang
Alles lief gut. Gehen Sie mit Hilfe von Selen auf die Website kad.arbit.ru, gehen Sie zum Kalender der Gerichtssitzungen, geben Sie das Gericht an und wählen Sie den Monat im Kalender aus - die Website gab die geplanten Sitzungen an:
Und hier begannen die ersten Probleme. Wenn es zu viele Treffen gäbe. Und in der Meinung, dass kad.arbitr mehr als 1000 ist, spuckte die Seite aus:
Hmm. Warum werden diese Informationen dann überhaupt benötigt, wenn sie nicht angezeigt werden können?
Aber, komm schon, die Anwälte waren heutzutage nicht gierig und wurden vermisst und verwandelten sich in verfügbare. Das folgende Bild öffnete sich:
Es blieb zum Beispiel, all dies in einer CSV-Tasche zu sammeln. Gleichzeitig behalten der Fall, die beklagte Firma und die Verbindung zum Fall. Es stellte sich so etwas wie das Folgende heraus - schauen Sie .
Als die Ernte einen Monat lang von To-Do-Listen gesammelt wurde, war sie klumpig.
Was danach geschah
Und dann war es notwendig, Nichtformate aus der Liste zu streichen, nämlich:
. Pyhton , . , , (), ( ).
? ! , CTRL+C, CTRL+V ...
. , . python, konvert-online.ru
, .
, . , .
, kad.arbitr.ru c selenium , , .
Code und Anweisungen zur Überprüfung - Download .