Erkennung von Dokumenten anhand eines privaten Beispiels - eine Übersicht über verfügbare kostenpflichtige und kostenlose Lösungen

Hallo! Dies ist eine typische Situation in der Firma, in der ich arbeite. In der Buchhaltung gibt es einen ewigen Ansturm, es gibt nicht genug Leute, jeder tut etwas absolut Wichtiges, aber im Wesentlichen nutzlos. Dieser Sachverhalt passte nicht zum Management.



Im Einzelnen besteht das Problem darin, dass die Buchhaltungsressourcen für aktuelle Aufgaben nicht ausreichen und niemand neue Mitarbeiter mit Tarifen ausstatten möchte. Aus diesem Grund haben sie beschlossen, einige Aufgaben zu kürzen und den Buchhaltern Zeit für nützlichere Dinge zu geben. Arbeiten wie das Scannen und Erkennen von Dokumenten, das Kopieren und Hinzufügen zu anderen Routinefreuden kamen unter das Messer.



Als Analyst stand ich vor der Aufgabe, eine Lösung für die Erkennung eines für mein Unternehmen typischen Dokuments zu finden - eine Rechnung -, um es in die verfügbaren Speicher sowie in 1C zu strukturieren. Eine Lösung, die bequem und verständlich ist und das Unternehmen keinen Cent kostet.



Die Erfahrung erwies sich als amüsant. Ich beschloss zu teilen, was ich sammeln konnte. Vielleicht habe ich etwas verpasst, also willkommen in den Kommentaren, wenn es etwas hinzuzufügen gibt.





Dokumentenscanprogramme und Dokumentenerkennungsprogramme sind keine neue Lösung auf dem Markt. Sie sind sowohl in kostenlosen Programmen als auch in Systemen integriert.



Ich habe mit kostenlosen Programmen angefangen:



  • glmageReader
  • Papierkram
  • VietOCR
  • Keilschrift.


Bei der Anerkennung unserer Rechnung durch solche Programme habe ich Folgendes gesehen:



  • In Programmen wie VietOCR, Paperwork, glmageReader können Sie die Speicherung gescannter Dokumente in bestimmten Ordnern konfigurieren. Paperwork kann sie sogar nach Etiketten sortieren.
  • Sie eignen sich im Allgemeinen gut für Text. Wenn der Text nicht richtig erkannt wird, können einige Programme den Inhalt vor dem Exportieren der Datei manuell ändern.


Bild



Es gibt jedoch auch Probleme:



  • Es gibt einen Unterschied zwischen der Arbeit mit PDF-Scans und PNG. Es ist nicht immer möglich, PNG erfolgreich in PDF zu konvertieren.
  • Die meisten dieser Programme sind mit der Erkennung tabellarischer Dokumente selbst im einfachsten Format nur schwer zu bewältigen. Als Ergebnis erhalten wir den erkannten Text ohne die markierten Felder.



    Bild

  • Manchmal ist die Schriftart ungenau bestimmt, wodurch beim Konvertieren der gesamte erkannte Text übereinander läuft.
  • Bei der Erkennung ist es manchmal erforderlich, die Ausrichtung nach Schlüsselwörtern mit Rotationen und Koordinatenverschiebungen vorzunehmen.
  • In einigen Programmen wurde die Tabelle als Bild erkannt und in ein neues Word-Dokument exportiert, auch als sehr abgeschnittenes Bild, das sogar schwer zu sehen ist.
  • Beim Bearbeiten von erkannten Inhalten in einigen Programmen traten Probleme auf, die Schriftart oder der Text selbst wurden geändert.




Bild



Die Technologie hat gut genug funktioniert. Angesichts der Tatsache, dass die Programme kostenlos sind, sind die oben beschriebenen Probleme akzeptabel. Ich suchte jedoch nach einer schlankeren Lösung.



Dann recherchierte ich in ABBYY FineReader 15 Corporate nach Anerkennung



Während der 7-tägigen Testphase habe ich auch diese Plattform studiert.



Was vermerkt:



  • Als ich die PNG-Datei öffnete, wurde sie perfekt gelesen und als Ergebnis erfolgreich in PDF konvertiert, ohne die Qualität von Bild und Text zu verlieren.
  • , . png , .
  • - pdf. .
  • , , .
  • OCR pdf -. - .



    Bild

  • , , . , , .



    Bild

  • Hier können Sie die automatische Konvertierung eingehender Dokumente einrichten, die regelmäßig gemäß dem angegebenen Zeitplan aus dem angegebenen Ordner abgerufen werden.
  • Sie können Versionen von Dokumenten vergleichen, auch wenn diese in unterschiedlichen Formaten vorliegen. Mit einem großen Fluss von Dokumenten und Bearbeitungen ist dies sehr praktisch.


Ich hatte eine angenehme Erfahrung mit dieser Software. Als ich mich jedoch dem Preisschild der ABBYY Flexicapture-Systemlösung zuwandte (und ich brauche die Systemlösung), stellte ich fest, dass die Lösung, insbesondere die kundenspezifische, eine ziemlich runde Summe kostet, etwa 400.000 Rubel / Monat. und darüber für 10 Tausend Seiten.



Ich suchte nach einer Alternative. So befreien Sie die Hände eines Mitarbeiters, erhalten eine qualitativ hochwertige Dokumentenerkennung und sorgen sich nicht um die Sicherheit und Struktur von Daten.



Und dann beschloss ich, ELMA RPA, das ich bereits zuvor studiert hatte, genauer zu betrachten .



Der Anbieter schlägt vor, einen wesentlichen Teil der Arbeit zum Exportieren von Daten in ERP von den Schultern der Buchhalter auf Roboter zu verlagern. Genau das löst das für mich aufgeworfene Problem. Um mich mit der Erkennung in diesem System vertraut zu machen, habe ich eine Testversion des Systems vom Anbieter genommen.



Hier habe ich festgestellt, dass die Erkennung nicht dazu gedacht ist, die empfangenen Daten in eine neue Dokumentdatei umzuwandeln.



Hier besteht das Hauptziel darin, Dokumentdetails zu erkennen und auf andere Systeme / Standorte / Anwendungen zu übertragen. Darüber hinaus platzieren Roboter alle Informationen dort, wo sie sie benötigen: Sie finden automatisch die erforderlichen Ordner und speichern sie in den erforderlichen Formaten.



Welche Arten der Erkennung im System habe ich mir angesehen:



Mustererkennung



Es wird uns angeboten, das geladene Dokument anhand der Dokumentvorlage zu erkennen. Soweit ich weiß, ist diese Art der Erkennung kostenlos, die Tesseract-Engine ist damit verbunden.



Was vermerkt:



  • Diese Art der Erkennung funktioniert genau mit Scans der Formate jpg und png, PDF wurde noch nicht berücksichtigt. Aber das Produkt ist noch jung, ich denke, alles liegt vor uns.
  • Diese Art der Anerkennung ist in der kostenlosen Community Edition enthalten
  • Der Text ist bequem in Blöcken markiert, die gemäß den Variablen, die wir im Kontext des Roboters erstellt haben, abgeglichen werden können. Konfigurieren Sie daher manuell, was genau wir erkennen.
  • Er erkannte unsere Rechnung 50/50 und änderte einige Wörter, wie er es für richtig hielt. :) :)



    Bild





Der Anbieter für diesen Fall sagte jedoch, dass diese Art der Erkennung für einfache Dokumente mit einer Textstruktur oder mit leichten Formen angepasst ist. Und er riet, eine andere Art der Erkennung zu verwenden, um die Rechnung zu erkennen - das Intellektlabor .



Der Vorgang ist der gleiche, wir laden die Vorlage und erkennen sie daran. Hier wird die Vorlage jedoch an den Cloud-Server gesendet.



Wir erhalten eine Antwort vom Server (unabhängig davon, ob dieser Dokumenttyp erkannt wird oder nicht). Wenn er erkannt wird, wird die Vorlagenstruktur (Variablen für die Zuordnung) übergeben, um den Variablen zu entsprechen, die im RPA-Prozess geschrieben werden müssen.



Während des Wiedergabevorgangs senden wir bereits ein Dokument, das wir erkennen möchten, und erhalten vom iLab-Server eine Antwort zur Erkennung.



Was ich über diese Anerkennung bemerkt habe:



  • pdf, jpg png.
  • . .
  • - .
  • , 1. , , , , .
  • Community Edition . , (, , .), , 100 500 . ( , , .)


Der Prozess der Dokumentenerkennung selbst ist auf Videos nur schwer darzustellen, wie dies in der Box der Fall ist, und der Bildschirm ist einige Sekunden lang leer. Daher habe ich die erkannten Daten zur Visualisierung separat in ein Notizbuch eingegeben.



Dokument im Notizblock erkennen



Dementsprechend schreibt der Roboter die gleichen Daten in 1C und erstellt dort ein neues Dokument:



Dokumenterkennung und -erstellung in 1C



Was wir anhand der Preise herausgefunden haben: Wenn wir beispielsweise in großem Maßstab mit ilab-Erkennung arbeiten möchten, müssen wir für unsere 10.000 Dokumente bezahlen:



  • etwa 180.000 Rubel. zu einer Zeit,
  • plus beispielsweise 400.000 Rubel. Kauf eines Roboters mit einem Orchestrator
  • Gesamt: 580.000 Rubel.


Der Roboter ist unbegrenzt und 10.000 Dokumente werden für einige Zeit ausreichen. Es stellt sich als ziemlich profitabel heraus, zumindest in der Tatsache, dass wir alles einmal bezahlen.



Was uns an der Anerkennung auf dieser Plattform im Allgemeinen gefallen hat:



  • , , . .
  • , , , . .
  • . 15 , — . , .
  • , .


:



  • Kostenlose Programme bewältigen die Aufgabe der Dokumentenerkennung besser als ich erwartet hatte. Aufgrund dieser Aufgabe wird es jedoch nicht möglich sein, die Arbeit mit einem großen Volumen erheblich zu beschleunigen
  • ABBYY FineReader kommt gut mit der anschließenden Verarbeitung und Erkennung von Dokumenten zurecht. Um jedoch eine Systemlösung zu erhalten, benötigen Sie große finanzielle Möglichkeiten.
  • ELMA RPA ist überrascht von der Qualität der Dokumentenerkennung, der Variabilität sowie der Speicher- und Übertragungsmöglichkeiten nach der Erkennung. Es sollte jedoch berücksichtigt werden, dass das Produkt jung ist.



All Articles