Einführung
Die handschriftliche Texterkennung (HTR) ist eine automatische Methode zum Transkribieren von Datensätzen mithilfe eines Computers. Die digitalisierte Form handschriftlicher Notizen würde die Geschäftsprozesse vieler Unternehmen automatisieren und die menschliche Arbeit erleichtern. In diesem Artikel betrachten wir ein Modell zum Erkennen von handgeschriebenem kyrillischem Text basierend auf einem künstlichen neuronalen Netzwerk. Die Studie verwendete das von Harald entwickelte SimpleHTR- System sowie LineHTR , eine erweiterte Version des Simple HTR- Systems . Sie können lesen Sie mehr über SimpleHTR hier .
Datensatz
In diesem Abschnitt werde ich zwei Arten von Datensätzen beschreiben: Der erste Datensatz enthält handschriftliche Anführungszeichen in kyrillischer Sprache. Es enthält 21.000 Bilder aus verschiedenen Handschriftmustern (Namen von Ländern und Städten). Wir haben diesen Trainingsdatensatz erweitert, indem wir 207.438 Bilder aus verfügbaren Formen oder Mustern gesammelt haben.
Das zweite HKR für die handgeschriebene kasachisch-russische Datenbank bestand aus einzelnen Wörtern (oder kurzen Phrasen), die in russischer und kasachischer Sprache geschrieben waren (etwa 95% Russisch bzw. 5% kasachisches Wort / Satz). Beachten Sie, dass beide Sprachen kyrillisch geschrieben sind und dieselben 33 Zeichen haben. Zusätzlich zu diesen Symbolen gibt es im kasachischen Alphabet 9 spezifischere Symbole. Einige Beispiele für den HKR-Datensatz sind nachstehend aufgeführt:
(70%), (15%) (15%) . ( 7,5% ): TEST1 , ; TEST2 , , . TEST1 TEST2 , , .
SimpleHTR
ANN, CNN . RNN. RNN . RNN . RNN. CTC . . CTC ; RNN , . CTC . , , , . , , , , .
: CNN: CNN. . 55 33 . RELU , , . 2 , () , ( ) 32 256. RNN: 256 . . LSTM- RNN, , . RNN 3280.
CTC: RNN , . CTC . 32
: : 128 32. , ( ) , 128 32 . 128 32 . , .
LineHTR
LineHTR - SimpleHTR, , ( ), , . LineHTR SimpleHTR, CNN RNN : 7 CNN 2 Bidirectinal LSTM (BLSTM) RNN.
LineHTR:
800 x 64 ( x ).
CNN 100 x 512.
BLSTM 512 100 x 205: 100 ( ) ; 205 )
CTC 2 : LOSS - ; -
50
Python deep learning Tensorflow. Tensorflow Python. Python , . matplotlib Python, Inkscape- , Adobe Photoshop. 2- " Intel ® Xeon(R) E-5-2680”, 4x " NVIDIA Tesla k20x” 100 RAM. 3 , , .
SimpleHTR
SimpleHTR - , . , :
•
• DataLoader
• : 90% 10% . : -, , ; -, CNN ; -, ; -, , , , .
: SimpleHTR, 42 . 10 . : . , .
|
|
|
|
||
CER |
WAR |
CER |
WAR |
|
bestpath |
19.13 |
52.55 |
17.97 |
57.11 |
beamsearch |
18.99 |
53.33 |
17.73 |
58.33 |
wordbeamsearch |
16.38 |
73.55 |
15.78 |
75.11 |
SimpleHTR (bestpath, beamsearch, wordbeamsearch). NN , . NN, , , . character-LM , .
:
, , " ” 86 .
(HKR Dataset): SimpleHTR 20,13% (CER) 1,55% CER. SimpleHTR ( ). (WER) 58,97% 1 11,09% 2. TEST2 . TEST1 , , , .
LineHTR, 100 . CAR 29,86% 86,71% TEST1 TEST2 ( ). .
SimpleHTR LineHTR : 57,1% SimpleHTR CNN , 58,3% Beamsearch 75,1% wordbeamsearch. Wordbeamsearch, .