Erster Platz bei AI Journey 2020 Digital Peter

Hallo Habr
Hallo Habr

Habt alle einen guten Tag! Der jährliche internationale KI-Wettbewerb, der von der Sberbank zusammen mit russischen und ausländischen Partnern im Rahmen der Artificial Intelligence Journey- Konferenz organisiert wird, ist gerade zu Ende gegangen . Die diesjährigen Aufgaben: Digital Peter: Anerkennung der Manuskripte von Peter I , NoFloodWithAI: Überschwemmungen auf dem Amur River und AI 4 Humanities: ruGPT-3 . Diesmal nahmen rund 1000 Personen aus 43 Ländern an dem Wettbewerb teil.





Unser Team hat an der Lösung des Problems "Digital Peter: Anerkennung von Manuskripten von Peter I" teilgenommen und den ersten Platz gewonnen. Ich möchte Ihnen erzählen, was wir bei der Lösung des Wettbewerbs getan haben , wer hier Papa ist , welche Tricks und Tricks wir angewendet haben. Es gibt viele Informationen, es wird viele spezielle Wörter für diejenigen geben, die nicht in dem Thema sind. Dies ist kein Tutorial, ich werde es nicht detailliert beschreiben, aber ich werde gerne Fragen in den Kommentaren beantworten.





Sie können sich das Traumteam ansehen





Planen

  • Beschreibung der Aufgabe





  • Lösungsschritte





    1. Datenvorverarbeitung





    2. Beschreibung des neuronalen Netzes





    3. Augmentation





    4. CharMasks





    5. Rechtschreibkorrektur mit XLMRoberta





    6. Schwellenwerte für Ensemble + Zauberkorrektur





  • Was hat nicht funktioniert





  • Mannschaft





  • Fazit





Beschreibung der Aufgabe

Datenformat, verfügbare Ressourcen und Einschränkungen





, : , I, (. ). , , - .





.





, - , - , , .





500 , , , , .





1.

, ( OOF), . ( ), ( ), , +90, -90 . (Resnet34 ) . , .









, .. . .





2.

, CTCLoss Attention. CTCLoss , Attention . CTCLoss, , Attention . .





Bs - , (w, h, c) - (, , ). . Hidden size - LSTM . Dict Size - , . Dense - Keras, Linear PyTorch.





3.

, . : ToGray, CLAHE, Rotate, CutOut.





CutOut .  , HandWrittenBlots, , , .  , ( ) . CutOut , HandWrittenBlots .  Augmixations. .





P.S. CutOut , .





4. CharMasks

, , CTC Loss. , , , ( , ). ( Action Labeling ).





. , , . , . XVII-XVIII (, ). , , .





danke euch allen für conov piter
piter

, , , , . . , . . (Multi Word Expression) ( ) .





danke euch allen für conov piter
piter

, , .. , . - :





danke euch allen für conov piter
piter

5. Spell correction using XLMRoberta

, .





,     ( , ). NLP. XLMRoberta XVII-XVIII .., I. :





1. OCR ( ) ( ) ( + softmax), 3 (//blank ..) ;





2. : 3-4 , - .. //blank, , . zero-shot learning, , . OCR ('': 'p', '': 'o', '': 'e', '': 'c', '': 'a', '': 'x', '': 'u', '': ‘k’);





3. OCR step by step (!), ;





4. : ( 0 12), 50% padding ( ), 10% . ( ). XLMRoberta outputhiddenstates - NER, ;





5. GPU , TPU Colab





P.S.

( ), BeamSearch. .





6. Ensemble + Spell Correction Thresholds





, , , CTCLoss, . .    , . N "" . , , . . , , , ., +- .





Other Backbones. (EfficientNet, [SE, ECA]ResNet[xt], Mobilenet ), Resnet34.





Augmentations.   Albumentations (Brightness, Gamma, Blur ), , .





TTA (Test-Time Augmentations).  , holdout , public test - . , holdout.





Classic Blending.  , , , , , .





(). , ! :)





(github, linkedin, kaggle)





(github, linkedin, kaggle)





(github, linkedin, kaggle)





(linkedin, kaggle)





, , . , .





P.S. ( , public): 

| CER: 2.531 | WER: 13.5 | ACC: 62.107 | TIME: 32s |

submission .





P.P.S.

, ? :)












All Articles