5 Ansätze zum Datenmarkup für maschinelle Lernprojekte

Als wir unseren Deep Learning- Kurs Ende letzten Jahres neu gestalteten , um ihn visueller und fallbezogener aus der realen Geschäftspraxis zu machen, haben wir ein neues Modul zum Datenmarkup auf der Crowd-Plattform Yandex.Toloka hinzugefügt. 

Da Crowdsourcing jedoch nicht die einzige Möglichkeit zum Markup ist, haben wir für neue Kursteilnehmer eine Übersetzung dieses Artikels aus dem Lionbridge-Blog mit einem Überblick über die wichtigsten Ansätze zum Markup von Daten vorbereitet. Wir hoffen, Sie finden es auch nützlich.

Die Qualität eines maschinellen Lernprojekts hängt direkt davon ab, wie Sie die Lösung von drei Hauptaufgaben angehen: Datenerfassung, Vorverarbeitung und Markup.

Markup ist normalerweise ein komplexer und zeitaufwändiger Prozess. Beispielsweise beinhalten Bilderkennungssysteme häufig das Zeichnen von Begrenzungsrahmen um Objekte, während Produktempfehlungssysteme und Stimmungsanalysesysteme möglicherweise Kenntnisse über den kulturellen Kontext erfordern. Vergessen Sie auch nicht, dass ein Datenarray Zehntausende oder mehr von Samples enthalten kann, die ein Markup benötigen.

, , . , 5 . 

:

In-house: , . : . , , , -. 

: , . ., . , , . , ; , . , , . 

: – . - , . , , . , , . 

: , , . - (GAN). GAN ( ), . - . GAN . . , , , . 

« »: . , , . , , , . , , .  

 

In-house

 

 

,

 

,

 

 

 

. : , , , . . 

-------------

Deep Learning 6.0 Newprolab 9 .

- Deep Learning 7.0 - c 30 22 2021 .




All Articles