Wir haben endlich unseren Satz hochwertiger vorgefertigter Spracherkennungsmodelle (d. H. In der Qualität mit den Premiummodellen von Google vergleichbar ) für die folgenden Sprachen veröffentlicht:

Englisch;
Deutsche;
Spanisch;

Sie finden unsere Modelle in unserem Repository zusammen mit Beispielen und Metriken für Qualität und Geschwindigkeit. Wir haben auch versucht, den Einstieg in unsere Modelle so einfach wie möglich zu gestalten. Wir haben Beispiele für Collab und Checkpoints für PyTorch, ONNX und TensorFlow veröffentlicht. Modelle können auch über TorchHub hochgeladen werden.

	PyTorch	ONNX	TensorFlow	Qualität
Englisch (en_v1)	✓	✓	✓	Verknüpfung
Deutsch (de_v1)	✓	✓	✓	Verknüpfung
Spanisch (es_v1)	✓	✓	✓	Verknüpfung

Warum ist es wichtig?

Die Spracherkennung hatte traditionell aus mehreren Gründen hohe Eintrittsbarrieren:

Daten sind schwer zu sammeln;
Markup für eine vergleichbare Dateneinheit ist viel teurer als bei Computer Vision.
Hohe Anforderungen an Rechenleistung und veraltete Technologien;

Hier ist eine Liste der häufigsten Probleme, mit denen vorhandene Spracherkennungslösungen vor unserer Veröffentlichung konfrontiert waren:

Die Forschung in diesem Bereich wird normalerweise mit enormer Rechenleistung durchgeführt.
- , " ", ;
, - ;

- , ( ). :

- ;
;
;
- ;
, , ;

—

, . :

;
. , , ;
("1 ");

, — 50 .

— 10-20 .

.

Wir haben moderne STT-Modelle veröffentlicht, deren Qualität mit Google vergleichbar ist

Warum ist es wichtig?

—

More articles: