
Wir haben endlich unseren Satz hochwertiger vorgefertigter Spracherkennungsmodelle (d. H. In der Qualität mit den Premiummodellen von Google vergleichbar ) für die folgenden Sprachen veröffentlicht:
- Englisch;
- Deutsche;
- Spanisch;
Sie finden unsere Modelle in unserem Repository zusammen mit Beispielen und Metriken für Qualität und Geschwindigkeit. Wir haben auch versucht, den Einstieg in unsere Modelle so einfach wie möglich zu gestalten. Wir haben Beispiele für Collab und Checkpoints für PyTorch, ONNX und TensorFlow veröffentlicht. Modelle können auch über TorchHub hochgeladen werden.
| PyTorch | ONNX | TensorFlow | Qualität | Colab | |
|---|---|---|---|---|---|
| Englisch (en_v1) | ✓ | ✓ | ✓ | Verknüpfung | |
| Deutsch (de_v1) | ✓ | ✓ | ✓ | Verknüpfung | |
| Spanisch (es_v1) | ✓ | ✓ | ✓ | Verknüpfung |
Warum ist es wichtig?
Die Spracherkennung hatte traditionell aus mehreren Gründen hohe Eintrittsbarrieren:
- Daten sind schwer zu sammeln;
- Markup für eine vergleichbare Dateneinheit ist viel teurer als bei Computer Vision.
- Hohe Anforderungen an Rechenleistung und veraltete Technologien;
Hier ist eine Liste der häufigsten Probleme, mit denen vorhandene Spracherkennungslösungen vor unserer Veröffentlichung konfrontiert waren:
- Die Forschung in diesem Bereich wird normalerweise mit enormer Rechenleistung durchgeführt.
- - , " ", ;
- , - ;
- - ;
- ;
- ;
- - ;
- , , ;
—
, . :
- ;
- . , , ;
- ("1 ");
, — 50 .
— 10-20 .
.