Meine Yandex.Station Mini kann zwei Sounds gleichzeitig ausgeben, aber Ihre? (UPD. Wie man eine weibliche Stimme befiehlt)

Kürzlich erworbene Yandex.Station Mini. Wenn, wer weiß nicht, ist dies ein kleiner intelligenter Lautsprecher, der durch Stimme und Gesten gesteuert wird. Darin befindet sich Alices Sprachassistentin: Sie schaltet die Musik ein, beantwortet Fragen und erledigt Besorgungen. Es wurde als "Smart Radio" für die Küche erworben, die anschließende Schaffung eines Smart Home mit eigenen Fähigkeiten.







Nachdem ich mit den Betriebssystemen Winodows 7, 10, Ubuntu 16.04 "gepaart" hatte, nachdem ich viel mit seinen Fähigkeiten gespielt hatte, lernte ich die offizielle Dokumentation kennen.





, Bluetooth — :



: «, Bluetooth» , .



Bluetooth , Bluetooth.



.



Bluetooth, . , , .










Nachdem ich es gelesen hatte, war ich sehr verärgert. Einerseits gibt es enorme Möglichkeiten für Sprachsteuerung, Schaffung von Fähigkeiten und Smart Home. Auf der anderen Seite erhalten wir mithilfe der Ladefunktionen über den USB 3.0-Anschluss eines Laptops ein Sprachbedienfeld mit einer Reichweite eines guten WLAN-Punkts ohne besondere Anpassungen - bis zu 100 Meter!



Ich beschloss, die Passphrase eines Lautsprechers zu überprüfen, der über Bluetooth mit einem Computer gekoppelt war. „Alice, schalte das Radio Mayak ein. Und das Radio begann zu singen ... Und parallel dazu ertönte der Ton vom Computer. Infolgedessen wurde die offizielle Dokumentation widerlegt, das Gerät hat seit August 2020 neue Funktionen erhalten. Für zwei Streams wird empfohlen, wie gewohnt einen Stream mit den Befehlen von Alice zu steuern. Der Stream über Bluetooth kann über die Lautstärkeregelung des Computers, auch über eine drahtlose Tastatur mit Steuertasten oder, falls verfügbar, über separate Lautstärkeregler für Laptops am Ende des Geräts gesteuert werden.



Wer kann dieses Experiment noch durchführen?



UPD1. Um zu analysieren, warum es Probleme mit Frauenstimmen bei der Steuerung eines intelligenten Lautsprechers gibt, werde ich mehrere Grafiken geben.



Dies ist eine Grafik der durchschnittlichen Leistung von 20 russischsprachigen Personen. Wie Sie sehen können, ist die Sprache sehr ungleichmäßig, die spektrale Dichte konzentriert sich auf 200 ... 600 Hertz.

(Abb. Aus "Lehrmaterialien OKSO 210000. Elektronik, Funktechnik und Kommunikation. Vorlesungen für Lehrer und Studenten." 3. Sprachbildung und Spracheigenschaften )



Nun wollen wir sehen, wie der intelligente Sprecher auf uns hört.





(Aus dem Video entnommen, YouTube-Nutzer Prokhor Ponomarev , Beitrag Messen des Frequenzgangs mit dem iPad gegen den Behringer ECM8000 .

Wir interessieren uns für die blaue Kurve. Dies ist der Frequenzgang des iPad 4-Mikrofons, im Prinzip ist dies der Standard, den ein intelligenter Lautsprecher anstreben könnte Wahrscheinlich haben sie für einen solchen Preis einfach nicht programmatisch in ihn investiert.



Daraus schließt der Autor. Schauen Sie sich die Grafiken genau an: Männer können einen Befehl im unteren Sprachbereich sprechen und aufgrund der größeren ausgeatmeten Masse „gleichmäßiger atmen“, wenn sie den Befehl erteilen. Bei Frauen ist die durchschnittliche Frequenz der Stimme höher. Das Vorhandensein einer größeren Anzahl von unharmonischen Tönen ermöglicht es der Empfindlichkeit eines Arrays von 4 Mikrofonen nicht, ein gleichmäßiges Plateau zu erreichen. Daher eine einfache alltägliche Schlussfolgerung - für die Stimme einer Frau ist es notwendig, Emotionen auszuschalten, zu versuchen, „mit der männlichen Energie“ des Basses zu sprechen und den unteren Formanten fallen zu lassen.



Es wurde auch eine Reihe indirekter Sprachmessungen durchgeführt, auf denen das Erkennungssystem trainiert wurde. Bisher ist die allgemeine Schlussfolgerung, dass sie auf Männerstimmen trainiert hat.



Unter dem Spoiler befinden sich mehrere technische Screenshots zum Verbinden von Yandex.Station Mini mit Windows.

Verbinden von Yandex.Station Mini mit Windows


Windows.





. ! Qualcomm !





.






All Articles