Eine Auswahl von Artikeln zum maschinellen Lernen: Fälle, Leitfäden und Forschung - August 2020





Wir sammeln weiterhin Materialien für Sie aus dem ML-Bereich. Wie immer bevorzugen wir Projekte, die Links zu nicht leeren Repositorys enthalten oder APIs auf hoher Ebene bereitstellen.





Iris



Die Firma MediaPipe, die sich auf Open-Source-ML-Lösungen zur Erkennung von Objekten im Weltraum spezialisiert hat - wie FaceMesh und Handpose, auf deren Grundlage wir eine Demo zusammengestellt haben - präsentierte ein neues Tool Iris . Wie der Name schon sagt, erkennt dieses Modell des maschinellen Lernens die Iris, die Pupille und die Augenkontur mithilfe einer einfachen RGB-Kamera in Echtzeit. Mit einem Fehler von weniger als 10% wird auch der Abstand zwischen Motiv und Kamera ohne Tiefensensoren ermittelt. Leider kann der Algorithmus bisher nicht bestimmen, in welche Richtung eine Person schaut, da er nicht in der Lage ist, eine Person zu identifizieren. In Kombination mit Pose Animator können Sie jedoch mehr "lebende" animierte Charaktere erstellen, sodass wir auf einen Trend für Comic-Masken warten.







FMKit



Nicht nur Mediapipe versucht, das Problem teurer Peripheriegeräte mithilfe von Algorithmen für maschinelles Lernen zu lösen. Forscher der Universität von Arizona haben eine Möglichkeit entwickelt, mit VR- oder AR-Umgebungen ohne spezielle Controller zu interagieren.

Ihr Algorithmus erkennt Wörter, die mit Ihrem Finger in die Luft geschrieben wurden. Auf Eingabegeräte konnte man überhaupt nicht verzichten, die Entwickler verwenden den Leap Motion Motion Capture Sensor. GitHub mit FMKit-Quellcode und Datensätzen.







Stil- und Semantikforscher



an der Schweizerischen Hochschule Zürich haben ein offenes neuronales Netzwerk entwickeltHiermit können Sie das generierte Bild mit übergeordneten Attributen und Textbeschreibungen bearbeiten. Am Eingang des Modells können Sie eine Maske von Objekten mit ihren Klassen angeben. Das neuronale Netzwerk erzeugt ein Bild mit ähnlicher Struktur. Sie können den Inhalt des Bildes mithilfe von Textabfragen bearbeiten. Das Modell arbeitet in zwei Schritten. Beim ersten wird der Hintergrund des Bildes erstellt, beim zweiten - der Generator synthetisiert den Vordergrund des Bildes unter Berücksichtigung des erstellten Hintergrunds. Dies löst das Problem von Artefakten, die beim Entfernen oder Verschieben von Bildern aus dem Vordergrund im Hintergrund auftreten.







Semantischer Reaktor



Wenn Sie eine sprachbasierte Anwendung erstellen, z. B. einen Kundendienst-Chatbot oder ein Questspiel, ist dieses Tool möglicherweise für Sie von Interesse. Semantic Reactor ist ein Google Sheets-Plugin, mit dem Sie Modelle zum Verständnis natürlicher Sprache für Ihre eigenen Daten ausführen können. Dieses Browsergame zeigt, wozu das Tool in der Lage ist. Glücklicherweise unterstützt es auch ein mehrsprachiges Modell, das auf 16 Paaren trainiert wurde, einschließlich Russisch.



Fawkes



Maschinelles Lernen wirft viele ethische Kontroversen auf, die gelöst werden können ... dasselbe maschinelle Lernen. Forscher der University of Chicago haben einen Algorithmus entwickelt, der Änderungen auf Pixelebene für das menschliche Auge in Fotografien unsichtbar macht, sodass sie für andere Modelle unbrauchbar werden. Sie nennen diesen Prozess Bildmaskierung. Sie benannten das Instrument zu Ehren von Guy Fawkes, der dank der anonymen Maske allen bekannt ist. Die Ersteller behaupten, dass getarnte Fotos in sozialen Netzwerken veröffentlicht werden können. Wenn sie zum Trainieren von Gesichtserkennungsmodellen verwendet werden, kann das Modell Sie durch Maskierung aufgrund von Verzerrungen nicht im Bild erkennen. Wie sie sagen, Keilkeil.







Sehen & sprühen



Eine Fallstudie zum maschinellen Lernen in der Landwirtschaft. John Deere, der weltweit größte Hersteller von landwirtschaftlichen Geräten, hat sich dem maschinellen Lernen und der Bildverarbeitung zugewandt, um Unkraut besser bekämpfen zu können. Das neuronale Netzwerk identifiziert Unkräuter anhand der Bilder und besprüht sie sofort mit Herbiziden. Dies spart Ressourcen, ohne die Ernte zu beschädigen. Das PyTorch-Framework wurde verwendet, um alle Modelle zu trainieren. Die erste Schwierigkeit, mit der die Urheber konfrontiert waren, war die Erstellung und Kennzeichnung von Datensätzen aufgrund der äußeren Ähnlichkeit von Unkräutern mit anderen Kulturen. Die Bereitstellung von Modellen auf Geräten war ebenfalls eine Herausforderung, da der Roboter schnell Entscheidungen treffen und sich auf dem Feld bewegen muss.



AI Economist



Die Entwicklung der Wirtschaftspolitik und die Bewertung ihrer Wirksamkeit halten nicht mit den Veränderungen in der umliegenden Welt Schritt, wie dies beispielsweise vor dem Hintergrund einer globalen Pandemie spürbar ist. Darüber hinaus erfordern Wirtschaftsmodelle viele Annahmen, die ihre Fähigkeit einschränken, die aktuellen wirtschaftlichen Bedingungen vollständig zu beschreiben: Beispielsweise können sie Einkommenssteuern isoliert untersuchen, Verbrauchssteuern jedoch ausschließen.



Salesforce schlägt ML-Algorithmen zur Lösung dieser Probleme vor und hat ein Framework veröffentlicht , das verstärktes Lernen und Wirtschaftsmodellierung verwendet, um neue Wirtschaftspolitiken auf der Grundlage von Daten schnell zu entwerfen und zu bewerten.



ScaNN



Es ist nicht schwierig, auch nur eine große Datenbank von Artikeln mit Abfragen zu durchsuchen, die eine genaue Übereinstimmung des Titels oder Autors erfordern, da solche Parameter leicht indiziert werden können. Bei abstrakteren Abfragen können Sie sich nicht mehr auf Ähnlichkeitsmetriken wie die Anzahl der gemeinsamen Wörter zwischen zwei Phrasen verlassen. Bei der Abfrage "Science Fiction" geht es beispielsweise mehr um "Zukunft" als um "Wissenschaft", obwohl die zweite Abfrage ein Wort enthält, das mit der Abfrage übereinstimmt.



Modelle für maschinelles Lernen verstehen die Sprache sehr gut und können Eingaben in Einbettungen umwandeln, Vektordarstellungen von Wörtern, die darauf trainiert sind, ähnliche Eingaben in Clustern zu kombinieren. Google hat ein Open-Source- Ähnlichkeitssuchwerkzeug für solche Vektoren eingeführt.







Menschen aus einem Bild neu rendern



Das erneute Rendern einer Person basierend auf einem einzelnen Bild ist eine schwierige Aufgabe. Moderne Algorithmen erzeugen häufig Artefakte wie unrealistische Verzerrungen von Körperteilen und Kleidung.

Diese Studie zeigt einen neuen Algorithmus, mit dem Menschen durch erneutes Rendern von Texturen neue Kleidung anziehen können. Es zeigt Haltung und Körperform in einem parametrischen Raster, das aus einem einzigen Bild rekonstruiert und leicht geändert werden kann. Anstelle von Farb-UV-Karten schlagen die Ersteller vor, Attributkarten zu verwenden, um das Erscheinungsbild zu codieren. Bisher ist die Qualität schwach und es gibt keine Quellen, aber Sie können sich bereits vorstellen, wie diese Technologie bald im E-Commerce angewendet wird.



Bonus: im Mai haben wir erzähltüber den Algorithmus, der die Tiefe der Bilder im Video bestimmt, aber dann war es möglich, nur die Videodemonstration auszuwerten, jetzt ist der Quellcode des Projekts verfügbar geworden .



Das ist alles, danke für Ihre Aufmerksamkeit!



All Articles