Wenn Sie kein Physiker oder Ingenieur sind, haben Sie keinen besonderen Grund, über partielle Differentialgleichungen Bescheid zu wissen. Und nach vielen Jahren in der Graduiertenschule, als ich Maschinenbau studierte, habe ich sie seitdem nicht mehr im wirklichen Leben benutzt.
Aber solche Gleichungen (im Folgenden verwenden wir der Einfachheit halber die englische Abkürzung PDE) haben ihre eigene Magie. Dies ist eine Kategorie mathematischer Gleichungen, die wirklich gut darin sind, Änderungen in Raum und Zeit zu beschreiben, und daher sehr praktisch für die Beschreibung physikalischer Phänomene in unserem Universum sind. Sie können verwendet werden, um alles zu modellieren, von Planetenbahnen bis hin zu Plattentektonik und Luftturbulenzen, die den Flug stören, was es uns wiederum ermöglicht, nützliche Dinge zu tun, wie beispielsweise die Vorhersage seismischer Aktivitäten und die Entwicklung sicherer Flugzeuge.
Der Haken ist, dass PDEs bekanntermaßen schwer zu lösen sind. Und hier wird die Bedeutung des Wortes "Entscheidung" vielleicht besser veranschaulicht. Sie versuchen beispielsweise, Luftturbulenzen zu simulieren, um ein neues Flugzeugdesign zu testen. Es gibt eine bekannte PDE namens Navier-Stokes-Gleichung, mit der die Bewegung einer Flüssigkeit beschrieben wird. Durch Lösen der Navier-Stokes-Gleichung können Sie jederzeit einen "Schnappschuss" der Luftbewegung (Windverhältnisse) machen und simulieren, wie sie sich weiter bewegt oder wie sie sich zuvor bewegt hat.
Diese Berechnungen sind sehr komplex und rechenintensiv, daher verlassen sich Disziplinen, die sich mit vielen PDEs befassen, häufig auf Supercomputer, um mathematische Berechnungen durchzuführen. Aus diesem Grund interessieren sich KI-Profis besonders für diese Gleichungen. Wenn wir Deep Learning nutzen könnten, um die Lösung zu beschleunigen, könnte dies in Forschung und Technik viele Vorteile bringen.
Koltech-Forscher führen neue Deep-Learning- Technik einPDE zu lösen, die wesentlich genauer ist als die zuvor entwickelten Deep-Learning-Methoden. Die Methode ist auch so verallgemeinert, dass ganze PDE-Familien wie die Navier-Stokes-Gleichung für jede Art von Flüssigkeit gelöst werden können, ohne dass ein neues Training erforderlich ist. Schließlich ist es 1000-mal schneller als herkömmliche mathematische Formeln, wodurch die Abhängigkeit von Supercomputern verringert und die Rechenleistung der Problemmodellierung noch weiter erhöht wird. Und das ist gut. Gib zwei!
Hammertime
[ca. übers. - Untertitel - eine Anspielung auf "U Can't Touch This" von Rapper MC Hammer]
Bevor wir uns mit der Vorgehensweise der Forscher befassen, wollen wir zunächst die Ergebnisse bewerten. Das GIF unten zeigt eine beeindruckende Demo. Die erste Spalte zeigt zwei Schnappschüsse der Flüssigkeitsbewegung. Die zweite Spalte zeigt, wie sich die Flüssigkeit tatsächlich weiter bewegte. und die dritte Spalte zeigt die Vorhersage des neuronalen Netzwerks. Grundsätzlich sieht es identisch mit dem zweiten aus.
Der Artikel machte viel Lärm auf Twitter und sogar Rapper MC Hammer repost.
Aber kehren wir zurück zu dem, wie Wissenschaftler dies erreicht haben.
Wenn die Funktion passt
Das erste, was zu verstehen ist, ist, dass neuronale Netze im Grunde genommen Approximatoren sind. Wenn sie auf einer Reihe von Ein- und Ausgängen trainieren, bewerten sie tatsächlich eine Funktion oder eine Reihe von mathematischen Operationen, die Daten in andere übersetzen. Betrachten Sie einen Katzendetektor. Sie trainieren das neuronale Netzwerk, indem Sie ihm viele Bilder von Katzen und anderen Bildern zuführen und die Gruppen als 1 und 0 markieren. Dann sucht das neuronale Netzwerk nach der besten Funktion, die jedes Bild der Katze in 1 und die Bilder von allem anderen in 0 konvertiert. Das Netzwerk kann also das Bild und betrachten Sagen Sie, ob eine Katze darauf ist. Sie verwendet die gefundene Funktion, um ihre Antwort zu berechnen. Wenn das Training erfolgreich war, ist die Erkennung in den meisten Fällen korrekt.
Praktischerweise ist die Funktionsnäherung genau das, was wir zum Lösen von PDE benötigen. Letztendlich müssen Sie eine Funktion finden, die beispielsweise die Bewegung von Luftpartikeln in Raum und Zeit am besten beschreibt.
Dies ist die Essenz der Arbeit. Neuronale Netze werden normalerweise trainiert, um Funktionen zwischen Ein- und Ausgängen zu approximieren, die im euklidischen Raum definiert sind. Dies ist ein klassischer Graph mit den x-, y- und z-Achsen. Diesmal beschlossen die Forscher jedoch, die Ein- und Ausgänge im Fourierraum zu definieren - einem speziellen Raumtyp zum Zeichnen von Wellenfrequenzen. Tatsache ist, dass so etwas wie Luftbewegung tatsächlich als eine Kombination von Wellen beschrieben werden kann, sagt Anima Anandkumar, Professorin an der University of California, die zusammen mit ihren Kollegen, den Professoren Andrew Stewart und Kaushik Bhattacharya, die Forschung leitete. Die allgemeine Windrichtung auf Makroebene ähnelt der Niederfrequenz mit sehr langen, trägen Wellen, während die auf Mikroebene erzeugten kleinen Wirbel hohen Frequenzen mit sehr kurzen und schnellen Wellen ähneln.
Warum ist das so wichtig? Weil es viel einfacher ist, die Fourier-Funktion im Fourier-Raum zu approximieren, als mit PDE im euklidischen Raum umzugehen. Dieser Ansatz vereinfacht die Arbeit des neuronalen Netzwerks erheblich. Dies ist auch eine Garantie für signifikante Verbesserungen der Genauigkeit: Zusätzlich zu dem enormen Geschwindigkeitsvorteil gegenüber herkömmlichen Methoden reduziert die neue Methode die Fehlerrate bei der Lösung von Navier-Stokes-Problemen um 30% im Vergleich zu früheren Methoden des Deep Learning.
Dies ist alles sehr vernünftig, und außerdem kann die Methode verallgemeinern. Frühere Methoden des Tiefenlernens müssen für jede Art von Flüssigkeit separat trainiert werden. Bei dieser Methode reicht eine Schulung aus, um mit allen Flüssigkeiten fertig zu werden, was durch die Experimente der Forscher bestätigt wird. Obwohl sie noch nicht versucht haben, den Ansatz auf andere Medien auszudehnen, sollte die Methode auch in der Lage sein, mit der Erdkruste zu arbeiten, wenn seismisch bedingte PDEs oder Materialtypen gelöst werden, wenn wärmeleitfähigkeitsbezogene PDEs gelöst werden.
Supersimulation
Die Fakultät und ihre Doktoranden haben diese Forschung nicht nur zum Vergnügen der Theorien durchgeführt. Sie wollen KI in neue wissenschaftliche Disziplinen bringen. Dank Gesprächen mit Mitarbeitern verschiedener Profile aus den Bereichen Klimatologie, Seismologie und Materialwissenschaften konnte Anandkumar als erste gemeinsam mit ihren Kollegen und Studenten das PDE-Problem lösen. Sie arbeiten nun daran, die Methode mit Kollegen von Coltech und Lawrence Berkeley National Laboratory in die Praxis umzusetzen.
Eines der Forschungsthemen, die Anandkumar besonders beschäftigen, ist der Klimawandel. Die Navier-Stokes-Gleichung eignet sich nicht nur zur Simulation von Luftturbulenzen. Diese Gleichung wird auch bei der Wettermodellierung verwendet. "Gute, genaue globale Wettervorhersagen sind eine Herausforderung", sagt sie, "und selbst auf den größten Supercomputern können wir heute keine globalen Vorhersagen treffen." Wenn wir also eine neue Methode verwenden können, um die gesamte Arbeit zu beschleunigen, hat dies enorme Auswirkungen.
"Es gibt viele, viele andere Anwendungen der Methode", fügt sie hinzu. "In diesem Sinne gibt es keine Grenzen, denn wir haben einen gemeinsamen Weg, um die Arbeit mit all diesen Anwendungen zu beschleunigen."
Jetzt kann künstliche Intelligenz die Diffusion lösen. Wie geht es weiter? Vielleicht sind Sie einer von denen, die ihm beibringen, wie man noch komplexere Probleme löst. Gerne
helfen wir Ihnen dabei mit einem speziellen Promo-Code HABR , der den Banner-Rabatt um 10% erhöht .
- Kurs "Mathematik und maschinelles Lernen für Data Science"
- Kurs für maschinelles Lernen
- Fortgeschrittenenkurs "Maschinelles Lernen Pro + Deep Learning"
- Data Science Berufsausbildung
- Data Analyst-Schulung
- Data Analytics Online Bootcamp
Weitere Kurse
empfohlene Artikel
- So werden Sie Data Scientist ohne Online-Kurse
- 450 kostenlose Kurse aus der Ivy League
- Wie man 9 Monate hintereinander 5 Tage die Woche maschinelles Lernen lernt
- Wie viel Datenanalysten verdienen: Überblick über Gehälter und offene Stellen in Russland und im Ausland im Jahr 2020
- Maschinelles Lernen und Computer Vision im Bergbau