Schneller Nachweis von Supernovae mithilfe neuronaler Netze

Hallo Habr! Ich möchte Ihnen eine Übersetzung (leicht angepasst) des ausgezeichneten Artikels "Schnelle Erkennung von Supernovae mithilfe neuronaler Netze" von Rodrigo Carrasco-Davis vom Institut für Astrophysik in Chile vorstellen.



Ein bisschen Hintergrund



Astronomie ist das Studium von Himmelsobjekten: Sternen, Galaxien oder Schwarzen Löchern. Diese Untersuchung von Himmelsobjekten ähnelt der Arbeit im Labor für "Naturphysik". Darin finden die unglaublichsten, extremsten natürlichen Prozesse statt, die auf der Erde größtenteils nicht wiederholt werden können. Beobachtungen dieser Prozesse ermöglichen es uns, ein tieferes Verständnis der Welt zu erlangen, das vorhandene Wissen über Physik zu überprüfen und die etablierten Konzepte mit dem zu vergleichen, was wir im Universum beobachten.



Es gibt eine besondere Art von Veranstaltung, die für Astronomen von großem Interesse ist. Es passiert am Ende des Lebens massereicher Sterne. Sie bestehen aus Wasserstoff, der durch die Schwerkraft zum Zentrum gezogen wird. Und wenn die Dichte hoch genug wird, beginnen Wasserstoffatome zu verschmelzen. Dies führt zum Auftreten eines Glühens und zum Auftreten neuer chemischer Elemente: Helium, Kohlenstoff, Sauerstoff, Neon usw. Der Verschmelzungsprozess findet unter Innendruck statt, während die Schwerkraft einen Außendruck ausübt, wodurch die Stabilität des Sterns erhalten bleibt, während er sich selbst ausbrennt. Je massereicher der Stern ist, desto höher sind seine Temperaturen und desto schneller verbrennt er Kernbrennstoff.



Allmählich geht der Synthesevorgang zu schwereren Elementen über: zu Magnesium, Silizium, Schwefel und schließlich zu Eisen, Kobalt und Nickel. Die Synthese weiterer Elemente würde mehr Energie erfordern, als während der Reaktion freigesetzt wird, so dass der Kern zusammenbricht und eine Supernova-Explosion auftritt.





Krebsnebel , Supernova-Überrest



Dieser Prozess ist für Astronomen sehr wichtig. Aufgrund der extremen Bedingungen während der Explosion können Astronomen die Synthese schwerer Elemente beobachten, das Verhalten von Materie unter starkem Druck und hoher Temperatur überprüfen und das Explosionsprodukt beobachten, bei dem es sich um einen Neutronenstern oder ein Schwarzes Loch handeln kann.



Supernovae können auch als Standardkerzen verwendet werden. Ein häufiges Problem in der Astronomie: Entfernungen zu Himmelsobjekten messen. Da Sterne so weit von der Erde entfernt sind, ist es schwierig festzustellen, ob ein Stern schwach und nahe bei uns oder sehr weit entfernt und sehr hell ist. Die meisten Supernova-Explosionen im Universum finden auf die gleiche Weise statt, weshalb Astronomen Supernovae verwenden, um Entfernungen zu messen. Dies ist wichtig, wenn beispielsweise die Expansion des Universums und die Dunkle Energie untersucht werden .



Trotz der Tatsache, dass Supernova-Explosionen sehr hell sind, sind sie aufgrund ihrer Entfernung von der Erde, ihrer geringen Häufigkeit (etwa eine Supernova pro Galaxie pro Jahrhundert) und der kurzfristigen Natur der Explosion, die mehrere Tage bis zu einem Paar dauern kann, schwer zu bemerken Wochen. Um nützliche Informationen von einer Supernova zu erhalten, muss außerdem ein Spektrograph erstellt werden (zur Messung der Energie, die während einer Explosion bei mehreren Frequenzen emittiert wird). Es wäre auch gut, den Stern im Voraus zu beobachten, da viele interessante physikalische Prozesse innerhalb von Stunden nach der Explosion stattfinden. Stellen Sie sich nun die Frage: Wie können wir diese Supernova-Explosionen unter all den anderen beobachtbaren astronomischen Objekten im Universum schnell finden?



Astronomie heute



Vor einigen Jahrzehnten musste ein Astronom ein bestimmtes Objekt auswählen und ein Teleskop darauf richten, um die benötigten Informationen zu erhalten. Moderne Teleskope wie die Zwicky Transient Facility (ZTF) oder das Vera Rubin Observatory erfassen qualitativ hochwertige Bilder des Himmels mit sehr hoher Geschwindigkeit und sammeln alle drei Tage Daten am sichtbaren Himmel. Das ZTF-Teleskop generiert 1,4 TB Daten pro Nacht und identifiziert und sendet in Echtzeit Informationen über interessante sich ändernde Objekte am Himmel.



Wenn etwas seine Helligkeit ändert, bemerken "intelligente" Teleskope dies und senden einen Warnalarm. Die Warnung wird durch Senden eines Datenstroms erreicht, in dem jede Nachricht aus drei zugeschnittenen Bildern mit einer Größe von 63 x 63 Pixel besteht. Diese drei Bilder werden als wissenschaftlich, Referenz und Differential bezeichnet.



Eine wissenschaftliche Bilddatei ist die jüngste Beobachtung eines bestimmten Gebiets. Mit Bezug - was war zu Beginn der Beobachtungen. Alles, was sich zwischen dem ersten und dem zweiten Bild geändert hat, ist im dritten Unterschied zu sehen. Das berüchtigte Teleskop sendet bis zu einer Million Warnungen pro Nacht, häufiger jedoch mehrere Tausend. Angenommen, eine Person möchte jede Warnung manuell überprüfen. Es dauert ungefähr 3,5 Tage, bis alle Warnungen in einer Nacht angezeigt werden.





Wissenschafts-, Referenz- und Differenzbilder. Ergänzt mit anderen wichtigen Daten wie Beobachtungsbedingungen und Informationen zum Objekt. Das vierte Bild ist eine Farbversion von PanSTARRS mit dem Aladin Sky Atlas . In der ALeRCE- Oberfläche können Sie die vollständige Entwicklung der Supernova-Helligkeit im Laufe der Zeit verfolgen .



Da diese Warnungen alles kommunizieren, was sich am Himmel ändert, ist es wichtig, Supernovae im gesamten vom Teleskop erzeugten Informationsstrom erkennen zu können. Das Problem ist, dass auch andere astronomische Objekte einen Alarm auslösen können. Zum Beispiel ändern variable Sterne ihre Helligkeit, aktive galaktische KerneAsteroiden. Es gibt auch falsche Warnungen. Glücklicherweise weisen Wissenschafts-, Referenz- und Differenzbilder eine Reihe von Unterscheidungsmerkmalen auf, mit deren Hilfe festgestellt werden kann, um was es sich bei einer Warnung um eine Supernova oder ein anderes Objekt handelt. Und es wäre großartig zu lernen, wie man effektiv zwischen den Hauptklassen von Warnungen unterscheidet.





Fünf Klassen astronomischer Objekte



Daher befinden sich aktive galaktische Kerne normalerweise im Zentrum von Galaxien. Supernovae entstehen normalerweise in der Nähe der Wirtsgalaxie. Asteroiden werden in der Nähe des Sonnensystems beobachtet und sind im Referenzbild nicht sichtbar. Variable Sterne finden sich in Bildern, die mit anderen Sternen gefüllt sind, da sie sich hauptsächlich in der Milchstraße befinden. Fehlalarme treten aus verschiedenen Gründen auf: Fehlen von Pixeln in der Teleskopkamera, schlechte Subtraktion beim Erstellen eines Differenzbilds, kosmische Strahlung usw. Wie ich bereits sagte, ist es einem Menschen nicht möglich, jede Warnung manuell zu überprüfen. Daher war eine automatische Klassifizierung erforderlich, damit Astronomen die interessantesten Daten finden konnten, die eher Informationen über Supernovae enthalten.



Suche nach Supernovae mithilfe neuronaler Netze



Da wir die Unterschiede zwischen den Bildern der fünf oben genannten Klassen grob verstehen, können wir versuchen, bestimmte Merkmale zu berechnen, um sie korrekt zu klassifizieren. Manuelle Arbeit ist jedoch schwierig und erfordert eine lange Zeit des Versuchs und Irrtums. Daher wurde beschlossen, ein Faltungs-Neuronales Netzwerk (CNN) zu trainieren , um das Klassifizierungsproblem zu lösen und Supernovae schnell zu erkennen.



Um die Invarianz des neuronalen Netzwerks sicherzustellen, wird eine um 90 ° gedrehte Kopie jedes Bildes im Trainingssatz erstellt. Danach wird der Durchschnittswert jeder gedrehten Version des Bildes geladen. Die Verwendung der Invarianz ist wichtig, da es keine bestimmte Ausrichtung gibt, in der Strukturen in Bildern angezeigt werden können, die in Warnungen gesendet werden.



Die Wissenschaftler fügten auch einige der in der Warnung enthaltenen Metadaten hinzu, z. B. die Position in den Koordinaten des Himmels, die Entfernung zu anderen bekannten Objekten und Metriken der atmosphärischen Bedingungen. Nach dem Training des Modells mit Kreuzentropie konzentriert sich die Wahrscheinlichkeit, dass die Warnung Informationen über eine Supernova enthält, auf die Werte 0 oder 1. Richtig, der Klassifikator hat manchmal Fehler in der vorhergesagten Klasse gemacht. Es ist nicht sehr praktisch, dass der Forscher die Daten nach möglichen Supernovae zusätzlich filtern muss, nachdem der Computer eine Vorhersage gemacht hat.



Um die Entropie der Vorhersage zu maximieren und die Werte der Ausgangswahrscheinlichkeiten zu verteilen, fügten die Wissenschaftler dem neuronalen Netzwerk zusätzliche Informationen hinzu. Dies ermöglichte es, die Details oder die Klarheit von Prognosen zu verbessern und Wahrscheinlichkeiten im gesamten Bereich von 0 bis 1 und nicht nur die Extremwerte dieser Indikatoren zu erhalten. Das Ergebnis sind viel bequemer interpretierbare Vorhersagen, die es dem Astronomen ermöglichen, stehende Supernova-Kandidaten auszuwählen.





Faltungs-Neuronales Netzwerk mit erhöhter Rotationsinvarianz. Gedrehte Kopien werden erstellt und an dieselbe neuronale Netzwerkarchitektur übergeben, um dann den mittleren Pool in einer dichten Schicht anzuwenden, bevor sie mit Metadaten kombiniert werden.



Wissenschaftler durchquerten das neuronale Netzwerk etwa 400.000 Objekte, die gleichmäßig im Raum über die gesamte Abdeckung des ZTF-Teleskops verteilt waren, um die Richtigkeit der Vorhersagen des Modells zu überprüfen. Es stellte sich heraus, dass jede vom neuronalen Netzwerk vorhergesagte Klasse räumlich verteilt ist. Dies ist sinnvoll, wenn Sie die Natur jedes astronomischen Objekts berücksichtigen. Beispielsweise befinden sich aktive galaktische Kerne und Supernovae meist außerhalb der Ebene der Milchstraße (extragalaktische Objekte), da es unwahrscheinlich ist, dass aufgrund der Okklusion weitere Objekte durch die Ebene der Milchstraße sichtbar sind. Das Modell sagt weniger Objekte in der Nähe der Ebene der Milchstraße korrekt voraus (galaktische Breiten näher an 0). Variable Sterne werden mit einer höheren Dichte in der galaktischen Ebene korrekt erfasst. Asteroiden befinden sich in der Nähe der Ebene des Sonnensystems.auch Ekliptik genannt (markiert mit einer gelben Linie). Und überall kommen falsche Warnungen vor.



Die Informationen in den Bildern (wissenschaftlich, Referenz und Differenz) reichen aus, um eine gute Klassifizierung im Trainingssatz zu erhalten, aber die Integration von Informationen aus den Metadaten war entscheidend, um die korrekte räumliche Verteilung der Vorhersagen zu erhalten. 





Räumliche Verteilung eines nicht markierten Satzes astronomischer Objekte. Jeder Graph wird in galaktischen Koordinaten angegeben. Der galaktische Breitengrad befindet sich im Zentrum der Milchstraße, sodass Breiten nahe 0 auch näher an der Ebene der Milchstraße liegen. Die galaktische Länge gibt an, wie viel von der Scheibe wir in der Ebene der Milchstraße sehen. Die gelbe Linie repräsentiert die Ebene des Sonnensystems (Ekliptik).



Supernova-Jäger



Über die Weboberfläche des resultierenden Supernova Hunter-Projekts können Astronomen Objekte untersuchen, die vom neuronalen Netzwerk ausgewählt wurden, und sich darauf verlassen, dass es sich um Supernovae handelt. Sie können auch vom Modell vorgenommene Fehlklassifizierungen melden, wodurch neue Informationen zum Trainingssatz hinzugefügt werden können, um die Leistung des neuronalen Netzwerks später zu verbessern.





Supernova Hunter : Benutzeroberfläche zur Suche nach Supernova-Kandidaten. Es zeigt eine Liste von Warnungen mit einer hohen Wahrscheinlichkeit von Supernova-Informationen. Für jedes dieser Bilder werden Objektposition und Metadaten hinzugefügt.



Der Klassifikator für neuronale Netze und Supernova Hunter bestätigten 394 Supernovae und meldeten 3.060 Supernova-Kandidaten auf dem Transient Name ServerVom 26. Juni 2019 bis 21. Juli 2020 wurden durchschnittlich 9,2 Supernova-Kandidaten pro Tag freigelassen. Diese Beobachtungsrate erhöht die Anzahl der verfügbaren Supernovae, die in den frühen Stadien einer Explosion untersucht werden können, dramatisch.



Perspektiven



Jetzt arbeiten die Wissenschaftler hinter Supernova Hunter daran, die Klassifizierungseigenschaften des Modells so zu verbessern, dass es Supernova-Kandidaten genauer identifiziert und weniger menschliche Aufmerksamkeit erfordert. Idealerweise sollte dies ein System sein, das automatisch jeden möglichen Supernova-Kandidaten mit einem hohen Maß an Vertrauen melden kann.



Ein weiterer Arbeitsbereich von Wissenschaftlern ist die Suche nach seltenen Objekten mit Ausreißererkennungsmethoden. Dies ist eine herausfordernde, aber realistische Aufgabe, da neue Teleskope aufgrund der unglaublichen Abtastrate und des Umfangs jeder Beobachtung theoretisch neue Arten von astronomischen Objekten entdecken könnten.



Eine neue Methode zur Analyse großer Mengen astronomischer Daten wird nicht nur nützlich, sondern auch notwendig sein, da die Organisation der Klassifizierung und Umverteilung von Daten ein wichtiger Bestandteil der Wissenschaft ist. Der Einsatz moderner, leistungsstarker Teleskope verändert die Art und Weise, wie Astronomen Himmelsobjekte untersuchen, grundlegend, und Wissenschaftler müssen bereit sein, mit neuen Technologien zu arbeiten.



Vielen Dank für Ihre Aufmerksamkeit! Originalartikel .



All Articles