Das Finden von Mustern und Reduzierung von Rauschen in großen, komplexen Datensätzen, die durch die Gravitationswellen-Erdeckungs-Ligo-Einrichtung erzeugt wurden, wurde dank der Arbeit von Wissenschaftlern an der University of California, Riverside, leichter.
Die UCR-Forscher präsentierten ein Papier in einem kürzlich durchgeführten IEEE-Workshop mit Big-Data-Workshop, in dem ein neuer, unbeaufsichtigtes maschinelles Lernansatz demonstriert ist, um neue Muster in den Hilfskanaldaten des Laser-Interferometer-Gravitationswellen-Observatoriums oder Ligo zu finden. Die Technologie gilt möglicherweise auch für Partikelbeschleunigerexperimente mit großem Maßstab und große komplexe industrielle Systeme.
Ligo ist eine Einrichtung, die Gravitationswellen erkennt – vorübergehende Störungen im Stoff der Raumzeit selbst, die durch die Beschleunigung massiver Körper erzeugt werden. Es war das erste, das solche Wellen aus der Verschmelzung von schwarzen Löchern erkannte, was einen wichtigen Teil von Einsteins Relativitätstheorie bestätigte. Ligo verfügt über zwei weit verbreitete 4 km lange Interferometer-in Hanford, Washington, und Livingston, Louisiana-, die zusammenarbeiten, um Gravitationswellen durch Einsatz von Laserstrahlen mit hohen Leistungen zu erkennen. Die Entdeckungen, die diese Detektoren bieten, bieten eine neue Möglichkeit, das Universum zu beobachten und Fragen zur Natur von Schwarzen Löchern, Kosmologie und den dichtesten Materiezuständen im Universum zu beantworten.
Jeder der beiden LIGO -Detektoren zeichnet Tausende von Datenströmen oder Kanälen auf, die die Ausgabe von Umgebungssensoren an den Detektorstellen ausmachen.
„Der Ansatz für maschinelles Lernen, den wir in enger Zusammenarbeit mit Ligo -Kommissaren und Stakeholdern entwickelt haben, identifiziert Muster in Daten allein“, sagte Jonathan Richardson, Assistenzprofessor für Physik und Astronomie, der die UCR -Ligo -Gruppe leitet. „Wir stellen fest, dass es den Operatoren an den Ligo -Detektorstellen, die den Operatoren an den Ligo -Detektorstandorten sehr gut bekannt sind Leiten Sie zukünftige Verbesserungen an den Detektoren. „
Richardson erklärte, dass die LIGO -Detektoren extrem empfindlich gegenüber einer externen Störung reagieren. Bodenbewegung und jede Art von Schwingungsbewegung – vom Wind bis zur Ozeanwellen, die die Küste von Grönland oder Pazifik treffen – kann die Empfindlichkeit des Experiments und die Datenqualität beeinflussen, was zu „Störungen“ oder Perioden erhöhter Rausch -Bursts führt, sagte er.
„Die Überwachung der Umgebungsbedingungen wird an den Standorten kontinuierlich durchgeführt“, sagte er. „Ligo hat mehr als 100.000 Hilfskanäle mit Seismometern und Beschleunigungsmetern, die die Umgebung spüren, in der sich die Interferometer befinden Kuratierte Erfassungskanäle. „
Vagelis Papalexakis, Associate Professor für Informatik und Ingenieurwesen, der den Ross Family Chair in Informatik innehat, präsentierte das Team des Teams mit dem Titel „Multivariate Time Series Clustering für die Charakterisierung der Umweltstaat Internationaler Workshop zu Big Data & KI -Tools, Modellen und Anwendungsfällen für innovative wissenschaftliche Entdeckungen, die letzten Monat in Washington, DC, stattfand
„Die Art und Weise, wie unser maschinelles Lernansatz funktioniert, ist, dass wir ein Modell mit der Identifizierung von Mustern in einem Datensatz aufnehmen und das Modell selbst Muster finden lassen“, sagte Papalexakis. „Das Tool war in der Lage, dieselben Muster zu identifizieren, die den physikalisch aussagekräftigen Umweltzuständen, die den menschlichen Betreibern und Kommissaren an den Ligo -Standorten bereits bekannt sind, sehr genau entsprechen.“
Papalexakis fügte hinzu, dass das Team mit der LIGO Scientific Collaboration zusammengearbeitet hatte, um die Veröffentlichung eines sehr großen Datensatzes zu sichern, der sich auf die in der Forschungsarbeit gemeldete Analyse bezieht. Diese Datenveröffentlichung ermöglicht es der Forschungsgemeinschaft, nicht nur die Ergebnisse des Teams zu validieren, sondern auch neue Algorithmen zu entwickeln, die versuchen, Muster in den Daten zu identifizieren.
„Wir haben einen faszinierenden Zusammenhang zwischen externen Umweltrauschen und dem Vorhandensein bestimmter Arten von Störungen identifiziert, die die Qualität der Daten korrumpieren“, sagte Papalexakis. „Diese Entdeckung hat das Potenzial, das Auftreten solcher Rauschen zu beseitigen oder zu verhindern.“
Das Team organisierte und arbeitete etwa ein Jahr lang alle Ligo -Kanäle durch. Richardson stellte fest, dass die Datenveröffentlichung ein großes Unterfangen war.
„Unser Team leitete diese Veröffentlichung im Namen der gesamten wissenschaftlichen Zusammenarbeit von Ligo, die etwa 3.200 Mitglieder hat“, sagte er. „Dies ist der erste dieser speziellen Arten von Datensätzen, und wir glauben, dass es sich um einen großen Einfluss auf das maschinelle Lernen und die Informatikgemeinschaft auswirken wird.“
Richardson erklärte, dass das Tool, das das Team entwickelt hat, von Signalen zahlreicher heterogener Sensoren aufnehmen kann, die unterschiedliche Störungen rund um die Ligo -Standorte messen. Das Tool kann die Informationen in einen einzelnen Zustand intillieren, sagte er, der dann verwendet werden kann, um nach Zeitreihen Assoziationen zu suchen, wenn Geräuschprobleme in den LIGO -Detektoren aufgetreten sind und sie zu diesen Zeiten mit den Umgebungszuständen der Standorte korrelieren.
„Wenn Sie die Muster identifizieren können, können Sie beispielsweise physische Änderungen am Detektor vornehmen – ersetzen Sie Komponenten“, sagte er. „Die Hoffnung ist, dass unser Werkzeug Licht auf physikalische Geräuschkopplungswege leuchten kann, die es ermöglichen, umsetzbare experimentelle Änderungen an die Ligo-Detektoren vorzunehmen. Unser langfristiges Ziel ist es, dass dieses Tool zur Erkennung neuer Assoziationen und neuen Formen der Umwelt verwendet wird Zustände, die mit unbekannten Rauschproblemen in den Interferometern verbunden sind. „
Pooyan Goodarzi, ein Doktorand, der mit Richardson und einem Co -Autor auf dem Papier arbeitete, betonte, wie wichtig es ist, den Datensatz öffentlich zu veröffentlichen.
„Typischerweise sind solche Daten in der Regel proprietär“, sagte er. „Wir haben trotzdem geschafft, einen groß angelegten Datensatz zu veröffentlichen, von dem wir hoffen, dass er zu einer interdisziplinären Forschung in Datenwissenschaft und maschinellem Lernen führt.“
Die Forschung des Teams wurde durch ein Stipendium der National Science Foundation unterstützt, das durch ein spezielles Programm vergeben wurde und die Entdeckung mit KI-angetriebenen Tools förderte und sich darauf konzentrierte, künstliche Intelligenz/maschinelle Lernen anzuwenden, um Probleme in den physischen Wissenschaften anzugehen.
Richardson, Papalexakis und Goodarzi wurden von Rutuja Gurav, einem Doktorandenstudent, der mit Papalexakis zusammenarbeitete, in die Forschung begleitet. Isaac Kelly, ein Student der Sommer -Studenten; Anamaria -Effler des Ligo Livingston Observatory; und Barry Barish, ein UCR -angesehener Professor für Physik und Astronomie.