Рет қаралды 179
media.ccc.de/v...
Vorhersage des Einsatzaufkommens mit Keras und TensorFlow
Im Notfall muss ein Rettungsdienst innerhalb weniger Minuten am Einsatzort eintreffen. Eine ausreichende Anzahl an Rettungsmitteln (Fahrzeuge und Besatzung) sind bereitzustellen, um dies immer und unter allen Umständen zu gewährleisten. Eine Leitstelle schätzt den Bedarf anhand von Erfahrungswerten ab. Weicht das reale Einsatzaufkommen von der Planung ab, schließt sie auftretende Lücken durch das Verlegen von Einsatzmitteln. In einem Forschungsprojekt der IABG wird untersucht, ob eine Vorhersage des Einsatzaufkommens mittels Künstlicher Intelligenz möglich ist. Das Ziel ist die Planung zu optimieren, um so die Anzahl an Verlege-Fahrten zu reduzieren, knappe Ressourcen einzusparen und ohne Hilfsfristen zu überschreiten. Die Umsetzung erfolgt mit Keras und TensorFlow.
Motivation
Die IABG berät Leitstellen und Lagezentren zum Einsatz moderner IT. Um bestehende Prozesse zu verbessern, forscht die IABG unter anderem zum Einsatz von Künstlicher Intelligenz zur Vorhersage von Einsatzaufkommen und -Verteilungen sowie zur Unterstützung von Standortplanungen.
Grundlagen
Rettungsdienste müssen innerhalb einer bestimmten Hilfsfrist nach dem Eingehen eines Notrufes am Einsatzort eintreffen. Diese Frist ist abhängig von der Besiedlungsdichte (Stadt oder Land) sowie dem Bundesland. Ein typischer Wert für dünn besiedelte Gebiete ist beispielsweise innerhalb von 10 Minuten in 90% der Fälle. Da die verfügbaren Einsatzmittel (Fahrzeuge und Personal) stets ein rares Gut sind, ist es wichtig sparsam zu planen, ohne die Hilfsfrist zu überschreiten. Das Leitstellenpersonal schätzt basierend auf Erfahrungen das Einsatzaufkommen anhand der Wettervorhersage, Jahreszeit, Wochentag, Tageszeit, Veranstaltungen und Sonderlagen. Stimmt die Planung nicht mit dem realen Einsatzaufkommen überein, bleiben entweder wertvolle Ressourcen ungenutzt oder Einsätze sind nur mit Mehraufwand durchzuführen.
Eingesetzte Tools
Zur schnellen Umsetzung und Entwicklung von Prototypen nutzen wir eine große Anzahl an Open-Source-Bibliotheken, unter anderem:
• Pandas ist eine beliebte Open-Source-Datenmanipulationsbibliothek für Python. Es bietet eine flexible und effiziente Möglichkeit, mit strukturierten Daten wie Tabellen und Zeitreihen zu arbeiten.
• NumPy nutzen wir für numerische Berechnungen. Es bietet eine leistungsstarke und effiziente Möglichkeit, mit Matrizen zu arbeiten, und ermöglicht eine schnelle Berechnung und Bearbeitung großer Datensätze.
• TensorFlow ist eine Bibliothek für den Aufbau, das Training und das Bereitstellen von Machine-Learning-Modellen, einschließlich Deep-Neural-Networks. Es bietet viel Flexibilität und Kontrolle über die zugrunde liegenden Berechnungen und ermöglicht es Benutzern, benutzerdefinierte komplexe Architekturen zu erstellen und die Leistung zu optimieren.
• Keras ist eine High-Level-API, die auf Backend-Engines wie TensorFlow aufsetzt und die Modellierung, Training und Bereitstellen von Machine-Learning erheblich erleichtert.
• scikit-learn ist eine weitere High-Level API für Machine-Learning, die hauptsächlich klassische bzw. typische und erprobte Algorithmen bereitstellt.
• Scipy und CVXOPT bieten eine große Auswahl an Werkzeugen im Bereich der Optimierung.
Analyse der Daten
Trainingsdaten sind die Einsatzdaten aus der Vergangenheit, die im Einsatzleitsystem jeder Leitstelle dokumentiert sind. Zusätzlich werden Wetterdaten, Wetterwarnungen und andere für die Prognose relevanten Daten einbezogen. So haben auch Daten zu Großveranstaltungen wie zum Beispiel Fußballspiele oder Open-Air Events in der Regel Auswirkungen auf das Einsatzaufkommen.
Aufbereiten der Daten
Zeitreihendaten enthalten oft fehlende/falsche Werte und Ausreißer. Diese Probleme sind zu identifizieren und zu beseitigen. Die Visualisierung der Daten stellt einen essenziellen Bestandteil der Zeitreihenanalyse dar. Sie dient der Erkennung von Mustern, Trends und Anomalien in den Daten. Darüber hinaus erlaubt sie die Bewertung der Relevanz einzelner Eingabeparameter, auch bekannt als Features. Bei der Vorhersage des Einsatzaufkommens stellt sich beispielsweise die Frage, welche der gegebenen Feature relevant für unsere Prognosen sind. Diese Überlegungen tragen maßgeblich zur Erklärbarkeit des Modells bei, indem sie ein Verständnis dafür schaffen, wie ein bestimmtes Feature die Vorhersage beeinflusst. Zusätzlich helfen eventuell weitere Features, wie beispielsweise die "gefühlte Temperatur" anstelle der bloßen Temperatur und relativen Feuchte das Modell zu verbessern. Alternative Datenquellen (z.B. Wetterdienst) sind ein weiteres Hilfsmittel Trends noch besser zu erklären.
Trainieren
Erfasst man Features über die Zeit, spricht man ganz allgemein von Zeitreihen. Beispielsweise ist das Einsatzaufkommen über die Zeit eine solche Zeitreihe. Beim Einsatzaufkommen im Rettungsdienst wird