Wettervorhersage mittels Luftdruck?

Idee

Eine kleine Anekdote vorweg: Bei Inbetriebnahme des eHives in Salzburg (siehe vorheriger Blog-Beitrag) und dem anschließenden Funktionstest aller Sensoren fiel einem in Würzburg (ca. 180 m über Meereshöhe) ansässigen BeeBIT-Mitglied sofort der verdächtig niedrige Luftdruck von nur rund 970 mbar auf. Für Würzburg sind Werte um 1000 mbar typisch. Der Messfehler des in der Wetterstation verbauten Barometers beträgt 1 mbar (siehe Blog-Eintrag vom 20.09.2019). Nach einem kurzen Schreckmoment ob des potentiell defekten Sensors setzte jedoch schnell Erleichterung ein: Selbstverständlich ist für den vergleichsweise niedrigen Luftdruck die Topographie Salzburgs (ca. 425 m über Meereshöhe) verantwortlich. Nach barometrischer Höhenformel sind bei einem Luftdruck von 1013,25 mbar auf Meereshöhe und einer konstanten Temperatur von 15 °C Drücke von 992 mbar (Würzburg) und 963 (Salzburg) zu erwarten. Bei heiterem Wetter sind die gemessenen Werte also vollkommen normal. Tatsächlich ließe sich die barometrische Höhenformel an sämtlichen eHive-Standorten überprüfen, indem der Luftdruck über einen repräsentativen Zeitraum gemittelt und mit dem nach Höhenlage zu erwartenden Wert verglichen wird. Die exponentielle Abhängigkeit zwischen Druck und Höhe ließe sich so sogar ohne Kenntnis der korrekten Formel aus einer grafischen Auftragung von Druck gegen Höhe erahnen. Ein solches Vorgehen soll aber nicht Thema dieses Blog-Beitrags sein.

In den Wintermonaten hat das Bienenvolk die Flug- und Bruttätigkeiten in der Regel vollständig eingestellt. In Form einer sogenannten Wintertraube überdauert das Volk die kalte Jahreszeit. Zwar lassen sich oftmals noch periodische Temperaturanstiege im Stock beobachten, die zum Verflüssigen und dem Verzehr der Honigreserven dienen, doch ansonsten ist den Daten vergleichsweise wenig abzugewinnen. Diese Winterruhe gilt aber selbstverständlich nur für das Bienenvolk; die am eHive montierte Wetterstation sendet weiter interessante Daten, die sich auswerten und interpretieren lassen. Im Folgenden soll versucht werden, einen Zusammenhang zwischen Luftdruck und Sonneneinstrahlung herzustellen. Ausgangspunkt sind die häufig an einfachen Barometern anzutreffenden Wettersymbole (Sonnenschein, Wolken, Regen), die den Zweck dieser Barometer offenbaren: Sie werden zur Vorhersage des Wetters genutzt. Einer einfachen Bildvorstellung folgend zieht ein niedriger Luftdruck Wolken aus umliegenden Regionen an, während ein Hochdruckgebiet die Wolken verdrängt und so für "schönes" Wetter sorgt. Können wir diesen Zusammenhang anhand der eHive-Wetterdaten bestätigen? Falls ja, wie verlässlich ist diese Methode?

Foto: Zifferblatt eines Barometers. Gut erkennbar sind die Symbole zur Vorhersage des Wetters.

Die folgende Untersuchung ist nach den Artikeln vom 20.07.2019 und 22.09.2019 der dritte Beitrag zum Thema Datenanalyse. Erneut wird die Programmiersprache Python3 verwendet, jedoch lassen sich die durchgeführten Rechnungen und grafischen Darstellungen auch in anderen Tools wie z.B. Tabellenkalkulationsprogrammen realisieren. Das verwendete Python-Skript sowie die mittels Diagrammanzeige heruntergeladenen Rohdaten sind am Ende dieses Artikels verlinkt. Im Skript können Sie alle durchgeführten Rechnungen anhand der Programmanweisungen nachvollziehen. Die mathematische Syntax folgt den Spezifikationen der NumPy-Bibliothek.

Datensatz 1: Herbst in Salzburg

Rohdaten im Zeitverlauf

An die obige Anekdote anschließend, werten wir zunächst Daten des eHives in Salzburg kurz nach dessen Inbetriebnahme aus. Im Zeitraum vom 14. bis einschließlich 30. Oktober diesen Jahres wurden die Daten für Luftdruck und Sonneneinstrahlung in der Diagrammanzeige ausgewählt und mittels Klick auf den Download-Button heruntergeladen. Händisch wurden nicht benötigte Daten am Anfang und Ende des Zeitbereichs gelöscht, sodass 17 volle Tage jeweils von 00:00 Uhr bis 23:59 Uhr verbleiben. Alle Zeitangaben beziehen sich auf die lokale Sommerzeit (UTC+2). Entsprechend findet sich im Datensatz der Zeitbereich vom 13.10. 22:00 Uhr bis 30.10. 21:59 Uhr (UTC+0). Die Rohdaten samt Tagesmittelwerten sind in Abb. 1 aufgetragen.

Abb. 1: Luftdruck und Sonneneinstrahlung des eHives AUT-PLU-1 im Zeitbereich vom 14.10.2021 bis 30.10.2021 (einschließlich). Gepunktete vertikale Striche markieren Mitternacht in Ortszeit (UTC+2). Die Tagesmittelwerte für Druck und Sonneneinstrahlung sind als gestrichelte horizontale Linien eingetragen.

Prinzipiell können wir bereits mit Hilfe von Abb. 1 die Arbeitshypothese überprüfen. Auffällig z.B. ist der starke Luftdruckabfall beginnend an Tag 6 des Messzeitraums. Während an diesem Tag die Sonneneinstrahlung noch Werte von bis zu 500 W/m² erreicht (Tagesmittel ca. 70 W/m²), fällt der Maximalwert an Tag 7 auf nur noch rund 200 W/m² (Tagesmittel 20 W/m²). Ein Einbruch in der beobachteten Sonneneinstrahlung deutet auf bewölktes oder gar regnerisches Wetter hin. Das selbe Phänomen unter umgekehrten Voraussetzungen lässt sich von Tag 7 bis 9 erkennen: Während der Luftdruck annährend linear von 955 mbar auf über 980 mbar steigt, lässt sich von Tag 7 auf 8 ein leichter und von Tag 8 auf 9 ein deutlicher Anstieg der Tagesmittelwerte der Sonneneinstrahlung feststellen. Doch ist die Korrelation zwischen Luftdruck und Sonneneinstrahlung tatsächlich so simpel?

Korrelationen erkennen

Von Tag 14 an fällt der Druck nahezu linear von 980 mbar bis auf ca. 960 mbar ab. Trotzdem bleibt die Sonneneinstrahlung nahezu konstant. Die Vermutung liegt nahe, dass der an den Tagen 6 bis 9 beobachtete Effekt nur Zufall war. Um den Grad der Korrelation zwischen den aufgetragenen Messgrößen auch quantitativ erfassen zu können, benötigen wir eine neue Darstellung. Aufbauend auf dem Blog-Beitrag vom 22.09.2019 werden die Datenpunkte beider Messwerte gegeneinander aufgetragen, siehe Abb. 2.

Abb. 2: Korrelation zwischen Luftdruck und Sonneneinstrahlung des eHives AUT-PLU-1 im Zeitbereich vom 14.10.2021 bis 30.10.2021 bei (a) Auftragung der Tagesmittelwerte des selben Tages bzw. bei (b) Autragung der Sonneneinstrahlung gegen den Luftdruck des Vortages. Eine Ausgleichsgerade wurde mit der Methode der kleinsten Fehlerquadrate berechnet und ist gestrichelt gezeichnet. In der Legende findet sich der Wert des Bestimmtheitsmaßes R² der linearen Anpassung. Wird der Mauszeiger über die Abbildung bewegt, werden zusätzliche Datenpunkte für die eHives DEU-DHG-1 und AUT-GSC-1 aus dem gleichen Zeitbereich eingeblendet.

In Abb. 2 wurden sämtliche Luftdruckwerte zur besseren Vergleichbarkeit mit anderen Standorten so normalisiert, dass der Mittelwert über den gesamten Zeitbereich dem auf Meereshöhe zu erwartenden Wert von 1013,25 mbar entspricht. Zwar ließe sich diese Normalisierung auch unter Verwendung der barometrischen Höhenformel durchführen, doch da sich die Luftdruckkurven geografisch naher Standorte (alle Mitteleuropa nördlich der Alpen) bis auf den Höhen-Offset nahezu doppeln, wurde diese Methode gewählt, die ohne weitere Daten wie z.B. exakte Höhe des eHives und des Verlaufs der Außentemperatur auskommt.

Zunächst wurden in Abb. 2a die Tagesmittelwerte von Luftdruck und Sonneneinstrahlung des selben Tages als Kreuze aufgetragen. Eine perfekte lineare Korrelation würde vorliegen, wenn alle Messwerte auf einer Geraden liegen. Unter der Annahme "hoher Luftdruck heißt schönes Wetter", ist für die Gerade eine positive Steigung zu erwarten. Tatsächlich weicht die Form der eingetragenen Messpunkte stark von einer Geraden ab. Mit etwas gutem Willen lässt sich in der Punktwolke eine Konzentration um die von links unten nach rechts oben steigende Diagonale ausmachen, was der Hypothese entspricht. Von einer eindeutigen linearen Korrelation kann aber keine Rede sein. Mit Fantasie ließe sich durch die Punktwolke wohl nahezu jede Art von Kurvenanpassung legen, vgl. diesen hierzu relevanten XKCD-Comic.

Lineare Anpassung und Bestimmtheitsmaß

Um dennoch ein quantitatives Maß für die Güte der Korrelation zu erhalten, wurde mit der Methode der kleinsten Fehlerquadrate eine Ausgleichsgerade berechnet und ebenfalls in Abb. 2a eingetragen. Tatsächlich ergibt sich eine positive Steigung. Aus dem sogenannten Bestimmtheitsmaß R² der linearen Anpassung lässt sich der Grad des funktionellen Zusammenhangs zwischen den untersuchten Messwerten abschätzen. Das Bestimmtheitsmaß nimmt Werte zwischen 0 und 1 an, wobei 0 einer vollständig unkorrelierten Verteilung und 1 einem perfekten linearen Zusammenhang entspricht. Für die Ausgleichsgerade zwischen Luftdruck und Sonneneinstrahlung ergibt sich ein Wert von R²=12,9%. (Für Grenzen und Kritik am Bestimmtheitsmaß zur Abschätzung und zum Auffinden einer Korrelation wird auf den entsprechenden Wikipedia-Eintrag verwiesen. Wir begnügen uns mit dem Hinweis, dass sich ein hoher Wert des Bestimmtheitsmaßes auch aus einer Scheinkorrelation ergeben kann und dass möglicherweise weitere bisher nicht betrachtete Variablen existieren. Eine Aussage über die statistische Signifikanz der Ergebnisse wurde bisher ebenfalls nicht gemacht.)

Der in Abb. 2a gefundene niedrige Wert des Bestimmtheitsmaßes deckt sich mit der Beobachtung, dass die Messwerte stark gestreut im Diagramm vorliegen und sich nur schwer ein Trend erkennen lässt. Selbstverständlich entspricht eine Auftragung der Messwerte des selben Tages wie in Abb. 2a nicht der ursprünglichen Hypothese, nach der mittels Barometer das Wetter vorhergesagt werden kann. Hierfür muss z.B. die Sonneneinstrahlung des Folgetages mit dem aktuellen Luftdruck verglichen werden, siehe Abb. 2b. Es ergibt sich ein ähnliches Bild wie zuvor, jedoch kann eine etwas bessere Konzentration der Messpunkte um die Hauptdiagonale beobachtet werden. Entsprechend höher liegt der berechnete Wert des Bestimmtheitsmaßes R²=21,3%. Aus dem betrachteten Datensatz können wir im Rahmen geringer statistischer Signifikanz schließen, dass der Luftdruck augenscheinlich eher zur Vorhersage der Sonneneinstrahlung des Folgetages als des aktuellen Tages geeignet ist (in Übereinstimmung mit der Ausgangshypothese und der vereinfachten Bildvorstellung angesaugter/verdrängter Wolken). Doch wie verlässlich ist dieser Schluss wirklich? Handelt es sich möglicherweise um einen Zufallstreffer?

Zur Beantwortung dieser Frage wurden zunächst die Wetterdaten zweier weiterer eHives im gleichen Zeitbereich ausgewertet. Die Ergebnisse werden angezeigt, wenn Sie den Mauszeiger über Abb. 2 bewegen. Für beide zusätzlichen eHives wurde analog zum bisherigen Datensatz vorgegangen, einschließlich Normalisierung der Luftdrück-Durchschnittswerte. Wir beobachten nun ein gänzlich anderes Bild: Zwar liegen die R²-Werte in Abb. 2b immernoch höher als in 2a, jedoch fallen die Absolutwerte deutlich niedriger aus. Es ergeben sich sogar Ausgleichsgeraden mit negativer Steigung. Zusätzlich wurde eine Ausgleichsgerade durch die Datenpunkte aller eHives gelegt (schwarz gestrichelt), die mit R²<1% keinen funktionellen Zusammenhang erahnen lässt. Sind Barometer mit aufgemalten Wettersymbolen also Quatsch? Es badarf einer präziseren Analyse.

Zunächst kann festgestellt werden, dass der ausgewählte Zeitbereich Ende Oktober suboptimal ist. Gegen Ende des Jahres nimmt die Sonneneinstrahlung auf natürliche Weise ab. Dieser Effekt wurde nicht kompensiert und sorgt bei ansonsten konstanten Parametern für eine Streuung der Messwerte in vertikaler Richtung. Auch der Umfang des Datensatzes ist mit 17 Tagen sehr klein. Eine statistisch verlässliche Aussage lässt sich so kaum erreichen. Zudem ist die Vorhersage des Wetters bekanntermaßen sehr kompliziert und der Luftdruck ist nur einer von vielen relevanten Parametern. Es wäre denkbar, das Modell zu verbessern, indem z.B. neben dem Luftdruck auch die Luftfeuchte betrachtet wird. Um die vorgestellte Analyse nicht zu stark zu verkomplizieren, beschränken wir uns jedoch weiterhin auf den Luftdruck als einzigen Eingangsparameter und erweitern stattdessen den Zeitbereich. Indem wir einen Datensatz um die Sommersonnenwende (22.06.) auswählen, minimieren wir den Effekt der Jahreszeit.

Datensatz 2: Sommersonnenwende in Würzburg

Wir betrachten den Zeitraum vom 29.05. bis einschließlich 16.07.2021 des eHives DEU-DHG-1 in Würzburg. Analog zum bisherigen Vorgehen wurden die Messwerte gegeneinander aufgetragen und eine Ausgleichsgerade berechnet, siehe Abb. 3. Auffällig sind zunächst die deutlich höheren Absolutwerte der Sonneneinstrahlung bedingt durch den Sonnenhöchststand zu Beginn des Sommers. Erneut wird in Abb. 3b (also bei Verwendung des Luftdrucks zur Vorhersage der Sonneneinsrahlung des Folgetages) der höhere R²-Wert erzielt, auch wenn der Absolutwert mit R²=16,6% noch vergleichsweise niedrig liegt. Durch den im Vergleich zu Salzburg größeren Datenumfang kann eine sich zufällig ergebende Korrelation jedoch eher ausgeschlossen werden.

Abb. 3: Korrelation zwischen Luftdruck und Sonneneinstrahlung des eHives DEU-DHG-1 im Zeitbereich vom 29.05.2021 bis 16.07.2021 bei (a) Auftragung der Tagesmittelwerte des selben Tages bzw. bei (b) Autragung der Sonneneinstrahlung gegen den Luftdruck des Vortages. Eine Ausgleichsgerade wurde mit der Methode der kleinsten Fehlerquadrate berechnet und ist gestrichelt gezeichnet. In der Legende findet sich der Wert des Bestimmtheitsmaßes R² der linearen Anpassung. Wird der Mauszeiger über die Abbildung bewegt, werden zusätzliche Datenpunkte für die eHives DEU-MNG-1 und DEU-LPG-1 aus dem gleichen Zeitbereich eingeblendet.

Erneut werden durch Hovern des Mauszeigers über Abb. 3 Daten zweier weiterer eHives aus dem gleichen Zeitbereich eingeblendet. Insbesondere in Abb. 3b lässt sich erkennen, dass die Korrelation zwischen Luftdruck und Sonneneinstrahlung nun kein Zufallsprodukt mehr ist, sondern sich in allen Datensätzen beobachten lässt. Beim eHive DEU-MNG-1 (Standort Mönchengladbach) ergibt sich sogar ein vergleichweise hohes Bestimmtheitsmaß R²=27,8%. Auffällig sind die durchweg niedrigeren Werte der Sonneneinstrahlung in München (DEU-LPG-1). Es ist möglich, dass die Wetterstation von einem nahestehenden Gebäude oder Baum zeitweise beschattet wird.

Fazit und Ausblick

Wir schließen diesen Blog-Beitrag mit der Erkenntnis, dass der Zusammenhang zwischen Luftdruck und "schönem" Wetter keinesfalls so linear ist, wie manche Hausbarometer suggerieren. Dennoch konnte eine schwache Korrelation festgestellt werden, nachdem die Methodik der Auswertung überdacht wurde. Hier haben sich insbesondere die Auswahl eines ausreichend großen und zur Sonnenwende gelegenen Zeitbereichs aufgedrängt.

Die durchgeführte Datenauswertung kann selbstverständlich nur einen Einblick in die Thematik geben. Es lässt sich leicht eine Vielzahl weiterer Hypothesen aufstellen. Wie z.B. wirkt sich die bereits oben angesprochene Luftfeuchtigkeit aus? Ist es vielleicht sinnvoll anstatt des Absolutwerts die Veränderung des Luftdrucks von Tag zu Tag (erste Zeitableitung) aufzutragen? Lässt sich beim Vergleich verschiedener Standort eine präzisere Vorhersage treffen? Solche und weitere Fragestellungen können analog bearbeitet werden. Größe des Datensatzes und Komplexität der Methodik lassen sich dabei nahezu beliebig skalieren.

Das verwendete Skript und die Rohdaten finden sie im Anhang dieses Blog-Beitrags. Sollten Sie Fragen, Anregungen oder Kritik zu diesem Beitrag oder dem Projekt im Generellen haben, nehmen Sie gerne jederzeit Kontakt zu uns auf.

Ergänzende Materialien

(cw) 2021-11-01