Hoe kun je met het Hollandse Luchten dashboard onderzoek doen naar bronbepaling?

De data science werkgroep beschrijft de stappen die je kunt nemen om zelf onderzoek te doen naar bronnen.

Veel meetvragen binnen Hollandse Luchten gaan over waar de vervuiling/fijnstof/overlast vandaan komt en/of over hoeveel een bepaalde bron bijdraagt. Dat is geen eenvoudige vraag, maar de Hollandse Luchten sensoren kunnen wel inzicht geven. Om tot de eerste resultaten te komen, kun je de volgende stappen volgen in het Hollandse Luchten data-analyse dashboard. Ook met deze stappen blijft het lastig (lokale) bronnen te detecteren. In sommige gevallen zijn er nog diepgaandere analyses nodig.

Onderaan het artikel vind je een video-uitleg over bronbepaling in het Hollandse Luchten data-analyse dashboard.

Stap 1: Bedenk welke regio je wil gaan analyseren

Als je een specifieke bron op het oog hebt, is het verstandig om de sensoren rondom deze bron te selecteren. Als je gewoon je eigen omgeving wilt analyseren, dan kies je de sensoren in jouw omgeving. Probeer altijd meer dan 1 sensor te betrekken. Dat maakt de analyse robuuster. In dit document maken we echter wel de vergelijking tussen twee individuele sensoren, omdat dit puur ter illustratie dient!

Stap 2: Bedenk welke databronnen je tot je beschikking hebt

Naast sensordata kan je bijvoorbeeld ook data van officiële meetstations (LML -data), data van het weer (KNMI-data) of overige databronnen gebruiken. In het dashboard van Hollandse Luchten zijn de LML-data en KNMI-data ook beschikbaar.

Stap 3: Onderzoek voor welke tijdsperiode deze data beschikbaar zijn

Onderzoek voor welke tijdsperiode deze data beschikbaar zijn en of dit voldoende is voor je onderzoeksvraag. Belangrijk is dat de verschillende sensoren die je gaat analyseren, ongeveer dezelfde momenten hebben gemeten!

Stap 4: Maak een tijdserie voor de sensoren

Zie je hier niet hele gekke waardes in voorkomen, dan kan je verder naar stap 5. Zo wel, filter deze sensoren/waardes uit de analyse. Zo voorkom je dat de verdere analyses erg vertekend worden. Zo zie je in de figuur hieronder dat sensor 220 veel 0-waardes heeft gegeven in januari. Die waarden moeten worden verwijderd uit de analyse.

Stap 5: Vergelijk de gemeten concentratie met de windrichting

In dit voorbeeld vergelijken we de gemeten concentratie in een pollutieroos’.
A Zien alle pollutierozen er binnen het gebied hetzelfde uit? Dan heb je waarschijnlijk geen significante individuele bronnen binnen het gebied (in elk geval niet te herleiden in tijdsperiode die je nu onderzoekt, met de data die je nu beschikbaar hebt).
B zijn de pollutierozen verschillend, dan zijn er aanwijzingen voor individuele bronnen binnen het gebied.

Een voorbeeld van een pollutieroos van sensor 415
Een voorbeeld van een pollutieroos van sensor 439

Als wij deze over elkaar heen leggen, krijgen wij het volgende beeld:

Combinatie van de pollutieroos van sensor 439 en sensor 415.

Hieruit blijkt dat de metingen voor sensor 415 bij zuidelijke wind (170 t/m 210 graden) iets hoger zijn dan de metingen van sensor 439. Echter, in dit geval blijkt dat sensor 415 voor alle dagen en uren gemiddeld genomen hogere meetwaardes geeft dan sensor 439.

Stap 6: Als de pollutierozen een verschillend beeld geven, dan kan je gaan inzoomen op waar deze verschillen vandaan komen

Soms geeft een sensor slechts 1 enorme piek, die kan het beeld behoorlijk vervormen (als het goed is verwijderd in stap 4), maar verschillen kunnen ook zijn ontstaan doordat de ene sensor altijd iets hoger is dan de ander. In het ideale geval, meten twee sensoren altijd hetzelfde, maar meet sensor A bepaalde uren van de dag, of bij specifieke windrichting hogere of lagere waarden dan sensor B. Echter, in dit geval blijkt dat sensor 415 voor alle dagen en uren gemiddeld genomen hogere meetwaardes geeft dan sensor 439. 

 

Conclusie

Het lijkt er in dit geval op dat sensor 415 altijd wat hogere meetwaardes geeft. Eigenlijk zie je dat ook al in de windroos. Echter, de verschillen tussen de sensoren zijn niet voor elk uur/dag gelijk. Tussen 5 en 9 uur ’s ochtends is het (relatieve) verschil bijvoorbeeld groter dan ’s avonds tussen 20:00 en 23:00 (zie de twee gele pijlen). Het zou dus kunnen dat er bij zuidenwind een bron is die meetbaar (door sensoren) meer bijdraagt op locatie 415 dan op locatie 439. Welke bron dat dan is, is nog niet te zeggen. Daarvoor zou je de data moeten combineren met kennis over het gebied wat je onderzoekt.