Per 1 juli 2024 zijn organisaties met 100 of meer werknemers in Nederland verplicht om hun CO2-uitstoot door werkgebonden mobiliteit te rapporteren aan de overheid. Voor het mobiliteitsplatform dat data van 150+ aanbieders combineert, betekende dit een enorme operationele uitdaging: honderden klanten, allemaal een rapport nodig, elk kwartaal.
De uitdaging: data uit 150+ bronnen
Het platform beheert mobiliteitsdata van honderden bedrijven. Die data komt van leasemaatschappijen, OV-providers, fietsenplannen, deelautoplatforms en thuiswerkregistraties. Elke bron levert data in een eigen formaat, met eigen frequentie en eigen definitie van wat "een rit" is.
Het handmatig samenvoegen en berekenen van CO2-uitstoot kostte het team drie tot vier werkdagen per klant, per kwartaal. Bij 45 klanten is dat 180 mandagen per jaar, alleen voor rapportages. En elke keer dat iemand handmatig data kopieert, sluipen er fouten in. Verkeerde emissiefactoren, dubbele ritten, ontbrekende thuiswerkdagen.
Met de nieuwe rapportageverplichting en een groeiend klantenbestand moest dit fundamenteel anders. Handmatig was geen optie meer.
Het CO2-rekenprobleem
CO2-uitstoot berekenen klinkt simpel: kilometers maal emissiefactor. In de praktijk is het een stuk complexer. Een leaseauto heeft een specifieke CO2-uitstoot per kilometer die afhangt van het model, het bouwjaar en het brandstoftype. Een elektrische auto heeft een andere emissiefactor dan een hybride. OV-uitstoot verschilt per vervoerder en per lijn. Fietsen stoten niets uit, maar tellen wel mee als vermeden autokilometers. En thuiswerken heeft een eigen berekeningsmodel op basis van het aantal dagen.
We moesten al deze berekeningsmodellen implementeren, koppelen aan de juiste databronnen, en zorgen dat de output voldoet aan het format dat de overheid vereist.
De technische oplossing
We bouwden een geautomatiseerde datapipeline die alle mobiliteitsbronnen koppelt. De architectuur heeft drie lagen. De eerste laag haalt data op bij alle providers via de adapters die we eerder hadden gebouwd. De tweede laag normaliseert alles naar een uniform rittenformaat: start, eind, afstand, modaliteit, voertuigtype. De derde laag past de CO2-emissiefactoren toe en genereert de rapportage.
Het systeem draait op Python voor de dataverwerking en berekeningen, PostgreSQL voor opslag, n8n voor de orchestratie en scheduling, en REST API's voor de externe koppelingen. Emissiefactoren worden centraal beheerd in een aparte tabel die we jaarlijks updaten op basis van de SKAO-standaarden.
De rapportages worden automatisch gegenereerd op de eerste werkdag van elk kwartaal. Elke klant ontvangt een PDF en een CSV-export die direct geupload kan worden naar het overheidsportaal. Bij afwijkingen groter dan 15% ten opzichte van het vorige kwartaal stuurt het systeem een alert zodat het team kan controleren of de data klopt voordat het rapport naar de klant gaat.
Wat we tegenkwamen
Het lastigste onderdeel was de historische data. Veel klanten hadden geen schone historische dataset. Ritten ontbraken, voertuiggegevens waren onvolledig, en thuiswerkregistraties bestonden simpelweg niet voor 2023. We moesten voor het eerste kwartaal een reconstructie maken op basis van de best beschikbare data, met duidelijke disclaimers in de rapportage.
Een ander probleem: emissiefactoren veranderen jaarlijks. De SKAO publiceert nieuwe factoren, maar niet altijd op dezelfde datum. We hebben een updateproces ingericht waarbij het team een melding krijgt zodra nieuwe factoren beschikbaar zijn, zodat ze gevalideerd en geimporteerd kunnen worden voordat het volgende kwartaalrapport wordt gegenereerd.
Resultaten
De rapportagetijd daalde van dagen naar minuten. Waar een medewerker eerst drie tot vier dagen bezig was met het handmatig samenstellen van een CO2-rapport, genereert het systeem dit nu automatisch. Alle aangesloten bedrijven voldoen aan de rapportageverplichting zonder dat ze er zelf iets voor hoeven te doen.
De data is actueler en nauwkeuriger. Handmatige fouten zijn geelimineerd. En het team kan zich focussen op productinnovatie in plaats van Excel-bestanden samenvoegen.
De bredere les
Compliance-rapportages zijn bij uitstek geschikt voor automatisering: ze hebben een vaste structuur, vaste deadlines en vaste databronnen. Maar de investering zit niet in de rapportage zelf. Die zit in de datakwaliteit eronder. Zonder schone, genormaliseerde data kun je geen betrouwbaar rapport genereren. De pipeline is het product, niet het PDF'je dat eruit komt.


