Datakwaliteit algemeen
Als u aan de slag gaat met het onderwerp datakwaliteit, is het van belang om begrip te hebben van het concept datakwaliteit. Dit onderdeel gaat nader in op wat datakwaliteit in brede zin voor pensioenfondsen betekent, waarbij er in enkele gevallen ook voorbeelden ten aanzien van het invaren naar het nieuwe pensioenstelsel worden gegeven.
Wat is datakwaliteit?
Datakwaliteit is de mate waarin de data geschikt zijn voor het doel waarvoor u de data wilt gebruiken. Data moeten bijvoorbeeld geschikt zijn voor besluitvorming of voor de uitvoering van de pensioenregeling, zoals het doen van uitkeringen of communicatie-uitingen. De mate waarin de data geschikt zijn voor het beoogde doel, wordt vaak bepaald door te kijken naar verschillende dimensies. Zo wordt bijvoorbeeld gekeken of de data volledig, juist en/of tijdig zijn.
Er zijn diverse raamwerken beschikbaar voor datakwaliteit. Eén van de bekendste voorbeelden is het DAMA-DMBOK raamwerk voor informatie- en datamanagement. In dit raamwerk wordt datakwaliteit gedefinieerd als de planning, implementatie en monitoring van maatregelen die de kwaliteit van data beheersen, om te verzekeren dat de data geschikt zijn voor het doel en voldoen aan de eisen van de datagebruikers.
Goede datakwaliteit is essentieel voor de uitvoering van pensioenregelingen. Terecht zijn er en komen er steeds meer initiatieven vanuit de sector en toezichthouders die de focus leggen op het beheersen van de datakwaliteit in pensioenfondsadministraties en het belang van datakwaliteit onder de aandacht brengen.
DNB beschrijft in de Good Practice Robuuste Pensioenadministratie dat de kwaliteit van data van een pensioenfonds wordt bepaald door de mate waarin deze data geschikt, volledig en accuraat zijn.
De Pensioenfederatie geeft in haar Kader datakwaliteit de volgende definitie: “Datakwaliteit is de mate waarin data geschikt is voor het doel waarvoor ze wordt gebruikt.” Het kader datakwaliteit richt zich op het doel om juist en volledig in te varen in het nieuwe pensioenstelsel.
Hieronder zijn enkele dimensies voor datakwaliteit, inclusief voorbeelden voor een pensioenadministratie, toegelicht:
- Volledigheid/compleetheid: Data zijn volledig als de verwachte variabele of dataset volledig aanwezig is. Een voorbeeld is dat voor elke pensioenfondsdeelnemer in een pensioenadministratie een geboortedatum aanwezig is.
- Juistheid: Data zijn juist als het dataveld de werkelijkheid juist representeert. Een voorbeeld is de aanspraak van een deelnemer. Is deze juist vastgesteld en representeert deze de werkelijkheid op basis van diverse factoren zoals de pensioenregeling en dienstverbandgegevens?
- Tijdigheid: Data zijn tijdig als de datavelden de realiteit van de tijd weergeven. Een voorbeeld is tijdige verwerking van life-events of de registratie van het meest recente salaris van een deelnemer
- Plausibiliteit: Data zijn plausibel als bijvoorbeeld de datavelden binnen de domeinwaarden liggen en daarmee redelijkerwijs de realiteit weerspiegelen, zoals een parttimefactor die tussen 0% en 100% ligt. Let op: in dit voorbeeld wordt niet gecontroleerd of het parttimepercentage juist is, maar enkel of het binnen plausibele grenzen ligt.
- Consistentie: De data zijn consistent over meerdere databases. Een voorbeeld is dat als een geboortedatum van een deelnemer op meerdere plekken in de administratie wordt geregistreerd, dat deze overal hetzelfde is. Let op: in dit voorbeeld wordt niet gecontroleerd of de geboortedatum juist is, maar enkel of het consistent is binnen de administratie.
- Uniekheid: Een datarecord is uniek in de database. Er staan geen dubbele pensioenaanspraken voor de deelnemer geregistreerd, tenzij het om bijvoorbeeld een andere polis of type pensioen voor deze deelnemer gaat.
- Formaat/validiteit: Het formaat van de datavelden is juist. Een voorbeeld is dat een salaris altijd een numerieke waarde is met twee decimalen of de naam van een deelnemer altijd een tekstueel veld is.
TIP: het is raadzaam om zowel de termen als de definitie van de termen vast te leggen. Wat verstaat u onder volledigheid? Compleetheid en volledigheid zijn twee andere benamingen van dimensies, maar er wordt hetzelfde mee bedoeld. Door een definitie uitgebreider vast te leggen kunnen dimensies eenvoudiger worden vergeleken, ook als deze een andere benaming hebben.
TIP: het is aan te raden om bij het vaststellen van de datakwaliteit dimensies uw pensioenuitvoeringsorganisatie te consulteren. Het kan lonen om de dimensies tussen pensioenfonds en pensioenuitvoeringsorganisatie consistent met elkaar te maken. U praat in dat geval over “hetzelfde” als u met uw pensioenuitvoeringsorganisatie over datakwaliteit spreekt en de pensioenuitvoeringsorganisatie over dit onderwerp aan u rapporteert
Waarom is datakwaliteit belangrijk?
Datakwaliteit staat hoog op de agenda van financiële instellingen. Zo ook bij pensioenfondsen, die onder andere verantwoordelijk zijn voor het verzorgen van een juiste uitkering aan deelnemers of juiste communicatie met hun deelnemers. Indien de datakwaliteit onvoldoende is en er fouten in de data zitten, kan dit leiden tot foutieve uitkeringen aan deelnemers of fouten in de communicatie met deelnemers, zoals foute bedragen in de UPO of het versturen van een brief naar een verkeerd adres. Het is van belang dat een pensioenfonds grip heeft op haar datakwaliteit en deze datakwaliteit periodiek beoordeeld.
Een goede datakwaliteit is de basis voor betrouwbare analyses, beslissingen en acties. Het gebruik van onjuiste data kan leiden tot verkeerde beslissingen of conclusies. Gezien het grote belang heeft DNB datakwaliteit als een van haar toezichtthema’s voor 2021 – 2024 gedefinieerd.
Ook de AFM heeft aandacht voor het onderwerp datakwaliteit, onder andere in relatie tot datakwaliteit van communicatie uitingen. Daarnaast heeft de AFM de Leidraad Keuzebegeleiding gepubliceerd ten aanzien van de norm keuzebegeleiding voor pensioenuitvoerders. Hierin geeft de AFM aan dat de keuzebegeleiding voor deelnemers periodiek geëvalueerd kan worden op basis van data-analyses. Er wordt niet expliciet over datakwaliteit gesproken, maar het is evident dat dit soort data-analyses op data van de hoogst mogelijke kwaliteit moeten worden uitgevoerd.
De Autoriteit Persoonsgegevens ziet een samenleving die steeds digitaler wordt en heeft voor de jaren 2020-2023 de focus op het thema dataprotectie in een digitale samenleving. Door de toenemende data die van de samenleving worden verzameld groeit de inzet van Artificiële Intelligentie (AI) en algoritmes, ten behoeve van de ondersteuning bij besluitvorming.
Een van de risico’s die door de AP wordt onderkend is de kwaliteit van de data die gebruikt worden door de algoritmes. Ook in de pensioensector wordt er gebruik gemaakt van algoritmen, waardoor er aandacht moet zijn voor het thema datakwaliteit.
Kortom: Data van hoge kwaliteit zijn van belang, voordat deze data gebruikt kunnen worden om besluitvorming mee te faciliteren.
Welke data is relevant en wat is de samenhang tussen data in de administratie?
De hoeveelheid data in de diverse administratiesystemen, die samen ervoor zorgen dat u de pensioenregeling kunt uitvoeren, kan overweldigend zijn. Mede in het kader van datakwaliteit is het van belang om prioritering binnen uw data aan te brengen. Daarbij is het van belang de data(velden) te identificeren die kritiek zijn voor de uitvoering van de pensioenregeling. Zo zijn bijvoorbeeld de contactgegevens van deelnemers kritiek voor communicatie (het beoogde doel), terwijl het salaris kritiek is voor de juiste en volledige berekening van de pensioenaanspraken. Ook voor invaren is de datakwaliteit van specifieke data(velden) van belang. Door u hierop te focussen, wordt de beheersing van datakwaliteit een overzichtelijker en beheersbaarder proces richting het nieuwe pensioenstelsel.
Domeinen, subdomeinen en data velden
Een mogelijke aanpak om te komen tot de belangrijkste datavelden is om samen met uw pensioenuitvoeringsorganisatie naar het datamodel van de pensioenadministratie te kijken. In een datamodel zijn alle onderdelen van de administratie op een gestructureerde wijze inzichtelijk gemaakt. Vaak herkent u in dit datamodel ook de samenhang tussen diverse domeinen in de administratie, zoals basisgegevens, dienstverbandgegevens, pensioengegevens, gegevensaanleveringen, beleggingsgegevens en excasso. Per domein kunnen de databases en systemen (subdomeinen) in kaart gebracht worden. Op basis van de indeling naar datadomeinen kunt u al een eerste risicoanalyse doen als pensioenfonds door voor de diverse domeinen het datakwaliteit risico te bepalen. De volgende stap is om de datavelden per subdomein in kaart te brengen. Elke database heeft diverse velden waarin informatie van deelnemers wordt opgeslagen, zoals NAW gegevens en pensioenaanspraken. Maar niet elk dataveld is kritisch als het gaat om de berekening van een aanspraak. Hier maakt u de stap naar Kritische Data Elementen.
Kritische Data Elementen
Per (sub)domein kan een pensioenfonds vervolgens de Kritische Data Elementen (KDE) definiëren. Een KDE is een data-element dat in aansluiting op de relevante pensioenregeling een getal, waarde of type aangeeft, welke relevant is voor het kunnen aantonen dat een deelnemer krijgt waar hij/zij recht op heeft. Voor elk dataveld in een (sub)domein bepaalt u of deze kritisch is. Hieronder zijn enkele voorbeelden van KDE voor diverse datadomeinen weergegeven:
- Basisgegevens: geboortedatum, geslacht en burgerlijke status.
- Dienstverbandgegevens: salaris, parttime percentage en datum indiensttreding.
- Pensioengegevens: soort pensioenregeling, rekenwaarden zoals opbouwpercentage, franchise, premiepercentage, pensioenrichtleeftijd en het maximum pensioengevend salaris, maar ook de opgebouwde pensioenaanspraak.
- Excasso: bankrekeningnummer en hoogte pensioenuitkering.
De variabelen in de administratie die u kenmerkt als KDE, zullen afhankelijk zijn van uw doelstelling op het gebied van datakwaliteit. Indien u inzet op het verbeteren van datakwaliteit ten behoeve van het invaren, dient u de KDE’s te identificeren die van belang zijn voor de invaarberekening. In de guidance beheersing Solvency II datakwaliteit voor verzekeraars benoemt DNB dat als een organisatie de keuze maakt om de datakwaliteit te borgen door te focussen op de KDE, er verwacht wordt dat u een selectieproces doorloopt met een onderhavige risicoanalyse en duidelijke afwegingen welke data-elementen als kritisch zijn geïdentificeerd.
In het Kader datakwaliteit van de Pensioenfederatie is een meer uitgebreid overzicht van KDE’s opgenomen, specifiek voor het invaren richting het nieuwe pensioenstelsel. De Pensioenfederatie benoemt in het kader dat bij het beschrijven van de KDE’s in ieder geval de volgende zaken per KDE meegenomen kunnen worden:
- De domeinwaarden (bijvoorbeeld voor geslacht zijn de mogelijke domeinwaarden “m/v/o”)
- De herkomst of bron van de data (bijvoorbeeld werkgever of BRP).
Het opstellen van een data-directory helpt het pensioenfonds en de pensioenuitvoeringsorganisatie het overzicht te behouden ten aanzien van de KDE’s. De data-directory is een overzicht waarin de hierboven genoemde zaken per KDE zijn vastgelegd. Daarnaast is het een good practice om op data element niveau inzichtelijk te maken hoe de data door de pensioenadministratie stromen en welke processtappen de data ondergaan. Deze zaken worden vastgelegd in de data-directory en helpen het pensioenfonds om datakwaliteitsdoelstellingen te borgen.
TIP: stem de set aan KDE’s af met uw pensioenuitvoeringsorganisatie. Vaak hebben zij al de beschikking over een datamodel van de administraties en de KDE’s hierin. Een pragmatische aanpak is om als pensioenfonds bij deze set van KDE’s aan te sluiten en deze als pensioenfonds vast te stellen. Hieraan dient een gedegen selectieproces voor de KDE’s ten grondslag te liggen in relatie tot de pensioenregeling.
Wettelijke verplichtingen omtrent datakwaliteit
Datakwaliteit is om evidente redenen belangrijk voor een pensioenfonds. In de wet- en regelgeving zijn er ook directe en indirecte wettelijke verplichtingen omtrent datakwaliteit opgenomen.
Artikel 143 van de Pensioenwet schrijft voor dat een pensioenfonds haar organisatie zodanig inricht dat deze een beheerste en integere bedrijfsvoering waarborgt. Een pensioenfonds dient beheersingsmaatregelen in te richten voor financiële en niet-financiële risico’s, zoals het datakwaliteit risico.
Pensioenfondsen zijn wettelijk verantwoordelijk voor de volledige en juiste administratie en vaststelling van de pensioenrechten en -aanspraken, ook bij uitbesteding. Het pensioenfonds dient te beschikken over een beleid met betrekking tot de uitbesteding en adequate controle op de uitbestede werkzaamheden (artikel 14 Besluit uitvoering Pensioenwet en Wet verplichte beroepspensioenregeling).
DNB houdt prudentieel en materieel toezicht op de naleving voor pensioenfondsen op diverse thema’s, zo ook op het thema datakwaliteit.