'Data for better health'

Dit najaar lanceert minister De Block 'data for better health' - een project om kwaliteitsvolle data uit de gezondheidszorg open te stellen voor het publiek en voor onderzoek.
In de gezondheidszorg worden heel wat gegevens geregistreerd. Dat gebeurt met het oog op de zorg, soms ook voor de wetenschappelijke onderbouwing van het beleid, maar biedt tal van mogelijkheden.
Healthdata.be
In uitvoering van het plan e-gezondheid kreeg Sciensano - toen het nog het Wetenschappelijk Instituut Volksgezondheid heette - de opdracht een systematische inventaris van de datanken op te maken.
Het moest ook standaarden voorstellen voor de manier van werken en de structuur van de gegevensverzamelingen - de 'business processes' en 'architectuur'. Dat leidde tot de oprichting van healthdata.be.
Sciensano werkt zo toe naar een gemeenschappelijk platform, in de eerste plaats voor de verschillende registers die ons land rijk is. Maar de brug kan ook gemaakt worden naar andere bestaande of nieuwe databanken.
Open data
Het ontsluiten van dat soort data heeft een enorm potentieel, voor allerlei soorten van onderzoek én voor de economie. Onderzoek naar de effectiviteit van behandelingen, gepersonaliseerde zorg, preventie die werkt, nieuwe geneesmiddelen, ...
Dat potentieel is trouwens geen uniek gegeven voor gezondheidsgegevens. 'Open data' zijn in het algemeen belangrijk om nieuwe kennis beschikbaar te maken voor de maatschappij.
Het openbaar maken van gegevens waarover de overheid beschikt legt de weg open naar nieuwe toepassingen en kan een boost geven aan nieuwe bedrijfjes.
FAIR
Maar om herbruikbaar te zijn moeten gegevens kwaliteitsvol zijn, situeerbaar, goed gedocumenteerd,... Enkele jaren geleden, in 2014, werd tijdens een workshop in Leiden een aantal criteria voorgesteld die de kwaliteit van wetenschappelijke gegevensbanken moeten verzekeren.
Dat leidde in 2016 tot de ontwikkeling van FAIR - een letterwoord dat staat voor 'findable, accessible, interoperable, reusable'. FAIR moet gegevens (her)bruikbaar maken voor wetenschappelijk onderzoek.
Met de website dataforbetterhealth.be werkt healthdata nu mee aan 'FAIR and open data' binnen de gezondheidszorg. Hoewel minister De Block pas op 6 september de aftrap wil geven voor het project, is de website al enige tijd toegankelijk.
Summer of code
Tijdens de maand juli liep ook de 'open summer of code 2018'. Zes studenten konden aan de slag met de open data op zoek naar manieren om ze visueel voor te stellen. Dat gebeurde onder begeleiding van een team van Sciensano, en een mentor van Open Knowledge Belgium.
De studenten konden aan de slag met een inventaris van meer dan 30.000 datasets. Die kunt u zelf terugvinden op fair.healthdata.be. Het zijn er vooral zoveel omdat ook de datasets van de European Clinical Trials Database zijn opgenomen.
De bedoeling is dat na de zomer, wanneer de minister het startsein heeft gegeven, kenniscentra, dataspecialisten, zorgverleners, wetenschappers... ook met deze datasets aan de slag gaan. De minister verwacht voorstellen voor allerlei projecten.
Anononiem
'Big data' is niet de meest geschikte omschrijving van de data die beschikbaar worden via healthdata.be. De mensen van Sciensano bewaken zorgvuldig de kwaliteit van de registratie. Ze waken er ook over dat gegevens niet identificeerbaar zijn.
De gegevens die bij healthdata.be passeren zijn anoniem gemaakt. De juiste term is eigenlijk 'pseudonimisering'. De gegevens mogen niet meer gekoppeld kunnen worden aan een bestaand persoon.
Maar ze worden wel gekoppeld aan een zogenaamd 'pseudoniem' - een computercode die het mogelijk maakt wel te weten dat op twee verschillende tijdstippen geregistreerde gegevens afkomstig zijn van dezelfde persoon.
Op de website staat de ingewikkelde procedure beschreven voor pseudonimisering - die wel degelijk anonimiteit moeten garanderen. Een 'derde partij' staat in voor de pseudonimisering maar ziet nooit de inhoud van de gegevens. De mensen van Sciensano kunnen de medische gegevens ontcijferen, maar zien nooit identificeerbare persoonsgegevens.
Healthdata.be moet transparant zijn. De burgers, in de eerste plaats de zorgverleners, kunnen er zich van vergewissen dat gevoelige gegevens niet te grabbel gegooid worden van onderzoekers of de industrie.
Dat betekent ook dat steeds wordt bewaakt wie toegang krijgt tot welke gegevens: 'geaggregeerd', gepseudonimiseerd,... 'Open' wil niet zeggen dat alles kan.