Wanneer je onderzoek is afgerond en je bezig bent met het publiceren van je onderzoeksoutput, komt ook het publiceren van je data om de hoek kijken. Je publiceert je data voor toekomstig hergebruik, bijvoorbeeld voor verder onderzoek of onderwijsdoeleinden. De Haagse hogeschool adviseert onderzoekers hun data na afloop van het onderzoek te deponeren in het DANS Data Stations. DANS is het nationale expertisecentrum voor onderzoeksdata van Nederland.  

Zo open als mogelijk, zo gesloten als nodig

De Nederlandse gedragscode wetenschappelijk integriteit vraagt van de onderzoeker om zowel de ruwe als bewerkte data zorgvuldig te bewaren gedurende een (voor het vakgebied en de methodologie) gepaste termijn en dat je de data zo veel mogelijk publiek beschikbaar maakt. Subsidieverstrekkers en uitgevers sluiten hierbij aan. Subsidieverstrekkers vragen dat je je inspant om na afronden van het onderzoek de data vrij toegankelijk te maken voor andere zoekers. En wanneer je wil publiceren in een tijdschrift, kan de uitgever verschillende dingen van je vragen. Bijvoorbeeld om je data te publiceren op de website van de uitgever, op te slaan in een data-archief of om je contactgegevens beschikbaar te stellen zodat de data opgevraagd kunnen worden. 

De Haagse Hogeschool is aangesloten bij – en deelt de ambities van – de Vereniging Hogescholen. De Vereniging Hogescholen heeft de Berlin Declaration on Open Access to Knowledge in Science and Humanities ondertekend. De hogescholen maken onderdeel uit van het nationaal programma ‘Open Science.’ Op het gebied van Open Science wordt onder andere gestreefd naar ‘het zorgvuldig bewaren van onderzoeksdata en het ontsluiten van onderzoeksdata volgens het ‘FAIR principe’ (Fair, Accessible, Interopable en Reusable). De onderzoeksdata zijn dan beschikbaar voor collega’s binnen de eigen hogeschool, voor collega’s van andere hogescholen, voor onderzoekers verbonden aan kennisinstellingen (universiteiten, instellingen voor toegepast onderzoek) en voor partners uit de beroepspraktijk. Daarbij geldt ‘zo open als mogelijk, zo gesloten als nodig’.

FAIR data

Findable/vindbaar

Data zijn findable/vindbaar als:

  • De dataset is voorzien van een persistent identifier
  • De dataset voorziet in datacitatie
  • De dataset tevens is gekoppeld aan de persistent identifier van de auteur(s) (ORCID, ISNI)
  • De dataset is voorzien in complete metadata volgens de juiste standaarden
  • De dataset is gelinkt aan de publicatie gebaseerd op de dataset
Accessible/toegankelijk

Data zijn accessible/toegankelijk als:

  • De dataset is opgenomen in en beschikbaar gemaakt via een betrouwbaar data-archief (zoals de nationale DANS Data Stations)
  • De metadata openbaar toegankelijk zijn, ook al is de dataset dat zelf niet
  • Toegangsvoorwaarden (toegangsprotocollen, contactgegevens, embargo) duidelijk zijn vermeld
Interoperable/uitwisselbaar

Data zijn interoperable/uitwisselbaar als:

  • De (meta)data toegankelijk zijn
  • De (meta)data juiste termen en relevante woordenschat bevatten volgens de standaarden van je vakgebied
  • De (meta)data van de hoogste kwaliteit zijn
  • De data beschikbaar zijn in open gestandaardiseerde dataformaten
Reusable/herbruikbaar

Data zijn Reusable/herbruikbaar als:

In deze video worden de FAIR principes uitgelegd. De videoclip ‘FAIR datamanagement’ is gemaakt in 2023 door DCC-PO, een netwerk van hogescholen voor de ondersteuning van Research Data Management.

 

Data publiceren

Het publiekelijk delen van data van afgeronde (delen van) onderzoek ondersteund transparantie en openheid van onderzoek. Je komt tegemoet aan de eventuele eisen van subsidieverstrekkers of uitgevers en je eerbiedigt gedragscodes en declaraties. Je vergroot de impact van je onderzoek binnen en buiten je vakgebied en het komt de zichtbaarheid van jou als onderzoeker ten goede.

In de kern zijn er vier dingen belangrijk bij het delen van data: (1) plaats de herbruikbare data in een data-archief dat gebruikmaakt van (2) een metadatastandaard en (3) een persistent identifier en (4) voorzie de data van een licentie. (1) is nodig voor toegankelijkheid, (2) is nodig voor uitwisselbaarheid, (3) is nodig voor (terug)vindbaarheid en citeerbaarheid en (4) is nodig om daadwerkelijk hergebruik mogelijk te maken (en kan ook ingezet worden voor uitwisselbaarheid).

DANS Data Stations, het data-archief dat wordt aangeraden door De Haagse Hogeschool biedt alle opties. Metadatastandaard komt hieronder aan bod in het onderdeel Data archiveren. Hieronder gaan we in op licenties en citeren. Maar eerst bespreken we de redenen om het delen van data te beperken.  

DANS Data Stations en domeinspecifieke data-archieven.

De Haagse Hogeschool adviseert onderzoekers hun data na afloop van het onderzoek te publiceren in het data-archief DANS Data Stations.  DANS heeft een aantal aandachtspunten rond het deponeren van data in hun archief in een handleiding geplaatst. Neem deze aandachtig door. Voor het deponeren van je onderzoeksdata sluit je een overeenkomst af met het archief: 

  • DANS krijgt het recht om de dataset op te nemen in haar archief en deze ter beschikking te stellen onder de aangegeven voorwaarden.
  • De overeenkomst is een ‘niet-exclusieve’ licentie. Dit houdt in dat de eigenaar van de dataset alle vrijheid houdt om deze ook elders te deponeren en/of beschikbaar te stellen.
  • U verklaart dat u rechthebbende bent, of dat u toestemming heeft van eventuele rechthebbenden voor het deponeren en ter beschikking stellen van de dataset. Denk hierbij aan auteurs-, databank- of octrooirecht.
  • U doet geen afstand van databank- en mogelijke auteursrechten; tenzij u ervoor kiest om de dataset in het publieke domein te plaatsen.

DANS Data Stations is een algemeen data-archief maar heeft aanleverspecificaties voor bepaalde disciplines, waaronder sociale- en gedragswetenschappen. Je kan ook kiezen voor een domeinspecifiek data-archief binnen jouw vakgebied, indien beschikbaar. Het voordeel van een domeinspecifiek data-archief is dat de mogelijkheden nog meer toegespitst zijn op de betreffende onderzoekscommunity. De data kunnen op een rijkere manier worden beschreven door het gebruik van domein specifieke metadatastandaarden. De re3data.org website biedt een overzicht van algemene en disciplinaire data-archieven wereldwijd. Je kunt filteren op onderwerp, vakgebied of land. Je hebt ook de mogelijkheid om te zoeken naar data-archieven met een datakeurmerk. Zo een keurmerk geeft aan dat het archief volgens derden een Trusted Digital Repository is en dat de onderzoeksdata die er zijn gedeponeerd ook in de toekomst gevonden en gedeeld kunnen worden. Een data-archief met een datakeurmerk zoals het CoreTrustSeal stelt langetermijntoegang, veiligheid, vindbaarheid en standaardisering voorop. 

Bestandsformaten

DANS Data Stations , het voorkeursdata-archief voor onderzoekers van De Haagse Hogeschool, werkt met verschillende voorkeursformaten voor verschillende types onderzoeksdata. Het deponeren van onderzoeksdata in deze voorkeursformaten zal zonder meer door DANS worden geaccepteerd. Neem hun tabel met voorkeursformaten daarom goed door.

Als algemene richtlijn stelt DANS dat de bestandsformaten die het beste geschikt zijn voor duurzaamheid en toegankelijkheid op de lange termijn:

  • veel worden gebruikt;
  • open specificaties hebben;
  • onafhankelijk zijn van specifieke software, ontwikkelaars of leveranciers.
Metadata

Door je data te beschrijven en te voorzien van begeleidende metadata (data over data, kenmerken of eigenschappen van data) garandeer je de vindbaarheid van de data. Zoekmachines maken gebruik van deze metadata velden. DANS Data Stations, het voorkeursdata-archief voor onderzoekers van De Haagse Hogeschool, maakt gebruik van de metadatastandaard Dublin Core. Dit is een internationaal gangbare en algemene metadatastandaard waarin 15 metadata velden worden beschreven o.a. titel, auteur, datum, onderwerp, beschrijving, uitgever, etc. Bekijk het volledig overzicht met toelichting van de metadatavelden die DANS aanbiedt. Hoe meer velden je invult, hoe groter de vindbaarheid van de data. De metadata zijn openbaar. De velden dienen daarom alleen persoonsgegevens te bevatten ter verantwoording van de dataset en geen persoonsgegevens van onderzoekssubjecten.

Er zijn verschillende typen metadata en metadata worden ingedeeld op zowel bestands- als dataniveau. Lees meer over de types en niveaus in deze leidraad. Door gebruik te maken van een metadatastandaard wordt tevens uitwisselbaarheid tussen systemen gegarandeerd. Dit maakt dat je data breder toegankelijker worden.  

Naast de algemene metadatastandaarden zoals Dublin Core bestaan er ook domeinspecifieke metadatastandaarden. Dit zijn metadatavelden die betrekking hebben op bijvoorbeeld numerieke data (sociale wetenschappen), materiële objecten en hun visualisaties (archeologie), primaire biodiversiteitsdata (biologie) of instrumenten om data vast te leggen (techniek).

Domeinspecifieke data-archieven maken uiteraard gebruik van domeinspecifieke metadatastandaarden, Maar domeinspecifieke metadata kunnen ook een aanvulling zijn op een algemene metadatastandaard (die gebruikt worden door een algemeen data-archief). Zo bevat DANS  specifieke velden voor bijvoorbeeld data uit de archeologie die verwijzen naar het Archeologisch Basisregister. 

Er zijn veel verschillende domeinspecifieke metadatastandaarden, afhankelijk van de onderzoeksgemeenschap, het doel, de functie in het domein. Het Engelse Digital Curation Centre geeft een goed overzicht. Ook de Research Data Alliance opgericht door de Europese Commissie onderhoudt een lijst.

Alles of niets?

Het delen van onderzoeksdata is geen alles- of niets keuze. Het varieert van het volledig open maken van data aan de ene kant tot ze volledig gesloten houden aan de andere kant, met daartussen verschillende mogelijke vormen van beperkte / gecontroleerde toegang 

Open onderzoeksdata zijn data die ‘vrijelijk kunnen worden gebruikt, gewijzigd en gedeeld door iedereen voor elk doel’ (opendefinition.org). Gesloten onderzoeksdata zijn data die tijdelijk onder een embargo staan of helemaal niet gedeeld kunnen worden. Beperkte / gecontroleerde onderzoeksdata zijn data die niet op een volledig open manier worden gedeeld, maar beschikbaar worden gesteld onder beperktere toegangs- en gebruiksvoorwaarden. Dit betekent dat er grenzen zijn aan wie toegang heeft tot en gebruik kan maken van de data, hoe en/of met welk doel. De toegang tot data kan op verschillende manieren beperkt worden: 

  • Toegang met een login of authenticatie die gerelateerd is aan een bepaalde instelling/organisatie of met een lidmaatschap. 
  • Je kunt ook kiezen om te werken met een gebruikersovereenkomst  (instelling  als de aanbieder van de data en diegene die je data willen hergebruiken) een zogenoemde Data Use Agreement. Jullie spreken af onder welke voorwaarden en op welke manieren jouw data hergebruikt mogen worden. 
  • Een data-archief als DANS biedt ook de mogelijkheid om je data (tijdelijk) van embargo te voorzien: gedurende de embargo-periode wordt vaak wel de beschrijving van de dataset gepubliceerd, maar zijn de onderzoeksdata zelf niet beschikbaar voor hergebruik door anderen. Als je in DANS Data Stations een embargo op de data wilt instellen (maximaal twee jaar) kan dat in het veld ‘Date available’. 

Bij DANS kun je kiezen voor de toegangscategorie ‘Restricted Access’. Anderen kunnen dan via het data-archief toestemming aan jou vragen om je data in te zien en te downloaden. Ze moeten hun aanvraag motiveren. Voordat je toegang verleent kun je de ander aanvullende voorwaarden opleggen zoals bijv. een toetsing van de ethische commissie van de instelling die om toestemming vraagt.

De redenen om het delen van data te beperken

Of je kiest voor open, gesloten, beperkt/gecontroleerd, hangt grotendeels af  wat passend is gezien de aard van de data en van het eigendomsrecht (beschik je  over de juiste machtigingen / toestemming). Redenen om het delen van data te beperken:

  • De data vormen of bevatten persoonsgegevens, d.w.z. alle informatie over een (direct of indirect) geïdentificeerde of identificeerbare levende natuurlijk persoon. Indien mogelijk anonimiseer je deze data.
  • Je hebt anderszins de plicht of bent overeengekomen om de data vertrouwelijk te houden (bijvoorbeeld door een geheimhoudingsverklaring te ondertekenen of een overeenkomst met een vertrouwelijkheidsclausule).
  • De data kunnen mogelijk schade toebrengen (bijvoorbeeld aan bedreigde diersoorten, kwetsbare locaties of groepen, volksgezondheid, nationale veiligheid, …) als ze openbaar worden gemaakt.
  • De data worden niet gegenereerd in de loop van je eigen onderzoeksproject, maar worden aangeleverd door een andere partij (bijvoorbeeld een commerciële aanbieder, overheidsinstantie, …).
  • Onderzoeksdata- of liever de vorm waarin ze tot uitdrukking komen – kunnen onder bepaalde omstandigheden worden beschermd door auteursrecht en/of databankenrecht.
  • De onderzoeksdata kunnen een octrooieerbare uitvinding zijn, of commercieel waardevolle knowhow bevatten. Als ze (voortijdig) worden gedeeld, kan dit jouw valorisatie-inspanningen in gevaar brengen.

Is er sprake van een legitieme reden zoals we hier beschreven hebben? Dan zullen subsidieverstrekkers, instellingen en gerenommeerde tijdschriften/uitgevers afwijken van de voorwaarden die zij hanteren met betrekking tot het delen van data. Er wordt wel van je verwacht dat je als onderzoeker de juiste rechtvaardiging opgeeft, bijvoorbeeld in het datamanagementplan of in een datatoegankelijkheidsverklaring die je opneemt in je publicatie. Een datatoegankelijkheidsverklaring wordt meestal opgenomen in het onderdeel ‘Acknowledgment’ van je artikel. Zo’n verklaring geeft aan waar en hoe de data waarop het artikel is gebaseerd kunnen worden geraadpleegd. En als de data niet beschikbaar kunnen worden gemaakt, waarom dat het geval is.

Data licenties

Bij het openbaar maken van onderzoeksdata is het van belang om potentiële gebruikers vooraf te laten weten wat ze met de data mogen doen. Licenties zijn een effectieve manier om dit te doen. Een goed data-archief zal normaal gesproken een licentie toepassen op elke dataset die erin wordt opgenomen. Doorgaans kun je een keuze maken bij het deponeren van data. DANS Data Stations  biedt een lijst van licenties[NS1]  aan. Bij elke licentie wordt gelinkt naar meer informatie over die specifieke licentie.

Een goede praktijk is het toepassen van een standaard en open licentie voor open onderzoeksdata, dit zorgt voor juridische uitwisselbaarheid en een zo breed mogelijk hergebruik. Een van de standaardlicenties die veel worden gebruikt voor onderzoeksdata, is de reeks Creative Commons (CC) -licenties.

  • De CC-licentie Naamsvermelding (CC BY) geeft anderen maximale vrijheid om de data te hergebruiken (d.w.z. kopiëren, herdistribueren, aanpassen), op voorwaarde dat ze de juiste erkenning geven.
  • De CC-licentie Naamsvermelding-GelijkDelen (CC BY-SA) geef dezelfde vrijheid aan anderen als CC BY, maar vereist herdistributie van afgeleide werken (die op jouw data zijn gebaseerd) onder dezelfde licentie.
  • De CC-licentie Naamsvermelding-NietCommercieel zou je in kunnen zetten bij het aanvragen van een octrooi of  bij het commercialiseren van je onderzoek. In de setting van onderzoek bij De Haagse Hogeschool waarin het onderzoek wordt gedaan met publieke middelen, is het commercieel inzetten van je data niet gebruikelijk. Bij deze licentie is er amper sprake van een open licentie.
  • De CC-licentie Naamsvermelding-GeenAfgeleideWerken geeft anderen de mogelijkheid om de data te gebruiken en de delen zoals ze zijn maar op geen enkele manier te wijzigen of te transformeren. Dit komt bij data echter op hetzelfde neer als ‘Alle rechten voorbehouden’ en anderen kunnen niet veel meer doen dan resultaten verifiëren die al uit de data zijn afgeleid. Deze licentie is het meest beperkend voor een gebruiker. 

De CC-licenties zijn algemene licenties. Heel goed toepasbaar bij data, maar ook bij onder andere publicaties. Er bestaan licenties die specifiek van toepassing zijn op data. Dit zijn zogenaamde Open Data Commons, onder te verdelen in drie licenties:

En in het geval dat jouw dataset software bevat, kan je de Open Source Licenses gebruiken

Hulp nodig bij het selecteren van een geschikte standaardlicentie? Bekijk deze EUDAT-licentieselectietool

Bekendheid geven aan je data

Er bestaan verschillende mogelijkheden om de bekendheid en toegankelijkheid van je data te vergroten. Wanneer je onderzoeksoutput creëert, kun je je data toevoegen als aanvullend materiaal. Dit werkt bij posters, papers of andere publicaties. Een verrijkte publicatie is een online publicatie waarin een artikel vergezeld gaat met bijvoorbeeld (links naar) onderzoeksdata, illustraties, visualisaties, internetbronnen en commentaren.

Heb je een bijzondere dataset gecreëerd of verzameld? Of is de gebruikte methodologie innovatief en het waard om uitgebreider besproken te worden dan alleen in een korte paragraaf in een artikel? Dan kun je overwegen om een artikel te publiceren in een datatijdschrift. Dit is waardevol om de volgende redenen:

  • Samen met je artikel wordt je dataset peer-reviewed en zo krijgt het een wetenschappelijke accreditatie voor hergebruik.
  • Met het artikel over je dataset maak je je methodologie en resultaten nog transparanter.
  • De publicatie in een datatijdschrift is een andere toegankelijke route die leidt tot je dataset. Daarmee wordt de bekendheid van de publicatie vergroot.

Voorbeelden van datatijdschriften:

Datacitatie

De publicatie (het publiekelijk delen) van datasets telt steeds meer mee als citeerbare bijdrage aan het onderzoekscurriculum. Het citeren van onderzoeksdata maakt onderdeel uit van de Altmetrics-beweging (alternative metrics) die stelt dat de impact van je onderzoek bepaald wordt door (de verwijzingen naar) een breed scala aan onderzoeksoutput zoals datasets, software, blogposts, presentaties, etc.

Datacitatie:

  • maakt data makkelijker vindbaar; 
  • bevordert reproduceerbaarheid; 
  • bevordert hergebruik van data; 
  • maakt het mogelijk de impact van de onderzoeksdata te volgen; 
  • creëert een publicatiestructuur die langetermijnbeschikbaarheid van data mogelijk maakt; 
  • biedt een structuur waarbinnen de impact van de data terug te voeren is naar de onderzoekers die de data creëerden. 

Om citeerbaar te zijn, heeft een dataset een persistent identifier (PID) nodig. Bij het publiceren van data in een data-archief zoals DANS Data Stations wordt er automatisch een PID aan de dataset toegekend. Door de PID kunnen je data altijd gevonden worden, ook bij veranderen van naam en plaats. Gebroken links of ‘page not found’ meldingen worden voorkomen door het gebruik van een PID bij datacitatie. Digital Object Identifiers (DOI’s) worden algemeen geaccepteerd als de persistent identifier voor datacitatie. Ook DANS Data Stations maakt gebruik van DOI’s. 

Een voorbeeld van een standaard-datacitatie naar een dataset in DANS Data Stations: 

Hageraats, C. (Sweco)(1) (20190603)(2): Overzijde Karel van Gelreweg 22 te Eeerbeek Bureauonderzoek en inventarisered veldonderzoek door middel van verkennende boringen.(3) DANS.(4) https://doi.org

  1. Auteur: diegene die de dataset heeft gecreëerd, individuele personen en/of organisatie.
  2. Datum: het jaar waarin of de exacte datum waarop de dataset is gepubliceerd.
  3. Titel: de naam die is gegeven aan de dataset of de naam van het onderzoeksproject.
  4. Uitgever: het archief verantwoordelijk voor het beschikbaar stellen van de dataset.
  5. Online locatie: DOI of een andere persistent identifier.

Andere mogelijke elementen bij datacitatie zijn:

  • Redactie: persoon of personen (anders dan de auteur) verantwoordelijk voor het samenstellen, bewerken en redigeren van de dataset.
  • Het formaat van de databestanden.
  • Versie, indien er meerdere versies van de dataset zijn gedeponeerd.

Deze korte video met de titel ‘Publiceren’ illustreert de belangrijkste aspecten waarmee je rekening moet houden bij het publiceren van onderzoekdata. De video ‘Publiceren’ is gemaakt in 2022 door DCC-PO, een netwerk van hogescholen voor de ondersteuning van Research Data Management.

 

Data archiveren

Wanneer je onderzoek is afgerond en je bezig bent met het publiceren van je onderzoeksresultaten, komt ook het archiveren van je data om de hoek kijken. Hierdoor zorg je ervoor dat je onderzoek kan worden geverifieerd en gereproduceerd. Het archiveren van data draagt bij aan transparantie en onderzoekintegriteit. Het is een van de zorgplichten beschreven in de Nederlandse gedragscode wetenschappelijke integriteit.

Dataselectie

Welke onderzoeksdata zijn geschikt voor archivering?

  • Om hierover te beslissen, neem je eerst de volgende algemene criteria in beschouwing:
    • Onderzoeksresultaten die een hoge maatschappelijke impact hebben moeten altijd verifieerbaar blijven (bv. klinische trials)
    • Neem indien van toepassing de eisen, bepalingen of voorwaarden van je subsidieverstrekker en uitgever in acht
    • Archiveer data die een hoge potentiële hergebruikwaarde hebben
    • Neem de wetenschappelijke, culturele of historische betekenis van data mee in je overweging. Data die bijvoorbeeld waardevol zijn voor wetenschapshistorisch onderzoek komen in aanmerking voor archivering
    • Wanneer de waarde van data voortkomt uit de complexiteit om de data opnieuw te creëren komen ook deze data in aanmerking voor archivering. De waarde van het databehoud is dan groter dan de kosten om de data te creëren
    • Kijk naar de bruikbaarheid van de data: dataformaat, voldoende documentatie en metadata, duidelijkheid over het eigendomsrecht
  • Vervolgens kan je een gedetailleerde keuze maken met behulp van de volgende punten:
    • In het algemeen is de aangewezen praktijk om zo veel mogelijk de ruwe data te archiveren. Maar er bestaan redenen om de bewerkte data te delen, bijvoorbeeld als jouw onderzoek juist is bedoeld om een nieuwe methode te demonstreren. Het archiveren van interviews in audio- of videoformaten wordt ook afgeraden omdat het moeilijk is om zulke data te anonimiseren
    • Bij simulaties is het beter om de data te archiveren die voor de simulatie zijn gebruikt (in plaats van de data die het resultaat vormen van de simulatie)
    • In het geval van experimenten is het altijd verstandig om al de data te archiveren die noodzakelijk zijn om jouw experiment te herhalen
    • Wanneer je ingevulde vragenlijsten archiveert, is het niet nodig om de lege vragenlijsten ook te archiveren. Maar indien je vanwege de gevoeligheid van de data de antwoorden niet wilt delen, archiveer je wel de legen vragenlijsten om deze te kunnen delen
    • Ruwe data van interviews die persoonlijke gegevens en gevoelige informatie bevatten, dienen vernietigd te worden direct nadat ze geanonimiseerd zijn
    • Software en code zijn belangrijk om te archiveren zodat je zelf de simulaties kunt herhalen en zodat andere onderzoekers jouw code kunnen valideren en verder kunnen ontwikkelen
    • Het is meestal niet nodig om tussentijdse data of hulpdata te archiveren. De finale data zijn daarentegen belangrijk wanneer ze de basis vormen van jouw resultaten. Deze data zijn namelijk cruciaal voor de integriteit en de verificatie van je resultaten
    • Archiveer data van een externe partij alleen wanneer de licentie of de voorwaarden het toelaten om de data te archiveren. Zo niet, dan zorg je ervoor dat je deze data goed documenteert en archiveer je deze documentatie. Indien de externe partij zelf de data heeft gearchiveerd, kun je naar deze data verwijzen
Data verwijderen

Bij de data die je niet archiveert, moet je overgaan tot vervolgmaatregelen. Hier hoort bijvoorbeeld bij dat je de data zorgvuldig verwijdert. Geef daarbij extra aandacht aan gevoelige data. Bij het verwijderen van data moet je voorkomen dat dat alsnog hersteld kunnen worden en je moet ervoor zorgen dat de data verwijderd worden op al je opslaglocaties. De betrouwbaarste manier om data te vernietigen, is het volledig fysiek onbruikbaar maken van de drager. Bij device-onafhankelijke opslag of wanneer je je device wilt behouden, moeten bestanden worden overschreven om ze ontoegankelijk te maken. Dit wordt data erasure, data clearing, data wiping of data destruction genoemd.

Bewaartermijn van data

Volgens de Nederlandse gedragscode wetenschapsbeoefening is tien jaar een minimale bewaartermijn voor de ruwe onderzoeksgegevens in Nederland. Daarnaast is de bewaartermijn van data afhankelijk van het vakgebied, de ontwikkelingen daarin, de kosten van opslag en toegankelijk maken, en het verwachte (her)gebruik. Datasets die tot erfgoed worden gerekend, zoals resultaten van archeologisch onderzoek, worden in de regel voor de eeuwigheid bewaard. In sommige gevallen is het wettelijk bepaald hoe lang data moeten worden bewaard. De Algemene verordening gegevensbescherming (AVG) noemt geen concrete bewaartermijn voor persoonsgegevens maar stelt wel dat die gegevens niet langer mogen worden bewaard dan noodzakelijk is. 

Deze korte video met de titel ‘Archiveren’ illustreert de belangrijkste aspecten waarmee je rekening moet houden bij het archiveren van onderzoekdata. De video ‘Archiveren’ is gemaakt in 2023 door DCC-PO, een netwerk van hogescholen voor de ondersteuning van Research Data Management.

 

Consortium

Bij een samenwerking met andere instellingen of organisaties zal in gezamenlijkheid moeten gekeken worden bij welke instellingen welke data waar worden gearchiveerd en hoe het delen van de data wordt gefaciliteerd. Deze afspraken moeten worden opgenomen in het (gezamenlijke) datamanagementplan maar daarnaast ook schriftelijk worden vastgelegd in een consortiumovereenkomst. Ga periodiek na of alle partijen de procedures blijven naleven die zijn afgesproken.

Ondersteuning door een data steward

Onderzoekers kunnen ondersteuning krijgen bij research datamanagement. De research datasteward(s) van de HHs zijn te benaderen via [email protected].