Datu pārvaldības plāns
Pirmais posms pirms datu ievākšanas un apstrādes ir datu pārvaldības plāna (DMP) izveide. DMP ir instruments, kas ļaus pētniekiem rūpīgi izvērtēt visus galvenos pētniecības datu pārvaldības aspektus, tādējādi sniedzot viņiem virzienu uz vislabāko iespējamo rezultātu. DMP palīdzēs pētniekiem plānot visas darbības attiecībā uz datu vākšanu (tostarp ētiskiem un tehniskiem nosacījumiem), datu apstrādi un publicēšanu.
Galvenie jautājumi
Lai izstrādātu DMP, ir jāievēro visas finansējošās institūcijas vai RSU dotās instrukcijas (gadījumos, kad ir sniegta RSU veidne). DMP ietver visu informāciju, kas nepieciešama, lai dati būtu FAIR principiem atbilstoši, kā arī ņem vērā resursus un datu drošību. Instrukcijas par piekļuvi RSU DMP veidnei tiks nodrošinātas, tiklīdz tā tiks publicēta Argos. Varat arī apskatīt dažādus citus DMP un to rīku piemērus sadaļā Tiešsaistes rīki un noderīgas saites.
Apraksts un zemāk apkopotie jautājumi piedāvā sākotnējo ieskatu, lai domātu un formulētu DMP.
- Vispārīgi
Norādiet datu vākšanas un ģenerēšanas mērķi, kā arī izskaidrojiet saistību ar projekta mērķiem. Sniedz kopsavilkumu par datu izcelsmi. Vienlaikus jums ir jāsniedz informācija par ģenerēto un savākto datu tipiem, formātiem un lielumu. Ir svarīgi norādīt, vai izmantosiet jau esošu datu kopu (atkārtoti izmantojot datus). Aprakstiet datu izmantošanu: kam tas noderēs?
Jautājumi
- Kāds ir izpētes mērķis?
- Kādi ir dati? Kā un kādā formātā tiks vākti dati? Vai tie ir skaitliski dati, attēlu dati, teksta secības vai modelēšanas dati?
- Cik daudz datu tiks ģenerēts šim pētījumam?
- Vai jūs izmantojat datus, ko kāds cits ir sagatavojis? Ja izmantojat, no kurienes tas ir?
- Kādi dati tiks kopīgoti, kad un kā?
- Atrodamība
Paskaidrojiet, kā jūsu dati tiks padarīti atrodami. Lai to izdarītu, jāapraksta datu atrodamība (metadatu sniegšana), jāizmanto standarta identifikācijas mehānismi (pastāvīgie un unikālie identifikatori). Jums ir jānorāda, vai plānojat izmantot atslēgvārdu nosaukumdošanas konvencijas. Vai būs iespējams skaidri redzēt datu kopas versijas? Ļoti svarīgi ir arī norādīt metadatu izveidei izmantotos standartus. Ja jūsu disciplīnā nav standartu, aprakstiet, kāda tipa metadati tiks izveidoti un kā.
Jautājumi
- Vai izmantojat metadatus, kas atbilst jūsu nozares standartiem? Kā tiks pārvaldīti un saglabāti metadati?
- Kādu mapju un datņu nosaukumdošanas pieeju izmantosiet?
- Vai šis pētījums tiks publicēts žurnālā, kas pieprasa norādīt pētījuma pamatā izstrādātos datus?
- Pieejamība
Paskaidrojiet, cik pieejami būs jūsu dati. Lai to izdarītu, ir jānorāda, kuri dati datu kopās būs pieejami, kā arī jāsniedz paskaidrojums gadījumos, ja daļa datu tiks aizvērta. Lai datus padarītu pieejamākus, jāapraksta arī tas, kā dati tiks padarīti pieejami, norādot metodes un programmatūras rīkus, kas nepieciešami, lai piekļūtu datiem, kur tiek uzglabāti dati un saistītie metadati, dokumentācija un kods. Būtiski ir izskaidrot, kā tiks nodrošināta piekļuve gadījumā, ja dati tiks ierobežoti.
Jautājumi
- Vai ir pieejams ar jomu saistīts repozitorijs?
- Kādu dokumentāciju izstrādāsiet, lai dati būtu saprotami citiem pētniekiem?
- Kādi rīki vai programmatūra ir nepieciešami, lai lasītu vai skatītu datus?
- Vai būs kādi ierobežojumi attiecībā uz datu pieejamību?
- Vai datu izmantošanai ir nepieciešama programmatūra vai rīki? Vai tie tiks arhivēti?
- Sadarbspēja
Novērtējiet datu sadarbspējas potenciālu, t. i., atļaujot datu apmaiņu un atkalizmantošanu starp pētniekiem, iestādēm, organizācijām, valstīm utt. Norādiet, kādiem standarti, kontrolētās vārdnīcas un taksonomijas sekosiet, lai atvieglotu savietojamību. Norādiet, vai izmantosit standarta kontrolēto vārdnīcu visiem datu kopas datu tipiem, lai nodrošinātu starpdisciplīnu savietojamību.
Jautājumi
- Kādi datņu formāti tiks izmantoti? Vai šie formāti atbilst atvērtiem standartiem un vai tie ir komerciāli pieejami?
- Kā sagatavosiet datus saglabāšanai vai datu koplietošanai? Vai dati tiks anonimizēti, vai konvertēti drošākos failu formātos?
- Vai izmantojat datnes formātu, kas atbilst jūsu nozares standartiem? Ja nē, kā dokumentēsiet izmantoto alternatīvu?
- Atkārtota izmantojamība
Norādiet, kā dati tiks licencēti, lai nodrošinātu pēc iespējas plašāku atkārtotu izmantošanu. Kad dati būs pieejami atkārtotai izmantošanai? Vajadzības gadījumā norādīt, kāpēc un uz kādu laiku ir nepieciešams datu embargo periods? Norādiet, vai projektā iegūtos un/vai izmantotos datus var izmantot trešās personas, jo īpaši pēc projekta noslēguma. Norādiet laiku, cik ilgi dati būs atkārtoti izmantojami. Ja daļas datu atkārtota izmantošana ir ierobežota, paskaidrojiet, kāpēc. Aprakstiet datu kvalitātes nodrošināšanas procesus.
Jautājumi
- Cik ilgi tiks apkopoti dati un cik bieži tie mainīsies?
- Vai pastāv ar projektu saistīti patentu vai tehnoloģiju licencēšanas ierobežojumi datu koplietošanai?
- Vai ļausiet atkārtoti izmantot vai radīt jaunus rīkus, pakalpojumus, datu kopas vai produktus? Vai tiks atļauta izmantošana komerciāliem nolūkiem?
- Kā arhivēsiet datus? Vai glabāsiet to arhīvā vai repozitorijā ilgtermiņa piekļuvei? Ja nē, kā saglabāsiet piekļuvi datiem?
- Cik ilgi dati jāsaglabā? 3–5 gadi, 10 gadi vai uz mūžu?
- Resursi un drošība
Nosauciet resursus, kas jums pieejami datu izveidei, publicēšanai un glabāšanai. Tāpēc aprēķiniet izmaksas, kas saistītas ar datu atbilstību FAIR principiem. Aprakstiet, kā jūs plānojat segt šīs izmaksas. Skaidri norādiet atbildību par datu pārvaldību jūsu projektā. Aprakstiet ilgtermiņa uzglabāšanas izmaksas. Aprakstiet nodrošinājumu datu atgūšanai, kā arī drošai sensitīvu datu uzglabāšanai un nodošanai. Aprakstiet visus ētiskos vai juridiskos jautājumus, kas saistīti ar datiem, kurus plānojat publicēt. Jums ir jāplāno, kā novērst piekļuvi personas datiem un aizsargāt sensitīvu informāciju. Tai skaitā aprakstot tehniskās metodes, kā apstrādāt personas datus vai sensitīvu informāciju un piekļūt tiem. Svarīgi ir arī pārskatīt normatīvos aktus, kā arī sazināties ar ētikas komiteju.
Jautājumi
- Kas ir atbildīgs par datu pārvaldību? Kas nodrošinās datu pārvaldības plāna izpildi?
- Kam ir tiesības pārvaldīt šos datus? Vai tā ir projekta vadītāja, studenta, laboratorijas vai finansējošās institūcijas atbildība?
- Kādas ir jūsu lokālās uzglabāšanas un dublēšanas procedūras? Vai šiem datiem būs nepieciešama droša glabāšana?
- Vai datu koplietošana rada bažas par privātumu, ētiku vai konfidencialitāti? Vai jums ir plāns datu aizsardzībai vai anonimizēšanai, ja nepieciešams?
- Kam ir intelektuālā īpašuma tiesības attiecībā uz projekta radītajiem datiem un citu informāciju? Vai tiks izmantoti ar autortiesībām aizsargāti vai licencēti materiāli? Vai jums ir atļauja izmantot vai izplatīt šo materiālu?
- Tiešsaistes rīki un noderīgas saites
Argos DMP rīks (izstrādāts OpenAIRE projektā)
DS-Wizard DMP rīks
DMP rīks (California Digital Library)
DMP rīks (Digital Curation Centre)
DMP asistents (Digital Research Alliance Canada)
Pētniecības datu pārvaldības glosārijs (Consortia Advancing Standards in Research Administration)
Praktiskas vadlīnijas par starptautisko praksi pētniecības datu pārvaldībā (Science Europe)
Datu pārvaldības plāna elementi ar praktiskiem piemēriem (North Carolina State University Library)