Dela forskningsdata
Att dela och göra forskningsdata tillgänglig ökar allt mer inom forskningsvärlden. Både från nationella och internationella myndigheter och organisationer samt från finansiärer och förlag finns efterfrågan och krav på att tillgängliggöra och dela sin forskningsdata.
Varför dela forskningsdata?
Det finns en mängd anledningar för både forskare och samhället i stort att forskningsdata tillgängliggörs.
-
Att återanvända data sparar pengar och minskar dubbelarbete. Forskarna kan fokusera på att ta fram nya data istället för att samla in data som redan finns. Enklare att bedöma om det är värt att genomföra en ny studie
-
Ett större genomslag- citeringar och nedladdningar av data ger erkännande för forskaren
-
Delad data innebär nytta för samhället - offentligt bekostad forskning bör vara fritt tillgänglig för allmänheten .
-
Mer synlighet genererar fler samarbeten - andra forskare får kännedom om din forskning och data vilket kan bidra till nya kontakter och samarbetsmöjligheter.
-
Forskningen blir mer transparent; genom att data delas så ökar möjligheten att kontrollera och återupprepa forskningsresultat.
-
Datan uppfyller de så kallade FAIR-principerna, som är vägledande för att ge stöd till att till att data ska vara tillgängliga och återanvändningsbara för både maskin och människa. FAIR står för Findable (Sökbara), Accessible (Tillgängliga), Interoperable (Interoperabilitet) och Reusable (Återanvändbara).
-
Uppfylla de krav och rekommendationer som förlag, finansiärer och lärosäten kan ha på att dela data.
Mer information:
- FAIR-principerna (SND)
- Dela data på ett FAIR sätt (SND)
- Öppna och delade data (DIGG)
Att dela forskningsdata
Hur du som forskare ska dela din forskningsdata beror mycket på vilken slags data det handlar om, till exempel kräver videoinspelningar med barn ett annat förfarande än data om jordprover. För att få stöd hur du ska går tillväga i just ditt fall kontakta DAU-funktionen vid Högskolan Väst.
Det finns flera olika sätt att publicera och tillgängliggöra data. Forskningsdata kan publiceras ihop med en publikation eller som ett eget dataset. Ibland tillgängligörs datan på ett förlags webbplats, men ännu vanligare är att den deponeras i ett så kallat datarepositorium
Ett viktigt steg i att kunna dela sin forskningsdata är att datan har hanterats rätt, det vill säga att den har dokumenterats och lagrats på ett tydligt och tillgängligt sätt så det är lätt för framtida användare att ta del av den. Genom att planera datahanteringen och upprätta en datahanteringsplan så underlättas även delningen av data.
Känslig data
Som nämnts tidigare så måste man se varje forskares data från fall till fall och se om det är möjligt att dela den öppet. Det kan finnas etiska, juridiska eller upphovsrättsliga skäl till att inte dela och publicera forskningsdata. Det kan gälla data som till exempel innehåller känsliga personuppgifter. En annan aspekt är sekretessbelagd data som innehåller exempelvis företagshemligheter.
" As open as possible, as closed as necessary"
Citatet ovan illustrerar förhållningssättet kring att tillgängliggöra forskningsdata - att den ska vara öppen som möjligt för att främja återanvändning och påskynda forskning men samtidigt vara stängd för att skydda forskningsdeltagarnas integritet.
Det innebär dock inte att även om du som forskare har känslig forskningsdata aldrig kommer att behöva dela den. Majoriteten av forskningsdatan i Sverige genomförs på lärosäten och omfattas av offentlighetsprincipen vilket innebär att den kan lämnas ut efter etik-eller sekretessprövning till andra forskare. Därför bör man inte lova forskningsdeltagarna att datan aldrig kommer att lämnas ut till andra.
Så även om det inte går att dela forskningsdata helt öppet så finns det alltid möjlighet att skriva en beskrivning av datan, så kallad metadata och tillgängliggöra den.
Mer information:
Licenser och embargo
För att skydda forskningsdata och tydliggöra för framtida användare hur den får återanvändas så kan man som upphovsman sätta en licens på datan. Ofta är det en så kallad Creative Commons-licens (CC-licens) som är vanligast. En CC-licens kan förtydliga om hur och om datan får till exempel omvandlas, delas och anpassas samt i vilka sammanhang. Det finns flera olika CC-licenser och många har det gemensamt att upphovsmannen ska ha erkännande om datan används.
Embargo innebär i detta sammanhang att det dröjer en längre tid mellan att datan publicerad tills den den får återanvändas. Embargo är vanligt när det gäller artiklar i publiceringssammanhang, men relativt ovanligt när det gäller forskningsdata. Exempel vid tillämpning av embargo är när datan kan innehålla affärshemligheter för ett företag. Generellt rekommenderas inte embargo för offentligt finansierad forskningsdata om det inte är ett absolut krav.
Mer information
Datarepositorier
Ett datarepositorium är en databas som lagrar och tillgängliggör forskningsdata eller beskrivning om datan. Genom att publicera din forskningsdata i ett repositorium så ger du din data en beskrivning (metadata) så den blir interoperabel och möjlig att återanvända.
Din forskningsdata får också en så kallad beständig identifierare (PID) så gör den lättare att hitta och citera. En beständig identifierare är ett unikt ID-nummer som identifierar ett objekt permanent. Exempel är ISBN för böcker och DOI för artiklar. Det sistnämnda används även vid identifiering av forskningsdataset.
Exempel på repositorier
Det finns många datarepositorer världen över där det går att dela och publicera data.
DORIS - är ett svenskt nationellt och certifierat verktyg för publicering av data som tillhandahålls av konsortiet Svensk Nationell Datatjänst (SND) och är gratis. Där kan forskningsdata kan delas öppet eller göras sökbara genom publicerade beskrivningar av dataset som av olika skäl inte kan delas öppet. Detta är det bästa alternativet för att dela forskningsdata som innehåller känsliga data som till exempel personuppgifter.
Zenodo - är skapad av de europeiska forskarorganisationerna CERN och OpenAire. Här går det att ladda upp till 50 GB utan kostnad.
Figshare - är ett övergripande repositorium och tillgängligt för alla discipliner. Det går att ladda upp till 20 GB utan kostnad.
Re3data - är ett register över både generella och ämnesspecifika datarepositorier. Här finns möjlighet att söka och filtrera på olika kategorier.
Mer information:
- FAQ Dela data (SND)
- PID (SND)
- PID/DOI-tjänst (SND)