Siirry pääsisältöön

Aineistonhallinta hankkeissa

Tutkimusdatan avaaminen

Metropolia on sitoutunut edistämään avointa TKI-toimintaa, johon sisältyy myös tutkimusaineistojen avaaminen aina silloin kun se on mahdollista. Tutkimusdatan avaaminen tarkoittaa tutkimusaineiston avaamista kaikkien saataville tai tutkimuskäyttöön. Tämä tarkoittaa yleensä aineiston tallentamista jonnekin avoimen datan palveluun, joita ovat esimerkiksi IDA, AVAA, Aila, Zenodo, OpenAIRE jne.

Avaamisessa hyödynnetään esimerkiksi CC-lisenssejä, joilla aineiston omistaja luovuttaa käyttöoikeuksia aineistoonsa. CC-lisenssin käyttö ei tarkoita tekijänoikeuksista luopumista, vaan sen avulla on mahdollista tarjota aineisto muiden käytettäväksi tiettyjen ehtojen mukaisesti. Käyttöehdot riippuvat valitusta lisenssistä. Avoimille aineistoille suosittelemme CC-lisenssiksi Nimeä 4.0 Kansainvälinen (CC BY 4.0), joka sallii myös aineiston kaupallisen käytön, mutta vaatii lähdeviittauksen. 

Aineiston avaaminen vaatii aineiston hyvää hallintaa alusta alkaen. Avaaminen tulee huomioida mm. yhteistyösopimuksissa, tutkittavien informoinnissa sekä anonymisoimalla mahdollinen sensitiivinen data.  

Sensitiivistä dataa kuten henkilötietoja tai liikesalaisuuksia ei voi avata sellaisenaan. Tällaisissakin aineistoissa kuitenkin saattaa olla osia, jotka on mahdollista avata, tai aineisto on mahdollista anonymisoida niin, että sen sisältämät tunnistetiedot poistetaan kokonaan. 

Aineistoa voi pyytää avattavaksi tekemällä datakatalogi-ilmoituksen. Ilmoituksen jälkeen datatukipalvelut ohjeistaa aineiston pakkaamisessa, anonymisoinnissa ja tiedonsiirrossa sekä varmistaa, että aineisto sopii avattavaksi. Kun aineisto on avattu, Metropolia vastaa siitä, että aineisto säilyy käyttökelpoisena ja saavutettavana. 

Datan avaamisen hyödyt

  • Edistää aineistojen jatkokäyttöä
    • uusissa hankkeissa - aina ei tarvitse tehdä kaikkea alusta asti itse
    • opetuksessa 
    • liiketoiminnassa - datan avaaminen voi lisätä kaupallisia innovaatioita
    • pystyt käyttämään aineistoa myös itse, jos vaihdat työpaikkaa
  • Aineistot saavat näkyvyyttä tiedejatutkimus.fi -sivulla, joka on kotimaisen tutkimuksen näyteikkuna
  • Avoimet aineistot ovat tekijälleen meriitti
  • Rahoittajat saattavat edellyttää avoimuutta - avoimuudesta voi olla hyötyä myös rahoituksen saamisessa
  • Lisää tutkimuksen läpinäkyvyyttä ja toistettavuutta
  • E​distää demokratiaa

Datan avaamisen periaatteet

  • Sensitiivistä dataa ei avata
  • Avaaminen ei saa olla ristiriidassa lainsäädännön, tietosuojan, tutkimusetiikan tai sopimusten kanssa
  • Datan säilytystavoista ja mahdollisesta avaamisesta on informoitava tutkittavia
  • Datan voi avata myös osittain
  • Datan voi avata embargollisena (avataan tietyn ajan jälkeen) tai vain palveluun kirjautuneiden käyttöön
  • Datan tulisi siis olla ”niin avointa kuin mahdollista, niin suljettua kuin tarpeen"

FAIR-periaatteet

Tutkimusaineistojen jatkokäytön edistämiseksi datan tulisi olla FAIR-periaatteiden mukaista.

Löydettävä (Findable)

  • Selkeät metatiedot datakatalogissa
  • Kuvailusivu, jolla ainutkertainen pysyvä tunniste

Saavutettava (Accessible)

  • Ladattavissa verkossa
  • Versiot ja elinkaari dokumentoitu
  • Muistosivu poistetulle aineistolle

Yhteentoimiva (Interoperable)

  • Yhteiset, dokumentoidut ja avoimet formaatit

Uudelleenkäytettävä (Re-usable)

  • Ymmärrettävä ja riittävästi kuvailtu
  • Käyttöehdot selkeästi esillä

Kansainväliset data-arkistot

Eri aloilla on omia kansainvälisiä data-arkistojaan, joiden kautta aineistoja on mahdollista jakaa oman alan asiantuntijoille. Aineiston jakaminen alakohtaisen data-arkiston kautta lisää aineiston ja TKI-hankkeen näkyvyyttä ja voi auttaa löytämään uusia yhteistyökumppaneita. Nämä data-arkistot sopivat lähinnä aineistoille, jotka ovat myös kansainvälisesti mielenkiintoisia. 

Yleisenä kansainvälisenä data-arkistona suosittelemme CERN:n ylläpitämää Zenodoa. Autamme tarvittaessa sopivan kansainvälisen data-arkiston kartoittamisessa.

PAS - Pitkäaikaissäilytys

​Pitkäaikaissäilytyksellä tarkoitetaan aineiston säilyttämistä käyttökelpoisena pitkiä aikoja, kymmeniä, jopa satoja vuosia. Koska teknologia kehittyy ja tiedostomuodot vanhentuvat, hyvin pitkäaikainen digitaalinen säilytys on aina dynaamista: tiedostoja esimerkiksi konvertoidaan formaatista toiseen, jotta ne saa auki myös tulevaisuudessa.

CSC:n PAS-palvelu on muunmuassa korkeakouluille suunnattu pitkäaikaissäilytyksen palvelu. PAS vaatii organisaatiokohtaista sopimusta ja henkilöstöresursseja, joten sen käyttöönotosta on aina sovittava erikseen. PAS:in ohjataan erityisen merkittäviä ja arvokkaita aineistoja.

Data-artikkelit

TKI-hankkeessa voidaan julkaista aineistoa kuvailevia data-artikkeleita, jotka kelpaavat myös julkaisutiedonkeruuseen.

Tieteellinen datan kuvailuun erikoistunut lehti on esimerkiksi Elsevierin kustantama Data in Brief. 

Jos hankkeessasi on tuotettu tutkimusaineistoa, joka voisi kiinnostaa myös muita toimijoita, ja olet kiinnostunut data-artikkelin julkaisusta osana Metropolian julkaisusarjaa, ota yhteyttä julkaisut@metropolia.fi. Metropolialla on valmis mallipohja data-artikkelin julkaisuun. 

Metropolian kirjasto- ja tietopalvelut | Saavutettavuusseloste