Aineiston dokumentoinnilla ja kuvailulla tarkoitetaan usein samaa asiaa, eli kerrotaan miten tutkimus- tai kehittämisaineisto on tuotettu, mitä se sisältää ja miten sitä on käsitelty. Metadata tai kuvailutieto on dataa datasta, eli useimmiten standardoidussa muodossa olevaa tietoa aineistosta. Käsitteet siis liittyvät yhteen ja toisinaan niitä käytetään myös synonyymeinä.
Ilman riittävän tarkkaa tietoa kontekstista, tutkimusaineistot ovat usein hyödyttömiä. Ajatellaan vaikkapa excel-taulukkoon tallennettuja mittaustuloksia. Jos ei ole olemassa mitään tietoa siitä, mitä on mitattu, millä välineillä ja millä asteikolla, aineisto on pelkkiä numeroita taulukossa ja sitä on mahdotonta ymmärtää ja tulkita. Kuvailu tuo tämän kontekstitiedon esiin.
Projektipäällikkö huolehtii siitä, että hankkeessa kerätyn aineiston kuvailutieto tulee tallennetuksi asianmukaisella tavalla.
Aineiston kuvailu on tärkeää, koska:
Kuvailutietojen tallentamiseen on useita erilaisia tapoja.
Kuvailuun ei ole olemassa yhtä kaikkiin aineistoihin sopivaa tapaa, vaan kuvailtavat tiedot kannattaa valita aineiston perusteella.
Tärkeitä tallennettavia tietoja ovat esimerkiksi:
Eri aloilla on käytössä erilaisia metadatastandardeja ja -formaatteja, joita kannattaa käyttää mikäli sopiva löytyy. Vaihtoehtoisesti voit hyödyntää alla olevaa aineiston kuvailun mallia soveltaen omaan aineistoosi. Suosittelemme erityisesti isoille dataseteille koneluettavien standardien käyttöä.
Eri alojen metadatastandardeja löydät esimerkiksi seuraavilta sivuilta:
Kun kuvailet tutkimuksellista aineistoa, keskity itse aineistoon, älä siitä tehtyihin johtopäätöksiin tai julkaisuihin. Kuvaile aineistoa jo hankkeen aikana, älä vasta sen loppuessa. Pyri kuvailemaan aineisto niin tarkasti, että aineistoa tuntemattoman on mahdollista ymmärtää, mistä siinä on kyse. Mitä tarkemmin aineisto on kuvailtu, sitä laadukkaampaa metadata on.
Tallenna lisäksi teksti- tai pdf-tiedostoina samaan hakemistoon aineiston ja kuvailutiedon kanssa:
Tallenna kaikki kieliversiot.
Tallenna kuvailutieto esimerkiksi tekstitiedostona (txt) aineiston yhteyteen seuraavan mallin mukaisesti.
Aineiston nimi: Anna aineistolle mahdollisimman kuvaava nimi.
Aineiston tieteenala: Valitse aineistosi tieteenala Tieteenala 2010 -luokituksesta Tilastokeskuksen sivuilla.
Aineiston tekijät: Henkilöt, jotka ovat vastuussa aineiston ajatuksellisen sisällön kehittelystä eli yleensä hankkeen vetäjät [Nimi, sähköposti, organisaatio ja yksikkö].
Muut aineiston kerääjät, tallentajat ja käsittelijät: Nimi ja organisaatio.
Rahoittajat: Mitkä tahot tai organisaatiot ovat osallistuneet aineiston tuottamiseen hankkeen rahoittajina.
Alkuperäinen käyttötarkoitus: Tiedot hankkeesta, jota varten aineisto on kerätty, mahdollisesta teoreettisesta viitekehyksestä ja käytetyistä operationalisoinneista.
Aineistonkeruun ajankohta: Alkamis- ja päättymispäivät.
Mitä aineistoa on kerätty ja miten: Kuvaa kerätty aineisto mahdollisimman informatiivisesti sekä aineistonkeruussa käytetty menetelmä. Kuvaa esim. aineiston perusjoukko eli se ihmis- tai asiaryhmä, joka on tutkimuksen kohteena tai johon tutkimuksen tulokset viittaavat.
Aineiston määrä ja tiedostojen kuvailu: Kuvaa kuinka paljon aineistoa on, kuvaile aineistoon kuuluvat tiedostot hakemistona (tiedoston nimi, formaatti + mitä sisältää).
Aineiston muokkaus: Kuvaa miten aineistoa on muokattu, esim. litteraattien tarkkuus, anonymisointi, aineisto-osien tai muuttujien poisto jne.
Tuotetut julkaisut: Listaa julkaisut, jotka on tehty aineiston pohjalta.
Kieli: Mikä on aineiston kieli.
Käyttöoikeudet: Metropolia suosittelee avoimille aineistoille lisenssiä Creative Commons Nimeä 4.0 (CC BY 4.0). Kirjaa ylös myös jos aineistolla on erityisiä käyttöehtoja sekä kuka antaa tarvittaessa lisätietoja.
Aineiston omistajuus: Kuka omistaa aineiston. Yhteishankkeissa aineiston omistajuus on yleensä määritelty yhteistyösopimuksessa.
Aineiston sijainti: Minne aineisto on tallennettu.
Asiasanat: Kuvaa aineistosi sisältö asiasanoilla (3 - 5 kpl). Etsi asiasanoja YSO-sanastosta.
Luettelo kaikista hankkeessa kerätyistä aineistoista: Esim. haastattelut, tallenteet, päiväkirjat, kenttämuistiinpanot, lehtileikkeet.
Aineistoyksikkökohtaiset tiedot: Esim. lehtileikkeestä lehden nimi, päivämäärä, jutun sijainti lehdessä, kirjoittaja ja otsikko. Haastattelussa haastateltavan taustatiedot ja muut taustatiedot. Tallenna perustiedot kunkin aineistoyksikön yhteyteen, esim. haastattelulitteraatin alkuun, sekä erilliseen listaukseen.
Lähdeaineistot: Jos kyseessä ei ole kysely- tai haastatteluaineisto, tallenna tiedot lähdeaineistoista, esim. kirjat, artikkelit ja rekisteritiedot, jotka ovat olleet aineiston lähteenä.
Tallenna muuttujista seuraavat tiedot
Jos muuttujat tai muuttujien saamat arvot tai selitteet poikkevat kyselylomakkeen kysymyksistä tai vastausvaihtoehdoista, on poikkeavuudet selitettävä.
Muutokset ja muokkaukset: Kirjaa tiedot dataan prosessoinnin yhteydessä tehdyistä muutoksista ja muokkauksista (esimerkiksi duplikaattien poistot, poikkeavien havaintojen poistot). Osa edellä mainituista kuvailutiedoista voidaan kirjata suoraan datatiedostoon
Kontekstitiedoilla tarkoitetaan tutkimusaineiston tiedonkeruuhetkellä vallinneita ulkoisia olosuhteita ja tapahtumia, jotka ovat voineet vaikuttaa havaintoyksiköihin. Esimerkiksi taloudellinen tilanne, poliittiset tapahtumat, yhteiskunnalliset muutokset sekä luonnonmullistukset ja onnettomuudet aineiston keruuaikana voivat vaikuttaa tutkittavien vastauksiin.
Kontekstitietoa kannattaa tarpeen mukaan tallentaa aineiston kuvailutietoihin.
Metropolian kirjasto- ja tietopalvelut | Saavutettavuusseloste