Aineiston dokumentoinnilla ja kuvailulla tarkoitetaan usein samaa asiaa, eli kuvataan miten opinnäytetyön tutkimusaineisto on tuotettu, mitä se sisältää ja miten sitä on käsitelty.
Metadata tai kuvailutieto on dataa datasta, eli useimmiten standardoidussa muodossa olevaa tietoa aineistosta. Käsitteet siis liittyvät yhteen ja toisinaan niitä käytetään myös synonyymeinä. Opinnäytetyön kannalta käsitteiden merkityseroja tärkeämpää on se, mitä kuvailulla ja metadatalla tavoitellaan.
Ilman riittävän tarkkaa tietoa kontekstista, tutkimusaineistot ovat usein hyödyttömiä. Ajatellaan vaikkapa excel-taulukkoon tallennettuja mittaustuloksia. Jos ei ole olemassa mitään tietoa siitä, mitä on mitattu, millä välineillä ja millä asteikolla, aineisto on pelkkiä numeroita taulukossa ja sitä on mahdotonta ymmärtää ja tulkita. Kuvailu tuo tämän kontekstitiedon esiin.
Eli aineistojen kuvailu on olennainen osa vastuullista aineistonhallintaa, koska ilman sitä aineistoa voi olla mahdotonta tai vaikeaa tulkita.
Mieti etukäteen, mitä tietoja sinun tulee tallentaa kustakin datasetistä (esimerkiksi haastatteluaineisto tai mittausdatasetti), jotta aineistoa on mahdollista ymmärtää. Tärkeää on, että aineisto säilyy ymmärrettävänä, vaikka aikaa kuluisi tai sitä tarkastelisi joku toinen henkilö kuin sinä itse. Väärintulkinnan mahdollisuudet tekevät aineistosta epäluotettavaa, sillä se vaikuttaa siitä saatuihin tuloksiin.
Myös opinnäytetyönohjaajan pitäisi pystyä ymmärtämään opinnäytetyön aineistoa.
Kuvailulla on merkitystä myös tulosten todentamisessa ja tutkimuksen toistamisessa. Sen avulla todennat, että opinnäytetyön tulokset ovat luotettavat ja ne olisi mahdollista tarvittaessa myös toistaa.
Riittävä kuvailutieto on erityisen tärkeää, mikäli olet kiinnostunut aineiston avaamisesta julkiseksi tai jatkokäytöstä opinnäytetyön jälkeen.
Kuvailu on aina aineistokohtaista, sillä sen tarkoituksena on tehdä aineistosta ymmärrettävä ja oikein tulkittava. Seuraavat kuvailun tasot ovat esimerkkejä tiedoista, jotka kannattaa laittaa ylös.
Projektitason kuvailulla tarkoitetaan opinnäytteessä toteutetun tutkimuksen perustietoja, esimerkiksi:
Tiedostotason kuvailulla tarkoitetaan tiedostojen kuvailua, eli niiden ominaisuuksien merkitsemistä ylös. Sen tarkoituksena on helpottaa oikean tiedon löytymistä ja tiedostojen eheyttä. Jos erillisiä tiedostoja on vähän, tiedostotason kuvailua ei välttämättä tarvita opinnäytetyössä.
Tiedostotason kuvailutietoa ovat esimerkiksi:
Muuttujatason kuvailulla tarkoitetaan tutkimusaineiston muuttujien kuvailua. Muuttujalistan ja mitta-asteikon lisäksi on hyvä kirjata ylös myös käytetyt merkinnät, lyhenteet ja koodaukset.
Aineiston luotettavuuden ja eheyden varmistamiseksi on myös tärkeää kirjata ylös miten aineistoa on käsitelty ja muokattu.
Edellä mainittujen lisäksi voidaan tallentaa myös kontekstitietoja tai paradataa, mikäli ne ovat aineiston kannalta merkityksellisiä.
Kontekstitiedoilla tarkoitetaan tietoa tiedonkeruun hetkellä vallinneista ulkoisista olosuhteista, jotka voivat vaikuttaa aineistoon. Tällaisia ovat esimerkiksi yhteiskunnalliset tapahtumat, luonnonkatastrofit tai onnettomuudet.
Paradata taas on empiiristä tietoa aineistonkeruun prosessista, esimerkiksi haastattelun eri osien kesto, vastausviive kysymyksiin tai haastattelijan visuaaliset havainnot haastattelutilanteessa.
Kuvailutietojen tallentamiseen on useita vaihtoehtoja. Esimerkiksi:
Metropolian kirjasto- ja tietopalvelut | Saavutettavuusseloste