Siirry pääsisältöön

Aineistonhallinta opinnäytetyössä

Opinnäytetyön aineiston kuvailu

Aineiston dokumentoinnilla ja kuvailulla tarkoitetaan usein samaa asiaa, eli kuvataan miten opinnäytetyön tutkimusaineisto on tuotettu, mitä se sisältää ja miten sitä on käsitelty. 

Metadata tai kuvailutieto on dataa datasta, eli useimmiten standardoidussa muodossa olevaa tietoa aineistosta. Käsitteet siis liittyvät yhteen ja toisinaan niitä käytetään myös synonyymeinä. Opinnäytetyön kannalta käsitteiden merkityseroja tärkeämpää on se, mitä kuvailulla ja metadatalla tavoitellaan. 

Miksi aineistoa kuvaillaan?

Ilman riittävän tarkkaa tietoa kontekstista, tutkimusaineistot ovat usein hyödyttömiä. Ajatellaan vaikkapa excel-taulukkoon tallennettuja mittaustuloksia. Jos ei ole olemassa mitään tietoa siitä, mitä on mitattu, millä välineillä ja millä asteikolla, aineisto on pelkkiä numeroita taulukossa ja sitä on mahdotonta ymmärtää ja tulkita. Kuvailu tuo tämän kontekstitiedon esiin.

Eli aineistojen kuvailu on olennainen osa vastuullista aineistonhallintaa, koska ilman sitä aineistoa voi olla mahdotonta tai vaikeaa tulkita.

Mieti etukäteen, mitä tietoja sinun tulee tallentaa kustakin datasetistä (esimerkiksi haastatteluaineisto tai mittausdatasetti), jotta aineistoa on mahdollista ymmärtää. Tärkeää on, että aineisto säilyy ymmärrettävänä, vaikka aikaa kuluisi tai sitä tarkastelisi joku toinen henkilö kuin sinä itse. Väärintulkinnan mahdollisuudet tekevät aineistosta epäluotettavaa, sillä se vaikuttaa siitä saatuihin tuloksiin. 

Myös opinnäytetyönohjaajan pitäisi pystyä ymmärtämään opinnäytetyön aineistoa.

Kuvailulla on merkitystä myös tulosten todentamisessa ja tutkimuksen toistamisessa. Sen avulla todennat, että opinnäytetyön tulokset ovat luotettavat ja ne olisi mahdollista tarvittaessa myös toistaa. 

Riittävä kuvailutieto on erityisen tärkeää, mikäli olet kiinnostunut aineiston avaamisesta julkiseksi tai jatkokäytöstä opinnäytetyön jälkeen. 

Miten opinnäytetyön aineistoa kannattaa kuvailla?

Kuvailu on aina aineistokohtaista, sillä sen tarkoituksena on tehdä aineistosta ymmärrettävä ja oikein tulkittava. Seuraavat kuvailun tasot ovat esimerkkejä tiedoista, jotka kannattaa laittaa ylös.

Opinnäytetyön projektitaso

Projektitason kuvailulla tarkoitetaan opinnäytteessä toteutetun tutkimuksen perustietoja, esimerkiksi:

  • mihin tarkoitukseen aineisto on kerätty
  • millä menetelmällä aineisto on kerätty
  • miten aineistonkeruu on toteutettu (kuka, mistä, milloin ja millä välineellä)
  • aineiston pääsy- ja käyttöehdot (jos sellaisia annetaan, esimerkiksi CC-lisenssillä)

Tiedostotaso

Tiedostotason kuvailulla tarkoitetaan tiedostojen kuvailua, eli niiden ominaisuuksien merkitsemistä ylös. Sen tarkoituksena on helpottaa oikean tiedon löytymistä ja tiedostojen eheyttä. Jos erillisiä tiedostoja on vähän, tiedostotason kuvailua ei välttämättä tarvita opinnäytetyössä.

Tiedostotason kuvailutietoa ovat esimerkiksi:

  • tiedostomuoto
  • tiedoston koko
  • tiedoston nimi
  • tiedostojen suhde toisiinsa, esimerkiksi eri versiot
  • miten tiedostot on järjestetty eri kansioihin
  • miten kansiot on järjestetty ja nimetty

Muuttujataso

Muuttujatason kuvailulla tarkoitetaan tutkimusaineiston muuttujien kuvailua. Muuttujalistan ja mitta-asteikon lisäksi on hyvä kirjata ylös myös käytetyt merkinnät, lyhenteet ja koodaukset. 

Aineiston luotettavuuden ja eheyden varmistamiseksi on myös tärkeää kirjata ylös miten aineistoa on käsitelty ja muokattu. 

Kontekstitiedot ja paradata

Edellä mainittujen lisäksi voidaan tallentaa myös kontekstitietoja tai paradataa, mikäli ne ovat aineiston kannalta merkityksellisiä. 

Kontekstitiedoilla tarkoitetaan tietoa tiedonkeruun hetkellä vallinneista ulkoisista olosuhteista, jotka voivat vaikuttaa aineistoon. Tällaisia ovat esimerkiksi yhteiskunnalliset tapahtumat, luonnonkatastrofit tai onnettomuudet.

Paradata taas on empiiristä tietoa aineistonkeruun prosessista, esimerkiksi haastattelun eri osien kesto, vastausviive kysymyksiin tai haastattelijan visuaaliset havainnot haastattelutilanteessa.

Minne kuvailutiedot tallennetaan?

Kuvailutietojen tallentamiseen on useita vaihtoehtoja. Esimerkiksi:

  • erillinen tekstitiedosto, joka nimetään Readme-nimellä ja tallennetaan aineiston yhteyteen. Readme-tiedostoja voi luoda useampiakin. 
  • varsinaisen datatiedoston sisälle. Esimerkiksi excel-taulukon yhdelle välilehdelle muuttujien selitykset tai haastattelulitteraatin alkuun haastateltavan taustatiedot ja päivämäärä. 
  • excel-taulukko tai tietokanta. Sopivat usein paremmin isommille aineistoille kuin readme-tiedosto.
  • Digitaalinen tutkimuspäiväkirja 

Metropolian kirjasto- ja tietopalvelut | Saavutettavuusseloste