Skip to main content

Aineistonhallinta ja avoin TKI-toiminta

Aineistojen kuvailutietojen eli metadatan tallentaminen

 

Metadata eli kuvailutieto kertoo mistä aineistossa on kyse, millaista dataa se sisältää. Esimerkiksi haastatteluaineistosta voidaan tallentaa vaikkapa haastatteluajankohta, haastateltujen iät ja mitä haastattelu koskee.

 

Metadata:

  • on tietoa, joka kuvaa mm. kerätyn aineiston aihetta, laatua ja määrää sekä omistus- ja käyttöoikeutta
  • metadata kertoo mistä aineistossa on kyse
  • laadukas metadata tekee tutkimusaineistosta ymmärrettävää
  • on verrattavissa tutkimuksen tiivistelmään, jota ilman käyttäjän on vaikea saada kokonaiskuvaa tutkimuksen sisällöstä ja arvioida tiedon merkitystä
  • auttaa myös aineistoon viittaamisessa
  • Laadukkaalla metadatalla varmistat, että aineistosi on ymmärrettävää myös tulevaisuudessa. Jos se ei ole, aineistolta putoaa pohja. 

Kuvailutietojen tallennusvaatimus koskee mm. seuraavia aineistoja:

  • kysely- ja haastatteluaineistot
  • erilaisten työpajojen ja living labien aineistot
  • tekstiaineistot
  • erilaiset mittaus-, testi- ja mallinnusaineistot
  • kuva- ja äänitallenteet (demot, videot, animaatiot)
  • palauteaineistot

Projektipäällikkö huolehtii siitä, että hankkeessa kerätyn aineiston kuvailutieto tulee tallennetuksi asianmukaisella tavalla. Metadata tulee tallentaa aineiston yhteyteen esimerkiksi erillisenä readme-tiedostona.

Aineiston kuvailun malli


Kun kuvailet aineistoa, keskity itse aineistoon, älä siitä tehtyihin johtopäätöksiin tai julkaisuihin. Kuvaile aineistoa jo hankkeen aikana, älä vasta sen loppuessa. Pyri kuvailemaan aineisto niin tarkasti, että aineistoa tuntemattoman on mahdollista ymmärtää, mistä siinä on kyse. 

Tallenna lisäksi teksti- tai pdf-tiedostoina samaan hakemistoon aineiston ja kuvailutiedon kanssa:

  • aineiston kerääjille ja käsittelijöille annetut ohjeet ja muut dokumentit
  • kirjoituspyynnöt, saatekirjeet
  • haastattelukysymykset, kyselylomakkeet, haastattelurungot

Tallenna kaikki kieliversiot.

Tallenna kuvailutieto esimerkiksi tekstitiedostona (txt) aineiston yhteyteen alla olevan mallin mukaisesti:

 

Perustiedot

Aineiston nimi

Anna aineistolle mahdollisimman kuvaava nimi

Aineiston tieteenala

Tilastokeskuksen tieteenala luokitus 2010

Aineiston tekijät

henkilöt, jotka ovat vastuussa aineiston ajatuksellisen sisällön kehittelystä eli yleensä hankkeen vetäjät [Nimi, sähköposti, organisaatio ja yksikkö]

Muut aineiston kerääjät, tallentajat ja käsittelijät

nimi ja organisaatio

Rahoittajat

Mitkä tahot tai organisaatiot ovat osallistuneet aineiston tuottamiseen hankkeen rahoittajina

Aineisto
 

Alkuperäinen käyttötarkoitus

tiedot hankkeesta, jota varten aineisto on kerätty, mahdollisesta teoreettisesta viitekehyksestä ja käytetyistä operationalisoinneista

Aineistonkeruun ajankohta

Alkamis- ja päättymispäivät

Mitä aineistoa on kerätty ja miten

kuvaa kerätty aineisto mahdollisimman informatiivisesti sekä aineistonkeruussa käytetty menetelmä. Kuvaa esim. aineiston perusjoukko eli se ihmis- tai asiaryhmä, joka on tutkimuksen kohteena tai johon tutkimuksen tulokset viittaavat

Aineiston määrä ja tiedostojen kuvailu

kuvaa kuinka paljon aineistoa on, kuvaile aineistoon kuuluvat tiedostot hakemistona (tiedoston nimi, formaatti + mitä sisältää)

Aineiston muokkaus

kuvaa miten aineistoa on muokattu, esim. litteraattien tarkkuus, anonymisointi, aineisto-osien tai muuttujien poisto jne.

Tuotetut julkaisut

listaa julkaisut, jotka on tehty aineiston pohjalta

Kieli

mikä on aineiston kieli

Käyttöoikeudet

Metropolia suosittelee avoimille aineistoille lisenssiä Creative Commons Nimeä 4.0 (CC BY 4.0). Kirjaa ylös myös jos aineistolla on erityisiä käyttöehtoja sekä kuka antaa tarvittaessa lisätietoja

Aineiston omistajuus

kuka omistaa aineiston. Yhteistyöhankkeissa aineiston omistajuus on yleensä määritelty yhteistyösopimuksessa

Aineiston sijainti

minne aineisto on tallennettu

Asiasanat

kuvaa aineistosi sisältö asiasanoilla (3 - 5 kpl)

Aineistoyksikön kuvailu
Kvalitatiivinen aineisto

Luettelo kaikista hankkeessa kerätyistä aineistoista

esim. haastattelut, tallenteet, päiväkirjat, kenttämuistiinpanot, lehtileikkeet

Aineistoyksikkökohtaiset tiedot

esim. lehtileikkeestä lehden nimi, päivämäärä, jutun sijainti lehdessä, kirjoittaja ja otsikko. Haastattelussa haastateltavan taustatiedot ja muut taustatiedot. Tallenna perustiedot kunkin aineistoyksikön yhteyteen, esim. haastattelulitteraatin alkuun, sekä erilliseen listaukseen.

Lähdeaineistot

Jos kyseessä ei ole kysely- tai haastatteluaineisto, tallenna tiedot lähdeaineistoista, esim. kirjat, artikkelit ja rekisteritiedot, jotka ovat olleet aineiston lähteenä.

Aineistoyksikön kuvailu
Kvantitatiivinen aineisto

Kvantitatiivisen aineiston muuttujista tallennetaan seuraavat tiedot

  • muuttujien ja havaintoyksikköjen lukumäärä
  • muuttujalista, jossa luetellaan kunkin muuttujan nimi, selite ja sijainti tiedostossa sekä muuttujien saamat arvot ja niiden selitteet
  • muuttujien suorat jakaumat
  • tiedot käytetyistä luokituksista, esimerkiksi "ammattiluokituksessa käytettiin ISCO-88:n pääluokkia" tai "maakoodit: kolminumeroinen ISO 3166".
  • käytettyjen lyhenteiden selitykset
  • puuttuvien tietojen koodaukset
  • konstruoitujen muuttujien tiedot (esimerkiksi painomuuttujien laskentakaavat, summamuuttujien muodostamisperiaatteet)
  • uudelleenluokittelut, muuttujien standardoinnit
  • tietosuojatoimenpiteet
  • Jos muuttujat tai muuttujien saamat arvot tai selitteet poikkevat kyselylomakkeen kysymyksistä tai vastausvaihtoehdoista, on poikkeavuudet selitettävä.

Muutokset ja muokkaukset

kirjaa tiedot dataan prosessoinnin yhteydessä tehdyistä muutoksista ja muokkauksista (esimerkiksi duplikaattien poistot, poikkeavien havaintojen poistot). Osa edellä mainituista kuvailutiedoista voidaan kirjata suoraan datatiedostoon.

Kontekstitiedot

Kontekstitiedoilla tarkoitetaan tutkimusaineiston tiedonkeruuhetkellä vallinneita ulkoisia olosuhteita ja tapahtumia, jotka ovat voineet vaikuttaa havaintoyksiköihin.

 

Esimerkiksi taloudellinen tilanne, poliittiset tapahtumat, yhteiskunnalliset muutokset sekä luonnonmullistukset ja onnettomuudet aineiston keruuaikana voivat vaikuttaa tutkittavien vastauksiin. 

 

Kontekstitietoa kannattaa tarpeen mukaan tallentaa aineiston kuvailutietoihin.

 

Metropolian kirjasto- ja tietopalvelut | Metropolia Library and Information Services