Tälle sivulle olemme koonneet ohjeita ja tietoa tutkimusaineistonhallinnan perusteista ja aineistonhallintasuunnitelman laatimisesta. Sivustolla esitellään mm. seuraavia asioita:
- mitä ovat tutkimusaineistot ja -data
- FAIR-periaatteet
- aineistonhallintasuunnitelma (DMP)
- aineistonhallintapolitiikka tutkimusinfrastruktuureille (DMPol)
- aineistonhallinnan budjetointi.
UEF Datatuki järjestää opintojaksoja ja koulutuksia, joissa käsitellään aineistonhallinnan perusasioita ja aineistonhallintasuunnitelman laatimista myös rahoitushakujen tueksi (Suomen Akatemia ja EU Horizon). Näistä löydät tietoa UEF Datatuen etusivulta kohdasta Koulutukset, opintojaksot ja avoimet materiaalit.
Tutkimusaineisto ja sen hallinta
Tutkimusaineistolla tarkoitetaan tutkimuksen aikana tuotettua tai hyödynnettyä aineistoa, johon tutkimustulokset pohjautuvat. Tutkimusaineistoa on monentyyppistä, esimerkiksi numeerista tietoa, tekstiä, kuvia, äänitteitä, videoita, kyselyaineistoja, ohjelmistoja, lähdekoodeja, algoritmeja, mittaustuloksia, näytteitä tai muistiinpanoja.
Tutkimusdatalla tarkoitetaan usein digitaalisessa muodossa olevaa tutkimusaineistoa, mutta sillä voidaan viitata myös analogiseen tai fyysiseen aineistoon.
Tieteen termipankissa tutkimusaineisto tai tutkimuksen tietoaineisto määritellään tutkijan tuottamaksi tai tutkimusprosessin aikana käyttämäksi resurssiksi, joka on digitaalisessa, analogisessa tai fyysisessä muodossa ja johon tutkimuksen löydökset ja tulokset perustuvat. Tutkimusaineisto voidaan myös ymmärtää hieman laajemmin sellaiseksi kokonaisuudeksi, joka sisältää tärkeää kuvausta ja dokumentaatiota esimerkiksi aineiston tai datan alkuperästä, käsittelystä, sisällöstä tai teknisistä ominaisuuksista.
Tutkimusaineistot voivat muodostaa myös merkittäviä tutkimusinfrastruktuureita.
Aineistonhallintaa ovat kaikki ne toimenpiteet, joilla huolehditaan, että tutkimusaineistoa on helppo käyttää ja tulkita, että se on asianmukaisesti suojattu ja että sen jatkokäyttö on mahdollista.
Aineistonhallintasuunnitelma eli DMP (data management plan) on dokumentti, jossa kuvataan, miten tutkimusaineistoa hankitaan, säilytetään ja käsitellään. Se siis kuvaa koko tutkimusaineiston elinkaaren eli sen, mitä tutkimusaineistolle tapahtuu tutkimuksen aikana ja sen jälkeen. Aineistonhallintasuunnitelma on osa tutkimussuunnitelmaa.
Tutkimusdatapolitiikka tai datapolitiikka on organisaatiokohtainen aineistonhallinnan ohjeistus, jossa kerrotaan tutkimusaineistonhallintaa ohjaavat periaatteet.
Hyvä aineistonhallinta on osa hyvää tieteellistä käytäntöä. Laadukas ja luotettava tutkimus pohjautuu tarkkaan ja kattavaan tutkimusaineistoon, jonka hallinta on hyvin suunniteltu ja huolellisesti toteutettu.
Aineistonhallinnalla varmistetaan laadukkaat ja luotettavat tutkimustulokset, minimoidaan riskejä ja tehostetaan aineiston hyödyntämistä uudelleen. Aineistonhallintaa ovat siten ne toimenpiteet, joilla huolehditaan, että tutkimusaineisto ja siihen liittyvä metatieto on helposti löydettävissä, tulkittavissa, käyttökelpoista ja asianmukaisesti suojattua koko aineiston elinkaaren ajan. On hyvä pitää mielessä, että tutkimusaineiston elinkaari voi olla satoja vuosia pidempi kuin kyseisen aineiston alun perin tuottaneen tutkimushankkeen elinkaari ja että aineiston jatkokäyttäjä voi tutkijan sijaan olla vaikkapa opettaja tai viranomainen.
Aineistonhallinnan käytännön toimenpiteitä ovat vaikkapa käyttölupien määrittely, tarpeellisten lupien tai lausuntojen hakeminen, varmuuskopiointi, toimenpiteiden dokumentointi, aineistojen julkaiseminen tai saattaminen tietyn data-arkiston tai -repositorion edellyttämään kuntoon. Toimenpiteistä kerrotaan enemmän tämän verkkosivuston eri osioissa, joissa annetaan myös vinkkejä ja linkkejä sivuston ulkopuolisiin lisätietoihin.
Aineistonhallinnan hyötyjä pähkinänkuoressa
Panostus aineistonhallintaan ja sen huolelliseen suunnitteluun tuo mukanaan monia hyötyjä:
- Laatu: Tutkimusaineisto säilyy tarkkana ja kattavana, kun esim. tiedostot ja kansiot on nimetty selkeästi ja eri versiot on tallennettu ja nimetty loogisesti.
- Lainsäädäntö: Aineistonhallinnan suunnittelu ohjaa huomioimaan esim. tietosuojalainsäädännön vaatimukset.
- Riskienhallinta: Tutkimusaineiston äkillisen tuhoutumisen riski vähenee, kun tietoturvasta ja varmuuskopioinnista huolehditaan suunnitelmallisesti.
- Vastaaminen vaatimuksiin: Helpottaa vastaamaan rahoittajien vaatimuksiin ja tutkimusorganisaatioon linjauksiin aineistonhallinnan osalta.
- Resurssit: Aikaa ja muita resursseja säästyy tutkimusprosessin edetessä.
- Tieteen avoimuus: Tutkimusaineiston säilyttäminen repositoriossa turvaa tutkimustuotoksen ja mahdollistaa sen avaamisen myös muiden hyödynnettäväksi.
- Meriitti: Laadukkaan aineiston saattaminen muiden hyödynnettäväksi lisää tutkimuksen vaikuttavuutta ja edistää uusia ja poikkitieteellisiä yhteistyömahdollisuuksia.
- Osaaminen: Aineistonhallinnan taitoja voi hyödyntää myös tutkimuksen ulkopuolella tiedonhallinnan yleistaitoina.
FAIR on akronyymi sanoista findable (löydettävä), accessible (saavutettava), interoperable (yhteentoimiva) ja reusable (uudelleenkäytettävä). Nämä FAIR-periaatteet tähtäävät siihen, että ihmiset ja tietojärjestelmät löytävät tutkimusdatan ja pystyvät käyttämään sitä mahdollisimman hyvin ja luotettavasti. FAIR-periaatteet liittyvät siten datan ja datanhallinnan laadun varmistamiseen.
FAIR saatetaan ymmärtää tarkoittavan samaa kuin avoin (tutkimus)data. Päällekkäisyydestään huolimatta käsitteet ovat kuitenkin erillisiä. FAIR-periaatteita voi noudattaa, vaikka tiettyä tutkimusaineistoa ei voitaisikaan avata jatkokäyttöä varten. Jos esimerkiksi tutkimusaineiston käyttöoikeuksia rajataan tietosuojaan liittyvistä syistä, niin tämä kerrotaan selkeästi metatiedoissa ja/tai osana ns. Data Availability Statement -dokumenttia (ks. lisätietoja kohdasta Datan avaaminen ja julkaiseminen).
FAIR-periaatteiden käytännön toteuttaminen onnistuu esimerkiksi
- hankkimalla tutkimusdatalle pysyvä tunniste (esim. DOI tai URN), jollaisen saa esimerkiksi datan julkaisupalveluista (F - löydettävä)
- käyttämällä maksuttomia ja avoimia tiedostomuotoja ja ohjelmistoja (A – saavutettava)
- hyödyntämällä avoimia ja koneluettavia sanastoja ja koodistoja (I - yhteentoimiva)
- ilmoittamalla selkeästi käyttöoikeuksista (R - uudelleenkäytettävä)
- luomalla kattava kuvailu ja dokumentaatio eli huolehtimalla laadukkaasta metadatasta, joka on avoimesti saatavilla myös datan säilytysajan jälkeen (F - löydettävä, A - saavutettava, I – yhteentoimiva, R - uudelleenkäytettävä).
Tutkimusdatan lisäksi FAIR-periaatteita voidaan soveltaa myös algoritmeihin, koodeihin, ohjelmistoihin ja tutkimusprosessin eri vaiheisiin. FAIR-toimenpiteet edistävät tutkimusdatan löydettävyyttä ja yhteentoimivuutta.
FAIR-periaatteet julkaistiin vuonna 2016, lue lisää Wilkinson ym. artikkelista. Useat tutkimusrahoittajat kannustavat tutkijoita käsittelemään tutkimusdataa FAIR-periaatteiden mukaisesti (kts. esim. Suomen Akatemian ohjeistus).
Testaa FAIR osaamistasi FAIR-Aware -työkalulla. Se koostuu kymmenestä kysymyksestä lisäohjeineen. Kysymyksiin vastaamiseen kuluu n. 10–30 min. Englanninkielisen työkalun on tuottanut Alankomaiden kansallinen datakeskus (DANS) osana FAIRsFAIR-projektia.
Aineistonhallinta ei synny itsestään. Siihen tarvitaan vähintäänkin aikaa ja ehkäpä myös erityistä osaamista ja rahaa. Jo ennen tutkimuksen alkamista on tärkeää määrittää selkeästi tutkimusprojektiin osallistuvien tehtävät, vastuut ja oikeudet aineistonhallintaan liittyen. Etenkin aineiston omistajuudesta, käyttöoikeuksista ja jatkokäytöstä tulee sopia.
Aineistonhallintaan tarvittavia resursseja - aikaa, rahaa, kouluttautumista - arvioidaan jo tutkimusta suunniteltaessa. Realistinen resurssisuunnittelu auttaa tutkimuksen aikana ja sen jälkeen, kun esimerkiksi tutkimusaineiston julkaiseminen tai säilyttäminen tulevat ajankohtaisiksi.
Jo itse aineistonhallinnan suunnitteluun varattava aika on osa resursointia. Muutoin resursoinnin apuna voi käyttää jaottelua, jossa arvioidaan ajan, osaamisen ja rahan tarve tutkimusaineiston
- keruussa (uudelleenkäyttö, laitevaatimukset, järjestely, prosessointi, tutkimusluvat jne.)
- kuvailussa ja dokumentoinnissa
- tutkimuksenaikaisessa tallentamisessa, jakamisessa ja tietoturvassa
- julkaisemisessa tutkimusjulkaisun yhteydessä (ml. anonymisointi)
- tutkimuksenjälkeisessä säilyttämisessä (ml. anonymisointi).
Verkosta löytyy erinomaisia ja yksityiskohtaisempia vinkkejä ja lisäapua resursointiin (esim. Utrechtin yliopiston Costs of data management -sivusto tai UK Data Servicen Costing-sivusto).
Resursoinnissa on muistettava tarkistaa rahoittajan ehdot, sillä ne eivät välttämättä myönnä erikseen rahoitusta tutkimusaineistojen säilyttämisen ja avaamisen kuluihin. Esimerkiksi Suomen Akatemian ehdoissa todetaan, että pääsääntöisesti nuo kulut kuuluvat tutkimushankkeen suorituspaikan yleiskustannuksiin.
Itä-Suomen yliopiston tutkimusaineistot-sivuilta löytyvät Itä-Suomen yliopistossa käytössä olevat keskeiset tutkimusaineistot ja tietokannat.
Aineistonhallintasuunnitelma ja aineistonhallintapolitiikka
Aineistonhallintasuunnitelma eli Data Management Plan (DMP) on tutkimussuunnitelmaa täydentävä dokumentti, jossa kuvataan aineistonhallinnan toimenpiteet. Se on usein tiivis parisivuinen dokumentti, mutta sen pituus voi vaihdella rahoittajan ohjeitten mukaan.
Aineistonhallintasuunnitelman avulla tutkija voi hahmottaa tutkimusdatan koko elinkaaren, vähentää dataan liittyviä riskejä sekä varmistaa tutkimusaineiston eettisen, turvallisen ja tehokkaan käytön tutkimuksen aikana ja sen jälkeen.
Aineistonhallintasuunnitelman tärkeimmät suuntaviivat ja periaatteet tulee miettiä jo ennen projektin alkua. Suunnitelma täsmentyy tutkimushankkeen aikana. Itä-Suomen yliopiston avoimen tieteen ja tutkimuksen linjauksessa todetaan, että aineistonhallintasuunnitelma laaditaan tutkimuksen suunnitteluvaiheessa ja sitä päivitetään tarpeen mukaan.
Myös rahoittajilla saattaa olla omia vaatimuksiaan aineistonhallintasuunnitelmaan liittyen. Jos rahoittaja edellyttää tutkijan tai tutkimushankkeen kotiorganisaation jollain tavoin hyväksymää aineistonhallintasuunnitelmaa, UEF Datatuella on tätä varten DMP-kommentointipalvelu.
Aineistonhallintasuunnitelmaan on tarjolla yleisiä tai rahoittajakohtaisia mallilomakkeita ja ohjeita. UEF Kirjaston tuottamassa avoimessa oppimateriaalissa käydään tarkemmin läpi aineistonhallintasuunnitelman laatiminen kansallista aineistonhallintasuunnitelman ohjetta ja sen mallipohjaa hyödyntäen.
Aineistonhallintasuunnitelman tekemiseen on käytettävissä DMPTuuli työkalu, jota esitellään alla. Toinen esimerkki tutkijoille käytettävissä olevista DMP-työkaluista on Data Stewardship Wizard. Se sisältää ohjeita ja apukysymyksiä FAIR-periaatteiden toteuttamisen tueksi. DSW:n käyttöä suositellaan mm. EU:n Horisontti Eurooppa -ohjelman ohjeistuksessa. Englanninkielinen työkalu on kehitetty yhteistyössä alankomaalaisen (DTL/ELIXIR NL) ja tsekkiläisen (CTU/ELIXIR CZ) tutkimusorganisaation voimin.
UEF Datatuki järjestää myös aineistonhallintasuunnitelmien tekemiseen valmistavia työpajoja. Katso lisätietoja tämän verkkosivuston osiosta Koulutukset, opintojaksot ja avoimet materiaalit.
Lisätietoa
Guidelines for Writing a Data Management Plan. UEFin englanninkieliset ohjeet aineistonhallintasuunnitelmaan rinnakkain kansallisen DMP ohjeen kanssa. Heimo-palvelut, vaatii kirjautumisen UEF-tunnuksilla.
Kansallinen aineistonhallintasuunnitelmaohje (2021).
ATT aineistonhallinnan ohje sensitiivisille aineistoille (2019). Additional instructions for planning the management of sensitive and confidential data 2019.
Tutkimusinfrastruktuureilla on keskeinen rooli tutkimusaineiston tuottamisessa. Yksittäiset infrastruktuurit voivat muodostua myös esimerkiksi jo olemassa olevista aineistokokoelmista.
Aineistonhallintapolitiikka eli Data Management Policy (DMPol) on dokumentti, joka ohjaa tutkimusinfrastruktuuria hyödyntävien osapuolien (esim. tutkijat, tekninen henkilöstö, asiakkaat) aineistonhallintaa. Tutkimusinfrastruktuurin tarjoamaa aineistonhallintapolitiikkaa voidaan hyödyntää yksittäisten hankkeiden aineistonhallintasuunnitelman laatimisessa.
Aineistonhallintapolitiikassa tutkimusinfrastruktuureista tulee kuvata aineistonhallinnan pääperiaatteet, kuten tieto infralla tuotetun tai sen koostavan datan määrästä ja tyypistä, käyttöoikeuksista ja tallennusmahdollisuuksista. Itä-Suomen yliopiston avoimen tieteen ja tutkimuksen linjauksessa todetaan, että DMPol laaditaan infrastruktuurin suunnitteluvaiheessa tai viimeistään rahoitushaun yhteydessä.
UEF Datatuen kommentointipalveluun kuuluu myös DMPol-kommentointi. UEF Datatuki on kehittämässä materiaalia ja koulutusta aineistonhallintapolitiikan tekemisen tueksi.
Lisätietoa
Aineistonhallintapolitiikka - FIRI. Suomen Akatemian DMPol-ohjeistus (englanninkielinen).
Itä-Suomen yliopiston tutkimusinfrastruktuurit. Tietoa UEF tutkimusinfrastruktuureista ja niiden kehittämisohjelmasta.
Kuusniemi, M.E., Siipilehto, L., Ojanen, M., Korhonen, T., Manninen, S., Leskinen P., Ellmén, U., Särkioja M. (2022). Data management policy (DMPol) template for research infrastructures.
Aineistonhallintasuunnitelmiin (DMP) ja aineistonhallintapolitiikkoihin (DMPol) on mahdollista saada kommentteja UEF Datatuesta.
Voit toimittaa dokumentin UEF Datatuen palveluosoitteeseen datasupport@uef.fi. Liitä mukaan joko tutkimuksen tiivistelmä tai tutkimussuunnitelma sekä tarvittaessa rahoittajan tai jonkin muun tahon ohjeet, joita sinun on noudatettava kommentoitavaksi lähettämässäsi aineistonhallintasuunnitelmassa tai -politiikassa.
Täydentävän rahoituksen hankkeille (esim. Suomen Akatemia tai Horisontti Eurooppa) on valmis DMP-prosessi, joka rakentuu rahoituspäätösten aikatauluihin.
- UEFiin tulevien täydentävän rahoituksen tutkimushankkeiden aineistonhallintasuunnitelma (DMP) on lähetettävä UEF Datatukeen kommenteille ennen sen lähettämistä rahoittajalle. Näissä hankkeissa edellytetään suorituspaikan sitoutumista aineistonhallintasuunnitelman mukaiseen aineistonhallintaan, joten suorituspaikan on oltava tietoinen suunnitelluista toimista.
- DMP lähetetään tiedostona datasupport@uef.fi osoitteeseen, mukana rahoituksen päätösnumero ja lyhyt kuvaus tutkimuksesta tai tutkimussuunnitelma.
- UEF Datatuen asiantuntijat käyvät läpi DMP:n hyödyntäen kansallista arviointiohjetta ja konsultoivat tarvittaessa muita yliopiston asiantuntijoita (tietotekniikkapalvelut, tietosuojavastaava, lakiasiantuntijat).
- UEF Datatuki kommentoi DMP:n tutkijalle ja antaa tarvittaessa ohjeita DMP:n täydentämiseen. UEF Datatuki kuittaa kommentoinnin tarkistuslistaan. Tutkija toimittaa DMP:n rahoittajalle rahoittajan ohjeiden mukaisesti. Suorituspaikan sitoumuksen antaja (laitosjohtaja/dekaani) tarkastaa ennen sitoumuksen antamista, että DMP on läpikäynyt kommentontiprosessin.
- DMP liittyy tutkimussuunnitelmaan ja se arkistoidaan rahoitushakemuksen/rahoituksen vastaanottamisen asiakirjojen yhteydessä. DMP on kuitenkin päivittyvä dokumentti, ja tutkijan vastuulla on huolehtia sen ajantasaisuudesta.
DMPTuuli on verkkoselainpohjainen työkalu aineistonhallintasuunnitelman ja aineistonhallintapolitiikan kirjoittamiseen. Työkalu on avoimesti jokaisen tutkijan ja tutkimusryhmän käytössä. DMPTuuli on räätälöity suomalaisten tutkimusorganisaatioiden tarpeisiin Digital Curation Centren (UK) avoimen lähdekoodin DMPonline-työkalun pohjalta.
DMPTuuli sisältää rahoittaja- ja organisaatiokohtaisia ohjeita ja suunnitelmapohjia. Sieltä löytyvät muun muassa valmiit pohjat Suomen Akatemian, Suomen Kulttuurirahaston ja Euroopan komission Horizon Europe -ohjelman aineistonhallintasuunnitelmille. Lisäksi DMPTuulissa on pohja Suomen Akatemian FIRI-haun aineistonhallintapolitiikalle (DMPol).
Tarvittavat ohjeet voi valita heti suunnitelman kirjoittamisen aluksi. Suunnitelman voi jakaa, ja sitä voi kirjoittaa yhdessä toisten tutkijoiden kanssa. Lisäksi sen näkyvyyden voi määrittää joko yksityiseksi, organisaatiokohtaiseksi tai julkiseksi. Valmiin aineistonhallintasuunnitelman voi tallentaa tiedostona eri muodoissa (esimerkiksi docx, pdf).
DMPTuuliin kirjaudutaan oman organisaation tunnuksilla (esim. UEF-tunnukset) tai rekisteröitymällä erikseen.
DMPTuuli- työkalu on kehitetty aineistonhallintasuunnitelmien tekemiseen, jakamiseen ja kommentoimiseen. DMPTuulissa on rahoittajien ja tutkimuslaitosten valmiita pohjia, ja sieltä löytyvät myös UEF-kohtaiset täyttöohjeet.
Itä-Suomen yliopisto on mukana DMPTuulia kehittäneessä ja aineistonhallintasuunnitelmayökalua kehittävässä DMP-konsortiossa, johon kuuluu 32 suomalaista korkeakoulua ja tutkimusorganisaatiota. Tämän yhteistyöverkoston tavoitteena on tutkimusaineistonhallinnan suunnittelun edistäminen Suomessa.