Hyppää pääsisältöön

Tarkenna hakuasi

Light. Image: Mostphotos.

FM, MEng Maiju Karjalainen, väitös 24.10.2025: Yksityistä ja nopeaa hahmonlouhintaa tarkkuuden kustannuksella

Tietojenkäsittelytieteen alaan kuuluva väitöskirja tarkastetaan luonnontieteiden, metsätieteiden ja tekniikan tiedekunnassa Kuopion kampuksella. 

Mikä on väitöstutkimuksesi aihe? Miksi aihepiiriä on tärkeää tutkia? 

Väitöskirjassani tutkin, kuinka hahmonlouhinnasta voidaan tehdä yksityistä ja nopeaa. Hahmonlouhinta on data-analyysin osa-alue, joka etsii kiinnostavia rakenteita ja yhteyksiä datasta. Hahmonlouhintamenetelmä, johon tutkimukseni pääasiassa keskittyy, on jälleenkuvausten louhinta, joka etsii tapoja esittää sama datan osajoukko erilaisten attribuuttijoukkojen avulla. Nykypäivänä dataa on helppoa kerätä, mutta sen analysointi nopeasti ja yksityisesti on edelleen haastavaa. Tutkimuksessani kehitän yksityisyyttä suojelevia sekä erittäin nopeita algoritmeja jälleenkuvausten louhintaan ja hahmojoukkojen valintaan. Tämä tutkimus on tärkeää, koska se mahdollistaa hahmojen louhimisen yksityisestä datasta sekä tehokkaan louhimisen isoista datajoukoista.

Mitkä ovat väitöstutkimuksesi keskeiset tulokset tai havainnot?

Väitöstutkimukseni tuloksina ovat kehittämäni algoritmit yksityiseen ja nopeaan jälleenkuvausten louhintaan sekä nopeaan hahmojoukkojen valitsemiseen. Ensimmäinen algoritmi mahdollistaa yksityisyyttä kunnioittavan data-analyysin: voimme osoittaa, että kehittämämme jälleenkuvausten louhinta-algoritmin tuloksista ei voi päätellä mitään yksittäisistä käyttäjistä. Kaksi muuta algoritmia parantavat tutkittujen menetelmien skaalautuvuutta suuriin datajoukkoihin.

Miten väitöstutkimuksesi tuloksia voidaan hyödyntää käytännössä?

Yksityisyyden yhdistäminen jälleenkuvausten louhintaan mahdollistaa datan analysoinnin aiempaa helpommin ja turvallisemmin. Tämä on erityisen tärkeää, kun käsitellään sensitiivistä dataa. Tutkijan voi esimerkiksi olla vaikeaa saada lupaa käyttää aineistoa, tai lupaprosessi voi olla hyvin pitkä. Lisäksi tutkija ei välttämättä tiedä etukäteen, onko aineistosta hyötyä hänen tutkimukselleen. Kehitetty menetelmä voi auttaa tutkijoita saamaan yleiskuvan datan sisältämistä ilmiöistä ilman, että yksittäisten henkilöiden yksityisyys vaarantuu. Yksityistettyjä tuloksia on myös turvallista raportoida. Kaksi muuta kehittämääni algoritmia nopeuttavat sekä hahmonlouhintaa että lopullisten tulosten valintaa. Näiden ansiosta jälleenkuvausten louhinta onnistuu nopeasti myös suurista numeerisista aineistoista, kun taas perinteisillä menetelmillä tulosten saaminen voi kestää jopa päiviä.

Mitkä ovat väitöstutkimuksesi keskeiset tutkimusmenetelmät ja -aineistot? 

Tutkimus on osa tietojenkäsittelytieteen laitoksen algoritmisen data-analyysin ryhmän pitkäaikaista jälleenkuvausten louhimismenetelmien tutkimusta. Ryhmä on maailman johtavia kyseisellä alalla.

Filosofian maisteri, Master of Engineering Maiju Karjalaisen väitöskirja Trading Accuracy for Privacy and Speed in Pattern Mining (Yksityistä ja nopeaa hahmonlouhintaa tarkkuuden kustannuksella) tarkastetaan luonnontieteiden, metsätieteiden ja tekniikan tiedekunnassa. Vastaväittäjänä toimii professori Jilles Vreeken, CISPA Helmholtz Center for Information Security, ja kustoksena professori Pauli Miettinen, Itä-Suomen yliopisto. Tilaisuus on englanninkielinen.

Väitöstilaisuus 

Väitöskirja 

Lisätietoja:

FM, MEng Maiju Karjalainen, [email protected]