Opiskelijoiden valmistumisajankohdan ennustaminen tietovaraston datalla

Projektissa laadittiin ennustemalli, jolla pyrittiin ennustamaan opiskelijakohtaisesti Aalto-yliopiston opiskelijoiden valmistumisajankohta lukukauden tarkkuudella. Datana käytettiin Aalto-yliopiston tietovarastoa (SQL Server). Ennustemallit laadittiin Python-ohjelmointikielellä ja metodologiana käytettiin logistisen regression ja lineaarisen regression yhdistelmää. Ensin logistisella regressiolla pyrittiin erottelemaan ne opiskelijat, jotka eivät valmistu lainkaan. Sen jälkeen jäljelle jääneisiin opiskelijoihin sovellettiin lineaarista regressiota valmistumisajankohdan ennustamiseksi. Ennustemallin tarkkuus riitti ennustamaan valmistumisajankohdista 79 % oikein +/- 1 lukuvuoden tarkkuudella. Projektista kirjoitettiin tutkimusartikkeli EUNIS-konferenssiin (European University Information Systems).

Haluatko kuulla lisää muista töistämme?

 

Ota yhteyttä