PLA-43101 Tiedon louhinta, 5 op
Data Mining
Lisätiedot
Opintojaksosta järjestetään englanninkielinen toteutus PLA-43106 Data Mining.
Ei luennoida lukuvuonna 2015-2016
Vastuuhenkilö
Teemu Kumpumäki, Pekka Ruusuvuori
-->Osaamistavoitteet
Kurssilla tutustutaan tiedon louhintaan ja suurten datamassojen käsittelyyn. Esimerkiksi tietoverkoissa liikkuu valtavia datamääriä ja hyödyllisen tiedon louhinta datasta on yleinen haaste. Kurssin suoritettuaan opiskelija ymmärtää tiedon louhinnan yleiset toimintaperiaatteet, tuntee yleisimmät algoritmit ja tunnistaa suurten data-aineistojen käsittelyn erityispiirteet. Kurssilla käsitellään lukuisia esimerkkejä tiedon louhinnasta, esimerkkeinä verkkohakujen toimintaperiaate, verkkomainonta ja suositusjärjestelmät.
Sisältö
Sisältö | Ydinsisältö | Täydentävä tietämys | Erityistietämys |
1. | Tiedon louhinnan käsitteen ja siihen liittyvän termistön tunteminen. | Termeihin liittyvien menetelmien toiminnan ymmärtäminen. | Tiedon louhinnan rajoitusten ymmärtäminen. |
2. | Suurten data-aineistojen ja rakenteettoman tiedon käsittelyn erityispiirteiden ymmärtäminen | Prosessoinnin erityishaasteiden, kuten muistinkäytön ja tietorakenteiden haasteiden ymmärtäminen | Mapreduce-algoritmi. |
3. | Verkkohakujen perusperiaatteiden tunteminen. |
Oppimateriaali
Tyyppi | Nimi | Tekijä | ISBN | URL | Lisätiedot | Tenttimateriaali |
Kirja | Mining of Massive Datasets | A. Rajaraman, J. Leskovec, J.D. Ullman | Kyllä | |||
Luentokalvot | P. Ruusuvuori | Kyllä |
Vastaavuudet
Opintojakso ei vastaan mitään toista opintojaksoa