TIES4450 Tiedonlouhinta ja koneoppiminen (5 op)
Avainteksti
Kuvaus
Kurssilla perehdytään suurten ja epätäydellisten datamassojen analyysi- eli tiedonlouhintamenetelmiin. Kurssin aluksi käydään läpi peruskäsitteet, määritelmät ja tiedonlouhinta-menetelmien kehittämiseen ja soveltamiseen liittyviä haasteita. Perehdytään tietämyksen etsintä (KDD) prosessin eri vaiheisiin sekä niissä sovellettaviin menetelmiin. Käydään läpi eri tyyppisissä tiedonlouhintaongelmissa käytettäviä menetelmiä. Tutustaan menetelmien soveltamiseen käytännön aineistoissa. Harjoitukset ja projektityö tapahtuvat Matlab-ohjelmistoa käyttäen.
Osaamistavoitteet
Understanding of the main machine learning / data mining methods and algorithms; knowledge of the basic concepts related to the overall knowledge discovery process
Esitietojen kuvaus
Ohjelmointi 2 ja Algoritmit 2. Matematiikan perusopinnot suositeltavia.
Oppimateriaalit
M. J. Zaki and W. Meira Jr.: “Data Mining and Analysis – Fundamental Concepts and Algorithms”, Cambridge University Press, 2014
Hand, Manilla and Smyth: “Principles of Data Mining”, MIT Press
Hastie, Tibshirani and Friedman: “The Elements of Statistical Learning”, Springer, 2017
Principles of Data Mining, D. Hand, H. Mannila, and P. Smyth, MIT Press, 2001. P-N.
Tan, M. Steinbach, V. Kumar, Introduction to Data Mining, Addison Wesley, 2005. J. Han and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006. Wang, X.