TIES445 Data Mining (3–5 cr)

Study level:
Advanced studies
Grading scale:
0-5
Language:
English
Responsible organisation:
Faculty of Information Technology
Curriculum periods:
2020-2021, 2021-2022, 2022-2023, 2023-2024

Description

Sisältö

Kurssilla perehdytään suurten ja epätäydellisten datamassojen analyysi- eli tiedonlouhintamenetelmiin. Kurssin aluksi käydään läpi peruskäsitteet, määritelmät ja tiedonlouhinta-menetelmien kehittämiseen ja soveltamiseen liittyviä haasteita. Perehdytään tietämyksen etsintä (KDD) prosessin eri vaiheisiin sekä niissä sovellettaviin menetelmiin. Käydään läpi eri tyyppisissä tiedonlouhintaongelmissa käytettäviä menetelmiä. Tutustaan menetelmien soveltamiseen käytännön aineistoissa. Harjoitukset ja projektityö tapahtuvat Matlab-ohjelmistoa käyttäen.

Suoritustavat

Tentti, demot ja projektityö.

Learning outcomes

-

Description of prerequisites

Ohjelmointi 2 ja Algoritmit 2. Matematiikan perusopinnot suositeltavia.

Study materials

Principles of Data Mining, D. Hand, H. Mannila, and P. Smyth, MIT Press, 2001. P-N. Tan, M. Steinbach, V. Kumar, Introduction to Data Mining, Addison Wesley, 2005. J. Han and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006. Wang, X.

Completion methods

Method 1

Select all marked parts
Parts of the completion methods
x

Teaching (3–5 cr)

Type:
Participation in teaching
Grading scale:
0-5
Language:
English
No published teaching