Docenti:
Assistenti:
La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali. L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi. Particolare enfasi è dedicata agli aspetti metodologici presentati mediante alcune classi di applicazioni paradigmatiche quali il Basket Market Analysis, la segmentazione di mercato, il rilevamento di frodi. Infine il corso introduce gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza. Il corso consiste delle seguenti parti:
Lezioni:
Giorno | Orario | Aula | |
---|---|---|---|
Lunedì | 14:00 - 16:00 | N | valido a partire dal 28.03.2011 |
Mercoledì | 14:00 - 16:00 | C1 | |
Venerdì | 09:00 - 11:00 | B1 | valido fino al 25.03.2011 |
Ricevimento:
Prima parte del corso
Giorno/ora | Aula | Argomento | Materiale didattico | Docente | |
---|---|---|---|---|---|
1. | 19.10.2010 11:00-13:00 | L1 | Introduzione: il knowledge discovery process | Cap. 1 del libro di testo dm_intro-2011.pdf | Pedreschi |
2. | 22.10.2010 08:30-10:00 | B1 | Overview delle tecniche di data mining | Giannotti | |
3. | 26.10.2010 11:00-13:00 | L1 | Dati: tipi e misure di base | Cap. 2 del libro di testo chap2_data_new.pdf | Pedreschi |
4. | 29.10.2010 08:30-10:00 | B1 | Dati: tipi e misure di base | Pedreschi | |
5. | 02.11.2010 11:00-13:00 | L1 | Analisi esplorativa e data understanding | Cap. 3 del libro di testo chap3_data_exploration.pdf | Pedreschi |
6. | 05.11.2010 08:30-10:00 | B1 | Analisi esplorativa e data understanding | Pedreschi | |
7. | 10.11.2010 14:00-16:00 | G1 | Esercitazione con il sistema Weka | Weka | Pedreschi |
8. | 17.11.2010 14:00-16:00 | G1 | cancellata per sciopero del docente | Pedreschi | |
9. | 19.11.2010 08:30-10:00 | B1 | Analisi di clustering. K-means | Cap. 8 del libro di testo chap8_basic_cluster_analysis.pdf | Pedreschi |
10. | 24.11.2010 14:00-16:00 | G1 | cancellata per occupazione studentesca | Pedreschi | |
11. | 26.11.2010 09:00-11:00 | B1 | cancellata per occupazione studentesca | Pedreschi | |
12. | 01.12.2010 14:00-16:00 | G1 | cancellata per occupazione studentesca | Pedreschi | |
13. | 03.12.2010 09:00-11:00 | B1 | Analisi di clustering. Metodi gerarchici | Pedreschi | |
14. | 08.12.2010 14:00-16:00 | G1 | festività | ||
15. | 11.12.2010 09:00-11:00 | B1 | Analisi di clustering. Metodi basati su densità | Pedreschi | |
16. | 15.12.2010 14:00-16:00 | G1 | Esercitazione con il sistema Weka | Pedreschi | |
17. | 17.12.2010 09:00-11:00 | B1 | Classificazione. Alberi di decisione | Cap. 4 del libro di testo chap4_basic_classification.pdf | Pedreschi |
18. | 12.01.2011 14:00-16:00 | G1 | Classificazione. Alberi di decisione | Pedreschi | |
19. | 14.01.2011 09:00-11:00 | B1 | Classificazione. Alberi di decisione | Pedreschi | |
20. | 19.01.2011 14:00-16:00 | G1 | Esercitazione con il sistema Weka | Pedreschi | |
21. | 21.01.2011 09:00-11:00 | B1 | Esercitazione con il sistema Weka | Pedreschi |
Seconda parte del corso
Giorno | Ora | Aula | Argomento | Materiale didattico | Docente | |
---|---|---|---|---|---|---|
1. | 09.03.2011 | 14:00-16:00 | C1 | Introduzione e casi di studio | dm2-intro-09.03.2011.pdf, case_studies.pdf | Giannotti |
2. | 16.03.2011 | 14:00-16:00 | C1 | Pattern frequenti (1/2) | dm2-assocrules-16-18.03.2011.pdf | Giannotti |
3. | 18.03.2011 | 09:00-11:00 | B1 | Pattern frequenti (2/2) | chap6_basic_association_analysis_2010_b.pdf | Giannotti |
4. | 23.03.2011 | 14:00-16:00 | C1 | Caso di studio - Fiscal Fraude Detection | Giannotti | |
5. | 25.03.2011 | 09:00-11:00 | B1 | Pattern frequenti su Weka | Giannotti | |
6. | 28.03.2011 | 14:00-16:00 | N | Pattern sequenziali | chap7_extended_association_analysis.pdf | Giannotti |
7. | 30.03.2011 | 14:00-16:00 | C1 | Complementi di classificazione | Pedreschi | |
8. | 04.04.2011 | 14:00-16:00 | N | Caso di studio - Fiscal Fraude Detection: esercizi e progetto | Giannotti | |
9. | 06.04.2011 | 14:00-16:00 | C1 | Pattern sequenziali: software | Giannotti | |
10. | 11.04.2011 | 14:00-16:00 | N | Caso di studio - Market Basket Analysis: presentazione | intro_progetto_2.pdf, tools_sequential_patterns.pdf | Nanni |
11. | 13.04.2011 | 14:00-16:00 | C1 | Time series | intro_serie_temporali.pdf | Nanni |
12. | 02.05.2011 | 14:00-16:00 | N | Anomalies detection | chap10_anomaly_detection.ppt, HQ_true_positive_prediction | Giannotti |
13. | 04.05.2011 | 14:00-16:00 | C1 | Social Network Analyis | Pedreschi | |
14. | 09.05.2011 | 14:00-16:00 | N | Mobility Data Mining (1/3) | spatio-temporal-dm.pdf | Nanni |
15. | 11.05.2011 | 14:00-16:00 | C1 | Mobility Data Mining (2/3) Caso di studio - Market Basket Analysis: esercizi e progetto | Nanni | |
16. | 16.05.2011 | 14:00-16:00 | N | Mobility Data Mining (3/3) | Nanni | |
17. | 18.05.2011 | 14:00-16:00 | C1 | Caso di studio - Mobilità: presentazione | Nanni | |
23.05.2011 | 14:00-16:00 | N | Lezione cancellata | |||
18. | 25.05.2011 | 14:00-16:00 | C1 | Privacy and Big data | Giannotti | |
19. | 30.05.2011 | 14:00-16:00 | N | Caso di studio - Mobilità: esercizi e progetto | Intro-churn, Churn-1, Churn-Spatio-Temp | Nanni |
20. | 01.06.2011 | 14:00-16:00 | C1 |
L'esame consiste in una prova scritta ed in una prova orale:
Dati e dettagli delle esercitazioni possono essere richiesti scrivendo a mirco [dot] nanni [at] isti [dot] cnr [dot] it. Nota: i gruppi di progetto possono essere composti fino a 3 persone.
Data | Orario | Luogo | Note | Voti | |
---|---|---|---|---|---|
I Esercizio e II Esercizio | 30.11.2010 | Risultati |
Appello | Data | Orario | Luogo | Note | Voti |
---|---|---|---|---|---|
07 Febbraio 2011 | 9.00 – 13.00 | Aula L1 | |||
03 Marzo 2011 | 9.00 – 13.00 | Aula C | |||
15 Giugno 2011 | 9.00-12.00 | Aula C | Scritto + Orali | ||
14.00-16.30 | Aula C1 | Orali | |||
27 Giugno 2011 | 9.00 | Aula C1 | |||
18 Luglio 2011 | 9.00 | Aula B | |||
Settembre 2011: su appuntamento |