dm:dm.2008-09
Differenze
Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
Entrambe le parti precedenti la revisioneRevisione precedente | |||
dm:dm.2008-09 [23/12/2009 alle 14:38 (15 anni fa)] – cancellata Mirco Nanni | dm:dm.2008-09 [23/12/2009 alle 14:38 (15 anni fa)] (versione attuale) – creata Mirco Nanni | ||
---|---|---|---|
Linea 1: | Linea 1: | ||
+ | ====== Data Mining A.A. 2008/09 ====== | ||
+ | Docenti: | ||
+ | * Fosca Giannotti, [[fosca.giannotti@isti.cnr.it]] | ||
+ | * Mirco Nanni, [[mirco.nanni@isti.cnr.it]] | ||
+ | * KDD LAB - Knowledge Discovery Laboratory, ISTI-CNR e Dipartimento di Informatica dell' | ||
+ | |||
+ | |||
+ | ====== News ====== | ||
+ | |||
+ | * **[30/ | ||
+ | * **[06/ | ||
+ | * **[29/ | ||
+ | * **[08/ | ||
+ | * **[22/ | ||
+ | * Le date della seconda verifica e degli appelli sono state fissate, anche se in modo non definitivo. | ||
+ | * Giovedì 21 maggio 2009 ci sarà una lezione extra di esercitazione. | ||
+ | * La verifica intermedia del 7 aprile è stata anticipata alla mattina dello stesso giorno. | ||
+ | * Gli studenti che devono ancora sostenere l' | ||
+ | |||
+ | ====== Obiettivi del corso ====== | ||
+ | |||
+ | La grande disponibilità di dati provenienti da database relazionali, | ||
+ | - i concetti di base del processo di estrazione della conoscenza: studio e preparazione dei dati, forme dei dati, misure e similarità dei dati; | ||
+ | - le principali tecniche di datamining (regole associative, | ||
+ | - alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici. | ||
+ | - l’ultima parte del corso ha l’obiettivo di introdurre gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza | ||
+ | |||
+ | ====== Orario e Aule ====== | ||
+ | **Lezioni: | ||
+ | * Martedì, ore 14-16, aula C1 | ||
+ | * Giovedi, ore 11-13, aula D1 | ||
+ | **Ricevimento: | ||
+ | * Giannotti: mercoledì 15-17, ISTI, Area Ricerca CNR, località San Cataldo, Pisa (prenotazione per e-mail) | ||
+ | |||
+ | ====== Libro di Testo ====== | ||
+ | |||
+ | * Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Addison Wesley, ISBN 0-321-32136-7, | ||
+ | * [[http:// | ||
+ | |||
+ | |||
+ | |||
+ | ====== Riferimenti bibliografici ====== | ||
+ | |||
+ | * Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Addison Wesley, ISBN 0-321-32136-7, | ||
+ | * Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, 2000 http:// | ||
+ | * U. Fayyad, G. Piatetsky-Shapiro, | ||
+ | * Barry Linoff Data Mining Techniques for Marketing Sales and Customer Support, John Wiles & Sons, 2002 | ||
+ | ====== Calendario delle lezioni ====== | ||
+ | |||
+ | ^ ^ Giorno/ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^ | ||
+ | |1.| Martedì, Febbraio 24, 14-16 | Aula C1 | // | ||
+ | |2.| Giovedì, Febbraio 26, 11-13 | Aula D1 | // | ||
+ | |3.| Martedì, Marzo 3, 14-16 | Aula C1 | //I Dati: i tipi di dato, la qualità dei dati, la preparazione dei dati - Misure di similarità (Cap.2) // | {{: | ||
+ | |4.| Giovedì, Marzo 5, 11-13 | Aula D1 | //I Dati: Esplorazione dei dati (Cap.3)// | {{: | ||
+ | |5.| Martedì, Marzo 10, 14-16 | Aula C1 | //Regole Associative: | ||
+ | |6.| Giovedì, Marzo 12, 11-13 | Aula D1 | //Regole Associative: | ||
+ | |7.| Martedì, Marzo 17, 14-16 | Aula C1 | //Regole Associative: | ||
+ | |8.| Giovedì, Marzo 19, 11-13 | Aula D1 | // | ||
+ | |9.| Martedì, Marzo 24, 14-16 | Aula C1 | // | ||
+ | |10.| Giovedì, Marzo 26, 11-13 | Aula D1 | // | ||
+ | |11.| Martedì, Marzo 31, 14-16 | Aula C1 | // | ||
+ | |12.| Giovedì, Aprile 2, 11-13 | Aula D1 | // | ||
+ | | | Martedì, Aprile 7, 11-13 | Aula D1 | **VERIFICA** | | | | ||
+ | |13.| Martedì, Aprile 21, 14-16 | Aula C1 | // | ||
+ | |14.| Giovedì, Aprile 23, 11-13 | Aula D1 | // | ||
+ | |15.| Martedì, Aprile 28, 14-16 | Aula C1 | // | ||
+ | |16.| Giovedì, Aprile 30, 11-13 | Aula D1 | // | ||
+ | |17.| Martedì, Maggio 5, 14-16 | Aula C1 | // Casi di studio // | {{: | ||
+ | |18.| Giovedì, Maggio 7, 11-13 | Aula D1 | // Casi di studio / Strumenti di DM // | | Giannotti | | ||
+ | |19.| Martedì, Maggio 12, 14-16 | Aula C1 | // Esercitazione di preparazione alla verifica: Classificazione // | | Nanni | | ||
+ | |20.| Giovedì, Maggio 14, 11-13 | Aula D1 | // Casi di studio / Presentazione progetti // | {{: | ||
+ | |21.| Giovedì, Maggio 21, 11-13 | Aula D1 | // Esercitazione di preparazione alla verifica: Classificazione // | [[http:// | ||
+ | |||
+ | |||
+ | ====== Verifiche anni precedenti ====== | ||
+ | |||
+ | === Verifiche anni precedenti (sottoinsieme) === | ||
+ | * {{tdm: | ||
+ | * {{tdm: | ||
+ | * {{tdm: | ||
+ | |||
+ | === Verifiche 2007 (appelli giugno-luglio) === | ||
+ | |||
+ | * {{dm: | ||
+ | * {{dm: | ||
+ | * {{dm: | ||
+ | |||
+ | === Verifiche 2008 === | ||
+ | * {{: | ||
+ | * {{: | ||
+ | * {{: | ||
+ | |||
+ | ====== Progetti ====== | ||
+ | |||
+ | * Vengono proposti 5 progetti (+1 //jolly//), descritti nel seguente documento: {{: | ||
+ | * I progetti andranno svolti in gruppi preferibilmente di 2 persone, eccezionalmente anche di 1 o 3 persone. | ||
+ | * Ogni gruppo dovrà comunicare ai docenti la propria composizione e il progetto scelto. In particolare, | ||
+ | * I progetti e le corrispondenti relazioni dovranno in linea di massima seguire le linee guida del modello CRISP-DM, brevemente riassunto nelle seguenti slide: {{: | ||
+ | * La discussione del progetto avverrà in prossimità degli appelli d' | ||
+ | * La presentazione di ogni progetto durerà tra i 20 e i 30 minuti. Al termine delle presentazioni, | ||
+ | |||
+ | ===== Software ===== | ||
+ | |||
+ | * I progetti possono essere svolti con qualunque software, a discrezione degli studenti, purché, ovviamente, provvisti di adeguate funzionalità di data mining. | ||
+ | * Alcuni software di analisi potrebbero avere problemi a reggere la mole dei dati forniti. In tal caso, si consiglia di utilizzare un DBMS (Access, SQL Server, Oracle, MySQL, ...) per effettuare una adeguata selezione/ | ||
+ | * Tra i software di data mining disponibili, | ||
+ | * **Weka**, scaricabile gratuitamente da questo indirizzo: [[http:// | ||
+ | * **Rialto**, scaricabile da: [[http:// | ||
+ | |||
+ | ====== Appelli di esame ====== | ||
+ | ===== Verifiche intermedie ===== | ||
+ | |||
+ | ^ Data ^ Orario ^ Luogo ^ Note ^ Voti ^ | ||
+ | | 7 aprile 2009, martedì | 11-13 | Aula D1 | | [[voti.7.4.2009]] | | ||
+ | | 28 maggio 2009, giovedì | 14-16 | Aula D1 | {{: | ||
+ | |||
+ | ===== Appelli regolari ===== | ||
+ | |||
+ | |||
+ | ^ Tipo di prova ^ Data ^ Orario ^ Luogo ^ Note ^ Voti ^ | ||
+ | | Appello 1 - scritto | 12 giugno 2009 | 10-12 | D1 | | [[appello.12.06.2009.risultati]] | | ||
+ | | orale | 16 giugno 2009 | 10-13 | B | - | - | | ||
+ | | Appello 2 - scritto | 30 giugno 2009 | 10-12 | D1 | {{: | ||
+ | | orale | 7 luglio 2009 | 10-13 | D1 | - | - | | ||
+ | | Appello 3 - scritto | 21 luglio 2009 | 10-12 | D1 | {{: | ||
+ | | orale | 24 luglio 2009 | 10-13 | D1 | - | | | ||
+ | | Appello 4 - scritto | 3 settembre 2009 | 10-12 | C | {{: | ||
+ | | orale | 10 settembre 2009 | 10-12 | C | **Confermata** | | | ||
+ | |||
+ | ====== Edizioni anni precedenti ===== | ||
+ | |||
+ | * [[dm.2007-08]] | ||
+ | * [[dm.2006-07]] |
dm/dm.2008-09.1261579080.txt.gz · Ultima modifica: 23/12/2009 alle 14:38 (15 anni fa) da Mirco Nanni