Strumenti Utente

Strumenti Sito


tdm:start

Differenze

Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.

Link a questa pagina di confronto

Entrambe le parti precedenti la revisione Revisione precedente
Prossima revisione
Revisione precedente
Ultima revisione Entrambe le parti successive la revisione
tdm:start [06/07/2009 alle 00:08 (15 anni fa)]
Dino Pedreschi
tdm:start [23/12/2009 alle 14:33 (14 anni fa)]
Dino Pedreschi
Linea 1: Linea 1:
-====== Tecniche di Data Mining a.a. 2008-2009 ======+====== Tecniche di Data Mining a.a. 2009-2010 ======
  
-====== News ====== +  * Il corso si terrà congiuntamente quello di Data Mining: [[Data Mining|]] 
- +  * Date modalità d'esame saranno le stesse
-  **Appelli sessione estiva 2009**: +
-  *  3 giugno ore 15 studio Pedreschi - orali pre-appello +
-  * 12 giugno (scritto: ore 10:00 aula D1) - 18 giugno (orali: ore 09:00 studio Pedreschi) +
-  * 30 giugno (scritto: ore 10:00 aula D1) - 08 luglio (orali: ore 09:00 studio Pedreschi) +
-  * 21 luglio (scritto: ore 10:00 aula D1) - 24 luglio (orali: ore 09:00 studio Pedreschi) +
- +
-  * Risultati Prima Verifica 2009: {{:tdm:risultatiprimaverifica.pdf|}} +
-  * Risultati Seconda Verifica 2009: {{:tdm:risultatisecondaverifica.pdf|}} +
-  * Risultati Appello 30 Giugno 2009: {{:tdm:risultati30giugno2009.pdf|}} +
-====== Docenti ====== +
- +
-  * **Dino Pedreschi** +
-    * **KDD LAB** - Knowledge Discovery Laboratory / ISTI-CNR e Dipartimento di Informatica dell'Università di Pisa +
-    * [[pedre@di.unipi.it]] +
-    * http://www.di.unipi.it/~pedre +
- +
-  * Codocenti: **Fosca Giannotti**, **Mirco Nanni** +
-    * **KDD LAB** - Knowledge Discovery Laboratory / ISTI-CNR +
-    * http://www-kdd.isti.cnr.it +
- +
- +
-====== Obiettivi del corso ====== +
- +
-La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali. L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi, concentrandosi su quelli più diffusi e consolidati, ma discutendo anche gli aspetti avanzati ed ancora al limite fra tecnologia metura e ricerca. Si discutono esempi di uso delle tecniche di data mining in contesti applicativi realistici, quali la market basket analysis ed il rilevamento di frodi.  Il corso si conclude con cenni sugli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere conoscenza.  Il corso consiste delle seguenti parti:  +
-  - i concetti di base del processo di estrazione della conoscenza; +
-  - le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste tecniche si studieranno gli aspetti formali e implementativi, sia nelle versioni standard che avanzate; +
-  - alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici.  +
-  - cenni sugli aspetti di privacy ed etici e delle tecnologie di analisi privacy-preserving. +
-  +
-====== Orario  ====== +
-  * **Lunedì 14-16, Aula D1** +
-  * **Giovedì 16-18, Aula A** +
- +
- +
-====== Libro di Testo ====== +
- +
-  *Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Pearson - Addison Wesley, ISBN 0-321-32136-7, 2006 +
-    *  [[http://www-users.cs.umn.edu/~kumar/dmbook/index.php]]  (slides e capitoli 4, 6 e 8 scaricabili liberamente). +
- +
-====== Riferimenti bibliografici ====== +
- +
-  * Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, 2000     http://www.mkp.com/books_catalog/catalog.asp?ISBN=1-55860-489-8 +
-  * U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy (editors).  Advances in Knowledge discovery and data mining, MIT Press, 1996. +
-  * Barry Linoff Data Mining Techniques for Marketing Sales and Customer Support, John Wiles & Sons, 2002 +
-====== Calendario delle lezioni ====== +
- +
-^ ^ Giorno/ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^ +
-|1.| Lunedì, Febbraio 23 | D1 | //Presentazione del corso// | {{tdm:chap1_intro.pdf|lucidi}} | Pedreschi +
-|2.| Giovedì, Febbraio 26 | A | //Cosa è il Data Mining, Motivazioni, Classi di applicazioni, I principali metodi di datamining// | | Pedreschi | +
-|3.| Lunedì, Marzo 02 | D1 | //Il processo di estrazione della conoscenza, esempi: previsione di frodi fiscali, analisi competitiva, etc.// | {{tdm:bonchi260207.pdf|lucidi}} | Pedreschi | +
-|4.| Giovedì, Marzo 05 28 | A | //I dati: i tipi di dato, la qualità dei dati, la preparazione dei dati// | {{tdm:tdm_data_preparation_2-3.pdf|lucidi}}| Pedreschi | +
-|5.| Lunedì, Marzo 09 | D1 | //Misure di similarità e dissimilarità// | {{tdm:chap2_data.pdf|lucidi}} | Nanni | +
-|6.| Giovedì, Marzo 12 | A | //Esplorazione dei dati: dalla statistica descrittiva alla visualizzazione//  | {{tdm:chap3_data_exploration.pdf|lucidi}}|Nanni | +
-|7.| Lunedì, Marzo 16 | D1 | //Clustering - Algoritmo k-means// | {{tdm:chap8_basic_cluster_analysis.pdf|lucidi}} | Pedreschi | +
-|8.| Giovedì, Marzo 19 | A | Lezione cancellata per impegni istituzionali del deocente | | | +
-|9.| Lunedì, Marzo 23| D1 | // Pattern discovery e regole associative. // | | Pedreschi | +
-|10.| Giovedì, Marzo 26 | A | // Regole Associative: concetti basici, algoritmi A-Priori e FP-Growth // | | Pedreschi | +
-|11.| Giovedì, Marzo 30 | A | // Pattern discovery e regole associative. // | | Pedreschi | +
-|12.| Lunedi, Aprile 02 | D1 | //Ricevimento collettivo e preparazione verifica // |{{tdm:tdm_12_aprile_07.pdf|lucidi}}| Pedreschi | +
-|13.| ** Lunedi, Aprile 06, 14-16 ** | **D1** | ** PRIMA VERIFICA ** | | | +
-|14.| Giovedì, Aprile 16 | A | //Pattern discovery regole associative. // | | Pedreschi | +
-|15.| Lunedi, Aprile 20| D1 | //Pattern sequenziali// | | Pedreschi| +
-|   | Giovedi, Aprile 23 | A | //  LEZIONE CANCELLATA // | {{tdm:TDM_DM_16_aprile_07.pdf|lucidi}} |Pedreschi +
-|16.| Lunedi, Aprile 27 | D1 | **Verifica per studenti internazionali ed ERASMUS**  | | | +
-|17.| Giovedi , Aprile 30 | A | // Classificazione con alberi di decisione, Algoritmo C4.5 // |  | Ruggieri | +
-|18.| Lunedì, Maggio 4 | D1 | //Classificazione con alberi di decisione, Algoritmo C4.5  // |{{tdm:bonchi-7-maggio.pdf|lucidi}} {{tdm:bonchi-14-maggio.pdf|lucidi}} | Ruggieri | +
-|19.| Lunedi, Maggio 11 | D1 |//Itemset frequenti con vincoli // | {{tdm:bonchi-10-maggio.pdf|lucidi}}| Pedreschi | +
-|20.| Giovedì, Maggio 14| A | Esercitazioni su classificazione | | Pedreschi | +
-|21.| Lunedi, Maggio 25 | D1 | Mobility data mining, Privacy-preserving data mining ed aspetti etici - a seguire ricevimento collettivo |{{tdm:2._privacypreservingtechnologies_pedreschi_.pdf|lucidi}} {{tdm:1._geopkdd-introduction_giannotti_.pdf|lucidi}}| Giannotti  Pedreschi | +
-|22.| **Mercoledì, Maggio 27, 14-16** | **I** | **SECONDA VERIFICA** | |    | +
- +
- +
-====== Verifiche ed esercizi====== +
- +
-  * {{:tdm:tdm.1verifica2009.pdf|Prima Verifica 2009}} +
-  * {{:tdm:verifica.04.04.08.pdf|Verifica 2008}} +
-  * {{:tdm:verifica.26.06.2007.pdf|Verifica 2007}} {{:tdm:sol2007.pdf|}} +
-  * {{tdm:verifica2006.pdf|Verifica 2006}}  {{:tdm:sol2006.pdf|}} +
-  * {{tdm:verifica2005.pdf|Verifica 2005}}  (con soluzioni) +
-  * {{tdm:verifica2004.pdf|Verifica 2004}} +
-  * {{:tdm:esempialberidecisione.xls|Esempi di Training Set per Classificazione (in formato xls)}} +
- +
- +
-====== Modalità di esame ====== +
- +
-Esame scritto e orale. Lo scritto può essere sostituito dalle due verifiche in itinere. +
-====== Appelli di esame ====== +
- +
-  * 03 giugno ore 15 studio Pedreschi - orali pre-appello +
-  * 12 giugno (scritto: ore 10:00 aula D1) 18 giugno (orali: ore 09:00 studio Pedreschi) +
-  * 30 giugno (scritto: ore 10:00 aula D1) 08 luglio (orali: ore 09:00 studio Pedreschi) +
-  * 21 luglio (scritto: ore 10:00 aula D1) 24 luglio (orali: ore 09:00 studio Pedreschi)+
  
 ====== Edizioni anni precedenti ====== ====== Edizioni anni precedenti ======
  
 +  * [[TDM-2008-2009|TDM a.a. 2008-09]]
   * [[TDM-2007-2008|TDM a.a. 2007-08]]   * [[TDM-2007-2008|TDM a.a. 2007-08]]
   * [[TDM-2006-2007|TDM a.a. 2006-07]]   * [[TDM-2006-2007|TDM a.a. 2006-07]]
   * [[http://www.di.unipi.it/~pedre/TDM-ADEC2006.htm|TDM a.a. 2005-06]]   * [[http://www.di.unipi.it/~pedre/TDM-ADEC2006.htm|TDM a.a. 2005-06]]
-====== Data Mining @ BISS 2009 ====== 
  
-  * [[BISS09|Corso BISS 09]] 
-  * Wiki del corso di Data Mining a BISS 09, Bertinoro International Spring School 2009, 9-13 Marzo 2009. 
tdm/start.txt · Ultima modifica: 23/12/2009 alle 14:34 (14 anni fa) da Dino Pedreschi