mercoledì 5 maggio 2010

ricerca 10 - principali tecniche di mining

Il data mining è una delle attività cruciali per la comprensione, la navigazione e lo sfruttamento dei dati nella nuova era digitale (Ushama Fayyad). Si tratta del processo automatico di scoperta ed individuazione di strutture all’interno dei dati, dove per struttura si intendono patterns, modelli e relazioni. Questo processo, noto anche col nome KDD (Knowledge Discovery in Databases), consente di estrarre conoscenza, in termini di informazioni significative ed immediatamente utilizzabili, da grandi moli di dati, tramite l’applicazione di particolari tecniche ed algoritmi.
Le tecniche maggiormente utilizzate, in questo ambito, sono: clustering, reti neurali, alberi di decisione ed analisi delle associazioni. Ciascuna comprende un vasto insieme di metodi e di algoritmi che hanno l’obiettivo comune di fare emergere patterns (sequenze ripetute, omogeneità, regole, …) dai dati, che, utilizzati a scopo descrittivo e/o previsivo, costituiscono un valido strumento di supporto alle decisioni.
2. Ambiti applicativi
In campo economico-finanziario, le principali applicazioni sono:
• segmentazione della clientela (database marketing) applicazione di tecniche di clustering per individuare i raggruppamenti impliciti nei dati, omogenei in termini di comportamento d’acquisto e di caratteristiche socio-demografiche
• customer retention applicazione di tecniche previsive per individuare i clienti a rischio di abbandono
• fraud detection individuazione di comportamenti fraudolenti
• analisi delle associazioni (market basket analysis) individuazione dei prodotti acquistati congiuntamente
• sequential patterns individuazione di comportamenti ricorrenti in sequenze temporali di eventi
• competitive intelligence applicazione di tecniche di clustering a documenti estratti da banche dati internazionali di tipo tecnicoscientifico volte ad individuare le tecnologie emergenti, le loro relazioni, l’evoluzione temporale e le aziende coinvolte
• analisi testuale (text mining) individuazione degli argomenti trattati da un set di documenti e delle relazioni tra argomenti

Nessun commento:

Posta un commento