mercoledì 28 aprile 2010

Ricerca 9 - Differenze reporting e Mining. Cenno alle finalità del mining e alle principali tecniche.

La maggior parte delle aziende utilizza strumenti OLAP (On Line Analytic Processing) per eseguire interrogazioni specifiche sui database aziendali. Questi strumenti realizzano report riassuntivi molto interessanti, come ad esempio le vendite ripartite per area geografica.
Il data mining consente agli utenti di strumenti OLAP di andare oltre i report riassuntivi.
Il data mining dice perché un certo fenomeno sta succedendo, mentre l'OLAP si limita a dire cosa sta succedendo. Le relazioni fra i dati e le linee di tendenza sono spesso nascosti nei report riassuntivi. Il data mining aiuta a scoprire queste preziose informazioni.
Per esempio, il data mining può scoprire gruppi di clienti o di prodotti che condividono caratteristiche simili. Per capire cosa significa, diamo uno sguardo ai dati giornalieri di acquisizione di clienti di una banca.





Risultati dell'OLAP
Il risultato dello strumento OLAP è un grafico che fornisce un'informazione molto chiara: l'acquisizione di clienti sta seguendo un trend positivo nonostante abbia avuto una flessione nei mesi centrali dell'anno. Se però si procede con ulteriori analisi e si affiancano alle tecniche di OLAP le tecniche di data mining emergono delle informazioni diverse. Procedendo ad una segmentazione dei clienti acquisiti tramite una cluster analysis si osserva la distribuzione della clientela rappresentata nel grafico.






Risultati del Data Mining
Il grafico mostra che l'acquisizione sta aumentando fra i clienti di "Breve termine", è sostanzialmente stabile fra i clienti definiti "Generici" e sta calando fra quelli di "Lungo termine". Dal momento che i clienti di "Lungo termine" sono i più interessanti per la banca, questa tendenza rappresenta un problema. Disponendo di questa ripartizione è stato innanzitutto possibile rilevare il problema, e sarà possibile studiare azioni specifiche di marketing dirette a invertire la tendenza.
E' quindi evidente che gli strumenti OLAP rappresentano una base di partenza, ma non sono in grado di fornire lo stesso contributo informativo delle tecniche di data mining.
La rapida crescita nell'uso delle tecniche avanzate di data mining deriva dal valore aggiunto fornito dalla combinazione di questi tre elementi:
· uso di tecniche analitiche più sofisticate per fornire informazioni di qualità
· distribuzione delle informazioni in una forma comprensibile e facilmente interpretabile
· ottenimento di risultati operativi in tempo reale

L'utilizzo delle tecniche avanzate viene anche detto modeling e può essere rappresentato tramite questo diagramma:




Gli strumenti del Data Mining si dividono in due gruppi:
- Indagine
- Verifica
entrambi necessari per progetti completi di data mining.

Strumenti di indagine
La maggior parte degli strumenti di indagine fu sviluppata nell'ambito della ricerca sull'intelligenza artificiale. Questi strumenti identificano relazioni e tendenze nei dati, aiutando a scoprire fenomeni di mercato e, di conseguenza, a consolidare le conoscenze di base sul proprio business. Le nuove conoscenze possono essere usate per aumentare i propri margini di competitività o il proprio giro d'affari. Ci sono diversi strumenti di indagine:
· Indagine esplorativa
· Alberi decisionali
· Cluster analysis
· Analisi fattoriale
· Association rules
· Rule induction

Strumenti di verifica
Pur essendo gli strumenti di indagine innovativi, la verifica svolge un ruolo determinante nel data mining. Se gli strumenti di indagine possono portare a interessanti scoperte sulla propria attività, non possono spiegare perché e nemmeno se, queste scoperte sono valide e utili. La maggior parte degli strumenti di indagine esegue test per analizzare le differenze tra gruppi. Spesso questi test portano a conclusioni sbagliate, per via della loro natura probabilistica. Gli strumenti di verifica servono a convalidare le scoperte fatte in sede di indagine, per garantire decisioni corrette. Alcuni degli strumenti di verifica sono:
· Correlazioni
· T-test
· ANOVA
· Regressione lineare
· Regressione logistica
· Analisi discriminante
· Previsioni

Nessun commento:

Posta un commento