venerdì 7 maggio 2010

Ricerca 12 - concetto di aggregazione e sintesi effettuata dai report.

I dati contenuti nell’ipercubo informativo sottostante al report possono essere aggregati o disaggregati in relazione alle esigenze formative.
La disaggregazione dei dati coincide con l’esigenza di approfondire l’analisi. La tecnica utilizzata è definita “drill-down”. Una volta visualizzato il dato complessivo relativo ad una dimensione gerarchizzata di analisi attraverso questa tecnica è possibile esplorare tutta la gerachia. Un esempio di dimensione gerarchizzabile è quella temporale: il dato annuale può essere esplorato per sottoreport che visualizzano gli aggregati mensili e questi ultimi possono essere-a loro volta- disaggregati secondo di dati giornalieri.
L’aggregazione dei dati consente una visione congiunta di dati e informazioni attraverso le funzioni aggregate, che permette di supportare le funzionalità del provider di dati. Nei database, le funzioni di aggregazione più diffuse sono: la somma dei valori; il calcolo della media aritmetica; la ricerca del valore minimo o max.
La tecnica è definita “slice & dice" (termine che si riferisce all’operazione di divisione di una torta). Questa tecnica consente di restringere l’analisi solo ad alcune delle occorrenze delle dimensioni e solo ad alcune delle dimensioni proposte. E’ possibile ad. Es., esplorare le vendite annuali solo in alcune regioni e di queste regioni solo di alcune città. I dati visualizzati si riferiranno unicamente alle occorrenze selezionate

Ricerca 11 - Costruzione di un Datatime report da database Northwind

- Accedere al programma Datatime cliccando sull’icona.
- Selezionare New Project oppure su Open Project se il file è già stato creato.Compare la connessione al DBMS prescelto.
- Si clicca su DB Explorer – quick report e poi su (re)Load Structure. Si sceglie una tabella tra quelle presenti nel DB (in questo caso è stata scelta la tabella “Ordini” – vedi immagine 1) e si seleziona Quick report.




- Si apre la finestra Report Grid Design (slice and dice) dalla quale scegliere le misure e le dimensioni che si intendono riassumere nel report.
Per fare un report con layout cross sono state scelte due dimensioni, una verticale ed una orizzontale, unitamente ad una misura da indicare nel riquadro “cross”, per la quale è stata scelta la funzione Totals (immagine 2)




- Si clicca su Generate e il report tabellare è pronto.
Le dimensioni sono visibili nella intestazione di colonna e di riga mentre nelle celle è indicato i dato che si trova all’incrocio dei valori delle due dimensioni. Alla fine di ciascuna riga e colonna è indicata la somma corrispondente alle due misure. L’ultima cella in basso a sx rappresenta il totale complessivo dei dati contenuti in entrambe le misure (immagine 3).



- Trascinando l’immagine del grafico a torta nella pagina creata si genera il grafico, la cui configurazione grafica può essere scelta. Ovviamente i valori coincidono con le dimensioni prescelte (immagine 4).





- Allo stesso modo è possibile generare il cruscotto (immagine 5).




Se si vuole realizzare un report con layout verticale è sufficiente selezionare la dimensione (in questo caso Region) e la misura (supllier ID) prescelte nell'apposito riquadro verticale (immagine 6).




- Cliccare su Generate ed il software provvederà a creare il report che sintetizza i dati richiesti.

- Trascinando l'icona del grafico e del cruscotto nella pagina creata si genera l'immagine grafica corrispondente (immagine 7).





mercoledì 5 maggio 2010

ricerca 10 - principali tecniche di mining

Il data mining è una delle attività cruciali per la comprensione, la navigazione e lo sfruttamento dei dati nella nuova era digitale (Ushama Fayyad). Si tratta del processo automatico di scoperta ed individuazione di strutture all’interno dei dati, dove per struttura si intendono patterns, modelli e relazioni. Questo processo, noto anche col nome KDD (Knowledge Discovery in Databases), consente di estrarre conoscenza, in termini di informazioni significative ed immediatamente utilizzabili, da grandi moli di dati, tramite l’applicazione di particolari tecniche ed algoritmi.
Le tecniche maggiormente utilizzate, in questo ambito, sono: clustering, reti neurali, alberi di decisione ed analisi delle associazioni. Ciascuna comprende un vasto insieme di metodi e di algoritmi che hanno l’obiettivo comune di fare emergere patterns (sequenze ripetute, omogeneità, regole, …) dai dati, che, utilizzati a scopo descrittivo e/o previsivo, costituiscono un valido strumento di supporto alle decisioni.
2. Ambiti applicativi
In campo economico-finanziario, le principali applicazioni sono:
• segmentazione della clientela (database marketing) applicazione di tecniche di clustering per individuare i raggruppamenti impliciti nei dati, omogenei in termini di comportamento d’acquisto e di caratteristiche socio-demografiche
• customer retention applicazione di tecniche previsive per individuare i clienti a rischio di abbandono
• fraud detection individuazione di comportamenti fraudolenti
• analisi delle associazioni (market basket analysis) individuazione dei prodotti acquistati congiuntamente
• sequential patterns individuazione di comportamenti ricorrenti in sequenze temporali di eventi
• competitive intelligence applicazione di tecniche di clustering a documenti estratti da banche dati internazionali di tipo tecnicoscientifico volte ad individuare le tecnologie emergenti, le loro relazioni, l’evoluzione temporale e le aziende coinvolte
• analisi testuale (text mining) individuazione degli argomenti trattati da un set di documenti e delle relazioni tra argomenti

Ricerca 10 - Differenza tra datamining e CRM

Il data mining ha per oggetto l'estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati (attraverso metodi automatici o semi-automatici) e l'utilizzazione industriale o operativa di questo sapere.
La statistica - il campo della matematica applicata connesso con l'analisi dei dati - può essere definita altrimenti come "estrazione di informazione utile da insiemi di dati".Il concetto di data mining è analogo. L'unica differenza è che questa recente disciplina ha a che fare con cospicui insiemi di dati.In sostanza il data mining è l'"analisi matematica eseguita su database di grandi dimensioni". Oggi il data mining (letteralmente: estrazione di dati) ha una duplice valenza:
Estrazione, con tecniche analitiche all'avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile;
Esplorazione ed analisi, eseguita in modo automatico o semiautomatico, su grandi quantità di dati allo scopo di scoprire pattern (schemi) significativi.
In entrambi i casi i concetti di informazione e di significato sono legati strettamente al dominio applicativo in cui si esegue data mining, in altre parole un dato può essere interessante o trascurabile a seconda del tipo di applicazione in cui si vuole operare.
Questo tipo di attività è cruciale in molti ambiti della ricerca scientifica, ma anche in altri settori (per esempio in quello delle ricerche di mercato). Nel mondo professionale è utilizzata per risolvere problematiche diverse tra loro, che vanno dalla gestione delle relazioni con i clienti (CRM), all'individuazione di comportamenti fraudolenti per finire all'ottimizzazione di siti web.

Il concetto di Customer relationship management (termine inglese spesso abbreviato in CRM) o Gestione delle Relazioni coi Clienti è legato al concetto di fidelizzazione dei clienti.
Il CRM si articola comunemente in 3 tipologie:
CRM operativo: soluzioni metodologiche e tecnologiche per automatizzare i processi di business che prevedono il contatto diretto con il cliente.
CRM analitico: procedure e strumenti per migliorare la conoscenza del cliente attraverso l'estrazione di dati dal CRM operativo, la loro analisi e lo studio revisionale sui comportamenti dei clienti stessi.
CRM collaborativo: metodologie e tecnologie integrate con gli strumenti di comunicazione (telefono, fax, e-mail, ecc.) per gestire il contatto con il cliente.
L'errore più comune in cui ci si imbatte quando si parla di Customer Relationship Management è quello di equiparare tale concetto a quello di un software. Il CRM non è una semplice questione di marketing né di sistemi informatici, bensì si avvale in maniera sempre più massiccia, di strumenti informatici o comunque automatizzati, per implementare il management. Il CRM è un concetto strettamente legato alla strategia, alla comunicazione, all'integrazione tra i processi aziendali, alle persone ed alla cultura, che pone il cliente al centro dell'attenzione sia nel caso del business-to-business sia in quello del business-to-consumer.
Le applicazioni CRM servono a tenersi in contatto con la clientela, a inserire le loro informazioni nel database e a fornire loro modalità per interagire in modo che tali interazioni possano essere registrate e analizzate.

Ricerca 10 - inquadramento generale tecniche reporting

DEFINIZIONE: IL SISTEMA DI REPORTING
Il sistema di reporting è una “Attività di comunicazione” finalizzata alla produzione di informazioni “just in time” tramite la raccolta e l’elaborazione di dati, a supporto del processo di budgeting e del decision making.
Nell’attività di reporting è necessario tenere in considerazione che i destinatari (riceventi) sono portatori di: aspettative, necessità informative, proprie semantiche, responsabilità specifiche, pregiudizi e credenze. Tutto questo deve essere tenuto in considerazione al fine di confezionare informazioni che siano poi recepite in modo giusto e per le necessità emergenti.

Fig. 2: Dal dato all’informazione













TIPO DI COMUNICAZIONE
Le comunicazioni possono essere di vario tipo: orali, scritte, in forma scritta discorsiva (poco immediata ma più orientante e fedele alle interpretazioni del reportista), in forma tabellare (asettica, richiede l’interpretazione del lettore), in forma grafica (immediata, meno specifica e dettagliata).

FINALITÀ DEL REPORTING
Le finalità del report possono essere di tipo generale e specifico.
Le generali sono:
- diffondere conoscenze all’interno dell’azienda;
- stimolare l’attenzione;
- far capire situazioni e fenomeni;
- produrre interventi.
Mentre le specifiche sono:
- di conoscenza: fornire conoscenze strutturate e di tipo generale sul contesto aziendale in cui si opera, anche non in relazione con l’ambito di responsabilità. Fornire inoltre conoscenze generale comuni a tutti i responsabili dei diversi settori attraverso report non standardizzati.
- di controllo: finalizzate a prendere decisioni spesso per problemi specifici, fornire report centrati sulle variabili su cui i dirigenti sono responsabilizzati. Fornire inoltre conoscenze specifiche all’ambito di azione e responsabilità attraverso report standardizzati.
- decisionali: fornire informazioni in relazione diretta con le decisioni da prendere.

TIPOLOGIA DEI REPORT
I report possono quindi essere classificati in: di conoscenza, di controllo e decisionali.
I primi in particolare possono essere di vario tipo:
- di routine (strutturati, periodici, standard);
- di approfondimento (a richiesta) più analitici;
- non strutturati, ad hoc, per problemi specifici.
Essi possono essere distribuiti in forma congiunta o in forma disgiunta. La decisione di fornire i report nelle varie forme dipende dalle esigenze informative e dalle strategie aziendali.
La diffusione di informazioni utili comporta anche che si definisca il livello di volume informativo che si vuole diffondere, valutando anche che un volume molto alto di informazioni può generare disorientamento soprattutto nei processi decisionali.


SPECIFICITÀ DELLE INFORMAZIONI
Le informazioni da inviare devono avere un grado di dettaglio idoneo a far comprendere la situazione delle variabili da governare (cogliere problemi) creando la possibilità di prendere decisioni e mettere in atto azioni correttive (intervenire praticamente).
Le informazioni inoltre devono essere in grado di far valutare i risultati delle attività (controllare gli effetti) e devono essere tarate sul livello gerarchico (reale potere decisionale) con il giusto grado di dettaglio e di aggregazione.
I vari operatori con i vari ruoli e livelli gerarchici infatti hanno bisogno di informazioni diversificate soprattutto nel grado di dettaglio ed aggregazione e nella specificità dei contenuti.
Più aumenta il livello gerarchico e più aumenta il grado di aggregazione delle informazioni e più diminuisce il grado di dettaglio necessario.
Le informazioni necessarie infatti per la direzione strategica, sono più di tipo gestionale, amministrativo e contabile con alto grado di aggregazione, mentre per le U.O. di tipo clinico le informazioni devono essere più dettagliate e maggiormente orientate alle attività cliniche e ai risultati ottenuti sia in termini di output che di utilizzo particolareggiato delle risorse. Nel confezionare i report sarà quindi necessario trovare il giusto bilanciamento.

TIPOLOGIA PREVALENTE DELLE INFORMAZIONI E LIVELLI
Nel confezionare i report va anche tenuto in considerazione che il dato diventa informazione quando vi è una aggiunta di elementi cognitivi, cioè è in grado di soddisfare le esigenze informative del destinatario, e di elementi di utilità.
Questi elementi riguardano la tempestività, l’attendibilità e la rilevanza. La figura successiva definisce questi concetti.

La tempestività è la caratteristica da tenere più in considerazione. Poter intervenire sui fenomeni prima che questi diventino immodificabili, è sicuramente una cosa da perseguire. Per tale motivo le attività di feedback dei report devono essere più rapide possibile. Un ottimo rapporto fornito alla fine di una attività e che non permetta l’intervento correttivo, perde la sua utilità e quindi la sua principale ragione di essere.
Vale quindi la pena di distinguere i “progress report” dai “final report” che sono delle prese d’atto finalizzati soprattutto ad una valutazione statica che non attiva interventi correttivi sulle attività.

CRITERI PER LA COSTRUZIONE DI UN SISTEMA DI REPORTING:
criteri principali per la costruzione di un sistema di reporting sono molti ed in particolare:
1. rilevanza;
2. controllabilità;
3. concisione/selettività;
4. gerarchizzazione;
5. frequenza/tempestività;
6. attendibilità;
7. comprensibilità;
8. confrontabilità,

Ne esistono anche altre, quali ad esempio: Orientamento, Bilanciamento, Leggibilità e Flessibilità.
La tabella successiva riporta in sintesi i criteri principali e le specifiche di essi.

CONCLUSIONI
I sistemi di reporting trovano la loro applicazione sia all’interno dell’azienda in generale che
anche nelle attività di progetto. In questo ambito si vuole sottolineare semplicemente l’importanza che questi sistemi
rivestono se soprattutto viene rispettato, al di là della qualità delle informazioni trasmesse, anche il criterio della tempestività. Nessuna informazione è utile dopo che è passato il tempo entro il quale, sulla base di tali informazioni, si potevano prendere decisioni per migliorare le attività cliniche o amministrative.

Ricerca 9 - Principali strumenti di reporting: acquisizioni. Elementi di layout: totali interruzioni, sezioni. Datagrid. Chart. Data source. Meter.

Acquisizioni attraverso la connessione ad un’origine dati
La definizione dell'origine dati (Data Source) consente di specificare il tipo di origine dati, la stringa di connessione e le credenziali, inoltre possono essere condivise per consentirne l'utilizzo da parte di più report oppure possono essere incorporate nella definizione del report.
Le informazioni di connessione archiviate per un'origine dati variano in base al tipo di origine dati. Alcuni tipi di origine dati sono i seguenti:
Microsoft SQL Server
Microsoft SQL Server Analysis Services
OLE DB
Oracle
ODBC
Modello Server report
SAP NetWeaver BI
Hyperion Essbase
Teradata
XML
Gli amministratori di sistema possono installare e configurare estensioni per l'elaborazione dati e provider di dati aggiuntivi.
Quando si crea per la prima volta un report, viene richiesto di creare una definizione dell'origine dati. È possibile creare una nuova definizione dell'origine dati o utilizzare un'origine dati condivisa esistente. Per connettersi a un'origine dati, è necessario avere le informazioni seguenti:
Tipo di origine dati Il tipo specifico di origine dati, ad esempio Microsoft SQL Server.
Informazioni di connessione Note anche come stringa di connessione, le informazioni di connessione includono il nome e il percorso dell'origine dati e talvolta una versione specifica del provider di dati.
Autorizzazioni Per accedere all'origine dati e ai dati specifici di tale origine utilizzando le credenziali specificate, è necessario disporre delle autorizzazioni appropriate.

Elementi di layout: totali, interruzioni, sezioni.
Il layout è l’operazione attraverso la quale si definisce l’impaginazione e la struttura grafica di un documento informatico.
Un layout del report è composto da tre aree principali: l’intestazione di pagina, il piè di pagina, e il corpo. Il corpo della relazione contiene i dati del report. È possibile aggiungere aree dati, caselle di testo, immagini, rettangoli, sottoreport e miglioramenti visivi per il layout del report.
L'intestazione e il piè di pagina consentono di ripetere lo stesso contenuto nella parte superiore e inferiore di ogni pagina del report. È possibile inserire elementi di report quali immagini, caselle di testo e linee in intestazioni e piè di pagina.

Attraverso l’interruzioni di pagina, che può essere automatica o manuale, si interrompe il testo inserito nella pagina di dimensioni predefinite, che viene automaticamente spostato nella pagina successiva.

L’interruzione di sezione consente di variare il layout di un documento all’interno di una pagina o tra più pagine. E’ sufficiente inserire l’interruzione di sezione affinchè sia possibile formattare ciascuna sezione nel modo desiderato.

Un componente particolarmente utile quando si tratta di mostrare dati tabellari è il DataGrid. Esso permette di mostrare una serie di dati ed eventualmente ordinarli in base ad una determinata colonna, inoltre è anche possibile offrire all'utente la possibilità di modificare i dati contenuti nelle varie celle della tabella.

CHART – Questo termine identifica le rappresentazioni di dati attraverso grafici, che possono assumere la diversa configurazione di grafici a torta, diagrammi di flusso, a blocchi, ecc. I dati rappresentati in un grafico sono spesso frutto di aggregazione. Agli utenti appare una prima vista di dati ma essi hanno spesso bisogno di approfondire (drill-down), ruotare, filtrare, raggruppare. Interattivamente. Tra gli applicativi più utilizzati per la creazione di Chart è da segnalare Dundas Chart for ASP.NET, che costruisce il proprio supporto per la programmazione interattiva di grafici attorno a quattro pilastri e relative funzionalità: selezione, drill-down, movimenti del mouse, ed embedded UI.

Meter è un sistema di reportistica che sfrutta la componente di sintesi grafica in maniera molto efficace. Attraverso un report meter è possibile visualizzare in maniera puntuale ed immediata i dati di riferimento che vengono aggiornati automaticamente e quindi sempre attuali.
Versioni di meter sul mercato
Time Meter. Versione di Miscrosoft Outlook mette a disposizione una tecnologia che permette di monitorare automaticamente il tempo e le spese ed in grado di garantire un alto livello di precisione. Permette di sistematizzare i progetti correnti, le scadenze, le tariffe orarie e gli impegni assegnati al personale in base ad un modello di monitoraggio reale, che consente di calcolare automaticamente il costo delle risorse umane impiegate.



Spotlight on windows è un software meter gratuito. E ‘ molto completo, graficamente accattivante, ricco di funzionalità. Funziona su Windows 2000 e superiori. SoW controlla tutti i sistemi di risorse rilevanti e la visualizzazione è sviluppata in modo professionale.


Windows Side Bar Con Vista, Microsoft ha introdotto una misura eccellente strumento di informazione e desktop, la barra laterale di Windows.


Tiny Res Meter è uno strumento di misurazione di piccole dimensioni semplice, veloce ed efficace. Anche se non offre molte opzioni per cambiare la sua presentazione (solo tipo di carattere e colore) offre comunque una grande varietà di informazioni sul display come l'utilizzo della CPU, l'utilizzo di RAM, il numero di processi, e molto altro ancora.


Raynmeter è uno dei report che valorizza la rappresentazione grafica delle informazioni.


Resource Meter software visualizza informazioni specifiche relative al sistema, per lo più sulle risorse disponibili, sulla capacità della CPU, sullo spazio di memoria o spazio su disco attualmente in uso (o disponibili). Molti professionisti utilizzano queste utilità regolarmente perché sono in gradi di rivelare eventuali perdite di prestazioni.