olap.it                 
The N° 1 site for Data Warehousing Professionals

Business Intelligence & Data Warehouse Resource Center

 Home Consulting Services Web Sites & Resources Books Articles Products Consulting Companies News Other Info

Breve introduzione alla Business Intelligence e glossario dei termini

1) La BI in 3 minuti

   Business Intelligence
   Data Warehouse, OLAP, Knowledge Management
   A cosa serve un Data Warehouse?

 

2) Glossario
   Glossario dei termini di BI

Il termine Business Intelligence, coniato all’inizio degli anni '90 da Howard Dresner, un analista del Gartner Group, viene utilizzato per indicare un insieme di strumenti e metodologie per la raccolta e l'analisi dei dati, atti a presentare i dati stessi in maniera tale che rappresentino un'informazione utile per gestire i processi decisionali di un'azienda o di un'organizzazione.
Si può intuire come questa definizione piuttosto ampia includa varie sottocategorie che vengono identificate con sigle e nomi diversi, come Data Warehousing, Data Mining, BPM, CPM, CRM, Scorecards, Dashboards, Budgeting, Planning fino ad includere aree confinanti come il Knowledge Management.
 

Mentre i sistemi gestionali, detti anche "operazionali" o "transazionali", si occupano principalmente di inserire ed aggiornare i dati, lo scopo dei sistemi di Business Intelligence è di estrarre da questa "materia prima" costituita dai dati tutte le informazioni più o meno nascoste che questi contengono. Chiaramente le due categorie hanno scopi e requisiti diversi, e richiedono tecniche di progettazione completamente diverse.
 
Le aree alle quali è possibile applicare le tecnologie di B.I. rappresentano la quasi totalità dei settori aziendali, anche se storicamente l'area del CRM analitico ha visto il maggior numero di applicazioni sul campo.
Tanto più le aziende producono informazioni, tanto più hanno bisogno di presentarle in maniera armonica per supportare i processi decisionali; la B.I. si rivolge principalmente al management (strategico, tattico, operativo) o al knowledge worker, fornendo loro gli strumenti necessari a prendere decisioni e risolvere problemi.

Un sistema di BI risponde a requisiti di funzionalità e progettazione che vanno ben oltre quelli propri di un normale ambiente di reportistica facente parte di un'applicazione gestionale. In particolare, un sistema di BI deve possedere le seguenti caratteristiche:

bullet

Facilità d'uso: presentare i dati in un formato che sia facile da leggere e da interpretare, dove sia possibile navigare sui dati seguendo dei percorsi di analisi e che faccia un ampio uso di grafici. I nomi dei campi devono essere facilmente comprensibili dall'utente finale

bullet

Velocità: possibilità di trattare grandi volumi di dati con tempi di risposta quasi istantanei grazie all'uso di tecniche di modellazione, memorizzazione e indicizzazione dei dati orientate all'analisi piuttosto che all'aggiornamento dei dati.

bullet

Integrazione: integrare tra loro dati provenienti da fonti differenti, sia interne che esterne all'azienda. Il processo di integrazione deve essere affidabile e testato, in modo che gli utenti possano fare affidamento sui dati presenti nel DW. Se i dati provenienti dai sistemi operazionali non sono puliti ed affidabili, prima di essere inseriti nel DW devono passare attraverso un processo di pulizia (data cleansing) e certificazione.

bullet

Storicizzazione: mantenere la storia dei cambiamenti subiti da certi attributi selezionati, per permettere analisi storiche contestualizzate.

bullet

Identificazione di trend ed anomalie: gli strumenti devono facilitare l'identificazione di trend nei dati, ad esempio confrontando periodi e prodotti diversi. Queste operazioni sono possibili solo con l'utilizzo di strumenti interattivi che permettano di effettuare operazioni di drill down/drill up (visualizzazione dei dettagli su un certo dato) e di slice & dice (cambiamento delle dimensioni di analisi sui due assi).

bullet

Subject orientation: presentare i dati in modo da fornire la visione di un processo aziendale (supply chain, vendite, qualità...), attraversando i confini delle singole aree dei sistemi gestionali.

bullet

Simulazione scenari: in certi casi (applicazioni di budgeting, forecasting and planning) deve essere possibile impostare degli scenari e confrontarli poi con i valori reali ("actual")

bullet

Indipendenza dal reparto I.T.: gli strumenti di analisi e reportistica devono dare la possibilità agli utenti finali di crearsi da soli i report di cui hanno bisogno

bullet

Adattabilità nel tempo, intesa come la capacità di resistere alle inevitabili evoluzioni della realtà aziendale, dei sistemi operazionali e delle esigenze di analisi

bullet

Sicurezza: deve essere possibile controllare in maniera al tempo stesso stretta e flessibile l'accesso ai dati, che in molti casi includono informazioni altamente riservate.

Soprattutto, nel disegnare un sistema di BI è necessario ricordarsi che deve svolgere bene il suo compito originario, che è quello di supportare le decisioni


 
Cosa si intende per Data Warehouse, OLAP e Knowledge Management?
Quelle che seguono sono solo definizioni senza alcuna pretesa di approfondimento; per capire meglio i concetti di base si rimanda agli approfondimenti contenuti nelle sezioni  links ad altri siti e Articoli.
 
Data Warehouse (DWH)
Il Data Warehouse è un insieme di dati e strumenti software aventi lo scopo di prelevare i dati dai sistemi gestionali di un'azienda o da fonti esterne e di utilizzarli per effettuare vari tipi di interrogazioni a carattere generalmente statistico/analitico. Per rendere facili e veloci le interrogazioni di grandi volumi di dati, questi ultimi  devono prima essere organizzati in maniera differente dai normali database operazionali (OLTP).
Per questo sono state concepite strutture di dati alternative a quelle dei database operazionali; mentre questi si basano sui concetti e sulle regole relazionali (Entity-Relationship), i Data Warehouse sono generalmente basati sul modello detto dimensionale o Star Schema, ottimizzato per rispondere velocemente a interrogazioni di vario tipo.
 
OLAP (On Line Analytical Processing)
Con il termine OLAP si intende la possibilità di effettuare analisi dei dati su strutture multidimensionali in maniera rapida, flessibile ed efficiente, attraverso i servizi forniti da motori di database specifici. 
Le analisi multidimensionali (in Inglese "Slice & Dice") consistono nel "navigare" i dati lasciando all'utente la facoltà di scegliere interattivamente le informazioni da visualizzare ed i filtri da applicare.
La tecnologia OLAP quindi consente all'utente di realizzare da solo le sue analisi, senza la necessità di ricorrere all'aiuto di personale tecnico.
 
Knowledge Management
Con questo termine si intende la capacità di gestire la competenza globale di un organismo (azienda,  ente) intesa come somma delle competenze dei singoli, permettendone uno sfruttamento razionale. La conoscenza aziendale trae origine in genere da tre diverse fonti:
- I dati che risiedono nei documenti, nei database operativi e nei Data Warehouse
- La conoscenza delle persone che lavorano in azienda
- Le fonti esterne (Internet o basi dati di terze parti)
Il K.M. integra queste fonti diverse e le incanala verso una struttura funzionale alle esigenze specifiche dell'azienda in cui viene realizzato.

A cosa serve un Data Warehouse ?
In generale un Data Warehouse serve ad accrescere la conoscenza di certi fenomeni, che possono riguardare diverse aree aziendali come le vendite per un'azienda manifatturiera o le polizze per un'assicurazione.
Per un corretto approccio metodologico, è opportuno come prima cosa definire le grandezze che misurano questi fenomeni: queste grandezze si chiamano KPI (Key Performance Indicator). Un esempio di KPI è la differenza nelle vendite dello stesso prodotto in un certo mese rispetto allo stesso mese dell'anno precedente. 
Quelli che seguono sono alcuni possibili esempi di applicazioni della tecnologia dei Data Warehouse:
Analisi delle vendite
bullet

Analizzare le vendite del passato per capire i fattori di successo e di fallimento

bullet

Individuare i trend per prodotto, zona, stagione, negozio

bullet

Analizzare i risultati delle promozioni

Customer Relationships Management (CRM)
bullet

Analizzare la redditività dei clienti per età, zona, fascia di reddito

bullet

Comprendere le preferenze degli utenti per inviare promozioni mirate

bullet

Individuare i clienti che non acquistano più e capire come riconquistarli

Analisi finanziaria, Controllo di gestione
bullet

Confrontare budget e risultati operativi 

bullet

Prevedere i flussi di cassa sulla base dei dati passati

Ordini, fatture e consegne
bullet

Andamento degli ordini e del fatturato, sconti

bullet

Spedizioni e consegne: puntualità, distribuzione nel tempo e nello spazio, modalità, costi

Risorse Umane (HR)
bullet

Struttura organizzativa dell'azienda, mansioni e tipologie contrattuali

bullet

Caratteristiche dei collaboratori (dati personali, curriculum, formazione e specializzazioni maturate, attitudini e competenze, mansione, ruolo, categoria)

bullet

Giornate e ore lavorate, assenze, infortuni

bullet

Costi del personale suddivisi per divisione, livello, mansione, centro di costo

bullet

Retribuzioni, benefit, rimborsi spese

Glossario dei termini di BI (fonte: Technetdati)

Back-end

Componenti dell’architettura che consentono al DWH di fornire nei tempi e nei modi previsti le informazioni necessarie al business (processi di alimentazione, trasformazione, aggregazione, controllo, ecc.).

 

Data Mart (DM)

Insieme di dati organizzati per supportare specifiche esigenze di un gruppo di utenti (es. dipartimento) che viene alimentato da processi di estrazione e trasformazione utilizzando i dati del DWH.

L’organizzazione dei dati è multidimensionale e può essere implementato con base dati multidimensionale o relazionale.

Contiene dati di dettaglio e aggregati ed è anche detta "base dati di secondo livello" (possono essere presenti più livelli di Data Mart a seconda delle esigenze).

 

Data Warehouse (DWH)

Insieme di dati tematici, integrati, temporali, permanenti finalizzato al supporto dei processi decisionali. Viene alimentato attraverso processi di alimentazione e trasformazione utilizzando dati contenuti nei database operazionali ed eventualmente dati esterni.

 Contiene dati di dettaglio o con aggregazioni minime ed è anche detta "base dati di primo livello".

 

Dimensioni

Insieme di attributi, generalmente di tipo testo, che definiscono e danno un significato alle misure (es. Tempo, Prodotto, Cliente, Mercato, Promozione, Contratti, Fornitore, Transazioni, ecc.)

 

Drill

Funzionalità OLAP che consente di visualizzare dati a diversi livelli di dettaglio, “navigando” attraverso le gerarchie. Si parla di drill-up quando l’operazione provoca un’aggregazione delle informazioni (es. da quantità venduta per modello a quantità venduta per marca), drill-down quando succede il contrario.

 

ETT

Letteralmente Extraction, Transformation and Transportation, è l’insieme dei processi che consentono l’alimentazione dell’architettura DWH a partire dai dati contenuti nei sistemi sorgente (operazionali e dati esterni).

 

Front-end

Componenti dell’architettura che consentono la fruizione delle informazioni da parte degli utenti (strumenti di query e analisi o applicazioni personalizzate).

 

Gerarchie

Naturale correlazione tra attributi appartenenti alla stessa dimensione, dipendente dall’organizzazione e dalle specifiche esigenze applicative. Qui di seguito sono riportati alcuni esempi di gerarchie (tra parentesi la dimensione).

(Tempo) Anno – Trimestre - Mese – Giorno

(Prodotto) Marca – Modello – Versione

(Prodotto) Classe Merceologica – Disegno

(Transazione) Tipo transazione – transazione

Possono esistere più gerarchie all’interno della stessa dimensione.

Nei modelli dimensionali le gerarchie stabiliscono le modalità di aggregazione dei dati, ovvero delle misure.

 

Metadati

Letteralmente “dati sui dati”, è l’insieme di tutte le informazioni che riguardano l’architettura di DWH a parte i dati stessi. Si possono suddividere in

metadati di business: informazioni a supporto delle attività di analisi (es. data ultimo aggiornamento, regole di calcolo degli indicatori, sistema di provenienza, ecc.)

metadati tecnici: informazioni a supporto dell’attività IT di gestione dell’architettura (es. algoritmi di trasformazione e aggregazione, regole di integrazione, dipendenze dei processi di alimentazione, strutture dati dei sistemi operazionali, responsabili dei sistemi, ecc.).

 

Misure o Fatti

Valori, generalmente numerici, utilizzati dagli utenti per la misurazione del loro business (es. Quantità venduta, Ricavo, Costo, Presenza/Assenza di un evento, ecc.).

 

Modello multidimensionale

Organizzazione delle informazioni orientata alle funzioni di reporting e analisi realizzata per consentire un efficace utilizzo degli strumenti automatici di query, reporting ed analisi.

Può essere realizzata fisicamente su strutture dati proprietarie (database multidimensionali) o su database relazionali attraverso una modellazione dati denominata “star-schema”.

 

OLAP

Letteralmente On Line Analytical Processing, è l’insieme delle funzionalità utente che consentono di rendere “dinamica” la visualizzazione delle informazioni attraverso alcune funzionalità utente denominate drill, slice and dice, pivoting (descritte di seguito).

 

Slice and dice o pivoting

Funzionalità OLAP che consente di ristrutturare le informazioni in modo da renderne più efficace la visualizzazione: creazione di master-detail e rotazione degli assi delle rappresentazioni  a matrice.

 

Staging Area

E’ un’area in cui i dati provenienti dai sistemi operazionali sono temporaneamente memorizzati per essere sottoposti a processi di “pulizia”, trasformazione e aggregazione allo scopo di alimentare correttamente il Data Warehouse