Il
termine Business Intelligence, coniato all’inizio degli anni '90
da Howard Dresner, un analista del Gartner Group, viene utilizzato per indicare un
insieme di strumenti e metodologie per la raccolta e l'analisi dei dati,
atti a presentare i dati stessi in maniera tale che rappresentino
un'informazione utile per gestire i processi decisionali di un'azienda o
di un'organizzazione. Si può intuire come questa definizione piuttosto ampia includa varie
sottocategorie che vengono identificate con sigle e nomi diversi, come Data Warehousing, Data Mining,
BPM, CPM, CRM, Scorecards, Dashboards, Budgeting, Planning fino ad
includere aree confinanti come il Knowledge
Management.
-
Mentre i sistemi gestionali, detti anche "operazionali" o
"transazionali", si
occupano principalmente di inserire ed aggiornare i dati, lo scopo dei
sistemi di
Business Intelligence è di estrarre da questa "materia prima"
costituita dai dati tutte le informazioni più o meno nascoste che
questi contengono. Chiaramente le due categorie hanno scopi e requisiti
diversi,
e richiedono tecniche di progettazione completamente diverse.
-
- Le aree alle
quali è possibile applicare le tecnologie di B.I. rappresentano la quasi
totalità dei settori aziendali, anche se storicamente l'area del CRM
analitico ha visto
il maggior numero di applicazioni sul campo.
- Tanto più le
aziende producono informazioni, tanto più hanno bisogno di presentarle
in maniera armonica per supportare i processi decisionali; la B.I. si
rivolge principalmente al management (strategico, tattico,
operativo) o al knowledge worker,
fornendo loro gli strumenti necessari a prendere decisioni e risolvere
problemi.
Un sistema di BI
risponde a requisiti di funzionalità e progettazione che vanno ben oltre quelli
propri di un normale ambiente di reportistica facente parte di un'applicazione
gestionale. In particolare, un sistema di BI deve possedere le seguenti
caratteristiche:
|
Facilità d'uso:
presentare i dati in un formato che sia facile da leggere e da interpretare,
dove sia possibile navigare sui dati seguendo dei percorsi di analisi e che
faccia un ampio uso di grafici. I nomi dei campi devono essere
facilmente comprensibili dall'utente finale |
|
Velocità:
possibilità di trattare grandi volumi di dati con tempi di risposta quasi
istantanei grazie all'uso di tecniche di modellazione, memorizzazione e
indicizzazione dei dati orientate all'analisi piuttosto che
all'aggiornamento dei dati. |
|
Integrazione:
integrare tra loro dati provenienti da fonti differenti, sia interne che
esterne all'azienda. Il processo di
integrazione deve essere affidabile e testato, in modo che gli utenti
possano fare affidamento sui dati presenti nel DW. Se i dati provenienti dai
sistemi operazionali non sono puliti ed affidabili, prima di essere inseriti
nel DW devono passare attraverso un processo di pulizia (data cleansing) e certificazione.
|
|
Storicizzazione:
mantenere la storia dei cambiamenti subiti da certi attributi selezionati,
per permettere analisi storiche contestualizzate. |
|
Identificazione
di trend ed anomalie: gli strumenti devono facilitare l'identificazione
di trend nei dati, ad esempio confrontando periodi e prodotti diversi.
Queste operazioni sono possibili solo con l'utilizzo di strumenti
interattivi che permettano di effettuare operazioni di drill down/drill
up (visualizzazione dei dettagli su un certo dato) e di slice & dice
(cambiamento delle dimensioni di analisi sui due assi). |
|
Subject orientation:
presentare i dati in modo da fornire la visione di un processo aziendale (supply chain,
vendite, qualità...), attraversando i confini delle singole aree dei
sistemi gestionali. |
|
Simulazione
scenari: in
certi casi (applicazioni di budgeting, forecasting and planning) deve essere possibile
impostare degli scenari e confrontarli poi con i valori reali
("actual") |
|
Indipendenza dal
reparto I.T.: gli strumenti di analisi e reportistica devono dare la possibilità
agli utenti finali di crearsi da soli i report di cui hanno bisogno |
|
Adattabilità nel
tempo, intesa come la capacità di resistere alle inevitabili evoluzioni
della realtà aziendale, dei sistemi operazionali e delle esigenze di analisi |
|
Sicurezza: deve essere
possibile controllare in maniera al tempo stesso stretta e flessibile
l'accesso ai dati, che in molti casi includono informazioni altamente
riservate. |
Soprattutto, nel
disegnare un sistema di BI è necessario ricordarsi che deve svolgere bene il suo
compito originario, che è quello di supportare le decisioni
-
- Cosa si
intende per Data Warehouse, OLAP e Knowledge Management?
- Quelle che
seguono sono solo definizioni senza alcuna pretesa di approfondimento;
per capire meglio i concetti di base si rimanda agli approfondimenti
contenuti nelle sezioni links ad
altri siti e Articoli.
-
- Data Warehouse
(DWH)
Il Data Warehouse è
un insieme di dati e strumenti software aventi lo scopo di prelevare i
dati dai sistemi gestionali di un'azienda o da fonti esterne e di utilizzarli per effettuare
vari tipi di interrogazioni a carattere generalmente
statistico/analitico.
Per rendere facili e veloci le interrogazioni di grandi volumi di dati,
questi ultimi devono prima
essere organizzati in maniera differente dai normali database
operazionali (OLTP).
Per questo sono state concepite strutture di dati alternative a quelle
dei database operazionali; mentre questi si basano sui concetti e sulle
regole relazionali (Entity-Relationship), i Data Warehouse sono
generalmente basati sul modello detto dimensionale o Star Schema, ottimizzato per rispondere
velocemente a interrogazioni di vario tipo.
-
- OLAP (On Line
Analytical Processing)
- Con il termine
OLAP si intende la possibilità di effettuare analisi dei dati su
strutture multidimensionali in maniera rapida, flessibile ed efficiente,
attraverso i servizi forniti da motori di database specifici.
- Le analisi
multidimensionali (in Inglese "Slice & Dice") consistono
nel "navigare" i dati lasciando all'utente la facoltà di
scegliere interattivamente le
informazioni da visualizzare ed i filtri da applicare.
- La
tecnologia OLAP quindi consente all'utente di realizzare da
solo le sue analisi, senza la necessità di ricorrere all'aiuto di
personale tecnico.
-
- Knowledge
Management
- Con questo
termine si intende la capacità di gestire la competenza globale di un
organismo (azienda, ente) intesa come somma delle competenze dei
singoli, permettendone uno sfruttamento razionale. La conoscenza aziendale
trae origine in genere da tre diverse fonti:
- - I dati che
risiedono nei documenti, nei database operativi e nei Data Warehouse
- La conoscenza delle persone che lavorano in azienda
- Le fonti esterne (Internet o basi dati di terze parti)
Il K.M. integra queste fonti diverse e le incanala
verso una struttura funzionale alle esigenze specifiche dell'azienda in cui
viene realizzato.
- A
cosa serve un Data Warehouse ?
- In generale un
Data Warehouse serve ad accrescere la conoscenza di certi fenomeni, che
possono riguardare diverse aree aziendali come le vendite per un'azienda
manifatturiera o le polizze per un'assicurazione.
Per un corretto approccio metodologico, è opportuno come prima cosa
definire le grandezze che misurano questi fenomeni: queste grandezze si
chiamano KPI (Key Performance Indicator). Un esempio di KPI è la
differenza nelle vendite dello stesso prodotto in un certo mese rispetto
allo stesso mese dell'anno precedente.
- Quelli che
seguono sono alcuni possibili esempi di applicazioni della tecnologia
dei Data Warehouse:
Analisi delle vendite
|
Analizzare le vendite del
passato per capire i fattori di successo e di fallimento |
|
Individuare i trend per
prodotto, zona, stagione, negozio |
|
Analizzare i risultati delle
promozioni |
Customer Relationships Management (CRM)
|
Analizzare la redditività dei
clienti per età, zona, fascia di reddito |
|
Comprendere le preferenze
degli utenti per inviare promozioni mirate |
| Individuare i clienti che non
acquistano più e capire come riconquistarli |
Analisi finanziaria, Controllo di gestione
|
Confrontare budget e risultati
operativi |
|
Prevedere i flussi di cassa
sulla base dei dati passati |
Ordini, fatture e consegne
|
Andamento degli ordini e del
fatturato, sconti |
|
Spedizioni e consegne:
puntualità, distribuzione nel tempo e nello spazio, modalità, costi |
Risorse Umane (HR)
|
Struttura
organizzativa dell'azienda, mansioni e tipologie contrattuali |
|
Caratteristiche dei collaboratori (dati personali, curriculum, formazione e
specializzazioni maturate, attitudini e competenze, mansione, ruolo,
categoria) |
|
Giornate e
ore lavorate, assenze, infortuni |
|
Costi del
personale suddivisi per divisione, livello, mansione, centro di costo |
|
Retribuzioni,
benefit, rimborsi spese |
Glossario dei termini
di BI (fonte: Technetdati)
Back-end |
Componenti dell’architettura che
consentono al DWH di fornire nei tempi e nei modi previsti le
informazioni necessarie al business (processi di alimentazione,
trasformazione, aggregazione, controllo, ecc.).
|
Data Mart (DM) |
Insieme di dati organizzati per
supportare specifiche esigenze di un gruppo di utenti (es. dipartimento)
che viene alimentato da processi di estrazione e trasformazione
utilizzando i dati del DWH.
L’organizzazione dei dati è
multidimensionale e può essere implementato con base dati
multidimensionale o relazionale.
Contiene dati di dettaglio e
aggregati ed è anche detta "base dati di secondo livello" (possono
essere presenti più livelli di Data Mart a seconda delle esigenze).
|
Data Warehouse (DWH) |
Insieme di dati tematici,
integrati, temporali, permanenti finalizzato al supporto dei processi
decisionali. Viene alimentato attraverso processi di alimentazione e
trasformazione utilizzando dati contenuti nei database operazionali ed
eventualmente dati esterni.
Contiene dati di dettaglio o con
aggregazioni minime ed è anche detta "base dati di primo livello".
|
Dimensioni |
Insieme di attributi, generalmente
di tipo testo, che definiscono e danno un significato alle misure (es.
Tempo, Prodotto, Cliente, Mercato, Promozione, Contratti, Fornitore,
Transazioni, ecc.)
|
Drill |
Funzionalità OLAP che consente di
visualizzare dati a diversi livelli di dettaglio, “navigando” attraverso
le gerarchie. Si parla di drill-up quando l’operazione provoca
un’aggregazione delle informazioni (es. da quantità venduta per modello
a quantità venduta per marca), drill-down quando succede il
contrario.
|
ETT |
Letteralmente Extraction,
Transformation and Transportation, è l’insieme dei processi che
consentono l’alimentazione dell’architettura DWH a partire dai dati
contenuti nei sistemi sorgente (operazionali e dati esterni).
|
Front-end |
Componenti dell’architettura che
consentono la fruizione delle informazioni da parte degli utenti
(strumenti di query e analisi o applicazioni personalizzate).
|
Gerarchie |
Naturale correlazione tra attributi
appartenenti alla stessa dimensione, dipendente dall’organizzazione e
dalle specifiche esigenze applicative. Qui di seguito sono riportati
alcuni esempi di gerarchie (tra parentesi la dimensione).
(Tempo) Anno – Trimestre - Mese –
Giorno
(Prodotto) Marca – Modello –
Versione
(Prodotto) Classe Merceologica –
Disegno
(Transazione) Tipo transazione –
transazione
Possono esistere più gerarchie
all’interno della stessa dimensione.
Nei modelli dimensionali le
gerarchie stabiliscono le modalità di aggregazione dei dati, ovvero
delle misure.
|
Metadati |
Letteralmente “dati sui dati”, è
l’insieme di tutte le informazioni che riguardano l’architettura di DWH
a parte i dati stessi. Si possono suddividere in
metadati di business:
informazioni a supporto delle attività di analisi
(es. data ultimo aggiornamento, regole di calcolo degli indicatori,
sistema di provenienza, ecc.)
metadati tecnici:
informazioni a supporto dell’attività IT di gestione dell’architettura
(es. algoritmi di trasformazione e aggregazione, regole di integrazione,
dipendenze dei processi di alimentazione, strutture dati dei sistemi
operazionali, responsabili dei sistemi, ecc.).
|
Misure o Fatti |
Valori, generalmente numerici,
utilizzati dagli utenti per la misurazione del loro business (es.
Quantità venduta, Ricavo, Costo, Presenza/Assenza di un evento, ecc.).
|
Modello multidimensionale |
Organizzazione delle informazioni
orientata alle funzioni di reporting e analisi realizzata per consentire
un efficace utilizzo degli strumenti automatici di query, reporting ed
analisi.
Può essere realizzata fisicamente
su strutture dati proprietarie (database multidimensionali) o su
database relazionali attraverso una modellazione dati denominata
“star-schema”.
|
OLAP |
Letteralmente On Line Analytical
Processing, è l’insieme delle funzionalità utente che consentono di
rendere “dinamica” la visualizzazione delle informazioni attraverso
alcune funzionalità utente denominate drill, slice and dice,
pivoting (descritte di seguito).
|
Slice and dice o pivoting |
Funzionalità OLAP che consente di
ristrutturare le informazioni in modo da renderne più efficace la
visualizzazione: creazione di master-detail e rotazione degli
assi delle rappresentazioni a matrice.
|
Staging Area |
E’ un’area in cui i dati
provenienti dai sistemi operazionali sono temporaneamente memorizzati
per essere sottoposti a processi di “pulizia”, trasformazione e
aggregazione allo scopo di alimentare correttamente il Data Warehouse
|
|