La Rai riceve quotidianamente i dati di ascolto Auditel,
società responsabile della rilevazione dell'audience delle principali reti
televisive nazionali. Gli elementi raccolti, che interessano l'ascolto medio
relativo ai singoli programmi televisivi (dati del trasmesso) e all'esatto
momento della giornata (ascolto esteso considerato minuto per minuto),
riferiti a differenti target di telespettatori, sono alla base della
programmazione televisiva e dell'analisi sul gradimento degli utenti. Alla
corretta compilazione del palinsesto e alla successiva pianificazione degli
spazi pubblicitari, come hanno spiegato i responsabili del progetto Analisi
Ascolto in Rai, partecipano diverse realtà operative, tra cui le divisioni
televisive e dell'area marketing.
Le note vengono inviate da Auditel al sistema informativo della Tv di Stato,
archiviate e messe a disposizione per studi ed elaborazioni successive. Per
aggiornare l'infrastruttura informatica e permettere al marketing di
sviluppare nuovi servizi, Rai Information and Communication Technology (Ict)
ha deciso di realizzare il sistema di analisi dell'ascolto utilizzando la
tecnologia Microsoft basata su Sql Server 2000 e Windows 2000 Datacenter.
La piattaforma multidimensionale
Per la definizione della nuova architettura la società di viale Mazzini ha
puntato su una soluzione che consentisse analisi Olap sofisticate, tenendo
conto dell'ampia tipologia di indicatori e di dimensioni di studio (tempo,
reti, target, generi televisivi e così via), delle analisi di data mining e
della possibilità di reperire e integrare informazioni diverse anche di tipo
testuale e multimediale.
Studi e sperimentazioni hanno individuato in Sql Server 2000 il sistema
adatto per il data warehousing, anche per la facilità d'uso e
d'amministrazione e per i limitati costi di implementazione e gestione. Il
progetto, che ha visto la partecipazione di Microsoft Consulting Services e
si è rivelato particolarmente significativo da un punto di vista tecnico a
causa dell'elevato volume dei dati in gioco, ha richiesto un attento disegno
del data warehouse. Le informazioni contenute nel Dw relazionale sono
caricate e sommarizzate in datamart multidimensionali per rendere più
efficiente l interrogazione e l'analisi dei dati, garantendo nel contempo
prestazioni adeguate. La "fact table" dell'ascolto esteso, per la
memorizzazione dei dati di ascolto rilevati minuto per minuto su un totale
di dodici reti televisive, supera, ad esempio, i due miliardi di record,
mentre la dimensione del data warehouse va ben oltre i 500 Gb.
L'utilizzo di tecniche di data partitioning e un attento disegno delle
componenti tecniche della soluzione hanno permesso di affrontare e risolvere
tali problematiche.
Aggiornamento e analisi di data
mining
I report che rilevano l'ascolto tengono conto di alcuni elementi da
considerare nella definizione e nella generazione di una banca dati
completa, tra cui lo zapping effettuato fra i programmi (anche solo di pochi
minuti), la collocazione di intermezzi pubblicitari e i fenomeni legati alla
reazione degli spettatori. Il caricamento dei dati, che avviene con cadenza
giornaliera, è stato realizzato attraverso i servizi Dts (Data trasformation
service) di Sql Server 2000 che hanno permesso di migliorare la velocità di
aggiornamento, rispondendo alle esigenze della Rai di analizzare i dati di
ascolto a pochi minuti dalla ricezione, cosa che avviene intorno alle ore
dieci del mattino.
Anche i requisiti funzionali e di prestazione per l'interrogazione e
l'analisi grafica dei dati (rappresentazione del palinsesto e charting) sono
risultati particolarmente sofisticati e sono stati ottenuti utilizzando
Excel 2000 e i componenti Pivot Table e Chart per le analisi
multidimensionali. Inoltre, le informazioni grezze di ascolto del campione
Auditel sono oggetto di un attento studio di datamining (attraverso gli
algoritmi integrati in Sql Server 2000) per rilevare i comportamenti degli
utenti televisivi.
L'architettura per il data
warehousing
La direzione di Rai Ict ha definito un'architettura per il data warehousing
composta da quattro server Compaq Proliant 8500, equipaggiati con otto Cpu
Intel Pentium III Xeon 700 MHz e 4 Gb di Ram. L'utilizzo di Microsoft
Windows 2000 Datacenter definisce una soluzione di clustering a quattro nodi
ad alta affidabilità, due dei quali dedicati al data warehouse per l'area
Analisi Ascolto, al fine di suddividere il carico elaborativo del database
relazionale e dei datamart multidimensionali.
Grazie alle funzionalità offerte da Sql Server 2000, tra cui Analysis
Services, la Rai può eseguire analisi multidimensionali, sfruttando i
servizi Olap, e ricerche sofisticate di data mining su insiemi di dati
complessi e di grandi dimensioni. Le tecnologie impiegate consentono,
inoltre, di integrare rapidamente le analisi eseguite all'interno dei
documenti, dei report e delle tabelle in formato Word ed Excel, a supporto
delle riunioni di marketing e delle attività di pianificazione dei programmi
e degli spazi pubblicitari. Sql Server 2000, infine, permette di effettuare
query per richiedere l'elaborazione dei dati di ascolto degli ultimi quattro
anni e dell'audience delle trasmissioni andate in onda negli ultimi dieci
anni. La riduzione dei tempi di risposta del database consente, poi, un
elaborazione migliore, in grado di supportare le decisioni strategiche, la
programmazione e la vendita degli spazi pubblicitari. |