Sql Server 2000 in prima fila per l’analisi dei dati Auditel in Rai

Carolina Agosti

Con la tecnologia di Microsoft, Rai Information and Communication Technology ha sviluppato una soluzione di data warehouse in grado di supportare l’area marketing nell’interpretazione dei report sull’ascolto radiotelevisivo e nella programmazione del palinsesto

 

 

La Rai riceve quotidianamente i dati di ascolto Auditel, società responsabile della rilevazione dell'audience delle principali reti televisive nazionali. Gli elementi raccolti, che interessano l'ascolto medio relativo ai singoli programmi televisivi (dati del trasmesso) e all'esatto momento della giornata (ascolto esteso considerato minuto per minuto), riferiti a differenti target di telespettatori, sono alla base della programmazione televisiva e dell'analisi sul gradimento degli utenti. Alla corretta compilazione del palinsesto e alla successiva pianificazione degli spazi pubblicitari, come hanno spiegato i responsabili del progetto Analisi Ascolto in Rai, partecipano diverse realtà operative, tra cui le divisioni televisive e dell'area marketing.
Le note vengono inviate da Auditel al sistema informativo della Tv di Stato, archiviate e messe a disposizione per studi ed elaborazioni successive. Per aggiornare l'infrastruttura informatica e permettere al marketing di sviluppare nuovi servizi, Rai Information and Communication Technology (Ict) ha deciso di realizzare il sistema di analisi dell'ascolto utilizzando la tecnologia Microsoft basata su Sql Server 2000 e Windows 2000 Datacenter.

La piattaforma multidimensionale
Per la definizione della nuova architettura la società di viale Mazzini ha puntato su una soluzione che consentisse analisi Olap sofisticate, tenendo conto dell'ampia tipologia di indicatori e di dimensioni di studio (tempo, reti, target, generi televisivi e così via), delle analisi di data mining e della possibilità di reperire e integrare informazioni diverse anche di tipo testuale e multimediale.
Studi e sperimentazioni hanno individuato in Sql Server 2000 il sistema adatto per il data warehousing, anche per la facilità d'uso e d'amministrazione e per i limitati costi di implementazione e gestione. Il progetto, che ha visto la partecipazione di Microsoft Consulting Services e si è rivelato particolarmente significativo da un punto di vista tecnico a causa dell'elevato volume dei dati in gioco, ha richiesto un attento disegno del data warehouse. Le informazioni contenute nel Dw relazionale sono caricate e sommarizzate in datamart multidimensionali per rendere più efficiente l interrogazione e l'analisi dei dati, garantendo nel contempo prestazioni adeguate. La "fact table" dell'ascolto esteso, per la memorizzazione dei dati di ascolto rilevati minuto per minuto su un totale di dodici reti televisive, supera, ad esempio, i due miliardi di record, mentre la dimensione del data warehouse va ben oltre i 500 Gb.
L'utilizzo di tecniche di data partitioning e un attento disegno delle componenti tecniche della soluzione hanno permesso di affrontare e risolvere tali problematiche.

Aggiornamento e analisi di data mining
I report che rilevano l'ascolto tengono conto di alcuni elementi da considerare nella definizione e nella generazione di una banca dati completa, tra cui lo zapping effettuato fra i programmi (anche solo di pochi minuti), la collocazione di intermezzi pubblicitari e i fenomeni legati alla reazione degli spettatori. Il caricamento dei dati, che avviene con cadenza giornaliera, è stato realizzato attraverso i servizi Dts (Data trasformation service) di Sql Server 2000 che hanno permesso di migliorare la velocità di aggiornamento, rispondendo alle esigenze della Rai di analizzare i dati di ascolto a pochi minuti dalla ricezione, cosa che avviene intorno alle ore dieci del mattino.
Anche i requisiti funzionali e di prestazione per l'interrogazione e l'analisi grafica dei dati (rappresentazione del palinsesto e charting) sono risultati particolarmente sofisticati e sono stati ottenuti utilizzando Excel 2000 e i componenti Pivot Table e Chart per le analisi multidimensionali. Inoltre, le informazioni grezze di ascolto del campione Auditel sono oggetto di un attento studio di datamining (attraverso gli algoritmi integrati in Sql Server 2000) per rilevare i comportamenti degli utenti televisivi.

L'architettura per il data warehousing
La direzione di Rai Ict ha definito un'architettura per il data warehousing composta da quattro server Compaq Proliant 8500, equipaggiati con otto Cpu Intel Pentium III Xeon 700 MHz e 4 Gb di Ram. L'utilizzo di Microsoft Windows 2000 Datacenter definisce una soluzione di clustering a quattro nodi ad alta affidabilità, due dei quali dedicati al data warehouse per l'area Analisi Ascolto, al fine di suddividere il carico elaborativo del database relazionale e dei datamart multidimensionali.
Grazie alle funzionalità offerte da Sql Server 2000, tra cui Analysis Services, la Rai può eseguire analisi multidimensionali, sfruttando i servizi Olap, e ricerche sofisticate di data mining su insiemi di dati complessi e di grandi dimensioni. Le tecnologie impiegate consentono, inoltre, di integrare rapidamente le analisi eseguite all'interno dei documenti, dei report e delle tabelle in formato Word ed Excel, a supporto delle riunioni di marketing e delle attività di pianificazione dei programmi e degli spazi pubblicitari. Sql Server 2000, infine, permette di effettuare query per richiedere l'elaborazione dei dati di ascolto degli ultimi quattro anni e dell'audience delle trasmissioni andate in onda negli ultimi dieci anni. La riduzione dei tempi di risposta del database consente, poi, un elaborazione migliore, in grado di supportare le decisioni strategiche, la programmazione e la vendita degli spazi pubblicitari.