venerdì 30 ottobre 2009

Che cosa sono i datawarehouse e cosa li differenzia dai sistemi OLTP


Innanzitutto partiamo dal definire cos’è un Data warehouse. Esso è un archivio informatico contenente i dati di un’organizzazione. I DW sono progettati per consentire di produrre facilmente relazioni ed analisi.

Vengono considerati componenti essenziali di un sistema Data warehouse anche gli strumenti per localizzare i dati, per estrarli, trasformarli e caricarli, come pure gli strumenti per gestire un dizionario dei dati.

L’integrazione dei dati costituisce la principale caratteristica distintiva del DW rispetto ad altri sistemi di supporto alle decisioni. La raccolta dei dati deve essere: integrata, orientata al soggetto, variabile nel tempo e non volatile.

Esso si differenzia in modo sostanziale dai normali sistemi gestionali che, al contrario, hanno il compito di automatizzare le operazioni di routine.

Inoltre i DW sono basi informative costruite per fornire informazioni aggregate e organizzate per aree tematiche. Le banche dati interattive sono applicazioni OLAP (On Line Analytical Processing) per l’analisi dei dati via Internet, basate su Data Warehouse costruiti a partire da archivi di diverse fonti e formati.
I prodotti consentono di interagire dinamicamente con le banche dati per ottenere report multidimensionali visualizzabili sia in forma tabellare che grafica (barre, torte, mappe territoriali) ed esportabili in Excel.
Le variabili disponibili e il dettaglio raggiungibile sono legati a differenti profili di utenza (utente anonimo, istituzionale con ambito nazionale/regionale/comunale).

A differenza delle analisi con tecnologia OLAP , la tecnologia OLTP non prevede la creazione di banche dati separate, infatti le analisi vengono effettuate direttamente sui dati di esercizio. Questa soluzione permette di avere i dati sempre aggiornati ed evita fasi intermedie di trasformazione dei dati, tuttavia per la sua stessa natura non è facilmente applicabile in situazioni dove la quantità di dati da analizzare sia molto elevata ed in questi casi viene generalmente preferito l’utilizzo di analisi di tipo OLAP.

Nessun commento:

Posta un commento