martedì 8 dicembre 2009

Architetture per i sistemi informativi aziendali: DW, DATA MART E DBMS TRANSAZIONALI


Quando parliamo di sistemi informativi aziendali ci riferiamo alla capacità di estrarre, integrare ed elaborare informazioni pervenuti da sorgenti informative eterogenee in real-time, amalgamandole con le informazioni già storicizzate e memorizzate nei diversi data mart.
Data Warehouse è l’insieme di dati tematici, integrati, temporali, permanenti finalizzato al supporto dei processi decisionali. Viene “nutrito” da processi di propulsione e trasformazione utilizzando dati contenuti nei database operazionali ed eventualmente dati esterni.

Una struttura DW ha l’arduo compito di rappresentare l’attività aziendale in modo trasparente e documentata. Questo sistema informativo ha una complessità architetturale: è costituito da una serie di componenti accoppiate tra di loro(ossia stretti legami di interdipendenza poco mascherati da interfacce standardizzate). Alcune di queste componenti (sistemi sorgente), sono tipicamente al di fuori dal controllo di chi gestisce il sistema di DW, malgrado ciò sono parte integrante del sistema stesso. Una variazione significativa su un sistema sorgente spesso si ripercuote su tutte la sua architettura: dalle procedure di alimentazione fino alla reportistica e alle funzioni analitiche. Pur essendo presenti strumenti di separazione fra i diversi passi del processo di trasformazione del dato in informazione (staging area, edw, data marts, strati semantici, ecc.). Si realizzano mutamenti significativi nelle regole di business o nella modellazione concettuale dell’informazione.

Tra i vari vantaggi, ricordiamo la possibilità di fornire una visione consistente delle informazioni dell’impresa, con ambienti informativi ed eterogenei (hardware e sistemi operativi diversi, ecc.), e fornire risposte agli utenti di alto livello senza l’assistenza dei tecnici.

All’interno dell’azienda esistono molti “depositi di informazione” talvolta incompleti ma sempre possibile, in ogni caso, usufruire di alcune fonti informative da cui è possibile prelevare informazioni utili per il DWH. Mi riferisco ai sistemi legacy, i dati delle applicazioni desktop di office automation (database desktop, fogli elettronici, documenti, presentazioni, oggetti multimediali, ecc.) e potenzialmente a tutti i documenti che vengono prodotti all’interno dell’azienda o vengono ricevuti dall’esterno (fax, offerte, comunicati stampa, posta elettronica semistruttura e strutturata, ecc.).

Funzionamento: è possibile utilizzare dei tools di estrazione e/o pulizia dei dati per renderli omogenei ed introdurli nel database di destinazione. Nei primi progetti di DWH questa operazione di conversione e “pulizia” dei dati veniva eseguita una tantum; la conseguenza era quella di poter effettuare le analisi su dati non sempre aggiornati. Adesso molti prodotti software di estrazione consentono di effettuare estrazioni on-line per interrogazioni sempre aggiornate (real-time).

Progettare soluzioni di data warehouse è generalmente molto interessante, appunto per le sue varie fasi: individuazione dei requirements, modellazione della soluzione, individuazione delle politiche di ETL, implementazione della base dati, creazione della reportistica e dei contesti di analisi.

I vantaggi del DWH si possono riassumere facilmente utilizzando le seguenti relazioni:

VANTAGGI AUTOMAZIONE = RIDUZIONE COSTI

VANTAGGI INFORMAZIONI = RIDUZIONE COSTI + CRESCITA FATTURATO (nuovi prodotti e nuovi mercati) + RIDUZIONE DEI RISCHI (maggiore controllo e flessibilità).

In altre parole i sistemi informativi direzionali ed in particolare il Data Warehouseing hanno lo scopo di superare i limiti dei sistemi tradizionali (mancanza del supporto alle interrogazioni estemporanee e complesse, al lancio dei nuovi prodotti, al controllo qualità ed alle nuove opportunità) e dare un reale supporto a chi in azienda decide o contribuisce a decidere le strategie, le verifica nel tempo e le adegua ai cambiamenti sempre più repentini dell’ambiente esterno ed interno all’azienda. Un processo lungo ma in grado di creare valore per l’azienda.

Il DWè una collezione di dati a supporto del processo decisionale, dando al management l’opportunità concreta di trovare le risposte a tutte quelle domande che hanno un alto impatto sulle performance aziendali. Chi ricopre ruoli decisionali deve avere la possibilità di usufruire di tutti gli strumenti che possono rendere la guida dell’azienda massimamente sicura.

Se analizziamo in dettaglio le problematiche delle aziende noteremo che i problemi si focalizzano soprattutto in fruizione di dati che possono essere riassunte in:

- Assenza di sintesi nella reportistica

- Risultati diversi da fonti diverse per la stessa tematica

- Impossibilità di navigare nei dati ragionando con oggetti “business”

- Inaffidabilità di alcuni dati critici

- Costi elevati per sintetizzare report e analisi

- Scarsa “collaborazione” o impossibilità di comunicazione dei sistemi informativi transazionali per interrogare i dati

- Assenza di coerenza fra i dati.

- Lentezza nell’interrogazione di dati non ottimizzati per l’analisi

Queste problematiche sono veramente universali, ed è qui che nacse l’esigenza di un sistema di Data Warehouse, difatti il DW consente:

* l’accesso a dati aziendali garantendo bassi tempi di attesa fra l’interrogazione dei dati e l’output di risultati.

* Consistenza dei dati (le vendite del prodotto A nella città B nel periodo di tempo C) .

* I dati esposti possono essere combinati e separati

* Inserimento di altri strumenti software necessari a facilitare l’interrogazione dei dati e a garantire una presentazione della sintesi.

* Dati sempre coerenti e “ripuliti”: parte fondamentale del processo di realizzazione di un sistema di Data Warehouse è rappresentata proprio da attività di recupero, trasformazione e pulitura dei dati.

Un Data Mart (DM), è l’ insieme di dati organizzati per supportare specifiche esigenze di un gruppo di utenti (es. dipartimento) che viene alimentato da processi di estrazione e trasformazione utilizzando i dati del DWH. Nel data warehouse i dati sono raffigurati in dettaglio e storicizzati, raggiungendo dimensioni poco compatibili con l’interrogazione diretta attraverso tool di analisi: vengono così generati dal data warehouse aggregati tematici di dati (datamart), sui quali verranno scatenate le query per le analisi.

I Datamart possono essere costruiti in rapporto ai dati relazionali e multidimensionali, con i relativi sistemi di alimentazione dagli archivi dei software operativi e di ERP, applicazioni di interrogazione ed analisi di dati ed applicazioni di reportistica, continuamente alimentate, da fonti di dati eterogenee e profilate in base agli utenti.

Dal modello informativo comune possono essere sviluppati, in maniera coerente, modelli dati dei datamart ; questi possono essere sia dipendenti che indipendenti.

L’implementazione prevede di mettere a fattor comune tra diversi progetti di datamart i processi di acquisizione di dati dai sistemi transazionali.

Sempre fondamentale segnalare che è comunque opportuno l’eliminazione dei datamart indipendenti, non appena sviluppati quelli derivanti direttamente dall’ambiente integrato del data warehouse.

NB: E' importante verificare tempi e costi dello sviluppo temporaneo di datamart indipendenti.

La figura seguente rappresenta uno schema di un data mart con i fatti di vendita di una ipotetica azienda. Si tratta di uno schema a stella con una tabella dei fatti “vendite giornaliere”, le sue misure “quantità” e “ammontare” e le varie dimensioni.


L’aggiornamento del data mart viene eseguito normalmente quando il data warehouse e fuori linea (di notte), e comporta sempre una forte diminuzione delle prestazioni del sistema. Inoltre, contemporaneamente all’aggiornamento delle viste, il sistema viene sottoposto ad altre operazioni periodiche (backup, sincronizzazione). Di conseguenza il tempo necessario dedicato a questo tipo di compito è limitato.

Invece per le fasi di caricamento dei dati nel data mart conviene associare a ogni record il tipo di operazione che ne ha determinato la variazione: in questo modo il processo di caricamento potrà stabilire a priori come trattare ciascun record.

DBMS(Data Base Management System), si tratta di un sistema, con programmi coordinati, centralizzato o distribuito (rete), che permette di memorizzare, cambiare ed estrarre informazioni da un database.

Suggerisce molti vantaggi, come una garanzia per i dei dati (unica raccolta di dati anziché copie distinte scoordinate che potrebbero causare duplicazioni inconsistenti); dispone le informazioni del database secondo una struttura gerarchica, di un database di rete o di un database relazionale; permette l’accesso alle informazioni solo al personale autorizzato, tramite password e account. Infine fissa schemi organizzativi e di controllo, rendendo le informazioni accessibili agli utenti, solitamente tramite query.

Altro compito del DBMS e’ quello di offrire il controllo delle modifiche dei dati, difatti, apportando una modifica su un campo del database, il sistema dovrebbe riportate un aggiornamento su tutti i campi. Se venisse a mancare tale controllo, non si saprebbe più quali dei diversi valori sia quello corretto.

Ricordiamo che i dati cambiano rapidamente, provocando delle variazioni non solo sui record, ma anche negli attributi dei database. Per evitare ciò si possono usare metodi incrementali per l’aggiornamento dei modelli e trattare le variazioni dei dati.

Un sistema per la scoperta di conoscenza è meno efficace quando non è integrato nel sistema globale dell’organizzazione. Tra i vari problemi tipici di integrazione ricordiamo: integrazione con i DBMS, integrazione con fogli di calcolo e con strumenti di visualizzazione e adattamento a sensori che leggono i dati in tempo reale.

Nell’ambito dell’informatica aziendale si parla spesso dei DBMS come esempio di legacy systems . Un DBMS, componente fondamentale per l’azienda, può essere un’ eredità non sempre gradita, nel senso che potrebbe avere una struttura monolitica e obsoleta, quindi limitata rispetto alle funzionalità delle nuove applicazioni. In alcuni casi, per evitare i costi di riammodernamento del DBMS si cerca di realizzare nuovi prodotti software in grado di operare con il system legacy (si parla quindi di backward compatibility).

Il vertice del s.i. (sistema informativo) è rappresentato dalla sintesi di tutti i dati raccolti nelle procedure operative e dalla loro disponibilità sottoforma di indici, grafici, report all’alta direzione, per lo studio e la valutazione di tutti i fenomeni che hanno determinato i risultati d’impresa.

La fase di implementazione consiste nella personalizzazione del software, nell’installazione, nella formazione e nell’avviamento di tutte le procedure operative, seguendo un piano di lavoro stabilito assieme all’imprenditore ed articolato, normalmente, su un anno (il tempo necessario per valutare il sistema in un intero esercizio aziendale).

Il data warehouse è un sistema informativo, dove i dati sono organizzati e strutturati per un facile accesso da parte dell’utente e per supportare i processi decisionali, comunemente rappresentati nei cosiddetti DSS (Decisional Support System) e EIS (Executive Information System). Il primo viene utilizzato per comprendere particolari problemi, mentre il secondo è utilizzato per soddisfare una circolazione continua dei dati.

Nessun commento:

Posta un commento