venerdì 30 ottobre 2009

Che cosa sono i datawarehouse e cosa li differenzia dai sistemi OLTP


Innanzitutto partiamo dal definire cos’è un Data warehouse. Esso è un archivio informatico contenente i dati di un’organizzazione. I DW sono progettati per consentire di produrre facilmente relazioni ed analisi.

Vengono considerati componenti essenziali di un sistema Data warehouse anche gli strumenti per localizzare i dati, per estrarli, trasformarli e caricarli, come pure gli strumenti per gestire un dizionario dei dati.

L’integrazione dei dati costituisce la principale caratteristica distintiva del DW rispetto ad altri sistemi di supporto alle decisioni. La raccolta dei dati deve essere: integrata, orientata al soggetto, variabile nel tempo e non volatile.

Esso si differenzia in modo sostanziale dai normali sistemi gestionali che, al contrario, hanno il compito di automatizzare le operazioni di routine.

Inoltre i DW sono basi informative costruite per fornire informazioni aggregate e organizzate per aree tematiche. Le banche dati interattive sono applicazioni OLAP (On Line Analytical Processing) per l’analisi dei dati via Internet, basate su Data Warehouse costruiti a partire da archivi di diverse fonti e formati.
I prodotti consentono di interagire dinamicamente con le banche dati per ottenere report multidimensionali visualizzabili sia in forma tabellare che grafica (barre, torte, mappe territoriali) ed esportabili in Excel.
Le variabili disponibili e il dettaglio raggiungibile sono legati a differenti profili di utenza (utente anonimo, istituzionale con ambito nazionale/regionale/comunale).

A differenza delle analisi con tecnologia OLAP , la tecnologia OLTP non prevede la creazione di banche dati separate, infatti le analisi vengono effettuate direttamente sui dati di esercizio. Questa soluzione permette di avere i dati sempre aggiornati ed evita fasi intermedie di trasformazione dei dati, tuttavia per la sua stessa natura non è facilmente applicabile in situazioni dove la quantità di dati da analizzare sia molto elevata ed in questi casi viene generalmente preferito l’utilizzo di analisi di tipo OLAP.

giovedì 29 ottobre 2009

i CMS: cosa sono. Gli applicativi piu diffusi e potenti


Un Content management system (CMS), letteralmente "Sistema di gestione dei contenuti", è uno strumento software installato su un server web studiato per facilitare la gestione dei contenuti di siti web, svincolando l'utilizzatore da conoscenze tecniche di programmazione.

Esistono CMS specializzati, cioè appositamente progettati per un tipo preciso di contenuti (un'enciclopedia on-line, un blog, un forum, ecc.) e CMS generici, che tendono ad essere più flessibili per consentire la pubblicazione di diversi tipi di contenuti.

Tecnicamente un CMS è un'applicazione lato server, divisa in due parti: la sezione di amministrazione (back end), che serve ad organizzare e supervisionare la produzione dei contenuti, e la sezione applicativa (front end), che l'utente web usa per fruire dei contenuti e delle applicazioni del sito.

I CMS possono essere programmati in vari linguaggi tra cui più comunemente in PHP e ASP; il tipo di linguaggio adoperato è indifferente a livello di funzionalità. I CMS in PHP sono multipiattaforma, mentre i CMS in ASP possono essere utilizzati solo su piattaforme Windows.
Un CMS permette di costruire e aggiornare un sito dinamico, anche molto grande, senza necessità di scrivere una riga di HTML e senza conoscere linguaggi di programmazione lato server (come PHP) o progettare un apposito database. L'aspetto esteriore delle pagine può essere personalizzato scegliendo un foglio di stile CSS appositamente progettato per un determinato CMS.

I flat file CMS (altrimenti noti come text-based CMS) sono dei content management system che si basano su file di testo (il più delle volte files XML) e che perciò non necessitano di alcun database come MySQL, PostgreSQL, ecc. Questi CMS sono facilmente installabili e dunque sono particolarmente adatti per siti personali o per piccole comunità. Un CMS open source di questa tipologia è Flatnuke.

mercoledì 28 ottobre 2009

ANSI SQL


Per spiegare l'ANSI SQL introduciamo innanzitutto il concetto di Database "relazionali". Con questo indichiamo la divisione del contenuto di un database in tante tabelle che contengono dati logicamente correlati tra loro. Per metterle insieme, si usano delle relazioni tra l' una e l' altra tabella.
Uno dei requisiti fondamentali per poter utilizzare un database relazionale e' avere un "linguaggio" che ci permetta di interrogarlo in maniera opportuna, cosa che gli informatici chiamano RDBMS, cioè Relational DataBase Management System. Come spesso succede nel mondo dell' informatica anche in questo caso e' nato uno "standard" che avrebbe permesso a tutti di parlare la stessa lingua, ed appena e' nato sono nati così tanti dialetti che non parlano l' uno con l'altro da potercisi affogare. Questo standard si chiama ANSI SQL (Structured Query Language della American National Standard Institute), e ovviamente sebbene TUTTI dicano che il loro linguaggio e' ANSI Compliant (compatibile con l' ansi SQL) in realtà tutti hanno differenze sostanziali l' uno con l'altra. i più diffusi linguaggi SQL oggi sono (ovviamente) quelle dei più diffusi database, cioè: Oracle SQL,MySQL,DBII SQL.

martedì 20 ottobre 2009

Creazione di un Data Source con DataTime, Creazione di join arbitrarie mediante lo strumento visuale di DataTime, Report da tabelle multiple


Un Data Source è un file che contiene al suo interno regole di estrazione dei dati da un data base, dunque in codice Sql. Il software di reportistica Data Time consente di creare report, sia lavorando in modalità quick (su una sola tabella) sia in modalità non quick (cioè generando un Data Source che consenta all'utente di operare su diverse tabelle, tramite relazioni di join). Le operazioni da seguire sono le seguenti:

1) Scaricare il programma da www.Datatime.eu/DataTime universal.htm e scaricare northwind (file prova di Microsoft)
2) Aprire new project (nome progetto-salva-apri), creare nuova connessione, selezionare access, crea e salva
3) Selezionare nwind e apri, connection e salva
4) db explorer/quick report
5) re load structure (mostra tutte le tabelle a disposizione)
6)selezionare query on each selection; cliccando su querry current, il programma mostra tutte le tabelle nel dettaglio; cliccando su una tabella in particolare, il programma mostra solo il dettaglio di quella selezionata.
7) cliccando su quick report si apre la schermata del slice e dice e si possono trascinare i nomi delle dimensioni e misure che ci interessano (ship region per le dimensioni e freight per le misure) e si clicca su generale.
8) Si apre una schermata con la tabella di interesse ed è possibile inserire grafici trascinando gli elementi già presenti nella parte sinista del foglio di lavoro.

lunedì 19 ottobre 2009

Nozione di Accessibilità

Lo stato Italiano ha emesso delle normative specifiche in materia di accessibilità dei siti Internet.
Queste norme riguardano nello specifico tutti gli enti governativi e statali che per legge devono adeguarsi nel rendere i propri siti accessibili.
I testi della legge sono disponibili per la consultazione e definiscono e chiariscono le specifiche da rispettare nello sviluppo di un web design accessibile.
Lo scopo della legge, in applicazione del principio costituzionale di eguaglianza, è quello di abbattere le "barriere virtuali" che limitano l'accesso dei disabili alla Società della Informazione e li escludono dal mondo del lavoro, dalla partecipazione democratica, da una migliore qualità della vita.
Si tratta quindi di garantire anche ai cittadini disabili il diritto di accesso alle risorse informatiche e ai servizi telematici, assicurando anche a loro una migliore opportunità di conoscenza, istruzione, lavoro, informazione ed intrattenimento.
siti esistono davvero, sono tantissimi e funzionano bene. Hanno un numero di visite e, soprattutto di clienti, elevatissimo. Ma potrebbero fare di più, il tuo sito potrebbe fare molto di più.
Rendersi accessibile.
Gli utenti ipovedenti o non-vedenti sono una comunità consistente di utenti Internet. Ed esistono strumenti appositi (Computer, telescriventi, terminali o dispositivi portatili con limitate capacità di visualizzazione, televisori, proiettori, dispositivi palmari, stampanti, libri, dispositivi con risposta tattile di tipo braille, sintetizzatori vocali, elettrodomestici interattivi, telefonini, consolle di gioco palmari o da tavolo)che permettono forme "differenti" di navigazione e fruizione dei contenuti di un sito. Magari faranno a meno di spettacolari animazioni in Flash (spesso tutti ne faremmo volentieri a meno...) ma lo scopo del sito, se accessibile, rimane. E con esso tutti i contenuti, le offerte, le idee e i vantaggi che il sito porta.
Le persone con disabilità motorie non usano, o usano in modo differente i normali dispositivi di puntamento (mouse, tastiera, trackpad) ma anche in questo caso esistono delle attrezzature che permettono di navigare il sito, se accessibile, e di disporre delle stesse condizioni di favore previste per un utente (cliente) "normale". Mentre un'attenta scelta delle immagini, ad esempio, ma non solo, può aumentare l'accessibilità di un sito per chi ha difficoltà cognitive.

sabato 17 ottobre 2009

Il formato ideale per il documento software di relazione aziendale (soggetto a revisioni nel tempo): Presentazioni, relazioni, progetti

La redazione di report aziendali non è un momento facile per i manager delle aziende, perchè il documento non è altro che l’immagine dello stato organizzativo interno dell’azienda. Il panorama aziendale è cambiato molto sotto il profilo organizzativo, perchè ormai si è più orientati verso una net economy e quindi verso una gestione del capitale intellettuale degli individui. Di fatti si da molto più spazio al singolo impiegato rendendolo partecipe alla vita aziendale non escludendolo da eventuali cambiamenti.

Si sono venuti a delineare nuovi modelli d’organizzazione innovativi rivolti alla comunicazione interna per diffondere nella maniera giuste le notizie e i cambiamenti aziendali all’esterno.

Le tipologie e format di documenti aziendali più utilizzati nella comunicazione e nel marketing delle organizzazioni, rep61sebbene diverse, presentano caratteristiche comuni come le identity guidelines guide al formato di identità aziendale. Si tratta non della missione aziendale ma delle linee guide da seguire per garantire coerenza di formato e per usare correttamente “l’identità aziendale” (anche detta CI = corporate identity),cioè quanto trasmesso visivamente o graficamente tramite ogni pezzo di carta pubblicato, dal biglietto da visita alla lettera, dalla pagina pubblicitaria alla nesletter tecnica o commerciale: corretto uso dei font aziendali (quando usare quelli con le grazie e senza grazie, il grassetto, corsivo, ecc., dimensioni, stili standard per titoli, titolini, corpo testo, ecc.), uso dei margini e degli spazi, colore Pantone corretto e in quali situazioni può essere usato in modo che ogni pezzo di carta pubblicato (e ormai anche ogni pagine pubblicata sul Web) sia identificabile a colpo d’occhio come proveniente da quella determinata azienda.

Per quanto riguarda la comunicazione interna serve per condividere il progetto organizzativo, missione evisione dell’organizzazione e diffondere conoscenza. Gli strumenti di comunicazione interna più diffusa sono gli House Organ, le Newsletter, i manuali, operativi, il Fact book/bilancio, le circolari e gli ordini di servizio, i Position paper, la reportistica e i progetti, le relazioni .

La cosa importante che una organizzazione non deve sottovalutare è che qualunque sia il report utilizzato per comunicare lo status aziendale, tale oggetto deve essere comprensibile alla maggio parte degli utenti a cui è indirizzato.

venerdì 16 ottobre 2009

FUNZIONE DELL’ ETL E I PRINCIPALI TOOL SOFTWARE DI ETL

L’ETL è la sigla di “Extract Transform Load” e come si può capire fa riferimento ai processi di estrazione, trasformazione e caricamento dei dati in un sistema di sintesi (data warehouse, data mart).

Il primo processo consiste nell’estrazione di dati dalle sorgenti quali database transazionali (OLTP), comuni file di testo o da altri sistemi informatici(tipo sistemi di Erp o Crm).

Una volta estratti i dati si passa al processo di trasformazione di questi, lo scopo di questo processo è quello di consolidare i dati, in modo tale che siano aderenti alla logica di business del sistema di analisi per cui viene sviluppato.

In poche parole questo secondo processo consiste in una serie di passaggi. Si inizia selezionando solo i dati che interessano al sistema, poi si passa alla normalizzazione dei dati, nel tradurre dati codificati, derivare nuovi dati calcolati, eseguire degli accoppiamenti tra dati recuperati da differenti tabelle e infine raggruppare i dati.

Occorre prestare particolare attenzione alla granularità delle informazioni da memorizzare nella stuttura a valle. Queste infatti, non solo devono essere aggregate in modo da non avere un dettaglio eccessivo, cosa che potrebbe portare ad un decadimento delle prestazioni delle interrogazioni effettuate sul sistema, ma devono anche mantenere una granularità etlche consenta di effettuare le necessarie analisi sui dati.

Il processo di estrazione, trasformazione e caricamento è importante perchè permette alle aziende di ottenere informazioni strategiche che ne permettono il suo sviluppo, infatti offre un supporto tecnico e analitico che permette la giusta flessibilità per andare oltre le mere trasformazioni “pre-pacchettizzate” e costruire delle routine di trasformazione ad hoc secondo le specifiche esigenze aziendali.

I principali benefici che si ottengono dal processo di ETL sono:

* riduzione del tempo per condurre attività di Business Intelligence grazie alla rapida generazione di Data Warehouse, Data Mart e flussi di dati
* controlli sui costi per l’integrazione dei dati, sviluppo dei processi ETL (Extract, Transform and Load) e manutenzione grazie a software solidi e affidabili che favoriscono la collaborazione e la gestione dei metadati comuni dall’inizio alla fine del flusso dei dati
* creazione di processi ETL riutilizzabili, facilmente modificabili e contenenti già al proprio interno robuste funzionalità per la qualità e correttezza dei dati
* incremento del ritorno sugli investimenti IT già effettuati grazie alla scalabilità multipiattaforma e alla interoperabilità standard fra applicazioni ed ambienti operativi.

Il mercato propone oggi alle aziende diversi tool software di ETL, tra i principali devono essere menzionati quelli sviluppati da Microsoft (SQL Server 2005) ed Oracle. Per quel che riguarda Microsoft SQL Server 2005 fornisce una piattaforma di estrazione, trasformazione e caricamento denominata SQL Server Integration Services (SSIS) che si propone di offrire alle organizzazioni la possibilità di ottenere un vantaggio competitivo attraverso applicazioni di ETL che consentono di sfruttare le potenzialità offerte dalla suite di prodotti Microsoft. NET. Invece Oracle ha da poco sviluppato una piattaforma ,Oracle Data Integration Suite, con lo scopo di garantire alle aziende l’integrazione dei dati attraverso strumenti volti ad ottimizzare il data management, tra i quali ad es. ELT e DQ (Data Quality).

mercoledì 14 ottobre 2009

Principali prodotti software per l'archiviazione delle informazioni (DBMS): Sql Server, Oracle, Access, Sybase, MySQl

Per DBMS si intende un sistema di gestione dei dati (Data Base Management System) che garantisce un livello di sicurezza ai dati, permettendo una condivisione sicura ed affidabile.
Il DBMS si frappone fra l’utente e i dati del Data Base, grazie a questo strato di software l’utente non ha accesso diretto ai dati memorizzati fisicamente, ma solo a una loro rappresentazione logica, permettendo un livello alto di indipendenza tra i dati e le applicazioni. Le attuali applicazioni dei Data Base permettono l’accesso ai dati a più utenti contemporaneamente, questo grazie al fatto che sono stati sviluppati DBMS che, utilizzando una sola copia dei dati, permettono la creazione di più rappresentazioni logiche di questi, riducendone la ridondanza e l’inconsistenza.
SQL SERVER è una Query Language. E' strutturato sull'architettura client/server dei database che si basano sul modello entità-relazione. tale modello è utilizzato per analizzare le caratteristiche di una situazione prescindendo dagli eventi che si verificheranno per costtituire cosi un modello concettuale di dati sentito come indipendente dalle applicazioni.
ORACLE è uno tra i più famosi database management system (DBMS). Anche questo fa parte dei cosiddetti RDBMS (Relational DataBase Management System) ovvero di sistemi di database basati sul Modello relazionale che si è affermato come lo standard dei database dell'ultimo decennio.
Oracle memorizza i dati sia logicamente, sotto forma di tablespace, sia fisicamente, sotto forma di file (datafile). Un tablespace, formato da uno o più datafile, contiene vari tipi di segment; ogni segment a sua volta si suddivide in uno o più extent. Ogni extent comprende gruppi contigui di blocchi di dati (data block), quest'ultimi sono la più piccola informazione memorizzabile da Oracle.
A livello fisico, i file comprendono almeno due o più extent. Oracle tiene traccia dei dati memorizzati tramite l'aiuto di informazioni presenti nelle tabelle di sistema. Esse contengono il dizionario dei dati e se presenti indici e cluster. Un dizionario dei dati consiste di una collezione di tabelle che contengono informazioni riguardo tutti gli oggetti utente del database.
Oracle è un RDBMS che se configurato e gestito in maniera appropriata, garantisce una sicurezza dei dati molto elevata
ACCESS è un altro esempio di relational database management system. Questo è realizzato da Microsoft, incluso nel pacchetto Microsoft Office Professional ed unisce il motore relazionale Microsoft Jet Database Engine con una interfaccia grafica.
Può utilizzare dati immagazzinati in formato Access/Jet, SQL Server, Oracle o qualsiasi database in formato compatibile ODBC( Open Database Connectivity, standard per la connessione ai DBMS)
A differenza di altri ambienti di sviluppo, in Access un unico file comprende tutti gli strumenti per lo sviluppo delle applicazioni: tabelle, query, maschere, report.
Le tabelle sono i contenitori dove vengono memorizzati i dati; le query sono gli strumenti idonei all'interrogazione ed alla manipolazione dei dati che avvengono attraverso un mini-SQL; le maschere consentono di interagire con i dati delle tabelle o delle query attraverso un'interfaccia grafica; i report consentono di visualizzare dei risultati basati sui dati.

venerdì 2 ottobre 2009

Elementi teorici e strutturali del report: Dimensioni, Misure, Aggregazione, funzioni di aggregazione

Il report aziendale è uno strumento che consente di valutare, attraverso informazioni prelevate da archivi diversi, lo stato di salute di una qualsiasi società di persone o di capitali. Esso aggrega in un unico documento tutte le informazioni indispensabili per esaminare in modo dettagliato la situazione economica, finanziaria e societaria di qualsiasi impresa italiana, per valutare rapidamente la solidità patrimoniale di fornitori, clienti e concorrenti e per mantenere sotto controllo i rischi di credito e commerciali.
Grazie all'accesso alle fonti pubbliche di tutto il territorio nazionale (Camere di Commercio, Tribunali e Uffici di Pubblicità Immobiliare), il Report Impresa integra:
• i dati identificativi del soggetto richiesto.
• per le società di capitali, i dati sintetici di bilancio su fatturato, valore della produzione e numero di dipendenti
• i codici RAE (Ramo di Attività Economica) e SAE (Settore di Attività Economica)
• l'elenco dei soci e degli esponenti d'impresa e le loro cariche in altre società
• i protesti su sede ed esponenti d'impresa
• le informazioni pregiudizievoli su sede ed esponenti d'impresa
• l'elenco delle società controllate e collegate
• le informazioni sulla sede e sulle unità secondarie
• le procedure concorsuali in atto
• gli abstract delle notizie pubblicate da oltre 130 quotidiani nazionali, regionali e locali sull'impresa
• il rating, che consente di avere immediatamente un quadro generale dell'affidabilità di un'impresa.
• a richiesta, i Bilanci Riclassificati, per conoscere il reale stato economico delle società di capitali e per contestualizzarne le performance all'interno del settore d'appartenenza.



.Ogni report è costituito da due elementi fondamentali:Dimensioni e Misura. Dimensioni: i caratteri che si misurano sulle unità statistiche; costituiscono la parte del report che non cambia, come ad esempio l’anagrafica dei clienti. Solitamente non si considerano più di due dimensioni in quanto il report deve essere di facile lettura, per permettere all’interessato di ottenere tutte le informazioni necessarie nel modo più semplice e rapido possibile. Per questioni di praticità però si può considerare più di un carattere su ciascuna dimensione (ad es. città e paese insieme), per cui le singole modalità diventano coppie; si parla quind di “carattere derivato”.
Misura: qualsiasi eleborazione (funzione generale) calcolata su unità statistiche che soddisfino la condizione di possedere una certa combinazione di modalità; si tratta dela parte quantitativa del report che scaturisce dall’operazione di aggregazione della matrice dei dati, come ad esempio la somma dei soldi spesa da ciascun cliente.
Per procedere alla costruzione di un report bisogna risalire alle relazioni esistenti tra le diverse tabelle, al fine di riunificare l’informazione frammentata; si ricorre pertanto a strumenti di reportistica ad hoc. L’operazione alla base della creazione di un report è esattamente opposta rispetto a quelle effettuata per la distribuzione dei dati all’interno dei database. Mentre in questo caso si lavora a partire dal principio di economicità per cui si applica il processo di normalizzazione dei dati (volto ad evitare la duplicazione e l’inconsistenza dei dati, garantendo al contempo l’integrità referenziale degli stessi), nel primo caso vige la logica della replicazione dei dati allo scopo di ricongiungere le informazioni.
Perchè il report è diverso da una semplice struttura tabulare?

In primo luogo è opportuno evidenziare che il report è una struttura complessa che non si limita, come un tabulato, a riportare i dati di una tabella, ma opera una “join” (unione) di più tabelle.
La seconda fondamentale differenza sta nel fatto che mentre in una stampa tabulare i record si riportano singolarmente, nel report si effettua sempre un’operazione di aggregazione (che può essere una somma o una differenza, così come una media, una moda, ecc.). Dunque il report è una struttura che deriva dall’aggregazione della matrice dei dati, che a sua volta corrisponde alla join arbitraria di un numero arbitrario di tabelle, utilizzato come base di partenza per la reportistica.
Dato che il report è un documento visionato da tutti gli stakeholders interni ed esterni dell’azienda, la componente “aspetto”, vale a dire il layout della presentazione, ha importanza fondamentale.