IlMioBlog: 2009

domenica 13 dicembre 2009

Il Software per la creazione di pagine web personali

Chi non ha mai avuto la tentazione di farsi un proprio sito o più semplicemente una Pagina web personale? Cosa serve?
Prima di tutto un Editor Html per trasformare nel modo più semplice possibile le nostre idee in codice comprensibile ai browser. Un editor altro non è che uno strumento che ci consente di scrivere in modo semplice e veloce righe di codice html; quel codice che i vari browser di navigazione, qualunque essi siano, riconoscono ed interpretano. Si potrebbe paragonarlo ad un programma per videoscrittura, anzi sono molte le similitudini, con la sola differenza che il testo scritto da questi editors è formattato nel modo giusto per dare vita a pagine di ipertesto, da qui il nome sigla HTML: Hyper Text Markup Language. Poiché HTML è un linguaggio costituito da un insieme di istruzioni (dette marcatori o tag, necessarie per descrivere la struttura del documento è importante conoscere la sintassi, con cui i marcatori vengono introdotti all’ interno del documento. E’ però vero che è possibile realizzare siti senza avere ampie conoscenze informatiche o conoscere linguaggi HTML. Esistono, infatti, specifici software pre-impostati e facili da usare. L’idea è quella di permettere a chiunque di scrivere pagine HTML con un editor molto simile ad un word processor e di potere fruire di alcuni servizi server.
Alcuni dei software che permettono di creare pagine web sono: Frontpage, Dreamweare,Nvu e Google Sites.

- Frontpage: è un programma sviluppato dalla Microsoft, incluso nel pacchetto Office. Una delle funzionalità più importanti di questo programma è la presenza di un sistema di navigazione automatico che crea pulsanti animati per le pagine aggiunte dal cliente.

- Dreamweare: è un programma prodotto da Macromedia che permette di creare pagine web con scritte abbastanza semplici. Questo programma riesce a seguire l’ utente dandogli anche qualche suggerimento.

- Nvu: è un editor gratuito basato sulla piattaforma Mozilla e più precisamente sul "motore"chiamato Gecko. Questo software si rivolge ad utenti che svolgono progettazione per hobby o a livello semiprofessionale.

- Google Sites: farà parte del pacchetto Google docs, che attualmente comprende un editor di testo, un foglio di calcolo e la possibilità di creare presentazioni come su Power Point. Google Sites è completamente integrato con tutti i prodotti di Google, sarà quindi possibile aggiungere alla pagina web, contenuti multimediali, come filmati di YouTube.

venerdì 11 dicembre 2009

Ruolo del software quale complemento necessario delle facoltà intellettuali dell'essere umano

Le nuove tecnologie sono entrate prepotentemente nella vita dell’uomo, dando origine ad una crisi di adattamento e di adeguamento della società. Ma cosa è accaduto all’uomo e quindi al cervello umano? Cosa è cambiato in questo processo di adattamento al computer e alla telecomunicazione? E’interessante ricercare per vedere cosa accade investigando le implicazioni determinate dall’uso delle tecnologie sullo sviluppo della psiche e sulla definizione di nuovi modelli mentali. E’ noto già da tempo che la mente pur avendo notevoli capacità cognitive, abbia dei limiti riguardo l’immagazzinamento dei dati ed in questo caso si può pensare ai software come alleati della nostra mente capaci di rendere più facili compiti soprattutto computazionali. Fino ad ora abbiamo avuto delle macchine o dei media che hanno fatto andare le nostre menti individualmente più rapidamente o più lentamente. Ieri i libri facevano andare la mente in modo più rapido, oggi i libri fanno andare la mente piano, perché la radio, la televisione, ed i computer sono più veloci. Ma la cosa nuova è che i computer stanno facendo andare molte menti associate in modo più veloce, in opposizione alla mente singola. Già da tempo si pensava che i computer collegati ad internet formassero un’intelligenza e memorie collettive. Oggi, con i progressi tecnici, metodologici e fisici che hanno investito le nuove tecnologie dell’informazione e della comunicazione il dibattito sulla correlazione tra mente umana ed intelligenza artificiale è ancora in gran parte acceso.
I computer più il telefono sono intelligenza collettiva. L'intelligenza collettiva cambia la natura dei nostri processi mentali, e ci permette di dipendere maggiormente dalla nostra rete per prendere una decisione, per creare assieme ad altri, per scoprire ogni genere di cose. I cambiamenti sono dovuti al fatto che non solo una singola mente, ma molte menti divengono parte del network.
La rete è il computer più la televisione più la radio più il telefono. Una volta congiunti i computer e i telefoni, avete linguaggio esterno, collettivo, e linguaggio interno e privato con la macchina. Per la prima volta nella storia, c'è una situazione in cui abbiamo un controllo privato del linguaggio che non viene eliminato dal collettivo, e che non elimina il collettivo. I computer in sé sono privati proprio come i libri; il computer più il telefono rimettono insieme il privato e il pubblico. Così, questa è la storia della nostra relazione con il linguaggio attraverso i media. Il computer è potenzialmente in grado di stimolare in maniera notevole le risorse intellettuali di chi lo utilizza in quanto permette a ognuno di seguire schemi e percorsi personali non programmati da un’altra persona. Solo il suo uso consente, infatti, l’impiego di quei prodotti ottenuti fondendo più linguaggi (testuale, grafico- iconico, sonoro, video, di animazione), detti comunemente prodotti multimediali. La combinazione di più linguaggi favorisce lo sviluppo della mente umana in tutte le sue potenzialità, anche perché la principale caratteristica di un prodotto multimediale è la sua organizzazione non lineare, ma "a rete", proprio come la rete dei neuroni del cervello umano, il che lo rende vicino al modo di pensare dell’uomo che è naturalmente strutturato in un’intricata rete di idee, associazioni, connessioni.

giovedì 10 dicembre 2009

I principali tool software di Query reporting: B.O., Microstrategy, Cognos, DataTime

Gli strumenti di query reporting sono rappresentati da software finalizzati ad elaborazioni anche personalizzabili, che generalmente si presentano sotto forma tabellare.
Le principali aziende specializzate nella produzione di questi strumenti sono:

BUSINESS OBJECTS

E' il principale fornitore mondiale di soluzioni software per la business intelligence (BI), offre un'ampia gamma di strumenti e applicazioni per aiutare i team a ottimizzare le prestazioni aziendali collegando individui, informazioni e aziende nella rete aziendale, indipendentemente dagli archivi di dati o dalle applicazioni aziendali sottostanti.

MICROSTRATEGY

Ha supportato le aziende nel processo di trasformazione dei dati operazionali in informazioni. La piattaforma di Business Intelligence utilizzata, MicroStrategy 8™, fornisce la risposta a tutte le esigenze legate a query, reporting e analisi avanzate condividendole attraverso il web, i dispositivi wireless e quelli vocali.

COGNOS

Offre un supporto completo per le attività di Business Intelligence in un unico prodotto, su una architettura collaudata orientata ai Web service; è facile da integrare, implementare da utilizzare.

DATA TIME

E' la principale risposta italiana in termini di supporto alla reportistica aziendale (ROLAP). Lo strumento fornito da quest’azienda è il “Data Time Reporting Solution” il quale soddisfa l’esigenza di raccolta e gestione dei dati, con la possibilità di generare dei report completi ed efficaci e supportati da presentazioni grafiche.

mercoledì 9 dicembre 2009

Classificazione dei software web per la comunicazione delle informazioni (Social Networking, Newsgroup, Forum, Blog)

IL BLOG

Il blog è una realtà esplosa di recente,ma affonda le sue radici nella storia del Web fino alla metà degli anni ’90. La rapida crescita si trasforma in esplosione demografica dopo il 2002 quando diventa competitivo per il tempo e i costi necessari a organizzare una presenza on-line.
Il blog è uno strumento elementare per pubblicare contenuti in rete, ma il suo successo nonché elemento di novità che ha portato nel panorama mediatico si deve soprattutto al fatto che chi lo usa ha saputo fin ora esaltare la natura ipertestuale e profondamente relazionale di internet. Il blog associa una persona a un nodo della rete: attraverso i link(collegamenti ipertestuali), da ogni punto di presenza l’attenzione viene rilanciata ad altri punti di presenza e altri siti.
E’ a tutti gli effetti un sito web: dal punto di vista della Rete,dei linguaggi e dei protocolli, è costruito come un sito web e come se fosse un sito web tradizionale vi si accede. La sua particolarità sta nell’essere gestito da un software per la gestione dei contenuti (Contest Management System) che automatizza e rende elementare l’inserimento, la pubblicazione e l’archiviazione di testi, immagine ed elementi multimediali. Caratteristica di ogni sistema automatico per la gestione dei contenuti e la netta divisione tra i contenuti e la loro presentazione. Il testo, le immagini e gli altri contenuti multimediali sono raccolti in un magazzino ( un database) e da questo sono richiamati e di volta in volta posizionati sulla pagina finale in base a ciò che il visitatore chiede di consultare. Unità minima del blog e suo fulcro è il “post” la porzione di contenuto corrispondente a ciascun intervento. I post sono pubblicati in ordine cronologico inverso: il più recente compare in cima alla pagina, il più datato in fondo. Tutti gli interventi pubblicati restano accessibili nell’archivio del blog, composto da raccolte mensili o settimanali.

I SOCIAL NETWORK

La versione di Internet delle reti sociali è una delle forme più evolute di comunicazione in rete.
Le social network online ebbero un'esplosione nel 2003, grazie alla popolarità di siti web come Friendster, Tribe.net e LinkedIn. Il motore di ricerca Google, ha lanciato Orkut il 22 gennaio 2004. Kibop, una social network in spagnolo e portoghese, ha debuttato anch'essa nel 2004. In Italia il primo dei grandi portali passati verso questo tipo di social network è stato superEva, ma sono comunque vivissime le comunità di italiani su Orkut e LinkedIn.Attualmente, i due social network services più rilevanti per accessi sono attualmente Facebook e Myspace, rispettivamente con 132 e 117 milioni di utenti, con il sorpasso del primo sul secondo nell'aprile del 2008.
Le applicazioni basate su reti sociali (più note con il corrispettivo inglese social network) sono ambienti di Internet che forniscono un contesto operativo per l’interazione tra reti di contatti che hanno in ciascun partecipante il proprio fulcro.
Chi si iscrive a un servizio di questo tipo da vita innanzitutto a un punto di presenza personale secondo le regole e le caratteristiche di quella specifica comunità. Il legame con un nodo della rete,oltre che dare vita a uno scambio privilegiato e reciproco tra i due soggetti,mette in comunicazione le rispettive reti di contatti,espandendole per gradi di sfera sociale. Dentro un’applicazione del genere dunque, il capitale sociale di ogni singolo nodo della rete sociale diventa il metodo privilegiato di ricerca per idee,contenuti e persone. Dentro un social network tuti i nodi sono uguali, non esiste alcun centro ordinatore e ciascun partecipante vede l’universo a partire dalla propria finestra dlla quale inizia l’esplorazione. Una rete sociale riproduce al suo interno una porzione virtuosa di quello che potrebbe essere internet, è la porta d’accesso per raggiungere gli iscritti della comunità con cui è possibile entrare in contatto in maniera esponenziale in funzione del numero di persone inserite tra i propri contatti,del numero di persone inserite da ciascun amico nella rispettiva lista di contatti e via dicendo.

IL NEWSGROUP

Un newsgroup è uno degli spazi virtuali creato su una rete di server interconnessi (storicamente una sottorete di internet USENIX network o più semplicemente Usenet) per discutere di un argomento (topic) ben determinato. In italiano a volte viene utilizzato il termine gruppo di discussione.
I news server comunicano fra loro (attraverso il protocollo NNTP) in modo che i messaggi inviati ad un server si trovino duplicati su tutti gli altri server. Per diversi motivi (economie di spazio, interesse degli utenti, censura), non tutti i server contengono gli stessi NG. Ogni gestore di news server (spesso gli stessi provider ISP) può decidere infatti quali NG tenere.
L'accesso a queste aree tematiche avviene per mezzo di programmi chiamati news clients o newsreader (oggi a volte integrati nei programmi di posta elettronica come ad esempio Mozilla Thunderbird, SeaMonkey, Outlook Express, Sylpheed), a una sorta di “stanza delle bacheche” (news server) che raccoglie i vari NewsGroup (o in breve NG)

IL FORUM

Struttura informatica contenente discussioni e messaggi scritti dagli utenti, a una sua sottosezione oppure al software utilizzato per fornire questa struttura. Un senso di comunità virtuale si sviluppa spesso intorno ai forum che hanno utenti abituali. La tecnologia, i videogiochi, la politica, l'attualità e lo sport sono temi popolari, ma ci sono forum per un enorme numero di argomenti differenti. I forum vengono utilizzati anche come strumenti di supporto on-line per vari prodotti e all'interno di aziende per mettere in comunicazione i dipendenti e permettere loro di reperire informazioni.
Ci si riferisce comunemente ai forum anche come board, message board, bulletin board, gruppi di discussione, bacheche e simili.
Molti forum richiedono la registrazione dell'utente prima di poter inviare messaggi ed in alcuni casi anche per poterli leggere. Differentemente dalla chat, che è uno strumento di comunicazione sincrono, il forum è asincrono in quanto i messaggi vengono scritti e letti anche in momenti diversi.
Pacchetti per la gestione di forum sono ampiamente disponibili su Internet, alcuni gratuitamente ed altri a pagamento. Possono essere scritti in una grande varietà di linguaggi di programmazione, come PHP, ASP, Perl e Java ed i loro contenuti vengono solitamente memorizzati in file di testo o in DBMS.
I più utilizzati tra i software gratuiti sono phpBB, Simple Machines Forum e Snitz Forums 2000, mentre tra quelli a pagamento troviamo vBulletin e Invision Power Board (che fino all'ormai obsoleta versione 1.3 era disponibile gratuitamente).
Infine, per chi non disponesse delle competenze o dei mezzi necessari all'installazione di un software come questi su un server, esistono anche alcuni forum in outsourcing o la possibilità di utilizzare software p2p appositi come Osiris che consente la creazione di forum decentralizzati e distribuiti tra i vari nodi.

Riflessioni sulle relazioni tra dati, fatti, informazioni, conoscenza. Interrelazioni, differenze, forme di manipolazione

Tutta la nostra vita è caratterizzata dall’atto del conoscere e se guardiamo la conoscenza dal punto di vista evolutivo essa rappresenta un vantaggio per l’evoluzione umana. E’ difficile anche solo immaginare un sistema vivente senza l’atto del conoscere. Questa è la “conoscenza organica”,che serve agli organismi per adattarsi all’ambiente,ma gli esseri umani sono dotati anche di altri due tipi di conoscenza: la “conoscenza del senso comune” cioè sono coscienti del loro sapere e lo organizzano per poterlo utilizzare al meglio nella loro vita quotidiana e la “conoscenza formalizzata”il sapere sviluppato per accrescere il sapere e riguarda quegli uomini che non si limitano a sapere le cose e ad imparare le cose che sanno gli altri.

La conoscenza va gestita e per gestire e comunicare la conoscenza,naturalmente,bisogna conoscere.

La conoscenza è un attributo della capacità cognitiva ed è proprio questo che distingue conoscenza e informazione. L’informazione è inerte,passiva,senza qualcuno che possieda la conoscenza per interpretarla,ha un valore solo se innesca un circolo che permette l’accrescimento della conoscenza. Conoscenza(qualità) e Informazione(quantità) si trovano su piani diversi e si completano vicendevolmente. Quando ci riferiamo alla Conoscenza attribuiamo implicitamente ad essa un senso qualitativo, perché è proprietà del soggetto conoscente,fa parte della sua esperienza che può essere trasmessa con processi lunghi di educazione e istruzione ed ha un valore d’uso particolare,nel senso che trasmetterla non comporta una “perdita”. Quando ci riferiamo all’informazione tendiamo a mettere in evidenza qualche cosa esterna al soggetto che produce informazione. L'informazione é costituita da dati raccolti, organizzati ed interpretati. Se i dati sono lettere, organizzare le lettere in parole intelligibili, è informazione.

Gestione della conoscenza o Knowledge Managment si rappresenta con una piramide dove alla base vi è la “conoscenza tacita”e questa deve essere interpretata perché possa diventare un dato. “Sappiamo sempre più di quanto non possiamo dire”(Polany).La conoscenza tacita è contenuta nelle persone e non nei sistemi informativi e per questo è difficile da formalizzare e condividere con gli altri. Subito sopra la conoscenza tacita vi sono i dati. I dati sono fatti sugli eventi che raccolti che organizzati ed interpretati costituiscono l’informazione. L’informazione che ha rilevanza porta ad una raccolta dati che l’osservazione sistematica traduce in conoscenza esplicita o formalizzata .Tale conoscenza verrà poi legittimata,certificata da un meccanismo istituzionale e diverrà il Sapere, all’apice della piramide che rappresenta il processo che porta alla conoscenza.

• Dati: Il materiale grezzo dell’informazione

• Informazione: Dati organizzati e presentati da qualcuno

• Conoscenza: Informazione letta, ascoltata o vista, compresa e rielaborata

• Sapienza: Conoscenza e comprensione distillata e integrata

martedì 8 dicembre 2009

Architetture per i sistemi informativi aziendali: DW, DATA MART E DBMS TRANSAZIONALI

Quando parliamo di sistemi informativi aziendali ci riferiamo alla capacità di estrarre, integrare ed elaborare informazioni pervenuti da sorgenti informative eterogenee in real-time, amalgamandole con le informazioni già storicizzate e memorizzate nei diversi data mart.
Data Warehouse è l’insieme di dati tematici, integrati, temporali, permanenti finalizzato al supporto dei processi decisionali. Viene “nutrito” da processi di propulsione e trasformazione utilizzando dati contenuti nei database operazionali ed eventualmente dati esterni.

Una struttura DW ha l’arduo compito di rappresentare l’attività aziendale in modo trasparente e documentata. Questo sistema informativo ha una complessità architetturale: è costituito da una serie di componenti accoppiate tra di loro(ossia stretti legami di interdipendenza poco mascherati da interfacce standardizzate). Alcune di queste componenti (sistemi sorgente), sono tipicamente al di fuori dal controllo di chi gestisce il sistema di DW, malgrado ciò sono parte integrante del sistema stesso. Una variazione significativa su un sistema sorgente spesso si ripercuote su tutte la sua architettura: dalle procedure di alimentazione fino alla reportistica e alle funzioni analitiche. Pur essendo presenti strumenti di separazione fra i diversi passi del processo di trasformazione del dato in informazione (staging area, edw, data marts, strati semantici, ecc.). Si realizzano mutamenti significativi nelle regole di business o nella modellazione concettuale dell’informazione.

Tra i vari vantaggi, ricordiamo la possibilità di fornire una visione consistente delle informazioni dell’impresa, con ambienti informativi ed eterogenei (hardware e sistemi operativi diversi, ecc.), e fornire risposte agli utenti di alto livello senza l’assistenza dei tecnici.

All’interno dell’azienda esistono molti “depositi di informazione” talvolta incompleti ma sempre possibile, in ogni caso, usufruire di alcune fonti informative da cui è possibile prelevare informazioni utili per il DWH. Mi riferisco ai sistemi legacy, i dati delle applicazioni desktop di office automation (database desktop, fogli elettronici, documenti, presentazioni, oggetti multimediali, ecc.) e potenzialmente a tutti i documenti che vengono prodotti all’interno dell’azienda o vengono ricevuti dall’esterno (fax, offerte, comunicati stampa, posta elettronica semistruttura e strutturata, ecc.).

Funzionamento: è possibile utilizzare dei tools di estrazione e/o pulizia dei dati per renderli omogenei ed introdurli nel database di destinazione. Nei primi progetti di DWH questa operazione di conversione e “pulizia” dei dati veniva eseguita una tantum; la conseguenza era quella di poter effettuare le analisi su dati non sempre aggiornati. Adesso molti prodotti software di estrazione consentono di effettuare estrazioni on-line per interrogazioni sempre aggiornate (real-time).

Progettare soluzioni di data warehouse è generalmente molto interessante, appunto per le sue varie fasi: individuazione dei requirements, modellazione della soluzione, individuazione delle politiche di ETL, implementazione della base dati, creazione della reportistica e dei contesti di analisi.

I vantaggi del DWH si possono riassumere facilmente utilizzando le seguenti relazioni:

VANTAGGI AUTOMAZIONE = RIDUZIONE COSTI

VANTAGGI INFORMAZIONI = RIDUZIONE COSTI + CRESCITA FATTURATO (nuovi prodotti e nuovi mercati) + RIDUZIONE DEI RISCHI (maggiore controllo e flessibilità).

In altre parole i sistemi informativi direzionali ed in particolare il Data Warehouseing hanno lo scopo di superare i limiti dei sistemi tradizionali (mancanza del supporto alle interrogazioni estemporanee e complesse, al lancio dei nuovi prodotti, al controllo qualità ed alle nuove opportunità) e dare un reale supporto a chi in azienda decide o contribuisce a decidere le strategie, le verifica nel tempo e le adegua ai cambiamenti sempre più repentini dell’ambiente esterno ed interno all’azienda. Un processo lungo ma in grado di creare valore per l’azienda.

Il DWè una collezione di dati a supporto del processo decisionale, dando al management l’opportunità concreta di trovare le risposte a tutte quelle domande che hanno un alto impatto sulle performance aziendali. Chi ricopre ruoli decisionali deve avere la possibilità di usufruire di tutti gli strumenti che possono rendere la guida dell’azienda massimamente sicura.

Se analizziamo in dettaglio le problematiche delle aziende noteremo che i problemi si focalizzano soprattutto in fruizione di dati che possono essere riassunte in:

- Assenza di sintesi nella reportistica

- Risultati diversi da fonti diverse per la stessa tematica

- Impossibilità di navigare nei dati ragionando con oggetti “business”

- Inaffidabilità di alcuni dati critici

- Costi elevati per sintetizzare report e analisi

- Scarsa “collaborazione” o impossibilità di comunicazione dei sistemi informativi transazionali per interrogare i dati

- Assenza di coerenza fra i dati.

- Lentezza nell’interrogazione di dati non ottimizzati per l’analisi

Queste problematiche sono veramente universali, ed è qui che nacse l’esigenza di un sistema di Data Warehouse, difatti il DW consente:

* l’accesso a dati aziendali garantendo bassi tempi di attesa fra l’interrogazione dei dati e l’output di risultati.

* Consistenza dei dati (le vendite del prodotto A nella città B nel periodo di tempo C) .

* I dati esposti possono essere combinati e separati

* Inserimento di altri strumenti software necessari a facilitare l’interrogazione dei dati e a garantire una presentazione della sintesi.

* Dati sempre coerenti e “ripuliti”: parte fondamentale del processo di realizzazione di un sistema di Data Warehouse è rappresentata proprio da attività di recupero, trasformazione e pulitura dei dati.

Un Data Mart (DM), è l’ insieme di dati organizzati per supportare specifiche esigenze di un gruppo di utenti (es. dipartimento) che viene alimentato da processi di estrazione e trasformazione utilizzando i dati del DWH. Nel data warehouse i dati sono raffigurati in dettaglio e storicizzati, raggiungendo dimensioni poco compatibili con l’interrogazione diretta attraverso tool di analisi: vengono così generati dal data warehouse aggregati tematici di dati (datamart), sui quali verranno scatenate le query per le analisi.

I Datamart possono essere costruiti in rapporto ai dati relazionali e multidimensionali, con i relativi sistemi di alimentazione dagli archivi dei software operativi e di ERP, applicazioni di interrogazione ed analisi di dati ed applicazioni di reportistica, continuamente alimentate, da fonti di dati eterogenee e profilate in base agli utenti.

Dal modello informativo comune possono essere sviluppati, in maniera coerente, modelli dati dei datamart ; questi possono essere sia dipendenti che indipendenti.

L’implementazione prevede di mettere a fattor comune tra diversi progetti di datamart i processi di acquisizione di dati dai sistemi transazionali.

Sempre fondamentale segnalare che è comunque opportuno l’eliminazione dei datamart indipendenti, non appena sviluppati quelli derivanti direttamente dall’ambiente integrato del data warehouse.

NB: E' importante verificare tempi e costi dello sviluppo temporaneo di datamart indipendenti.

La figura seguente rappresenta uno schema di un data mart con i fatti di vendita di una ipotetica azienda. Si tratta di uno schema a stella con una tabella dei fatti “vendite giornaliere”, le sue misure “quantità” e “ammontare” e le varie dimensioni.

L’aggiornamento del data mart viene eseguito normalmente quando il data warehouse e fuori linea (di notte), e comporta sempre una forte diminuzione delle prestazioni del sistema. Inoltre, contemporaneamente all’aggiornamento delle viste, il sistema viene sottoposto ad altre operazioni periodiche (backup, sincronizzazione). Di conseguenza il tempo necessario dedicato a questo tipo di compito è limitato.

Invece per le fasi di caricamento dei dati nel data mart conviene associare a ogni record il tipo di operazione che ne ha determinato la variazione: in questo modo il processo di caricamento potrà stabilire a priori come trattare ciascun record.

DBMS(Data Base Management System), si tratta di un sistema, con programmi coordinati, centralizzato o distribuito (rete), che permette di memorizzare, cambiare ed estrarre informazioni da un database.

Suggerisce molti vantaggi, come una garanzia per i dei dati (unica raccolta di dati anziché copie distinte scoordinate che potrebbero causare duplicazioni inconsistenti); dispone le informazioni del database secondo una struttura gerarchica, di un database di rete o di un database relazionale; permette l’accesso alle informazioni solo al personale autorizzato, tramite password e account. Infine fissa schemi organizzativi e di controllo, rendendo le informazioni accessibili agli utenti, solitamente tramite query.

Altro compito del DBMS e’ quello di offrire il controllo delle modifiche dei dati, difatti, apportando una modifica su un campo del database, il sistema dovrebbe riportate un aggiornamento su tutti i campi. Se venisse a mancare tale controllo, non si saprebbe più quali dei diversi valori sia quello corretto.

Ricordiamo che i dati cambiano rapidamente, provocando delle variazioni non solo sui record, ma anche negli attributi dei database. Per evitare ciò si possono usare metodi incrementali per l’aggiornamento dei modelli e trattare le variazioni dei dati.

Un sistema per la scoperta di conoscenza è meno efficace quando non è integrato nel sistema globale dell’organizzazione. Tra i vari problemi tipici di integrazione ricordiamo: integrazione con i DBMS, integrazione con fogli di calcolo e con strumenti di visualizzazione e adattamento a sensori che leggono i dati in tempo reale.

Nell’ambito dell’informatica aziendale si parla spesso dei DBMS come esempio di legacy systems . Un DBMS, componente fondamentale per l’azienda, può essere un’ eredità non sempre gradita, nel senso che potrebbe avere una struttura monolitica e obsoleta, quindi limitata rispetto alle funzionalità delle nuove applicazioni. In alcuni casi, per evitare i costi di riammodernamento del DBMS si cerca di realizzare nuovi prodotti software in grado di operare con il system legacy (si parla quindi di backward compatibility).

Il vertice del s.i. (sistema informativo) è rappresentato dalla sintesi di tutti i dati raccolti nelle procedure operative e dalla loro disponibilità sottoforma di indici, grafici, report all’alta direzione, per lo studio e la valutazione di tutti i fenomeni che hanno determinato i risultati d’impresa.

La fase di implementazione consiste nella personalizzazione del software, nell’installazione, nella formazione e nell’avviamento di tutte le procedure operative, seguendo un piano di lavoro stabilito assieme all’imprenditore ed articolato, normalmente, su un anno (il tempo necessario per valutare il sistema in un intero esercizio aziendale).

Il data warehouse è un sistema informativo, dove i dati sono organizzati e strutturati per un facile accesso da parte dell’utente e per supportare i processi decisionali, comunemente rappresentati nei cosiddetti DSS (Decisional Support System) e EIS (Executive Information System). Il primo viene utilizzato per comprendere particolari problemi, mentre il secondo è utilizzato per soddisfare una circolazione continua dei dati.

venerdì 4 dicembre 2009

Approfondimenti su SQL: clausole where, having e group by

La clausola Group By viene applicata alle selezioni per suddividere i risultati in gruppi distinti per valore nei campi specificati e raggruppare i risultati di una SELECT in base al campo specificato dopo il BY. L'operatore va usato in congiunzione con una funzione statistica secondo la seguente sintassi:

SELECT

FROM

[WHERE ]

GROUP BY

dove deve essere lo stesso nella SELECT e nel GROUP BY

L'obiettivo della clausola Where è quello di limitare la query solo a certe righe.

La clausola HAVING rappresenta un vincolo sui dati risultanti dall'operazione di raggruppamento. Il suo funzionamento è molto simile a quello della clausola WHERE ma anziché operare sui campi del database opera sui raggruppamenti; i campi richiesti possono essere sia quelli delle funzioni di aggregazione sia quelli indicati nelle clausole GROUP BY.

venerdì 27 novembre 2009

Particolarità riscontrate lavorando con l'SQL in Access: differenze rispetto agli altri DBMS

L'SQL "standard" può presentare delle variazioni più o meno marcate a seconda del DBMS preso in considerazione.Access, a tal proposito, è fondamentalmente un DBMS sui generis.
A differenza di altri ambienti di sviluppo, in Access un unico file comprende tutti gli strumenti per lo sviluppo delle applicazioni: tabelle, query, maschere, report. Le tabelle sono i contenitori dove vengono memorizzati i dati; le query sono gli strumenti idonei all'interrogazione ed alla manipolazione dei dati che avvengono attraverso un mini-SQL; le maschere consentono di interagire con i dati delle tabelle o delle query attraverso un'interfaccia grafica; i report, infine, consentono principalmente di visualizzare dei risultati basati sui dati.
Negli anni '90 Microsoft inserisce Access nel pacchetto dei prodotti Office e Access, oltre ad essere un programma in grado di gestire le informazioni "depositate" in un database relazionale, si rivela potente e flessibile ma soprattutto user friendly, tanto che può essere utilizzato sia per progetti "semplici" (si pensi ad una rubrica telefonica) che "complessi" (una ricerca scientifica). Access rientra in quella categoria di RDBMS che possono relazionarsi con il linguaggio SQL.
Per poter usare SQL in Access è necessario definire una query e scegliere l’opzione "Visualizza SQL", cosi facendo è possibile aprire una finestra di testo (la c.d. "Finestra SQL") in cui riportare le istruzioni SQL.
Gli elementi che caratterizzano il linguaggio SQL di Access sono:

- Non accetta il costrutto CHECK (è un vincolo).

-Cambia la valutazione dell’operatore COUNT: se l’argomento è un attributo, non vengono restituiti i singoli valori dell’attributo, ma il numero dei valori non nulli.
-La clausola DISTINCT non può essere utilizzata.

- L'operatore JOIN deve essere sempre identificato con il termine INNER od OUTER, mentre con Oracle utilizzeremmo, per esempio, l'operatore WHERE.
- Il carattere JOLLY (corrisponde a qualsiasi stringa composta da zero o più caratteri) viene indicato con il segno asterisco (*) e non con il simbolo della percentuale (%).

-Riconosce sia il singolo apice (') che i doppi apici (") nell’identificazione delle stringhe alfanumeriche.
- Per le stringhe che contengono date Access permette di adottare la formula latina GG/MM/AAAA mentre per alcuni DBMS di origine anglosassone ciò non è possibile. Nei comandi le date vanno racchiuse attraverso l'apice singolo ('), per la maggior parte dei dialetti SQL, mentre in Access si usa il cancelletto (#).

- La clausola TOP può essere utilizzata per selezionare un certo numero di tuple dal risultato.

- Le parentesi quadre racchiudono gli identificativi di tabelle

mercoledì 18 novembre 2009

SQL : Istruzioni di base per Estrazione, Inserimento, Update dei dati

SQL (Structured Query Language) è un linguaggio creato per l'accesso a informazioni memorizzate nei database.
Questo linguaggio può essere suddiviso in tre parti:
-DATA DEFINITION LANGUAGE (DDL): permette di creare, modificare o cancellare il database, definendo la struttura dello stesso con dei dati –contenuti.
-DATA MANIPULATION LANGUAGE (DML): permette di inserire, cancellare, modificare e leggere i dati, fornendone gli strumenti.
- DATA CONTROL LANGUAGE (DCL): permette di gestire gli utenti e i permessi che gli consentono di agire sulla struttura del database.
SQL ha tre aspetti fondamentali:
1- l’estrazione delle informazioni (query);
2- l’inserimento dei dati (insert to);
3- la modifica dei dati (update).
Gli operatori messi a disposizione dall’ SQL standard si dividono in 4 categorie:
- OPERATORI DI CONFRONTO: determinano le uguaglianze e disuguaglianze tra valori ed effettuare ricerche all’interno dei dati;
- OPERATORI ARITMETICI: effettuano calcoli all’interno di una ricerca; (ad esempio il “+” effettua una addizione, il “-” una sottrazione, il “*” una moltiplicazione ed il “/” una divisione);
- OPERATORI CONDIZIONALI: unico operatore condizionale di SQL è il WHERE (dove) e serve a definire i criteri di ricerca mirati;
- OPERATORI LOGICI: sono AND (e), OR (o), NOT (non) e possono essere ripetuti più volte all’interno della ricerca.
Il comando SELECT abbiamo la possibilità di estrarre i dati in modo mirato dal database. Sintassi del comando SELECT:
SELECT lista elementi
FROM lista_riferimenti_tabella
[WHERE] espressione condizionale
[GROUP BY lista colonne]
[ORDER BY lista colonne]
La nota ORDER BY serve per ORDINARE e viene sempre applicato al primo attributo inserito nella SELECT. Il comando INSERT ha la funzione di inserire i dati nelle tabelle. (INSERT TO….). Il comando UPDATE ha la funzione di modificare i dati nelle tabelle. Il nome di ogni campo che deve essere modificato va dopo la parola SET e deve essere seguito dal simbolo “=” e dal nuovo valore che deve assumere. Il comando DELETE ha la funzione di cancellare i dati dalle tabelle. Una tabella priva di clausola WHERE cancella tutte le righe della tabella specificata. Esiste un altro modo per svuotare completamente una tabella, con il comando TRUNCATE TABLE. L’unica pecca dell’SQL riguarda il suo linguaggio, considerato da molti molto complicato e non fornisce un modo standard per suddividere un lungo comando in comandi più brevi.

venerdì 6 novembre 2009

Multidimentional Cube, Slice & Dice, Roll Up, Drill Down, Filtering

Come ho già spiegato nel post dal titolo Elementi teorici e strutturali del report, il report aziendale è uno strumento che consente di valutare, attraverso informazioni prelevate da archivi diversi, lo stato di salute di una qualsiasi società di persone o di capitali.Esso è anche un documento formato da tabelle e grafici esposti in modo sinottico con l’obiettivo di supportare le decisioni strategiche di un’azienda in base ad un determinato fenomeno d’interesse che è analizzato a sua volta secondo più dimensioni.
Le dimensioni sono i caratteri che si rilevano sulle unità statistiche. Si possono considerare anche più caratteri per singola unità statistica per agevolare la lettura del Report. Il Multidimentional Cube si può associare un database relazionale ad un database multidimensionale. L’accesso ai dati è semplificata dal costante tracciato del cammino che lo identifica.

Per rendere ancora più semplice la lettura di un Report sono state messe a punto alcune tecniche di visualizzazione come:

_ drill down ( termine che indica la perforazione di un terreno) è la possibilità di esplorare tutta la gerarchia a partire da un dato complessivo relativo ad una dimensione gerarchizzata.

_ slice & dice ( è l’insieme di operazioni di divisione di una torta) è la possibilità di restringere l’analisi solo ad alcune dimensioni.

_ Roll up è la possibilità di aumentare l’aggregazione dei dati eliminando i dettagli di gerarchizzazione. Il Roll Up può dividersi poi in due tipi: il primo che consiste nell’applicazione di una funzione aggregata e il secondo nell’eliminazione di una dimensione.

_ Filtering attraverso di esso si filtrano i dati con un algoritmo.

venerdì 30 ottobre 2009

Che cosa sono i datawarehouse e cosa li differenzia dai sistemi OLTP

Innanzitutto partiamo dal definire cos’è un Data warehouse. Esso è un archivio informatico contenente i dati di un’organizzazione. I DW sono progettati per consentire di produrre facilmente relazioni ed analisi.

Vengono considerati componenti essenziali di un sistema Data warehouse anche gli strumenti per localizzare i dati, per estrarli, trasformarli e caricarli, come pure gli strumenti per gestire un dizionario dei dati.

L’integrazione dei dati costituisce la principale caratteristica distintiva del DW rispetto ad altri sistemi di supporto alle decisioni. La raccolta dei dati deve essere: integrata, orientata al soggetto, variabile nel tempo e non volatile.

Esso si differenzia in modo sostanziale dai normali sistemi gestionali che, al contrario, hanno il compito di automatizzare le operazioni di routine.

Inoltre i DW sono basi informative costruite per fornire informazioni aggregate e organizzate per aree tematiche. Le banche dati interattive sono applicazioni OLAP (On Line Analytical Processing) per l’analisi dei dati via Internet, basate su Data Warehouse costruiti a partire da archivi di diverse fonti e formati.
I prodotti consentono di interagire dinamicamente con le banche dati per ottenere report multidimensionali visualizzabili sia in forma tabellare che grafica (barre, torte, mappe territoriali) ed esportabili in Excel.
Le variabili disponibili e il dettaglio raggiungibile sono legati a differenti profili di utenza (utente anonimo, istituzionale con ambito nazionale/regionale/comunale).

A differenza delle analisi con tecnologia OLAP , la tecnologia OLTP non prevede la creazione di banche dati separate, infatti le analisi vengono effettuate direttamente sui dati di esercizio. Questa soluzione permette di avere i dati sempre aggiornati ed evita fasi intermedie di trasformazione dei dati, tuttavia per la sua stessa natura non è facilmente applicabile in situazioni dove la quantità di dati da analizzare sia molto elevata ed in questi casi viene generalmente preferito l’utilizzo di analisi di tipo OLAP.

giovedì 29 ottobre 2009

i CMS: cosa sono. Gli applicativi piu diffusi e potenti

Un Content management system (CMS), letteralmente "Sistema di gestione dei contenuti", è uno strumento software installato su un server web studiato per facilitare la gestione dei contenuti di siti web, svincolando l'utilizzatore da conoscenze tecniche di programmazione.

Esistono CMS specializzati, cioè appositamente progettati per un tipo preciso di contenuti (un'enciclopedia on-line, un blog, un forum, ecc.) e CMS generici, che tendono ad essere più flessibili per consentire la pubblicazione di diversi tipi di contenuti.

Tecnicamente un CMS è un'applicazione lato server, divisa in due parti: la sezione di amministrazione (back end), che serve ad organizzare e supervisionare la produzione dei contenuti, e la sezione applicativa (front end), che l'utente web usa per fruire dei contenuti e delle applicazioni del sito.

I CMS possono essere programmati in vari linguaggi tra cui più comunemente in PHP e ASP; il tipo di linguaggio adoperato è indifferente a livello di funzionalità. I CMS in PHP sono multipiattaforma, mentre i CMS in ASP possono essere utilizzati solo su piattaforme Windows.
Un CMS permette di costruire e aggiornare un sito dinamico, anche molto grande, senza necessità di scrivere una riga di HTML e senza conoscere linguaggi di programmazione lato server (come PHP) o progettare un apposito database. L'aspetto esteriore delle pagine può essere personalizzato scegliendo un foglio di stile CSS appositamente progettato per un determinato CMS.

I flat file CMS (altrimenti noti come text-based CMS) sono dei content management system che si basano su file di testo (il più delle volte files XML) e che perciò non necessitano di alcun database come MySQL, PostgreSQL, ecc. Questi CMS sono facilmente installabili e dunque sono particolarmente adatti per siti personali o per piccole comunità. Un CMS open source di questa tipologia è Flatnuke.

mercoledì 28 ottobre 2009

ANSI SQL

Per spiegare l'ANSI SQL introduciamo innanzitutto il concetto di Database "relazionali". Con questo indichiamo la divisione del contenuto di un database in tante tabelle che contengono dati logicamente correlati tra loro. Per metterle insieme, si usano delle relazioni tra l' una e l' altra tabella.
Uno dei requisiti fondamentali per poter utilizzare un database relazionale e' avere un "linguaggio" che ci permetta di interrogarlo in maniera opportuna, cosa che gli informatici chiamano RDBMS, cioè Relational DataBase Management System. Come spesso succede nel mondo dell' informatica anche in questo caso e' nato uno "standard" che avrebbe permesso a tutti di parlare la stessa lingua, ed appena e' nato sono nati così tanti dialetti che non parlano l' uno con l'altro da potercisi affogare. Questo standard si chiama ANSI SQL (Structured Query Language della American National Standard Institute), e ovviamente sebbene TUTTI dicano che il loro linguaggio e' ANSI Compliant (compatibile con l' ansi SQL) in realtà tutti hanno differenze sostanziali l' uno con l'altra. i più diffusi linguaggi SQL oggi sono (ovviamente) quelle dei più diffusi database, cioè: Oracle SQL,MySQL,DBII SQL.

martedì 20 ottobre 2009

Creazione di un Data Source con DataTime, Creazione di join arbitrarie mediante lo strumento visuale di DataTime, Report da tabelle multiple

Un Data Source è un file che contiene al suo interno regole di estrazione dei dati da un data base, dunque in codice Sql. Il software di reportistica Data Time consente di creare report, sia lavorando in modalità quick (su una sola tabella) sia in modalità non quick (cioè generando un Data Source che consenta all'utente di operare su diverse tabelle, tramite relazioni di join). Le operazioni da seguire sono le seguenti:

1) Scaricare il programma da www.Datatime.eu/DataTime universal.htm e scaricare northwind (file prova di Microsoft)
2) Aprire new project (nome progetto-salva-apri), creare nuova connessione, selezionare access, crea e salva
3) Selezionare nwind e apri, connection e salva
4) db explorer/quick report
5) re load structure (mostra tutte le tabelle a disposizione)
6)selezionare query on each selection; cliccando su querry current, il programma mostra tutte le tabelle nel dettaglio; cliccando su una tabella in particolare, il programma mostra solo il dettaglio di quella selezionata.
7) cliccando su quick report si apre la schermata del slice e dice e si possono trascinare i nomi delle dimensioni e misure che ci interessano (ship region per le dimensioni e freight per le misure) e si clicca su generale.
8) Si apre una schermata con la tabella di interesse ed è possibile inserire grafici trascinando gli elementi già presenti nella parte sinista del foglio di lavoro.

lunedì 19 ottobre 2009

Nozione di Accessibilità

Lo stato Italiano ha emesso delle normative specifiche in materia di accessibilità dei siti Internet.
Queste norme riguardano nello specifico tutti gli enti governativi e statali che per legge devono adeguarsi nel rendere i propri siti accessibili.
I testi della legge sono disponibili per la consultazione e definiscono e chiariscono le specifiche da rispettare nello sviluppo di un web design accessibile.
Lo scopo della legge, in applicazione del principio costituzionale di eguaglianza, è quello di abbattere le "barriere virtuali" che limitano l'accesso dei disabili alla Società della Informazione e li escludono dal mondo del lavoro, dalla partecipazione democratica, da una migliore qualità della vita.
Si tratta quindi di garantire anche ai cittadini disabili il diritto di accesso alle risorse informatiche e ai servizi telematici, assicurando anche a loro una migliore opportunità di conoscenza, istruzione, lavoro, informazione ed intrattenimento.
siti esistono davvero, sono tantissimi e funzionano bene. Hanno un numero di visite e, soprattutto di clienti, elevatissimo. Ma potrebbero fare di più, il tuo sito potrebbe fare molto di più.
Rendersi accessibile.
Gli utenti ipovedenti o non-vedenti sono una comunità consistente di utenti Internet. Ed esistono strumenti appositi (Computer, telescriventi, terminali o dispositivi portatili con limitate capacità di visualizzazione, televisori, proiettori, dispositivi palmari, stampanti, libri, dispositivi con risposta tattile di tipo braille, sintetizzatori vocali, elettrodomestici interattivi, telefonini, consolle di gioco palmari o da tavolo)che permettono forme "differenti" di navigazione e fruizione dei contenuti di un sito. Magari faranno a meno di spettacolari animazioni in Flash (spesso tutti ne faremmo volentieri a meno...) ma lo scopo del sito, se accessibile, rimane. E con esso tutti i contenuti, le offerte, le idee e i vantaggi che il sito porta.
Le persone con disabilità motorie non usano, o usano in modo differente i normali dispositivi di puntamento (mouse, tastiera, trackpad) ma anche in questo caso esistono delle attrezzature che permettono di navigare il sito, se accessibile, e di disporre delle stesse condizioni di favore previste per un utente (cliente) "normale". Mentre un'attenta scelta delle immagini, ad esempio, ma non solo, può aumentare l'accessibilità di un sito per chi ha difficoltà cognitive.

sabato 17 ottobre 2009

Il formato ideale per il documento software di relazione aziendale (soggetto a revisioni nel tempo): Presentazioni, relazioni, progetti

La redazione di report aziendali non è

un momento facile per i manager delle aziende, perchè il documento non è altro che l’immagine dello stato organizzativo interno dell’azienda. Il panorama aziendale è cambiato molto sotto il profilo organizzativo, perchè ormai si è più orientati verso una net economy e quindi verso una gestione del capitale intellettuale degli individui. Di fatti si da molto più spazio al singolo impiegato rendendolo partecipe alla vita aziendale non escludendolo da eventuali cambiamenti.

Si sono venuti a delineare nuovi modelli d’organizzazione innovativi rivolti alla comunicazione interna per diffondere nella maniera giuste le notizie e i cambiamenti aziendali all’esterno.

Le tipologie e format di documenti aziendali più utilizzati nella comunicazione e nel marketing delle organizzazioni, rep61sebbene diverse, presentano caratteristiche comuni come le identity guidelines guide al formato di identità aziendale. Si tratta non della missione aziendale ma delle linee guide da seguire per garantire coerenza di formato e per usare correttamente “l’identità aziendale” (anche detta CI = corporate identity),cioè quanto trasmesso visivamente o graficamente tramite ogni pezzo di carta pubblicato, dal biglietto da visita alla lettera, dalla pagina pubblicitaria alla nesletter tecnica o commerciale: corretto uso dei font aziendali (quando usare quelli con le grazie e senza grazie, il grassetto, corsivo, ecc., dimensioni, stili standard per titoli, titolini, corpo testo, ecc.), uso dei margini e degli spazi, colore Pantone corretto e in quali situazioni può essere usato in modo che ogni pezzo di carta pubblicato (e ormai anche ogni pagine pubblicata sul Web) sia identificabile a colpo d’occhio come proveniente da quella determinata azienda.

Per quanto riguarda la comunicazione interna serve per condividere il progetto organizzativo, missione evisione dell’organizzazione e diffondere conoscenza. Gli strumenti di comunicazione interna più diffusa sono gli House Organ, le Newsletter, i manuali, operativi, il Fact book/bilancio, le circolari e gli ordini di servizio, i Position paper, la reportistica e i progetti, le relazioni .

La cosa importante che una organizzazione non deve sottovalutare è che qualunque sia il report utilizzato per comunicare lo status aziendale, tale oggetto deve essere comprensibile alla maggio parte degli utenti a cui è indirizzato.

venerdì 16 ottobre 2009

FUNZIONE DELL’ ETL E I PRINCIPALI TOOL SOFTWARE DI ETL

L’ETL è la sigla di “Extract Transform Load” e come si può capire fa riferimento ai processi di estrazione, trasformazione e caricamento dei dati in un sistema di sintesi (data warehouse, data mart).

Il primo processo consiste nell’estrazione di dati dalle sorgenti quali database transazionali (OLTP), comuni file di testo o da altri sistemi informatici(tipo sistemi di Erp o Crm).

Una volta estratti i dati si passa al processo di trasformazione di questi, lo scopo di questo processo è quello di consolidare i dati, in modo tale che siano aderenti alla logica di business del sistema di analisi per cui viene sviluppato.

In poche parole questo secondo processo consiste in una serie di passaggi. Si inizia selezionando solo i dati che interessano al sistema, poi si passa alla normalizzazione dei dati, nel tradurre dati codificati, derivare nuovi dati calcolati, eseguire degli accoppiamenti tra dati recuperati da differenti tabelle e infine raggruppare i dati.

Occorre prestare particolare attenzione alla granularità delle informazioni da memorizzare nella stuttura a valle. Queste infatti, non solo devono essere aggregate in modo da non avere un dettaglio eccessivo, cosa che potrebbe portare ad un decadimento delle prestazioni delle interrogazioni effettuate sul sistema, ma devono anche mantenere una granularità etlche consenta di effettuare le necessarie analisi sui dati.

Il processo di estrazione, trasformazione e caricamento è importante perchè permette alle aziende di ottenere informazioni strategiche che ne permettono il suo sviluppo, infatti offre un supporto tecnico e analitico che permette la giusta flessibilità per andare oltre le mere trasformazioni “pre-pacchettizzate” e costruire delle routine di trasformazione ad hoc secondo le specifiche esigenze aziendali.

I principali benefici che si ottengono dal processo di ETL sono:

* riduzione del tempo per condurre attività di Business Intelligence grazie alla rapida generazione di Data Warehouse, Data Mart e flussi di dati
* controlli sui costi per l’integrazione dei dati, sviluppo dei processi ETL (Extract, Transform and Load) e manutenzione grazie a software solidi e affidabili che favoriscono la collaborazione e la gestione dei metadati comuni dall’inizio alla fine del flusso dei dati
* creazione di processi ETL riutilizzabili, facilmente modificabili e contenenti già al proprio interno robuste funzionalità per la qualità e correttezza dei dati
* incremento del ritorno sugli investimenti IT già effettuati grazie alla scalabilità multipiattaforma e alla interoperabilità standard fra applicazioni ed ambienti operativi.

Il mercato propone oggi alle aziende diversi tool software di ETL, tra i principali devono essere menzionati quelli sviluppati da Microsoft (SQL Server 2005) ed Oracle. Per quel che riguarda Microsoft SQL Server 2005 fornisce una piattaforma di estrazione, trasformazione e caricamento denominata SQL Server Integration Services (SSIS) che si propone di offrire alle organizzazioni la possibilità di ottenere un vantaggio competitivo attraverso applicazioni di ETL che consentono di sfruttare le potenzialità offerte dalla suite di prodotti Microsoft. NET. Invece Oracle ha da poco sviluppato una piattaforma ,Oracle Data Integration Suite, con lo scopo di garantire alle aziende l’integrazione dei dati attraverso strumenti volti ad ottimizzare il data management, tra i quali ad es. ELT e DQ (Data Quality).

mercoledì 14 ottobre 2009

Principali prodotti software per l'archiviazione delle informazioni (DBMS): Sql Server, Oracle, Access, Sybase, MySQl

Per DBMS si intende un sistema di gestione dei dati (Data Base Management System) che garantisce un livello di sicurezza ai dati, permettendo una condivisione sicura ed affidabile.
Il DBMS si frappone fra l’utente e i dati del Data Base, grazie a questo strato di software l’utente non ha accesso diretto ai dati memorizzati fisicamente, ma solo a una loro rappresentazione logica, permettendo un livello alto di indipendenza tra i dati e le applicazioni. Le attuali applicazioni dei Data Base permettono l’accesso ai dati a più utenti contemporaneamente, questo grazie al fatto che sono stati sviluppati DBMS che, utilizzando una sola copia dei dati, permettono la creazione di più rappresentazioni logiche di questi, riducendone la ridondanza e l’inconsistenza.
SQL SERVER è una Query Language. E' strutturato sull'architettura client/server dei database che si basano sul modello entità-relazione. tale modello è utilizzato per analizzare le caratteristiche di una situazione prescindendo dagli eventi che si verificheranno per costtituire cosi un modello concettuale di dati sentito come indipendente dalle applicazioni.
ORACLE è uno tra i più famosi database management system (DBMS). Anche questo fa parte dei cosiddetti RDBMS (Relational DataBase Management System) ovvero di sistemi di database basati sul Modello relazionale che si è affermato come lo standard dei database dell'ultimo decennio.
Oracle memorizza i dati sia logicamente, sotto forma di tablespace, sia fisicamente, sotto forma di file (datafile). Un tablespace, formato da uno o più datafile, contiene vari tipi di segment; ogni segment a sua volta si suddivide in uno o più extent. Ogni extent comprende gruppi contigui di blocchi di dati (data block), quest'ultimi sono la più piccola informazione memorizzabile da Oracle.
A livello fisico, i file comprendono almeno due o più extent. Oracle tiene traccia dei dati memorizzati tramite l'aiuto di informazioni presenti nelle tabelle di sistema. Esse contengono il dizionario dei dati e se presenti indici e cluster. Un dizionario dei dati consiste di una collezione di tabelle che contengono informazioni riguardo tutti gli oggetti utente del database.
Oracle è un RDBMS che se configurato e gestito in maniera appropriata, garantisce una sicurezza dei dati molto elevata
ACCESS è un altro esempio di relational database management system. Questo è realizzato da Microsoft, incluso nel pacchetto Microsoft Office Professional ed unisce il motore relazionale Microsoft Jet Database Engine con una interfaccia grafica.
Può utilizzare dati immagazzinati in formato Access/Jet, SQL Server, Oracle o qualsiasi database in formato compatibile ODBC( Open Database Connectivity, standard per la connessione ai DBMS)
A differenza di altri ambienti di sviluppo, in Access un unico file comprende tutti gli strumenti per lo sviluppo delle applicazioni: tabelle, query, maschere, report.
Le tabelle sono i contenitori dove vengono memorizzati i dati; le query sono gli strumenti idonei all'interrogazione ed alla manipolazione dei dati che avvengono attraverso un mini-SQL; le maschere consentono di interagire con i dati delle tabelle o delle query attraverso un'interfaccia grafica; i report consentono di visualizzare dei risultati basati sui dati.

venerdì 2 ottobre 2009

Elementi teorici e strutturali del report: Dimensioni, Misure, Aggregazione, funzioni di aggregazione

Il report aziendale è uno strumento che consente di valutare, attraverso informazioni prelevate da archivi diversi, lo stato di salute di una qualsiasi società di persone o di capitali. Esso aggrega in un unico documento tutte le informazioni indispensabili per esaminare in modo dettagliato la situazione economica, finanziaria e societaria di qualsiasi impresa italiana, per valutare rapidamente la solidità patrimoniale di fornitori, clienti e concorrenti e per mantenere sotto controllo i rischi di credito e commerciali.
Grazie all'accesso alle fonti pubbliche di tutto il territorio nazionale (Camere di Commercio, Tribunali e Uffici di Pubblicità Immobiliare), il Report Impresa integra:
• i dati identificativi del soggetto richiesto.
• per le società di capitali, i dati sintetici di bilancio su fatturato, valore della produzione e numero di dipendenti
• i codici RAE (Ramo di Attività Economica) e SAE (Settore di Attività Economica)
• l'elenco dei soci e degli esponenti d'impresa e le loro cariche in altre società
• i protesti su sede ed esponenti d'impresa
• le informazioni pregiudizievoli su sede ed esponenti d'impresa
• l'elenco delle società controllate e collegate
• le informazioni sulla sede e sulle unità secondarie
• le procedure concorsuali in atto
• gli abstract delle notizie pubblicate da oltre 130 quotidiani nazionali, regionali e locali sull'impresa
• il rating, che consente di avere immediatamente un quadro generale dell'affidabilità di un'impresa.
• a richiesta, i Bilanci Riclassificati, per conoscere il reale stato economico delle società di capitali e per contestualizzarne le performance all'interno del settore d'appartenenza.

.Ogni report è costituito da due elementi fondamentali:Dimensioni e Misura. Dimensioni: i caratteri che si misurano sulle unità statistiche; costituiscono la parte del report che non cambia, come ad esempio l’anagrafica dei clienti. Solitamente non si considerano più di due dimensioni in quanto il report deve essere di facile lettura, per permettere all’interessato di ottenere tutte le informazioni necessarie nel modo più semplice e rapido possibile. Per questioni di praticità però si può considerare più di un carattere su ciascuna dimensione (ad es. città e paese insieme), per cui le singole modalità diventano coppie; si parla quind di “carattere derivato”.
Misura: qualsiasi eleborazione (funzione generale) calcolata su unità statistiche che soddisfino la condizione di possedere una certa combinazione di modalità; si tratta dela parte quantitativa del report che scaturisce dall’operazione di aggregazione della matrice dei dati, come ad esempio la somma dei soldi spesa da ciascun cliente.
Per procedere alla costruzione di un report bisogna risalire alle relazioni esistenti tra le diverse tabelle, al fine di riunificare l’informazione frammentata; si ricorre pertanto a strumenti di reportistica ad hoc. L’operazione alla base della creazione di un report è esattamente opposta rispetto a quelle effettuata per la distribuzione dei dati all’interno dei database. Mentre in questo caso si lavora a partire dal principio di economicità per cui si applica il processo di normalizzazione dei dati (volto ad evitare la duplicazione e l’inconsistenza dei dati, garantendo al contempo l’integrità referenziale degli stessi), nel primo caso vige la logica della replicazione dei dati allo scopo di ricongiungere le informazioni.
Perchè il report è diverso da una semplice struttura tabulare?

In primo luogo è opportuno evidenziare che il report è una struttura complessa che non si limita, come un tabulato, a riportare i dati di una tabella, ma opera una “join” (unione) di più tabelle.
La seconda fondamentale differenza sta nel fatto che mentre in una stampa tabulare i record si riportano singolarmente, nel report si effettua sempre un’operazione di aggregazione (che può essere una somma o una differenza, così come una media, una moda, ecc.). Dunque il report è una struttura che deriva dall’aggregazione della matrice dei dati, che a sua volta corrisponde alla join arbitraria di un numero arbitrario di tabelle, utilizzato come base di partenza per la reportistica.
Dato che il report è un documento visionato da tutti gli stakeholders interni ed esterni dell’azienda, la componente “aspetto”, vale a dire il layout della presentazione, ha importanza fondamentale.