Le Parole Chiave di un Database (2^ parte)
Cosa sono l`Indice, SQL, ETL, Cubi di Dati, Data Warehouse/Data Mart, Data Mining?
INDICE (o index): all’interno di ogni tabella possiamo definire degli "indici". Lo scopo è di rendere per noi più agevoli e veloci ricerche, filtri, selezioni, raggruppi, estrazioni ed ordinamenti, INDICANDO appunto al database regole e priorità di accesso ben precise. Le CHIAVI UNIVOCHE sono di per sè degli indici naturali: una ricerca su di esse sarà velocissima !
SQL: Sigla che sta per STRUCTURED QUERY LANGUAGE (ovvero Linguaggio Strutturato a Richieste). E’ universalmente riconosciuto come il linguaggio standard attraverso il quale si interroga un database in tutti i software di database moderni. Attraverso pochi e ben precisi comandi e regole, possiamo eseguire qualsiasi tipo di attività sui nostri archivi. Rinvio a sedi più appropriate l'approfondimento dello stesso.
ETL: Sigla che sta per Extract -> Transform -> Load. Attività o Processo automatizzato che, a seguito di un’analisi ben precisa, appunto estrae dati da un database, li elabora, e quindi predispone queste "rielaborazioni" per utilizzi e finalità diverse. Spesso questi dati vengono messi in su spazi (logici o anche fisici) DIVERSI da quello del database di origine.
Ad esempio: voglio porre con cadenza mensile una lista delle diponibilità di libri invenduti (o vecchi) in una newsletter promozionale, o in un’area del mio sito internet.
CUBI DI DATI: tramite un processo ETL è possibile anche creare un cubo di dati (o anche "data cube"). Ad esempio: mensilmente desidero disporre di un RAGGRUPPO PERIODICO delle vendite per ARGOMENTO. Dal punto di vista pratico la finalità è evitare di "stressare" il database principale (dove magari più persone ci lavorano quotidianamente), creando invece delle rielaborazioni (o "viste") RAGGRUPPATE su campi ben precisi e spesso con raffronti mensili o su base annuale. Con software particolari questi "cubi" possono inoltre essere manipolati agevolmente per ottenere visualizzazioni o raggruppi alternativi, con diversi gradi di dettaglio, magari tramite pannelli o maschere particolari (c.d. dashboards).
DATA WAREHOUSE e DATA MART (letteralmente "magazzini di dati"): analogamente ai "cubi", uno o più processi ETL predispongono in aree fisiche estrazioni mirate dei dati (solo alcune tabelle o solo parti di esse o un mix fra queste).
Ad esempio: un estratto della mia contabilità (l’anno in corso o il partitario dei clienti) potrebbe essere posta in un notebook per usi di rappresentanza o agenzia, oppure sul cloud come scambio dati da/verso sedi esterne...
DATA MINING (letteramente "scavare nei dati"). Attività svolta da un esperto di database finalizzata a trovare ERRORI, PROBLEMI, SQUADRATURE, BUCHI, BACHI, etc... per poi isolarli o correggerli.
Contestualmente va ricercato il MOTIVO per il quale si siano manifestati (ERRORE UMANO ? DI PROCEDURA ? DEL SOFTWARE DI GESTIONE?), e possibilmente vanno create delle sicurezze, o regole di validazione, tali da impedire che il problema si ripresenti nuovamente.
SQL: Sigla che sta per STRUCTURED QUERY LANGUAGE (ovvero Linguaggio Strutturato a Richieste). E’ universalmente riconosciuto come il linguaggio standard attraverso il quale si interroga un database in tutti i software di database moderni. Attraverso pochi e ben precisi comandi e regole, possiamo eseguire qualsiasi tipo di attività sui nostri archivi. Rinvio a sedi più appropriate l'approfondimento dello stesso.
ETL: Sigla che sta per Extract -> Transform -> Load. Attività o Processo automatizzato che, a seguito di un’analisi ben precisa, appunto estrae dati da un database, li elabora, e quindi predispone queste "rielaborazioni" per utilizzi e finalità diverse. Spesso questi dati vengono messi in su spazi (logici o anche fisici) DIVERSI da quello del database di origine.
Ad esempio: voglio porre con cadenza mensile una lista delle diponibilità di libri invenduti (o vecchi) in una newsletter promozionale, o in un’area del mio sito internet.
CUBI DI DATI: tramite un processo ETL è possibile anche creare un cubo di dati (o anche "data cube"). Ad esempio: mensilmente desidero disporre di un RAGGRUPPO PERIODICO delle vendite per ARGOMENTO. Dal punto di vista pratico la finalità è evitare di "stressare" il database principale (dove magari più persone ci lavorano quotidianamente), creando invece delle rielaborazioni (o "viste") RAGGRUPPATE su campi ben precisi e spesso con raffronti mensili o su base annuale. Con software particolari questi "cubi" possono inoltre essere manipolati agevolmente per ottenere visualizzazioni o raggruppi alternativi, con diversi gradi di dettaglio, magari tramite pannelli o maschere particolari (c.d. dashboards).
DATA WAREHOUSE e DATA MART (letteralmente "magazzini di dati"): analogamente ai "cubi", uno o più processi ETL predispongono in aree fisiche estrazioni mirate dei dati (solo alcune tabelle o solo parti di esse o un mix fra queste).
Ad esempio: un estratto della mia contabilità (l’anno in corso o il partitario dei clienti) potrebbe essere posta in un notebook per usi di rappresentanza o agenzia, oppure sul cloud come scambio dati da/verso sedi esterne...
DATA MINING (letteramente "scavare nei dati"). Attività svolta da un esperto di database finalizzata a trovare ERRORI, PROBLEMI, SQUADRATURE, BUCHI, BACHI, etc... per poi isolarli o correggerli.
Contestualmente va ricercato il MOTIVO per il quale si siano manifestati (ERRORE UMANO ? DI PROCEDURA ? DEL SOFTWARE DI GESTIONE?), e possibilmente vanno create delle sicurezze, o regole di validazione, tali da impedire che il problema si ripresenti nuovamente.
Articolo del: