Introduzione alla tabella dimensionale
Una tabella dimensionale è presente nello schema a stella o fiocco di neve. Le tabelle delle dimensioni aiutano a descrivere le dimensioni, ovvero i valori, gli attributi e le chiavi delle dimensioni. Di solito è di taglia piccola. Le dimensioni possono variare da alcune a mille righe. Descrive gli oggetti presenti nella tabella dei fatti. La tabella delle dimensioni si riferisce alla raccolta o al gruppo di informazioni relative a qualsiasi evento misurabile. Costituiscono un nucleo per la modellazione dimensionale. Contiene una colonna che può essere considerata come una colonna chiave primaria che consente di identificare in modo univoco ogni riga o record di dimensione. Viene unito alle tabelle dei fatti tramite questa chiave. Quando viene creata, viene utilizzata una chiave chiamata chiave surrogata generata dal sistema per identificare in modo univoco le righe nella dimensione.
Perché dobbiamo usare?
- Il suo aiuto per memorizzare la storia delle informazioni o informazioni dimensionali.
- È facile da capire rispetto alle tabelle normalizzate.
- È possibile aggiungere più colonne alla tabella senza influire sulle applicazioni esistenti che le stanno utilizzando.
Tipi di tabella delle dimensioni
Di seguito sono riportati i diversi tipi di tabella delle dimensioni:
1. SCD (modifica lenta delle dimensioni)
Gli attributi delle dimensioni che tendono a cambiare lentamente con il tempo piuttosto che cambiare in un intervallo di tempo regolare sono chiamati dimensioni che cambiano lentamente. Ad esempio, l'indirizzo e il numero di telefono cambiano ma non regolarmente. Vediamo un esempio di un uomo che viaggia in diversi paesi, quindi deve cambiare il suo indirizzo in base a quel paese. Questo può essere fatto in tre modi:
Tipo 1: sovrascrive il valore precedente. Questo metodo è facile da applicare e aiuta a risparmiare spazio riducendo quindi i costi. Ma la storia si perde in questo scenario.
La tabella prima del cambiamento
ID | NOME | NAZIONE | NAZIONALITÀ |
1001 | Rachel | India | indiano |
Tabella dopo la modifica
ID | NOME | NAZIONE | NAZIONALITÀ |
1001 | Rachel | Cina | indiano |
Tipo2: aggiungi una nuova riga con il nuovo valore. In questo metodo, la cronologia viene salvata e può essere utilizzata ogni volta che è necessario. Ma occupa molto spazio, quindi aumenta il costo.
La tabella prima del cambiamento
ID | NOME | NAZIONE | NAZIONALITÀ |
1001 | Rachel | India | indiano |
Tabella dopo la modifica
ID | NOME | NAZIONE | NAZIONALITÀ |
1001 | Rachel | India | indiano |
1001 | Rachel | Cina | indiano |
Tipo 3: aggiungi una nuova colonna. È l'approccio migliore poiché la storia può essere mantenuta facilmente.
La tabella prima di Change
ID | NOME | NAZIONE | NAZIONALITÀ |
1001 | Rachel | India | indiano |
Tabella dopo il cambiamento
ID | NOME | NAZIONE | VECCHIO PAESE | NAZIONALITÀ |
1001 | Rachel | Cina | India | indiano |
2. Dimensione conforme
Questa dimensione è condivisa tra più aree tematiche o data mart. Lo stesso può essere utilizzato in diversi progetti senza alcuna modifica nello stesso. Questo è usato per mantenere la coerenza. Le dimensioni conformi sono quelle esattamente uguali o un sottoinsieme corretto di qualsiasi altra dimensione.
3. Dimensione spazzatura
Una dimensione spazzatura è un gruppo di attributi di bassa cardinalità. Contiene attributi diversi o vari che non sono correlati a nessun altro attributo. Questi possono essere utilizzati per implementare RCD (dimensioni che cambiano rapidamente) come bandiere, pesi, ecc.
4. Dimensione degenerata
Attribuisce che sono memorizzati nella stessa tabella dei fatti e non come una tabella di dimensioni separata, tali attributi sono chiamati dimensioni degenerate. Ad esempio numero del biglietto, numero della fattura, numero della transazione ecc.
5. Dimensione di gioco
Le relazioni multiple con la tabella dei fatti sono chiamate dimensioni del gioco di ruolo. In altre parole, è quando la stessa chiave di dimensione con tutti i suoi attributi correlati è unita a molti regali di chiave esterna nella tabella dei fatti. Può soddisfare molteplici scopi all'interno dello stesso database esistente.
Come funziona nel data warehouse?
- La dimensione si riferisce alla raccolta o al gruppo di informazioni relative a qualsiasi evento misurabile. Costituiscono un nucleo per la modellazione dimensionale. Quando viene creata una dimensione, viene generata una struttura di un progetto. Creato può essere utilizzato in diversi progetti e riflette l'idea di riusabilità. Quando viene apportata una modifica in una di esse, il suo effetto si riflette solo in quella particolare tabella. Quando si deve creare un report, l'utente può prelevare i dati poiché le tabelle delle dimensioni contengono tutte le informazioni necessarie.
- Quando si esegue la modellazione delle dimensioni, i dati atomici vengono caricati in strutture dimensionali. Quindi i modelli dimensionali vengono generati o costruiti attorno ai processi aziendali. Durante la creazione, è necessario tenere presente che per filtrare i valori di dominio e archiviare le etichette dei report in queste tabelle. È necessario assicurarsi che la chiave surrogata (chiave generata dal sistema utilizzata durante la creazione della tabella delle dimensioni che aiuta a identificare in modo univoco ogni record presente nella tabella delle dimensioni.) Deve essere utilizzata durante la creazione della tabella delle dimensioni. Deve essere denormalizzato perché il loro compito è quello di consentire all'utente di leggere e analizzare i dati in modo altrettanto efficiente anziché gestire le transazioni. L'obiettivo principale della dimensione è fornire il filtraggio, eseguire il raggruppamento e un'etichettatura efficiente.
vantaggi
Di seguito sono riportati i diversi vantaggi della tabella delle dimensioni:
- Ha una struttura semplice.
- È facile da analizzare e capire.
- Dati denormalizzati.
- Aiuta a mantenere le informazioni storiche per qualsiasi dimensione.
- Facile da recuperare i dati da esso.
- Veloce da creare e implementare.
- Fornisce il contesto circostante di qualsiasi processo aziendale.
Conclusione - Tabella dimensionale
Questa è parte integrante della modellazione dei dati. È utilizzato nello schema a stella o fiocco di neve. Contiene dimensioni, chiavi e valori degli attributi della tabella dei fatti. Esistono diversi tipi di cui vengono utilizzati in diversi scenari.
Articoli consigliati
Questa è una guida alla tabella delle dimensioni. Qui abbiamo discusso dei tipi, come funziona la tabella dimensionale nel data warehouse con vantaggi. Puoi anche consultare i nostri altri articoli correlati per saperne di più-
- Tabella dei fatti e tabella delle dimensioni
- Che cos'è la tabella dei fatti?
- Che cos'è il tableau?
- Miscelazione dei dati nel tableau