Introduzione allo schema a stella

Lo schema a stella è l'approccio e il modello dimensionale più semplici in cui le tabelle delle funzioni, le dimensioni e i fatti sono organizzati in modo organizzato ed è principalmente applicato in Business Intelligence e Data Warehousing. Uno schema a stella si forma organizzando ogni fatto con le relative dimensioni che assomigliano a una stella. Un dato di fatto è un risultato infinito come i dettagli di vendita e il numero di accessi. Una dimensione è la raccolta di dati di riferimento inclusi fatti, come data, dettagli sul prodotto e clienti. Lo schema a stella è ottimizzato per enormi query di dati nel data warehousing, cubi di dati di elaborazione analitica online e anche query ad hoc.

Come creare uno schema a stella?

Qui l'utente creerà lo schema a stella mediante la conversione del modello entità-relazione. I modelli entità-relazione sono troppo complessi per spiegare le quantità e gli attributi funzionali, quindi è semplificato allo schema a stella dimensionale come segue:

  • Trova la procedura aziendale dalla vista entità-relazione e comprendi il modello che può essere suddiviso in diversi modelli dimensionali. Una relazione tra entità è costituita da dati aziendali.
  • Trova molte o molte tabelle nella relazione entità che spiega la procedura aziendale e convertile in tabelle di realtà del modello dimensionale. Questa tabella contiene dati che comprendono la tabella dei fatti e una tabella dimensionale con valori numerici e attributi chiave univoci.
  • L'idea alla base di questo processo è quella di differenziare le tabelle di informazioni basate sullo scambio o le tabelle cancellate dalle informazioni. Quindi è necessario progettare da molte a numerose relazioni. Ad esempio, nel database ERP, ci sono dettagli della fattura che sono la tabella di scambio. I dettagli che vengono aggiornati e aggiornati sono tabelle basate sullo scambio. Ora confrontando entrambe le tabelle, si ricava che i dati sono veramente statici.
  • La tabella della realtà è una rappresentazione di un modello dimensionale che mostra molte o numerose reti tra misurazioni finite. Ciò risulta che le chiavi esterne nelle tabelle di realtà condividono molte o numerose che è una relazione numerabile. la maggior parte di questa tabella rientra nelle tabelle basate sullo scambio
  • L'ultimo passo nella progettazione dello schema a stella è la de-normalizzazione delle tabelle residue in tabelle di misurazione. La chiave obbligatoria è creare una chiave duplicata. Questa chiave si basa sulla tabella della realtà che aiuta a comprendere meglio. Trova la data e l'ora dalla progettazione entità-relazione e archivia la tabella delle dimensioni. Le date vengono salvate come data e ora. Una colonna dimensione data rappresenta l'anno, il mese o la data o l'ora

Esempio: la tabella dimensionale temporale ha TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek che possono essere importanti criteri delle tabelle dimensionali. Allo stesso modo, tutte le tabelle hanno ID e attributi univoci. I linguaggi di query come SQL possono essere applicati al data mining, al data warehouse e all'analisi dei dati.

Sintassi della definizione del cubo:

Define cube (cube-name)(dimension-list): (measure-list)

I cubi vengono distribuiti per indirizzare gli avvisi a vari livelli e il tempo di risposta per rispondere alla query è minimo. È disponibile come design pre-costruito e applicabile nelle situazioni richieste. La creazione dello schema a stella è molto semplice ed efficiente da applicare ed è anche adattabile. Il completamento della tabella dei fatti e della tabella dimensionale è obbligatorio, che a sua volta forma come stella e può essere formato utilizzando query SQL o l'esecuzione di codice. Questo design è realizzato per una migliore comprensione e un facile recupero dei dati.

Caratteristiche dello schema a stella

1. Lo schema a stella fornisce aggregazioni e calcoli rapidi come gli articoli totali venduti e le entrate delle entrate ottenute alla fine di ogni mese. Questi dettagli e processi possono essere filtrati in base ai requisiti inquadrando le query appropriate.

2. Ha la capacità di filtrare i dati da dati normalizzati e fornire esigenze di data warehousing. Le informazioni associate della tabella normalizzata sono raggruppate in una scheda a più dimensioni. Viene generata una chiave univoca per ciascuna tabella dei fatti per identificare ogni riga.

3. La Tabella dei fatti è la misurazione di eventi specifici inclusi i valori numerici finiti ed è costituita da chiavi esterne relative alle tabelle dimensionali. Questa tabella è inquadrata con valori di fatti a livello atomico e consente di memorizzare più record alla volta. Esistono tre diversi tipi di tabella dei fatti.

4. Le tabelle dei fatti delle transazioni sono costituite da dati su eventi specifici come eventi festivi, eventi di vendita.

5. Registrazione dei fatti per determinati periodi come le informazioni sull'account alla fine di ogni trimestre.

6. Le tabelle con aggregazione rapida per un determinato periodo sono chiamate tabelle di accumulazione istantanea.

7. Le tabelle dimensionali forniscono dati dettagliati sugli attributi, i record trovati nella tabella dei fatti. La tabella delle dimensioni può avere varie funzioni. Le tabelle dimensionali vengono utilizzate principalmente come Tabella dimensionale data e ora, Ordine e ordine prodotto Tabella dimensionale, Dipendente e dettagli conto Tabella dimensionale, Geografia e tabella dimensionale località. Queste tabelle sono assegnate con un singolo tipo di dati intero che è la chiave primaria duplicata.

8. L'utente può progettare la sua tabella in base alle esigenze. Ad esempio, se ha bisogno di una tabella dimensionale di vendita con chiave prodotto e cliente, chiave data e ora, la chiave delle entrate generate dal reddito. Se l'uomo d'affari incornicia una tabella dimensionale del prodotto con attributi chiave come colore, data dell'articolo acquistato, chiave promozionale e chiave cliente.

vantaggi

  • È formato con una logica semplice e query facili da estrarre i dati dal processo transazionale.
  • Ha una logica di reporting comune implicita in modo dinamico.
  • Lo schema a stella può offrire un aumento delle prestazioni per le applicazioni di reporting.
  • Schema a stella progettato alimentando i cubi applicati dal processo di transazione online per creare e far funzionare i cubi in modo efficace.

svantaggi

  • Ha un'alta integrità e uno stato de-normalizzato elevato. Se l'utente non riesce ad aggiornare i valori, l'intero processo verrà compresso. Le protezioni e la sicurezza non sono affidabili fino al limite. Non è flessibile come un modello analitico e non estende il suo supporto efficiente a molte relazioni.
  • Lo schema a stella è distribuito nel database per controllare il recupero più rapido dei dati. La query viene utilizzata per selezionare l'esigenza anziché cercare l'intero database. I dati filtrati e selezionati possono essere applicati in diversi casi. Quindi questo schema a stella è un modello semplice che viene adottato facilmente.

Articolo raccomandato

Questa è una guida a Cos'è Star Schema? Qui discutiamo l'introduzione allo schema stellare e le sue caratteristiche insieme a vantaggi e svantaggi. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -

  1. Panoramica della tabella dei fatti
  2. Star Schema vs Snowflake Schema | Le migliori differenze
  3. Modellazione del data warehouse con tipi
  4. Database AWS con vantaggi
  5. Pipeline di dati AWS

Categoria: