Introduzione al Data Warehousing Intervista Domande e risposte
Che cos'è un data warehouse?
Il data warehouse è un repository centrale che archivia dati eterogenei da varie fonti. I dati in un magazzino possono essere utilizzati per report analitici, query strutturate o ad hoc e utilizzati nel processo decisionale. Il processo di raccolta di dati da più origini e archiviazione nel repository centrale è chiamato Data Warehousing.
I dati possono essere di diversi tipi come dati strutturati, semi-strutturati o non strutturati. I dati provenienti da varie origini vengono elaborati, trasformati e ingeriti in un unico database chiamato data warehouse. Gli utenti possono accedere a questi dati elaborati nel data warehouse tramite vari strumenti come strumenti di Business Intelligence, client SQL, fogli di calcolo e molti altri strumenti. Questi dati aiutano a eseguire operazioni di data mining che aiutano a trovare qualche modello nei dati.
Ora, se stai cercando un lavoro correlato al Data Warehousing, devi prepararti per le Domande di intervista sul Data Warehousing 2019. È vero che ogni colloquio è diverso secondo i diversi profili professionali. Qui, abbiamo preparato le importanti domande e risposte sul colloquio di Data Warehousing che ti aiuteranno ad avere successo nel tuo colloquio.
Ora cerchiamo di comprendere alcune delle importanti domande di intervista sul datawarehousing del 2019 che possono essere poste in un'intervista. Ma ciò non significa che queste siano le uniche domande che verranno poste in un'intervista, è necessario essere preparati a fondo su ogni argomento di cui stiamo discutendo qui. Queste domande sono divise in due parti:
Parte 1 - Domande sul colloquio di Data Warehousing (di base)
Questa prima parte tratta le domande e le risposte di intervista di base sul data warehousing
Q1. Che cos'è il data warehouse?
Risposta:
Il data warehousing è un processo di raccolta di dati da varie fonti elaborandoli e archiviandoli in un enorme database, quindi i dati elaborati potrebbero essere utilizzati per vari scopi come report analitici, business intelligence o data mining ecc. L'idea alla base del data warehouse è nulla ma memorizzando enormi quantità di dati.
Q2. Differenza tra database e data warehouse?
Risposta:
Di seguito sono riportate le diverse tabelle supportate da Data Warehousing:
Banca dati | Data Warehouse |
Raccolta di dati utilizzati per l'archiviazione, l'accesso e il recupero | Raccolta di dati utilizzati per eseguire analisi |
Vincolato alla singola applicazione | Può essere utilizzato da più applicazioni |
Memorizza i dati normalizzati | I dati non devono essere normalizzati generalmente archiviati come dati denormalizzati |
Basato su ER e orientato all'applicazione | fiocco di neve o inizio basato sullo schema e orientato al soggetto |
Utilizzato per l'elaborazione delle transazioni | Utilizzato per la modellazione e l'analisi dei dati |
Passiamo alle prossime domande di intervista sul data warehouse
Q3. Quali sono le fasi del Data Warehousing?
Risposta:
Le fasi generali del data warehouse sono:
- Database operativo offline: i dati vengono copiati dal sistema operativo su un altro server per eseguire varie operazioni.
- Data Warehouse offline: i dati nel Data Warehouse vengono regolarmente aggiornati dal database operativo.
- Data Warehouse in tempo reale: Data Warehouse viene aggiornato quando si verifica una transazione nel sistema operativo.
- Data Warehouse integrato: Data Warehouse viene aggiornato continuamente quando viene eseguita una transazione sul sistema operativo.
Q4. Che cos'è Business Intelligence (BI)?
Risposta:
Queste sono le domande di intervista di base per il data warehouse poste in un'intervista. La BI è un processo basato sulla tecnologia per l'analisi dei dati e la presentazione di approfondimenti significativi agli utenti finali che aiuta a prendere decisioni migliori. La BI comprende vari strumenti che aiutano a comprendere le tendenze e i modelli dei dati nascosti nei dati. Alcuni degli strumenti ampiamente utilizzati sono SAP Business Intelligence, MicroStrategy, Science, Tableau e molti altri.
Q5. Quali sono i componenti di Data Warehouse?
Risposta:
Quattro componenti del data warehouse sono:
- Load Manager: esegue tutte le operazioni associate all'estrazione e al caricamento dei dati nel magazzino.
- Gestione magazzino: esegue le operazioni associate ai dati nel magazzino. Esegue operazioni come l'analisi dei dati per garantire coerenza, la creazione di indici e viste e molte altre operazioni.
- Gestione query: esegue tutte le operazioni relative alle query degli utenti. Le operazioni di questo componente sono query dirette alle tabelle appropriate.
- Strumento di accesso per l'utente finale: strumenti utilizzati dagli utenti finali per accedere ai dati. È classificato in diversi gruppi come
- Strumenti di segnalazione dei dati
- Strumenti di query
- Strumenti per lo sviluppo di applicazioni
- Strumenti EIS
- Strumenti OLAP e di data mining
Parte 2 - Domande sul colloquio di Data Warehousing (Avanzate)
Diamo ora uno sguardo alle domande avanzate di intervista sul data warehouse.
Q6. Cos'è la tabella delle dimensioni?
Risposta:
La tabella dimensionale in un data warehouse è una tabella in uno schema a stella. Le tabelle delle dimensioni vengono utilizzate per memorizzare le dimensioni o gli attributi che descrivono i dati nella tabella Fact. Ad esempio, la dimensione del prodotto potrebbe contenere il nome, la descrizione, il prezzo unitario, il peso, il colore e molti altri attributi. Il sistema generato la chiave viene utilizzato per identificare in modo univoco la riga nella tabella delle dimensioni. Questa chiave funge da chiave primaria nella tabella delle dimensioni e viene utilizzata come chiave esterna nella tabella dei fatti che consente di unire le due tabelle.
Q7. Cos'è la tabella dei fatti?
Risposta:
Una tabella dei fatti è la tabella centrale dello schema a stella, circondata da una tabella dimensionale di un data warehouse. La tabella dei fatti comprende le metriche quantitative o i fatti del processo aziendale. La tabella dei fatti funziona con una tabella delle dimensioni e memorizza i dati che devono essere analizzati. La tabella dei fatti contiene una colonna di chiave esterna che funge da chiave primaria nella tabella delle dimensioni che consente di unire tra queste due tabelle.
Passiamo alle prossime domande di intervista sul data warehouse
Q8. Che cos'è Data Mart?
Risposta:
Data Mart è un sottoinsieme del data warehouse che di solito contiene un set specifico di dati relativi a una specifica linea di business. Il Data Mart è di piccole dimensioni e utilizzato per interrogare o analizzare un insieme specifico di dati, ad esempio dati relativi a "Vendite", "Clienti", "Ordine" ecc.
Q9. Che cos'è l'archivio dati operativi (ODS)?
Risposta:
Queste sono le domande di intervista per il data warehouse più frequenti in un'intervista. Un ODS è il tipo di database che archivia i dati utilizzati dai sistemi operativi prima di essere archiviati in un data warehouse. Funge da database intermedio. Un ODS contiene dati a breve termine mentre un data warehouse contiene dati storici.
Q10. Spiegare l'architettura del data warehouse.
Risposta:
Include le seguenti fasi:
- Livello origine dati: in questa fase, i dati vengono raccolti da varie fonti e archiviati in un database relazionale. I dati includono dati di social media, dati operativi, dati transazionali e molti altri.
- Livello di gestione temporanea dei dati: in questa fase i dati dal livello dell'origine dati vengono estratti ed elaborati poiché i dati provengono da varie origini e con formati diversi. I dati estratti saranno sottoposti a controlli di qualità e i risultati finali saranno dati puliti e organizzati che verranno caricati nel data warehouse.
- Livello di archiviazione dei dati: questo livello è il punto in cui i dati dell'area di gestione temporanea verranno archiviati come un unico repository centrale. A seconda dei requisiti aziendali, l'archiviazione può essere un data warehouse, un data mart o un Data Store operativo.
- Livello presentazione dati: questo livello viene utilizzato dagli utenti per accedere ai dati. Gli utenti possono eseguire varie query o eseguire alcune analisi per eseguire report.
Articolo raccomandato
Questa è stata una guida all'elenco delle domande e risposte dell'intervista di Data Warehousing in modo che il candidato possa facilmente reprimere queste domande di intervista di Data Warehousing. Qui in questo post, abbiamo studiato le principali domande di intervista di Data Warehousing che vengono spesso poste nelle interviste. Puoi anche consultare i seguenti articoli per saperne di più -
- Domande e risposte sul colloquio con RMAN
- Le 10 domande più importanti per l'intervista agli analisti di dati
- La maggior parte delle domande di intervista a Hibernate
- Domande sul colloquio con PowerShell
- Guida completa a Oracle Data Warehousing