Introduzione alle domande e risposte di intervista sui test ETL

Le informazioni e i dati aziendali sono le cose più importanti di qualsiasi azienda al giorno d'oggi. L'analisi di tutti i dati e l'integrazione di questi risultati ha acquisito un enorme potenziale sul mercato. Esistono molti strumenti di test ETL che aiutano a organizzare e semplificare un processo. I test ETL devono avere una strategia ben definita che semplifichi l'intero processo. Il processo include l'analisi dei requisiti, la convalida e la stima dei test, la pianificazione e la progettazione dei test dell'ambiente di test, la preparazione e l'esecuzione dei dati di test e la creazione di un rapporto di riepilogo. Il processo di estrazione, trasformazione e caricamento richiede un sacco di analisi e, di conseguenza, necessita di test adeguati. Le seguenti domande ti daranno un'idea di tutte le domande che possono essere poste in un'intervista.

Ora, se stai cercando un lavoro correlato ai test ETL, allora devi prepararti per le domande di intervista per i test ETL 2019. È vero che ogni colloquio è diverso secondo i diversi profili professionali. Qui, abbiamo preparato le importanti domande e risposte sull'intervista ai test ETL che ti aiuteranno ad avere successo nel tuo colloquio.

In questo articolo di domande di intervista di test ETL del 2019, presenteremo le 10 domande di intervista di test ETL più importanti e utilizzate di frequente. Queste domande sono divise in due parti:

Parte 1 - Domande di intervista ai test ETL (di base)

Questa prima parte tratta le domande e le risposte di base dell'intervista ai test ETL

Q1. Che cos'è ETL e spiega perché sono richiesti i test ETL?

Risposta:
ETL è un'abbreviazione per estrarre, trasformare e caricare. Questo processo viene eseguito per i dati utilizzati per analizzare e prevedere il futuro di qualsiasi azienda. Estrarre significa individuare i dati e rimuovere dal file di origine tutti i dati. La trasformazione è il processo di trasporto dei dati in qualsiasi file richiesto e caricamento di questo file nel sistema di destinazione nel formato richiesto o applicabile. La necessità di test ETL sorge in quanto dobbiamo tenere traccia dei dati che vengono trasformati da un sistema a un altro. Dobbiamo anche verificare l'efficienza e la velocità dell'intero processo. I test ETL assicurano che tutti i dati che vengono implementati siano conformi ai requisiti del cliente e forniscono l'output necessario.

Q2. Qual è la chiave surrogata?

Risposta:
Una chiave surrogata può essere definita come un identificatore univoco che può essere utilizzato per modellare un'entità o un oggetto. Può essere una chiave univoca il cui significato è essere un identificatore primario di qualsiasi oggetto o entità che non è derivato da nessun altro database e non può essere utilizzato come chiave primaria. La chiave surrogata può essere un numero sequenziale univoco. Una chiave surrogata non è sempre una chiave primaria e di solito dipende dal database. Sceglie se il database è corrente o di tipo temporale. Quando un database è corrente, memorizza i dati correnti e deve avere una relazione uno a uno nei dati. Quando si tratta del database temporale, può esserci una relazione molti-a-uno tra le chiavi primaria e surrogata.

Passiamo alle prossime domande di intervista per i test ETL.

Q3. Spiegare cos'è il partizionamento e spiegare i tipi di partizioni?

Risposta:
Al fine di migliorare le prestazioni, le transazioni presenti sono suddivise e questo processo è noto come partizionamento. Il partizionamento aiuta Informatica Server a creare connessioni diverse alle sue varie fonti. I tipi di partizioni sono:
Partizione Round Robin: tutti i dati sono distribuiti uniformemente tra tutte le partizioni. In tutte queste partizioni quando il numero di righe è approssimativamente uguale, viene utilizzato questo partizionamento.
Partizionamento hash: in questo partizionamento, tutte le chiavi di partizionamento sono raggruppate tra le partizioni applicano una funzione hash. Viene utilizzato per garantire che il gruppo di righe elaborato con la stessa chiave di partizionamento abbia le stesse partizioni.

Q4. Quali sono i modi per aggiornare una tabella quando si utilizza SSIS?
Risposta:
Queste sono le domande comuni sull'intervista ai test ETL poste in un'intervista. Di seguito sono riportate le diverse tabelle supportate da ETL Testing. Per aggiornare una tabella utilizzando SSIS è possibile eseguire le seguenti operazioni:

  • Usa il comando SQL
  • Utilizzare una tabella di gestione temporanea per memorizzare i dati dello stage
  • Utilizzare la cache per archiviare dati che utilizzano spazio limitato e richiedono un aggiornamento frequente
  • Utilizzare gli script per pianificare le attività
  • Utilizzare il nome completo del database per l'aggiornamento di MSSQL.

Q5. Cos'è un'area di stadiazione e qual è il suo scopo?

Risposta:
La gestione temporanea dei dati è in genere una raccolta di processi utilizzata per preparare i dati di sistema di origine. Questi dati vengono quindi caricati nel data warehouse. La gestione temporanea dei dati include i seguenti passaggi:

Estrazione e trasformazione dei dati di origine in cui i dati vengono ristrutturati in base alle esigenze del cliente. La trasformazione dei dati include il processo di pulizia dei dati e trasformazioni di valore. Implica anche il processo di assegnazione delle chiavi surrogate.

Parte 2 - Domande di intervista ai test ETL (Avanzate)

Diamo ora un'occhiata alle avanzate domande di intervista sui test ETL.

Q6. Spiegare la differenza tra test ETL e test del database?

Risposta:
La differenza tra test ETL e test del database è la seguente:

  • I test ETL si concentrano solitamente sui report di business intelligence mentre i test sui database comportano un'integrazione di dati.
  • Gli strumenti utilizzati per i test ETL sono Cognos, QuerySurge e Informatica, mentre QTP e selenio vengono utilizzati per l'automazione dei test sui database.
  • L'analisi dei dati in ETL ha un potenziale impatto sui dati. Il normale test del database ha impatti sull'implementazione dell'architettura
  • I test ETL hanno deformato i dati mentre i test del database utilizzano dati normalizzati.

Q7. Che cos'è un fatto? Spiegare i tipi di fatti?

Risposta:
Un fatto è una componente centrale di un modello multidimensionale che consiste nelle misure che devono essere analizzate. I fatti sono correlati a dimensioni diverse.

I tipi di fatti sono i seguenti:
Additivo: una misura può eseguire calcoli aritmetici utilizzando tutte o alcune dimensioni.
Semi-additivo: in questo tipo, una misura può eseguire calcoli aritmetici usando solo alcune dimensioni.
Non additivo: una misura non può partecipare alle funzioni aritmetiche utilizzando la dimensione.

Passiamo alle prossime domande di intervista per i test ETL.

Q8. Qual è la differenza tra la chiave surrogata e la chiave primaria?

Risposta:
Si dice che una chiave surrogata abbia numeri generati in sequenza che non hanno alcun significato. Viene utilizzato solo per identificare le righe presenti in modo univoco. La chiave primaria, d'altra parte, viene utilizzata per identificare le righe in modo univoco. È visibile agli utenti e può essere modificato secondo i requisiti.

Q9. Definire il termine dimensione che cambia lentamente.
Risposta:
Queste sono le domande di intervista per i test ETL più poste in un'intervista. Le dimensioni che cambiano lentamente sono quelle che tendono a cambiare molto lentamente. I dati presenti in queste dimensioni sono lenti a cambiare. Esempio di questa dimensione può essere una città o un dipendente.
Le righe in questi dati nelle dimensioni possono essere sostituite completamente senza avere alcun track record oppure è possibile creare o inserire una nuova riga. Usando questo si possono anche tenere traccia delle modifiche lente.

Q10. Spiegare il concetto di eliminazione dei dati?

Risposta:
L'eliminazione di una parte di dati dal data warehouse è nota come eliminazione dei dati. Questi dati che vengono eliminati sono generalmente dati con righe con valori nulli o spazi che devono essere ripuliti. In questo processo di pulizia di questo tipo di immondizia o spazzatura, vengono eseguiti i valori.

Articolo raccomandato

Questa è stata una guida per elencare le domande e le risposte alle interviste sui test ETL in modo che il candidato possa facilmente reprimere queste domande sui colloqui sui test ETL. Qui in questo post, abbiamo studiato le principali domande di intervista sui test ETL che vengono spesso poste nelle interviste. Puoi anche consultare i seguenti articoli per saperne di più -

  1. 10 domande essenziali per l'intervista a Power Bi
  2. Domande sul colloquio con PowerShell - Molto utile
  3. Le 10 principali domande di intervista a MicroStrategy
  4. Domande di intervista a JIRA