Le 12 migliori domande e risposte sull'intervista ETL (Aggiornamento per il 2019)

Sommario:

Anonim

Introduzione alle domande e risposte dell'intervista ETL

ETL sta per Extract-Transform-Load. Si tratta di una base di sistema di Data warehouse, in cui i dati vengono estratti dalle diverse fonti e quindi i dati vengono trasformati in cui i dati vengono applicati o elaborati in modo da rendere la qualità, la coerenza dei dati in un formato di presentazione appropriato e infine il i dati vengono caricati in Data Warehouse in formato di presentazione in modo che possa aiutare l'utente finale a ottenere facilmente le informazioni e prendere una decisione.

Di seguito sono riportate le principali domande di intervista ETL 2019 che vengono poste frequentemente in un'intervista

Se stai cercando un lavoro correlato a ETL, devi prepararti per le domande di intervista ETL 2019. Anche se ogni colloquio è diverso e anche la portata di un lavoro è diversa, possiamo aiutarti con le migliori domande e risposte sull'intervista ETL, che ti aiuteranno a fare il salto e ottenere il successo nel tuo colloquio.

Parte 1 - Domande di intervista ETL (di base)

Questa prima parte tratta le domande e le risposte di base dell'intervista ETL

1. Espandere il sistema ETL nel Data warehouse? Spiegare

Risposta:
Il sistema Extract-Transform-Load (ETL) è la base del data warehouse. Un sistema ETL correttamente progettato estrae i dati dai sistemi di origine, applica standard di qualità e coerenza dei dati, conferma i dati in modo che possano essere utilizzate insieme fonti separate e infine fornisce i dati in un formato pronto per la presentazione in modo che gli sviluppatori di applicazioni possano creare applicazioni e utenti finali può prendere decisioni.

2. Il significato del sistema ETL nel data warehouse?

Risposta :
Rimuove gli errori e corregge i dati mancanti. Fornisce misure documentate di fiducia nei dati. Cattura il flusso di dati transnazionali per la custodia. Regola i dati da più fonti da utilizzare insieme. Struttura i dati per essere utilizzabili dagli strumenti dell'utente finale.

3. Qual è il processo quotidiano nel sistema ETL?

Risposta :
Costruire la suite di sviluppo / test / produzione dei processi ETL. Comprendere i compromessi di varie strutture di dati di back-room, inclusi file flat, schemi normalizzati, schemi XML e schemi a stella (dimensionali). Analizzare ed estrarre i dati di origine. Costruire un sottosistema di pulizia dei dati completo. Strutturare i dati in schemi dimensionali per la consegna più efficace agli utenti finali, strumenti di business intelligence, strumenti di data mining, cubi OLAP e applicazioni analitiche. Fornire i dati in modo efficace a data warehouse altamente centralizzati e profondamente distribuiti utilizzando le stesse tecniche. Ottimizza l'intero processo ETL per prestazioni ottimali.

Passiamo alle prossime domande di intervista ETL.

4. Formati di dati nel sistema ETL?

Risposta :
Esistono vari formati di dati in ETL, alcuni dei quali sono file flat, set di dati XML, tabelle di lavoro DBMS indipendenti, schemi entità / relazione (E / R) normalizzati e modelli di dati dimensionali.

5. Profilazione dei dati nel sistema ETL?

Risposta :
La profilazione dei dati è un esame sistematico della qualità, portata e contesto di un'origine dati per consentire la costruzione di un sistema ETL. Ad un estremo, un'origine dati molto pulita che è stata ben mantenuta prima che arrivi al data warehouse richiede una trasformazione minima e un intervento umano per caricare direttamente nelle tabelle delle dimensioni finali e nelle tabelle dei fatti.

6. Che cos'è un validatore ETL?

Risposta :
ETL Validator è uno strumento di test dei dati che semplifica notevolmente i test dei progetti di integrazione dei dati, data warehouse e migrazione dei dati. Si avvale della nostra architettura ELV brevettata per estrarre, caricare e convalidare i dati da origini dati come database, file flat, XML, Hadoop e sistemi BI.

Parte 2 - Domande di intervista ETL (avanzate)

Diamo ora un'occhiata alle domande di intervista ETL avanzate.

7. Quali sono le operazioni nel sistema ETL?

Risposta :
Le tre operazioni seguenti: Estrae i dati dal sistema transnazionale che può essere un Oracle, Microsoft o qualsiasi altro database relazionale, trasforma i dati eseguendo operazioni di pulizia dei dati. Un carico è un processo di scrittura dei dati nel database di destinazione.

8. Denominare alcuni degli strumenti ETL maggiormente utilizzati sul mercato?

Risposta:
Esistono vari strumenti ETL utilizzati sul mercato, ma alcuni degli strumenti ETL preferibilmente umidi
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• Gestione dei dati SAS.
• Power Center Informatica.
• Repertorio elisir per dati ETL.
• Data Migrator (IBI)
• SQL Server Integration Services (SSIS)

9. Quali sono i ruoli e le responsabilità del team ETL?

Risposta:
I ruoli del team ETL ai massimi livelli sono di creare la back room del data warehouse.
• Fornire i dati nel modo più efficace agli strumenti per l'utente finale
• Aggiungere valore ai dati nelle fasi di pulizia e conformità
• Proteggere e documentare la discendenza di dati
• Estrazione dei dati dalle fonti originali
• Assicurazione della qualità e dati di pulizia
• Conformare le etichette e le misure nei dati da raggiungere
• coerenza tra le fonti originali
• Fornitura di dati in un formato fisico che può essere utilizzato dagli strumenti di query,
• Scrittori di report e dashboard.

Passiamo alle prossime domande di intervista ETL.

10. Qual è il ruolo dell'analisi dell'impatto nel sistema ETL?

Risposta:
L'analisi dell'impatto esamina i metadati associati a un oggetto (in questo caso una tabella o colonna) e determina cosa è influenzato da una modifica nella sua struttura o contenuto. La modifica degli oggetti di gestione temporanea dei dati può interrompere i processi cruciali per il corretto caricamento del data warehouse. Consentire modifiche ad hoc agli oggetti di gestione temporanea dei dati è dannoso per il successo del progetto. Dopo aver creato una tabella nell'area di gestione temporanea, è necessario eseguire un'analisi di impatto prima di apportare eventuali modifiche. Molti produttori di strumenti ETL forniscono funzionalità di analisi dell'impatto, ma questa funzionalità viene spesso trascurata durante la prova di concetto del prodotto ETL perché è una funzione di back-room e
Non molto importante fino a quando il data warehouse è attivo e funzionante e inizia a evolversi.

11. Come si elabora il file flat a lunghezza fissa?

Risposta:
Un layout di file a lunghezza fissa dovrebbe includere il nome del file, dove inizia il campo; la sua lunghezza; e il suo tipo di dati (di solito testo o numero). A volte viene fornita la posizione finale. In caso contrario, è necessario calcolare la posizione finale di ciascun campo in base alla posizione iniziale e alla lunghezza, se richiesto dallo strumento ETL. Nella maggior parte degli strumenti ETL, molto probabilmente è necessario inserire manualmente il layout del file flat una volta. Dopo aver inserito il layout, lo strumento memorizza il layout e si aspetta lo stesso layout ogni volta che interagisce con il file flat effettivo. Se il layout del file cambia o i dati si spostano dalle posizioni assegnate, il processo ETL deve essere programmato per fallire. Quando si elaborano file flat di lunghezza fissa, provare a verificare che le posizioni dei dati nel file siano accurate. Un rapido controllo per convalidare le posizioni è testare qualsiasi campo di data (o ora) per assicurarsi che sia una data valida. Se le posizioni vengono spostate, molto probabilmente il campo della data contiene caratteri alfa o numeri illogici. Altri campi con domini molto specifici possono essere testati allo stesso modo. XML offre capacità di convalida più concrete. Se la convalida o la coerenza dei dati è un problema, provare a convincere il fornitore di dati a consegnare i dati in formato XML.

12.Perché ETL in tempo reale nel data warehouse?

Risposta:
Il data warehouse doveva fornire una serie costante di dati ai decisori aziendali, fornendo un piano informativo affidabile su cui basarsi. Per i report aggiornati al momento su un database scintillante, gli utenti aziendali sono stati indirizzati alle applicazioni di produzione che gestiscono l'azienda. Pertanto, gli utenti dovevano andare al data warehouse per avere un quadro storico di ciò che è accaduto nel business a partire da ieri e dovevano guardare attraverso molti sistemi OLTP per un quadro di ciò che stava accadendo oggi. Gli utenti aziendali non hanno mai accettato completamente questa divisione. Naturalmente i data warehouse necessitano assolutamente di flussi di informazioni sui clienti costanti da un'operazione, ma sempre più sistemi operativi si basano sull'arricchimento delle informazioni dei clienti del data warehouse. Pertanto, è prevedibile che le organizzazioni abbiano iniziato a esplorare alternative architettoniche in grado di supportare scenari di integrazione più generalizzati spostando i dati operativi tra le applicazioni e contemporaneamente dentro e fuori il magazzino con urgenza sempre maggiore.

Articoli consigliati

Questa è stata una guida all'elenco delle domande e risposte sull'intervista ETL in modo che il candidato possa reprimere facilmente queste domande sull'intervista ETL. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Azure Paas vs Iaas - Funzionalità
  2. 9 Incredibile MapReduce Intervista Domande e risposte
  3. Le 11 domande e risposte più utili per l'intervista a RDBMS
  4. 10 domande di intervista PHP più impressionanti per esperti
  5. Conoscere le 5 principali domande e risposte utili per l'intervista a DBA