Ab initio Intervista Domande e risposte

Quindi hai finalmente trovato il lavoro dei tuoi sogni in Ab initio ma ti stai chiedendo come decifrare l'intervista di Ab initio e quali potrebbero essere le probabili domande di intervista di Ab initio per il 2018. Ogni intervista è diversa e anche la portata di un lavoro è diversa. Tenendo presente questo, abbiamo progettato le domande e le risposte per l'intervista Ab initio più comuni per il 2018 per aiutarti a ottenere il successo nel tuo colloquio.

Di seguito sono riportate le principali domande di intervista di Ab initio che vengono poste frequentemente in un'intervista. Queste domande di intervista sono divise in due parti:

Parte 1 - Ab initio Interview Questions (Basic)

Questa prima parte copre le domande e le risposte di intervista di base Ab initio.

1. Quali sono i componenti o le funzioni disponibili in ab initio?

Risposta:
I componenti principali di ab initio sono qui sotto,

ComponenteScopo
dedupPer rimuovere i duplicati
AderirePer unire più set di dati di input in base a un valore chiave comune.
OrdinareQuesto componente riordina i dati. Prende l'ordine di confronto e scarica i dati in memoria
FiltroQualsiasi rimozione condizionale dei dati.
ReplicareQuesto componente è principalmente per il parallelismo in quanto una copia aggiuntiva dei dati è utile mentre tutti gli altri nodi non sono disponibili.
mergeQuesto componente serve a combinare più dati di input.

2. Quali sono i tipi di elaborazione parallela?

Risposta:
Queste sono le domande frequenti sull'intervista di Ab initio poste in un'intervista. Diversi tipi di elaborazione parallela sono,

  1. Parallelismo dei componenti
  2. Parallelismo dei dati
  3. Parallelismo della conduttura

Parallelismo dei componenti: un'applicazione con più componenti in esecuzione contemporaneamente sul sistema. Ma i dati sono separati. Ciò si ottiene attraverso l'elaborazione parallela a livello di componente.

Parallelismo dei dati: i dati vengono suddivisi in segmenti ed eseguono le operazioni contemporaneamente. Questo tipo di processo si ottiene utilizzando il parallelismo dei dati

Parallelismo della pipeline: un'applicazione con più componenti ma in esecuzione sullo stesso set di dati. Questo utilizza il parallelismo della pipeline.

3. Qual è il modo diverso di realizzare le partizioni?

Risposta:
Esistono diversi modi per eseguire le partizioni.

partizioniDescrizione
EspressioneDivisione dei dati secondo il linguaggio di manipolazione dei dati.
ChiaveRaggruppamento dei dati per chiavi specifiche
Bilanciamento del caricoBilanciamento del carico dinamico
PercentualeSeparare i dati in cui la dimensione dell'output è sulle frazioni di 100
GammaDividi uniformemente i dati in base a una chiave e un intervallo tra i nodi
Round robinDistribuire uniformemente i dati in blocchi tra le partizioni di output.

Passiamo alla prossima intervista di Ab initio Domande.

4. Che cos'è un sistema multifile?

Risposta:
Multifile è un insieme di directory su nodi diversi in un cluster. Possiedono una struttura di directory identica. Il sistema multifile porta a prestazioni migliori in quanto è l'elaborazione parallela in cui i dati risiedono su più dischi.

Viene creato con la partizione di controllo su un nodo e le partizioni dati sugli altri nodi per distribuire l'elaborazione al fine di migliorare le prestazioni.

5. Differenza tra Hadoop e Ab Initio?

Risposta:

HadoopDall'inizio
Open sourceSoftware proprietario
Elaborazione parallela tramite mappatori e riduttoriArchitettura di elaborazione parallela
Qualsiasi varietà di dati è più adatta quiIdeale per le implementazioni EDW tradizionali
La tolleranza ai guasti è stata raggiuntaLa tolleranza ai guasti non è stata raggiunta
MapReduce è controllato su qualsiasi componente o funzioneComponenti come join, group, sort sono facili

eseguita

Economico come open source e può provare qualsiasi caso d'uso aziendale.Costoso e applicabile su un business case di alto valore a causa del costo
Componenti liberamente accoppiati in cui sono costruite funzioni personalizzateStrettamente accoppiati tra i componenti poiché sono altamente raccomandati in base al caso d'uso aziendale.

Parte 2 - Domande di intervista Ab initio (Avanzate)

Diamo ora un'occhiata alle domande avanzate sull'intervista di Ab initio.

6. Che tipo di layout supporta Ab initio?

Risposta:

  • Supporta layout seriali e paralleli.
  • Un layout grafico supporta sia layout seriali che paralleli alla volta.
  • Un sistema multi-file è un sistema parallelo a 4 vie
  • Un componente in un sistema grafico può eseguire un sistema parallelo a 4 vie.

7. Qual è la relazione tra Enterprise metadata environment (EME), l'ambiente di sviluppo grafico (GDE) e il sistema cooperativo?

Risposta:
Sistema operativo: funziona sopra il sistema operativo e questo è fornito da ab initio e costituisce la base per tutti i processi Ab Initio. I comandi aerei sono una delle funzionalità che possono essere installate su diversi sistemi operativi come UNIX, Linux, IBM ecc

Queste sono le seguenti funzionalità che offre,
- Gestisce ed esegue i grafici Ab Initio e controlla i processi ETL
- Fornire le estensioni
- Monitoraggio e debug dei processi ETL
- Gestione dei metadati e interazione con l'EME

GDE: è un componente di progettazione e viene utilizzato per eseguire i grafici ab initio.

I grafici sono formati dai componenti (predefiniti o definiti dall'utente), dai flussi e dai parametri. Fornisce il processo ETL in Ab Initio rappresentato da grafici.

Possibilità di eseguire, eseguire il debug dei processi dei log di processo e tracciare i log di esecuzione

Enterprise Meta-Environment (EME): è un ambiente per l'archiviazione e anche la gestione dei metadati (metadati sia aziendali che tecnici). È possibile accedere ai metadati dall'ambiente di sviluppo grafico e anche dal browser Web o dalla riga di comando cooperante. È un repository ab initio per qualsiasi segnaposto.

Passiamo alle prossime domande dell'intervista ad Ab initio.

8. Come vengono elaborati i dati e quali sono i fondamenti di questo approccio?

Risposta:
Ci sono alcune attività che richiedono la raccolta dei dati e la cosa migliore da elaborare dipende in gran parte dalle stesse in molti casi. Prima di elaborare i dati deve risiedere su alcuni segnaposto come una memoria ben definita. Questo compito dipende da alcuni dei principali fattori che sono

1. Raccolta di dati
2. Presentazione
3. Risultati finali
4.Analysis
5.Sorting

9. Qual è la differenza tra il partizionamento con chiave e round robin?

Risposta :
Queste sono le domande avanzate sull'intervista di Ab Initio poste in un'intervista. Partizione per chiave
In questo, dobbiamo specificare la chiave in base alla quale si verificherà la partizione. Risulta in dati ben bilanciati a causa delle partizioni basate su chiave. È utile per la chiave dipendente
parallelismo.
Partizione per round robin: in questo, distribuendo i dati in modo uniforme in blocchi di dimensioni di blocco, i record vengono partizionati in modo sequenziale attraverso la partizione di output. Non è la chiave
basato e risultati sono dati ben bilanciati soprattutto con una dimensione del blocco di 1. È utile per
registrare un parallelismo indipendente.

10. Come migliorare le prestazioni di un grafico?

Risposta :
Esistono molti modi in cui è possibile migliorare le prestazioni del grafico.
1) Ridurre l'utilizzo di più componenti in determinate fasi.
2) Utilizzare un valore raffinato e ben definito di valori core massimi per ordinare e unire i componenti
3) Ridurre al minimo l'uso di funzioni di espressione regolare come re_index nelle funzioni di trasferimento
4) Ridurre al minimo il componente join ordinato e, se possibile, sostituirli con join / hash join in memoria
5) Utilizzare solo i campi obbligatori per ordinare, riformattare, unire i componenti
6) Utilizzo di Fase o buffering del flusso durante i casi di unione o unione ordinata
7) Usa hash join se i due set di input sono piccoli altrimenti è meglio scegliere il join ordinato per le enormi dimensioni di input
8) Per set di dati di grandi dimensioni, non utilizzare la trasmissione come partizionata
9) Ridurre il numero di componenti di ordinamento durante l'elaborazione.
10) Evitare di ripartizionare i dati inutilmente

Articolo raccomandato

Questa è stata una guida all'elenco delle domande e risposte dell'intervista di Ab initio, in modo che il candidato possa reprimere facilmente queste domande sull'intervista di Ab initio. Qui in questo post, abbiamo studiato le principali domande di intervista di Ab initio che vengono spesso poste nelle interviste. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Domande di intervista per Android - Le 10 domande utili principali
  2. Domande per le interviste sulle statistiche | Utile e più richiesto
  3. Domande di intervista a Minitab - Le 7 principali domande utili da imparare
  4. Domande e risposte sull'intervista di Splunk che dovresti sapere