Ab initio Intervista Domande e risposte
Quindi hai finalmente trovato il lavoro dei tuoi sogni in Ab initio ma ti stai chiedendo come decifrare l'intervista di Ab initio e quali potrebbero essere le probabili domande di intervista di Ab initio per il 2018. Ogni intervista è diversa e anche la portata di un lavoro è diversa. Tenendo presente questo, abbiamo progettato le domande e le risposte per l'intervista Ab initio più comuni per il 2018 per aiutarti a ottenere il successo nel tuo colloquio.Di seguito sono riportate le principali domande di intervista di Ab initio che vengono poste frequentemente in un'intervista. Queste domande di intervista sono divise in due parti:
Parte 1 - Ab initio Interview Questions (Basic)
Questa prima parte copre le domande e le risposte di intervista di base Ab initio.
1. Quali sono i componenti o le funzioni disponibili in ab initio?
Risposta:
I componenti principali di ab initio sono qui sotto,
Componente | Scopo |
dedup | Per rimuovere i duplicati |
Aderire | Per unire più set di dati di input in base a un valore chiave comune. |
Ordinare | Questo componente riordina i dati. Prende l'ordine di confronto e scarica i dati in memoria |
Filtro | Qualsiasi rimozione condizionale dei dati. |
Replicare | Questo componente è principalmente per il parallelismo in quanto una copia aggiuntiva dei dati è utile mentre tutti gli altri nodi non sono disponibili. |
merge | Questo componente serve a combinare più dati di input. |
2. Quali sono i tipi di elaborazione parallela?
Risposta:
Queste sono le domande frequenti sull'intervista di Ab initio poste in un'intervista. Diversi tipi di elaborazione parallela sono,
- Parallelismo dei componenti
- Parallelismo dei dati
- Parallelismo della conduttura
Parallelismo dei componenti: un'applicazione con più componenti in esecuzione contemporaneamente sul sistema. Ma i dati sono separati. Ciò si ottiene attraverso l'elaborazione parallela a livello di componente.
Parallelismo dei dati: i dati vengono suddivisi in segmenti ed eseguono le operazioni contemporaneamente. Questo tipo di processo si ottiene utilizzando il parallelismo dei dati
Parallelismo della pipeline: un'applicazione con più componenti ma in esecuzione sullo stesso set di dati. Questo utilizza il parallelismo della pipeline.
3. Qual è il modo diverso di realizzare le partizioni?
Risposta:
Esistono diversi modi per eseguire le partizioni.
partizioni | Descrizione |
Espressione | Divisione dei dati secondo il linguaggio di manipolazione dei dati. |
Chiave | Raggruppamento dei dati per chiavi specifiche |
Bilanciamento del carico | Bilanciamento del carico dinamico |
Percentuale | Separare i dati in cui la dimensione dell'output è sulle frazioni di 100 |
Gamma | Dividi uniformemente i dati in base a una chiave e un intervallo tra i nodi |
Round robin | Distribuire uniformemente i dati in blocchi tra le partizioni di output. |
Passiamo alla prossima intervista di Ab initio Domande.
4. Che cos'è un sistema multifile?
Risposta:
Multifile è un insieme di directory su nodi diversi in un cluster. Possiedono una struttura di directory identica. Il sistema multifile porta a prestazioni migliori in quanto è l'elaborazione parallela in cui i dati risiedono su più dischi.
Viene creato con la partizione di controllo su un nodo e le partizioni dati sugli altri nodi per distribuire l'elaborazione al fine di migliorare le prestazioni.
5. Differenza tra Hadoop e Ab Initio?
Risposta:
Hadoop | Dall'inizio |
Open source | Software proprietario |
Elaborazione parallela tramite mappatori e riduttori | Architettura di elaborazione parallela |
Qualsiasi varietà di dati è più adatta qui | Ideale per le implementazioni EDW tradizionali |
La tolleranza ai guasti è stata raggiunta | La tolleranza ai guasti non è stata raggiunta |
MapReduce è controllato su qualsiasi componente o funzione | Componenti come join, group, sort sono facili
eseguita |
Economico come open source e può provare qualsiasi caso d'uso aziendale. | Costoso e applicabile su un business case di alto valore a causa del costo |
Componenti liberamente accoppiati in cui sono costruite funzioni personalizzate | Strettamente accoppiati tra i componenti poiché sono altamente raccomandati in base al caso d'uso aziendale. |
Parte 2 - Domande di intervista Ab initio (Avanzate)
Diamo ora un'occhiata alle domande avanzate sull'intervista di Ab initio.
6. Che tipo di layout supporta Ab initio?
Risposta:
- Supporta layout seriali e paralleli.
- Un layout grafico supporta sia layout seriali che paralleli alla volta.
- Un sistema multi-file è un sistema parallelo a 4 vie
- Un componente in un sistema grafico può eseguire un sistema parallelo a 4 vie.
7. Qual è la relazione tra Enterprise metadata environment (EME), l'ambiente di sviluppo grafico (GDE) e il sistema cooperativo?
Risposta:
Sistema operativo: funziona sopra il sistema operativo e questo è fornito da ab initio e costituisce la base per tutti i processi Ab Initio. I comandi aerei sono una delle funzionalità che possono essere installate su diversi sistemi operativi come UNIX, Linux, IBM ecc
Queste sono le seguenti funzionalità che offre,
- Gestisce ed esegue i grafici Ab Initio e controlla i processi ETL
- Fornire le estensioni
- Monitoraggio e debug dei processi ETL
- Gestione dei metadati e interazione con l'EME
GDE: è un componente di progettazione e viene utilizzato per eseguire i grafici ab initio.
I grafici sono formati dai componenti (predefiniti o definiti dall'utente), dai flussi e dai parametri. Fornisce il processo ETL in Ab Initio rappresentato da grafici.
Possibilità di eseguire, eseguire il debug dei processi dei log di processo e tracciare i log di esecuzione
Enterprise Meta-Environment (EME): è un ambiente per l'archiviazione e anche la gestione dei metadati (metadati sia aziendali che tecnici). È possibile accedere ai metadati dall'ambiente di sviluppo grafico e anche dal browser Web o dalla riga di comando cooperante. È un repository ab initio per qualsiasi segnaposto.
Passiamo alle prossime domande dell'intervista ad Ab initio.
8. Come vengono elaborati i dati e quali sono i fondamenti di questo approccio?
Risposta:
Ci sono alcune attività che richiedono la raccolta dei dati e la cosa migliore da elaborare dipende in gran parte dalle stesse in molti casi. Prima di elaborare i dati deve risiedere su alcuni segnaposto come una memoria ben definita. Questo compito dipende da alcuni dei principali fattori che sono
1. Raccolta di dati
2. Presentazione
3. Risultati finali
4.Analysis
5.Sorting
9. Qual è la differenza tra il partizionamento con chiave e round robin?
Risposta :
Queste sono le domande avanzate sull'intervista di Ab Initio poste in un'intervista. Partizione per chiave
In questo, dobbiamo specificare la chiave in base alla quale si verificherà la partizione. Risulta in dati ben bilanciati a causa delle partizioni basate su chiave. È utile per la chiave dipendente
parallelismo.
Partizione per round robin: in questo, distribuendo i dati in modo uniforme in blocchi di dimensioni di blocco, i record vengono partizionati in modo sequenziale attraverso la partizione di output. Non è la chiave
basato e risultati sono dati ben bilanciati soprattutto con una dimensione del blocco di 1. È utile per
registrare un parallelismo indipendente.
10. Come migliorare le prestazioni di un grafico?
Risposta :
Esistono molti modi in cui è possibile migliorare le prestazioni del grafico.
1) Ridurre l'utilizzo di più componenti in determinate fasi.
2) Utilizzare un valore raffinato e ben definito di valori core massimi per ordinare e unire i componenti
3) Ridurre al minimo l'uso di funzioni di espressione regolare come re_index nelle funzioni di trasferimento
4) Ridurre al minimo il componente join ordinato e, se possibile, sostituirli con join / hash join in memoria
5) Utilizzare solo i campi obbligatori per ordinare, riformattare, unire i componenti
6) Utilizzo di Fase o buffering del flusso durante i casi di unione o unione ordinata
7) Usa hash join se i due set di input sono piccoli altrimenti è meglio scegliere il join ordinato per le enormi dimensioni di input
8) Per set di dati di grandi dimensioni, non utilizzare la trasmissione come partizionata
9) Ridurre il numero di componenti di ordinamento durante l'elaborazione.
10) Evitare di ripartizionare i dati inutilmente
Articolo raccomandato
Questa è stata una guida all'elenco delle domande e risposte dell'intervista di Ab initio, in modo che il candidato possa reprimere facilmente queste domande sull'intervista di Ab initio. Qui in questo post, abbiamo studiato le principali domande di intervista di Ab initio che vengono spesso poste nelle interviste. Puoi anche consultare i seguenti articoli per saperne di più -
- Domande di intervista per Android - Le 10 domande utili principali
- Domande per le interviste sulle statistiche | Utile e più richiesto
- Domande di intervista a Minitab - Le 7 principali domande utili da imparare
- Domande e risposte sull'intervista di Splunk che dovresti sapere