Introduzione all'intervista a Pig Domande e risposte

Apache Pig è una piattaforma di alto livello per la quale viene utilizzata per creare programmi in esecuzione su Hadoop. La lingua del maiale è conosciuta come latino latino. Pig è scritto in Java ed è stato sviluppato dalla ricerca Yahoo e dalla base software Apache. La sua versione iniziale è avvenuta l'11 settembre 2008. Preparazione per un colloquio di lavoro in Maiale. Sono sicuro che vorresti conoscere le domande e le risposte più comuni sull'intervista con il maiale che ti aiuteranno a risolvere facilmente l'intervista con il maiale.

Di seguito è riportato l'elenco delle principali domande di intervista di maiale e le risposte in vostro soccorso. queste domande di intervista sono divise in due parti:

  • Parte 1 - Domande di intervista ai maiali (di base)
  • Parte 2 - Domande di intervista ai maiali (avanzate)

Parte 1 - Domande di intervista ai maiali (di base)

Questa prima parte copre le domande e le risposte di base dell'intervista a Pig

Q1.Qual è la differenza tra Map Reduce e Pig?

Risposta:
Map Reduce è un linguaggio compilato e l'efficienza del codice di Map-reduce è elevata e Pig è un linguaggio di scripting con minore efficienza del codice.

Q2. Cosa intendi per borsa in Maiale?

Risposta:
La raccolta di tuple è conosciuta come una borsa in un maiale.

Q3.Quali sono i tipi di dati complessi in Pig?

Risposta:
Mappa, Tuple e Borsa sono i tipi di dati complessi di Maiale.

Q4. Cosa è appiattito in Maiale?

Risposta:
Quando vogliamo rimuovere l'annidamento dai dati in tupla o borsa, usiamo Flatten.

Q5 Supponiamo di avere un nome file con abc.csv e che abbia l'attributo come id, nome, anno, valutazione, durata. Come caricherai questo file su un maiale?

Risposta:
movies = LOAD 'path of abc.csv' USING Pig Storage (', ') as (id, nome, anno, valutazione, durata);

Q6.Qual è la differenza tra PigLatin e HIVEQL?

Risposta:
HIVEQL è un linguaggio dichiarativo e PigLatin è una posta procedurale.

Passiamo alle prossime domande di intervista di maiale.

Q7 Cosa intendi per borsa interna e borsa esterna in maiale?

Risposta:
La relazione all'interno della sacca è riferita alla sacca interna e la normale relazione è nota come sacca esterna.

Q8.Qual è la differenza tra Gruppo e COGROUP?

Risposta:
L'operatore GROUP viene utilizzato per raggruppare i dati in un'unica relazione e COGROUP viene utilizzato per creare la relazione in GROUP e JOIN.

Q9.Qual è la differenza tra COUNT e COUNT_STAR?

Risposta:
La funzione COUNT non funziona con un valore NULL quando contiamo un elemento in un sacchetto ma COUNT_STAR considererà il valore NULL.

Q10. Quali sono gli operatori diagnostici disponibili in Apache Pig?

Risposta:
Operatore di discarica, Descrivi operatore, Spiega operatore, Illustra operatore.

D11 Cosa intendi per operatore UNION e SPLIT?

Risposta:
Utilizzando un operatore UNION possiamo unire i contenuti di due o più relazioni e un operatore SPILLED viene utilizzato per dividere la singola relazione in due o più relazioni.

D12.Come ottenere le prime 10 tuple dalla relazione R?

Risposta:
Utilizzando la funzione TOP ().

Passiamo alle prossime domande di intervista di maiale.

Q13.Quali sono le somiglianze tra Pig e Hive?

Risposta:
Pig usa PigLatin e Hive usano HiveQL entrambi converte i comandi in lavori MapReduce.

D14.Quali sono i diversi tipi di funzioni UDF di JAVA che sono supportati da Apache Pig?

Risposta:
Le funzioni algebriche, Eval e Filter sono i tipi di funzioni UDF.

Q15. Hai un file movies.txt nella directory HDFS con 1000 record. Vuoi vedere solo i primi 10 record dal file movies.txt. Come lo farai?

Risposta:
Innanzitutto, devi caricare il film.txt con il nome della relazione film:
movies = LOAD 'path of movies.txt' USING Pig Storage (', ') as (attributi);
Risultato = limite impiegato 10

Parte 2 - Domande di intervista ai maiali (avanzate)

Diamo ora un'occhiata alle domande avanzate di intervista di maiale.

D16: In che modo gli utenti interagiscono con Hadoop in Pig?

Risposta:
Usando grunt shell

D17: Pig supporta i comandi multilinea?

Risposta:

D18.Che cosa sono tutte le classi di statistiche in un pacchetto pigstats?

Risposta:
PigStats, JobStats, OutputStats, InputStats.

Q19.Che cos'è l'UDF?

Risposta:
La funzione che non è integrata nell'operatore ma può creare a livello di codice una funzione per far apparire la funzionalità.

D20: Spiega la distinzione tra maiuscole e minuscole in latino latino?

Risposta:
Le funzioni e i nomi delle relazioni fanno distinzione tra maiuscole e minuscole in latino latino, ma un nome o una parola chiave e un parametro non fanno distinzione tra maiuscole e minuscole.

D21: Che cos'è Grunt in Pig?

Risposta:
Grunt è un terminale di comando che è una shell interattiva in cui diamo il comando di Pig.

D22. Qual è il requisito di MapReduce nella programmazione Pig?

Risposta:
MapReduce è un motore di esecuzione.

Passiamo alle prossime domande di intervista di maiale.

Q23.Che cos'è il motore Pig?

Risposta:
Il motore di maiale fornisce l'ambiente di esecuzione per eseguire i programmi di maiale. Converte le operazioni del maiale in lavori MapReduce.

Q24.Quali sono le modalità di esecuzione di Pig?

Risposta:
Modalità locale: l'operazione suino verrà eseguita in JVM singola.
Modalità MapReduce: l'esecuzione del cluster Hadoop verrà eseguita.

D25.Quali sono le diverse funzioni Eval disponibili nel maiale?

Risposta:
AVG, CONCAT, MAX, MIN, SM, SIZE, COUNT sono diverse funzioni EVAL suino.

Q26: cosa intendi con LOAD e STORE in Pig?

Risposta:
Questi sono gli operatori per il caricamento e l'archiviazione dei dati in hdfs.

Passiamo alle prossime domande di intervista di maiale.

Q27.Quale funzione matematica disponibile in Pig?

Risposta:
ABS, ACOS, LOG, ROUND, CBRT, SORT sono le funzioni matematiche disponibili in Pig.

D28: Cosa ha fatto la parola chiave distinta in Pig?

Risposta:
Le parole chiave distinte rimuovono le parole chiave duplicate dai record. Ad esempio:
movies = LOAD 'path of abc.csv' USING Pig Storage (', ') as (id, nome, anno, valutazione, durata);
New_movies = distinto (id, nome, anno, valutazione, durata);

D29 Cosa intendi per tipo di dati primitivo in Pig?

Risposta:
Int, Long, Float, Double, Char array, Byte array sono i tipi di dati primitivi in ​​Pig.

D30: Cosa intendi per tupla in Maiale?

Risposta:
Una serie ordinata di campo di un dato si chiama Tupla.

Conclusione

Se ti stai preparando per i lavori relativi a Hadoop, allora devi preparare il Maiale per questo perché questo argomento avrà il ruolo principale per garantire buone osservazioni nell'intervista. Le domande di intervista di maiale che sono condivise sopra ti aiuteranno a preparare le basi e teoricamente del maiale, ma devi avere le mani sul maiale. Ti aiuterà a rafforzare la fiducia e la conoscenza avanzata.

Articolo raccomandato

Questa è stata una guida all'elenco delle domande e risposte sull'intervista del maiale, in modo che il candidato possa reprimere facilmente queste domande sull'intervista al maiale. Qui abbiamo trattato sia le domande di base che quelle avanzate di maiale. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Domande utili per l'intervista ad Apache PIG
  2. Domande di intervista C ++
  3. Spark Intervista Domande che dovresti sapere
  4. Domande sul colloquio con il cetriolo