Introduzione a Hive Intervista Domande e risposte

Nella nuova era dei dati Hive è un pacchetto di strumenti di infrastruttura ETL e data warehousing su scala open source per l'archiviazione di dati strutturati e non strutturati basati su Distributed File System (HDFS)
per l'analisi, l'interrogazione e il mining di enormi set di dati di volume abilitando un linguaggio simile a SQL chiamato HiveQL (HQL) e una facile esecuzione delle query mediante la pianificazione di Hadoop MapReduce.

Hive è basato su Hadoop per elaborare e analizzare i Big Data e semplifica l'interrogazione.
L'alveare è stato inizialmente creato da Facebook, successivamente è stato ulteriormente migliorato e sviluppato come open source da Apache Software Foundation e lo ha chiamato Apache Hive. Ci sono molte aziende che utilizzano Apache Hive per le loro soluzioni Big Data.

Se stai cercando un lavoro correlato a Hive, devi prepararti per le domande di intervista Hive 2018. Sebbene ogni intervista sia diversa e anche la portata di un lavoro sia diversa, possiamo aiutarti con le domande e le risposte dell'intervista Hive del 2018 più importanti, che ti aiuteranno a fare il salto e ottenere il successo nel tuo colloquio.

Di seguito è riportato l'elenco delle domande di intervista dell'alveare che vengono poste principalmente in un'intervista. Queste domande sono divise in due parti:

Parte 1 - Domande di intervista all'alveare (di base)

Questa prima parte tratta le domande e le risposte di base dell'intervista Hive.

1. Elencare i diversi componenti dell'architettura Hive?

Risposta:
Di seguito sono elencati cinque componenti principali nell'architettura Hive:
• Interfaccia utente (UI): funge da comunicatore tra utenti e driver quando l'utente scrive le query che l'interfaccia utente lo accetta e lo esegue sul driver, sono disponibili due tipi di interfaccia: riga di comando e interfaccia GUI.
• Driver: mantiene il ciclo di vita della query HiveQL. Riceve le query dall'interfaccia utente e crea la sessione per elaborare la query.
• Compilatore: riceve i piani di query dal driver e ottiene le informazioni richieste da Metastore per eseguire il piano.
• Metastore: memorizza le informazioni sui dati come una tabella; può essere di una tabella interna o esterna. Invia le informazioni sui metadati al compilatore per eseguire la query.
• Esegui motore: il servizio hive eseguirà il risultato nel motore di esecuzione; esegue la query in MapReduce per elaborare i dati. È responsabile del controllo di ogni fase per tutti questi componenti.

2. Quali sono i diversi tipi di modalità che Hive può operare?

Risposta:
Queste sono le domande comuni sull'intervista dell'alveare poste in un'intervista. Hive può operare in due modalità in base alla dimensione dei dati,
Queste modalità sono:
• Modalità riduzione mappa
•Modalità locale

3. Quali sono gli scenari in cui Hive può essere utilizzato e non può essere utilizzato?

Risposta :
Quando si creano applicazioni di data warehouse quando i dati sono statici quando l'applicazione non necessita di tempi di risposta elevati, quando il volume di dati è enorme, quando i dati non cambiano rapidamente e quando si utilizzano query anziché script. Hive supporta solo transazioni OLAP, non è adatto per transazioni OLTP.

Passiamo alle prossime domande sull'intervista all'alveare.

4. Quali sono i formati di file supportati da Hive? Elencare il tipo di applicazioni supportate da HIVE?

Risposta:
Per impostazione predefinita, Hive supporta il formato di file di testo e supporta anche il formato di file binario come file di sequenza, file ORC, file Parquet, file Avro Data.
• File di sequenza: è generalmente un file in formato binario, che può essere compresso ed è divisibile.
• File ORC: il file colonna ottimizzato per riga è un file di registrazione basato su colonna e un file di archiviazione orientato alla colonna.
• File di parquet: è un file binario orientato alla colonna ed è altamente efficiente per query su larga scala.
• File di dati Avro: è uguale al formato del file di sequenza che è un file divisibile, comprimibile e orientato alle righe.
La dimensione massima del tipo di dati stringa consentita in Hive è 2 GB.

Hive è un framework di data warehouse adatto per le applicazioni scritte in Java, C ++, PHP, Python o Ruby.

5. Quali sono i diversi tipi di tabella disponibili in Hive?

Risposta:
Esistono due tipi di tabella nell'applicazione Hive:
• Tabelle gestite: i dati e lo schema hanno il controllo di Hive.
• Tabelle esterne: solo lo schema ha il controllo dell'alveare.

Parte 2 - Domande di intervista ad alveare (avanzate)

Diamo ora un'occhiata alle Domande avanzate sull'intervista Hive.

6. Che cos'è un metastore in Hive? Elencare e spiegare i diversi tipi di configurazione Hive Metastores?

Risposta:
Il metastore in Hive viene utilizzato per memorizzare le informazioni sui metadati, è un repository centrale in Hive. Permette di archiviare le informazioni sui metadati in un database esterno. Per impostazione predefinita, Hive memorizza le informazioni sui metadati nel database Derby ma può anche essere memorizzato in altri database come Oracle, MySql ecc.
Esistono tre tipi di configurazione Metastore:
• Metastore incorporato: è una modalità predefinita; può accedere localmente alla libreria Hive, tutte le operazioni da riga di comando vengono eseguite in modalità incorporata. Il servizio Hive, il servizio metastore e il database vengono eseguiti nella stessa JVM.
• Metastore locale: memorizza i dati in un database esterno come MySql o Oracle. Il servizio Hive e il servizio metastore vengono eseguiti nella stessa JVM, si connettono al database in esecuzione in JVM separata.
• Metastore remoto: utilizza la modalità remota per eseguire query, qui il servizio metastore e il servizio hive vengono eseguiti in una JVM separata. È possibile disporre di più server metastore per aumentare la disponibilità.

7. Che cos'è un processore di query Hive? Quali sono i diversi componenti del processore di query Hive?

Risposta:
Queste sono le domande frequenti sull'intervista dell'alveare in un'intervista. Il processore di query Hive viene utilizzato per convertire i lavori da SQL a MapReduce. In base all'ordine delle dipendenze, i lavori vengono eseguiti.
I componenti di Hive Query Processor sono elencati di seguito:
• Analizzatore semantico
• UDF e UDAF
• Optimizer
•Operatore
• Parser
• Motore di esecuzione
• Verifica del tipo
• Generazione del piano logico
• Generazione di piani fisici

8. Qual è la funzionalità di Object-Inspector in Hive?

Risposta:
È composto da Hive che viene utilizzato per identificare la struttura delle singole colonne e la struttura interna degli oggetti riga. È possibile accedere agli oggetti complessi memorizzati in più formati utilizzando Object-Inspector in Hive.
Object-Inspector identificherà la struttura di un oggetto e le modalità di accesso ai campi interni all'interno dell'oggetto.

Passiamo alle prossime domande sull'intervista all'alveare.

9. Quali sono i diversi modi per connettere le applicazioni a Hive Server?

Risposta:
Esistono tre modi per connettere le applicazioni al server Hive:
• Thrift Client: viene utilizzato per eseguire tutti i comandi hive utilizzando un linguaggio di programmazione diverso come Java, C ++, PHP, Python o Ruby.
• Driver ODBC: supporterà il protocollo ODBC
• Driver JDBC: supporterà il protocollo JDBC

10. Qual è la classe di lettura e scrittura predefinita in Hive?

Risposta:
Di seguito sono riportate le classi di lettura e scrittura disponibili in Hive:
• TextInputFormat: questa classe viene utilizzata per leggere i dati in formato testo normale.
• HiveIgnoreKeyTextOutputFormat: questa classe viene utilizzata per scrivere dati in formato testo normale.
• SequenceFileInputFormat - Questa classe viene utilizzata per leggere i dati nel formato file Hadoop Sequence.
• SequenceFileOutputFormat: questa classe viene utilizzata per scrivere dati nel formato di file Hadoop Sequence.

Articolo raccomandato

Questa è stata una guida all'elenco delle domande e risposte all'intervista all'alveare in modo che il candidato possa facilmente reprimere queste domande sull'intervista all'alveare. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Le 5 domande e risposte utili per l'intervista a DBA
  2. 12 domande e risposte sull'intervista GitHub più fantastiche
  3. 15 domande e risposte sul colloquio più importanti
  4. Le 10 domande più utili per l'intervista con HBase