Introduzione su Hive Drop Table

La parola chiave "DROP" si riferisce alla cancellazione. Per la cancellazione dei dati, è necessario che i dati siano presenti nell'alveare.

In Hadoop, abbiamo due funzionalità:

  1. Archivio dati
  2. Elaborazione dati

Per l'archiviazione dei dati, appare HDFS (Hadoop Distributed File System). Ora quando diciamo di avere dei dati nella tabella degli alveari significa due cose:

  1. I dati sono in HDFS
  2. Abbiamo una tabella hive creata su quel file HDFS e cariciamo i dati di quel file HDFS nella tabella hive.

Quindi, in sostanza, affinché la tabella di rilascio dell'hive abbia i dati, il file di dati è un prerequisito. In questo articolo, vedremo come eliminare le tabelle nell'alveare, cosa succede quando la tabella viene eliminata e tutte le cose relative alla tabella di eliminazione nell'alveare.

Tipi di Drop Table in Hive

Nell'alveare ci sono due tipi di tabelle:

  1. Tabella interna o tabella gestita
  2. Tabella esterna o tabella non gestita

Tavolo gestito / Tavolo interno:

  1. In Hive, " utente / hive / magazzino " è la directory predefinita. Le tabelle interne sono memorizzate in questa directory per impostazione predefinita. Non è necessario fornire la posizione manualmente durante la creazione della tabella.
  2. Il comando "Elimina tabella" elimina i dati in modo permanente.
  3. Hive gestisce tutta la sicurezza per le tabelle gestite.

Ho già una tabella presente nella directory "user / hive / warehouse" chiamata "codici".

Per verificare se la tabella esistente è gestita o non gestita, è possibile utilizzare il comando seguente:

Sintassi del comando:

Descrivi formattato table_name;

Produzione:

Vediamo, i dati presentati nella tabella "codici".

Innanzitutto, usando il comando hive-

In secondo luogo, usando Hue (Hadoop User Experience a Web UI)

Elimina comando: Elimina tabella nome_tabella;

Produzione:

Ora, se voglio selezionare i dati da "codici", mi darà un errore perché la tabella viene eliminata.

Inoltre, non sarà in grado di vedere questa tabella nella directory predefinita che è

“Utente / alveare / magazzino”

Osserva qui,

Tabella non gestita / tabella esterna:

  1. Tabelle esterne, ci viene richiesto di fornire il percorso in cui è necessario archiviare quella tabella usando la parola chiave 'posizione' nel comando create table.

Per esempio:

CREA TABELLA ESTERNA stg_s2_json.products

(prodotto senza stringa, stringa di nome prodotto, stringa di descrizione, stringa attiva, stringa di data creata, stringa di data aggiornata) campi delimitati dal formato riga terminati da ', '

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. Hive elimina solo i metadati. I dati sono permanenti.
  2. Queste tabelle possono essere utilizzate da chiunque abbia accesso a HDFS, quindi devono gestire la sicurezza a livello di cartella.

Per comprendere la caduta della tabella esterna, utilizzeremo la tabella "prodotti".

Controlliamo se la tabella è interna o esterna. Ancora una volta, "descrivi formattato table_name" comando.

Osservare "limite 10" nel comando di selezione. I prodotti della tabella contengono i dati seguenti:

Per verificarlo in Tonalità, è simile al seguente:

Vediamo cosa succede quando eliminiamo questa tabella:

Sintassi:

Drop table table_name;

Produzione:

Ora, se si tenta di recuperare i dati della tabella, viene generato un errore.

Innanzitutto, usando il comando "select" sul terminale, mi lancerà un errore che significa che i metadati per la tabella esterna vengono eliminati.

Osservare l'errore qui:

In secondo luogo, controllando la tonalità dello stato dei dati, il file "products.json" è ancora presente in HDFS, il che significa che i dati sono permanenti.

Conclusione

Ho intenzione di semplificare e fornirti i punti chiave per entrambi i tipi di tabelle. Decidi tu quale tipo si adatta alle tue esigenze.

Tavolo interno

Tavolo esterno

Chiamato anche "Tavolo gestito"Chiamato anche "tabella non gestita"
Non è necessario fornire la posizione, la directory predefinita di Hive gestisce questi datiÈ necessario fornire la posizione
Elimina i metadati della tabella e (I dati sono temporanei)Hive lascia i dati intatti (i dati sono permanenti)
L'alveare stesso controlla la sicurezza della tabellaÈ necessario gestire la sicurezza a livello di cartella

Articoli consigliati

Questa è una guida per Hive Drop Table. Qui discutiamo dell'introduzione di Hive Drop Table, Tipi di Drop Table in Hive lungo la sintassi. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -

  1. Che cos'è un alveare?
  2. Hive Architecture
  3. Comandi alveare
  4. Cos'è Oracle Database
  5. Hive Order di
  6. Installazione alveare

Categoria: