Introduzione su Hive Drop Table
La parola chiave "DROP" si riferisce alla cancellazione. Per la cancellazione dei dati, è necessario che i dati siano presenti nell'alveare.
In Hadoop, abbiamo due funzionalità:
- Archivio dati
- Elaborazione dati
Per l'archiviazione dei dati, appare HDFS (Hadoop Distributed File System). Ora quando diciamo di avere dei dati nella tabella degli alveari significa due cose:
- I dati sono in HDFS
- Abbiamo una tabella hive creata su quel file HDFS e cariciamo i dati di quel file HDFS nella tabella hive.
Quindi, in sostanza, affinché la tabella di rilascio dell'hive abbia i dati, il file di dati è un prerequisito. In questo articolo, vedremo come eliminare le tabelle nell'alveare, cosa succede quando la tabella viene eliminata e tutte le cose relative alla tabella di eliminazione nell'alveare.
Tipi di Drop Table in Hive
Nell'alveare ci sono due tipi di tabelle:
- Tabella interna o tabella gestita
- Tabella esterna o tabella non gestita
Tavolo gestito / Tavolo interno:
- In Hive, " utente / hive / magazzino " è la directory predefinita. Le tabelle interne sono memorizzate in questa directory per impostazione predefinita. Non è necessario fornire la posizione manualmente durante la creazione della tabella.
- Il comando "Elimina tabella" elimina i dati in modo permanente.
- Hive gestisce tutta la sicurezza per le tabelle gestite.
Ho già una tabella presente nella directory "user / hive / warehouse" chiamata "codici".
Per verificare se la tabella esistente è gestita o non gestita, è possibile utilizzare il comando seguente:
Sintassi del comando:
Descrivi formattato table_name;
Produzione:
Vediamo, i dati presentati nella tabella "codici".
Innanzitutto, usando il comando hive-
In secondo luogo, usando Hue (Hadoop User Experience a Web UI)
Elimina comando: Elimina tabella nome_tabella;
Produzione:
Ora, se voglio selezionare i dati da "codici", mi darà un errore perché la tabella viene eliminata.
Inoltre, non sarà in grado di vedere questa tabella nella directory predefinita che è
“Utente / alveare / magazzino”
Osserva qui,
Tabella non gestita / tabella esterna:
- Tabelle esterne, ci viene richiesto di fornire il percorso in cui è necessario archiviare quella tabella usando la parola chiave 'posizione' nel comando create table.
Per esempio:
CREA TABELLA ESTERNA stg_s2_json.products
(prodotto senza stringa, stringa di nome prodotto, stringa di descrizione, stringa attiva, stringa di data creata, stringa di data aggiornata) campi delimitati dal formato riga terminati da ', '
LOCATION '/user/data/hive/stg_s2_json.db/products';
- Hive elimina solo i metadati. I dati sono permanenti.
- Queste tabelle possono essere utilizzate da chiunque abbia accesso a HDFS, quindi devono gestire la sicurezza a livello di cartella.
Per comprendere la caduta della tabella esterna, utilizzeremo la tabella "prodotti".
Controlliamo se la tabella è interna o esterna. Ancora una volta, "descrivi formattato table_name" comando.
Osservare "limite 10" nel comando di selezione. I prodotti della tabella contengono i dati seguenti:
Per verificarlo in Tonalità, è simile al seguente:
Vediamo cosa succede quando eliminiamo questa tabella:
Sintassi:
Drop table table_name;
Produzione:
Ora, se si tenta di recuperare i dati della tabella, viene generato un errore.
Innanzitutto, usando il comando "select" sul terminale, mi lancerà un errore che significa che i metadati per la tabella esterna vengono eliminati.
Osservare l'errore qui:
In secondo luogo, controllando la tonalità dello stato dei dati, il file "products.json" è ancora presente in HDFS, il che significa che i dati sono permanenti.
Conclusione
Ho intenzione di semplificare e fornirti i punti chiave per entrambi i tipi di tabelle. Decidi tu quale tipo si adatta alle tue esigenze.
Tavolo interno |
Tavolo esterno |
Chiamato anche "Tavolo gestito" | Chiamato anche "tabella non gestita" |
Non è necessario fornire la posizione, la directory predefinita di Hive gestisce questi dati | È necessario fornire la posizione |
Elimina i metadati della tabella e (I dati sono temporanei) | Hive lascia i dati intatti (i dati sono permanenti) |
L'alveare stesso controlla la sicurezza della tabella | È necessario gestire la sicurezza a livello di cartella |
Articoli consigliati
Questa è una guida per Hive Drop Table. Qui discutiamo dell'introduzione di Hive Drop Table, Tipi di Drop Table in Hive lungo la sintassi. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -
- Che cos'è un alveare?
- Hive Architecture
- Comandi alveare
- Cos'è Oracle Database
- Hive Order di
- Installazione alveare