Che cos'è un alveare?

Prima di comprendere i tipi di dati Hive, studieremo l'alveare. Hive è una tecnica di archiviazione dei dati di Hadoop. Hadoop è il segmento di archiviazione e elaborazione dei dati della piattaforma Big Data. Hive mantiene la sua posizione per le tecniche di elaborazione dei dati sequel. Come altri ambienti sequel, l'hive può essere raggiunto tramite query sequel. Le principali offerte di hive sono l'analisi dei dati, l'interrogazione ad hoc e il riepilogo dei dati memorizzati da una prospettiva di latenza, le query vanno molto più in là.

Tipi di dati Hive

I tipi di dati sono classificati in due tipi:

  • Tipi di dati primitivi
  • Tipi di dati collettivi

1. Tipi di dati primitivi

I mezzi primitivi erano antichi e antichi. tutti i tipi di dati elencati come primitivi sono quelli legacy. le aree di tipi di dati primitivi importanti elencate di seguito:

genere Dimensione (byte) Esempio
TinyInt 1 20
SmallInt 2 20
Int 4 20
bIGINT 8 20
booleano Booleano vero / falso FALSE
Doppio 8 10, 2222
Galleggiante 4 10, 2222
Corda Sequenza di personaggi ABCD
timestamp Integer / float / stringa 2/3/2012 12: 34: 56: 1234567
Data Integer / float / stringa 2019/02/03

I tipi di dati Hive sono implementati utilizzando JAVA

Esempio: Java Int viene utilizzato per implementare il tipo di dati Int qui.

  • Le matrici di caratteri non sono supportate in HIVE.
  • Hive si affida a delimitatori per separare i suoi campi, hive sulla coordinazione con Hadoop consente di aumentare le prestazioni di scrittura e le prestazioni di lettura.
  • Non è previsto specificare la lunghezza di ciascuna colonna nel database hive.
  • I letterali di stringa possono essere articolati tra virgolette doppie (“) virgolette singole (').
  • In una versione più recente dell'alveare, vengono introdotti i tipi di Varchar che formano un identificatore di span di (tra 1 e 65535), quindi per una stringa di caratteri, questo funge da lunghezza di valore maggiore che può contenere. Quando viene inserito un valore superiore a questa lunghezza, gli elementi più a destra di tali valori vengono troncati. La lunghezza del carattere è la risoluzione con la figura dei punti di codice controllata dalla stringa di caratteri.
  • Tutti i valori letterali interi (TINYINT, SMALLINT, BIGINT) sono considerati fondamentalmente come tipi di dati INT e solo la lunghezza supera il livello int effettivo che viene trasmutata in BIGINT o in qualsiasi altro tipo corrispondente.
  • I letterali decimali offrono valori definiti e una raccolta superiore per valori in virgola mobile rispetto al tipo DOPPIO. Qui i valori numerici vengono memorizzati nella loro forma esatta, ma nel caso del doppio, non vengono memorizzati esattamente come valori numerici.

Processo di fusione del valore della data

Casting eseguito Risultato
cast (data come data) Stesso valore della data
cast (data e ora come data) Un fuso orario locale viene utilizzato per valutare i valori di Anno / mese / data qui e stampato nell'output.
cast (stringa come data) Come risultato di questo casting verrà richiesto un valore di data corrispondente, ma dobbiamo assicurarci che la stringa abbia il formato 'AAAA-MM-GG'. Verrà restituito un valore Null quando il valore di stringa non riesce a trovare una corrispondenza valida.
cast (data come data / ora) Secondo l'attuale fuso orario locale, verrà creato un valore di data / ora per questo processo di trasmissione
cast (data come stringa) AAAA-MM-GG è formato per il valore di anno / mese / data e l'output sarà in formato stringa.

2. Tipi di dati di raccolta

Nell'hive sono presenti quattro tipi di dati di raccolta che vengono anche definiti tipi di dati complessi.

  • VETTORE
  • CARTA GEOGRAFICA
  • STRUCT
  • UNIONTYPE

1. ARRAY: una sequenza di elementi di un tipo comune che possono essere indicizzati e il valore dell'indice inizia da zero.

Codice:

array ('anand', 'balaa', 'praveeen');

2. MAP: sono elementi dichiarati e recuperati usando coppie chiave-valore.

Codice:

'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').

3. STRUCT: come in C, la struttura è un tipo di dati che accumula un insieme di campi che sono etichettati e possono essere di qualsiasi altro tipo di dati.

Codice:

For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY

4. UNIONTYPE: Union può contenere uno qualsiasi dei tipi di dati specificati.

Codice:

CREATE TABLE test(col1 UNIONTYPE ) CREATE TABLE test(col1 UNIONTYPE )

Produzione:

Di seguito sono elencati vari delimitatori utilizzati in tipi di dati complessi,

delimitatore Codice Descrizione
\ n \ n Record o delimitatore di riga
A (Ctrl + A) \ 001 Delimitatore di campo
B (Ctrl + B) \ 002 STRUTTURE e ARRAY
C (Ctrl + C) \ 003 MAP

Esempio di tipi di dati complessi

Di seguito sono riportati esempi di tipi di dati complessi:

1. CREAZIONE DELLA TABELLA

Codice:

create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';

2. DATI DELLA TABELLA DEI CAMPIONI

Codice:

100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL

3. CARICAMENTO DEI DATI

Codice:

load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;

4. VISUALIZZAZIONE DEI DATI

Codice:

select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';

Conclusione - Tipi di dati Hive

Essendo un DB relazionale e tuttavia un Sequel collega l'HIVE offre tutte le proprietà chiave dei soliti database SQL in un modo molto sofisticato che lo rende tra le unità di elaborazione dei dati strutturati più efficienti in Hadoop.

Articoli consigliati

Questa è una guida al tipo di dati Hive. Qui discutiamo due tipi di tipi di dati hive con esempi adeguati. Puoi anche consultare i nostri altri articoli correlati per saperne di più -

  1. Che cos'è un alveare?
  2. Alternative dell'alveare
  3. Hive Funzioni integrate
  4. Interviste sull'alveare
  5. Tipi di dati PL / SQL
  6. Esempi di funzioni integrate di Python
  7. Diversi tipi di dati SQL con esempi

Categoria: