Panoramica di R Data Frame

I frame di dati sono un elenco di vettori di uguale lunghezza. Tuttavia, la differenza tra matrice e frame di dati è che i frame di dati accettano vari tipi di dati. (Carattere, numerico, ecc.). In questo argomento, apprenderemo su R Data Frame.

Vantaggi dell'utilizzo di frame di dati

  • Raccolta distribuita di dati e organizzata.
  • Ha ottimizzazioni migliori rispetto a un database relazionale.
  • Contiene una varietà di dati eterogenei.

Creazione di un frame di dati in R

Creiamo data_frame. Di seguito è riportato l'esempio per dichiarare un frame di dati.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

Nell'esempio sopra, non abbiamo definito le variabili. Vediamo ora come assegniamo i valori alle variabili e li memorizziamo nel frame di dati.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Produzione:

Numero alfa booleani

1 2 x VERO

2 3 y VERO

3 4 z FALSE

Struttura del frame di dati

Quando vogliamo conoscere la struttura di un determinato frame di dati. Possiamo usare la seguente funzione.

Stella ()

str(Data_frame)

Produzione:

Numero: num 2 3 4

alfa: fattore w / 3 livelli “x”, ”y”, ”z”: 1 2 3

Booleani: logi VERO VERO FALSO

Estrazione di dati specifici dal frame di dati

1. Utilizzando il nome della colonna

Siamo in grado di estrarre un determinato set di dati dal frame di dati.

Dal nostro esempio sopra, estraiamo solo la prima colonna dal frame di dati che è Number.

Data_ frame <- data. Frame(Number)

Produzione:

Numero

1 2

2 3

3 4

2. Utilizzo delle righe

Possiamo estrarre i dati dalle righe proprio come nell'esempio seguente.

Supponiamo di voler stampare solo due righe della colonna Numero.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Produzione:

Numero alfa booleani

1 2 x VERO

2 3 y VERO

3 4 z FALSE

------------

Numero alfa booleani

1 2 x VERO

2 3 y VERO

Possiamo osservare la differenza tra la prima e la seconda uscita.

3. Stampa di righe e colonne specifiche

Possiamo anche stampare righe e colonne specifiche.

Nell'esempio seguente, stampiamo la e la riga, colonna

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Produzione:

Numero alfa booleani

1 2 x VERO

2 3 y VERO

3 4 z FALSE

-------------

Numero alfa

1 2 x

2 3 anni

4. Aggiunta di un'altra colonna al frame di dati

Possiamo aggiungere un'altra colonna insieme ai valori al frame di dati.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Produzione:

Numero alfa classe booleana

1 2 x VERO A

2 3 y VERO B

3 4 z FALSE C

5. Aggiunta di una riga al frame di dati

Usiamo la funzione rbind per aggiungere una nuova riga al frame di dati esistente.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Produzione:

Numero alfa classe booleana

1 2 x VERO A

2 3 y VERO B

3 4 z FALSE C

4 5 x FALSO D

6. Combinazione di entrambi i frame di dati

Possiamo anche combinare due frame di dati per produrre un singolo output.

Per combinare due frame di dati è necessario disporre della stessa colonna per i frame di dati.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Produzione:

Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
--------------
Numero alfa booleani
1 4 x VERO
2 5 y VERO
3 6 z FALSE

--------------

Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
4 4 x VERO
5 5 y VERO
6 6 z FALSE

Ispezione dei frame di dati

Di seguito sono riportati i diversi modi per ispezionare un frame di dati e fornisce informazioni su un frame di dati proprio come la funzione stella sopra.

1. Nomi: fornisce i nomi delle variabili nel frame di dati

Sintassi : names(data frame name)

Esempio

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

output : (1) “Numero” “alfa” “Booleani”

2. Riepilogo: fornisce le statistiche del frame di dati.

Sintassi: summary(data frame name)

Esempio

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Produzione:

Numero alfa booleani
Min. : 2, 0 x: 1 Modalità: logica
1st Qu.:2.5 y: 1 FALSE: 1
Mediana: 3, 0 z: 1 VERO: 2
Media: 3.0 NA: 0
3a domanda: 3, 5
Max. : 4.0

3. Head: fornisce i dati per le prime poche righe.

Sintassi: Head( name of the data frame)

Esempio

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Produzione:

Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
4 5 a VERO
5 6 b FALSO
6 7 c FALSO

4. Coda: stampa le ultime righe nel riquadro dati.

Sintassi: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Produzione:

Numero alfa booleani
5 6 b FALSO
6 7 c FALSO
7 8 d FALSE
8 9 f FALSO
9 10 g FALSO
10 11 j FALSO

Conclusione

I frame di dati sono un concetto importante nella programmazione R. È facile ma potente nella creazione di set di dati che possono essere modificati e accessibili facilmente. Proprio come la matrice, è possibile accedere ai set di dati tramite nomi di righe e colonne con l'aggiunta e la rimozione di dati semplificate.

Articoli consigliati

Questa è una guida a R Data Frame. Qui discutiamo la creazione di un frame di dati in R con la struttura e l'estrazione di dati specifici dal frame di dati. Puoi anche dare un'occhiata ai seguenti articoli per saperne di più -

  1. Tipi di dati in C
  2. Carriera nella scienza dei dati
  3. Tecnologie per i Big Data
  4. Piattaforma di data science
  5. Java booleani

Categoria: