Panoramica di R Data Frame
I frame di dati sono un elenco di vettori di uguale lunghezza. Tuttavia, la differenza tra matrice e frame di dati è che i frame di dati accettano vari tipi di dati. (Carattere, numerico, ecc.). In questo argomento, apprenderemo su R Data Frame.
Vantaggi dell'utilizzo di frame di dati
- Raccolta distribuita di dati e organizzata.
- Ha ottimizzazioni migliori rispetto a un database relazionale.
- Contiene una varietà di dati eterogenei.
Creazione di un frame di dati in R
Creiamo data_frame. Di seguito è riportato l'esempio per dichiarare un frame di dati.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
Nell'esempio sopra, non abbiamo definito le variabili. Vediamo ora come assegniamo i valori alle variabili e li memorizziamo nel frame di dati.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Produzione:
Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
Struttura del frame di dati
Quando vogliamo conoscere la struttura di un determinato frame di dati. Possiamo usare la seguente funzione.
Stella ()
str(Data_frame)
Produzione:
Numero: num 2 3 4
alfa: fattore w / 3 livelli “x”, ”y”, ”z”: 1 2 3
Booleani: logi VERO VERO FALSO
Estrazione di dati specifici dal frame di dati
1. Utilizzando il nome della colonna
Siamo in grado di estrarre un determinato set di dati dal frame di dati.
Dal nostro esempio sopra, estraiamo solo la prima colonna dal frame di dati che è Number.
Data_ frame <- data. Frame(Number)
Produzione:
Numero
1 2
2 3
3 4
2. Utilizzo delle righe
Possiamo estrarre i dati dalle righe proprio come nell'esempio seguente.
Supponiamo di voler stampare solo due righe della colonna Numero.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Produzione:
Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
------------
Numero alfa booleani
1 2 x VERO
2 3 y VERO
Possiamo osservare la differenza tra la prima e la seconda uscita.
3. Stampa di righe e colonne specifiche
Possiamo anche stampare righe e colonne specifiche.
Nell'esempio seguente, stampiamo la 1ª e la 2ª riga, colonna
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Produzione:
Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
-------------
Numero alfa
1 2 x
2 3 anni
4. Aggiunta di un'altra colonna al frame di dati
Possiamo aggiungere un'altra colonna insieme ai valori al frame di dati.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Produzione:
Numero alfa classe booleana
1 2 x VERO A
2 3 y VERO B
3 4 z FALSE C
5. Aggiunta di una riga al frame di dati
Usiamo la funzione rbind per aggiungere una nuova riga al frame di dati esistente.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Produzione:
Numero alfa classe booleana
1 2 x VERO A
2 3 y VERO B
3 4 z FALSE C
4 5 x FALSO D
6. Combinazione di entrambi i frame di dati
Possiamo anche combinare due frame di dati per produrre un singolo output.
Per combinare due frame di dati è necessario disporre della stessa colonna per i frame di dati.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Produzione:
Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
--------------
Numero alfa booleani
1 4 x VERO
2 5 y VERO
3 6 z FALSE
--------------
Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
4 4 x VERO
5 5 y VERO
6 6 z FALSE
Ispezione dei frame di dati
Di seguito sono riportati i diversi modi per ispezionare un frame di dati e fornisce informazioni su un frame di dati proprio come la funzione stella sopra.
1. Nomi: fornisce i nomi delle variabili nel frame di dati
Sintassi : names(data frame name)
Esempio
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
output : (1) “Numero” “alfa” “Booleani”
2. Riepilogo: fornisce le statistiche del frame di dati.
Sintassi: summary(data frame name)
Esempio
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Produzione:
Numero alfa booleani
Min. : 2, 0 x: 1 Modalità: logica
1st Qu.:2.5 y: 1 FALSE: 1
Mediana: 3, 0 z: 1 VERO: 2
Media: 3.0 NA: 0
3a domanda: 3, 5
Max. : 4.0
3. Head: fornisce i dati per le prime poche righe.
Sintassi: Head( name of the data frame)
Esempio
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Produzione:
Numero alfa booleani
1 2 x VERO
2 3 y VERO
3 4 z FALSE
4 5 a VERO
5 6 b FALSO
6 7 c FALSO
4. Coda: stampa le ultime righe nel riquadro dati.
Sintassi: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Produzione:
Numero alfa booleani
5 6 b FALSO
6 7 c FALSO
7 8 d FALSE
8 9 f FALSO
9 10 g FALSO
10 11 j FALSO
Conclusione
I frame di dati sono un concetto importante nella programmazione R. È facile ma potente nella creazione di set di dati che possono essere modificati e accessibili facilmente. Proprio come la matrice, è possibile accedere ai set di dati tramite nomi di righe e colonne con l'aggiunta e la rimozione di dati semplificate.
Articoli consigliati
Questa è una guida a R Data Frame. Qui discutiamo la creazione di un frame di dati in R con la struttura e l'estrazione di dati specifici dal frame di dati. Puoi anche dare un'occhiata ai seguenti articoli per saperne di più -
- Tipi di dati in C
- Carriera nella scienza dei dati
- Tecnologie per i Big Data
- Piattaforma di data science
- Java booleani