Cornici dati in R - Come estrarre i dati dai frame di dati in R?

Sommario:

Anonim

Introduzione ai data frame in R

Un frame di dati è una struttura a matrice 2D (bidimensionale) in cui sono accettati diversi tipi di dati come caratteri, numeri, ecc. Il frame di dati è un sottoinsieme di un elenco che ha ciascun componente di uguale lunghezza. Fondamentalmente, il frame di dati è una tabella in cui ogni colonna contiene valori di una variabile e ogni riga contiene un set di valori per ogni colonna.

Vi sono alcune caratteristiche del frame di dati.

  • È richiesto il nome della colonna
  • I nomi delle righe devono essere univoci
  • Il numero di elementi in ciascuna colonna dovrebbe essere lo stesso

Passaggi per la creazione di frame di dati in R

Cominciamo con la creazione di un frame di dati che è spiegato di seguito,

Passaggio 1: creare un frame di dati di una classe in una scuola.

Codice:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Quando eseguiamo questo codice otterremo un frame di dati come questo.

Produzione:

Qui nel nostro esempio, il frame di dati è molto piccolo, ma nella vita reale, mentre affrontiamo il problema abbiamo molti dati. Quindi per capire la struttura dei dati passiamo sulla funzione Str ().

Passaggio 2: aggiungiamo la riga seguente nel nostro codice.

Codice:

Str(tenthclass)

Quando eseguiamo l'intero codice avremo l'output.

Produzione:

L'output sopra indica che abbiamo 5 osservazioni di 3 variabili. Quindi spiega il tipo di dati di ciascuna variabile. Come nel nostro esempio il numero del rotolo è un numero intero, il nome è carattere e i segni sono numerati.

Una volta compresa la struttura dei dati, passeremo il codice sotto indicato per comprendere i dati in modo più statistico.

Passaggio 3: ora utilizzeremo una funzione di riepilogo ()

Codice:

summary(tenthclass)

Produzione:

Il riepilogo fornisce una migliore comprensione dei nostri dati. Ci dirà che significa, mediana, quartile, Max e Min. Queste cose ci aiuteranno a prendere una decisione migliore.

Come estrarre i dati dai frame di dati in R?

Qui continueremo il caso sopra. Supponiamo di voler conoscere il nome dello studente in decima classe, solo il nome. Quindi come estrarremo?

Il nostro frame di dati è simile al seguente.

roll_number Contrassegni nome

1 1 Giovanni 77

2 2 Sam 87

3 3 Casey 45

4 4 Ronald 68

5 5 Mathew 95

Per ottenere il nome come output passeremo il seguente codice.

Codice:

onlyname = tenthclass$Name
print(onlyname)

Produzione:

Qui se rompiamo il codice, inseriamo semplicemente il simbolo del dollaro tra il nome del nostro frame di dati e il nome della variabile che vogliamo come output.

Ora considera una situazione, l'insegnante vuole sapere tutto sul tiro numero 2 come il suo nome e quanto ha segnato.

Qui abbiamo bisogno di tutto sul rotolo numero 2, quindi passeremo il codice sotto indicato.

Codice:

result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)

Produzione:

Espandi in cornici dati

È possibile aumentare e ridurre le dimensioni del frame di dati aggiungendo o eliminando colonne e righe.

1. Aggiungi riga

Abbiamo due frame di dati. Un frame di dati appartiene alla decima sezione A della classe e l'altro frame di dati appartiene alla decima sezione B. La classe ora queste diverse sezioni si fondono in un'unica classe.

Esempio n. 1: Classe 10 A

Codice:

tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)

Produzione:

Esempio n. 2: Classe 10 B

Codice:

tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)

Produzione:

Esempio n. 3: funzione rbind ()

Ora dobbiamo unire queste due classi in un'unica classe. Useremo la funzione rbind () qui. L'unica limitazione nell'aggiunta di una nuova riga è che dobbiamo inserire le nuove righe nella stessa struttura del frame di dati esistente.

Codice:

new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)

Produzione:

2. Aggiungi colonna

Consideriamo ora un caso in cui dobbiamo aggiungere i dettagli dei gruppi sanguigni di ogni singolo studente della classe 10. Aggiungeremo una nuova colonna per questo e la chiameremo "Blood_group".

Il nostro frame di dati è simile al seguente.

Codice:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Produzione:

Codice:

tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)

Produzione:

Elimina riga e colonna dal riquadro dati

Per eliminare riga e colonna dal frame di dati utilizziamo la seguente implementazione del codice.

1. Elimina colonna

Codice:

print(tenthclass)

Produzione:

In questo frame di dati se dobbiamo eliminare la variabile del gruppo sanguigno (colonna più a destra), passeremo il codice seguente.

Codice:

tenthclass$Blood_group = NULL
print(tenthclass)

Produzione:

Bypassando il comando NULL possiamo rimuovere direttamente la variabile dal nostro frame di dati.

2. Elimina riga

Codice:

print(tenthclass)

Produzione:

Ora considera una situazione in cui non abbiamo bisogno di segni di John, quindi dobbiamo rimuovere la riga più in alto.

Codice:

tenthclass = tenthclass(-1, ) print(tenthclass)

Produzione:

Aggiorna dati nella cornice dati

Codice:

print(tenthclass)

Produzione:

Supponiamo che Sam abbia segnato 98 punti, ma secondo i nostri marchi di frame di dati sono 87. Quindi possiamo passare il codice qui sotto per correggerlo.

Codice:

tenthclass$Marks(2) = 98
print(tenthclass)

Produzione:

Conclusione

I frame di dati sono una forma molto comune dell'affermazione del problema. È un elenco della variabile dello stesso numero di righe con ID riga univoci. Questo articolo ci aiuta a sapere come possiamo aggiungere una riga, aggiungere una colonna, eliminare una riga, eliminare una colonna del frame di dati e spiega anche come possiamo aggiornare i dati nel frame di dati.

Articoli consigliati

Questa è una guida ai frame di dati in R. Qui discutiamo i diversi passaggi per creare frame di dati e come estrarre i dati dai frame di dati in R. Puoi anche leggere i seguenti articoli per saperne di più-

  1. Primi 5 tipi di dati in R
  2. Elenco dei pacchetti R utili
  3. R File CSV
  4. R Funzioni del programma - Importanza
  5. Fattore in R con vantaggi