Introduzione alle etichette Boxplot in R

Le etichette Boxplot aiutano nella visualizzazione dei dati distribuiti in R. Il grafico rappresenta la media, la mediana e la varianza. I valori sono indicati come input per la funzione boxplot (). La funzione Boxplot () crea il boxplot con l'aiuto di dati di input dati. Boxplot può essere creato per singole variabili o un gruppo.

Tracciare il grafico del diagramma a scatole

  • Abbiamo bisogno di cinque input stimati come media, varianza, mediana, primo e terzo quartile.
  • Identificare se ci sono valori anomali nei dati.
  • Progetta il modello per tracciare i dati.

Parametri nella funzione boxplot ()

  1. formula: questo parametro consente di versare valori numerici in diversi gruppi.
  2. Dati :: Immettere i dati che contengono un frame di dati o un elenco.
  3. Sottoinsieme: parametro vettoriale facoltativo per specificare un sottoinsieme per la stampa.
  4. xlab: annotazione dell'asse x
  5. ylab: annotazione sull'asse y.
  6. intervallo: intervallo specifica le estensioni della trama.
  7. azione: specifica cosa succede quando c'è un valore nullo. Ignora la risposta o il valore.

Creazione di dati casuali

Siamo in grado di creare dati campione casuali tramite la funzione rnorm ().

Ora usiamo rnorm () per creare dati campione casuali di 10 valori.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Il comando precedente genera 10 valori casuali con media 3 e deviazione standard = 2 e la memorizza nel frame di dati.

Quando stampiamo i dati otteniamo l'output di seguito.

Stat1

1 2.662022

2 2.184315

3 5.974787

4 4.536203

5 4.808296

6 3.817232

7 1.135339

8 1.583991

9 3.308994

10 4.649170

Possiamo convertire lo stesso input (dati) nella funzione boxplot che genera la trama.

Aggiungiamo più valori ai dati e vediamo come cambia la trama.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Aggiunta di più valori casuali e utilizzo per rappresentare un grafico.

Di seguito sono riportati i valori memorizzati nella variabile di dati.

STAT 1STAT 2STAT 3STAT 4
3.7954654, 21, 864 mila5.8275852.157315
0.9117264, 09, 119 mila6.2608112, 26, 594 mila
3.7078283, 35, 987 mila5, 88, 945 mila3.714557
0.1157724, 51235.9348582, 40, 645 mila
0.6975562, 15, 945 mila6, 81, 147 mila2.571304
5.1292313, 26986.2500683.025175
5.4041014, 38, 939 mila5.6700612, 9901
1.4550663, 13, 059 mila5.6923232, 69, 693 mila
0.8686365, 42, 311 mila5.4154352.674768
2, 14, 113 mila3, 90, 728 mila6.2060592.806656

Di seguito è riportato il grafico a riquadro con 40 valori. Abbiamo 1-7 numeri sull'asse y e stat1 su stat4 sull'asse x.

Possiamo modificare l'allineamento del testo sull'asse x usando un altro parametro chiamato las = 2.

Analisi del grafico delle etichette R Boxplot

Abbiamo fornito l'input nel frame di dati e vediamo la trama sopra.

Per comprendere i dati, esaminiamo i valori stat1.

La trama rappresenta tutti e 5 i valori. A partire dal valore minimo dal basso e quindi dal terzo quartile, media, primo quartile e valore minimo.

La trama sopra ha allineamento del testo orizzontale sull'asse x.

Cambiare il colore

In tutti gli esempi sopra, abbiamo visto la trama in bianco e nero. Vediamo come cambiare il colore nella trama.

Possiamo aggiungere il parametro col = color nella funzione boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Di seguito possiamo vedere l'output della trama in rosso.

Utilizzando lo stesso codice sopra, possiamo aggiungere più colori alla trama.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Aggiunta di etichette

Possiamo aggiungere etichette usando i parametri xlab, ylab nella funzione boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Usando il parametro principale, possiamo aggiungere un'intestazione alla trama.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Il parametro Notch viene utilizzato per rendere più comprensibile la trama. Poiché le mediane da stat1 a stat4 non corrispondono nella trama sopra.

Vantaggi e svantaggi del diagramma a scatole

vantaggi

  • Riassumendo grandi quantità di dati è facile con le etichette boxplot.
  • Visualizza l'intervallo e la distribuzione dei dati sull'asse.
  • Indica simmetria e asimmetria
  • Aiuta a identificare i valori anomali nei dati.

svantaggi

  • Può essere utilizzato solo per dati numerici.
  • Se ci sono discrepanze nei dati, la trama della scatola non può essere accurata.

Appunti:

  1. I grafici devono essere etichettati correttamente.
  2. Le scale sono importanti; il cambio di scala può dare ai dati una visione diversa.
  3. Il confronto dei dati con le scale corrette dovrebbe essere coerente

Conclusione: etichette R Boxplot

Il raggruppamento dei dati è semplificato con l'aiuto di grafici a scatole. Il diagramma a scatole supporta più variabili e varie ottimizzazioni. Possiamo anche variare le scale in base ai dati.

I grafici a scatole possono essere utilizzati per confrontare varie variabili o insiemi di dati.

L'usabilità del boxplot è semplice e conveniente. Abbiamo bisogno di dati coerenti e di etichette adeguate. I grafici a scatole sono spesso utilizzati nella scienza dei dati e persino dai team di vendita per raggruppare e confrontare i dati. Boxplot offre approfondimenti sul potenziale dei dati e ottimizzazioni che possono essere fatte per aumentare le vendite.

Boxplot è un modo interessante per testare i dati che fornisce approfondimenti sull'impatto e il potenziale dei dati.

Articoli consigliati

Questa è una guida alle etichette R Boxplot. Qui discutiamo della funzione Parametri sotto boxplot (), come creare dati casuali, cambiare il colore e l'analisi del grafico insieme ai Vantaggi e Svantaggi. Puoi anche leggere il seguente articolo per saperne di più -

  1. Tipi di visualizzazione dei dati
  2. Implementazione del data warehouse
  3. Tecniche di scienza dei dati
  4. Che cos'è il cubo di dati?

Categoria: