Introduzione all'istogramma in R

In questo articolo, inizieremo con l'istogramma di base nell'implementazione e nelle personalizzazioni di R. L'istogramma svolge un ruolo importante nell'analisi dei dati per la visualizzazione dei dati. La programmazione R è un ambiente speciale per il calcolo statistico e i fondamenti per la scienza dei dati. Nella programmazione R i set di dati e le funzioni sono raggruppati sotto forma di pacchetti. La maggior parte dei programmi di analisi visiva fanno uso di istogrammi e rendono la larghezza del cestino predefinita. Consentono di comprendere rapidamente le informazioni sui dati, che è un ruolo primario nella scienza dei dati. Qui costruiremo un istogramma usando i comandi R.

Che cos'è l'istogramma?

L'istogramma è una rappresentazione grafica di una distribuzione del set di dati con la quale è possibile analizzare facilmente quale fattore ha una maggiore quantità di dati e il minor numero di dati. In altre parole, l'istogramma consente di eseguire grafici di frequenza cumulativa sull'asse xe sull'asse y. In realtà, gli istogrammi accettano sia dati raggruppati che non raggruppati. Per un istogramma di dati raggruppati sono costruiti considerando i limiti di classe, mentre i dati non raggruppati è necessario formare la distribuzione di frequenza raggruppata. Aiutano ad analizzare in modo efficace l'intervallo e la posizione dei dati. Durante la distribuzione dei dati viene applicata una struttura comune di istogrammi come normale, inclinata, scogliera.

A differenza di una barra, l'istogramma del grafico non ha spazi vuoti tra le barre e le barre qui sono denominate come bin con cui i dati sono rappresentati a intervalli uguali. Istogramma Prende la variabile continua e si divide in intervalli è necessario scegliere la larghezza del contenitore corretta. La principale differenza tra il grafico a barre e l'istogramma è che il primo utilizza set di dati nominali per tracciare mentre l'istogramma traccia i set di dati continui. R usa la funzione hist () per creare istogrammi. Questa funzione hist () utilizza un vettore di valori per tracciare l'istogramma. L'istogramma comprende un intervallo di valori continui dell'asse x, l'asse y traccia i valori frequenti dei dati nell'asse x con barre di variazioni delle altezze.

Sintassi:

La sintassi per la creazione dell'istogramma è

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Creazione di un istogramma in R

Per l'analisi, l'istogramma dello scopo richiede l'importazione in R. R di alcuni set di dati integrati e le sue librerie hanno una varietà di pacchetti e funzioni grafiche. Qui utilizziamo il set di dati Swiss e Air Passengers. Per calcolare un istogramma per un dato valore dei dati viene utilizzata la funzione hist () insieme a un segno $ per selezionare la determinata colonna di dati dal set di dati per creare un istogramma.

L'esempio seguente calcola un istogramma del valore dei dati nella colonna Esame del set di dati denominato Swiss.

Esempio 1: creiamo un istogramma semplice

Codice:

hist (swiss $Examination)

Produzione:

Hist viene creato per un set di dati svizzero con esame della colonna. questo semplicemente traccia un bin con frequenza e asse x.

Esempio 2: istogramma con più argomenti

Per raggiungere una migliore comprensione degli istogrammi, è necessario aggiungere più argomenti alla funzione hist per ottimizzare la visualizzazione del grafico. Modifica dell'etichetta xey in un intervallo di valori Gli argomenti xlim e ylim vengono aggiunti alla funzione.

Esempio:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Produzione:

Il codice sopra traccia un istogramma per i valori del set di dati Air Passengers, dà il titolo di "Istogramma per più arg", l'etichetta dell'asse x come "Elenco nomi", con un bordo verde e un colore giallo alle barre, limitando il valore compreso tra 100 e 600, i valori stampati sull'asse y di 2 e portando la larghezza del cestino a 5.

Aggiunta di due colori diversi alla barra

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Produzione:

Aggiunta di più barre all'istogramma

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Produzione:

Esempio 3: Istogramma in R Restituisce un valore

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Produzione:

Esempio 4: utilizzo di Break Argument per modificare la larghezza del cestino

Per avere più punti di interruzione tra la larghezza, si preferisce utilizzare il valore nella funzione c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Produzione:

Il grafico sopra mostra la larghezza della barra attraverso i valori di sequenza.

Esempio 5: implementazione della curva di distribuzione normale nell'istogramma

Useremo il set di dati "swiss" per i valori dei dati per tracciare un grafico. Qui la curva di funzione () viene utilizzata per visualizzare la linea di distribuzione.

Codice:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Produzione:

Esempio 6: rappresentazione della distribuzione della probabilità

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Creazione di diagrammi di densità nell'istogramma in R

La distribuzione di una variabile viene creata utilizzando la densità di funzione (). Di seguito è riportato l'esempio con i set di dati mtcars. I grafici di densità aiutano nella distribuzione della forma.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Produzione:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Il seguente istogramma in R mostra l'altezza come esame sull'asse x e la densità viene tracciata sull'asse y.

Produzione:

Conclusione

Questo è tutto sull'istogramma e precisamente l'istogramma è il modo più semplice per comprendere i dati. Come abbiamo visto con un istogramma, potremmo disegnare grafici singoli, multipli, usando la larghezza del cestino, la correzione degli assi, la modifica dei colori, ecc. L'istogramma aiuta a visualizzare le diverse forme dei dati. Infine, abbiamo visto come l'istogramma consente di analizzare set di dati e punti medi come etichette della classe. L'istogramma aiuta a cambiare gli intervalli per produrre una descrizione avanzata dei dati e funziona, in particolare con i dati numerici. gli istogrammi sono più preferiti nell'analisi a causa del loro vantaggio di visualizzare un ampio set di dati. Sulla base dell'output abbiamo potuto distorcere visivamente i dati e fare semplici ipotesi.

Articoli consigliati

Questa è stata una guida sull'istogramma in R. Qui abbiamo discusso il concetto, la sintassi e come creare un istogramma in R con esempi. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Esempi di istogrammi
  2. Carriera nella programmazione R.
  3. Diagramma di Gantt nel tableau
  4. Carriera nella programmazione informatica
  5. Come creare un grafico a linee in R?

Categoria: