Formula dei valori anomali (sommario)

  • Formula dei valori anomali
  • Esempi di formula outlier (con modello Excel)

Formula dei valori anomali

In statistica, i valori anomali sono i due punti insoliti a distanza estrema nei set di dati indicati. Il valore estremamente alto e i valori estremamente bassi sono i valori anomali di un set di dati. Questo è molto utile per trovare difetti o errori. Come dice il nome, i valori anomali sono valori che si trovano all'esterno del resto dei valori nel set di dati. Esempio, considera gli studenti di ingegneria e immagina di avere nani nella loro classe. Quindi i nani sono le persone che sono estremamente basse in altezza rispetto ad altre persone di altezza normale. Quindi questo è il valore anomalo in questa classe. I valori anomali possono essere calcolati usando il metodo Tukey.

La formula per gli outlier -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Esempi di formula outlier (con modello Excel)

Facciamo un esempio per comprendere meglio il calcolo della formula di valori anomali.

Puoi scaricare questo modello di valori anomali qui - Modello di valori anomali

Formula dei valori anomali - Esempio n. 1

Considerare il seguente set di dati e calcolare i valori anomali per il set di dati.

Set di dati = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Ordine crescente di set di dati:

Il set di dati della mediana dell'ordine crescente è calcolato come:

In questo set di dati, il numero totale di dati è 11. Quindi n = 11. Mediana = 11 + 1/2 = 12/2 = 6. Quindi il valore che si trova nella sesta posizione in questo set di dati è la mediana.

Quindi valore mediano = 34.

Dividi il set di dati in 2 metà usando la mediana.

Il set di dati della mediana della metà inferiore e della metà superiore viene calcolato come:

  • Nella metà inferiore 2, 5, 6, 7, 23, se troviamo la mediana come quella che abbiamo trovato nel passaggio 2, il valore mediano sarebbe 6. Quindi Q1 = 6.
  • Nella metà superiore 45, 56, 89, 98.309 se troviamo la mediana come quella che abbiamo trovato nel passaggio 2, il valore mediano sarebbe 89. Quindi Q3 = 89.

L'IQR viene calcolato utilizzando la formula indicata di seguito

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

Il valore anomalo inferiore viene calcolato utilizzando la formula indicata di seguito

Lower Outlier = Q1 - (1.5 * IQR)

  • Outlier inferiore = 6 - (1, 5 * 83)
  • Valore anomalo inferiore = -118, 5

Il valore anomalo superiore viene calcolato utilizzando la formula indicata di seguito

Più alto valore anomalo = Q3 + (1.5 * IQR)

  • Valore anomalo superiore = 89 + (1, 5 * 83)
  • Valore anomalo superiore = 213, 5

Ora recupera questi valori nel set di dati -118.5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Valori che scendono al di sotto del valore del lato inferiore e sopra al lato superiore sono il valore anomalo. Per questo set di dati, 309 è il valore anomalo.

Formula dei valori anomali - Esempio n. 2

Considerare il seguente set di dati e calcolare i valori anomali per il set di dati.

Set di dati = 45, 21, 34, 90, 109.

Ordine crescente di set di dati:

Il set di dati della mediana dell'ordine crescente è calcolato come:

In questo set di dati, il numero totale di dati è 5. Quindi n = 5. Mediana = 5 + 1/2 = 6/2 = 3. Quindi il valore che si trova in terza posizione in questo set di dati è la mediana.

Quindi valore mediano = 45.

Dividi il set di dati in 2 metà usando la mediana.

Il set di dati della mediana della metà inferiore e della metà superiore viene calcolato come:

  • Q1 = 27.5
  • Q3 = 89

L'IQR viene calcolato utilizzando la formula indicata di seguito

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Il valore anomalo inferiore viene calcolato utilizzando la formula indicata di seguito

Lower Outlier = Q1 - (1.5 * IQR)

  • Outlier inferiore = 27, 5 - (1, 5 * 72)
  • Outlier inferiore = -80, 5

Il valore anomalo superiore viene calcolato utilizzando la formula indicata di seguito

Più alto valore anomalo = Q3 + (1.5 * IQR)

  • Valore anomalo superiore = 99, 5 + (1, 5 * 72)
  • Valore anomalo superiore = 207, 5

Spiegazione

Passaggio 1: disporre tutti i valori nel set di dati indicato in ordine crescente.

Passaggio 2: trovare il valore mediano per i dati ordinati. La mediana può essere trovata utilizzando la seguente formula. Il seguente calcolo fornisce semplicemente la posizione del valore mediano che risiede nella data impostata.

Mediana = (n + 1) / 2

Dove n è il numero totale di dati disponibili nel set di dati.

Passaggio 3: trovare il valore Quartile inferiore Q1 dal set di dati. Per trovare questo, usando il valore mediano dividere il set di dati in due metà. Dalla metà inferiore del set di valori, trova la mediana per quel set inferiore che è il valore Q1.

Passaggio 4: trovare il valore Quartile superiore Q3 dal set di dati. È esattamente come il passaggio precedente. Invece della metà inferiore, dobbiamo seguire la stessa procedura la metà superiore di valori.

Passaggio 5: trovare il valore IQR intervallo interquartile. Per trovare il valore Deduct Q1 da Q3.

IQR = Q3-Q1

Passaggio 6: trova il valore Extreme interno. Un'estremità che cade al di fuori della parte inferiore, che può anche essere definita un valore anomalo minore. Moltiplicare il valore IQR per 1, 5 e dedurre questo valore da Q1 ti dà l'estremo inferiore interno.

Lower Outlier = Q1 - (1.5 * IQR)

Passaggio 7: trovare il valore Outer Extreme. Un fine che cade al di fuori del lato superiore, che può anche essere definito un valore anomalo maggiore. Moltiplicare il valore IQR per 1, 5 e sommare questo valore con Q3 ti dà l'estremo superiore estremo.

Più alto valore anomalo = Q3 + (1.5 * IQR)

Passaggio 8: I valori che non rientrano in questi estremi interni ed esterni sono i valori anomali per il set di dati specificato.

Rilevanza e usi della formula dei valori anomali

I valori anomali sono molto importanti in qualsiasi problema di analisi dei dati. Il valore anomalo mostra incoerenza in qualsiasi set di dati in quanto è definito come i valori distanti non comuni nel set di dati dall'uno all'altro. Questo è molto utile per trovare eventuali difetti che si sono verificati nel set di dati. Perché quando si inserisce un errore nel set di dati, questo influisce sulla media e sulla mediana, pertanto possono ottenere grandi deviazioni nel risultato se gli outlier si trovano nel set di dati. Quindi è essenziale scoprire valori anomali dal set di dati al fine di evitare seri problemi nell'analisi statistica.

Articoli consigliati

Questa è stata una guida alla formula degli Outlier. Qui discutiamo come calcolare gli Outlier insieme ad esempi pratici e template Excel scaricabili. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Guida alla formula di fascia media
  2. Esempi di formula salariale
  3. Calcolatrice per la formula DPMO
  4. Come calcolare la distribuzione T?
  5. Formula di deviazione quartile | Esempi