Panoramica di ANOVA a due vie in R
L'ANOVA a due vie (analisi della varianza) ci aiuta a comprendere la relazione tra una variabile dipendente continua e due variabili indipendenti categoriali. In questo argomento, impareremo l'ANOVA a due vie in R.
Di seguito sono riportate le ipotesi di interesse nell'ambito dell'ANOVA a due vie
- H₀: chiamalo l'effetto principale che è il primo fattore che dipende dalla variabile continua
- H: l'effetto principale riguarda anche l'effetto sulla seconda variabile sulla variabile continua dipendente.
- H: L' interazione è l'effetto combinato della prima variabile del secondo fattore sulla variabile dipendente
Di seguito sono riportate le norme che un ANOVA a due vie deve soddisfare.
- Le osservazioni devono essere indipendenti
- Le osservazioni dovrebbero essere normalmente distribuite.
- Dovrebbe esserci uguale varianza nelle osservazioni
- Nessun valore anomalo nel design
- Gli errori dovrebbero essere indipendenti.
Nota
Dobbiamo trasformare i nostri dati in caso di violazione della normalità e della varianza uguale.
Esempio di ANOVA a due vie in R
Eseguiamo un test ANOVA a una via sul set di dati sui livelli di cancro che contiene 48 righe e 3 variabili di dati:
Tempo impiegato: tempo di sopravvivenza di un animale
Diversi livelli di cancro 1 - 3
Trattamento: trattamenti usati da 1-3
Prima di testare, abbiamo bisogno dei seguenti dati in mano.
- Importare i dati
- Rimuovi la variabile non necessaria
- Converti le variabili (livelli di Cancro) come livello ordinato.
Di seguito è riportato il set di dati.
Osservazioni: 48
Variabili: 3
tempo di sopravvivenza 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …
livelli di cancro 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Trattamento A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
obiettivi
- H: nessun cambiamento nel tempo medio di sopravvivenza tra i gruppi
- H: il tempo di sopravvivenza è diverso per almeno un gruppo.
passi
- Controlla i livelli di cancro. Possiamo vedere tre valori di carattere perché li convertiamo in fattori con un verbo mutato.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Calcola deviazione media e standard
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Produzione:
Un mazzo: 3 x 4
cancerlevels count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- Nel passaggio tre, è possibile verificare graficamente se esiste una differenza tra le distribuzioni. Si noti che si include il punto jitter.
- Esegui il test con il comando AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Sintassi:
y ~ X1 + X2 +… + Xn (X1 + X2 +… si riferisce alle variabili indipendenti)
y ~. Utilizzare tutte le restanti variabili come variabili indipendenti
Assicurati di salvare il modello e stampare il riepilogo.
Codice
- aov (time ~ cancerlevels, data = df): esegui il test ANOVA con la seguente formula
- riepilogo (anova_one_way): stampa il riepilogo del test
Df Somma Sq Media Sq Valore F Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Residui 45 1.972 0, 0438
-
Signif. codici: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1
Il valore p è inferiore alla soglia 0, 05. La differenza statistica è indicata da '*' nel caso precedente.
Test di sola andata per Anova a due vie in R
Vediamo come il test unidirezionale può essere esteso all'ANOVA bidirezionale. Il test è simile all'ANOVA a senso unico ma la formula differisce e aggiunge un'altra variabile di gruppo alla formula.
y = x1 + x2
- H0 : le medie sono uguali per entrambe le variabili (variabili dei fattori)
- H3 : i mezzi sono diversi per entrambe le variabili
Aggiungi variabili trattamento al nostro modello. Questa variabile indica il trattamento somministrato al paziente. Sei interessato a vedere se esiste una dipendenza statistica tra i livelli di cancro e il trattamento dato al paziente.
Adattiamo il nostro codice aggiungendo un trattamento con l'altra variabile indipendente.
Df Somma Sq Media Sq Valore F Pr (> F)
Livelli di cancro 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Trattare 3 0.9212 0.3071 12.27 6.7e-06 ***
Residui 42 1.0509 0.0250
Sia i livelli di cancro che il trattamento sono statisticamente diversi da 0. Con questo, possiamo respingere l'ipotesi NULL. Inoltre, conferma che la modifica del trattamento o del tipo di tumore influisce sul tempo di sopravvivenza.
Test
ANOVA a una via: H3 - La media è diversa per almeno un gruppo
ANOVA a due vie: H3 - La media è diversa per entrambi i gruppi.
Differenza tra ANOVA a senso unico e bidirezionale
Differenze tra ANOVA a una via e ANOVA a due vie
ANOVA a senso unico | ANOVA a due vie |
Progettato per consentire test di uguaglianza tra 3 o più mezzi | Progettato per valutare l'interrelazione di due variabili indipendenti su una variabile dipendente. |
Coinvolge una variabile indipendente | Coinvolge due variabili indipendenti |
Analizzato in 3 o più gruppi categorici. | Confronta più gruppi di due fattori |
Deve soddisfare due principi: replica e randomizzazione | Deve soddisfare tre principi che sono la replica, la randomizzazione e il controllo locale. |
Vantaggi dell'ANOVA bidirezionale
- Nell'esempio sopra, l'età e il genere nel nostro esempio aiutano a ridurre la variazione degli errori, rendendo il design più efficiente.
- L'ANOVA a due vie ci consente di testare l'effetto di due fattori contemporaneamente.
Applicazioni di ANOVA
- Confronto del chilometraggio di diversi veicoli, carburante e tipi di strade.
- Conoscere l'impatto della temperatura, della pressione o della concentrazione chimica su alcune reazioni chimiche (reattori di potenza, impianti chimici, ecc.)
- Impatto di diversi catalizzatori sulle velocità di reazione chimica
- Comprensione dell'impatto degli annunci pubblicitari e del diverso numero di risposte dei clienti.
- Impatto delle prestazioni, della qualità e della velocità di produzione in biologia (processo basato sul numero di cellule in cui vengono suddivisi)
Articoli consigliati
Questa è una guida all'ANOVA a due vie in R. Qui discutiamo esempi, obiettivi, passaggi e differenza tra ANOVA a una e due vie. Puoi anche dare un'occhiata ai seguenti articoli per saperne di più -
- ANOVA in R
- Come interpretare i risultati usando ANOVA Test
- Regressione vs ANOVA
- GLM in R