ANOVA bidirezionale in R - Test ANOVA bidirezionale in R Guida facile - Esempi

Sommario:

Anonim

Panoramica di ANOVA a due vie in R

L'ANOVA a due vie (analisi della varianza) ci aiuta a comprendere la relazione tra una variabile dipendente continua e due variabili indipendenti categoriali. In questo argomento, impareremo l'ANOVA a due vie in R.

Di seguito sono riportate le ipotesi di interesse nell'ambito dell'ANOVA a due vie

  1. H₀: chiamalo l'effetto principale che è il primo fattore che dipende dalla variabile continua
  2. H: l'effetto principale riguarda anche l'effetto sulla seconda variabile sulla variabile continua dipendente.
  3. H: L' interazione è l'effetto combinato della prima variabile del secondo fattore sulla variabile dipendente

Di seguito sono riportate le norme che un ANOVA a due vie deve soddisfare.

  1. Le osservazioni devono essere indipendenti
  2. Le osservazioni dovrebbero essere normalmente distribuite.
  3. Dovrebbe esserci uguale varianza nelle osservazioni
  4. Nessun valore anomalo nel design
  5. Gli errori dovrebbero essere indipendenti.

Nota

Dobbiamo trasformare i nostri dati in caso di violazione della normalità e della varianza uguale.

Esempio di ANOVA a due vie in R

Eseguiamo un test ANOVA a una via sul set di dati sui livelli di cancro che contiene 48 righe e 3 variabili di dati:

Tempo impiegato: tempo di sopravvivenza di un animale

Diversi livelli di cancro 1 - 3

Trattamento: trattamenti usati da 1-3

Prima di testare, abbiamo bisogno dei seguenti dati in mano.

  • Importare i dati
  • Rimuovi la variabile non necessaria
  • Converti le variabili (livelli di Cancro) come livello ordinato.

Di seguito è riportato il set di dati.

Osservazioni: 48

Variabili: 3

tempo di sopravvivenza 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …

livelli di cancro 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …

Trattamento A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

obiettivi

  1. H: nessun cambiamento nel tempo medio di sopravvivenza tra i gruppi
  2. H: il tempo di sopravvivenza è diverso per almeno un gruppo.

passi

  • Controlla i livelli di cancro. Possiamo vedere tre valori di carattere perché li convertiamo in fattori con un verbo mutato.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Calcola deviazione media e standard

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Produzione:

Un mazzo: 3 x 4

cancerlevels count_cancerlevels mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • Nel passaggio tre, è possibile verificare graficamente se esiste una differenza tra le distribuzioni. Si noti che si include il punto jitter.
  • Esegui il test con il comando AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Sintassi:

y ~ X1 + X2 +… + Xn (X1 + X2 +… si riferisce alle variabili indipendenti)

y ~. Utilizzare tutte le restanti variabili come variabili indipendenti

Assicurati di salvare il modello e stampare il riepilogo.

Codice

  • aov (time ~ cancerlevels, data = df): esegui il test ANOVA con la seguente formula
  • riepilogo (anova_one_way): stampa il riepilogo del test

Df Somma Sq Media Sq Valore F Pr (> F)

Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***

Residui 45 1.972 0, 0438

-

Signif. codici: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1

Il valore p è inferiore alla soglia 0, 05. La differenza statistica è indicata da '*' nel caso precedente.

Test di sola andata per Anova a due vie in R

Vediamo come il test unidirezionale può essere esteso all'ANOVA bidirezionale. Il test è simile all'ANOVA a senso unico ma la formula differisce e aggiunge un'altra variabile di gruppo alla formula.

y = x1 + x2

  • H0 : le medie sono uguali per entrambe le variabili (variabili dei fattori)
  • H3 : i mezzi sono diversi per entrambe le variabili

Aggiungi variabili trattamento al nostro modello. Questa variabile indica il trattamento somministrato al paziente. Sei interessato a vedere se esiste una dipendenza statistica tra i livelli di cancro e il trattamento dato al paziente.

Adattiamo il nostro codice aggiungendo un trattamento con l'altra variabile indipendente.

Df Somma Sq Media Sq Valore F Pr (> F)

Livelli di cancro 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***

Trattare 3 0.9212 0.3071 12.27 6.7e-06 ***

Residui 42 1.0509 0.0250

Sia i livelli di cancro che il trattamento sono statisticamente diversi da 0. Con questo, possiamo respingere l'ipotesi NULL. Inoltre, conferma che la modifica del trattamento o del tipo di tumore influisce sul tempo di sopravvivenza.

Test

ANOVA a una via: H3 - La media è diversa per almeno un gruppo

ANOVA a due vie: H3 - La media è diversa per entrambi i gruppi.

Differenza tra ANOVA a senso unico e bidirezionale

Differenze tra ANOVA a una via e ANOVA a due vie

ANOVA a senso unicoANOVA a due vie
Progettato per consentire test di uguaglianza tra 3 o più mezziProgettato per valutare l'interrelazione di due variabili indipendenti su una variabile dipendente.
Coinvolge una variabile indipendenteCoinvolge due variabili indipendenti
Analizzato in 3 o più gruppi categorici.Confronta più gruppi di due fattori
Deve soddisfare due principi: replica e randomizzazioneDeve soddisfare tre principi che sono la replica, la randomizzazione e il controllo locale.

Vantaggi dell'ANOVA bidirezionale

  • Nell'esempio sopra, l'età e il genere nel nostro esempio aiutano a ridurre la variazione degli errori, rendendo il design più efficiente.
  • L'ANOVA a due vie ci consente di testare l'effetto di due fattori contemporaneamente.

Applicazioni di ANOVA

  1. Confronto del chilometraggio di diversi veicoli, carburante e tipi di strade.
  2. Conoscere l'impatto della temperatura, della pressione o della concentrazione chimica su alcune reazioni chimiche (reattori di potenza, impianti chimici, ecc.)
  3. Impatto di diversi catalizzatori sulle velocità di reazione chimica
  4. Comprensione dell'impatto degli annunci pubblicitari e del diverso numero di risposte dei clienti.
  5. Impatto delle prestazioni, della qualità e della velocità di produzione in biologia (processo basato sul numero di cellule in cui vengono suddivisi)

Articoli consigliati

Questa è una guida all'ANOVA a due vie in R. Qui discutiamo esempi, obiettivi, passaggi e differenza tra ANOVA a una e due vie. Puoi anche dare un'occhiata ai seguenti articoli per saperne di più -

  1. ANOVA in R
  2. Come interpretare i risultati usando ANOVA Test
  3. Regressione vs ANOVA
  4. GLM in R