Introduzione alla regressione multivariata
- Il termine in multivariato significa modello con più di una variabile
- La regressione multivariata fa parte delle statistiche multivariate.
- La regressione multivariata è una tecnica utilizzata per stimare un singolo modello di regressione quando esiste più di una variabile di risultato.
- La regressione multivariata utilizzava comunemente un algoritmo di apprendimento automatico che è un algoritmo di apprendimento supervisionato.
Perché il singolo modello di regressione non funziona?
- Come noto, l'analisi di regressione viene utilizzata principalmente per esplorare la relazione tra una variabile dipendente e indipendente.
- Nel mondo reale, ci sono molte situazioni in cui molte variabili indipendenti sono influenzate da altre variabili per cui dobbiamo passare a opzioni diverse rispetto a un singolo modello di regressione che può prendere solo una variabile indipendente.
Che cos'è la regressione multivariata?
- La regressione multivariata aiuta a misurare l'angolo di più di una variabile indipendente e più di una variabile dipendente. Trova la relazione tra le variabili (linearmente correlate).
- Ha usato per prevedere il comportamento della variabile risultato e l'associazione delle variabili predittive e come stanno cambiando le variabili predittive.
- Può essere applicato a molti campi pratici come la politica, l'economia, la medicina, i lavori di ricerca e molti diversi tipi di imprese.
- La regressione multivariata è una semplice estensione della regressione multipla.
- La regressione multipla viene utilizzata per prevedere e scambiare i valori di una variabile in base al valore collettivo di più di un valore delle variabili predittive.
- In primo luogo, faremo un esempio per comprendere l'uso della regressione multivariata, dopodiché cercheremo la soluzione a tale problema.
Esempi di regressione multivariata
- Se la Società di e-commerce ha raccolto i dati dei suoi clienti come Età, storia acquistata di un cliente, genere e azienda vogliono trovare la relazione tra queste diverse persone a carico e variabili indipendenti.
- Un istruttore di palestra ha raccolto i dati del suo cliente che stanno arrivando nella sua palestra e desidera osservare alcune cose del cliente che sono salute, abitudini alimentari (che tipo di prodotto cliente consuma ogni settimana), il peso del cliente. Questo vuole trovare una relazione tra queste variabili.
Come hai visto nei due esempi precedenti, in entrambe le situazioni esiste più di una variabile, alcune sono dipendenti e altre indipendenti, quindi la singola regressione non è sufficiente per analizzare questo tipo di dati.
Ecco la regressione multivariata che entra in scena.
1. Selezione funzionalità -
La selezione delle funzionalità svolge il ruolo più importante nella regressione multivariata.
Trovare la funzione necessaria per trovare quale variabile dipende da questa funzione.
2. Funzionalità di normalizzazione -
Per una migliore analisi, è necessario ridimensionare le funzionalità per inserirle in un intervallo specifico. Possiamo anche cambiare il valore di ogni funzione.
3. Selezionare la funzione Perdita e Ipotesi -
La funzione di perdita calcola la perdita quando l'ipotesi prevede un valore errato.
E l'ipotesi significa valore previsto dalla variabile caratteristica.
4. Impostare i parametri di ipotesi -
Impostare il parametro di ipotesi che può ridurre la funzione di perdita e prevedere.
5. Ridurre al minimo la funzione di perdita-
Ridurre al minimo la perdita utilizzando un algoritmo di minimizzazione della perdita e utilizzarlo nel set di dati che può aiutare a regolare i parametri di ipotesi. Una volta che la perdita è ridotta al minimo, può essere utilizzata per la previsione.
Esistono molti algoritmi che possono essere utilizzati per ridurre la perdita come la discesa del gradiente.
6. Verifica la funzione di ipotesi -
Controllare la funzione di ipotesi su come è corretta la previsione dei valori, testarlo su dati di test.
I passaggi per seguire l'archivio Regressione multivariata
1) Importa le librerie comuni necessarie come numpy, panda
2) Leggi il set di dati usando la libreria dei panda
3) Come abbiamo discusso sopra, dobbiamo normalizzare i dati per ottenere risultati migliori. Perché la normalizzazione perché ogni funzione ha un intervallo di valori diverso.
4) Creare un modello in grado di archiviare la regressione se si utilizza l'equazione della regressione lineare
Y = mx + c
In cui x è dato input, m è una linea di slop, c è costante, y è la variabile di output.
5) Addestra il modello usando l'iperparametro. Comprendere l'iperparametro impostarlo in base al modello. Come tasso di apprendimento, epoche, iterazioni.
6) Come discusso sopra come l'ipotesi gioca un ruolo importante nell'analisi, controlla l'ipotesi e misura la funzione di perdita / costo.
7) La funzione di perdita / costo ci aiuterà a misurare come il valore dell'ipotesi sia vero e preciso.
8) Ridurre al minimo la funzione di perdita / costo aiuterà il modello a migliorare la previsione.
9) L'equazione di perdita può essere definita come una somma della differenza quadrata tra il valore previsto e il valore effettivo diviso per il doppio della dimensione del set di dati.
10) Per ridurre al minimo la funzione Perdita / costo usa la discesa gradiente, inizia con un valore casuale e trova il punto in cui la loro funzione di perdita è minima.
Seguendo quanto sopra possiamo implementare la regressione multivariata
Vantaggi della regressione multivariata
- La tecnica multivariata consente di trovare una relazione tra variabili o caratteristiche
- Aiuta a trovare una correlazione tra variabili indipendenti e variabili dipendenti.
Vantaggi della regressione multivariata
- Le tecniche multivariate sono un calcolo matematico poco complesso e di alto livello
- L'output del modello di regressione multivariata non è facilmente interpretabile e talvolta perché alcuni output di perdita ed errore non sono identici.
- Non può essere applicato a un piccolo set di dati poiché i risultati sono più semplici in set di dati più grandi.
Conclusione: regressione multivariata
- Lo scopo principale di utilizzare la regressione multivariata è quando sono disponibili più di una variabile e in tal caso, la regressione lineare singola non funzionerà.
- Principalmente il mondo reale ha più variabili o caratteristiche quando entrano in gioco più variabili / caratteristiche vengono utilizzate regressioni multivariate.
Articoli consigliati
Questa è una guida alla regressione multivariata. Qui discutiamo l'introduzione, esempi di regressione multivariata insieme ai vantaggi e ai vantaggi. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -
- Formula di regressione
- Corso di data science a Londra
- Operatori SAS
- Tecniche di scienza dei dati
- Variabili in JavaScript
- Principali differenze di regressione rispetto alla classificazione