Introduzione alla regressione polinomiale

La regressione è definita come il metodo per trovare la relazione tra le variabili indipendenti e dipendenti per prevedere il risultato. Il primo modello di regressione polinomiale fu usato nel 1815 da Gergonne. Viene utilizzato per trovare la linea più adatta utilizzando la linea di regressione per prevedere i risultati. Esistono molti tipi di tecniche di regressione, la regressione polinomiale è una di queste. Prima di capirlo, è consigliabile avere una conoscenza adeguata della regressione lineare, quindi sarà facile contrassegnare le differenze tra loro.

Perché la regressione polinomiale?

  • Questa è una delle tecniche di regressione che viene utilizzata dai professionisti per prevedere il risultato. È definita come la relazione tra le variabili indipendenti e dipendenti quando la variabile dipendente è correlata alla variabile indipendente avente un ennesimo grado. Non richiede che la relazione tra variabili dipendenti e indipendenti sia lineare, quindi se la linea è una curva di quanto potrebbe avere qualsiasi termine polinomiale.
  • La principale differenza tra la regressione lineare e quella polinomiale è che la regressione lineare richiede che le variabili dipendenti e indipendenti siano correlate in modo lineare, mentre ciò potrebbe adattarsi meglio alla linea se includiamo un grado superiore al termine variabile indipendente nell'equazione. L'equazione della regressione polinomiale avente un ennesimo grado può essere scritta come:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX n

  • Se aggiungiamo gradi più alti come quadratico, trasforma la linea in una curva che si adatta meglio ai dati. Generalmente, viene utilizzato quando i punti nel set di dati sono sparsi e il modello lineare non è in grado di descrivere chiaramente il risultato. Dobbiamo sempre tenere d'occhio Overfitting e Underfitting considerando questi gradi all'equazione.
  • È meglio considerare il grado che attraversa tutti i punti dati, ma a volte prendere un grado più alto come 10 o 20 può passare attraverso tutti i punti dati e ridurre l'errore, ma cattura anche il rumore dei dati che si sta adattando al modello e può essere evitato aggiungendo più campioni al set di dati di allenamento. Pertanto, è sempre consigliabile scegliere un grado ottimale per adattarsi al modello.

Esistono due tecniche che vengono utilizzate per decidere il grado dell'equazione:

  • Selezione diretta: è il metodo per aumentare il grado fino a quando non è abbastanza significativo per definire il modello.
  • Selezione all'indietro: è il metodo per ridurre il grado fino a quando non è abbastanza significativo per definire il modello.

Procedura per applicare la regressione polinomiale

Si prega di trovare i seguenti passaggi o procedure per applicare la regressione polinomiale a qualsiasi set di dati:

Passaggio 1: importare il rispettivo set di dati su qualsiasi piattaforma (R o Python) e installare i pacchetti richiesti richiesti per l'applicazione del modello.

Passaggio 2: dividere il set di dati in set di training e test in modo da poter applicare l'algoritmo al set di dati di training e testarlo utilizzando il set di dati di test.

Passaggio 3: applicare i metodi di analisi dei dati esplorativi per studiare lo sfondo dei dati come media, mediana, modalità, primo quartile, secondo quartile, ecc.

Passaggio 4: applicare l'algoritmo di regressione lineare al set di dati e studiare il modello.

Passaggio 5: applicare l'algoritmo di regressione polinomiale al set di dati e studiare il modello per confrontare i risultati RMSE o R quadrato tra regressione lineare e regressione polinomiale.

Passaggio 6: visualizzare e prevedere i risultati della regressione lineare e polinomiale e identificare quale modello prevede il set di dati con risultati migliori.

Usi di regressione polinomiale

  • È usato in molte procedure sperimentali per produrre il risultato usando questa equazione.
  • Fornisce una relazione ben definita tra le variabili indipendenti e dipendenti.
  • È usato per studiare gli isotopi dei sedimenti.
  • È usato per studiare l'ascesa di diverse malattie all'interno di qualsiasi popolazione.
  • È usato per studiare la generazione di qualsiasi sintesi.

Caratteristiche della regressione polinomiale

  • È un tipo di metodo di regressione non lineare che ci dice la relazione tra la variabile indipendente e dipendente quando la variabile dipendente è correlata alla variabile indipendente dell'ennesimo grado.
  • La linea più adatta è decisa dal grado dell'equazione di regressione polinomiale.
  • Il modello derivato dalla regressione polinomiale è influenzato dagli outlier, quindi è sempre meglio trattare gli outlier prima di applicare l'algoritmo al set di dati.
  • La funzione Polynomialfeature () si converte in una caratteristica della matrice in base al grado dell'equazione.
  • La natura della curva può essere studiata o visualizzata utilizzando un semplice diagramma a dispersione che ti darà un'idea migliore della relazione di linearità tra le variabili e deciderà di conseguenza.

Conclusione

La regressione polinomiale viene utilizzata in molte organizzazioni quando identificano una relazione non lineare tra le variabili indipendenti e dipendenti. È una delle tecniche di regressione difficili rispetto ad altri metodi di regressione, quindi avere una conoscenza approfondita dell'approccio e dell'algoritmo ti aiuterà a ottenere risultati migliori.

Articoli consigliati

Questa è una guida per una regressione polinomiale. Qui discutiamo le caratteristiche e gli usi della regressione polinomiale. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più–

  1. Algoritmo SVM
  2. Metodi del kernel
  3. Funzione LINEST Excel
  4. Algoritmi di apprendimento automatico
  5. Regressione lineare vs regressione logistica | Differenze principali

Categoria: