Introduzione all'apprendimento supervisionato e all'apprendimento non supervisionato

L'apprendimento supervisionato e l'apprendimento non supervisionato sono compiti di apprendimento automatico.
L'apprendimento supervisionato è semplicemente un processo di algoritmo di apprendimento dal set di dati di addestramento. L'apprendimento supervisionato è dove hai variabili di input e una variabile di output e usi un algoritmo per apprendere la funzione di mappatura dall'input all'output. L'obiettivo è approssimare la funzione di mappatura in modo che quando abbiamo nuovi dati di input possiamo prevedere le variabili di output per quei dati.

L'apprendimento non supervisionato sta modellando la struttura o la distribuzione sottostante o nascosta nei dati al fine di saperne di più sui dati. L'apprendimento non supervisionato è il punto in cui si hanno solo dati di input e nessuna variabile di output corrispondente.

Set di dati di training: un set di esempi utilizzati per l'apprendimento, in cui è noto il valore target.

Confronti testa a testa tra apprendimento supervisionato e apprendimento non supervisionato (infografica)

Di seguito è riportato il confronto tra i 7 principali tra apprendimento supervisionato e apprendimento non supervisionato

Differenze chiave tra apprendimento supervisionato e apprendimento non supervisionato

Di seguito sono elencati gli elenchi di punti, descrivono le principali differenze tra apprendimento supervisionato e apprendimento non supervisionato

1. Gli algoritmi di machine learning scoprono modelli nei big data. Questi diversi algoritmi possono essere classificati in due categorie in base al modo in cui "apprendono" i dati per fare previsioni. Quelli sono apprendimento supervisionato e non supervisionato.

2. Nell'apprendimento supervisionato, lo scienziato funge da guida per insegnare all'algoritmo quali conclusioni o previsioni dovrebbe trarre. Nell'apprendimento senza supervisione non esiste una risposta corretta, non c'è insegnante, gli algoritmi sono lasciati a se stessi per scoprire e presentare l'interessante struttura nascosta nei dati.

3. Il modello di apprendimento supervisionato utilizzerà i dati di addestramento per apprendere un collegamento tra input e output.

4. L'apprendimento non supervisionato non utilizza i dati di output. Nell'apprendimento non supervisionato, la loro non e 'alcuna conoscenza preventiva etichettata, mentre nell'apprendimento supervisionato avranno accesso alle etichette e avranno una conoscenza preliminare dei set di dati

5. Apprendimento supervisionato: l'idea è che la formazione possa essere generalizzata e che il modello possa essere utilizzato su nuovi dati con una certa precisione.

6. Algoritmi di apprendimento supervisionato: supporto macchina vettoriale, regressione lineare e logistica, rete neurale, alberi di classificazione e foresta casuale ecc.

7. Gli algoritmi senza supervisione possono essere suddivisi in diverse categorie: algoritmi di cluster, K-media, clustering gerarchico, algoritmi di riduzione dimensionale, rilevamenti di anomalie, ecc.

8. Algoritmi ampiamente utilizzati nell'area di classificazione e regressione nell'apprendimento supervisionato. Support Vector Machines (SVM) sono modelli di apprendimento automatico supervisionati con algoritmi di apprendimento associati, che possono essere utilizzati sia a fini di classificazione che di regressione, ma principalmente utilizzati per problemi di classificazione.

9. Nel modello SVM, tracciamo ogni elemento di dati come un punto nello spazio n-dimensionale, (dove n è caratteristiche che abbiamo) con i valori di ciascuna caratteristica come il valore di una particolare coordinata. Quindi la classificazione eseguita trovando l'iperpiano che differenzia le due classi.

10. L'obiettivo principale degli algoritmi di regressione è prevedere il valore discreto o continuo. In alcuni casi, il valore previsto può essere utilizzato per identificare la relazione lineare tra gli attributi. In base agli algoritmi di regressione della differenza problema possono essere utilizzati. Alcuni degli algoritmi di regressione di base sono la regressione lineare, la regressione polinomiale, ecc.

11. Il clustering è ampiamente utilizzato nell'apprendimento non supervisionato. Il clustering è il compito di dividere i punti di dati in numero di gruppi in modo tale che i punti degli stessi tratti siano uniti sotto forma di cluster. Esistono molti più algoritmi di clustering; alcuni di questi sono modelli di connettività, modelli di centroidi, modelli di distribuzione e modelli di densità.

12. Il clustering gerarchico rientra nell'apprendimento senza supervisione. Cluster gerarchico, come suggerisce il nome, è un algoritmo che crea una gerarchia di cluster. Questo algoritmo inizia con tutti i punti dati assegnati a un cluster a parte. Quindi due cluster più vicini vengono uniti nello stesso cluster. Alla fine, questo algoritmo termina quando rimane un solo cluster.

13.KMeans rientra nel metodo di clustering senza supervisione. I dati verranno suddivisi in k cluster, in base alle loro caratteristiche. Ogni cluster è rappresentato dal suo centroide, definito come il centro dei punti nel cluster. KMeans è semplice e veloce ma non offre lo stesso risultato ad ogni corsa.

14.Per comprendere meglio l'apprendimento supervisionato e l'apprendimento non supervisionato, prendiamo esempi di vita reale. Apprendimento supervisionato: prendiamo ad esempio una delle funzionalità di Gmail, ovvero una posta spam. Sulla base delle informazioni passate sulle e-mail di spam, filtrando una nuova e-mail in arrivo nella cartella Posta in arrivo o nella cartella Posta indesiderata. In questo scenario Gmail è modellato su una funzione di mappatura per separare la posta in arrivo in base alla conoscenza precedente delle e-mail, questo è un apprendimento supervisionato.

15. Apprendimento non supervisionato: supponiamo che un amico ti inviti alla sua festa, dove incontri nuove persone. Ora li classificherai senza alcuna conoscenza precedente (apprendimento non supervisionato) e questa classificazione potrebbe essere su qualsiasi tratto. Potrebbe essere la fascia di età, il genere, il vestirsi, il titolo di studio o qualunque modo tu voglia. Dal momento che non hai usato alcuna conoscenza precedente delle persone e le hai classificate, si tratta di apprendimento non supervisionato.

Tabella di confronto tra apprendimento supervisionato e apprendimento non supervisionato

Apprendimento supervisionatoApprendimento senza supervisione

Metodo

Verranno fornite variabili di input e variabili di output.Verranno forniti solo i dati di input

Obbiettivo

L'obiettivo dell'apprendimento supervisionato è determinare la funzione così bene che quando viene fornito un nuovo set di dati di input, è possibile prevederne l'output.L'obiettivo di apprendimento non supervisionato è quello di modellare i modelli nascosti o la struttura sottostante nei dati di input dati al fine di conoscere i dati.

Classe

Problemi di apprendimento automatico, data mining e rete neurale,Apprendimento automatico, data mining, problemi e rete neurale

Esempi

  • Classificazione
  • Regressione
  • Regressione lineare
  • Supporto macchina vettoriale
  • Clustering
  • Associazione
  • k-means
  • Associazione
Chi usaData scientistData scientist

Eco-sistemi

Elaborazione di big data, data mining ecc

Elaborazione di big data, data mining ecc

usi

L'apprendimento supervisionato viene spesso utilizzato per i sistemi di esportazione nel riconoscimento delle immagini, nel riconoscimento vocale, nelle previsioni, nell'analisi finanziaria e nella formazione di reti neurali e alberi decisionali ecc.

Gli algoritmi di apprendimento senza supervisione vengono utilizzati per pre-elaborare i dati, durante l'analisi esplorativa o per pre-addestrare algoritmi di apprendimento supervisionato.

Conclusione - Apprendimento supervisionato vs apprendimento non supervisionato

La scelta di utilizzare un algoritmo di apprendimento automatico supervisionato o non supervisionato dipende in genere da fattori correlati alla struttura e al volume dei dati e al caso d'uso. In realtà, il più delle volte, i data scientist utilizzano insieme gli approcci di apprendimento supervisionato e apprendimento non supervisionato per risolvere il caso d'uso.

Articolo raccomandato

Questa è stata una guida per l'apprendimento supervisionato rispetto all'apprendimento non supervisionato, il loro significato, il confronto diretto, le differenze chiave, la tabella di confronto e le conclusioni. Puoi anche consultare i seguenti articoli per saperne di più -

  1. I 7 migliori confronti tra apprendimento supervisionato e apprendimento di rinforzo
  2. 5 Differenza più utile tra data science e machine learning
  3. Scopri le 10 migliori differenze tra Map Reduce vs Yarn
  4. MapReduce vs Apache Spark: 20 utili confronti da imparare
  5. Che cos'è l'apprendimento per rinforzo?

Categoria: