Differenze tra apprendimento supervisionato e apprendimento profondo

Nell'apprendimento supervisionato, i dati di training forniti all'algoritmo includono le soluzioni desiderate, denominate etichette. Un tipico compito di apprendimento supervisionato è la classificazione. Il filtro antispam ne è un buon esempio: è addestrato con molte email di esempio insieme alla loro classe (spam o ham) e deve imparare a classificare le nuove email.

L'apprendimento profondo è un tentativo di imitare l'attività negli strati di neuroni nella neocorteccia, che è circa l'80% del cervello in cui si verifica il pensiero (in un cervello umano, ci sono circa 100 miliardi di neuroni e 100 ~ 1000 trilioni di sinapsi). Si chiama deep perché ha più di uno strato nascosto di neuroni che aiuta ad avere più stati di trasformazione delle caratteristiche non lineari

Confronto diretto tra apprendimento supervisionato e apprendimento profondo (infografica)

Di seguito è riportato il confronto tra i 5 principali tra apprendimento supervisionato e apprendimento profondo

Differenze chiave tra apprendimento supervisionato e apprendimento profondo

Sia l'apprendimento supervisionato che l'apprendimento profondo sono scelte popolari sul mercato; parliamo di alcune delle principali differenze tra l'apprendimento supervisionato e l'apprendimento profondo:

● Modelli principali -

Importanti modelli supervisionati sono:

K-vicini più vicini - Usato per classificazione e regressione
Regressione lineare - Per previsione / regressione
Regressione logistica - Per la classificazione
Support Vector Machines (SVMs) - Utilizzato per la classificazione e la regressione
Alberi decisionali e foreste casuali: attività di classificazione e regressione

Più popolari reti neurali profonde:

Perceptrons multistrato (MLP) - Tipo più elementare. Questa rete è generalmente la fase iniziale della costruzione di altre reti profonde più sofisticate e può essere utilizzata per eventuali problemi di regressione o classificazione supervisionati

Autoencoders (AE) : la rete dispone di algoritmi di apprendimento senza supervisione per l'apprendimento delle funzionalità, la riduzione delle dimensioni e il rilevamento anomalo

Convolution Neural Network (CNN) - particolarmente adatto per dati spaziali, riconoscimento di oggetti e analisi di immagini mediante strutture di neuroni multidimensionali. Uno dei motivi principali della popolarità del deep learning negli ultimi tempi è dovuto alla CNN.

Rete neurale ricorrente (RNN) : gli RNN vengono utilizzati per l'analisi dei dati in sequenza come serie temporali, analisi del sentiment, PNL, traduzione linguistica, riconoscimento vocale, didascalia delle immagini. Uno dei tipi più comuni di modello RNN è la rete LSTM (Long Short Term Memory).

Dati di addestramento : come accennato in precedenza, i modelli supervisionati necessitano di dati di addestramento con etichette. Ma il deep learning può gestire i dati con o senza etichette. Alcune architetture di reti neurali possono essere senza supervisione, come gli auto-codificatori e le macchine Boltzmann riservate

Selezione funzionalità : alcuni modelli supervisionati sono in grado di analizzare funzionalità e un sottoinsieme selezionato di funzionalità per determinare l'obiettivo. Ma il più delle volte questo deve essere gestito in fase di preparazione dei dati. Ma nelle reti neurali profonde, emergono nuove funzionalità e le funzioni indesiderate vengono scartate man mano che i progressi dell'apprendimento.

Rappresentazione dei dati - Nei modelli supervisionati classici, non viene creata l'astrazione di alto livello delle funzioni di input. Modello finale che cerca di prevedere l'output applicando trasformazioni matematiche su un sottoinsieme di funzionalità di input.
Ma nelle reti neurali profonde, le astrazioni delle caratteristiche di input si formano internamente. Ad esempio, durante la traduzione del testo, la rete neurale prima converte il testo di input in codifica interna, quindi trasforma quella rappresentazione astratta in linguaggio di destinazione.

Framework : i modelli ML supervisionati sono supportati da molti framework ML generici in diverse lingue: Apache Mahout, Scikit Learn, Spark ML sono alcuni di questi.
Maggioranza I framework di deep learning forniscono un'astrazione di facile utilizzo per gli sviluppatori per creare facilmente una rete, occuparsi della distribuzione dei calcoli e hanno il supporto per le GPU. Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow sono framework popolari. Tensorflow di Google è ampiamente utilizzato ora con il supporto attivo della comunità.

Tabella di confronto tra apprendimento supervisionato e apprendimento profondo

Di seguito è riportato un confronto chiave tra l'apprendimento supervisionato e l'apprendimento profondo

La base del confronto tra apprendimento supervisionato e apprendimento profondo Apprendimento supervisionato Apprendimento approfondito
Modello di formazionePrincipali compiti nella formazione -

  • Scorrere le istanze di allenamento, principalmente come mini batch, e aggiornare i pesi applicati per le funzionalità.
  • Una direzione di aggiornamento del peso (incremento o decremento) determinata da alcuni indicatori come una pendenza della funzione di errore rispetto al peso.
  • Infine, un target viene formulato come trasformazione su una somma ponderata delle funzioni del sottoinsieme.
Principali compiti nella formazione -

  • Il numero di pesi da aggiornare è molto grande se un numero di livelli nascosti in più.
  • Errore nel valore target calcolato per primo e propagato a ciascun livello
  • Trova la derivata parziale della funzione di errore rispetto ai pesi e aggiorna i pesi per ridurre l'errore.
Potenziale di sistemaUtilizzato per risolvere compiti relativamente semplici in cui la relazione con le caratteristiche di input e il target è rilevabile dall'uomo e la progettazione delle funzionalità è diretta. Per esempio :

  • Una classificazione binomiale o multiclasse come classificare i clienti in base al modo in cui interagiscono con un sito Web.
  • Prevedi il valore della proprietà immobiliare usando dati simili raccolti.
L'apprendimento profondo può svolgere compiti davvero intelligenti come

  • Classificazione delle immagini a livello quasi umano
  • Riconoscimento vocale a livello quasi umano
  • Trascrizione della scrittura a livello quasi umano
  • Traduzione automatica migliorata
  • Assistenti digitali come Google Now e Amazon Alexa
FlessibilitàI modelli sono più flessibili, il che aiuta a mettere a punto facilmente il modello ML. Esistono metodi ben definiti come la ricerca della griglia con convalida incrociata per trovare gli iperparametri correttiMeno flessibile in quanto vi sono molti iperparametri da modificare come un numero di strati, il numero di neuroni per strato, il tipo di funzione di attivazione da utilizzare in ogni strato, la logica di inizializzazione del peso e molto altro.
Rappresentazione delle caratteristicheFunzionalità derivate o astratte da creare esplicitamente. Ad esempio caratteristiche polinomiali come input per un modello di regressione lineareRappresentazione astratta dei dati generata automaticamente in livelli nascosti. Ecco perché una rete neurale CNN addestrata può rilevare un gatto in un'immagine.
Modelli generativiNon è possibile generare nulla di originale poiché la rappresentazione automatica dei dati astratti non sta avvenendoUna volta addestrato, un tipo specifico di rete neurale profonda può generare nuove immagini, canzoni o testi. Questi sono chiamati GNN (Generative neural network) o GAN (Generative Adversarial Networks)

Qualche implementazione di questo tipo di rete viene utilizzata per creare anche nuovi design di moda

Conclusione: apprendimento supervisionato vs apprendimento profondo

La precisione e le capacità di DNN (Deep Neural Network) sono aumentate molto negli ultimi anni. Ecco perché ora i DNN sono un'area di ricerca attiva e, riteniamo, abbia il potenziale per sviluppare un sistema intelligente generale. Allo stesso tempo, è difficile ragionare sul motivo per cui un DNN fornisce un output particolare che rende davvero difficile la messa a punto di una rete. Quindi, se un problema può essere risolto utilizzando semplici modelli ML, si consiglia vivamente di utilizzarlo. Per questo motivo, una semplice regressione lineare avrà rilevanza anche se un sistema intelligente generale viene sviluppato utilizzando DNN.

Articolo raccomandato

Questa è stata una guida alle principali differenze tra l'apprendimento supervisionato e l'apprendimento profondo. Qui discutiamo anche le differenze chiave tra apprendimento supervisionato e apprendimento profondo con infografica e tabella comparativa. Puoi anche dare un'occhiata ai seguenti articoli -

  1. Apprendimento supervisionato vs apprendimento di rinforzo
  2. Apprendimento supervisionato vs apprendimento non supervisionato
  3. Reti neurali vs apprendimento profondo
  4. Apprendimento automatico e analisi predittiva
  5. TensorFlow vs Caffe: quali sono le differenze
  6. Che cos'è l'apprendimento supervisionato?
  7. Che cos'è l'apprendimento per rinforzo?
  8. Top 6 Confronti tra CNN vs RNN

Categoria: