Differenze tra apprendimento supervisionato e apprendimento profondo
Nell'apprendimento supervisionato, i dati di training forniti all'algoritmo includono le soluzioni desiderate, denominate etichette. Un tipico compito di apprendimento supervisionato è la classificazione. Il filtro antispam ne è un buon esempio: è addestrato con molte email di esempio insieme alla loro classe (spam o ham) e deve imparare a classificare le nuove email.
L'apprendimento profondo è un tentativo di imitare l'attività negli strati di neuroni nella neocorteccia, che è circa l'80% del cervello in cui si verifica il pensiero (in un cervello umano, ci sono circa 100 miliardi di neuroni e 100 ~ 1000 trilioni di sinapsi). Si chiama deep perché ha più di uno strato nascosto di neuroni che aiuta ad avere più stati di trasformazione delle caratteristiche non lineari
Confronto diretto tra apprendimento supervisionato e apprendimento profondo (infografica)
Di seguito è riportato il confronto tra i 5 principali tra apprendimento supervisionato e apprendimento profondo
Differenze chiave tra apprendimento supervisionato e apprendimento profondo
Sia l'apprendimento supervisionato che l'apprendimento profondo sono scelte popolari sul mercato; parliamo di alcune delle principali differenze tra l'apprendimento supervisionato e l'apprendimento profondo:
● Modelli principali -
Importanti modelli supervisionati sono:
○ K-vicini più vicini - Usato per classificazione e regressione
○ Regressione lineare - Per previsione / regressione
○ Regressione logistica - Per la classificazione
○ Support Vector Machines (SVMs) - Utilizzato per la classificazione e la regressione
○ Alberi decisionali e foreste casuali: attività di classificazione e regressione
Più popolari reti neurali profonde:
● Perceptrons multistrato (MLP) - Tipo più elementare. Questa rete è generalmente la fase iniziale della costruzione di altre reti profonde più sofisticate e può essere utilizzata per eventuali problemi di regressione o classificazione supervisionati
● Autoencoders (AE) : la rete dispone di algoritmi di apprendimento senza supervisione per l'apprendimento delle funzionalità, la riduzione delle dimensioni e il rilevamento anomalo
● Convolution Neural Network (CNN) - particolarmente adatto per dati spaziali, riconoscimento di oggetti e analisi di immagini mediante strutture di neuroni multidimensionali. Uno dei motivi principali della popolarità del deep learning negli ultimi tempi è dovuto alla CNN.
● Rete neurale ricorrente (RNN) : gli RNN vengono utilizzati per l'analisi dei dati in sequenza come serie temporali, analisi del sentiment, PNL, traduzione linguistica, riconoscimento vocale, didascalia delle immagini. Uno dei tipi più comuni di modello RNN è la rete LSTM (Long Short Term Memory).
● Dati di addestramento : come accennato in precedenza, i modelli supervisionati necessitano di dati di addestramento con etichette. Ma il deep learning può gestire i dati con o senza etichette. Alcune architetture di reti neurali possono essere senza supervisione, come gli auto-codificatori e le macchine Boltzmann riservate
● Selezione funzionalità : alcuni modelli supervisionati sono in grado di analizzare funzionalità e un sottoinsieme selezionato di funzionalità per determinare l'obiettivo. Ma il più delle volte questo deve essere gestito in fase di preparazione dei dati. Ma nelle reti neurali profonde, emergono nuove funzionalità e le funzioni indesiderate vengono scartate man mano che i progressi dell'apprendimento.
● Rappresentazione dei dati - Nei modelli supervisionati classici, non viene creata l'astrazione di alto livello delle funzioni di input. Modello finale che cerca di prevedere l'output applicando trasformazioni matematiche su un sottoinsieme di funzionalità di input.
Ma nelle reti neurali profonde, le astrazioni delle caratteristiche di input si formano internamente. Ad esempio, durante la traduzione del testo, la rete neurale prima converte il testo di input in codifica interna, quindi trasforma quella rappresentazione astratta in linguaggio di destinazione.
● Framework : i modelli ML supervisionati sono supportati da molti framework ML generici in diverse lingue: Apache Mahout, Scikit Learn, Spark ML sono alcuni di questi.
Maggioranza I framework di deep learning forniscono un'astrazione di facile utilizzo per gli sviluppatori per creare facilmente una rete, occuparsi della distribuzione dei calcoli e hanno il supporto per le GPU. Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow sono framework popolari. Tensorflow di Google è ampiamente utilizzato ora con il supporto attivo della comunità.
Tabella di confronto tra apprendimento supervisionato e apprendimento profondo
Di seguito è riportato un confronto chiave tra l'apprendimento supervisionato e l'apprendimento profondo
La base del confronto tra apprendimento supervisionato e apprendimento profondo | Apprendimento supervisionato | Apprendimento approfondito |
Modello di formazione | Principali compiti nella formazione -
| Principali compiti nella formazione -
|
Potenziale di sistema | Utilizzato per risolvere compiti relativamente semplici in cui la relazione con le caratteristiche di input e il target è rilevabile dall'uomo e la progettazione delle funzionalità è diretta. Per esempio :
| L'apprendimento profondo può svolgere compiti davvero intelligenti come
|
Flessibilità | I modelli sono più flessibili, il che aiuta a mettere a punto facilmente il modello ML. Esistono metodi ben definiti come la ricerca della griglia con convalida incrociata per trovare gli iperparametri corretti | Meno flessibile in quanto vi sono molti iperparametri da modificare come un numero di strati, il numero di neuroni per strato, il tipo di funzione di attivazione da utilizzare in ogni strato, la logica di inizializzazione del peso e molto altro. |
Rappresentazione delle caratteristiche | Funzionalità derivate o astratte da creare esplicitamente. Ad esempio caratteristiche polinomiali come input per un modello di regressione lineare | Rappresentazione astratta dei dati generata automaticamente in livelli nascosti. Ecco perché una rete neurale CNN addestrata può rilevare un gatto in un'immagine. |
Modelli generativi | Non è possibile generare nulla di originale poiché la rappresentazione automatica dei dati astratti non sta avvenendo | Una volta addestrato, un tipo specifico di rete neurale profonda può generare nuove immagini, canzoni o testi. Questi sono chiamati GNN (Generative neural network) o GAN (Generative Adversarial Networks)
Qualche implementazione di questo tipo di rete viene utilizzata per creare anche nuovi design di moda |
Conclusione: apprendimento supervisionato vs apprendimento profondo
La precisione e le capacità di DNN (Deep Neural Network) sono aumentate molto negli ultimi anni. Ecco perché ora i DNN sono un'area di ricerca attiva e, riteniamo, abbia il potenziale per sviluppare un sistema intelligente generale. Allo stesso tempo, è difficile ragionare sul motivo per cui un DNN fornisce un output particolare che rende davvero difficile la messa a punto di una rete. Quindi, se un problema può essere risolto utilizzando semplici modelli ML, si consiglia vivamente di utilizzarlo. Per questo motivo, una semplice regressione lineare avrà rilevanza anche se un sistema intelligente generale viene sviluppato utilizzando DNN.
Articolo raccomandato
Questa è stata una guida alle principali differenze tra l'apprendimento supervisionato e l'apprendimento profondo. Qui discutiamo anche le differenze chiave tra apprendimento supervisionato e apprendimento profondo con infografica e tabella comparativa. Puoi anche dare un'occhiata ai seguenti articoli -
- Apprendimento supervisionato vs apprendimento di rinforzo
- Apprendimento supervisionato vs apprendimento non supervisionato
- Reti neurali vs apprendimento profondo
- Apprendimento automatico e analisi predittiva
- TensorFlow vs Caffe: quali sono le differenze
- Che cos'è l'apprendimento supervisionato?
- Che cos'è l'apprendimento per rinforzo?
- Top 6 Confronti tra CNN vs RNN