Reti neurali ricorrenti (RNN) - Funzionamento e passaggi di RNN

Presentazione delle reti neurali ricorrenti (RNN)

Una rete neurale ricorrente è un tipo di rete neurale artificiale (ANN) ed è utilizzata nelle aree di applicazione dell'elaborazione del linguaggio naturale (PNL) e del riconoscimento vocale. Un modello RNN è progettato per riconoscere le caratteristiche sequenziali dei dati e, successivamente, utilizzare gli schemi per prevedere lo scenario imminente.

Funzionamento delle reti neurali ricorrenti

Quando parliamo di reti neurali tradizionali, tutte le uscite e gli ingressi sono indipendenti l'uno dall'altro, come mostrato nel diagramma seguente:

Ma nel caso di reti neurali ricorrenti, l'output dei passaggi precedenti viene immesso nell'input dello stato corrente. Ad esempio, per prevedere la lettera successiva di qualsiasi parola o per predire la parola successiva della frase, è necessario ricordare le lettere o le parole precedenti e memorizzarle in qualche forma di memoria.

Il livello nascosto è quello che ricorda alcune informazioni sulla sequenza. Un semplice esempio di vita reale a cui possiamo relazionare RNN è quando guardiamo un film e in molti casi, siamo in grado di prevedere cosa accadrà dopo ma cosa succede se qualcuno si è appena unito al film e gli viene chiesto di prevedere cosa succederà dopo? Quale sarà la sua risposta? Lui o lei non avranno alcun indizio perché non sono a conoscenza degli eventi precedenti del film e non hanno alcun ricordo al riguardo.

Di seguito viene fornita un'illustrazione di un tipico modello RNN:

I modelli RNN hanno una memoria che ricorda sempre ciò che è stato fatto nei passaggi precedenti e ciò che è stato calcolato. La stessa attività viene eseguita su tutti gli ingressi e RNN utilizza lo stesso parametro per ciascuno degli ingressi. Poiché la rete neurale tradizionale ha insiemi indipendenti di input e output, sono più complessi di RNN.

Ora proviamo a capire la rete neurale ricorrente con l'aiuto di un esempio.

Diciamo che abbiamo una rete neurale con 1 layer di input, 3 layer nascosti e 1 layer di output.

Quando parliamo di altre o tradizionali reti neurali, avranno i loro set di distorsioni e pesi nei loro livelli nascosti come (w1, b1) per il livello nascosto 1, (w2, b2) per il livello nascosto 2 e (w3, b3 ) per il terzo livello nascosto, dove: w1, w2 e w3 sono i pesi e, b1, b2 e b3 sono i pregiudizi.

Detto questo, possiamo dire che ogni livello non dipende da nessun altro e che non possono ricordare nulla sull'input precedente:

Ora, ciò che farà un RNN è il seguente:

I livelli indipendenti verranno convertiti nel livello dipendente. Questo viene fatto fornendo gli stessi pregiudizi e pesi a tutti i livelli. Ciò riduce anche il numero di parametri e layer nella rete neurale ricorrente e aiuta RNN a memorizzare l'output precedente emettendo output precedente come input per il layer nascosto imminente.
Per riassumere, tutti i livelli nascosti possono essere uniti in un singolo livello ricorrente in modo tale che pesi e distorsioni siano uguali per tutti i livelli nascosti.
Quindi una rete neurale ricorrente avrà un aspetto simile al seguente:

Ora è il momento di affrontare alcune delle equazioni per un modello RNN.

Per calcolare lo stato corrente,

h _t= f (h _t-1, x _t ),

Dove:

x _t è lo stato di input
h _t-1 è lo stato precedente,
h _t è lo stato corrente.

Per calcolare la funzione di attivazione

h _t= tanh (W _hh h _t-1 +W _xh x _t ),

Dove:
W _xh è il peso al neurone in ingresso,

_Whh è il peso del neurone ricorrente.

Per calcolare l'output:

Y _t =W _hy h _t.

Dove,
Y _t è l'output e,
_Perché è il peso a livello di output.

Passaggi per la formazione di una rete neurale ricorrente

Nei livelli di input, l'input iniziale viene inviato con tutti lo stesso peso e la stessa funzione di attivazione.
Utilizzando l'ingresso corrente e l'uscita di stato precedente, viene calcolato lo stato corrente.
Ora lo stato corrente h _t diventerà h _t-1 per la seconda fase temporale.
Questo continua a ripetersi per tutti i passaggi e per risolvere qualsiasi problema particolare, può andare avanti tante volte per unire le informazioni da tutti i passaggi precedenti.
Il passaggio finale viene quindi calcolato dallo stato corrente dello stato finale e da tutti gli altri passaggi precedenti.
Ora viene generato un errore calcolando la differenza tra l'output effettivo e l'output generato dal nostro modello RNN.
Il passaggio finale è quando si verifica il processo di backpropagation in cui l'errore viene riproposto per aggiornare i pesi.

Vantaggi delle reti neurali ricorrenti

RNN può elaborare input di qualsiasi lunghezza.
Un modello RNN è modellato per ricordare ogni informazione nel tempo, il che è molto utile in qualsiasi predittore di serie temporali.
Anche se la dimensione di input è maggiore, la dimensione del modello non aumenta.
I pesi possono essere condivisi attraverso le fasi temporali.
RNN può utilizzare la propria memoria interna per elaborare le serie arbitrarie di input che non è il caso delle reti neurali feedforward.

Svantaggi delle reti neurali ricorrenti

A causa della sua natura ricorrente, il calcolo è lento.
L'addestramento dei modelli RNN può essere difficile.
Se stiamo usando relu o tanh come funzioni di attivazione, diventa molto difficile elaborare sequenze molto lunghe.
È soggetto a problemi come l'esplosione e la sparizione gradiente.

Conclusione

In questo articolo, abbiamo appreso un altro tipo di rete neurale artificiale chiamata rete neurale ricorrente, ci siamo concentrati sulla differenza principale che distingue RNN da altri tipi di reti neurali, le aree in cui può essere ampiamente utilizzato come nel riconoscimento vocale e NLP (Natural Language Processing). Inoltre, siamo andati dietro il funzionamento dei modelli e delle funzioni RNN utilizzati per costruire un modello RNN robusto.

Articoli consigliati

Questa è una guida alle reti neurali ricorrenti. Qui discutiamo l'introduzione, come funziona, i passaggi, i vantaggi e gli svantaggi di RNN, ecc. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -

Che cosa sono le reti neurali?
Quadri di apprendimento automatico
Introduzione all'intelligenza artificiale
Introduzione a Big Data Analytics
Implementazione di reti neurali

Reti neurali ricorrenti (RNN) - Funzionamento e passaggi di RNN

Sommario:

Presentazione delle reti neurali ricorrenti (RNN)

Funzionamento delle reti neurali ricorrenti

Passaggi per la formazione di una rete neurale ricorrente

Vantaggi delle reti neurali ricorrenti

Svantaggi delle reti neurali ricorrenti

Conclusione

Articoli consigliati

Esempi di equità - I 4 migliori esempi di equità nella vita reale

Le funzioni importanti e il ruolo dei lavori di ricerca azionaria

EOMONTH in Excel (Formula) - Esempi di utilizzo della funzione EOMONTH

Il valore del capitale proprio è importante per un'azienda? (Pieno di risorse) - eduCBA

Equity vs Asset - Le 7 migliori differenze (con infografica)

Istruzione switch in C - Introduzione e funzionamento dell'istruzione Switch in C

Cambia istruzione in JavaScript - Come funziona - Concetto ed esempi

Switch Case in PowerShell - Guida completa allo switch case in PowerShell

Cambia istruzione in Matlab - Sintassi ed esempio di istruzione Switch

Analisi e progettazione del sistema - Le 11 differenze principali che dovresti conoscere

Cos'è la tecnologia cloud? - Guida ai sistemi e alle tecnologie cloud

Che cos'è il cloud bursting? - Sfide, usi - Vantaggi del cloud bursting

Che cos'è il clustering nel data mining? - Applicazione del clustering nel data mining

Cos'è il Cloud Computing - Vantaggi - Servizio e usi - Scopo e carriera

Che cos'è la CMD? - Come accedere al comando di Windows e al suo utilizzo