Introduzione ai metodi di apprendimento automatico

L'articolo seguente, Metodi di apprendimento automatico fornisce una descrizione dei metodi più comunemente utilizzati nell'apprendimento automatico. L'apprendimento automatico è una tecnica che rende un computer in grado di "imparare" le cose da solo. Gli algoritmi migliorano in modo adattivo le loro prestazioni man mano che aumentano i dati disponibili per l'apprendimento. Più sono i dati, più accurato sarebbe il nostro modello.

Come apprendono le macchine?

Esistono vari metodi per farlo. Quale metodo seguire completamente dipende dalla dichiarazione del problema. A seconda del set di dati e del nostro problema, ci sono due modi diversi per approfondire. Uno è l'apprendimento supervisionato e l'altro è l'apprendimento non supervisionato. La seguente tabella spiega l'ulteriore classificazione dei metodi di apprendimento automatico. Ne discuteremo uno per uno.

Dai un'occhiata alla seguente tabella!

Comprendiamo cosa significa apprendimento supervisionato.

Apprendimento supervisionato

Come suggerisce il nome, immagina un insegnante o un supervisore che ti aiuti ad imparare. Lo stesso vale per le macchine. Formiamo o insegniamo alla macchina usando i dati che sono etichettati.

Alcune delle più interessanti applicazioni di apprendimento supervisionato sono:

  • Analisi del sentiment (Twitter, Facebook, Netflix, YouTube, ecc.)
  • Elaborazione del linguaggio naturale
  • Classificazione delle immagini
  • Analisi predittiva
  • Riconoscimento del modello
  • Rilevazione spam
  • Elaborazione vocale / sequenza

Ora, l'apprendimento supervisionato è ulteriormente suddiviso in classificazione e regressione. Capiamo questo.

Classificazione

La classificazione è il processo di ricerca di un modello che aiuta a separare i dati in diverse classi categoriali. In questo processo, i dati vengono classificati in diverse etichette in base ad alcuni parametri forniti in input e quindi le etichette vengono previste per i dati. Per categoria significa che la variabile di output è una categoria, ovvero rosso o nero, spam o non spam, diabetico o non diabetico, ecc.

I modelli di classificazione includono Support vector machine (SVM), K-più vicino vicino (KNN), Naive Bayes ecc.

a) Supporto classificatore macchina vettoriale (SVM)

SVM è un metodo di apprendimento supervisionato che esamina i dati e li ordina in una di due categorie. Uso un hyperplane per classificare i dati. Un classificatore discriminativo lineare tenta di tracciare una linea retta che separa le due serie di dati e quindi crea un modello per la classificazione. Cerca semplicemente di trovare una linea o una curva (in due dimensioni) o una varietà (in più dimensioni) che divide le classi l'una dall'altra.

Nota: per la classificazione multiclasse SVM fa uso di "uno contro riposo", ciò significa calcolare SVM diversi per ogni classe.

b) Classificatore K vicino più vicino (KNN)

  • Se leggi attentamente, il nome stesso suggerisce cosa fa l'algoritmo. KNN considera i punti dati più vicini, molto più simili in termini di funzionalità e quindi più probabilità di appartenere alla stessa classe del vicino. Per ogni nuovo punto dati, viene calcolata la distanza da tutti gli altri punti dati e la classe viene decisa in base ai vicini K più vicini. Sì, può sembrare zoppo, ma per alcune classifiche, funziona come qualsiasi cosa.
  • Un punto dati viene classificato in base al numero massimo di voti dei suoi vicini, quindi il punto dati viene assegnato alla classe più vicina tra i suoi vicini k.
  • In KNN non è necessario apprendere il modello e tutto il lavoro avviene nel momento in cui viene richiesta una previsione. Ecco perché KNN viene spesso definito un algoritmo di apprendimento pigro.

c) classificatore Naïve Bayes

  • Naïve Bayes è un algoritmo di apprendimento automatico altamente raccomandato per problemi di classificazione del testo. Si basa sul teorema di probabilità di Bayes. Questi classificatori sono chiamati ingenui perché presumono che le variabili delle caratteristiche siano indipendenti l'una dall'altra. Ciò significa, ad esempio, che abbiamo una frase completa per l'input, quindi Naïve Bayes assume che ogni parola in una frase sia indipendente dalle altre. E poi classificali di conseguenza. Lo so, sembra abbastanza ingenuo, ma è un'ottima scelta per i problemi di classificazione del testo ed è una scelta popolare per la classificazione delle e-mail di spam.
  • Fornisce diversi tipi di algoritmi Naive Bayes come BernoulliNB, GaussianNB, MultinomialNB.
  • Considera tutte le funzionalità come non correlate, quindi non può imparare la relazione tra le funzionalità. Ad esempio, diciamo, a Varun piace mangiare hamburger, gli piace anche mangiare patatine fritte con la coca cola. Ma non gli piace mangiare un hamburger e una combinazione di patatine fritte e coca cola insieme. In questo caso, Naïve Bayes non può apprendere la relazione tra due funzioni, ma impara solo l'importanza delle singole caratteristiche.

Passiamo ora all'altro lato del nostro metodo di apprendimento supervisionato, che è una regressione.

Regressione

La regressione è il processo di ricerca di un modello che aiuta a differenziare i dati utilizzando valori continui. In questo, viene ordinata la natura dei dati previsti. Alcuni dei modelli di regressione più ampiamente utilizzati includono regressione lineare, foresta casuale (alberi decisionali), reti neurali.

Regressione lineare

  • Uno degli approcci più semplici nell'apprendimento supervisionato, utile per prevedere la risposta quantitativa.
  • La regressione lineare include la ricerca della retta più adatta ai punti. La linea più adatta si chiama linea di regressione. La linea più adatta non attraversa esattamente tutti i punti dati, ma cerca invece di avvicinarsi a essi.
  • È l'algoritmo ampiamente utilizzato per i dati continui. Tuttavia, si concentra solo sulla media della variabile dipendente e si limita a una relazione lineare.
  • La regressione lineare può essere utilizzata per serie storiche, previsioni di tendenza. Può prevedere le vendite future, in base ai dati precedenti.

Apprendimento senza supervisione

  • L'apprendimento senza supervisione si basa sull'approccio che può essere considerato come l'assenza di un insegnante e quindi su misure di errore assoluto. È utile quando è necessario imparare il raggruppamento o il raggruppamento di elementi. Gli elementi possono essere raggruppati (raggruppati) in base alla loro somiglianza.
  • Nell'apprendimento senza supervisione, i dati non sono etichettati, non classificati e gli algoritmi del sistema agiscono sui dati senza una formazione preliminare. Gli algoritmi di apprendimento senza supervisione possono svolgere compiti più complessi rispetto agli algoritmi di apprendimento supervisionato.
  • L'apprendimento senza supervisione include il clustering che può essere fatto usando K significa cluster, gerarchico, miscela gaussiana, modello nascosto di Markov.

Le applicazioni di apprendimento senza supervisione sono:

  1. Rilevazione di somiglianza
  2. Etichettatura automatica
  3. Segmentazione degli oggetti (come Persona, Animale, Film)

Clustering

  • Il clustering è una tecnica di apprendimento senza supervisione utilizzata per l'analisi dei dati in molti campi. L'algoritmo di clustering è utile quando vogliamo ottenere informazioni dettagliate sui nostri dati.
  • Un esempio reale del clustering sarebbero i cluster di genere di Netflix, che sono divisi per diversi clienti target inclusi interessi, dati demografici, stili di vita, ecc. Ora puoi pensare a quanto sia utile il clustering quando le aziende vogliono capire la loro base di clienti e indirizzare il nuovo potenziale i clienti.

a) K significa clustering

  • K significa che l'algoritmo di clustering tenta di dividere i dati sconosciuti dati in cluster. Seleziona casualmente il centroide dei cluster "k", calcola la distanza tra i punti dati e il centroide dei cluster e infine assegna il punto dati al centroide del cluster la cui distanza è minima di tutti i centroidi del cluster.
  • In k-medie, i gruppi sono definiti dal centroide più vicino per ogni gruppo. Questo centroide funge da "Cervello" dell'algoritmo, acquisiscono i punti dati più vicini a loro e quindi li aggiungono ai cluster.

b) Clustering gerarchico

Il clustering gerarchico è quasi simile a quello del cluster normale a meno che non si desideri creare una gerarchia di cluster. Questo può tornare utile quando vuoi decidere il numero di cluster. Ad esempio, supponiamo di creare gruppi di articoli diversi nel negozio di alimentari online. Nella home page principale, si desidera alcuni elementi di grandi dimensioni e una volta che si fa clic su uno degli elementi, categorie specifiche, ovvero cluster più specifici si apre.

Riduzione dimensionale

La riduzione dimensionale può essere considerata come compressione di un file. Significa, togliere le informazioni che non sono rilevanti. Riduce la complessità dei dati e cerca di conservare i dati significativi. Ad esempio, nella compressione dell'immagine, riduciamo la dimensionalità dello spazio in cui l'immagine rimane com'è senza distruggere troppo il contenuto significativo nell'immagine.

PCA per la visualizzazione dei dati

L'analisi dei componenti principali (PCA) è un metodo di riduzione dimensionale che può essere utile per visualizzare i tuoi dati. Il PCA viene utilizzato per comprimere i dati di dimensione superiore in dati di dimensione inferiore, ovvero possiamo usare il PCA per ridurre i dati a quattro dimensioni in tre o 2 dimensioni in modo da poter visualizzare e ottenere una migliore comprensione dei dati.

Articoli consigliati

Questa è una guida ai metodi di apprendimento automatico. Qui discutiamo un'introduzione, come apprendono le macchine? classificazioni dell'apprendimento automatico e un diagramma di flusso insieme a una spiegazione dettagliata. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -

  1. Architettura di apprendimento automatico
  2. Quadri di apprendimento automatico
  3. Strumenti di apprendimento automatico
  4. Tecniche di apprendimento automatico
  5. Apprendimento automatico iperparametro
  6. Algoritmo di clustering gerarchico
  7. Clustering gerarchico Clustering agglomerativo e divisivo

Categoria: