Clustering in Machine Learning - Principali metodi e applicazioni

Sommario:

Anonim

Introduzione al clustering in Machine Learning

Capiremo prima l'apprendimento automatico. Possiamo vedere i dati crescere rapidamente intorno a noi. I dati sono disponibili in diverse forme come video, audio, immagini, ecc. Il clustering in Machine learning utilizza questi dati per rispondere alla domanda. Ad esempio (rilevamento di malattie della pelle), il medico utilizzerà l'apprendimento automatico per comprendere il segno sulla pelle e predirà che tipo di malattia è. Il clustering non è altro che il raggruppamento di set di dati senza etichetta. Facciamo un esempio del tuo film (che vuoi guardare). Potresti apprezzare i film romantici, ma a tua sorella piacciono i film comici. Ti potrebbero piacere i film romantici di Bollywood o i film romantici di Hollywood. Ma a tua sorella piacciono i film comici di Telegu, qui puoi vedere te e tua sorella ha una scelta diversa di film. Entrambi avete scoperto informazioni approfondite sui film. Qui abbiamo raggruppato set di dati senza etichetta (film) per guardare il film.

Come funziona il clustering nell'apprendimento automatico?

Nel cluster, raggruppiamo un set di dati senza etichetta che è noto come apprendimento non supervisionato. Quando raggruppiamo per la prima volta i dati senza etichetta, dobbiamo trovare un gruppo simile. Quando creiamo un gruppo, dobbiamo comprendere le caratteristiche dei set di dati, cioè cose simili. Se creiamo un gruppo in base a una o due funzionalità, è facile misurare la somiglianza.

  • Esempio n. 1: film del regista. Al termine del clustering, a ciascun cluster viene assegnato un numero di cluster noto come ClusterID. Il sistema di apprendimento automatico come YouTube utilizza clusterID per rappresentare i dati complessi più facilmente.
  • Esempio n. 2: YouTube utilizza la cronologia delle ricerche o la cronologia delle visualizzazioni e suggerisce video che potrebbero piacerci. Il set di dati delle funzionalità per Facebook contiene le persone che seguiamo, le pagine che seguiamo, i commenti che inseriamo, le foto o i video che ci piacciono, le foto o le foto alle quali taggiamo. Il clustering di video o foto di Facebook sostituirà un set di funzionalità con un singolo ID cluster a causa della compressione dei dati.

I 4 metodi principali di clustering in Machine Learning

Di seguito sono riportati i metodi di clustering in Machine Learning:

1. Gerarchico

Il clustering dei nomi definisce un modo di lavorare, questo metodo forma un cluster in modo gerarchico. Il nuovo cluster viene formato utilizzando una struttura precedentemente formata. Dobbiamo capire le differenze tra l'approccio Divisivo e l'approccio Agglomerativo. L'agglomerativo è un approccio dal basso verso l'alto, inizia con singoli punti in un cluster e combina alcuni arbitrari. Divisive inizia con un singolo cluster, tutti i punti in un cluster e lo divide in più cluster.

2. Basato sulla densità

In questo metodo, la regione densa viene considerata come un cluster che presenta alcune somiglianze. È diverso dalla regione densa inferiore dello spazio oggetti. DBSCAN è noto come clustering spaziale basato su densità di applicazioni con rumore. Per l'orientamento agli oggetti di dati, DBSCAN cerca alcuni epsilon, impostando un raggio epsilon e il numero minimo di punti. Entro un raggio, se superiamo un numero minimo di punti, classifichiamo un cluster ad alta densità. Quindi, in questo modo possiamo considerare i dati con una regione ad alta densità. DBSCAN differisce dal metodo centroide di raggruppamento in quanto non è un approccio rigoroso. I punti di rumore sono punti in aree a bassa densità che sono lasciati senza etichetta o etichettati come valori anomali. Questo è il motivo per cui non richiediamo K. specifici. Possiamo specificare punti minimi per la regione ad alta densità e il raggio che vogliamo che una regione sia o sia cluster.

3. Partizionamento

Quando abbiamo un set di dati di N numero di oggetti. Questo metodo costruisce "K" come partizione di dati. Questa partizione è il cluster, cioè il costrutto K, la partizione (K <= N).

Requisiti da soddisfare:

  • Ogni gruppo o set di dati deve contenere almeno un oggetto.
  • Ogni oggetto dovrebbe appartenere a un solo gruppo.

Uno degli esempi di partizionamento è il clustering K-mean.

4. Basato su griglia

Lo spazio oggetti, un numero finito di celle forma una struttura a griglia. Questo metodo consente una rapida elaborazione del cluster. Questi sono indipendenti dallo spazio oggetti.

Applicazioni del clustering in Machine Learning

Di seguito sono riportate le applicazioni del clustering in Machine Learning:

1. Medico

Il medico può utilizzare un algoritmo di clustering per trovare il rilevamento della malattia. Facciamo un esempio di malattia della tiroide. Il set di dati della malattia della tiroide può essere identificato utilizzando l'algoritmo di clustering quando applichiamo l'apprendimento senza supervisione su un set di dati che contiene set di dati tiroidei e non tiroidei. Il clustering identificherà la causa della malattia e fornirà una ricerca dei risultati riuscita.

2. Social Network

Siamo la generazione dell'era di Internet, possiamo incontrare qualsiasi persona o conoscere qualsiasi identità individuale attraverso Internet. I siti di social network utilizzano il clustering per comprendere i contenuti, affrontare le persone o localizzare l'utente. Quando l'apprendimento senza supervisione viene utilizzato nei social, è utile per la traduzione della lingua. Ad esempio Instagram e Facebook offrono la funzionalità di traduzione della lingua.

3. Marketing

Possiamo vedere o osservare che accanto a noi sta crescendo una tecnologia diversa e le persone sono attratte dall'uso di tecnologie come il cloud, il marketing digitale. Per attirare un numero maggiore di clienti, ogni azienda sta sviluppando funzionalità e tecnologie di facile utilizzo. Per comprendere il cliente, possiamo usare il clustering. Il clustering aiuterà l'azienda a comprendere il segmento di utenti e quindi classificare ciascun cliente. In questo modo possiamo comprendere il cliente e trovare somiglianze tra i clienti e raggrupparli.

4. Attività bancarie

Abbiamo osservato che la frode del denaro sta accadendo intorno a noi e la società sta avvertendo i clienti al riguardo. Con l'aiuto del clustering, le compagnie assicurative possono trovare frodi, riconoscerne i clienti e comprendere le politiche introdotte dal cliente.

5. Google

Google è uno dei motori di ricerca utilizzati dalle persone. Facciamo un esempio quando cerchiamo alcune informazioni come il negozio di animali nella zona, Google ci fornirà diverse opzioni. Questo è il risultato del raggruppamento, raggruppamento di risultati simili che viene fornito all'utente.

Conclusione

Abbiamo imparato a conoscere il clustering e l'apprendimento automatico. Il modo di raggruppare funziona nell'apprendimento automatico. Informazioni sull'apprendimento non supervisionato. Utilizzo in tempo reale dell'apprendimento non supervisionato. Metodi di clustering e funzionamento di ciascun metodo nell'apprendimento automatico.

Articolo raccomandato

Questa è una guida al clustering in Machine Learning. Qui discutiamo i primi 4 metodi di clustering in machine learning insieme alle applicazioni. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -
  1. Strutture di apprendimento automatico Top 10
  2. K: algoritmo di clustering con vantaggi
  3. Introduzione alle tecniche di apprendimento automatico
  4. Modelli di apprendimento automatico | I 5 migliori tipi
  5. Libreria di apprendimento automatico C ++