Introduzione al data mining

Qui in questo articolo, scopriremo l'introduzione al Data mining mentre gli esseri umani hanno estratto dalla terra da secoli, per ottenere ogni sorta di materiale prezioso. A volte durante il mining, le cose vengono scoperte da terra che nessuno si aspettava di trovare in primo luogo. Ad esempio, nel 1898, durante lo scavo di una tomba per trovare mummie a Saqqara, in Egitto, fu trovato un manufatto in legno che assomigliava esattamente ad un aereo. Risale al 200 a.C. circa 2200 anni fa! Ma quali possibili informazioni potremmo ottenere da un ampio set di dati? E anche se iniziamo a estrarlo, ci sono possibilità di ottenere risultati imprevisti dal set di dati? Prima di questo, andiamo in quello che è esattamente il Data Mining.

Che cos'è il data mining?

  • È fondamentalmente l'estrazione di informazioni / conoscenze vitali da un ampio insieme di dati.
  • Pensa ai dati come a un grande terreno / superficie rocciosa. Non sappiamo cosa ci sia dentro, non sappiamo se c'è qualcosa di utile sotto le rocce.
  • In questa introduzione al Data mining stiamo cercando informazioni nascoste, ma senza alcuna idea di quale tipo di informazioni vogliamo trovare e per cosa prevediamo di utilizzarle per una volta, le troviamo.
  • Proprio come nel Concept mining tradizionale, anche nel Data mining ci sono varie tecniche e strumenti, che variano a seconda del tipo di Dati che stiamo estraendo, quindi abbiamo chiarito che cosa è il Data mining attraverso questo argomento di introduzione al Data mining.

Esempio di data mining

Abbiamo imparato a conoscere l'introduzione al data mining nella sezione precedente e ora stiamo procedendo con gli esempi del data mining, elencati di seguito:

  • Quindi c'è un operatore di rete mobile. Consultare un minatore di dati per scavare nei registri delle chiamate dell'operatore. Nessun dato specifico viene assegnato al Data Miner.
  • Viene fornito un obiettivo quantitativo di trovare almeno 2 nuovi modelli in un mese.
  • Quando il minatore di dati inizia a scavare nei dati, trova uno schema secondo cui oggi ci sono meno chiamate internazionali rispetto ad altri giorni.
  • Queste informazioni sono condivise con la direzione e escogitano il piano per ridurre le tariffe delle chiamate internazionali il mercoledì e avviare una campagna.
  • I tassi di chiamata aumentano, i clienti sono soddisfatti del basso prezzo delle chiamate, più clienti si iscrivono e l'azienda guadagna più soldi! Situazione di assoluta vittoria!

Tenendo presente l'esempio di cui sopra, esaminiamo ora i vari passaggi coinvolti nel data mining.

Passaggi coinvolti nel data mining

Abbiamo imparato a conoscere l'introduzione al data mining nella sezione precedente e ora stiamo andando avanti con i passaggi coinvolti nel data mining, elencati di seguito:

  • Comprensione commerciale

In questa introduzione al data mining, comprenderemo ogni aspetto degli obiettivi e delle esigenze aziendali. La situazione attuale viene valutata trovando le risorse, i presupposti e altri fattori importanti. Di conseguenza, stabilire una buona introduzione al piano di data mining per raggiungere obiettivi aziendali e di data mining.

  • Comprensione dei dati

Inizialmente, i dati vengono raccolti da tutte le fonti disponibili. Quindi scegliamo il miglior set di dati da cui possiamo estrarre i dati che potrebbero essere più vantaggiosi.

  • Preparazione dei dati

Una volta identificato, il set di dati viene selezionato, pulito, costruito e formattato nella forma desiderata.

  • Modellazione dei dati

È un processo di rimodellamento dei dati forniti in base alle esigenze dell'utente. uno o più modelli potrebbero essere creati sul set di dati preparato e, infine, i modelli devono essere valutati attentamente coinvolgendo le parti interessate per assicurarsi che i modelli creati soddisfino le iniziative aziendali.

  • Valutazione

Questo è uno dei processi più necessari nel data mining. Include la verifica di ogni aspetto del processo in modo da verificare l'eventuale presenza di errori o perdite di dati nel processo. Inoltre, potrebbero essere aumentati i nuovi requisiti aziendali grazie ai nuovi modelli scoperti.

  • Distribuzione

Significa semplicemente presentare le conoscenze in modo tale che le parti interessate possano utilizzarle quando lo desiderano. Nel nostro esempio precedente, è stato riscontrato che le chiamate internazionali erano meno il mercoledì, quindi queste informazioni sono state presentate agli stakeholder che a loro volta hanno usato queste informazioni a loro vantaggio e aumentando i loro profitti.

Tecniche utilizzate nel data mining

Nella sezione precedente abbiamo appreso l'introduzione al data mining ora stiamo andando avanti con le tecniche utilizzate nel data mining che sono elencate di seguito:

  • Analisi di gruppo

Cluster Analysis consente di identificare un determinato gruppo di utenti in base alle funzionalità comuni in un database. Queste funzionalità potrebbero includere l'età, la posizione geografica, il livello di istruzione e così via.

  • Anomaly Detection

È usato per determinare quando qualcosa è notevolmente diverso dal modello normale. Viene utilizzato per eliminare eventuali incoerenze o anomalie del database all'origine.

  • Analisi di regressione

Questa tecnica viene utilizzata per fare previsioni basate su relazioni all'interno del set di dati. Ad esempio, è possibile prevedere il tasso di stock di un determinato prodotto analizzando il tasso passato e anche tenendo conto dei diversi fattori che determinano il tasso di stock. O come mostrato di seguito, se disponiamo dei dati relativi all'altezza e al peso di persone diverse, quindi se ne considerasse l'altezza o il peso, potremmo determinare l'altro valore.

  • Classificazione

Questo riguarda le cose che hanno delle etichette. Nota nel rilevamento dei cluster, le cose non avevano un'etichetta e usando il data mining abbiamo dovuto etichettare e formare i cluster, ma nella classificazione esistono informazioni che possono essere facilmente classificate usando un algoritmo. Un esempio sono i filtri antispam di posta elettronica. Il filtro antispam viene fornito con messaggi pertinenti e antispam (dati di addestramento). Le differenze tra i due sono identificate in modo da consentirgli di classificare correttamente le e-mail future.

  • Apprendimento associativo

È usato per analizzare quali cose tendono ad accadere insieme in coppie o in gruppi più grandi. Ad esempio, le persone che tendono ad acquistare i limoni, comprano anche le arance, le persone che tendono ad acquistare il pane, anche a comprare il latte e così via. Quindi gli acquisti effettuati da tutti i clienti vengono analizzati e le cose che accadono insieme vengono messe insieme per aumentare le vendite. Quindi il latte viene posto vicino al pane, i limoni vengono posti accanto alle arance e così via.

Il data mining è etico?

Quindi, sto programmando un viaggio per il fine settimana a Goa con un amico, cerco su Internet buoni posti da visitare a Goa. La prossima volta che apro Internet, trovo annunci su vari hotel a Goa per rimanere.

  • Buona cosa?

Sì, Internet mi ha aiutato a semplificare il mio viaggio. Dopo tutto, se decido di visitare Goa, avrei bisogno di dormire da qualche parte e un annuncio che mi mostra un hotel è molto più utile di un annuncio che mi mostra vestiti casuali da acquistare.

  • Brutta cosa?

Sì! Perché una società di data mining che non ho mai sentito prima, saprebbe dove sto andando in vacanza. E se non avessi detto a nessuno di questo viaggio, ma qui Internet improvvisamente sa che ci andrò. La verità è che il modello di business dell'azienda di data mining dipende da questo. Raccolgono questi dati tramite cookie e script, quindi li vendono agli inserzionisti che, a loro volta, provano a vendermi qualcos'altro (in questo caso, una camera d'albergo).

Quindi potrebbe essere buono o cattivo a seconda del modo in cui lo guardiamo. Inoltre, potremmo sempre disattivare i cookie o andare in incognito nel caso precedente. Comunque sia, una cosa è certa. Il data mining è qui per restare.

Articoli consigliati

Questa è stata una guida all'introduzione al data mining. Qui discutiamo il suo significato, le tecniche e i passaggi coinvolti nell'introduzione al data mining con un esempio per capire meglio. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Domande di intervista sull'estrazione di dati
  2. Analisi predittiva vs Data mining
  3. Introduzione alla scienza dei dati
  4. Che cos'è l'analisi di regressione?

Categoria: