9 Eccezionale differenza tra Data Science e Data Mining

Sommario:

Anonim

Differenza tra data science e data mining

Il data mining consiste nel trovare le tendenze in un set di dati. E usando queste tendenze per identificare modelli futuri. È un passo importante nel processo di individuazione della conoscenza. Spesso include l'analisi della grande quantità di dati storici precedentemente ignorati. La scienza dei dati è un campo di studio che comprende tutto ciò che riguarda l'analisi dei big data, il data mining, la modellazione predittiva, la visualizzazione dei dati, la matematica e la statistica. La scienza dei dati è stata definita il quarto paradigma della scienza. (gli altri tre sono teorici, empirici e computazionali). Academia conduce spesso ricerche esclusive in Data Science.

Prospettiva storica

Prima di passare alle descrizioni tecniche diamo un'occhiata all'evoluzione dei termini. Un'indagine storica chiarirà come vengono attualmente utilizzati i termini.

  • La parola "scienza dei dati" risale agli anni '60 ma all'epoca era usata come alternativa a "informatica". Attualmente, ha un significato completamente diverso.
  • Nel 2008, DJ Patil e Jeff Hammerbacher sono diventati i primi individui a definirsi "Data Scientists" per descrivere il loro ruolo rispettivamente su LinkedIn e Facebook.
  • Nel 2012, l'articolo di Harvard Business Review ha citato Data Scientist come "il lavoro più sexy del 21 ° secolo".
  • Il termine Data Mining si è evoluto parallelamente. È diventato prevalente tra le comunità di database negli anni '90.
  • Data Mining deve la sua origine a KDD (Knowledge Discovery in Database). KDD è un processo di ricerca della conoscenza dalle informazioni presenti nei database. E Data Mining è un sottoprocesso importante in KDD.
  • Il data mining viene spesso utilizzato in modo intercambiabile insieme a KDD.

Sebbene questi nomi siano entrati in scena in modo indipendente, spesso risultano complementari tra loro poiché, dopo tutto, sono strettamente correlati all'analisi dei dati.

Confronto diretto tra Data Science e Data Mining (Infographics)

Di seguito è riportato il confronto tra i primi 9 di Data Science Vs Data Mining

Esempio di utilizzo del caso

Prendi in considerazione uno scenario in cui sei un grande rivenditore in India. Hai 50 negozi che operano nelle 10 principali città dell'India e sei operativo da 10 anni.

Diciamo, vuoi studiare i dati degli ultimi 8 anni per trovare il numero di vendite di dolci durante le festività di 3 città. Se questo è il tuo obiettivo, ti consiglierei di assumere una persona con esperienza nel Data Mining. Un Data Miner probabilmente esaminerebbe le informazioni storiche memorizzate nei sistemi legacy e impiegherebbe algoritmi per estrarre le tendenze.

Considera un altro caso in cui vuoi sapere quali dolci hanno ricevuto recensioni più positive. In questo caso, le tue fonti di dati potrebbero non essere limitate ai database, potrebbero estendersi ai siti Web social o ai messaggi di feedback dei clienti. In questo caso, il mio suggerimento per te sarebbe di assumere un Data Scientist. Una persona impiegata come Data Scientist è più adatta ad applicare algoritmi e condurre questa analisi socio-computazionale.

Differenze chiave tra Data Science e Data Mining

Di seguito è riportata la differenza tra data science e data mining:

  • Il data mining è un'attività che fa parte di un più ampio processo di scoperta della conoscenza nei database (KDD) mentre Data Science è un campo di studio proprio come la matematica applicata o l'informatica.
  • Spesso Data Science è considerata in senso lato mentre Data Mining è considerata una nicchia.
  • Alcune attività di Data Mining come analisi statistiche, scrittura di flussi di dati e riconoscimento di modelli possono intersecarsi con Data Science. Pertanto, Data Mining diventa un sottoinsieme di Data Science.
  • L'apprendimento automatico nel data mining viene utilizzato più nel riconoscimento dei modelli mentre in Data Science ha un uso più generale.

Nota

  • Data Science e Data Mining non devono essere confusi con Big Data Analytics e si possono avere sia minatori che scienziati che lavorano su grandi set di dati.

Data Science Vs Tabella comparativa di data mining

Base per il confrontoEstrazione dei datiData Science
Che cos'è?Una tecnicaUn'area
Messa a fuocoProcesso di businessStudio scientifico
ObbiettivoRendi i dati più utilizzabiliCreazione di prodotti incentrati sui dati per un'organizzazione
ProduzionePatternsvario
ScopoTrovare tendenze precedentemente non noteAnalisi sociale, costruzione di modelli predittivi, scoperta di fatti sconosciuti e altro ancora
Prospettiva professionaleQualcuno con una conoscenza della navigazione attraverso i dati e la comprensione statistica può condurre il data miningUna persona deve comprendere l'apprendimento automatico, la programmazione, le tecniche info-grafiche e avere le conoscenze del dominio per diventare un data scientist
EstensioneIl data mining può essere un sottoinsieme di Data Science poiché le attività di mining fanno parte della pipeline di Data ScienceMultidisciplinare - La scienza dei dati è costituita da visualizzazioni dei dati, scienze sociali computazionali, statistiche, data mining, elaborazione del linguaggio naturale, ecc.
Affronta (il tipo di dati)Principalmente strutturatoTutte le forme di dati: strutturate, semi-strutturate e non strutturate
Altri nomi meno popolariArcheologia dei dati, raccolta di informazioni, scoperta di informazioni, estrazione di conoscenzaScienza basata sui dati

Conclusione - Data Science Vs Data Mining

Quindi eccoti qua! Sono sicuro che ora sei più consapevole di quali siano le differenze chiave tra i due e in quale contesto i due dovrebbero essere utilizzati. Una cosa da ricordare è che non esistono definizioni formali e precise di Data Science e Data Mining. Ci sono ancora dibattiti in corso tra il mondo accademico e l'industria su ciò che costituisce una definizione accurata. Tuttavia, tutti sono sulla stessa pagina per quanto riguarda le differenze di alto livello e le descrizioni dei due termini che abbiamo esplorato in questo articolo.

Articolo raccomandato

Questa è stata una guida per Data Science vs Data Mining, il loro significato, confronto testa a testa, differenze chiave, tabella di confronto e conclusioni. Puoi anche consultare i seguenti articoli per saperne di più -

  1. Data Science e sua crescente importanza
  2. 7 Importanti tecniche di data mining per i migliori risultati
  3. Predictive Analytics vs Data Science - Scopri l'8 utile confronto
  4. 8 Importanti tecniche di data mining per attività di successo