Differenza tra data science e data mining
Il data mining consiste nel trovare le tendenze in un set di dati. E usando queste tendenze per identificare modelli futuri. È un passo importante nel processo di individuazione della conoscenza. Spesso include l'analisi della grande quantità di dati storici precedentemente ignorati. La scienza dei dati è un campo di studio che comprende tutto ciò che riguarda l'analisi dei big data, il data mining, la modellazione predittiva, la visualizzazione dei dati, la matematica e la statistica. La scienza dei dati è stata definita il quarto paradigma della scienza. (gli altri tre sono teorici, empirici e computazionali). Academia conduce spesso ricerche esclusive in Data Science.
Prospettiva storica
Prima di passare alle descrizioni tecniche diamo un'occhiata all'evoluzione dei termini. Un'indagine storica chiarirà come vengono attualmente utilizzati i termini.
- La parola "scienza dei dati" risale agli anni '60 ma all'epoca era usata come alternativa a "informatica". Attualmente, ha un significato completamente diverso.
- Nel 2008, DJ Patil e Jeff Hammerbacher sono diventati i primi individui a definirsi "Data Scientists" per descrivere il loro ruolo rispettivamente su LinkedIn e Facebook.
- Nel 2012, l'articolo di Harvard Business Review ha citato Data Scientist come "il lavoro più sexy del 21 ° secolo".
- Il termine Data Mining si è evoluto parallelamente. È diventato prevalente tra le comunità di database negli anni '90.
- Data Mining deve la sua origine a KDD (Knowledge Discovery in Database). KDD è un processo di ricerca della conoscenza dalle informazioni presenti nei database. E Data Mining è un sottoprocesso importante in KDD.
- Il data mining viene spesso utilizzato in modo intercambiabile insieme a KDD.
Sebbene questi nomi siano entrati in scena in modo indipendente, spesso risultano complementari tra loro poiché, dopo tutto, sono strettamente correlati all'analisi dei dati.
Confronto diretto tra Data Science e Data Mining (Infographics)
Di seguito è riportato il confronto tra i primi 9 di Data Science Vs Data Mining
Esempio di utilizzo del caso
Prendi in considerazione uno scenario in cui sei un grande rivenditore in India. Hai 50 negozi che operano nelle 10 principali città dell'India e sei operativo da 10 anni.
Diciamo, vuoi studiare i dati degli ultimi 8 anni per trovare il numero di vendite di dolci durante le festività di 3 città. Se questo è il tuo obiettivo, ti consiglierei di assumere una persona con esperienza nel Data Mining. Un Data Miner probabilmente esaminerebbe le informazioni storiche memorizzate nei sistemi legacy e impiegherebbe algoritmi per estrarre le tendenze.
Considera un altro caso in cui vuoi sapere quali dolci hanno ricevuto recensioni più positive. In questo caso, le tue fonti di dati potrebbero non essere limitate ai database, potrebbero estendersi ai siti Web social o ai messaggi di feedback dei clienti. In questo caso, il mio suggerimento per te sarebbe di assumere un Data Scientist. Una persona impiegata come Data Scientist è più adatta ad applicare algoritmi e condurre questa analisi socio-computazionale.
Differenze chiave tra Data Science e Data Mining
Di seguito è riportata la differenza tra data science e data mining:
- Il data mining è un'attività che fa parte di un più ampio processo di scoperta della conoscenza nei database (KDD) mentre Data Science è un campo di studio proprio come la matematica applicata o l'informatica.
- Spesso Data Science è considerata in senso lato mentre Data Mining è considerata una nicchia.
- Alcune attività di Data Mining come analisi statistiche, scrittura di flussi di dati e riconoscimento di modelli possono intersecarsi con Data Science. Pertanto, Data Mining diventa un sottoinsieme di Data Science.
- L'apprendimento automatico nel data mining viene utilizzato più nel riconoscimento dei modelli mentre in Data Science ha un uso più generale.
Nota
- Data Science e Data Mining non devono essere confusi con Big Data Analytics e si possono avere sia minatori che scienziati che lavorano su grandi set di dati.
Data Science Vs Tabella comparativa di data mining
Base per il confronto | Estrazione dei dati | Data Science |
Che cos'è? | Una tecnica | Un'area |
Messa a fuoco | Processo di business | Studio scientifico |
Obbiettivo | Rendi i dati più utilizzabili | Creazione di prodotti incentrati sui dati per un'organizzazione |
Produzione | Patterns | vario |
Scopo | Trovare tendenze precedentemente non note | Analisi sociale, costruzione di modelli predittivi, scoperta di fatti sconosciuti e altro ancora |
Prospettiva professionale | Qualcuno con una conoscenza della navigazione attraverso i dati e la comprensione statistica può condurre il data mining | Una persona deve comprendere l'apprendimento automatico, la programmazione, le tecniche info-grafiche e avere le conoscenze del dominio per diventare un data scientist |
Estensione | Il data mining può essere un sottoinsieme di Data Science poiché le attività di mining fanno parte della pipeline di Data Science | Multidisciplinare - La scienza dei dati è costituita da visualizzazioni dei dati, scienze sociali computazionali, statistiche, data mining, elaborazione del linguaggio naturale, ecc. |
Affronta (il tipo di dati) | Principalmente strutturato | Tutte le forme di dati: strutturate, semi-strutturate e non strutturate |
Altri nomi meno popolari | Archeologia dei dati, raccolta di informazioni, scoperta di informazioni, estrazione di conoscenza | Scienza basata sui dati |
Conclusione - Data Science Vs Data Mining
Quindi eccoti qua! Sono sicuro che ora sei più consapevole di quali siano le differenze chiave tra i due e in quale contesto i due dovrebbero essere utilizzati. Una cosa da ricordare è che non esistono definizioni formali e precise di Data Science e Data Mining. Ci sono ancora dibattiti in corso tra il mondo accademico e l'industria su ciò che costituisce una definizione accurata. Tuttavia, tutti sono sulla stessa pagina per quanto riguarda le differenze di alto livello e le descrizioni dei due termini che abbiamo esplorato in questo articolo.
Articolo raccomandato
Questa è stata una guida per Data Science vs Data Mining, il loro significato, confronto testa a testa, differenze chiave, tabella di confronto e conclusioni. Puoi anche consultare i seguenti articoli per saperne di più -
- Data Science e sua crescente importanza
- 7 Importanti tecniche di data mining per i migliori risultati
- Predictive Analytics vs Data Science - Scopri l'8 utile confronto
- 8 Importanti tecniche di data mining per attività di successo