Introduzione all'elenco dei pacchetti R.

Un pacchetto in linguaggio di programmazione R è un'unità che fornisce le funzionalità necessarie che possono essere utilizzate caricandolo nell'ambiente R. Un elenco di pacchetti R è simile a una libreria in C, C ++ o Java. Quindi, in sostanza, un pacchetto può avere numerose funzionalità come funzioni, costanti, ecc. Che consentiremo all'utente di utilizzarle nel contesto di un particolare problema. In R, un pacchetto richiesto può essere caricato usando la funzione library (). Nel caso in cui un pacchetto non sia presente, è possibile installarlo utilizzando la funzione install.packages (). I pacchetti semplificano le attività apparentemente difficili grazie alle funzionalità già pronte.

Cosa sono i pacchetti R?

Esistono molti pacchetti in R e la selezione di un pacchetto dipende dalla sua applicazione. Sebbene ci siano alcuni pacchetti che sono ampiamente utilizzati a causa delle funzionalità che forniscono, non è il caso che altri pacchetti siano meno importanti. Pacchetti diversi hanno scopi diversi; alcuni sono correlati a tecniche statistiche, alcuni riguardano visualizzazioni, ecc.

Nella sezione seguente, esamineremo alcuni dei pacchetti importanti in R:

1. Auto

Questo pacchetto è associato alla regressione applicata. È un grande pacchetto che offre varie funzionalità per l'analisi statistica. L'importazione di questo pacchetto nell'ambiente R importa altri pacchetti correlati come MASS, stats, graphics, ecc. Alcune delle funzioni del pacchetto includono Anova, avPlots, Boxplot, carPalette, diagrammi di densità, infIndexPlot, ipotesi lineari, logit, test anomalo, qqPlot, grafici residui, scatterplot, matrice scatterplot, ecc. Le ampie capacità del pacchetto possono essere misurate dal numero di funzioni fornite.

2. Corrotto

Il pacchetto fornisce una visualizzazione grafica di una matrice di correlazione e un intervallo di confidenza. Il pacchetto fornisce anche algoritmi per eseguire il riordino della matrice. Numerose opzioni includono la scelta dei colori richiesti, etichette di testo, etichette di colore, layout, ecc. Vari metodi di visualizzazione o metodi di parametri nel pacchetto corrplot sono "cerchio", "quadrato", "ellisse", "numero", "ombra", "colore" e "torta". La funzione corrplot che incorpora varie opzioni fornisce una rappresentazione visivamente accattivante della correlazione tra diverse variabili, che, altrimenti, in circostanze normali, come i numeri, sono difficili da interpretare. Le correlazioni positive sono visualizzate in blu e le correlazioni negative in rosso. L'intensità del colore e la dimensione del cerchio sono proporzionali ai coefficienti di correlazione.

3. DataExplorer

Questo pacchetto tratta l'esplorazione e il trattamento automatizzati dei dati. Fornisce un processo automatizzato di esplorazione dei dati pensato per attività analitiche e modellazione predittiva. Ciò è cruciale in quanto consente all'utente di comprendere i dati ed estrarre approfondimenti. Ogni variabile nell'analisi viene scansionata e analizzata dal pacchetto. Inoltre, il pacchetto fornisce funzionalità per la visualizzazione di queste variabili usando tecniche grafiche tipiche. Fornisce inoltre metodi di elaborazione dei dati comuni per il trattamento e la formattazione dei dati.

4. Gmodels

Il pacchetto gmodels fornisce vari strumenti in R per la stampa di dati. Contiene varie funzioni come glh.test che viene utilizzato per testare, stampare o sintetizzare un'ipotesi lineare generale per un modello di regressione. La funzione rende. i contrasti convertono i contrasti leggibili dall'uomo nella forma richiesta da R per il calcolo. La matrice restituita da make.contrasts può essere utilizzata come argomento per l'argomento dei contrasti delle funzioni del modello. La funzione coefFrame adatta un modello a ciascun sottogruppo definito da , quindi restituisce un frame di dati con una riga per ogni adattamento e una colonna per ciascun parametro. La funzione stimabile calcola e verifica i contrasti e altre funzioni lineari stimabili dei coefficienti del modello per lm, glm, ecc. La funzione fit.contrast calcola e verifica i contrasti arbitrari per gli oggetti di regressione.

5. Gplots

Questo pacchetto fornisce funzionalità di visualizzazione attraverso molteplici strumenti di programmazione. Le funzioni nel pacchetto funzionano sul concetto di calcolo e stampa. Le capacità grafiche del pacchetto sono dimostrate da varie funzioni come trama della banda, boxplot2, col2hex, ci2d, hist2d, trama del testo, trama del lavandino, pilota del pallone, plotCI, mezzi della trama, ecc. Queste funzioni consentono di lavorare con le impostazioni relative al colore, testo e altri intricati aspetti grafici della visualizzazione. Trattano anche elementi complessi coinvolti nella visualizzazione basata su statistiche, ad esempio lmplot2, funzioni residplot che consentono all'utente di guidare una diagnosi di regressione dettagliata attraverso grafici diagnostici. Se è necessario tracciare più dati nella stessa area, ma con assi separati, ciò è possibile utilizzando la funzione over plot nel pacchetto.

6. Ggplot2

È uno dei pacchetti molto famosi in R che offre ampie capacità visive e presenta i risultati anche di complesse tecniche statistiche e matematiche. Le numerose funzionalità fornite dal pacchetto consentono all'analista di ricavare intuizioni dai dati nel modo più interattivo. La descrizione R per la funzione è "un sistema per la creazione dichiarativa di grafica che si basa sulla grammatica della grafica". Questa grammatica della grafica significa che l'utente deve dire 'ggplot2' sul modo in cui le variabili devono essere mappate sull'estetica, quindi questo essenzialmente significa che specificare quali aspetti grafici usare e ggplot2 funzionerà di conseguenza in base ai dettagli.

7. Lubrificare

Questo pacchetto R semplifica il lavoro con date e orari. Il pacchetto lubridate consente una facile manipolazione dei dati di data e ora. Analizza un numero e fornisce un'adeguata disposizione dei dati, infatti le funzioni di analisi nel pacchetto gestiscono un'ampia varietà di formati e separatori che semplificano il processo di analisi. Una delle caratteristiche degne di nota è che il pacchetto fornisce funzionalità per gestire le date con fusi orari diversi.

8. Hmisc

Denominato Harrell Miscellaneous, il pacchetto Hmisc contiene molte funzioni che possono essere sfruttate per analisi dei dati, grafica di alto livello e operazioni di utilità. Include anche funzioni per calcolare dimensioni e potenza del campione, importare e annotare set di dati, imputare valori mancanti, fornire funzionalità avanzate della tabella, raggruppamento di variabili, manipolazione della stringa di caratteri, conversione di oggetti R in codice HTML, ecc.

9. Lattice

Il pacchetto offre un sistema di visualizzazione dei dati di alto livello ispirato alla grafica Trellis. Sottolinea i dati multivariati. Le potenti capacità di visualizzazione del pacchetto forniscono la soluzione grafica necessaria. Alcune delle funzioni degne di nota nel pacchetto sono B_07_cloud che aiuta a produrre grafici a dispersione 3D e grafici a superficie wireframe; D_level. colori, una funzione per calcolare falsi colori che rappresentano variabili numeriche o categoriali; B_06_levelplot, una funzione che genera grafici di livello e grafici di contorno; A_01_Lattice, una funzione che fornisce funzionalità grafiche Lattice. B_09_tmd è una funzione che genera Tukey Mean - Difference Plot; B_11_oneway, una funzione che si adatta al modello a senso unico. Il pacchetto, quindi, fornisce ampie funzionalità per le visualizzazioni attraverso varie funzioni.

10. MatrixModels

Questo pacchetto consente la modellazione con matrici 'Matrix' sparse e dense. A tale scopo utilizza la previsione e la risposta modulari, classi di moduli. Tutte le funzioni fornite dal pacchetto sono ugualmente importanti, alcune delle quali sono lm.fit.sparse, che è una funzione più adatta per i modelli lineari sparsi, risolve Cooef che risolve i coefficienti e l'incremento dei coefficienti, il modello. Una matrice che costruisce matrici di modelli o modelli eventualmente sparsi, glm4 che si adatta a modelli lineari generalizzati.

11. Multcomp

Il pacchetto consente confronti multipli di k gruppi in modelli lineari generalizzati. Un elenco di nove procedure standard vale a dire. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott e Tetrade sono forniti all'utente e l'utente seleziona i confronti in base al requisito. Inoltre, viene fornita un'interfaccia di input gratuita per la matrice di contrasto che consente confronti speciali. La caratteristica degna di nota è che i confronti stessi non sono limitati a nessun disegno particolare come bilanciato o semplice, piuttosto i programmi sono progettati in modo tale da adattarsi a confronti multipli all'interno del modello lineare generale che consente covariate, mezzi correlati, valori mancanti, eccetera.

12. OpenMx

Questo pacchetto tratta sostanzialmente di modelli estesi di equazioni strutturali. Fornisce funzionalità per creare modelli di equazioni strutturali. Questi modelli possono essere manipolati mediante la programmazione. I modelli possono essere specificati con matrici o percorsi come LISREL o RAM. Alcuni tipi di modelli includono più gruppi, fattore di conferma, distribuzione della miscela, soglia categoriale, funzioni di adattamento differenziale, ecc.

13. Plyr

È un pacchetto molto importante che fornisce funzionalità per la manipolazione dei dati. Fornisce strumenti per suddividere, applicare e combinare i dati. Viene fornito con una serie di strumenti che aiutano a risolvere una serie comune di problemi. Ad esempio, a volte potremmo dover suddividere un grosso compito in compiti più piccoli che sono gestibili, quindi operiamo su ciascuno dei pezzi e infine, rimettiamo insieme tutti i pezzi.

14. Qcc

Il pacchetto acquisisce significato grazie alle varie funzionalità di analisi della qualità che fornisce. Fornisce grafici di controllo qualità Shewhart per dati continui, di attributi e conteggi. Tra gli altri grafici importanti ci sono i grafici Cusum ed EWMA e le curve delle caratteristiche operative. Offre inoltre funzionalità di analisi della capacità di processo. Il diagramma di Pareto e il diagramma di causa ed effetto e i grafici di controllo multivariato sono strumenti utili forniti dal pacchetto.

15. RandomForest

Come suggerisce il nome, questo pacchetto viene utilizzato per creare un algoritmo di foresta casuale. Il pacchetto implementa l'algoritmo di foresta casuale di Breiman, basato sul codice FORTRAN originale di Beiman e Cutler. L'algoritmo viene utilizzato per la classificazione e la regressione. Il pacchetto può essere utilizzato anche in modalità non supervisionata per valutare le prossimità tra i punti dati.

16. Psych

È un pacchetto pensato per uno scopo speciale. Il pacchetto fornisce una procedura per la ricerca psicologica, psicometrica e della personalità. Le funzioni sono principalmente per l'analisi multivariata utilizzando varie tecniche statistiche multivariate.

Elenco delle conclusioni dei pacchetti R

Esistono numerosi pacchetti in R e l'applicazione di un pacchetto dipende dai requisiti. La community di Elenco dei pacchetti R è cresciuta molto rapidamente e ogni giorno viene aggiunto un pacchetto. Pacchetti multipli possono fornire funzionalità simili ma la selezione di un pacchetto deve essere basata sul suo attento studio.

Articoli consigliati

Questa è una guida a un elenco di pacchetti R. Qui discutiamo dell'introduzione ai pacchetti R e ad alcuni pacchetti importanti di R. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -

  1. Pacchetti Java
  2. Che cos'è JNDI in Java?
  3. JColorChooser
  4. R Programmazione vs Python

Categoria: