Introduzione ai pacchetti R.
Il pacchetto è una raccolta di funzioni e set di dati. I pacchetti aiutano a migliorare la funzionalità in un linguaggio di programmazione. Se vogliamo archiviare ed elaborare database (ovvero funzionalità simili a SQL che utilizzano frame di dati), allora possiamo usare il pacchetto dplyr in R. I pacchetti forniscono anche la documentazione su come utilizzare le funzioni e i set di dati in un determinato pacchetto.
Dove troviamo i pacchetti?
I pacchetti sono disponibili su Internet attraverso diverse fonti. Tuttavia, ci sono alcuni repository affidabili da cui è possibile scaricare i pacchetti.
Ecco i due repository importanti disponibili online.
- CRAN (rete completa di archivi R): questa è la comunità R ufficiale con una rete di FTP e server web che contiene il codice e la documentazione più recenti di R. Prima di pubblicare i tuoi pacchetti online, passa attraverso una serie di test che aderiscono alla politica CRAN .
- GitHub: GitHub è un altro famoso repository ma non specifico di R. La community online può condividere i propri pacchetti con altre persone e viene utilizzata per il controllo della versione. GitHub è un open-source e non ha alcun processo di revisione.
Elenco dei pacchetti R utili
Esistono diversi pacchetti in R e possono essere scaricati da CRAN o GitHub. Di seguito sono riportati i pacchetti che possono essere utilizzati per scopi specifici.
1. Caricamento dei dati da fonti esterne
- Haven: R legge e scrive dati da SAS.
- DBI: per stabilire la comunicazione tra il database relazionale e R.
- RSQlite: viene utilizzato per leggere i dati dai database relazionali.
2. Manipolazione dei dati
- Dplyr: viene utilizzato per la manipolazione dei dati come il subsetting, fornisce collegamenti per accedere ai dati e genera query sql.
- Tidyr : viene utilizzato per convertire i dati in piccoli formati.
- stringr - manipola le espressioni di stringa e le stringhe di caratteri.
- lubridate: per lavorare con dati e tempo.
3. Visualizzazione dei dati
- Rgl: lavorare su visualizzazioni 3D.
- ggvis: per creare e costruire la grammatica della grafica.
- googlevis: per utilizzare gli strumenti di visualizzazione di google in R.
4. Pacchetti basati sul Web
- XML: per leggere e scrivere documenti XML in R.
- Httpr: funziona con connessioni http.
- Jsonlite: per leggere le tabelle di dati JSON.
Ottenere pacchetti R
Possiamo controllare i pacchetti disponibili che sono presenti in R usando il codice qui sotto.
- available.packages (): ci sono circa 5200 pacchetti disponibili nella rete CRAN.
CRAN ha viste delle attività che raggruppano i pacchetti in un particolare argomento.
Installazione dei pacchetti R
Possiamo installare i pacchetti direttamente tramite IDE o tramite comandi. Per installare i pacchetti utilizziamo la seguente funzione e specifichiamo il nome del pacchetto.
Sintassi:
install.packages()
Codice:
install.packages(“ggplot2”)
Il codice sopra installa il pacchetto ggplot2 e i suoi pacchetti dipendenti, se presenti.
Possiamo installare diversi pacchetti contemporaneamente specificando i nomi dei pacchetti sotto un vettore di caratteri.
Sintassi:
install.packages(c(“package 1”, ”package 2”, ”package 3”))
Codice:
install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))
Installazione tramite R Studio
Il vantaggio di utilizzare un R studio è che è GUI (interfaccia grafica utente). Possiamo scegliere i pacchetti da installare e la relativa fonte.
Possiamo andare su strumenti -> Installa pacchetti.
Caricamento dei pacchetti R
Dopo aver installato il pacchetto R, è necessario caricarli in R, per iniziare a utilizzare i pacchetti installati.
Usiamo la seguente funzione per caricare i pacchetti.
Sintassi:
library(package name)
Codice:
library(ggplot2)
Esistono alcuni pacchetti che visualizzano i messaggi quando vengono caricati. Alcuni non lo fanno. Possiamo vedere i dettagli della libreria installata con l'aiuto del codice seguente.
Codice:
library(ggplot2)
search()
Produzione:
"Pacchetto: reticolo" "pacchetto: ggplot2" "pacchetto: makelides"
"Pacchetto: knitr" "pacchetto: slidify" "strumenti: rstudio"
Creare il tuo pacchetto
Prima di creare il nostro pacchetto. Prima di procedere alla creazione di un pacchetto, dovremmo tenere a mente l'elenco di controllo riportato di seguito.
- Organizzare il codice è una delle cose più importanti durante la scrittura del codice nel pacchetto. Perdiamo metà del tempo a cercare la posizione del codice invece di migliorare il codice. Metti tutti i file in una cartella facilmente accessibile.
- Documentare il codice ti aiuta a capire lo scopo del codice. Quando non rivisitiamo spesso il codice, dimentichiamo perché abbiamo scritto il codice in un certo modo. Può anche aiutare le persone a comprendere meglio il tuo codice se condiviso con loro.
- La condivisione degli script tramite e-mail è diventata arcaica. Il modo più semplice è caricare il tuo codice e distribuirlo su GitHub. È possibile che tu riceva feedback che possono aiutarti a migliorare il codice.
Per creare il tuo pacchetto, dobbiamo installare il pacchetto devtools.
Codice:
install.packages("devtools")
Per aiutare con la documentazione possiamo usare il pacchetto seguente.
Codice:
install.packages("roxygen2")
Dopo aver installato il pacchetto devtools. Puoi creare il tuo pacchetto.
Codice:
devtools::create ("packagename")
Al posto di "nomepacchetto", puoi dare il nome che desideri. Ora puoi aggiungere le tue funzioni in questo pacchetto.
È possibile creare lo stesso nome file del nome della funzione.
Sintassi:
Devtools:create(“firstpackage”)
Pacchetto di distribuzione
Puoi distribuire il tuo pacchetto su github usando il pacchetto devtools.
Usiamo il codice seguente per distribuire il nostro pacchetto su github.
Codice:
devtools::install_github("yourusername/firstpackage")
Puoi dare il tuo nome utente github e il nome del pacchetto che hai creato sopra.
Ecco i file richiesti per un pacchetto
- funzioni
- Documentazione
- Dati
Una volta che abbiamo tutti i file sopra, siamo pronti a pubblicarlo nel repository.
Articoli consigliati
Questa è una guida ai pacchetti R. Qui discutiamo l'elenco di utili pacchetti R, installando pacchetti usando R studio e creando il tuo pacchetto, ecc. Puoi anche leggere i seguenti articoli per saperne di più -
- Cos'è il linguaggio di programmazione R?
- Carriere nella programmazione R
- R Programmazione vs Python
- MySQL vs SQLite
- Elenco dei pacchetti R