Introduzione ai pacchetti R.

Il pacchetto è una raccolta di funzioni e set di dati. I pacchetti aiutano a migliorare la funzionalità in un linguaggio di programmazione. Se vogliamo archiviare ed elaborare database (ovvero funzionalità simili a SQL che utilizzano frame di dati), allora possiamo usare il pacchetto dplyr in R. I pacchetti forniscono anche la documentazione su come utilizzare le funzioni e i set di dati in un determinato pacchetto.

Dove troviamo i pacchetti?

I pacchetti sono disponibili su Internet attraverso diverse fonti. Tuttavia, ci sono alcuni repository affidabili da cui è possibile scaricare i pacchetti.

Ecco i due repository importanti disponibili online.

  • CRAN (rete completa di archivi R): questa è la comunità R ufficiale con una rete di FTP e server web che contiene il codice e la documentazione più recenti di R. Prima di pubblicare i tuoi pacchetti online, passa attraverso una serie di test che aderiscono alla politica CRAN .
  • GitHub: GitHub è un altro famoso repository ma non specifico di R. La community online può condividere i propri pacchetti con altre persone e viene utilizzata per il controllo della versione. GitHub è un open-source e non ha alcun processo di revisione.

Elenco dei pacchetti R utili

Esistono diversi pacchetti in R e possono essere scaricati da CRAN o GitHub. Di seguito sono riportati i pacchetti che possono essere utilizzati per scopi specifici.

1. Caricamento dei dati da fonti esterne

  • Haven: R legge e scrive dati da SAS.
  • DBI: per stabilire la comunicazione tra il database relazionale e R.
  • RSQlite: viene utilizzato per leggere i dati dai database relazionali.

2. Manipolazione dei dati

  • Dplyr: viene utilizzato per la manipolazione dei dati come il subsetting, fornisce collegamenti per accedere ai dati e genera query sql.
  • Tidyr : viene utilizzato per convertire i dati in piccoli formati.
  • stringr - manipola le espressioni di stringa e le stringhe di caratteri.
  • lubridate: per lavorare con dati e tempo.

3. Visualizzazione dei dati

  • Rgl: lavorare su visualizzazioni 3D.
  • ggvis: per creare e costruire la grammatica della grafica.
  • googlevis: per utilizzare gli strumenti di visualizzazione di google in R.

4. Pacchetti basati sul Web

  1. XML: per leggere e scrivere documenti XML in R.
  2. Httpr: funziona con connessioni http.
  3. Jsonlite: per leggere le tabelle di dati JSON.

Ottenere pacchetti R

Possiamo controllare i pacchetti disponibili che sono presenti in R usando il codice qui sotto.

  • available.packages (): ci sono circa 5200 pacchetti disponibili nella rete CRAN.

CRAN ha viste delle attività che raggruppano i pacchetti in un particolare argomento.

Installazione dei pacchetti R

Possiamo installare i pacchetti direttamente tramite IDE o tramite comandi. Per installare i pacchetti utilizziamo la seguente funzione e specifichiamo il nome del pacchetto.

Sintassi:

install.packages()

Codice:

install.packages(“ggplot2”)

Il codice sopra installa il pacchetto ggplot2 e i suoi pacchetti dipendenti, se presenti.

Possiamo installare diversi pacchetti contemporaneamente specificando i nomi dei pacchetti sotto un vettore di caratteri.

Sintassi:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Codice:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Installazione tramite R Studio

Il vantaggio di utilizzare un R studio è che è GUI (interfaccia grafica utente). Possiamo scegliere i pacchetti da installare e la relativa fonte.

Possiamo andare su strumenti -> Installa pacchetti.

Caricamento dei pacchetti R

Dopo aver installato il pacchetto R, è necessario caricarli in R, per iniziare a utilizzare i pacchetti installati.

Usiamo la seguente funzione per caricare i pacchetti.

Sintassi:

library(package name)

Nota: il nome del pacchetto non deve essere indicato tra virgolette.

Codice:

library(ggplot2)

Esistono alcuni pacchetti che visualizzano i messaggi quando vengono caricati. Alcuni non lo fanno. Possiamo vedere i dettagli della libreria installata con l'aiuto del codice seguente.

Codice:

library(ggplot2)
search()

Produzione:

"Pacchetto: reticolo" "pacchetto: ggplot2" "pacchetto: makelides"

"Pacchetto: knitr" "pacchetto: slidify" "strumenti: rstudio"

Creare il tuo pacchetto

Prima di creare il nostro pacchetto. Prima di procedere alla creazione di un pacchetto, dovremmo tenere a mente l'elenco di controllo riportato di seguito.

  • Organizzare il codice è una delle cose più importanti durante la scrittura del codice nel pacchetto. Perdiamo metà del tempo a cercare la posizione del codice invece di migliorare il codice. Metti tutti i file in una cartella facilmente accessibile.
  • Documentare il codice ti aiuta a capire lo scopo del codice. Quando non rivisitiamo spesso il codice, dimentichiamo perché abbiamo scritto il codice in un certo modo. Può anche aiutare le persone a comprendere meglio il tuo codice se condiviso con loro.
  • La condivisione degli script tramite e-mail è diventata arcaica. Il modo più semplice è caricare il tuo codice e distribuirlo su GitHub. È possibile che tu riceva feedback che possono aiutarti a migliorare il codice.

Per creare il tuo pacchetto, dobbiamo installare il pacchetto devtools.

Codice:

install.packages("devtools")

Per aiutare con la documentazione possiamo usare il pacchetto seguente.

Codice:

install.packages("roxygen2")

Dopo aver installato il pacchetto devtools. Puoi creare il tuo pacchetto.

Codice:

devtools::create ("packagename")

Al posto di "nomepacchetto", puoi dare il nome che desideri. Ora puoi aggiungere le tue funzioni in questo pacchetto.

È possibile creare lo stesso nome file del nome della funzione.

Sintassi:

Devtools:create(“firstpackage”)

Pacchetto di distribuzione

Puoi distribuire il tuo pacchetto su github usando il pacchetto devtools.

Usiamo il codice seguente per distribuire il nostro pacchetto su github.

Codice:

devtools::install_github("yourusername/firstpackage")

Puoi dare il tuo nome utente github e il nome del pacchetto che hai creato sopra.

Ecco i file richiesti per un pacchetto

  • funzioni
  • Documentazione
  • Dati

Una volta che abbiamo tutti i file sopra, siamo pronti a pubblicarlo nel repository.

Articoli consigliati

Questa è una guida ai pacchetti R. Qui discutiamo l'elenco di utili pacchetti R, installando pacchetti usando R studio e creando il tuo pacchetto, ecc. Puoi anche leggere i seguenti articoli per saperne di più -

  1. Cos'è il linguaggio di programmazione R?
  2. Carriere nella programmazione R
  3. R Programmazione vs Python
  4. MySQL vs SQLite
  5. Elenco dei pacchetti R

Categoria: