Introduzione alle funzioni di stringa R

Il linguaggio R o le funzioni della stringa R sono implicite principalmente nella rappresentazione grafica dei dati, nell'analisi statistica dei dati e nel reporting. è una lingua open source. la convenzione di denominazione di questa lingua è stata derivata dalle prime lettere dei fondatori di questa lingua che sono Ross Ihaka e Robert Gentleman. È un linguaggio di programmazione interpretato. Ha la capacità di integrarsi con varie altre procedure linguistiche, in particolare C ++, Python, ecc. Attualmente R è il linguaggio di programmazione più utilizzato al mondo.

Caratteristiche delle funzioni di stringa R

Le caratteristiche principali del linguaggio R sono le seguenti,

  • Un linguaggio statistico finemente sviluppato e molto semplice.
  • Archiviazione e gestione dei dati sono integrati in modo molto efficiente in R.
  • Offre una vasta gamma di strumenti classificati che aiutano nell'analisi dei dati
  • R offre anche librerie per ottenere rappresentazioni grafiche dei dati

Manipolazione delle funzioni della stringa R

Di seguito è riportato l'elenco delle funzioni di manipolazione della stringa R.

1. Grep () nelle funzioni di stringa R

Utilizzato per abbinare un motivo nei dati e sostituire il motivo con una stringa diversa. La funzione grep può essere espressa in molti modi nei linguaggi R sono regexpr, gregexpr grep, grepl e regexec.

Es: grep (modello, x, ignora. Caso = FALSE, perl = FALSE, valore = FALSE, fisso = FALSE, usa Byte = FALSE, invert = FALSE)

Argomenti:

  • Motivo: stringa di caratteri che contiene un'espressione abituale che dovrebbe essere uguale al vettore di carattere dato.
  • X, testo - Un oggetto che può essere limitato come carattere a un vettore di caratteri.
  • Ignorare. Case - (False - La corrispondenza dei modelli funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei modelli funziona con distinzione tra maiuscole e minuscole)
  • Perl: per determinare espressioni compatibili con Perl, utilizzare in particolare regexprns.
  • Valore: se una corrispondenza trovata restituisce true else false,
  • Usa byte: se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
  • Inverti: restituisce indici se True,
  • Sostituzione - La stringa di sostituzione,

2. Nchar ()

Utilizzato per contare il numero di caratteri in un vettore. Prende un vettore in formato stringa come argomento e restituisce un altro vettore numerico che contiene il conteggio della stringa.

Es: nchar (x, type = "chars", allowNA = FALSE, keepNA = NA)

Argomenti:

  • X - Stringa vettoriale.
  • Tipo - Tipo, della stringa di caratteri, utilizzato i tre più comuni citati sono ("byte", "caratteri", "larghezza").
  • AllowNA: indica se "Non applicabile" può essere restituito come output.
  • KeepNA - Dovrebbe essere restituito 'Non applicabile' quando X non viene trovato.

3.Substr ()

Utilizzato per selezionare il valore di sottostringa del vettore di caratteri.

Esempio: substr (x, start, stop)

Argomenti:

  • X, testo - La stringa del noleggiatore vettoriale.
  • Inizio, Primo - numero intero. Inizio dell'elemento che dovrebbe essere sostituito
  • Stop, Last - numero intero. qui la sostituzione viene eseguita alla fine della stringa

4. strsplit () in Funzioni stringa R

Utilizzato per dividere una stringa vettoriale esistente in più sottostringhe in base alle corrispondenze di sottostringa trovate al loro interno

Esempio: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)

Argomenti:

  • X - Carattere vettoriale che verrà spiato.
  • Dividi: vettore di caratteri che funge da separatore.
  • Risolto - Fa una divisione uguale quando viene passato come vero
  • Perl: utilizzare regexps compatibili con Perl?
  • UseBytes - Se passato come vero, attiva la corrispondenza byte per byte anziché la corrispondenza carattere per carattere

5. Regexpr ()

Più che grep, regexpr fornisce l'indice in cui inizia una corrispondenza valida e la lunghezza della stringa corrispondente quando non viene trovata alcuna corrispondenza viene restituito il valore -1.

Esempio: regexpr (modello, testo, ignore.case = FALSE, perl = FALSE, fisso = FALSE, useBytes = FALSE)

Argomenti:

  • Pattern: stringa di caratteri che contiene un'espressione abituale che dovrebbe eguagliare il vettore di caratteri specificato.
  • X - Carattere vettoriale
  • Ignore.case - (False - La corrispondenza dei pattern funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei pattern funziona con distinzione tra maiuscole e minuscole)
  • Perl: per determinare espressioni compatibili con Perl, utilizzare in particolare regexprns
  • Valore: se una corrispondenza trovata restituisce true, altrimenti false
  • UseBytes - Se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
  • Inverti: restituisce gli indici se True

6. Gregexpr () in Funzioni stringa R

Gregexpr fornisce restituisce un elenco di una lunghezza simile a un testo ogni cui elemento ha una forma simile al valore restituito per regexpr, tranne per il fatto che vengono fornite le posizioni preliminari di ogni corrispondenza (disgiunta).

Sintassi: gregexpr (modello, testo, ignore.case = FALSE, perl = FALSE, fisso = FALSE, useBytes = FALSE, extract = FALSE)

Argomenti:

  • Motivo: stringa di caratteri che contiene un'espressione abituale che dovrebbe essere uguale al vettore di carattere dato.
  • X - Carattere vettoriale
  • Ignore.case - (Falso - La corrispondenza dei modelli funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei modelli funziona con distinzione tra maiuscole e minuscole)
  • Perl: per determinare espressioni compatibili con Perl, utilizzare in particolare regexprns
  • Valore: se una corrispondenza trovata restituisce true, altrimenti false
  • UseBytes - Se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
  • Inverti: restituisce gli indici se True
  • Estrai: quando viene identificata un'indicazione logica, viene creato e restituito un estratto della sottostringa

7. Regexec ()

Il regexec () nelle funzioni di stringa R è molto simile al regexpr () tranne qui vengono restituiti gli indici tra parentesi le corrispondenti sottoespressioni

Sintassi: regexec (modello, testo, ignore.case = FALSE, perl = FALSE, fisso = FALSE, useBytes = FALSE)

Argomenti:

  • Motivo: stringa di caratteri che contiene un'espressione abituale che si suppone possa eguagliare il vettore di caratteri specificato.
  • X - Carattere vettoriale
  • Ignore.case - (False - La corrispondenza dei pattern funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei pattern funziona con distinzione tra maiuscole e minuscole)
  • Perl - Per determinare le espressioni compatibili Perl in particolare regexprns deve essere usato
  • Valore: se una corrispondenza trovata restituisce true, altrimenti false
  • UseBytes - Se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
  • Inverti: restituisce gli indici se True

Articoli consigliati

Questa è stata una guida alle funzioni della stringa R. Qui abbiamo discusso il concetto, le caratteristiche, la manipolazione delle funzioni della stringa R con esempi e argomenti. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -

  1. Funzioni stringa JavaScript
  2. Funzioni stringa Oracle
  3. Funzioni stringa T-SQL
  4. Funzioni stringa VBScript
  5. Funzioni Regex in Python (esempio)

Categoria: