Introduzione alle funzioni di stringa R
Il linguaggio R o le funzioni della stringa R sono implicite principalmente nella rappresentazione grafica dei dati, nell'analisi statistica dei dati e nel reporting. è una lingua open source. la convenzione di denominazione di questa lingua è stata derivata dalle prime lettere dei fondatori di questa lingua che sono Ross Ihaka e Robert Gentleman. È un linguaggio di programmazione interpretato. Ha la capacità di integrarsi con varie altre procedure linguistiche, in particolare C ++, Python, ecc. Attualmente R è il linguaggio di programmazione più utilizzato al mondo.
Caratteristiche delle funzioni di stringa R
Le caratteristiche principali del linguaggio R sono le seguenti,
- Un linguaggio statistico finemente sviluppato e molto semplice.
- Archiviazione e gestione dei dati sono integrati in modo molto efficiente in R.
- Offre una vasta gamma di strumenti classificati che aiutano nell'analisi dei dati
- R offre anche librerie per ottenere rappresentazioni grafiche dei dati
Manipolazione delle funzioni della stringa R
Di seguito è riportato l'elenco delle funzioni di manipolazione della stringa R.
1. Grep () nelle funzioni di stringa R
Utilizzato per abbinare un motivo nei dati e sostituire il motivo con una stringa diversa. La funzione grep può essere espressa in molti modi nei linguaggi R sono regexpr, gregexpr grep, grepl e regexec.
Es: grep (modello, x, ignora. Caso = FALSE, perl = FALSE, valore = FALSE, fisso = FALSE, usa Byte = FALSE, invert = FALSE)
Argomenti:
- Motivo: stringa di caratteri che contiene un'espressione abituale che dovrebbe essere uguale al vettore di carattere dato.
- X, testo - Un oggetto che può essere limitato come carattere a un vettore di caratteri.
- Ignorare. Case - (False - La corrispondenza dei modelli funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei modelli funziona con distinzione tra maiuscole e minuscole)
- Perl: per determinare espressioni compatibili con Perl, utilizzare in particolare regexprns.
- Valore: se una corrispondenza trovata restituisce true else false,
- Usa byte: se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
- Inverti: restituisce indici se True,
- Sostituzione - La stringa di sostituzione,
2. Nchar ()
Utilizzato per contare il numero di caratteri in un vettore. Prende un vettore in formato stringa come argomento e restituisce un altro vettore numerico che contiene il conteggio della stringa.
Es: nchar (x, type = "chars", allowNA = FALSE, keepNA = NA)
Argomenti:
- X - Stringa vettoriale.
- Tipo - Tipo, della stringa di caratteri, utilizzato i tre più comuni citati sono ("byte", "caratteri", "larghezza").
- AllowNA: indica se "Non applicabile" può essere restituito come output.
- KeepNA - Dovrebbe essere restituito 'Non applicabile' quando X non viene trovato.
3.Substr ()
Utilizzato per selezionare il valore di sottostringa del vettore di caratteri.
Esempio: substr (x, start, stop)
Argomenti:
- X, testo - La stringa del noleggiatore vettoriale.
- Inizio, Primo - numero intero. Inizio dell'elemento che dovrebbe essere sostituito
- Stop, Last - numero intero. qui la sostituzione viene eseguita alla fine della stringa
4. strsplit () in Funzioni stringa R
Utilizzato per dividere una stringa vettoriale esistente in più sottostringhe in base alle corrispondenze di sottostringa trovate al loro interno
Esempio: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)
Argomenti:
- X - Carattere vettoriale che verrà spiato.
- Dividi: vettore di caratteri che funge da separatore.
- Risolto - Fa una divisione uguale quando viene passato come vero
- Perl: utilizzare regexps compatibili con Perl?
- UseBytes - Se passato come vero, attiva la corrispondenza byte per byte anziché la corrispondenza carattere per carattere
5. Regexpr ()
Più che grep, regexpr fornisce l'indice in cui inizia una corrispondenza valida e la lunghezza della stringa corrispondente quando non viene trovata alcuna corrispondenza viene restituito il valore -1.
Esempio: regexpr (modello, testo, ignore.case = FALSE, perl = FALSE, fisso = FALSE, useBytes = FALSE)
Argomenti:
- Pattern: stringa di caratteri che contiene un'espressione abituale che dovrebbe eguagliare il vettore di caratteri specificato.
- X - Carattere vettoriale
- Ignore.case - (False - La corrispondenza dei pattern funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei pattern funziona con distinzione tra maiuscole e minuscole)
- Perl: per determinare espressioni compatibili con Perl, utilizzare in particolare regexprns
- Valore: se una corrispondenza trovata restituisce true, altrimenti false
- UseBytes - Se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
- Inverti: restituisce gli indici se True
6. Gregexpr () in Funzioni stringa R
Gregexpr fornisce restituisce un elenco di una lunghezza simile a un testo ogni cui elemento ha una forma simile al valore restituito per regexpr, tranne per il fatto che vengono fornite le posizioni preliminari di ogni corrispondenza (disgiunta).
Sintassi: gregexpr (modello, testo, ignore.case = FALSE, perl = FALSE, fisso = FALSE, useBytes = FALSE, extract = FALSE)
Argomenti:
- Motivo: stringa di caratteri che contiene un'espressione abituale che dovrebbe essere uguale al vettore di carattere dato.
- X - Carattere vettoriale
- Ignore.case - (Falso - La corrispondenza dei modelli funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei modelli funziona con distinzione tra maiuscole e minuscole)
- Perl: per determinare espressioni compatibili con Perl, utilizzare in particolare regexprns
- Valore: se una corrispondenza trovata restituisce true, altrimenti false
- UseBytes - Se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
- Inverti: restituisce gli indici se True
- Estrai: quando viene identificata un'indicazione logica, viene creato e restituito un estratto della sottostringa
7. Regexec ()
Il regexec () nelle funzioni di stringa R è molto simile al regexpr () tranne qui vengono restituiti gli indici tra parentesi le corrispondenti sottoespressioni
Sintassi: regexec (modello, testo, ignore.case = FALSE, perl = FALSE, fisso = FALSE, useBytes = FALSE)
Argomenti:
- Motivo: stringa di caratteri che contiene un'espressione abituale che si suppone possa eguagliare il vettore di caratteri specificato.
- X - Carattere vettoriale
- Ignore.case - (False - La corrispondenza dei pattern funziona senza distinzione tra maiuscole e minuscole, True - La corrispondenza dei pattern funziona con distinzione tra maiuscole e minuscole)
- Perl - Per determinare le espressioni compatibili Perl in particolare regexprns deve essere usato
- Valore: se una corrispondenza trovata restituisce true, altrimenti false
- UseBytes - Se TRUE, la corrispondenza verrà eseguita byte per byte anziché carattere per carattere.
- Inverti: restituisce gli indici se True
Articoli consigliati
Questa è stata una guida alle funzioni della stringa R. Qui abbiamo discusso il concetto, le caratteristiche, la manipolazione delle funzioni della stringa R con esempi e argomenti. Puoi anche consultare i nostri altri articoli suggeriti per saperne di più -
- Funzioni stringa JavaScript
- Funzioni stringa Oracle
- Funzioni stringa T-SQL
- Funzioni stringa VBScript
- Funzioni Regex in Python (esempio)