Come installare NLTK?

Il seguente articolo Installa NLTK fornisce una struttura per l'installazione di NLTK. NLTK è un insieme di librerie per l'elaborazione del linguaggio naturale. È una piattaforma per la creazione di programmi Python per l'elaborazione del linguaggio naturale. NLTK è scritto nel linguaggio di programmazione Python. È stato sviluppato da Steven Bird ed Edward Loper. Supporta la ricerca e l'insegnamento nella PNL o aree strettamente correlate, tra cui scienze cognitive, linguistica empirica, recupero di informazioni, intelligenza artificiale e apprendimento automatico. NLTK fornisce un'interfaccia facile da usare.

NLTK (Natural Language Toolkit)

  • L'elaborazione del linguaggio naturale (PNL) è una parte dell'intelligenza artificiale che elabora la lingua parlata dagli umani. Pertanto, aiuta le persone a interagire con i computer anche se non hanno conoscenza di come usarlo. Usando la PNL, gli umani devono solo dettare il comando ai computer. Con la potenza dell'apprendimento automatico, l'elaborazione del linguaggio naturale sta diventando popolare e più facile da implementare. È fondamentalmente la tecnica per interagire con gli umani ed eseguire azioni sui comandi vocali.
  • Ciò consente ai dispositivi di essere utilizzati anche dai principianti che non hanno alcuna conoscenza della tecnologia. Ma l'implementazione dell'elaborazione del linguaggio naturale non è facile, poiché una lingua parlata dagli Umani non ha una struttura definita. È ambiguo e dipende da parole di contesto che possono avere un significato diverso.
  • NLTK ha più di 50 corpora e fonti lessicali come WordNet, Problem Report Corpus, Penn Treebank Corpus, ecc. Viene inoltre fornito con una guida che spiega i concetti di elaborazione del linguaggio tramite toolkit e fondamenti di programmazione di Python che lo rende facile per le persone che non hanno una profonda conoscenza della programmazione. Ha una vasta gamma di pacchetti che lo rende uno dei potenti toolkit per la PNL. Tokenization, Lemmatization, Stemming, Parsing, Count dei caratteri, Punteggiatura, conteggio delle parole sono alcuni di questi pacchetti.

Installa NLTK per Windows

Di seguito sono riportate le istruzioni per installare NLTK in Windows. Questi si basano sul presupposto che Python non sia installato nel sistema. NLTK richiede le versioni Python 2.7, 3.5 e successive.

Passaggio 1: scarica l'ultima versione di Python per Windows dal link seguente

https://www.python.org/downloads/

Passaggio 2: fare clic su .exe scaricato per eseguirlo.

Passaggio 3: selezionare personalizza l'installazione.

Passaggio 4: controllare tutte le funzionalità in particolare "pip" in quanto aiuta a installare NLTK e fare clic su Avanti.

Passaggio 5: nella schermata successiva selezionare le opzioni avanzate, selezionare il percorso e fare clic su Installa.

Passaggio 6: una volta completata l'installazione, vicino alla finestra.

Passaggio 7: copiare il percorso della cartella Script per installare NLTK nella stessa cartella.

NLTK può essere facilmente installato utilizzando un programma di installazione "pip". Inoltre, dobbiamo installare anche "numpy".

Passaggio 8: per installare NLTK, aprire il prompt dei comandi e digitare il comando seguente.

Assicurarsi che l'installazione abbia avuto esito positivo.

Dopo un'installazione corretta, è giunto il momento di utilizzare NLTK per l'elaborazione del linguaggio naturale.

Step9: Apri Python Shell e digita il comando seguente.

Se viene importato senza errori, significa che NLTK è installato correttamente.

Installa NLTK per Mac / Linux

A differenza di Windows, nei sistemi Linux è installato Python. Per installare NLTK in Linux / Mac, viene utilizzato il programma di installazione del pacchetto Pip di Python. Per installare pip o aggiornarlo digitare i comandi seguenti nel prompt dei comandi.

Per installare Python in Linux usa i comandi seguenti.

Passaggio 1: per aggiornare l'indice del pacchetto, utilizzare il comando seguente.

Step2: per installare Python nel sistema Linux usa di seguito.

Passaggio 3: digitare il comando seguente per installare "pip" per Python 3.

Passaggio 4: Dopo aver installato "Pip", utilizzare i seguenti comandi per installare NLTK.

Set di dati NLTK

NLTK ha molti set di dati disponibili per l'elaborazione del linguaggio naturale, ad esempio WordNet, WikiCorpus, Gutenberg, Opinione Lexicon, Tweebank, ecc. Questi set di dati sono chiamati corpora. Fondamentalmente, il set di dati NLTK contiene un set di file o documenti. Ogni file / documento contiene una raccolta di parole, lettere o testo in una sola lingua. Pertanto, un corpus è principalmente una biblioteca per comprendere / apprendere una lingua. Ha regole di grammatica e struttura di una lingua.

Dopo aver installato correttamente NLTK, puoi importarlo e anche scaricare i suoi corpora con il seguente comando.

Il downloader NLTK apre una finestra per scaricare i set di dati. La dimensione del set di dati è grande, quindi ci vorrà del tempo. Per verificare se i set di dati sono installati correttamente, provare a importare il set di dati e utilizzarlo.

Elaborazione di NLTK

Esistono 5 processi principali di elaborazione del linguaggio naturale. Questi sono i passaggi necessari per l'elaborazione di qualsiasi testo.

  1. Rilevamento EOS : il rilevamento della fine del parlato suddivide il testo in una raccolta di frasi significative. Divide il lungo testo in parti che hanno un significato.
  2. Tokenizzazione : questo passaggio divide le frasi in token. I token non contengono solo parole ma includono anche spazi bianchi, interruzioni di frase.
  3. Tag POS : POS significa pat-of-speech. Qui, le informazioni vengono assegnate al token. Questa informazione suggerisce che tipo di discorso è teso, verbo, aggettivo, sostantivo, ecc.
  4. Chunking : Chunking significa raccogliere testo basato su tag.
  5. Estrazione: l' estrazione è un processo continuo di attraversamento di blocchi e tag come entità denominate come persone, posizioni, organizzazioni, ecc.

Conclusione:

NLTK viene utilizzato per la classificazione del testo, i sottotitoli delle immagini, il riconoscimento vocale, la risposta alle domande, la modellazione del linguaggio, il riepilogo dei documenti e molte altre operazioni. Esistono molti altri strumenti per l'elaborazione del linguaggio naturale. Ma NLTK ha una vasta gamma di librerie che lo rendono uno dei potenti strumenti di elaborazione del linguaggio naturale. È più preciso di qualsiasi altro strumento, ma a causa di un gran numero di librerie, è un po 'lento. Quindi, tutto dipende dalle esigenze dell'utente. Se l'utente desidera la velocità, può anche preferire altri strumenti, ma dovrà scendere a compromessi con l'accuratezza del contenuto. Ma se l'accuratezza è una priorità, dovrebbero sicuramente scegliere NLTK.

Articoli consigliati:

Questa è stata una guida all'installazione di NLTK. Qui discutiamo il concetto di base e i diversi passaggi per installare NLTK su Windows e Linux \ Mac. Puoi anche consultare i seguenti articoli per saperne di più-

  1. Installa la dashboard di Kubernetes
  2. Come installare JDK
  3. Installa Docker
  4. Come installare Magento?
  5. Versioni di Magento | Caratteristiche delle versioni di Magento

Categoria: