Lemmatizzazione in Python | Una guida per principianti

Lemmatizzazione in Python | Una guida per principianti

In questo tutorial, discuteremo della lemmatizzazione in Python che è un metodo utilizzato per raggruppare i diversi elementi di una parola. La lemmatizzazione mira anche a ridurre l'inflessione delle parole e si concentra sul fornire la radice o la forma base di una parola che è ciò che significa la parola lemma .

Sommario

Lemmatizzazione Vs Stemming

La lemmatizzazione è simile allo stemming che funziona anche per ridurre le inflessioni nelle parole. L'unica differenza è che la lemmatizzazione utilizza come risultato parole basate sul dizionario.

D'altra parte, lo stemming rimuove solo gli affissi da una parola flessa che può risultare in parole che non esistono.

Ad esempio, se utilizziamo la derivazione alla parola studies , darà la parola studi come output poiché mira a rimuovere il suffisso es dalla parola studies .

D'altra parte, se viene utilizzata la lemmatizzazione , la parola studio verrà data come risultato poiché si concentra sul fornire la forma base di una parola.

Cose da considerare nell'utilizzo della lemmatizzazione

  • Utilizza parole basate sul dizionario. Con il termine lemma che indica la radice o la forma base di una parola, la lemmatizzazione mira a fornire la forma base di una parola piuttosto che rimuovere semplicemente le inflessioni di una parola.
  • Dipende completamente dalle parti del discorso per trovare una parola base. Senza specificare le parti del discorso), la lemmatizzazione potrebbe non funzionare bene e potresti non ottenere il risultato che stai cercando.
  • È più lento dello stemming ma è più potente. Poiché la lemmatizzazione non segue un algoritmo da eseguire sulle parole e la necessità di fornire parti del discorso, è considerata più lenta dello stemming. Tuttavia, è più potente in quanto utilizza parole basate sul dizionario per i risultati. 
  • Ha una maggiore precisione nella ricerca della parola radice. Poiché la lemmatizzazione utilizza parole basate sul dizionario per disporre i risultati di una parola flessa, avrai maggiori possibilità di ottenere risultati accurati.

Fase di preparazione per la lemmatizzazione in Python

Prima di procedere all'implementazione della lemmatizzazione, iniziamo importando la libreria Word da textblob .

Lemmatizzazione in Python |  Una guida per principianti

Successivamente, creeremo un oggetto parola. 

Lemmatizzazione in Python |  Una guida per principianti

Per creare un oggetto parola, abbiamo creato una variabile denominata w . Quindi abbiamo archiviato la libreria Word che contiene il nostro oggetto parola che è octopi , la forma plurale della parola octopus. Tieni presente che quando passi un elemento utilizzando la libreria Word, è importante racchiudere quell'elemento tra virgolette singole.

Inizializziamo la variabile w per vedere se contiene l'oggetto word che abbiamo appena creato.

Lemmatizzazione in Python |  Una guida per principianti

Dopo aver eseguito la variabile w , otteniamo come risultato la parola oggetto octopi .

Implementazione della lemmatizzazione in Python

Successivamente, implementeremo la lemmatizzazione utilizzando la funzione .lemmatize

Lemmatizzazione in Python |  Una guida per principianti

In questo passaggio, abbiamo utilizzato la variabile w che contiene la parola oggetto octopi e abbiamo utilizzato la funzione .lemmatize per applicare la lemmatizzazione. Di conseguenza, abbiamo ottenuto la parola polpo che è la radice o la forma base della parola polpo .

Dopodiché, proviamo ad applicare la lemmatizzazione con la parola better .

Lemmatizzazione in Python |  Una guida per principianti

Nell'esempio precedente, abbiamo aggiornato il nostro oggetto word da octopi a better . Poi l'abbiamo lemmatizzato con la funzione .lemmatize . Quindi, il risultato che abbiamo ottenuto è lo stesso della parola oggetto che abbiamo usato.

Usando la funzione .lemmatize, puoi cambiare il modo della sua lemmatizzazione passandoci una parte del discorso. Ad esempio, proviamo a passare a alla funzione .lemmatize che sta per aggettivo nelle parti del discorso. 

Lemmatizzazione in Python |  Una guida per principianti

Dopo aver aggiunto una parte del discorso alla funzione .lemmatize, siamo in grado di ottenere come risultato una buona parola base.

Cambiamo di nuovo il nostro oggetto word in running . Cambiamo anche la parte del discorso che passeremo alla funzione .lemmatize in v che sta per verbo.

Lemmatizzazione in Python |  Una guida per principianti

Dopo aver apportato le modifiche e aver inizializzato la funzione .lemmatize, abbiamo ottenuto la parola radice della parola running che viene eseguita come risultato. La maggior parte dei lemmatizzatori non è in grado di eseguire i metodi che abbiamo appena utilizzato utilizzando la funzione .lemmatize.

Tuttavia, la funzione .lemmatize è uno strumento considerevole da utilizzare quando si eseguono determinati tipi di analisi del testo in Python per ottenere la forma base di una parola.


Come utilizzare lo script Python in LuckyTemplates
Come caricare set di dati di esempio in Python
Funzioni definite dall'utente di Python | Una panoramica

Conclusione

In breve, siamo in grado di comprendere l'uso della lemmatizzazione in Python e come funziona. Abbiamo anche discusso la somiglianza e le differenze tra lemmatizzazione e derivazione . Siamo anche in grado di creare un oggetto parola utilizzando la libreria Word e come utilizzare la funzione .lemmatize .

Inoltre, abbiamo imparato come applicare diverse parti del discorso nella funzione .lemmatize. L'implementazione della lemmatizzazione nelle tue attività quotidiane di analisi del testo ti aiuterà notevolmente a ridurre il tempo e lo sforzo nella ricerca della parola base di una parola specifica.

Ti auguro il meglio,

Gaellim


Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.

Mostra approfondimenti utilizzando la tecnica di visualizzazione dinamica multi-thread in LuckyTemplates

Mostra approfondimenti utilizzando la tecnica di visualizzazione dinamica multi-thread in LuckyTemplates

Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.

Introduzione al filtraggio del contesto in LuckyTemplates

Introduzione al filtraggio del contesto in LuckyTemplates

In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.

I migliori suggerimenti per lutilizzo delle app nel servizio online LuckyTemplates

I migliori suggerimenti per lutilizzo delle app nel servizio online LuckyTemplates

Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.

Analizza le variazioni del margine di profitto nel tempo: analisi con LuckyTemplates e DAX

Analizza le variazioni del margine di profitto nel tempo: analisi con LuckyTemplates e DAX

Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.

Idee di materializzazione per cache di dati in DAX Studio

Idee di materializzazione per cache di dati in DAX Studio

Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.

Reporting aziendale tramite LuckyTemplates

Reporting aziendale tramite LuckyTemplates

Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.

Che cosè il gateway LuckyTemplates? Tutto quello che devi sapere

Che cosè il gateway LuckyTemplates? Tutto quello che devi sapere

Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere