Lemmatizzazione in Python | Una guida per principianti

In questo tutorial, discuteremo della lemmatizzazione in Python che è un metodo utilizzato per raggruppare i diversi elementi di una parola. La lemmatizzazione mira anche a ridurre l'inflessione delle parole e si concentra sul fornire la radice o la forma base di una parola che è ciò che significa la parola lemma .

Sommario

Lemmatizzazione Vs Stemming

La lemmatizzazione è simile allo stemming che funziona anche per ridurre le inflessioni nelle parole. L'unica differenza è che la lemmatizzazione utilizza come risultato parole basate sul dizionario.

D'altra parte, lo stemming rimuove solo gli affissi da una parola flessa che può risultare in parole che non esistono.

Ad esempio, se utilizziamo la derivazione alla parola studies , darà la parola studi come output poiché mira a rimuovere il suffisso es dalla parola studies .

D'altra parte, se viene utilizzata la lemmatizzazione , la parola studio verrà data come risultato poiché si concentra sul fornire la forma base di una parola.

Cose da considerare nell'utilizzo della lemmatizzazione

  • Utilizza parole basate sul dizionario. Con il termine lemma che indica la radice o la forma base di una parola, la lemmatizzazione mira a fornire la forma base di una parola piuttosto che rimuovere semplicemente le inflessioni di una parola.
  • Dipende completamente dalle parti del discorso per trovare una parola base. Senza specificare le parti del discorso), la lemmatizzazione potrebbe non funzionare bene e potresti non ottenere il risultato che stai cercando.
  • È più lento dello stemming ma è più potente. Poiché la lemmatizzazione non segue un algoritmo da eseguire sulle parole e la necessità di fornire parti del discorso, è considerata più lenta dello stemming. Tuttavia, è più potente in quanto utilizza parole basate sul dizionario per i risultati. 
  • Ha una maggiore precisione nella ricerca della parola radice. Poiché la lemmatizzazione utilizza parole basate sul dizionario per disporre i risultati di una parola flessa, avrai maggiori possibilità di ottenere risultati accurati.

Fase di preparazione per la lemmatizzazione in Python

Prima di procedere all'implementazione della lemmatizzazione, iniziamo importando la libreria Word da textblob .

Lemmatizzazione in Python |  Una guida per principianti

Successivamente, creeremo un oggetto parola. 

Lemmatizzazione in Python |  Una guida per principianti

Per creare un oggetto parola, abbiamo creato una variabile denominata w . Quindi abbiamo archiviato la libreria Word che contiene il nostro oggetto parola che è octopi , la forma plurale della parola octopus. Tieni presente che quando passi un elemento utilizzando la libreria Word, è importante racchiudere quell'elemento tra virgolette singole.

Inizializziamo la variabile w per vedere se contiene l'oggetto word che abbiamo appena creato.

Lemmatizzazione in Python |  Una guida per principianti

Dopo aver eseguito la variabile w , otteniamo come risultato la parola oggetto octopi .

Implementazione della lemmatizzazione in Python

Successivamente, implementeremo la lemmatizzazione utilizzando la funzione .lemmatize

Lemmatizzazione in Python |  Una guida per principianti

In questo passaggio, abbiamo utilizzato la variabile w che contiene la parola oggetto octopi e abbiamo utilizzato la funzione .lemmatize per applicare la lemmatizzazione. Di conseguenza, abbiamo ottenuto la parola polpo che è la radice o la forma base della parola polpo .

Dopodiché, proviamo ad applicare la lemmatizzazione con la parola better .

Lemmatizzazione in Python |  Una guida per principianti

Nell'esempio precedente, abbiamo aggiornato il nostro oggetto word da octopi a better . Poi l'abbiamo lemmatizzato con la funzione .lemmatize . Quindi, il risultato che abbiamo ottenuto è lo stesso della parola oggetto che abbiamo usato.

Usando la funzione .lemmatize, puoi cambiare il modo della sua lemmatizzazione passandoci una parte del discorso. Ad esempio, proviamo a passare a alla funzione .lemmatize che sta per aggettivo nelle parti del discorso. 

Lemmatizzazione in Python |  Una guida per principianti

Dopo aver aggiunto una parte del discorso alla funzione .lemmatize, siamo in grado di ottenere come risultato una buona parola base.

Cambiamo di nuovo il nostro oggetto word in running . Cambiamo anche la parte del discorso che passeremo alla funzione .lemmatize in v che sta per verbo.

Lemmatizzazione in Python |  Una guida per principianti

Dopo aver apportato le modifiche e aver inizializzato la funzione .lemmatize, abbiamo ottenuto la parola radice della parola running che viene eseguita come risultato. La maggior parte dei lemmatizzatori non è in grado di eseguire i metodi che abbiamo appena utilizzato utilizzando la funzione .lemmatize.

Tuttavia, la funzione .lemmatize è uno strumento considerevole da utilizzare quando si eseguono determinati tipi di analisi del testo in Python per ottenere la forma base di una parola.


Come utilizzare lo script Python in LuckyTemplates
Come caricare set di dati di esempio in Python
Funzioni definite dall'utente di Python | Una panoramica

Conclusione

In breve, siamo in grado di comprendere l'uso della lemmatizzazione in Python e come funziona. Abbiamo anche discusso la somiglianza e le differenze tra lemmatizzazione e derivazione . Siamo anche in grado di creare un oggetto parola utilizzando la libreria Word e come utilizzare la funzione .lemmatize .

Inoltre, abbiamo imparato come applicare diverse parti del discorso nella funzione .lemmatize. L'implementazione della lemmatizzazione nelle tue attività quotidiane di analisi del testo ti aiuterà notevolmente a ridurre il tempo e lo sforzo nella ricerca della parola base di una parola specifica.

Ti auguro il meglio,

Gaellim

Leave a Comment

Power Automate si applica a ogni azione nei flussi di lavoro

Power Automate si applica a ogni azione nei flussi di lavoro

Scopri l

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.

Filtro Power Apps: cosè e come si usa?

Filtro Power Apps: cosè e come si usa?

Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Connettori Power Automate: numero, testo e data e ora

Connettori Power Automate: numero, testo e data e ora

Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Ora, è molto facile studiare il budget rispetto all

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.

Che cosè Power Query e M Language: una panoramica dettagliata

Che cosè Power Query e M Language: una panoramica dettagliata

Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.

Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.