Power Automate si applica a ogni azione nei flussi di lavoro
Scopri l
In questo tutorial, discuteremo della lemmatizzazione in Python che è un metodo utilizzato per raggruppare i diversi elementi di una parola. La lemmatizzazione mira anche a ridurre l'inflessione delle parole e si concentra sul fornire la radice o la forma base di una parola che è ciò che significa la parola lemma .
Sommario
Lemmatizzazione Vs Stemming
La lemmatizzazione è simile allo stemming che funziona anche per ridurre le inflessioni nelle parole. L'unica differenza è che la lemmatizzazione utilizza come risultato parole basate sul dizionario.
D'altra parte, lo stemming rimuove solo gli affissi da una parola flessa che può risultare in parole che non esistono.
Ad esempio, se utilizziamo la derivazione alla parola studies , darà la parola studi come output poiché mira a rimuovere il suffisso es dalla parola studies .
D'altra parte, se viene utilizzata la lemmatizzazione , la parola studio verrà data come risultato poiché si concentra sul fornire la forma base di una parola.
Cose da considerare nell'utilizzo della lemmatizzazione
Fase di preparazione per la lemmatizzazione in Python
Prima di procedere all'implementazione della lemmatizzazione, iniziamo importando la libreria Word da textblob .
Successivamente, creeremo un oggetto parola.
Per creare un oggetto parola, abbiamo creato una variabile denominata w . Quindi abbiamo archiviato la libreria Word che contiene il nostro oggetto parola che è octopi , la forma plurale della parola octopus. Tieni presente che quando passi un elemento utilizzando la libreria Word, è importante racchiudere quell'elemento tra virgolette singole.
Inizializziamo la variabile w per vedere se contiene l'oggetto word che abbiamo appena creato.
Dopo aver eseguito la variabile w , otteniamo come risultato la parola oggetto octopi .
Implementazione della lemmatizzazione in Python
Successivamente, implementeremo la lemmatizzazione utilizzando la funzione .lemmatize .
In questo passaggio, abbiamo utilizzato la variabile w che contiene la parola oggetto octopi e abbiamo utilizzato la funzione .lemmatize per applicare la lemmatizzazione. Di conseguenza, abbiamo ottenuto la parola polpo che è la radice o la forma base della parola polpo .
Dopodiché, proviamo ad applicare la lemmatizzazione con la parola better .
Nell'esempio precedente, abbiamo aggiornato il nostro oggetto word da octopi a better . Poi l'abbiamo lemmatizzato con la funzione .lemmatize . Quindi, il risultato che abbiamo ottenuto è lo stesso della parola oggetto che abbiamo usato.
Usando la funzione .lemmatize, puoi cambiare il modo della sua lemmatizzazione passandoci una parte del discorso. Ad esempio, proviamo a passare a alla funzione .lemmatize che sta per aggettivo nelle parti del discorso.
Dopo aver aggiunto una parte del discorso alla funzione .lemmatize, siamo in grado di ottenere come risultato una buona parola base.
Cambiamo di nuovo il nostro oggetto word in running . Cambiamo anche la parte del discorso che passeremo alla funzione .lemmatize in v che sta per verbo.
Dopo aver apportato le modifiche e aver inizializzato la funzione .lemmatize, abbiamo ottenuto la parola radice della parola running che viene eseguita come risultato. La maggior parte dei lemmatizzatori non è in grado di eseguire i metodi che abbiamo appena utilizzato utilizzando la funzione .lemmatize.
Tuttavia, la funzione .lemmatize è uno strumento considerevole da utilizzare quando si eseguono determinati tipi di analisi del testo in Python per ottenere la forma base di una parola.
Come utilizzare lo script Python in LuckyTemplates
Come caricare set di dati di esempio in Python
Funzioni definite dall'utente di Python | Una panoramica
Conclusione
In breve, siamo in grado di comprendere l'uso della lemmatizzazione in Python e come funziona. Abbiamo anche discusso la somiglianza e le differenze tra lemmatizzazione e derivazione . Siamo anche in grado di creare un oggetto parola utilizzando la libreria Word e come utilizzare la funzione .lemmatize .
Inoltre, abbiamo imparato come applicare diverse parti del discorso nella funzione .lemmatize. L'implementazione della lemmatizzazione nelle tue attività quotidiane di analisi del testo ti aiuterà notevolmente a ridurre il tempo e lo sforzo nella ricerca della parola base di una parola specifica.
Ti auguro il meglio,
Gaellim
Scopri l
Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.
Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all
Come commentare più righe in Python: una guida semplice e veloce
Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.
Ora, è molto facile studiare il budget rispetto all
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.
Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.
Cos'è il sé in Python: esempi del mondo reale
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.