En este tutorial, analizaremos la lematización en Python , que es un método que se utiliza para agrupar los diferentes elementos de una palabra. La lematización también tiene como objetivo reducir la inflexión de las palabras y se enfoca en proporcionar la forma raíz o base de una palabra, que es lo que significa la palabra lema .
Tabla de contenido
Lematización Vs Stemming
La lematización es similar a la lematización, que también funciona para reducir las inflexiones en las palabras. La única diferencia es que la lematización utiliza como resultado palabras basadas en diccionario.
Por otro lado, la derivación solo elimina los afijos de una palabra flexionada, lo que puede dar como resultado palabras que no existen.
Por ejemplo, si utilizamos la derivación de la palabra estudios , dará como resultado la palabra estudios , ya que tiene como objetivo eliminar los sufijos de la palabra estudios .
Por otro lado, si se utiliza la lematización , se dará como resultado el estudio de palabras, ya que se enfoca en proporcionar la forma base de una palabra.
Cosas a considerar al utilizar la lematización
- Utiliza palabras basadas en diccionario. Con el término lema , que significa la forma raíz o base de una palabra, la lematización tiene como objetivo proporcionar la forma base de una palabra en lugar de simplemente eliminar las inflexiones de una palabra.
- Depende completamente de las partes del discurso para encontrar una palabra base. Sin especificar las partes del discurso), es posible que la lematización no funcione bien y es posible que no obtenga el resultado que está buscando.
- Es más lento que stemming pero es más poderoso. Dado que la lematización no sigue un algoritmo para funcionar con palabras y la necesidad de proporcionar partes del discurso, se considera más lenta que la lematización. Sin embargo, es más potente en el sentido de que utiliza palabras basadas en diccionarios para obtener resultados.
- Tiene una mayor precisión en la búsqueda de la raíz de la palabra. Dado que la lematización utiliza palabras basadas en diccionarios para presentar los resultados de una palabra flexionada, tendrá mayores posibilidades de obtener resultados precisos.
Etapa de preparación para la lematización en Python
Antes de proceder a implementar la lematización, comencemos importando la biblioteca de Word desde textblob .

Después de eso, vamos a crear un objeto de palabra.

Para crear un objeto de palabra, creamos una variable llamada w . Luego almacenamos la biblioteca de Word que contiene nuestro objeto de palabra, que es pulpo , la forma plural de la palabra pulpo. Tenga en cuenta que al pasar un elemento mediante la biblioteca de Word, es importante encerrar ese elemento entre comillas simples.
Inicialicemos la variable w para ver si contiene el objeto de palabra que acabamos de crear.

Al ejecutar la variable w , obtenemos como resultado la palabra objeto pulpos .
Implementando la Lematización en Python
A continuación, implementaremos la lematización mediante la función .lemmatize .

En este paso, usamos la variable w que contiene el objeto de palabra octopi y usamos la función .lemmatize para aplicar la lematización. Como resultado, obtuvimos la palabra pulpo , que es la forma raíz o base de la palabra pulpo .
Después de eso, intentemos aplicar la lematización con la palabra mejor .

En el ejemplo anterior, actualizamos nuestro objeto de palabra de pulpos a mejor . Luego lo lematizamos con la función .lemmatize . Por lo tanto, el resultado que obtuvimos es el mismo que el objeto de palabra que usamos.
Al usar la función .lemmatize, puede cambiar la forma de su lematización pasando una parte del discurso. Como ejemplo, intentemos pasar a la función .lemmatize que representa adjetivo en las partes del discurso.

Después de agregar una parte del discurso a la función .lemmatize, podemos obtener la palabra base como resultado.
Cambiemos nuestro objeto de palabra nuevamente a running . También cambiemos la parte del discurso que pasaremos a la función .lemmatize en v que significa verbo.

Después de realizar los cambios e inicializar la función .lemmatize, obtuvimos la palabra raíz de la palabra en ejecución , que se ejecuta como resultado. La mayoría de los lematizadores no son capaces de realizar los métodos que acabamos de hacer al usar la función .lemmatize.
Sin embargo, la función .lemmatize es una herramienta considerable para utilizar cuando se realizan ciertos tipos de análisis de texto en Python para obtener la forma base de una palabra.
Cómo utilizar secuencias de comandos de Python en LuckyTemplates
Cómo cargar conjuntos de datos de muestra en Python
Funciones definidas por el usuario de Python | Una visión general
Conclusión
En resumen, podemos comprender el uso de la lematización en Python y cómo funciona. También hemos discutido la similitud y las diferencias de la lematización de la derivación . También podemos crear un objeto de Word usando la biblioteca de Word y cómo utilizar la función .lemmatize .
Además, hemos aprendido cómo aplicar diferentes partes del discurso en la función .lemmatize. Implementar la lematización en sus tareas diarias de análisis de texto lo ayudará en gran medida a reducir el tiempo y el esfuerzo en la búsqueda de la palabra base de una palabra específica.
Mis mejores deseos,
Gaellim