Aquí hay una pregunta típica de análisis de datos que recibimos de vez en cuando:
Tengo una hoja de cálculo con más de 100 000 filas en una hoja de cálculo de Excel que tiene mucha información de clientes que necesito limpiar para detectar duplicados. Calculo que me llevará unos días limpiar la lista manualmente. Un colega me dijo que lo más probable es que necesite una macro de Excel para hacerlo. Nuestro técnico de TI, que está familiarizado con el desarrollo de macros, está de baja, por lo que necesito resolver esto por mi cuenta. ¿Hay alguna forma de solucionar este problema sin saber programar?
Sí, hay una manera de resolver esto en Excel, y no requerirá ser competente con la programación de Visual Basic. Avancemos y resolvamos esto muy rápido para usted.
Eliminar filas duplicadas de Excel
Aquí le mostramos cómo deshacerse de las entradas innecesarias en su hoja de cálculo:
- En primer lugar, haga una copia de su libro de trabajo, para que tenga una copia de seguridad en caso de que algo salga mal.
- A continuación, abra su hoja de cálculo de Excel.
- En la cinta superior, presione la pestaña Datos .
- Ahora continúe y seleccione el rango de datos que le gustaría limpiar. Asegúrese de seleccionar los encabezados de la tabla si están disponibles también.
- En la sección Herramientas de datos, presione el botón Eliminar duplicados .
- Ahora, continúe y verifique la columna relevante que lo ayudará a determinar si una entrada en su lista está duplicada. En nuestro caso, usando nuestro conjunto de datos de objetivos de ventas de demostración, usaremos las primeras 3 columnas para identificar filas duplicadas.

- Pulse Aceptar .
- Se mostrará un mensaje detallando el número de entradas eliminadas y las que se mantienen en la tabla.

- Presione Aceptar e inspeccione su conjunto de datos modificado para verificar que sea correcto.
- Si está satisfecho con el resultado, continúe y guarde su archivo. De lo contrario, puede deshacer su cambio ( Editar >> Deshacer ).
Consejos avanzados:
- Una capacidad similar está disponible en Excel PowerQuery, que le permite transformar conjuntos de datos significativamente más grandes.
- Si está familiarizado con el lenguaje Python, puede eliminar fácilmente las filas duplicadas de un conjunto de datos utilizando la biblioteca Pandas.
Disfruta de tu análisis de datos 😉