Voici une question typique d'analyse de données que nous recevons de temps à autre :
J'ai une feuille de calcul avec plus de 100 000 lignes de feuille de calcul Excel qui contient un tas d'informations sur les clients dont j'ai besoin pour nettoyer les doublons. J'estimerais qu'il me faudra quelques jours pour nettoyer la liste manuellement. Un collègue m'a dit que j'aurais probablement besoin d'une macro Excel pour y parvenir. Notre informaticien, qui connaît bien le développement de macros, est en congé, je dois donc résoudre ce problème par moi-même. Existe-t-il un moyen de résoudre ce problème sans savoir programmer ?
Oui, il existe un moyen de résoudre ce problème dans Excel, et il ne sera pas nécessaire de maîtriser la programmation Visual Basic. Allons de l'avant et résolvons cela très rapidement pour vous.
Supprimer les lignes dupliquées Excel
Voici comment vous débarrasser des entrées inutiles dans votre feuille de calcul :
- Tout d'abord, faites une copie de votre classeur, afin d'avoir une sauvegarde en cas de problème.
- Ouvrez ensuite votre feuille de calcul Excel.
- Dans le ruban supérieur, cliquez sur l' onglet Données .
- Maintenant, allez-y et sélectionnez la plage de données que vous souhaitez nettoyer. Assurez-vous de sélectionner également les en-têtes de tableau s'ils sont disponibles.
- Dans la section Outils de données, cliquez sur le bouton Supprimer les doublons .
- Maintenant, allez-y et vérifiez la colonne appropriée qui vous aidera à déterminer si une entrée de votre liste est en double. Dans notre cas, en utilisant notre ensemble de données de démonstration Sales Targets, nous utiliserons les 3 premières colonnes pour identifier les lignes en double.

- Appuyez sur OK .
- Un message détaillant le nombre d'entrées supprimées et celles conservées dans le tableau s'affichera.

- Appuyez sur OK et inspectez votre ensemble de données modifiées pour vous assurer qu'elles sont correctes.
- Si vous êtes satisfait du résultat, continuez et enregistrez votre fichier. Sinon, vous pouvez annuler votre modification ( Édition >> Annuler ).
Conseils avancés :
- Une fonctionnalité similaire est disponible dans Excel PowerQuery, qui vous permet de transformer des ensembles de données beaucoup plus volumineux.
- Si vous maîtrisez le langage Python, vous pouvez facilement supprimer les lignes dupliquées d'un ensemble de données à l'aide de la bibliothèque Pandas.
Profitez de votre analyse de données 😉