Les données en double peuvent être utiles, mais parfois elles compliquent la compréhension d'un tableau. Il est donc important de pouvoir les mettre en surbrillance pour les analyser et le cas échéant pouvoir les supprimer.
C'est quoi un doublon sur Excel ?
Un doublon sur Excel est la répétition stricte d'une donnée dans une colonne ou dans une ligne d'un tableau. Les doublons peuvent être essentiels dans le cadre d'une analyse, mais peuvent aussi constituer des erreurs. Il est donc possible de les mettre en évidence et de les supprimer.
Comment identifier les doublons sur Excel ?
- Il est possible d'identifier de plusieurs façons les doublons sur une ou plusieurs colonnes dans Excel avec la mise en forme conditionnelle.
Cette manipulation permet de passer facilement en revue les doublons et de prendre la décision de les supprimer ou de les conserver selon leur intérêt.
L'utilisateur doit cliquer dans une cellule de son tableau. Pour sélectionner toutes les données, il doit appuyer sur la combinaison de touches Ctrl+A sur PC ou Cmd+A sur Mac. La sélection de la première ligne d'en-tête n'est pas importante pour l'utilisation de cette fonction. Il faut savoir qu'en appuyant à nouveau sur les boutons Ctrl+A, la sélection tiendra compte de ces titres de colonnes et qu'en appuyant à nouveau sur ces boutons, la feuille entière sera sélectionnée. L'utilisateur peut ne sélectionner qu'une seule colonne pour mettre en avant les doublons de cette colonne. Pour cela, il clique sur la première valeur et appuie sur les touches Ctrl+Maj+Flèche vers le bas. Il peut aussi cliquer sur le A de la colonne A.
Dans l'onglet « Accueil », il clique sur « Mise en forme conditionnelle » puis sur « Règles de mise en surbrillance des cellules » et sur « Valeurs en double ». Il sélectionne « En double » dans la première liste déroulante et dans la seconde liste, il précise un formatage de cellule comme « Remplissage rouge clair avec texte rouge foncé ». Il peut aussi choisir un autre formatage de cellule en cliquant sur « Format personnalisé ». Dans ce cas, fenêtre « Format de cellule » s'ouvre et propose de choisir la mise en forme des doublons avec une police, une bordure ou un remplissage personnalisé des cellules concernées.
Ce formatage n'annule en rien l'ancien formatage des cellules. Pour le faire disparaître, il faut à nouveau sélectionner le tableau en appuyant sur la combinaison Ctrl+A ou Cmd+A. Ensuite, dans l'onglet « Accueil », il faut aller sur « Mise en forme conditionnelle » et sur « Effacer les règles des cellules sélectionnées ». Pour ne pas avoir à sélectionner tout le tableau, il faut cliquer sur « Effacer les règles de la feuille entière ».
Il faut savoir que chaque colonne d'Excel est traitée indépendamment pour la recherche de doublons. Alors, si la colonne A et la colonne B ont été sélectionnées et qu'il est inscrit un même nombre dans les deux colonnes, il ne s'agit en aucun cas d'un doublon. Il faut que le même nombre soit présent 2 fois dans la colonne A ou 2 fois dans la colonne B. Dans ce cas, ces deux nombres sont passés en surbrillance. Il faut aussi savoir qu'Excel ne prend pas en compte la casse ou le format pour déterminer les doublons. Cela signifie que « Pierre » et « pierre » sont des doublons tout comme « 11/10/22 » et « 11 octobre 2022 ».
- Il est aussi possible d'utiliser des filtres pour afficher les données en double.
Les filtres d'Excel se reconnaissent par la petite flèche déroulante qui est présente à droite de chaque en-tête de colonnes. En cliquant sur cette flèche, il est ensuite possible de trier ou filtrer les données selon ses propres critères de recherche. Cette méthode n'est donc applicable que si les colonnes du tableau commencent par une ligne d'en-tête.
Si l'en-tête de colonne ne propose pas de filtre, l'utilisateur devra les afficher lui-même. Pour ce faire, il doit cliquer sur l'en-tête de la colonne qui l'intéresse et se rendre sur l'onglet « Accueil », puis sur « Trier et filtrer » et « Filtrer ». S'il souhaite appliquer des filtres sur toutes les colonnes, il sélectionne toute sa ligne d'en-tête et fait la même démarche. Les filtres apparaissent alors sur chaque cellule de la ligne d'en-tête.
En cliquant sur la flèche déroulante d'une colonne, l'utilisateur découvre les options de tri et de filtrage. Pour visualiser une donnée en particulier, il faut décocher la case « Sélectionner tout » et cocher uniquement la donnée souhaitée, puis cliquer sur « OK ». Les informations concernant la donnée recherchée resteront apparentes, les lignes non concernées seront quant à elles masquées. Ce filtrage des doublons peut être cumulatif au sein de plusieurs colonnes.
Une fois les doublons identifiés, il est ensuite possible de cliquer sur la flèche en haut de la colonne, puis sur « Effacer le filtre » pour supprimer le filtre appliqué sur cette même colonne.
Comment supprimer les doublons sur Excel ?
À noter qu'Excel supprimera toutes les données en double. Avant toute intervention de suppression de doublons sur un tableau Excel, il est donc conseillé de travailler sur une copie ou de dupliquer la feuille de données dans un onglet du document. En cas d'erreur de manipulation ou de modification d'objectif de traitement, il sera ainsi plus simple de retrouver l'intégralité des données.
Pour supprimer les doublons Excel, l'utilisateur doit cliquer sur une cellule du tableau. Dans l'onglet « Données », il sélectionne « Supprimer les doublons ». Sous l'intitulé « Colonnes », il faut ensuite cocher celles dans lesquelles activer la suppression des doublons.
- L'utilisateur souhaite supprimer toutes les lignes strictement identiques.
Il laisse alors tous les champs cochés par défaut et vérifie que la case « Mes données ont des en-têtes » soit cochée également. Il clique ensuite sur « OK » pour supprimer les doublons. Excel supprime alors les lignes identiques en double dans le document.
- L'utilisateur souhaite supprimer les doublons d'une ou plusieurs colonnes spécifiques.
Dans ce cas, Excel vérifiera que le contenu de toutes les colonnes sélectionnées est identique avant de supprimer la ligne.
Attention : sur un tableau de 4 colonnes, si l'utilisateur supprime les doublons des colonnes 3 et 4, toutes les lignes concernées seront supprimées dans leur intégralité, et pas uniquement le contenu des cellules des colonnes 3 et 4.
Si le tableur ne comporte qu'une colonne, la méthode est plus simple, car Excel ne conservera que les données uniques et supprimera les cellules en doublon.
Après avoir validé, un message s'affiche récapitulant le nombre de doublons supprimés et le nombre de valeurs uniques restant.
Pour aller plus loin, téléchargez ces modèles Excel gratuits et utilisez-les pour formater vos données et mettre en évidence vos résultats.
Comment supprimer les doublons sur Excel ?
RAPPORT GRATUIT : L'AVENIR DU MARKETING
Décodez les défis et opportunités auxquelles les décisionnaires marketing font face en France et en Europe
Télécharger gratuitementMis à jour :
Publié :
Les données en double peuvent être utiles, mais parfois elles compliquent la compréhension d'un tableau. Il est donc important de pouvoir les mettre en surbrillance pour les analyser et le cas échéant pouvoir les supprimer.
C'est quoi un doublon sur Excel ?
Un doublon sur Excel est la répétition stricte d'une donnée dans une colonne ou dans une ligne d'un tableau. Les doublons peuvent être essentiels dans le cadre d'une analyse, mais peuvent aussi constituer des erreurs. Il est donc possible de les mettre en évidence et de les supprimer.
Comment identifier les doublons sur Excel ?
Cette manipulation permet de passer facilement en revue les doublons et de prendre la décision de les supprimer ou de les conserver selon leur intérêt.
L'utilisateur doit cliquer dans une cellule de son tableau. Pour sélectionner toutes les données, il doit appuyer sur la combinaison de touches Ctrl+A sur PC ou Cmd+A sur Mac. La sélection de la première ligne d'en-tête n'est pas importante pour l'utilisation de cette fonction. Il faut savoir qu'en appuyant à nouveau sur les boutons Ctrl+A, la sélection tiendra compte de ces titres de colonnes et qu'en appuyant à nouveau sur ces boutons, la feuille entière sera sélectionnée. L'utilisateur peut ne sélectionner qu'une seule colonne pour mettre en avant les doublons de cette colonne. Pour cela, il clique sur la première valeur et appuie sur les touches Ctrl+Maj+Flèche vers le bas. Il peut aussi cliquer sur le A de la colonne A.
Dans l'onglet « Accueil », il clique sur « Mise en forme conditionnelle » puis sur « Règles de mise en surbrillance des cellules » et sur « Valeurs en double ». Il sélectionne « En double » dans la première liste déroulante et dans la seconde liste, il précise un formatage de cellule comme « Remplissage rouge clair avec texte rouge foncé ». Il peut aussi choisir un autre formatage de cellule en cliquant sur « Format personnalisé ». Dans ce cas, fenêtre « Format de cellule » s'ouvre et propose de choisir la mise en forme des doublons avec une police, une bordure ou un remplissage personnalisé des cellules concernées.
Ce formatage n'annule en rien l'ancien formatage des cellules. Pour le faire disparaître, il faut à nouveau sélectionner le tableau en appuyant sur la combinaison Ctrl+A ou Cmd+A. Ensuite, dans l'onglet « Accueil », il faut aller sur « Mise en forme conditionnelle » et sur « Effacer les règles des cellules sélectionnées ». Pour ne pas avoir à sélectionner tout le tableau, il faut cliquer sur « Effacer les règles de la feuille entière ».
Il faut savoir que chaque colonne d'Excel est traitée indépendamment pour la recherche de doublons. Alors, si la colonne A et la colonne B ont été sélectionnées et qu'il est inscrit un même nombre dans les deux colonnes, il ne s'agit en aucun cas d'un doublon. Il faut que le même nombre soit présent 2 fois dans la colonne A ou 2 fois dans la colonne B. Dans ce cas, ces deux nombres sont passés en surbrillance. Il faut aussi savoir qu'Excel ne prend pas en compte la casse ou le format pour déterminer les doublons. Cela signifie que « Pierre » et « pierre » sont des doublons tout comme « 11/10/22 » et « 11 octobre 2022 ».
Les filtres d'Excel se reconnaissent par la petite flèche déroulante qui est présente à droite de chaque en-tête de colonnes. En cliquant sur cette flèche, il est ensuite possible de trier ou filtrer les données selon ses propres critères de recherche. Cette méthode n'est donc applicable que si les colonnes du tableau commencent par une ligne d'en-tête.
Si l'en-tête de colonne ne propose pas de filtre, l'utilisateur devra les afficher lui-même. Pour ce faire, il doit cliquer sur l'en-tête de la colonne qui l'intéresse et se rendre sur l'onglet « Accueil », puis sur « Trier et filtrer » et « Filtrer ». S'il souhaite appliquer des filtres sur toutes les colonnes, il sélectionne toute sa ligne d'en-tête et fait la même démarche. Les filtres apparaissent alors sur chaque cellule de la ligne d'en-tête.
En cliquant sur la flèche déroulante d'une colonne, l'utilisateur découvre les options de tri et de filtrage. Pour visualiser une donnée en particulier, il faut décocher la case « Sélectionner tout » et cocher uniquement la donnée souhaitée, puis cliquer sur « OK ». Les informations concernant la donnée recherchée resteront apparentes, les lignes non concernées seront quant à elles masquées. Ce filtrage des doublons peut être cumulatif au sein de plusieurs colonnes.
Une fois les doublons identifiés, il est ensuite possible de cliquer sur la flèche en haut de la colonne, puis sur « Effacer le filtre » pour supprimer le filtre appliqué sur cette même colonne.
Comment supprimer les doublons sur Excel ?
À noter qu'Excel supprimera toutes les données en double. Avant toute intervention de suppression de doublons sur un tableau Excel, il est donc conseillé de travailler sur une copie ou de dupliquer la feuille de données dans un onglet du document. En cas d'erreur de manipulation ou de modification d'objectif de traitement, il sera ainsi plus simple de retrouver l'intégralité des données.
Pour supprimer les doublons Excel, l'utilisateur doit cliquer sur une cellule du tableau. Dans l'onglet « Données », il sélectionne « Supprimer les doublons ». Sous l'intitulé « Colonnes », il faut ensuite cocher celles dans lesquelles activer la suppression des doublons.
Il laisse alors tous les champs cochés par défaut et vérifie que la case « Mes données ont des en-têtes » soit cochée également. Il clique ensuite sur « OK » pour supprimer les doublons. Excel supprime alors les lignes identiques en double dans le document.
Dans ce cas, Excel vérifiera que le contenu de toutes les colonnes sélectionnées est identique avant de supprimer la ligne.
Attention : sur un tableau de 4 colonnes, si l'utilisateur supprime les doublons des colonnes 3 et 4, toutes les lignes concernées seront supprimées dans leur intégralité, et pas uniquement le contenu des cellules des colonnes 3 et 4.
Si le tableur ne comporte qu'une colonne, la méthode est plus simple, car Excel ne conservera que les données uniques et supprimera les cellules en doublon.
Après avoir validé, un message s'affiche récapitulant le nombre de doublons supprimés et le nombre de valeurs uniques restant.
Pour aller plus loin, téléchargez ces modèles Excel gratuits et utilisez-les pour formater vos données et mettre en évidence vos résultats.
Partager cet article sur les réseaux sociaux
Articles recommandés
Comment calculer un écart type sur Excel ? (+ exemple)
Fichier CSV : définition, création et import dans Excel
Comment faire une liste déroulante sur Excel ?
Comment créer un heatmap sur Excel
TCD Excel : comment faire un tableau croisé dynamique ?
Comment utiliser la fonction NB.SI sur Excel correctement ?
Comment faire un graphique sparkline sur Excel ?
Comment utiliser la formule INDEX + EQUIV sur Excel ? (+ exemple)
Comment filtrer sur Excel ? (Filtre automatique + fonction FILTRE)
Comment créer un graphique sur Excel ?