Когда удалить дубли в столбце нужно без удаления строк, которые их содержат, стандартный инструмент удаления дубликатов в Excel не подходит:

  • Если выделить один столбец — он удаляет ячейки, смещая ячейки вверх, и целостность структуры табличных данных будет утеряна.
  • Если просто выделить все столбцы — он удалит только полностью дублирующиеся строки, причем удалит их совсем
  • Можно выделить все столбцы и указать, по каким столбцам проверять дубликаты, но вторая проблема — полное удаление строк — не будет решена

Можно ли удалить повторяющиеся значения в столбце без смещения и удаления строк, чтобы данные не «перепутались»?

Именно эту задачу решает надстройка !SEMTools. Она позволяет удалить дубли из столбца, просто очищая содержимое ячеек.

Ниже пример использования.
Здесь мы хотим узнать, какое действие каждый из посетителей совершил в последнем визите. Для этого:
1. Сортируем таблицу по номеру визита по убыванию
2. Удаляем все дубли имени пользователя, кроме первого (это будет последний визит пользователя), получим нужные нам строки для фильтрации.

Удалить дубликаты в столбце без смещения
Пример — как удалить дублирующиеся значения в столбце без смещения строк с !SEMTools

У приведенного примера есть обратная операция — заполнение пустых ячеек значениями выше (или ниже). Чтобы она не понадобилась, рекомендуется производить операцию не на исходных столбцах, а скопировать исходный столбец и производить удаление уже в нем.

А можно ли удалить дубли и одновременно посчитать уникальные значения в Excel?

Да, такая возможность есть, ее предоставляет стандартный функционал сводных таблиц и упрощенная и ускоренная процедура создания сводных таблиц в !SEMTools. Подробнее: как свести таблицу и удалить дубли.

Что, если значения в ячейках могут незначительно отличаться друг от друга?

Речь об удалении неявных дублей. В таких случаях потребуется процесс нормализации данных. Он включает в себя те или иные методы избавления от подобных отличий. В зависимости от вашего кейса, может потребоваться удалить все кроме букв и цифр, привести все ячейки в верхний или нижний регистр, произвести лемматизацию строк, упорядочить слова в ячейке по алфавиту. И уже после нормализации производить удаление дублей.

Можно ли найти дубликаты в столбце, не удаляя их?

Да, есть несколько способов решения этой задачи, подробнее: найти дубликаты