Найти повторы слов в ячейках
Данная процедура имеет исключительно простой алгоритм, который ищет внутри ячеек повторяющиеся слова. Если в ячейке есть слова, которые повторяются, она возвращает ИСТИНА, если повторяющихся слов нет — возвращает ЛОЖЬ. При этом повторяющимися словами являются исключительно полные совпадения слов.

Что является словом? В понимании макроса им считается:
- Набор символов, отделённых пробелами друг от друга в середине строки;
- Набор символов в конце строки, отделённых пробелом слева;
- Набор символов в начале строки, отделённых пробелом справа.
Поиск ячеек с повторяющимися словами рекомендуется производить перед удалением повторов слов, дабы визуально удостовериться, в каких фразах слова встречаются неоднократно.
В обработке семантического ядра часто данную операцию имеет смысл производить вместе с лемматизацией, чтобы удалить повторы разных словоформ одного и того же слова.
Запуск производится через меню «Слова -> Повторяющиеся слова» в группе «ОБНАРУЖИТЬ».
Найти наиболее повторяющиеся слова в тексте
Если задача стоит не просто найти повторы, но обнаружить наиболее повторяющиеся слова в целом столбце текста, в таком случае потребуется провести частотный анализ n-грамм, что также доступно в Excel с !SEMTools. Поскольку наиболее востребована операция поиска n-грамм бывает у SEO и PPC-специалистов, она находится в соответствующей группе: инструменты для SEO и контекстной рекламы.
Ниже пример, иллюстрирующий поиск наиболее популярных слов в семантике этой статьи. Находим наиболее повторяющиеся слова в диапазоне и выводим их списком с количеством повторений. Предварительно рекомендуется удалить пунктуацию и сделать все буквы строчными.

Читайте подробнее: Частотный анализ N-gram в Excel
Эта статья также доступна на EN