Возможности !SEMTools

Данная процедура имеет исключительно простой алгоритм, который ищет внутри ячеек повторяющиеся слова. Если в ячейке есть слова, которые повторяются, она возвращает ИСТИНА, если повторяющихся слов нет — возвращает ЛОЖЬ. При этом повторяющимися словами являются исключительно полные совпадения слов.

Найти повторяющиеся слова в Excel

Что является словом? В понимании макроса им считается:
1. Набор символов, отделенных пробелами друг от друга в середине строки.
2. Набор символов в конце строки, отделенных пробелом слева.
3. Набор символов в начале строки, отделенных пробелом справа.

Поиск ячеек с повторяющимися словами рекомендуется производить перед удалением повторов слов, дабы визуально удостовериться, в каких фразах слова встречаются неоднократно.

В обработке семантического ядра часто данную операцию имеет смысл производить вместе с лемматизацией, чтобы удалить повторы разных словоформ одного и того же слова.

Запуск производится через меню «Слова -> Повторяющиеся слова» в группе «ОБНАРУЖИТЬ«.

Найти наиболее повторяющиеся слова в тексте

Если задача стоит не просто найти повторы, но обнаружить наиболее повторяющиеся слова в целом столбце текста, в таком случае потребуется провести частотный анализ n-грамм, что также доступно в Excel с !SEMTools. Поскольку наиболее востребована операция поиска n-грамм бывает у PPC- и SEO-специалистов, она находится в соответствующей группе инструментов. Ниже пример, иллюстрирующий поиск наиболее популярных слов в семантике этой статьи.

Читайте подробнее: Частотный анализ N-gram в Excel

Как обнаружить наиболее повторяющиеся слова в семантическом ядре