
Раздел «Обнаружить – слова» в надстройке !SEMTools предназначен для поиска слов в ячейках Excel по различным критериям. Как и все процедуры в разделе, эти тоже возвращают только ИСТИНА (если искомое слово найдено) или ЛОЖЬ (если слово не найдено / не соответствует указанному критерию или нескольким).
Раздел помогает быстро найти в ячейках слова по одному критерию или нескольким – выявлять их по целому совпадению, частичному совпадению с определённым паттерном или целым списком таковых, по начертанию шрифта, по морфологическим признакам и по наличию дублирующихся слов внутри ячейки.

Целые слова
Процедуры этого меню ищут в ячейках слова, совпадающие с указываемым паттерном (или списком) целиком.
Найти слово в ячейке
Позволяет находить в ячейке определённое слово. Казалось бы, несложная задача, но с короткими словами могут быть проблемы. Подробнее читайте по ссылке выше. Там будут как примеры обычных формул, так и демонстрация процедур !SEMTools.
Найти в диапазоне слова из списка
Здесь доступны два режима:
- все слова из заданного списка – когда нужно, чтобы в ячейке содержались все слова сразу;
- любое слово из списка – если нужно быстро выявить наличие в ячейке хотя бы одного из указанных слов.
По частям речи
Доступен поиск по следующим грамматическим категориям:
- существительные — чтобы выделить ключевые запросы, содержащие конкретные объекты (например, «ремонт», «доставка»);
- прилагательные — полезно для фильтрации по признакам («дешевый», «быстрый»);
- глаголы — чтобы находить действия в фразах («купить», «заказать»);
- наречия — для уточнения характеристик действий или объектов («срочно», «онлайн»).
Наиболее полезно, когда проверяемые ячейки содержат немного слов. Поскольку для длинного текста всегда будут возвращать “ИСТИНА”.
Содержащие…
Инструменты этой группы ищут слова, в которых паттерн встречается:
- в начале (например, все слова, начинающиеся на «авто»: «авто», «автомобиль», «автозапчасти»);
- в конце (например, слова, заканчивающиеся на «тех»: «физтех», «финтех»);
- в любом месте слова (например, паттерн «ремонт» найдёт «ремонтные», «евроремонт» «отремонтировать»).
Можно использовать как один паттерн, так и список — удобно при работе с группой морфологических фрагментов или корней.
По регистру
Позволяет выявить, встречаются ли в ячейках слова в определённом регистре:
- только строчные — «покупка»;
- с первой заглавной — «Москва», что полезно для выявления именованных сущностей;
- все заглавные — «РЖД, RTX2080», может быть полезно для поиска именованных сущностей, написанных “капсом” – аббревиатур, артикулов, брендов и т.д.
Регулярные выражения (REGEX)
Мощный инструмент для продвинутого анализа. Позволяет находить сложные комбинации символов, шаблоны и маски. Например, найти все слова, где цифры чередуются с буквами, или все слова длиной ровно из 5 символов.
Найти повторяющиеся слова в ячейках
Находит случаи, когда в одной фразе повторяется одно и то же слово, что часто бывает результатом некорректной автоматической генерации. Это помогает далее их удалить (повторяющиеся слова внутри ячеек).
Другие процедуры со словами в !SEMTools для Excel
В надстройке также можно:
Удалить (убрать) определённые слова из ячеек
Изменить (поменять, заменить) слова в ячейках
Извлечь (взять, вытащить) слова из ячеек
Эта статья также доступна на EN