Возможности !SEMTools

Найти слова в ячейках

Найти слова в Excel - все команды надстройки !SEMTools

Раздел «Обнаружить – слова» в надстройке !SEMTools предназначен для поиска слов в ячейках Excel по различным критериям. Как и все процедуры в разделе, эти тоже возвращают только ИСТИНА (если искомое слово найдено) или ЛОЖЬ (если слово не найдено / не соответствует указанному критерию или нескольким).

Раздел помогает быстро найти в ячейках слова по одному критерию или нескольким – выявлять их по целому совпадению, частичному совпадению с определённым паттерном или целым списком таковых, по начертанию шрифта, по морфологическим признакам и по наличию дублирующихся слов внутри ячейки.

Найти слова в ячейках Excel по различным критериям - процедуры надстройки !SEMTools

Целые слова

Процедуры этого меню ищут в ячейках слова, совпадающие с указываемым паттерном (или списком) целиком.

Найти слово в ячейке

Позволяет находить в ячейке определённое слово. Казалось бы, несложная задача, но с короткими словами могут быть проблемы. Подробнее читайте по ссылке выше. Там будут как примеры обычных формул, так и демонстрация процедур !SEMTools.

Найти в диапазоне слова из списка

Здесь доступны два режима:

  • все слова из заданного списка – когда нужно, чтобы в ячейке содержались все слова сразу;
  • любое слово из списка – если нужно быстро выявить наличие в ячейке хотя бы одного из указанных слов.

По частям речи

Доступен поиск по следующим грамматическим категориям:

  • существительные — чтобы выделить ключевые запросы, содержащие конкретные объекты (например, «ремонт», «доставка»);
  • прилагательные — полезно для фильтрации по признакам («дешевый», «быстрый»);
  • глаголы — чтобы находить действия в фразах («купить», «заказать»);
  • наречия — для уточнения характеристик действий или объектов («срочно», «онлайн»).

Наиболее полезно, когда проверяемые ячейки содержат немного слов. Поскольку для длинного текста всегда будут возвращать “ИСТИНА”.

Содержащие…

Инструменты этой группы ищут слова, в которых паттерн встречается:

В начале

Например, как в примере ниже, мы хотим найти среди ключевых слов такие, которые содержат слова, начинающиеся на “напол” или “настол”. Иными словами, всё напольное и настольное.

найти в диапазоне слова, начинающиеся на несколько паттернов

В конце

(например, слова, заканчивающиеся на «тех»: «физтех», «финтех»);

найти в диапазоне слова, заканчивающиеся на несколько паттернов

В любом месте слова

Например, паттерн «ремонт» найдёт «ремонтные», «евроремонт» «отремонтировать».

найти в диапазоне слова, содержащие несколько паттернов

Можно использовать как один паттерн, так и список — удобно при работе с группой морфологических фрагментов или корней.

По регистру

Позволяет выявить, встречаются ли в ячейках слова в определённом регистре:

  • только строчные — «покупка»;
  • с первой заглавной — «Москва», что полезно для выявления именованных сущностей;
  • все заглавные — «РЖД, RTX2080», может быть полезно для поиска именованных сущностей, написанных “капсом” – аббревиатур, артикулов, брендов и т.д.

Регулярные выражения (REGEX)

Мощный инструмент для продвинутого анализа. Позволяет находить сложные комбинации символов, шаблоны и маски. Например, найти все слова, где цифры чередуются с буквами, или все слова длиной ровно из 5 символов.

Найти повторяющиеся слова в ячейках

Находит случаи, когда в одной фразе повторяется одно и то же слово, что часто бывает результатом некорректной автоматической генерации. Это помогает далее их удалить (повторяющиеся слова внутри ячеек).

Другие процедуры со словами в !SEMTools для Excel

В надстройке также можно:

Удалить (убрать) определённые слова из ячеек

Изменить (поменять, заменить) слова в ячейках

Извлечь (взять, вытащить) слова из ячеек

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

*