Возможности !SEMTools

Найти слова в ячейках

найти слова в Excel по критерию или нескольким

Раздел «Обнаружить – слова» в надстройке !SEMTools предназначен для поиска слов в ячейках Excel по различным критериям. Как и все процедуры в разделе, эти тоже возвращают только ИСТИНА (если искомое слово найдено) или ЛОЖЬ (если слово не найдено / не соответствует указанному критерию или нескольким).

Раздел помогает быстро найти в ячейках слова по одному критерию или нескольким – выявлять их по целому совпадению, частичному совпадению с определённым паттерном или целым списком таковых, по начертанию шрифта, по морфологическим признакам и по наличию дублирующихся слов внутри ячейки.

Найти слова в ячейках Excel по различным критериям - процедуры надстройки !SEMTools

Целые слова

Процедуры этого меню ищут в ячейках слова, совпадающие с указываемым паттерном (или списком) целиком.

Найти слово в ячейке

Позволяет находить в ячейке определённое слово. Казалось бы, несложная задача, но с короткими словами могут быть проблемы. Подробнее читайте по ссылке выше. Там будут как примеры обычных формул, так и демонстрация процедур !SEMTools.

Найти в диапазоне слова из списка

Здесь доступны два режима:

  • все слова из заданного списка – когда нужно, чтобы в ячейке содержались все слова сразу;
  • любое слово из списка – если нужно быстро выявить наличие в ячейке хотя бы одного из указанных слов.

По частям речи

Доступен поиск по следующим грамматическим категориям:

  • существительные — чтобы выделить ключевые запросы, содержащие конкретные объекты (например, «ремонт», «доставка»);
  • прилагательные — полезно для фильтрации по признакам («дешевый», «быстрый»);
  • глаголы — чтобы находить действия в фразах («купить», «заказать»);
  • наречия — для уточнения характеристик действий или объектов («срочно», «онлайн»).

Наиболее полезно, когда проверяемые ячейки содержат немного слов. Поскольку для длинного текста всегда будут возвращать “ИСТИНА”.

Содержащие…

Инструменты этой группы ищут слова, в которых паттерн встречается:

  • в начале (например, все слова, начинающиеся на «авто»: «авто», «автомобиль», «автозапчасти»);
  • в конце (например, слова, заканчивающиеся на «тех»: «физтех», «финтех»);
  • в любом месте слова (например, паттерн «ремонт» найдёт «ремонтные», «евроремонт» «отремонтировать»).

Можно использовать как один паттерн, так и список — удобно при работе с группой морфологических фрагментов или корней.

По регистру

Позволяет выявить, встречаются ли в ячейках слова в определённом регистре:

  • только строчные — «покупка»;
  • с первой заглавной — «Москва», что полезно для выявления именованных сущностей;
  • все заглавные — «РЖД, RTX2080», может быть полезно для поиска именованных сущностей, написанных “капсом” – аббревиатур, артикулов, брендов и т.д.

Регулярные выражения (REGEX)

Мощный инструмент для продвинутого анализа. Позволяет находить сложные комбинации символов, шаблоны и маски. Например, найти все слова, где цифры чередуются с буквами, или все слова длиной ровно из 5 символов.

Найти повторяющиеся слова в ячейках

Находит случаи, когда в одной фразе повторяется одно и то же слово, что часто бывает результатом некорректной автоматической генерации. Это помогает далее их удалить (повторяющиеся слова внутри ячеек).

Другие процедуры со словами в !SEMTools для Excel

В надстройке также можно:

Удалить (убрать) определённые слова из ячеек

Изменить (поменять, заменить) слова в ячейках

Извлечь (взять, вытащить) слова из ячеек

Эта статья также доступна на EN

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

*