Возможности !SEMTools

Как удалить слова в Excel, даже самые короткие, из ячеек, уже рассматривалось. Но зачастую бывает нужно удалить не слова, а словосочетания. И обычная замена, как и в случае со словами, может привести к ситуациям, где после замены в некоторых случаях останутся окончания или начала слов.

!SEMTools идеально решает такого рода задачи, так как смотрит всегда не на строку в целом, а на отдельные ее слова, и при поиске сравнивает их. В случае со словосочетаниями надстройка ищет подряд идущие слова аналогично тому, как они расположены в искомых фразах. Если находит —удаляет всю цепочку, если находит лишь часть слов фразы — не удаляет ничего.

Удалить города (топонимы)

Топонимы — один из наиболее распространенных типов слов и словосочетаний, которые бывает необходимость удалить. Их можно удалить как вместе с предлогами («в москве», «в нижегородской области», «в минеральных водах»), так и без них. Первая ситуация нужна, чтобы не оставлять предлоги после удаления самих топонимов.

При работе с большими массивами данных рекомендуется сначала определить, есть ли названия городов в списке, затем желательно извлечь эти словосочетания, чтобы убедиться, что не будут удалены лишние.

В этом коротком видео пример процедуры удаления топонимов:

Удаляем все географические названия из 100 000 фраз

Удалить свой список фраз (словосочетаний)

Для удаления своего собственного списка словосочетаний предусмотрен отдельный пункт меню. Основное требование — список должен быть в одном столбце. Пример ниже показывает, как можно оставить в семантике только породы собак (в основном в родительном падеже), удалив все лишние слова из семантического ядра.

Важно, что не обязательно иметь в списке только словосочетания — можно и отдельные слова, они тоже удалятся. Но макрос нужно применять, если в списке слов есть хотя бы одно словосочетание.

Удаляем пару десятков словосочетаний из тех же 100 000 фраз
Найти повторяющиеся значения в Excel и решить сотни других задач поможет надстройка !SEMTools. Скачайте прямо сейчас и убедитесь сами!